Non esiste una formula unica per la scala mel. La formula popolare del libro di O’Shaughnessy può essere espressa con diverse basi logaritmiche:

m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {displaystyle m=2595\log _{10}left(1+{frac {f}{700}}}right)=1127\ln \left(1+{frac {f}{700}}right)}

{displaystyle m=2595\log _{10}\sinistra(1+frac {f}{700}}destra)=1127\ln \sinistra(1+frac {f}{700}destra)}

Le corrispondenti espressioni inverse sono:

f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\displaystyle f=700\left(10^{frac {m}{2595}}-1\right)=700\left(e^{frac {m}{1127}}-1\right)}

{displaystyle f=700\sinistra(10^{frac {m}{2595}}-1\destra)=700\sinistra(e^{frac {m}{1127}-1\destra)}

Ci sono state pubblicate curve e tabelle sulle scale di altezza psicofisiche dopo le curve di Steinberg del 1937 basate su differenze di altezza appena percettibili. Altre curve seguirono presto negli articoli di Fletcher e Munson del 1937 e Fletcher del 1938 e Stevens del 1937 e Stevens e Volkmann del 1940 usando una varietà di metodi sperimentali e approcci di analisi.

Nel 1949 Koenig pubblicò un’approssimazione basata su segmenti lineari e logaritmici separati, con una pausa a 1000 Hz.

Gunnar Fant propose l’attuale formula popolare lineare/logaritmica nel 1949, ma con la frequenza d’angolo di 1000 Hz.

Un’espressione alternativa della formula, che non dipende dalla scelta della base del logaritmo, è notata in Fant (1968):

m = 1000 log 2 log ( 1 + f 1000 ) {displaystyle m={frac {1000}{log 2}}log \sinistra(1+{frac {f}{1000}} destra)\

{displaystyle m={frac {1000}{log 2}}log \left(1+{frac {frac {1000}}right)\

Nel 1976, Makhoul e Cosell pubblicarono la versione ora popolare con la frequenza d’angolo di 700 Hz.Come Ganchev et al. hanno osservato, “Le formule, se paragonate a , forniscono un’approssimazione più vicina alla scala di Mel per le frequenze sotto i 1000 Hz, al prezzo di una maggiore imprecisione per le frequenze superiori ai 1000 Hz.” Sopra 7 kHz, tuttavia, la situazione è invertita, e la versione 700 Hz si adatta di nuovo meglio.

I dati da cui sono motivate alcune di queste formule sono tabulati in Beranek (1949), come misurato dalle curve di Stevens e Volkmann:

Beranek 1949 mel scala dati da Stevens e Volkmann 1940
Hz 20 160 394 670 1000 1420 1900 2450 3120 4000 5100 6600 9000 14000
mel 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 3250

Una formula con una frequenza di rottura di 625 Hz è data da Lindsay & Norman (1977); la formula non appare nella loro prima edizione del 1972:

m = 2410 log 10 ( 0.0016 f + 1 ) {\displaystyle m=2410\log _{10}(0.0016f+1)}

{displaystyle m=2410\log _{10}(0.0016f+1)}

Per un confronto diretto con altre formule, questo è equivalente a:

m = 2410 log 10 ( 1 + f 625 ) {\displaystyle m=2410\log _{10}\left(1+{frac {f}{625}}\right)}

{displaystyle m=2410\log _{10}sinistra(1+{frac {f}{625}}destra)}

La maggior parte delle formule della scala di fusione danno esattamente 1000 mels a 1000 Hz. La frequenza di rottura (ad esempio 700 Hz, 1000 Hz o 625 Hz) è l’unico parametro libero nella forma usuale della formula. Alcune formule di scala di frequenza uditiva non mel usano la stessa forma ma con una frequenza di break molto più bassa, non necessariamente mappando a 1000 a 1000 Hz; per esempio la scala ERB-rate di Glasberg & Moore (1990) usa un punto di break di 228,8 Hz, e la mappa cocleare frequenza-posto di Greenwood (1990) usa 165,3 Hz.

Altre forme funzionali per la scala mel sono state esplorate da Umesh et al.; essi sottolineano che le formule tradizionali con una regione logaritmica e una lineare non si adattano ai dati delle curve di Stevens e Volkmann così come alcune altre forme, sulla base della seguente tabella di dati di misurazioni che hanno fatto da quelle curve:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.