Il n’existe pas de formule unique d’échelle de Mel. La formule populaire du livre de O’Shaughnessy peut être exprimée avec différentes bases logarithmiques:
m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {\displaystyle m=2595\log _{10}\left(1+{\frac {f}{700}}\right)=1127\ln \left(1+{\frac {f}{700}}\right)}.
Les expressions inverses correspondantes sont :
f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\displaystyle f=700\left(10^{\frac {m}{2595}}-1\right)=700\left(e^{\frac {m}{1127}}-1\right)}
Il y a eu des courbes et des tableaux publiés sur les échelles de hauteur psychophysique depuis les courbes de 1937 de Steinberg basées sur les différences de hauteur juste perceptibles. D’autres courbes ont rapidement suivi dans les papiers de Fletcher et Munson en 1937 et Fletcher en 1938et Stevens en 1937 et Stevens et Volkmann en 1940 utilisant une variété de méthodes expérimentales et d’approches d’analyse.
En 1949, Koenig a publié une approximation basée sur des segments linéaires et logarithmiques séparés, avec une rupture à 1000 Hz.
Gunnar Fant a proposé la formule linéaire/logarithmique populaire actuelle en 1949, mais avec la fréquence d’angle de 1000 Hz.
Une autre expression de la formule, qui ne dépend pas du choix de la base du logarithme, est notée dans Fant (1968):
m = 1000 log 2 log ( 1 + f 1000 ) {\displaystyle m={\frac {1000}{\log 2}\log \left(1+{\frac {f}{1000}}\right)\ }
En 1976, Makhoul et Cosell ont publié la version désormais populaire avec la fréquence de coin de 700 Hz.Comme l’ont observé Ganchev et al. « Les formules , comparées à , fournissent une approximation plus proche de l’échelle de Mel pour les fréquences inférieures à 1000 Hz, au prix d’une plus grande imprécision pour les fréquences supérieures à 1000 Hz. » Au-dessus de 7 kHz, cependant, la situation s’inverse, et la version 700 Hz s’adapte à nouveau mieux.
Les données par lesquelles certaines de ces formules sont motivées sont tabulées dans Beranek (1949), telles que mesurées à partir des courbes de Stevens et Volkmann :
Hz | 20 | 160 | 394 | 670 | 1000 | 1420 | 1900 | 2450 | 3120 | 4000 | 5100 | 6600 | 9000 | 14000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
mel | 0 | 250 | 500 | 750 | 1000 | 1250 | 1500 | 1750 | 2000 | 2250 | 2500 | 2750 | 3000 | 3250 |
Une formule avec une fréquence de rupture de 625 Hz est donnée par Lindsay & Norman (1977) ; la formule n’apparaît pas dans leur première édition de 1972 :
m = 2410 log 10 ( 0.0016 f + 1 ) {\displaystyle m=2410\log _{10}(0.0016f+1)}
Pour une comparaison directe avec d’autres formules, ceci est équivalent à:
m = 2410 log 10 ( 1 + f 625 ) {\displaystyle m=2410\log _{10}\left(1+{\frac {f}{625}}right)}
La plupart des formules d’échelle de fusion donnent exactement 1000 mels à 1000 Hz. La fréquence de rupture (par exemple 700 Hz, 1000 Hz ou 625 Hz) est le seul paramètre libre dans la forme habituelle de la formule. Certaines formules d’échelle de fréquence auditive non mels utilisent la même forme mais avec une fréquence de rupture beaucoup plus basse, ne correspondant pas nécessairement à 1000 à 1000 Hz ; par exemple, l’échelle de taux ERB de Glasberg & Moore (1990) utilise un point de rupture de 228,8 Hz, et la carte fréquence-lieu cochléaire de Greenwood (1990) utilise 165,3 Hz.
D’autres formes fonctionnelles pour l’échelle mel ont été explorées par Umesh et al. Ils soulignent que les formules traditionnelles avec une région logarithmique et une région linéaire ne s’adaptent pas aux données des courbes de Stevens et Volkmann aussi bien que certaines autres formes, sur la base du tableau de données suivant des mesures qu’ils ont effectuées à partir de ces courbes :
.