No existe una fórmula única de escala mel. La fórmula popular del libro de O’Shaughnessy puede expresarse con diferentes bases logarítmicas:
m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {\displaystyle m=2595\log _{10}\left(1+{\frac {f}{700}\right)=1127\ln \left(1+{\frac {f}{700}\right)}
Las expresiones inversas correspondientes son:
f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\displaystyle f=700\left(10^{frac {m}{2595}}-1\right)=700\left(e^{frac {m}{1127}}-1\right)}
Desde las curvas de Steinberg de 1937, basadas en diferencias de tono apenas perceptibles, se publicaron curvas y tablas sobre escalas de tono psicofísicas. Pronto siguieron más curvas en los documentos de Fletcher y Munson de 1937 y Fletcher de 1938 y Stevens de 1937 y Stevens y Volkmann de 1940, utilizando una variedad de métodos experimentales y enfoques de análisis.
En 1949 Koenig publicó una aproximación basada en segmentos lineales y logarítmicos separados, con una ruptura a 1000 Hz.
Gunnar Fant propuso la fórmula lineal/logarítmica popular actual en 1949, pero con la frecuencia de esquina de 1000 Hz.
Una expresión alternativa de la fórmula, que no depende de la elección de la base del logaritmo, aparece en Fant (1968):
m = 1000 log 2 log ( 1 + f 1000 ) {\displaystyle m={{frac {1000}{log 2}}log \left(1+{frac {f}{1000}}\right)}
En 1976, Makhoul y Cosell publicaron la versión ahora popular con la frecuencia de esquina de 700 Hz.Como han observado Ganchev et al., «Las fórmulas , cuando se comparan con las de , proporcionan una mayor aproximación a la escala de Mel para frecuencias inferiores a 1000 Hz, al precio de una mayor inexactitud para frecuencias superiores a 1000 Hz.» Por encima de 7 kHz, sin embargo, la situación se invierte, y la versión de 700 Hz vuelve a ajustarse mejor.
Los datos que motivan algunas de estas fórmulas se tabulan en Beranek (1949), a partir de las curvas de Stevens y Volkmann:
Hz | 20 | 160 | 394 | 670 | 1000 | 1420 | 1900 | 2450 | 3120 | 4000 | 5100 | 6600 | 9000 | 14000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
mel | 0 | 250 | 500 | 750 | 1000 | 1250 | 1500 | 1750 | 2000 | 2250 | 2500 | 2750 | 3000 | 3250 |
Una fórmula con una frecuencia de ruptura de 625 Hz es dada por Lindsay & Norman (1977); la fórmula no aparece en su primera edición de 1972:
m = 2410 log 10 ( 0.0016 f + 1 ) {\displaystyle m=2410\log _{10}(0.0016f+1)}
Para la comparación directa con otras fórmulas, esto es equivalente a:
m = 2410 log 10 ( 1 + f 625 ) {{displaystyle m=2410\log _{10}\left(1+{\frac {f}{625}\right)}
La mayoría de las fórmulas de escala de mel dan exactamente 1000 mels a 1000 Hz. La frecuencia de ruptura (por ejemplo, 700 Hz, 1000 Hz o 625 Hz) es el único parámetro libre en la forma habitual de la fórmula. Algunas fórmulas de escala de frecuencia auditiva que no son mels utilizan la misma forma pero con una frecuencia de ruptura mucho más baja, no necesariamente mapeando a 1000 a 1000 Hz; por ejemplo la escala de tasa ERB de Glasberg & Moore (1990) utiliza un punto de ruptura de 228,8 Hz, y el mapa de frecuencia-lugar coclear de Greenwood (1990) utiliza 165,3 Hz.
Otras formas funcionales para la escala mel han sido exploradas por Umesh et al.; señalan que las fórmulas tradicionales con una región logarítmica y una región lineal no se ajustan a los datos de las curvas de Stevens y Volkmann tan bien como algunas otras formas, basándose en la siguiente tabla de datos de las mediciones que realizaron a partir de esas curvas: