Não há uma única fórmula de escala de mel. A popular fórmula do livro de O’Shaughnessy pode ser expressa com diferentes bases logarítmicas:
m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {\displaystyle m=2595\log _{10}{10}esquerda(1+{\frac {700}}{700}} =1127ln {\frac {1+{\frac {700}}direita)}
As expressões inversas correspondentes são:
f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\i1}f=700{\i1}esquerda(10^{\i}{\i}frac {m}{2595}}-1}direita)=700{\i}esquerda(e^{\i}{\i}{\i}-127}-1{\i1}direita)} Mais curvas logo se seguiram nas curvas de Fletcher e Munson 1937 e Fletcher 1938 e Stevens 1937 e Stevens e Volkmann 1940, usando uma variedade de métodos experimentais e abordagens de análise.
Em 1949 Koenig publicou uma aproximação baseada em segmentos lineares e logarítmicos separados, com uma quebra a 1000 Hz.
Gunnar Fant propôs a actual fórmula linear/logarítmica popular em 1949, mas com a frequência de canto de 1000 Hz.
Uma expressão alternativa da fórmula, não dependendo da escolha da base logarítmica, é anotada em Fant (1968):
m = 1000 log 2 log ( 1 + f 1000 ) {\displaystyle m={\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac }}}}
Em 1976, Makhoul e Cosell publicaram a versão agora popular com a frequência de canto de 700 Hz.Como observaram Ganchev et al., “As fórmulas, quando comparadas com , proporcionam uma aproximação mais próxima da escala de Mel para frequências abaixo de 1000 Hz, ao preço de uma maior imprecisão para frequências superiores a 1000 Hz”. Acima de 7 kHz, entretanto, a situação é invertida, e a versão de 700 Hz novamente se encaixa melhor.
Dados pelos quais algumas destas fórmulas são motivadas são tabulados em Beranek (1949), conforme medido a partir das curvas de Stevens e Volkmann:
Hz | 20 | 160 | 394 | 670 | 1000 | 1420 | 1900 | 2450 | 3120 | 4000 | 5100 | 6600 | 9000 | 14000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
mel | 0 | 250 | 500 | 750 | 1000 | 1250 | 1500 | 1750 | 2000 | 2250 | 2500 | 2750 | 3000 | 3250 |
Uma fórmula com uma frequência de ruptura de 625 Hz é dada por Lindsay & Norman (1977); a fórmula não aparece na sua primeira edição de 1972:
m = 2410 log 10 ( 0.0016 f + 1 ) {\\displaystyle m=2410\log _{10}(0.0016f+1)}
Para comparação directa com outras fórmulas, isto é equivalente a:
m = 2410 log 10 ( 1 + f 625 ) {\displaystyle m=2410\log _{10}{10}{10}esquerda(1+{\frac {625}}{625}}direita)} A freqüência de ruptura (por exemplo, 700 Hz, 1000 Hz ou 625 Hz) é o único parâmetro livre na forma usual da fórmula. Algumas fórmulas sem escala de frequência auditiva usam a mesma forma, mas com frequência de quebra muito mais baixa, não necessariamente mapeando para 1000 a 1000 Hz; por exemplo, a escala ERB de Glasberg & Moore (1990) usa um ponto de quebra de 228,8 Hz, e o mapa de frequência coclear de Greenwood (1990) usa 165,3 Hz.
Outras formas funcionais para a escala mel foram exploradas por Umesh et al.; eles apontam que as fórmulas tradicionais com uma região logarítmica e uma região linear não se encaixam nos dados das curvas de Stevens e Volkmann, bem como algumas outras formas, com base na seguinte tabela de dados de medidas que eles fizeram a partir dessas curvas: