Não há uma única fórmula de escala de mel. A popular fórmula do livro de O’Shaughnessy pode ser expressa com diferentes bases logarítmicas:

m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {\displaystyle m=2595\log _{10}{10}esquerda(1+{\frac {700}}{700}} =1127ln {\frac {1+{\frac {700}}direita)}

>197>{\i1}displaystyle m=2595{\i}log _{\i}esquerda(1+{\i}{\i}{\i}{700}{\i1}direita)=1127{\i}esquerda(1+{\i}{\i}{\i}{\i}{\i}{\i}{\i1}-7830>

As expressões inversas correspondentes são:

f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\i1}f=700{\i1}esquerda(10^{\i}{\i}frac {m}{2595}}-1}direita)=700{\i}esquerda(e^{\i}{\i}{\i}-127}-1{\i1}direita)} Mais curvas logo se seguiram nas curvas de Fletcher e Munson 1937 e Fletcher 1938 e Stevens 1937 e Stevens e Volkmann 1940, usando uma variedade de métodos experimentais e abordagens de análise.

Em 1949 Koenig publicou uma aproximação baseada em segmentos lineares e logarítmicos separados, com uma quebra a 1000 Hz.

Gunnar Fant propôs a actual fórmula linear/logarítmica popular em 1949, mas com a frequência de canto de 1000 Hz.

Uma expressão alternativa da fórmula, não dependendo da escolha da base logarítmica, é anotada em Fant (1968):

m = 1000 log 2 log ( 1 + f 1000 ) {\displaystyle m={\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac {\frac }}}}

{\i1}{\i1000}{\i1}{\i1000}{\i1}log 2}{\i1+{\i1000}{\i1}direita}

Em 1976, Makhoul e Cosell publicaram a versão agora popular com a frequência de canto de 700 Hz.Como observaram Ganchev et al., “As fórmulas, quando comparadas com , proporcionam uma aproximação mais próxima da escala de Mel para frequências abaixo de 1000 Hz, ao preço de uma maior imprecisão para frequências superiores a 1000 Hz”. Acima de 7 kHz, entretanto, a situação é invertida, e a versão de 700 Hz novamente se encaixa melhor.

Dados pelos quais algumas destas fórmulas são motivadas são tabulados em Beranek (1949), conforme medido a partir das curvas de Stevens e Volkmann:

Beranek 1949 dados da escala de mel de Stevens e Volkmann 1940
Hz 20 160 394 670 1000 1420 1900 2450 3120 4000 5100 6600 9000 14000
mel 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 3250

Uma fórmula com uma frequência de ruptura de 625 Hz é dada por Lindsay & Norman (1977); a fórmula não aparece na sua primeira edição de 1972:

m = 2410 log 10 ( 0.0016 f + 1 ) {\\displaystyle m=2410\log _{10}(0.0016f+1)}

{\displaystyle m=2410\log _{10}(0.0016f+1)}

Para comparação directa com outras fórmulas, isto é equivalente a:

m = 2410 log 10 ( 1 + f 625 ) {\displaystyle m=2410\log _{10}{10}{10}esquerda(1+{\frac {625}}{625}}direita)} A freqüência de ruptura (por exemplo, 700 Hz, 1000 Hz ou 625 Hz) é o único parâmetro livre na forma usual da fórmula. Algumas fórmulas sem escala de frequência auditiva usam a mesma forma, mas com frequência de quebra muito mais baixa, não necessariamente mapeando para 1000 a 1000 Hz; por exemplo, a escala ERB de Glasberg & Moore (1990) usa um ponto de quebra de 228,8 Hz, e o mapa de frequência coclear de Greenwood (1990) usa 165,3 Hz.

Outras formas funcionais para a escala mel foram exploradas por Umesh et al.; eles apontam que as fórmulas tradicionais com uma região logarítmica e uma região linear não se encaixam nos dados das curvas de Stevens e Volkmann, bem como algumas outras formas, com base na seguinte tabela de dados de medidas que eles fizeram a partir dessas curvas:

Deixe uma resposta

O seu endereço de email não será publicado.