Es gibt keine einheitliche Formel für die Mel-Skala. Die bekannte Formel aus O’Shaughnessys Buch kann mit verschiedenen logarithmischen Basen ausgedrückt werden:

m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {\displaystyle m=2595\log _{10}\links(1+{\frac {f}{700}}\rechts)=1127\ln \links(1+{\frac {f}{700}}\rechts)}

{\displaystyle m=2595\log _{10}\left(1+{\frac {f}{700}}\right)=1127\ln \left(1+{\frac {f}{700}}\right)}

Die entsprechenden inversen Ausdrücke sind:

f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\displaystyle f=700\left(10^{\frac {m}{2595}}-1\right)=700\left(e^{\frac {m}{1127}}-1\right)}

{\displaystyle f=700\left(10^{\frac {m}{2595}}-1\right)=700\left(e^{\frac {m}{1127}}-1\right)}

Seit Steinbergs Kurven aus dem Jahr 1937, die auf gerade noch wahrnehmbaren Tonhöhenunterschieden basieren, wurden Kurven und Tabellen zu psychophysischen Tonhöhenskalen veröffentlicht. Weitere Kurven folgten bald in den Veröffentlichungen von Fletcher und Munson (1937) und Fletcher (1938) sowie von Stevens (1937) und Stevens und Volkmann (1940), die verschiedene experimentelle Methoden und Analyseansätze verwendeten.

1949 veröffentlichte Koenig eine Annäherung, die auf getrennten linearen und logarithmischen Segmenten basierte, mit einem Bruch bei 1000 Hz.

Gunnar Fant schlug 1949 die heute gängige linear/logarithmische Formel vor, allerdings mit der Eckfrequenz von 1000 Hz.

Ein alternativer Ausdruck der Formel, der nicht von der Wahl der Logarithmusbasis abhängt, ist in Fant (1968) aufgeführt:

m = 1000 log 2 log ( 1 + f 1000 ) {\displaystyle m={\frac {1000}{\log 2}}\log \left(1+{\frac {f}{1000}}\right)\ }

{\displaystyle m={\frac {1000}{\log 2}}\log \left(1+{\frac {f}{1000}}\right)\ }

Im Jahr 1976 veröffentlichten Makhoul und Cosell die heute populäre Version mit der 700 Hz-Eckfrequenz.Wie Ganchev et al. feststellten, „bieten die Formeln im Vergleich zu , eine bessere Annäherung an die Mel-Skala für Frequenzen unter 1000 Hz, allerdings um den Preis einer größeren Ungenauigkeit für Frequenzen über 1000 Hz.“ Oberhalb von 7 kHz kehrt sich die Situation jedoch um, und die 700-Hz-Version passt wieder besser.

Daten, durch die einige dieser Formeln motiviert sind, sind in Beranek (1949) tabellarisch aufgeführt, gemessen an den Kurven von Stevens und Volkmann:

Beranek 1949 mel scale data from Stevens and Volkmann 1940
Hz 20 160 394 670 1000 1420 1900 2450 3120 4000 5100 6600 9000 14000
mel 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 3250

Eine Formel mit einer Bruchfrequenz von 625 Hz wird von Lindsay & Norman (1977) angegeben; Die Formel erscheint nicht in ihrer ersten Ausgabe von 1972:

m = 2410 log 10 ( 0.0016 f + 1 ) {\displaystyle m=2410\log _{10}(0.0016f+1)}

{\displaystyle m=2410\log _{10}(0.0016f+1)}

Für den direkten Vergleich mit anderen Formeln ist dies äquivalent zu:

m = 2410 log 10 ( 1 + f 625 ) {\displaystyle m=2410\log _{10}\links(1+{\frac {f}{625}}\rechts)}

{\displaystyle m=2410\log _{10}\links(1+{\frac {f}{625}}\rechts)}

Die meisten Mel-Skalen-Formeln ergeben genau 1000 mels bei 1000 Hz. Die Bruchfrequenz (z. B. 700 Hz, 1000 Hz oder 625 Hz) ist der einzige freie Parameter in der üblichen Form der Formel. Einige Formeln für Hörfrequenzskalen, die keine Mels sind, verwenden dieselbe Form, aber mit einer viel niedrigeren Unterbrechungsfrequenz, die nicht notwendigerweise 1000 bei 1000 Hz abbildet; zum Beispiel verwendet die ERB-Ratenskala von Glasberg & Moore (1990) einen Unterbrechungspunkt von 228,8 Hz, und die Cochlea-Frequenz-Ort-Karte von Greenwood (1990) verwendet 165,3 Hz.

Andere Funktionsformen für die mel-Skala wurden von Umesh et al. untersucht; sie weisen darauf hin, dass die traditionellen Formeln mit einem logarithmischen Bereich und einem linearen Bereich nicht so gut zu den Daten aus den Kurven von Stevens und Volkmann passen wie einige andere Formen, basierend auf der folgenden Datentabelle mit Messungen, die sie anhand dieser Kurven vorgenommen haben:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.