Det finns ingen enda formel för melskalan. Den populära formeln från O’Shaughnessys bok kan uttryckas med olika logaritmiska baser:

m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {\displaystyle m=2595\log _{10}\left(1+{\frac {f}{700}}\right)=1127\ln \left(1+{{\frac {f}{700}}\right)}

{\displaystyle m=2595\log _{10}\left(1+{\frac {f}{700}}}\right)=1127\ln \left(1+{\frac {f}{700}}}\right)}

Den motsvarande omvända uttrycken är:

f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\displaystyle f=700\left(10^{\frac {m}{2595}}-1\right)=700\left(e^{\frac {m}{1127}}-1\right)}

{\displaystyle f=700\left(10^{\frac {m}{2595}}-1\right)=700\left(e^{\frac {m}{1127}}-1\right)}

Det har funnits publicerade kurvor och tabeller över psykofysiska tonhöjdsskalor sedan Steinbergs kurvor från 1937, som baserades på precis märkbara skillnader i tonhöjd. Fler kurvor följde snart i Fletcher och Munsons 1937 och Fletchers 1938och Stevens 1937 och Stevens och Volkmanns 1940papper där man använde en mängd olika experimentella metoder och analysmetoder.

1949 publicerade Koenig en approximation baserad på separata linjära och logaritmiska segment, med ett avbrott vid 1000 Hz.

Gunnar Fant föreslog 1949 den nuvarande populära linjära/logaritmiska formeln, men med 1000 Hz hörnfrekvens.

Ett alternativt uttryck för formeln, som inte är beroende av valet av logaritmbas, noteras i Fant (1968):

m = 1000 log 2 log ( 1 + f 1000 ) {\displaystyle m={\frac {1000}{\log 2}}}\log \left(1+{\frac {f}{1000}}\right)\ }

{\displaystyle m={\frac {1000}{\log 2}}\log \left(1+{\frac {f}{1000}}\right)\ }

År 1976 publicerade Makhoul och Cosell den numera populära versionen med en hörnfrekvens på 700 Hz.Som Ganchev et al. har observerat: ”Formlerna , jämfört med , ger en närmare approximation av Mel-skalan för frekvenser under 1000 Hz, till priset av större inexakthet för frekvenser högre än 1000 Hz”. Över 7 kHz är situationen dock den omvända, och 700 Hz-versionen passar återigen bättre.

Data som motiverar några av dessa formler finns i Beranek (1949) i tabellform, som mätt från Stevens och Volkmanns kurvor:

Beranek 1949 mel skaldata från Stevens och Volkmann 1940
Hz 20 160 394 670 1000 1420 1900 2450 3120 4000 5100 6600 9000 14000
mel 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 3250

En formel med en brytfrekvens på 625 Hz ges av Lindsay & Norman (1977); formeln finns inte med i deras första upplaga från 1972:

m = 2410 log 10 ( 0.0016 f + 1 ) {\displaystyle m=2410\log _{10}(0.0016f+1)}

{\displaystyle m=2410\log _{10}(0.0016f+1)}

För direkt jämförelse med andra formler är detta likvärdigt med:

m = 2410 log 10 ( 1 + f 625 ) {\displaystyle m=2410\log _{10}\left(1+{\frac {f}{625}}\right)}

{\displaystyle m=2410\log _{10}\left(1+{\frac {f}{625}}}\right)}

De flesta formler för melskala ger exakt 1000 mels vid 1000 Hz. Brytningsfrekvensen (t.ex. 700 Hz, 1000 Hz eller 625 Hz) är den enda fria parametern i formelns vanliga form. Vissa formler för auditiva frekvensskalor som inte är melskalor använder samma form men med mycket lägre brytningsfrekvens, som inte nödvändigtvis motsvarar 1000 vid 1000 Hz; till exempel använder Glasberg & Moores ERB-frekvensskala (1990) en brytningspunkt på 228,8 Hz, och Greenwoods (1990) karta över cochleära frekvenser och platser använder 165,3 Hz.

Andra funktionella former för mel-skalan har undersökts av Umesh et al. De påpekar att de traditionella formlerna med ett logaritmiskt område och ett linjärt område inte passar data från Stevens och Volkmanns kurvor lika bra som vissa andra former, baserat på följande datatabell med mätningar som de gjort från dessa kurvor:

Lämna ett svar

Din e-postadress kommer inte publiceras.