Der findes ikke en enkelt formel for melskalaen. Den populære formel fra O’Shaughnessys bog kan udtrykkes med forskellige logaritmiske baser:

m = 2595 log 10 ( 1 + f 700 ) = 1127 ln ( 1 + f 700 ) {\displaystyle m=2595\log _{10}\left(1+{{\frac {f}{700}}}\right)=1127\ln \left(1+{{\frac {f}{700}}}\right)}

{\displaystyle m=2595\log _{10}\left(1+{{\frac {f}{700}}}\right)=1127\ln \left(1+{{\frac {f}{700}}}\right)}

De tilsvarende omvendte udtryk er:

f = 700 ( 10 m 2595 – 1 ) = 700 ( e m 1127 – 1 ) {\displaystyle f=700\left(10^{\frac {m}{2595}}}-1\right)=700\left(e^{\frac {m}{1127}}}-1\right)}

{\displaystyle f=700\left(10^{\frac {m}{2595}}}-1\right)=700\left(e^{\frac {m}{1127}}}-1\right)}

Der er blevet offentliggjort kurver og tabeller over psykofysiske tonehøjdeskalaer siden Steinbergs kurver fra 1937 baseret på netop mærkbare forskelle i tonehøjde. Flere kurver fulgte snart efter i Fletcher og Munsons 1937 og Fletchers 1938og Stevens’ 1937 og Stevens og Volkmanns 1940papirer ved hjælp af en række forskellige eksperimentelle metoder og analysetilgange.

I 1949 offentliggjorde Koenig en tilnærmelse baseret på separate lineære og logaritmiske segmenter, med et brud ved 1000 Hz.

Gunnar Fant foreslog den nuværende populære lineære/logaritmiske formel i 1949, men med 1000 Hz hjørnefrekvens.

Et alternativt udtryk for formlen, der ikke er afhængig af valg af logaritmebase, er noteret i Fant (1968):

m = 1000 log 2 log ( 1 + f 1000 ) {\displaystyle m={\frac {1000}{\log 2}}}\log \left(1+{{\frac {f}{1000}}}\right)\ }

{\displaystyle m={\frac {1000}{\log 2}}}\log \left(1+{\frac {f}{1000}}}\right)\ }

I 1976 offentliggjorde Makhoul og Cosell den nu populære version med 700 Hz hjørnefrekvens.Som Ganchev et al. har bemærket: “Formlerne , sammenlignet med , giver en tættere tilnærmelse af Mel-skalaen for frekvenser under 1000 Hz, til prisen af større unøjagtighed for frekvenser højere end 1000 Hz”. Over 7 kHz er situationen imidlertid omvendt, og 700 Hz-versionen passer igen bedre.

Data, hvormed nogle af disse formler er motiveret, er opgjort i Beranek (1949), som målt ud fra Stevens og Volkmanns kurver:

Beranek 1949 mel skala data fra Stevens og Volkmann 1940
Hz 20 160 394 670 1000 1420 1900 2450 3120 4000 5100 6600 9000 14000
mel 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 3250

En formel med en brudfrekvens på 625 Hz er givet af Lindsay & Norman (1977); formlen optræder ikke i deres første udgave fra 1972:

m = 2410 log 10 ( 0.0016 f + 1 ) {\displaystyle m=2410\log _{10}(0.0016f+1)}

{\displaystyle m=2410\log _{10}(0.0016f+1)}

Til direkte sammenligning med andre formler svarer dette til:

m = 2410 log 10 ( 1 + f 625 ) {\displaystyle m=2410\log _{10}\left(1+{{\frac {f}{625}}}\right)}

{\displaystyle m=2410\log _{10}\left(1+{{\frac {f}{625}}}\right)}

De fleste mel-skala-formler giver præcis 1000 mels ved 1000 Hz. Brudfrekvensen (f.eks. 700 Hz, 1000 Hz eller 625 Hz) er den eneste frie parameter i den sædvanlige form af formlen. Nogle ikke-mel-auditive frekvensskalaformler anvender samme form, men med meget lavere pausefrekvens, der ikke nødvendigvis svarer til 1000 ved 1000 Hz; f.eks. anvender Glasberg & Moores ERB-frekvensskala (1990) et pausepunkt på 228,8 Hz, og Greenwoods (1990) cochleare frekvens-placeringskort anvender 165,3 Hz.

Umesh et al. har undersøgt andre funktionelle former for mel-skalaen; de påpeger, at de traditionelle formler med et logaritmisk område og et lineært område ikke passer til dataene fra Stevens og Volkmanns kurver lige så godt som nogle andre former, baseret på følgende datatabel med målinger, som de har foretaget ud fra disse kurver:

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.