MAE și RMSE - Care metrică este mai bună?

Comparare

Similitudini: Atât MAE, cât și RMSE exprimă eroarea medie de predicție a modelului în unități ale variabilei de interes. Ambele metrici pot varia de la 0 la ∞ și sunt indiferente la direcția erorilor. Acestea sunt scoruri orientate negativ, ceea ce înseamnă că valorile mai mici sunt mai bune.

Diferențe: Luarea rădăcinii pătrate a erorilor pătratice medii are unele implicații interesante pentru RMSE. Deoarece erorile sunt ridicate la pătrat înainte de a fi mediate, RMSE acordă o pondere relativ mare erorilor mari. Acest lucru înseamnă că RMSE ar trebui să fie mai util atunci când erorile mari sunt deosebit de nedorite. Cele trei tabele de mai jos prezintă exemple în care MAE este constant și RMSE crește pe măsură ce crește și varianța asociată cu distribuția de frecvență a mărimilor erorilor.

MAE și RMSE pentru cazuri de creștere a varianței erorilor

Ultima propoziție este un pic cam lungă de gură, dar cred că este adesea interpretată incorect și este important de subliniat.

RMSE nu crește neapărat cu varianța erorilor. RMSE crește cu varianța distribuției de frecvență a mărimilor erorilor.

Pentru a demonstra, luați în considerare Cazul 4 și Cazul 5 din tabelele de mai jos. Cazul 4 are un număr egal de erori de testare de 0 și 5 și Cazul 5 are un număr egal de erori de testare de 3 și 4. Varianța erorilor este mai mare în Cazul 4, dar RMSE este același pentru Cazul 4 și Cazul 5.

Pot exista cazuri în care varianța distribuției de frecvență a mărimilor erorilor (încă o vorbă lungă) este interesantă, dar în majoritatea cazurilor (la care mă pot gândi) varianța erorilor este mai interesantă.

O altă implicație a formulei RMSE care nu este adesea discutată are legătură cu dimensiunea eșantionului. Utilizând MAE, putem pune o limită inferioară și superioară pentru RMSE.

≤ . Rezultatul RMSE va fi întotdeauna mai mare sau egal cu MAE. Dacă toate erorile au aceeași magnitudine, atunci RMSE=MAE.
≤ , unde n este numărul de eșantioane de testare. Diferența dintre RMSE și MAE este mai mare atunci când toată eroarea de predicție provine de la un singur eșantion de testare. Eroarea pătratică este atunci egală cu pentru acel singur eșantion de testare și cu 0 pentru toate celelalte eșantioane. Dacă se ia rădăcina pătrată, RMSE este atunci egal cu .

Centrându-se pe limita superioară, aceasta înseamnă că RMSE are tendința de a fi din ce în ce mai mare decât MAE pe măsură ce dimensiunea eșantionului de testare crește.

Acest lucru poate fi problematic atunci când se compară rezultatele RMSE calculate pe eșantioane de testare de dimensiuni diferite, ceea ce este frecvent cazul în modelarea din lumea reală.

MAE și RMSE – Care metrică este mai bună?

Comparare

Lasă un răspuns Anulează răspunsul