比較

類似性。 MAEとRMSEの両方が、対象変数の単位で平均的なモデル予測誤差を表します。 両方のメトリクスは0から∞の範囲で、誤差の方向には無頓着です。 それらは負に向いたスコアであり、値が低いほど良いことを意味する。

差分。 平均二乗誤差の平方根を取ることは、RMSEに対していくつかの興味深い意味を持ちます。 誤差は平均化される前に2乗されるので、RMSEは大きな誤差に比較的高い重みを与えます。 つまり、大きな誤差が特に好ましくない場合、RMSEはより有用であるはずです。 以下の3つの表は、誤差の大きさの度数分布に関連する分散が増加すると、MAEが安定し、RMSEが増加する例を示しています。

MAE and RMSE for cases of increasing error variance

最後の文は少し口が悪いですが、しばしば間違って解釈されているので強調することが重要だと思います。

RMSE is not necessarily increase with the variance of the errors…RMSEは必ずしも誤差の分散とともに増加するわけではありません。 RMSE は、誤差の大きさの度数分布の分散とともに増加します。

実証するために、以下の表のケース 4 とケース 5 を考えてみましょう。 ケース4は0と5のテスト誤差が同数であり、ケース5は3と4のテスト誤差が同数である。 誤差の分散はケース4の方が大きいですが、RMSEはケース4とケース5で同じです。

3,4,5 is a Pythagorean Triple

エラー大きさの度数分布の分散(まだ口語的)が興味のある場合もありますが、ほとんどの場合(私が考えるところ)には、エラー値の分散の方が興味があるのだと思います。

あまり議論されていないRMSEの公式のもう一つの意味は、サンプルサイズに関係します。 MAEを使って、RMSEの下限と上限を決めることができます。

  1. ≤ 。 RMSEの結果は常にMAEより大きいか等しくなります。 すべての誤差が同じ大きさであれば、RMSE=MAE.
  2. ≤ 、ここでnはテストサンプルの数です。 RMSEとMAEの差は、予測誤差のすべてが1つのテストサンプルに由来する場合に最も大きくなります。 二乗誤差は、その単一のテストサンプルでは1に等しく、他のすべてのサンプルでは0になります。 平方根を取ると、RMSE は .

上限に焦点を当てると、これはテスト サンプル サイズが増加すると、RMSE は MAE よりも大きくなる傾向があることを意味します。

コメントを残す

メールアドレスが公開されることはありません。