Abweichung vom quadratischen Mittelwert - Root-mean-square deviation

Die quadratische Abweichung ( RMSD ) oder der quadratische Fehler ( RMSE ) ist ein häufig verwendetes Maß für die Unterschiede zwischen Werten (Stichproben- oder Populationswerte), die von einem Modell oder einem Schätzer vorhergesagt werden, und den beobachteten Werten. Die RMSD stellt die Quadratwurzel aus der zweiten Probe Moment der Unterschiede zwischen den vorhergesagten Werten und den beobachteten Werten oder dem quadratischen Mittelwert dieser Differenzen. Diese Abweichungen werden als Residuen bezeichnet, wenn die Berechnungen für die Datenstichprobe durchgeführt werden, die für die Schätzung verwendet wurde, und werden als Fehler (oder Vorhersagefehler) bezeichnet, wenn sie außerhalb der Stichprobe berechnet werden. Der RMSD dient dazu, die Größenordnungen der Fehler in Vorhersagen für verschiedene Datenpunkte zu einem einzigen Maß für die Vorhersagekraft zu aggregieren. RMSD ist ein Maß für die Genauigkeit , um Vorhersagefehler verschiedener Modelle für einen bestimmten Datensatz und nicht zwischen Datensätzen zu vergleichen, da er skalenabhängig ist.

RMSD ist immer nicht negativ, und ein Wert von 0 (in der Praxis fast nie erreicht) würde eine perfekte Anpassung an die Daten anzeigen. Im Allgemeinen ist ein niedrigerer RMSD besser als ein höherer. Vergleiche zwischen verschiedenen Datentypen wären jedoch ungültig, da das Maß von der Skala der verwendeten Zahlen abhängt.

RMSD ist die Quadratwurzel des Durchschnitts der quadrierten Fehler. Die Auswirkung jedes Fehlers auf RMSD ist proportional zur Größe des quadrierten Fehlers; daher haben größere Fehler einen unverhältnismäßig großen Einfluss auf RMSD. Folglich reagiert RMSD empfindlich auf Ausreißer.

Formel

Der RMSD eines Schätzers in Bezug auf einen geschätzten Parameter ist als die Quadratwurzel des mittleren quadratischen Fehlers definiert :

Bei einem unverzerrten Schätzer ist der RMSD die Quadratwurzel der Varianz, die als Standardabweichung bekannt ist .

Der RMSD der vorhergesagten Werte für die Zeiten t der abhängigen Variablen einer Regression mit Variablen, die über T- Zeiten beobachtet wurden, wird für T verschiedene Vorhersagen als Quadratwurzel des Mittelwerts der Quadrate der Abweichungen berechnet:

(Bei Regressionen von Querschnittsdaten wird das tiefgestellte t durch i und T durch n ersetzt .)

In einigen Disziplinen wird der RMSD verwendet, um Unterschiede zwischen zwei Dingen zu vergleichen, die variieren können, von denen keines als "Standard" akzeptiert wird. Wenn Sie beispielsweise die durchschnittliche Differenz zwischen zwei Zeitreihen und messen , lautet die Formel

Normalisierung

Die Normalisierung des RMSD erleichtert den Vergleich zwischen Datensätzen oder Modellen mit unterschiedlichen Maßstäben. Obwohl es in der Literatur keine einheitlichen Mittel zur Normalisierung gibt, sind gängige Optionen der Mittelwert oder der Bereich (definiert als Maximalwert minus Minimalwert) der gemessenen Daten:

oder .

Dieser Wert wird im Allgemeinen als normalisierte quadratische Abweichung oder Fehler (NRMSD oder NRMSE) bezeichnet und oft als Prozentsatz ausgedrückt, wobei niedrigere Werte eine geringere Restvarianz anzeigen. In vielen Fällen, insbesondere bei kleineren Stichproben, wird der Stichprobenumfang wahrscheinlich durch die Stichprobengröße beeinflusst, was Vergleiche erschweren würde.

Ein weiteres mögliches Verfahren , um den RMSD zu einem nützlicheren Vergleichsmaß zu machen , besteht darin , den RMSD durch den Interquartilabstand zu teilen . Bei Division des RMSD mit dem IQR wird der normalisierte Wert weniger empfindlich für Extremwerte in der Zielvariablen.

wo

mit und wobei CDF −1 die Quantilfunktion ist .

Bei der Normierung mit dem Mittelwert der Messwerte kann zur Vermeidung von Mehrdeutigkeiten der Begriff Variationskoeffizient des RMSD, CV(RMSD) verwendet werden. Dies ist analog zum Variationskoeffizienten, wobei der RMSD an die Stelle der Standardabweichung tritt .

Mittlerer absoluter Fehler

Einige Forscher haben die Verwendung des Mean Absolute Error (MAE) anstelle der Root Mean Square Deviation empfohlen . MAE besitzt gegenüber RMSD Vorteile in der Interpretierbarkeit. MAE ist der Durchschnitt der absoluten Werte der Fehler. MAE ist grundsätzlich leichter zu verstehen als die Quadratwurzel aus dem Durchschnitt der quadrierten Fehler. Darüber hinaus beeinflusst jeder Fehler die MAE direkt proportional zum Absolutwert des Fehlers, was bei RMSD nicht der Fall ist.

Anwendungen

Siehe auch

Verweise

  1. ^ Hyndman, Rob J.; Köhler, Anne B. (2006). "Ein weiterer Blick auf die Maße der Vorhersagegenauigkeit". Internationale Zeitschrift für Prognosen . 22 (4): 679–688. CiteSeerX  10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .
  2. ^ a b Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). „Informationskomponenten für den Vergleich mit mehreren Auflösungen zwischen Karten, die eine reale Variable teilen“. Umweltökologische Statistik . 15 (2): 111–142. doi : 10.1007/s10651-007-0043-y .
  3. ^ Willmott, Cort; Matsuura, Kenji (2006). "Über die Verwendung von dimensionierten Fehlermaßen zur Bewertung der Leistung von räumlichen Interpolatoren". Internationale Zeitschrift für Geographische Informationswissenschaft . 20 : 89–102. doi : 10.1080/13658810500286976 .
  4. ^ "Coastal Inlets Research Program (CIRP) Wiki - Statistik" . Abgerufen am 4. Februar 2015 .
  5. ^ "FAQ: Was ist der Variationskoeffizient?" . Abgerufen am 19. Februar 2019 .
  6. ^ Armstrong, J. Scott; Collopy, Fred (1992). "Fehlermaße zur Verallgemeinerung von Prognosemethoden: Empirische Vergleiche" (PDF) . Internationale Zeitschrift für Prognosen . 8 (1): 69–80. CiteSeerX  10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .
  7. ^ Anderson, Abgeordneter; Wößner, WW (1992). Angewandte Grundwassermodellierung: Simulation von Strömung und advektivem Transport (2. Aufl.). Akademische Presse.
  8. ^ Ensemble Neuronales Netzwerkmodell
  9. ^ ANSI/BPI-2400-S-2012: Standard Practice for standardized Qualification of the Whole House Energy Savings Predictions by Calibration to Energieverbrauch History