Abweichung vom quadratischen Mittelwert - Root-mean-square deviation
Statistiken |
---|
Die quadratische Abweichung ( RMSD ) oder der quadratische Fehler ( RMSE ) ist ein häufig verwendetes Maß für die Unterschiede zwischen Werten (Stichproben- oder Populationswerte), die von einem Modell oder einem Schätzer vorhergesagt werden, und den beobachteten Werten. Die RMSD stellt die Quadratwurzel aus der zweiten Probe Moment der Unterschiede zwischen den vorhergesagten Werten und den beobachteten Werten oder dem quadratischen Mittelwert dieser Differenzen. Diese Abweichungen werden als Residuen bezeichnet, wenn die Berechnungen für die Datenstichprobe durchgeführt werden, die für die Schätzung verwendet wurde, und werden als Fehler (oder Vorhersagefehler) bezeichnet, wenn sie außerhalb der Stichprobe berechnet werden. Der RMSD dient dazu, die Größenordnungen der Fehler in Vorhersagen für verschiedene Datenpunkte zu einem einzigen Maß für die Vorhersagekraft zu aggregieren. RMSD ist ein Maß für die Genauigkeit , um Vorhersagefehler verschiedener Modelle für einen bestimmten Datensatz und nicht zwischen Datensätzen zu vergleichen, da er skalenabhängig ist.
RMSD ist immer nicht negativ, und ein Wert von 0 (in der Praxis fast nie erreicht) würde eine perfekte Anpassung an die Daten anzeigen. Im Allgemeinen ist ein niedrigerer RMSD besser als ein höherer. Vergleiche zwischen verschiedenen Datentypen wären jedoch ungültig, da das Maß von der Skala der verwendeten Zahlen abhängt.
RMSD ist die Quadratwurzel des Durchschnitts der quadrierten Fehler. Die Auswirkung jedes Fehlers auf RMSD ist proportional zur Größe des quadrierten Fehlers; daher haben größere Fehler einen unverhältnismäßig großen Einfluss auf RMSD. Folglich reagiert RMSD empfindlich auf Ausreißer.
Formel
Der RMSD eines Schätzers in Bezug auf einen geschätzten Parameter ist als die Quadratwurzel des mittleren quadratischen Fehlers definiert :
Bei einem unverzerrten Schätzer ist der RMSD die Quadratwurzel der Varianz, die als Standardabweichung bekannt ist .
Der RMSD der vorhergesagten Werte für die Zeiten t der abhängigen Variablen einer Regression mit Variablen, die über T- Zeiten beobachtet wurden, wird für T verschiedene Vorhersagen als Quadratwurzel des Mittelwerts der Quadrate der Abweichungen berechnet:
(Bei Regressionen von Querschnittsdaten wird das tiefgestellte t durch i und T durch n ersetzt .)
In einigen Disziplinen wird der RMSD verwendet, um Unterschiede zwischen zwei Dingen zu vergleichen, die variieren können, von denen keines als "Standard" akzeptiert wird. Wenn Sie beispielsweise die durchschnittliche Differenz zwischen zwei Zeitreihen und messen , lautet die Formel
Normalisierung
Die Normalisierung des RMSD erleichtert den Vergleich zwischen Datensätzen oder Modellen mit unterschiedlichen Maßstäben. Obwohl es in der Literatur keine einheitlichen Mittel zur Normalisierung gibt, sind gängige Optionen der Mittelwert oder der Bereich (definiert als Maximalwert minus Minimalwert) der gemessenen Daten:
- oder .
Dieser Wert wird im Allgemeinen als normalisierte quadratische Abweichung oder Fehler (NRMSD oder NRMSE) bezeichnet und oft als Prozentsatz ausgedrückt, wobei niedrigere Werte eine geringere Restvarianz anzeigen. In vielen Fällen, insbesondere bei kleineren Stichproben, wird der Stichprobenumfang wahrscheinlich durch die Stichprobengröße beeinflusst, was Vergleiche erschweren würde.
Ein weiteres mögliches Verfahren , um den RMSD zu einem nützlicheren Vergleichsmaß zu machen , besteht darin , den RMSD durch den Interquartilabstand zu teilen . Bei Division des RMSD mit dem IQR wird der normalisierte Wert weniger empfindlich für Extremwerte in der Zielvariablen.
- wo
mit und wobei CDF −1 die Quantilfunktion ist .
Bei der Normierung mit dem Mittelwert der Messwerte kann zur Vermeidung von Mehrdeutigkeiten der Begriff Variationskoeffizient des RMSD, CV(RMSD) verwendet werden. Dies ist analog zum Variationskoeffizienten, wobei der RMSD an die Stelle der Standardabweichung tritt .
Mittlerer absoluter Fehler
Einige Forscher haben die Verwendung des Mean Absolute Error (MAE) anstelle der Root Mean Square Deviation empfohlen . MAE besitzt gegenüber RMSD Vorteile in der Interpretierbarkeit. MAE ist der Durchschnitt der absoluten Werte der Fehler. MAE ist grundsätzlich leichter zu verstehen als die Quadratwurzel aus dem Durchschnitt der quadrierten Fehler. Darüber hinaus beeinflusst jeder Fehler die MAE direkt proportional zum Absolutwert des Fehlers, was bei RMSD nicht der Fall ist.
Anwendungen
- In der Meteorologie , um zu sehen, wie effektiv ein mathematisches Modell das Verhalten der Atmosphäre vorhersagt .
- In der Bioinformatik ist die quadratische Abweichung von Atompositionen das Maß für den durchschnittlichen Abstand zwischen den Atomen überlagerter Proteine .
- In Struktur basiertes Wirkstoffdesign ist die RMSD ein Maß für die Differenz zwischen einer Kristall Konformation der Liganden - Konformation und einer Docking - Vorhersage.
- In den Wirtschaftswissenschaften wird der RMSD verwendet, um zu bestimmen, ob ein Wirtschaftsmodell zu Wirtschaftsindikatoren passt . Einige Experten haben argumentiert, dass RMSD weniger zuverlässig ist als der relative absolute Fehler.
- In der experimentellen Psychologie wird der RMSD verwendet, um zu beurteilen, wie gut mathematische oder computergestützte Verhaltensmodelle das empirisch beobachtete Verhalten erklären.
- In GIS ist der RMSD ein Maß für die Bewertung der Genauigkeit von räumlichen Analysen und Fernerkundung.
- In der Hydrogeologie werden RMSD und NRMSD verwendet, um die Kalibrierung eines Grundwassermodells zu bewerten.
- In der Bildgebungswissenschaft ist der RMSD Teil des Signal-Rausch-Verhältnisses , ein Maß, das verwendet wird, um zu beurteilen, wie gut eine Methode zur Rekonstruktion eines Bildes im Vergleich zum Originalbild abschneidet.
- In der Computational Neuroscience wird der RMSD verwendet, um zu beurteilen, wie gut ein System ein bestimmtes Modell lernt.
- In der kernmagnetischen Resonanzspektroskopie von Proteinen wird die RMSD als Maß verwendet, um die Qualität des erhaltenen Strukturbündels abzuschätzen.
- Die Einreichungen für den Netflix-Preis wurden anhand des RMSD aus den nicht offenbarten "wahren" Werten des Testdatensatzes bewertet.
- Bei der Simulation des Energieverbrauchs von Gebäuden werden RMSE und CV(RMSE) verwendet, um Modelle auf die gemessene Gebäudeleistung zu kalibrieren.
- In der Röntgenkristallographie wird RMSD (und RMSZ) verwendet, um die Abweichung der internen molekularen Koordinaten von den Werten der Beschränkungsbibliothek zu messen.
Siehe auch
- Quadratischer Mittelwert
- Mittlerer absoluter Fehler
- Durchschnittliche absolute Abweichung
- Mittlere Abweichung mit Vorzeichen
- Mittlere quadratische Abweichung
- Quadratische Abweichungen
- Fehler und Residuen in der Statistik
Verweise
- ^ Hyndman, Rob J.; Köhler, Anne B. (2006). "Ein weiterer Blick auf die Maße der Vorhersagegenauigkeit". Internationale Zeitschrift für Prognosen . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .
- ^ a b Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). „Informationskomponenten für den Vergleich mit mehreren Auflösungen zwischen Karten, die eine reale Variable teilen“. Umweltökologische Statistik . 15 (2): 111–142. doi : 10.1007/s10651-007-0043-y .
- ^ Willmott, Cort; Matsuura, Kenji (2006). "Über die Verwendung von dimensionierten Fehlermaßen zur Bewertung der Leistung von räumlichen Interpolatoren". Internationale Zeitschrift für Geographische Informationswissenschaft . 20 : 89–102. doi : 10.1080/13658810500286976 .
- ^ "Coastal Inlets Research Program (CIRP) Wiki - Statistik" . Abgerufen am 4. Februar 2015 .
- ^ "FAQ: Was ist der Variationskoeffizient?" . Abgerufen am 19. Februar 2019 .
- ^ Armstrong, J. Scott; Collopy, Fred (1992). "Fehlermaße zur Verallgemeinerung von Prognosemethoden: Empirische Vergleiche" (PDF) . Internationale Zeitschrift für Prognosen . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .
- ^ Anderson, Abgeordneter; Wößner, WW (1992). Angewandte Grundwassermodellierung: Simulation von Strömung und advektivem Transport (2. Aufl.). Akademische Presse.
- ^ Ensemble Neuronales Netzwerkmodell
- ^ ANSI/BPI-2400-S-2012: Standard Practice for standardized Qualification of the Whole House Energy Savings Predictions by Calibration to Energieverbrauch History