Statistische Streuung - Statistical dispersion

Beispiel für Stichproben aus zwei Populationen mit gleichem Mittelwert, aber unterschiedlicher Streuung. Die blaue Bevölkerung ist viel stärker verstreut als die rote Bevölkerung.

In der Statistik ist die Streuung (auch als Variabilität , Streuung oder Streuung bezeichnet ) das Ausmaß, in dem eine Verteilung gestreckt oder gestaucht wird. Übliche Beispiele für Maße der statistischen Streuung sind die Varianz , die Standardabweichung und der Interquartilabstand .

Der Dispersion wird der Standort oder die zentrale Tendenz gegenübergestellt , und zusammen sind sie die am häufigsten verwendeten Eigenschaften von Verteilungen.

Mittel

Ein Maß für die statistische Streuung ist eine nicht negative reelle Zahl , die Null ist, wenn alle Daten gleich sind und die zunimmt, wenn die Daten vielfältiger werden.

Die meisten Dispersionsmaße haben die gleichen Einheiten wie die gemessene Größe . Mit anderen Worten, wenn die Messungen in Metern oder Sekunden angegeben sind, ist dies auch das Maß für die Streuung. Beispiele für Ausbreitungsmaßnahmen sind:

Standardabweichung
Interquartilsabstand (IQR)
Bereich
Mittlere absolute Differenz (auch als Gini-Mean absolute Differenz bekannt)
Mittlere absolute Abweichung (MAD)
Durchschnittliche absolute Abweichung (oder einfach als durchschnittliche Abweichung bezeichnet)
Distanzstandardabweichung

Diese werden häufig (zusammen mit Skalenfaktoren ) als Schätzer von Skalenparametern verwendet , wobei sie als Skalenschätzungen bezeichnet werden. Robuste Maßstabsmaße sind solche, die von einer kleinen Anzahl von Ausreißern nicht beeinflusst werden , und umfassen den IQR und den MAD.

Alle oben genannten Maße der statistischen Streuung haben die nützliche Eigenschaft, dass sie ortsinvariant und im Maßstab linear sind . Das heißt, wenn eine Zufallsvariable X eine Streuung von S _{X hat,} dann sollte eine lineare Transformation Y = aX + b für reelle a und b eine Streuung von S _Y = | . haben ein | S _X , wobei | ein | ist der Absolutwert von a , d. h. ignoriert ein negatives Vorzeichen – .

Andere Dispersionsmaße sind dimensionslos . Mit anderen Worten, sie haben keine Einheiten, selbst wenn die Variable selbst Einheiten hat. Diese beinhalten:

Variationskoeffizient
Quartil-Dispersionskoeffizient
Relative Mittelwertdifferenz , gleich dem doppelten Gini-Koeffizienten
Entropie : Während die Entropie einer diskreten Variablen ortsinvariant und skalenunabhängig ist und daher kein Dispersionsmaß im obigen Sinne ist, ist die Entropie einer kontinuierlichen Variablen ortsinvariant und skalenadditiv: Wenn Hz die Entropie von . ist stetige Variable z und z =ax+b , dann Hz=Hx+log(a) .

Es gibt andere Streuungsmaße:

Varianz (das Quadrat der Standardabweichung) – ortsinvariant, aber nicht linear im Maßstab.
Varianz-zu-Mittelwert-Verhältnis – wird meistens für Zähldaten verwendet, wenn der Begriff Dispersionskoeffizient verwendet wird und wenn dieses Verhältnis dimensionslos ist , da Zähldaten selbst dimensionslos sind, ansonsten nicht.

Einige Dispersionsmaße haben spezielle Zwecke. Die Allan-Varianz kann für Anwendungen verwendet werden, bei denen das Rauschen die Konvergenz stört. Die Hadamard-Varianz kann verwendet werden, um der Empfindlichkeit der linearen Frequenzdrift entgegenzuwirken.

Bei kategorialen Variablen ist es weniger üblich, die Streuung durch eine einzelne Zahl zu messen; siehe qualitative Variation . Ein Maß dafür ist die diskrete Entropie .

Quellen

In den physikalischen Wissenschaften kann eine solche Variabilität aus zufälligen Messfehlern resultieren: Instrumentenmessungen sind oft nicht perfekt präzise, dh reproduzierbar , und es gibt zusätzliche Interrater-Variabilität bei der Interpretation und Berichterstattung der Messergebnisse. Man kann davon ausgehen, dass die gemessene Größe stabil ist und dass die Abweichung zwischen den Messungen auf Beobachtungsfehler zurückzuführen ist . Ein System aus vielen Teilchen ist durch die Mittelwerte relativ weniger makroskopischer Größen wie Temperatur, Energie und Dichte gekennzeichnet. Die Standardabweichung ist ein wichtiges Maß in der Fluktuationstheorie, das viele physikalische Phänomene erklärt, einschließlich warum der Himmel blau ist.

In den biologischen Wissenschaften ist die gemessene Größe selten unveränderlich und stabil, und die beobachtete Variation könnte zusätzlich dem Phänomen inhärent sein : Sie kann auf interindividuelle Variabilität zurückzuführen sein , dh verschiedene Mitglieder einer Population, die sich voneinander unterscheiden. Es kann auch auf intraindividuelle Variabilität zurückzuführen sein, dh ein und dieselbe Person unterscheidet sich in Tests, die zu verschiedenen Zeiten oder unter anderen unterschiedlichen Bedingungen durchgeführt wurden. Solche Variabilitäten sind auch im Bereich der hergestellten Produkte zu beobachten; auch dort findet der akribische Wissenschaftler Abwechslung.

In den Wirtschaftswissenschaften , Finanzen und anderen Disziplinen versucht die Regressionsanalyse , die Streuung einer abhängigen Variablen zu erklären , die im Allgemeinen durch ihre Varianz gemessen wird, indem eine oder mehrere unabhängige Variablen verwendet werden, von denen jede selbst eine positive Streuung aufweist. Der erklärte Anteil der Varianz wird als Bestimmtheitsmaß bezeichnet .

Eine partielle Ordnung der Dispersion

Eine mittelerhaltende Streuung (MPS) ist eine Änderung von einer Wahrscheinlichkeitsverteilung A zu einer anderen Wahrscheinlichkeitsverteilung B, wobei B gebildet wird, indem ein oder mehrere Teile der Wahrscheinlichkeitsdichtefunktion von A ausgebreitet werden, während der Mittelwert (der Erwartungswert) unverändert bleibt. Das Konzept einer mittelerhaltenden Streuung sieht eine teilweise Ordnung der Wahrscheinlichkeitsverteilungen gemäß ihrer Streuung vor: Von zwei Wahrscheinlichkeitsverteilungen kann eine als mit größerer Streuung als die andere eingestuft werden, oder alternativ kann keine als mit einer größeren Streuung eingestuft werden.

Siehe auch

Verweise

Languages

In other projects