Stichprobe (Statistik) - Sample (statistics)

Eine visuelle Darstellung der Auswahl einer einfachen Zufallsstichprobe

In der Statistik und quantitativen Forschungsmethodik ist eine Stichprobe eine Menge von Individuen oder Objekten, die durch ein definiertes Verfahren aus einer statistischen Population gesammelt oder ausgewählt werden. Die Elemente einer Stichprobe werden als Stichprobenpunkte , Stichprobeneinheiten oder Beobachtungen bezeichnet. Wenn als Datensatz konzipiert, wird eine Probe oft durch das Kapital bezeichnet lateinische Buchstaben so und , mit seinen Elementen in Klein ausgedrückt (zB ) und die Probengröße durch den Buchstaben bezeichnet .

Typischerweise ist die Population sehr groß, was eine Volkszählung oder eine vollständige Aufzählung aller Personen in der Population entweder unpraktisch oder unmöglich macht. Die Stichprobe stellt normalerweise eine Teilmenge von überschaubarer Größe dar. Es werden Stichproben gesammelt und Statistiken aus den Stichproben berechnet, so dass Rückschlüsse oder Extrapolationen von der Stichprobe auf die Grundgesamtheit gezogen werden können.

Die Stichprobe kann „ohne Ersatz“ aus einer Grundgesamtheit gezogen werden (dh kein Element kann mehr als einmal in derselben Stichprobe ausgewählt werden), in diesem Fall handelt es sich um eine Teilmenge einer Grundgesamtheit ; oder 'mit Ersetzung' (dh ein Element kann in einer Stichprobe mehrfach vorkommen), in diesem Fall handelt es sich um eine Mehrfachuntermenge.

Arten von Proben

Eine vollständige Stichprobe ist ein Satz von Objekten aus einer Elternpopulation, die alle solche Objekte enthält, die einem Satz wohldefinierter Auswahlkriterien genügen. Eine vollständige Stichprobe australischer Männer mit einer Körpergröße von mehr als 2 m würde beispielsweise aus einer Liste aller australischen Männer bestehen, die größer als 2 m sind. Aber es würde keine deutschen Männer oder große australische Frauen oder Menschen mit einer Körpergröße von weniger als 2 m einschließen. Um eine solche vollständige Stichprobe zu erstellen, ist daher eine vollständige Liste der Elternpopulation erforderlich, einschließlich Daten zu Größe, Geschlecht und Nationalität für jedes Mitglied dieser Elternpopulation. Im Fall der menschlichen Bevölkerung ist es unwahrscheinlich, dass eine solche vollständige Liste existiert (die menschliche Bevölkerung geht in die Milliarden). Aber auch in anderen Disziplinen sind solche vollständigen Stichproben oft vorhanden, wie zum Beispiel die Spielermenge einer großen Sportliga, die Geburtsdaten der Abgeordneten eines Parlaments oder eine vollständige größenbegrenzte Liste astronomischer Objekte.

Eine unverzerrte (repräsentative) Stichprobe ist eine Menge von Objekten, die aus einer vollständigen Stichprobe ausgewählt werden, wobei ein Auswahlverfahren verwendet wird, das nicht von den Eigenschaften der Objekte abhängt. Eine unverzerrte Stichprobe australischer Männer mit einer Körpergröße von mehr als 2 m könnte beispielsweise aus einer zufällig ausgewählten Teilmenge von 1 % australischer Männer mit einer Körpergröße von mehr als 2 m bestehen. Eine aus dem Wählerverzeichnis gewählte Person ist jedoch möglicherweise nicht unvoreingenommen, da beispielsweise Männer unter 18 Jahren nicht in die Wählerverzeichnisse eingetragen werden. Im astronomischen Kontext könnte eine unverzerrte Stichprobe aus dem Bruchteil einer vollständigen Stichprobe bestehen, für die Daten verfügbar sind, vorausgesetzt, die Datenverfügbarkeit wird nicht durch einzelne Quelleneigenschaften verzerrt.

Der beste Weg, eine verzerrte oder nicht repräsentative Stichprobe zu vermeiden, ist die Auswahl einer Zufallsstichprobe, auch Wahrscheinlichkeitsstichprobe genannt. Eine Zufallsstichprobe ist definiert als eine Stichprobe, bei der jedes einzelne Mitglied der Grundgesamtheit eine bekannte, von null verschiedene Wahrscheinlichkeit hat, als Teil der Stichprobe ausgewählt zu werden. Mehrere Arten von Stichproben sind einfache Stichproben , systematische Stichproben , geschichtete Stichproben und Cluster-Stichproben .

Eine Stichprobe, die nicht zufällig ist, wird als Nicht-Zufallsstichprobe oder Nicht-Wahrscheinlichkeitsstichprobe bezeichnet . Einige Beispiele für nicht zufällige Stichproben sind Zweckmäßigkeitsstichproben , Beurteilungsstichproben , Zweckstichproben , Quotenstichproben , Schneeballstichproben und Quadraturknoten in Quasi-Monte-Carlo-Methoden .

Mathematische Beschreibung der Zufallsstichprobe

Mathematisch ausgedrückt, um eine gegebene Wahrscheinlichkeitsverteilung F , eine Stichprobe mit der Länge n (wobei n eine beliebige positive ganze Zahl sein kann) ist ein Satz von Realisierungen von n unabhängig , identisch verteilt ( iid ) Zufallsvariablen mit Verteilung F .

Eine Probe repräsentiert konkret die Ergebnisse von n Experimenten, in denen die gleiche Menge gemessen wird. Wenn wir beispielsweise die durchschnittliche Körpergröße von Mitgliedern einer bestimmten Population schätzen möchten, messen wir die Körpergröße von n Individuen. Jede Messung wird aus der die Population charakterisierenden Wahrscheinlichkeitsverteilung F gezogen , so dass jede gemessene Höhe die Realisierung einer Zufallsvariablen mit der Verteilung F ist . Beachten Sie, dass ein Satz von Zufallsvariablen (dh ein Satz messbarer Funktionen) nicht mit den Realisierungen dieser Variablen (das sind die Werte, die diese Zufallsvariablen annehmen) verwechselt werden darf. Mit anderen Worten, ist eine Funktion, die die Messung beim i- ten Experiment darstellt, und ist der Wert, der beim Durchführen der Messung erhalten wird.

Siehe auch

Anmerkungen

Externe Links