Tukeys Reichweitentest - Tukey's range test

Tukeys Reichweitentest , auch bekannt als Tukey-Test , Tukey-Methode , Tukeys ehrlicher Signifikanztest oder Tukeys HSD- Test ( ehrlich signifikanter Unterschied ) ist ein einstufiges Mehrfachvergleichsverfahren und ein statistischer Test . Es kann verwendet werden, um Mittelwerte zu finden, die sich signifikant voneinander unterscheiden.

Benannt nach John Tukey , vergleicht er alle möglichen Paare von Mitteln , und basiert auf einer studentisierten Bereichsverteilung ( q ) (diese Verteilung auf die Verteilung der ähnlich ist , t vom t -Test . Siehe unten).

Der Tukey-Test vergleicht die Mittel jeder Behandlung mit den Mitteln jeder anderen Behandlung; das heißt, es gilt gleichzeitig für die Menge aller paarweisen Vergleiche

und identifiziert jede Differenz zwischen zwei Mittelwerten, die größer als der erwartete Standardfehler ist . Der Konfidenzkoeffizient für die Menge ist , wenn alle Stichprobengrößen gleich sind, genau für alle . Bei ungleichen Stichprobengrößen ist der Konfidenzkoeffizient größer als 1 − α. Mit anderen Worten, die Tukey-Methode ist konservativ, wenn ungleiche Stichprobengrößen vorliegen .

Annahmen

  1. Die getesteten Beobachtungen sind innerhalb und zwischen den Gruppen unabhängig .
  2. Die jedem Mittelwert im Test zugeordneten Gruppen sind normalverteilt .
  3. Innerhalb der Gruppen, die jedem Mittelwert im Test zugeordnet sind, besteht eine gleiche Varianz innerhalb der Gruppe ( Varianzhomogenität ).

Die Teststatistik

Der Tukey-Test basiert auf einer Formel, die der des t -Tests sehr ähnlich ist . Tatsächlich ist der Tukey-Test im Wesentlichen ein t -Test , außer dass er die familienbezogene Fehlerrate korrigiert .

Die Formel für den Tukey-Test lautet:

wobei Y A der größere der beiden verglichenen Mittelwerte ist , Y B der kleinere der beiden verglichenen Mittelwerte ist und SE der Standardfehler der Summe der Mittelwerte ist.

Dieser q s -Wert kann dann mit einem q -Wert aus der studentisierten Reichweitenverteilung verglichen werden . Wenn der q s -Wert größer als der aus der Verteilung erhaltene kritische Wert q α ist , werden die beiden Mittelwerte als signifikant unterschiedlich auf der Ebene bezeichnet .

Da die Nullhypothese für den Tukey-Test besagt, dass alle verglichenen Mittelwerte aus derselben Grundgesamtheit stammen (dh μ 1 = μ 2 = μ 3 = ... = μ k ), sollten die Mittelwerte normalverteilt sein (gemäß dem zentralen Grenzwertsatz ). Daraus ergibt sich die Normalitätsannahme des Tukey-Tests.

Die studentisierte Range ( q )-Verteilung

Die Tukey-Methode verwendet die studentisierte Reichweitenverteilung . Angenommen, wir nehmen eine Stichprobe der Größe n aus jeder von k Populationen mit derselben Normalverteilung N ( μ , σ 2 ) und nehmen an, dass min der kleinste dieser Stichprobenmittelwerte und max der größte dieser Stichprobenmittelwerte ist, und angenommen S 2 ist die gepoolte Stichprobenvarianz dieser Stichproben. Dann hat die folgende Zufallsvariable eine studentisierte Bereichsverteilung.

Dieser Wert von q ist die Grundlage des kritischen Wertes von q , basierend auf drei Faktoren:

  1. α (die Fehlerrate vom Typ I oder die Wahrscheinlichkeit, eine echte Nullhypothese abzulehnen)
  2. k (die Anzahl der Populationen)
  3. df (Anzahl der Freiheitsgrade ( N  –  k ), wobei N die Gesamtzahl der Beobachtungen ist)

Die Verteilung von q ist tabellarisch dargestellt und erscheint in vielen Lehrbüchern der Statistik. In einigen Tabellen wurde die Verteilung von q ohne den Faktor tabellarisch dargestellt . Um zu verstehen, um welche Tabelle es sich handelt, können wir das Ergebnis für k  = 2 berechnen und mit dem Ergebnis der Student-t-Verteilung mit den gleichen Freiheitsgraden und dem gleichen  α vergleichen . Außerdem bietet R eine kumulative Verteilungsfunktion ( ) und eine Quantilfunktion ( ) für  q . ptukeyqtukey

Grenzen des Selbstvertrauens

Die Tukey- Konfidenzgrenzen für alle paarweisen Vergleiche mit einem Konfidenzkoeffizienten von mindestens 1 − α sind

Beachten Sie, dass der Punktschätzer und die geschätzte Varianz dieselben sind wie bei einem einzelnen paarweisen Vergleich. Der einzige Unterschied zwischen den Vertrauensgrenzen für simultane Vergleiche und denen für einen einzelnen Vergleich ist das Vielfache der geschätzten Standardabweichung.

Beachten Sie auch, dass die Stichprobengrößen bei der Verwendung des studentisierten Bereichsansatzes gleich sein müssen. ist die Standardabweichung des gesamten Designs, nicht nur die der beiden verglichenen Gruppen. Es ist möglich, mit ungleichen Stichprobengrößen zu arbeiten. In diesem Fall muss man die geschätzte Standardabweichung für jeden paarweisen Vergleich berechnen, wie sie 1956 von Clyde Kramer formalisiert wurde , daher wird das Verfahren für ungleiche Stichprobengrößen manchmal als Tukey-Kramer-Methode bezeichnet, die wie folgt lautet:

wobei n i und n j die Größen der Gruppen i bzw. j sind. Die Freiheitsgrade für das gesamte Design werden ebenfalls angewendet.   

Siehe auch

Anmerkungen

Weiterlesen

  • Montgomery, Douglas C. (2013). Design und Analyse von Experimenten (Achte Aufl.). Wiley. Abschnitt 3.5.7.

Externe Links