Zwei-Wege-Varianzanalyse - Two-way analysis of variance

In der Statistik ist die Zweiwege- Varianzanalyse ( ANOVA ) eine Erweiterung der Einweg-ANOVA , die den Einfluss zweier verschiedener kategorialer unabhängiger Variablen auf eine stetige abhängige Variable untersucht . Die Zwei-Wege-ANOVA zielt nicht nur darauf ab, den Haupteffekt jeder unabhängigen Variablen zu bewerten , sondern auch, ob es eine Interaktion zwischen ihnen gibt.

Geschichte

1925 erwähnt Ronald Fisher die Zweiwege-ANOVA in seinem berühmten Buch Statistical Methods for Research Workers (Kapitel 7 und 8). 1934 veröffentlichte Frank Yates Verfahren für den unausgeglichenen Fall. Seitdem ist eine umfangreiche Literatur entstanden. Das Thema wurde 1993 von Yasunori Fujikoshi überprüft . 2005 schlug Andrew Gelman einen anderen Ansatz der ANOVA vor, der als Mehrebenenmodell betrachtet wird .

Datensatz

Stellen wir uns einen Datensatz vor, bei dem eine abhängige Variable durch zwei Faktoren beeinflusst werden kann , die potenzielle Variationsquellen darstellen. Der erste Faktor hat Stufen ( ) und der zweite hat Stufen ( ) . Jede Kombination definiert eine Behandlung für insgesamt Behandlungen. Wir stellen die Anzahl der Replikate für die Behandlung durch dar und seien der Index des Replikats in dieser Behandlung ( ) .

Aus diesen Daten können wir eine Kontingenztabelle erstellen , wobei und , und die Gesamtzahl der Replikate gleich ist .

Das Versuchsdesign ist ausgewogen, wenn jede Behandlung die gleiche Anzahl von Wiederholungen hat, . In einem solchen Fall wird das Design auch als orthogonal bezeichnet , wodurch die Auswirkungen beider Faktoren vollständig unterschieden werden können. Wir können daher schreiben und .

Modell

Beim Beobachten der Variation zwischen allen Datenpunkten, beispielsweise über ein Histogramm , kann " Wahrscheinlichkeit verwendet werden, um eine solche Variation zu beschreiben". Bezeichnen wir daher mit der Zufallsvariablen, welcher beobachtete Wert das -te Maß für die Behandlung ist . Die Zwei-Wege-ANOVA modelliert alle diese Variablen als unabhängig und normalerweise um einen Mittelwert variierend , mit einer konstanten Varianz ( Homoskedastizität ):

.

Konkret wird der Mittelwert der Antwortvariablen als Linearkombination der erklärenden Variablen modelliert:

,

wo der Gesamtmittelwert ist, ist der additive Effekt der Hauptebene von dem ersten Faktor ( i -ten Zeile in der Kontingenz - Tabelle), ist der additive Effekt der Hauptstufe aus dem zweiten Faktor ( j -ten Spalte in der Kontingenztabelle) und ist der nicht-additive Interaktionseffekt der Behandlung aus beiden Faktoren (Zelle in Zeile i und Spalte j in der Kontingenztabelle).

Eine andere äquivalente Art, die Zweiwege-ANOVA zu beschreiben, besteht darin, zu erwähnen, dass neben der durch die Faktoren erklärten Variation noch ein gewisses statistisches Rauschen verbleibt . Diese Menge an unerklärlichen Variationen wird durch die Einführung einer Zufallsvariablen pro Datenpunkt , genannt error, gehandhabt . Diese Zufallsvariablen werden als Abweichungen vom Mittelwert angesehen und als unabhängig und normalverteilt angenommen:

.

Annahmen

Nach Gelman und Hill sind die Annahmen der ANOVA und allgemeiner des allgemeinen linearen Modells in absteigender Bedeutung:

  1. die Datenpunkte sind im Hinblick auf die zu untersuchende wissenschaftliche Fragestellung relevant;
  2. der Mittelwert der Antwortvariablen wird additiv (wenn nicht Interaktionsterm) und linear durch die Faktoren beeinflusst;
  3. die Fehler sind unabhängig;
  4. die Fehler haben die gleiche Varianz;
  5. die Fehler sind normalverteilt.

Parameter Schätzung

Um die Identifizierbarkeit von Parametern sicherzustellen , können wir die folgenden "Summe-to-Null"-Beschränkungen hinzufügen:

Hypothesentest

Beim klassischen Ansatz wird das Testen von Nullhypothesen (dass die Faktoren keine Wirkung haben) über ihre Signifikanz erreicht, was die Berechnung von Quadratsummen erfordert .

Das Testen, ob der Interaktionsterm signifikant ist, kann aufgrund der potenziell großen Anzahl von Freiheitsgraden schwierig sein .

Siehe auch

Anmerkungen

Verweise