Gemischtes Modell - Mixed model

Ein gemischtes Modell , ein Modell mit gemischten Effekten oder ein gemischtes Fehlerkomponentenmodell ist ein statistisches Modell, das sowohl feste Effekte als auch zufällige Effekte enthält . Diese Modelle sind in einer Vielzahl von Disziplinen der physikalischen, biologischen und sozialen Wissenschaften nützlich. Sie sind besonders nützlich in Umgebungen, in denen wiederholte Messungen an denselben statistischen Einheiten ( Längsschnittstudie ) oder an Clustern verwandter statistischer Einheiten durchgeführt werden. Aufgrund ihres Vorteils beim Umgang mit fehlenden Werten werden Mixed-Effects-Modelle häufig traditionellen Ansätzen wie der Varianzanalyse mit wiederholten Messungen vorgezogen .

Auf dieser Seite werden hauptsächlich lineare Mixed-Effects-Modelle (LMEM) und nicht generalisierte lineare Mixed-Effects-Modelle oder nichtlineare Mixed-Effects-Modelle diskutiert .

Historie und aktueller Status

Ronald Fisher führte Zufallseffektmodelle ein , um die Korrelationen von Merkmalswerten zwischen Verwandten zu untersuchen. In den 1950er Jahren lieferte Charles Roy Henderson die besten linearen unverzerrten Schätzungen von festen Effekten und die besten linearen unverzerrten Vorhersagen von zufälligen Effekten. In der Folge hat sich die gemischte Modellierung zu einem wichtigen Bereich der statistischen Forschung entwickelt, darunter Arbeiten zur Berechnung von Maximum-Likelihood-Schätzungen, nichtlinearen Modellen mit gemischten Effekten, fehlenden Daten in Modellen mit gemischten Effekten und Bayes'scher Schätzung von Modellen mit gemischten Effekten. Gemischte Modelle werden in vielen Disziplinen angewendet, bei denen mehrere korrelierte Messungen an jeder interessierenden Einheit vorgenommen werden. Sie werden prominent in der Forschung an Menschen und Tieren in Bereichen von der Genetik bis zum Marketing verwendet und wurden auch in der Baseball- und Industriestatistik verwendet.

Definition

In Matrixnotation kann ein lineares gemischtes Modell dargestellt werden als

wo

  • ist ein bekannter Beobachtungsvektor mit Mittelwert ;
  • ist ein unbekannter Vektor fester Effekte;
  • ist ein unbekannter Vektor zufälliger Effekte mit Mittelwert und Varianz-Kovarianz-Matrix ;
  • ist ein unbekannter Vektor zufälliger Fehler mit Mittelwert und Varianz ;
  • und sind dafür bekannt , Entwurfsmatrizen beziehen , die Beobachtungen zu und verbunden.

Einschätzung

Die gemeinsame Dichte von und kann geschrieben werden als: . Unter der Annahme von Normalität, , und , und Maximierung der Verbindungsdichte über und erhält man Hendersons "gemischte Modellgleichungen" (MME) für lineare gemischte Modelle:

Die Lösungen des MME und sind die besten linearen unverzerrten Schätzungen und Prädiktoren für und bzw. . Dies ist eine Folge des Gauß-Markov-Theorems, wenn die bedingte Varianz des Ergebnisses nicht auf die Identitätsmatrix skalierbar ist. Wenn die bedingte Varianz bekannt ist, ist die nach der inversen Varianz gewichtete Kleinste-Quadrate-Schätzung die beste lineare unverzerrte Schätzung. Die bedingte Varianz ist jedoch selten, wenn überhaupt, bekannt. Daher ist es wünschenswert, die Varianz und die gewichteten Parameterschätzungen beim Lösen von MMEs gemeinsam zu schätzen.

Eine Methode, die verwendet wird, um solche gemischten Modelle anzupassen, ist der Erwartungs-Maximierungs-Algorithmus, bei dem die Varianzkomponenten als unbeobachtete Störparameter in der gemeinsamen Wahrscheinlichkeit behandelt werden. Derzeit ist dies die implementierte Methode für die wichtigsten Statistiksoftwarepakete R (lme im nlme-Paket oder lineare gemischte Effekte im lme4-Paket), Python ( statsmodels- Paket), Julia (MixedModels.jl-Paket) und SAS (proc gemischt). Die Lösung der gemischten Modellgleichungen ist eine Schätzung der maximalen Wahrscheinlichkeit, wenn die Fehlerverteilung normal ist.

Siehe auch

Verweise

Weiterlesen

  • Gałecki, Andrzej; Burzykowski, Tomasz (2013). Lineare Mixed-Effects-Modelle mit R: Ein schrittweiser Ansatz . New York: Springer. ISBN 978-1-4614-3900-4.
  • Milliken, GA; Johnson, DE (1992). Analyse unordentlicher Daten: Vol. 2, No. I. Entworfene Experimente . New York: Chapman & Hall.
  • Westen, BT; Welch, KB; Galecki, AT (2007). Lineare gemischte Modelle: Ein praktischer Leitfaden für die Verwendung von Statistiksoftware . New York: Chapman & Hall/CRC.