Einheitlich leistungsstärkster Test - Uniformly most powerful test

Beim statistischen Hypothesentest ist ein einheitlich leistungsfähigerer ( UMP ) Test ein Hypothesentest, der unter allen möglichen Tests einer gegebenen Größe α die größte Leistung aufweist . Beispielsweise ist nach dem Neyman-Pearson-Lemma der Likelihood-Ratio- Test UMP zum Testen einfacher (Punkt-) Hypothesen.

Rahmen

Lassen Sie uns einen Zufallsvektor bezeichnen (entsprechend den Messungen), gemäß A parametrisierten Familie von Wahrscheinlichkeitsdichtefunktionen oder Wahrscheinlichkeitsfunktion , die auf dem unbekannten deterministischen Parameter abhängt . Der Parameterraum ist in zwei disjunkte Mengen und unterteilt . Lassen Sie bezeichnen die Hypothese , dass , und lassen Sie bezeichnen die Hypothese , dass . Der binäre Test von Hypothesen wird unter Verwendung einer Testfunktion durchgeführt .

Das heißt, das ist in Kraft, wenn die Messung und das ist in Kraft, wenn die Messung . Beachten Sie, dass dies eine disjunkte Abdeckung des Messraums ist.

Formale Definition

Eine Testfunktion hat eine UMP-Größe, wenn eine andere Testfunktion erfüllt ist

wir haben

Der Karlin-Rubin-Satz

Das Karlin-Rubin-Theorem kann als Erweiterung des Neyman-Pearson-Lemmas für zusammengesetzte Hypothesen angesehen werden. Betrachten Sie eine Skalarmessung mit einer Wahrscheinlichkeitsdichtefunktion, die durch einen Skalarparameter θ parametrisiert ist , und definieren Sie das Wahrscheinlichkeitsverhältnis . Wenn die Monotonie für ein Paar nicht abnimmt (was bedeutet, dass je größer , desto wahrscheinlicher ist), dann ist der Schwellenwerttest:

wo wird so gewählt, dass

ist der UMP-Test der Größe α zum Testen

Beachten Sie, dass genau der gleiche Test auch UMP zum Testen ist

Wichtiger Fall: Exponentialfamilie

Obwohl das Karlin-Rubin-Theorem aufgrund seiner Beschränkung auf Skalarparameter und Skalarmessung schwach erscheinen mag, stellt sich heraus, dass es eine Vielzahl von Problemen gibt, für die das Theorem gilt. Insbesondere funktioniert die eindimensionale Exponentialfamilie von Wahrscheinlichkeitsdichtefunktionen oder Wahrscheinlichkeitsmassenfunktionen mit

hat ein monotones nicht abnehmendes Wahrscheinlichkeitsverhältnis in der ausreichenden Statistik , vorausgesetzt, es ist nicht abnehmend.

Beispiel

Lassen Sie bezeichnen IId normal verteilt -dimensionalen Zufallsvektoren mit Mittelwert und die Kovarianz - Matrix . Wir haben dann

Dies ist genau die Form der Exponentialfamilie, die im vorherigen Abschnitt gezeigt wurde, mit der ausreichenden Statistik

Somit schließen wir, dass der Test

ist der UMP-Test der Größe zum Testen vs.

Weitere Diskussion

Schließlich stellen wir fest, dass UMP-Tests im Allgemeinen nicht für Vektorparameter oder für zweiseitige Tests existieren (ein Test, bei dem eine Hypothese auf beiden Seiten der Alternative liegt). Der Grund ist, dass in diesen Situationen der leistungsstärkste Test einer bestimmten Größe für einen möglichen Wert des Parameters (z. B. für wo ) sich von dem leistungsstärksten Test derselben Größe für einen anderen Wert des Parameters (z. B. für wo) unterscheidet ). Infolgedessen ist in diesen Situationen kein Test einheitlich am leistungsfähigsten.

Verweise

Weiterführende Literatur

  • Ferguson, TS (1967). "Abschnitt 5.2: Einheitlich leistungsstärkste Tests ". Mathematische Statistik: Ein entscheidungstheoretischer Ansatz . New York: Akademische Presse.
  • Stimmung, AM; Graybill, FA; Boes, DC (1974). "Abschnitt IX.3.2: Einheitlich leistungsstärkste Tests ". Einführung in die Theorie der Statistik (3. Aufl.). New York: McGraw-Hill.
  • LL Scharf, Statistische Signalverarbeitung , Addison-Wesley, 1991, Abschnitt 4.7.