Lassen Sie uns einen Zufallsvektor bezeichnen (entsprechend den Messungen), gemäß A parametrisierten Familie von Wahrscheinlichkeitsdichtefunktionen oder Wahrscheinlichkeitsfunktion , die auf dem unbekannten deterministischen Parameter abhängt . Der Parameterraum ist in zwei disjunkte Mengen und unterteilt . Lassen Sie bezeichnen die Hypothese , dass , und lassen Sie bezeichnen die Hypothese , dass . Der binäre Test von Hypothesen wird unter Verwendung einer Testfunktion durchgeführt .
Das heißt, das ist in Kraft, wenn die Messung und das ist in Kraft, wenn die Messung . Beachten Sie, dass dies eine disjunkte Abdeckung des Messraums ist.
Formale Definition
Eine Testfunktion hat eine UMP-Größe, wenn eine andere Testfunktion erfüllt ist
wir haben
Der Karlin-Rubin-Satz
Das Karlin-Rubin-Theorem kann als Erweiterung des Neyman-Pearson-Lemmas für zusammengesetzte Hypothesen angesehen werden. Betrachten Sie eine Skalarmessung mit einer Wahrscheinlichkeitsdichtefunktion, die durch einen Skalarparameter θ parametrisiert ist , und definieren Sie das Wahrscheinlichkeitsverhältnis . Wenn die Monotonie für ein Paar nicht abnimmt (was bedeutet, dass je größer , desto wahrscheinlicher ist), dann ist der Schwellenwerttest:
wo wird so gewählt, dass
ist der UMP-Test der Größe α zum Testen
Beachten Sie, dass genau der gleiche Test auch UMP zum Testen ist
hat ein monotones nicht abnehmendes Wahrscheinlichkeitsverhältnis in der ausreichenden Statistik , vorausgesetzt, es ist nicht abnehmend.
Beispiel
Lassen Sie bezeichnen IId normal verteilt -dimensionalen Zufallsvektoren mit Mittelwert und die Kovarianz - Matrix . Wir haben dann
Dies ist genau die Form der Exponentialfamilie, die im vorherigen Abschnitt gezeigt wurde, mit der ausreichenden Statistik
Somit schließen wir, dass der Test
ist der UMP-Test der Größe zum Testen vs.
Weitere Diskussion
Schließlich stellen wir fest, dass UMP-Tests im Allgemeinen nicht für Vektorparameter oder für zweiseitige Tests existieren (ein Test, bei dem eine Hypothese auf beiden Seiten der Alternative liegt). Der Grund ist, dass in diesen Situationen der leistungsstärkste Test einer bestimmten Größe für einen möglichen Wert des Parameters (z. B. für wo ) sich von dem leistungsstärksten Test derselben Größe für einen anderen Wert des Parameters (z. B. für wo) unterscheidet ). Infolgedessen ist in diesen Situationen kein Test einheitlich am leistungsfähigsten.
Verweise
Weiterführende Literatur
Ferguson, TS (1967). "Abschnitt 5.2: Einheitlich leistungsstärkste Tests ". Mathematische Statistik: Ein entscheidungstheoretischer Ansatz . New York: Akademische Presse.
Stimmung, AM; Graybill, FA; Boes, DC (1974). "Abschnitt IX.3.2: Einheitlich leistungsstärkste Tests ". Einführung in die Theorie der Statistik (3. Aufl.). New York: McGraw-Hill.