Gleichmäßig bester Test

Aus testwiki
Zur Navigation springen Zur Suche springen

Vorlage:Belege Ein gleichmäßig bester Test (GB-Test), gleichmäßig trennschärfster Test, gleichmäßig schärfster Test, gleichmäßig mächtigster Test, oder kurz bester Test ist ein spezieller statistischer Test in der Testtheorie, einem Teilgebiet der mathematischen Statistik. Gleichmäßig beste Tests zeichnen sich dadurch aus, dass die Wahrscheinlichkeit für einen Fehler 1. Art immer unter einer vorgegebenen Grenze liegt, gleichzeitig aber die Wahrscheinlichkeit für ein Fehler 2. Art kleiner ist als die jedes weiteren Tests, der ebenfalls die vorgegebene Grenze für den Fehler 1. Art einhält. Nachteil an gleichmäßig besten Tests ist, dass sie im Gegensatz zu anderen Klassen von optimalen Schätzern wie strengen Tests und Maximin-Tests nur unter sehr eingeschränkten Rahmenbedingungen existieren.

Teils findet sich auch die Bezeichnung als UMP-Test, die aus dem Englischen von Uniform Most Powerful (gleichmäßig trennschärfster bzw. gleichmäßig mächtigster) abgeleitet ist.

Definition

Gegeben sei ein Statistisches Modell (𝒳;𝒜,(Pϑ)ϑΘ) sowie eine disjunkte Zerlegung von Θ in Nullhypothese Θ0 und Alternative Θ1. Sei 𝒯α die Menge aller statistischen Tests zum Niveau α, das heißt alle Statistiken

Φ:𝒳[0,1],

für die

supϑΘ0Eϑ(Φ)α

gilt. Sei

GΦ(ϑ):=Eϑ(Φ)

die Gütefunktion des Tests Φ. Der Test Ψ𝒯α heißt dann ein gleichmäßig bester Test (oder gleichmäßig trennschärfster Test) zum Niveau α, wenn für alle weiteren Φ𝒯α die Trennschärfe von Ψ größer ist als die Trennschärfe von Φ. Es gilt also

GΨ(ϑ)GΦ(ϑ)fu¨ralleϑΘ1.

Alternativ kann ein gleichmäßig bester Test auch definiert werden als derjenige Test, dessen Gütefunktion auf der Alternative mit der einhüllenden Gütefunktion (Vorlage:EnS envelope power function) von 𝒯α übereinstimmt.

Existenz

Gleichmäßig beste Tests müssen im Allgemeinen nicht existieren. Wichtigstes Hilfsmittel zur Herleitung von Existenzaussagen und zur Konstruktion von gleichmäßig besten Tests ist das Neyman-Pearson-Lemma, das teils auch das Fundamentallemma der mathematischen Statistik genannt wird.

Einfache Hypothesen

Für Tests mit einfachen Hypothesen, also einer einelementigen Nullhypothese und einer einelementigen Alternative liefert das Neyman-Pearson-Lemma die Existenz eines gleichmäßig besten Tests zu einem vorgegebenen Niveau α. Dieser Test ist der Neyman-Pearson-Test, ein Likelihood-Quotienten-Test. Einzige zusätzliche Voraussetzung ist die Existenz der Wahrscheinlichkeitsdichtefunktionen von Nullhypothese und Alternative.

Nach dem Lemma von Stein konvergiert die Trennschärfe des Neyman-Pearson-Tests mit exponentieller Geschwindigkeit bei wachsender Stichprobengröße gegen 1.

Einseitige Tests

In einparametrigen Modellen mit monotonem Dichtequotient in T existiert ein gleichmäßig bester einseitiger Test zu einem vorgegebenen Niveau α, also ein Test bei dem Nullhypothese und Alternative von der Form

Θ0={ϑΘ|ϑϑ0} und Θ1={ϑΘ|ϑ>ϑ0}

sind. Dabei ist Θ und ϑ0 eine vorgegebene Zahl aus Θ. Der Test ist dann gegeben durch

Φ(x):={0 falls T(x)<cl falls T(x)=c1 falls T(x)>c.

Dabei sind c,l so zu wählen, dass die Bedingung Eϑ0(Φ)=α erfüllt ist. Des Weiteren ist die Gütefunktion monoton. Bei einem Vertauschen von Nullhypothese und Alternative kehren sich die kleinergleich/größergleich-Zeichen um.

Eine große Verteilungsklasse mit monotonem Dichtequotient ist die einparametrische Exponentialfamilie (wenn die Parameterfunktion η monoton ist oder die Familie in natürlicher Parametrisierung vorliegt).

Das Ergebnis über beste einseitige Tests leitet sich direkt aus dem Neyman-Pearson-Lemma ab: Aufgrund der Monotonie des Dichtequotienten ist der Test von ϑ0 gegen ϑ für alle ϑΘ1 ein gleichmäßig bester Test, somit ist Φ ein gleichmäßig bester Test von ϑ gegen Θ1. Da man zeigen kann, dass die Gütefunktion monoton ist, hält der Test für alle ϑΘ0 das Niveau α ein und ist somit ein gleichmäßig bester Test zum Niveau α von Θ0 gegen Θ1.

Weitere Aussagen

Weitere Existenzaussagen erhält man beispielsweise durch die Einschränkung auf kleinere Klassen von Tests wie unverfälschte Tests, für diese lassen sich Aussagen beispielsweise mithilfe von ähnlichen Tests herleiten.

Verwandte Begriffe

Der zum gleichmäßig besten Test duale Begriff für Konfidenzbereiche (im Sinne der Dualität von Tests und Konfidenzbereichen) ist der gleichmäßig bester Konfidenzbereich.

Literatur