Gütefunktion

Aus testwiki
Zur Navigation springen Zur Suche springen

Vorlage:Belege Eine Gütefunktion, auch Trennschärfefunktion, Machtfunktion, Teststärkefunktion oder Testschärfefunktion, ist eine spezielle reellwertige Funktion in der Testtheorie, einem Teilgebiet der mathematischen Statistik. Jedem statistischen Test kann eine Gütefunktion zugewiesen werden. Diese ordnet im parametrischen Fall jedem Parameter die mittlere Entscheidung zu, die der Test trifft, wenn der Parameter wirklich vorliegt. Viele statistische Konzepte wie die Trennschärfe oder das Niveau eines Tests finden sich in der Gütefunktion wieder oder können über diese definiert werden.

Definition

Gegeben sei ein (nicht notwendigerweise parametrisches) statistisches Modell (𝒳,𝒜,(Pϑ)ϑΘ) sowie eine disjunkte Zerlegung der Indexmenge Θ in Nullhypothese Θ0 und Gegenhypothese (oder Alternative) Θ1. Des Weiteren sei ein statistischer Test

φ:(𝒳,𝒜)([0,1],|[0,1])

gegeben. Dann heißt die Funktion

Gφ:Θ[0,1]

definiert durch

Gφ(ϑ):=Eϑ(φ(X))

die Gütefunktion des Tests φ. Hierbei bezeichnet Eϑ den Erwartungswert bezüglich des Wahrscheinlichkeitsmaßes Pϑ, d. h. der Wahrscheinlichkeitsverteilung der Zufallsvariablen X mit Werten im Stichprobenraum 𝒳. Somit gibt die Gütefunktion an der Stelle ϑ an, mit welcher Wahrscheinlichkeit der Test die Nullhypothese ablehnt, wenn das Wahrscheinlichkeitsmaß Pϑ vorliegt.

Ableitbare Begriffe

Die folgenden Begriffe lassen sich über die Gütefunktion definieren oder finden sich in ihr wieder.

Niveau eines Tests

Gütefunktion eines Binomialtests mit n = 30. Für alle Werte von p aus der Nullhypothese H0: p ≤ 0,2 liegt G(p) unter dem Signifikanzniveau α = 5 %.

Ist φ ein Test zum Niveau α, so gilt

supϑΘ0Gφ(ϑ)α.

Das Niveau eines Test ist somit eine obere Schranke für die Gütefunktion des Tests auf Θ0 und somit auch eine obere Schranke für Fehler 1. Art des Tests. Dementsprechend sind Tests mit effektiven Niveau α diejenigen, für die α eine kleinste obere Schranke für ihre Gütefunktion auf Θ0 ist und somit die Wahrscheinlichkeit für einen Fehler 1. Art α ist.

Trennschärfe eines Tests

Die Trennschärfe eines Tests gibt an, wie groß die Wahrscheinlichkeit ist, sich für die Alternative zu entscheiden, wenn diese wirklich vorliegt. Somit ist die Trennschärfe des Tests φ für vorliegendes ϑΘ1 gegeben als Gφ(ϑ). Dementsprechend ist die Wahrscheinlichkeit für einen Fehler 2. Art bei Vorliegen von ϑ gegeben durch

βφ(ϑ)=1Gφ(ϑ)fu¨rϑΘ1.

Einhüllende Gütefunktion

Ist eine Menge von Tests 𝒯 gegeben, so heißt die Funktion

β𝒯+:Θ1[0,1]

definiert durch

β𝒯+(ϑ):=supφ𝒯Gφ(ϑ)

die einhüllende Gütefunktion (engl. envelope power function). Sie ordnet jedem Element der Alternative den größten Trennschärfe-Wert aller Tests der Menge 𝒯 zu. Anwendung findet sie beispielsweise bei der Formulierung von Optimalitätskriterien von Tests wie gleichmäßig besten Tests oder strengen Tests. So sind die gleichmäßig besten Tests gerade die Tests, deren Gütefunktion auf der Alternative mit der einhüllenden Gütefunktion übereinstimmen.

Siehe auch

Literatur