Dualität von Tests und Konfidenzbereichen

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Dualität von Tests und Konfidenzbereichen, auch Dualität von Tests und Konfidenzintervallen, ist in der mathematischen Statistik eine Verbindung zwischen Konfidenzbereichen und statistischen Tests, die es ermöglicht, aus Konfidenzbereichen Tests zu konstruieren und umgekehrt. Somit können auch Konstruktionsverfahren aus dem einen Themengebiet in das andere übertragen werden. Des Weiteren wird diese Dualität beispielsweise zur Beschreibung von Optimalitätseigenschaften von Konfidenzbereichen verwendet.[1]

Einführendes Beispiel

Gegeben sei ein statistisches Modell (𝒳,𝒜,(Pϑ)ϑΘ) sowie ein Messraum (Γ,𝒜Γ). Ein wesentlicher Unterschied zwischen statistischen Tests und Konfidenzintervallen ist, dass ein Test als Funktionswerte 0 oder 1 annimmt bzw. im Falle eines randomisierten Tests Werte zwischen null und eins. Ein Test ist also eine Abbildung

T:(𝒳,𝒜)([0,1],([0,1])).

Konfidenzintervalle hingegen nehmen als Werte Mengen an, also Elemente aus AΓ, sind also Abbildungen

C:𝒳𝒜Γ

mit zusätzlichen Messbarkeitseigenschaften, für Details siehe Bereichsschätzer.

Angenommen es handelt sich um ein parametrisches Modell und der Parameter soll geschätzt werden. Dann ist Γ=Θ und die zu schätzende Funktion (Parameterfunktion) ist

g(ϑ)=ϑ.

Per Definition eines Konfidenzintervalls C(X) mit Konfidenzniveau 1α gilt

Pϑ({x𝒳ϑC(X)})1αfu¨ralleϑΘ.

Wählt man nun konkret ein fixes ϑ0 aus Θ, so ist

Pϑ0({x𝒳ϑ0C(X)})α (1)

und

Pϑ({x𝒳ϑC(X)})1αfu¨ralleϑΘ{ϑ0}.

Definiert man nun einen statistischen Test

TC:𝒳[0,1]

durch

TC(X)=𝟏{x𝒳ϑ0C(X)}(X),

wobei 𝟏A die Indikatorfunktion auf der Menge A bezeichnet, so ist dies ein statistischer Test der Hypothese H0=ϑ0 gegen die Alternative H1=Θ{ϑ0}. Nach der Gleichung (1) hält er das Signifikanzniveau α ein.[2]

Als konkretes Beispiel betrachte man das Normalverteilungsmodell mit bekannter Varianz σ02 und unbekanntem Erwartungswert μ, also das statistische Modell (n,(n),(𝒩(μ,σ02))μ). Ein rechtsseitig unbeschränktes Konfidenzintervall für den unbekannten Erwartungswert zum Konfidenzniveau 1α ist gegeben durch

C(X)=[Xσ0nu1α;).

Hierbei bezeichnet uα das α-Quantil der Standardnormalverteilung, welches aus der Quantiltabelle der Standardnormalverteilung entnommen werden kann und

X=1ni=1nXi

das Stichprobenmittel. Es folgt für einen festen Mittelwert μ0

μ0C(X)μ0<Xσ0nu1αμ0+σ0nu1α<X.

Somit ergibt sich als statistischer Test zum Niveau α von H0=μ0 gegen H1={μ0}

T(X,μ0)={1 falls μ0+σ0nu1α<X0 sonst.

Dualität mittels Formhypothesen

Allgemeiner kann eine Bijektion zwischen den Konfidenzbereichen und den nichtrandomisierten Tests mittels des Konzepts der Formhypothesen hergestellt werden. Gegeben seien Formhypothesen (H~ϑ,K~ϑ)ϑΘ und korrespondierende Testhypothesen (Hγ,Kγ)γΓ zu einem statistischen Modell (𝒳,𝒜,(Pϑ)ϑΘ) und einem Entscheidungsraum (Γ,𝒜Γ).

Nichtrandomisierte Tests aus Konfidenzbereichen

Sei C ein Konfidenzbereich zu den Formhypothesen (H~ϑ,K~ϑ)ϑΘ zum Konfidenzniveau 1α. Definiere für jedes γ die Menge

AC,γ:={x𝒳γC(x)}.

Dann ist für jedes γ

φγ(x)={1fallsxAC,γ0 fallsxAC,γ

ein Test zum Niveau α für die Nullhypothese Hγ gegen die Alternative Kγ. Die Menge AC,γ ist somit genau der Annahmebereich des Tests φγ.

Konfidenzbereiche aus nichtrandomisierten Tests

Gegeben sei für jedes γ ein nichtrandomisierter Test zum Niveau α der Nullhypothese Hγ gegen die Alternative Kγ mit dem Annahmebereich Aγ. Die Tests sind also von der Form

φγ(x)={1 falls xAγ0 falls xAγ.

Dann ist

C(x):={γΓxAγ}

ein Konfidenzbereich zum Konfidenzniveau 1α zu den Formhypothesen (H~ϑ,K~ϑ)ϑΘ

Korrespondenz der Optimalitätsbegriffe

Über die Formhypothesen und die korrespondierenden Testhypothesen lassen sich nicht nur Tests konstruieren, sondern es lassen sich auch Optimalitätsaussagen von Tests auf Konfidenzbereiche übertragen und umgekehrt. Es gilt:

Ein Konfidenzbereich zu den Formhypothesen (H~ϑ,K~ϑ)ϑΘ und dem Konfidenzniveau 1α ist genau dann ein gleichmäßig bester Konfidenzbereich (bzw. ein gleichmäßig bester unverfälschter Konfidenzbereich), wenn für jedes γ der Test φγ wie er oben beschrieben wurde eine gleichmäßig bester Test (bzw. ein gleichmäßig bester unverfälschter Test) zum Niveau α für die Nullhypothese Hγ gegen die Alternative Kγ ist.

Literatur

Einzelnachweise