Pivotstatistik

Aus testwiki
Zur Navigation springen Zur Suche springen

Eine Pivotstatistik, auch Pivot-Größe genannt, kurz ein Pivot, ist eine spezielle Funktion in der mathematischen Statistik. Es handelt sich um Statistiken mit bestimmten Invarianzeigenschaften, die zur Konstruktion von Konfidenzbereichen verwendet werden. Der Name leitet sich ab vom französischen pivot (deutsch Anker, hier im Sinne von Dreh- und Angelpunkt)[1] und beruht auf den Invarianzeigenschaften.

Definition

Gegeben sei ein statistisches Modell (𝒳,𝒜,(Pϑ)ϑΘ)

Ein Pivot ist eine Zufallsvariable T(X,ϑ) als Funktion von der Stichprobenvariable X und ϑ, deren Verteilung unabhängig von ϑ ist.[2]

Streng formell wird eine Pivotstatistik wie folgt definiert: Gegeben seien ein Entscheidungsraum (Γ,𝒜Γ) und eine zu schätzende Funktion

g:ΘΓ.

Meist ist Γ. Dann heißt eine messbare Abbildung

T:𝒳×ΓΓ

eine Pivotstatistik für g, wenn sie folgende Eigenschaften erfüllt:[3]

  • Für alle B𝒜Γ und alle ϑΘ ist die Menge {x𝒳T(x,g(ϑ))B} in 𝒜 enthalten.
  • Es existiert eine Wahrscheinlichkeitsverteilung Q auf (Γ,𝒜Γ), so dass für alle ϑΘ stets PϑT(,g(ϑ))1=Q gilt.

Beispiel

Gegeben sei ein festes σ0>0 und sei 𝒩(μ,σ02) die Normalverteilung mit Erwartungswert μ und Varianz σ02. Sei 𝒩n(μ,σ02) das n-fache Produktmaß.

Betrachtet wird als statistisches Modell das Produktmodell (n,(n),(𝒩n(μ,σ02))μ) bei fester Varianz und unbekanntem Erwartungswert.

Dann ist eine Pivot-Statistik gegeben durch

T(X,μ)=n(Xμ)σ0.

Hierbei ist

X=1ni=1nXi

das Stichprobenmittel. Dass es sich um ein Pivot handelt, folgt direkt aus den Rechenregeln für normalverteilte Zufallsvariablen (siehe Invarianz der Normalverteilung gegenüber Faltung), denn es ist Xμ𝒩(0,σ02/n). Durch Normierung mit der Standardabweichung σ0/n erhält man, dass T immer standardnormalverteilt ist, also T(,μ)𝒩(0,1) für alle μ.

Konstruktion von Konfidenzbereichen mittels Pivots

Existiert eine Pivotstatistik T und ist eine Menge B𝒜Γ gegeben, so wird durch

CB(x)={γΓT(x,γ)B}

ein Bereichsschätzer definiert.[3] Aufgrund der Definition des Bereichsschätzers ist dann

{x𝒳g(ϑ)CB(x)}={x𝒳T(x,g(ϑ))B}

und somit

Pϑ({x𝒳g(ϑ)CB(x)})=Pϑ({x𝒳T(x,g(ϑ))B})=Q(B)

für alle ϑΘ aufgrund der Pivoteigenschaft von T. Der Bereichsschätzer CB liefert also einen Konfidenzbereich zum Konfidenzniveau Q(B). Die Wahl der Menge B bestimmt somit Konfidenzniveau und Geometrie des Konfidenzbereiches.

Beispiel zur Konstruktion von Konfidenzbereichen

Unter denselben Rahmenbedingungen wie im obigen Beispiel soll ein Konfidenzbereich für den Mittelwert zum Konfidenzniveau 1α bestimmt werden. Da Q=𝒩(0,1) ist, muss zuerst eine Menge B gewählt werden, so dass

Q(B)=𝒩(0,1)(B)=1α.

Die Wahl von B hängt im Wesentlichen von der Anwendung ab. Gängig sind einseitige Konfidenzintervalle

B1=[a1,+) oder B2=(,a2]

oder zweiseitige Konfidenzintervalle

B3=[a3,a3].

Dabei müssen a1,a2,a3 nun so gewählt werden, dass 𝒩(0,1)(Bi)=1α für i=1,2,3 ist. Dafür wählt man die passenden p-Quantile up der Standardnormalverteilung aus und erhält a1=uα sowie a2=u1α und a3=u1α/2.

Damit ergibt sich für den Bereichsschätzer mit der Menge B1

CB1(X)={μT(X,μ)[uα,+)}={μn(Xμ)σ0uα}={μμXσ0u1αn},

da aufgrund der Symmetrie der Standardnormalverteilung u1α=uα gilt.

Als einseitiges Konfidenzintervall zum Konfidenzniveau 1α für den Erwartungswert erhält man somit

CB1(X)=[Xσ0u1αn,+).

Durch analoges Vorgehen mit den Mengen B2 und B3 erhält man als zweites einseitiges Konfidenzintervall

CB2(X)=(,X+σ0u1αn]

und als beidseitiges Konfidenzintervall

CB3(X)=[Xσ0nu1α/2;X+σ0nu1α/2].

Verwandte Konzepte

Eng mit den Pivotstatistiken sind die approximativen Pivotstatistiken verwandt. Sie dienen der Konstruktion von approximativen Konfidenzbereichen und beruhen auf Grenzwertbetrachtungen.

Einzelnachweise