Stichprobenvarianz (Schätzfunktion)

Aus testwiki
Version vom 22. Dezember 2024, 19:22 Uhr von imported>Gunnar.Kaestle (spezifischere Wikilink-Auswahl)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Vorlage:Dieser Artikel Vorlage:Infobox Die Stichprobenvarianz ist eine Schätzfunktion und messbare Abbildung in der mathematischen Statistik. Ihre zentrale Aufgabe ist es, die unbekannte Varianz einer zugrundeliegenden Wahrscheinlichkeitsverteilung zu schätzen. Außerhalb der Schätztheorie findet sie auch als Hilfsfunktion zur Konstruktion von Konfidenzbereichen und statistischen Tests Verwendung.

Die Stichprobenvarianz wird in mehreren Varianten definiert, die sich leicht bezüglich ihrer Eigenschaften und somit auch ihrer Anwendungsgebiete unterscheiden. Die Unterscheidung der unterschiedlichen Bezeichnungen für die Varianten ist in der Literatur nicht immer einheitlich. Wird daher lediglich von „der“ Stichprobenvarianz gesprochen, so sollte immer überprüft werden, welche der Definitionen im entsprechenden Kontext gilt.

Stichprobenvarianz als Schätzfunktion ist zu unterscheiden von der konkreten Berechnung der Varianz einer Stichprobe: Die empirische Varianz wird ebenfalls oft als Stichprobenvarianz bezeichnet, ist aber keine Funktion, sondern ein Streumaß von mehreren numerischen (Stichproben-)Werten. Sie entspricht einem konkreten Schätzwert und ist damit eine Realisierung der Stichprobenvarianz als Schätzfunktion und Zufallsvariable.

Definition

Zur Schätzung des Erwartungswertes μ und der Varianz σ2 einer Grundgesamtheit liegen n Zufallsvariablen X1,X2,,Xnund sei X=(X1,X2,,Xn). In der Anwendung sind die Xidie Stichprobenvariablen. Es bezeichne

X=1ni=1nXi

das Stichprobenmittel.

Zuerst ist der Erwartungswert zu schätzen, welcher hier in Form des Parameters p=1 vorliegt. Mit Hilfe des Kleinste-Quadrate-Kriteriums[1]

i=1n(Xiμ)2Min!

erhält man die Schätzung μ^ des Erwartungswertes als Stichprobenmittel:

μ^=X.

Da durch die Schätzung des Stichprobenmittels ein Freiheitsgrad verbraucht wird, ist es üblich, die empirische Varianz mit dem Faktor 1n1 zu „korrigieren“. In der Literatur finden sich im Wesentlichen drei unterschiedliche Definitionen der Stichprobenvarianz. Viele Autoren nennen

S2=1n1i=1n(XiX)2

die Stichprobenvarianz[2][3][4] oder zur besseren Abgrenzung die korrigierte Stichprobenvarianz.[5] Alternativ wird auch

S~2=1ni=1n(XiX)2

als Stichprobenvarianz bezeichnet[6][3]; ebenso wird auch

S*2=1ni=1n(Xiμ0)2

für eine fixe reelle Zahl μ0Stichprobenvarianz genannt.[7]

Verwendung

Wichtiger Verwendungszweck der Stichprobenvarianz ist die Schätzung der Varianz einer unbekannten Wahrscheinlichkeitsverteilung. Je nach Rahmenbedingungen kommen dabei die verschiedenen Definitionen zum Einsatz, da diese unterschiedliche Optimalitätskriterien erfüllen (siehe unten). Als Faustregel kann gelten:

  • Sind der Erwartungswert und die Varianz des Wahrscheinlichkeitsmaßes unbekannt, so wird S2als Schätzfunktion verwendet.
  • Ist die Varianz unbekannt und entspricht der Erwartungswert dem Wert μ0, so wird S*2als Schätzfunktion verwendet.

Die Schätzfunktion S~2wird meist nicht verwendet, sie entsteht beispielsweise bei Verwendung der Momentenmethode oder der Maximum-Likelihood-Methode und erfüllt die gängigen Qualitätskriterien nicht.

Neben der Verwendung als Schätzfunktion wird die Stichprobenvarianz noch als Hilfsfunktion für die Konstruktion von Konfidenzintervallen oder statistischen Tests verwendet. Dort findet sie sich zum Beispiel als Pivotstatistik zur Konstruktion von Konfidenzintervallen im Normalverteilungsmodell oder als Teststatistik bei dem Chi-Quadrat-Test.

Eigenschaften

Rahmenbedingungen

Meist wird die Stichprobenvarianz unter den Annahmen verwendet, dass die Auswertungen unabhängig und identisch verteilt sind sowie entweder einen bekannten oder einen unbekannten Erwartungswert besitzen. Diese Annahmen werden durch die folgenden statistischen Modelle beschrieben:

  • Ist der Erwartungswert unbekannt, so ist das statistische Modell gegeben durch das (nicht notwendigerweise parametrische) Produktmodell
(n,(n),(Pϑn)ϑΘ).
Hierbei bezeichnet Pndas n-fache Produktmaß von P und (Pϑ)ϑΘ ist die Familie aller Wahrscheinlichkeitsmaße mit endlicher Varianz, die mit einer beliebigen Indexmenge Θ indiziert sind. Die Stichprobenvariablen X1,,Xn sind dann unabhängig identisch verteilt gemäß Pϑund besitzen also eine endliche Varianz.
  • Ist der Erwartungswert bekannt und gleich μ0, so ist das statistische Modell gegeben durch das (nicht notwendigerweise parametrische) Produktmodell
(n,(n),(Pϑn)ϑΘ).
Hierbei bezeichnet (Pϑ)ϑΘ die Familie aller Wahrscheinlichkeitsmaße mit endlicher Varianz und Erwartungswert μ0, die mit einer beliebigen Indexmenge Θindiziert sind. Die Stichprobenvariablen X1,,Xn sind dann unabhängig identisch verteilt gemäß Pϑund besitzen somit eine endliche Varianz und den Erwartungswert μ0.

Erwartungstreue

Bekannter Erwartungswert

Im Falle des bekannten Erwartungswertes ist S*2 ein erwartungstreuer Schätzer für die Varianz. Das bedeutet, es gilt

Eϑ(S*2)=Varϑ(X1)=Var(Pϑ).

Hierbei bezeichnet Eϑ(Y) bzw. Varϑ(Y) die Erwartungswertbildung bzw. die Varianzbildung bezüglich des Wahrscheinlichkeitsmaßes Pϑ.

Die Erwartungstreue gilt, da

Eϑ(S*2)=1ni=1nEϑ((Xiμ0)2)=1ni=1nVar(Xi)=Varϑ(X1)

ist. Hierbei folgt der erste Schritt aus der Linearität des Erwartungswertes, der zweite, da nach der Voraussetzung über den bekannten Erwartungswert μ0=Eϑ(Xi) ist und somit nach der Definition der Varianz Eϑ(Xiμ0)2=Eϑ(XiE(Xi))2=Varϑ(Xi) gilt. In den dritten Schritt geht ein, dass die Xi alle identisch verteilt sind.

Unbekannter Erwartungswert

Im Falle des unbekannten Erwartungswertes ist S2eine erwartungstreue Schätzfunktion für die Varianz, es gilt also

Eϑ(S2)=Var(Pϑ)

Im Gegensatz dazu ist S~2nicht erwartungstreu, denn es gilt

Eϑ(S~2)=n1nVar(Pϑ).

Der Schätzer S~2ist aber noch asymptotisch erwartungstreu. Dies folgt direkt aus der obigen Darstellung, denn es ist

limnEϑ(S~2)=limnn1nVar(Pϑ)=Var(Pϑ).
Herleitung der Erwartungstreue

Beachte dazu zuerst, dass aufgrund der Unabhängigkeit

E(XiXj)={E(Xi)E(Xj) falls ijE(Xi2) falls i=j(*)

gilt und aufgrund der identischen Verteilungen

E(Xi)=E(Xj)für alle i,j und somit E(Xi)E(Xj)=E(Xi)2(**).

Daraus folgt direkt

Eϑ(XkX)=1nEϑ(Xki=1nXi)=1nEϑ(Xk2)+1nEϑ(i=1iknXiXk)=1nEϑ(Xk2)+1n i=1iknEϑ(XiXk)=Eϑ(Xk)2=1nEϑ(Xk2)+n1nEϑ(Xk)2(1)

aufgrund von (*)und (**)im letzten Schritt und unter Verwendung der Linearität des Erwartungswertes.

Analog folgt, weil auch X12,,Xn2 identisch verteilt sind (insbesondere also Eϑ(Xi2)=Eϑ(Xk2) für alle i,k),

Eϑ(X2)=1n2Eϑ(i=1nj=1nXiXj)=1n2Eϑ(i=1nXi2+i,j=1ijnXiXj)=nn2Eϑ(Xk2)+n(n1)n2Eϑ(Xk)2=1nEϑ(Xk2)+n1nEϑ(Xk)2(2)

wieder mithilfe von (*)und (**)im dritten Schritt.

Mithilfe von (1)und (2)im zweiten Schritt sowie von (**)im dritten Schritt ist dann

Eϑ(k=1n(XkX)2)=Eϑ(k=1n(Xk22XXk+X2))=k=1n(Eϑ(Xk2)2(1nEϑ(Xk2)+n1nEϑ(Xk)2(1))+(1nEϑ(Xk2)+(n1)nEϑ(Xk)2(2)))=nEϑ(X12)2Eϑ(X12)2(n1)Eϑ(X1)2+Eϑ(X12)+(n1)Eϑ(X1)2=(n1)Eϑ(X12)(n1)Eϑ(X1)2=(n1)Var(X1).

Die letzte Gleichheit folgt hier nach dem Verschiebungssatz. Daraus folgt dann

Eϑ(S2)=1n1Eϑ(k=1n(XkX)2)=Varϑ(X1)=Var(Pϑ)

und analog

Eϑ(S~2)=1nEϑ(k=1n(XkX)2)=n1nVar(Pϑ).

Bessel-Korrektur

Direkt aus der Definition folgt der Zusammenhang

S2=nn1S~2

Der Faktor nn1wird hierbei als Bessel-Korrektur (nach Friedrich Wilhelm Bessel) bezeichnet.[8] Er kann insofern als Korrekturfaktor verstanden werden, da er S~2so korrigiert, dass die Schätzfunktion erwartungstreu wird. Dies folgt, da wie oben gezeigt

Eϑ(S~2)=n1nVar(Pϑ).

und die Bessel-Korrektur genau der Kehrwert des Faktors n1nist. Die Schätzfunktion S2geht somit aus S~2durch die Bessel-Korrektur hervor.

Stichprobenstandardabweichung

Sind die n Zufallsvariablen Xi unabhängig und identisch verteilt, also beispielsweise eine Stichprobe, so ergibt sich die Standardabweichung der Stichprobe als Wurzel aus der Stichprobenvarianz S~2 bzw. S2, also

S~2=1ni=1n(XiX)2

oder

S2=nn11ni=1n(XiX)2

mit

X=1ni=1nXi.

Diese Funktion wird Stichprobenstandardabweichung oder Stichprobenstreuung genannt;[9] ihre Realisierungen entsprechen der empirischen Standardabweichung. Da die Erwartungstreue bei Anwendung einer nichtlinearen Funktion wie der Wurzel in den meisten Fällen verloren geht, ist die Stichprobenstandardabweichung im Gegensatz zur korrigierten Stichprobenvarianz in keinem der beiden Fälle ein erwartungstreuer Schätzer für die Standardabweichung der Grundgesamtheit.

Schätzung der Standardabweichung der Grundgesamtheit aus einer Stichprobe

Die korrigierte Stichprobenvarianz S2 ist ein erwartungstreuer Schätzer für die Varianz σX2 der Grundgesamtheit. Im Gegensatz dazu ist aber S2 kein erwartungstreuer Schätzer für die Standardabweichung. Da die Quadratwurzel eine konkave Funktion ist, folgt aus der Jensenschen Ungleichung zusammen mit der Erwartungstreue von S2

E(S2)E(S2)=σX.

Dieser Schätzer unterschätzt also in den meisten Fällen die Standardabweichung der Grundgesamtheit.

Beispiel

Wählt man eine der Zahlen 1 oder +1 durch Wurf einer fairen Münze, also beide mit Wahrscheinlichkeit jeweils 12, so ist das eine Zufallsgröße mit Erwartungswert 0, Varianz σ2=1 und Standardabweichung σ=1. Berechnet man aus n=2 unabhängigen Würfen X1 und X2 die korrigierte Stichprobenvarianz

S2=121((X1X¯)2+(X2X¯)2),

wobei

X¯=X1+X22

den Stichprobenmittelwert bezeichnet, so gibt es vier mögliche Versuchsausgänge, die alle jeweils Wahrscheinlichkeit 1/4 haben:

X1 X2 X¯ S2 S2
1 1 1 0 0
1 +1 0 2 2
+1 1 0 2 2
+1 +1 +1 0 0

Der Erwartungswert der korrigierten Stichprobenvarianz beträgt daher

E(S2)=0+2+2+04=1=σ2.

Die korrigierte Stichprobenvarianz ist demnach also tatsächlich erwartungstreu. Der Erwartungswert der korrigierten Stichprobenstandardabweichung beträgt hingegen

E(S2)=0+2+2+04=22<1=σ.

Die korrigierte Stichprobenstandardabweichung unterschätzt also die Standardabweichung der Grundgesamtheit.

Berechnung für auflaufende Messwerte

In Systemen, die kontinuierlich große Mengen an Messwerten erfassen, ist es oft unpraktisch, alle Messwerte zwischenzuspeichern, um die Standardabweichung zu berechnen.

In diesem Zusammenhang ist es günstiger, eine modifizierte Formel zu verwenden, die den kritischen Term i=1n(XiX¯)2 umgeht. Dieser kann nicht für jeden Messwert sofort berechnet werden, da der Mittelwert X¯ nicht konstant ist.

Durch Anwendung des Verschiebungssatzes und der Definition des Mittelwerts X¯=1ni=1nXi gelangt man zur Darstellung

S2=1n1[(i=1nXi2)1n(i=1nXi)2]

bzw.

S2=1n[(i=1nXi2)1n(i=1nXi)2]

die sich für jeden eintreffenden Messwert sofort aktualisieren lässt, wenn die Summe der Messwerte i=1nXi sowie die Summe ihrer Quadrate i=1nXi2 mitgeführt und fortlaufend aktualisiert werden. Diese Darstellung ist allerdings numerisch weniger stabil, insbesondere kann der Term unter der Quadratwurzel numerisch durch Rundungsfehler kleiner als 0 werden.

Durch geschicktes Umstellen lässt sich für letztere Gleichung eine Form finden, die numerisch stabiler ist und auf die Varianz Sn12 und den Mittelwert X¯n1 des vorhergehenden sowie auf den Stichprobenwert Xn und den Mittelwert X¯n des aktuellen Iterationsschrittes n zurückgreift:

S2=n1n(Sn12+X¯n12)+Xn2nX¯n2

Normalverteilte Zufallsgrößen

Erwartungstreue Schätzung der Standardabweichung

Für den Fall normalverteilter Zufallsgrößen lässt sich die erwartungstreue Schätzfunktion cnS für die Standardabweichung σ angeben[10][11], wobei der Korrekturfaktor cn durch

cn=n12 Γ(n12)Γ(n2)

gegeben ist, S=S2 die übliche Schätzung der Standardabweichung σ ist und Γ die Gammafunktion bezeichnet. Die Formel folgt, indem man beachtet, dass (n1)S2σ2 eine Chi-Quadrat-Verteilung mit n1 Freiheitsgraden hat.

Korrekturfaktoren für die erwartungstreue Schätzung der Standardabweichung
Stichprobenumfang Korrekturfaktor
2 1,253314
5 1,063846
10 1,028109
15 1,018002
25 1,010468
Beispiel

Es wurden bei einer Stichprobe aus einer normalverteilten Zufallsgröße die fünf Werte 3, 4, 5, 6, 7 gemessen. Man soll nun einen Schätzwert für die Standardabweichung errechnen.

Die Stichprobenvarianz ist:

sX2=14(22+12+0+12+22)=2,5

Der Korrekturfaktor ist in diesem Fall

2 Γ(2)Γ(2,5)1,063846

und der Schätzwert für die Standardabweichung, unter Verwendung einer erwartungstreuen Schätzfunktion, ist damit näherungsweise

σ^=1,0642,5=1,68

Literatur

Einzelnachweise

  1. L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2016, ISBN 978-3-662-50371-3, S. 351.
  2. Vorlage:Literatur
  3. 3,0 3,1 Vorlage:MathWorld
  4. Vorlage:Literatur
  5. Vorlage:Literatur
  6. Vorlage:Literatur
  7. Vorlage:EoM
  8. Vorlage:MathWorld
  9. Vorlage:Literatur
  10. Vorlage:MathWorld
  11. Vorlage:Literatur