Empirische Verteilung (Wahrscheinlichkeitsverteilung)

Aus testwiki
Zur Navigation springen Zur Suche springen

Die empirische Verteilung ist eine spezielle Wahrscheinlichkeitsverteilung in der Stochastik, einem Teilgebiet der Mathematik. Sie gehört zu den diskreten Wahrscheinlichkeitsverteilungen und stellt eine Beziehung zwischen der deskriptiven Statistik und der Wahrscheinlichkeitstheorie her. So ist der Erwartungswert der empirischen Verteilung das arithmetische Mittel der zugrundeliegenden Stichprobe, ebenso wie die Verteilungsfunktion der empirischen Verteilung die empirische Verteilungsfunktion ist.

Definition

Gegeben sei ein Vektor x=(x1,x2,,xn)n. Es bezeichne δz das Dirac-Maß auf z, das gegeben ist durch

δz(A)={1 falls zA0 falls zA.

Dann heißt die Wahrscheinlichkeitsverteilung auf den reellen Zahlen, gegeben durch

P=1ni=1nδxi

die empirische Verteilung von x auf den reellen Zahlen.[1] Es ist also

P(A)=1n#{ixiA}.

Dabei bezeichnet # die Mächtigkeit der Menge, also die Anzahl ihrer Elemente und {ixiA} enthält die Indizes der Elemente des Vektors x, die in A enthalten sind. Anschaulich wird somit zuerst gezählt, wie viele Komponenten des Vektors x in der Menge A enthalten sind. Diese Zahl, geteilt durch die Gesamtzahl der Komponenten, ist dann die Wahrscheinlichkeit der Menge A.

Die empirische Verteilung kann auch auf allgemeineren Grundräumen Ω definiert werden, dann ist xΩn.[2] Dieser Artikel behandelt aber weiterhin den Fall xn.

Wahrscheinlichkeitsfunktion

Sind alle Komponenten von x verschieden, ist also xixj für ij, so entspricht die Wahrscheinlichkeitsfunktion der empirischen Verteilung der einer diskreten Gleichverteilung auf {x1,x2,,xn} und ist gegeben durch

f(x)={1nfür x=xi(i=1,,n)0sonst

Tritt eine Komponente k-mal auf, so ist der Wert der Wahrscheinlichkeitsfunktion dort entsprechend kn.

Verteilungsfunktion

Die Verteilungsfunktion der empirischen Verteilung ist die empirische Verteilungsfunktion und damit gegeben durch

F(t)=1ni=1n𝟏[xi;+)(t).

Hierbei ist 𝟏A die Indikatorfunktion der Menge A.

Eigenschaften

Gegeben sei eine Zufallsvariable X, welche gemäß der empirischen Verteilung (mit xn) verteilt ist. Dann sind die wahrscheinlichkeitstheoretischen Kennzahlen von X wie Erwartungswert und Quantile genau die korrespondierenden Kennzahlen der deskriptiven Statistik der Stichprobe x=(x1,x2,,xn) wie das arithmetisches Mittel und die empirischen Quantile.

Erwartungswert

Der Erwartungswert der empirischen Verteilung ist das arithmetische Mittel von x (siehe Gewichtetes arithmetisches Mittel als Erwartungswert), also

E(X)=1ni=1nxi

Varianz

Die Varianz der empirischen Verteilung ist die (unkorrigierte) empirische Varianz, also

Var(X)=1ni=1n(xix)2.

Hierbei bezeichnet x das arithmetische Mittel bzw. den Erwartungswert.

Median und Quantile

Der Median (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung entspricht dem Median der Stichprobe x, ebenso entsprechen die Quantile der empirischen Verteilung den empirischen Quantilen.

Modus

Der Modus (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung entspricht dem Modus der Stichprobe x.

Weitere Streumaße

Des Weiteren gilt:

Einzelnachweise

Vorlage:Navigationsleiste Wahrscheinlichkeitsverteilungen