Verallgemeinerte hypergeometrische Verteilung

Aus testwiki
Zur Navigation springen Zur Suche springen

Die multivariate hypergeometrische Verteilung, auch verallgemeinerte hypergeometrische Verteilung, allgemeine hypergeometrische Verteilung oder polyhypergeometrische Verteilung genannt, ist eine multivariate Wahrscheinlichkeitsverteilung und zählt zu den diskreten Wahrscheinlichkeitsverteilungen. Sie ist eine multivariate Verallgemeinerung der hypergeometrischen Verteilung und kann aus dem Urnenmodell abgeleitet werden.

Definition

Eine Zufallsvariable X mit Werten in {(b1,,bk)0k|b1++bk=n} heißt multivariat hypergeometrisch verteilt zu den Parametern B=(B1,,Bk)0k mit B1++Bk=N und nN, wenn sie die Wahrscheinlichkeitsfunktion

fB,n(b1,,bk)=(B1b1)(B2b2)(Bkbk)(Nn)

besitzt. Man schreibt dann XB,n oder XHypB,n wie bei der hypergeometrischen Verteilung.

Herleitung aus dem Urnenmodell

Die multivariate hypergeometrische Verteilung lässt sich anschaulich aus dem Urnenmodell herleiten. Gegeben sei eine Urne mit insgesamt N Kugeln, von denen jede in einer von k unterschiedlichen Farben eingefärbt ist. Von der Farbe i gibt es Bi Kugeln. Die Wahrscheinlichkeit, beim n-maligen Ziehen ohne Zurücklegen genau bi Kugeln der Farbe i zu ziehen, ist multivariat hypergeometrisch verteilt.

Eigenschaften

Erwartungswert

Ist Xi die Anzahl der Kugeln der Farbe i, so ist der Erwartungswert

E(Xi)=nBiN

Varianz

Die Varianz ist

Var(Xi)=BiN(1BiN)nNnN1

Kovarianz

Für die Kovarianz zwischen der Anzahl der Kugeln gilt

Cov(Xi,Xj)=nBiBjN2NnN1

wenn ij.

Beispiel

Es ist eine Urne mit 5 schwarzen, 10 weißen und 15 roten Kugeln gegeben. Die Wahrscheinlichkeit, bei sechsmaligem Ziehen genau zwei Kugeln von jeder Farbe zu ziehen, ist

P(2 schwarz,2 weiss,2 rot)=(52)(102)(152)(306)0.0795,

also knapp acht Prozent. Es ist n=6,N=30,B1=5,B2=10,B3=15. Damit folgt zum Beispiel für den Erwartungswert der schwarzen Kugeln E(schwarz)=1.

Beziehung zu anderen Verteilungen

Beziehung zur hypergeometrischen Verteilung

Die hypergeometrische Verteilung ist ein Spezialfall der multivariaten hypergeometrischen Verteilung mit B1=M und B2=NM. Man beachte hier die unterschiedlichen Parametrisierungen.

Beziehung zur Multinomialverteilung

Die multivariate hypergeometrische Verteilung und die Multinomialverteilung sind verwandt, da sie aus demselben Urnenmodell entstehen, mit dem Unterschied, dass im Multinomialmodell zurückgelegt wird. Insbesondere lässt sich zeigen, dass wenn N und Bi gilt, sodass BiNpi ist, und die pi eine Wahrscheinlichkeitsfunktion auf {1,,k} definieren, dann B,n punktweise gegen die Multinomialverteilung p,n mit den Parametern pi und n konvergiert. Die multivariate hypergeometrische Verteilung kann somit durch die Multinomialverteilung approximiert werden.

Literatur

Vorlage:Navigationsleiste Wahrscheinlichkeitsverteilungen