Poisson-Approximation

Aus testwiki
Zur Navigation springen Zur Suche springen
Vergleich der Poisson-Verteilung (schwarze Linien) und der Binomialverteilung mit n=10 (rote Kreise), n=20 (blaue Kreise),n=1000 (grüne Kreise). Alle Verteilungen haben einen Erwartungswert von 5. Die horizontale Achse zeigt die Anzahl der eingetretenen Ereignisse k. Je größer n wird, umso besser ist die Approximation der Binomialverteilung durch die Poisson-Verteilung.

Die Poisson-Approximation ist in der Wahrscheinlichkeitsrechnung eine Möglichkeit, die Binomialverteilung und die verallgemeinerte Binomialverteilung für große Stichproben und kleine Wahrscheinlichkeiten durch die Poisson-Verteilung anzunähern. Durch den Grenzübergang nach unendlich erhält man dann die Konvergenz in Verteilung der beiden Binomialverteilungen gegen die Poisson-Verteilung.

Formulierung

Ist (Sn) eine Folge binomialverteilter Zufallsvariablen mit Parametern n und pn, sodass für die Erwartungswerte E(Sn)=npnλ>0 für n gilt, dann folgt

P(Sn=k)=Bn,pn({k})λkk!eλ=Pλ({k})

für n.

Beweis-Skizze

Der Wert einer Poisson-verteilten Zufallsvariable an der Stelle k ist der Grenzwert n einer Binomialverteilung mit p=λn an der Stelle k:

limnP(Sn=k)=limn(nk)pk(1p)nk=limnn!k!(nk)!(λn)k(1λn)nk=limn(λkk!)(n(n1)(n2)(nk+1)nk)(1λn)n(1λn)k=λkk!limn(nnn1nn2nnk+1n)1(1λn)neλ(1λn)k1=λkeλk!.

Bei großen Stichproben und kleinem p lässt sich folglich die Binomialverteilung gut durch die Poisson-Verteilung approximieren.

Die Darstellung als Grenzwert der Binomialverteilung erlaubt eine alternative Berechnung von Erwartungswert und Varianz der Poisson-Verteilung. Seien X1,,Xnn unabhängige bernoulliverteilte Zufallsvariablen mit p=λ/n und sei Sn:=X1++Xn. Für n gilt SnPλ und

E(Sn)=E(X1)++E(Xn)=λn++λnnmal=λλVar(Sn)=Var(X1)++Var(Xn)=λn(1λn)++λn(1λn)nmal=λ(1λn)λ.

Güte der Approximation

Vorlage:Belege Für die Fehlerabschätzung gilt

k0|Bn,p({k})Pnp({k})|2np2.

Die Approximation einer Summe von Bernoulli-verteilten Zufallsvariablen (bzw. einer binomialverteilten Zufallsvariable) ist also insbesondere für kleine p gut. Als Faustregel gilt, dass die Approximation gut ist, wenn n50 und p0,05 gilt. Ist p0,5, so ist die Normal-Approximation besser geeignet.

Le Cams Verallgemeinerung

Allgemeiner lässt sich Folgendes zeigen: Seien X1,,Xn stochastisch unabhängige Zufallsvariablen mit P(Xi=1)=pi=1P(Xi=0) (jede Zufallsvariable ist also Bernoulli-verteilt), dann ist

S:=i=1nXi

verallgemeinert binomialverteilt. Definiere

λ:=i=1npi,

dann gilt

k=0|P(S=k)exp(λ)λkk!|2i=1npi2.

Im Englischen ist dieses Resultat als „Ungleichung von Le Cam“ (Le Cam’s Inequality) bekannt.[1]

Gilt pi=pj für alle 1i,jn, so ist S binomialverteilt und das obige Ergebnis folgt sofort.

Beispiel

Ein Individuum einer Spezies zeugt n=1000 Nachkommen, die alle stochastisch unabhängig voneinander mit einer Wahrscheinlichkeit von pi=0,001 das geschlechtsreife Alter erreichen. Interessiert ist man nun an der Wahrscheinlichkeit, dass zwei oder mehr Nachkommen das geschlechtsreife Alter erreichen.

Exakte Lösung

Sei Xi=1 die Zufallsvariable „Der i-te Nachkomme erreicht das geschlechtsreife Alter“. Es gilt P(Xi=1)=pi und P(Xi=0)=1pi für alle i. Dann ist die Anzahl der überlebenden Nachkommen S:=i=1nXi aufgrund der stochastischen Unabhängigkeit Bn,p-verteilt. Zur Modellierung definiert man den Wahrscheinlichkeitsraum (Ω,Σ,P) mit der Ergebnismenge Ω:={0,,n}, der Anzahl der überlebenden geschlechtsreifen Nachkommen. Die σ-Algebra ist dann kanonisch die Potenzmenge der Ergebnismenge: Σ:=𝒫(Ω) und als Wahrscheinlichkeitsverteilung die Binomialverteilung: P({k}):=Bn,p({k}). Gesucht ist P(S2)=1P(S=1)P(S=0)=1B1000;0,001({0})B1000;0,001({1})0,2642. Es erreichen also mit einer Wahrscheinlichkeit von ca. 26 % mindestens zwei Individuen das geschlechtsreife Alter.

Approximierte Lösung

Da n ausreichend groß und p ausreichend klein ist, lässt sich die Binomialverteilung genügend genau mittels der Poisson-Verteilung annähern. Diesmal ist der Wahrscheinlichkeitsraum (Ω,Σ,P) definiert mittels des Ergebnisraums Ω:=, der σ-Algebra Σ:=𝒫() und der Poisson-Verteilung als Wahrscheinlichkeitsverteilung P({k}):=Pλ({k})=λkk!eλ mit dem Parameter λ=np=1. Man beachte hier, dass die beiden modellierten Wahrscheinlichkeitsräume unterschiedlich sind, da die Poisson-Verteilung auf einem endlichen Ergebnisraum keine Wahrscheinlichkeitsverteilung definiert. Die Wahrscheinlichkeit, dass mindestens zwei Individuen das geschlechtsreife Alter erreichen, ist also P(S2)1Pλ({1})Pλ({0})=1λ11!e1λ00!e10,2642.

Bis auf vier Nachkommastellen stimmt also die exakte Lösung mit der Poisson-Approximation überein.

Literatur

Einzelnachweise