Verallgemeinerte Binomialverteilung

Aus testwiki
Zur Navigation springen Zur Suche springen

Vorlage:Infobox Verteilung

Die Verallgemeinerte Binomialverteilung (gelegentlich auch Poissonsche Verallgemeinerung der Binomialverteilung, oder Poisson-Binomialverteilung genannt) ist eine Wahrscheinlichkeitsverteilung und somit dem mathematischen Teilgebiet der Stochastik zuzuordnen. Bei ihr handelt es sich um eine univariate diskrete Wahrscheinlichkeitsverteilung. Sie ist definiert als die Summe von unabhängigen, nicht notwendigerweise identisch verteilten Zufallsvariablen, welche einer Bernoulli-Verteilung unterliegen.

Die Verallgemeinerte Binomialverteilung beschreibt also die Erfolge einer Serie von unabhängigen Versuchen, welche jeweils genau zwei Ergebnisse annehmen kann. Der Unterschied zur Binomialverteilung besteht darin, dass jedem Versuch eine andere Erfolgswahrscheinlichkeit zugeordnet werden kann.

Es ist auch möglich die Verallgemeinerte Binomialverteilung als Summe von unabhängigen, nicht identischen, binomialverteilten Zufallsvariablen festzulegen, wobei die Bernoulli Zufallsgrößen mit identischen Erfolgswahrscheinlichkeiten zu binomialverteilten Zufallsvariablen zusammengefasst werden.

Definition der Verallgemeinerten Binomialverteilung

Eine diskrete Zufallsvariable X folgt einer Verallgemeinerten Binomialverteilung mit Parametervektor p, wenn sie die folgende Wahrscheinlichkeitsfunktion besitzt[1]

ρX(k)=ABkiApijAc(1pj),

wobei p=(p1,,pn) den Vektor der Erfolgswahrscheinlichkeiten pro Versuch und k die Gesamtanzahl der Erfolge bei n Versuchen bezeichnet.

Schreibweise: XGB(p)

Bk ist die Menge aller k-elementigen Teilmengen, die aus dem Träger {1,2,,n} gebildet werden können. Ac ist das Komplement von A, das heißt Ac={1,2,,n}A.

Die zugehörige Verteilungsfunktion lautet[2]

FX(k)=P(Xk)=l=0kABliApijAc(1pj)

Alternative Parametrisierung

Die Verallgemeinerte Binomialverteilung kann ebenso als Summe von binomialverteilten Zufallsgrößen definiert werden, indem die Bernoulli Zufallsvariablen mit gleichen Erfolgswahrscheinlichkeiten zu binomialverteilten Zufallsgrößen zusammengefasst werden.

GB(k|p)=GB(k|pr,nr),

wobei der Parametervektor pr=(pr1,,prr) die Erfolgswahrscheinlichkeiten von r binomialverteilten Zufallsvariablen enthält und der Parametervektor nr=(nr1,,nrr) die jeweils zugehörige Anzahl an Versuchen.

Es gilt somit p=(p1,,pn)=(pr11nr1T,,prr1nrrT). Hierbei ist 1nriT der Einsvektor der Länge nri, bestehend aus lauter Einsen.

Eigenschaften der Verallgemeinerten Binomialverteilung

X sei im Folgenden eine Zufallsvariable, die einer Verallgemeinerten Binomialverteilung folgt XGB(p).

Erwartungswert

Die Verallgemeinerte Binomialverteilung besitzt den Erwartungswert

E(X)=i=1npi

Varianz

Die Verallgemeinerte Binomialverteilung besitzt die Varianz

Var(X)=i=1n(1pi)pi

Schiefe

Die Verallgemeinerte Binomialverteilung besitzt die Schiefe

v(X)=i=1n(12pi)(1pi)pi(i=1n(1pi)pi)32

Wölbung und Exzess

Die Verallgemeinerte Binomialverteilung besitzt die Wölbung

β2=3+i=1n(16(1pi)pi)(1pi)pi(i=1n(1pi)pi)2

und damit den Exzess

γ=β23=i=1n(16(1pi)pi)(1pi)pi(i=1n(1pi)pi)2

Kumulanten

Die kumulantenerzeugende Funktion ist

gX(t)=i=1nln(1pi+piet).

Daher ist die k-te Kumulante genau die Summe der k-ten Kumulanten der n Bernoulli-verteilten Zufallsvariablen, aus denen die Verallgemeinerte Binomialverteilung zusammengesetzt ist:

τk=τk1++τkn

Für diese Kumulanten gilt dann auch die Rekursionsgleichung der Kumulanten der Bernoulli-Verteilung.

Wahrscheinlichkeitserzeugende Funktion

Die wahrscheinlichkeitserzeugende Funktion der verallgemeinerten Binomialverteilung lautet

mX(t)=j=1n(1pj+pjt)

Charakteristische Funktion

Die charakteristische Funktion der Verallgemeinerten Binomialverteilung lautet:

φX(t)=j=1n(1pj+pjeit)

Momenterzeugende Funktion

Die momenterzeugende Funktion der Verallgemeinerten Binomialverteilung lautet:

MX(t)=j=1n(1pj+pjet)

Summe von verallgemeinert binomialverteilten Zufallsvariablen

Ist XGBn(p1,pn) und YGBm(p1,pm) zwei unabhängige verallgemeinert binomialverteilte Zufallsvariablen, dann ist auch X+Y verallgemeinert binomialverteilt: X+YGBn+m(p1,pn+m). Demnach ist die verallgemeinerte Binomialverteilung reproduktiv.

Beziehung zu anderen Verteilungen

Beziehung zur Binomialverteilung

Die Summe von voneinander unabhängigen binomialverteilten Zufallsvariablen XiB(ni,pi) ist verallgemeinert binomialverteilt. Wenn alle Erfolgswahrscheinlichkeiten gleich sind, das heißt pi=pji,j=1,n, dann ergibt sich aus der Verallgemeinerten Binomialverteilung die Binomialverteilung. Tatsächlich ist die Binomialverteilung für festen Erwartungswert und feste Ordnung diejenige verallgemeinerte Binomialverteilung mit maximaler Entropie.[3] Das bedeutet, unter der Bedingung, dass der Parametervektor p von XGB(p) die Länge n hat, maximiert p=(E(X)/n,,E(X)/n) die Entropie H(X).

Beziehung zur Bernoulli-Verteilung

Die Summe von n voneinander unabhängigen Bernoulli-verteilten Zufallsvariablen Xi, die alle einen unterschiedlichen Parameter pi besitzen, ist verallgemeinert binomialverteilt.

Approximation durch die Poisson-Verteilung

Vorlage:Hauptartikel Für eine sehr große Anzahl an Versuchen n und sehr kleine, aber unterschiedliche Erfolgswahrscheinlichkeiten p1,,pn kann die Wahrscheinlichkeitsfunktion der Verallgemeinerten Binomialverteilung durch die Poisson-Verteilung approximiert werden.[2]

ρX(k)λkk!eλ

Der Parameter λ ist gleich dem Erwartungswert der Verallgemeinerten Binomialverteilung.

Approximation durch die Normalverteilung

Die Verteilungsfunktion der Verallgemeinerten Binomialverteilung kann für eine sehr große Anzahl an Versuchen n durch die Normalverteilung approximiert werden.[2]

FX(k)Φ(k+0,5μσ), k=0,,n

Der Parameter μ entspricht dem Erwartungswert und σ der Standardabweichung der Verallgemeinerten Binomialverteilung. Φ() ist die Verteilungsfunktion der Standardnormalverteilung.

Beispiele

Radarkontrolle

Ein Arbeitnehmer muss an jedem Arbeitstag über die Autobahn und durch das Ortsgebiet zur Arbeit fahren. Die Wahrscheinlichkeiten in eine Radarkontrolle zu geraten sind 0,5% auf der Autobahn und 1% im Ortsgebiet.

Wie hoch sind die Wahrscheinlichkeiten an einem Arbeitstag in 0,1,2 Kontrollen zu geraten?

Die zufällige Anzahl von Radarkontrollen R kann als Summe von zwei Bernoulli-verteilten Zufallsvariablen R1 für die Autobahn und R2 für das Ortsgebiet modelliert werden: R=R1+R2, mit

R1={1,Kontrolle mit Wahrscheinlichkeit 0,0050,keine Kontrolle mit Wahrscheinlichkeit 0,995
R2={1,Kontrolle mit Wahrscheinlichkeit 0,010,keine Kontrolle mit Wahrscheinlichkeit 0,99

Da R1 und R2 unterschiedliche Erfolgswahrscheinlichkeiten besitzen, kann man dieses Beispiel nicht mit Hilfe der Binomialverteilung lösen.

R folgt einer Verallgemeinerten Binomialverteilung mit Parametervektor p=(0,005,0,01).

Die gesuchten Wahrscheinlichkeiten können folgendermaßen berechnet werden:

  • 0 Kontrollen: P(R=0)
P(R=0)=P(R1=0)P(R2=0)=0,9950,99=0,98505=98,505%
  • 1 Kontrolle: P(R=1)
P(R=1)=P(R1=1)P(R2=0)+P(R1=0)P(R2=1)=0,0050,99+0,9950,01=0,0149=1,49%
  • 2 Kontrollen: P(R=2)
P(R=2)=P(R1=1)P(R2=1)=0,0050,01=0,00005=0,005%

Herstellungsprozess

In einer Fabrik werden Geräte produziert und anschließend einer Qualitätskontrolle unterzogen. Es können 3 verschiedene Fehlertypen auftreten. Die Wahrscheinlichkeiten, dass ein spezieller Fehlertyp auftritt sind 4% für den Fehler vom Typ 1 und jeweils 7% für die Fehlertypen 2 und 3.

Wie hoch sind die Wahrscheinlichkeiten dafür, dass ein Gerät mit 0,1,2,3 Fehlern produziert wird?

Die zufällige Anzahl von Fehlern F kann als Summe von drei Bernoulli-verteilten Zufallsvariablen F1, F2 und F3 geschrieben werden: F=F1+F2+F3, mit

F1={1,Fehler mit Wahrscheinlichkeit 0,040,kein Fehler mit Wahrscheinlichkeit 0,96
F2=F3={1,Fehler mit Wahrscheinlichkeit 0,070,kein Fehler mit Wahrscheinlichkeit 0,93

F besitzt eine Verallgemeinerten Binomialverteilung mit Parametervektor p=(0,04,0,07,0,07).

Alternativ kann die Parametrisierung pr=(0,04,0,07), nr=(1,2) gewählt werden, indem die identischen Bernoulli Zufallsvariablen zu einer binomialverteilten Zufallsvariable zusammengefasst werden.

Die gesuchten Wahrscheinlichkeiten können folgendermaßen berechnet werden:

  • 0 Fehler: P(F=0)
P(F=0)=P(F1=0)P(F2=0)P(F3=0)=0,960,930,93=0,830304=83,0304%
  • 1 Fehler: P(F=1)
P(F=1)=P(F1=1)P(F2=0)P(F3=0)+P(F1=0)P(F2=1)P(F3=0)+P(F1=0)P(F2=0)P(F3=1)=0,040,930,93+0,960,070,93+0,960,930,07=0,159588=15,9588%
  • 2 Fehler: P(F=2)
P(F=2)=P(F1=1)P(F2=1)P(F3=0)+P(F1=0)P(F2=1)P(F3=1)+P(F1=1)P(F2=0)P(F3=1)=0,040,070,93+0,960,070,07+0,040,930,07=0,009912=0,9912%
  • 3 Fehler: P(F=3)
P(F=3)=P(F1=1)P(F2=1)P(F3=1)=0,040,070,07=0,000196=0,0196%

Anwendung & Berechnung

Die Verallgemeinerte Binomialverteilung kommt in vielen Bereichen zum Einsatz; z. B. Umfragen, Herstellungsprozesse, Qualitätssicherung. Oft wird allerdings eine Approximation benutzt, da die exakte Berechnung sehr aufwändig ist. Ohne entsprechende Software sind selbst einfache Modelle mit wenigen Bernoulli Zufallsvariablen kaum zu berechnen.

Zufallszahlen

Zur Erzeugung von Zufallszahlen kann die Inversionsmethode verwendet werden. Alternativ kann man auch n Bernoulli-verteilte Zufallszahlen zu den Parametern pi erzeugen und diese Aufsummieren. Das Ergebnis ist dann verallgemeinert binomialverteilt.

Literatur

  • M.Fisz, Wahrscheinlichkeitsrechnung und mathematische Statistik, VEB Deutscher Verlag der Wissenschaften, 1973, p. 164 ff.
  • K.J. Klauer, Kriteriumsorientierte Tests, Verlag für Psychologie, Hogrefe, 1987, Göttingen, p. 208 ff.
  • GenBinomApps – R Package. R Package zur Berechnung von Clopper Pearson Konfidenzintervallen und der verallgemeinerten Binomialverteilung. Abgerufen am 30. Juli 2015.

Einzelnachweise

  1. On the Number of Successes in Independent Trials. (PDF; 1,6 MB) Y.H.Wang, Statistica Sinica, Vol. 3, 1993, p. 295–312. Abgerufen am 23. September 2013.
  2. 2,0 2,1 2,2 Vorlage:Webarchiv (PDF; 110 kB) Y.Hong, Blacksburg, USA, 5. April 2011. Abgerufen am 23. September 2013.
  3. Vorlage:Cite journal

Vorlage:Navigationsleiste Wahrscheinlichkeitsverteilungen