A-posteriori-Wahrscheinlichkeit

Aus testwiki
Zur Navigation springen Zur Suche springen

Die A-posteriori-Wahrscheinlichkeit ist ein Begriff aus der bayesschen Statistik. Sie beschreibt den Wissensstand über einen unbekannten Umweltzustand θ a posteriori, d. h. nach der Beobachtung einer Zufallsgröße X, die von θ in statistischer Abhängigkeit steht.

Definition

Folgende Situation ist gegeben: θ ist ein unbekannter Umweltzustand (z. B. ein Parameter einer Wahrscheinlichkeitsverteilung), der auf der Basis von Beobachtungen x einer Zufallsgröße X geschätzt werden soll.

Gegeben sei eine Verteilung für den Parameter θ vor der Beobachtung der Stichprobe. Diese Verteilung wird auch A-priori-Verteilung genannt.

Weiterhin sei die Dichte (bzw. im diskreten Fall: die Wahrscheinlichkeitsfunktion) der bedingten Verteilung der Stichprobe unter der Bedingung θ=θ0 gegeben. Diese Dichte (bzw. Wahrscheinlichkeitsfunktion) wird im Folgenden mit f(x|θ0) bezeichnet.

Die A-posteriori-Verteilung ist die Verteilung des Populationsparameters θ unter der Bedingung, dass für die Zufallsgröße X der Wert x beobachtet wurde. Die A-posteriori-Verteilung wird mit Hilfe des Satzes von Bayes aus der A-priori-Verteilung und der bedingten Verteilung der Stichprobe unter der Bedingung θ=θ0 berechnet.

A-posteriori-Verteilung

Für stetige A-priori-Verteilungen

Eine stetige A-priori-Verteilung liegt dann vor, wenn die A-priori-Verteilung auf der Menge der reellen Zahlen oder auf einem Intervall in definiert ist. Beispiele für stetige A-priori-Verteilungen sind:

  • die Normalverteilung (hier ist der Parameterraum Θ die Menge der reellen Zahlen) oder
  • die Gleichverteilung auf dem Intervall [0;1] (hier ist der Parameterraum Θ das Intervall [0;1]).

Im Folgenden steht g(θ) für die auf dem Parameterraum Θ definierte A-priori-Dichte von θ.

In diesem Fall kann die A-posteriori-Dichte h(θ|x) folgendermaßen berechnet werden:[1]

h(θ0x)=f(xθ0)g(θ0)Θf(xθ)g(θ)dθ

Für diskrete A-priori-Verteilungen

Im folgenden Abschnitt steht P(θ=θ0) für die diskrete A-priori-Wahrscheinlichkeit, dass der Parameter θ den Wert θ0 annimmt. Eine diskrete A-priori-Verteilung ist auf einer endlichen Menge oder auf einer Menge mit abzählbar unendlichem Träger definiert.

Die A-posteriori-Wahrscheinlichkeit wird im Folgenden mit P(θ=θ0|x) bezeichnet und kann auf folgende Weise berechnet werden:[1]

P(θ=θ0|x)=f(x|θ0)P(θ=θ0)θΘf(x|θ)P(θ=θ)

Bedeutung in der bayesschen Statistik

In der bayesschen Statistik stellt die A-posteriori-Verteilung den neuen, durch Vorwissen und Beobachtung bestimmten Kenntnisstand über die Verteilung des Parameters θ nach der Beobachtung der Stichprobe dar.

Damit ist die A-posteriori-Verteilung die Grundlage zur Berechnung aller Punktschätzer (siehe Bayes-Schätzer) und Glaubwürdigkeitsintervalle.[1]

Beispiel

In einer Urne befinden sich rote und schwarze Kugeln. Es ist bekannt, dass der Anteil roter Kugeln entweder bei 40 % oder aber bei 60 % liegt. Um Genaueres herauszufinden, werden (mit Zurücklegen) 11 Kugeln aus der Urne gezogen. Es werden 4 rote und 7 schwarze Kugeln gezogen.

Die Zufallsgröße „Anzahl gezogener roter Kugeln“ wird im Folgenden mit X bezeichnet, der tatsächlich beobachtete Wert der Zufallsgröße mit x.

Die Zufallsgröße X ist binomialverteilt mit unbekanntem Parameter θ, wobei θ nur einen der Werte 0,4 oder 0,6 annehmen kann. Da kein weiteres Vorwissen bekannt ist, wird als A-priori-Verteilung für θ eine diskrete Gleichverteilung angenommen, d. h.

P(θ=0,4)=P(θ=0,6)=0,5.

Die Wahrscheinlichkeitsfunktion für X=x ergibt sich aus der Binomialverteilung zu

f(X=4θ=θ0)=(114)θ04(1θ0)7.

Man erhält daher für θ0=0,4

f(X=4θ=0,4)=(114)0,440,67=0,236.

Für θ0=0,6 erhält man

f(X=4θ=0,6)=(114)0,640,47=0,07.

Die A-posteriori-Verteilung kann nun mit Hilfe des Satzes von Bayes berechnet werden. Für θ=0,4 erhält man als A-posteriori-Wahrscheinlichkeit

P(θ=0,4x=4)=0,2360,50,2360,5+0,070,5=0,77.

Für θ=0,6 ergibt sich die A-posteriori-Wahrscheinlichkeit

P(θ=0,6x=4)=0,070,50,2360,5+0,070,5=0,23.

Somit ist nach Ziehung der Stichprobe die Wahrscheinlichkeit, dass der Anteil roter Kugeln in der Urne 40 % beträgt, gleich 0,77.

Siehe auch

Einzelnachweise

  1. 1,0 1,1 1,2 Bernhard Rüger (1988), S. 152 ff.

Literatur

  • Bernhard Rüger: Induktive Statistik. Einführung für Wirtschafts- und Sozialwissenschaftler. R. Oldenbourg Verlag, München Wien 1988. ISBN 3-486-20535-8
  • Hans-Otto Georgii: Stochastik – Einführung in die Wahrscheinlichkeitstheorie und Statistik. de Gruyter Verlag, Berlin New York 2007. ISBN 978-3-11-019349-7