Konvergenz in Wahrscheinlichkeit

Aus testwiki
Zur Navigation springen Zur Suche springen
Graph einer Versuchsreihe mit stochastischer Konvergenz der relativen Häufigkeit gegen einen Grenzwert

Die Konvergenz in Wahrscheinlichkeit, auch stochastische Konvergenz genannt, ist ein Begriff aus der Wahrscheinlichkeitstheorie, einem Teilgebiet der Mathematik. Die Konvergenz in Wahrscheinlichkeit ist das wahrscheinlichkeitstheoretische Pendant zur Konvergenz nach Maß in der Maßtheorie und neben der Konvergenz im p-ten Mittel, der Konvergenz in Verteilung und der fast sicheren Konvergenz einer der Konvergenzbegriffe in der Stochastik. Es finden sich auch Quellen, welche die Konvergenz in Wahrscheinlichkeit analog zur Konvergenz lokal nach Maß der Maßtheorie definieren. Die Konvergenz in Wahrscheinlichkeit findet beispielsweise Anwendung bei der Formulierung des schwachen Gesetzes der großen Zahlen.

Definition

Für reellwertige Zufallsvariablen

Eine Folge (Xn)n von reellen Zufallsvariablen konvergiert in Wahrscheinlichkeit oder stochastisch gegen die Zufallsvariable X, wenn für jedes ϵ>0 gilt, dass

limnP(|XnX|ϵ)=0

ist. Man schreibt dann XnpX oder XnPX oder auch plim(Xn)=X.

Für Zufallsvektoren

Eine Folge (𝐗n)n von Zufallsvektoren mit Werten in m konvergiert in Wahrscheinlichkeit oder stochastisch gegen den m-dimensionalen Zufallsvektor 𝐗, wenn für jedes ϵ>0 gilt, dass

limnP(d(𝐗n,𝐗)ϵ)=0

ist, wobei d eine Metrik auf m ist. Man schreibt dann 𝐗np𝐗 oder 𝐗nP𝐗 oder plim(𝐗n)=𝐗.
Die verwendete Metrik d kann beispielsweise die euklidische Metrik, die Manhattan-Metrik oder die Maximum-Metrik sein. Sie erzeugen dasselbe Konzept der Konvergenz in Wahrscheinlichkeit für Zufallsvektoren.

Allgemeiner Fall

Seien (M,d) ein separabler metrischer Raum und (M) die zugehörige Borelsche σ-Algebra. Eine Folge (Xn)n von Zufallsvariablen auf einem Wahrscheinlichkeitsraum (Ω,𝒜,P) mit Werten in (M,(M)) heißt konvergent in Wahrscheinlichkeit oder stochastisch konvergent gegen X, wenn für alle ϵ>0 gilt, dass

limnP(d(Xn,X)ϵ)=0

ist. Dabei wird die vorausgesetzte Separabilität benötigt, um die in der Definition verwendete Messbarkeit der Abbildung Ω,ωd(Xn(ω),X(ω)), sicherzustellen.

Beispiel

Animation – Urnenmodell mit Zurücklegen und gleicher Wahrscheinlichkeit für rote bzw. blaue Kugel

Seien Yn unabhängige Rademacher-verteilte Zufallsvariablen, also P(Yn=1)=P(Yn=1)=12. Dann ist E(Yn)=0 und Var(Yn)=1. Definiert man nun die Folge von Zufallsvariablen (Xn)n als

Xn:=1ni=1nYi,

so ist aufgrund der Unabhängigkeit

E(Xn)=1nnE(Yn)=0

und

Var(Xn)=1n2Var(i=1nYi)=1n.

Mit der Tschebyscheff-Ungleichung

P[|XnE[Xn]|ϵ]Var[Xn]ϵ2

erhält man dann die Abschätzung

P[|Xn|ϵ]1nϵ2n0.

Also konvergieren die Xn in Wahrscheinlichkeit gegen 0. Neben der Tschebyscheff-Ungleichung ist die allgemeinere Markow-Ungleichung ein hilfreiches Mittel, um Konvergenz in Wahrscheinlichkeit zu zeigen.

Eigenschaften

  • Konvergiert (Xn)nN stochastisch gegen 0 und konvergiert (Yn)nN stochastisch gegen 0, so konvergiert auch (Xn+Yn)nN stochastisch gegen 0.
  • Ist die reelle Zahlenfolge (an)n beschränkt und konvergiert (Xn)nN stochastisch gegen 0, so konvergiert auch (anXn)nN stochastisch gegen 0.
  • Man kann zeigen, dass eine Folge Xn genau dann stochastisch gegen X konvergiert, falls
limnE[min(1,|XnX|)]=0,
das heißt die stochastische Konvergenz entspricht der Konvergenz bezüglich der Metrik d(X,Y):=E[min(1,|XY|)]. Der Raum aller Zufallsvariablen versehen mit dieser Metrik bildet einen topologischen Vektorraum, der im Allgemeinen nicht lokalkonvex ist.
  • Eine Folge von Zufallsvektoren (𝐗n)n mit Werten in m konvergiert stochastisch gegen den m-dimensionalen Nullvektor 𝟎 genau dann, wenn er komponentenweise stochastisch gegen Null konvergiert, wenn also
Xjnp0für j=1,,m
gilt, wobei Xjn die j-te Komponente des Vektors 𝐗n=(X1n,,Xmn) bezeichnet.

Beziehung zu anderen Konvergenzarten der Stochastik

Allgemein gelten für die Konvergenzbegriffe der Wahrscheinlichkeitstheorie die Implikationen

Fast sichereKonvergenzKonvergenz inWahrscheinlichkeitKonvergenz inVerteilung

und

Konvergenz imp-ten MittelKonvergenz inWahrscheinlichkeitKonvergenz inVerteilung.

Die Konvergenz in Wahrscheinlichkeit ist also ein mäßig starker Konvergenzbegriff. In den unten stehenden Abschnitten sind die Beziehungen zu den anderen Konvergenzarten genauer ausgeführt.

Konvergenz im p-ten Mittel

Aus der Konvergenz im p-ten Mittel folgt für p1 unmittelbar die Konvergenz in Wahrscheinlichkeit. Dazu wendet man die Markow-Ungleichung auf die Funktion h=Yp an, die für p>0 monoton wachsend ist, und die Zufallsvariable Y=|XnX| an. Dann folgt

P(|XnX|ϵ)1ϵpE(|XnX|p),

was im Grenzwert gegen Null geht. Die Umkehrung gilt im Allgemeinen nicht. Ein Beispiel hierfür ist: sind die Zufallsvariablen definiert durch

P(Xn=enα)=en=1P(Xn=0)

mit α>0. Dann ist

E(|Xn|1)=en(α1)n0,

wenn α<1. Also konvergiert die Folge für α(0,1) im Mittel gegen 0. Für beliebiges ϵ(0,1) ist aber

P(|Xn|ϵ)=P(Xn=enα)=enn0. Also konvergiert die Folge für alle α in Wahrscheinlichkeit gegen 0.

Ein Kriterium, unter dem die Konvergenz im p-ten Mittel aus der Konvergenz in Wahrscheinlichkeit gilt ist, dass eine Majorante Y mit E(|Y|p)< existiert, so dass P(|Xn|Y)=1 für alle n gilt. Konvergieren dann die Xn in Wahrscheinlichkeit gegen X, so konvergieren sie auch im p-ten Mittel gegen X. Allgemeiner lässt sich eine Verbindung zwischen der Konvergenz im p-ten Mittel und der Konvergenz in Wahrscheinlichkeit mittels des Konvergenzsatzes von Vitali und der gleichgradigen Integrierbarkeit im p-ten Mittel ziehen: Eine Folge konvergiert genau dann im p-ten Mittel, wenn sie gleichgradig integrierbar im p-ten Mittel ist und sie in Wahrscheinlichkeit konvergiert.

Fast sichere Konvergenz

Aus der fast sicheren Konvergenz folgt die Konvergenz in Wahrscheinlichkeit. Um dies zu sehen, definiert man die Mengen

BN:={ωΩ:nN |XnX|<ϵ} und B:=N=1BN.

Die BN bilden eine monoton wachsende Mengenfolge, und die Menge B enthält die Menge

A:={ωΩ:limnXn=X}

der Stellen, an denen die Folge konvergiert. Nach Voraussetzung ist P(A)=1 und damit auch P(B)=1 und demnach limNP(BN)=1. Durch Komplementbildung folgt dann die Aussage.

Die Umkehrung gilt aber im Allgemeinen nicht. Ein Beispiel hierfür ist die Folge von unabhängigen Bernoulli-Verteilten Zufallsvariablen zum Parameter 1n, also XnBer1/n. Dann ist

limnP(|Xn|ϵ)=0

für alle ϵ>0 und somit konvergiert die Folge in Wahrscheinlichkeit gegen 0. Die Folge konvergiert aber nicht fast sicher, man zeigt dies mit dem hinreichenden Kriterium für fast sichere Konvergenz und dem Borel-Cantelli-Lemma.

Bedingungen, unter denen aus der Konvergenz in Wahrscheinlichkeit die fast sichere Konvergenz folgt, sind:

i=1P(|XiX|ϵ)<.
  • Der Grundraum Ω lässt sich als abzählbare Vereinigung von μ-Atomen darstellen. Dies ist bei Wahrscheinlichkeitsräumen mit höchstens abzählbarer Grundmenge immer möglich.
  • Ist die Folge der Zufallsvariablen fast sicher streng monoton fallend und konvergiert in Wahrscheinlichkeit gegen 0, so konvergiert die Folge fast sicher gegen 0.

Allgemeiner konvergiert eine Folge in Wahrscheinlichkeit genau dann, wenn jede Teilfolge eine weitere, fast sicher konvergente Teilfolge besitzt. Insbesondere besitzt jede in Wahrscheinlichkeit konvergierende Folge eine fast sicher konvergente Teilfolge (man wähle in „“ als Ausgangsteilfolge die ganze Folge).

Konvergenz in Verteilung

Aus Konvergenz in Wahrscheinlichkeit folgt nach dem Satz von Slutzky die Konvergenz in Verteilung, der Umkehrschluss gilt im Allgemeinen nicht. Ist beispielsweise die Zufallsvariable X Bernoulli-verteilt mit Parameter p=q=12, also

P(X=1)=P(X=0)=12,

und setzt man Xn=1X für alle n, so konvergiert Xn in Verteilung gegen X, da sie dieselbe Verteilung haben. Es gilt aber immer |XnX|=1, die Zufallsvariablen können also nicht in Wahrscheinlichkeit konvergieren. Es existieren jedoch Kriterien, unter denen aus der Konvergenz in Verteilung die Konvergenz in Wahrscheinlichkeit folgt. Sind beispielsweise alle Zufallsvariablen Xn auf demselben Wahrscheinlichkeitsraum definiert und konvergieren in Verteilung gegen die Zufallsvariable X, die fast sicher konstant ist, so konvergieren die Xn auch in Wahrscheinlichkeit gegen X.

Literatur