Stochastisch unabhängige Zufallsvariablen

Aus testwiki
Zur Navigation springen Zur Suche springen

Die stochastische Unabhängigkeit von Zufallsvariablen ist ein zentrales Konzept der Wahrscheinlichkeitstheorie und der Statistik, das die stochastische Unabhängigkeit von Ereignissen und die Unabhängigkeit von Mengensystemen verallgemeinert. Die stochastische Unabhängigkeit von Zufallsvariablen wird beispielsweise bei der Formulierung des Zentralen Grenzwertsatzes benötigt.

Definition für zwei Zufallsvariablen

Gegeben seien ein Wahrscheinlichkeitsraum (Ω,𝒜,P) sowie zwei Messräume (E1,Σ1) und (E2,Σ2) und zwei Zufallsvariablen

X1:(Ω,𝒜,P)(E1,Σ1)

und

X2:(Ω,𝒜,P)(E2,Σ2).

Die beiden Zufallsvariablen heißen stochastisch unabhängig oder einfacher unabhängig, wenn für jedes B1Σ1 und jedes B2Σ2 gilt, dass

P({ωΩ:X1(ω)B1undX2(ω)B2})=P({ωΩ:X1(ω)B1})P({ωΩ:X2(ω)B2}).

Meist werden die Mengen kompakter notiert, indem man anstelle von {ωΩ:X2(ω)B2} einfach {X2B2} schreibt. Dann lautet die Definition

P({X1B1,X2B2})=P({X1B1})P({X2B2})

für alle B1Σ1,B2Σ2. Außerdem werden – weiter vereinfachend – häufig die Mengenklammern weggelassen, so dass die Notation

P(X1B1,X2B2)=P(X1B1)P(X2B2),

resultiert, die auch im Folgenden verwendet wird.

Eine alternative Definition wird durch die stochastische Unabhängigkeit von Ereignissen ermöglicht. Man definiert dann

AB11={ωΩ:X1(ω)B1}
AB22={ωΩ:X2(ω)B2}.

Die Zufallsvariablen X1,X2 heißen dann stochastisch unabhängig, wenn für alle B1Σ1,B2Σ2 gilt, dass die AB11 und AB22 stochastisch unabhängige Ereignisse sind, also

P(AB11AB22)=P(AB11)P(AB22)

gilt.

Beispiel

Wir betrachten den Wahrscheinlichkeitsraum (Ω,𝒜,P) mit Grundmenge Ω={1,2,3,4}, σ-Algebra 𝒜=𝒫(Ω) und als Wahrscheinlichkeitsmaß die Gleichverteilung auf der Grundmenge. Sei E1=E2={0,1} und Σ1=Σ2=𝒫({0,1}). Die Zufallsvariablen sind definiert als

X1(ω)={1 falls ω{1,2}0 falls ω{3,4}
X2(ω)={1 falls ω{2,3}0 falls ω{1,4}.

Jede der σ-Algebren hat 4 Elemente: ,{0},{1},{0,1}. Demnach wären 16 Kombinationen zu überprüfen. Die Fälle, in denen eine der beteiligten Mengen die Obermenge oder die leere Menge ist, können jedoch ausgeschlossen werden, da jede Menge von diesen beiden unabhängig ist. Demnach bleiben nur 4 Fälle übrig: B1={0} oder B1={1} kombiniert mit B2={0} oder B2={1}

  1. Sei B1=B2={0}. Dann ist AB11={3,4} und AB22={1,4} sowie AB11AB22={4}. Diese Ereignisse sind unabhängig, denn es ist P({4})=14=P({3,4})P({1,4}).
  2. Sei B1=B2={1}. Dann ist AB11={1,2} und AB22={2,3} sowie AB11AB22={2}. Diese Ereignisse sind unabhängig, denn es ist P({2})=14=P({1,2})P({2,3}).
  3. Sei B1={1} und B2={0}. Dann ist AB11={1,2} und AB22={1,4} sowie AB11AB22={1}. Diese Ereignisse sind unabhängig, denn es ist P({1})=14=P({1,2})P({1,4}).
  4. Sei B1={0} und B2={1}. Dann ist AB11={3,4} und AB22={2,3} sowie AB11AB22={3}. Diese Ereignisse sind unabhängig, denn es ist P({3})=14=P({3,4})P({2,3}).

Somit sind alle Ereignisse unabhängig und demnach auch die Zufallsvariablen.

Allgemeine Definition

Die Familie von Zufallsvariablen Xi:(Ω,𝒜,P)(Ei,Σi), iI für eine beliebige Indexmenge I heißt stochastisch unabhängig, falls für jede endliche Teilmenge J von I gilt, dass

P(jJ{XjBj})=jJP(XjBj)

für alle BjΣj gilt.

Mit der Unabhängigkeit für Mengensysteme wird die stochastische Unabhängigkeit von Zufallsvariablen auch wie folgt definiert: Eine Familie von Zufallsvariablen ist genau dann stochastisch unabhängig, wenn ihre Initial-σ-Algebren voneinander unabhängig sind.

Diese Definition kann äquivalent auf Zufallsvektoren, also auf n-wertige Zufallsvariablen, angewandt werden.[1] An die Unabhängigkeit der Komponentenabbildungen sind dabei keine weiteren Forderungen gestellt.

Kriterien für Unabhängigkeit

Erzeugendensysteme

Die Anzahl der auf Unabhängigkeit zu überprüfenden Mengen lässt sich reduzieren, wenn ein Erzeuger bekannt ist. Existiert zu jeder σ-Algebra Σi ein durchschnittsstabiler Erzeuger i, gilt also σ(i)=Σi, so genügt es, die Unabhängigkeit auf den Erzeugern zu überprüfen. Das Kriterium reduziert sich dann zu

P(jJ{XjBj})=jJP(XjBj)

für alle Bjj und alle endlichen Teilmengen J von I. Für diskrete Wahrscheinlichkeitsräume wählt man als Erzeuger meist die Punktmengen {xk}, für reelle Zufallsvariablen die halboffenen Intervalle als Erzeuger der Borelsche σ-Algebra.

Endliche Familien

Ist die Familie von Zufallsvariablen und damit auch die Indexmenge endlich, zum Beispiel mit Indexmenge I={1,,n}, so genügt es

P(iI{XiBi})=iIP(XiBi)

für alle BiΣi zu überprüfen. Auf die Überprüfung der Teilmengen JI kann verzichtet werden. Dies folgt daraus, dass {XiEi}=Ω ist. Der Fall mit JI folgt dann automatisch aus dem obigen Fall, man setzt für iIJ dann Bi=Ei und erhält daraus die Aussage für die kleinere Indexmenge.

Für endliche Familien diskreter Zufallsvariablen

Beide oben genannten Kriterien lassen sich für eine endliche Familie von Zufallsvariablen, die Werte in einem diskreten Messraum annehmen zusammenfassen. Sei I={1,,n} und seien die Xi Zufallsvariablen von (Ω,𝒜,P) nach (Ei,Σi) und sei Ei diskret, also endlich oder abzählbar unendlich. Dann sind die Zufallsvariablen genau dann unabhängig, wenn

P(X1=x1,,Xn=xn)=i=1nP(Xi=xi)

für alle xiEi gilt.

Für endliche Familien reeller Zufallsvariablen

Für endliche Familien reellwertiger Zufallsvariablen ergibt sich folgendes Kriterium: Die Zufallsvariablen (Xi)iI sind genau dann stochastisch unabhängig, wenn

P(X1x1,,Xnxn)=i=1nP(Xixi)

für alle x1,,xn gilt. Sind also FXi(x)=P(Xix) die Verteilungsfunktionen der Xi sowie FI(x1,,xn):=P(X1x1,,Xnxn) die gemeinsame Verteilungsfunktion, dann sind die Xi genau dann stochastisch unabhängig, wenn

FI(x1,,xn)=i=1nFXi(xi)

gilt. Falls die Xi eine gemeinsame Dichtefunktion fI besitzen, so sind sie genau dann stochastisch unabhängig, wenn

fI(x1,,xn)=i=1nfXi(xi)

gilt. Dabei bezeichnet fXi die Randdichte von Xi.

Existenz unabhängiger Zufallsvariablen

Für abzählbar unendliche Familien von Zufallsvariablen stellt sich die Frage, ob überhaupt ein „genügend großer“ Wahrscheinlichkeitsraum existiert, so dass die gesamte Familie auf diesem Wahrscheinlichkeitsraum unabhängig ist. Es ist nicht offensichtlich, dass dies möglich ist, alternativ könnte die Unabhängigkeit eine zu starke Forderung sein, da die Initial-σ-Algebren bei vielen Zufallsvariablen immer zwangsläufig abhängig sind.

Tatsächlich lässt sich die Frage aber mittels des Produktmaßes positiv beantworten. Betrachtet man das unendliche Produktmodell

(i=1Ωi,i=1𝒜i,i=1Pi)

und definiert als Familie von Zufallsvariablen genau die Projektionen auf die i-ten Komponenten (Xi)i=(πi)i, so ist diese Familie per Definition des Produktmodells und des Produktmaßes unabhängig und die Projektionen πi haben genau die Verteilung Pi auf dem Ereignisraum (Ωi,𝒜i). Das Produktmodell ist also groß genug, um eine unabhängige Familie von Zufallsvariablen zu enthalten. Andererseits wird dadurch das Problem der Existenz von unendlich vielen unabhängigen Zufallsvariablen auf die Existenz eines unendlichen Produktmaßes zurückgeführt, was nicht selbstverständlich ist. Diese Existenzfrage wird beispielsweise durch den Satz von Andersen-Jessen für beliebige Indexmengen positiv beantwortet, kann aber auch für abzählbare Indexmengen über den Satz von Ionescu-Tulcea oder für Borel’sche Räume über den Erweiterungssatz von Kolmogorov erfolgen.

Unkorreliertheit und Unabhängigkeit

Zwei Zufallsvariablen X,Y heißen unkorreliert, wenn ihre Kovarianz Cov(X,Y) gleich null ist. Diese Definition der Unkorreliertheit setzt nicht voraus, dass der Korrelationskoeffizient existiert und damit die Varianzen beider Zufallsvariablen positiv sind.

Aus Unabhängigkeit der Zufallsvariablen X,Y folgt ihre Unkorreliertheit, falls die Erwartungswerte E(XY), E(Y) und E(Y) endlich sind. Sind nämlich die Zufallsvariablen unabhängig, so gilt E(XY)=E(X)E(Y) und demnach

Cov(X,Y)=E(XY)E(X)E(Y)=E(X)E(Y)E(X)E(Y)=0.

Dabei folgt die erste Gleichheit aus dem Verschiebungssatz für die Kovarianz und die zweite aus der Unabhängigkeit der Zufallsvariablen und der obigen Folgerung für den Erwartungswert.

Aus der Unkorreliertheit folgt nicht stochastische Unabhängigkeit. Ein Beispiel dafür sind die Zufallsvariable X, die gleichverteilt auf [1,1] ist und Y=X2. Es gilt dann

Cov(X,Y)=E(X3)E(X)E(X2)=00E(X2)=0,

die Zufallsvariablen sind also unkorreliert. Sie sind aber nicht unabhängig, denn es ist zum Beispiel

P({X[0,12],Y[0,19]})=P([0,12][13,13])=16

und

P({X[0,12]})=P([0,12])=14 und P({Y[0,19]})=P([13,13])=13.

Die Abhängigkeit folgt dann aus 141316.

Analyse auf Abhängigkeit

Für die Analyse auf Abhängigkeit zweier Zufallsvariablen kann man auch testen, ob der Korrelationskoeffizient Null ist. Wenn die Hypothese abgelehnt wird, geht man davon aus, dass diese Variablen stochastisch abhängig sind. Der Umkehrschluss ist allerdings nicht zulässig, denn es können Abhängigkeitsstrukturen vorliegen, die der Korrelationskoeffizient nicht erfassen kann. Jedoch sind beispielsweise unkorrelierte, gemeinsam normalverteilte Zufallsvariablen auch stochastisch unabhängig.

Unabhängigkeit von Zufallsvariablen und Mengensystemen

Im Rahmen des bedingten Erwartungswertes wird teilweise auch von der Unabhängigkeit einer Zufallsvariable X und eines Mengensystems gesprochen. Die Zufallsvariable und das Mengensystem heißen unabhängig, wenn das Mengensystem und die Initial-σ-Algebra σ(X) der Zufallsvariable unabhängige Mengensysteme sind.

Verallgemeinerungen

Mittels des bedingten Erwartungswertes lässt sich sowohl die Unabhängigkeit von Mengensystemen als auch die Unabhängigkeit von Zufallsvariablen zur bedingten Unabhängigkeit erweitern.

Literatur

  • A. M. Prochorow: Independence. In: Michiel Hazewinkel (Hrsg.): Encyclopaedia of Mathematics, Kluwer Academic Publishers, 2001, ISBN 978-1-55608-010-4 (online).

Vorlage:Wikibooks

Einzelnachweise