Bernstein-Ungleichung (Stochastik)

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Bernstein-Ungleichung ist eine Abschätzung aus der Wahrscheinlichkeitstheorie und wurde von Sergei Bernstein (1880–1968) bewiesen. Sie ist eine Erweiterung der Hoeffding-Ungleichung, deren Abschätzung durch eine zusätzliche Voraussetzung an die Varianz der Zufallsvariablen verbessert werden kann.

Die Ungleichung gilt für beliebig verteilte beschränkte Zufallsvariablen mit verschwindendem Erwartungswert und beschränkter Varianz.

Satz

Sei (Ω,𝒜,𝒫) ein Wahrscheinlichkeitsraum. Seien B,𝒯 und σ positive reelle Zahlen und n eine natürliche Zahl. X1,,Xn:Ω seien unabhängig verteilte Zufallsvariablen mit EXi=0,XiB und E(Xi2)σ2 für alle i=1,,n.

Dann gilt:

P[1ni=1nXi2σ2𝒯n+2B𝒯3n]e𝒯

Lemma

Für alle x>1 gilt:

x(1+x)ln(1+x)3x22(x+3)

Ein Beweis des Lemmas und ein ausführlicherer Beweis des Satzes befinden sich im Beweisarchiv.

Beweis (Satz)

Dieser Beweis folgt dem Ansatz aus "Support Vector Machines" (siehe Literatur).

Zur Vereinfachung definiere man ϵ=18𝒯nσ2+𝒯2B2+𝒯B3n

Nach 𝒯 umgestellt, ergibt sich: 𝒯=3nϵ22ϵB+6σ2

Nun wird die Ungleichung gezeigt. Man wende die Markow-Ungleichung an mit X=1ni=1nXi und f(ϵ)=etϵn für ein t>0 (t wird später noch speziell gewählt):

P[1ni=1nXi2σ2𝒯n+2B𝒯3n]P[1ni=1nXiϵ]etϵnE(i=1nexp(tXi))

Da die Zufallsvariablen nach Voraussetzung unabhängig sind, können Produkt und Erwartungswert vertauscht werden. Aus der Exponentialfunktion bilde man eine unendliche Exponentialreihe. Diese ist durch die integrierbare Majorante etB beschränkt. Also können Erwartungswert und Summe vertauscht werden. Mit Xi0=1 und der Voraussetzung EXi=0 folgt:

etϵnE(i=1nexp(tXi))=etϵni=1nE(k=0tkk!Xik)=etϵni=1n(k=0tkk!EXik)=etϵni=1n(1+k=2tkk!EXik)

Mit der Abschätzung EXikEXi2Bk2σ2Bk2 folgt:

etϵni=1n(1+k=2tkk!EXik)etϵni=1n(1+k=2tkk!σ2Bk2)=etϵn(1+σ2B2k=2(tB)kk!)n

Durch die Ungleichung (1+x)nexp(nx) für x0 erhält man mit x=σ2B2(etBtB1):

etϵn(1+σ2B2k=2(tB)kk!)n=etϵn(1+σ2B2(etBtB1))netϵnexp(nσ2B2(etBtB1))

Man setze t=1Bln(1+ϵBσ):

etϵnexp(nσ2B2(etBtB1))=exp[nσ2B2(ϵBσ2ln(1+ϵBσ2)+ϵBσ2ln(1+ϵBσ2))]

Aus dem Lemma (oben) folgt mit x=ϵBσ2.

exp[nσ2B2(ϵBσ2ln(1+ϵBσ2)+ϵBσ2ln(1+ϵBσ2))]exp[3nϵ22ϵB+6σ2]=e𝒯
P[1ni=1nXi2σ2𝒯n+2B𝒯3n]e𝒯

Anwendung

Problem 1

Angenommen n,B und σ sind bekannt.

Wie groß ist die Wahrscheinlichkeit höchstens, dass der Mittelwert einen gegebenen Wert k übersteigt?

Löse k=2σ2𝒯n+2B𝒯3n nach 𝒯 auf.

Die Wahrscheinlichkeit, dass der Mittelwert den Wert k übersteigt, ist höchstens e𝒯.

Problem 2

Weiterhin seien B und σ bekannt.

Es soll gelten: P[1ni=1nXik]0,1

Berechne k mit Hilfe der Bernstein-Ungleichung.

e𝒯=0,1

𝒯=ln10

k=2σ2ln10n+2Bln103n

Problem 3

Seien B und σ bekannt.

Wie viele Realisierungen werden mindestens benötigt, sodass für gegebene Werte k und 𝒯 gilt, dass

P[1ni=1nXik]e𝒯 ?

Man benötigt mindestens n*=min{n|k2σ2𝒯n+2B𝒯3n} Realisierungen.

Beispiel

Als Zufallsvariable betrachte man eine Münze. Den i-ten Münzwurf bezeichnen wir mit Xi. Dabei gelte bei Kopf Xi=1 und bei Zahl Xi=1.

Wie groß ist die Wahrscheinlichkeit, dass der Mittelwert nach n Würfen den Wert 1675 übersteigt?

Da die Wahrscheinlichkeit für Kopf und Zahl jeweils 50 % sind, ist der Erwartungswert 0. Da die Zufallsvariablen nur die Werte −1 und 1 annehmen können, kann B=1 gewählt werden.

Xi2=1EXi2=1. Also kann σ=1 gewählt werden.

Nun wähle noch 𝒯=n50. Dabei ist n die Anzahl der Münzwürfe. Nach der Bernstein-Ungleichung gilt dann:

P[1ni=1nXi1675]en50

Also gilt zum Beispiel bei 50 Würfen:

P[150i=150Xi1675]1e

Damit der Mittelwert 1675 übersteigt, müsste man bei 50 Würfen 31-mal Kopf werfen.

311+19(1)50=1250=18751675

Das heißt, die Wahrscheinlichkeit, in 50 Würfen 31 Kopf zu erhalten, ist kleiner als 1e0,367879441

Siehe auch

Literatur

  • Ingo Steinwart, Andreas Christmann: Support Vector Machines. Information Science and Statistics. 1. Auflage. Springer, Berlin 2008

Vorlage:Wikibooks