Hoeffding-Ungleichung

Aus testwiki
Version vom 12. Oktober 2024, 21:16 Uhr von imported>Nukelavee (growthexperiments-addlink-summary-summary:2|0|0)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

In der Wahrscheinlichkeitstheorie beschreibt die Hoeffding-Ungleichung (nach Wassilij Hoeffding) eine obere Schranke für die maximale Wahrscheinlichkeit, dass eine Summe von stochastisch unabhängigen und beschränkten Zufallsvariablen stärker als eine Konstante von ihrem Erwartungswert abweicht.

Die Hoeffding-Ungleichung wird auch die additive Chernoff-Ungleichung genannt und ist ein Spezialfall der Bernstein-Ungleichung.

Satz

Seien X1,X2,,Xn stochastisch unabhängige Zufallsvariablen, so dass fast sicher aiXiE[Xi]bi gilt. Sei ferner c eine positive, reellwertige Konstante. Dann gilt:

Pr[i=1n(XiE[Xi])c]exp(2c2i=1n(biai)2).

Beweis

Dieser Beweis folgt der Darstellung von D. Pollard, siehe auch Lutz Dümbgens Skriptum (siehe Literatur).

Betrachte zur Vereinfachung der Schreibweise die Zufallsvariablen Yi=XiE[Xi] mit E[Yi]=0 und ferner für ein zunächst beliebiges z>0 die auf den reellen Zahlen monoton wachsende Abbildung xexp(zx). Nach der Tschebyschow-Ungleichung gilt dann:

Pr[Yic]E[exp(zYi)]exp(zc)=exp(zc)E[exp(zYi)].

Wegen der Konvexität der Exponentialfunktion ist

exp(zYi)=exp(biYibiaizai+Yiaibiaizbi)biYibiaiexp(zai)+Yiaibiaiexp(zbi),

und mit E[Yi]=0 folgt, dass

E[exp(zYi)]bibiaiexp(zai)+aibiaiexp(zbi)=euiλi((1λi)+λieui)

für die Konstanten λi=aibiai und ui=z(biai). Betrachtet man den Logarithmus der rechten Seite dieses Terms

L(u,λ)=uλ+log((1λ)+λeu),

so kann man mittels Kurvendiskussion und Taylor-Reihenentwicklung zeigen, dass stets L(u,λ)u28 gilt. Setzt man diesen Wert auf Grund der Monotonie der Exponentialfunktion als obere Schranke in die erste Ungleichung wieder ein, so erhält man

Pr[Yic]exp(zc)exp(ui28)=exp(zc+z28(biai)2),

was bei einer Wahl von z=4c(biai)2 zur zu beweisenden Behauptung führt.

Beispiel

Betrachtet wird die Fragestellung: Wie wahrscheinlich ist es, bei hundertmaligem Würfeln eine Augensumme von wenigstens 500 zu erreichen?

  • Diese Frage kann exakt mit Hilfe der Verteilung der Summenvariablen S=i=1100Xi beantwortet werden, wobei X1,,Xn stochastisch unabhängige und identisch verteilte Zufallsvariablen mit der Verteilung Pr(X1=k)=16 für k=1,6 sind. Dabei gilt E[X1]=3,5. Für die Berechnung der gesuchten Wahrscheinlichkeit Pr(S500) ergibt sich ein gewisser Aufwand durch kombinatorische und numerische Probleme, weswegen auch Approximationen oder Abschätzungen mit Hilfe einer Ungleichung von Interesse sein können.
  • Eine approximative Lösung erhält man beispielsweise, indem man die Wahrscheinlichkeitsverteilung der Zufallsvariablen S durch eine Normalverteilung mit demselben Erwartungswert und derselben Varianz approximiert. Die Verteilung der Zufallsvariablen S ist in diesem Fall aufgrund des zentralen Grenzwertsatzes gut durch eine Normalverteilung approximierbar.
  • Häufig genügt für viele Anwendungen bei kleinen Wahrscheinlichkeiten die Angabe einer Oberschranke für die gesuchte Wahrscheinlichkeit. Im Beispiel ergibt sich mit der Hoeffding-Ungleichung:
Pr[S500]=Pr[i=1100Xi350150]=Pr[i=1100(Xi3,5)150]=Pr[i=1100(XiE[Xi])150]
exp(21502i=1100(2,5+2,5)2)=exp(4500010025)=exp(18)1,523108
Somit ist e18 eine Oberschranke für die mit der Frage gesuchte Wahrscheinlichkeit, die erheblich kleiner als die angegebene Oberschranke sein kann.

Literatur

  • Wassily Hoeffding, „Probability Inequalities for Sums of Bounded Random Variables“, Journal of the American Statistical Association, Vol. 58, 1963, pp. 13–30.
  • David Pollard, „Convergence of Stochastic Processes“, Springer Verlag, 1984.
  • Lutz Dümbgen, Empirische Prozesse, Universität Bern, 2010.
  • Otto Kerner, Joseph Maurer, Jutta Steffens, Thomas Thode und Rudolf Voller, Vieweg Mathematik Lexikon, zweite überarbeitete Auflage, Vieweg Verlag, 1993.