Satz von Cramér (Große Abweichungen)

Aus testwiki
Zur Navigation springen Zur Suche springen

Der Satz von Cramér ist eine Aussage des mathematischen Teilgebiets der Stochastik. Die Arbeit Sur un nouveau théorème-limite de la théorie des probabilités, in der Harald Cramér 1938 seinen Satz veröffentlichte, gilt als die Begründung der Theorie der großen Abweichungen (engl. large deviations theory).[1][2] Der Satz von Cramér quantifiziert, wie schnell die Wahrscheinlichkeit bestimmter seltener Ereignisse gegen 0 konvergiert. Die Chernoff-Ungleichung überträgt diese asymptotische Aussage auf den endlichen Fall, in Abgrenzung zu anderen nach Cramér benannten Resultaten spricht man daher auch vom Satz von Cramér-Chernoff.[3]

Einleitendes Beispiel

Sei X1,X2,X3,... eine Folge von unabhängigen Messungen einer physikalischen Größe, dann ist das arithmetische Mittel 1ni=1nXi ein erwartungstreuer Schätzer für den Erwartungswert. Ist beispielsweise die gesuchte Größe im Einheitsintervall gleichverteilt, so konvergiert nach dem starken Gesetz der großen Zahlen der Mittelwert der Messungen fast sicher gegen E[X1]=E[X2]==1/2. Dies trifft allerdings noch keine Aussage über die Geschwindigkeit der Konvergenz. Das typische Verhalten der Summe i=1nXin/2 wird durch den Grenzwert bestimmt, es ist aber nicht ausgeschlossen, dass sie für ein beliebig großes n immer noch stark abweicht, also bspw. i=1nXi2n/3 gilt. Der Satz von Cramér gibt nun ein allgemeines Verfahren an, wie aus der zugrundeliegenden Verteilung der Größe die Qualität des Schätzers bestimmt werden kann.

Aussage

Sei (Xi)i1 eine Folge von unabhängig und identisch verteilten (i.i.d.) reellen Zufallsvariablen, wobei die kumulantenerzeugende Funktion gX1(t)=ln(E[etX1]) von X1 für jedes t endlich sei. Für reelles x sei weiter

Λ*(x)=supt(txgX1(t))

die Legendre-Transformation von gX1. Der Satz von Cramér besagt nun, dass für alle x>E[X1] gilt

limn1nln(P[i=1nXixn])=Λ*(x).

Bemerkungen

  • Dass der Limes auf der linken Seite der Gleichung existiert, ist nicht offensichtlich, sondern Teil der Aussage.
  • Die konkrete Wahl der Basis e ist nicht essentiell für den Satz. Die kumulantenerzeugende Funktion kann durch g(t)=loga(E[atX1]) für ein beliebiges a>0 ersetzt werden, entsprechend betrachtet man dann den Grenzwert des Logarithmus zur Basis a.
  • Der Satz von Cramér lässt sich aus dem allgemeinen Fall des Satzes von Sanov herleiten oder alternativ elementar über die exponentielle Tschebyscheff-Ungleichung beweisen.[4]
  • Bis auf sublineare additive Terme im Exponenten (d. h. subexponentielle Faktoren) gilt asymptotisch P[i=1nXixn]enΛ*(x). Die (allgemeine) Chernoff-Ungleichung besagt, dass sogar für jedes endliche n gilt P[i=1nXixn]enΛ*(x).[5]

Satz von Chernoff-Hoeffding

Ein wichtiger Spezialfall des Satzes von Cramér ergibt sich, wenn die Variablen Xi Bernoulli-verteilt sind mit Erwartungswert E[X1]=p. Für eine Wahrscheinlichkeit 0x1 sei

D(xp)=xln(xp)+(1x)ln(1x1p)

die Kullback-Leibler-Divergenz zwischen Bernoulli-Verteilungen mit Parametern x und p (in der Einheit Nat). Die kumulantenerzeugende Funktion einer Bernoulli-Variable ist gX1(t)=ln(pet+1p). Daher lässt sich leicht nachweisen, dass die Cramér-Funktion Λ*(x)=D(xp) hier gerade die Divergenz ist. Die Summe X=i=1nXi ist binomialverteilt mit Erwartungswert E[X]=pn. Mit Hilfe der Chernoff-Ungleichung ergibt sich nun für 0ε1p

P[XE[X]+εn]enD(p+εp)=(pp+ε)(p+ε)n(1p1pε)(1pε)n.

Dies ist der Satz von Chernoff-Hoeffding und wird anschaulich auch als additive Chernoff-Ungleichung bezeichnet.[6][7]

Siehe auch

Literatur

Einzelnachweise