Robbins-Monro-Prozess

Aus testwiki
Zur Navigation springen Zur Suche springen

Der Robbins-Monro-Prozess ist ein stochastischer Prozess, mit dessen Hilfe die Nullstelle einer unbekannten Regressionsfunktion stochastisch approximiert werden kann. Er wurde 1951 von Herbert Robbins und Sutton Monro vorgestellt.

Definition

Sei Yx: eine Familie von Zufallsvariablen und M: eine messbare Funktion, sodass gilt: M(x)=𝔼(Yx). Sei zudem eine eindeutige Lösung θ gegeben, sodass M(θ)=0 . Dann heißt die Folge (Xn)n von Zufallsvariablen gegeben durch

Xn+1=Xnan(YXn)

Robbins-Monro-Prozess, wobei X1 eine beliebige reelle Konstante und (an)n eine Folge reeller Konstanten mit an>0 sei.

Konvergenz von Xn gegen θ

Unter den folgenden vier Bedingungen konvergiert Xn in L2 gegen θ[1]:

  • C>0x (P[|Yx|C]=1),
  • M(x) ist monoton wachsend,
  • M(θ)>0 existiert,
  • an genügt folgenden Bedingungen:
n=0an=undn=0an2<

Einfaches Beispiel

Seien Yxn um 1/2 verschobene Sinusfunktionen zwischen π/3 und π/3 mit zufälligen Schwankungen εn, die an den Rändern linear fortgesetzt werden.

Yxn={  xn+sin(π/3)π/312+εnfür xn>π/3  sin(xn)12+εnfür π/3xnπ/3  xnsin(π/3)+π/312+εnfür xn<π/3

Wobei εn unabhängige, gleichverteilte Zufallsvariablen in (14,14) sind. Sei außerdem an=1n+1 und X1=12. Dann konvergiert Xn+1=Xnan(YXn) gegen π/6.

Einzelnachweise

  1. Herbert Robbins, Sutton Monro: A Stochastic Approximation Method. In: The Annals of Mathematical Statistics. 22, Nr. 3, 1951, S. 405 Theorem 2.

Literatur

  • Herbert Robbins, Sutton Monro: A Stochastic Approximation Method. In: The Annals of Mathematical Statistics. 22, Nr. 3, 1951, S. 400–407(PDF-Datei; 514KB).
  • Marie Duflo: Random Iterative Models, Springer Verlag, 1997.