Neyman-Kriterium

Aus testwiki
Zur Navigation springen Zur Suche springen

Das Neyman-Kriterium ist in der mathematischen Statistik ein Kriterium für die Suffizienz von σ-Algebren und Suffizienz von Statistiken bei statistischen Modellen mit dominierten Verteilungsklassen. Das Neyman-Kriterium leitet sich aus dem Satz von Halmos-Savage ab, ist aber leichter anzuwenden als dieser. Somit ist das Neyman-Kriterium eines der gängigsten Kriterien, um zu überprüfen, ob eine Abbildung Daten ohne Informationsverlust komprimiert.

Es ist nach Jerzy Neyman benannt.

Aussage

Für σ-Algebren

Gegeben sei ein statistisches Modell (Ω,𝒜,𝒫) mit dominierter Verteilungsklasse 𝒫, die von ν dominiert wird, sowie eine Unter-σ-Algebra 𝒮 von 𝒜.

Dann ist 𝒮 suffizient genau dann, wenn eine 𝒜([0,))-messbare Funktion h existiert und für jedes P𝒫 eine 𝒮([0,))-messbare Funktion fP existiert, so dass

dPdν(x)=h(x)fP(x)

gilt bis auf eine ν-Nullmenge. Dabei ist dPdν(x) die Radon-Nikodým-Ableitung von P bezüglich ν.

Für Statistiken

Unter denselben Voraussetzungen wie oben ist eine Statistik

T:(Ω,𝒜)(Ω*,𝒜*)

suffizient genau dann, wenn eine 𝒜([0,))-messbare Funktion h existiert und für jedes P𝒫 eine 𝒜*([0,))-messbare Funktion fP existiert, so dass

dPdν(x)=h(x)fP(T(x))

gilt bis auf eine ν-Nullmenge. Dies folgt aus dem Faktorisierungslemma und der Tatsache, dass T eine suffiziente Statistik ist genau dann, wenn σ(T) eine suffiziente σ-Algebra ist.

Beispiel: Suffizienz der Exponentialfamilie

Per Definition hat für die Exponentialfamilie 𝒫 bezüglich μ jedes P𝒫 die Dichtefunktion

fϑ(x)=dPdμ(x)=C(ϑ)h(x)exp(Q(ϑ);T(x))

Dies ist aber bereits genau die oben geforderte Zerlegung. h und T sind bereits korrekt, man setzt dann nur noch

fP(y)=f~ϑ(y)=C(ϑ)exp(Q(ϑ);y)

um zu zeigen, dass T eine suffiziente Statistik für die Exponentialfamilie ist.

Literatur