M-Schätzer

Aus testwiki
Zur Navigation springen Zur Suche springen

M-Schätzer, auch maximum-likelihood-artige Schätzer stellen eine Klasse von Schätzfunktionen dar, die als Verallgemeinerung der Maximum-Likelihood-Methode angesehen werden können. M-Schätzer sind im Vergleich zu anderen Schätzern wie z. B. den Maximum-Likelihood-Schätzern robuster gegen Ausreißer.

Dieser Artikel behandelt M-Schätzer zur Ermittlung des Lageparameters.

Herleitung durch Verallgemeinerung der Maximum-Likelihood-Methode

Das Prinzip von Maximum-Likelihood-Schätzern beruht darauf, die Funktion

i=1nlnfXi(xi;Θ)

mit entsprechender Dichte- bzw. Wahrscheinlichkeitsfunktion fX(x) in Abhängigkeit von Θ zu minimieren.

Die Idee bei M-Schätzern ist, die Funktion lnfXi(xi;Θ) durch eine Funktion ρ(x;Θ) zu ersetzen, welche weniger empfindlich auf Ausreißer reagiert. Aufgabe ist es, den Ausdruck

i=1nρ(xi;Θ)

in Abhängigkeit von Θ zu minimieren, bzw. die Gleichung

ψ(xi;Θ)=0

mit

ψ(xi;Θ)=ρΘ(xi;Θ)

zu lösen.

Jede Lösung dieser Gleichung wird M-Schätzer genannt.

Implizite Definition

Sei F eine beliebige Verteilungsfunktion und ψ eine ungerade und monoton wachsende Funktion ungleich 0. Dann ist μψ(F) definiert als die Lösung μ=μψ(F) der Gleichung

E(ψ(xμ))=ψ(xμ)dF(x)=0

Beachtet werden muss, dass abhängig von der Wahl von ψ und F es entweder keine, eine oder mehrere Lösungen geben kann. Im Falle einer konkreten Stichprobe wird μ=μψ(Fn), die Lösung von

1ni=1nψ(xiμ)=ψ(xμ)dFn(x)=0

M-Schätzer genannt.

Geeignete Funktionen ρ

Im Folgenden sind die xi gemäß

zi=xiΘSn

standardisiert, um Skaleninvarianz zu erreichen. Sn stellt hierbei einen Streuungschätzer dar, für den meist der MAD (Median Absolute Deviation) verwendet wird.

Methode ρ(z) ψ(z) w(z)
Kleinste-Quadrate-Methode ρLS(z)=z22 ψLS(z)=z wLS(z)=1
Huber-k-Schätzer ρH(z)={z22|z|kk|z|12k2|z|>k ψH(z)={z|z|kksgn(z)|z|>k wH(z)={1|z|kk|z||z|>k
Hampel-Schätzer ρHa(z)={z22|z|aa|z|a22a<|z|baba22+(cb)a2(1(c|z|cb)2)b<|z|caba22+(cb)a2|z|>c ψHa(z)={z|z|aasgn(z)a<|z|bac|z|cbsgn(z)b<|z|c0|z|>c wHa(z)={1|z|aa1|z|a<|z|bac|z|cb1|z|b<|z|c0|z|>c
Andrews wave ρAw(z)={a2π2(1cos(πza))|z|a2a2π2|z|>a ψAw(z)={aπsin(πza)|z|a0|z|>a wAw(z)={aπzsin(πza)|z|a0|z|>a
Tukey's biweight ρTb(z)={a26(1(1z2a2)3)|z|aa26|z|>a ψTb(z)={z(1z2a2)2|z|a0|z|>a wTb(z)={(1z2a2)2|z|a0|z|>a

Die Gewichtsfunktionen im folgenden Bild zeigen die Unterschiede zwischen den Schätzern auf: bei Huber-k haben auch extreme Beobachtungen ein geringes Gewicht, beim Hampel-, Andrews wave- und Tukey's biweight-Schätzer wird extremen Beobachtungen das Gewicht Null zugeordnet.

Datei:Mest weightfunc.jpg
Gewichtsfunktionen w(z) für verschiedene M-Schätzer. Die Parameterwerte entsprechen den Standardwerten von SPSS.

Robustheit

Bei geeigneter Wahl von ψ (ungerade, beschränkt und monoton steigend) haben M-Schätzer einen Bruchpunkt von ϵ*=0,5.[1]

Numerische Lösungsmethode

Für viele Funktionen ρ lässt sich keine explizite Lösung angeben, sie muss daher numerisch berechnet werden. Wie üblich zur Berechnung von Nullstellenproblemen bietet sich auch hier das Newton-Raphson-Verfahren an, und es ergibt sich folgende Iterationsvorschrift, wobei wiederum zi=xiμSn :

μk+1=μk+Sni=1nψ(zi)i=1nψ(zi)

Als geeigneter Startwert μ0 wird meist der Median verwendet. Dieses Iterationsverfahren konvergiert sehr schnell, meist sind zwei bis drei Iterationsschritte ausreichend.

W-Schätzer

W-Schätzer sind M-Schätzern sehr ähnlich und liefern im Normalfall gleiche Ergebnisse. Der einzige Unterschied liegt in der Lösung des Minimierungsproblems. W-Schätzer werden meist bei der robusten Regression eingesetzt.

Es wird die Wichtungsfunktion

w(z)=ψ(z)z

mit

ψ(xi;Θ)=ρΘ(xi;Θ)

eingeführt, mit deren Hilfe das Minimierungsproblem umgeschrieben werden kann in

i=1nziw(zi)=0

Einsetzen der Definition von zi, ausmultiplizieren und umstellen ergibt schließlich über die Fixpunktgleichung

Θ=i=1nxiw(xiΘSn)i=1nw(xiΘSn)

die Iterationsvorschrift

Θt+1=i=1nxiw(xiΘtSn)i=1nw(xiΘtSn)

Siehe auch

Literatur

  • Vorlage:Literatur
  • Robert G. Staudte: Robust estimation and testing. Wiley, New York 1990. ISBN 0-471-85547-2
  • Rand R. Wilcox: Introduction to robust estimation and hypothesis testing. Academic Press, San Diego Cal 1997. ISBN 0-12-751545-3

Einzelnachweise