Mittlere absolute Abweichung vom Median

Aus testwiki
Zur Navigation springen Zur Suche springen

Vorlage:Redundanztext Die mittlere absolute Abweichung vom Median ist ein robustes Streuungsmaß in der deskriptiven Statistik und gibt an, wie weit eine Stichprobe „im Mittel“ vom Median abweicht. Je nach Definition wird entweder das arithmetische Mittel oder der Median der absoluten Abweichungen berechnet.

Definition

Gegeben sei eine Stichprobe x1,x2,,xnmit Median x~.

Die mittlere absolute Abweichung vom Median ist entweder definiert als arithmetisches Mittel der absoluten Abweichungen (englisch mean absolute deviation, kurz MAD):[1][2]

d~0,5=1ni=1n|xix~|,

oder als Median der absoluten Abweichungen (auch: Median-Abweichung, englisch median absolute deviation, kurz MAD oder auch MedAD):[3]

d~med=median(|xix~|).

Beispiel

Gegeben sei die Stichprobe 10,9,13,15,16. Als sortierte Stichprobe erhält man xsort=(9,10,13,15,16).

Der Median beträgt somit x~=13.

Daraus folgt

d~0,5=15(|1013|+|913|+|1313|+|1513|+|1613|)=15(|3|+|4|+0+|2|+|3|)=15(3+4+2+3)=2,4.
d~med=median(|1013|,|913|,|1313|,|1513|,|1613|)=median(3,4,0,2,3)=median(0,2,3,3,4)=3.

Insbesondere unterscheiden sich die beiden Werte für die mittlere absolute Abweichung vom Median beinahe immer von der mittleren absoluten Abweichung vom arithmetischen Mittel. Diese liefert bei derselben Stichprobe den Wert

dx=2,48.

Eigenschaften

Betrachtet man die mittlere absolute Abweichung von einem beliebigen Wert m, also

A(m)=1ni=1n|xim|,

so ist A(m) minimal, wenn m der Median ist.[4] Ein analoges Resultat gilt auch für die mittlere quadratische Abweichung von einem Wert m: sie wird genau dann minimal, wenn m das arithmetische Mittel ist. In diesem Sinne ist die mittlere absolute Abweichung ein natürliches Streumaß um den Median, ebenso wie die mittlere quadratische Abweichung ein natürliches Streumaß um das arithmetische Mittel ist.

Die mittlere absolute Abweichung ist ein robustes Streuungsmaß, es ist also deutlich unempfindlicher gegenüber Ausreißern als etwa die Standardabweichung. Dies liegt an der Verwendung des robusten Medians. Besonders relevant ist dies, wenn eine Regel für das Entfernen von Ausreißern aus einem Datensatz gefunden werden soll: Das übliche Verfahren, alle Werte, die mehr als drei Standardabweichungen vom arithmetischen Mittel entfernt sind, zu streichen, ist insofern problematisch, als dass Standardabweichung und Mittel selbst durch Ausreißer verzerrt sein könnten. Ein deutlich unempfindlicheres Verfahren wäre, alle Werte zu streichen, die mehr als das k-fache des MedAD vom Median abweichen, wobei k ein von der Wahrscheinlichkeitsverteilung abhängiger Faktor ist.[5]

Siehe auch

Einzelnachweise