Rang (Statistik)

Aus testwiki
Version vom 2. April 2023, 13:12 Uhr von imported>Anthroporraistes (Bindungen: Zwei weitere Möglichkeiten zum Umgang mit Bindungen ergänzt (Ich weiß leider nicht, wie ich das in Bezug auf das Format konsistent einpflege, gerne korrigieren), sowie die Verteilung der Ränge.)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

In einer Reihe von statistischen Beobachtungen ergibt sich der Rang einer einzelnen Beobachtung als ihre Position, wenn alle Beobachtungswerte der Größe nach geordnet und durchnummeriert werden.

Es ist möglich, dass mindestens zwei Beobachtungen den gleichen Wert haben. Man spricht dann von Bindungen oder Verbundwerten (engl. Ties). Der Rang ist daher nicht wohldefiniert.

In der Stochastik ist der Rang aber fast sicher eindeutig erklärt, falls die einzelnen Beobachtungen unabhängig und stetig verteilt sind. Auf der Auswertung der Ränge innerhalb von Stichproben basiert eine Reihe von statistischen Tests in der nichtparametrischen Statistik. Die nach ihrem Rang geordneten Beobachtungswerte heißen Ordnungsstatistiken.

Definition

Die Beobachtungswerte werden der Größe nach sortiert. Im Fall, dass kein Wert mehrfach auftritt, bekommt der kleinste Wert meistens den Rang 1, der nächstgrößere (also zweitkleinste) den Rang 2 usw.[1][2] Mögliche Vorgehensweisen bei mehrfach auftretenden Werten (sogenannten Bindungen) sind unten aufgeführt.

Die übliche Schreibweise ist x(i) für den Beobachtungswert mit dem Rang i.

Beispiel

Folgende Beobachtungen wurden für die monatlichen Aufwendungen für Freizeitgüter und Urlaub in Zweipersonenhaushalten gemacht:

Beobachtungsnummer 1 2 3 4
Beobachtungswert 220 240 220 180
Rang 2 oder 3 4 2 oder 3 1

Also: x(4)=240=x2, d. h. x(4) ist der Beobachtungswert mit dem Rang 4 und x2 der zweite Beobachtungswert in der Datenreihe.

Die Beobachtungen können zu einer Rangliste geordnet werden:

Listenrang Beobachtungsnummer Beobachtungswert
1. 4 180
2.–3. 1 220
" 3 "
4. 2 240

Bindungen

In der Praxis kann es vorkommen, dass Beobachtungswerte mehrfach auftreten. Man spricht davon, dass Bindungen in den Beobachtungswerten auftreten. Da Beobachtungen mit gleichen Werten nicht unterschiedliche Ränge haben sollten, müssen diese behandelt werden. Da in der Statistik oft Rangsummen betrachtet werden, ist eine oft gestellte Anforderung an Verfahren, die Bindungen behandeln, dass die Summe der Ränge von n Beobachtungen gerade 1+2+3++n=n(n+1)2 ist.

Verschiedene Verfahren können benutzt werden, um eine eindeutige Rangzuordnung zu finden:[3]

Mittelwert
Den ranggleichen Beobachtungen wird das arithmetische Mittel der auf sie fallenden Ränge zugeordnet.[1][2]
Beispiel: Folgende Beobachtungen wurden für die monatlichen Aufwendungen für Freizeitgüter und Urlaub in Zweipersonenhaushalten gemacht:
Beobachtungsnummer 1 2 3 4 5 6 7 8 9 10
Beobachtungswert 125 315 215 105 200 170 170 220 220 220
Rang 2 10 6 1 5 3,5 3,5 8 8 8
  • Den Beobachtungswerten 170 müssten die Ränge 3 und 4 zugeordnet werden. Das arithmetische Mittel ergibt sich zu 3+42=3,5.
  • Den Beobachtungswerten 220 müssten die Ränge 7, 8 und 9 zugeordnet werden. Das arithmetische Mittel ergibt sich zu 7+8+93=8.
Randomisierung
Den ranggleichen Beobachtungswerten wird zufällig einer der Ränge derselben zugeordnet.
A-fortiori-Methode
Im Falle der Durchführung eines Tests wird die Rangfolge so festgelegt, dass die Nullhypothese H0 begünstigt wird.

Alle möglichen Rangzuordnungen untersuchen

Berechne die Teststatistik für alle möglichen Rangzuordnungen, d. h. führe den Test für alle möglichen Zuordnungen durch. Wird H0 unabhängig von den Zuordnungen immer angenommen oder verworfen, dann endet die Methode hier.[4]

Eliminierung

Entferne solange Beobachtungen aus der Stichprobe, bis alle Bindungen verschwinden. Insofern der Stichprobenumfang groß genug ist, ist der Informationsverlust unerheblich, ansonsten ist von dieser Methode abzuraten, da sie bei vielen Tests die Teststärke verringert.[5]

Verteilung der Ränge

Der Rang R(Xi) einer Zufallsvariablen Xi ist eine diskret gleichverteilte Zufallsvariable auf {1,...,n}.

Eigenschaften

Die Summe der Ränge einer Datenreihe ist

1+2+3++n=n(n+1)2

(Gaußsche Summenformel). Auch bei Bildung des arithmetischen Mittels zur Berechnung der Ränge bei Bindungen bleibt diese Eigenschaft erhalten.

Einzelnachweise

Siehe auch

Vorlage:Normdaten