Kolmogorow-Verteilung

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Kolmogorow-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die als Grenzverteilung einer Teststatistik des Kolmogorow-Smirnow-Anpassungstests für einen über alle Grenzen wachsenden Stichprobenumfang auftritt.

Definition

Eine stetige Zufallsvariable X heißt Kolmogorow-verteilt, falls sie die Verteilungsfunktion

P(Xx)=K(x):={12k=1(1)k1e2k2x2für x>00für x0,x

hat.[1][2] Die zugehörige Wahrscheinlichkeitsverteilung heißt Kolmogorow-Verteilung.

Eigenschaften

Datei:KolmogorovDistribution.png
Kolmogorow-Verteilungsfunktion (rot) und x12e2x2 (blau)

Eine alternative Summendarstellung der Verteilungsfunktion[3][4] ist

K(x)=1x2πk=1exp((2k1)2π28x2),x>0.

Diese alternative Darstellung ist für numerische Berechnungen in bestimmten Fällen günstiger.[3]

Für eine Kolmogorow-verteilte Zufallsvariable X gilt

P(X>0)=1.

Die Zufallsvariable X hat den Erwartungswert

𝔼[X]=π2ln(2)

und die Varianz

Var[X]=π212π2ln2(2).[3]

Anwendung

Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die (1α)-Quantile der Kolmogorow-Verteilung für α=0.20,0.10,0.05,0.02,0.01 sind näherungsweise 1.073,1.224,1.358,1.517,1.628.[5]

Eine Approximation der Verteilungsfunktion ergibt sich, wenn nur der erste Summand für k=1 verwendet wird,

K(x)K(1)(x)=12e2x2,x>0.

Das (1α)-Quantil k1α der Kolmogorow-Verteilung ergibt sich dann näherungsweise als Lösung der Gleichung α=2e2x2. Dies führt zur Näherungsformel

k1α12ln(α2),

die zu Werten führt, die bis zur dritten Nachkommastelle mit den oben angegebenen Tabellenwerten übereinstimmen. Manchmal wird diese Formel angegeben, ohne klarzustellen, dass es sich um eine doppelte Approximation handelt.[6] Die asymptotische Verteilung wird für endlichen Stichprobenumfang verwendet und dabei wird nur die Approximation K1(x) der Kolomogorow-Verteilung verwendet. Wie der Vergleich der Funktionen K und K(1) in der Abbildung zeigt, ist die Approximation K(1) zur Quantilbestimmung nur für hinreichend kleine Werte von α, z. B. für α<1/2, anwendbar. Insbesondere ist die Approximation K(1) keine Verteilungsfunktion.

Theoretischer Hintergrund

Die reellwertigen Zufallsvariablen X1,,Xn seien stochastisch unabhängig und identisch verteilt mit der stetigen Verteilungsfunktion F.

Kn=nsupx|F~n(x)F(x)|,
wobei
F~n(x):=1ni=1n𝟏(,x](Xi),x
die zufällige empirische Verteilungsfunktion bezeichnet, nicht von F ab. Kn ist also bezüglich der Klasse aller stetigen Verteilungsfunktionen eine verteilungsfreie Statistik.
  • Außerdem konvergiert die Folge (Kn)n in Verteilung gegen die Kolmogorow-Verteilung, es gilt daher
limnP(Knx)=K(x),für alle x.

Kn ist die Teststatistik des Kolmogorov-Smirnov-Anpassungstest für den Stichprobenumfang n. Sie heißt auch Kolmogorow-Smirnow-Statistik. Es gibt Tabellen für Quantile der Verteilung von Kn.[7]

Für große Stichprobenumfänge können die Quantile der Kolmogorow-Verteilung verwendet werden.[5] Es gibt eine Tabelle für Werte der Verteilungsfunktion der Kolomogorov-Verteilung.[8]

Literatur

Vorlage:Literatur

Einzelnachweise und Anmerkungen

  1. Die leicht abweichende Darstellung
    K(x)=j=(1)je2j2x2,x>0
    findet sich im Vorlage:Literatur In dieser Form wurde die Verteilungsfunktion auch durch Kolmogorow in der Originalarbeit angegeben: Vorlage:Literatur Diese ist äquivalent zur oben angegebenen Form.
  2. Eine - vermutlich fehlerhafte – Darstellung der Verteilungsfunktion K(x) mit ek2x2 anstelle von e2k2x2 findet sich in den beiden folgenden Quellen: Andererseits findet sich die in der Definition angegebene Form der Verteilungsfunktion mit dem Faktor 2 im Exponenten auch in diesen Quellen:
  3. 3,0 3,1 3,2 Vorlage:Literatur
  4. Vorlage:Literatur
  5. 5,0 5,1 Z. B. Vorlage:Literatur
  6. Vorlage:Literatur
  7. Z. B. Vorlage:Literatur
  8. Vorlage:Literatur Diese Tabelle wurde zuerst abgedruckt in Vorlage:Literatur Die Tabelle ist wiederabgedruckt auf S. 143 in Vorlage:Literatur

Vorlage:Navigationsleiste Wahrscheinlichkeitsverteilungen