Mehrdimensionale Tschebyscheffsche Ungleichung

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Mehrdimensionale Tschebyscheffsche Ungleichung ist eine Ungleichung aus dem Bereich der Stochastik. Sie ist eine Verallgemeinerung der Tschebyscheff-Ungleichung und nach dem Mathematiker Pafnuti Lwowitsch Tschebyschow benannt.

Eindimensionale Tschebyscheffsche Ungleichung

Vorlage:Hauptartikel

Die (eindimensionale) Tschebyscheffsche Ungleichung besagt, dass für eine reelle Zufallsvariable X mit dem Erwartungswert μ und der Varianz σ2 die Wahrscheinlichkeit, dass X einen Wert außerhalb des Intervalls (μkσ,μ+kσ) annimmt, höchstens gleich 1/k2 ist, d. h.

1P(μkσXμ+kσ)1k2für alle k>0.

Z. B. ergibt sich für k=2

1P(μ2σXμ+2σ)14,

d. h. außerhalb des 2σ-Intervalls um dem Erwartungswert μ liegt höchstens die Wahrscheinlichkeit 1/4. Bei einer Zufallsstichprobe sind höchstens 25 % der Werte von X außerhalb des Intervalls zu erwarten.

Mehrdimensionale Verallgemeinerung

𝐗 sei ein d-dimensionaler Zufallsvektor mit Erwartungswertvektor μ und invertierbarer Kovarianzmatrix Σ. Dann hat die reelle Zufallsvariable Y=(𝐗μ)TΣ1(𝐗μ) den Erwartungswert d[1] und mit der Markow-Ungleichung folgt

1P(Y<k2)=P(Yk2)dk2für alle k>0.

Damit gilt für den Zufallsvektor 𝐗 die Ungleichung

P((𝐗μ)TΣ1(𝐗μ)k2)dk2für alle k>0.

Diese Ungleichung ergibt sich als Spezialfall einer Ungleichung für quadratische Formen von Zufallsvariablen.[2][3] Die Ungleichung wurde bereits 1962 von Samuel Stanley Wilks angegeben.[4]

Die Menge

{𝐱d(𝐱μ)Σ1(𝐱μ)k2}

ist ein Ellipsoid mit Mittelpunktvektor μ. Die mehrdimensionale Tschebyscheffsche Ungleichung besagt somit für d=2, dass außerhalb einer Konzentrationsellipse mit k=2 höchstens 50 % der Stichproben-Tupel liegen. Das ist (wie im Eindimensionalen) eine grobe Abschätzung.

Beachte, dass die quadratische Form 𝐱Σ1𝐱=k2 den Rand der Streuregion einer zentrierten d-dimensionalen Normalverteilung 𝒩d(𝟎,Σ) mit invertierbarer Kovarianzmatrix Σ beschreibt. Siehe auch Streuregionen der mehrdimensionalen Normalverteilung und Quadratische Formen von Zufallsvariablen.

Literatur

Einzelnachweise