Laguerre-Samuelson-Ungleichung

Die Laguerre-Samuelson-Ungleichung, auch nur Samuelson-Ungleichung genannt, ist eine Ungleichung aus der beschreibenden Statistik. Sie gibt an, um wie viele empirische Standardabweichungen eine einzelne Beobachtung maximal vom arithmetischen Mittel aller Beobachtungen abweichen kann. Sie ist benannt nach dem amerikanischen Wirtschaftswissenschaftler Paul Samuelson, der sie im Jahre 1968 beschrieb. Vor ihm hat sie aber bereits der französische Mathematiker Edmond Laguerre im Jahr 1880 im Zusammenhang mit der Größenabschätzung der Nullstellen von Polynomen gefunden.

Samuelsons Ungleichung

Für einen Datensatz $(x_{1}, \dots, x_{n}) \in ℝ^{n}$ sei

\bar{x} = \frac{1}{n} \sum_{i = 1}^{n} x_{i}

das arithmetische Mittel und

\tilde{s} = \sqrt{\frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}}

die empirische Standardabweichung (hier im Unterschied zur sonst üblichen Variante $s = \sqrt{\frac{1}{n - 1} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}}$ mit $\tilde{s}$ bezeichnet).

Dann gilt:

| x_{j} - \bar{x} | \leq \sqrt{n - 1} \tilde{s}

für jede Einzelbeobachtung $x_{j}, j = 1, \dots, n$ .

Die Ungleichung ist scharf in dem Sinne, dass die rechte Seite ohne zusätzliche Annahmen über die Verteilung der Daten nicht verbessert werden kann.

Arnolds Beweis von Samuelsons Ungleichung

Im Jahre 1974 veröffentlichte Barry C. Arnold einen einfachen Beweis der Ungleichung, der sich auf die Cauchy-Schwarzsche Ungleichung stützt:

Sei $j \in {1, 2, \dots, n}$ beliebig aber fest gewählt, und $\vec{a} = {(\begin{matrix} x_{1} - \bar{x} \\ ⋮ \\ x_{n} - \bar{x} \end{matrix})}_{i \neq j} \in ℝ^{n - 1}, \vec{b} = (\begin{matrix} 1 \\ ⋮ \\ 1 \end{matrix}) \in ℝ^{n - 1}$ .

Wendet man auf $\vec{a}$ und $\vec{b}$ die Cauchy-Schwarzsche Ungleichung $({\vec{a}}^{T} \vec{b})^{2} \leq | \vec{a} |^{2} \cdot | \vec{b} |^{2}$ mit dem Standardskalarprodukt an, so folgt

{(\sum_{i \neq j} (x_{i} - \bar{x}))}^{2} \leq \sum_{i \neq j} (x_{i} - \bar{x})^{2} \cdot (n - 1)

und daraus

{(\sum_{i = 1}^{n} (x_{i} - \bar{x}) - (x_{j} - \bar{x}))}^{2} \leq (n - 1) (\sum_{i = 1}^{n} (x_{i} - \bar{x})^{2} - (x_{j} - \bar{x})^{2}) .

Die erste Summe auf der linken Seite ist 0, daher

(x_{j} - \bar{x})^{2} \leq (n - 1) \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2} - (n - 1) (x_{j} - \bar{x})^{2}

und

n (x_{j} - \bar{x})^{2} \leq (n - 1) \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2} .

Division durch $n$ liefert

(x_{j} - \bar{x})^{2} \leq (n - 1) \cdot \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2} = (n - 1) {\tilde{s}}^{2} .

Wurzelziehen auf beiden Seiten schließt den Beweis ab.

Gleichheit in Samuelsons Ungleichung tritt für ein $x_{j}$ genau dann ein, wenn die anderen $n - 1$ Daten einander gleich sind und $x_{j}$ als einziges davon verschieden.

Beispiel

Für den Datensatz $(2, 2, 2, 2, 7)$ mit $n = 5$ berechnet man $\bar{x} = 3$ und $\tilde{s} = 2$ . Für den fünften Wert gilt dann

| x_{5} - \bar{x} | = | 7 - 3 | = 4 = \sqrt{n - 1} \tilde{s},

in der Ungleichung herrscht also Gleichheit.

Laguerres Ungleichung

Im Jahr 1880 veröffentlichte Laguerre folgenden Satz über die Abschätzung der Nullstellen von Polynomen: Ist

p (x) = x^{n} + a_{1} x^{n - 1} + a_{2} x^{n - 2} + \dots + a_{n}

ein Polynom mit $n$ (nicht notwendig verschiedenen) reellen Nullstellen $x_{1}, x_{2}, \dots, x_{n}$ , so genügen die Nullstellen folgender Ungleichung:

- \frac{a_{1}}{n} - \sqrt{n - 1} b \leq x_{j} \leq - \frac{a_{1}}{n} + \sqrt{n - 1} b

mit

b = \frac{1}{n} \sqrt{(n - 1) a_{1}^{2} - 2 n a_{2}} .

Diese Abschätzung ist Samuelsons Ungleichung, nur mit anderen Bezeichnungen. Dazu faktorisiert man das Polynom zu

p (x) = (x - x_{1}) \cdot (x - x_{2}) \cdot \dots \cdot (x - x_{n})

und multipliziert aus:

p (x) = x^{n} - (\sum_{i = 1}^{n} x_{i}) x^{n - 1} + (\sum_{i < j} x_{i} x_{j}) x^{n - 2} + \dots

Koeffizientenvergleich mit der ursprünglichen Form liefert

a_{1} = - \sum_{i = 1}^{n} x_{i}

und

a_{2} = \sum_{i < j} x_{i} x_{j} .

Damit ist der Term $- \frac{a_{1}}{n}$ in Laguerres Ungleichung gleich $\bar{x}$ , und eine etwas längere aber elementare Rechnung zeigt $b = \tilde{s}$ .

Vergleich mit Tschebyscheffs Ungleichung

Tschebyscheffs Ungleichung ist eine Ungleichung aus der Wahrscheinlichkeitsrechnung über eine Zufallsvariable $X$ mit Erwartungswert $μ$ und Standardabweichung $σ$ und lautet

P (| X - μ | \leq k σ) \geq 1 - \frac{1}{k^{2}}

Um Vergleichbarkeit mit Samuelsons Ungleichung herzustellen, wählt man für $X$ die diskrete gleichverteilte Zufallsvariable, die die Werte $x_{j}$ mit Wahrscheinlichkeiten $P (X = x_{j}) = \frac{1}{n}, j = 1, \dots, n,$ annimmt. Dann ist

μ = E (X) = \bar{x}

und

σ^{2} = Var (X) = {\tilde{s}}^{2} .

Tschebyscheffs Ungleichung lautet dann

P (| X - \bar{x} | \leq k \tilde{s}) \geq 1 - \frac{1}{k^{2}}

Sie macht eine Aussage über den Anteil der Daten, die innerhalb eines symmetrisch zu $\bar{x}$ gelegenen Intervalls liegen, und zwar unabhängig von der Größe des Datensatzes, während Samuelsons Ungleichung besagt, dass alle Werte eines $n$ -elementigen Datensatzes innerhalb von $\sqrt{n - 1}$ Standardabweichungen um $\bar{x}$ liegen, die Aussage wird mit wachsendem $n$ also immer ungenauer.

Beispiel

Für einen Datensatz mit $n = 1000$ Werten sagt Tschebyscheff, dass mindestens 99 % der Werte innerhalb von 10 Standardabweichungen um den Mittelwert liegen, dagegen Samuelson, dass alle Werte innerhalb von 31,6070 Standardabweichungen um den Mittelwert liegen. Der Preis für das Erfassen aller Werte ist also der viel schlechtere Faktor bei der Standardabweichung.

Literatur

Laguerre-Samuelson-Ungleichung

Inhaltsverzeichnis

Samuelsons Ungleichung

Arnolds Beweis von Samuelsons Ungleichung

Laguerres Ungleichung

Vergleich mit Tschebyscheffs Ungleichung

Literatur

Navigationsmenü

Laguerre-Samuelson-Ungleichung

Samuelsons Ungleichung

Arnolds Beweis von Samuelsons Ungleichung

Laguerres Ungleichung

Vergleich mit Tschebyscheffs Ungleichung

Literatur

Navigationsmenü

Suche