Jensensche Ungleichung

Aus testwiki
Zur Navigation springen Zur Suche springen

Die jensensche Ungleichung ist eine elementare Ungleichung für konvexe und konkave Funktionen. Sie ist wegen ihrer Allgemeinheit Grundlage vieler bedeutender Ungleichungen, vor allem in der Analysis und Informationstheorie. Die Ungleichung ist nach dem dänischen Mathematiker Johan Ludwig Jensen benannt, der sie am 17. Januar 1905 bei einer Konferenz der Dänischen Mathematischen Gesellschaft präsentierte.[1] Unter etwas anderen Voraussetzungen findet sie sich bereits 1889 bei Otto Hölder.[2]

Die jensensche Ungleichung besagt, dass der Funktionswert einer konvexen Funktion an einer endlichen Konvexkombination von Stützstellen stets kleiner oder gleich einer endlichen Konvexkombination von den Funktionswerten der Stützstellen ist. Dies bedeutet insbesondere, dass das gewichtete arithmetische Mittel der Funktionswerte an n Stellen größer oder gleich dem Funktionswert am Mittel dieser n Stellen ist. Für lineare Funktionen gilt stets Gleichheit.

Satz

Für eine konvexe Funktion f und für nichtnegative λi mit i=1nλi=1 gilt:

f(i=1nλixi)i=1nλif(xi).

Beweis per Induktion

Verwendet man die heute übliche Definition von konvex, dass

f(λx+(1λ)y)λf(x)+(1λ)f(y)

für alle reellen λ zwischen 0 und 1 gelte, so ergibt sich die jensensche Ungleichung durch vollständige Induktion über die Anzahl der Stützstellen.

Beweis von Hölder

Hölder verwendete den Begriff konvex noch nicht und zeigte, dass aus f0 bzw. f monoton steigend die Ungleichung

f(i=1naixii=1nai)i=1naif(xi)i=1nai

für positive ai folgt, wobei er dies im Wesentlichen mit dem Mittelwertsatz der Differentialrechnung bewies.[2]

Beweis von Jensen

Jensen ging von der schwächeren Definition

f(x+y2)f(x)+f(y)2

aus und zeigte unter ausdrücklichem Verweis auf den cauchyschen Beweis der Ungleichung vom arithmetischen und geometrischen Mittel mit Vorwärts-Rückwärts-Induktion, dass daraus die Beziehung

f(i=1nxin)i=1nf(xi)n

für beliebige natürliche Zahlen n folgt. Daraus folgerte er dann weiter, dass

f(i=1nkixii=1nki)i=1nkif(xi)i=1nki

für natürliche Zahlen ki und somit

f(i=1nλixi)i=1nλif(xi)

für beliebige rationale und, sofern f stetig ist, auch reelle Zahlen λi zwischen 0 und 1 mit i=1nλi=1 gilt.[1]

Varianten

  • Da für konkave Funktionen f die Funktion f konvex ist, gilt für konkave Funktionen die jensensche Ungleichung in umgekehrter Richtung, d. h., für jede konkave Funktion f und für positive λi mit i=1nλi=1 gilt:
f(i=1nλixi)i=1nλif(xi).
  • Die stetige Variante der jensenschen Ungleichung für eine im Bild von y:[a,b] konvexe Funktion f lautet
f(1baaby(x) dx)1baabf(y(x)) dx.
  • Die stetige und die diskrete Variante lässt sich in der maßtheoretischen Variante zusammenfassen: Ist (Ω,A,μ) Maßraum mit μ(Ω)=1 und ist y eine μ-integrierbare reellwertige Funktion, so gilt für jede im Bild von y konvexe Funktion f
f(Ωy dμ)Ωfy dμ.
f(E(X))E(f(X)).
Jensen's Ungleichung gilt auch für den bedingten Erwartungswert
f(E[X𝒢])E[f(X)𝒢].

Anwendungen

Die jensensche Ungleichung lässt sich beispielsweise zum Beweis der Ungleichung vom arithmetischen und geometrischen Mittel und der Ky-Fan-Ungleichung verwenden. Die Variante für Erwartungswerte dient in der Stochastik zur Abschätzung von bestimmten Zufallsgrößen.

Umkehrung

Die Aussage der maßtheoretischen Variante der jensenschen Ungleichung lässt sich im folgenden Sinne umkehren:[3]

Sei f: eine reelle Funktion derart, dass für jede beschränkte (Lebesgue-)messbare Funktion y:[0,1] gilt

f(01y dx)01fy dx,

dann ist f konvex.

Vorlage:Wikisource

Einzelnachweise