Lagrange-Dualität

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Lagrange-Dualität ist eine wichtige Dualität in der mathematischen Optimierung, die sowohl Optimalitätskriterien mittels der Karush-Kuhn-Tucker-Bedingungen oder der Lagrange-Multiplikatoren liefert als auch äquivalente Umformulierungen von Optimierungsproblemen möglich macht. Ziel ist es das ursprüngliche (primale) Problem in ein duales Problem zu überführen.

Lagrange-Funktion, duales Problem

Gegeben sei folgendes Optimierungsproblem:

Minimiere f(x)unter den Nebenbedingungen gi(x)0i=1,,phj(x)=0j=1,,qxX

Dabei kann die abstrakte Restriktion xX beispielsweise Forderungen wie xn (Ganzzahligkeit) oder x𝒦 für einen Kegel 𝒦 aufnehmen. Die auftretenden Funktionen müssen weder konvex noch differenzierbar sein.

Die Funktion

L(x,λ,μ):=f(x)+i=1pλigi(x)+j=1qμjhj(x)

heißt dann die zu dem obigen Optimierungsproblem gehörende Lagrange-Funktion. Gelegentlich werden die Funktionen gi,hj sowie die Skalare λi,μj zu Vektoren g(x)=(g1(x),,gp(x))T,h(x)=(h1(x),,hq(x))T und λ=(λ1,,λp)T,μ=(μ1,,μq)T zusammengefasst. Die Lagrange-Funktion vereinfacht sich dann zu

L(x,λ,μ):=f(x)+λTg(x)+μTh(x).

(λ,μ) werden duale Variablen oder Lagrange-Multiplikatoren genannt. Die Funktion

q(λ,μ)=infxXL(x,λ,μ)

heißt dann die duale Funktion zu dem obigen Optimierungsproblem. Das Optimierungsproblem

Maximiere q(λ,μ)unter den Nebenbedingungen λ0

heißt das duale Problem des obigen Optimierungsproblems. Dabei ist λ0 komponentenweise zu verstehen. Das ursprüngliche Problem wird dann auch als primales Problem bezeichnet. Im Allgemeinen muss die duale Funktion nicht reellwertig sein, sie kann durchaus auch den Wert annehmen. Man definiert dann

domq:={(λ,μ)p×q|λ0,q(λ,μ)>}

als den wesentlichen Definitionsbereich der dualen Funktion. Die dualen Variablen (λ,μ) werden dual zulässig genannt, wenn sie zulässig bezüglich des dualen Problems sind, das heißt, wenn λ0 gilt.

Beispiel

Betrachtet man als Beispiel ein lineares Optimierungsproblem in Ungleichungsform:

Minimiere f(x)=cTxunter den Nebenbedingungen Axb0

Dabei ist x,cn,bm und Am×n. Der Vollständigkeit halber setzt man X=n, was in diesem Fall keine Einschränkung bedeutet. Die Lagrange-Funktion ist dann

L(x,λ)=cTx+λT(Axb)=(cT+λTA)xλTb.

Ist cT=λTA, so ist L(x,λ) unabhängig von x und damit ist infxXL(x,λ)=λTb. Ist aber cTλTA, so ist L(x,λ) in eine Richtung nach unten unbeschränkt und demnach gilt infxXL(x,λ)=. Somit lautet die duale Funktion:

q(λ)={λTb falls cT+λTA=0 sonst 

Schreibt man nun die Fallunterscheidung aus der dualen Funktion als Nebenbedingung in das duale Problem, so erhält man:

Maximiere λTbunter den Nebenbedingungen ATλ+c=0λ0

Dies ist genau ein lineares Optimierungsproblem in Standardform.

Eigenschaften des dualen Problems

  • Die Definitionsmenge domq der dualen Funktion ist konvex.
  • Die duale Funktion ist konkav. Für fixiertes x~ ist L(x~,λ,μ) eine affine Funktion und damit ist q(λ,μ) als punktweises Infimum von affinen Funktionen konkav. Somit ist das duale Problem immer ein konvexes Optimierungsproblem, unabhängig von der Struktur des primalen Problems.
  • Daher sind konvexe Optimierungsprobleme eine Klasse von Problemen, deren duales Problem wieder in derselben Problemklasse liegt. Weitere solche Klassen sind die lineare Optimierungsprobleme (siehe Beispiel), die konischen Programme sowie die semidefiniten Programme und die SOCPs.

Schwache Dualität

Sei RP die Restriktionsmenge des primalen Problems und domq die Definitionsmenge des dualen Problems. Dann gilt für alle xRP und (λ,μ)domq

q(λ,μ)f(x).

Der Wert f(x)q(λ,μ) heißt dann die Dualitätslücke (des zulässigen Punktes (x,λ,μ)). Die duale Funktion ist also immer eine untere Schranke für die Zielfunktion des primalen Problems. Somit lässt sich auch das duale Problem motivieren: Es stellt die Frage nach der größten unteren Schranke für das primale Problem, die noch zulässig ist.

Ist P=f(RP) die Wertemenge des primalen Problems und D=q(domq) die des dualen Problems, so gilt

sup(D)inf(P).

Der Wert der dualen Optimallösung ist also stets kleiner als der Wert der primalen Optimallösung. Diese Aussage wird auch schwache Dualität genannt. Der Wert inf(P)sup(D) heißt dann die optimale Dualitätslücke.

Diese Aussagen folgen direkt aus

q(λ,μ)=infxXL(x,λ,μ)L(x~,λ,μ)=f(x~)+i=1pλigi(x~)+j=1qμjhj(x~)f(x~)für alle (λ,μ)domq und x~RP.

Dabei folgt die letzte Ungleichung, da gi(x~)0 und hj(x~)=0 (Zulässigkeit von x~) und λi0 (Zulässigkeit von λ) und damit λigi(x~)0 und μihi(x~)=0. Da die Ungleichung für beliebige (λ,μ)domq und x~RP gilt, folgen die beiden obigen Aussagen.

Starke Dualität

Unter gewissen Umständen stimmen der Optimalwert des primalen Problems und der des dualen Problems überein, die optimale Dualitätslücke ist also Null. Es gilt dann

sup(D)=inf(P).

Dieser Fall wird dann starke Dualität genannt. Gilt starke Dualität und ist der Optimalwert endlich und wird in x* bzw. (λ*,μ*) angenommen, so gilt:

sup(D)=inf(P)=f(x*)=q(λ*,μ*)=L(x*,λ*,μ*)

Im Allgemeinen gilt starke Dualität nicht, sondern es müssen noch weitere Regularitätsvoraussetzungen (im Englischen constraint qualifications) an das Problem erfüllt sein. Eine der wichtigsten Voraussetzungen für konvexe Optimierungsprobleme und fast-konvexe Funktionen, unter der starke Dualität gilt, ist zum Beispiel die Slater-Bedingung.

Komplementärer Schlupf

Vorlage:Hauptartikel Gilt die starke Dualität, sind x* und (λ*,μ*) primal bzw. dual optimal und ist der Optimalwert endlich, so gilt die complementary slackness, auch komplementärer Schlupf genannt:

λigi(x*)=0 für alle i=1,,p

Ist der i-te Lagrange-Multiplikator (die i-te Ungleichungsrestriktion) ungleich null, so muss die i-te Ungleichungsrestriktion (der i-te Lagrange-Multiplikator) gleich null sein:

λi>0gi(x*)=0gi(x*)<0λi=0

Dies folgt aus λi0 und gi(x*)0. Es muss also stets mindestens einer der beiden Faktoren null sein.

Sattelpunkte

Ein Punkt (x*,λ*,μ*) heißt ein Sattelpunkt der Lagrange-Funktion, wenn für alle (x,λ,μ) mit λ0

L(x*,λ,μ)L(x*,λ*,μ*)L(x,λ*,μ*)

gilt. Äquivalent dazu ist

infxXsup(λ,μ)domqL(x,λ,μ)=L(x*,λ*,μ*)=sup(λ,μ)domqinfxXL(x,λ,μ).

Dies bedeutet, dass (λ*,μ*) ein Maximum der Lagrange-Funktion für fixiertes x* und x* ein Minimum der Lagrange-Funktion für fixiertes (λ*,μ*) ist.

Es lässt sich zeigen, dass (x*,λ*,μ*) genau dann ein Sattelpunkt der Lagrange-Funktion ist, wenn x* primal optimal ist, (λ*,μ*) dual optimal ist und starke Dualität gilt.

Sattelpunkte spielen eine wichtige Rolle bei der Bestimmung von Optimalpunkten und schlagen eine Verbindung zu den Karush-Kuhn-Tucker-Bedingungen und den Lagrange-Multiplikatoren. Sind zum Beispiel alle beteiligten Funktionen stetig differenzierbar, so lässt sich aus dem Sattelpunktkriterium ableiten, dass an einem Optimalpunkt x*

xL(x*,λ*,μ*)=0

gelten muss, da x* nach der Sattelpunktcharakterisierung L(x,λ*,μ*) minimiert. Diese Forderung findet sich zum Beispiel in den Karush-Kuhn-Tucker-Bedingungen zur Bestimmung eines Optimalpunktes und als notwendiges Optimalitätskriterium wieder.

Allgemeinere Formulierungen

Formulierung für Hilberträume

Betrachtet man ein Optimierungsproblem mit verallgemeinerten Ungleichungen zwischen reellen Hilberträumen (also reellen vollständigen Vektorräumen, die mit einem Skalarprodukt versehen sind), so ist dies meist von folgender Form:

Minimiere f(x)unter den Nebenbedingungen gi(x)Ki0i=1,,phj(x)=0j=1,,qxX

Hierbei sind f:V0 die Zielfunktion, gi:V0Vi die Ungleichungsrestriktionsfunktionen und hj:V0Vj die Gleichheitsrestriktionsfunktionen. Die Vi seien mit dem echten Kegel Ki ausgestattet, der die verallgemeinerte Ungleichung Ki induziert. Das zum Vektorraum Vs gehörende Skalarprodukt sei mit ;s bezeichnet. Man setzt dann λ:=(λ1,,λp)T,μ:=(μ1,,μq)T. Dabei gilt λiVi und μjVj. Dann ist die Lagrange-Funktion von der Form

L(x,λ,μ):=f(x)+i=1pλi;gi(x)i+j=1qμj;hj(x)j

und die duale Funktion lautet

q(λ,μ)=infxXL(x,λ,μ).

Das duale Problem lautet dann:

Maximiere q(λ,μ)unter den Nebenbedingungen λiKD0i=1,,p,

Dabei ist KD der duale Kegel von K.

Alternative Formulierungen fassen alle Ungleichungsrestriktionen und Gleichheitsrestriktionen zusammen:

g(x)=(g1(x),,gp(x))T,h(x)=(h1(x),,hj(x))T,K:=K1××Kp

Dies führt zu einer kompakteren Schreibweise, die ohne Summenzeichen und Indizes auskommt und daher für theoretische Betrachtungen bevorzugt wird. Alternativ wird auch die Forderung nach einem echten Kegel abgeschwächt, stattdessen definiert man die Ungleichung nur durch einen Ordnungskegel, der zumindest konvex sein muss. Manchmal wir auch komplett auf Gleichheitsnebenbedingungen verzichtet, man modelliert diese dann stattdessen als Ordnungskegel mit leerem Inneren. Statt g(x)K,h(x)=0 zu fordern, definiert man einen Kegel K=K×{0}. Dann gilt (g(x),h(x))K genau dann, wenn g(x)K,h(x)=0. Für alle drei Varianten sind die Lagrange-Funktion und das duale Problem in der untenstehenden Tabelle angegeben. Die duale Funktion ist stets von der Form q(λ,μ)=infxXL(x,λ,μ) bzw., wenn nur eine duale Variable verwendet wird, von der Form q(λ)=infxXL(x,λ).

Primales Problem Lagrange-Funktion Duales Problem
Minimiere f(x)unter den Nebenbedingungen g(x)K0h(x)=0xX L(x,λ,μ)=f(x)+λ;g(x)1+μ;h(x)2 Maximiere q(λ,μ)unter den Nebenbedingungen λKD0
Minimiere f(x)unter den Nebenbedingungen g(x)Kh(x)=0xX L(x,λ,μ)=f(x)+λ;g(x)1+μ;h(x)2 Maximiere q(λ,μ)unter den Nebenbedingungen λKD
Minimiere f(x)unter den Nebenbedingungen g(x)KxX L(x,λ)=f(x)+λ;g(x)1 Maximiere q(λ)unter den Nebenbedingungen λKD

Dabei ist f:V0 die Zielfunktion, g:V0V1, wobei auf V1 ein Kegel K ausgezeichnet ist, der im ersten Fall ein echter Kegel ist, im zweiten und dritten Fall ein konvexer Kegel ist. Es ist h:V0V2 und λV1,μV2.

Formulierung für normierte Räume

Für Probleme mit Abbildungen zwischen reellen normierten Vektorräumen ist zu beachten, dass kein Skalarprodukt definiert ist. Man wählt stattdessen die duale Paarung. Dementsprechend sind die dualen Variablen aus dem Dualraum des Vektorraumes. Ist ein Problem der Form

Minimiere f(x)unter den Nebenbedingungen g(x)Kh(x)=0xX

gegeben, wobei f:V0 die Zielfunktion, gi:V0V1 die Ungleichungsrestriktionsfunktionen und hj:V0V2 die Gleichungsrestriktionsfunktion sind. K sei ein Ordnungskegel auf V1 und es seien V0,V1,V2 Banachräume. Die Lagrange-Funktion lautet dann

L(x,u,v)=f(x)+u(g(x))+v(h(x)).

Dabei ist u aus dem Dualraum V1* und v aus dem Dualraum V2*. Die duale Funktion ist dann wieder

q(u,v)=infxXL(x,u,v)

und damit lautet das duale Problem:

Maximiere q(u,v)unter den Nebenbedingungen uK*

Dabei ist K* der duale Kegel, der in diesem Fall aber eine Teilmenge von V1* ist. Formulierungen für alternative Problemstellungen laufen analog zu den Problemen für Abbildungen zwischen Hilberträumen. Die duale Paarung ersetzt jeweils das Skalarprodukt, die dualen Variablen befinden sich im Dualraum.

Schwache und starke Dualität

Die schwache Dualität gilt auch für die beiden allgemeineren Formulierungen. Für den Beweis in der Hilbertraumformulierung nutzt man aus, dass a;b0 ist, wenn aKD0 und bK gilt (für Ordnungskegel erhält man aKD,bKa;b0). In normierten Räumen gelten analoge Aussagen mit dem Unterschied, dass a ein Element des Dualraumes ist: Gilt aK*,bK, so folgt a(b)0.

Die starke Dualität wird in den allgemeineren Fällen identisch zum gewöhnlichen Fall definiert. Auch im verallgemeinerten Fall existieren Regularitätsvoraussetzungen wie die Slater-Bedingung, die starke Dualität garantieren.

Literatur

  • Florian Jarre, Josef Stoer: Optimierung. Springer, Berlin 2004, ISBN 3-540-43575-1.
  • Stephan Boyd, Lieven Vandenberghe: Convex Optimization. Cambridge University Press, 2004, ISBN 978-0-521-83378-3 (online).
  • C. Geiger, C. Kanzow: Theorie und Numerik restringierter Optimierungsaufgaben. Springer, 2002, ISBN 3-540-42790-2.
  • Johannes Jahn: Introduction to the Theory of Nonlinear Optimization. 3. Auflage. Springer, Berlin 2007, ISBN 978-3-540-49378-5.

Vorlage:Normdaten