Karush-Kuhn-Tucker-Bedingungen

Aus testwiki
Version vom 17. September 2024, 14:21 Uhr von imported>Nukelavee (growthexperiments-addlink-summary-summary:3|0|0)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Die Karush-Kuhn-Tucker-Bedingungen sind ein notwendiges Optimalitätskriterium erster Ordnung in der nichtlinearen Optimierung. Sie sind die Verallgemeinerung der notwendigen Bedingung f(x)=0 von Optimierungsproblemen ohne Nebenbedingungen und der Lagrange-Multiplikatoren von Optimierungsproblemen unter Gleichungsnebenbedingungen. Sie wurden zum ersten Mal 1939 in der allerdings unveröffentlichten Master-Arbeit von William Karush aufgeführt.[1] Bekannter wurden diese jedoch erst 1951 nach einem Konferenz-Paper von Harold W. Kuhn und Albert W. Tucker.[2]

Rahmenbedingungen

Gegeben seien m+l+1 stetig differenzierbare Funktionen f,g1,,gm,h1,,hl:D, wobei D eine nicht-leere offene Teilmenge von n ist. Die KKT-Bedingungen ermöglichen Aussagen über ein Optimierungsproblem der Form

minxCf(x),

wobei CD die Menge aller Punkte in n ist, welche die Nebenbedingungen

gi(x)0,1im,
hj(x)=0,1jl,

erfüllen.

Aussage

Karush-Kuhn-Tucker-Bedingungen

Ein Punkt (x*,μ*,λ*)C×m×l heißt Karush-Kuhn-Tucker-Punkt oder kurz KKT-Punkt des obigen Optimierungsproblems, wenn er die folgenden Bedingungen erfüllt:

f(x*)+i=1mμi*gi(x*)+j=1lλj*hj(x*)=0,hj(x*)=0,für j=1,,l,gi(x*)0,für i=1,,m,μi*0,für i=1,,m,μi*gi(x*)=0,für i=1,,m.

Diese Bedingungen werden die Karush-Kuhn-Tucker-Bedingungen oder kurz KKT-Bedingungen genannt. Verwendet man alternativ die Lagrange-Funktion

L(x,μ,λ):=f(x)+i=1mμigi(x)+j=1lλjhj(x),

so kann man die erste Zeile formulieren als xL(x*,μ*,λ*)=0. Die zweite und dritte Zeile fordert, dass x* zulässig für das (primale) Problem ist, die vierte fordert Zulässigkeit der dualen Variable für das duale Problem und die letzte Zeile Komplementarität.

Ist der Definitionsbereich D=0n, so benötigt man nicht zwangsläufig die Formulierung über gi(x*)0 und zugehörige Lagrange-Multiplikatoren. Stattdessen lauten die KKT dann:

f(x*)+i=1mμi*gi(x*)+j=1lλj*hj(x*)0,gi(x*)0,für i=1,,m,hj(x*)=0,für j=1,,l,μi*0,für i=1,,m,μi*gi(x*)=0,für i=1,,m,x*(f(x*)+i=1mμi*gi(x*)+j=1lλj*hj(x*))=0,für p=1,,n,xp*0,für p=1,,n.

Optimalitätskriterium

Ist der Punkt x* lokales Minimum des Optimierungsproblems und erfüllt er gewisse Regularitätsvoraussetzungen (siehe unten), so gibt es μ*,λ*, so dass (x*,μ*,λ*) ein KKT-Punkt ist. Somit sind die KKT-Bedingungen ein notwendiges Optimalitätskriterium. Im Allgemeinen ist μ*,λ* nicht eindeutig festgelegt.

Regularitätsvoraussetzungen

Es gibt unterschiedlichste Regularitätsbedingungen, die sicherstellen, dass die KKT-Bedingungen gelten. Sie unterscheiden sich hauptsächlich in ihrer Allgemeingültigkeit und der Leichtigkeit ihrer Anwendung und Überprüfbarkeit. In Anlehnung an das Englische werden sie auch Vorlage:Lang genannt.

Beispiele für Vorlage:Lang sind:

  • Abadie CQ: Der Tangentialkegel und der linearisierte Tangentialkegel stimmen in x^ überein.
  • [[Linear independence constraint qualification|Lineare Unabhängigkeit – Vorlage:Lang (LICQ):]] Die Gradienten der aktiven Ungleichungsbedingungen und die Gradienten der Gleichungsbedingungen sind linear unabhängig im Punkt x^. Diese CQ liefert Eindeutigkeit bei μ*,λ*.
  • [[MFCQ|Mangasarian-Fromovitz – Vorlage:Lang (MFCQ):]] Die Gradienten der aktiven Ungleichungsbedingungen und die Gradienten der Gleichungsbedingungen sind positiv-linear unabhängig im Punkt x^.
  • Konstanter Rang – Vorlage:Lang (CRCQ): Für jede Untermenge der Gradienten der aktiven Ungleichungsbedingungen und der Gradienten der Gleichungsbedingungen ist der Rang in einer Umgebung von x^ konstant.
  • Konstante positiv-lineare Abhängigkeit – Vorlage:Lang (CPLD): Für jede Untermenge der Gradienten der aktiven Ungleichungsbedingungen und der Gradienten der Gleichungsbedingungen im Punkt x^ gilt: falls eine positiv-lineare Abhängigkeit im Punkt x^ vorliegt, dann gibt es eine positiv-lineare Abhängigkeit in einer Umgebung von x^.

Speziell für konvexe Optimierungsprobleme und fast konvexe Funktionen gibt es die

  • Slater-Bedingung: Es gibt einen zulässigen Punkt, der strikt zulässig bezüglich der Ungleichungsrestriktionen ist. Sie liefert die Regularität aller Punkte des Problems und nicht nur die des untersuchten Punktes.

Man kann zeigen, dass die folgenden beiden Folgerungsstränge gelten

LICQMFCQCPLD und LICQCRCQCPLD,

obwohl MFCQ nicht äquivalent zu CRCQ ist. In der Praxis werden schwächere Vorlage:Lang bevorzugt, da diese stärkere Optimalitäts-Bedingungen liefern. Insbesondere können die constraint qualifications auch genutzt werden, um sicherzustellen, dass die KKT-Bedingungen mit den Fritz-John-Bedingungen übereinstimmen.

Spezialfälle

Konvexe Optimierung

Handelt es sich bei dem Optimierungsproblem um ein konvexes Optimierungsproblem, sind also f,g1,,gm konvex und h1,,hl affin, so lassen sich stärkere Aussagen treffen. Einerseits kann man dann als Regularitätsbedingung die Slater-Bedingung verwenden, welche die Regularität aller Punkte des Problems liefern, andererseits ist bei konvexen Problemen die KKT-Bedingung auch hinreichendes Optimalitätskriterium. Jeder Punkt, der ein KKT-Punkt ist, ist also lokales (und aufgrund der Konvexität sogar globales) Minimum. Insbesondere ist dazu keine Regularitätsvoraussetzung nötig.

Konvexe Zielfunktion mit linearen Restriktionen

Ist die Zielfunktion f(x) und die Definitionsmenge D konvex und sind alle Restriktionen affin, sprich ist gi(x)=aiTxbi und hj(x)=ajTxbj, so ist ohne weitere Regularitätsvoraussetzungen ein KKT-Punkt äquivalent zum globalen Minimum.

Allgemeine Zielfunktion mit linearen Restriktionen

Sind die Zielfunktion und der Definitionsbereich im Rahmen der obigen Voraussetzungen beliebig und alle Restriktionen affin, so ist die Abadie CQ automatisch erfüllt, da die Linearisierung der linearen Funktionen wieder die Funktionen selbst liefert. Damit ist in diesem Fall ohne weitere Voraussetzungen an die Regularität ein lokales Optimum immer ein KKT-Punkt.

Beispiel

Betrachten wir als Beispiel das nichtlineare Optimierungsproblem

minxX[(x1+1)2(x2+2)2]

mit der Restriktionsmenge

X={x2|g1(x)=x20,g2(x)=x12x240,g3(x)=x12+x2+10}.

Ein lokales Minimum befindet sich im Punkt x*=(2,0). Zuerst überprüft man eine der Regularitätsbedingungen, in diesem Fall LICQ: im lokalen Optimum sind die Ungleichungsrestriktionen g1,g2 aktiv und deren Gradienten g1(x*)=(0,1)T,g2(x*)=(4,1)T sind linear unabhängig. Somit ist die LICQ erfüllt, es existiert also ein KKT-Punkt. Um diesen zu berechnen, stellen wir zunächst fest, dass g3(x*)<0 ist, also ist aufgrund der KKT-Bedingung μ3*g3(x*)=0 auf jeden Fall μ3*=0. Die anderen Werte des KKT-Punktes ergeben sich aus dem Gleichungssystem der Gradienten am Punkt x*

(64)+μ1*(01)+μ2*(41)=(00)

zu μ1*=112,μ2*=32. Somit ist ein KKT-Punkt gegeben als (2,0,112,32,0).

Da das Problem nicht konvex ist, gilt die Umkehrung jedoch nicht: der Punkt (1,2,0,0,0) ist zwar ein KKT-Punkt des Problems, aber kein Optimum.

Verallgemeinerungen

Eine Verallgemeinerung der KKT-Bedingungen sind die Fritz-John-Bedingungen. Sie kommen ohne Regularitätsvoraussetzungen aus, liefern jedoch eine schwächere Aussage. Für konvexe Optimierungsprobleme, bei denen die Funktionen nicht stetig differenzierbar sind, gibt es außerdem die Sattelpunktkriterien der Lagrange-Funktion.

Literatur

Einzelnachweise

  1. Die Arbeit ist dargestellt in H. Kuhn, Nonlinear Programming. A historical view, in: R. W. Cottle, C. E. Lemke, Nonlinear Programming, SIAM-AMS Proc. 9, American Mathematical Society 1976, S. 1–26
  2. Kuhn, Tucker, Nonlinear programming, in: Jerzey Neyman, Proc. 2. Berkeley Symp. Math. Statistics and Probability, University of California Press 1951, S. 481–492