Active-Set-Methoden

Active-Set-Methoden sind eine Klasse iterativer Algorithmen zur Lösung von quadratischen Optimierungsproblemen.

Mathematische Problemstellung

Jedes quadratische Programm kann in eine standardisierte Form überführt werden:^[1]

\begin{matrix} \min_{x \in ℝ^{n}} & \frac{1}{2} x^{T} H x + c^{T} x & = f (x) \\ s . t . & a_{i}^{T} x \geq b_{i} & \forall i \in ℐ \\ a_{j}^{T} x = b_{j} & \forall j \in ℰ \end{matrix}

wobei $n$ die Anzahl der Entscheidungsvariablen ist. In der Zielfunktion $f (x)$ entspricht $H$ der Hesse-Matrix, die Mengen $ℐ$ und $ℰ$ indizieren die Ungleichheits- und Gleichheitsbedingungen. Oft wird dabei gefordert, dass die Matrix $H$ positiv semidefinit ist, da dann das Optimierungsproblem konvex ist.

Active Set

Eine Nebenbedingung $i \in ℐ$ ist aktiv an einem Punkt $x$ , wenn $a_{i}^{T} x = b_{i}$ gilt.

Das Active Set $𝒜 (x)$ ist die Menge aller aktiven Bedingungen an einem gültigen Punkt $x$ :

𝒜 (x) := {j \in ℰ \cup i \in ℐ : a_{i}^{T} x = b_{i}}

Algorithmus

Active-Set-Methoden setzen eine initiale gültige Lösung $x_{0}$ voraus. Die Algorithmen berechnen dann in jeder Iteration einen gültigen Punkt $x_{k}$ , bis ein Optimum erreicht ist. Dabei wird eine Menge $W_{k}$ verwaltet, die angibt, welche Nebenbedingungen in der aktuellen Iteration aktiv sein sollen.^[2]

 1  Gegeben: gültiger Punkt  $x_{0}$ ,  $W_{0} \subseteq 𝒜 (x_{0})$ 
 2
 3  for k=0,1,.. do
 4  berechne eine Suchrichtung  $p_{k}$ 
 5  if  $p_{k} = 0$ 
 6    berechne Lagrange-Multiplikatoren  $λ_{i}$ 
 7    if  $\forall i : λ_{i} \geq 0$ 
 8      terminiere und gib  $x_{k}$  aus
 9    else
10      finde Ungleichheitsbedingung  $i \in W_{k} \cap ℐ$  mit  $λ_{i} < 0$ 
11       $W_{k + 1} = W_{k} ∖ i$ 
12    end
13  else
14    berechne Schrittlänge  $α_{k}$ 
15    if  $α_{k} < 1$ 
16      finde Nebenbedingung j die  $α_{k}$  beschränkt
17       $W_{k + 1} = W_{k} \cup j$ 
18    end
19     $x_{k + 1} = x_{k} + α_{k} p_{k}$ 
20  end

Berechnung der Suchrichtung p_k

Die Nebenbedingungen in $W_{k}$ definieren einen Unterraum. Wenn $x$ in der optimalen Lösung der Zielfunktion in diesem Unterraum ist, kann man die Suchrichtung als $p_{k} = x - x_{k}$ definieren. Substituiert man dies in die Zielfunktion, erhält man die Suchrichtung $p_{k}$ durch Lösen eines quadratischen Subproblems:^[3]

\begin{matrix} \min_{x \in ℝ^{n}} & \frac{1}{2} p_{k}^{T} H p_{k} + g_{k}^{T} p_{k} \\ s . t . & A^{T} p_{k} = 0 & \forall i \in W_{k} \end{matrix}

wobei $g_{k} = H x_{k} + c$ der Gradient an der aktuellen Lösung ist und die Spalten der Matrix $A$ die Vektoren $a_{i}, i \in W_{k}$ sind.

Dieses Subproblem kann auf verschiedenen Weisen gelöst werden. Eine Möglichkeit ist dabei ein Nullspace-Ansatz:^[4]

Hat man eine Matrix $Z$ , deren Spalten eine Basis für den Kern der Matrix $A^{T}$ bilden, kann man den gültigen Bereich des Subproblems durch $p_{k} = Z u$ parametrisieren. Löst man nun das Gleichungssystem

M u = - Z^{T} g_{k}

,

wobei $M = Z^{T} H Z$ die reduzierte Hesse-Matrix ist, erhält man die Suchrichtung im originalen Problem.

Berechnung der Lagrange-Multiplikatoren λ_i

Falls die Suchrichtung $p_{k} = 0$ ist, ist $x_{k}$ bereits optimal im aktuellen Unterraum. Man muss dann eine geeignete Ungleichheitsbedingung aus $W_{k}$ entfernen. Die Lagrange-Multiplikatoren $λ_{i}$ erhält man durch Lösen eines linearen Gleichungssystems:

\sum_{i \in W_{k} \cap ℐ} a_{i} λ_{i} = g_{k} = H x_{k} + c

Falls alle $λ_{i} \geq 0$ sind, erfüllen $x_{k}$ und $λ$ die Karush-Kuhn-Tucker-Bedingungen, welche notwendige Kriterien für die Optimalität sind. Wenn zudem die Hesse-Matrix $H$ positiv semidefinit ist, sind diese Bedingungen hinreichend und $x_{k}$ ist die optimale Lösung des Problems. Entfernt man eine Ungleichheitsbedingung mit negativem Lagrange-Multiplikator aus $W_{k}$ erhält man in der nächsten Iteration eine Suchrichtung.^[5]

Berechnung der Schrittlänge α_k

Hat man eine Suchrichtung $p_{k}$ , muss man die maximale Schrittlänge $α_{k}$ berechnen. Eine volle Schrittlänge mit $α_{k} = 1$ führt direkt zum Minimum im durch $W_{k}$ definierten Unterraum. Die Schrittlänge ist jedoch häufig durch eine Nebenbedingung $i \notin W_{k}$ beschränkt.

Alle Nebenbedingungen in $i \notin W_{k}$ mit $a_{i}^{T} p_{k} \geq 0$ sind auch am Punkt $x_{k} + α_{k} p_{k}$ für alle $α_{k} \geq 0$ erfüllt, da dann die Ungleichung

a_{i}^{T} (x_{k} + α_{k} p_{k}) = a_{i}^{T} x_{k} + α_{k} a_{i}^{T} p_{k} \geq a_{i}^{T} x_{k} \geq b_{i}

gilt. Alle Nebenbedingungen $i \notin W_{k}$ mit $a_{i}^{T} p_{k} < 0$ werden am neuen Punkt nur dann eingehalten, wenn für diese Nebenbedingungen die Ungleichung

a_{i}^{T} x_{k} + α_{k} a_{i}^{T} p_{k} \geq b_{i}

gilt. Dies ist äquivalent mit der Bedingung

α_{k} \leq \frac{b_{i} - a_{i}^{T} x_{k}}{a_{i}^{T} p_{k}} \forall {i \notin W_{k} | a_{i}^{T} p_{k} < 0}

Um so nah wie möglich an das Optimum im aktuellen Unterraum zu kommen, kann man die maximale Schrittlänge durch diese Formel berechnen:

α_{k} = \min (1, \min_{i \notin W_{k}, a_{i}^{T} p_{k} < 0} \frac{b_{i} - a_{i}^{T} x_{k}}{a_{i}^{T} p_{k}})

Die Nebenbedingung, die diese Länge beschränkt, wird in die Menge $W_{k + 1}$ aufgenommen, da diese Nebenbedingung nun aktiv ist.^[6]

Literatur

Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, Kapitel 16.5.
Roger Fletcher: Practical methods of optimization. Second Edition. John Wiley & Sons, 1987, ISBN 978-0-471-49463-8, Kapitel 10.3.

Einzelnachweise

↑ Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 449.
↑ Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 472.
↑ Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 468.
↑ Roger Fletcher: Stable reduced Hessian updates for indefinite quadratic programming. Mathematical Programming (87.2) 2000, S. 251–264.
↑ Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 469f.
↑ Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 468f.

[1] Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 449.

[2] Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 472.

[3] Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 468.

[4] Roger Fletcher: Stable reduced Hessian updates for indefinite quadratic programming. Mathematical Programming (87.2) 2000, S. 251–264.

[5] Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 469f.

[6] Jorge Nocedal, Stephen J. Wright: Numerical Optimization. Second Edition. Springer, New York 2006, ISBN 978-0387-30303-1, S. 468f.

[1]

[2]

[3]

[4]

[5]

[6]

Active-Set-Methoden

Inhaltsverzeichnis

Mathematische Problemstellung

Active Set

Algorithmus

Berechnung der Suchrichtung p_k

Berechnung der Lagrange-Multiplikatoren λ_i

Berechnung der Schrittlänge α_k

Literatur

Einzelnachweise

Navigationsmenü

Active-Set-Methoden

Mathematische Problemstellung

Active Set

Algorithmus

Berechnung der Suchrichtung pk

Berechnung der Lagrange-Multiplikatoren λi

Berechnung der Schrittlänge αk

Literatur

Einzelnachweise

Navigationsmenü

Suche

Berechnung der Suchrichtung p_k

Berechnung der Lagrange-Multiplikatoren λ_i

Berechnung der Schrittlänge α_k