Fourier-Motzkin-Elimination

Die Fourier-Motzkin-Elimination ist ein Verfahren, um einen durch ein lineares Ungleichungssystem gegebenen konvexen Polyeder $P (A, b) := {x | A x \leq b}$ auf eine Hyperebene der Form $H := {x | x_{j} = 0}$ zu projizieren. Dabei ist $A \in ℝ^{m \times n}$ eine Matrix und $b \in ℝ^{m}$ eine passende rechte Seite.

Das Verfahren wurde von Joseph Fourier im Jahr 1827 erstmals beschrieben,^[1] geriet jedoch in Vergessenheit und wurde schließlich 1936 in der Doktorarbeit von Theodore Motzkin erneut entdeckt.^[2]

Beschreibung des Verfahrens

Der Algorithmus kombiniert die Zeilen $A_{i \cdot} i \in M := {1 \dots m}$ der Matrix $A$ und die Einträge der rechten Seite $b$ konisch zu neuen Ungleichungen. Dies geschieht in einer Weise, die sicherstellt, dass die resultierenden neuen Ungleichungen die Variable $x_{j}$ nicht länger beinhalten.

Der Algorithmus wird durch folgenden Pseudocode beschrieben:

 function FourierMotzkin(A, b, j) is
     Eingabe: eine Matrix  $A$  der Dimension  $(m, n)$ , ein Vektor  $b$  der Dimension  $m$ 
              und ein Index j  $\in {1, \dots, n}$ 
     Ausgabe: eine Matrix  $D$  der Dimension  $(r, n)$ , sodass  $D_{i j} = 0$  für alle  $i = 1, \dots, r$ 
              und ein Vektor  $d$  mit  $r$  Einträgen

      $Z \leftarrow {i \in M | a_{i j} = 0}$ 
      $N \leftarrow {i \in M | a_{i j} < 0}$ 
      $P \leftarrow {i \in M | a_{i j} > 0}$ 
      $R \leftarrow Z \cup (N \times P)$ 
      $r \leftarrow | R |$ 
      $p \leftarrow$  eine Indizierung der Elemente in  $R$ , also eine Bijektion  $p : {1, \dots, r} \to R$

     for  $i = 1$  to  $r$  do
         if  $p (i) \in Z$  then
              $D_{i \cdot} \leftarrow A_{p (i) \cdot}$ 
              $d_{i} \leftarrow b_{p (i)}$ 
         else if  $p (i) = (s, t) \in N \times P$  then
              $D_{i \cdot} \leftarrow a_{t j} A_{s \cdot} - a_{s j} A_{t \cdot}$ 
              $d_{i} \leftarrow a_{t j} b_{s} - a_{s j} b_{t}$ 
         endif
     endfor
     return  $(D, d)$

Der resultierende Polyeder $P (D, d)$ beschreibt anschließend die gewünschte Projektion^{[A. 1]}.

Beispiel für die Fourier-Motzkin-Elimination

Datei:Projection polytop.svg

Die Projektion eines Polyeders auf verschiedene (lineare) Hyperebenen

Als Beispiel wählen wir den Polyeder $P (A, b)$ , der durch das folgende Ungleichungssystem gegeben ist:

P (A, b) = {(x, y) \in ℝ^{2} | x \geq 1, 2 x + 4 y \leq 14, x - 2 y \leq - 1}

Die entsprechende Matrix und rechte Seite sind folglich

A = (\begin{matrix} - 1 & 0 \\ 2 & 4 \\ 1 & - 2 \end{matrix}), b = (\begin{matrix} - 1 \\ 14 \\ - 1 \end{matrix})

Für die Projektion auf die Hyperebene $x = 0$ , also für $j = 1$ , erhalten wir die folgenden Mengen:

Z = \emptyset

,

N = {1}

und

P = {2, 3}

.

Damit ist $r = 2$ und $R = {(1, 2), (1, 3)}$ . Wir setzen $p (1) = (1, 2), p (2) = (1, 3)$ .

Für $i = 1$ kombinieren wir die erste und zweite Ungleichung:

2 \cdot (- x) - (- 1) \cdot (2 x + 4 y) \leq 2 \cdot (- 1) - (- 1) \cdot (14) ⟹ 4 y \leq 12

Für $i = 2$ erhalten wir durch die Kombination der ersten und dritten Ungleichung die folgende neue Ungleichung:

1 \cdot (- x) - (- 1) \cdot (x - 2 y) \leq 1 \cdot (- 1) - (- 1) \cdot (- 1) ⟹ - 2 y \leq - 2

Das Bild der Projektion ist also gegeben durch ${(0, y) \in ℝ^{2} | 1 \leq y \leq 3}$ , während die resultierende Matrix $D$ bzw. die rechte Seite $d$ die folgende Gestalt haben:

D = (\begin{matrix} 0 & 4 \\ 0 & - 2 \end{matrix}), d = (\begin{matrix} 12 \\ - 2 \end{matrix})

Die Fourier-Motzkin-Elimination aus Sicht der linearen Algebra

Die im Algorithmus angewandten Zeilenoperationen lassen sich durch die Multiplikation der Matrix $A$ bzw. der rechten Seite $b$ mit einer Matrix $U \in ℝ_{+}^{r \times m}$ darstellen, deren $i$ -te Zeile gegeben ist durch

U_{i \cdot} = {\begin{matrix} e_{k} & falls p (i) = k \in Z \\ a_{t j} e_{s} - a_{s j} e_{t} & falls p (i) = (s, t) \in N \times P \end{matrix}

Da die Matrix $U$ eine konische Kombination der Zeilen von $A$ beschreibt, sind alle Einträge von $U$ nicht negativ. Im obigen Beispiel ist

U = (\begin{matrix} 2 & 1 & 0 \\ 1 & 0 & 1 \end{matrix})

Anwendungen

Zulässigkeitsprobleme

Die Fourier-Motzkin-Elimination hat als Projektionsverfahren die Eigenschaft, dass das System $A x \leq b$ eine Lösung besitzt genau dann wenn dies auch auf das System $D x \leq d$ zutrifft.

Während es im Allgemeinen schwierig ist, zu entscheiden, ob ein konvexer Polyeder eine zulässige Lösung besitzt, lässt sich dies in einigen Spezialfällen recht leicht bewerkstelligen:

Verbleibt keine Variable in dem resultierenden System $D x \leq d$ , ist also $D$ die Nullmatrix, so ist das System dann und nur dann lösbar, wenn die rechte Seite $d$ nicht negativ ist
Enthält nur eine einzige zu einer Variable $x_{k}$ gehörige Spalte der Matrix $D$ von Null verschiedene Einträge, so entspricht die Projektion einem Intervall $I$ . Ist dieses nicht leer, so ist auch das System $A x \leq b$ lösbar. Weiterhin sind die möglichen Werte der Variablen $x_{k}$ in dem Polyeder $P (A, b)$ gerade durch das Intervall $I$ gegeben

Diese Erkenntnis lässt sich nutzen, um zu überprüfen, ob ein beliebiges Polyeder $P (A, b)$ eine zulässige Lösung hat oder nicht: Zunächst werden sämtliche Variablen nacheinander herausprojiziert:

P (A, b) \overset{FourierMotzkin (A, b, 1)}{\to} P (D^{(1)}, d^{(1)}) \overset{FourierMotzkin (D^{(1)}, d^{(1)}, 2)}{\to} P (D^{(2)}, d^{(2)}) \dots P (D^{(n - 1)}, d^{(n - 1)}) \overset{FourierMotzkin (D^{(n - 1)}, d^{(n - 1)}, n)}{\to} P (D^{(n)}, d^{(n)})

Die resultierende Matrix $D^{(n)}$ ist dann die Nullmatrix und man kann entscheiden, ob $P (A, b) = \emptyset$ , denn $P (A, b) = \emptyset$ gdw. $P (D^{(n)}, d^{(n)}) = \emptyset$ .

Insbesondere gilt $P (A, b) \neq \emptyset$ gdw. $d^{(n)} \geq 0$ .

Da sich der $j$ -te Projektionsschritt durch eine Multiplikation mit einer nichtnegativen Matrix $U^{(j)}$ ausführen lässt, gilt außerdem:

D^{(n)} = U \cdot A, d^{(n)} = U \cdot b, wobei U := U^{(n)} \cdot U^{(n - 1)} \dots U^{(1)}

.

Wenn der $k$ -te Eintrag von $d^{(n)}$ negativ ist, so ist $u \cdot A = 0$ und $u \cdot b < 0$ , wobei $u := e_{k} \cdot U$ . Diese Aussage entspricht dem Farkas’ Lemma. Da sich die Matrizen $U^{(j)}$ während der Ausführung des Algorithmus aufstellen lassen, bietet die Fourier-Motzkin-Elimination damit die Möglichkeit, das Zertifikat für $P (A, b) = \emptyset$ explizit zu berechnen.

Zusätzlich impliziert die Fourier-Motzkin-Elimination, dass die Projektion eines Polyeders wieder ein Polyeder ist. Dieses Resultat kann benutzt werden, um die Äquivalenz der $𝒱$ - und $ℋ$ -Darstellung von Polyedern zu zeigen.

Beispiel zur Entscheidung der Zulässigkeit

Wir wollen entscheiden, ob der folgende konvexe Polyeder eine zulässige Lösung hat:

P (A, b) = {x \in ℝ^{2} | x_{1} + x_{2} \geq 4, x_{1} \leq 1, x_{2} \leq 1}

Dies entspricht in der Form $A x \leq b$ dem System

[\begin{matrix} - x_{1} & - x_{2} & \leq - 4 \\ x_{1} & \leq 1 \\ x_{2} & \leq 1 \end{matrix}]

Nach den einzelnen Projektionsschritten ergeben sich folgenden Systeme:

[\begin{matrix} - x_{2} & \leq - 3 \\ x_{2} & \leq 1 \end{matrix}] [\begin{matrix} 0 & \leq - 2 \end{matrix}]

Es offenbart sich also ein Widerspruch, der Polyeder $P (A, b)$ entspricht der leeren Menge. Die resultierenden Matrizen sind gegeben durch

U^{(1)} = (\begin{matrix} 1 & 1 & 0 \\ 0 & 0 & 1 \end{matrix}), U^{(2)} = (\begin{matrix} 1 & 1 \end{matrix})

Ein Zertifikat für die Nichtzulässigkeit ist also der Vektor $e_{1} U^{(2)} U^{(1)} = (1, 1, 1)$ .

Lösung von linearen Programmen

Durch Ausnutzen der Dualität der linearen Optimierung lässt sich jedes lineare Programm auf ein Zulässigkeitsproblem reduzieren, welches sich dann durch die Anwendung der Fourier-Motzkin-Elimination lösen lässt. In diesem Fall benötigt man jedoch recht viele neue Variablen und Ungleichungen, was die Anwendung des Verfahrens verlangsamt. Alternativ kann man den folgenden Ansatz wählen: Um das Problem $\max {c^{T} x | A x \leq b}$ zu lösen, führt man eine zusätzliche Variable $y \in ℝ$ ein, und fordert zusätzlich, dass $y \leq c^{T} x$ . Der Wert der Variablen $y$ ist also durch die Optimallösung des Problems beschränkt. Man erhält dadurch einen Polyeder $P (\tilde{A}, \tilde{b})$ mit

\tilde{A} = (\begin{matrix} A & 0 \\ - c^{T} & 1 \end{matrix}) \in ℝ^{m + 1 \times n + 1}, \tilde{b} = (\begin{matrix} b \\ 0 \end{matrix}) \in ℝ^{m + 1}

Man projiziert anschließend die ersten $n$ Einträge heraus, sodass man schließlich ein System der Form

\begin{matrix} D_{1, n + 1}^{(n)} y & \leq d_{1}^{(n)} \\ ⋮ \\ D_{l, n + 1}^{(n)} y & \leq d_{l}^{(n)} \end{matrix}

erhält. Das resultierende Intervall $I$ beschreibt die Menge der möglichen Werte für die Variable $y$ . Es treten folgende Fälle auf:

Das Intervall ist leer. In diesem Fall besitzt das Optimierungsproblem keine zulässige Lösung.
Das Intervall ist nicht nach oben beschränkt. Damit ist auch das Optimierungsproblem unbeschränkt.
Das Intervall ist nicht leer und besitzt ein maximales Element $γ$ . Damit ist der Zielfunktionswert der Optimallösung des Problems genau $γ$ .

Um eine Lösung $x^{*}$ mit einem gegebenen Zielfunktionswert $y^{*} := γ$ zu erhalten, geht man wie folgt vor: Zunächst betrachtet man das System nach der Vorlage:Nowrap Iteration: Es treten nur noch die Variablen $y$ und $x_{n}$ auf, wobei der Wert von $y$ schon auf $y^{*}$ festgelegt ist:

\begin{matrix} D_{1, n}^{n - 1} x_{n} + D_{1, n + 1}^{n - 1} y & \leq d_{1}^{n - 1} \\ ⋮ \\ D_{l, n}^{n - 1} x_{n} + D_{l, n + 1}^{n - 1} y & \leq d_{l}^{n - 1} \end{matrix}

Man erhält somit ein (nicht leeres) Intervall von möglichen Lösungen für $x_{n}$ , von denen man eine beliebige auswählt. Diesen Prozess iteriert man für $x_{n - 1}, \dots, x_{1}$ ^{[A. 2]}.

Beispiel zur Lösung eines linearen Programms

Zur Illustration des Verfahrens wählen wir das Programm

\begin{matrix} \max & x_{1} \\ so dass & x_{1} + x_{2} \leq 4 \\ x_{1} \geq 0 \\ x_{2} \geq 0 \end{matrix}

Um das Problem zu lösen, fügen wir die Variable $y$ zusammen mit der Ungleichung $y \leq x_{1}$ zu dem Problem hinzu. Die folgenden Systeme zeigen den Polyeder $P (\tilde{A}, \tilde{b})$ , sowie die veränderten Systeme nach der Projektion auf ${x_{1} = 0}$ und ${x_{2} = 0}$ :

[\begin{matrix} x_{1} & + x_{2} & \leq 4 \\ - x_{1} & \leq 0 \\ - x_{2} & \leq 0 \\ - x_{1} & + y & \leq 0 \end{matrix}] [\begin{matrix} - x_{2} & \leq 0 \\ x_{2} & \leq 4 \\ x_{2} + y & \leq 4 \end{matrix}] [\begin{matrix} 0 & \leq 4 \\ y & \leq 4 \end{matrix}]

Damit steht fest, dass die Optimallösung des Problems den Zielfunktionswert 4 hat. Um eine entsprechende Lösung zu erhalten, setzen wir $y^{*} = 4$ und kehren zum vorletzten Schritt zurück. Es ergibt sich das System

\begin{matrix} - x_{2} & \leq 0 \\ x_{2} & \leq 4 \\ x_{2} & \leq 0 \end{matrix}

Es bleibt also nichts anderes übrig, als $x_{2}^{*} = 0$ zu setzen. Der Wert von $x_{1}^{*}$ ergibt sich schlussendlich aus dem System

\begin{matrix} x_{1} & \leq 4 \\ - x_{1} & \leq 0 \\ - x_{1} & \leq - 4 \end{matrix}

Damit ist die Optimallösung $(x_{1}^{*}, x_{2}^{*}) = (4, 0)$ . Diese hat natürlich auch den erwarteten Zielfunktionswert von $y^{*} = 4$ .

Laufzeit

Obwohl die Fourier-Motzkin-Elimination zur Lösung von linearen Programmen verwendet werden kann, gibt man in der Praxis anderen Algorithmen den Vorzug. Das Problem der Fourier-Motzkin-Elimination ist, dass im ungünstigsten Fall die Anzahl der Ungleichungen bzw. die Größe der Matrizen $D^{(j)}$ in jeden Projektionsschritt von vorher $m$ auf ${(\frac{m}{2})}^{2}$ anwächst. In diesem Fall ist die Laufzeit des Algorithmus nicht mehr polynomiell. Im Allgemeinen sind außerdem die meisten der erzeugten Ungleichungen redundant. Da dies in der Regel allerdings nicht effizient erkannt werden kann, wird für die Fourier-Motzkin-Elimination weit mehr Speicher gebraucht als nötig wäre, um die Polyeder $P (D^{(j)}, d^{(j)})$ zu beschreiben.

Anmerkungen

↑ Da die Menge $R$ im Allgemeinen sehr groß werden kann, ist es ratsam, die Ungleichungen zunächst so zu skalieren, dass $a_{i j} \in {\pm 1, 0}$ für alle $i \in {1, \dots m}$ . Zur Bestimmung von $D$ und $d$ müssen die Spalten dann nur noch voneinander subtrahiert werden.
↑ Das hier vorgestellte Verfahren des Rückwärtseinsetzens lässt sich stets anwenden, um eine zulässige Lösung des Polyeders zu erhalten.

Einzelnachweise

↑ J.B.J. Fourier aus dem Journal: Analyse des travaux de l'Académie Royale des Sciences pendant l'année 1824, Partie mathématique, 1827.
↑ T.S. Motzkin: Beiträge zur Theorie der Linearen Ungleichungen.

Literatur

Vorlage:Cite book
Vorlage:Cite journal
Unger, Thomas; Dempe, Stefan: Lineare Optimierung, S. 19–23, Vieweg+Teubner 2010, ISBN 978-3-8351-0139-5

Weblinks

Ein Vorlesungsskript zur linearen Optimierung (PDF; 3,5 MB)

[3] Da die Menge $R$ im Allgemeinen sehr groß werden kann, ist es ratsam, die Ungleichungen zunächst so zu skalieren, dass $a_{i j} \in {\pm 1, 0}$ für alle $i \in {1, \dots m}$ . Zur Bestimmung von $D$ und $d$ müssen die Spalten dann nur noch voneinander subtrahiert werden.

[4] Das hier vorgestellte Verfahren des Rückwärtseinsetzens lässt sich stets anwenden, um eine zulässige Lösung des Polyeders zu erhalten.

[1] J.B.J. Fourier aus dem Journal: Analyse des travaux de l'Académie Royale des Sciences pendant l'année 1824, Partie mathématique, 1827.

[2] T.S. Motzkin: Beiträge zur Theorie der Linearen Ungleichungen.

[1]

[2]

[A. 1]

[A. 2]

Fourier-Motzkin-Elimination

Inhaltsverzeichnis

Beschreibung des Verfahrens

Beispiel für die Fourier-Motzkin-Elimination

Die Fourier-Motzkin-Elimination aus Sicht der linearen Algebra

Anwendungen

Zulässigkeitsprobleme

Beispiel zur Entscheidung der Zulässigkeit

Lösung von linearen Programmen

Beispiel zur Lösung eines linearen Programms

Laufzeit

Anmerkungen

Einzelnachweise

Literatur

Weblinks

Navigationsmenü

Fourier-Motzkin-Elimination

Beschreibung des Verfahrens

Beispiel für die Fourier-Motzkin-Elimination

Die Fourier-Motzkin-Elimination aus Sicht der linearen Algebra

Anwendungen

Zulässigkeitsprobleme

Beispiel zur Entscheidung der Zulässigkeit

Lösung von linearen Programmen

Beispiel zur Lösung eines linearen Programms

Laufzeit

Anmerkungen

Einzelnachweise

Literatur

Weblinks

Navigationsmenü

Suche