Fourier-Motzkin-Elimination

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Fourier-Motzkin-Elimination ist ein Verfahren, um einen durch ein lineares Ungleichungssystem gegebenen konvexen Polyeder P(A,b):={x|Axb} auf eine Hyperebene der Form H:={x|xj=0} zu projizieren. Dabei ist Am×n eine Matrix und bm eine passende rechte Seite.

Das Verfahren wurde von Joseph Fourier im Jahr 1827 erstmals beschrieben,[1] geriet jedoch in Vergessenheit und wurde schließlich 1936 in der Doktorarbeit von Theodore Motzkin erneut entdeckt.[2]

Beschreibung des Verfahrens

Der Algorithmus kombiniert die Zeilen Ai iM:={1m} der Matrix A und die Einträge der rechten Seite b konisch zu neuen Ungleichungen. Dies geschieht in einer Weise, die sicherstellt, dass die resultierenden neuen Ungleichungen die Variable xj nicht länger beinhalten.

Der Algorithmus wird durch folgenden Pseudocode beschrieben:

 function FourierMotzkin(A, b, j) is
     Eingabe: eine Matrix A der Dimension (m,n), ein Vektor b der Dimension m
              und ein Index j {1,,n}
     Ausgabe: eine Matrix D der Dimension (r,n), sodass Dij=0 für alle i=1,,r
              und ein Vektor d mit r Einträgen
     Z{iM|aij=0}
     N{iM|aij<0}
     P{iM|aij>0}
     RZ(N×P)
     r|R|
     p eine Indizierung der Elemente in R, also eine Bijektion p:{1,,r}R
     for i=1 to r do
         if p(i)Z then
             DiAp(i)
             di bp(i)
         else if p(i)=(s,t)N×P then
             DiatjAsasjAt
             di atjbsasjbt
         endif
     endfor
     return (D,d)

Der resultierende Polyeder P(D,d) beschreibt anschließend die gewünschte Projektion[A. 1].

Beispiel für die Fourier-Motzkin-Elimination

Datei:Projection polytop.svg
Die Projektion eines Polyeders auf verschiedene (lineare) Hyperebenen

Als Beispiel wählen wir den Polyeder P(A,b), der durch das folgende Ungleichungssystem gegeben ist:

P(A,b)={(x,y)2 | x1, 2x+4y14, x2y1}

Die entsprechende Matrix und rechte Seite sind folglich

A=(102412), b=(1141)

Für die Projektion auf die Hyperebene x=0, also für j=1, erhalten wir die folgenden Mengen:

Z=, N={1} und P={2,3}.

Damit ist r=2 und R={(1,2), (1,3)}. Wir setzen p(1)=(1,2), p(2)=(1,3).

Für i=1 kombinieren wir die erste und zweite Ungleichung:

2(x)(1)(2x+4y)2(1)(1)(14)4y12

Für i=2 erhalten wir durch die Kombination der ersten und dritten Ungleichung die folgende neue Ungleichung:

1(x)(1)(x2y)1(1)(1)(1)2y2

Das Bild der Projektion ist also gegeben durch {(0,y)2 | 1y3}, während die resultierende Matrix D bzw. die rechte Seite d die folgende Gestalt haben:

D=(0402), d=(122)

Die Fourier-Motzkin-Elimination aus Sicht der linearen Algebra

Die im Algorithmus angewandten Zeilenoperationen lassen sich durch die Multiplikation der Matrix A bzw. der rechten Seite b mit einer Matrix U+r×m darstellen, deren i-te Zeile gegeben ist durch

Ui={ekfalls p(i)=kZatjesasjetfalls p(i)=(s,t)N×P

Da die Matrix U eine konische Kombination der Zeilen von A beschreibt, sind alle Einträge von U nicht negativ. Im obigen Beispiel ist

U=(210101)

Anwendungen

Zulässigkeitsprobleme

Die Fourier-Motzkin-Elimination hat als Projektionsverfahren die Eigenschaft, dass das System Axb eine Lösung besitzt genau dann wenn dies auch auf das System Dxd zutrifft.

Während es im Allgemeinen schwierig ist, zu entscheiden, ob ein konvexer Polyeder eine zulässige Lösung besitzt, lässt sich dies in einigen Spezialfällen recht leicht bewerkstelligen:

  • Verbleibt keine Variable in dem resultierenden System Dxd, ist also D die Nullmatrix, so ist das System dann und nur dann lösbar, wenn die rechte Seite d nicht negativ ist
  • Enthält nur eine einzige zu einer Variable xk gehörige Spalte der Matrix D von Null verschiedene Einträge, so entspricht die Projektion einem Intervall I. Ist dieses nicht leer, so ist auch das System Axb lösbar. Weiterhin sind die möglichen Werte der Variablen xk in dem Polyeder P(A,b) gerade durch das Intervall I gegeben

Diese Erkenntnis lässt sich nutzen, um zu überprüfen, ob ein beliebiges Polyeder P(A,b) eine zulässige Lösung hat oder nicht: Zunächst werden sämtliche Variablen nacheinander herausprojiziert:

P(A,b) FourierMotzkin(A,b,1) P(D(1),d(1)) FourierMotzkin(D(1),d(1),2) P(D(2),d(2))  P(D(n1),d(n1)) FourierMotzkin(D(n1),d(n1),n) P(D(n),d(n))

Die resultierende Matrix D(n) ist dann die Nullmatrix und man kann entscheiden, ob P(A,b)=, denn P(A,b)= gdw. P(D(n),d(n))= .

Insbesondere gilt P(A,b) gdw. d(n)0 .

Da sich der j-te Projektionsschritt durch eine Multiplikation mit einer nichtnegativen Matrix U(j) ausführen lässt, gilt außerdem:

D(n)=UA, d(n)=Ub,wobeiU:=U(n)U(n1)U(1).

Wenn der k-te Eintrag von d(n) negativ ist, so ist uA=0 und ub<0, wobei u:=ekU. Diese Aussage entspricht dem Farkas’ Lemma. Da sich die Matrizen U(j) während der Ausführung des Algorithmus aufstellen lassen, bietet die Fourier-Motzkin-Elimination damit die Möglichkeit, das Zertifikat für P(A,b)= explizit zu berechnen.

Zusätzlich impliziert die Fourier-Motzkin-Elimination, dass die Projektion eines Polyeders wieder ein Polyeder ist. Dieses Resultat kann benutzt werden, um die Äquivalenz der 𝒱- und -Darstellung von Polyedern zu zeigen.

Beispiel zur Entscheidung der Zulässigkeit

Wir wollen entscheiden, ob der folgende konvexe Polyeder eine zulässige Lösung hat:

P(A,b)={x2 | x1+x24, x11, x21}

Dies entspricht in der Form Axb dem System

[x1x24x11x21]

Nach den einzelnen Projektionsschritten ergeben sich folgenden Systeme:

[x23x21][02]

Es offenbart sich also ein Widerspruch, der Polyeder P(A,b) entspricht der leeren Menge. Die resultierenden Matrizen sind gegeben durch

U(1)=(110001),U(2)=(11)

Ein Zertifikat für die Nichtzulässigkeit ist also der Vektor e1U(2)U(1)=(1,1,1).

Lösung von linearen Programmen

Durch Ausnutzen der Dualität der linearen Optimierung lässt sich jedes lineare Programm auf ein Zulässigkeitsproblem reduzieren, welches sich dann durch die Anwendung der Fourier-Motzkin-Elimination lösen lässt. In diesem Fall benötigt man jedoch recht viele neue Variablen und Ungleichungen, was die Anwendung des Verfahrens verlangsamt. Alternativ kann man den folgenden Ansatz wählen: Um das Problem max{cTx|Axb} zu lösen, führt man eine zusätzliche Variable y ein, und fordert zusätzlich, dass ycTx. Der Wert der Variablen y ist also durch die Optimallösung des Problems beschränkt. Man erhält dadurch einen Polyeder P(A~,b~) mit

A~=(A0cT1)m+1×n+1, b~=(b0)m+1

Man projiziert anschließend die ersten n Einträge heraus, sodass man schließlich ein System der Form

D1,n+1(n)yd1(n)Dl,n+1(n)ydl(n)

erhält. Das resultierende Intervall I beschreibt die Menge der möglichen Werte für die Variable y. Es treten folgende Fälle auf:

  1. Das Intervall ist leer. In diesem Fall besitzt das Optimierungsproblem keine zulässige Lösung.
  2. Das Intervall ist nicht nach oben beschränkt. Damit ist auch das Optimierungsproblem unbeschränkt.
  3. Das Intervall ist nicht leer und besitzt ein maximales Element γ. Damit ist der Zielfunktionswert der Optimallösung des Problems genau γ.

Um eine Lösung x* mit einem gegebenen Zielfunktionswert y*:=γ zu erhalten, geht man wie folgt vor: Zunächst betrachtet man das System nach der Vorlage:Nowrap Iteration: Es treten nur noch die Variablen y und xn auf, wobei der Wert von y schon auf y* festgelegt ist:

D1,nn1xn+D1,n+1n1yd1n1Dl,nn1xn+Dl,n+1n1ydln1

Man erhält somit ein (nicht leeres) Intervall von möglichen Lösungen für xn, von denen man eine beliebige auswählt. Diesen Prozess iteriert man für xn1,,x1 [A. 2].

Beispiel zur Lösung eines linearen Programms

Zur Illustration des Verfahrens wählen wir das Programm

maxx1so dass x1+x24x10x20

Um das Problem zu lösen, fügen wir die Variable y zusammen mit der Ungleichung yx1 zu dem Problem hinzu. Die folgenden Systeme zeigen den Polyeder P(A~,b~), sowie die veränderten Systeme nach der Projektion auf {x1=0} und {x2=0}:

[x1+x24x10x20x1+y0][x20x24x2+y4][04y4]

Damit steht fest, dass die Optimallösung des Problems den Zielfunktionswert 4 hat. Um eine entsprechende Lösung zu erhalten, setzen wir y*=4 und kehren zum vorletzten Schritt zurück. Es ergibt sich das System

x20x24x20

Es bleibt also nichts anderes übrig, als x2*=0 zu setzen. Der Wert von x1* ergibt sich schlussendlich aus dem System

x14x10x14

Damit ist die Optimallösung (x1*,x2*)=(4,0). Diese hat natürlich auch den erwarteten Zielfunktionswert von y*=4.

Laufzeit

Obwohl die Fourier-Motzkin-Elimination zur Lösung von linearen Programmen verwendet werden kann, gibt man in der Praxis anderen Algorithmen den Vorzug. Das Problem der Fourier-Motzkin-Elimination ist, dass im ungünstigsten Fall die Anzahl der Ungleichungen bzw. die Größe der Matrizen D(j) in jeden Projektionsschritt von vorher m auf (m2)2 anwächst. In diesem Fall ist die Laufzeit des Algorithmus nicht mehr polynomiell. Im Allgemeinen sind außerdem die meisten der erzeugten Ungleichungen redundant. Da dies in der Regel allerdings nicht effizient erkannt werden kann, wird für die Fourier-Motzkin-Elimination weit mehr Speicher gebraucht als nötig wäre, um die Polyeder P(D(j),d(j)) zu beschreiben.

Anmerkungen

  1. Da die Menge R im Allgemeinen sehr groß werden kann, ist es ratsam, die Ungleichungen zunächst so zu skalieren, dass aij{±1,0} für alle i{1,m}. Zur Bestimmung von D und d müssen die Spalten dann nur noch voneinander subtrahiert werden.
  2. Das hier vorgestellte Verfahren des Rückwärtseinsetzens lässt sich stets anwenden, um eine zulässige Lösung des Polyeders zu erhalten.

Einzelnachweise

  1. J.B.J. Fourier aus dem Journal: Analyse des travaux de l'Académie Royale des Sciences pendant l'année 1824, Partie mathématique, 1827.
  2. T.S. Motzkin: Beiträge zur Theorie der Linearen Ungleichungen.

Literatur