Matrix-Riccati-Gleichung

Als Matrix-Riccati-Gleichungen oder algebraische Riccati-Gleichungen wird ein Typ von nichtlinearen Gleichungen für Matrizen bezeichnet, die sich, grob gesagt, bei Dimension 1 auf eine algebraische, quadratische Gleichung zurückführen lassen. Daher kommt auch die Bezeichnung des Problems in Anlehnung an die entsprechende Riccati-Differentialgleichung. Bei allgemeinen Dimensionen $m, n \in ℕ$ ist in einer recht allgemeinen Form der Matrix-Riccati-Gleichung eine Matrix $X \in ℝ^{m \times n}$ gesucht, welche die Gleichung

X B X + X A - D X - C = 0 \in ℝ^{m \times n}

erfüllt. Die anderen, vorgegebenen Matrizen haben die dazu passenden Dimensionen $C, B^{T} \in ℝ^{m \times n}$ , $A \in ℝ^{n \times n}$ , $D \in ℝ^{m \times m}$ . Ein Spezialfall dieser Gleichung ist $X^{2} = C$ , welche als Lösungen die Quadratwurzel einer Matrix $X = C^{1 / 2}$ hat, wenn solche existieren.

Bedeutung der Riccati-Gleichung

Außer bei der Quadratwurzel treten Matrix-Riccati-Gleichungen bei weiteren wichtigen Problemen auf.

Eigenwertproblem, invariante Unterräume

Soll die $(m + n) \times (m + 1)$ -Blockmatrix

M := (\begin{matrix} A & B \\ C & D \end{matrix}) mit (\begin{matrix} I_{n} & 0 \\ X & I_{m} \end{matrix})

auf obere Block-Dreieckform transformiert werden, bekommt man

(\begin{matrix} I_{n} & 0 \\ - X & I_{m} \end{matrix}) (\begin{matrix} A & B \\ C & D \end{matrix}) (\begin{matrix} I_{n} & 0 \\ X & I_{m} \end{matrix}) = (\begin{matrix} A + B X & B \\ 0 & D - X B \end{matrix}) = : \hat{M},

wenn $X$ Lösung der obigen Riccati-Gleichung ist, dann verschwindet der linke untere Block $C + D X - X A - X B X = 0$ in der transformierten Matrix. Bei den beiden Einheitsmatrizen ist die Dimension als Index vermerkt, $I_{k} \in ℝ^{k \times k}$ . Die Multiplikation der 3 Matrizen stellt tatsächlich eine Ähnlichkeitstransformation dar, da der linke und der rechte Faktor zueinander invers sind. Daher ergeben sich die Eigenwerte der Gesamtmatrix $M$ aus der Vereinigung der Eigenwerte der beiden Hauptdiagonalblöcke $A + B X$ und $D - X B$ vom $\hat{M}$ . Darüber hinaus bilden die ersten $n$ Spalten $(\begin{matrix} I_{n} \\ X \end{matrix})$ der Transformationsmatrix eine Basis für den zu $A + B X$ gehörigen invarianten Unterraum (Summe von Eigenräumen) von $M$ , aus dem sich bei Bedarf die Eigenvektoren bestimmen lassen. Es gilt also

(\begin{matrix} A & B \\ C & D \end{matrix}) (\begin{matrix} I_{n} \\ X \end{matrix}) = (\begin{matrix} I_{n} \\ X \end{matrix}) (A + B X) .

Anwendung findet diese Eigenschaft z. B. bei der Nachbesserung von Eigenvektor-Basen: wenn $M$ durch Störungen aus einer Block-Dreieckmatrix hervorging, ist $C$ klein und unter geeigneten Voraussetzungen auch $X$ . Dann kann die Block-Dreieckform in der angegebenen Weise wiederhergestellt werden ([Stewart]).

Kontinuierliche, optimale Steuerung

Bei einem linearen System von Differentialgleichungen $y^{'} (t) = A y (t) + S u (t)$ für einen Zustand $y (t) \in ℝ^{n}$ mit konstanten Koeffizienten $A \in ℝ^{n \times n}$ , $S \in ℝ^{n \times p}$ soll diejenige optimale Steuerung $u (t) \in ℝ^{p}$ bestimmt werden, welche bei unendlichem Zeithorizont das Funktional

\int_{0}^{\infty} (y (t)^{T} Q y (t) + u (t)^{T} R u (t)) d t

minimiert. Darin ist $R \in ℝ^{p \times p}$ symmetrisch und positiv definit, $Q \in ℝ^{n \times n}$ symmetrisch und positiv semi-definit. Verwendet man eine Steuerung durch Rückkopplung $u (t) = - K y (t)$ , ist das Optimum bei unendlichem Zeithorizont gegeben durch $u (t) = - R^{- 1} S^{T} X y (t)$ , wobei $X = X^{T}$ die (maximale) symmetrische Lösung der Riccati-Gleichung

Q + X A + A^{T} X - X S R^{- 1} S^{T} X = 0

ist, für welche die Matrix $A - S K = A - S R^{- 1} S^{T} X$ asymptotisch stabil ist mit allen Eigenwerten in der linken komplexen Halbebene. Für mehr Hintergrund wird auf den Artikel LQ-Regler verwiesen. Diese Gleichung ist also ein Spezialfall der Gleichung aus der Einleitung mit $m = n$ , $C = - Q$ , $D = - A^{T}$ , $B = - S R^{- 1} S^{T} = B^{T}$ . Die hierzu gehörige Blockmatrix

L = (\begin{matrix} A & - S R^{- 1} S^{T} \\ - Q & - A^{T} \end{matrix})

ist eine hamiltonsche Matrix, da $B$ und $C$ hier symmetrisch sind. Bei dieser Matrix $L$ tritt mit jedem Eigenwert $λ$ auch $- λ$ als Eigenwert auf.

Numerische Lösung von Riccati-Gleichungen

Newton-Verfahren

Da die Matrix-Riccati-Gleichung eine algebraische Gleichung vom Grad 2 für die $m \cdot n$ Unbekannten in der Matrix $X$ ist, kann zur Lösung natürlich auch das Newton-Verfahren eingesetzt werden. Die Ableitung der Abbildung $X \mapsto X B X + X A - D X - C$ an der Stelle $X \in ℝ^{m \times n}$ ist die lineare Abbildung

H \mapsto H (A + B X) + (X B - D) H für H \in ℝ^{m \times n} .

Mit einer aktuellen Näherung $X_{k} \in ℝ^{m \times n}$ bekommt man das Inkrement $H_{k} = X_{k + 1} - X_{k}$ zu einer verbesserten Näherung also aus dem linearen Gleichungssystem

H_{k} (A + B X_{k}) + (X_{k} B - D) H_{k} = C + D X_{k} - X_{k} A - X_{k} B X_{k}, k \geq 0,

wo auf der rechten Seite, wie gewohnt, das negative Residuum der Riccati-Gleichung steht. Das Ganze stellt eine Sylvester-Gleichung dar, im zugehörigen Artikel werden numerische Methoden zu ihrer Auflösung behandelt. Diese lineare Gleichung ist eindeutig lösbar, wenn die beiden Matrizen $A + B X_{k}$ und $D - X_{k} B$ keine gemeinsamen Eigenwerte besitzen, z. B. wenn die Realteile aller Eigenwerte von $A + B X_{k}$ oberhalb und die von $D - X_{k} B$ unterhalb eines geeigneten Wertes (etwa null) liegen.

Lösung mit der Signum-Iteration

Involutorische Matrizen $V \in ℝ^{N \times N}$ sind Lösungen der einfachen Riccati-Gleichung $V^{2} = I$ . Auch die Newton-Iteration für diese spezielle Gleichung ist sehr einfach,

V_{k + 1} := \frac{1}{2} (V_{k} + V_{k}^{- 1}), k = 0, 1, \dots,

und man kann zeigen, dass diese Signum-Iteration immer und quadratisch konvergiert, sofern die Startmatrix $V_{0} := M \in ℝ^{N \times N}$ keine rein imaginären Eigenwerte (einschließlich null) besitzt. Alle Matrizen $V_{k}, k \geq 0,$ kommutieren miteinander und besitzen daher die gleiche Jordan-Basis, und dies gilt auch für die Grenzwert-Matrix $S (M) := \lim_{k \to \infty} V_{k}$ . Die zugehörigen Eigenwerte der $V_{k}$ konvergieren gegen $1$ bzw. $- 1$ , wenn der Realteil im Eigenwert von $V_{0} = M$ positiv bzw. negativ war. Daher besitzt $S (M)$ nur die beiden Eigenwerte $\pm 1$ und wird als Signum-Funktion von $M$ bezeichnet, $S (M)$ ist also eine Involution mit $S^{2} = I$ . Da die Eigenwerte von $S (M)$ bekannt sind, bekommt man Basen für die invarianten Unterräume zu $+ 1$ bzw. $- 1$ , indem man Basen für die Kerne von $S (M) - I$ bzw. $S (M) + I$ bestimmt, etwa mit der QR-Zerlegung. Diese sind dann auch Basen für die invarianten Unterräume der Ausgangsmatrix $M$ zu den Eigenwerten mit positivem bzw. negativem Realteil.

Diesen Hintergrund kann man mit $N = m + n$ zur Lösung der ursprünglichen Riccati-Gleichung verwenden, wenn aufgrund der Struktur von $M$ bzw. $H$ die Zahl der Eigenwerte mit positivem und negativem Realteil klar ist. Das gilt für die Quadratwurzel und das Steuerungsproblem.

Für die Quadratwurzel verschwinden die Hauptdiagonalblöcke von $M$ und auch bei den $V_{k}$ ist das so, sei also

M = (\begin{matrix} 0 & I \\ C & 0 \end{matrix}) = V_{0}, V_{k} = (\begin{matrix} 0 & R_{k} \\ P_{k} & 0 \end{matrix}), k \geq 0,

mit $N = 2 n$ . Die Iteration für die $V_{k}$ lautet dann für die Einzelblöcke

P_{k + 1} = \frac{1}{2} (P_{k} + R_{k}^{- 1}), R_{k + 1} := \frac{1}{2} (R_{k} + P_{k}^{- 1}), k = 0, 1, \dots .

Falls $C$ keine reellen und nicht-positiven Eigenwerte besitzt, konvergiert die Iteration gegen die eindeutige Wurzel $\lim_{k \to \infty} P_{k} = C^{1 / 2}$ , deren Eigenwert-Realteile positiv sind.

Bei der allgemeinen Gleichung ist die Signum-Funktion mit $N = m + n$ einsetzbar, wenn die Riccati-Gleichung eine Lösung $X$ besitzt, für die $A + B X$ und $X B - D$ asymptotisch stabil sind, also beide nur Eigenwerte mit negativem Realteil besitzen. Unter dieser Voraussetzung ist $S (A + B X) = - I_{n}$ und $S (D - X B) = + I_{m}$ und für die Blockmatrix $M$ folgt, dass

S (M) (\begin{matrix} I_{n} & 0 \\ X & I_{m} \end{matrix}) = (\begin{matrix} I_{n} & 0 \\ X & I_{m} \end{matrix}) (\begin{matrix} - I_{n} & G \\ 0 & I_{m} \end{matrix})

ist mit einer geeigneten Matrix $G$ . Die ersten $n$ Spalten dieser Gleichung zeigen mit

(S (M) + I_{N}) (\begin{matrix} I_{n} \\ X \end{matrix}) = 0,

dass die Matrix $(\begin{matrix} I_{n} \\ X \end{matrix})$ eine spezielle Basis des Kerns von $S (M) + I_{N}$ ist. Zur Lösung der Riccati-Gleichung sind also mit der Startmatrix $V_{0} := M$ , bzw. $V_{0} := L$ bei der optimalen Steuerung, die Matrizen $V_{k}$ und ihr Grenzwert $S (M)$ zu berechnen. Danach bekommt man $X$ bei Aufteilung von $S (M) + I_{N}$ in Blöcke aus dem folgenden Gleichungssystem

(\begin{matrix} G_{12} \\ G_{22} \end{matrix}) X = - (\begin{matrix} G_{11} \\ G_{21} \end{matrix}) mit S (M) + I_{N} = (\begin{matrix} G_{11} & G_{12} \\ G_{21} & G_{22} \end{matrix}) .

Hier sind $G_{11} \in ℝ^{n \times n}$ , $G_{12}, G_{21}^{T} \in ℝ^{n \times m}$ , $G_{22} \in ℝ^{m \times m}$ .

Beispiel

Bei der Anwendung zur optimalen Steuerung sei mit $n = 2$ und $p = 1$ ,

A = (\begin{matrix} - \frac{2}{3} & - 2 \\ - 1 & - \frac{8}{3} \end{matrix}), S = (\begin{matrix} 1 \\ \frac{1}{2} \end{matrix}), Q = (\begin{matrix} 1 & \frac{5}{3} \\ \frac{5}{3} & \frac{20}{3} \end{matrix}),

sowie $R = 1 \in ℝ^{1 \times 1}$ . Von den Eigenwerten $- \frac{5}{3} \pm \sqrt{3}$ der Matrix $A$ ist einer positiv, das ungeregelte System mit $u \equiv 0$ ist also instabil. Als Blockmatrix $M$ tritt hier die speziellere Form

L = (\begin{matrix} - \frac{2}{3} & - 2 & - 1 & - \frac{1}{2} \\ - 1 & - \frac{8}{3} & - \frac{1}{2} & - \frac{1}{4} \\ - 1 & - \frac{5}{3} & \frac{2}{3} & 1 \\ - \frac{5}{3} & - \frac{20}{3} & 2 & \frac{8}{3} \end{matrix})

auf, sie besitzt die 4 Eigenwerte $\pm \frac{13}{6} \pm \frac{1}{2} \sqrt{13}$ , von denen, wie erwähnt, tatsächlich 2 positiv und 2 negativ sind. In diesem Beispiel lässt sich die Signum-Funktion von $L$ noch über deren Jordan-Normalform berechnen, das Ergebnis ist

S (L) = (\begin{matrix} \frac{25}{338} & - \frac{135}{169} & - \frac{114}{169} & \frac{21}{338} \\ - \frac{75}{338} & - \frac{115}{169} & \frac{21}{338} & - \frac{87}{676} \\ - \frac{789}{676} & \frac{163}{338} & - \frac{25}{338} & \frac{75}{338} \\ \frac{163}{338} & - \frac{433}{169} & \frac{135}{169} & \frac{115}{169} \end{matrix}) .

Tatsächlich kann man direkt verifizieren, dass $S (L)$ involutorisch ist, $S (L)^{2} = I$ , und mit $L$ kommutiert, $L S (L) - S (L) L = 0$ . Eine Basismatrix $Y$ des Kerns von $S (L) + I_{4}$ , also mit $(S (L) + I_{4}) Y = 0$ ist gegeben durch

Y = (\begin{matrix} 1 & 0 \\ \frac{3}{2} & 1 \\ 0 & - 1 \\ 2 & 2 \end{matrix}) = (\begin{matrix} 1 & 0 \\ 0 & 1 \\ \frac{3}{2} & - 1 \\ - 1 & 2 \end{matrix}) (\begin{matrix} 1 & 0 \\ \frac{3}{2} & 1 \end{matrix}) = (\begin{matrix} I_{2} \\ X \end{matrix}) (\begin{matrix} 1 & 0 \\ \frac{3}{2} & 1 \end{matrix}) .

Durch spaltenweise Elimination in den ersten beiden Zeilen von $Y$ wurde dort eine Einheitsmatrix erzeugt und man kann daher im unteren Block die Lösung $X$ der Riccati-Gleichung ablesen mit

X = (\begin{matrix} \frac{3}{2} & - 1 \\ - 1 & 2 \end{matrix}), und es gilt A + B X = A - S R^{- 1} S^{T} X = (\begin{matrix} - \frac{5}{3} & - 2 \\ - \frac{3}{2} & - \frac{8}{3} \end{matrix}) .

Die gesteuerte Systemmatrix $A + B X$ hat jetzt also 2 negative Eigenwerte und das System ist daher asymptotisch stabil.

Die Berechnung der Jordan-Normalform umgeht man mit der in Abschnitt 2.2 beschriebenen Signum-Iteration. Die Konvergenz $V_{k} \to S (L), k \geq 0,$ ist quadratisch, man kann dies direkt an den Eigenwerten der Matrizen $V_{k}$ ablesen. Diese lauten:

\begin{matrix} k = & Eigenwerte V_{k} \\ 0 & \pm 0.363891029 & \pm 3.969442305 \\ 1 & \pm 1.555983235 & \pm 2.110683431 \\ 2 & \pm 1.099331841 & \pm 1.292231811 \\ 3 & \pm 1.004487641 & \pm 1.033043387 \\ 4 & \pm 1.000010024 & \pm 1.000528470 \\ 5 & \pm 1.000000000 & \pm 1.000000140 \\ 6 & \pm 1.000000000 & \pm 1.000000000 \end{matrix}

Tatsächlich ist $‖ V_{6}^{2} - I_{4} ‖ \approx 1 0^{- 14}$ . Setzt man zur Berechnung der Lösung $X$ an Stelle von $S (L)$ die Näherung $V_{6}$ ein und teilt $V_{6} + I_{4}$ auf wie beschrieben,

V_{6} + I_{N} = (\begin{matrix} G_{11} & G_{12} \\ G_{21} & G_{22} \end{matrix})

bekommt man mit Hilfe der reduzierten QR-Zerlegung

(\begin{matrix} G_{12} \\ G_{22} \end{matrix}) = \hat{Q} \cdot \hat{R} \approx (\begin{matrix} - 0.48245 & 0.43832 \\ 0.04444 & - 0.13345 \\ 0.66238 & - 0.36922 \\ 0.57138 & 0.80854 \end{matrix}) (\begin{matrix} 1.39805 & 1.07147 \\ 0 & 1.32121 \end{matrix})

(Angabe aus Platzgründen mit geringer Genauigkeit) die Näherungslösung

\tilde{X} = - {\hat{R}}^{- 1} {\hat{Q}}^{T} (\begin{matrix} G_{11} \\ G_{21} \end{matrix}) = (\begin{matrix} 1.499999999 & - 0.9999999997 \\ - 1.000000000 & 2.000000001 \end{matrix}) .

Diese Näherung ist offensichtlich auf ca. 9 Stellen genau.

Literatur

G.W. Stewart, Error and perturbation bounds for subspaces associated with certain eigenvalue problems, SIAM Review 15, 727–764
N.J. Higham, Functions of matrices: Theory and computation, SIAM, Philadelphia, 2008.
J.D. Roberts, Linear model reduction and solution of the algebraic Riccati equation by use of the sign function, Intern. J. Control 32, 677–687

Matrix-Riccati-Gleichung

Inhaltsverzeichnis

Bedeutung der Riccati-Gleichung

Eigenwertproblem, invariante Unterräume

Kontinuierliche, optimale Steuerung

Numerische Lösung von Riccati-Gleichungen

Newton-Verfahren

Lösung mit der Signum-Iteration

Beispiel

Literatur

Navigationsmenü

Matrix-Riccati-Gleichung

Bedeutung der Riccati-Gleichung

Eigenwertproblem, invariante Unterräume

Kontinuierliche, optimale Steuerung

Numerische Lösung von Riccati-Gleichungen

Newton-Verfahren

Lösung mit der Signum-Iteration

Beispiel

Literatur

Navigationsmenü

Suche