Arnoldi-Verfahren

Aus testwiki
Zur Navigation springen Zur Suche springen

In der numerischen Mathematik ist das Arnoldi-Verfahren wie das Lanczos-Verfahren ein iteratives Verfahren zur Bestimmung einiger Eigenwerte und zugehöriger Eigenvektoren. Es ist nach Walter Edwin Arnoldi benannt. Im Arnoldi-Verfahren wird zu einer gegebenen Matrix An×n und einem gegebenen Startvektor qn eine orthonormale Basis des zugeordneten Krylowraumes

𝒦m(A,q)=span{q,Aq,A2q,Am1q}

berechnet. Da die Spalten Aiq bis auf eine etwaige Skalierung genau den in der Potenzmethode berechneten Vektoren entsprechen, ist es klar, dass der Algorithmus instabil wird, wenn zuerst diese Basis berechnet würde und anschließend, zum Beispiel nach Gram-Schmidt, orthonormalisiert würde.

Der Algorithmus kommt allerdings ohne die vorherige Aufstellung der sogenannten Krylowmatrix Km(A,q)=(q,Aq,A2q,,Am1q) aus.

Der Algorithmus (MGS-Variante)

Gegeben sei eine quadratische Matrix An×n und ein (nicht notwendig normierter) Startvektor r0n.

for k and rk1=0 do

hk,k1rk1
qkrk1/hk,k1
rkAqk
for j=1,,k do
hjkqj,rk
rkrkqjhjk
end for

end for

Einsatz beim Eigenwertproblem

Nach m Schritten hat das Arnoldi-Verfahren im Wesentlichen eine Orthonormalbasis in der Matrix Qm=(q1,,qm) bestimmt und eine Hessenbergmatrix

Hm=(h11h12h1mh21h22h2m0hm,m1hmm).

Für diese im Arnoldi-Verfahren berechneten Größen gilt der Zusammenhang

AQm=QmHm+hm+1,mqm+1emT

wo em der m-te Einheitsvektor ist. Daraus folgt:

  • Für hm+1,m=0 definiert die Gleichung AQm=QmHm einen invarianten Unterraum der Matrix A und alle m Eigenwerte der Matrix Hm sind auch Eigenwerte von A. In diesem Fall bricht das Arnoldi-Verfahren vorzeitig ab aufgrund der zweiten Bedingung rk1=0.
  • Wenn hm+1,m klein ist, sind die Eigenwerte von Hm gute Approximationen an einzelne Eigenwerte von A. Insbesondere Eigenwerte am Rand des Spektrums werden gut approximiert ähnlich wie beim Lanczos-Verfahren.

Anwendung auf Lineare Systeme, FOM und GMRES

Das Arnoldi-Verfahren ist außerdem der Kern-Algorithmus des GMRES-Verfahrens zur Lösung Linearer Gleichungssysteme und der Full Orthogonalization Method (FOM). In der FOM baut man den Krylow-Unterraum und die Basen Qm mit dem Startvektor r0=b auf und ersetzt beim linearen System Ax=b die Matrix A durch die Approximation QmHmQmT. Die rechte Seite ist also Element des Krylowraums, b=βq1. Die Näherungslösung xmKm(A,b) im Krylow-Raum wird in der Basisdarstellung xm=Qmym bestimmt anhand des Systems

Hmym=βe1.

Dies entspricht der Bedingung QmT(bAxm)=0 und definiert die Lösung xm durch die Orthogonalitätsbedingung bAxmKm(A,q). Daher ist die FOM ein Galerkin-Verfahren. Löst man das kleine System Hmym=βe1 mit einer QR-Zerlegung von Hm, so unterscheidet sich die Methode nur minimal vom Pseudocode im Artikel GMRES-Verfahren.

Literatur