Satz von Courant-Fischer

Aus testwiki
Zur Navigation springen Zur Suche springen

Der Satz von Courant-Fischer (auch Minimum-Maximum-Prinzip) ist ein mathematischer Satz aus der linearen Algebra, der eine variationelle Charakterisierung der Eigenwerte einer symmetrischen oder hermiteschen Matrix ermöglicht. Jeder Eigenwert wird dabei als minimaler beziehungsweise maximaler Rayleigh-Quotient von Vektoren aus Untervektorräumen mit bestimmten Dimensionen dargestellt. Der Satz ist nach den Mathematikern Richard Courant und Ernst Fischer benannt. Er dient unter anderem zur Eigenwertabschätzung und zur Analyse numerischer Eigenwertverfahren.

Satz

Ist A𝕂n×n eine symmetrische Matrix (falls 𝕂=) oder hermitesche Matrix (falls 𝕂=) mit aufsteigend sortierten Eigenwerten λ1λn und bezeichnet Xi die Menge der i-dimensionalen Untervektorräume von 𝕂n, i=1,,n, dann hat der i-te Eigenwert von A die Darstellung

λi=minXXimaxxXx0x,Axx,x=maxXXni+1minxXx0x,Axx,x,

wobei , das reelle oder komplexe Standardskalarprodukt ist. Wird der Satz von Courant-Fischer mit absteigend sortierten Eigenwerten angegeben, dann vertauschen sich jeweils Minimum und Maximum.[1]

Anschauliches Beispiel

Der Satz von Courant-Fischer charakterisiert die Eigenwerte einer symmetrischen positiv definiten (3 × 3)-Matrix über Extrempunkte auf einem Ellipsoid

Für eine symmetrische positiv definite (3×3)-Matrix A3×3 lässt sich der Satz von Courant-Fischer folgendermaßen veranschaulichen. Da die Eigenwerte von ATA die Quadrate der stets positiven Eigenwerte von A sind und x,ATAx=Ax,Ax gilt, hat der i-te Eigenwert von A die Darstellung

λi=minXXimaxxXx0Axx=minXXimaxxXx=1Ax,

wobei die euklidische Norm ist. Die Menge {Ax3x=1} hat die Form eines Ellipsoids im dreidimensionalen Raum mit den Halbachsen λ1, λ2 und λ3. Der Satz von Courant-Fischer charakterisiert nun die Eigenwerte von A über bestimmte Extrempunkte auf diesem Ellipsoid:

  • Für den kleinsten Eigenwert λ1 werden alle eindimensionalen Untervektorräume, also alle Ursprungsgeraden, betrachtet. Jede dieser Ursprungsgeraden schneidet das Ellipsoid an zwei diametral gegenüberliegenden Punkten. Von all diesen Punkten wird einer derjenigen mit dem kleinsten Abstand zum Ursprung ausgewählt.
  • Für den zweitkleinsten Eigenwert λ2 werden alle zweidimensionalen Untervektorräume, also alle Ursprungsebenen, betrachtet. Jede dieser Ursprungsebenen schneidet das Ellipsoid in einer Ellipse. Auf jeder dieser Ellipsen wird einer der Punkte mit dem größten Abstand zum Ursprung gesucht und von all diesen Punkten einer derjenigen mit dem kleinsten Abstand zum Ursprung ausgewählt.
  • Für den größten Eigenwert λ3 wird der ganze Raum betrachtet und einer der Punkte auf dem Ellipsoid mit dem größten Abstand zum Ursprung ausgewählt.

Der Ortsvektor eines auf diese Weise ausgewählten Punkts ist dann ein Eigenvektor der Matrix und die Länge dieses Vektors der zugehörige Eigenwert.

Beweis

Der Satz von Courant-Fischer stellt die Eigenwerte einer symmetrischen oder hermiteschen Matrix als minimale beziehungsweise maximale Rayleigh-Quotienten

RA(x)=x,Axx,x

dar. Im Folgenden wird eine obere und eine untere Schranke für den ersten Teil der Behauptung ermittelt. Die zweite Gleichung folgt analog durch Betrachtung von A und der entsprechenden Komplementärräume.

Obere Schranke

Nachdem A symmetrisch oder hermitesch ist, lässt sich eine Orthonormalbasis {x1,,xn} aus Eigenvektoren jeweils zu den Eigenwerten λ1,,λn finden. Bezeichnet

Vi=span(xi,,xn)

die lineare Hülle derjenigen Eigenvektoren, deren Indizes mindestens i sind. Der Schnitt von Vi mit einem i-dimensionalen Untervektorraum XXi ist nicht {0}, denn mit der Dimensionsformel gilt

dim(XVi)=dimX+dimVidim(X+Vi)=i+(ni+1)dim(X+Vi)1.

Daher gibt es einen Vektor vXVi mit v0, der eine Basisdarstellung

v=cixi++cnxn

mit Koeffizienten ci,,cn𝕂 besitzt. Für einen solchen Vektor v gilt nun

v,Av=λici2++λncn2λi(ci2++cn2)=λiv,v.

Für die Vektoren xX eines beliebigen i-dimensionalen Untervektorraums XXi ist daher der maximale Rayleigh-Quotient RA(x)λi und demnach gilt auch

minXXimaxxXx0RA(x)λi.

Untere Schranke

Bezeichne nun

Wi=span(x1,,xi)

die lineare Hülle derjenigen Eigenvektoren, deren Indizes höchstens i sind. Für einen Vektor wWi mit w0 und der Darstellung

w=c1x1++cixi

gilt nun

w,Aw=λ1c12++λici2λi(c12++ci2)=λiw,w.

Der maximale Rayleigh-Quotient aller Vektoren xWi ist also RA(x)=λi und demnach gilt

minXXimaxxXx0RA(x)maxxWix0RA(x)=λi.

Durch Zusammenfassung der beiden Schranken folgt dann der erste Teil der Behauptung.[1]

Verwendung

Eine direkte Konsequenz aus dem Satz von Courant-Fischer ist die Abschätzung

λminRA(x)λmax

für den kleinsten und den größten Eigenwert einer symmetrischen oder hermiteschen Matrix A. Gleichheit gilt dabei jeweils genau dann, wenn x ein Eigenvektor zum jeweiligen Eigenwert ist. Der kleinste und der größte Eigenwert können demnach durch Minimierung beziehungsweise Maximierung des Rayleigh-Quotienten ermittelt werden.

Eine weitere Anwendung besteht in numerischen Stabilitätsaussagen für Eigenwertverfahren. Sind A,B𝕂n×n zwei symmetrische oder hermitesche Matrizen mit aufsteigend sortierten Eigenwerten λ1(A)λn(A) und λ1(B)λn(B), dann gilt

|λi(A)λi(B)|AB

für alle i=1,,n, wobei eine beliebige natürliche Matrixnorm ist. Wird demnach eine Matrix A durch eine Matrix B angenähert (deren Eigenwerte einfacher zu berechnen sind), dann ist der dadurch entstehende Fehler durch die Norm der Differenz der beiden Matrizen beschränkt.[2]

Varianten

Von dem Satz von Courant-Fischer existiert auch folgende Variante zur Darstellung der Singulärwerte einer Matrix. Ist A𝕂m×n eine (nicht notwendigerweise quadratische) Matrix mit aufsteigend sortierten Singulärwerten σ1σmin{m,n} und bezeichnet die euklidische Norm, dann hat der i-te Singulärwert von A die Darstellung

σi=minXXimaxxXx=1Ax=maxXXni+1minxXx=1Ax,

wobei Xi wieder die Menge der i-dimensionalen Untervektorräume von 𝕂n ist. Dieses Resultat folgt aus dem Satz von Courant-Fischer über die Darstellung der Singulärwerte von A als Wurzeln der Eigenwerte von AHA beziehungsweise AAH.[3]

Verallgemeinerungen dieser Aussage existieren auch zur Darstellung des Spektrums selbstadjungierter Operatoren auf Hilberträumen, was zum Beispiel beim Rayleigh-Ritz-Prinzip eingesetzt wird.

Siehe auch

Literatur

Originalarbeiten

Einzelnachweise