Matrixfunktion

Aus testwiki
Zur Navigation springen Zur Suche springen

Eine Matrixfunktion ist in der Mathematik eine Funktion, welche als Funktionsargument eine quadratische Matrix besitzt. Es gibt unterschiedliche Definitionen solcher Funktionen, deren Funktionswerte meistens Skalare oder wieder quadratische Matrizen sind. Generell versteht man in der Mathematik unter dem Begriff Matrixfunktion explizit den letzteren Fall, das bedeutet

f:n×nn×n.

Zum ersten Fall gehören klassische Funktionen wie die Determinante oder die Spur. Da dieser Fall selbsterklärend ist, wird im Artikel nur der letzte Fall behandelt. Im Artikel werden drei äquivalente Methoden zur Erzeugung einer Matrixfunktion erklärt.

Einführung

Sei A=(aij)ij eine quadratische Matrix, n×n der dazugehörige Matrizenraum und f: eine skalare Funktion. Das Ziel ist es nun, f(A) zu definieren. Dafür gibt es unterschiedliche Möglichkeiten, darunter:

  • Die elementweise Evaluation
f(A)=(f(aij))ij=(f(a11)f(a12)f(a21)f(a22)).
  • Die skalarwertige Evaluation f:n×n.
  • Die matrixwertige Evaluation f:n×nn×n.

Der erste Fall wird häufig von Programmiersprachen verwendet, spielt in der Mathematik aber eine untergeordnete Rolle, da er die Regeln der Matrizen-Algebra bricht.

Den zweiten Fall trifft man häufig an, klassische Beispiele sind die Determinante det(A), die Spur tr(A) und der Spektralradius ρ(A).

Die ersten beiden Fälle sind selbsterklärend, deshalb werden wir nur den letzten Fall behandeln und werden solche Funktionen f:n×nn×n als Matrixfunktionen bezeichnen.

Es existieren noch weitere Fälle, die wir auch nicht behandeln werden, so fällt die Vektorisierung in keine der Kategorien.

Matrixfunktion

Es existieren unterschiedliche Wege, wie wir die matrixwertige Funktion einer skalaren Funktion f: definieren können. Drei übliche Wege sind

Wenn f eine analytische Funktion in einer Umgebung ist, welche das Spektrum umschließt, dann sind alle drei Definitionen äquivalent.

Wir brauchen folgende wichtige Definition, welche uns später garantiert, dass wir die Funktion f auf allen Jordan-Blöcken anwenden können:

Sei An×n eine Matrix und λ1,,λs ihre eindeutigen Eigenwerte, das heißt s ist die Anzahl Eigenwerte ohne Berücksichtigung algebraischer Vielfachheiten. Sei mi die Größe des größten Jordan-Blockes zum Eigenwert λi. Wir nennen eine Funktion f auf dem Spektrum von A definiert, wenn die folgenden Werte existieren
f(j)(λi),j=0,,mi1,i=1,,s[1]

Definition 1 (Jordan-Normalform)

Sei f auf dem Spektrum von An×n definiert. Weiter seien J=Z1AZ die Jordan-Normalform und J1,,Jp die dazugehörigen Jordan-Blöcke mit ihren Größen n1,,np, das heißt n1++np=n und pn. Seien λ1,,λp die zu den J1,,Jp dazugehörigen Eigenwerte.

Die Matrixfunktion ist definiert als

f(A):=Zf(J)Z1=Zdiag(f(J1),,f(Jp))Z1,

wobei die f(J1),,f(Jp) wie folgt definiert sind

f(Jk)=(f(λk)f(1)(λk)f(2)(λk)2!f(nk1)(λk)(nk1)!0f(λk)f(1)(λk)f(nk2)(λk)(nk2)!00f(λk)f(2)(λk)2!f(λk)f(1)(λk)0000f(λk)),f(Jk)nk×nk,k=1,,p.[1]

Erklärung der Matrix

Die Matrix in der Definition lässt sich wie folgt erklären, man bildet die Taylor-Reihe von f(x) und verwendet als Entwicklungspunkt den Eigenwert λk, das heißt

f(x)=i=0f(i)(λk)i!(xλk)i

Nun substituiert man x mit dem Jordan-Block Jk und erhält

f(Jk)=i=0nk1f(i)(λk)i!(JkλkInk)i,

wobei Ink die Identitätsmatrix der Dimension nk ist. Da (JkλkInk) eine nilpotente Matrix mit Nilpotenzindex nk ist, ist die Taylorreihe endlich und somit ein Polynom. Da Matrizen dieselben Operationen wie Polynome besitzen (Addition, Subtraktion, Multiplikation usw.), existiert auch das Matrixpolynom. Durch Ausschreiben der Taylorreihe erhält man die Matrix aus der Definition

f(Jk)=f(λk)Ink+f(1)(λk)(JkλkInk)++f(nk1)(λk)(nk1)!(JkλkInk)nk1,

wobei jeder Term eine der diagonalen Linien in der oberen Dreiecksmatrix bildet. Das macht man nun für jeden Jordan-Block.[1]

Erläuterungen

  • Wenn A diagonalisierbar ist, dann ist die Jordan-Normalform gerade die Diagonalmatrix der Eigenwerte D=diag(λ1,,λn) und die Spalten von Z sind die Eigenvektoren. Das bedeutet wiederum, dass
f(A)=Zf(D)Z1
und somit hat f(A) die gleichen Eigenvektoren wie A und die Eigenwerte von f(A) erhält man durch Anwendung von f auf die Eigenwert von A, das heißt f(λ1),,f(λn).
  • Es spielt keine Rolle, welche Reihenfolge die Jordan-Blöcke haben, das resultierende f(A) wird dasselbe sein.

Beispiel

Seien die Jordan-Blöcke

J1=(2102),J2=(1101)

und die Funktion f(x)=x3 gegeben, dann berechnet man

f(J1)=(f(2)f(2)0f(2))=4(2302),f(J2)=(f(1)f(1)0f(1))=(1301).

Es lässt sich leicht überprüfen, dass die Resultate mit J13 und J23 übereinstimmen.

Nun ist

f(A)=Zf(J)Z1

mit

f(J)=(f(J1)𝟎𝟎f(J2))=(81200080000130001).

Definition 2 (Polynominterpolation)

Sei f auf dem Spektrum von An×n definiert. Weiter sei φ das Minimalpolynom von A, das heißt das monische Polynom mit dem kleinsten Grad, so dass φ(A)=0. Seien λ1,,λs die eindeutigen Eigenwerte und mi die Größe des größten Jordan-Blockes zum Eigenwert λi.

Das Polynom der Hermiteinterpolation P besitzt den Grad

deg(P)i=1smi=deg(φ)

und erfüllt

P(j)(λi)=f(j)(λi),j=0,,mi1,i=1,,s

Die Matrixfunktion ist definiert als[1]

f(A):=P(A).

Erläuterungen

  • Diese Methode basiert darauf, dass G(A) für ein beliebiges Polynom G vollständig durch die Auswertung der Eigenwerte G(λi) bestimmt ist.
  • Es ist wichtig zu verstehen, dass das Polynom P von den Werten von f auf dem Spektrum von A abhängt.

Beispiel

Sei p(x)=13(x+2) das Polynom, welche die oben aufgeführten Interpolationsbedingungen erfüllt. Dann ist für A2×2

p(A)=13(A+2I2).

Definition 3 (Cauchyscher Integralsatz)

Sei An×n und f sei analytisch auf und innerhalb einer geschlossenen Kontur Γ, welche das Spektrum σ(A) umschließt. Die Matrixfunktion ist definiert als

f(A):=12πiΓf(z)(zInA)1dz,

wobei In die Identitätsmatrix ist.[1]

Die Einträge der Matrix f(A) sind explizit

fkj=12πiΓf(z)ekT(zInA)1ejdz,k=1,,n,j=1,,n

wobei ek,ej die entsprechenden Einheitsvektoren sind.

Erläuterungen

  • Da die Kontour Γ um das Spektrum herum geht, gilt Γσ(A)= und die Resolvente
R(A,z)=(zInA)1.
existiert.

Äquivalenz der Definitionen

Die ersten beiden Definition sind äquivalent:[1]

Definition 1Definition 2

Wenn f zusätzlich analytisch auf und innerhalb der Kontour Γ ist, dann sind alle drei Definitionen äquivalent

Definition 1Definition 2Definition 3.

Eigenschaften

Sei An×n und f auf dem Spektrum von A definiert. Dann gilt[2]

  • f(A) und A kommutieren, das heißt Af(A)=f(A)A respektive für den Kommutator gilt [A,f(A)]=0.
  • f(A*)=f(A)*.
  • f(XAX1)=Xf(A)X1.
  • Die Eigenwerte von f(A) sind f(λi), wobei λi die Eigenwerte von A sind.
  • Falls A=diag(A1,A2,,Ap), wobei A1,A2,,Ap Matrizenblöcke auf der Diagonale sind, dann gilt f(A)=diag(f(A1),f(A2),,f(Ap)).
  • f(IpA)=Ipf(A), wobei das Kronecker-Produkt ist.
  • f(AIp)=f(A)Ip, wobei das Kronecker-Produkt ist.

Literatur

Einzelnachweise