Hesse-Matrix

Aus testwiki
Zur Navigation springen Zur Suche springen

Die nach Otto Hesse benannte Hesse-Matrix ist eine quadratische Matrix, die in der mehrdimensionalen reellen Analysis ein Analogon zur zweiten Ableitung einer Funktion ist.

Die Hesse-Matrix taucht bei der Approximation einer mehrdimensionalen Funktion in der Taylor-Entwicklung auf. Sie ist unter anderem in Zusammenhang mit der Optimierung von Systemen von Bedeutung, die durch mehrere Parameter beschrieben werden, wie sie beispielsweise in den Wirtschaftswissenschaften, in der Physik, theoretischen Chemie oder in den Ingenieurwissenschaften häufig auftreten.

Definition

Sei f:Dn eine zweimal stetig differenzierbare Funktion. Dann ist die Hesse-Matrix von f am Punkt x=(x1,,xn)D definiert durch

Hf(x):=(2fxixj(x))i,j=1,,n=(2fx1x1(x)2fx1x2(x)2fx1xn(x)2fx2x1(x)2fx2x2(x)2fx2xn(x)2fxnx1(x)2fxnx2(x)2fxnxn(x)).

Mit 2fxixj werden die zweiten partiellen Ableitungen bezeichnet. Die Hesse-Matrix entspricht der Transponierten der Jacobi-Matrix des Gradienten, ist aber bei stetigen zweiten Ableitungen wegen der Vertauschbarkeit der Differentiationsreihenfolge symmetrisch,[1] so dass das Transponieren der Matrix keine Änderung bewirkt.

Beispiele

  • Für f:2, f(x,y)=x3+y33xy gilt
fx(x,y)=3x23y und fy(x,y)=3y23x,
und für die zweiten Ableitungen dementsprechend:
2fxx(x,y)=6x und
2fxy(x,y)=3, beziehungsweise
2fyx(x,y)=3, sowie
2fyy(x,y)=6y.
Somit ergibt sich die Hessematrix zu:
Hf(x,y)=(6x336y).
  • Die Funktion r:n, r(x)=x=j=1nxj2, die jedem Vektor im n seine euklidische Norm zuordnet, ist für alle x0 zweimal stetig differenzierbar und es gilt nach der Kettenregel
rxj(x)=xjx
sowie weiter nach der Quotientenregel
2rxixj(x)=δijxxjxixx2=1xδijxixjx3,
wobei δij=xjxi das Kronecker-Delta bezeichnet. In Matrixschreibweise folgt also
Hr(x)=1xEn1x3xxT
mit der n×n-Einheitsmatrix En.

Anwendungen

Taylor-Entwicklung

Die Taylor-Entwicklung einer zweimal stetig differenzierbaren Funktion f:D mit Dn um eine Entwicklungsstelle aD beginnt mit

T(x)=f(a)+(xa)Tgradf(a)+12(xa)THf(a)(xa)+

Die Terme zweiter Ordnung dieser Entwicklung sind also durch die quadratische Form gegeben, deren Matrix die an der Entwicklungsstelle ausgewertete Hesse-Matrix ist.

Extremwerte

Mit Hilfe der Hesse-Matrix lässt sich der Charakter der kritischen Punkte einer Abbildung in n bestimmen. Dazu bestimmt man für die zuvor ermittelten kritischen Punkte die Definitheit der Hesse-Matrix.

  • Ist die Matrix an einer Stelle positiv definit, so befindet sich an diesem Punkt ein lokales Minimum der Funktion.
  • Ist die Hesse-Matrix dort negativ definit, so handelt es sich um ein lokales Maximum.
  • Ist sie indefinit, dann handelt es sich um einen Sattelpunkt der Funktion.

Falls die Hesse-Matrix an der untersuchten Stelle nur semidefinit ist, so versagt dieses Kriterium und der Charakter des kritischen Punktes muss auf anderem Wege ermittelt werden. Welcher dieser Fälle vorliegt, kann – wie unter Definitheit beschrieben – zum Beispiel mit Hilfe der Vorzeichen der Eigenwerte der Matrix oder ihrer Hauptminoren entschieden werden.

Beispiel: Die Funktion f(x,y)=x2y2 hat in (0,0) einen kritischen Punkt, aber H(f)(0,0)=(2002) ist weder positiv noch negativ definit und auch nicht semidefinit, sondern indefinit. Die Funktion hat in diesem Punkt kein Extremum, sondern einen Sattelpunkt, in dem sich zwei Höhenlinien schneiden.

Konvexität

Es besteht zudem ein Zusammenhang zwischen der positiven Definitheit der Hesse-Matrix und der Konvexität einer zweimal stetig differenzierbaren Funktion f, die auf einer offenen, konvexen Menge D definiert ist: Eine solche Funktion ist genau dann konvex, wenn ihre Hesse-Matrix überall in D positiv semidefinit ist. Ist die Hesse-Matrix sogar positiv definit in D, dann ist die Funktion auf D strikt konvex.

Entsprechend gilt: Eine zweimal stetig differenzierbare Funktion f ist auf ihrer konvexen Definitionsmenge D genau dann konkav, wenn ihre Hesse-Matrix negativ semidefinit ist. Ist die Hessematrix sogar negativ definit auf D, so ist f auf D strikt konkav.

Ist f auf ihrer Definitionsmenge D strikt konvex, so besitzt f höchstens ein globales Minimum auf D. Jedes lokale Minimum ist zugleich das (einzige) globale Minimum. Ist f strikt konkav, so besitzt f höchstens ein globales Maximum. Jedes lokale Maximum ist zugleich ihr (einziges) globales Maximum.[2]

Laplace-Operator

Der Laplace-Operator einer zweimal stetig differenzierbaren Funktion f:D mit Dn ist gleich der Spur ihrer Hesse-Matrix und daher unabhängig von der Wahl der Koordinaten:

Δf=Spur(Hf)

Siehe auch

Einzelnachweise

Literatur und Einzelnachweise

  • Konrad Königsberger: Analysis. Band 2. 3. überarbeitete Auflage. Springer-Verlag, Berlin u. a. 2000, ISBN 3-540-66902-7.