Hauptachsentransformation

Aus testwiki
Version vom 12. September 2024, 21:00 Uhr von imported>FZ2 (growthexperiments-addlink-summary-summary:3|0|0)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Die Hauptachsentransformation (HAT) ist in der euklidischen Geometrie ein Verfahren, mit dem man die Gleichungen von Quadriken (Ellipse, Hyperbel, …; Ellipsoid, Hyperboloid, …) durch eine geeignete Koordinatentransformation auf die jeweilige Normalform bringt und damit ihren Typ und ihre geometrischen Eigenschaften (Mittelpunkt, Scheitel, Halbachsen) bestimmen kann. Damit Längen und Winkel bei der Transformation nicht verändert werden, muss man orthogonale Koordinatentransformationen (Drehungen, Spiegelungen, Verschiebungen) verwenden (s. u.). Das wesentliche Hilfsmittel dieses Verfahrens ist die Diagonalisierung einer symmetrischen Matrix mit Hilfe einer orthogonalen Matrix.

Hauptachsentransformation einer Ellipse mit Hilfe einer Drehung des Koordinatensystems

Neben der rein mathematisch-geometrischen Bedeutung der Hauptachsentransformation zur Bestimmung des Typs von Quadriken wird sie in zahlreichen Disziplinen der theoretischen Physik sowie in der Informatik und den Geowissenschaften eingesetzt (s. Abschnitt Anwendung).

Einfache Beispiele und Motivation des Verfahrens

Beispiel 1

Dass die Gleichung

x2+y24x+2y4=0

den Kreis mit Mittelpunkt (2,1) und Radius 3 beschreibt, erkennt man, indem man die Gleichung durch quadratische Ergänzung auf die Form (x2)2+(y+1)2=9 bringt.

Ellipse mit achsenparallelen Hauptachsen

Beispiel 2

Auch die Gleichung

4x2+9y28x+36y+4=0

lässt sich durch quadratische Ergänzung auf die Form (x1)29+(y+2)24=1 bringen und man erkennt, dass es sich um eine Ellipse mit Mittelpunkt (1,2) und den Halbachsen a=3,b=2 handelt.

Beispiel 3

Deutlich schwieriger ist es, der Gleichung

5x223xy+7y216=0

anzusehen, dass es sich um eine Ellipse mit den Halbachsen a=2,b=2 handelt. Das Problem rührt von dem „gemischten“ Term xy her. Er ist ein Zeichen dafür, dass die zueinander senkrechten Hauptachsen in diesem Fall nicht parallel zu den Koordinatenachsen sind. Dies lässt sich durch Anwendung einer geeigneten Drehung des Koordinatensystems (um den Nullpunkt) ändern. Der Drehwinkel ergibt sich aus den Koeffizienten bei x2,y2,xy (s. Kegelschnitte). Dieses anschauliche Verfahren wird aber bei der Untersuchung von Quadriken im euklidischen Raum sehr unübersichtlich. Die Lineare Algebra stellt ein Verfahren zur Verfügung, das in jeder Dimension anwendbar ist: die Diagonalisierung symmetrischer Matrizen. Hierzu schreibt man die Gleichung der Quadrik mit Hilfe einer symmetrischen Matrix: Auf der Diagonalen der Matrix stehen die Koeffizienten von x2,y2, auf der Nebendiagonale jeweils die Hälfte des Koeffizienten von xy.

5x223xy+7y216=(xy)(5337)(xy)16=xTAx16=0

Nun diagonalisiert man die Matrix A durch Anwendung einer orthogonalen Koordinatentransformation (Drehung oder Drehspiegelung im 2). Bei einer orthogonalen Koordinatentransformation werden Längen nicht verändert, sodass man nach der Transformation und einer eventuell nötigen quadratischen Ergänzung (s. oben) die Längen der Halbachsen und Lagen von Mittelpunkt und Scheitel ablesen kann.

Diagonalisierung einer symmetrischen Matrix (Hauptachsentheorem)

Zu einer symmetrischen (n×n)-Matrix A gibt es immer eine orthogonale Matrix S, sodass

DA=STAS

eine Diagonalmatrix ist. Die Hauptdiagonale der Diagonalmatrix DA besteht aus den Eigenwerten λ1,,λn der Matrix A. Eine symmetrische (n×n)-Matrix besitzt immer n reelle Eigenwerte unter Beachtung der jeweiligen Vielfachheit. Für die Matrix S wählt man als Spaltenvektoren n orthonormierte Eigenvektoren e1,,en der Matrix. (Eigenvektoren einer symmetrischen Matrix zu verschiedenen Eigenwerten sind immer orthogonal. Falls ein Eigenraum eine Dimension größer als 1 hat, muss man beispielsweise mit Hilfe des Gram-Schmidtschen Orthogonalisierungsverfahrens eine Orthonormalbasis des Eigenraums bestimmen.) Die Determinante von S ist ±1. Damit im ebenen Fall S eine Drehmatrix ist, muss man die Orientierungen der benutzten Eigenvektoren so wählen, dass detS=1 ist.

Interpretiert man die Matrix A als lineare Abbildung im n, so kann man die Matrix S als eine Transformation auf die neue Basis e1,,en auffassen. Zwischen den alten und neuen Koordinaten besteht die Beziehung x=Sξ. Die Wirkung der Matrix A im neuen Koordinatensystem übernimmt die Diagonalmatrix DA. Eine wichtige Eigenschaft der (orthogonalen!) Matrix S ist S1=ST. Damit lassen sich auch leicht alte Koordinaten in neue umrechnen: ξ=S1x=STx.

Die Gleichung einer Quadrik

i,j=1naijxixj+2i=1nbixi+c=0

hat einen quadratischen Anteil i,j=1naijxixj, der durch eine (o.B.d.A. symmetrische) Matrix (aij) beschrieben werden kann. Mit dem Hauptachsentheorem wird dieser quadratische Anteil in die „Diagonalgestalt“ i=1nλiξi2 transformiert. Es kommen danach also keine gemischten Terme ξiξj mit i=j mehr vor.

Hauptachsentransformation eines Kegelschnitts

Beschreibung der Methode

Ein Kegelschnitt im 2 genügt einer Gleichung

ax2+bxy+cy2+dx+ey+f=0.

Diese Gleichung lässt sich in Matrizenform so schreiben:

(xy)(ab/2b/2c)(xy)+dx+ey+f=0.
1. Schritt
Setze A=(ab/2b/2c).
2. Schritt
Bestimme die Eigenwerte der Matrix A als Lösungen der Eigenwertgleichung
det(AλE)=0. Die Eigenwerte seien λ1,λ2.
3. Schritt
Bestimme normierte Eigenvektoren aus den 2 Gleichungssystemen:
(Aλ1E)x=0e1
(Aλ2E)x=0e2
4. Schritt
Setze S=(e1e2) und ersetze x,y durch ξ,η mit Hilfe von (xy)=S(ξη).
5. Schritt
Es ergibt sich die Gleichung des Kegelschnitts in den neuen Koordinaten:
λ1ξ2+λ2η2+εξ+δη+ω=0
Da der quadratische Teil in dieser Gleichung durch die Eigenwerte als Koeffizienten und das Verschwinden des gemischten Teils festliegt, müssen nur im linearen Teil dx+ey die alten Koordinaten x und y ersetzt werden.
6. Schritt
Durch quadratische Ergänzung erhält man die Mittelpunkts- bzw. Scheitelform des Kegelschnitts und kann Mittelpunkt (bei Ellipse, Hyperbel, …) bzw. Scheitel (bei Parabel) und eventuell Halbachsen ablesen.
7. Schritt
Mit Hilfe der Beziehung (xy)=S(ξη) lassen sich schließlich die x-y-Koordinaten von Mittelpunkt und Scheitel berechnen.

Beispiel 3 (Fortsetzung)

Hauptachsentransformation: Ellipse mit NICHT achsenparallelen Hauptachsen
5x223xy+7y216=0
1. Schritt
A=(5337)
2. Schritt
det(AλE)=|5λ337λ|=λ212λ+32=(λ8)(λ4)=0
λ1=8, λ2=4
3. Schritt
Ein normierter Eigenvektor zu λ1=8 ergibt sich aus dem linearen Gleichungssystem
3x3y=03xy=0 zu e1=(1/23/2).
Ein normierter Eigenvektor zu λ2=4 ergibt sich aus dem linearen Gleichungssystem
x3y=03x+3y=0 zu e2=(3/21/2).
4. Schritt
S=(1/23/23/21/2) und aus (xy)=S(ξη) ergibt sich: x=12ξ+123ηy=123ξ+12η
Wegen detS=1 ist die Transformation eine Drehung und zwar um den Winkel φ=60. Letzteres folgt aus cosφ=1/2, sinφ=3/2 (s. Drehmatrix).
5. Schritt
8ξ2+4η2=16ξ22+η24=1
6. Schritt
Da in der letzten Gleichung weder ξ noch η linear vorkommen, ist keine quadratische Ergänzung nötig.
Ergebnis: Der Kegelschnitt ist eine Ellipse mit Mittelpunkt im Nullpunkt und den Halbachsen a=2,b=2. Die Scheitel sind in ξ-η-Koordinaten: (±2,0)ξη, (0,±2)ξη
7. Schritt
Die x-y-Koordinaten der Scheitel sind (s. 4. Schritt):
(12,32), (12,32), (3,1), (3,1)

Bemerkung: Das neue Koordinatensystem und die Matrix S sind nicht eindeutig bestimmt. Beide hängen von der Reihenfolge der Eigenwerte und der Orientierung der gewählten Eigenvektoren ab. Die Lage des Kegelschnitts (Mittelpunkt, Scheitel) im x-y-Koordinatensystem ist aber durch die gegebene Kegelschnittgleichung eindeutig bestimmt.

Beispiel 4: Hyperbel

Hauptachsentransformation einer Hyperbel

Der Kegelschnitt hat die Gleichung:

3x26xy5y2+4810x+6410y19=0
1. Schritt
A=(3335)
2. Schritt
det(AλE)=|3λ335λ|=λ2+2λ24=0
λ1=6, λ2=4
3. Schritt
e1=110(13),e2=110(31)
4. Schritt
S=(110310310110)x=110ξ+310ηy=310ξ+110η
5. Schritt
6ξ2+4η2+24ξ8η19=0
6. Schritt
6(ξ2)24(η1)2=1
Der Kegelschnitt ist eine Hyperbel mit dem Mittelpunkt (2,1)ξη und den Halbachsen a=16, b=12.
7. Schritt

Die x-y-Koordinaten des Mittelpunktes sind (110,710) (s. 4. Schritt).

Beispiel 5: Parabel

Hauptachsentransformation einer Parabel

Der Kegelschnitt hat die Gleichung:

x223xy+3y243x4y+24=0

Es ist

A=(1333).

Die zugehörigen Eigenwerte sind λ1=0, λ2=4 und die Transformationsmatrix ist S=(3/21/21/23/2). In ξ-η-Koordinaten genügt der Kegelschnitt der Gleichung:

4η28ξ+24=0ξ=12η2+3

Also ist der Kegelschnitt eine Parabel mit dem Scheitel (3,0)ξη bzw. in x-y-Koordinaten (323,32). Die Matrix S beschreibt eine Drehung um den Winkel 30.

Hauptachsentransformation von Flächen

Die Hauptachsentransformation für Quadriken im Raum läuft nach der gleichen Methode ab wie im ebenen Fall für Kegelschnitte. Allerdings sind die Rechnungen deutlich umfangreicher.

Beispiel: Hyperboloid

Mit Hilfe der Hauptachsentransformation soll festgestellt werden, welche Fläche durch die folgende Gleichung beschrieben wird:

x2+3y2z2+6xz=1
1. Schritt
A=(103030301)
2. Schritt
det(AλE)=|1λ0303λ0301λ|=(3λ)(λ2+2λ8)=0
Die Eigenwerte sind: λ1=3, λ2=2, λ3=4
3. Schritt

Bestimmung der Eigenvektoren:

zu λ1=3 :4x3z=00=03x4z=0e1=(010)
zu λ2=2 :e2=12(101)
und zu λ3=4 :e3=12(101)
Hauptachsentransformation: einschaliges Hyperboloid in ξ-η-ζ-Koordinaten mit 2 Scheiteln und einem Nebenscheitel
4. Schritt
S=(0121210001212)x=12η+12ζy=ξz=12η12ζ
5. Schritt
3ξ2+2η24ζ2=1
6. Schritt

Die Quadrik ist ein einschaliges Hyperboloid (s. Liste der Quadriken) mit dem Mittelpunkt im Nullpunkt, den Halbachsen a=13, b=12, c=12, den Scheiteln (±a,0,0),(0,±b,0) und den Nebenscheiteln (0,0,±c).

7. Schritt

Mit den Beziehungen in Schritt 4 erhält man die Scheitel bzw. Nebenscheitel in x-y-z-Koordinaten: (0,±a,0),(±b2,0,±b2),(±c2,0,±c2) (der Mittelpunkt ist der Nullpunkt).

Beispiel: Kegel

Gegeben sei die Gleichung

x22xy+y22yz+z22xz+2x+2y+2z3=0.

Mittels Hauptachsentransformation soll diese Gleichung nun in eine Normalform überführt werden und der Typ der durch die Gleichung dargestellten Quadrik bestimmt werden.

1. Schritt
A=(111111111)
2. Schritt
Die Eigenwerte der Matrix A sind λ1=λ2=2,λ3=1.
3. Schritt

Der Eigenraum zu λ1,2=2 ist Lösung der (einen!) Gleichung xyz=0. Es müssen zwei zueinander orthogonale Lösungsvektoren bestimmt werden. Eine Lösung ist v1=(1,1,0)T. Ein dazu orthogonaler Lösungsvektor muss zusätzlich die Gleichung x+y=0 erfüllen. Offensichtlich erfüllt der Vektor (1,1,2)T beide Gleichungen. Nun müssen beide Vektoren noch normiert werden:

e1=12(110),e2=16(112)

Ein normierter Eigenvektor zu λ3=1 ist :e3=13(111).

4. Schritt
S=(12161312161302613)x=12ξ16η+13ζy=12ξ16η+13ζz=26η+13ζ
Hauptachsentransformation eines Kegels (Die Spitze ist der Punkt (1,1,1), der Mittelpunkt des dargestellten Basiskreises ist der Nullpunkt)
5. Schritt
2ξ2+2η2ζ2+23ζ3=0
6. Schritt

Quadratische Ergänzung liefert

ξ2+η2(ζ3)22=0.
Die Quadrik ist ein senkrechter Kreiskegel mit der Spitze im Punkt (0,0,3) und der ζ-Achse als Rotationsachse.
7. Schritt

Die Spitze ist in x-y-z-Koordinaten der Punkt (1,1,1). Die Kegelachse hat die Richtung (1,1,1)T.

Hauptachsentransformation in beliebiger Dimension

Eine Quadrik Q im n ist (analog zu n=2) die Lösungsmenge einer allgemeinen quadratischen Gleichung (s. Quadrik):

Q={xnxTAx+2bTx+c=0}

wobei A=(aij)n×n eine symmetrische Matrix und b=(bi)n sowie x=(xi)n Spaltenvektoren sind.

Die Hauptachsentransformation in diesem allgemeinen Fall läuft nach dem gleichen Schema ab wie für Kegelschnitte (s. o.). Nach der Diagonalisierung wird allerdings oft noch eine Verschiebung des Nullpunktes in den Mittelpunkt oder Scheitel der Quadrik vorgenommen, so dass die Normalform der Quadrik entsteht, an der man die Art und Eigenschaften der Quadrik ablesen kann.

Anwendung

In der theoretischen Physik wird die Hauptachsentransformation in der klassischen Mechanik zur Beschreibung der Kinematik starrer Körper verwendet: Hier können über eine Hauptachsentransformation des Trägheitstensors, der die Trägheiten des Körpers bezüglich Drehungen um verschiedene Achsen angibt, eventuell vorhandene Deviationsmomente – zum Beispiel bei einem Kreisel – zum Verschwinden gebracht werden.

Ein Deviationsmoment ist ein Maß für das Bestreben eines starren Körpers, seine Drehachse zu verändern. Deviationsmomente werden mit den Trägheitsmomenten in Trägheitstensoren zusammengefasst, wobei die Trägheitsmomente sich auf der Hauptdiagonalen des Tensors, die Deviationsmomente auf den Nebendiagonalen befinden. Wie oben gezeigt, kann der symmetrische Trägheitstensor auf eine Diagonalform gebracht werden. Die durch die Hauptachsentransformation festgelegten Achsen des neuen, angepassten Koordinatensystems bezeichnet man als Hauptträgheitsachsen, das neue Koordinatensystem als Hauptachsensystem. Die Diagonalelemente des transformierten Tensors werden konsequent Hauptträgheitsmomente genannt.

Auch in weiteren Teilgebieten der klassischen Mechanik wird die Hauptachsentransformation eingesetzt, so zum Beispiel in der Festigkeitslehre zur Berechnung der Hauptspannungen, die auf einen Körper einwirken. Häufig angewandt werden Hauptachsentransformationen weiterhin in der relativistischen Mechanik zur Basisdarstellung der Raumzeit im vierdimensionalen Minkowski-Raum oder zum Beispiel in der Elektrostatik beim Quadrupolmoment und anderen höheren Multipolmomenten.

Außerdem ist die Hauptachsentransformation in der multivariaten Statistik ein Teil der Hauptkomponentenanalyse, die vor allem in der Bildverarbeitung auch als Karhunen-Loève-Transformation bezeichnet wird. Manchmal werden die Begriffe synonym gebraucht, doch sind beide Transformationen nicht identisch.[1]

Praktisch wird die Hauptachsentransformation als Teil der Hauptkomponentenanalyse dazu verwendet, die Größe umfangreicher Datensätze ohne wesentlichen Datenverlust zu vermindern. Dabei werden vorhandene Beziehungen zwischen einzelnen statistischen Variablen durch Überführung in ein neues, linear unabhängiges problemangepasstes Koordinatensystem so weit wie möglich reduziert. Beispielsweise kann die Anzahl der benötigten Signalkanäle verringert werden, indem diese nach Varianz geordnet und die Kanäle geringster Varianz gegebenenfalls ohne relevanten Datenverlust aus dem Datensatz entfernt werden. Dadurch können Effizienz und Ergebnis einer späteren Analyse der Daten verbessert werden.[2]

In der elektronischen Bildverarbeitung wird die Reduktion der Datensatzgröße durch Hauptkomponentenanalysen besonders in der Fernerkundung durch Satellitenbilder sowie den zugehörigen naturwissenschaftlichen Disziplinen der Geodäsie, Geographie, Kartografie und Klimatologie eingesetzt. Hier kann die Qualität der Satellitenaufnahmen durch Unterdrückung des Rauschens mittels Hauptkomponentenanalyse deutlich verbessert werden.[3]

In der Informatik wird die Hauptachsentransformation vor allem bei der Mustererkennung, zur Schaffung künstlicher neuronaler Netze, einem Teilgebiet der künstlichen Intelligenz, zur Datenreduktion angewandt (s. Hauptkomponentenanalyse).[3]

Literatur

  • Burg & Haf & Wille: Höhere Mathematik für Ingenieure. Band II (Lineare Algebra), Teubner-Verlag, Stuttgart 1992, ISBN 3 519 22956 0, S. 214, 335.
  • Meyberg & Vachenauer: Höhere Mathematik 1. Springer-Verlag, 1995, ISBN 3 540 59188 5, S. 341.
  • W. Nolting: Grundkurs Theoretische Physik 1: Klassische Mechanik. 7. Auflage. Springer, Berlin 2004, ISBN 3-540-21474-7.
  • T. Fließbach: Mechanik. 2. Auflage. Spektrum, Heidelberg 1996, ISBN 3-86025-686-6.
  • W. Greiner: Theoretische Physik. Band 2. Mechanik Teil 2. 5. Auflage. Harri Deutsch, Thun / Frankfurt am Main, 1989, ISBN 3-8171-1136-3.

Einzelnachweise

  1. Vgl. Skript Mustererkennung. Kap. 5.2: Karhunen-Loeve-Transformation. (PDF) Laboratorium für Nachrichtenverarbeitung, Universität Hannover.
  2. Vorlage:Webarchiv.
  3. 3,0 3,1 Vorlage:Webarchiv (Postscript). Diplomarbeit im Fach Informatik, Friedrich-Alexander-Universitat Erlangen-Nürnberg.