Variationsrechnung

Aus testwiki
Version vom 7. März 2025, 20:37 Uhr von imported>Christian1985 (Skripte: hier gibt es genug weblinks, diese hier können weg.)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Die Variationsrechnung ist ein mathematisches Teilgebiet der Analysis, in welchem kleine Änderungen in Funktionen und Funktionalen studiert werden, um Minima und Maxima von Funktionalen zu bestimmen.

Dieses (unendlichdimensionale) Optimierungsproblem mit Anwendungen in der theoretischen und der mathematischen Physik wurde um die Mitte des 18. Jahrhunderts insbesondere von Leonhard Euler und Joseph-Louis Lagrange zu einem Fachgebiet entwickelt.[1] Die Variationsrechnung, ihre verwandten Themen und Anwendungen sind Gegenstand aktueller Lehre,[2] Weiterentwicklung[3] und Forschung.[4] Die Frage „Wie können die Methoden der Variationsrechnung weiterentwickelt werden?“ ist das 23. Problem auf Hilberts Liste. Weitere Beiträge lieferten u. a. die Mathematiker Ennio De Giorgi und Charles Morrey. Ihre Forschungsarbeiten führte zur Lösung des 19. Hilbert-Problems mit der Herausforderung „Sind alle Lösungen von regulären Variationsproblemen analytisch?“. Die von der deutschen Mathematikerin Emmy Noether entwickelten Theoreme, die mit der Variationsrechnung zusammenhängen,[5][6] spielen heutzutage eine bedeutende Rolle in der modernen Physik (Symmetrie). Der US-Mathematikerin Karen Uhlenbeck wurde 2019 der Abelpreis zugesprochen.[7] Uhlenbeck hat sich intensiv mit der Variationsrechnung befasst.[8]

Vorlage:Anker Grundlagen

Die Variationsrechnung beschäftigt sich mit reellen Funktionen von Funktionen, die auch Funktionale genannt werden. Solche Funktionale können etwa Integrale über eine unbekannte Funktion und ihre Ableitungen sein. Dabei interessiert man sich für stationäre Funktionen, also solche, für die das Funktional ein Maximum, ein Minimum (Extremale)[9] oder einen Sattelpunkt annimmt. Einige klassische Probleme können elegant mit Hilfe von Funktionalen formuliert werden.

Das Schlüsseltheorem der Variationsrechnung ist die Euler-Lagrange-Gleichung, genauer „Euler-Lagrange’sche Differentialgleichung“. Diese beschreibt die Stationaritätsbedingung eines Funktionals. Wie bei der Aufgabe, die Maxima und Minima einer Funktion zu bestimmen, wird sie aus der Analyse kleiner Änderungen (Variation) um die angenommene Lösung hergeleitet. Die Euler-Lagrangesche Differentialgleichung ist lediglich eine notwendige Bedingung. Weitere notwendige Bedingungen für das Vorliegen einer Extremalen lieferten Adrien-Marie Legendre und Alfred Clebsch sowie Carl Gustav Jacob Jacobi. Eine hinreichende, aber nicht notwendige Bedingung stammt von Karl Weierstraß.[10][11] Weierstraß präsentierte ein Gegenbeispiel zum Dirichletschen Prinzip. Basierend auf dieser neuen Erkenntnis („Existenztheorien“)[12] entwickelte sich die Variationsrechnung fortan zu den Direkten Methoden der Variationsrechnung.[12]

Anwendungsgebiete

Historisch

Ein typisches Anwendungsbeispiel ist das Brachistochronenproblem: Auf welcher Kurve in einem Schwerefeld von einem Punkt A zu einem Punkt B, der unterhalb, aber nicht direkt unter A liegt, benötigt ein Objekt die geringste Zeit zum Durchlaufen der Kurve? Von allen Kurven zwischen A und B minimiert eine den Ausdruck, der die Zeit des Durchlaufens der Kurve beschreibt. Dieser Ausdruck ist ein Integral, das die unbekannte, gesuchte Funktion, die die Kurve von A nach B beschreibt, und deren Ableitungen enthält.

Ingenieurwesen

Die Variationsrechnung findet Anwendung in der Steuerungs- und Regelungstheorie, wenn es um die Bestimmung von Optimalreglern geht. Die aus dem Verfahren von Ritz weiterentwickelte Finite-Elemente-Methode findet z. B. Anwendung in der Strukturmechanik.[13]

Mathematik

Die Methoden der Variationsrechnung tauchen bei den Hilbertraum-Techniken, der Morsetheorie und bei der symplektischen Geometrie auf. Der Begriff Variation wird für alle „Extremal-Probleme“ von Funktionen verwendet. Geodäsie und Differentialgeometrie sind Bereiche der Mathematik, in denen Variationen eine Rolle spielen, bzw. mittels dieser weiterentwickelt wird.[14] Besonders am Problem der minimalen Oberflächen (vgl. auch Plateau-Problem), die etwa bei Seifenblasen auftreten, wurde viel gearbeitet.[15] Variationsmethoden finden Anwendung bei den partiellen Differentialgleichungen.[16] In der Mathematik wurde die Variationsrechnung beispielsweise bei der riemannschen Behandlung des Dirichlet-Prinzips für harmonische Funktionen verwendet.[17]

Andere Weiterentwicklungen existieren, z. B. Γ-Konvergenz, stochastische Variationsmethoden.[18]

Physik

Die Variationsrechnung ist die mathematische Grundlage aller physikalischen Extremalprinzipien und deshalb besonders in der theoretischen Physik wichtig, so etwa im Lagrange-Formalismus der klassischen Mechanik bzw. der Bahnbestimmung, in der Quantenmechanik[19] in Anwendung des Prinzips der kleinsten Wirkung und in der statistischen Physik im Rahmen der Dichtefunktionaltheorie.

Direkte Methoden der Variationsrechnung

Grundlegend ist der Euler-Lagrange Ansatz effektiv im Auffinden von Extremalen von Funktionalen. Jedoch ist es bereits bei mehreren Variablen, wo die Euler-Lagrange-Gleichung eine partielle Differentialgleichung darstellt, nicht möglich, eine explizite Lösung zu finden. Es existieren weitere Einschränkungen.[12] Hingegen gehen die sog. Direkten Methoden der Variationsrechnung auf den generellen Fall ein, welcher der Frage nachgeht, unter welchen generellen Bedingungen können Funktionale minimiert werden?[12] Die Ansätze bedienen sich dabei stark der Methoden der Funktionalanalysis.[20] Wichtige Theoreme und Beiträge zur Methode erfolgten durch Tonelli, Ascoli, Arzelà und Hilbert.[21]

Zu den direkten Methoden der Variationsrechnung zählen z. B. das Approximationsverfahren nach Ritz sowie das Differenzenverfahren nach Euler.[22] Die mathematische Theorie dazu hat Zusammenhänge mit der Theorie der Konvexen Analysis.[23][24]

Euler-Lagrange-Gleichung

Zentrales Element bildet die Euler-Lagrange-Gleichung[12]

δI(x,δx)=0,

die für I=dt gerade zur Lagrange-Gleichung aus der klassischen Mechanik wird. δ ist dabei die Variation, die sog. Lagrangefunktion und I das Funktional. Mehr dazu siehe die Herleitung.

Ein Hilfsmittel aus der Analysis reeller Funktionen in einer reellen Veränderlichen

Im Folgenden wird eine wichtige Technik der Variationsrechnung demonstriert, bei der eine notwendige Aussage für eine lokale Minimumstelle einer reellen Funktion mit nur einer reellen Veränderlichen in eine notwendige Aussage für eine lokale Minimumstelle eines Funktionals übertragen wird. Diese Aussage kann dann oftmals zum Aufstellen beschreibender Gleichungen für stationäre Funktionen eines Funktionals benutzt werden.

Sei ein Funktional I:X auf einem Funktionenraum X gegeben (X muss mind. ein topologischer Raum sein). Das Funktional habe an der Stelle xX ein lokales Minimum.

Durch den folgenden einfachen Trick tritt an die Stelle des „schwierig handhabbaren“ Funktionals I eine reelle Funktion F(α), die nur von einem reellen Parameter α abhängt „und entsprechend einfacher zu behandeln ist“.

Mit einem ϵ>0 sei (xα)α(ϵ,ϵ) eine beliebige stetig durch den reellen Parameter α parametrisierte Familie von Funktionen xαX. Dabei sei die Funktion x0 (d. h., xα für α=0) gerade gleich der stationären Funktion x. Außerdem sei die durch die Gleichung

F(α):=I(xα)

definierte Funktion F:(ϵ,ϵ) an der Stelle α=0 differenzierbar.

Die stetige Funktion F nimmt dann an der Stelle α=0 ein lokales Minimum an, da x0=x ein lokales Minimum von I ist.

Aus der Analysis für reelle Funktionen in einer reellen Veränderlichen ist bekannt, dass dann ddαF(α)|α=0=0 gilt. Auf das Funktional übertragen heißt das

ddαI(xα)|α=0=0.

Beim Aufstellen der gewünschten Gleichungen für stationäre Funktionen wird dann noch ausgenutzt, dass die vorstehende Gleichung für jede beliebige („gutartige“) Familie (xα)α(ϵ,ϵ) mit x0=x gelten muss.

Das soll im nächsten Abschnitt anhand der Euler-Gleichung demonstriert werden.

Euler-Lagrange-Gleichung; Variationsableitung; weitere notwendige bzw. hinreichende Bedingungen

Gegeben seien zwei Zeitpunkte ta,te mit te>ta und eine in allen Argumenten zweifach stetig differenzierbare Funktion, die Lagrangefunktion

:(ta,te)×G ,Gn×n ,G offen.

Beispielsweise ist bei der Lagrangefunktion des freien relativistischen Teilchens mit Masse m und c=1

(t,x,v)=m1v2

das Gebiet G das kartesische Produkt von 3 und dem Inneren der Einheitskugel.

Als Funktionenraum X wird die Menge aller zweifach stetig differenzierbaren Funktionen

x:[ta,te]n

gewählt, die zum Anfangszeitpunkt ta und zum Endzeitpunkt te die fest vorgegebenen Orte xa bzw. xe einnehmen:

x(ta)=xa ,x(te)=xe

und deren Werte zusammen mit den Werten ihrer Ableitung in G liegen,

t[ta,te]:(x(t),dxdt(t))G.

Mit der Lagrangefunktion wird nun das Funktional I:X, die Wirkung, durch

I(x):=tate(t,x(t),x˙(t))dt

definiert. Gesucht ist diejenige Funktion xX, die die Wirkung I minimiert.

Entsprechend der im vorhergehenden Abschnitt vorgestellten Technik untersuchen wir dazu alle differenzierbaren einparametrigen Familien (xα)α(ϵ,ϵ)X, die für α=0 durch die stationäre Funktion x des Funktionals gehen (es gilt also x0=x). Genutzt wird die im letzten Abschnitt hergeleitete Gleichung

0=ddαI(xα)|α=0=[ddαtate(t,xα(t),x˙α(t))dt]α=0.

Hereinziehen der Differentiation nach dem Parameter α in das Integral liefert mit der Kettenregel (Leibnizregel für Parameterintegrale)

0=[tate(2(t,xα(t),x˙α(t))αxα(t)+3(t,xα(t),x˙α(t))αx˙α(t))dt]α=0=[tate2(t,xα(t),x˙α(t))αxα(t)dt+tate3(t,xα(t),x˙α(t))αx˙α(t)dt]α=0.

Dabei stehen 2,3 für die Ableitungen nach dem zweiten bzw. dritten Argument und α für die partielle Ableitung nach dem Parameter α.

Es wird sich später als günstig erweisen, wenn im zweiten Integral statt αx˙α(t) wie im ersten Integral αxα(t) steht. Das erreicht man durch partielle Integration:

0=[tate2(t,xα(t),x˙α(t))αxα(t)dt+[3(t,xα(t),x˙α(t))αxα(t)]t=tate
tateddt(3(t,xα(t),x˙α(t)))αxα(t)dt]α=0

An den Stellen t=ta und t=te gelten unabhängig von α die Bedingungen xα(ta)=xa und xα(te)=xe. Ableiten dieser beiden Konstanten nach α liefert αxα(ta)=αxα(te)=0. Deshalb verschwindet der Term [3(t,xα(t),x˙α(t))αxα(t)]t=tate und man erhält nach Zusammenfassen der Integrale und Ausklammern von αxα die Gleichung

0=[tate(2(t,xα(t),x˙α(t))ddt3(t,xα(t),x˙α(t)))αxα(t)dt]α=0

und mit xα(t)|α=0=x(t)

0=tate(2(t,x(t),x˙(t))ddt3(t,x(t),x˙(t)))[αxα(t)]α=0dt.

Außer zum Anfangszeitpunkt und zum Endzeitpunkt unterliegt xα(t) keinen Einschränkungen. Damit sind die Zeitfunktionen t[αxα(t)]α=0 bis auf die Bedingungen αxα(ta)=αxα(te)=0 beliebige zweimal stetig differenzierbare Zeitfunktionen. Die letzte Gleichung kann nach dem Fundamentallemma der Variationsrechnung also nur dann für alle zulässigen [αxα]α=0 erfüllt sein, wenn der Faktor 2(t,x(t),x˙(t))ddt3(t,x(t),x˙(t)) im gesamten Integrationsintervall gleich null ist (das wird in den Bemerkungen etwas detaillierter erläutert). Damit erhält man für die stationäre Funktion x die Euler-Lagrange-Gleichung

2(t,x(t),x˙(t))ddt3(t,x(t),x˙(t))=0,

die für alle t(ta,te) erfüllt sein muss.

Die angegebene, zum Verschwinden zu bringende Größe bezeichnet man auch als Eulerableitung der Lagrangefunktion ,

^^x(t):=(t,x,x˙)x|(t,x(t),x˙(t))ddt((t,x,x˙)x˙|(t,x(t),x˙(t))).

Vor allem in Physikbüchern wird die Ableitung α|α=0 als Variation bezeichnet. Dann ist δx=αxα|α=0 die Variation von x. Die Variation der Wirkung

δI(x,δx)=δIδx(t)δx(t)dt

ist wie bei df=i(if)dxi eine Linearform in den Variationen der Argumente, ihre Koeffizienten δIδx(t) heißen Variationsableitung des Funktionals I. Sie ist im betrachteten Fall die Eulerableitung der Lagrangefunktion

δIδx(t)=^^x(t).

Bemerkungen

Die Funktion tb(t) für t0=1 und ϵ=0,1

Bei der Herleitung der Euler-Lagrange-Gleichung wurde berücksichtigt, dass eine stetige Funktion a, die für alle mindestens zweimal stetig differenzierbaren Funktionen b mit b(ta)=b(te)=0 bei Integration über

tatea(t)b(t)dt

den Wert null ergibt, identisch gleich null sein muss.

Das ist leicht einzusehen, wenn man berücksichtigt, dass es zum Beispiel mit

b(t):={0für tt0ϵ oder tt0+ϵ(tt0+ϵ)3(t0t+ϵ)3für t(t0ϵ,t0+ϵ)

eine zweimal stetig differenzierbare Funktion gibt, die in einer ϵ-Umgebung eines willkürlich herausgegriffenen Zeitpunktes t0(ta,te) positiv und ansonsten null ist. Gäbe es eine Stelle t0, an der die Funktion a größer oder kleiner null wäre, so wäre sie aufgrund der Stetigkeit auch noch in einer ganzen Umgebung (t0ϵ,t0+ϵ) dieser Stelle größer bzw. kleiner null. Mit der eben definierten Funktion b ist dann jedoch das Integral tatba(t)b(t)dt im Widerspruch zur Voraussetzung an a ebenfalls größer bzw. kleiner null. Die Annahme, dass a an einer Stelle t0 ungleich null wäre, ist also falsch. Die Funktion a ist also wirklich identisch gleich null.

Ist der Funktionenraum X ein affiner Raum, so wird die Familie (xα)α(ϵ,ϵ) in der Literatur oftmals als Summe xα(t):=x(t)+αh(t) mit einer frei wählbaren Zeitfunktion h festgelegt, die der Bedingung h(ta)=h(te)=0 genügen muss. Die Ableitung αI(xα)|α=0 ist dann gerade die Gateaux-Ableitung αI(x+αh)|α=0 des Funktionals I an der Stelle x in Richtung h. Die hier vorgestellte Version erscheint dem Autor etwas günstiger, wenn die Funktionenmenge X kein affiner Raum mehr ist (wenn sie beispielsweise durch eine nichtlineare Nebenbedingung eingeschränkt ist; siehe etwa gaußsches Prinzip des kleinsten Zwanges). Sie ist ausführlicher bei Smirnow[25] dargestellt und lehnt sich an die Definition von Tangentialvektoren an Mannigfaltigkeiten an.[26]

Im Falle eines weiteren, einschränkenden Funktionals J(x)=j(t,x,x˙,x¨,,x(n))ddt, der den Funktionenraum X dadurch einschränkt, dass J(x)=0 gelten soll, kann man analog zum reellen Fall das Verfahren der Lagrange-Multiplikatoren anwenden:

δIδxi=λδJδxi

für beliebiges i=1,,n und ein festes λ.

Verallgemeinerung für höhere Ableitung und Dimensionen

Die obige Herleitung mittels partieller Integration lässt sich auf Variationsprobleme der Art

I(φ)=(φ(x),1φ(x),,dφ(x),)ddx

übertragen, wobei in den Abhängigkeiten Ableitungen Dαφ(x) (siehe Multiindex-Notation) auch höherer Ordnung auftauchen, etwa bis zur Ordnung |α|N. Dα ist gerade der Differentialoperator. In diesem Fall lautet die Euler-Lagrange-Gleichung:

|α|N(1)|α|Dαδδ(Dαφ(x))=0,

wobei die Euler-Ableitung als

δδ(Dαφ(x)):=(Dαφ)|φ=φ(x),1φ=1φ(x),

zu verstehen ist. Hierbei sind in Dαφ in selbsterklärender Weise symbolisch die entsprechende Abhängigkeit von repräsentiert, Dαφ(x) steht für den konkreten Wert der Ableitung von φ(x). Insbesondere wird auch über α=0 summiert.

Weiterführende Verallgemeinerungen

Verallgemeinerungen für mehrere Funktionen, Dimensionen und auf Mannigfaltigkeiten können gemacht werden. In diesem Zusammenhang ist es günstig, einen sog. Euler-Operator einzuführen und davon gebrauch zu machen, wobei verschiedene Ansätze für den Operator existieren.[27][28]

Siehe auch

Journale & andere Beiträge

Schools & Workshops

Literatur

Moderne Lehrbücher

Monografien

Klassische und historische Werke

Einzelnachweise

  1. Vorlage:Literatur
  2. Vorlage:Literatur
  3. Vorlage:Literatur
  4. Vorlage:Literatur
  5. Vorlage:Literatur
  6. Vorlage:Literatur
  7. Vorlage:Internetquelle
  8. Vorlage:Literatur
  9. Vorlage:Literatur
  10. Vorlage:Internetquelle
  11. Vorlage:Internetquelle
  12. 12,0 12,1 12,2 12,3 12,4 Vorlage:Literatur
  13. Vorlage:Literatur
  14. Vorlage:Literatur
  15. Vorlage:Literatur
  16. Vorlage:Literatur
  17. Vorlage:Literatur
  18. Vorlage:Literatur
  19. Vorlage:Literatur
  20. Vorlage:Literatur
  21. Vorlage:Literatur
  22. Vorlage:Literatur
  23. Vorlage:Literatur
  24. Vorlage:Literatur
  25. Wladimir I. Smirnow: Lehrgang der höheren Mathematik (= Hochschulbücher für Mathematik. Bd. 5a). Teil 4, 1. (14. Auflage, deutschsprachige Ausgabe der 6. russischen Auflage). VEB Deutscher Verlag der Wissenschaften, Berlin 1988, ISBN 3-326-00366-8.
  26. Siehe auch Helmut Fischer, Helmut Kaul: Mathematik für Physiker. Band 3: Variationsrechnung, Differentialgeometrie, mathematische Grundlagen der allgemeinen Relativitätstheorie. 2., überarbeitete Auflage. Teubner, Stuttgart u. a. 2006, ISBN 3-8351-0031-9.
  27. Vorlage:Literatur
  28. Vorlage:Internetquelle

Vorlage:Normdaten