Kettenregel

Aus testwiki
Zur Navigation springen Zur Suche springen

Die Kettenregel ist eine der Grundregeln der Differentialrechnung. Mit ihr wird die Ableitung einer Verkettung zweier differenzierbarer Funktionen berechnet. In Lagrange-Notation lautet die Kettenregel:

[f(g(x))]=f(g(x))g(x)

Die Kettenregel lässt sich verallgemeinern auf Funktionen, die sich als Verkettung mindestens zweier differenzierbarer Funktionen darstellen lassen. Auch eine solche Funktion ist wiederum differenzierbar, ihre Ableitung erhält man durch Multiplikation der Ableitungen aller ineinander verschachtelten Funktionen.

Die Kettenregel bildet einen Spezialfall der mehrdimensionalen Kettenregel für den eindimensionalen Fall.

Ihr Gegenstück in der Integralrechnung ist die Integration durch Substitution.

Geschichte

Die Kettenregel scheint erstmals von Gottfried Wilhelm Leibniz verwendet worden zu sein. Er benutzte sie zur Berechnung der Ableitung von a+bz+cz2 als Kompositum der Quadratwurzelfunktion und der Funktion a+bz+cz2. Er erwähnte sie erstmals in einer Denkschrift von 1676 (mit einem Vorzeichenfehler in der Berechnung). Die gängige Schreibweise der Kettenregel geht auf Leibniz zurück.[1] Guillaume de l’Hôpital verwendete die Kettenregel implizit in seiner Analyse des infiniment petits. Die Kettenregel taucht in keinem der Analysis-Bücher von Leonhard Euler auf, obwohl sie über hundert Jahre nach Leibniz' Entdeckung geschrieben wurden.

Es wird angenommen, dass die erste „moderne“ Version der Kettenregel in Lagranges „Théorie des fonctions analytiques“ von 1797 auftaucht; sie erscheint auch in Cauchys „Résumé des Leçons données a L'École Royale Polytechnique sur Le Calcul Infinitesimal“ von 1823.[1]

Mathematische Formulierung

Seien U,V offene Intervalle, v:V und u:U Funktionen mit v(V)U.

Die Funktion v sei im Punkt x0V differenzierbar und u sei im Punkt z0:=v(x0)U differenzierbar.

Dann ist die „zusammengesetzte“ Funktion (Komposition)

f=uv:V

im Punkt x0 differenzierbar und es gilt:

(uv)(x0)=u(v(x0))v(x0).

Im Zusammenhang mit der Kettenregel nennt man u auch die äußere, v die innere Funktion von f.

Praktische Merkregel: Die Ableitung einer durch Verkettung gebildeten Funktion im Punkt x0 ist die „äußere Ableitung“ u, ausgewertet an der Stelle v(x0), mal der Ableitung der inneren Funktion v, ausgewertet an der Stelle x0. Oder kurz: „Äußere Ableitung mal innere Ableitung“.

Beispiel

Es wird die durch f(x)=(x3+1)2 definierte Funktion f betrachtet.

Diese lässt sich darstellen als Verkettung der Funktion

u(v)=v2

mit der Funktion

v(x)=x3+1,

denn es gilt f(x)=u(v(x)). Hierbei nennt man u äußere und v innere Funktion.

Für die Anwendung der Kettenregel benötigen wir die Ableitungen u (äußere Ableitung) und v (innere Ableitung):

u(v)=2v

und

v(x)=3x2.

Da sowohl u als auch v differenzierbar sind, ist nach der Kettenregel auch f=uv differenzierbar, und es gilt für ihre Ableitung:

f (x)=u(v(x))v(x).

Nun ist u(v(x))=2(x3+1), so dass wir insgesamt erhalten:

f (x)=2(x3+1)3x2

Unter Zuhilfenahme von Farbe lässt sich die eingangs formulierte Merkregel auch im Formelbild wiedererkennen.

f(x)=(x3+1)2f(x)=2(x3+1)3x2

Man beachte, dass die Darstellung einer Funktion als Verkettung einer äußeren mit einer inneren Funktion keineswegs eindeutig sein muss. So lässt sich die Beispielfunktion auch als Verkettung der Funktionen u(v)=(v+1)2 und v(x)=x3 auffassen, denn auch für diese beiden Funktionen gilt:

u(v(x))=(x3+1)2=f(x).

Die Anwendung der Kettenregel ist in diesem Fall rechnerisch aufwendiger, da zumindest der Term (v+1)2 ausmultipliziert werden muss.

Insgesamt lässt sich an diesem Beispiel die Kettenregel im Sinne der konstruktivistischen Didaktik selbst entdecken. Ausmultiplizieren ergibt:

f(x)=x6+2x3+1.

Nach Ableiten wird durch Ausklammern die innere Funktion v(x)=x3+1 herauspräpariert:

f(x)=6x5+6x2=6x2(x3+1)=2(x3+1)3x2.

Hieraus lässt sich dann die Kettenregel vermuten, die dann noch in ihrer Allgemeingültigkeit bewiesen werden muss.

Heuristische Herleitung

Für die Berechnung der Ableitung von uv ist der Differenzenquotient ΔuΔx zu berechnen. Erweitert man diesen Bruch mit Δv, so erhält man:

ΔuΔx=ΔuΔvΔvΔx.

Durch den Grenzübergang Δx0 gehen die Differenzenquotienten in Differentialquotienten über. Geht Δx gegen Null, dann auch Δv. Man erhält dann insgesamt für die Ableitung der verketteten Funktion:

f(x)=limΔx0ΔuΔx=limΔx0(ΔuΔvΔvΔx)=limΔv0(ΔuΔv)limΔx0(ΔvΔx)=dudvdvdx=u(v(x))v(x).

Beweis

Man definiert

D(z,z0):={u(z)u(z0)zz0,falls zz0,u(z0),falls z=z0.

Weil u in z0 differenzierbar ist, gilt

limzz0D(z,z0)=u(z0),

das heißt, die Funktion zD(z,z0) ist an der Stelle z0 stetig. Außerdem gilt für alle zU:

u(z)u(z0)=D(z,z0)(zz0).

Wegen limxx0v(x)=v(x0) folgt daraus:

(uv)(x0)=limxx0u(v(x))u(v(x0))xx0=limxx0D(v(x),v(x0))(v(x)v(x0))xx0=limxx0D(v(x),v(x0))limxx0v(x)v(x0)xx0=u(v(x0))v(x0).

Komplexe Funktionen

Seien U,V offene Teilmengen, z. B. Gebiete, v:V und u:U Funktionen mit v(V)U.

Die Funktion v sei im Punkt x0V differenzierbar und u sei im Punkt v(x0)U differenzierbar.

Dann ist die zusammengesetzte Funktion

f:=uv:V,xu(v(x))

im Punkt x0 differenzierbar und es gilt:

(uv)(x0)=u(v(x0))v(x0).

Fazit: Die komplexe Kettenregel ist (einschließlich ihres Beweises) völlig analog zum Reellen.

Verallgemeinerung auf mehrfache Verkettungen

Anwendung der Kettenregel auf „verschachtelte“ Funktionen

Etwas komplizierter wird das Differenzieren, wenn mehr als zwei Funktionen verkettet sind. In diesem Fall wird die Kettenregel rekursiv angewendet. Beispielsweise ergibt sich bei Verkettung von drei Funktionen u,v und w

f(x)=u(v(w(x)))

die Ableitung

f(x)=u(v(w(x)))(v(w(x)))=u(v(w(x)))v(w(x))w(x).

Im Allgemeinen hat die Funktion

f=u1un

die Ableitung

f(x)=u1(u2((un(x))))u2(u3((un(x))))un(x),

wie sich durch vollständige Induktion beweisen lässt. Beim praktischen Berechnen der Ableitung multipliziert man also Faktoren, die sich folgendermaßen ergeben:

Den ersten Faktor erhält man dadurch, dass man die äußerste Funktion durch eine unabhängige Variable ausdrückt und ableitet. Anstelle dieser unabhängigen Variablen ist der Rechenausdruck für die restlichen (inneren) Funktionen einzusetzen. Der zweite Faktor wird entsprechend berechnet als Ableitung der zweitäußersten Funktion, wobei auch hier der Rechenausdruck für die zugehörigen inneren Funktionen einzusetzen ist. Dieses Verfahren setzt man fort bis zum letzten Faktor, der innersten Ableitung.

Als Beispiel kann wiederum die Funktion f(x)=(x3+1)2 dienen. Diese lässt sich darstellen als Verkettung der drei Funktionen:

u(v)=v2v(w)=w+1w(x)=x3,

denn es gilt:

u(v(w(x)))=u(w(x)+1)=u(x3+1)=(x3+1)2=f(x).

Damit liefert die auf mehrfache Verkettungen verallgemeinerte Kettenregel mit

u(v)=2vv(w)=1w(x)=3x2,

die Ableitung

f (x)=u(v(w(x)))v(w(x))w(x)=2v(w(x))1w(x)=2(x3+1)13x2.

Verallgemeinerung für höhere Ableitungen

Vorlage:Hauptartikel Eine Verallgemeinerung der Kettenregel für höhere Ableitungen ist die Formel von Faà di Bruno. Sie ist wesentlich komplizierter und schwieriger zu beweisen.

Sind u und v zwei n-mal differenzierbare Funktionen, deren Verkettung f(x)=u(v(x)) definiert ist, so gilt

f(n)(x)=(k1,,kn)Tnn!k1!  kn!u(k1++kn)(v(x))m=1km1n(1m!v(m)(x))km.

Hierbei bezeichnet f(n)(x) die n-te Ableitung von f an der Stelle x. Die Menge Tn, über die summiert wird, enthält alle n-Tupel (k1,  ,kn) aus nichtnegativen, ganzen Zahlen mit 1k1+2k2++nkn=n.

Verallgemeinerung auf Funktionen und Abbildungen mehrerer Veränderlicher

Vorlage:Hauptartikel Hier betrachtet man differenzierbare Funktionen (Abbildungen) f:nm. Die Ableitung einer solchen Abbildung im Punkt x0n ist dann eine lineare Abbildung Dfx0:nm, die durch eine (m×n)-Matrix, die Jacobi-Matrix Jf(x0) dargestellt werden kann.

Die Kettenregel besagt, dass die Verkettung von zwei differenzierbaren Abbildungen wieder differenzierbar ist. Ihre Ableitung erhält man, indem man die einzelnen Ableitungen verkettet. Die zugehörige Jacobi-Matrix ist das Matrizenprodukt der einzelnen Jacobi-Matrizen.

Im Detail: Sind die Abbildungen v:nl im Punkt x0n und u:lm im Punkt v(x0)l differenzierbar, so ist auch die Verkettung uv:nm im Punkt x0 differenzierbar, und es gilt

D(uv)x0=Duv(x0)Dvx0

und

Juv(x0)=Ju(v(x0))Jv(x0).

In ähnlicher Form lässt sich eine Kettenregel für Fréchet-Ableitungen von Abbildungen zwischen Banachräumen und für die Ableitungen (Differentiale, Tangentialabbildungen) von Abbildungen zwischen differenzierbaren Mannigfaltigkeiten formulieren.

Abweichende Notationen in der Physik und anderen Wissenschaften

In vielen Naturwissenschaften wie der Physik sowie in der Ingenieurwissenschaft findet die Kettenregel breite Anwendung. Allerdings hat sich hier eine besondere Notation entwickelt, die von der mathematischen Notation der Kettenregel deutlich abweicht.

Vorstellung der Notation

In physikalischer Literatur wird für die Ableitung einer Funktion h nach der Variable x in der Regel die Schreibweise

h(x)=:dhdx(x)

bevorzugt. Ist h eine Verkettung zweier Funktionen: h=fg mit yf(y),xg(x), so präsentiert sich die Kettenregel in dieser Notation:

dhdx(x)=dfdy(g(x))dgdx(x)

Es ist zusätzlich gängige Konvention, die unabhängige Variable der Funktion f mit dem Funktionssymbol der inneren Funktion g zu identifizieren, dafür aber sämtliche Argumentklammern auszulassen:

dhdx=dfdgdgdx

Letztlich wird für die Verkettung fg kein neues Symbol eingeführt, sondern die gesamte Verkettung mit der äußeren Funktion f identifiziert: f=fg.

Die Kettenregel nimmt dann das folgende Aussehen an:

dfdx=dfdgdgdx

Formal stellt sich die Kettenregel hier als eine Erweiterung des „Bruches“ df/dx mit dg dar, so dass es in physikalischer Fachliteratur (und auch in anderen Natur- und Ingenieurwissenschaften) gängig ist, die Kettenregel bei Anwendung nicht namentlich zu erwähnen. Stattdessen findet man oft Ersatzformulierungen, so ist etwa von der „Erweiterung von df/dx mit dg“ die Rede, teilweise fehlt eine Begründung vollständig. Auch wenn dies für das ungeübte Auge nicht immer auf den ersten Blick erkennbar ist, steckt hinter all diesen Formulierungen ausnahmslos die Kettenregel der Differentialrechnung.

Obwohl die vorgestellte Notation mit einigen mathematischen Konventionen bricht, erfreut sie sich großer Beliebtheit und weiter Verbreitung, da sie es ermöglicht, mit Ableitungen (zumindest salopp) wie mit „normalen Brüchen“ zu rechnen. Viele Rechnungen gestaltet sie außerdem übersichtlicher, da Klammern entfallen und nur sehr wenige Symbole verwendet werden müssen. Vielfach stellt auch die durch eine Verkettung beschriebene Größe eine bestimmte physikalische Variable dar (z. B. eine Energie oder eine elektrische Spannung), für die ein bestimmter Buchstabe „reserviert“ ist (etwa E für Energie und U für Spannung). Die obige Notation ermöglicht es, diesen Buchstaben in der gesamten Rechnung durchgängig zu verwenden.

Beispiel

Die kinetische Energie eines Körpers hängt von seiner Geschwindigkeit v ab: E=f(v). Hängt die Geschwindigkeit wiederum von der Zeit ab, v=g(t), so ist auch die kinetische Energie des Körpers eine Funktion der Zeit, die durch die Verkettung

E(t)=f(g(t))

beschrieben wird. Möchten wir die Änderung der kinetischen Energie nach der Zeit berechnen, so gilt nach der Kettenregel

E(t)=f(g(t))g(t).

In physikalischer Literatur würde man die letzte Gleichung in folgender (oder ähnlicher) Gestalt vorfinden:

dEdt=dEdvdvdt.

Klarer Vorteil ist die durchgängige Verwendung von Funktionssymbolen, deren Buchstaben mit denen der zugrunde liegenden physikalisch relevanten Größe (E für Energie, v für Geschwindigkeit) übereinstimmen.

Literatur

Einzelnachweise