Heron-Verfahren

Aus testwiki
Zur Navigation springen Zur Suche springen
Berechnung von 5 mit dem Heronverfahren

Das Heron-Verfahren, Heronsche Näherungsverfahren oder Babylonische Wurzelziehen ist ein Rechenverfahren zur Berechnung einer Näherung der Quadratwurzel einer reellen Zahl a>0. Hierbei wird die Zahl a als Flächeninhalt eines Rechtecks aufgefasst (z. B. mit Seitenlängen a und 1). Dieses Rechteck wird dann schrittweise in ein flächengleiches Quadrat transformiert, indem man in jedem Rechenschritt die längere Seite des vorherigen Rechtecks verkürzt und seine kürzere Seite so verlängert, so dass der Flächeninhalt a erhalten bleibt. Die verkürzte neue längere Seite berechnet sich dabei als Mittelwert der beiden Seiten des vorherigen Rechtecks (siehe Grafik rechts). Das Verfahren ist nach dem griechischen Mathematiker Heron von Alexandria benannt, der es in seinem Werk Metrika beschrieb. Allerdings wurde es schon über 1000 Jahre früher von den Babyloniern benutzt.

Im Gegensatz zum schriftlichen Wurzelziehen benötigt man keinen festgelegten, also korrekten, Ausgangswert. Zudem ist das Verfahren relativ robust gegen Rundungsfehler und konvergiert in der Regel schneller. Jedoch können Wurzeln mit dem Heronverfahren prinzipiell nur näherungsweise berechnet werden.

Geometrische Veranschaulichung und Grundidee

Die ersten vier Schritte zur Berechnung der Wurzel aus 9 mit dem Heron-Verfahren

Dem Heron-Verfahren liegt die Idee zu Grunde, dass ein Quadrat mit Flächeninhalt A eine Seitenlänge von A hat. Ausgangspunkt des Verfahrens ist ein beliebiges Rechteck mit Flächeninhalt A. Schritt für Schritt wird das Seitenverhältnis des Rechtecks so geändert, dass sich seine Form immer mehr der eines Quadrats annähert, während der Flächeninhalt gleich bleibt. Die Seitenlängen des Rechtecks sind die Näherungswerte für A.

Im ersten Schritt wird eine beliebige Seitenlänge x0 für das Rechteck gewählt. Damit dieses den gewünschten Flächeninhalt hat, wird die zweite Seitenlänge mit der Formel

y0=Ax0

berechnet. Als Beispiel soll die Wurzel aus 9 berechnet werden. Für die eine Seitenlänge wird der Wert 9 gewählt, sodass sich die andere Seitenlänge zu 1 berechnet. Das erste Rechteck hat deshalb die folgende Form.

Die Ähnlichkeit dieses Rechteckes mit einem Quadrat ist gering. Das kommt auch dadurch zum Ausdruck, dass die Seitenlängen 1 und 9 sehr schlechte Näherungen für die Wurzel aus 9 sind.

Um eine bessere Annäherung an ein Quadrat zu erhalten, muss die lange Seite gekürzt und die kurze Seite verlängert werden. Als neue Länge der langen Seite wird der Mittelwert

x1=x0+y02

der beiden bisherigen Seitenlängen genommen. Die Länge der anderen Seite berechnet sich wie oben zu

y1=Ax1.

Im Beispiel ergibt sich als Mittelwert die Seitenlänge 5. Die dazugehörige kurze Seite hat eine Länge von 1,8.

Auch hier ist die Ähnlichkeit zu einem Quadrat noch gering. Allerdings ist das neue Rechteck im Vergleich zum vorhergehenden kompakter.

Der beschriebene Ablauf wird in jedem weiteren Schritt des Heron-Verfahrens wiederholt. Der Mittelwert der Seitenlängen eines Rechtecks entspricht der Länge der langen Seite des neuen Rechtecks und die Länge der kurzen Seite lässt sich daraus jeweils wie oben beschrieben berechnen. Im Beispiel entstehen so in den nächsten zwei Schritten die folgenden beiden Rechtecke.

Das letzte Rechteck ist schon annähernd quadratisch. Die Seitenlänge 3,024 liegt entsprechend nah bei 3, dem exakten Wert von 9.

Iterationsverfahren

Entwicklung aus der Grundidee, Rekursionsgleichung

Heron-Verfahren zur Berechnung von 2 mit drei verschiedenen Startwerten 2,4 und 8

Aus der geometrischen Grundidee erhält man ein allgemeines Iterationsverfahren zur näherungsweisen Berechnung der Wurzel einer reellen Zahl a>0:

Man geht von einem beliebigen Startwert x00 (idealerweise in der Nähe von a) aus und setzt y0=a/x0. Da in jedem Iterationsschritt die eine Seite durch den Mittelwert der beiden Seiten ersetzt wird und die andere Seite so angepasst wird, dass der Flächeninhalt unverändert bleibt, lautet die Iterationsvorschrift

xn+1=xn+yn2undyn+1=axn+1.

Häufig wird die Iteration in einer Form geschrieben, in der nur noch die Variable x vorkommt. Dazu setzt man yn=axn in die Gleichung für xn+1 ein und erhält die Rekursionsgleichung

xn+1=12(xn+axn),

die eine Folge x0,x1,x2, („Heron-Folge“) von immer besseren Näherungen von a liefert.

Alternativ kann diese Rekursionsgleichung auch aus dem Newton-Verfahren für die Nullstelle der quadratischen Funktion f(x)=x2a hergeleitet werden.

Beispiel

Die Folgenglieder der babylonischen Wurzelfolge mit dem Startwert a0=14.

Mithilfe des Heron-Verfahrens soll die Wurzel aus 2 angenähert werden. Als Startwert wird x0=2 gewählt. Die ersten Glieder der Heron-Folge lauten

x1=12(2+22)=32=1,5
x2=12(32+232)=1712=1,41666666
x3=12(1712+21712)=577408=1,41421568.

Nach drei Iterationen ist die Näherung bereits auf fünf Nachkommastellen genau und die Abweichung vom wahren Wert 2=1,41421356 beträgt somit weniger als 0,0001 %.

Konvergenz

Die Heron-Folge (xn) mit xn=12(xn1+axn1) konvergiert für jeden Startwert x0>0 gegen a. Somit kann jede Wurzel durch das Iterationsverfahren beliebig angenähert werden.

Beweis  

Alle Glieder der Heron-Folge sind positiv. Man kann nun zeigen, dass sie auch alle wenigstens so groß wie a sind und die Heron-Folge somit nach unten beschränkt ist. Dazu zeigt man für beliebiges n1 die Ungleichung xn2a0:

xn2a=14(xn1+axn1)2a=14(xn1axn1)20.

Weiter zeigt man, dass die Heron-Folge monoton fallend ist:

xn+1xn=12(xn+axn)xn=a2xnxn2=axn22xn0.

Aufgrund der Beschränktheit und Monotonie muss die Folge nach dem Monotoniekriterium gegen einen Grenzwert x konvergieren. Es bleibt noch zu zeigen, dass x=a. Hierzu ist es zweckmäßig, die Folge x02,x12,x22, zu betrachten, die gegen x2 konvergiert. Aus xn2a>0 folgt x2a>0, also ist x0. Nun lässt sich der Grenzwert x berechnen:

x=limn12(xn+axn)=12(x+ax).

Hieraus erhält man durch elementare Termumformungen x2=a, woraus schließlich x=a folgt.

Der Startwert x0 der Iteration kann sogar, solange er von Null verschieden ist, beliebig festgesetzt werden, die Iteration konvergiert immer. Zu beachten ist, dass bei negativen Startwerten die Iteration gegen die negative Quadratwurzel konvergiert. Da sich das Heron-Verfahren aus dem Newtonschen Näherungsverfahren ableiten lässt und die zu berechnende Nullstelle einfach ist, ist die Konvergenzordnung 2. Die Zahl der richtigen Stellen wird mit jedem Schritt etwa verdoppelt.

Bei einem Startwert x0 in der Nähe von a erhält man mithilfe des Heron-Verfahrens schnell gute Näherungswerte, wie das Beispiel verdeutlicht. Wenn die Anfangsnäherung jedoch schlecht ist, sind viele Schritte für eine gute Näherung nötig. Wenn zum Beispiel die Wurzel einer ganzen Zahl a mit 200 Binärstellen berechnet werden soll und man x0=a als Startwert verwendet, dann wird die Näherung mit jedem Schritt um etwa eine Binärstelle kürzer, d. h. erst nach etwa 100 Schritten hat die Näherung die richtige Länge von 100 Stellen. Danach reichen sechs bis sieben weitere Schritte (log2(100)), um alle 100 Stellen vor dem Komma richtig zu berechnen. Es empfiehlt sich somit, einen möglichst genauen Startwert x0 zu bestimmen. Im Beispiel sollte man zuerst die Bitlänge log2(a)+1 von a ermitteln und einen Startwert mit der halben Länge verwenden.[A 1] Eine qualifizierte Schätzung für den Startwert erhält man aus der Taylorreihen-Entwicklung der binomischen Reihe um 1, deren zwei erste Glieder die Gleichung x0=a+12 liefern.

Das Heron-Verfahren gehört zu den Fixpunktverfahren. Setzt man φ(x)=12(x+ax), so gilt für den Fixpunkt (der die Bedingung φ(x)=x erfüllt) x2=a mit der (positiven) Lösung x=a.

Fehlerabschätzung

Für die Heron-Folge (xn)n1 gilt die Abschätzung

axnaxn,

und für den Fehler die Abschätzung

xna=12xn1(xn1a)212xn1(xn1axn)2=12xn1xn2(xn1xna)2.

Angewandt auf obiges Beispiel erhält man:

x32=12x2(x22)212x2x32(x2x32)2=0,00000212

Für den relativen Fehler

εn=xnaa

gilt die Rekursion

εn+1=εn22(1+εn).

Die Folge der εn ist also bei gegebenem relativen Fehler ε0 der Startnäherung unabhängig von a.

Implementierung in Software

Das Verfahren eignet sich besonders gut zur Implementierung in Software, da nur Grundrechenarten benötigt werden, s. o. Es wird heute angesichts der breiten Verfügbarkeit numerischer Prozessorhardware aber nur noch selten benötigt.

Wenn dazu noch eine Gleitkommadarstellung mit einem Zweier-Exponenten benutzt wird, wird der Ansatz relativ einfach, als Beispiel wird die Wurzel aus 5 betrachtet und der relative Fehler zum Endwert |xix|x verfolgt:

  • Zunächst wird von diesem Zweier-Exponenten eine gerade Anzahl abgespaltet, so dass als Exponent entweder eine 0 oder 1 übrig bleibt, die Zahl also auf das Intervall [12,2] normalisiert wird. In diesem Intervall ist die Wurzelfunktion eine nur schwach gekrümmte Kurve, lässt sich also numerisch gut behandeln. Beispiel:5=41,25=21,2521,118034=2,236068, es wird also vorerst nur noch a=1,25 mit dem Ziel x=1,118 behandelt.
  • Als Startwert für die eigentliche Iteration approximiert man diese Kurve durch eine noch einfachere, die sich direkt ohne Iteration berechnen lässt. Mit dieser Anfangsberechnung wird der Startwert ermittelt, mit dem die folgende Iteration begonnen wird. Man kann diese Kurve mehr oder weniger aufwendig ansetzen, mit den steigend komplizierteren Ansätzen unten lässt sich gegebenenfalls ein Iterationsschritt einsparen:
    • eine einfache Konstante (beispielsweise 1),
      Beispiel: x0=1, relativer Fehler 1,1101
    • eine Gerade mit Steigung 12 und einer additiven Konstante von 12 als Vereinfachung des nachfolgenden Falls
      Beispiel: x0=12+1,252=1,125, relativer Fehler 6,2103
    • eine Gerade mit Steigung 12 und einer additiven, optimierten Konstante von (2242)2/20,4648415,
      Beispiel: x0=0,9296832+1,2521,089841, relativer Fehler 2,5102.
    • eine Gerade mit optimierter Steigung und einer additiven Konstante hier nicht näher betrachtet.
  • Ausgehend von dem so ermittelten Startwert x0 führt man eine feste Anzahl von Iterationsschritten durch. Die nötige Anzahl, um die gewünschte Genauigkeit zu erreichen, lässt sich dank der obigen Fehlerabschätzung als Worst Case innerhalb des Startintervalls direkt ausrechnen. Bei 32 Bits Mantisse und dem mittleren Startansatz braucht man beispielsweise nur drei Schritte. Diese fest gewählte Anzahl erspart wesentlich aufwendigere Abfragen auf Erreichung der Genauigkeit. Der Ersatz der genannten Konstanten durch die Zahl 1,0 ändert daran nichts. Auch der noch kompliziertere Ansatz brächte zumindest bei dieser Genauigkeit keine Einsparung eines weiteren Iterationsschritts. Bei höheren Genauigkeitsanforderungen kann das anders aussehen.
    Beispiel mit drei Schritten nach Ansatz 1 (Konstante 1, mit den anderen Ansätzen konvergiert es noch einen Schritt schneller):
    x1=x0+ax02x1=x0+1,25x02=1+1,2512=1,125, relativer Fehler 6,2103 x2=x1+ax12=1,125+1,251,12521,118056, relativer Fehler 2,0105
    x3=x2+ax22=1,118056+1,251,11805621,118034, relativer Fehler kleiner als 106
    Man sieht die Wirkung der quadratischen Konvergenz, dass sich der relative Fehler von Schritt zu Schritt jeweils quadriert oder die Anzahl gültiger Stellen bzw. der negative Fehlerexponent etwa verdoppelt.
  • Zum Schluss wird der Exponent restauriert, indem man die Hälfte des im ersten Schritt abgespalteten Werts wieder hinzufügt.
    Beispiel: 2x3=x2+ax2=1,118056+1,251,1180562,236068.

Verallgemeinerung des Verfahrens

Näherung höherer Wurzeln

Dieses Verfahren lässt sich verallgemeinern, um die k-te Wurzel einer Zahl a>0 näherungsweise zu berechnen. Dabei wird das Newton-Verfahren zur Bestimmung der positiven Nullstelle ak der Funktion f(x)=xka angewandt. Mit f(x)=kxk1 folgt aus der Rekursionsformel xn+1=xnf(xn)f(xn) des Newton-Verfahrens die Iterationsvorschrift

xn+1=1k((k1)xn+axnk1).

Beispielsweise lautet die Rekursionsformel zur Berechnung der Kubikwurzel

xn+1=13(2xn+axn2).

Hier muss die Folge mit einem geeigneten Startwert x0 für den gesuchten Wert von ak gestartet werden.

Je größer k ist, desto mehr Schritte werden benötigt, um die Wurzel genau zu berechnen. Für ganzzahliges positives k gelten die gleichen Konvergenzaussagen wie oben für k=2.

Näherung des Kehrwerts

Verfahren und Ersetzen der Division durch Verwendung des Kehrwerts

Für k=1 erhält man ein Verfahren, mit dem (ohne Verwendung der Division!) der Kehrwert a1=1/a näherungsweise errechnet werden kann:

xn+1=(11)xn1+a(1)xn11=2xnaxn2=(2axn)xn.

Dieses Verfahren konvergiert für alle x0(0,2/a) quadratisch gegen 1/a.

Die Iteration ermöglichte für erste Computer ohne eingebaute Division die Zurückführung dieser Operation auf Multiplikation und Subtraktion. Die Division von zwei Zahlen wurde so ausgeführt, dass der Kehrwert des Nenners bestimmt wurde und mit dem Zähler multipliziert wurde.

Beispiel

Es soll 1/3 näherungsweise berechnet werden mit dem Startwert x0=12<23:

x1=(2312)12=14=0,25,
x2=(2314)14=516=0,3125,
x3=(23516)516=85256=0,33203125.

Für den Startwert x0=23 erhält man

x1=(2323)23=0,
x2=(230)0=0,

somit keine Konvergenz gegen den gesuchten Wert von 13.

Geschichte

Das Verfahren war in Mesopotamien bereits zur Zeit des babylonischen Königs Hammurapi I. (ca. 1750 v. Chr.) bekannt.[1] Um 100 n. Chr. wurde es von Heron von Alexandria im ersten Buch seines Werkes Metrika beschrieben.[2]

Literatur

  • Jochen Ziegenbalg, Oliver Ziegenbalg, Bernd Ziegenbalg: Algorithmen: Von Hammurapi bis Gödel. 4. Auflage. Springer Spektrum, Wiesbaden 2016, ISBN 978-3-658-12362-8, S. 55–60.
  • David Fowler, Eleanor Robson: Square Root Approximations in Old Babylonian Mathematics. In: Historia Mathematica, Band 25, Nr. 4, 1998, S. 366–378 (sciencedirect.com).
  • Hans Rudolf Schwarz, Norbert Köckler: Numerische Mathematik. 7. Auflage. Vieweg+Teubner, Wiesbaden 2009, ISBN 978-3-8348-0683-3, S. 192–194.
  • Dietmar Herrmann: Die antike Mathematik. 3. Auflage. Springer Spektrum, Berlin 2024, ISBN 978-3-662-68477-1, S. 337–339.
  • Konrad Königsberger: Analysis 1. 6. Auflage. Springer, Berlin / Heidelberg 2004, ISBN 978-3-540-40371-5, S. 48–49.

Vorlage:Commonscat

Anmerkungen

  1. Startwert: Sofern der Ausgangswert bereits als Binärzahl (im Stellenwertsystem) vorliegt, kann einfach gezählt werden, an welcher Stelle i seine höchstwertige '1' steht; Startwert wird dann 12i/2. Sofern der Ausgangswert in (Binär-)Exponentialdarstellung vorliegt, kann als Startwert einfach der Exponent halbiert werden (um 1 Bit nach rechts schieben). Siehe auch Abschnitt Implementierung in Software

Einzelnachweise

  1. Jochen Ziegenbalg, Oliver Ziegenbalg, Bernd Ziegenbalg: Algorithmen: Von Hammurapi bis Gödel. Springer Spektrum 2016, S. 55 (Vorlage:Google Buch).
  2. Vorlage:MacTutor

es:Cálculo de la raíz cuadrada#Algoritmo babilónico it:Metodi per il calcolo della radice quadrata#Metodo babilonese pl:Metody obliczania pierwiastka kwadratowego#Metoda babilońska