Simulated Annealing

Vorlage:Lang (engl. für simuliertes Tempern/ spannungsfrei Machen/ Vergüten) ist ein heuristisches Approximationsverfahren. Es wird zum Auffinden einer Näherungslösung von Optimierungsproblemen eingesetzt, die durch ihre hohe Komplexität das vollständige Ausprobieren aller Möglichkeiten und mathematische Optimierungsverfahren ausschließen.

Grundidee ist die Nachbildung eines Abkühlungsprozesses, etwa beim Glühen in der Metallurgie. Nach dem Erhitzen eines Metalls sorgt die langsame Abkühlung dafür, dass die Atome ausreichend Zeit haben, sich zu ordnen und stabile Kristalle zu bilden. Dadurch wird ein energiearmer Zustand nahe am Optimum erreicht. Übertragen auf das Optimierungsverfahren entspricht die Temperatur einer Wahrscheinlichkeit, mit der sich ein Zwischenergebnis der Optimierung auch verschlechtern darf. Wie viele andere Lokale-Suche-Algorithmen kann das Verfahren dadurch ein lokales Optimum wieder verlassen, um ein besseres zu finden. Vom Metropolis-Algorithmus in Monte-Carlo-Simulationen unterscheidet sich das Verfahren durch das Absenken der Temperatur im Verlauf der Iteration.

Der Algorithmus wird beispielsweise beim Floorplanning im Laufe eines Chipentwurfs oder für die Standort- und Routenplanung verwendet.^[1]

Es gibt auch Quantenversionen von Annealing (mit Tunnelung zwischen den Minima), eingeführt in den 1990er Jahren.^[2]^[3]

Motivation

Der Algorithmus des Simulated Annealing ist durch physikalische Überlegungen motiviert.^[4] Gesucht sei ein energetisch günstigster Zustand eines Systems, welches mithilfe der Boltzmann-Statistik beschrieben werden kann. Gemäß der Boltzmann-Statistik ist die Wahrscheinlichkeit, einen Mikrozustand mit Energie $\geq E_{j}$ anzutreffen, gegeben durch die Wahrscheinlichkeitsverteilung

p (E_{j}) \propto \exp (- \frac{E_{j}}{k_{B} T}),

wobei $k_{B}$ die Boltzmann-Konstante und $T$ die Temperatur ist. Die Energie des energetisch günstigsten Zustandes sei $E_{0}$ . Die obige Proportionalität bleibt bestehen bei Multiplikation mit einem von $E_{j}$ unabhängigen Faktor:

p (E_{j}) \propto \exp (- \frac{(E_{j} - E_{0})}{k_{B} T})

Da $E_{0}$ der energetisch günstigste Zustand ist, gilt $E_{j} - E_{0} \geq 0$ . Weiterhin ist $k_{B} > 0$ und $T > 0$ . Somit ist der Exponent negativ, und mit abnehmender Temperatur wird sein Betrag größer, wodurch die Wahrscheinlichkeit sinkt, einen angeregten Energiezustand mit mindestens $E_{j}$ zu finden. Senkt man somit die Temperatur des Systems langsam ab, so wird der energetisch günstigste Zustand mit immer größerer Wahrscheinlichkeit angetroffen.

Problemstellung

Gegeben sei der Lösungsraum $D$ , eine Fitnessfunktion $f : D \to ℝ$ , die jeder Lösung in $D$ einen Wert zuweist, und ein Abbruchkriterium.

Gesucht ist eine approximative Lösung des globalen Minimums von $f$ über $D$ , also ein $x \in D$ mit möglichst kleinem Wert $f (x)$ . Sollte ein $x$ mit möglichst großem Wert gesucht sein (Maximierungsproblem), kann man dies durch Negieren von $f$ einfach auf den vorigen Fall zurückführen.

Außerdem wird ein Umgebungsbegriff $U : D \to 𝒫 (D)$ benötigt (wobei $𝒫 (D)$ die Potenzmenge von $D$ bezeichnet), um zu gegebenem $x \in D$ eine benachbarte Lösung $y \in U (x)$ zu erzeugen.

Algorithmus

Initialisierung:
- wähle eine Startlösung $x \in D$
- setze $x_{a p p r o x} = x$
- wähle eine monoton gegen Null fallende Folge von positiven Temperaturwerten $(T_{t})_{t \in ℕ}$
- Setze $t = 0$
lokale Veränderung:
- wähle zu $x$ einen Nachbarn $y \in U (x)$ zufällig aus
Selektion:
- wenn $f (y) \leq f (x)$ , setze $x = y$
- anderenfalls setze $x = y$ nur mit Wahrscheinlichkeit $\exp (- \frac{f (y) - f (x)}{T_{t}})$ .
Bisher beste Lösung aktualisieren:
- wenn $f (x) < f (x_{approx})$ , setze $x_{approx} = x$
Inkrementiere:
- setze $t = t + 1$
Abbruch oder weiter:
- wenn die Abbruchbedingung nicht erfüllt ist, gehe zu Schritt 2.

Erläuterungen

Die Wahrscheinlichkeit $\exp (- \frac{f (y) - f (x)}{T_{t}})$ , dass $x$ durch ein schlechteres $y$ ersetzt wird, ist umso kleiner, je größer die Verschlechterung $f (y) - f (x)$ ist. Weil $T_{t}$ eine monoton fallende Folge ist, nimmt die Wahrscheinlichkeit außerdem während eines Programmlaufs immer mehr ab. Das Verfahren verhält sich mit abnehmendem $T_{t}$ mehr und mehr wie ein Bergsteigeralgorithmus.

Wie ein Nachbar $y \in U (x)$ gewählt werden sollte, hängt von dem vorliegenden Problem ab. In der Informatik ist häufig der Wertebereich $D = {0, 1}^{n}$ und $x = (x_{1}, x_{2}, \dots, x_{n})$ wird als Bit-Vektor betrachtet. Ein Nachbar $y$ von $x$ kann dann z. B. durch das Flippen (Invertieren) von einem oder von wenigen Bits erzeugt werden (siehe Wegener 2005).

Es sind verschiedene Abbruchbedingungen denkbar. Zum Beispiel wird nur eine maximale Anzahl von Durchläufen erlaubt, eine ausreichende Fitness definiert, eine Untergrenze für die Abkühlung festgelegt oder eine Anzahl $t$ von Zeitpunkten definiert, über die $x_{a p p r o x}$ sich nicht mehr geändert hat.

Graphische Verdeutlichung

Datei:SimAnnealingLandschaft.png

Graphische Darstellung einer Landschaft, in der ein globales Minimum gefunden werden soll.

Die Idee des simulierten Abkühlens kann man sich graphisch verdeutlichen.^[5]

Angenommen, man sucht in einer zweidimensionalen Landschaft den (global) tiefsten Punkt. Die Landschaft selbst besteht aus vielen unterschiedlich tiefen Dellen. Die einfache Suchstrategie (suche den nächsten tiefsten Punkt) entspricht dem Verhalten einer Kugel, welche in dieser Landschaft ausgesetzt wird. Sie rollt zum nächsten lokalen Minimum und bleibt dort. Bei der simulierten Abkühlung wird der Kugel immer wieder ein Stoß versetzt, der mit zunehmender „Abkühlung“ schwächer wird. Dieser ist idealerweise stark genug, um die Kugel aus einer flachen Delle (lokales Minimum) zu entfernen, reicht aber nicht aus, um aus dem globalen Minimum zu fliehen.

Simulated Annealing bei der Suche nach einem Maximum. Die zahlreichen lokalen Maxima werden durch die bei noch hoher „Temperatur“ starke Rausch-Bewegung der Temperatursimulation schnell wieder verlassen. Das globale Maximum wird aber zuverlässig gefunden, da der fallende „Temperatur“-Wert zum Ende nicht mehr ausreicht, es zu verlassen. Das erbringt bessere Resultate als ein einfacher Bergsteigeralgorithmus.

Vorlage:Absatz

Siehe auch

Schwellenakzeptanz (threshold accepting)
Deterministic Annealing
Stochastisches Tunneln
Sintflutalgorithmus
Metropolisalgorithmus

Literatur

Vorlage:Literatur

Weblinks

Vorlage:Webarchiv
Interaktive Demonstration zum Ausprobieren
C#-Implementierung und Anwendung zur Minimierung und auf das Problem des Handelsreisenden
Simulated Annealing in C++ Optimierungs-Bibliothek cppOpt cppOpt bzw. OptSimulatedAnnealing.h

Einzelnachweise

↑ Bogatzki, A.: Fabrikplanung: Verfahren zur Optimierung von Maschinenaufstellung. Diss. Universität Wuppertal (1998). Roderer 1998. ISBN 978-3-89073-234-3
↑ T. Kadowaki, H. Nishimori, Quantum annealing in the transverse Ising model, Phys. Rev. E, Band 58, 1998, S. 5355
↑ A. B. Finilla, M. A. Gomez, C. Sebenik, J. D. Doll, Quantum annealing: A new method for minimizing multidimensional functions, Chem. Phys. Lett., Band 219, 1994, S. 343
↑ JP Dr. A. Arnold, Universität Stuttgart, Institut für Computerphysik, Skript zur Vorlesung Physik auf dem Computer (PDF; 3,3 MB) S. 181 ff.
↑ Google TechTalk Vortrag Eine kurze, aber sehr verständliche Erklärung zum Thema findet man ab Minute 35.

[1] Bogatzki, A.: Fabrikplanung: Verfahren zur Optimierung von Maschinenaufstellung. Diss. Universität Wuppertal (1998). Roderer 1998. ISBN 978-3-89073-234-3

[2] T. Kadowaki, H. Nishimori, Quantum annealing in the transverse Ising model, Phys. Rev. E, Band 58, 1998, S. 5355

[3] A. B. Finilla, M. A. Gomez, C. Sebenik, J. D. Doll, Quantum annealing: A new method for minimizing multidimensional functions, Chem. Phys. Lett., Band 219, 1994, S. 343

[4] JP Dr. A. Arnold, Universität Stuttgart, Institut für Computerphysik, Skript zur Vorlesung Physik auf dem Computer (PDF; 3,3 MB) S. 181 ff.

[5] Google TechTalk Vortrag Eine kurze, aber sehr verständliche Erklärung zum Thema findet man ab Minute 35.

[1]

[2]

[3]

[4]

[5]