Simulated Annealing

Aus testwiki
Zur Navigation springen Zur Suche springen

Vorlage:Lang (engl. für simuliertes Tempern/ spannungsfrei Machen/ Vergüten) ist ein heuristisches Approximationsverfahren. Es wird zum Auffinden einer Näherungslösung von Optimierungsproblemen eingesetzt, die durch ihre hohe Komplexität das vollständige Ausprobieren aller Möglichkeiten und mathematische Optimierungsverfahren ausschließen.

Grundidee ist die Nachbildung eines Abkühlungsprozesses, etwa beim Glühen in der Metallurgie. Nach dem Erhitzen eines Metalls sorgt die langsame Abkühlung dafür, dass die Atome ausreichend Zeit haben, sich zu ordnen und stabile Kristalle zu bilden. Dadurch wird ein energiearmer Zustand nahe am Optimum erreicht. Übertragen auf das Optimierungsverfahren entspricht die Temperatur einer Wahrscheinlichkeit, mit der sich ein Zwischenergebnis der Optimierung auch verschlechtern darf. Wie viele andere Lokale-Suche-Algorithmen kann das Verfahren dadurch ein lokales Optimum wieder verlassen, um ein besseres zu finden. Vom Metropolis-Algorithmus in Monte-Carlo-Simulationen unterscheidet sich das Verfahren durch das Absenken der Temperatur im Verlauf der Iteration.

Der Algorithmus wird beispielsweise beim Floorplanning im Laufe eines Chipentwurfs oder für die Standort- und Routenplanung verwendet.[1]

Es gibt auch Quantenversionen von Annealing (mit Tunnelung zwischen den Minima), eingeführt in den 1990er Jahren.[2][3]

Motivation

Der Algorithmus des Simulated Annealing ist durch physikalische Überlegungen motiviert.[4] Gesucht sei ein energetisch günstigster Zustand eines Systems, welches mithilfe der Boltzmann-Statistik beschrieben werden kann. Gemäß der Boltzmann-Statistik ist die Wahrscheinlichkeit, einen Mikrozustand mit Energie Ej anzutreffen, gegeben durch die Wahrscheinlichkeitsverteilung

p(Ej)exp(EjkBT),

wobei kB die Boltzmann-Konstante und T die Temperatur ist. Die Energie des energetisch günstigsten Zustandes sei E0. Die obige Proportionalität bleibt bestehen bei Multiplikation mit einem von Ej unabhängigen Faktor:

p(Ej)exp((EjE0)kBT)

Da E0 der energetisch günstigste Zustand ist, gilt EjE00. Weiterhin ist kB>0 und T>0. Somit ist der Exponent negativ, und mit abnehmender Temperatur wird sein Betrag größer, wodurch die Wahrscheinlichkeit sinkt, einen angeregten Energiezustand mit mindestens Ej zu finden. Senkt man somit die Temperatur des Systems langsam ab, so wird der energetisch günstigste Zustand mit immer größerer Wahrscheinlichkeit angetroffen.

Problemstellung

Gegeben sei der Lösungsraum D, eine Fitnessfunktion f:D, die jeder Lösung in D einen Wert zuweist, und ein Abbruchkriterium.

Gesucht ist eine approximative Lösung des globalen Minimums von f über D, also ein xD mit möglichst kleinem Wert f(x). Sollte ein x mit möglichst großem Wert gesucht sein (Maximierungsproblem), kann man dies durch Negieren von f einfach auf den vorigen Fall zurückführen.

Außerdem wird ein Umgebungsbegriff U:D𝒫(D) benötigt (wobei 𝒫(D) die Potenzmenge von D bezeichnet), um zu gegebenem xD eine benachbarte Lösung yU(x) zu erzeugen.

Algorithmus

  1. Initialisierung:
    • wähle eine Startlösung xD
    • setze xapprox=x
    • wähle eine monoton gegen Null fallende Folge von positiven Temperaturwerten (Tt)t
    • Setze t=0
  2. lokale Veränderung:
    • wähle zu x einen Nachbarn yU(x) zufällig aus
  3. Selektion:
    • wenn f(y)f(x), setze x=y
    • anderenfalls setze x=y nur mit Wahrscheinlichkeit exp(f(y)f(x)Tt).
  4. Bisher beste Lösung aktualisieren:
    • wenn f(x)<f(xapprox), setze xapprox=x
  5. Inkrementiere:
    • setze t=t+1
  6. Abbruch oder weiter:

Erläuterungen

Die Wahrscheinlichkeit exp(f(y)f(x)Tt), dass x durch ein schlechteres y ersetzt wird, ist umso kleiner, je größer die Verschlechterung f(y)f(x) ist. Weil Tt eine monoton fallende Folge ist, nimmt die Wahrscheinlichkeit außerdem während eines Programmlaufs immer mehr ab. Das Verfahren verhält sich mit abnehmendem Tt mehr und mehr wie ein Bergsteigeralgorithmus.

Wie ein Nachbar yU(x) gewählt werden sollte, hängt von dem vorliegenden Problem ab. In der Informatik ist häufig der Wertebereich D={0,1}n und x=(x1,x2,,xn) wird als Bit-Vektor betrachtet. Ein Nachbar y von x kann dann z. B. durch das Flippen (Invertieren) von einem oder von wenigen Bits erzeugt werden (siehe Wegener 2005).

Es sind verschiedene Abbruchbedingungen denkbar. Zum Beispiel wird nur eine maximale Anzahl von Durchläufen erlaubt, eine ausreichende Fitness definiert, eine Untergrenze für die Abkühlung festgelegt oder eine Anzahl t von Zeitpunkten definiert, über die xapprox sich nicht mehr geändert hat.

Graphische Verdeutlichung

Datei:SimAnnealingLandschaft.png
Graphische Darstellung einer Landschaft, in der ein globales Minimum gefunden werden soll.

Die Idee des simulierten Abkühlens kann man sich graphisch verdeutlichen.[5]

Angenommen, man sucht in einer zweidimensionalen Landschaft den (global) tiefsten Punkt. Die Landschaft selbst besteht aus vielen unterschiedlich tiefen Dellen. Die einfache Suchstrategie (suche den nächsten tiefsten Punkt) entspricht dem Verhalten einer Kugel, welche in dieser Landschaft ausgesetzt wird. Sie rollt zum nächsten lokalen Minimum und bleibt dort. Bei der simulierten Abkühlung wird der Kugel immer wieder ein Stoß versetzt, der mit zunehmender „Abkühlung“ schwächer wird. Dieser ist idealerweise stark genug, um die Kugel aus einer flachen Delle (lokales Minimum) zu entfernen, reicht aber nicht aus, um aus dem globalen Minimum zu fliehen.

Simulated Annealing bei der Suche nach einem Maximum. Die zahlreichen lokalen Maxima werden durch die bei noch hoher „Temperatur“ starke Rausch-Bewegung der Temperatursimulation schnell wieder verlassen. Das globale Maximum wird aber zuverlässig gefunden, da der fallende „Temperatur“-Wert zum Ende nicht mehr ausreicht, es zu verlassen. Das erbringt bessere Resultate als ein einfacher Bergsteigeralgorithmus.

Vorlage:Absatz

Siehe auch

Literatur

Einzelnachweise

  1. Bogatzki, A.: Fabrikplanung: Verfahren zur Optimierung von Maschinenaufstellung. Diss. Universität Wuppertal (1998). Roderer 1998. ISBN 978-3-89073-234-3
  2. T. Kadowaki, H. Nishimori, Quantum annealing in the transverse Ising model, Phys. Rev. E, Band 58, 1998, S. 5355
  3. A. B. Finilla, M. A. Gomez, C. Sebenik, J. D. Doll, Quantum annealing: A new method for minimizing multidimensional functions, Chem. Phys. Lett., Band 219, 1994, S. 343
  4. JP Dr. A. Arnold, Universität Stuttgart, Institut für Computerphysik, Skript zur Vorlesung Physik auf dem Computer (PDF; 3,3 MB) S. 181 ff.
  5. Google TechTalk Vortrag Eine kurze, aber sehr verständliche Erklärung zum Thema findet man ab Minute 35.