Odds-Strategie

Aus testwiki
Version vom 24. März 2024, 19:04 Uhr von imported>Aka (typografische Anführungszeichen, Kleinkram)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Die Odds-Strategie (abgeleitet von Odds) bzw. der Bruss-Algorithmus oder die Bruss-Strategie (nach dem Entwickler des Verfahrens F. Thomas Bruss) ist ein mathematisches Verfahren aus der Entscheidungstheorie, mit dem man mit großer Wahrscheinlichkeit eine optimale „Gelegenheit“ aus einer Folge von Ereignissen auswählen kann. Der Algorithmus zur Berechnung der Strategie ist außerdem selbst optimal.[1]

Die Strategie kann angewendet werden, wenn eine zeitliche Abfolge von unabhängigen Ereignissen vorliegt, von denen einige als „Gelegenheiten“ gelten, und bei Eintreten einer Gelegenheit nicht bekannt ist, ob später noch eine andere oder bessere Gelegenheit folgt. Ein Beispiel ist die Situation eines Gebrauchtwagenhändlers oder Immobilienmaklers, der bei Vorliegen eines Kaufangebots nicht weiß, ob später ein weiterer Kaufinteressent ein besseres Angebot macht. Jedes bessere Angebot ist dann ein interessantes Ereignis (Gelegenheit), und das letzte interessante Ereignis, das man im Voraus nicht kennt, stellt das beste Angebot dar. Ein spezieller Fall für die Anwendung der Odds-Strategie ist das Sekretärinnenproblem, in dem der bzw. die beste Kandidat/Kandidatin ausgewählt werden soll.

Die Odds-Strategie ist in mehreren Bereichen anwendbar, da sie beliebige Definitionen für „Gelegenheit“ bzw. „interessante Ereignisse“ zulässt und damit die Optimierung recht allgemeiner Zielfunktionen ermöglicht. So zum Beispiel ist es bei klinischen Versuchen aus ethischen Gründen optimal zu „stoppen“, wenn in einer Versuchsreihe einer festen Anzahl sequentiell zu behandelnder Patienten mit maximaler Wahrscheinlichkeit der letzte Behandlungserfolg verzeichnet wurde. Hier ist jede erfolgreiche Behandlung eine Gelegenheit. Gelegenheiten werden nicht qualitativ verglichen, doch mit der letzten Gelegenheit sind alle Erfolge erreicht, so dass allen weiteren Patienten die Behandlung erspart werden kann (siehe z. B. „Compassionate use“ und (Bruss, 2005).)

Definitionen

Um die Odds-Strategie anwenden zu können, muss die Realität mathematisch modelliert werden. Dazu wird eine Folge von n Ereignissen angenommen, zum Beispiel könnte jedes Ereignis ein Kaufangebot sein. Die Ereignisse werden mit dem Index k von 1 bis n durchnummeriert: E1,E2,,Ek,,En. Jedes Ereignis Ek ist mit einer bestimmten Wahrscheinlichkeit pk eine „Gelegenheit“.

Wenn pk die Wahrscheinlichkeit dafür ist, dass Ek die gesuchte Gelegenheit ist, dann ist

qk=1pk

die Wahrscheinlichkeit dafür, dass sie es nicht ist. Ihren Namen hat die Strategie vom Quotienten

rk=pkqk,

der englisch Odds genannt wird.

Algorithmus

Die Strategie besteht darin, ab einem bestimmten Index s, dem sogenannten „Stoppindex“, die erste Gelegenheit wahrzunehmen, die besser ist als alle bisherigen Gelegenheiten.

Der Stoppindex s wird bestimmt, indem die Odds rückwärts aufgeschrieben werden: rn, rn1, rn2 usw. Dabei werden sie aufsummiert, und zwar solange, bis die Summe 1 erreicht oder übertroffen wird. Man definiert dazu die Summe

Rk=i=knri

und dasjenige k, bei dem der Wert dieser Summe erstmals den Wert 1 erreicht oder übertrifft, bildet den Stoppindex s.

Erfolgswahrscheinlichkeit

Die Odds-Strategie ist optimal unter der Vorgabe, von allen Gelegenheiten mit der höchsten Wahrscheinlichkeit die letzte Gelegenheit zu wählen. In der Anwendung wird dabei unter Gelegenheit oft ein Ereignis verstanden, das nach einem Kriterium besser als alle vorherigen Ereignisse ist, zum Beispiel ein besseres Angebot als alle vorgehenden Angebote. In diesem Kontext wählt die Odds-Strategie im Vergleich zu anderen Strategien das beste Angebot mit höchster Wahrscheinlichkeit.

Die Erfolgswahrscheinlichkeit für die Odds-Strategie, also die Wahrscheinlichkeit dafür, dass die letzte beziehungsweise beste Gelegenheit genutzt wird, ist: W=RsQs. Hierbei ist

Rs=i=snri

die Summe der Odds und

Qs=i=snqi

die Wahrscheinlichkeit, dass unter den in Frage kommenden Ereignissen keine Gelegenheit ist.

Beispiele

Sekretärinnenproblem

k pk qk rk Rk
16 0,0625 0,9375 0,0667 0,0667
15 0,0667 0,9333 0,0714 0,1381
14 0,0714 0,9286 0,0769 0,2150
13 0,0769 0,9231 0,0833 0,2984
12 0,0833 0,9167 0,0909 0,3893
11 0,0909 0,9091 0,1000 0,4893
10 0,1000 0,9000 0,1111 0,6004
9 0,1111 0,8889 0,1250 0,7254
8 0,1250 0,8750 0,1429 0,8682
7 0,1429 0,8571 0,1667 1,0349

Vorlage:Hauptartikel Angenommen, der Gebrauchtwagenverkäufer weiß, dass sich in einem Monat durchschnittlich 16 Kunden für ein Auto interessieren, und er möchte natürlich demjenigen Kunden verkaufen, der den höchsten Preis bietet. Ein Ereignis ist für den Gebrauchtwagenhändler also dann eine „Gelegenheit“, wenn es besser ist als alle vorherigen.

Für das erste Angebot gilt das mit Sicherheit, also ist p1=1. Für das zweite Angebot ist p2=12, wenn jede Ankunftsreihenfolge als gleich wahrscheinlich vorausgesetzt wird, allgemein gilt dann pk=1k. Daraus folgt qk=k1k und rk=pkqk=1k1.

Da der Gebrauchtwagenhändler durchschnittlich 16 Kunden pro Monat hat, ist n=16. Die nebenstehende Tabelle zeigt, dass der Stoppindex s=7 ist, weil bei k=7 die Summe Rk=i=knri der rückwärts aufsummierten Odds den Wert 1 erstmals erreicht bzw. überschreitet. Der Gebrauchtwagenhändler muss also bis zum siebten Angebot warten, und dann das erste annehmen, das besser ist als alle vorherigen.

Die Erfolgswahrscheinlichkeit ist W=RsQs=1,03490,3750=0,3881, also zirka 39 %. Mit anderen Worten: Der Gebrauchtwagenhändler verkauft das Auto in 39 % aller Fälle zum besten Preis.

Verallgemeinerungen

Das vorherige Beispiel ist das „Sekretärinnenproblem“. Die Lösung ist weniger interessant, sobald der Gebrauchtwagenhändler Zusatzinformationen besitzt. Hier zeigt sich der Vorteil der allgemeinen Definition der rk=pkqk in der Odds-Strategie. Nehmen wir als einfaches Beispiel an, der Gebrauchtwagenhändler kenne drei der letzten potentiellen Kunden und glaube aus Erfahrung zu wissen, dass jeder dieser drei den bisherigen Höchstpreis unabhängig voneinander mit der Wahrscheinlichkeit p überbietet. Wenn p mindestens den Wert 14 besitzt (bzw. die entsprechenden rk mindestens den Wert 13), so zeigt nun die Odds-Strategie, dass es optimal ist, zumindest auf eine weitere Angebotserhöhung zu setzen. Verallgemeinerungen für eine unbekannte Anzahl von potentiellen Kunden sind ebenfalls möglich mittels einer Integralversion (Bruss, 2000) der Odds-Strategie.

Siehe auch

Verwandte Themen, bei denen man aus Teilinformation die optimale Entscheidung des Restproblems treffen kann:

Literatur

Einzelnachweise

  1. Bruss, Louchard: The Odds-algorithm based on sequential updating and its performance. AAP, Nr. 41, 2009, S. 131–153. (ps)