Ugly-Duckling-Theorem: Unterschied zwischen den Versionen

Aus testwiki
Zur Navigation springen Zur Suche springen
imported>Ole...liikhj
 
(kein Unterschied)

Aktuelle Version vom 1. September 2024, 13:27 Uhr

Das Ugly-Duckling-Theorem (zu deutsch Hässliches-Entlein-Theorem) ist ein Satz über Ähnlichkeiten verschiedener Merkmale und damit verbundene Aussagen für die Mustererkennung. Es wurde von Satoshi Watanabe bewiesen und trägt seinen Namen nach dem Kunstmärchen Das hässliche Entlein.

Aussage des Theorems

Auf einer Menge von Merkmalen weisen alle Paare von verschiedenen Mustern dieselbe Ähnlichkeit auf. Betrachtet man die Menge aller möglichen Aussagen auf den Mustern, stimmen beide Muster bei immer gleicher Anzahl Aussagen überein, die Anzahl gleicher Aussagen ist sogar konstant und unabhängig von dem gewählten Musterpaar. Wird zudem die Ähnlichkeit über die Anzahl aller möglichen Aussagen gewählt, so ist jedes Musterpaar gleich ähnlich.

Damit ähnelt ein hässliches Entlein genauso einem Schwan wie zwei Schwäne untereinander. Diese Aussage ist der Namensgeber für dieses Theorem.

Eine Aussage über Ähnlichkeiten oder Unterschiede von Mustern ist damit subjektiv und hängt von vorher erfolgten Annahmen ab.

Eine andere Betrachtungsweise ist das systematische Aufstellen aller erdenklichen Ähnlichkeiten der Muster in dem gegebenen Merkmalsraum, und die Aufnahme von Relationen, scheinen diese noch so sinnlos und ohne Bezug auf einen möglichen Anwendungsfall; und so zeigt sich, dass die Anzahl der Ähnlichkeiten stets gleich ist. Diese scheinbar sinnlos aufgenommenen Ähnlichkeiten erscheinen eben durch vorherige Annahmen und der Definition einer Äquivalenzrelation im speziellen Anwendungsfall nicht.

Beweisidee

Die auf einer Menge von Mustern möglichen Aussagen können bei einer diskreten Darstellung über Prädikate dargestellt werden. Diese lassen sich dann wie zum Beispiel durch „f1 AND f2“ angeben, wenn fi ein Prädikat bezeichnet. Diese Prädikate sollen nun jeweils eine Möglichkeit aus allen möglichen Ähnlichkeiten darstellen.

Beispielhafte Darstellung von Prädikaten und Mustern

Darstellung vier Elemente in einem Venn-Diagramm mit zwei Prädikaten.

Für Elemente x1,x2,x3,x4 lassen sich nun solche Prädikate in einem Venn-Diagramm darstellen. Durch verschiedene Kombinationen der Prädikate können Aussagen formal dargestellt werden. Das Prädikat f2 kann nun beispielsweise die Aussage „Farbe Blau“ der Fahrzeuge x2 und x3 markieren.

Mögliche Kombinationen

Diese Elemente können nun in verschiedenster Weise kombiniert werden. Die Anzahl der Kombinationen wird durch r=0n(nr)=2n berechnet, für n die Anzahl der möglichen Muster.

Für das oben gewählt Beispiel sind dies 16 mögliche Aussagen. Neben True (Wahr), False (Falsch) sind dies:

1 Element ( (41)=4)
Muster Prädikatendarst.
x1 f1ANDNOTf2
x2 f1ANDf2
x3 NOTf1ANDf2
x4 NOT(f1ORf2)
2 Elemente ((42)=6)
Muster Prädikatendarst.
x1ORx2 f1
x1ORx3 f1XORf2
x1ORx4 NOTf2
x2ORx3 f2
x2ORx4 NOT(f1XORf2)
x3ORx4 NOTf1
3 Elemente ( (43)=4)
Muster Prädikatendarst.
x1ORx2ORx3 f1ORf2
x1ORx2ORx4 f1ORNOTf2
x1ORx3ORx4 NOT(f1ANDf2)
x2ORx3ORx4 NOTf1ORf2

Geteilte Aussagen

Für die vier Muster im obigen Fall gibt es nun Prädikate, die für ein Paar (xi,xj) beide Muster beinhalten: Für Prädikate mit nur einem Element gibt es keines, für Prädikate mit zwei Elementen gibt es genau ein Prädikat für (xi,xj) und für Prädikate mit drei Elementen gibt es zwei solcher Prädikate. So sind dies z. B. für (x1,x3): x1ORx3,x1ORx2ORx3,x1ORx3ORx4 und True (also x1ORx2ORx3ORx4).

Allgemein gibt es für ein Paar (xi,xj) mit n möglichen Mustern r2n(n2r2)=(1+1)n2=2n2 geteilte Aussagen.

Diese Formel ist vor allem unabhängig von den gewählten Mustern, also konstant und jedes Paar hat die gleiche Anzahl gemeinsamer Aussagen.

Anwendung

Ähnlich den No-Free-Lunch-Theoremen, bei denen gezeigt wird, dass es keinen generell besten Klassifikator gibt, zeigt das Ugly-Duckling-Theorem, dass es ebenso ohne vorherige Annahmen keine beste Repräsentation von Merkmalen geben kann. Diese bedeutet in der Mustererkennung, dass eine optimale Klassifikation nur unter Annahmen erfolgen kann und stets spezifisch dem Problem angepasst ist.

Literatur