Resolution (Logik)

Aus testwiki
Version vom 9. April 2024, 18:37 Uhr von imported>Joerg Bader (Beweis: Beweislogik klarer herausgestellt)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Die Resolution ist ein Verfahren der formalen Logik, um eine logische Formel auf Gültigkeit zu testen.

Das Resolutionsverfahren, auch Resolutionskalkül genannt, ist ein Widerlegungsverfahren: Statt direkt die Allgemeingültigkeit einer Formel zu zeigen, leitet es einen logischen Widerspruch aus deren Verneinung ab.

Diese Herleitung geschieht mittels eines Algorithmus auf rein formalem Weg und kann deshalb von einem Computerprogramm durchgeführt werden. Die Resolution ist eine der bekanntesten Techniken des Maschinengestützten Beweisens.

Das Resolutionsverfahren in der Aussagenlogik

Resolvente (auch: Resolvent)

Seien C1, C2 Klauseln einer aussagenlogischen Formel, die in konjunktiver Normalform vorliegt. Gibt es ein Literal L, welches in C1 positiv und in C2 negativ vorkommt, ist die Vereinigung beider Klauseln ohne das positive und negative Literal L eine Resolvente (auch: der Resolvent) CR. Das heißt insbesondere: Gibt es kein komplementäres Literal, so gibt es auch keine Resolvente.

LC1
LC2

CR=(C1{L})(C2{L})

Es darf immer nur genau ein Literal resolviert werden. Je nach Ausgangsklauseln ist die Bildung verschiedener Resolventen möglich.

Anders notiert: Aus

(A1A2An)(B1B2Bm¬A1)

wird auf die Resolvente

A2AnB1Bm

geschlossen.

Die Resolvente ist nicht äquivalent zu den Ausgangsklauseln. Die Bedeutung der Resolvente liegt vielmehr darin, dass die Ausgangsklauseln nur dann beide gleichzeitig erfüllbar sind, wenn auch die Resolvente erfüllbar ist (notwendige Bedingung). Gelingt es, die leere Klausel zu resolvieren, die stets unerfüllbar ist, ist somit die Unerfüllbarkeit der gesamten Formel gezeigt.

Beweis

Die Resolvente CR ist eine notwendige Bedingung für die Ausgangsklauseln C1 und C2, es gilt also

(C1C2)CR.

Man sagt CR folgt aus C1 und C2. Der Beweis zur Korrektheit dieser Resolution kann wie folgt geführt werden:

[(A1A2An)(B1B2Bm¬A1)](A2A3AnB1B2Bm)¬[(A1A2An)(B1B2Bm¬A1)](A2A3AnB1B2Bm)(¬A1¬A2¬An)(¬B1¬B2¬BmA1)(A2A3An)(B1B2Bm)(¬A1A2A3An)(A1B1B2Bm)¬A1A11

Res-Operator

Das Ausführen eines einzelnen Resolutionsschrittes wird mit dem Res-Operator notiert:

Res(F)=F{R}, wobei R eine Resolvente zweier Klauseln aus F ist

Mit Res(F)=nResn(F) bezeichnet man die Vereinigung aller möglichen Resolutionsschritte auf F.

Somit sind folgende Aussagen möglich:

  1. ist die leere Klausel Element von Res(F), ist F unerfüllbar und
  2. ist die leere Klausel Element von Res(¬F), ist F eine Tautologie

Resolution und Prädikatenlogik

Problemstellung

Für interessantere Problemstellungen ist das Instrumentarium der Aussagenlogik nicht ausreichend. Das Prinzip der Resolution sollte von der einfachen Aussagenlogik auf die Prädikatenlogik erster Stufe ausgeweitet werden können. Neben logischen Literalen sind dabei zu berücksichtigen:

  • Variablen (beispielsweise Zahlenvariablen), üblicherweise mit Symbolen wie x und y bezeichnet
  • die Quantoren (der Existenzquantor) und (der Allquantor),
  • Konstanten, beispielsweise 0,1,π
  • ein- und mehrwertige Funktionen, üblicherweise mit Symbolen wie f(x) oder g(x,y) bezeichnet.

Ein durchaus typisches Beispiel für eine prädikatenlogische Aussage ist:

1) xyzK(g(a,z),y)K(g(f(a),f(z)),x)

(Anmerkung: Setzen wir g(t,u)=|tu| und K(v,w)(v<w), so liefert uns die obige Formel die formal-logische Definition der Stetigkeit der Funktion f im Punkt a.)

Damit auf solche Aussagen die Resolution angewendet werden kann, müssen sie umgeformt und das oben beschriebene Verfahren erweitert werden.

Normalisierung

Die ersten Schritte bestehen darin, die zu widerlegende Aussage in eine Form zu bringen, die der konjunktiven Normalform der Aussagenlogik ähnelt.

  1. Man bringt die zu widerlegende Formel in die Pränexform. Nach dieser Umformung stehen die Quantoren alle am Anfang der Formel, und der Rest der Formel hat die Gestalt einer konjunktiven Normalform.
  2. Durch die Anwendung von Skolemfunktionen eliminiert man alle Existenzquantoren aus der Formel und bringt sie in die Skolemform.
  3. Nun sind alle Variablen in der Funktion an Allquantoren gebunden. Trifft man die Übereinkunft, Konstanten und Variablen unterschiedlich zu bezeichnen, beispielsweise Konstanten mit a,b,c,a1,a2,a3, und Variablen mit x,y,z,x1,x2,x3,, dann kann auch auf die explizite Notation des Allquantors verzichtet werden. Man lässt ihn ebenfalls weg und erhält die Klauselform der Aussage.[1]

Beispielsweise lautet die Klauselform der Formel 1) aus dem vorigen Abschnitt:

2) ¬K(g(a,z),s(x))K(g(f(a),f(z)),x)

Substitution und Vereinheitlichung

Die Formeln

P(x) und ¬P(a)

scheinen auf den ersten Blick nicht resolvierbar zu sein, da sie sich in x und a unterscheiden. Da die freie Variable x jedoch implizit ein Stellvertreter für alle x ist, darf (unter anderem) a für x eingesetzt werden.

Man erhält also die beiden Terme

P(a) und ¬P(a)

die sich offensichtlich miteinander resolvieren lassen.

Folgende Ersetzungen sind möglich:

3a) Ersetze Variable durch Konstante: P(x) P(a)
3b) Ersetze Variable durch eine andere Variable: P(x) P(y)
3c) Ersetze Variable durch Funktion einer Variablen: P(x) P(f(y))

Die Ersetzung von Variablen in einem Literal muss in konsistenter Weise durchgeführt werden: Wird eine Variable an einer Stelle durch einen Term ersetzt, so muss dies innerhalb des Literals überall geschehen:

4a) Korrekte Ersetzung: P(x,f(x)) P(a,f(a))
4b) Verbotene Ersetzung: P(x,f(x)) P(a,f(x))

Sei {x1,x2,,xn} eine Menge von Variablen. Sei {t1,t2,,tn} eine Menge von Termen, die aus Funktionen, Variablen oder Konstanten zusammengesetzt sein können.

  • Ein System S von Ersetzungen {x1t1,x2t2,,xntn} heißt eine Substitution.

Seien L1=P(t1,t2,,tn),L2=P(u1,u2,,un),,Lm=P(v1,v2,,vn) Literale über demselben Prädikat P, wobei die ti,ui,,vi wiederum Terme sind.

  • Eine Substitution S heißt eine Vereinheitlichung (oder auch Unifikator) von L1,L2,,Lm, wenn durch die Anwendung von S die Argumente aller Literale zur Übereinstimmung gebracht werden, das heißt, wenn S(L1)=S(L2)==S(Lm).

Zwei Literale über demselben Prädikat haben nicht notwendigerweise eine Vereinheitlichung. Beispielsweise lassen sich P(a) und P(b) nicht vereinheitlichen, wenn a und b unterschiedliche Konstanten sind.

  • Eine Vereinheitlichung S von Literalen heißt allgemeinste Vereinheitlichung, wenn es für jede andere Vereinheitlichung T dieser Literale eine Substitution V gibt, so dass T=SV.

Wenn eine Menge von Literalen eine Vereinheitlichung besitzt, dann besitzt sie eine allgemeinste Vereinheitlichung. Diese kann mit Hilfe eines relativ einfachen Algorithmus[2] ermittelt werden.

Resolution prädikatenlogischer Klauseln

Mit diesem Instrumentarium kann das Resolutionsverfahren auf Aussagen der Prädikatenlogik ausgeweitet werden.

  • Seien C1,C2 zwei Klauseln einer normalisierten prädikatenlogischen Aussage. Ohne Beschränkung der Allgemeinheit darf vorausgesetzt werden, dass diese keine übereinstimmenden Variablen enthalten (da sie durch einen Allquantor gebunden sind, können wir gleichnamige Variablen in einer Klausel umbenennen, auch wenn der Allquantor nicht mehr explizit geschrieben wird).
  • Seien L1 und L2 positive bzw. negiert vorkommende Literale in C1 bzw. C2, die eine allgemeinste Vereinheitlichung S besitzen.

Dann heißt

  • CR=S(C1C2){S(L1),¬S(L2)} ein binärer Resolvent von C1 und C2.
  • Sei ferner C eine Klausel mit einer Teilmenge von Literalen, die eine allgemeinste Vereinheitlichung S besitzt.

Dann heißt

  • S(C) ein Faktor von C.

Ein Resolvent zweier Klauseln C1,C2 ist

  • entweder ein binärer Resolvent von C1 und C2.
  • oder ein binärer Resolvent von C1 und einem Faktor von C2.
  • oder ein binärer Resolvent eines Faktors von C1 und C2.
  • oder ein binärer Resolvent eines Faktors von C1 und eines Faktors von C2.

Das Resolutionsverfahren für prädikatenlogische Aussagen besteht darin, so lange solche Resolventen zu erzeugen, bis die leere Klausel erzeugt und damit der Widerspruchsbeweis erbracht ist.[3]

Beispiel

Ein logisches Rätsel

Wir wollen das Prinzip am Beispiel eines kleinen, nicht wörtlich zu nehmenden logischen Rätsels illustrieren:

Seit dem Altertum ist bekannt, dass alle Athener klug (1) und alle Spartaner heldenmütig (2) sind. Außerdem ist bekannt, dass ein profundes Misstrauen zwischen beiden Städten herrscht, so dass doppelte Stadtbürgerschaften ausgeschlossen sind (3). Unser nach Griechenland entsandter Forscher war neulich zu Gast bei einer Konferenz. Mit Ausnahme unseres Forschers stammte jeder der Anwesenden aus einer der beiden Städte (4).

Der Forscher kam ins Gespräch mit den Herren Diogenes, Platon und Euklid. Mit ihren berühmten Vorbildern hatten diese nur den Namen gemein. Die Herren zogen kräftig übereinander vom Leder. Euklid sagte: „Wenn Platon Spartaner ist, dann ist Diogenes feige!“ (5) – Platon behauptete: „Diogenes ist eine Memme, wenn Euklid Spartaner ist!“ (6) „Wenn Diogenes allerdings Athener ist, dann ist Euklid ein Waschlappen!“ (7) – Worauf sich Diogenes den Bart glatt strich und postulierte: „Wenn Platon Athener ist, dann ist Euklid ein Dummkopf!“ (8)

Bei aller Spitzzüngigkeit blieben die drei Herren mit ihren Behauptungen bei der Wahrheit. Wer kommt aus welcher Stadt?

Das Rätsel in Klauselform

Wir setzen p für Platon, d für Diogenes, e für Euklid. Die Prädikate „ist Athener“, „ist Spartaner“, „ist heldenmütig“ und „ist klug“ bezeichnen wir mit A, S, H und K. Wir übersetzen die oben genannten Aussagen in die Klauselform und erhalten:

¬A(x) v K(x) (1)
¬S(x) v H(x) (2)
¬A(x) v ¬S(x) (3)
A(x) v S(x) (4)
¬S(p) v ¬H(d) (5)
¬S(e) v ¬H(d) (6)
¬A(d) v ¬H(e) (7)
¬A(p) v ¬K(e) (8)

Die Auflösung

Wir nehmen an, Platon sei Athener:

A(p) {Annahme} (9)

Nun wenden wir das Resolutionsprinzip an und erhalten:

¬K(e) {aus Resolution von (9) mit (8)} (10)
¬A(e) {aus Substitution von e für x und Resolution (10,1)} (11)
S(e) {Subs. (e:x), Res. (11,4)} (12)
¬H(d) {Res. (12,6)} (13)
¬S(d) {Subs. (d:x), Res. (13,2)} (14)
A(d) {Subs. (d:x), Res. (14,4)} (15)
¬H(e) {Res. (15,7)} (16)
¬S(e) {Subs. (e:x), Res. (16,2)} (17)
leere Klausel {Res. (17,12)} (18)

Somit ist die Annahme (9) zum Widerspruch geführt. Sie ist mitsamt den aus ihr abgeleiteten Klauseln (10) bis (18) zu verwerfen. Wir erhalten stattdessen:

¬A(p) {da (9) falsch ist} (19)
S(p) {Subs. (p:x), Res. (19,4)} (20)

Nehmen wir nun an, Diogenes sei Spartaner, und wenden wir weiterhin das Resolutionsprinzip an:

S(d) {Annahme} (21)
H(d) {Subs. (d:x), Res. (21,2)} (22)
¬S(p) {Res. (22,5)} (23)
leere Klausel {Res. (23,20)} (24)

Somit ist die Annahme (21) widerlegt und mitsamt den aus ihr abgeleiteten Klauseln (22) – (24) zu verwerfen. Wir erhalten stattdessen:

¬S(d) {da (21) falsch ist} (25)
A(d) {Subs. (d:x), Res. (25,4)} (26)

Nehmen wir an, Euklid sei Spartaner. Wir erhalten:

S(e) {Annahme} (27)
H(e) {Subs. (e:x), Res. (27, 2)} (28)
¬A(d) {Res. (28, 7)} (29)
leere Klausel {Res. (29,26)} (30)

Also ist (27) falsch und samt (28) – (30) zu verwerfen. Wir erhalten stattdessen:

¬S(e) {da (27) falsch ist} (31)
A(e) {Subs. (e:x), Res. (31,4)} (32)

Platon ist Spartaner (20). Diogenes ist Athener (26), ebenso Euklid (32).

Terminierung und Komplexität

Im Falle der Aussagenlogik terminiert das Verfahren: Es liefert in endlicher Zeit ein Ergebnis, ob eine vorgelegte Aussage erfüllbar ist. Die Rechenzeit wächst im allgemeinen Fall und mit den derzeit bekannten Verfahren exponentiell mit der Anzahl der Literale. Das Problem ist NP-vollständig.[4]

Im Falle der Prädikatenlogik terminiert das Verfahren stets mit dem korrekten Ergebnis, wenn es auf eine unerfüllbare Formel angewendet wird. Bei einer erfüllbaren Formel kommt es jedoch vor, dass das Verfahren kein Ende findet. Man spricht von Semi-Entscheidbarkeit. Wäre es anders, dann wäre das Resolutionsverfahren ein Algorithmus, um prädikatenlogische Formeln allgemein zu entscheiden – was unmöglich ist, da das Gültigkeitsproblem in der Prädikatenlogik nicht entscheidbar ist.

Andere Kalküle im logischen Einsatz

Quellen

  1. Davis, Martin: Eliminating the Irrelevant from Mechanical Proofs. in: Journal of Symbolic Logic, Vorlage:ISSN, Vol. 32, No. 1 (Mar., 1967), pp. 118–119
  2. Chang, Chin-Liang; Lee, Richard Char-Tung: Symbolic Logic and Mechanical Theorem Proving, Academic Press, 1973, ISBN 0-12-170350-9, S. 77ff
  3. Chang, Chin-Liang; Lee, Richard Char-Tung: Symbolic Logic and Mechanical Theorem Proving, Academic Press, 1973, ISBN 0-12-170350-9, S. 80–81
  4. Haken, A. "The Intractability of Resolution", Theoretical Computer Science 39 (1985), pp. 297–308.

Literatur

  • Chang, Chin-Liang; Lee, Richard Char-Tung: Symbolic Logic and Mechanical Theorem Proving, Academic Press, 1973, ISBN 0-12-170350-9