Lemma von Arden

Aus testwiki
Version vom 1. September 2024, 15:55 Uhr von imported>Invisigoth67 (form)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Das Lemma von Arden trifft eine Aussage über Mengen von Zeichenreihen, welche im Rahmen der formalen Sprachen Gegenstand der theoretischen Informatik, spezieller der Automatentheorie sind.

Formulierung

Es sei Σ ein beliebiges Alphabet; * stehe für den Kleene-Stern, + für die positive transitive Hülle, für die Konkatenation zweier Zeichenreihen-Mengen und für deren gewöhnliche Vereinigung (in dieser Priorität – Klammerung wird entsprechend vernachlässigt). Dann gilt folgende Äquivalenz:

(YΣ+)(ZΣ*)((X=YXZ)(X=Y*Z))

bzw. folgende Gleichung:

(YΣ+)(ZΣ*)({XΣ*X=YXZ}={Y*Z})

In Worten: Für eine beliebige Zeichenreihen-Menge Z und eine Zeichenreihen-Menge Y, welche das leere Wort ϵ nicht enthält, hat die Gleichung X=YXZ nur die eine Lösung X=Y*Z.

Beweis

Auf die Quantisierung sei in beiden Beweisteilen der besseren Lesbarkeit halber weg verzichtet, was bei Allquantifizierung nicht weiter problematisch ist, solange keine Spezifikationen für die betreffenden Variablen vorgenommen werden. Entsprechende Stellen werden speziell behandelt.

Hinrichtung

Es sei S eine Lösung für X in der Gleichung X=YXZ.

Obermenge

Zunächst wird die Definition des Kleene-Sternes angewendet und die Distributivität der Konkatenation über Vereinigungen genutzt:

S(Y*Z=(n0Yn)Z=n0YnZ)

Nun lässt sich durch vollständige Induktion über n zeigen, dass SYnZ für alle n0 gilt:

  • Induktions-Hypothese

SYnZ

  • Induktions-Anfang

(SZ)(S{ε}Z)(SY0Z)

  • Induktions-Schritt

(SYSZ)(SYS)(SYYnZ)(SYn+1Z)

Da für verschiedene n alle Yn paarweise disjunkt sind, folgt aus (n0)(SYn) auch die ursprüngliche Obermengen-Beziehung SY*Z.

Untermenge

Hier wird der Beweis indirekt geführt: Man nimmt an, SY*Z gilt nicht, womit es mindestens ein Wort w mit (wS)(wY*Z) geben muss. Weil S=YSZ ist, muss w auch Element von YSZ sein oder anders formuliert (wYS)(wZ). Im ersten Fall setzt sich w aus zwei Teilwörtern yY und sS zusammen, also w=ys. Da y nicht das leere Wort sein kann (die Quantifizierung fordert YΣ+), folgt |s|<|w|. Betrachtet man das kleinste der als existierenden angenommenen w, dann müsste außerdem sY*Z gelten, was aber im Widerspruch zur Annahme wY*Z steht. Im anderen Fall, also wZ, ergibt sich ebenfalls der Widerspruch wY*Z. Da beide Fälle in Widersprüchen enden, muss die Annahme falsch gewesen sein, dass SYnZ nicht gilt.

Rückrichtung

Diese Beweisrichtung ist trivial, da es reicht zu zeigen, dass Y*Z die Gleichung X=YXZ überhaupt löst:

(X=Y*Z)(X=(Y+{ε})Z)(X=(YY*{ε})Z)(X=YY*Z{ε}Z)(X=YXZ)

Anwendung

Die zentrale Bedeutung des Arden-Lemmas ist seine Anwendung in der Automatentheorie. Es erleichtert das Ermitteln der mengentechnischen Beschreibung, der von einem Nichtdeterministischen endlichen Automaten (NEA) akzeptierten Sprache:

Betrachtet wird ein NEA 𝒜=(Q,Σ,Δ,i,F), dessen Zustände mit den natürlichen Zahlen von 1 bis n bezeichnet sein sollen (also Q={1,2,,n}). Zusätzlich werden folgende Definitionen herangezogen:

Aq,r={σΣ(q,σ,r)Δ}

Bq={{ε}qF{}qF

Mit Hilfe dieser Mengen lässt sich die Teilsprache jedes Zustands qQ angeben:

Lq=(rQAq,rLr)Bq

Durch die Definition von Lq erhält man ein Gleichungs-System mit n Gleichungen:

L1=A1,1L1A1,2L2A1,nLnB1L2=A2,1L1A2,2L2A2,nLnB2Ln=An,1L1An,2L2An,nLnBn

Nun bringt man eine Teilsprache auf eine geeignete Form, welche eine Anwendung des Lemmas ermöglicht:

Lq=Aq,qLq((rQ{q}Aq,rLr)Bq)

Laut Arden’s Lemma ist diese Aussage äquivalent zu folgender:

Lq=Aq,q*((rQ{q}Aq,rLr)Bq)

Diese Lösung ist eindeutig. Setzt man nun Lq in alle anderen Gleichungen ein, so erhält man ein Gleichungs-System mit einer Variable weniger und kann so auf diese Weise immer weiter bis zum trivialen Fall vereinfachen, bei dem nur noch eine Gleichung übrig ist, welche man unabhängig von allen anderen Teilsprachen lösen kann. Durch Rückwärts-Einsetzen erhält man dann auch die übrigen Teilsprachen um schlussendlich die eindeutige Lösung des gesamten Gleichungs-Systems zu ermitteln und mit Li die vom Automaten 𝒜 akzeptierte Sprache L(𝒜) zu identifizieren.

Algebraische Betrachtung

Aus Sicht der abstrakten Algebra stellt (𝒫(Σ*),,) die Struktur eines Dioids dar, was heißt, dass sowohl (𝒫(Σ*),) als auch (𝒫(Σ*),) einen Monoiden bilden und distributiv über ist. Das neutrale Element bezüglich der Vereinigung ist die leere Menge und das neutrale Element bezüglich der Konkatenation ist {ε}. Aufgrund der fehlenden Invertierbarkeit ist es im Allgemeinen nicht möglich Gleichungen über dieser Struktur zu lösen. Das Lemma von Arden ermöglicht es aber zumindest die Lösungen einiger spezieller Gleichungen zu ermitteln und das sogar eindeutig.

Beispiele

Einfache Beispiele

(X={a}X{b})(X={a}*{b}={anbn0}={b,ab,aab,aaab})

(X={0,1}X{u,v})(X={0,1}*{u,v}={u,v,0u,0v,1u,1v,00u,00v,01u,01v,10u,10v,})

Komplexes Beispiel

𝒜=({S0,S1,S2,S3,S4},{0,1},Δ,S0,{S1,S3})

Δ={(S0,ε,S1),(S0,ε,S3),(S1,0,S2),(S1,1,S1),(S2,0,S1),(S2,1,S2),(S3,0,S3),(S3,1,S4),(S4,0,S4),(S4,1,S3)}

Man erhält damit das folgende Gleichungs-System:

LS0={}LS0{ε}LS1{}LS2{ε}LS3{}LS4=LS1LS3LS1={}LS0{1}LS1{0}LS2{}LS3{}LS4{ε}={1}LS1{0}LS2{ε}LS2={}LS0{0}LS1{1}LS2{}LS3{}LS4={0}LS1{1}LS2LS3={}LS0{}LS1{}LS2{0}LS3{1}LS4{ε}={0}LS3{1}LS4{ε}LS4={}LS0{}LS1{}LS2{1}LS3{0}LS4={1}LS3{0}LS4


Durch die Anwendung des Lemmas erhält man schrittweise die Lösung:

LS2={0}LS1{1}LS2

LS2={1}*{0}LS1


LS1={1}LS1{0}LS2{ε}={1}LS1{0}{1}*{0}LS1{ε}=({1}{0}{1}*{0})LS1{ε}

LS1=({1}{0}{1}*{0})*


LS4={1}LS3{0}LS4

LS4={0}*{1}LS3


LS3={0}LS3{1}LS4{ε}={0}LS3{1}{0}*{1}LS3{ε}=({0}{1}{0}*{1})LS3{ε}

LS3=({0}{1}{0}*{1})*


LS0=LS1LS3=({1}{0}{1}*{0})*({0}{1}{0}*{1})*


Da S0 der Startzustand von 𝒜 ist, gilt L(𝒜)=LS0, was der dem regulären Ausdruck (1+01*0)*+(0+10*1)* zugeordneten Sprache entspricht.

Literatur

  • D. N. Arden: Theory of Computing Machine Design: An Intensive Course for Engineers, Scientists, and Mathematicians, University of Michigan Press, Michigan, USA, 1960 (S. 1–35)
  • John E. Hopcroft: Introduction to Automata Theory, Languages, and Computation, Addison-Wesley, 1979. ISBN 0-201-02988-X
  • Marko Van Eekelen, Herman Geuvers, Julien Schmaltz, Freek Wiedijk: Interactive Theorem Proving, Springer Science & Business Media, 2011
  • Harold V. McIntosh: One Dimensional Cellular Automata, Luniver Press, 2009 (S. 87)
  • A. Arnold, D. Niwinski: Rudiments of µ-calculus, Elsevier, 2001 (ab S. 107)
  • John Daintith: Ardens rule, Oxford University Press, 2004 (englisch)