Kleenesche und positive Hülle

Aus testwiki
Version vom 31. März 2021, 13:56 Uhr von imported>JamesP (fix typo)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Die kleenesche Hülle (auch endlicher Abschluss, Kleene-*-Abschluss, Verkettungshülle oder Sternhülle genannt) eines Alphabets Σ oder einer formalen Sprache L ist die Menge aller Wörter, die durch beliebige Konkatenation (Verknüpfung) von Symbolen des Alphabets Σ bzw. von Wörtern der Sprache L gebildet werden können, wobei das leere Wort ε inbegriffen ist. Sie ist nach dem US-amerikanischen Mathematiker und Logiker Stephen Cole Kleene benannt. Demgegenüber ist die positive Hülle (auch Kleene-+-Abschluss genannt) eines Alphabets Σ oder einer formalen Sprache L die Menge aller Wörter, die aus den Symbolen von Σ beziehungsweise aus Wörtern von L gebildet werden können und die nur dann das leere Wort enthält, wenn die positive Hülle auf eine Sprache angewandt wird, die selbst das leere Wort als Element enthält.

Der Operator der kleeneschen Hülle ist der Kleene-Stern *“. So ist die Darstellung der kleeneschen Hülle eines Alphabets Σ gleich Σ* und einer Sprache L gleich L*. Demgegenüber ist der Operator der positiven Hülle das Pluszeichen +“, sodass die positive Hülle eines Alphabets Σ mit Σ+ und einer Sprache L mit L+ dargestellt wird.

In Anlehnung an den Kleene-*-Operator über Sprachen wird der *-Operator bei regulären Ausdrücken ebenfalls Kleene-*-Operator genannt. Die Anzahl verschachtelter Kleene-*-Operatoren bestimmt die Sternhöhe eines regulären Ausdrucks.

Definition

Hüllenoperator für Alphabete

Die kleenesche Hülle Σ* eines Alphabets Σ ist eine Sprache, die alle Wörter über dem Alphabet enthält. Sie lässt sich mit Hilfe der strukturellen Induktion definieren. Im Induktionsanfang definiert man zunächst, dass das leere Wort ε in der kleeneschen Hülle enthalten ist, und im Induktionsschritt wird definiert, dass für jedes Wort w, das Element der kleeneschen Hülle ist, auch die Konkatenationen wa für alle Symbole aΣ Elemente der Kleeneschen Hülle sind:

  • Induktionsanfang: εΣ*
  • Induktionsschritt: (wΣ*)(aΣ)waΣ*

Die positive Hülle Σ+ eines Alphabets Σ ist definiert als die kleenesche Hülle dieses Alphabets ohne das leere Wort:

Σ+:=Σ*{ε}

Ausgehend von der kleeneschen Hülle lassen sich Teilmengen der Wörter mit fester Länge n definieren.

Σn:={wwΣ*|w|=n}

Alternativ kann Σn als das n-fache kartesische Produkt des Alphabets definiert werden, also

Σn=i=1nΣ=Σ××Σn-mal mit Σ0={ε}.

Dann gilt:

Σ*=i0Σi und
Σ+=iΣi

Hüllenoperator für Sprachen

Die kleenesche Hülle L* einer Sprache L ist die Vereinigung all ihrer Potenzsprachen (wiederholte Konkatenation der Sprachen):

L*:=i0Li

Dabei gilt L0={ε} und Ln+1=LnL.

Die positive Hülle L+ einer Sprache L ist ähnlich definiert, sie ist die Vereinigung aller Potenzen von L größer gleich 1:

L+:=iLi

Beispiele

Alphabete

Die kleenesche Hülle des Alphabets Σ={a} enthält das leere Wort ε, das Wort εa=a und daher auch das Wort aa=aa und so weiter. Damit ist

Σ*={ε,a,aa,}.

Für das Alphabet Σ={a,b} gilt Σ2={aa,ab,ba,bb}, Σ3={aaa,aab,aba,abb,baa,bab,bba,bbb} und so weiter. Damit ist

Σ*={ε,a,b,aa,ab,ba,bb,aaa,aab,aba,}.

Sprachen

Die kleenesche Hülle der Sprache L={aa,bb} ist die Menge aller Wörter, die sich aus aa und bb zusammensetzen, sowie dem leeren Wort:

L*={ε,aa,bb,aaaa,aabb,bbbb,bbaa,bbaabb,aabbaa,}

Die positive Hülle ist entsprechend:

L+={aa,bb,aaaa,aabb,bbbb,bbaa,bbaabb,aabbaa,}

Die kleenesche Hülle der leeren Sprache und der Sprache des leeren Wortes enthält nur das leere Wort:

{}*={ε}*={ε}

Die positive Hülle der leeren Sprache ist leer, die der Sprache des leeren Wortes enthält nur das leere Wort:

{}+={}
{ε}+={ε}

Merkmale

  • Die kleenesche Hülle und die positive Hülle (falls letztere das leere Wort enthält) sind jeweils die Trägermenge des Monoids mit der Konkatenation von Wörtern als Operator und dem leeren Wort ε als neutralem Element. So bildet die kleenesche Hülle den freien Monoid über ein Alphabet. Die kleenesche Hülle sowie die positive Hülle sind damit ebenfalls abgeschlossen gegen die Konkatenation.
  • Die kleenesche und die positive Hülle sind für alle Sprachen, die mindestens ein nicht-leeres Wort enthalten, abzählbar unendlich:
L{{},{ε}}|L*|=||
L{{},{ε}}|L+|=||
  • Wenn eine Sprache L das leere Wort enthält, sind die kleenesche und die positive Hülle von L identisch; die Umkehrung gilt ebenfalls:
εLL*=L+

Verallgemeinerungen

Die abzählbar unendlichen Folgen von Zeichen aus dem Alphabet Σ werden mit Σω bezeichnet, siehe: ω = 0.
Σ bezeichnet die gesamte Menge ΣΣω der endlichen Sequenzen und unendlichen Folgen von Zeichen aus Σ .

Literatur