Attributgrammatik

Eine Attributgrammatik ist eine kontextfreie Grammatik, die um Attribute sowie Regeln und Bedingungen erweitert ist. Angewandt wird das Konzept im Compilerbau, um beispielsweise die Einhaltung von Regeln zu überprüfen, die mit kontextfreien Grammatiken nicht formuliert werden können. Solche Regeln sind z. B. die, dass jede Variable deklariert sein muss und ihrem Datentyp entsprechend verwendet wird. Das Konzept der Attributgrammatiken wurde ursprünglich von Donald E. Knuth eingeführt.^[1]^[2]

Ein Compiler überprüft die Einhaltung dieser Regeln während der semantischen Analyse. Dabei hat er nur die Informationen zur Verfügung, die im Syntaxbaum des Programms enthalten sind. Zusätzliche Informationen, die die semantische Analyse erleichtern, kann man als Attribute in den Syntaxbaum integrieren.

Zum Beispiel kann der Typ eines Ausdrucks als Attribut an den entsprechenden Knoten im Syntaxbaum annotiert werden. Durch Attributregeln und -bedingungen können zusätzlich Abhängigkeiten von anderen Attributen (auch anderer Knoten im Syntaxbaum) angegeben werden.

Die Programmierung der betreffenden Teile des Compilers vereinfacht sich, wenn die Produktionen der Grammatik selbst mit entsprechenden Attributen versehen werden.

Notation

$X_{i} . a : = f (\dots, X_{j} . b, \dots) \in R (p)$ ist ein Attribut $a$ , das zu einem Nichtterminal $X_{i}$ der Produktion $p : X_{0} \to X_{1} \dots X_{n}$ gehört, mit $0 \leq i, j \leq n$ .

Definitionen

$A G = (G, A, R, B)$ ist eine Attributgrammatik, die durch folgende Komponenten definiert ist:

$G = (N, T, P, S)$ ist eine kontextfreie Grammatik.
$A = ⋃_{X \in (T \cup N)} A (X)$ ist eine endliche Menge von Attributen, die jeweils eindeutig einem Symbol $X$ zugeordnet sind. Die einzelnen Attributmengen $A (X)$ sind disjunkt, es gilt also $A (X) \cap A (Y) \neq \emptyset \Rightarrow X = Y$ .
$R = ⋃_{p \in P} R (p)$ ist eine endliche Menge von Attributionsregeln.
$B = ⋃_{p \in P} B (p)$ ist eine endliche Menge von Bedingungen. Die Bedingung $B (p)$ einer Produktion $p : X_{0} \to X_{1} \dots X_{n}$ kann in der Form $X_{0} . b$ auch als Attribut der linken Seite aufgefasst werden, daher sind mit den Attributen auch alle Bedingungen erfasst.
$A F (p) : = {X_{i} . a | p : X_{0} \to X_{1} \dots X_{n}, 0 \leq i \leq n, X_{i} . a : = f (\dots) \in R (p)}$ ist die Menge der Attribute, die in den Regeln $R (p)$ einer Produktion $p \in P$ definiert sind.

Die Attribute $A (X)$ eines Symbols lassen sich in zwei disjunkte Klassen unterteilen, da es für alle Attribute $a \in A (X)$ nur eine Berechnungsregel der Form $X . a \leftarrow f (\dots)$ in $R$ gibt:

$A S (X) : = {X . a | \exists p : X \to X_{1} \dots X_{n} \in P \land X . a \in A F (p)}$ ist die Menge der synthetisierten (abgeleiteten) Attribute. Dies sind die Attribute, die in den Regeln $r \in R (p)$ einer Produktion $p \in P$ definiert sind, bei der $X$ auf der linken Seite steht.
$A I (X) : = {X . a | \exists q : Y \to u X v \in P \land X . a \in A F (q)}$ ist die Menge der ererbten (inherited) Attribute. Dies sind die Attribute, die in den Regeln $r \in R (p)$ einer Produktion $p \in P$ definiert sind, bei der $X$ auf der rechten Seite steht.

Zirkularität

Attributgrammatiken sind zirkulär, wenn der Abhängigkeitsgraph der Attributvariablen, der durch die funktionale Abhängigkeit induziert wird, eine Schleife enthält.

Diese Zirkularität lässt sich in exponentieller Zeit testen.

Ein vereinfachter Test, der weniger Grammatiken zulässt, berechnet das Problem in polynomieller Zeit.

Grammatiktypen

S-Attributgrammatiken

S-Attributgrammatiken, kurz SAG sind Attributgrammatiken, die nur auf synthetischen Attributen arbeiten. So können sie direkt bei den Reduce-Schritten des Parse-Vorgang eines LR(k)-Parsers berechnet werden. Implementiert in yacc.

L-Attributgrammatiken

L-Attributgrammatiken (LAG) können in einem Top-down-Durchgang von links nach rechts durch den abstrakten Syntaxbaum ausgewertet werden. Sie können für jede LL-Grammatik ausgewertet werden und somit für Pascal-ähnliche Programmiersprachen verwendet werden. Bei diesen dürfen nur abgeleitete und nachstehende Baumteile auf aktuelle Attribute zugreifen.

Beispiel:

$A \to B C, a . 1 = a . 0, b . 0 = b . 1, c . 2 = c . 1, c . 2 = c . 0$ (erlaubt)
$A \to B C, a . 1 = a . 2$ (verboten)

Das erleichtert die vorwärtsgerichtete Deklaration von Variablen und Funktionen.

LR-Attributgrammatiken

Eine Teilklasse der L-Attributgrammatiken, und zwar gerade diejenigen, die sich in einem Durchgang von links nach rechts während des LR-Parsens auswerten lassen. Implementierung: zyacc; in yacc von Hand über globale Variablen realisierbar. Der Vorteil der größeren Mächtigkeit des LR-Parsens gegenüber dem LL-Parsen manifestiert sich somit spiegelbildlich im Nachteil der geringeren Mächtigkeit der LR-Attributgrammatiken gegenüber den L-Attributgrammatiken.

ECLR-Attributgrammatiken

Eine Variante der LR-Attributgrammatiken; sie benutzt eine Äquivalenzrelation, um die Attributauswertung zu optimieren. Implementierung: rie.

Einzelnachweise

[1] Vorlage:Literatur

[2] Vorlage:Literatur

[1]

[2]

Attributgrammatik

Inhaltsverzeichnis

Notation

Definitionen

Zirkularität

Grammatiktypen

S-Attributgrammatiken

L-Attributgrammatiken

LR-Attributgrammatiken

ECLR-Attributgrammatiken

Einzelnachweise

Navigationsmenü

Attributgrammatik

Notation

Definitionen

Zirkularität

Grammatiktypen

S-Attributgrammatiken

L-Attributgrammatiken

LR-Attributgrammatiken

ECLR-Attributgrammatiken

Einzelnachweise

Navigationsmenü

Suche