Attributgrammatik

Aus testwiki
Version vom 18. Februar 2021, 17:20 Uhr von imported>Karlito (G=(N,T,P,Z) wird nicht in der referenzierten Seite zu CFG verwendet. Um Verwirrung vorzubeugen, hier korrigiert zu G=(N,T,P,S) wie im Artikel zu CFG zumindest als Alternative dargestellt)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Eine Attributgrammatik ist eine kontextfreie Grammatik, die um Attribute sowie Regeln und Bedingungen erweitert ist. Angewandt wird das Konzept im Compilerbau, um beispielsweise die Einhaltung von Regeln zu überprüfen, die mit kontextfreien Grammatiken nicht formuliert werden können. Solche Regeln sind z. B. die, dass jede Variable deklariert sein muss und ihrem Datentyp entsprechend verwendet wird. Das Konzept der Attributgrammatiken wurde ursprünglich von Donald E. Knuth eingeführt.[1][2]

Ein Compiler überprüft die Einhaltung dieser Regeln während der semantischen Analyse. Dabei hat er nur die Informationen zur Verfügung, die im Syntaxbaum des Programms enthalten sind. Zusätzliche Informationen, die die semantische Analyse erleichtern, kann man als Attribute in den Syntaxbaum integrieren.

Zum Beispiel kann der Typ eines Ausdrucks als Attribut an den entsprechenden Knoten im Syntaxbaum annotiert werden. Durch Attributregeln und -bedingungen können zusätzlich Abhängigkeiten von anderen Attributen (auch anderer Knoten im Syntaxbaum) angegeben werden.

Die Programmierung der betreffenden Teile des Compilers vereinfacht sich, wenn die Produktionen der Grammatik selbst mit entsprechenden Attributen versehen werden.

Notation

  • Xi.a:=f(,Xj.b,)R(p) ist ein Attribut a, das zu einem Nichtterminal Xi der Produktion p:X0X1Xn gehört, mit 0i,jn.

Definitionen

AG=(G,A,R,B) ist eine Attributgrammatik, die durch folgende Komponenten definiert ist:

  • G=(N,T,P,S) ist eine kontextfreie Grammatik.
  • A=X(TN)A(X) ist eine endliche Menge von Attributen, die jeweils eindeutig einem Symbol X zugeordnet sind. Die einzelnen Attributmengen A(X) sind disjunkt, es gilt also A(X)A(Y)X=Y.
  • R=pPR(p) ist eine endliche Menge von Attributionsregeln.
  • B=pPB(p) ist eine endliche Menge von Bedingungen. Die Bedingung B(p) einer Produktion p:X0X1Xn kann in der Form X0.b auch als Attribut der linken Seite aufgefasst werden, daher sind mit den Attributen auch alle Bedingungen erfasst.
  • AF(p):={Xi.a|p:X0X1Xn,0in,Xi.a:=f()R(p)} ist die Menge der Attribute, die in den Regeln R(p) einer Produktion pP definiert sind.

Die Attribute A(X) eines Symbols lassen sich in zwei disjunkte Klassen unterteilen, da es für alle Attribute aA(X) nur eine Berechnungsregel der Form X.af() in R gibt:

  • AS(X):={X.a|p:XX1XnPX.aAF(p)} ist die Menge der synthetisierten (abgeleiteten) Attribute. Dies sind die Attribute, die in den Regeln rR(p) einer Produktion pP definiert sind, bei der X auf der linken Seite steht.
  • AI(X):={X.a|q:YuXvPX.aAF(q)} ist die Menge der ererbten (inherited) Attribute. Dies sind die Attribute, die in den Regeln rR(p) einer Produktion pP definiert sind, bei der X auf der rechten Seite steht.

Zirkularität

Attributgrammatiken sind zirkulär, wenn der Abhängigkeitsgraph der Attributvariablen, der durch die funktionale Abhängigkeit induziert wird, eine Schleife enthält.

Diese Zirkularität lässt sich in exponentieller Zeit testen.

Ein vereinfachter Test, der weniger Grammatiken zulässt, berechnet das Problem in polynomieller Zeit.

Grammatiktypen

S-Attributgrammatiken

S-Attributgrammatiken, kurz SAG sind Attributgrammatiken, die nur auf synthetischen Attributen arbeiten. So können sie direkt bei den Reduce-Schritten des Parse-Vorgang eines LR(k)-Parsers berechnet werden. Implementiert in yacc.

L-Attributgrammatiken

L-Attributgrammatiken (LAG) können in einem Top-down-Durchgang von links nach rechts durch den abstrakten Syntaxbaum ausgewertet werden. Sie können für jede LL-Grammatik ausgewertet werden und somit für Pascal-ähnliche Programmiersprachen verwendet werden. Bei diesen dürfen nur abgeleitete und nachstehende Baumteile auf aktuelle Attribute zugreifen.

Beispiel:

  1. ABC,a.1=a.0,b.0=b.1,c.2=c.1,c.2=c.0 (erlaubt)
  2. ABC,a.1=a.2 (verboten)

Das erleichtert die vorwärtsgerichtete Deklaration von Variablen und Funktionen.

LR-Attributgrammatiken

Eine Teilklasse der L-Attributgrammatiken, und zwar gerade diejenigen, die sich in einem Durchgang von links nach rechts während des LR-Parsens auswerten lassen. Implementierung: zyacc; in yacc von Hand über globale Variablen realisierbar. Der Vorteil der größeren Mächtigkeit des LR-Parsens gegenüber dem LL-Parsen manifestiert sich somit spiegelbildlich im Nachteil der geringeren Mächtigkeit der LR-Attributgrammatiken gegenüber den L-Attributgrammatiken.

ECLR-Attributgrammatiken

Eine Variante der LR-Attributgrammatiken; sie benutzt eine Äquivalenzrelation, um die Attributauswertung zu optimieren. Implementierung: rie.

Einzelnachweise