Analyse Syntaxique

Grammaires hors-contexte Une grammaire hors-contexte est un 4-uplet N,Σ,P,S où : ◮

terminaux, app ppeelé l’alphabet N est un ensemble de symboles non terminaux, non terminal. terminal.

◮

◮

terminaux, ap appe pel´ lé l’ l’al alph phab abet et Σ est un ensemble de symboles terminaux, terminal,, tel que N et Σ soient disjoints. terminal P est un sous ensemble fini de : N × (N ∪ Σ)∗

un élément (α, β) de P, que l’on note α estt ap app pelé une règle β es de production ou règle de ré´ eécriture. appel´ elé par partie tie gau gauche che de la règle egl e α est app appel´ elé par partie tie dro droite ite de la règle egl e β est app elément de N app ppeelé l’axiome de la grammaire. S est un ´

→

◮

Automate à pile

Un automate à pile est un 6-uplet Q,Σ,Γ,δ,q0 , F ◮

l’ense nsemble mble des états eta ts Q est l’e

◮

l’alph lphab abet et d’e d’entr´ ntrée ee Σ est l’a

◮

Γ est l’alphabet de symboles de pile

◮

δ est la fonction de transition : {ε δ : Q × (Σ ∪ { ε}) × Γ

→

℘(Q × Γ ∗ )

◮

estt l’état etat in init itia iall q0 ∈ Q es

◮

l’ensemble emble des états etats d’acc d’acceptati eptation on F ⊆ Q est l’ens

Grammaires hors-contexte

⇔

Automate à pile

Un langage est hors-contexte si et seulement si il existe un automate à pilee qui le rec pil reconn onnaaˆıt. ◮

◮

Si un langage est hors-contexte alors il existe un automate à pile quii le re qu reco connaˆ nnaˆıt. ıt . Si un langage est reconnu par un automate à pile alors il est hors-contexte.

Grammaires hors-contexte

◮

◮

◮

⇒

Automate à pile

Soit G = N,Σ,P,S une grammaire hors-contexte, on construit un automate à pile A qui accepte un mot m s’il existe une + dériva er ivati tion on pou ourr m dans G (S m).

⇒

cu de telle sorte à déter etermi mine nerr une dérivat er ivatio ion n co condu nduis isant ant A est con¸cu de S à m. Idée ee cle cleff : écrir ecr iree dan danss la pil pilee de A les proto-phrases qui cons co nsti titue tuent nt la dérivat er ivatio ion n re reche cherch´ rchée. ee.

Principe

1 2

Empiler l’axiome S Remplacer S par la partie droite d’une règle egle de la forme S α de telle sorte que le premier symbole x de α se trouve en sommet de pile.

→

◮

◮

Si x est un terminal alors on le compare avec le caract` ere se ere trouvant trou vant sous s ous la tête ete de lect lecture. ure. S’il S’ilss sont égaux egau x alor alorss on dépile. epil e. Si x est un non terminal alors on le remplace par la partie droite d’une d’u ne règle egle de P de la forme x β.

→

Exemple Reconnaissance du mot : a+a∗a

avec la grammaire : E T F

→→ →

T + E | T F ∗ T | F (E) | a

T

F

a

+

+

+

+

E

E

E

E

E

E

a

a

a

a

+

a

F

a

*

*

*

T

T

T

T

a

a

a

*

T

a

a

a

Non déterminisme

◮

◮ ◮

Lorsqu’un non terminal X doit être remplacé au sommet de la pile, il peut l’être par la partie droite d’une règle de la forme X β. Plusieurs règles de cette forme peuvent exister dans la grammaire. L’automate correspondant est généralement non déterministe.

→

Automate correspondant à la grammaire G = N,Σ,P,S

ε, Ni

→

αi, pour toute regle Ni

0

→

1

ε, ε

→

S$

x, x

→

αi de P

2

ε, $ ε ∀x ∈ Σ

→

ε

Construction de l’automate Automate à pile A correspondant à la grammaire G = N,Σ,P,S : A =  {0,1,2}, Σ , N ∪ Σ ∪ {$},δ,0, {2}

La fonction de transition δ est définie de la fa¸con suivante : ◮ ◮

δ(0,ε, $) = {(1, S$)} On empile l’axiome. δ(1,ε,Ni ) = {(1, αi ) | avec Ni αi ∈ P} Si un symbole non terminal Ni occupe le sommet de la pile, on le remplace par la partie droite αi d’une règle Ni αi .

→

→

◮

δ(1,a,a) = {(1, ε) | avec a ∈ Σ}

◮

Si le même symbole terminal occupe le sommet de la pile et la case courante de la bande d’entrée, on dépile. δ(1,ε, $) = {(2, $)} Si le mot en entrée a été reconnu et que la pile ne contient que le symbole de fond de pile, on passe à l’état d’acceptation.

Exemple Grammaire :  {E,T,F}, {a, +, −, ∗(, )},P,E avec : P = {E

Automate :

→

T + E | T , T

→

F ∗ T | F , F

→

(E) | a}

A1 =  {0,1,2}, {a, +, ∗, (, )}, {a, +, ∗, (, ),E,T,F, $},δ,0, $, {2}

avec : δ(0, ε, $) δ(1,ε,E) δ(1,ε,T ) δ(1,ε,F) δ(1, ε, $)

= = = = =

{(1, E$, ε)} {(1, E + T ), {(1, T ∗ F), {(1, (E)), {(2, $)}

(1, T )} (1, F)} (1, a)}

δ(1, +, +) δ(1, ∗, ∗) δ(1, (, () δ(1,a,a)

= = = =

{(1, ε)} {(1, ε)} {(1, ε)} {(1, ε)}

Analyse syntaxique

Etant donné m ∈ Σ et G = Σ,N,P,A , analyser m consiste à trouver pour m son (et éventuellement ses) arbre de dérivation. ∗

E ¨ r ¨ r ¨ r ¨ r

E T F

→→ →

T + E|T F ∗ T |F (E)|a

T

+

E

F a

T ¨ r ¨ r

F a

*

T F a

Sens d’analyse

◮

◮

Analyse descendante L’arbre de dérivation est construit depuis la racine vers les feuilles Séquence de dérivations gauches à partir de l’axiome E T + E F+E a+E a + T a + F ∗ T a + a ∗ T a+a∗F a+a∗a

⇒ ⇒⇒ ⇒

⇒

⇒

⇒

Analyse ascendante L’arbre de dérivation est construit des feuilles vers la racine Séquence de dérivation telle que la séquence inverse soit une dérivation droite de m. a+a∗a F+a∗a T + a ∗ a T + F ∗ a T + F ∗ F T + F ∗ T T + E E

⇐⇐ ⇐ ⇐

⇐

⇐

⇐

⇒

Transducteurs à pile

BANDE D’ENTREE

TETE DE LECTURE

UNITE DE CONTROLE PILE

BANDE DE SORTIE

◮

◮

Un transducteur à pile est un automate à pile qui émet, à chaque déplacement, un suite finie de symboles de sortie. Une configuration d’un transducteur à pile est un quadruplet (q,w,α,y) o` u y est une séquence de symboles de sortie.

Transducteur à pile : définition Un transducteur à pile est un 8-uplet Q,Σ,Γ,∆,δ,q0 , F ◮

etats Q est l’ensemble des ´

◮

Σ est l’alphabet d’entrée

◮

Γ est l’alphabet de symboles de pile

◮

∆ est l’alphabet de sortie

◮

δ est la fonction de transition δ : Q × (Σ ∪ {ε}) × Γ

→

℘(Q × Γ ∗ × ∆∗ )

◮

q0 ∈ Q est l’état initial

◮

etats d’acceptation F ⊆ Q est l’ensemble des ´

Analyseur gauche

1E 3 T 5F ◮

2E 4 T 6F

T + E F ∗ T (E)

→→ → ⇒ ⇒

T F a

Dérivation gauche de a + a ∗ a : E

◮

→→ →

1

T + E

4

F+E

6

⇒ ⇒ ⇒

a+E

Analyse gauche : 14623646

2

a + T

∗

a+a∗a

Analyseur gauche

Soit une CFG G dont les règles ont été numérotées de 1 à p. On appelle un analyseur gauche de G, un transducteur à pile non g déterministe T G qui produit pour un mot m ∈ L(G), une dérivation gauche de m. Performances : ◮ Espace : O (|m|) ◮

Temps : O(c|m| )

Analyseur gauche : Exemple ε, E ε, E ε, T

→→ →

T, 2 T + E, 1 F ∗ T, 3

0

ε, T ε, F ε, F

→→ →

F, 4 (E), 5 a

1

ε, ε x, x

→

→

E$

2

ε, $

→

ε

ε, ε avec x ∈ {a, +, ∗, (, )}

⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢

(0, a + a ∗ a, $) (1, a + a ∗ a, E$) (1, a + a ∗ a, T + E$, 1) (1, a + a ∗ a, F + E$, 14) (1, a + a ∗ a, a + E$,146) (1, +a ∗ a, +E$,146) (1, a ∗ a, E$, 146) (1, a ∗ a, T $, 1462) (1, a ∗ a, F ∗ T $, 14623) (1, a ∗ a, a ∗ T $, 146236) (1, ∗a, ∗T $, 146236) (1,a,T $, 1462364) (1,a,F$, 14623646) (1,a,a$, 14623646) (1,ε, $, 14623646) (2, ε, ε, 14623646)

Analyse descendante prédictive : idée générale

◮

◮

◮

Rendre déterministe un analyseur gauche en s’autorisant à regarder les k symboles suivant le caractère courant dans le mot à analyser. Une grammaire dont l’analyseur gauche peut être rendu déterministe en regardant les k symboles suivant le caractère courant est dite LL(k). Certaines grammaires hors contexte ne sont pas LL(k), en particulier : ◮ ◮ ◮

les grammaires ambiguës. les grammaires récursives a` gauche, certaines grammaires non factorisées a` gauche,

Problème de la récursivité a` gauche

Si la grammaire possède une règle de la forme A a Aα, l’automate ` pile ou l’analyseur gauche correspondant bouclera !

→

A

⇒

A α

⇒

A α α

⇒

A α α α

⇒

A α α α α

Récursivité a` gauche

◮

Un symbole non terminal A est dit récursif si A α, β ∈ (N ∪ Σ) . ∗

◮ ◮

◮

◮

Si α = ε, A est dit récursif ` a gauche. Si β = ε, A est dit récursif ` a droite.

∗

⇒

αAβ avec

Une grammaire comportant au moins un symbole récursif à gauche est dite grammaire récursive a` gauche. Une grammaire comportant au moins un symbole récursif à droite est dite grammaire récursive a` droite.

Récursivité a` gauche

◮

◮

récursivité gauche directe : la récursivité à gauche apparaˆıt à l’issue d’une seule dérivation. Exemple : application de la règle A AB au symbole A : A

◮

◮

⇒

→

AB

récursivité gauche indirecte : la récursivité à gauche apparaˆıt après plusieurs dérivations. Exemple : application sucessive des deux règles A aA: B AE `

→

A

BC

⇒ ⇒

AEC

→

BC et

Bonne nouvelle !

Tout langage hors-contexte peut être généré par une grammaire hors-contexte non récursive à gauche. Idée générale :

A

 → ⇔ →→ Ab|a

A A′

a|aA ′ bA ′ |ε

Elimination de la récursivité a` gauche directe Soit G = N,Σ,P,S une grammaire hors contexte, et soit A

→

Aα1 | Aα2 | . . . | Aαm | β1 | β2 | . . . | βn

toutes les règle de P ayant A pour partie gauche. eme langage que la grammaire G définie de la fa¸con G génère le mˆ suivante : ′

G ′ = N ∪ {A ′ }, Σ , P ′ , S

où P est égale à P avec les règles ayant A pour partie gauche remplacées par : ′

A A′

→ →

β1 | β2 | . . . | βn | β1 A ′ | β2 A ′ | . . . | βn A ′ α1 | α2 | . . . | αm | α1 A ′ | α2 A ′ | . . . | αm A ′

Exemple

E T F

→→ →

E + T | T T ∗ F | F (E) | a

⇒

E E′ T T ′ F

→→ →→ →

T | TE ′ +T | + TE ′ F | FT ′ ∗F | ∗ FT ′ (E) | a

Elimination de la récursivité a` gauche

◮

◮

◮

Principe : On procède de manière incrémentale en considérant des ensembles de règles de plus en plus important, jusqu’à avoir traité toute les règles. On ordonne les non terminaux de la grammaire : A1 , . . . , An et on commence par éliminer la récursivité directe des règles de la forme A1 α.

→

Puis on traite les règles de la forme A2 β et ainsi de suite, jusqu’à avoir transformé toute la grammaire.

→

Elimination de la récursivité a` gauche une grammaire G = N,Σ,P,S une grammaire G non récursive à gauche

Entr´ ee : Sortie :

′

M´ ethode : ◮ ◮

◮

Numéroter les non terminaux de G : N = {A1 , . . . , An } éliminer les récursivités à gauche directes des règles ayant A1 pour partie gauche. Pour i = 2 à n faire ◮

pour j = 1 a ` i − 1 faire Ai Aj γ par les r` egles δ1 | .. . | δk sont toutes les r` egles

1 remplacer chaque r` egle de la forme

→

Ai δ1 γ | .. . | δk γ, o` u Aj ayant Aj pour partie gauche. eliminer les r´ ecursivit´ es ` a gauche directes des r` egles ayant Ai pour 2 ´ partie gauche.

→

→

Elimination de la récursivité a` gauche

◮

◮

La raison pour laquelle l’algorithme ci-dessus produit l’effet voulu est qu’après la (i − 1)ème itération de la boucle la plus externe (en i), chaque règle de la forme Aj u j < i doit être telle Al α, o` que l > j.

→

Il en résulte qu’à l’itération suivante dans la boucle interne (en j), les remplacements successifs de Aj dans les règles de la forme egles de la forme Ai Aj α va avoir pour conséquence que les r` Ai Al α seront telles que l ≥ i et l’élimination de la récursivité directe sur Ai va faire que l > i.

→→

Exemple

A B C ◮ ◮

◮

◮

→→ →

BC | a CA | Ab AB | CC | a

On pose A1 = A, A2 = B et A3 = C. On commence par éliminer la récursivité directe sur A puis on remplace, dans B elimine la CA | Ab, A par BC | a puis on ´ récursivité directe sur B. On remplace alors, dans C AB | CC | a, A par BC | a, ce qui donne C BCB | aB | CC | a. Puis on remplace B par CA | ab | CAB | abB et on termine en éliminant la récursivité directe sur C.

→

→

→

′

′

Exemple A B C ◮

→→ →

BC | a CA | Ab AB | CC | a

On pose A1 = A, A2 = B et A3 = C.

i=1 i=2 i=2 i=3 i=3 i=3

pas de changements j=1

j=1 j=2

B B B′ C C C C C′

CA | BCb | ab CA | ab | CAB ′ | abB ′ CbB ′ | Cb BCB | aB | CC | a CACB | abCB | CAB ′ CB | abB ′ B | aB | CC | a abCB | abB ′ CB | aB | a | abCBC ′ | abB ′ BC ′ | aBC ′ | aC ′ ACBC ′ | AB ′ CBC ′ | CC ′ | ACB | AB ′ B | C

→→ →→ →→ →→

Grammaire factorisée a` gauche

Une grammaire G est dite factorisée à gauche si les parties droites de deux règles ayant la même partie gauche n’ont pas de préfixe commun propre : (A = ε). αβ1 | αβ2 avec α 

→

Factorisation à gauche une grammaire G Sortie : une grammaire ´ equivalente factorisée à gauche M´ ethode : Pour chaque symbole non terminal A, trouver le plus long préfixe α =  ε commun à deux règles ou plus ayant A pour partie gauche. Remplacer toutes les règles ayant A pour partie gauche : Entr´ ee :

A

→

αβ1 | αβ2 | . . . | αβn | γ

où γ représente toutes les parties droites qui ne commencent pas par α, par : A A′

→

→

αA ′ | γ

β1 | β2 | . . . | βn

Exemple

G =  {E, S}, {i,t,e,a,b}, {S

→

iEtS | iEtSeS | a, E

→

b}, S

Factorisée à gauche, cette grammaire devient :

G =  {E,S,E ′ }, {i,t,e,a,b}, {S

→

iEtSS ′ | a, S ′

→

eS | ε, E

→

b}, S

Exemples

LL(2) LL(1) A A

→→

LL(1) aB bC

A A B D

→→ →→

BC DE a b

A A B D C E

→→ →→ →→

BC DE a a c e

Grammaires LL(1)

◮

◮

◮

◮

◮

Soit G = N,Σ,P,S une grammaire hors-contexte non ambiguë et m = a1 . . . an un mot de L(G). On sait qu’il existe une unique dérivation gauche du mot m composée des proto-phrases α1 . . . αk avec α1 = S et αk = m. Idée de l’analyse LL(1) : construire cette suite de proto-phrases en ne lisant m qu’une fois, de gauche à droite. Principe : si αi = a1 . . . aj Aβ alors αi+1 doit pouvoir être déterminée de fa¸con unique en fonction du symbole non terminal A et du symbole aj+1 . Une grammaire possédant cette propriété est dite grammaire LL(1).

Analyseurs LL(1)

BANDE D’ENTREE TETE DE LECTURE

TABLE D’ANALYSE PILE

BANDE DE SORTIE TETE D’ECRITURE

Configuration Une configuration d’un analyseur LL est un triplet (au, Xα, π ) où : ◮

◮

◮

au représente la partie du mot d’entrée non encore lue, a est le

symbole terminal se trouvant sous la tête de lecture. Xα représente le contenu de la pile (avec X au sommet de cette dernière) esente le mot produit sur la bande de sortie. π repr´

Si m ∈ Σ est le mot à analyser, ∗

◮

◮

la configuration initiale de l’analyseur est : (m$, S$, ε) $ étant le symbole de fond de pile qui sert aussi à marquer la fin de la chaˆıne à analyser. Une configuration d’acceptation se présente sous la forme : etant l’analyse gauche de m. ($, $, π ) π ´

Mouvements Trois cas possibles à partir de la configuration (au,Xα,π ) : 1

Si X = a = $, l’analyseur s’arrête et annonce le succès de l’analyse.

2

= $, l’analyseur enlève X de la pile et avance la tˆ Si X = a  ete de lecture : (au,aα,π ) ⊢ ( u,α,π )

3

Si X est un symbole non terminal, l’analyseur consulte l’entrée M(X, a) de la table d’analyse M. Deux cas sont possibles : 1

u i est le numéro d’une règle ayant X pour partie M(X, a) = i o` gauche (X epilé, β est empilé et i est β). Dans ce cas, X est d´

→

écrit sur la bande de sortie. (au,Xα,π ) 2

M(X, a) =

l’analyse.

erreur

⊢

(au,βα,πi)

, l’analyse s’arrête et annonce l’échec de

Exemple Grammaire 1 3 5 7

2 4 6 8

TE ′ ε ∗FT ′ (E)

E E′ T ′ F

→→ →→

E′ T T ′ F

+TE FT ε a

→→ →→

′

Table LL(1)

E E′ T T ′ F

a 1

( 1

×

×

4

4

∗ $ × × × × 3 2 × 3 × × × ×

×

×

6

8

7

× × × ×

)

+

6

5

6

′

⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢

((a ∗ a), E$, ε) ((a ∗ a), TE $, 1) ((a ∗ a), FT E $, 14) ((a ∗ a), (E)T E $, 147) (a ∗ a), E)T E $, 147) (a ∗ a), TE )T E $, 1471) (a ∗ a), FT E )T E $, 14714) (a ∗ a), aT E )T E $, 147148) (∗a), T E )T E $, 147148) (∗a), ∗FT E )T E $, 1471485) (a), FT E )T E $, 1471485) (a), aT E )T E $, 14714858) (), T E )T E $, 14714858) (), E )T E $, 147148586) (), )T E $, 1471485863) (ε, T E $, 1471485863) (ε, E $, 14714858636) (ε, $, 147148586363) ′ ′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

′

Construction d’une table LL(1) à partir d’une grammaire

La construction d’une table d’analyse LL(1) pour une grammaire ee par les deux fonctions premier et G = N,Σ,P,S est facilit´ suivant. Ces deux fonctions pemettent, quand c’est possible, de remplir les entrées de la table d’analyse LL(1) de G.

PREMIER

Si α est une proto-phrase de G, premier(α) est l’ensemble des terminaux qui commencent les chaˆınes se dérivant de α. : premier

Si α

∗

⇒

(α) = {a ∈ Σ | α

a ε alors ε appartient aussi `

premier

∗

⇒

au}

(α).

PREMIER(X)

Pour calculer premier(X) avec X ∈ N ∪ Σ, on applique les règles suivantes jusqu’à ce qu’aucun terminal ni ε ne puisse être ajouté aux ensembles premier. 1 2 3

Si X ∈ Σ, premier(X) = {X}. Si X a premier(X). ε ∈ P, on ajoute ε `

→

Si X ∈ N et X Y 1 . . . Yk ∈ P, mettre a dans premier(X) s’il existe i tel que a est dans premier(Y i ) et que ε est dans tous les premier(Y 1 ) . . . premier(Y i−1 ). Si ε ∈ premier(Y j )∀j , 1 ≤ j ≤ k, on ajoute ε à premier(X).

→

PREMIER(X1 . . . Xn)

On calcule 1

2

3

premier

(X1 . . . Xn ) de la fa¸con suivante :

Ajouter à premier(X1 . . . Xn ) tous les symboles de premier(X1 ) différents de ε. Si ε ∈ premier(X1 ), ajouter également les symboles de erents de ε. premier(X2 ) diff´ Si ε ∈ premier(X2 ), ajouter également les symboles de erents de ε, etc. premier(X3 ) diff´ Finalement, si ε appartient à premier(Xj ) pour tous les a premier(X1 . . . Xn ). j = 1 , 2 , . . . n , on ajoute ε `

SUIVANT( X)

Si X ∈ N, suivant(X) est l’ensemble des symboles a ∈ Σ qui peuvent apparaˆıtre immédiatement à droite de X dans une proto-phrase : suivant

(X) = {a ∈ Σ | S

∗

⇒

αXaβ}

Si X peut être le symbole le plus à droite d’une proto-phrase alors $ est dans suivant(X).

SUIVANT( X)

Pour calculer suivant(X) pour tous symbole non terminal X, on applique les règles suivantes jusqu’à ce qu’aucun symbole non terminal ne puisse être ajouté aux ensembles suivant : 1 2

3

Mettre $ dans suivant(S). si X a αBβ, le contenu de premier(β), excepté ε, est ajouté ` suivant (B). s’il existe une règle X αB ou une règle X αBβ telle que a dire β eléments de suivant(X) ε ∈ premier(β) (c’est ` ε), les ´ sont ajoutés à suivant(B).

→

→

∗

⇒

→

Exemple Soit la grammaire G =  {E, E ,T,T , F}, {a, +, ∗, (, ), a},P,E non récursive a` gauche où P est composé des règles suivantes : ′

1 3 5 7 Alors :

TE ′ ε ∗FT ′ (E)

E E′ T ′ F

→→ → →

′

2 4 6 8

E′ T T ′ F

+TE FT ε a

→→ →→

′

′

(E) = premier(T ) = premier(F) = {(, a} premier(E ) = {+, ε} premier(T ) = {∗, ε} suivant(E) = {), $} suivant(E ) = suivant (E) = {), $} suivant(T ) = {premier(E ) − {ε}} ∪ suivant (E) = {+, ), $} suivant(T ) = suivant (T ) = {+, ), $} suivant(F) = {premier(T ) − {ε}} ∪ suivant(T ) = {+, ∗, ), $} premier

′ ′

′

′

′

′

Construction de la table LL(1) Entrée : G = N,Σ,P,S Une grammaire dont les règles sont numérotées. Sortie : M Une table d’analyse LL(1) pour G. Méthode : 1

2

3

4

pour chaque regle i ∈ P de la forme A etapes α, procéder aux ´ 2 et 3. Pour chaque symbole terminal a ∈ premier(α), ajouter i à M(A, a). Si ε ∈ premier(α), ajouter i à M(A, b) pour chaque symbole terminal b ∈ suivant(A). Si ε ∈ premier(α) et $ ∈ suivant(A), ajouter i à M(A, $). Mettre erreur dans toutes les entrées restées vides.

→

Grammaires non LL(1)

Si G n’est pas LL(1), en particulier si elle est récursive à gauche, non factorisée à gauche ou ambiguë, M peut avoir des entrées qui sont définies de fa¸cons multiples. On peut montrer qu’une grammaire G est LL(1) si et seulement si, pour toute règle disctincte A α et A β de G, les conditions suivantes s’appliquent :

→

→

1

Pour aucun symbole terminal a, α et β ne se dérivent toutes les deux en des mots commen¸cant par a.

2

Une des deux proto-phrases α et β peut se dériver en ε. Si β erive pas en un mot commen¸cant par un ε, α ne se d´ élément de suivant(A).

3

∗

⇒

Réalisation simple d’un analyseur LL(1) en C

Principes généraux : ◮ ◮

◮

G est une grammaire LL(1).

Une fonction en langage C est associée à tout symbole non terminal de G. Le graphe des appels de fonctions représente l’arbre de dérivation.

Cas de base A

→

B avec

→

a

premier

(B) = {b}

void A(void){ if(cc == ’b’){ B(); return;} erreur();} A

void A(void){ if(cc == ’a’){ cc = yylex(); return;} erreur();}

Parties droites complexes A

→

BC avec

→

aB avec

premier

(B) = {b} et

premier

void A(void){ if(cc == ’b’){ B(); if(cc == ’c’){ C(); return;} erreur();} A

premier

(B) = {b}

void A(void){ if(cc == ’a’){ cc = yylex(); if(cc == ’b’){ B(); return;} erreur();}

(C) = {c}

Redondance Certains tests sont effectués plusieurs fois A B et B b avec premier(B) = {b}

→

→

void A(void){ if(cc == ’b’){ /* premiere fois */ B(); return;} erreur();} void B(void){ if(cc == ’b’){ /* deuxieme fois */ cc = yylex(); return;} erreur();}

Symboles ambigus

A

→

B|C avec

premier

(B) = {b} et

void A(void){ if(cc == ’b’){ B(); return;} if(cc == ’c’){ C(); return;} erreur();}

premier

(C) = {c}

Règles non factorisées a` gauche BC|BD avec premier(B) = {b}, premier(D) = {d} A

→

void A(void){ if(cc == ’b’){ B(); if(cc == ’c’){ C(); return;} if(cc == ’d’){ D(); return;} } erreur();}

premier

(C) = {c} et

Règles vides

A

→

B|ε avec

premier

(B) = {b} et

void A(void){if(cc == ’b’){ B(); return;} if(cc == ’c’){ return;} erreur();}

suivant

(A) = {c}

Règles vides

De manière plus générale A B avec premier(B) = {b, ε} et

→

void A(void){if(cc == ’b’){ B(); return;} if(cc == ’c’){ return;} erreur;}

suivant

(A) = {c}

Arbre de dérivation

◮

◮

◮

◮

Il n’est pas nécessaire de construire explicitement l’arbre de dérivation sous-jacent à une analyse syntaxique. L’arbre abstrait sera constuit directement lors de l’analyse, par ajout d’actions sémantiques. Il est cependant utile de pouvoir visualiser l’arbre de dérivation pour des raisons de mise au point. On peut pour cela produire de manière simple un fichier XML qui représente la structure de l’arbre de dérivation, qu’il suffira d’ouvrir à l’aide d’un outil de visualisation de fichiers XML.

Production d’un arbre de dérivation XML

void A(void){ fprintf(sortie_xml, ‘‘\n’’); if(cc == ’b’){ B(); fprintf(sortie_xml, ‘‘\n’’); return;} if(cc == ’c’){ fprintf(sortie_xml, ‘‘\n’’); return;} erreur();}

Analyse Syntaxique

Recommend Documents