CH 3 - Les Grammaires

Théorie des langages et des
automates
Olfa MOUELHI
olfa.mouelhi@esprit.tn
Année Universitaire 2013 / 2014

Plan
 Les grammaires
 Langage engendré par une grammaire
 Types de grammaires
 grammaires et dérivation
 Transformation d'une grammaire régulière en un automate fini
 Transformation d’automate fini en une grammaire régulière
© Olfa MOUELHI 2
Les grammaires
Une grammaire G est un système de réécriture dans un alphabet Vn Vt formé de

∩
deux alphabets disjoints (Vn ∩ Vt = Ø):

 Vt l'alphabet terminal, celui des mots engendrés
 Vn l'alphabet non terminal, ou alphabet des variables, contenant un élément

particulier : l'axiome, et dont la partie gauche de chaque règle contient au moins
une variable.
 V = Vn Vt est appelé le vocabulaire de la grammaire G.
∩
© Olfa MOUELHI 3
Les grammaires
Exemple :
 Vt = {chat, chien, le, mord, voit}
 Vn = {phrase, verbe, groupe_nominal, article, nom}
phrase  groupe_nominal verbe groupe_nominal

groupe_nominal  article nom
article  le
nom  chat
nom  chien
verbe  mord
verbe  voit
© Olfa MOUELHI 4
Les grammaires
On va pouvoir engendrer ("dériver") huit phrases différentes :

 phrase * le chat voit le chien
 phrase * le chat voit le chat
 phrase * le chien mord le chat
 etc.
On a donc besoin de quatre choses différentes pour définir une grammaire :

 Vt : est un ensemble fini de symboles dits terminaux, appelé vocabulaire terminal.
 Vn : est un ensemble fini (disjoint de Vt) de symboles dits non-terminaux, appelé
vocabulaire non terminal.
 L’axiome : est un non-terminal particulier appelé aussi source.
 Les règles : R  (V* \ Vt* ) × V* est un ensemble fini de règles de grammaire
notées g  d si (g, d) ∈ R.
© Olfa MOUELHI 5
Les grammaires
Une grammaire est une machine à réécrire c’est–à–dire, une machine à faire des
substitutions.
Une règle de production (l, r) ∈ P est notée l  r : l est la partie gauche, contenant
au moins une variable, r est la partie droite.
Pour les grammaires, on dit dérivation plutôt que réécriture, et on note + au lieu de 
∩
pour décrire l'union de deux langages : X + V = X V est l'alphabet de la grammaire.
∩
© Olfa MOUELHI 6
Les grammaires
Langage engendré par une grammaire

Une grammaire est un mécanisme permettant d’engendrer les phrases du langage, en
récrivant un mot u ∈ V en un nouveau mot v ∈ V.
L’opération de réécriture consiste à remplacer une occurrence (quelconque) d’un non-

terminal N (quelconque) de Vn présent dans u par un membre droit de règle dont N
est membre gauche.
Ce processus est itéré à partir de la source jusqu’à l’élimination complète des non-
terminaux.
© Olfa MOUELHI 7
Les grammaires
Définition
Étant donnée une grammaire G = {Vt, Vn, S, R}, on dit que le mot u ∈ V* se réécrit
en le mot v ∈ V* dans G avec la règle g  d, et l’on note :
gd
u  v
Si :
1) u = w1gw2, où w1 ∈ V* et w2 ∈ V*.
2) v = w1dw2
On dit que le mot u ∈ V* se réécrit en le mot v ∈ V* dans la grammaire G s’il existe
une règle g  d ∈ R telle que u se récrit en v dans G.
Enfin, on dit que le mot v ∈ V* dérive du mot u ∈ V*, dans la grammaire G, ce que
l’on note par u * v, s’il existe une suite finie w , w , . . . , w de mots de V* telle que
0 1 n
w0 = u, wi  wi+1 pour tout i ∈ [0, n − 1], et wn = v.
© Olfa MOUELHI 8
Les grammaires
Exemple
N  0
N  1 N  0
N  1M N  1M
M  0 M  
M  1 M  0M
M  0M M  1M
M  1M
Les deux grammaires décrivent les entiers écrits en binaire
© Olfa MOUELHI 9
Les grammaires
N  0
Exemple N  1
N  1M
M  0
M  1
M  0M
M  1M
En utilisant la première grammaire :
N  1M  11M  110M  1101M  11010
N  0
En utilisant la deuxième grammaire : N  1M
N  1M  11M  110M  1101M  11010M  11010 M  

M  0M
Le mot 11010M dérive du mot 1M M  1M
1M  11M  110M  1101M  11010M
© Olfa MOUELHI 10
Les grammaires
Définition
Le langage engendré par la grammaire G est l’ensemble des mots de Vt qui dérivent
de l’axiome de G, que l’on note par L (G).
Remarque
Les grammaires de l’exemple précédent peuvent aussi être spécifiées de la manière
suivante :
N  0 | 1 | 1M N  0 | 1M
M  0 | 1 | 0M | 1M M   | 0M | 1M
© Olfa MOUELHI 11
Grammaires contextuelles
La grammaire suivante décrit le langage {anbncn | n  0}. Ses règles ont la particularité
d’avoir un membre droit de taille supérieure ou égale à celle de leur membre gauche.
S  aSBC|
CB  BC
aB  ab
bB  bb
bC  bc
cC  cc
© Olfa MOUELHI 12
a3b3c3
S  aSBC
 a(aSBC)BC
 a(a(aSBC)BC)BC S  aaabbbccC cC  cc
 aaaBCBCBC CB  BC  aaabbbccc
 aaaBBCCBC CB  BC
 aaaBBCBCC CB  BC
 aaaBBBCCC
aaaBBBCCC aB  ab
 aaabBBCCC
aaabBBCCC bB  bb
 aaabbBCCC
aaabbBCCC bB  bb
 aaabbbCCC bC  bc
 aaabbbcCC cC  cc
© Olfa MOUELHI 13
Définition
Étant donnée une grammaire G = {Vt, Vn, S, R}, une règle de R est dite contextuelle
si elle est de la forme g  d avec |g|  |d|. Une grammaire est contextuelle si toutes
ses règles le sont, et le langage engendré est alors dit contextuel.
Les langages de ce type sont reconnus par des machines de Turing particulières
utilisant un espace mémoire borné.
© Olfa MOUELHI 14
Grammaires hors-contexte
La grammaire suivante décrit le langage {anbn | n  0}. Cette grammaire a une
particularité : le membre gauche de chaque règle est un non-terminal..
S  aSb|
© Olfa MOUELHI 15
Grammaires hors-contexte ou algébriques
Définition
Étant donnée une grammaire G = {Vt, Vn, S, R}, une règle de R est dite hors-contexte
si elle est de la forme N  u où u ∈ V* . Une grammaire est hors-contexte si toutes
ses règles le sont, et le langage engendré est alors dit hors-contexte. On note par
LHC la classe des langage hors-contexte.
Les langages hors-contexte sont reconnus par les automates à pile, que nous
découvrirons plus loin dans ce cours.
© Olfa MOUELHI 16
Grammaires régulières
Les grammaires de l’exemple suivant sont hors-contexte, mais elles ont une
particularité supplémentaire : le membre droit possède au plus une occurrence de
symbole non terminal, située à l’extrémité droite.
N  0 | 1 | 1M N  0 | 1M
M  0 | 1 | 0M | 1M M   | 0M | 1M
© Olfa MOUELHI 17
Grammaires régulières
Définition
Étant donnée une grammaire G = {Vt, Vn, S, R}, une règle de R est dite régulière si
elle est de la forme N  u ou N  uM, où M, N ∈ Vn et u ∈ Vt* . Une grammaire
est régulière si toutes ses règles le sont, et un langage engendré par une telle
grammaire est alors dit régulier ou de type 3.
Les langages réguliers sont bien sûr reconnus par un automate fini.
Un langage est dit régulier si et seulement si il est reconnaissable.
© Olfa MOUELHI 18
Grammaires et dérivation
 Une dérivation est l'application répétée de règles qui commence avec le symbole
de départ et se termine avec une séquence de terminaux.
 Une phrase est une forme sententielle ne contenant que des terminaux.
 Les dérivations dans G = (V, S, R) sont des suites de réécritures que l’on peut
opérer sur les éléments de (Σ + V)∗ par application de ses règles.
 Une dérivation élémentaire est l’application d’une règle de la grammaire.
 Une dérivation élémentaire se définit pour 1 ∈ (Σ + V)∗, 2 ∈ (Σ + V)∗, X ∈ V
par:
1X2  12
pour toute règle X   de la grammaire.
© Olfa MOUELHI 19
i
 Une dérivation de longueur i notée :    est une suite de i dérivations
élémentaires qui s’enchaînent, qui se définit par récurrence sur i :
0:   Pas d’application de règle.
i 1
ii+1:    Une application de plus
i
 On notera  
*
 pour signifier qu’il existe une dérivation   .
© Olfa MOUELHI 20
Considérons le langage des expressions arithmétiques. Cette grammaire aura alors

pour symboles terminaux Vt = {, , (, ), Id, Cte} et pour non-terminaux l’unique
symbole E qui sera donc la source :
E  Id | Cte | E + E | E × E | (E)
Cette grammaire permet d’engendrer l’expression arithmétique x + 2.5 × 4 + (y + z),

en supposant que les mots 2.5 et 4 font partie du langage engendré par la grammaire
des constantes, et que x, y, z font partie du langage engendré par la grammaire des
variables.
© Olfa MOUELHI 21
E  Id | Cte | E + E | E × E | (E) x + 2.5 × 4 + (y + z)

EE+E
E  Id
Id ++ EE
E  Id + E × E
E  Id + Cte
Cte ×× EE
Chaque fois on prend le terminal le plus
E  Id + Cte × E + E à gauche  dérivation à gauche.
E  Id + Cte × Cte
Cte ++ EE
E  Id + Cte × Cte + (E)
E  Id + Cte × Cte + (E + E)
E  Id + Cte × Cte + (Id(Id ++ E)
E)
E  Id + Cte × Cte + (Id + Id) Id)
x 2.5 4 y z
© Olfa MOUELHI 22
E  Id | Cte | E + E | E × E | (E) x + 2.5 × 4 + (y + z)

EE+E
E  E + (E)
E  E + (E + E)
E  E + (E + Id)
Id)
Chaque fois on prend le terminal le plus
E  E + (Id
(Id ++ Id)
Id) à droite  dérivation à droite.
E  E  E + (Id + Id)
E  E  Cte
Cte ++ (Id
(Id ++ Id)
Id)
E  E + E  Cte + (Id + Id)
E  E + Cte
Cte  Cte
Cte ++ (Id
(Id ++ Id)
Id)
E  Id Cte  Cte
Id ++ Cte Cte ++ (Id
(Id ++ Id)
Id)
x 2.5 4 y z
© Olfa MOUELHI 23
 Étant donné la grammaire des expressions arithmétiques :

E  Id | Cte | E + E | E × E | (E)
 Considérons la phrase Id + Id × Id.
 La dérivation à droite de cette phrase est :
E  EE ++ EE E E  E
 E+
E+ Id Id E + E  E
 EE  EE ++ id
id  Id
Id ++ EE  EE
 E + Id  id  Id + Id
Id  EE
 Id + Id  Id  Id + Id  Id
© Olfa MOUELHI 24
Définition
Une grammaire G est ambiguë s’il existe un mot w ∈ L(G) qui possède plusieurs
dérivations gauches (droites) dans G.
Exemple:
E  E+E|E*E| (E)| x1| x2
Soit w = x1+x1*x2
Cette grammaire est ambiguë car la chaîne w a plus d'une dérivation gauche:
E  E+E  x1+E x1 +E*E  x1+x1*E  x1+x1*x2
E  E*E E+E*E x1+E*E  x1+x1*E  x1+x1*x2
De même on peut trouver deux dérivations droites

© Olfa MOUELHI 25
Représentation arborescente
Une dérivation est l’enchaînement séquentiel de dérivations élémentaires, mais ceci

est généralement obtenu au prix de choix qui, en réalité, sont arbitraires.
Soient Y → β et Y’ → β’ deux règles de G. Elles sont applicables à tout mot de la

forme α1Y α2Y α3 pour produire les deux dérivations :
D1 : 1Y2Y’3 ⇒ 1β2Y’3 ⇒ 1β2β’3

D2 : 1Y2Y’3 ⇒ 1Y2β’3 ⇒ 1β2β’3
La commutation de règles dans une dérivation est le remplacement de D1 par D2 ou
celui de D2 par D1 : une telle opération ne modifie pas la nature d’une dérivation mais
seulement la façon de la décrire.
© Olfa MOUELHI 26
Définition
Deux dérivations sont dites équivalentes si et seulement si on peut transformer l’une
en l’autre par une suite de commutations de règles.
© Olfa MOUELHI 27
Arbre de dérivation d’une grammaire

L’idée est simplement d’arborer chaque règle X → ε, X → ξ1 ... ξm de G, en la
représentant sous la forme d’un embranchement ordonné, sur le modèle ci–dessous :
X X
ε ξ1 ξm
© Olfa MOUELHI 28
Exemple : id + id × id
E  E+E E  E×E
 id + E  E+E×E
 id + E × E  id + E × E
 id + id × E  id + id × E
 id + id × id  id + id × id
E E
E + E E × E
id E × E E + E id
id id id id
© Olfa MOUELHI 29
Transformation d'une grammaire
régulière en un automate fini :
Soit G=(V,T,S,R) une grammaire régulières, on peut construire un automate fini A=(
Q,Σ,δ,q0,F) qui accepte les mots engendrés par G:
 Pour toutes les productions Bα de P, on ajoute un nouveau symbole non

terminal X et on remplace ces productions par BαX et Xε
 L’ensemble des états Q de l’automate est celui des non-terminaux. Q=V
 L’alphabet Σ est égal à l’ensemble T des terminaux. Σ=T
 L’état q0 correspond à l’axiome A de la grammaire. q0 =S
 δ= {(p,x,q)/ il existe une règle de la forme pxq}
 F={X/ Xε}
© Olfa MOUELHI 30
Exemple
 G=(V,T,A,R) une grammaire régulière
 V={A,B} axiome A
b
 T={a,b,c}
B
b a
 R={AaA a
AbB
A X
Ac (devient AcX et Xε)
BbB
c
Ba(devient BaX)
Bε
© Olfa MOUELHI 31
Transformation d'un Automate fini en
une grammaire régulière:
Soit un automate fini donné M=(Q,Σ,δ, q0,F)
La grammaire G=(V,T,S,R) équivalente est définie comme suit :
 V=Q
 T= Σ
 S= q0
 R={pxq/(p,x,q)  δ }{Qε /QF}
© Olfa MOUELHI 32
Exemple :
 A=(Q,Σ,δ, q0=A,F)
b a
Σ={a,b},Q={A,B,C,D},F={D} B a,b
b
 G=(V,T,A,R)
A D
b
V ={A,B,C,D},T={a,b}, axiome A a C a
R={AaC, AbB, BaD, BbA, CaD, CbB, DaD, DbD, Dε}
© Olfa MOUELHI 33

CH 3 - Les Grammaires

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

CH 3 - Les Grammaires

Transféré par

Droits d'auteur :

Formats disponibles

Théorie des langages et des

Année Universitaire 2013 / 2014

Une grammaire G est un système de réécriture dans un alphabet Vn Vt formé de

deux alphabets disjoints (Vn ∩ Vt = Ø):

 Vn l'alphabet non terminal, ou alphabet des variables, contenant un élément

phrase  groupe_nominal verbe groupe_nominal

On va pouvoir engendrer ("dériver") huit phrases différentes :

 phrase * le chat voit le chat

 phrase * le chien mord le chat

On a donc besoin de quatre choses différentes pour définir une grammaire :

Langage engendré par une grammaire

L’opération de réécriture consiste à remplacer une occurrence (quelconque) d’un non-

Les deux grammaires décrivent les entiers écrits en binaire

En utilisant la deuxième grammaire : N  1M

N  1M  11M  110M  1101M  11010M  11010 M  

Le mot 11010M dérive du mot 1M M  1M

1M  11M  110M  1101M  11010M

Un langage est dit régulier si et seulement si il est reconnaissable.

Considérons le langage des expressions arithmétiques. Cette grammaire aura alors

Cette grammaire permet d’engendrer l’expression arithmétique x + 2.5 × 4 + (y + z),

E  Id | Cte | E + E | E × E | (E) x + 2.5 × 4 + (y + z)

E  Id | Cte | E + E | E × E | (E) x + 2.5 × 4 + (y + z)

 Étant donné la grammaire des expressions arithmétiques :

E  E+E|E*E| (E)| x1| x2

E  E+E  x1+E x1 +E*E  x1+x1*E  x1+x1*x2

E  E*E E+E*E x1+E*E  x1+x1*E  x1+x1*x2

De même on peut trouver deux dérivations droites

Une dérivation est l’enchaînement séquentiel de dérivations élémentaires, mais ceci

Soient Y → β et Y’ → β’ deux règles de G. Elles sont applicables à tout mot de la

D1 : 1Y2Y’3 ⇒ 1β2Y’3 ⇒ 1β2β’3

Arbre de dérivation d’une grammaire

 Pour toutes les productions Bα de P, on ajoute un nouveau symbole non

 L’ensemble des états Q de l’automate est celui des non-terminaux. Q=V

 L’alphabet Σ est égal à l’ensemble T des terminaux. Σ=T

 L’état q0 correspond à l’axiome A de la grammaire. q0 =S

 δ= {(p,x,q)/ il existe une règle de la forme pxq}

 G=(V,T,A,R) une grammaire régulière

La grammaire G=(V,T,S,R) équivalente est définie comme suit :

 R={pxq/(p,x,q)  δ }{Qε /QF}

R={AaC, AbB, BaD, BbA, CaD, CbB, DaD, DbD, Dε}

Vous aimerez peut-être aussi

E  E+E  x1+E x1 +EE  x1+x1E  x1+x1*x2

E  EE E+EE x1+EE  x1+x1E  x1+x1*x2