Chapitre 1.

19/10/2022
Chapitre 1: Initiation à la
théorie des langages
Enseignant: Manel Ben Salem
Niveau: 2ième Licence SI
2022-20231
Plan du cour Théorie des langages et des automates

Chapitre 1: Initiation à la théorie des
2
langages
1. Introduction
2. Alphabet et mots
3. Langages
4. Grammaires
5. Types de grammaires
1
19/10/2022
1. Introduction Théorie des langages et des automates

3
langages
• Les langages sont les supports naturels de communication;
• Permettent aux hommes d’échanger des

informations et des idées/ de communiquer
avec les machines;
• Les langages utilisés entre êtres humains

sont dits naturels;
• Généralement informels et ambigus et demandent toute la subtilité d’un cerveau humain pour être interprétés
correctement.

4
langages
• Les langages créés par l’homme pour communiquer doivent être formalisés et non ambigus pour
avec les ordinateurs sont des langages artificiels. pouvoir être interprétés par une machine
• Un ordinateur ne comprend qu’un seul langage : son langage machine.
Suite de bits qui est interprétée par

le processeur d'un ordinateur exécutant
un programme informatique.
• Pour communiquer avec des langages plus évolués → un interprète (traduit interactivement les instructions
entrées au clavier) / un compilateur (traduit tout un programme),
2
19/10/2022

5
langages
• L’interprétation ou la compilation d’un texte se décomposent généralement en trois étapes.
• Analyse lexicale: permet de décomposer le texte en entités élémentaires appelées lexèmes (token en
anglais).
• Analyse syntaxique: permet de reconnaître des combinaisons de lexèmes formant des entités
syntaxiques.
• Analyse sémantique: permet de générer le code objet directement compréhensible par la machine (ou
bien un code intermédiaire qui devra être de nouveau traduit dans un code machine).
• Les phases d’analyse lexicale et syntaxique constituent en fait un même problème (à deux niveaux différents).
• Dans les deux cas, il s’agit de reconnaître une combinaison valide d’entités : une combinaison de caractères
formant des lexèmes pour l’analyse lexicale, et une combinaison de lexèmes formant des programmes pour
l’analyse syntaxique.

6
langages
Exemple: Soit le texte C suivant : x = i + 3.14;

1. L’analyse lexicale permet d’identifier les lexèmes suivants : un IDENTIFICATEUR de valeur x, un
OPERATEUR de valeur =, un IDENTIFICATEUR de valeur i, un OPERATEUR de valeur +, un REEL de
valeur 3.14 et un POINT VIRGULE.
2. L’analyse syntaxique permet de reconnaître que cette combinaison de lexèmes forme une instruction C
syntaxiquement correcte, et qu’il s’agit d’une affectation entre la variable d’identificateur x et l’expression
arithmétique résultant de l’addition de la variable d’identificateur i avec le réel 3.14.
3. L’analyse sémantique vérifie le bon typage des variables cpt et i, puis génère le code objet correspondant à cette
instruction.
3
19/10/2022
2. Alphabet et mots Théorie des langages et des automates

7
langages
• En théorie des langages, l’ensemble des entités élémentaires est appelé l’alphabet.
• Une combinaison d’entités élémentaires est appelé un mot.
• Définition (Alphabet) : Un alphabet, noté A, est un ensemble fini non vide de symboles.
• Exemples d’alphabets : A1 = { •, ?, } A2 = { a, b, c, . . ., z } A3 = { if, then, else, id, nb, =, + }
• Définition (Mot) : Un mot, défini sur un alphabet A, est une suite finie d’éléments de A.
• Exemples de mots :
→ sur l’alphabet A1, le mot • • ?
→ sur l’alphabet A2, le mot if
→ sur l’alphabet A3, le mot if id = nb

8
langages
Terminologie :
– Lors de l’analyse lexicale d’un programme, l’alphabet est l’ensemble des symboles du clavier, tandis que les mots
sont les mots clés, les identificateurs, les nombres, les opérateurs, ... et sont généralement appelés lexèmes.
– Lors de l’analyse syntaxique d’un programme, les éléments de base de l’alphabet sont les mots clés, les
identificateurs, les nombres, les opérateurs, ... (autrement dit, les lexèmes de l’analyse lexicale), tandis qu’un mot
est une suite de lexèmes et forme un programme.
– D’une façon plus générale, lorsque les éléments de l’ensemble de base A sont des mots au sens linguistique, on
emploie le terme de vocabulaire à la place d’alphabet pour désigner A, et le terme de phrase (ou chaîne) à la place
de mot pour désigner une séquence finie de mots linguistiques.
4
19/10/2022

9
langages
• Définitions:
1. Longueur d’un mot : La longueur d’un mot u défini sur un alphabet A, notée |u|, est le nombre de
symboles qui composent u. Par exemple :
 sur l’alphabet A1, | • • ? |= 3
 sur l’alphabet A2, | if |= 2
 sur l’alphabet A3, | if id = nb |= 4
2. Mot vide : le mot vide, noté ε, est défini sur tous les alphabets et est le mot de longueur 0 (autrement
dit, | ε | = 0).
3. A+ : on note A+ l’ensemble des mots de longueur supérieure ou égale à 1 que l’on peut construire à partir
de l’alphabet A.
4. A∗ : on note A∗ l’ensemble des mots que l’on peut construire à partir de A, y compris le mot vide,
autrement dit: A∗ = {ε} ∪ A+

10
langages
• Définition (Concaténation) : Soient deux mots u et v définis sur un alphabet A. La concaténation de u avec v,
notée u.v ou uv, est le mot formé en faisant suivre les symboles de u par les symboles de v.
• On notera un le mot u concaténé n fois où u0 =ε et un = u.(u n−1) pour n ≥ 1.
− Par exemple: sur l’alphabet A2, si u = aabb et v = cc, alors u.v = aabbcc et u3 = aabbaabbaabb.
Activité 1 : Soit l’alphabet A = {a, b}.

1. Etant donnés les mots u = aa et v = bab, écrire les Correction : 1. uv = aabab, (uv)2 = aababaabab et u3v =
mots uv, (uv)2 et u3v. aaaaaabab.
2. Enoncer tous les mots de longueur 2 définis sur A. 2. Mots de longueur 2 sont: {aa, ab, ba, bb}
3. Soient les ensembles E1 = {u.v/u ∈ A+, v ∈ A+}, 3. E1 = {u ∈ A∗/|u| ≥ 2} = ensemble des mots d’au
E2 = {u.v/u ∈ A+, v ∈ A*} et E3 = {u.v/u ∈ A* , v moins 2 symboles, E2 = A+ et E3 = A*
∈ A*}, A quoi correspondent ces ensembles ?
5
19/10/2022

11
langages
Activité 2 : On considère les ensembles de mots E1 et E2 définis sur l’alphabet A = {0, 1, 2} de la façon suivante :
1. E1 est l’ensemble des mots de longueur paire,
2. E2 est l’ensemble des mots comportant autant de 0 que de 1 et autant de 1 que de 2.
Définir de façon plus formelle ces deux ensembles.
Correction :
• E1 = {u ∈ A∗/∃ s∈ N, |u| = 2s}.
• Pour définir formellement l’ensemble E2, il est nécessaire d’introduire la notion de permutations d’un mot.
• L’ensemble des permutations d’un mot u est l’ensemble de tous les mots que l’on peut former en réarrangeant les symboles
qui composent u de toutes les façons possibles→ permutations(ε) = {ε} et pour tout mot u ∈ A+ commençant par un
symbole a ∈ A et se terminant par une suite de symboles u'∈ A* (tel que u = a.u' ), permutations(u) = {v'.a.v''/v'v'' ∈
permutations(u')}.
• On peut alors définir E2 de la façon suivante : E2 = {u/∃n ∈ N, u ∈ permutations(0n1n2n)}.

12
langages
• Définition (Préfixe, suffixe et facteur) : Soient deux mots u et v définis sur un alphabet A.
− u est un préfixe de v si et seulement si ∃w ∈ A∗ tel que uw = v ;
− u est un suffixe de v si et seulement si ∃w ∈ A∗ tel que wu = v ;
− u est un facteur de v si et seulement si ∃w1 ∈ A∗ , ∃w2 ∈ A∗ tels que w1uw2 = v.
6
19/10/2022
3. Langage Théorie des langages et des automates

13
langages
• Définition (Langage) : Un langage, défini sur un alphabet A, est un ensemble des mots définis sur A.
Autrement dit, un langage est un sous-ensemble de A∗ .
• Deux langages particuliers sont indépendants de l’alphabet A :
− le langage vide (L = ∅),
− le langage contenant le seul mot vide (L = {ε}).
Opérations ensemblistes définies sur les langages : Soient deux langages L1 et L2 respectivement définis sur les
alphabets A1 et A2 :
• L’union de L1 et L2 est le langage défini sur A1 ∪ A2 et contenant tous les mots qui sont soit contenus
dans L1, soit contenus dans L2 :
L1 ∪ L2 = {u/u ∈ L1 ou u ∈ L2}
• L’intersection de L1 et L2 est le langage défini sur A1 ∩ A2 et contenant tous les mots qui sont contenus à
la fois dans L1 et dans L2 : L1 ∩ L2 = {u/u ∈ L1 et u ∈ L2}

14
langages
• Le complément de L1 est le langage défini sur A1 contenant tous les mots qui ne sont pas dans L1 :
C(L1) = {u/u ∈ A1∗ et u ∈ L1}
• La différence de L1 et L2 est le langage défini sur A1 contenant tous les mots de L1 qui ne sont pas dans L2 :
L1 − L2 = {u/u ∈ L1 et u ∈ L2}
• Définition (Produit de deux langages) : Le produit ou concaténation de deux langages L1 et L2,

respectivement définis sur les alphabets A1 et A2, est le langage défini sur A1∪A2 contenant tous les mots
formés d’un mot de L1 suivi d’un mot de L2 :
L1.L2 = {uv/u ∈ L1 et v ∈ L2}
• Le produit de langages est associatif, mais non commutatif.
• Exp: Considérons les deux langages L1 = {00, 11} et L2 = {0, 1, 01} définis sur {0, 1}.
L1.L2 = {000, 001, 0001, 110, 111, 1101}
7
19/10/2022

15
langages
• Définition (Puissances d’un langage) : Les puissances successives d’un langage L sont définies récursivement
par :
− L 0 = {ε},
− L n = L.L n−1 pour n ≥ 1.
Par exemple, si L1 = {00, 11}, alors L1 2 = {0000, 0011, 1100, 1111}
• Description d’un langage :
− Un langage fini peut être décrit par l’énumération des mots qui le composent.
− Certains langages infinis peuvent être décrits par l’application d’opérations à des langages plus simples.
− Certains langages infinis peuvent être décrits par un ensemble de règles appelé grammaire.
− Certains langages infinis ne peuvent pas être décrits, ni par l’application d’opérations, ni par un ensemble de
règles. On parle alors de langage indécidable. On peut noter que si un langage est indécidable, alors il
n’existe pas d’algorithme permettant de déterminer si un mot donné appartient à ce langage. On dit alors
que le problème est indécidable.

16
langages
Activité 3 : Sur l’alphabet A = {0, 1}, on considère les langages L1 et L2 définis par:
• L1 = {01n/n ∈ N}
• L2 = {0n1/n ∈ N}
• Définir les langages L1L2, L1 ∩ L2 et L12.
• Correction :
− L1L2={01n0m1/n,m ∈ N}; L1 ∩ L2={01}; L12={01n01m/n ∈ N, m ∈ N}
Activité 4 : Sur l’alphabet A = {a, b}, on considère le langage L1 des mots formés de n fois la lettre a suivi de n
fois la lettre b, et le langage L2 des mots comportant autant de a que de b.
• Définir formellement ces deux langages.
• Que sont les langages suivants : L1 ∪ L2, L1 ∩ L2, L12
• Correction :
− L1={anbn/n ∈ N}; L2={u/∃ n ∈ N, u ∈ permutations(anbn)}; L1 ∪ L2 =L2; L1 ∩ L2=L1; L12={anbnambm/n,m ∈ N}
8
19/10/2022
4. Grammaire Théorie des langages et des automates

17
langages
• Un langage peut être décrit par un certain nombre de règles. Prenons par exemple le sous-ensemble suivant
de la grammaire française :
• Le vocabulaire est défini par l’ensemble : T = { le, la, fille, jouet, regarde }
• Les catégories syntaxiques sont :
− la phrase, notée PH
− le groupe nominal, noté GN
− le verbe, noté V
− le déterminant, noté D
− le nom, noté N
• les règles permettant de combiner des éléments du vocabulaire et des catégories syntaxiques pour construire
les catégories syntaxiques suivantes :
le symbole → est une
• PH → GN V GN ; GN → D N ; D → le ; D → la ; N → fille ; N → jouet ; V → regarde. abréviation de “peut être
composé de”

18
langages
• La phrase “la fille regarde le jouet” est une phrase correcte pour la grammaire envisagée, comme le montre
l’analyse suivante : PH ⇒ GN V GN ⇒ D N V GN ⇒ la N V GN ⇒ la fille V GN ⇒ la fille regarde GN ⇒ la
fille regarde D N ⇒ la fille regarde le N ⇒ la fille regarde le jouet,
• Notons que :
1. La grammaire considérée ne prend pas en compte certains aspects du français, comme les accords de genre.
2. “le jouet regarde la fille” est aussi une phrase syntaxiquement correcte, mais dont la sémantique n’est pas
assurée.
→ La fonction d’une grammaire est :
• D’indiquer comment construire des phrases appartenant au langage (fonctionnement en production) ;
• De décider si une phrase donnée appartient ou non au langage (fonctionnement en reconnaissance).
• Dans le cas d’un langage de programmation, on se sert d’une grammaire pour décrire les entités du langage.
9
19/10/2022

19
langages
• Définition (Grammaire) : Une grammaire est un quadruplet G = (T, N, S, R) tel que
1. T est le vocabulaire terminal → l’alphabet sur lequel est défini le langage.
2. N est le vocabulaire non terminal → l’ensemble des symboles qui n’apparaissent pas dans les mots générés, mais
qui sont utilisés au cours de la génération. Un symbole non terminal désigne une “catégorie syntaxique”.
3. R est un ensemble de règles dites de réécriture ou de production de la forme :
u1 → u2, avec u1 ∈ (N ∪ T) + et u2 ∈ (N ∪ T) ∗
La signification intuitive de ces règles est que la suite non vide de symboles terminaux ou non terminaux u1 peut être
remplacée par la suite éventuellement vide de symboles terminaux ou non terminaux u2.
4. S ∈ N est le symbole de départ ou axiome. C’est à partir de ce symbole non terminal que l’on commencera la
génération de mots au moyen des règles de la grammaire.

20
langages
• Terminologie :
− une suite de symboles terminaux et non terminaux (un élément de (N ∪ T)∗ ) est appelée une forme.
− une règle u1 → u telle que u ∈ T ∗ est appelée une règle terminale.
Notation : Lorsque plusieurs règles de grammaire ont une même forme en partie gauche, on pourra “factoriser” ces
différentes règles en séparant les parties droites par des traits verticaux. Par exemple, l’ensemble de règles S → ab, S
→ aSb, S → c pourra s’écrire S → ab | aSb | c.
• Le langage défini, ou généré, par une grammaire est l’ensemble des mots qui peuvent être obtenus à partir du
symbole de départ par application des règles de la grammaire.
• On introduit les notions de dérivation entre formes, d’abord en une étape, ensuite en plusieurs étapes et on
définit le langage généré comme étant l’ensemble des mots pouvant être dérivés depuis l’axiome.
10
19/10/2022

21
langages
• Définition (Dérivation en une étape) : Soient une grammaire G = (T, N, S, R), une forme non vide u ∈ (N ∪
T)+ et une forme éventuellement vide v ∈ (N ∪ T)∗.
La grammaire G permet de dériver v de u en une étape (noté u ⇒ v) si et seulement si :
− u = xu'y (u peut être décomposé en x, u' et y ; x et y peuvent être vides),
− v = xv'y (v peut être décomposé en x, v' et y),
− u' → v' est une règle de R.
• Définition (Dérivation en plusieurs étapes) : Une forme v peut être dérivée d’une forme u en plusieurs étapes :
− u ⇒ v : si v peut être obtenue de u par une succession de 1 ou plusieurs dérivations en une étape,
∗
− u ⇒ v : si v peut être obtenue de u par une succession de 0, 1 ou plusieurs dérivations en une étape.

22
langages
• Définition (Langage généré par une grammaire) : Le langage généré par une grammaire G = (T, N, S, R) est
l’ensemble des mots sur T qui peuvent être dérivés à partir de S :
L(G) = {v ∈ T ∗ /S ⇒ v}
Remarques :
- Une grammaire définit un seul langage.
- Un même langage peut être engendré par plusieurs grammaires différentes.
• Activité 5 : On considère la grammaire G = (T, N, S, R) où T = { b, c } N = { S } et R = { S → bS | cc }

Déterminer L(G).
Correction : L(G) = {bncc/n ∈ N}. En effet, partant de l’axiome S, toute dérivation commencera nécessairement par
appliquer 0, 1 ou plusieurs fois la première règle puis se terminera en appliquant la deuxième règle. On représentera
( ) ( )
cela en écrivant le schéma de dérivation suivant : S bnS bncc avec n ∈ N
11
19/10/2022

23
langages
• Activité 6 : On considère la grammaire G = (T, N, Ph, R) où

− T = { un, une, le, la, enfant, garcon, fille, cerise, haricot, cueille, mange }
− N = { Ph, Gn, Gv, Df, Dm, Nf, Nm, V }
• Correction : Pour montrer qu’une phrase appartient au
− R = { Ph → Gn Gv langage, on construit une dérivation de l’axiome Ph jusqu’à la
Gn → Df Nf | Dm Nm phrase. On souligne à chaque fois le symbole non terminal qui
Gv → V Gn est remplacé par la dérivation.
Df → une | la • Ph ⇒ Gn Gv ⇒ Df Nf Gv ⇒ Df Nf V Gn ⇒ Df Nf V Dm
Dm → un | le Nm ⇒ une Nf V Dm Nm ⇒ une cerise V Dm Nm ⇒ une

cerise cueille Dm Nm ⇒ une cerise cueille un Nm ⇒ une
Nf → fille | cerise
cerise cueille un enfant
Nm → enfant | garcon | haricot
• Notons qu’il existe plusieurs dérivations possibles.
V → cueille | mange }
• La phrase “une cerise cueille un enfant” appartient-elle au langage L(G) ?

24
langages
• Activité 7 : On considère la grammaire G = (T, N, S, R) où T = { 0, 1 }; N = { S } et R = { S → 0S | 1S | 0 }

Déterminer L(G).
• Correction : L(G) = {u0/u ∈ {0, 1}∗}.

En effet, partant de l’axiome S, toute dérivation commencera nécessairement par appliquer 0, 1 ou plusieurs fois la
première ou la deuxième règle puis se terminera en appliquant la troisième règle. On représentera cela en écrivant le
n fois (1 ou 2) (3)
schéma de dérivation suivant : S uS u0 avec n ∈ N, u ∈ {0, 1} ∗ et |u| = n
• Activité 8 : Construire une grammaire pour le langage L = {abna/n ∈ N}.
• Correction : On définit la grammaire G = (T, N, S, R) où T = { a, b }, N = { S, U } et

R = { S → aU a
U → bU |ε }
12
19/10/2022

25
langages
• Activité 9 : On considère la grammaire G = (T, N, S, R) où T = { a, b, 0 }, N = { S, U } et

R = { S → aSa | bSb | U
• Correction : L(G) = {u0mv/u ∈ {a, b}∗ , v = inverse(u), m ∈ N} où inverse(u) est le
U → 0U | ε }
mot inverse de u, défini récursivement par :
Déterminer L(G).
• inverse(ε) = {ε}
• pour tout mot u ∈ A+ commençant par un symbole a ∈ A et se terminant par une
suite de symboles u' ∈ A∗ (tel que u = a.u'), inverse(u) = inverse(u').a. En effet,
partant de l’axiome S, toute dérivation partant de S suivra nécessairement le schéma
n fois (1 ou 2) (3) m fois (4) (5)
suivant : S uSv uUv u0mUv u0mv avec u ∈ {a, b}∗ , v
= inverse(u), n ∈ N, |u| = n, m ∈ N
• Activité 10 : Construire une grammaire pour le langage L = {02n1n/n ≥ 0}.
• Correction : On définit la grammaire G = (T, N, S, R) où T = { 0, 1 }, N = { S }et R = { S → 00S1 | ε }
5. Types de grammaire Théorie des langages et des automates

26
langages
• Les classes de grammaires sont hiérarchisées et ordonnées par inclusion.

• La classification des grammaires, définie en 1957 par Noam CHOMSKY, distingue les quatre classes suivantes :
− Type 0 : pas de restriction sur les règles.
− Type 1 : grammaires sensibles au contexte ou contextuelles. Les règles de R sont de la forme : uAv →
uwv avec A ∈ N, u, v ∈ (N ∪ T)∗ et w ∈ (N ∪ T)+. Autrement dit, le symbole non terminal A est
remplacé par w si on a les contextes u à gauche et v à droite.
− Type 2 : grammaires hors-contexte. Les règles de R sont de la forme A → w avec A ∈ N et w ∈ (N ∪ T)∗
Autrement dit, le membre de gauche de chaque règle est constitué d’un seul symbole non terminal.
− Type 3 : grammaires régulières
→ à droite. Les règles de R sont de la forme A → aB ou A → a avec A, B ∈ N et a ∈ T
→ à gauche. Les règles de R sont de la forme A → Ba ou A → a avecA, B ∈ N et a ∈ T
13
19/10/2022

27
langages
Autrement dit, le membre de gauche de chaque règle est constitué d’un seul symbole non terminal, et le
membre de droite est constitué d’un symbole terminal et éventuellement d’un symbole non terminal. Pour
les grammaires régulières à droite, le symbole non terminal doit toujours se trouver à droite du symbole
terminal tandis que pour les grammaires régulières à gauche il doit se trouver à gauche.
• A chaque type de grammaire est associé un type de langage :

– les grammaires de type 3 génèrent les langages réguliers,
– les grammaires de type 2 génèrent les langages hors-contexte,
– les grammaires de type 1 génèrent les langages contextuels,
– les grammaires de type 0 permettent de générer tous les langages “décidables”, autrement dit, tous les langages
qui peuvent être reconnus en un temps fini par une machine.
• Les langages qui ne peuvent pas être générés par une grammaire de type 0 sont dits “indécidables”.

28
langages
• Les langages définis par les grammaires de types 0 à 3 de sont ordonnés par inclusion : l’ensemble des
langages générés par les grammaires de type n est strictement inclus dans celui des grammaires de type n − 1
(pour n ∈ {1, 2, 3}).
• A chaque type de grammaire est associé un type d’automate qui permet de reconnaître les langages de sa classe
(c’est-à-dire de déterminer si un mot donné appartient au langage) :
− les langages réguliers sont reconnus par des automates finis,
− les langages hors-contexte sont reconnus par des automates à pile,
− les autres langages, décrits par des grammaires de type 1 ou 0, sont reconnus par des machines de
Turing. Ainsi, la machine de Turing peut être considérée comme le modèle de machine le plus puissant
qu’il soit, dans la mesure où tout langage (ou plus généralement, tout problème) qui ne peut pas être
traité par une machine de Turing, ne pourra pas être traité par une autre machine.
14
19/10/2022

29
langages
• Activité 11 : On considère la grammaire G = (T, N, S, R) où T = { a, b, c, d }, N = { S, U } et R = { S → aU|c

U → Sb | d }
• Donner le type de G et déterminer L(G).
Correction : G est hors-contexte (vue que la partie gauche de chaque règle est un symbole non terminal).
• G n’est pas régulière car la règle (1) est régulière à droite tandis que la règle (3) est régulière à gauche. Notons qu’il n’existe
pas de grammaire régulière permettant de générer L(G).
• L(G) = {ancbn, an+1dbn/n ∈ N}. En effet, partant de l’axiome S, toute dérivation partant de S suivra nécessairement un
n fois (1 suivie de 3) (2) n fois (1 suivie de 3) (1) (4)
des deux schémas suivants : S anSbn ancbn ou S anSbn anaUbn anadbn
avec n ∈ N
• Activité 12 : On considère le langage L des mots sur {a, b, c} qui contiennent au moins une fois la chaine bac.
Définir formellement L et construire une grammaire hors-contexte puis une grammaire régulière décrivant L.

30
langages
Correction : L = {u.bac.v/u ∈ {a, b, c}∗ , v ∈ {a, b, c}∗}

• On définit la grammaire hors-contexte G = (T, N, S, R) où T = { a, b, c }, N = { S, U } et R = { S → U bacU
U → U a | U b | U c | ε}
• la grammaire régulière à droite G = (T, N, S, R) où T = { a, b, c }, N = { S, U, V, W } et R = { S → aS | bS | cS | bU
U → aV
V → cW | c
W → aW | bW | cW | a | b | c }
• la grammaire régulière à gauche G =(T, N, S, R) où T = { a, b, c }, N = { S, U, V, W } et R = { S → Sa | Sb | Sc | Uc
U → Va
V → Wb | b
W → Wa | Wb | Wc | a | b | c }
15
19/10/2022

31
langages
• Activité 13 : On considère le langage L des mots sur {0, 1} qui représentent des entiers pairs non signés en base
2 (les mots de ce langage se terminent tous par 0 et ne commencent pas par 0, sauf pour l’entier nul). Définir
formellement L et construire une grammaire régulière décrivant L.
Correction : L = {0, 1u0/u ∈ {0, 1}∗}

• On définit la grammaire régulière à droite G = (T, N, S, R) où T = { a, b, c }, N = { S, U } et R = { S → 0 | 1U
U → 1U | 0U | 0 }
• la grammaire régulière à gauche G = (T, N, S, R) où T = { a, b, c }, N = { S, U } et R = { S → 0 | U0
U → U1 | U0 | 1 }
• Activité 14 : On considère la grammaire G = (T, N, S, R) où T = { a, b, c }, N = { S, D, E } et R = { S → aSDE

|ε ; aD → ab ; bE → bc ; cD → DE; bD → bb ; cE → cc }. Quel est le type de G ?
Correction : G n’est pas hors-contexte car plusieurs règles comportent plusieurs symboles en partie gauche. G n’est pas
contextuelle non plus car dans la règle cD → DE, on ne retrouve pas le contexte gauche (c) de D en partie droite de la règle.
Ainsi, G est de type 0.
Merci de votre
attention
32
16

Chapitre 1.

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 1.

Transféré par

Droits d'auteur :

Formats disponibles

19/10/2022

Niveau: 2ième Licence SI

Plan du cour Théorie des langages et des automates

1. Introduction Théorie des langages et des automates

• Les langages sont les supports naturels de communication;

• Permettent aux hommes d’échanger des

• Les langages utilisés entre êtres humains

1. Introduction Théorie des langages et des automates

• Un ordinateur ne comprend qu’un seul langage : son langage machine.

Suite de bits qui est interprétée par

1. Introduction Théorie des langages et des automates

• L’interprétation ou la compilation d’un texte se décomposent généralement en trois étapes.

1. Introduction Théorie des langages et des automates

Exemple: Soit le texte C suivant : x = i + 3.14;

2. Alphabet et mots Théorie des langages et des automates

• Une combinaison d’entités élémentaires est appelé un mot.

• Exemples d’alphabets : A1 = { •, ?, } A2 = { a, b, c, . . ., z } A3 = { if, then, else, id, nb, =, + }

→ sur l’alphabet A1, le mot • • ?

→ sur l’alphabet A2, le mot if

→ sur l’alphabet A3, le mot if id = nb

2. Alphabet et mots Théorie des langages et des automates

2. Alphabet et mots Théorie des langages et des automates

2. Alphabet et mots Théorie des langages et des automates

Activité 1 : Soit l’alphabet A = {a, b}.

E2 = {u.v/u ∈ A+, v ∈ A*} et E3 = {u.v/u ∈ A* , v moins 2 symboles, E2 = A+ et E3 = A*

∈ A*}, A quoi correspondent ces ensembles ?

2. Alphabet et mots Théorie des langages et des automates

2. Alphabet et mots Théorie des langages et des automates

3. Langage Théorie des langages et des automates

3. Langage Théorie des langages et des automates

• Définition (Produit de deux langages) : Le produit ou concaténation de deux langages L1 et L2,

3. Langage Théorie des langages et des automates

3. Langage Théorie des langages et des automates

4. Grammaire Théorie des langages et des automates

4. Grammaire Théorie des langages et des automates

4. Grammaire Théorie des langages et des automates

• Définition (Grammaire) : Une grammaire est un quadruplet G = (T, N, S, R) tel que

1. T est le vocabulaire terminal → l’alphabet sur lequel est défini le langage.

3. R est un ensemble de règles dites de réécriture ou de production de la forme :

4. Grammaire Théorie des langages et des automates

− une règle u1 → u telle que u ∈ T ∗ est appelée une règle terminale.

4. Grammaire Théorie des langages et des automates

4. Grammaire Théorie des langages et des automates

• Activité 5 : On considère la grammaire G = (T, N, S, R) où T = { b, c } N = { S } et R = { S → bS | cc }

4. Grammaire Théorie des langages et des automates

• Activité 6 : On considère la grammaire G = (T, N, Ph, R) où

Dm → un | le Nm ⇒ une Nf V Dm Nm ⇒ une cerise V Dm Nm ⇒ une

4. Grammaire Théorie des langages et des automates

• Activité 7 : On considère la grammaire G = (T, N, S, R) où T = { 0, 1 }; N = { S } et R = { S → 0S | 1S | 0 }

• Correction : L(G) = {u0/u ∈ {0, 1}∗}.

• Activité 8 : Construire une grammaire pour le langage L = {abna/n ∈ N}.

• Correction : On définit la grammaire G = (T, N, S, R) où T = { a, b }, N = { S, U } et

4. Grammaire Théorie des langages et des automates

• Activité 9 : On considère la grammaire G = (T, N, S, R) où T = { a, b, 0 }, N = { S, U } et

• Activité 10 : Construire une grammaire pour le langage L = {02n1n/n ≥ 0}.

• Correction : On définit la grammaire G = (T, N, S, R) où T = { 0, 1 }, N = { S }et R = { S → 00S1 | ε }

5. Types de grammaire Théorie des langages et des automates

• Les classes de grammaires sont hiérarchisées et ordonnées par inclusion.

5. Types de grammaire Théorie des langages et des automates

• A chaque type de grammaire est associé un type de langage :

5. Types de grammaire Théorie des langages et des automates

5. Types de grammaire Théorie des langages et des automates

• Activité 11 : On considère la grammaire G = (T, N, S, R) où T = { a, b, c, d }, N = { S, U } et R = { S → aU|c

E2 = {u.v/u ∈ A+, v ∈ A} et E3 = {u.v/u ∈ A , v moins 2 symboles, E2 = A+ et E3 = A*