Vous êtes sur la page 1sur 3

École nationale supérieure d'informatique (ESI) 6 décembre 2022 (14h30-15h30)

Oued Smar, Alger Documents et calculatrice non autorisés


Nom + Prénom
Examen Master 2022/2023
TALN : Traitement automatique du langage naturel ………………………………………………………

QCM. Test de connaissance (10pts : 25mn)


Pour chaque question, la sélection d'un choix erroné est sanctionnée par la note d'un choix juste. La
note minimale d'une question est 0.

1) Sélectionner les mots qui nécessitent une seule opération d'édition afin d'avoir le mot
"Levenstein" selon la distance de Levenstein (0.5pt / choix) :
☐ Levnstein ☐ Levenstien ☐ Levensteine ☐ Lefenstein

2) Voici un paragraphe : "Débloquer : dégager ou libérer quelque chose. Le déblocage est son
action. Exemple : bloquez et débloquez vos cartes SIM. Le sens inverse est le verbe bloquer
qui veut dire immobiliser. Un autre sens de ce mot est : grouper en un bloc. La personne qui,
lors d’une grève, bloque l’entrée est appelée bloqueur."
Définir deux expressions régulières minimales utilisées pour extraire deux lexèmes à partir des mots
contenant la chaîne "blo". Ensuite, exécuter ces expressions régulières afin d'extraire les mots de
chaque lexème. Enfin, choisir un verbe du lexème comme lemme. (4pts)
Expression régulière Lexème Lemme

3) Dans le paragraphe précédent, trouver les verbes des trois sens de ces lemmes (0.25pt / mot) :
Synset 1 Synset 2 Synset 3

4) Nous voulons utiliser les MEMM afin d'appliquer l'étiquetage morpho-syntaxique sur ce
paragraphe. Si nous voulons le maximum des propriétés de chaque mot afin d'effectuer la
classification, quelles sont les opérations à éviter lors du prétraitement (0.5pt / choix) :
☐ Tokenization ☐ Racinisation ☐ Filtrage des mots vides
☐ Rendre en minuscule ☐ Utiliser un treebank d'entraînement

5) Etant donné un encodeur-décodeur de type Seq2seq, sélectionner les systèmes qui peuvent
l'utiliser entre l'entrée et la sortie (0.25pt / choix) :
☐ Traduction automatique ☐ Résumé automatique ☐ Questions-Réponses
☐ Chatbot ☐ Analyse de sentiments ☐ Reconnaissance de la parole
Exercice 01. Application numérique (7pts : 20mn)
Voici un treebank de trois phrases :
it/P rains/V cats/N and/C dogs/N dogs/N chase/V cats/N it/P rains/V

1) Modèles de langage (2.5pts)


Nous avons utilisé un modèle bigramme sur les mots avec lissage de Laplace.
P(</s>|dogs)

P(cats chase dogs)

2) Etiquetage morpho-syntaxique (2pts)


Nous avons utilisé un modèle de Markov caché pour cette tâche sans lissage .
π(N) P(V|N) P(N|V) P(dogs|N) P(cats|N) P(chase|V)

P( N V N | cats chase
dogs)

3) Encodage des mots (2.5)


Mot/ type d'encodage X1 X2 X3 X4 X5 X6
rains/ mot-mot 2-2 : (it, rains, cats, and, dogs, chase)

rains/ TF : (phrase 1, phrase 2, phrase 3)

rains/ fonc = somme(mot-mot)/somme(TF)

Exercice 02. Test de réflexion (3pts : 15mn)


Nous voulons utiliser CNN, RNN et MLP dans une seule architecture pour l'analyse des sentiments
(pos, neg, neut) sur les phrases de l'exercice 1. Proposer une architecture en expliquant brièvement
comment ces trois éléments sont utilisés en pratique. Il faut préciser l'encodage utilisé.

…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
Bonne chance

Vous aimerez peut-être aussi