Académique Documents
Professionnel Documents
Culture Documents
1) Sélectionner les mots qui nécessitent une seule opération d'édition afin d'avoir le mot
"Levenstein" selon la distance de Levenstein (0.5pt / choix) :
☐ Levnstein ☐ Levenstien ☐ Levensteine ☐ Lefenstein
2) Voici un paragraphe : "Débloquer : dégager ou libérer quelque chose. Le déblocage est son
action. Exemple : bloquez et débloquez vos cartes SIM. Le sens inverse est le verbe bloquer
qui veut dire immobiliser. Un autre sens de ce mot est : grouper en un bloc. La personne qui,
lors d’une grève, bloque l’entrée est appelée bloqueur."
Définir deux expressions régulières minimales utilisées pour extraire deux lexèmes à partir des mots
contenant la chaîne "blo". Ensuite, exécuter ces expressions régulières afin d'extraire les mots de
chaque lexème. Enfin, choisir un verbe du lexème comme lemme. (4pts)
Expression régulière Lexème Lemme
3) Dans le paragraphe précédent, trouver les verbes des trois sens de ces lemmes (0.25pt / mot) :
Synset 1 Synset 2 Synset 3
4) Nous voulons utiliser les MEMM afin d'appliquer l'étiquetage morpho-syntaxique sur ce
paragraphe. Si nous voulons le maximum des propriétés de chaque mot afin d'effectuer la
classification, quelles sont les opérations à éviter lors du prétraitement (0.5pt / choix) :
☐ Tokenization ☐ Racinisation ☐ Filtrage des mots vides
☐ Rendre en minuscule ☐ Utiliser un treebank d'entraînement
5) Etant donné un encodeur-décodeur de type Seq2seq, sélectionner les systèmes qui peuvent
l'utiliser entre l'entrée et la sortie (0.25pt / choix) :
☐ Traduction automatique ☐ Résumé automatique ☐ Questions-Réponses
☐ Chatbot ☐ Analyse de sentiments ☐ Reconnaissance de la parole
Exercice 01. Application numérique (7pts : 20mn)
Voici un treebank de trois phrases :
it/P rains/V cats/N and/C dogs/N dogs/N chase/V cats/N it/P rains/V
P( N V N | cats chase
dogs)
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………
Bonne chance