Académique Documents
Professionnel Documents
Culture Documents
1) Sélectionner les mots qui nécessitent une seule opération d'édition afin d'avoir le mot
"Levenstein" selon la distance de Levenstein : (1.5pts : 0.5pt/choix)
☒ Levnstein ☐ Levenstien ☒ Levensteine ☒ Lefenstein
2) Voici un paragraphe : "Débloquer : dégager ou libérer quelque chose. Le déblocage est son
action. Exemple : bloquez et débloquez vos cartes SIM. Le sens inverse est le verbe bloquer
qui veut dire immobiliser. Un autre sens de ce mot est : grouper en un bloc. La personne qui,
lors d’une grève, bloque l’entrée est appelée bloqueur."
Définir deux expressions régulières minimales utilisées pour extraire deux lexèmes à partir des mots
contenant la chaîne "blo". Ensuite, exécuter ces expressions régulières afin d'extraire les mots de
chaque lexème. Enfin, choisir un verbe du lexème comme lemme. (4pts: 0.75 par expression
régulière et 0.25pt par mot). Chaque 2 erreurs/expression régulière → -0.25 de 0.75
Expression régulière Lexème Lemme
3) Dans le paragraphe précédent, trouver les verbes des trois sens de ces lemmes : (1.75pt: 0.25pt
par mot)
Synset 1 Synset 2 Synset 3
4) Nous voulons utiliser les MEMM afin d'appliquer l'étiquetage morpho-syntaxique sur ce
paragraphe. Si nous voulons le maximum des propriétés de chaque mot afin d'effectuer la
classification, quelles sont les opérations à éviter lors du prétraitement (1.5pt: 0.5pt/choix) :
☐ Tokenization ☒ Racinisation ☒ Filtrage des mots vides
☒ Rendre en minuscule ☐ Utiliser un treebank d'entraînement
5) Etant donné un encodeur-décodeur de type Seq2seq, sélectionner les systèmes qui peuvent
l'utiliser entre l'entrée et la sortie : (1.25pt: 0.25pt/choix)
☒ Traduction automatique ☒ Résumé automatique ☒ Questions-Réponses
☒ Chatbot ☐ Analyse de sentiments ☒ Reconnaissance de la parole
Bonne chance