Académique Documents
Professionnel Documents
Culture Documents
2CSSID 2021/2022
Contrôle Final (CF)
Traitement automatique du langage naturel (TALN)
1) Comparer entre les représentations d'un mot [3pts]. Ligne correcte (+0.5), (-0.25) pour chaque réponse
fausse par ligne, la note d'une ligne dans le cas où le nombre des choix corrects dépasse la moitié et n'atteint
pas la totalité des choix corrects est (0.25) sinon (0), la note minimale par ligne est (-0.5).
Lexicale Mot-Mot Word2Vec GloVe ELMo BERT
Représente la relation IS-A d'une manière explicite
☒ ☐ ☐ ☐ ☐ ☐
(directe)
Se base sur la co-occurrence des mots dans un
☐ ☒ ☒ ☒ ☒ ☒
corpus
Si oui (question passée), le contexte est fixe
☐ ☒ ☒ ☒ ☐ ☐
(nombre des mots avant et après)
Nécessite un réseau de neurones pour apprendre la
☐ ☐ ☒ ☒ ☒ ☒
représentation
Un mot peut avoir plusieurs représentations selon
☒ ☐ ☐ ☐ ☒ ☒
son sens (polysémie)
Prend en considération les variations
☒ ☐ ☐ ☐ ☒ ☒
morphologiques du mot
Le vent ◯ ◯ ⬤ ◯ ◯ ◯ ◯ ◯
la fenêtre ◯ ◯ ◯ ⬤ ◯ ◯ ◯ ◯
une pierre ◯ ◯ ◯ ◯ ◯ ◯ ⬤ ◯
3) Parmi les propositions suivantes (concernant les coréférences), choisir si elles sont toujours justes (OUI),
toujours fausses (NON) ou peuvent êtres correctes des fois (PEUT-ETRE) [2pts]. (+0.5) pour un choix correct,
(-0.5) pour un choix erroné.
Nomenclature : L'examen [référent] est …. Il [référence] …
OUI NON PEUT-ETRE
La référence suit le référent dans le texte. ◯ ◯ ⬤
Un syntagme en coréférence avec un autre est une référence et un
⬤ ◯ ◯
référent en même temps.
Avant d'appliquer la résolution de la coréférence, nous appliquons le
◯ ⬤ ◯
filtrage des mots vides sur le texte
La détection de coréférence utilise la détection de mention ⬤ ◯ ◯
4) Comparer les méthodes d'analyse de cohérence [2pts]. Ligne correcte (+0.5), (-0.25) pour chaque réponse
fausse par ligne, la note d'une ligne dans le cas où le nombre des choix corrects dépasse la moitié et n'atteint
pas la totalité des choix corrects est (0.25) sinon (0), la note minimale par ligne est (-0.5).
RST PDTB Centering theory Entity grid
Basée sur la structure du discours ☒ ☒ ☐ ☐
La cohérence est représentée d'une manière binaire ☐ ☒ ☒ ☐
La cohérence est estimée par la distribution des patterns ☐ ☐ ☐ ☒
La cohérence est une relation entre un noyau et un satellite ☒ ☐ ☐ ☐
5) Comparer entre les systèmes suivants : traduction automatique (MT), résumé automatique (AS),
questions-réponses (QA), système de dialogue (DS) et analyse de sentiments (SENT) [2.5pts]. Ligne correcte
(+0.5), (-0.25) pour chaque réponse fausse par ligne, la note d'une ligne dans le cas où le nombre des choix
corrects dépasse la moitié et n'atteint pas la totalité des choix corrects est (0.25) sinon (0), la note minimale
par ligne est (-0.5).
MT AS QA DS SENT
L'utilisateur peut introduire un seul mot et le résultat reste raisonnable ☒ ☐ ☐ ☒ ☒
Un système de recherche d'information peut être utilisé par ce système ☐ ☒ ☒ ☒ ☐
Ce système ne peut pas générer du texte ☐ ☐ ☐ ☐ ☒
Ce système n'utilise aucune étape de prétraitement ☐ ☐ ☐ ☐ ☐
Ce système est difficil à évaluer automatiquement ☐ ☐ ☐ ☒ ☐
2. Peut-on calculer une similarité basée sur les relations IS-A de Wordnet entre ces deux mots ?
Non:Pourquoi/Oui:Comment ? [0.75pts]
Non (0.25pt) Puisque les catégories grammaticales des deux mots sont différentes fish/nom
swim/verbe (0.5pt)
B) Sémantique de la phrase
Nous avons le domaine suivant : Constants : I ; Prédicats : LIKE(x, y) ; BIG(x) ; FISH(x).
1. Écrire la dernière phrase en logique du premier ordre en se basant sur ce domaine. [0.5pt]
∀x FISH(x) ∧ BIG(x) ⇒ LIKE(I, x) (0.5pt)
2. Écrire les règles sémantiques qui génèrent cette phrase (sans prendre en compte les autres phrases ;
utiliser seulement les 8 règles grammaticales qui la composent). [2.5pts]
S → NP VP VP.sem(NP.sem) (0.25pt)
PN → I PN.sem = I (0.25pt)
Autres variantes peuvent être justes; l'essentiel est que le quantificateur est lié soit au nom, soit au syntagme
nominal (vu que les articles de quantification sont absents)
C) Cohérence
Supposons que les quatres phrases forment un paragraphe dans cet ordre.
1. En se basant sur "RST (Rhetorical Structure Theory)", est ce que ce texte est cohérent ? Pourquoi ?
[0.5pt]
Non (0.25) Puisqu'il n'y a aucune relation entre les phrases (causalité, contradiction, etc.) (0.25)
2. En se basant sur "Centering theory", est ce que ce texte est cohérent ? Pourquoi ? [0.5pt]
Oui (0.25) puisque le centre du discours ne change pas (l'interlocuteur) sauf pour une seule
phrase (0.25)