Académique Documents
Professionnel Documents
Culture Documents
TD 2 : Recherche d’information
Exercice 1 :
Considérons deux documents D1 et D2, représentés sur un vocabulaire T={t1, …, t10}.
La formule logique de D1, est : - WD1 est défini par :
Solution :
Pour Q1
2
= 0.43
(1 – 0 ) + (1 – 12 )
= 0.29
Sim(D2,( t7 t5 ))= 1- 2
Un document est pertinent lorsqu'il peut nous aider à répondre à notre question de recherche.
Pour Q2
0 + 0.92 = 0.63
= 0.63
Sim(D1,( t2 t10))= 2
2
= 0.80
Solution :
Exercice 3 :
une collection de 100 documents, le terme ”maison” apparaît dans 20 documents pour un
nombre d’occurrences de 35 au total, le terme ”belle” apparaît dans 35 documents pour un
nombre d’occurrences de 40 au total.
Cette mesure est utilisée pour pondérer les termes-candidats : plus la valeur TFIDF d’un terme-
candidat est élevée, plus celui-ci est important dans le document analysé. En prenant compte de
tous les documents dans le corpus, cette méthode présente généralement de meilleurs résultats.
1. T1 = maison et T2 = belle
2. Le terme T1(maison) est plus important que le terme T2(belle) dans le document
analysé.