Vous êtes sur la page 1sur 2

Matière: Recherche d’information Niveau : 2eme LSI

Responsable : Hanen Samaali A U : 2022 / 2023

TD 2 : Recherche d’information

Exercice 1 :
Considérons deux documents D1 et D2, représentés sur un vocabulaire T={t1, …, t10}.
La formule logique de D1, est : - WD1 est défini par :

La formule logique de D2 est : - WD2 est défini par :

1. Donner la liste de réponse ordonnée pour chaque requête en utilisant la seconde


similarité vue en cours (modèle booléen pondéré) :
Q1 : t7  t5 Q2 : t2  t10

Exercice 2 :
Soient les ensembles des termes obtenus de l'indexation des documents D1 et D2 suivants:

D1 = {efficacité, recherche, mesurée, précision, moyenne}

D2 = {modèles, recherche, efficaces, langage, vectoriel}

1. Donner la table des fréquences : terme, document;


2. Calculer TF*IDF de chaque terme
Exercice 3 :

Soient : un document qui contient le texte ”maison belle maison”

une collection de 100 documents, le terme ”maison” apparaît dans 20 documents pour un
nombre d’occurrences de 35 au total, le terme ”belle” apparaît dans 35 documents pour un
nombre d’occurrences de 40 au total.

1. Quelle est la pondération ”TF*IDF” des termes ”maison” et ”belle” pour le document
? Commentez les valeurs obtenues.

Vous aimerez peut-être aussi