Vous êtes sur la page 1sur 2

Groupe 1

1. En considérant uniquement l’extraction de mots simples, l'ensemble des termes


d'indexation de chacun des documents sont ci-dessous.
ci

Document 1 (professeur, parle, recherche, information, textuelle)

Document 2 (recherche, information, domaine, recherche, intéresse, problèmes)

Document 3 (modèle, vectoriel, recherche, information, simple, comprendre)

2. Calculer les tf de chacun de ces termes pour chaque document Où

terme Document 1 Document 2 Document 3


TF idf TF idf TF idf
professeur 1
parle 1
recherche 1 1 1
information 1 1/2 1
textuelle 1
domaine 1/2
intéresse 1/2
problèmes 1/2
modèle 1
vectoriel 1
simple 1
comprendre 1
3. Calculer l'idf de chacun des termes présents dans les documents

terme Document 1 Document 2 Document 3


TF idf TF idf TF idf
professeur 1 Log(3)
parle 1 Log(3)
recherche 1 0 1 0 1 0
information 1 0 1/2 0 1 0
textuelle 1 Log(3)
domaine 1/2 Log(3)
intéresse 1/2 Log(3)
problèmes 1/2 Log(3)
modèle 1 Log(3)
vectoriel 1 Log(3)
simple 1 Log(3)
comprendre 1 Log(3)

4. En déduire le tableau du fichier inverse pour ce corpus.

Document 1 Document 2 Document 3


terme TF * idf
TF* idf TF* idf

professeur Log(3)
parle Log(3)
Log(3)
textuelle

domaine 1/2*Log(3)
intéresse 1/2*Log(3)
problèmes 1/2*Log(3)
modèle Log(3)
vectoriel Log(3)
simple Log(3)
comprendre Log(3)

Vous aimerez peut-être aussi