Exercices ch3

Transféré par

Eya Hmida

0% ont trouvé ce document utile (0 vote)

54 vues5 pages

Titre original

exercices ch3

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

54 vues5 pages

Exercices ch3

Transféré par

Eya Hmida

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 5

Rechercher à l'intérieur du document

Considérons un corpus formé par les documents suivants :

D1= « Le modèle vectoriel représente les termes et les documents »

D2= « Le modèle booléen est meilleur que le modèle vectoriel »
D3= « Le modèle vectoriel est simple »
On considère la liste suivante des mots vides : « le, les, est, que, et »
1) Segmenter les textes des documents afin de trouver les termes d’indexation (en prenant en
considération tous les termes sauf les mots vides). Donner la liste des termes d’indexation
ordonnée par ordre alphabétique.
2) Calculer le tf=frequence(ti,dj) de chacun de ces termes pour chaque document
3) Calculer l’idf de chacun de ces termes
4) Créer la matrice de poids pour chaque terme et document (le produit de la pondération locale et
la pondération globale)
5) Que donnera le système de recherche d’information en réponse aux à la requête suivante (on ne
demande pas de calculer la similarité entre la requête et les documents):
Q= « booléen meilleur »
D1= « Le modèle vectoriel représente les termes et les documents »
D2= « Le modèle booléen est meilleur que le modèle vectoriel »
D3= « Le modèle vectoriel est simple »

Terme d'indexation freq freq freq

D1 D2 D3 dft idf tf*idf D1 tf*idf D2 tf*idf D3
booléen 0 1 0 1 0,477121 0 0,477121 0
documents 1 0 0 1 0,477121 0,477121 0 0
meilleur 0 1 0 1 0,477121 0 0,477121 0
modèle 1 2 1 3 0 0 0 0
représente 1 0 0 1 0,477121 0,477121 0 0
simple 0 0 1 1 0,477121 0 0 0,477121
termes 1 0 0 1 0,477121 0,477121 0 0
vectoriel 1 1 1 3 0 0 0 0
Considérons les textes suivants :
Document 1 : « Les professeurs parlent de la recherche d information textuelle. »
Document 2 : « La recherche des informations est un domaine de recherche qui s intéresse à de nombreux problèmes. »
Document 3 : « Le modèle vectoriel de recherche d information est un modèle simple à comprendre. »
1.En considérant la stop-list suivante :
{à, au, d, de, du, des, elle, elles, est, je, il, ils, le, la, les, lui, qui, son, s, sa, ses, tu, un, une}
Représenter l'ensemble des termes d'indexation de chacun des documents ci-dessus.
2.Dans le but de normaliser les termes d’indexation, on passe par une étape de racinisation qui utilise les deux règles suivantes :
s → NULL
ent → e
Extraire les termes d’indexation finaux.
3.Calculer le tf=freq(ti,dj) de chacun de ces termes pour chaque document.
4.Calculer l'idf=log10(N/dft) de chacun des termes présents dans les documents
5.En déduire la matrice de poids pour ce corpus sachant que poids(t,d)=tf(t,d)*idf(t,D)
6.Soit les requêtes suivantes :
Q0 : pomme de terre
Q1 : recherche d information
Q2 : recherche d information textuelle
Q3 : domaine du modèle vectoriel
Analyser les requêtes comme les documents (élimination des mots vides et racinisation), et utiliser une pondération des requêtes par le tf
uniquement
Document 1 : professeur (1/1/0.48), parle(1/1/0.48), recherche(1/3/0), information(1/3/0), textuelle(1/1/0.48).
Document 2 : recherche(2/3/0), information(1/3/0), domaine(1/1/0.48), intéresse(1/1/0.48), nombreux(1/1/0.48),
problème(1/1/0.48).
Document 3 : modèle(2/1/0.48), vectoriel(1/1/0.48), recherche(1/3/0), information(1/3/0), simple(1/1/0.48),
comprendre(1/1/0.48)
d1 d2 d3
T1
T2
T3
T4
T5
T6
T7
T8
T9
T10
T11
T12
T13

Vous aimerez peut-être aussi

Chapitre 2 - VF
Document48 pages
Chapitre 2 - VF
Eya Hmida
Pas encore d'évaluation
Chapitre3 VF
Document52 pages
Chapitre3 VF
Eya Hmida
Pas encore d'évaluation
CHAPITRE05-ETL-Entrepot de Données
Document42 pages
CHAPITRE05-ETL-Entrepot de Données
Abdelhalim Boudraa
Pas encore d'évaluation
Chapitre1 VF
Document44 pages
Chapitre1 VF
Eya Hmida
100% (1)
Test Logiciel: Pr. Aimad QAZDAR
Document71 pages
Test Logiciel: Pr. Aimad QAZDAR
Hamza Ha
Pas encore d'évaluation
Chapitre 3 - Analyse Syntaxique (Notions de Base)
Document13 pages
Chapitre 3 - Analyse Syntaxique (Notions de Base)
achrafbouydmar10
Pas encore d'évaluation
Travail Pratique Objectif: Gestion Des Tablespaces Exercice 1
Document4 pages
Travail Pratique Objectif: Gestion Des Tablespaces Exercice 1
ouameur abderrahim
100% (1)
Diagramme de Séquence
Document37 pages
Diagramme de Séquence
Kaoutar Ab
Pas encore d'évaluation
Cours Compilation Chapitre 3
Document12 pages
Cours Compilation Chapitre 3
Emma Hcn
Pas encore d'évaluation
Analyse Syntaxique Ascendante
Document7 pages
Analyse Syntaxique Ascendante
Eya Hmida
Pas encore d'évaluation
Ilovepdf Merged
Document99 pages
Ilovepdf Merged
slim yaich
Pas encore d'évaluation
Examen ASD MPI Janvier 2020
Document3 pages
Examen ASD MPI Janvier 2020
Mariem Ksontini
Pas encore d'évaluation
Exercices Archit
Document2 pages
Exercices Archit
lok lok
0% (1)
Exercices Recursivite
Document3 pages
Exercices Recursivite
Med Mohamed
Pas encore d'évaluation
Chap 4. Diviser Pour Régner PDF
Document18 pages
Chap 4. Diviser Pour Régner PDF
Med Yacine
Pas encore d'évaluation
TD1. Arbre Couvrant
Document2 pages
TD1. Arbre Couvrant
safe selmi
100% (1)
Chap 4
Document36 pages
Chap 4
olfa zorgui
Pas encore d'évaluation
TD2 DiagClasses 2022 2023correction
Document13 pages
TD2 DiagClasses 2022 2023correction
Yosr Abdeladhime
Pas encore d'évaluation
Cours DB
Document85 pages
Cours DB
Momed
Pas encore d'évaluation
Design Pattern
Document10 pages
Design Pattern
Moustapha BER
Pas encore d'évaluation
Chapitre4 Multimd
Document10 pages
Chapitre4 Multimd
wael zf
Pas encore d'évaluation
TP1 Java PDF
Document2 pages
TP1 Java PDF
Najeh Touil
Pas encore d'évaluation
TD 03
Document4 pages
TD 03
satmania
Pas encore d'évaluation
Algo
Document30 pages
Algo
Bessem Bessem
Pas encore d'évaluation
Untitled 1
Document5 pages
Untitled 1
Theo
Pas encore d'évaluation
TD3 Big Data
Document2 pages
TD3 Big Data
Mohamed Sidi Brahim
Pas encore d'évaluation
Gestion de La Mémoire Centrale Allocation de La Mémoire Physique Illustration Sous Linux
Document41 pages
Gestion de La Mémoire Centrale Allocation de La Mémoire Physique Illustration Sous Linux
Colmain Nassiri
Pas encore d'évaluation
1 - Les SI 2019-2020
Document28 pages
1 - Les SI 2019-2020
Ķőőķie Šâm
100% (1)
Cours Patron Partie 4
Document19 pages
Cours Patron Partie 4
Houda Tekaya
Pas encore d'évaluation
EXAMEN Tech Principal 2018
Document4 pages
EXAMEN Tech Principal 2018
PFE
0% (1)
Devoir de Synthese1 2si 2020 - 2021 PDF
Document8 pages
Devoir de Synthese1 2si 2020 - 2021 PDF
Melek Talbi
Pas encore d'évaluation
Chapitre1 GRAPHE ET OPTIMISATION
Document57 pages
Chapitre1 GRAPHE ET OPTIMISATION
wala mz
Pas encore d'évaluation
v2-Sujet+Corrigé-Rattrapage de WebSemantique-2017-2018
Document4 pages
v2-Sujet+Corrigé-Rattrapage de WebSemantique-2017-2018
melazem rym
Pas encore d'évaluation
Corrige GL 2021
Document2 pages
Corrige GL 2021
Papi
Pas encore d'évaluation
Rattrapage Solutions
Document3 pages
Rattrapage Solutions
Abdallahi Sidi
Pas encore d'évaluation
Introduction À La Théorie Des Graphes: 1) Origines
Document12 pages
Introduction À La Théorie Des Graphes: 1) Origines
Switch Gang
Pas encore d'évaluation
TD 1 Java
Document3 pages
TD 1 Java
Curriculum Vitae
100% (1)
Examen 3
Document8 pages
Examen 3
Sofien Haddad
Pas encore d'évaluation
Traitement Des Images
Document89 pages
Traitement Des Images
Rharif Anass
Pas encore d'évaluation
TD EC Big Data
Document3 pages
TD EC Big Data
Mme et Mr Lafon
Pas encore d'évaluation
TD Algo
Document11 pages
TD Algo
amel
100% (1)
TD1 Ing
Document3 pages
TD1 Ing
Chouichi Ghada
Pas encore d'évaluation
Examen15 16
Document2 pages
Examen15 16
zayd
Pas encore d'évaluation
Exam Final 20187295833749988164015
Document4 pages
Exam Final 20187295833749988164015
Yasmine Chihab
Pas encore d'évaluation
TD Ordonnancement
Document4 pages
TD Ordonnancement
Zied Boudali
0% (1)
TPpython
Document8 pages
TPpython
Oumaima Kammoun
Pas encore d'évaluation
Corrigé Type TD1
Document7 pages
Corrigé Type TD1
Walid Youcefi
Pas encore d'évaluation
Les Piles Et Les Files en C
Document15 pages
Les Piles Et Les Files en C
abdelmadjid redjechta
Pas encore d'évaluation
Les Fonctions Standards 4
Document3 pages
Les Fonctions Standards 4
Denzel
0% (1)
Résumer Genie Logiciel-1
Document4 pages
Résumer Genie Logiciel-1
Hathat
Pas encore d'évaluation
TD 1 Ri 2
Document2 pages
TD 1 Ri 2
حكايات عربية
Pas encore d'évaluation
Intelligence Artificielle Sujet 04
Document2 pages
Intelligence Artificielle Sujet 04
Faralahy Ulrich
Pas encore d'évaluation
Cours Structures Des Donnees 4
Document102 pages
Cours Structures Des Donnees 4
Khaled Mhamedi
Pas encore d'évaluation
TD 1
Document3 pages
TD 1
Malek Bouazizi
Pas encore d'évaluation
Principal Cas 2021 MCW Final Corrige
Document10 pages
Principal Cas 2021 MCW Final Corrige
Meryem Ramdani
Pas encore d'évaluation
DS Sepc 20 11 2015
Document9 pages
DS Sepc 20 11 2015
Dhia Benkhaled
Pas encore d'évaluation
TD 3 Correction
Document6 pages
TD 3 Correction
AmineAmiine
Pas encore d'évaluation
TD Corrigé
Document19 pages
TD Corrigé
abdelaati wafa
Pas encore d'évaluation
ConventionAlgorithmiqueAS2022 2023
Document8 pages
ConventionAlgorithmiqueAS2022 2023
hiba hitana
Pas encore d'évaluation
Série TD2
Document3 pages
Série TD2
Entertainment world
Pas encore d'évaluation
Les Techniques de Tests: Techniques Basées Sur Les Spécifications (Boite Noire)
Document9 pages
Les Techniques de Tests: Techniques Basées Sur Les Spécifications (Boite Noire)
Eya Hmida
Pas encore d'évaluation
Analyse Syntaxique Ascendante
Document7 pages
Analyse Syntaxique Ascendante
Eya Hmida
Pas encore d'évaluation
Technique de Partition D'equivalence
Document7 pages
Technique de Partition D'equivalence
Yosra Yarmani
Pas encore d'évaluation
Les Techniques de Tests: Techniques Basées Sur Les Spécifications (Boite Noire)
Document9 pages
Les Techniques de Tests: Techniques Basées Sur Les Spécifications (Boite Noire)
Eya Hmida
Pas encore d'évaluation
DSéquences 2021
Document21 pages
DSéquences 2021
Eya Hmida
Pas encore d'évaluation
Les Techniques de Tests: Techniques Basées Sur Les Structures (Boite Blanche)
Document20 pages
Les Techniques de Tests: Techniques Basées Sur Les Structures (Boite Blanche)
Eya Hmida
Pas encore d'évaluation
Fondamentaux Des Tests Tester Pendant Le Cycle Vie Les Techniques de Tests Gestion Des Tests Outils de Support Aux Tests
Document7 pages
Fondamentaux Des Tests Tester Pendant Le Cycle Vie Les Techniques de Tests Gestion Des Tests Outils de Support Aux Tests
Eya Hmida
Pas encore d'évaluation
CH 3
Document34 pages
CH 3
Eya Hmida
Pas encore d'évaluation
Chap 1 UC
Document29 pages
Chap 1 UC
Eya Hmida
Pas encore d'évaluation
Chap 1 Axiomes de Probabilité
Document29 pages
Chap 1 Axiomes de Probabilité
Eya Hmida
Pas encore d'évaluation
CH 2
Document53 pages
CH 2
Eya Hmida
Pas encore d'évaluation
Intro
Document17 pages
Intro
Eya Hmida
Pas encore d'évaluation
TP2 Ing - BD L2CS S TP
Document3 pages
TP2 Ing - BD L2CS S TP
Eya Hmida
Pas encore d'évaluation
Chapitre 4 - VLAN
Document41 pages
Chapitre 4 - VLAN
Eya Hmida
Pas encore d'évaluation
Chap 2 Initiation Réseaux Commutés
Document38 pages
Chap 2 Initiation Réseaux Commutés
Eya Hmida
Pas encore d'évaluation
CH 1
Document28 pages
CH 1
Eya Hmida
Pas encore d'évaluation
Chap 3 Protocole STP Part1 2021
Document52 pages
Chap 3 Protocole STP Part1 2021
Eya Hmida
Pas encore d'évaluation
Chap1 Rappel Reseaux
Document23 pages
Chap1 Rappel Reseaux
Eya Hmida
Pas encore d'évaluation
TP2 Ing - BD L2CS S1 Ressource
Document6 pages
TP2 Ing - BD L2CS S1 Ressource
Eya Hmida
Pas encore d'évaluation
Chapitre2 (P1)
Document28 pages
Chapitre2 (P1)
Eya Hmida
Pas encore d'évaluation
IBD 2CS-GLSI-Cours03
Document16 pages
IBD 2CS-GLSI-Cours03
Eya Hmida
Pas encore d'évaluation
IBD 2CS-GLSI-Cours02 (Partie 1)
Document25 pages
IBD 2CS-GLSI-Cours02 (Partie 1)
Eya Hmida
Pas encore d'évaluation
IBD 2CS-GLSI-Cours01
Document16 pages
IBD 2CS-GLSI-Cours01
Eya Hmida
Pas encore d'évaluation
TD1 Entreprise Environnement
Document1 page
TD1 Entreprise Environnement
Eya Hmida
Pas encore d'évaluation
Chapitre 1
Document13 pages
Chapitre 1
Eya Hmida
Pas encore d'évaluation
TD1 Correction
Document3 pages
TD1 Correction
Eya Hmida
Pas encore d'évaluation
Module de Systemes Distribues
Document50 pages
Module de Systemes Distribues
يوسف مرزوق
Pas encore d'évaluation
Dgfip Metiers Informatique 29092021
Document14 pages
Dgfip Metiers Informatique 29092021
romain.desriac
Pas encore d'évaluation
Movavi Video Converter Premium 22.5.0 + Portable
Document2 pages
Movavi Video Converter Premium 22.5.0 + Portable
Corbas Cabana
Pas encore d'évaluation
Projet Gestion Cabinet
Document3 pages
Projet Gestion Cabinet
info bougarnine
Pas encore d'évaluation
Network Scangear Guide
Document46 pages
Network Scangear Guide
technique
Pas encore d'évaluation
Hymne de Gloire Du Peuple Bamileke (Ghomala)
Document13 pages
Hymne de Gloire Du Peuple Bamileke (Ghomala)
Rodrigue Tchamna
100% (2)
CV Khalled FullStack
Document2 pages
CV Khalled FullStack
khalled meneouali
Pas encore d'évaluation
Cours BD Relationnelle CH1
Document13 pages
Cours BD Relationnelle CH1
Meriem Benftima
Pas encore d'évaluation
S2 - Evaluation Pratique N°1
Document1 page
S2 - Evaluation Pratique N°1
Oumaima Kasdi
Pas encore d'évaluation
Correction tp2 PHP
Document7 pages
Correction tp2 PHP
Imane Ou
Pas encore d'évaluation
Fiche Caneco Solar 042011 - FRB
Document2 pages
Fiche Caneco Solar 042011 - FRB
Lino YETONGNON
Pas encore d'évaluation
A 2 Bcef 525 B 390 DD 68 DF 7
Document23 pages
A 2 Bcef 525 B 390 DD 68 DF 7
api-722622622
Pas encore d'évaluation
3.2.11 Lab - Exploring Processes Threads Handles and Windows Registry - FR FR
Document5 pages
3.2.11 Lab - Exploring Processes Threads Handles and Windows Registry - FR FR
Jérémie Balula
Pas encore d'évaluation
Cours Microservices
Document18 pages
Cours Microservices
Bochra Arfaoui
Pas encore d'évaluation
TP4 - BD - Oracle Express
Document2 pages
TP4 - BD - Oracle Express
Imane Lamdaine
Pas encore d'évaluation
TP 2 Api
Document15 pages
TP 2 Api
YOUNES KABBAJ
100% (1)
RapportDeStageEsprit Technicien
Document29 pages
RapportDeStageEsprit Technicien
Tayeb Ahmed
Pas encore d'évaluation
HP500
Document4 pages
HP500
Ali Boudjerada
Pas encore d'évaluation
Memoire
Document91 pages
Memoire
Julien Kp
Pas encore d'évaluation
Composant (Enregistrement Automatique)
Document7 pages
Composant (Enregistrement Automatique)
bouchtaoui imane
Pas encore d'évaluation
11 G7 Chariot Eleve PDF
Document12 pages
11 G7 Chariot Eleve PDF
Edmond Ouattara
Pas encore d'évaluation
WWW Lucidchart Com Pages FR Bete A Cornes
Document8 pages
WWW Lucidchart Com Pages FR Bete A Cornes
Bouilla
Pas encore d'évaluation
Cours Genie Logiciel
Document67 pages
Cours Genie Logiciel
belkacem nabila
Pas encore d'évaluation
Tutorial Radio Turnigy 9x
Document8 pages
Tutorial Radio Turnigy 9x
yeeepa
Pas encore d'évaluation
JEE7 4 Traitnavigation PDF
Document35 pages
JEE7 4 Traitnavigation PDF
Yassine Najmi
Pas encore d'évaluation
tp1 Persistance
Document3 pages
tp1 Persistance
naas
Pas encore d'évaluation
Chap3 Exercices
Document3 pages
Chap3 Exercices
changi
100% (1)
Google Forms A Quoi
Document6 pages
Google Forms A Quoi
Xavier Féard
Pas encore d'évaluation
TP N°4 Initiation À PowerPoint-part 1
Document5 pages
TP N°4 Initiation À PowerPoint-part 1
Samo Samo
Pas encore d'évaluation
Cours3 L'architecture Globale de SQL Server
Document4 pages
Cours3 L'architecture Globale de SQL Server
Amel ourahmoune
100% (1)