TP 01

Transféré par

amal fathi

0% ont trouvé ce document utile (0 vote)

7 vues2 pages

Titre original

tp01

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

7 vues2 pages

TP 01

Transféré par

amal fathi

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

Master : Systèmes d’information décisionnel et imagerie(SIDI)

TP01 : Indexation et recherche d’image par le contenu

CBIR (Content-Based Image Retrieval)
Prof. Ahmad EL ALLAOUI
2023/2024

Tokenisation et indexation
Le but du TP est de manipuler les expressions rationnelles pour découper les textes en tokens. Nous
aborderons l'indexation de documents et la recherche de motifs.

la librairie NLTK.

Exercice 1 - Tokenisation
Le but de l'exercice est d'écrire en Python un programme qui découpe un texte en tokens à l'aide
d'expressions rationnelles.
Indications :

• vous devrez prendre le texte en français de votre choix sur le web.

• travaillez en encodage UTF-8.

1. Utilisez les librairies codecs et nltk de Python pour ouvrir le fichier texte, et afficher tous
ses tokens.

Dans un premier temps, on définit un token comme suit:

o
soit une séquence de lettres (attention aux accents!).
o
soit un chiffre
o
soit un symbole de ponctuation
2. Modifiez votre script pour que votre expression rationnelle reconnaisse aussi comme tokens,
les nombres (entiers et décimaux) et les prix du type 15,3€.
3. Modifiez votre script pour que votre expression rationnelle reconnaisse aussi les dates en
chiffres comme tokens. Par exemple, 01/12/2021; 2020-01-11; etc.
4. Dessinez sur papier un automate à états finis correspondant à votre expression rationnelle.

Exercice 2 - Indexation
Le but de l'exercice est d'indexer une collection de textes par tokens. La collection se trouve dans ce
fichier zip à décompresser. La liste des textes se trouve dans le fichier collection.lst.

1. Écrivez un script Python qui construit l'index de la collection et le sauvegarde dans un

fichier. Il prendra comme paramètre le nom du fichier contenant la liste des textes de la
collection. L'index doit comporter les informations suivantes pour chaque token : l'ensemble
des documents dans lequel il apparaît.

1/2
2. Indication : utilisez un dictionnaire Python et le module pickle pour la sauvegarde
(fonction dump()).
3. Nous souhaitons maintenant implémenter un petit moteur de recherche simple. Une requête
est une suite de mots qui doivent appartenir aux documents que l'on cherche. Pour cela, on
va écrire un nouveau script python qui va, dans un premier temps, charger l'index (cf. la
fonction load() du module pickle) puis traiter les différentes requêtes entrées par l'utilisateur.
o Écrivez une fonction qui prend comme paramètre une requête (string) et un index
d'une collection, et qui renvoie la liste des documents de la collection qui
contiennent tous les mots de la requête.
o Faites en sorte que votre script demande à l'utilisateur de rentrer sa requête au
clavier (méthode raw_input()). Le script doit être capable de gérer plusieurs
requêtes consécutives indéfiniment.
o Modifiez le script pour ajouter une option aux requêtes afin qu'il soit aussi
possible d'obtenir tous les documents contenant au moins un mot de la requête.

Optimisez le moteur de recherche en utilisant un index.

Faites en sorte que le poids d'un token-mot dans un texte soit la mesure TF.IDF vue en cours.
Optimisez le tri des documents pertinents par rapport à une requête.

2/2

Vous aimerez peut-être aussi

Compilation ch1 2023
Document49 pages
Compilation ch1 2023
Djalal Aymen
Pas encore d'évaluation
Cours Python 2
Document21 pages
Cours Python 2
ilyass bk
Pas encore d'évaluation
Polyl3python PDF
Document24 pages
Polyl3python PDF
الواعر رؤوف
Pas encore d'évaluation
Abreviation Python
Document8 pages
Abreviation Python
plben3ahmed
Pas encore d'évaluation
Python pour Débutants : Guide Complet pour Apprendre la Programmation Pas à Pas
D'Everand
Python pour Débutants : Guide Complet pour Apprendre la Programmation Pas à Pas
YVES SITBON
Pas encore d'évaluation
Python
Document98 pages
Python
kansie_sam
67% (3)
Python - Gerer Les Caracteres Accentues Dans Les Textes Cle213b6c
Document4 pages
Python - Gerer Les Caracteres Accentues Dans Les Textes Cle213b6c
Nguessan Kouadio
Pas encore d'évaluation
03 ElasticSearch ELK-IP
Document122 pages
03 ElasticSearch ELK-IP
helmi.sassi.hs
Pas encore d'évaluation
Sujet 2023
Document2 pages
Sujet 2023
François ZINSOU
Pas encore d'évaluation
Courscsharp Id5876
Document62 pages
Courscsharp Id5876
Samir Benchakroun
Pas encore d'évaluation
TP TD Fichiers
Document4 pages
TP TD Fichiers
Marwane Ait Ouaicha
100% (1)
TP3 Python Scapy
Document7 pages
TP3 Python Scapy
Naomi Lili
Pas encore d'évaluation
Python Par Les Debuts
Document199 pages
Python Par Les Debuts
Raphael Armando
100% (1)
INFO L3 TD TP 2 Shell Scripting
Document3 pages
INFO L3 TD TP 2 Shell Scripting
Ivan Megaptché
Pas encore d'évaluation
653977016de1e Seance15 Prog 25 10 2023 Enligne
Document7 pages
653977016de1e Seance15 Prog 25 10 2023 Enligne
ahmednajah718
Pas encore d'évaluation
Moteur Recherche
Document78 pages
Moteur Recherche
Albert Malang
Pas encore d'évaluation
TP2 Test Validation
Document2 pages
TP2 Test Validation
Nassim Gafsi
Pas encore d'évaluation
Index - 2024-01-14T173609.398
Document43 pages
Index - 2024-01-14T173609.398
Yaniss Radi
Pas encore d'évaluation
Rapport Finale
Document12 pages
Rapport Finale
BOUKHIMA LILIA
Pas encore d'évaluation
Python Question Réponses
Document7 pages
Python Question Réponses
Alisson Alain
100% (1)
Support Python Web
Document66 pages
Support Python Web
Jamal Jam
Pas encore d'évaluation
Les Flux D'entrée-Sortie
Document33 pages
Les Flux D'entrée-Sortie
Anonymous CZVjyUz
Pas encore d'évaluation
NoSQL Ch2
Document80 pages
NoSQL Ch2
Sofien Haddad
Pas encore d'évaluation
Python
Document111 pages
Python
Amadou Kandji
Pas encore d'évaluation
Confectionner Des DSL Avec XTEXT
Document30 pages
Confectionner Des DSL Avec XTEXT
Franck Armel Djoya
Pas encore d'évaluation
Python Pour La Data Science - Les Bases Du Langage - Le Data Scientist
Document12 pages
Python Pour La Data Science - Les Bases Du Langage - Le Data Scientist
Olfa Souki Ep Chebil
Pas encore d'évaluation
Cours Algorithmique
Document46 pages
Cours Algorithmique
Makrem Hammadi
Pas encore d'évaluation
C++ Chapitre1
Document7 pages
C++ Chapitre1
Salah Eddine Atitallah
Pas encore d'évaluation
Socket Finale
Document44 pages
Socket Finale
Meryem RAHMOUNI
Pas encore d'évaluation
Chap2 Courscpp
Document178 pages
Chap2 Courscpp
ElHarfi Marwane
Pas encore d'évaluation
Python
Document170 pages
Python
Patrick Gelard
Pas encore d'évaluation
MINI PROJET Compilation 2020
Document2 pages
MINI PROJET Compilation 2020
Ilyass EL Khair
0% (1)
Python Bases - MD Beamer PDF
Document103 pages
Python Bases - MD Beamer PDF
Jean Jacques Yao
Pas encore d'évaluation
15 (BONUS) Stockez Des Citations Dans Un Fichier Avec Le Module Json - Démarrez Votre Projet Avec Python - OpenClassrooms
Document5 pages
15 (BONUS) Stockez Des Citations Dans Un Fichier Avec Le Module Json - Démarrez Votre Projet Avec Python - OpenClassrooms
Sohaib Adjaout
Pas encore d'évaluation
Algorithmique Et Programmation
Document38 pages
Algorithmique Et Programmation
zack sl
Pas encore d'évaluation
Séance 7 HTML Css Javascript
Document67 pages
Séance 7 HTML Css Javascript
Oumeima RACHDI
Pas encore d'évaluation
TP Scala
Document2 pages
TP Scala
fafa
Pas encore d'évaluation
TP ProgShell 2
Document2 pages
TP ProgShell 2
Karim Karima
Pas encore d'évaluation
Cours II - Aoutoul
Document90 pages
Cours II - Aoutoul
ZINEB AZ
Pas encore d'évaluation
Tpshell 1
Document1 page
Tpshell 1
abdallah ben hadj meftah
Pas encore d'évaluation
Projet Logo Turtle
Document2 pages
Projet Logo Turtle
fredericol.2007
Pas encore d'évaluation
AI21 nf11 Introduction 2
Document26 pages
AI21 nf11 Introduction 2
Jayden ColebryanVanessa
Pas encore d'évaluation
Flex
Document14 pages
Flex
sihamkalach3
Pas encore d'évaluation
Débuter en Python
Document59 pages
Débuter en Python
Fayssal Abaibat
Pas encore d'évaluation
Pr2sentqtion Python
Document19 pages
Pr2sentqtion Python
haronlin48
Pas encore d'évaluation
Corrigé Eps Da
Document21 pages
Corrigé Eps Da
Junior
Pas encore d'évaluation
Lab1 Iti1521 H211
Document6 pages
Lab1 Iti1521 H211
le dozo
Pas encore d'évaluation
TP3 Objet Connecte
Document2 pages
TP3 Objet Connecte
Conrat elian
Pas encore d'évaluation
Python
Document144 pages
Python
Simon
Pas encore d'évaluation
Cours Python Part123132463
Document221 pages
Cours Python Part123132463
saidista2021
Pas encore d'évaluation
TD 4 Les Entrées Sorties Java
Document2 pages
TD 4 Les Entrées Sorties Java
Hend Hedhli
Pas encore d'évaluation
Serie 3
Document3 pages
Serie 3
sanatravail1990
Pas encore d'évaluation
TP VHDL Fpga
Document13 pages
TP VHDL Fpga
Joel Minkeu
100% (1)
Cours Python 2020
Document131 pages
Cours Python 2020
Fadwa Jabri
Pas encore d'évaluation
Qu'est Ce Que Pep 8?
Document2 pages
Qu'est Ce Que Pep 8?
Dakhla Ayoub
Pas encore d'évaluation
P3 S6 Pa Chap1-1
Document8 pages
P3 S6 Pa Chap1-1
fredericcoutigno
Pas encore d'évaluation
System 1 Id 048
Document8 pages
System 1 Id 048
Kam Zeg
Pas encore d'évaluation
TP1 Compilation
Document6 pages
TP1 Compilation
Emna Rekik
Pas encore d'évaluation
Enoncé TP04 2024
Document1 page
Enoncé TP04 2024
kochier fatima
Pas encore d'évaluation
Python pour les hackers : guide pratique pour créez des outils de test de pénétration puissants
D'Everand
Python pour les hackers : guide pratique pour créez des outils de test de pénétration puissants
Kevin Droz
Pas encore d'évaluation
Le Pattern Decorator en Python
Document27 pages
Le Pattern Decorator en Python
Jeffrey Dvk
Pas encore d'évaluation
Rapport PFE Chamsi Salimi Nmili
Document67 pages
Rapport PFE Chamsi Salimi Nmili
welo
Pas encore d'évaluation
Tuto Python & Pandas - Installation Et Manipulations de Base
Document18 pages
Tuto Python & Pandas - Installation Et Manipulations de Base
deogratias davo
Pas encore d'évaluation
1 L1POO Bases
Document108 pages
1 L1POO Bases
Dia
Pas encore d'évaluation
TS Spé Ex. Sur Les Graphes Pondérés Version 26-3-2023
Document51 pages
TS Spé Ex. Sur Les Graphes Pondérés Version 26-3-2023
Olivier Monty
Pas encore d'évaluation
Générateur de Vagues
Document3 pages
Générateur de Vagues
Axel Gonzalez
Pas encore d'évaluation
Formation Python
Document54 pages
Formation Python
kalosca
Pas encore d'évaluation
Capture D'écran . 2021-11-23 À 10.38.18 2
Document124 pages
Capture D'écran . 2021-11-23 À 10.38.18 2
益Naeqah
Pas encore d'évaluation
Python en Action PDF
Document79 pages
Python en Action PDF
alarue
100% (1)
Rapport Stage CDBVis Walid
Document64 pages
Rapport Stage CDBVis Walid
Baboy Amadou Ka
Pas encore d'évaluation
NSI Classes Terminal
Document19 pages
NSI Classes Terminal
mulk omar
Pas encore d'évaluation
2 Fonctions
Document35 pages
2 Fonctions
Younes JEDDI
Pas encore d'évaluation
Exam Progra
Document5 pages
Exam Progra
Quentin M
Pas encore d'évaluation
Nsi23poj1 Corr
Document12 pages
Nsi23poj1 Corr
achti
Pas encore d'évaluation
Poo Python
Document9 pages
Poo Python
Benani Omar
Pas encore d'évaluation
td01 Hadoop
Document6 pages
td01 Hadoop
aissamemi
Pas encore d'évaluation
Cours Python 21 1 Introduction 2 Saisir Executer Observer Mpsi 3 PDF
Document12 pages
Cours Python 21 1 Introduction 2 Saisir Executer Observer Mpsi 3 PDF
malick
Pas encore d'évaluation
Chapitre 2 Concepts de Base
Document5 pages
Chapitre 2 Concepts de Base
Houcem Koubaa
Pas encore d'évaluation
Cours Python
Document7 pages
Cours Python
BATGIMS
Pas encore d'évaluation
Recommandations Pédagogiques Pour La Mise en Œuvre Des Nouveaux Programmes As 2021
Document2 pages
Recommandations Pédagogiques Pour La Mise en Œuvre Des Nouveaux Programmes As 2021
Hm Walid
Pas encore d'évaluation
Python - Expression Reguliere
Document1 page
Python - Expression Reguliere
Wilfried Ouskan Koffi
Pas encore d'évaluation
Beautifulsoup FR
Document13 pages
Beautifulsoup FR
Kévin Esteves
Pas encore d'évaluation
Cours Python Uni Paris7 2
Document73 pages
Cours Python Uni Paris7 2
omar2022
Pas encore d'évaluation
50 Heures de Formation Entre Python Et Intelligence Artificielle
Document4 pages
50 Heures de Formation Entre Python Et Intelligence Artificielle
Nadou She
Pas encore d'évaluation
2 - INITIATION AI - Data - Processing
Document22 pages
2 - INITIATION AI - Data - Processing
DIALLO
Pas encore d'évaluation
Jeu Tableau
Document2 pages
Jeu Tableau
Nissaf
100% (1)
Ecg2 TP1
Document12 pages
Ecg2 TP1
motivation31102001
Pas encore d'évaluation
Chapitre 7 - Interface-Graphique-Sur-Python-Bac-Sciences - Prof - 2022
Document3 pages
Chapitre 7 - Interface-Graphique-Sur-Python-Bac-Sciences - Prof - 2022
mahjoubi Rabie
Pas encore d'évaluation
Cours - CH2 PDF
Document30 pages
Cours - CH2 PDF
real life
Pas encore d'évaluation
TP 08 - Tris (Suite)
Document3 pages
TP 08 - Tris (Suite)
moreiramario005
Pas encore d'évaluation