Vous êtes sur la page 1sur 16

INFORMATION RETRIEVAL

TP DEVOIR INDEXATION DES DOCUMENTS

Préparée par : Encadrée par :

Naoui Jihad Pr. BNIHSSANE ABDERAHIM


Al Ahmadi Saad
Majdoul Jihane
Contexte Générale

Nous sommes chargés de réaliser un système de recherche d’information ( engin de


recherche ) qui a pour objectif d’indexer les fichiers textes et retourner les documents
pertinents en réponse à une requête saisie par l’utilisateur .

Définition d’un moteur de recherche

Les moteurs de recherche (search engine) sont des applications web créées pour effectuer
des recherches sur la toile. Les résultats apparaissent selon les expressions demandées par
les internautes. Aujourd’hui, Google reste le plus connu de tous. Mais il existe de nombreux
moteurs de recherche efficaces comme DuckDuckGo, Bing, Qwant, Yahoo… Vous trouverez
également des moteurs de recherche spécialisés comme : Google Scholar pour l’éducation,
Yahoo kids pour les enfants, Ecosia pour l’environnement…

Fonctionnement des moteurs de recherche

Les moteurs de recherche (search engine) servent à une seule chose : fournir des réponses
aux questions des utilisateurs. Pour fournir des résultats de recherches pertinents, ces
outils passent par deux étapes :

​ le crawling : la recherche de pages sur internet .

​ l’indexation : le classement des résultats par ordre de pertinence .

on s’interesse plus a la 2eme partie “Indexation” ,

Environnement de travail :

Java : C'est un langage de programmation orienté objet, développé par Sun


Microsystems. Il permet de créer des logiciels compatibles avec de nombreux
systèmes d'exploitations (Windows, Linux, Macintosh, Solaris).

2
Swing : est une bibliothèque graphique pour le langage de programmation Java, faisant
partie du package Java Foundation Classes (JFC), inclus dans J2SE. Swing constitue l'une des
principales évolutions apportées par Java 2 par rapport aux versions antérieures.

Les étapes de création d’un moteur de recherche :

- On a utilisé Java comme langage de programmation oriente objet pour les


techniques de programmation “ l’organisation des classes , la recursion , le tri .. “ .
- Swing comme interface graphique .

Conception d’un moteur de recherche :

On a utilisé deux classes :

I. Action.java
1. Classe Document
Cette classe représente un document texte caractérise par deux éléments :
un titre et une liste de mots.

3
2. Classe Action

Cette classe contient toutes les actions qu’on a utilisé :

lireFichier() , getTitle() , getText() ;

4
II. GUI.java

Pour Input on a utilisé getNomFichier() pour initialiser nomfichier

5
Bouton indexer : permet de créer le fichier index et le fichier inverse.

Bouton rechercher : permet de chercher une requête dans les documents .

6
Bouton effacer console : elle réinitialise l’interface graphique.

Bouton annuler tous : permet de supprimer le contenu de zone de saisie.

Butoon quitter : fermer l’interface graphique.

7
Pour console = output :

Pour document

Main :

8
Structure d’interface graphique :

III. DOCUMENT.TXT

Il Contient deux balises pour le titre et le texte “le corp” : test.txt …

9
Réalisation :
on obtient cette fenêtre comme interface de notre moteur de recherche .

10
1. Indexer :

1.1. Error indexer

11
2. Rechercher

2.2. Error rechercher

12
3. Effacer Console

4. Annuler Tout

13
5. Quitter : Pour fermer l’aplication

Langage Python(using tkinter )


On a pu réaliser une autre application en utilisant le langage de programmation Python et
la bibliothèque Tkinter .

Environnement de travail :

Python : est un langage de programmation interprété multi-paradigme. Il favorise la


programmation impérative structurée, et orientée objet.

Tkinter : Le module Tkinter ("Tk interface") de Python permet de créer des interfaces
graphiques (GUI : graphical user interface).

Voila les resultats :

14
Indexer

Rechercher

Effacer console

15
Annuler tous

Quitter pour fermer l’application

Conclusion
Un moteur de recherche est un système extrêmement complexe qui doit s’adapter aux
nouvelles technologies, aux évolutions du web et renvoyer les meilleurs résultats pour une
requête utilisateur.

16

Vous aimerez peut-être aussi