Académique Documents
Professionnel Documents
Culture Documents
Sommaire
Introduction Dfinition Prsentation Fonctionnement Architecture Conclusion
Introduction
Introduction
Dfinition
Dfinition
Expression moteur de recherche souvent employe tord. Importance de la diffrenciation entre les diffrents outils existants Diversit plus complmentaire que concurrentielle
Prsentation
Prsentation
moteurs mtamoteurs annuaires portails anneaux web invisible autres
Moteurs
Outil permettant de rechercher les pages comportant une expression donne. Ex: AltaVista, Excite, Google, Lycos
Exhaustif, options de recherche utiles, indexation de chaque mot. Nombre de rponses souvent lev, une certaine exprience dutilisation est requise.
+
Mta-moteurs
Super-moteurs permettant deffectuer simultanment une recherche sur plusieurs moteurs et annuaires. Ex: Debriefing, MetaCrawler, Savvy Search.
Puissance cumule de plusieurs outils, efficacit croissante. Longueur de la recherche, fantaisie de certains rsultats, efficacit moindre par rapport aux moteurs spcialiss.
+
Les moteurs de recherche web
Annuaires (suite)
+
Portails
Site offrant un ensemble de ressources et de services (gnraux ou propres un domaine) un ensemble d'utilisateurs dfini (grand public, membre d'une profession, d'une branche d'activit...). Ex: Cuisinons, Visioweb. Navigation et recherche d'information facilites, services valeur ajoute. Sites cloisonnant
+
Les moteurs de recherche web
Portails (suite)
Outils de recherche, Information (actualit, finance, mto, etc.), Outils de communication (E-mail, listes de diffusion, groupes de discussion), Outils de consommation (vente en ligne, publicit, etc.), Personnalisation, Du contenu...
Les moteurs de recherche web
Anneaux ( WebRings )
Communaut (de sites) dcentralise l'extrme, lie par un thme commun. L'anneau slectionne et contrle humainement la qualit des sites proposs.
Qualit et fiabilit de l'information. Recherche du bon anneau laborieuse.
+
http://nav.webring.yahoo.com
Les moteurs de recherche web
Web invisible
Partie du Web contenant des documents nayant pas t indexs. Origines : Type de fichiers, donnes dynamiques, robot de recherche brid, documents interdits de rfrencement
Outils :, All-One-Search, AlphaSearch, Fossick, Invisibleweb, Searchability
Les moteurs de recherche web
Autres
Impossibilit de citer, et de classer la totalit des outils de recherche existants. Quelques exemples de ces catgories difficilement classables :
Recherche d'adresses classes par zone gographique (FinderSeeker, Excite Travel). Recherche dobjets perdus (Yellowtag).
Les moteurs de recherche web
Fonctionnement
Fonctionnement
Vue densemble,
Le robot explorateur, Le systme dindexation,
Le module de recherche,
Modes dinterrogation, Techniques utilises.
Les moteurs de recherche web
Vue densemble
Le spider rcupre et analyse le maximum dinformations provenant des pages quil visite. Le systme dindexation soccupe de stocker, et classer ces informations dans une base de donnes. Le searcher est charg de retrouver dans cette base, les documents qui correspondent le mieux la requte mise.
Les moteurs de recherche web
Fonctionnement gnral
Le systme dindexation
Analyse les informations collectes, construit un index des mots rencontrs (et des pages correspondantes), puis stocke lensemble dans une base de donnes. Convertit certains fichiers ne pouvant pas tre indexs cause de leur format. Utilise des outils dextraction pour ne rcuprer que lessence des documents. Ex: Fulcrum, Infoseek, Intelliserv, Livelink.
Les moteurs de recherche web
Le searcher est le frontal de l'utilisateur. Grce son interface graphique, on peut poser une question, slectionner les options disponibles, et lancer une recherche. Un script faisant alors appel au systme d'indexation pour quil excute la requte sur la base de donnes. Les rsultats affichs sous forme de page Web intgrant gnralement les rponses sous forme de liste.
Les moteurs de recherche web
Boolen : utilisation des oprateurs logiques (AND, OR, NOT, NEAR, etc.),
Liste de mots : requte retranscrite en une expression boolenne, En langage naturel (exprimental).
Les moteurs de recherche web
Documentaire classique : utilisant des fichiers d'index de type mots-cls (mots ou expressions normaliss). Textuelle : cherchant retrouver les documents " ressemblant " le plus la question pose. Pour cela, on utilise des techniques linguistiques (question pose en langue naturelle) ou statistiques (pondration des valeurs des mots et des documents) Floue : autorisant les erreurs (OCR)
Les moteurs de recherche web
Architecture
Architecture
Architecture Gnrale
Pages Web Moteur de recherche
Robots Indexation
Navigateur Client
DILIB
DILIB est une plate-forme pour l'Ingnierie du Document et de l'Information Scientifiques et Techniques
partie recherche
Fichiers Paramtre
Fichier direct
Morris, Goscinny Lucky Luke, cheval Goscinny, Uderzo Asterix, Idefix, chien
Mots cls
Asterix Cheval Chien 000004 000002, 000003 000001, 000002, 000004 000004 000001, 000002 000001, 000002 Herge
Auteurs
Goscinny 000003, 000004 000001, 000002 000004 000004 Morris Uderzo
Fichier inverse
Deux serveurs
Serveurs en parallles
Serveurs Indpendants
Conclusion
Accroissement important de la quantit dinformations disponible sur le rseau. Progression notable (mais pas encore suffisante) des performances des outils de recherche. Nouvelles technologies intelligentes prometteuses : agents, recherche en langage naturel.
Les moteurs de recherche web
Bibliographie
Glossaire spcialis dans le domaine : http://www.idf.net/mdr/glossaire.html Divers sites explicatifs : http://www.decisionnel.net/recherche/ http://www-dist.cea.fr/ext/neuf/moteur/ Sur le Web invisible : http://www.asktibbs.com/web_invisible.html Sur les Anneaux: http://2sevres.clipewebring.free.fr/quoi.html Liste de discussions : motrech-subscribe@egroups.com