Vous êtes sur la page 1sur 6

Panorama des diffrents moteurs de recherche

Fvrier 2009

Dfinition
"Un moteur de recherche est une machine spcifique (matrielle et logicielle) charge dindexer des
pages web afin de permettre une recherche laide de mots-cls dans un formulaire de recherche 1"
Lindexation du web se fait rgulirement grce des robots (spiders ou crawlers) qui parcourent les
pages web de lien en lien et les stockent dans leur index. Cet index est interrog par linternaute avec
des mots clefs libres dans une interface de recherche. Le moteur interroge alors son index et
slectionne les pages web qui contiennent les mots clefs (recherche en plein texte). Laffichage de
rsultats se fait selon un classement propre chaque moteur en fonction de certains critres de
pertinence que lon appelle page rank (occurence des mots dans la page et dans le titre, popularit,
mise jour rgulire...).
La plupart des moteurs de recherche peuvent tre ajouts dans la barre doutils de votre navigateur
internet.

I.

Les moteurs gnralistes

Les moteurs de recherche gnralistes classiques


Google : un des moteurs les plus complets par le nombre doptions innovantes2 quil propose
rgulirement et le plus performant par la qualit de ses recherches et la pertinence de ses rsultats.
Son index dpasse 40 milliards de pages et ses critres de classement des rsultats sont les plus
objectifs existants. Ce moteur est actuellement prdominant en France avec prs de 90% des requtes
(63% dans le monde). Il est possible de chercher un document en fonction de son support (textes,
images, vidos), par typologie ( Actualits pour chercher dans la presse en ligne, recherche de blogs,
de livres avec Google Books ). Google propose lalternative dune recherche par annuaire (qui
utilise DMoz qui est un annuaire contributif et bnvole).
Yahoo : Moteur concurrent de Google (12% des requtes dans le monde), il offre sensiblement la mme
qualit de rponse lors des requtes simples et un index presquaussi consquent, mais est moins
pertinent dans le cas dune requte complexe. Lindex est sensiblement de la mme taille que Google.
Yahoo propose lalternative dune recherche par annuaire.

Dfinition de Comment Ca Marche : http://www.commentcamarche.net/contents/web/moteur-recherche.php3

Googlepages pour crer des sites, Blogger pour crer des blogs, gestion de son agenda en ligne, crer des groupes de discussion, Picasa pour
stocker et retoucher des photos
2

Exalead est un moteur de recherche conu en France, bas sur la spcificit du langage franais et
fonctionnant sur le clustering pour gnrer des termes associs, mais aussi pour catgoriser partir
dune liste dfinie (index de 8 milliards de pages). Il permet de prvisualiser les pages web grce des
vignettes et des fonctions avances sont proposes pour affiner la recherche (termes associs, type de
ressources, langue, annuaire).Il permet de crer et grer une slection de sites favoris grce loption
Ajouter aux raccourcis (portail personnalis du type Netvibes). Il est tout de mme noter que la
place des liens sponsoriss rduit considrablement la visibilit de laffichage des rsultats. Possibilit
de faire des recherches phontiques, lorsque lon ne connait pas lorthographe dun mot.
Ask propose une interface moderne, avec possibilit de la personnaliser avec des skins. Laffichage des
rsultats sous forme de liste offre cependant plusieurs options : termes associs, visualisation de la
page web, rponses flash (par exemple : dfinition du mot clef par Wikipdia, site officiel),
possibilit de cataloguer un site et le classer dans un dossier dans un espace personnalis. Lalgorithme
Expert Rank du moteur Ask se base non seulement sur la popularit des liens, mais aussi sur
lidentification des sujets (clusters) pour amliorer la pertinence des rsultats.
Wikiasearch est original par son caractre collaboratif : on peut proposer lors dune recherche, un lien
que lon juge pertinent, en lajoutant dans la liste des rsultats, on peut signaler un lien inappropi, le
commenter ou le supprimer. Le moteur offre un historique de recherche et sattache proposer des
liens de qualit, bien que la redondance dun site dans la liste des rsultats soit frquente.

Les moteurs de recherche alternatifs


Blackle, bas sur lindex Google, propose une interface noire, qui conomiserait lnergie de notre
ordinateur en watts. Des tudes contradictoires3 laissent penser que cette conomie dnergie nest
relle que par lutilisation dcrans cathodiques et non sur des crans LCD. Un compteur sur linterface
de recherche affiche un compteur de Watts conomises par heure.
Doona.fr, moteur franais utilise lindex Exalead. Les revenus publicitaires gnrs par les recherches
sont reverss 100% des associations humanitaires.
Veosearch, moteur franais, utilise lindex Yahoo. Les revenus publicitaires gnrs par les recherches
sont reverss 50% des projets associatifs lis au dveloppement durable. Il est possible de choisir
les associations qui on prfre donner en paramtrant son compte. Ethicle, quant lui, plantent des
arbres en fonction du nombre de recherches (index Yahoo).

Les moteurs de recherches avec affichage des rsultats innovant


http://www.business-garden.com/index.php/2007/08/13/fond_noir_ne_serait_pas_ecologique
prouve que lconomie dnergie sur des crans LCD nest pas prouve, alors que
http://ecoiron.blogspot.com/2007/01/black-google-would-save-3000-megawatts.html soutient que
Blackle conomise de lnergie.
3

Addict o matic affiche et synthtise les rsultats sur une seul page sous forme de widgets, par
catgories de contenus, comme dans les univers Netvibes. Chaque bloc peut tre dplac ou supprim,
pour obtenir une page personnalise
Cuil (Connaissance en galique) moteur dvelopp par des anciens employs de Google qui
possderait un index de 120 milliards de pages (soit trois fois plus que Google, mais invrifiable). Les
rsultats de recherche sont prsents sous forme de vignettes avec des rsums, classes selon des
onglets thmatiques. Seul problme : il nexiste quen anglais pour le moment, son page rank est moins
efficace que Google, il ne propose pas dautres options que la recherche Web pure, mais il respecte la
vie prive car il nenregistre pas de donnes de navigation. Cependant laffichage innovant des
rsultats par colonnes est trs critiqu par des tudes deye tracking4.
Oamos (uniquement en anglais et allemand). Cest un moteur de recherche fantaisiste, qui allie
plusieurs gadgets laffichage des rsultats : musique, vidos, photos, nuages de mots-clefs...
Intressant utiliser pour des recherches concernant les loisirs, plus que pour des recherches
universitaires.
MelZoo, en version Bt, propose une interface de recherche pure avec une barre de saisie agrandie
pour un meilleur confort visuel. La recherche se fait uniquement sur le web gnral et est prsente
dans une page spare en deux, ce qui le rend plus ergonomique : dun ct vous avez la liste des
rsultats, de lautre la page web saffiche en pr-vue pendant deux minutes maximum lorsque vous
passez le curseur sur les rsultats de recherche gauche.
Twingine affiche ses rsultats dans une page divise en deux, avec dun ct les rsultats du moteur
Yahoo et de lautre laffichage des rsultats avec Google. Moteur idal pour comparer les diffrences de
rfrencement et de pertinence des rsultats.
Kartoo est un mtamoteur5 qui prsente les rsultats des recherches sous forme de carte heuristique.
Laffichage des rsultats se fait sous forme de pages vignettes relies entre elles par liens smantiques
gnrs dynamiquement. Lorsque lon survole une vignette, elle saffiche en miniature la gauche de
lcran. Des onglets proposent des recherches dimages et de vidos qui basculent dans une nouvelle
fentre sur Yahoo. En gnral, les rsultats sont pertinents, mais laffichage en carte est perturbant
(juste lUrl et la vignette, pas de nom de site visible), mais il est apprciable de se voir proposer des
mots-clefs pour affiner la recherche

II.
4

Les moteurs de recherche spcialiss

http://motrech.blogspot.com/2008/09/trop-de-cuil-tue-le-cuil.html

Un mtamoteur est un moteur qui interroge plusieurs moteurs et annuaires de faon simultane et na pas dindex propre, car il utilise celui
des autres. Autre exemple de mtamoteur : Copernic.
5

Presse en ligne
Google actualits recherche les informations sur les pages web des journaux en ligne.
Paperblog, Wikio et LePost : portails dinformations publies dans la blogosphre.

Les moteurs de recherche de personnes


Les pages jaunes/blanches : recherche les coordonnes dune personne ou dune entreprise.
Dautres moteurs se sont dvelopps dans la recherche dinformations sur une personne, travers les
traces laisses dans les rseaux sociaux : facebook, copainsdavant, blogs personnels, annuaires
dentreprises... Ce sont des moteurs intressants connaitre pour apprendre grer son E-rputation.
123people : site en franais. Organise les rsultats de la recherche en diffrents domaines : photos,
numros de tlphone, mails, blog, biographie... Au vu des rsultats donns, lessai nest pas trs
concluant. La plupart des photos publies viennent des rseaux sociaux auxquels on est affili. Le
nuage de tags associ au profil rapporte des informations tout fait mineures et peu satisfaisantes
Whozat : laffichage des rsultats se fait sous forme de liste, mais il est possible daffiner la recherche
en ciblant une ville, un ge ou le sexe, ainsi que de personnaliser la page des rsultats en approuvant
ou en supprimant un rsultat. Les rsultats sont en gnral trs pertinents, dautant plus quil est
possible de rajouter des mots-clefs pour diffrencier les homonymes.

Moteurs de recherche de musique


Musicme et deezer sont des webradios, avec moteurs de recherche intgr, ce qui permet de rechercher
et couter en streaming les morceaux choisis. Il est possible de se crer des playlists en ouvrant un
compte, dadhrer une communaut, de faire des commentaires et dacheter les titres.
Playzik.net, MP3.com et AirMP3 sont des moteurs de recherche de fichiers MP3
Lyrics.cd recherche les paroles de chansons
Freescores recherche les partitions de musique gratuites et payantes.

Moteurs de recherche sur la sant


Honcode est un moteur de recherche de sites mdicaux tels que Caducee.net, e-sante.fr, creapharma
Possibilit de chercher avec Medhunt, intgr au moteur Honcode, qui recherche des documents
mdicaux. ****

Les moteurs de recherche de linformation scientifique et technique

Spinoo est un moteur spcialis pour lEducation Nationale. Il recherche dans un index compos des
pages web de 90 sites ducatifs institutionnels franais (MEN, CNDP, CRDP, CDDP, INRP, Onisep,
serveurs acadmiques...).
In extenso.org est un moteur de recherche spcialis en sciences humaines et sociales dvelopp par le
Centre pour ldition lectronique ouverte (CLEO). Il explore une partie de la Toile mondiale,
slectionne et indexe en un corpus rduit de sites et de dpts d'articles par l'quipe de Revues.org.
In-extenso distingue deux espaces de recherche. Le premier espace indexe des dpts darticles
scientifiques et permet une recherche sur le titre, lauteur et le rsum provenant de Perse,
Revues.org, HAL-SHS, Gallica (environ 135.000 pages). Il sagit de dpts relevant du mouvement
des archives ouvertes (OAI) soutenu par le CNRS depuis la dclaration de Berlin. Le second indexe les
sites slectionns par LAlbum des sciences sociales (2 000 sites et plus dun million de pages web).
Google Scholar est un moteur de recherche spcialis dans les travaux universitaires : il indexe des
articles issus de priodiques avec valuation par les pairs, des thses, des livres, des rapports, des
articles en pr-publication. Avec laccord des diteurs, la numrisation et lindexation de cette
littrature scientifique rvle une partie du web invisible. Lindex est marqu par la prpondrance de
ressources en sciences exactes et mdicales, par rapport aux sciences humaines et sociales. La langue
majoritaire est langlais. On peut trouver notamment dans les sources franaises la totalit de larchive
franaise HAL du CCSD et les collections du fonds documentaire de lINIST. Google Scholar propose
aux bibliothques de participer lalimentation du site, grce des liens avec leur catalogue.
OAIster est un moteur spcialis dans le moissonnage des entrepts OAI, c'est--dire des serveurs
darchives ouvertes. Le moissonneur (harvester) couvre une base de donnes multidisciplinaire,
majoritairement en langue anglaise et rcupre les mtadonnes (labores selon la norme Dublin
Core simple) associes chaque document. Chaque notice pointe vers la ressource numrique
hberge par une institution reprsentant principalement des documents textuels (articles
scientifiques, pr et post-publications, littrature grise) mais aussi des ressources multimdia. La base
compte plus de 14 900 000 notices issues de plus de 930 institutions en janvier 2008.
Scirus est un moteur de recherche produit par Elsevier Science, spcialis dans les documents de
nature scientifique publis sur linternet. Scirus indexe toutes les pages de sites prsents sur les
serveurs reconnus et rfrencs par Elsevier pour leur contenu scientifique, ainsi que des documents
issus de ses ressources lectroniques (Science direct), de bases de donnes (Medline, Nasa, Beilstein),
des brevets amricains, de serveurs de pr-publication et Open archive. 250 millions de documents
sont prsents, dont 20 million de rfrences bibliographiques, majoritairement anglais.
UREC est un annuaire de lenseignement suprieur et de la recherche, dirig par le CNRS.
Seek : propose une recherche gnrale sur le web et un onglet de recherche cible sur lducation.
Moteur anglophone.

Portails de moteurs

Le centre de documentation sur internet, Lecdi.net et Zefab, sont des portails de recherche documentairesqui permettent un
accs rapide et simultan au contenu de diffrents sites retenus pour leur richesse, leur intrt documentaire et la gratuit de
laccs la totalit ou une partie au moins de leur contenu.