Vous êtes sur la page 1sur 23

UE INFO 251: RECHERCHE

DE LINFORMATION
SCIENTIFIQUE

Dmarche de recherche de linformation

FOYET GANKAM Arsne Delors


Gographe-environnementaliste
f2lor@yahoo.fr

Master 2 : Espagnol, Gographie,


Psychologie, LGA.
Semestre 1-2016

Information scientifique et technique


Dfinition
Ensemble des informations dont les diffrents professionnels
des secteurs de la recherche, de l'enseignement, de
l'industrie et de l'conomie ont besoin dans l'exercice de leur
mtier.

recherche d'information
La recherche d'information ncessite une stratgie adapte qui
consiste :
Cerner le besoin d'information ;
Formuler le besoin d'information ;
Reprer les sources pertinentes ;
Identifier les outils exploiter en fonction de ces sources ;
Interroger les outils ;
valuer la qualit des rsultats.
3

Les sources d'information


les sources d'information traditionnelles qui diffusent des
informations valides selon un processus reconnu ;

les sources mergeant de structures collectives plus ou


moins formelles , dont les rgles de publication et de
validation de l'information sont plus ou moins strictes.
les sources informelles publies sans aucun contrle.
4

Les catalogues de bibliothque


Les bibliothques conservent des documents. Pour les rpertorier
et les localiser, ils sont dcrits par leur notice bibliographique.
Une notice bibliographique est la description d'un document. Elle est
organise selon des champs : auteur, titre, diteur, collection, ISBN,
anne de publication, type de publication, rsum, mots-sujet, etc.
Un catalogue de bibliothque donne accs aux notices
bibliographiques des documents qu'elle contient.
5

Les catalogues de bibliothque


L'indexation du contenu
Pour permettre une recherche par le sujet, les documents
doivent tre indexs, c'est--dire associs des mots-cl.
Traditionnellement, l'indexation des documents d'une
bibliothque est manuelle et s'appuie sur un thsaurus.
Le vocabulaire d'un thsaurus est ferm : tous les mots du
dictionnaire ne s'y trouvent pas !

Les catalogues de bibliothque


Les catalogues intgrent dsormais une indexation automatique des
divers champs des notices, notamment du champ
Titre et du champ Rsum . Il est ainsi possible d'entrer une
requte compose de mots-cls qui seront cherchs dans tous ces
champs la fois, ce qui lve partiellement la contrainte du vocabulaire
ferm du thsaurus, et rapproche cette pratique de celle de
l'interrogation des moteurs de recherche.

Les portails documentaires


Un portail documentaire de bibliothque centralise l'accs
un ensemble de services lis la recherche d'information.
On trouve notamment :
l'accs au catalogue de cette bibliothque et d'autres
bibliothques ;
l'accs des documents en texte intgral ;
l'accs des encyclopdies, des dictionnaires, la presse en ligne,
etc. ;
des services personnaliss comme l'accs son dossier de lecteur,
des informations cibles, des outils de veille
8

Les annuaires de recherche


Un annuaire de recherche est un outil de recherche qui
rpertorie des sites web slectionns pour leur qualit par
des spcialistes du domaine. Les sites sont organiss dans
une hirarchie de catgories.
Le processus d'alimentation d'un annuaire reposant sur une
slection humaine, les ressources qu'on y trouve sont
thoriquement de bonne qualit.
Cependant, elles sont relativement peu nombreuses, et
n'intgrent pas toujours les dernires nouveauts apparues
sur le web.

Les annuaires de recherche


Les annuaires gnralistes :
Open Directory Project DMOZ
ipl2 - information you can trust
Les annuaires spcialiss :
Signets de la BNF (slection des bibliothcaires de la
Bibliothque Nationale de France)
WWW Virtual Library (le premier de l'histoire du web)
Infomine (ressources acadmiques)
10

Les moteurs de recherche


Un moteur de recherche est un outil permettant de retrouver des pages web
partir d'une requte.
C'est un logiciel qui ralise les tches suivantes :
moissonnage : les pages du web sont parcourues automatiquement par un
robot ;
indexation automatique : les pages sont analyses pour en extraire les mots
significatifs ;
interrogation en fonction d'une requte : les mots cls de la requte
sont compars aux mots extraits par l'indexation et une liste de pages web
slectionnes est affiche par ordre de pertinence.
11

Les moteurs de recherche


Les moteurs de recherche gnralistes:
Google, Yahoo Search ou Bing
Les moteurs de recherche spcialiss :
dans certains types de ressources (images, vidos,
publications acadmiques, blogs, flux RSS, personnes, etc.);
dans certains domaines (technologie, musique,
mathmatiques, sant, chimie, etc.).

12

Les moteurs de recherche


Les limites du moissonnage:
Certaines pages du web ne peuvent pas tre moissonnes par
les moteurs de recherche : c'est le web invisible ou web
profond. Notamment certaines pages ne sont accessibles
qu'aprs authentification
; d'autres sont des pages
dynamiques qui sont composes partir de donnes stockes
dans des bases de donnes.

13

Les moteurs de recherche


Les limites de l'indexation automatique:
Certains documents en ligne ne sont pas indexs car le moteur ne
sait pas traiter leur format.
Les documents au format PDF sont dsormais indexs par la
plupart des moteurs.
Pour indexer les images, les moteurs utilisent les mtadonnes
associes, le texte entourant l'image ou les tags laisss par les
internautes.
Les textes trs courts ou mal crits reprsentent un dfi pour
l'indexation automatique.
14

les mta-moteurs de recherche


Un mta-moteur est un outil permettant de soumettre
une mme requte plusieurs moteurs de recherche
simultanment.
Exemples de mta-moteurs : Dogpile, Yippy

15

Les requtes
Lorsqu'on interroge un catalogue de bibliothque ou un
moteur de recherche, on utilise une requte pour prciser
les critres de la recherche.

16

Les requtes
Catalogue de bibliothque
Lorsqu'on fait une recherche dans un catalogue de
bibliothque, la requte exprime des critres qui sont
structurs selon les champs des notices bibliographiques.
On peut choisir les oprateurs pour combiner ces critres.

17

Les requtes

Catalogue de bibliothque

Les oprateurs boolens


l'oprateur ET ou AND rend tous les critres obligatoires ;
l'oprateur OU ou OR il suffit que l'un des critres soit vrifi ;
l'oprateur SAUF ou NOT permet de signaler un mot-cl non
souhait.
Si on utilise mauvais escient cet oprateur, cela peut liminer des
rponses pertinentes des rsultats : c'est le phnomne de silence

Si on change un ET en un OU dans une requte, cela augmente le


nombre de rsultats, au risque de voir apparatre des documents non
pertinents : c'est le phnomne de bruit
18

Les requtes
Catalogue de bibliothque
l'oprateur de troncature * qui permet de ne donner

que le dbut d'un mot-cl pour inclure virtuellement toutes


les terminaisons possibles.
De PORT* on peut arriver porter, portable, portique

19

Les requtes

Moteur de recherche

Les moteurs de recherche tendent limiter l'effort de formulation


de l'usager en dcidant automatiquement de la faon de combiner
et ajuster les mots-cls saisis.
Cependant, il est possible de raliser une recherche plus fine en
utilisant les oprateurs boolens pour combiner les critres.
Les moteurs proposent gnralement des notations plus lgres :
le signe + devant un mot-cl signifie qu'il est obligatoire (proche du
ET) ;
le signe signifie qu'il ne doit pas apparatre (proche du SAUF).
20

Les requtes
Moteur de recherche
les guillemets pour rechercher une expression exacte;
l'expression entire doit tre prsente, et sous cette forme
exactement.

21

Les requtes
Les oprateurs numriques

22

Je vous remercie

23

Vous aimerez peut-être aussi