Académique Documents
Professionnel Documents
Culture Documents
2020-2021
Informatique 4
LA RECHERCHE INFORMATIQUE
INFORMATIQUE DE RECHERCHE
Pour bien mener la recherche en recourant à l’ordinateur, on suit cinq étapes, devenues
classiques, que voici :
1) Préparer sa recherche
2) Sélectionner les sources d'information
3) Chercher et localiser les documents
4) Évaluer la qualité et la pertinence des sources
5) Mettre en place une veille documentaire (Univ d’Avignon, 2017)
Il y a un schéma des questions sur un sujet :
Voici les paliers à respecter pour construire la recherche documentaire :
_L’analyse du sujet
_La recherche de mots-clés
_La problématisation
_La recherche de documents (Bulco 2010)
Pour cerner le sujet on se pose les questions suivantes : Qui, quoi, quand, où, comment et
pourquoi ? C’est le système 3QOCP (ou système de Quintilien ou modèle de Laswel) : Qui, quoi,
quand, où, comment, pourquoi. Ce sont les 5W (who, what, when, where and why ? en anglais
(Andral 2017). Le schéma suivant ajoute aussi « combien ? ». On aurait donc deux c.
Exemple :
Si la recherche de l’information sur ordinateur se réalise aujourd’hui
essentiellement avec l’internet et le web (C), il est à noter que le
développement de l’informatique a permis de pouvoir constituer des catalogues
numériques (A) ainsi que la constitution des gigantesques bases de données
(B), nécessaires pour la facilitation de la recherche sur ordinateur.
-BABORD PLUS: catalogue des bibliothèques des universités de Bordeaux et plus qu’un catalogue,
une « interface de recherche documentaire »
-Le catalogue collectif des Bibliothèques universitaires des Universités françaises (SUDOC :
http://www.sudoc.abes.fr)
-Le catalogue mondial (Worldcat : http://www.worldcat.org/)
- Le catalogue de la Bibliothèque nationale de France
(http://catalogue.bnf.fr) (Univ Avignon, 2017)
-Le catalogue RAMEAU. Les autorités RAMEAU sont accessibles en ligne à partir du catalogue
général de la BnF (bouton "RAMEAU" en bas à gauche de l'écran).
-En France, les thèses sont répertoriées dans les catalogues suivants : Theses.fr ; Theses.fr a environ
6000 thèses (cliquer sur Uniquement les thèses soutenues accessibles en ligne).
-Les catalogues de revues en texte intégral
Ce type de base de données constitue des archives en ligne de revues scientifiques. Les revues
scientifiques constituent un ensemble de publications important dans le champ scientifique. Leur
particularité est de publier des articles dont le contenu scientifique a été validé par un comite de
lecture composé d’autres chercheurs (Peer review process). Il est souvent utile de se rendre
directement sur les sites des revues pour consulter les résumés des dernières publications voire le
texte intégral. De plus sur le site des bibliothèques des Universités on trouve un recensement de
bases de données.
Voici le contenu des catalogues : On y trouve certains types de documents : des livres, des
mémoires, des thèses, des comptes-rendus de congrès, des numéros spéciaux de revues, les titres
des revues, peu d’articles (ce sont les bases de données qui les recensent), des rebonds (sans reposer
la question) vers d’autres sources (autres catalogues, bases de données, etc) (Andral, 2017)
Les catalogues sont des outils documentaires comme les autres, on y trouve les mêmes
fonctionnalités que dans les Bases de Données : Une recherche simple, une recherche avancée, des
limitations, un historique de recherche, des possibilités de sauvegarde, un envoi par mail, une alerte,
etc… (Andral, 2017).
Les catalogues (catalogue de la BU mais aussi catalogue SUDOC) sont des outils de
localisation par excellence. Ils permettent :
de vérifier si la bibliothèque possède tel ou tel document,
de savoir où il se trouve dans la bibliothèque (dans quel espace, à quelle cote), et de connaître sa
disponibilité (en rayon ou en prêt)
d'identifier les ressources disponibles sur tel ou tel Sujet.
Les utilisateurs peuvent retrouver les documents dans les différents espaces (ex. Espace
Lettres & Sciences humaines) de la bibliothèque en se repérant grâce à l'utilisation de la
classification décimale Dewey. Exemples de cote Dewey :
809 Histoire de la littérature. Littérature comparée
820 Littérature Anglaise
840.19 Littérature Française. Auteurs du XIXe Siècle
En RDC, avec l’avènement des Nouvelles Technologies de l’Information et de la
Communication (NTIC), le Ministère de l’ESU a l’ambition d’informatiser les Bibliothèques des
Universités, d’interconnecter les Bibliothèques des Universités congolaises à travers le projet dit «
Ebale », qui signifie fleuve et qui suivra la forme du fleuve Congo, épine dorsale de la
communication terrestre en RDC, de les connecter avec des Bibliothèques étrangères pour constituer
des Campus numériques et de répandre partout la fibre optique. Ce .projet, ambitieux, prendra du
temps à se réaliser. L’UCG a déjà commencé l’informatisation de sa bibliothèque centrale et de la
Faculté de Philosophie sur le site de Vuhira.
Il revient aux étudiants de visiter le logiciel utilisé dans cette bibliothèque et d’en connaître
le fonctionnement pour la recherche documentaire.
B. LES BASES DE DONNEES
Les bases de données bibliographiques ou de texte intégral permettent de rechercher des
références sur un sujet précis, en écrivant une équation de recherche via une interface
d'interrogation. La plupart des bases de données utiles pour un travail universitaire sont payantes
(abonnement par le SCD donc « gratuites » pour l’utilisateur).
Il faut toujours se demander quel est le contenu de la base de données que l'on utilise :
champ(s) disciplinaire(s) couvert(s), texte intégral des articles ou références bibliographiques
seulement (ex : Francis), période chronologique couverte, etc. Le Service Commun de la
Documentation (SCD), pour les Universités françaises, en fait une description ou la base elle-même
donne ces informations (Andral, 2017).
Une bibliothèque universitaire joue un rôle très important dans une recherche de document.
D'une part, les ouvrages et documents constituant son fonds documentaire constituent une première
source de document, ensuite la disponibilité et les savoir-faire des bibliothécaires constituent un
élément permettant d'apprendre à trouver des documents. Enfin, il est très utile d'avoir accès aux
services périphériques des bibliothèques universitaires comme l'accès a des bases de données
payantes, que les bibliothèques mettent à la disposition des étudiants. C'est pourquoi, dans la mesure
b. MODES DE RECHERCHE
Recherche dans le plan de classement : Cette méthode est parfois complexe, aucune norme
n'existant pour l'arborescence des répertoires. Les sites sont indiqués par ordre alphabétique.
Recherche par mot clé : la recherche se fait sur les champs suivants : intitulés des catégories,
titres des sites, résumé des sites, adresses URL des sites. Avec ce mode de recherche, les
résultats bénéficient généralement d'un classement de pertinence opéré uniquement sur les
fiches descriptives des sites. Le Open Directory ne recherche pas sur les catégories.
c. UTILISATION
Les répertoires sont à réserver pour des recherches plutôt thématiques, ou sur des mots clés assez
généralistes ; notons toutefois que les catégories deviennent au fil du temps de plus en plus
"pointues" en fonction du sujet. Si l'on utilise des mots clés trop précis, ou trop de mots clés, la
plupart des répertoires passent le relais à des moteurs de recherche partenaires qui effectuent des
recherches sur le texte intégral des pages web.
C’est pourquoi la distinction entre annuaires et moteurs est de plus en plus difficile à
percevoir, mais elle reste néanmoins fondamentale. Les interfaces à bases d'onglets mises en place
par Google, Yahoo ou Voila par exemple sont nettement plus claires toutefois.
Les répertoires sont aussi utiles :
pour se faire une idée du vocabulaire utilisé dans un domaine
pour retrouver, à partir d'un site web donné, d'autres sites traitant du même sujet
pour trouver des sites fédérateurs ou portails spécialisés
pour obtenir rapidement tous les sites d'une organisation importante.
d. LES PRINCIPAUX RÉPERTOIRES FRANCOPHONES ET INTERNATIONAUX
GENERALISTES
Important : De nombreux autres portails intègrent bien entendu ces répertoires, et en particulier le
Open Directory
Soit à des experts rémunérés pour leur prestation : About.com travaille ainsi avec des
spécialistes qui sélectionnent les sites pour leur thématique et sont chargées de l'animation
de leur section. Celle-ci peut d'ailleurs être considérée comme une "méta-page" du domaine,
voire un répertoire spécialisé. About se présente donc comme un annuaire de guides du web.
Voir par exemple http://websearch.about.com qui représente l'un des points de départ
incontournables pour la recherche d'information sur le Web.
Soit à des internautes bénévoles dont la compétence dans le domaine couvert pour cette
catégorie a été vérifiée. Ces internautes reçoivent alors les demandes de référencement de
leur catégorie, décident ou non d'intégrer les sites, et le cas échéant, rédigent eux-mêmes la
description du site : Ainsi, le Open Directory "racheté" en 1998 par Netscape qui propose
des licences d'utilisation à d'autres acteurs du Web, tels Google. Bien entendu, l'inconvénient
d'un tel système réside dans une qualité inégale selon les catégories. Le Open Directory
signale actuellement environ 100 000 sites francophones.
A noter que le Open Directory fait des "émules", mais qui se rapprochent plus du modèle ci-
dessus, avec une rémunération éventuelle des éditeurs : exemple Zeal.com, répertoire ouvert
proposé par Looksmart et qui sert également à alimenter ses bases
Soit à des centres spécialisés (universités, centres techniques, etc.) : Ainsi, la Virtual Library
du W3C (World Wide Web Consortium) fut le premier catalogue de ce type du Web. On est
renvoyé pour chaque thématique à une section spécifique sur le serveur du centre concerné
: http://www.vlib.org
f. LES RÉPERTOIRES SÉLECTIFS
Répertoires dont les gestionnaires mettent en place des critères de qualité précis et intègrent
uniquement les sites répondant à ces critères : Exemples www.bonweb.com ou www.britannica.com
(encyclopédie Britannica).
La page du site de l'ADBS "Panorama des outils de recherche sur le web" (Véronique Mesguich)
http://www.adbs.fr/site/repertoires/outils/index.php est intéressante car simple et relativement
complète. Voir aussi la page proposée par SearchengineWatch :
http://searchenginewatch.com/links/
Répertoires "classiques"
7alpha (www.7alpha.com) ;
Beaucoup (www.beaucoup.com)
Finderseeker (www.finderseeker.com) ;
Metamonster (www.metamonster.com) ;
Searchability (www.searchability.com) ;
d'abord sur les sites les plus populaires et les plus mouvants. De façon générale, les moteurs
travaillent aujourd'hui plus sur la représentativité que sur l'exhaustivité de leur index.
Quelques idées reçues sur les moteurs
Il existe des centaines de moteurs… FAUX : Il existe en fait de nombreuses interfaces
"opérant" sur les mêmes bases.
"Je cherche une page que j'ai vue sur le web il y a un an"… Les moteurs de recherche
n'archivent pas les documents qui ont été modifiés ou qui ont disparu:
ce n'est pas parce que vous avez vu une page un jour sur le web que vous la retrouverez
forcément. A noter que Google propose toutefois d'obtenir la page telle qu'elle était
lorsqu'elle a été visitée par le robot (option "en cache") (solution de dernier recours = la
Wayback Machine de www.archive.org).
Quand vous interrogez un moteur, vous scrutez le web en temps réel"… FAUX : vous
interrogez l'index d'une base de données.
"On ne sait jamais quelles fonctionnalités sont disponibles sur un moteur"… FAUX : les
aides en ligne (help, tips) sont généralement bien rédigées.
"If you've found it once, you'll find it again"… FAUX : la plupart des moteurs changent, les
algorithmes de pertinence varient, et peuvent donner des résultats très différents Les pages
disparaissent, évoluent, etc.
Les moteurs ont tous l'opérateur ET par défaut et acceptent les " " pour une expression :
VRAI
b. LES PRINCIPAUX MOTEURS FRANÇAIS ET INTERNATIONAUX
Yahoo a racheté en 2003 La société Overture, leader des liens sponsorisés et promotionnels qui
venait elle-même de racheter le moteur Altavista et la division web search de Fast, l'éditeur du
moteur Alltheweb. De son côté, Yahoo avait finalisé en mars l'acquisition de Inktomi, afin de
posséder ses propres technologies de recherche. (En effet, jusqu'ici, le moteur utilisé par Yahoo était
Google, un partenaire encombrant qui finalement lui captait de nombreux clients et internautes).
Microsoft a lancé sa propre technologie moteur début 2005.
Pour vous aider :
Le site Abondance qui propose un tableau bien pratique (attention aux mises à jour toutefois)
: http://docs.abondance.com/portails.html
Le "search engine decoder" www.search-this.com/search_engine_decoder.asp
Google utilise des algorithmes analogues à ceux des autres moteurs, mais donne davantage
d’importance à la «popularité» des pages web. Google calcule en effet l'importance d'une
page en fonction du nombre de liens qui, à partir d'autres sites, pointent vers cette page.
L'importance probable des sites où se trouvent ces
liens est également prise en considération, et elle est évaluée de la même
manière. (cf pages précédentes sur la pertinence)
Syntaxe: L'opérateur par défaut est ET. Google accepte les guillemets. On peut utiliser
l’opérateur OU, sachant qu'une équation booléenne est acceptée (pas besoin de parenthèses,
le moteur traite d'abord le OU. L'opérateur + est néanmoins parfois nécessaire pour forcer le
moteur à prendre en compte un mot très courant ("mot vide", ou "stop word" en anglais).
L’opérateur – fonctionne. Il n’y a pas de troncature, et la recherche se fait sur la chaîne de
caractère indiquée (au singulier si indiqué au singulier).
Recherche dans le titre des pages (fonction intitle: ainsi que allintitle:) et dans l'url (inurl:
ainsi que allinurl:) Utiliser allinurl pour signifier au moteur que l'on veut plus d'un mot dans
l'URL ou dans le titre avec allinurl. link:www.monsite.com visualise les pages "pointant"
vers "monsite". related: www.monsite.com/page.html visualise les pages liées. particulier
site:www.monsite.com cherche le mot clé "particulier" sur le site Mon site.
filetype:pdf management retrouve les fichiers de type pdf contenant le mot-clé management
(il est obligatoire d'utiliser un mot-clé)
Fonctionne avec les fichier texte (txt), word (doc), excel (xls), powerpoint (ppt), Adobe (pdf
et ps), Works (wks, wps et wdb), RTF (rtf), ASP (asp), flash (swf), Lotus.
La recherche avancée permet de retrouver ces fonctions via des menus
déroulants et permet également d'inclure seulement (ou d'exclure) les pages provenant d'un
site ou d'un domaine. En anglais, une recherche est possible sur le titre ou l'URL.
Depuis juillet 2001, le moteur permet la recherche sur les dates en recherche avancée : il n'y
a pas, comme dans Alta Vista, moyen de configurer précisément sa requête, mais on peut
néanmoins choisir d'effectuer une recherche sur les trois derniers mois, les six derniers mois
ou l'année précédente.
MIRAGO www.mirago.fr
Ce moteur, à la technologie propriétaire, s'intéresse aux pages françaises
(également Royaume Uni, Allemagne et Espagne)
Il permet de faire une recherche régionale : sélection possible d'une ville ou d'une région
à partir de laquelle démarrer une recherche
Possibilité de classer les résultats selon le nombre de liens pointant vers une page
(popularité des pages) ou le nombre de liens contenus sur une page (page riche en liens) ou
selon la date (documents les plus récents d'abord) ou selon que la page est riche en images
ou non.
Ramène les pluriels en singulier, formes verbales à l'infinitif et abréviations aux mots
entiers, adverbes et synonymes à la racine du mot auquel ils se rapportent : "enfant adoptif"
= "enfant adopté" ; "problèmes d'ado" = "problème d'adolescence"
Supporte le langage naturel : option "meilleur résultat" en recherche avancée
Donne en premier les noms de domaine contenant les mots de la recherche (résultats non
numérotés).
Option proche du "near" : choisir "mots liés" dans la recherche avancée. A noter aussi la
possibilité de rechercher sur "la plupart des mots".
Recherche par dates
Recherche sectorielle proposée
MSN
5 milliards de pages rafraîchies tous les deux jours (avec 'intégralité des articles de
l'encyclopédie Encarta appartenant à Microsoft).
Ne tient pas compte de la casse des lettres, ni des caractères accentués.
Fonctions de recherche classiques : Et par défaut, OU traduit par OR, site:, link:…
Nouveaux opérateurs récents : filetype: ; linkdomain: (toutes les pages qui ont mis en
place un lien vers n'importe quelle page d'un site) ; contains: (recherche sur des documents
qui contiennent le mot demandé dans leur code html) ; inurl: (dans l'adresse de la page) ;
inanchor (dans le contenu textuel des liens) ; intitle:
; inbody: (dans le texte à l'exception des titres) ;
YAHOO www.yahoo.fr
Moteur lancé en février 2004, rompant ainsi son partenariat avec Google. Les
moteurs Alltheweb et AltaVista ont aujourd'hui abandonné leur index pour adopter celui de
Yahoo et sa technologie, même si les résultats ne sont pas toujours identiques. Le moteur
annonce un index de plus de 4 milliards de pages, donc comparable à Google, et son interface
générale est également proche. Yahoo a conservé le système de présenter en haut de la page
de résultats les rubriques du guide web qui contiennent les mots de la requête. Ouverture
directe possible des résultats dans une nouvelle fenêtre, fonction cache sont au RDV
Nombre de résultats par page par défaut :
Voir les fonctionnalités de recherche très complètes (le OR réclame des capitales) et
recherche avancée. La fonction 'site:' est la même que sur Google (recherche sur un domaine,
ou un sous-domaine) ; 'url:' permet de chercher un document en particulier, quand 'inurl:'
permet de chercher une page ayant un mot-clé en particulier dans l'URL ; 'title:' cherche des
pages ayant un mot-clé en particulier dans le titre.
'Fonction link:' comme sur Google, pour chercher les "backlinks" d'une page, mais l'URL
complète doit être indiquée (avec le http) et contrairement à Google, on peut utiliser un mot-
clé en plus (trouver les pages contenant un mot-clé et "pointant" sur). A noter également la
fonction 'linkdomain:' qui permet de trouver
les pages qui pointent sur le domaine donné (ex cnrs.fr) ou sur l'ensemble des pages d'un site
donné (ex www.cnrs.fr). Il ne faut alors pas mettre de http. On peut ainsi trouver les pages
émanant de sites publics français "pointant" sur l'un des sous-sites CNRS avec la requête :
linkdomain:cnrs.fr site:gouv.fr. Ces fonctions peuvent être utilisées avec d'autres opérateurs,
comme inurl ou intitle.
Pas de limitation (comme le fait Google) sur le nombre de mots dans la requête.
Si la page de résultats contient un "fil RSS", celui-ci est signalé (avec possibilité
de le rajouter à My Yahoo).
Toute une série de raccourcis de recherché sont disponibles sur Yahoo US à
l'adresse http://help.yahoo.com/help/us/ysearch/tips/tips-01.html (des numéros
d'immatriculation aux brevets en passant par la définition d'un mot).
Nouvelles fonctions de personnalisation (voir page 14)
CNN a remplacé Google par Yahoo en mai dernier.
A noter cette fonction utile disponible sur Research Buzz pour chercher un mot séparé
d'un (ou deux, trois, quatre ou cinq) mot du premier.
http://www.researchbuzz.org/archives/002051.shtml
Yahoo a sorti en février 2005 Y!Q (voir page 52).
Yahoo!Mindset (beta) (http://mindset.research.yahoo.com) permet de moduler les
résultats en fonction de la finalité de recherche de l'utilisateur (plus orienté "shopping" ou
"recherche d'information") grâce à un simple curseur à faire varier.
WISENUT www.wisenut.com
Wisenut apparaît comme un challenger de Google en calculant la pertinence à partir des
"backlinks" (analyse du texte des liens, des termes qui entourent ces liens et du contenu des
pages contenant ces liens) et à partir de l'analyse du texte de la page. Racheté en 2003 par
Looksmart
Autre fonction le rapprochant de Google : "Sneak a peek" pour voir une "archive" de la
page, mais sans quitter la page de résultats
Le moteur effectue une catégorisation automatique des résultats de la recherche dans des
dossiers ("wiseguides") via des liens sémantiques avec les mots de la requête. On peut ouvrir
la catégorie ou relancer une nouvelle recherche en utilisant la catégorie comme requête.
Le moteur groupe les résultats par site et liste le nombre exact de pages d'un site définies
comme pertinentes.
3. LES META-MOTEURS SUR LE WEB
a. PRÉSENTATION
Les méta-moteurs (parfois appelés méta-chercheurs) interrogent simultanément plusieurs moteurs
de recherche et/ou répertoires et compilent les résultats avant de les présenter (élimination des
doublons, parfois nouveau tri de pertinence). Ils ne maintiennent donc pas eux-mêmes de base de
données, et se contentent de transmettre la requête aux outils utilisés.
Avantages : ils sont efficaces et rapides pour une recherche du type "Question-Réponse" ou une
recherche précise. Ils permettent par ailleurs de se faire rapidement une idée du "répondant" des
moteurs à partir d'un ou deux termes de recherche ou citations exactes. Ils innovent beaucoup
actuellement. A ne pas confondre avec les méta-moteurs clients ("off-line") du type Copernic.
Les méta-moteurs "on-line" commencent pour certains d'entre eux à proposer un accès au Web
invisible (Profusion, Search.com).
Inconvénients : Ils ne traduisent pas toujours les langages d'interrogations. Les recherches
complexes génèrent beaucoup de bruit avec les méta-moteurs. Par ailleurs, ils ne sélectionnent
souvent que les dix premières réponses fournies par les différents moteurs qu'ils mettent en œuvre.
Pour être réellement efficaces, les utilisateurs des méta-moteurs devraient les paramétrer et dépasser
la première page de résultats.
Avec la vague des liens payants, l'"indépendance" des méta-moteurs risque d'être sérieusement
remise en cause, d'autant qu'il est souvent plus difficile de reconnaître ces liens dans leurs résultats
que dans les outils d'origine. D'après une étude de mai 2001 de SearchEngineWatch
(http://searchenginewatch.com/sereport/01/05-metasearch.html)
pour certains outils de ce type, la moitié des résultats s'avéraient être payés. Voici les pourcentages
de liens payés dans la source pour les méta-moteurs choisis pour l'étude Dogpile 60 %, Meta-
Crawler 36 %, Search.com 33 %, Ixquick 25 %, ProFusion 14 %, Vivisimo 0 %
Critères de choix des méta-moteurs : Outils et sources interrogeables, options de paramétrage, tri
et présentation des résultats.
Une recherche de niveau universitaire dans Internet s’avère une démarche complexe. Taper
quelques mots dans un moteur de recherche et se fier aux premiers résultats ne garantit pas que
l’information trouvée est de qualité. Les moteurs sélectionnent et classent les sites selon des critères
qui n’ont que peu à voir avec l’esprit critique : la pertinence des résultats de ces recherches est toute
relative. En d’autres termes, la facilité d’accès à une information dans Internet ne garantit pas sa
fiabilité, ce qui s’explique par l’absence d’autorité universellement reconnue sur la toile.
5Nous avons vu au chapitre précédent que les articles scientifiques faisaient l’objet d’une évaluation
par les pairs afin d’attester leur qualité et leur sérieux. Or, la grande majorité de l’information dans
Internet n’est pas évaluée : un texte prétendant démontrer l’existence de la pierre philosophale figure
dans le Web sur un pied d’égalité avec un rapport de recherche du ministère des Ressources
naturelles. Les outils de recherche n’appliquent aucun critère qualitatif dans leurs recherches et ils
accordent même une priorité à des sites avec lesquels des ententes commerciales ont été convenues.
La diffusion de l’information par Internet, sauf exception, ne reçoit donc l’aval d’aucune autorité
qui puisse attester sa valeur et sa rigueur scientifiques. Dans un tel contexte, il importe non pas de
renoncer à chercher sa documentation dans Internet, mais plutôt de le faire avec vigilance et de
chercher avant tout les canaux menant à une information de qualité.
8Il existe plusieurs façons de trouver ce qu’on cherche dans Internet, chaque outil pouvant donner
des résultats plus ou moins précis. Si les moteurs de recherche passent pour la porte d’entrée
privilégiée du Web, une connaissance plus approfondie des ressources Internet dans un domaine du
savoir favorisera le recours à des répertoires ou à des portails spécialisés. L’information recherchée,
et généralement sûre, se concentre davantage dans ces derniers.
9La meilleure façon d’obtenir de bons résultats au moyen des outils de recherche demeure le recours
à plus d’un outil.
Intersection ET AND
Union OU OR
Exclusion SAUF NOT
ET
Sert à combiner divers mots-clés de façon à ce qu'ils correspondent simultanément à l'objet de la
recherche.
OU
Sert à combiner divers mots-clés de façon à ce qu'au moins l'un d'eux se retrouve dans l'objet de la
recherche.
SAUF
Sert à éliminer un concept non pertinent à l'objet de la recherche.
ADJ
L'opérateur d'adjacence implique que les mots doivent se retrouver les uns à côté des autres.
Les banques de données traditionnelles utilisent l'abréviation ADJ.
Mais les symboles employés pour désigner cet opérateur varient d'un outil de recherche à l'autre.
d. LA TRONCATURE
Il peut arriver qu’un doute plane sur le genre (masculin/féminin) ou le nombre (singulier/pluriel)
des mots-clés à employer dans la recherche. Il est aussi possible que plusieurs termes ayant la même
racine soient pertinents dans la définition d’un sujet. Plutôt que de chercher à les inclure tous dans
une même requête à l’aide de l’opérateur OU, on peut utiliser la troncature. Cette fonction a pour
but de considérer comme un seul élément de la requête tous les termes qui ont en commun les mêmes
premières lettres ou de prendre en compte le féminin et le pluriel du terme. Ainsi, une recherche
utilisant le terme religieux gagnerait à inclure religieuse et religieuses, ce que permet la troncature.
29Par exemple, en criminologie, la notion de victime comprend, entre autres, les termes victime,
victimisation, victimologie. Pour effectuer une recherche qui englobe tous ces termes, il serait
fastidieux de demander (victime OU victimologie OU victimisation), suivi des autres termes de la
requête. La troncature permet d’étendre la recherche à tous les termes qui ont la même racine, y
compris ceux auxquels on n’aurait pas pensé. Il suffit d’entrer la racine ou la partie de mot désirée
suivie d’un symbole qui signale la troncature (*, !, #, $, ?, etc., selon le catalogue). Le catalogue
cherchera tous les termes qui commencent par ce qui précède ce symbole (ici, l’astérisque). Ainsi,
victim* renverra à toutes les vedettes-matière comprenant un mot commençant par ces lettres,
féminin et pluriel inclus. La troncature n’est pas recommandée pour étendre une recherche et obtenir
un plus grand nombre de notices autour d’un sujet imprécis ; elle permet plutôt de repérer des notices
comprenant des termes apparentés et utiles à la recherche. Attention : il faut s’assurer que la
troncature permette une recherche assez précise, car, si l’astérisque est placé trop tôt, la recherche
risque de donner plusieurs termes sans aucun rapport avec le sujet. Par exemple, en littérature, une
recherche sur le romantisme gagnera à tenir compte du terme romantique, ce qui se traduira par la
requête romant* ; si on demande roman*, la recherche inclura roman, romance, romanisation,
romane, romanichel, etc. en plus des féminins et des pluriels de ces termes.
e. LA RECHERCHE AVANCEE AVEC GOOGLE
Google propose des fonctions de Recherche avancée. Elles permettent, par exemple, de
Le format de fichier :
Par défaut la recherche est étendue à tous les types de fichiers. Vous pouvez toutefois
réduire votre recherche en indiquant le format des documents désirés en ajoutant
l'opérateur filetype:.
Google autorise la recherche à l'intérieur des formats PDF, PS, DWF, KLM, KMZ,
XLS, PPT, DOC, RTF et SWF. Le format de tous ces fichiers est indexé dans l'option de
format de la page Recherche avancée :
Cette liste peut être étendue à d’autres types de fichiers en tapant directement l’extension désirée
dans la zone de recherche. Ainsi vous pouvez sans problème effectuer une recherche dans des
fichiers portant l’extension .txt, .wp (wordperfect), .dbf (dbase), .wk1, .wk2, .wk3, .wk4, .wk5 (lotus
123), .wki, .wku, (works), .mw (macwrite), .mdb (access), .wri (wordpad) ou d'autres formats de
fichiers sous réserve que ces fichiers contiennent des textes écrits « en clair » pour le moteur de
recherche. Cette procédure ne s’applique pas aux fichiers contenus dans les fichiers compressés
(.zip, .rar…).L’extension filetype peut aussi être utilisée pour les fichiers contenant des données non
textuelles :
Exemple : si vous cherchez à télécharger un certain type de fichier comme les fichiers
.dll, l’expression filetype:dll recherchera les pages contenant les mots clés tapés et
les liens affichés vont conduiront vers les fichiers possédant cette extension : cette
procédure est pratique pour télécharger par exemple des sons, des fonds d'écran ou
des fichiers système (dll, drivers…).
De la même manière, vous pouvez exclure un type de fichiers avec l’expression -filetype
Exemple : jconseil -filetype:pdf recherchera tous les fichiers contenant le
terme jconseil à l’exception des documents présentant l’extension pdf.
Le cache de Google :
Il est possible de demander une page précise depuis le cache enregistré chez Google.
Exemple cache:www.jconseil.net
La date :
Vous pouvez demander à mener votre recherche uniquement sur les pages des
dernières 24 heures, des 7 derniers jours… des 6 derniers mois ou des 365 derniers
jours.
La fourchette :
Vous pouvez effectuer une recherche en définissant une fourchette de valeurs
en tapant deux points consécutifs entre deux valeurs déterminées.
Exemple : lecteur mp3 100..150€.
L'emplacement dans la page :
Vous pouvez demander que les mots recherchés soient présents dans le titre, le
Lorsque l'option de traduction disponible sur la page des préférences est activée, Google traduit
automatiquement les résultats de la recherche, ici en français.
Depuis cette page, vous pouvez réaliser une recherche dans une langue étrangère autre que votre
langue d’origine et afficher les résultats soit en langue étrangère, soit en français par traduction
automatique.
Vous pouvez traduire la page d’un site depuis l’outil Page Web à traduire et passez de l’original à
la traduction et vice et versa, très utile pour vérifier la traduction :
Google a récemment ajouté de nouvelles langues dans son outil de traduction. Il est maintenant
capable d'assurer des traductions entre les langues suivantes : allemand, anglais, arabe, bulgare,
chinois, coréen, croate, danois, espagnol, finnois, français, grec, hindi, italien, japonais, néerlandais,
norvégien, polonais, portugais, roumain, tchèque, russe, suédois et tchèque. L’utilisateur peut ainsi
utiliser cet outil pour traduire n’importe quelle de ces langues vers une autre. L'option "Détecter la
langue" détermine automatiquement la langue du texte à traduire, la précision de la détection
automatique de la langue augmentant en fonction de la quantité de texte entrée.
Vous pouvez traduire de simple mot, traduire un extrait, ici par exemple du thèque au français, voire
même passer d’une page en français à une page en chinois simplifié :
related: et link:
L’expression link: recense les pages indexées par Google qui pointent vers l'URL d'un
site.
Exemple : link:http://www.jconseil.net
Les définitions :
L’expression define: permet de rechercher la définition d'un mot ou d'une
expression dans la langue de l'interface.
La recherche sécurisée
L'opérateur safesearch: facilite votre requête lorsque les termes recherchés
peuvent prêter à confusion en filtrant les sites présentant un contenu à caractère
sexuel et en les excluant des résultats de votre recherche :
Google dispose d'une calculette et d'un convertisseur : en tapant une opération dans la
barre de recherche, Google affichera le résultat correspondant à l’opération. Vous
trouverez sur cette page une liste des fonctions mathématiques disponibles. Le
convertisseur fonctionne de façon très simple : la syntaxe est [nombre] unité en [unité],
remplacez "en" par "in" pour une page anglophone :
Vous souhaitez ouvrir des ports pour un modem/routeur afin d’utiliser le logiciel
emule. Des tutoriaux ou tutoriels abondent vraisemblablement sur ce sujet ! Que taper ? ouvrir ports
emule et la marque et le modèle du modem ou du routeur. Inutile de taper modem si vous donnez le
modèle du modem. Port ou ports ? Utilisez OR... Exemple : ouvrir ports OR port emule LiveBox
Vous connaissez les fonctions du logiciel ? Indiquez les : convertir mp3 freeware, ou [le nom d'un
programme commercial] equivalent freeware… L’accent n’a pas été tapé : equivalent sera traité
comme équivalent, utile pour étendre votre recherche aux sites anglais !
+Go.
intitle:"index of" "last modified" mp3. Ici les fichiers avec les extensions « .htm » et « .html » sont
écartés. L’option intitle permet de mener la recherche dans le titre du document. Nous recherchons
“index of” dans le titre du document et “last modified”, expressions souvent utilisées dans les
répertoires de musiques à télécharger, ainsi que le terme mp3.
B. PRESENTATION DE LA WEBOGRAPHIE
Au fur et à mesure des recherches, il est recommandé de mettre en place une veille
informationnelle automatisée. Elle permettra d'être alerté des nouvelles publications dans un
domaine particulier sans avoir à relancer manuellement la recherche sur chaque source. L'utilisateur
reçoit des messages provenant des divers outils sur lesquels il a paramétré sa veille. Selon le cas,
ces messages sont reçus dans son courriel, le compte d'un agrégateur de son choix, sa page Web
personnalisée, etc. (Univ Avignon, 2017)
Il faut respecter rigoureusement les normes apprises en G1 pour ce qui concerne les références
bibliographiques dans le corps du texte ou la bibliographie à la fin de l’ouvrage. Nous rappelons ces
normes. On écrit en lettre capitales le nom de famille de l’auteur et on abrège son prénom, c’est-à-
dire son nom de baptême. Il ne faut jamais prendre le prénom, qui est le nom de baptême, pour le
nom d’un auteur. On commence toujours, dans les notes infrapaginales, par le nom de famille de
l’auteur et jamais par son prénom abrégé. Cela facilite l’ordre alphabétique dans la bibliographie
générale à la fin de l’ouvrage, quand on la génère automatiquement. Ces éléments sont toujours en
italique : Ibidem, op. cit., art. cit., le titre d’un ouvrage et le titre d’une revue. Par contre on met
entre guillemets et on ne met pas en italique le titre d’un article de revue et le titre d’une contribution
dans un ouvrage collectif. On met aussi entre guillemets le nom de la collection. Pour les sciences
appliquées, on cite les auteurs dans le corps du texte en mettant entre parenthèses et en minuscule
le nom de l’auteur suivi d’une virgule et de l’année de parution de son écrit. Dans ce même cas,
dans la bibliographie générale, on met l’année immédiatement après le nom et le prénom de l’auteur.
Pour les disciplines à caractère littéraire, dans le corps du texte, on cite les auteurs en notes
infrapaginales et dans les références en bas de page ou dans la bibliographie générale à la fin du
travail on respecte la succession suivante en séparant tout par des virgules : nom, prénom, titre,
collection, édition, lieu, année, page(s) ou, selon les institutions, nom, prénom, titre, lieu, édition,
année et page(s).
Pour la webographie, il est recommandé d’écrire l’URL complet des sites visités. URL
signifie Uniform Resource Locator. Il se structure comme suit, selon cet exemple :
http://www.bibl.ulaval.ca/vitrine/giri/index.htm
WEBOGRAPHIE
« Arbradoc | Bibliothèque Universitaire Paris 8 » [En ligne : http://arbradoc.bu.univ-paris8.fr/#].
Consulté le19 juin 2013.
CATHERINE PASSERIEUX, Lucie Verreault, « InfoSphère - Sciences humaines », [En ligne :
http://www.bibliotheques.uqam.ca/InfoSphere/sciences_humaines/index.html]. Consulté le 30 mai
2013.
« Cerise guide de formation a la maitrise de l’information, méthodologie documentaire, information
literacy tutorial » [En ligne : http://urfist.enc.sorbonne.fr/anciensite/cerise/index.htm]. Consulté
le19 juin 2013.
DANDANHUANGHUANG, « La recherche documentaire », [En ligne :
http://www.docstoc.com/docs/95055956/La-recherchedocumentaire]. Consulté le19 juin 2013.
INSTITUT NATIONAL DES SCIENCES APPLIQUÉES DE LYON, « SAPRISTI », [En ligne :
http://sapristi-docinsa.insalyon.fr/]. Consulté le19 juin 2013.
Pour aller plus loin, nous vous proposons une sélection de sites généralistes de formation ou
auto-formation à la recherche documentaire.
URFIST DE PARIS. CERISE : Conseils aux Etudiants pour une Recherche d'Information
Spécialisée Efficace [en ligne].
URFIST DE PARIS, 1999. Maj 2007. Disponible sur : <http://www.ext.upmc.fr/urfist/cerise/>.
(consulté le 25/04/08).
ENSSIB. FORMIST : FORMation à l'Information Scientifique et Technique [en ligne]. Disponible
sur: <http://formist.enssib.fr>. (consulté le 25/04/08).
BNF. Le Guide de recherche en bibliothèque [en ligne]. BNF, 2005. Disponible sur :
<http://grebib.bnf.fr/>. (consulté le 25/04/08).
Service des bibliothèques de l'UQAM. InfoSphère [en ligne]. Service des bibliothèques de l'UQAM,
2006. Maj 2007.
Disponible sur : < http://www.bibliotheques.uqam.ca/InfoSphere//index.html>. (consulté le
25/04/08).
PIQUEMAL, Laurent. PARME : Pour Acquérir Rapidement une Méthode de recherche Efficace
[en ligne]. Université Sophia-Antipolis.
Disponible sur : <http://www.unice.fr/BU/parme/>. (consulté le 25/04/08).
SCD de l'Université de Haute-Bretagne. Portail documentaire SCD Université Rennes 2 [en ligne].
Université de Haute-Bretagne.
Disponible sur : <https://scdportail.uhb.fr> (consulté le 25/04/08).
Université du Québec. Programmme de développement des compétences informationnelles [en
ligne]. Université du Québec, 2006. Maj 2008.
Disponible sur : <http://pdci.uquebec.ca> (consulté le 25/04/08).
ENSSIB. REPERE : Ressources électroniques pour les étudiants la recherche et l'enseignement [en
ligne]. ENSSIB.
Disponible sur : <http://repere.enssib.fr/frontoffice/index.asp> (consulté le 25/04/08). URFIST de
Bretagne