Vous êtes sur la page 1sur 30

Notes de Cours

TECHNIQUES DE RECHERCHE DOCUMENTAIRE

UFR-MI - Licence 3 Maths-Info-Meca. 2021

Dr. AKEKE

1
I. Introduction.
Tout travail universitaire doit être documenté. L’étudiant va avoir
besoin de compléter ses cours par des recherches personnelles. Les
systèmes éducatifs actuels permettent d’affirmer que la recherche
documentaire est un élément essentiel des apprentissages. Il est
important de transmettre aux étudiants une méthodologie qui permet
d'identifier, récupérer et traiter des informations sur un sujet donné. Ces
notes de cours mettent l’accent sur les grands axes de la recherche
documentaire.

II. Définitions
II-1 La recherche documentaire (cf. Vocabulaire de la documentation,
AFNOR, 1987) : Action, méthodes et procédures ayant pour objet de
retrouver dans des fonds documentaires les références des documents
pertinents (répondant à une demande d’information) et les documents
eux-mêmes.
« Savoir se documenter, c'est savoir où et comment trouver l'information,
savoir poser les bonnes questions, savoir de quelles informations on a
besoin, savoir la lire, la comprendre, la critiquer, évaluer si elle répond à
ses besoins et savoir la gérer». Bernard Pochet; Méthodologie
documentaire: rechercher, consulter, rédiger à l'heure d'Internet
(2005).
II-2 Recherche de l’information (Définition Afnor) : Action, méthodes
et procédures ayant pour objet d’extraire d’un ensemble de documents
les informations voulues (d’après l’AFNOR, 1979). Dans un sens plus
large, toute opération (ou ensemble d’opérations) ayant pour objet la
recherche, la collecte et l’exploitation d’informations en réponse à une
question sur un sujet précis.

2
L’information est multiforme :
 L'information « orale » (médias audiovisuels notamment)
 L'information écrite :
(1) L’édition commerciale donc payante ou littérature blanche
(livres, revues, bases de données essentiellement)
(2) L’édition non commerciale ou littérature grise (thèses,
mémoires, rapports, articles en prépublication, actes de
congrès non publiés, etc)

Quelques termes documentaires courants

Base de données : En bibliothéconomie, le mot a un sens large, il


désigne un ensemble structuré de fichiers informatisés qui donne accès
à des informations dans une ou plusieurs disciplines. Le mot qualifie
d’une manière générique, à la fois les catalogues informatisés, les bases
de références bibliographiques d’articles issus de revues scientifiques,
les bases de texte intégral, les bibliothèques numériques, les
bibliographies commerciales… Les bases de données peuvent être
stockées sur des cédéroms ou être accessibles en ligne par Internet. En
informatique documentaire, une base de données est un ensemble de
données organisé en vue de son utilisation par des programmes
correspondant à des applications distinctes et de manière à faciliter
l’évolution indépendante des données et des programmes. Ces données
sont organisées de manière à être consultables par les utilisateurs. En
anglais : data base.
Bibliographie: Le mot bibliographie est étymologiquement lié au mot
grec « biblion », livre. Une bibliographie peut être une liste de
documents (monographies, articles de périodiques, thèses, rapports…)
sur un sujet donné et classés suivant un ordre précis. Pour les
3
documents différents des imprimés on utilise des mots spécifiques :
discographie, filmographie… La bibliographie désigne aussi l’action et
la discipline qui consiste à rechercher des documents et des
informations en se servant de répertoires bibliographiques. Employé
dans ce sens, le mot bibliographie est synonyme de recherche
documentaire.
Bibliographie analytique : bibliographie dans laquelle chaque notice
comporte un résumé du document décrit.
Bibliographie commerciale : Bibliographie publiée par les éditeurs et
qui recense les documents disponibles sur le marché du livre.
Bibliographie courante : bibliographie qui recense et décrit les
documents au fur et à mesure de leur publication, pour l’année en
cours.
Bibliographie critique : bibliographie signalétique dans laquelle
chaque notice comporte un commentaire sur la publication étudiée.
Biobibliographie : notice ou document renseignant sur la vie et
l’œuvre d’une personne et
Comportant l’ensemble complet des références dont cette personne et
l’auteur.
Biographie : notice ou document renseignant sur la vie et l’œuvre
d’une personne.
Index : dans un répertoire imprimé, le mot index désigne un
classement complémentaire qui comporte une liste de titres, auteurs,
sujets… que l’on peut retrouver en fin de répertoire et qui n’est rien
sans le classement principal qu’il complète car il n’indique qu’un
simple renvoi vers une page. Dans un répertoire électronique, un index
est une liste alphabétique ou alphanumérique de termes contenus dans
des champs de recherche : index titres, index auteurs, index sujets.

4
ISBN: International Standard Book Number : Numéro international
normalise attribué à chaque titre de livre ou à chaque édition d’un titre
de livre d’un éditeur donné. Chaque numéro ISBN est unique et ne
correspond qu’à un seul titre. Depuis le 1er janvier 2007, l’ISBN est
composé de 13 chiffres, répartis en 5 segments : le premier segment
permet d’identifier le produit (978 pour le « produit » livre), le
deuxième segment permet d’identifier le secteur géolinguistique (2
pour les « pays francophones »), le troisième segment permet
d’identifier l’éditeur, le quatrième permet d’identifier la publication, le
dernier segment est un chiffre de contrôle.
ISSN: International Standard Serial Number : Numéro international
normalisé attribué à chaque titre de périodique : numéro qui identifie au
plan international chaque titre-clé de publication en série dans le
système international des données sur les publications en série. Chaque
titre de périodique possède un ISSN qui lui est propre.
Monographie : ouvrage formant un tout, en un ou plusieurs volumes et
ayant une parution en une seule fois ou en plusieurs fois avec un plan
de publication établi à l’avance. Une monographie est un document qui
constitue une étude détaillée sur un sujet déterminé. En bibliothèque,
on utilise le terme de monographie pour désigner un livre.
Monographie en plusieurs volumes : monographie ayant un nombre
déterminé de volumes et dont la publication est envisagée comme un
tout. Les volumes portent quelquefois des titres particuliers en plus du
titre d’ensemble et peuvent avoir des mentions de responsabilité qui
leur sont propres.
Moteur de recherche : Sur Internet, un moteur de recherche est un
outil permettant de faire des recherches précises à partir du texte
intégral. (Google est l’exemple type du moteur de recherche, il permet,
à partir d’une seule barre de requête, de lancer une recherche).

5
Un moteur de recherche est composé de:

• un robot aussi appelé spider, un programme informatique dont le


travail est d’archiver. Le robot suit les liens hypertextes des sites web et
navigue ainsi de page en page.
• un moteur d'indexation : pour chaque page web trouvée par le
robot, le moteur d’indexation y associe les mots fréquemment utilisés
ainsi que les termes du titre ou d'autres parties significatives de cette
page. Ces pages sont ensuite enregistrées dans des bases de données.

• et un moteur d'interrogation : il est le lien entre l'internaute et la


base de données créée par le moteur d'indexation. Le moteur
d’interrogation fonctionne à partir de mots-clés.

Périodique : publication qui parait régulièrement sous le même titre.


On identifie un périodique par son titre clé et son ISSN. Dans le cas de
périodiques sans ISSN, l’identification se fait par le titre, la ville
d’édition et les dates de parution. Le terme adéquat pour désigner un
périodique est « publication en série », lui-même progressivement
remplacé par « ressource continue ».
La littérature « blanche »: documentation accessible, commercialisée,
largement diffusée (ex: les revues scientifiques, les livres, les banques
de données scientifiques…)
La littérature « grise » : documentation non commercialisée, diffusée
de manière restreinte (ex: actes de congrès, thèses, rapports….).
(Définition (AFNOR) : tout document dactylographié ou imprimé,
produit à l'intention d'un public restreint, en dehors des circuits
commerciaux de l'édition et de la diffusion et en marge des dispositifs
de contrôle bibliographiques.)
Editeur : En bibliothéconomie, personne ou organisme responsable
de la publication d’un document. En informatique documentaire,
programme qui permet à un appareil spécifique d’introduire des

6
données textuelles ou graphiques, ou d’en modifier la disposition En
anglais : editor.
Editeur scientifique : personne ou collectivité responsable du contenu
intellectuel de l’édition d’un document : édition critique d’un texte,
édition d’un ouvrage collectif.
Edition : ensemble des exemplaires d’une monographie imprimée à
partir d’une même composition typographique ou produits à partir d’un
même exemplaire servant de matrice et publié par un éditeur ou un
groupe d’éditeurs. Une édition peut comprendre plusieurs impressions
ou tirages dans lesquels il peut y avoir de légers changements,
notamment pour l’indication de la date et du prix. Le terme d’édition
désigne aussi la publication simultanée ou consécutive d’un ensemble
d’exemplaires présentant avec les premiers des différences notables
quant au contenu, à la langue, à l’impression, au support, au format…

IV- Méthodologie de la recherche


Les différentes étapes de la recherche d'information
On distingue 6 principales étapes :
1) Cerner le sujet
2) Chercher les documents
3) Sélectionner les documents
4) Extraire des informations
5) Traiter les informations
6) Produire le travail final

1 - Cerner le sujet

Face à la quantité d'informations qui seront mises à la disposition de


l’étudiant, seules quelques-unes (les plus pertinentes !) seront
essentielles pour son travail et pour les trouver il doit mettre en œuvre
une stratégie et des moyens.

7
 Il faut faire le bilan de ses connaissances personnelles sur le sujet.
Une analyse précise du sujet (de recherche) s’impose. Cette
analyse doit conduire à définir les principaux concepts liés au
sujet ainsi que les questions induites par le sujet, auxquelles la
recherche documentaire devra répondre. Dans bien de cas il faut
définir des limites de la recherche documentaire : dates, langues,
pays, etc.
Stratégie :
 Utiliser un ouvrage de référence (dictionnaire, encyclopédie,
manuels) et mobiliser ses connaissances autour du sujet pour le
définir, le clarifier, le cadrer le plus précisément possible.
 Déterminer des mots-clés (en anglais keyword) en utilisant des
méthodes de questionnement et de reclassement. Pour identifier
les bons mots clés, il faut utiliser des outils plus spécialisés
comme des thésaurus, des lexiques, des manuels et des articles de
synthèse sur le sujet.
Rappelons qu’un mot-clé est un mot ou groupe de mots choisis, soit
dans le titre, soit dans le texte d’un document, soit dans une requête de
recherche documentaire pour en caractériser le contenu. Les mots-clés
sont donc issus du langage naturel et ils sont dégagés par l’analyse.
Une liste de mots-clés permet ainsi de définir les thématiques
représentées dans un document »
(http://www.cndp.fr/savoirscdi/fileadmin/fichiers_auteurs/PDF_manuel
s/dicoduplessis.pdf)
Thésaurus.
Un thésaurus ou thésaurus de descripteurs, est un type de langage
documentaire qui consiste en une liste de termes sur un domaine de
connaissances, reliés entre eux par des relations synonymiques,
hiérarchiques et associatives. Le thésaurus constitue un vocabulaire
normalisé. C'est une sorte de dictionnaire hiérarchisé. Il permet
8
d’harmoniser « sous un même descripteur les différents termes qui
peuvent être employés pour décrire un même concept. » Il est surtout
utilisé dans les catalogues de bibliothèques. Notons que devant la
difficulté de mise en place, peu d’outils utilisent des thésaurus.

Les mots-clés retenus dans un thésaurus pourront être organisés d’un point de vue
hiérarchique. Ainsi, on trouve alors une « liste de termes classés verticalement
(arborescence) du concept le plus large au concept le plus étroit »
Quelques exemples
Aller sur le site suivant (exemple de thesaurus de Mathématiques) :
http://www.anmath.ulg.ac.be/thesaurus/
Utopies (http://catalogue.bnf.fr/ark:/12148/cb119337395/PUBLIC).
Dyslexie (http://www.hetop.eu/hetop/ - n=500&q=dyslexie).

Quelques outils linguistiques


Thesaurus Mesh http://www.nlm.nih.gov/mesh/meshhome.html
Thesaurus Mesh Bilingue INSERM
http://www.ist.inserm.fr/mesh/html/mesh.html
TermSciences http://www.termscience.fr
Dictionnaire interactif des sciences et techniques
http://www.sciences-en-ligne.com/page/acces.php

 Des ressources sont accessibles en ligne (via un abonnement) :


- Encyclopaedia Universalis
- http://www.universalis.fr/
- Dictionnaire Robert (langue française)
- Dictionnaire Robert et Collins anglais français/français-anglais

9
 On peut aussi trouver des dictionnaires gratuits répertoriés dans
des sites :
- http://www.dicorama.com/
- www.yourdictionary.com

On peut aussi citer l’encyclopédies gratuites Wikipédia


http://en.wikipedia.org/wiki/Main
Page Wikipedia (France)
http://fr.wikipedia.org/wiki/Accueil
Wikipedia est un projet collaboratif gratuit, passionnant mais en
constante évolution, tout le monde peut modifier un article (à condition
d’être utilisateur enregistré), vous pouvez d’ailleurs voir les
modifications (dans l’onglet « historique » d’un article).
 Attention à la validité des informations pour un niveau
universitaire, voir les avertissements dans le site
 Et les débats sur l’évaluation de l’information (débats déjà
anciens).

Il existe plusieurs approches de questionnement du sujet. Nous


mettons l’accent sur deux approches.
- L’approche lexical ou le brainstorming (remue-meninges) : il
s’agit, par un questionnement informel, de mobiliser ses idées, ses
connaissances et de lister en vrac, tous les mots, toutes les notions
qui vous viennent à l’esprit sur le sujet, sans vous censurer. On
n'exprime pas de critique, toutes les idées sont les bienvenues.
Exemple : les groupes : groupes abélien, éléments neutre, groupes
commutatif, noyau, anneaux corps, morphisme, associativité, sous-
groupes

10
On peut par la suite structurer les termes dans un tableau plus
thématique, avec des thèmes et des sous-thèmes.
- La méthode 3QOCP (ou système de Quintilien ou modèle de
Laswel) : on peut utiliser par ailleurs la méthode de
questionnement du sujet (Qui? Quoi? Quand? Où? Comment?
Pourquoi?) Il s'agit d'appliquer au thème la méthode du
questionnement journalistique face à un événement.

Préciser la question
Qui est concerné par le sujet ?
Qui ? Quels sont les acteurs les acteurs en jeu ?
Quoi ? De quoi s'agit ? Quelle définition donner de
ce sujet ? De quel problème s'agit?
Quand ? Depuis quand?
Quelle période est concernée / intéressante
pour mon sujet?
Où ? Où cela se passe-t-il?
Dans quel contexte géographique?
Comment ? De quelle manière les événements se
déroulent-ils?
Quels sont les moyens?
Pourquoi ? Pourquoi ce problème existe-il?
Quelles en sont les causes?
Pourquoi traiter ce sujet?

Le lecteur pourra s’informer sur cet autre outil de questionnement du


sujet: Carte mentale (schéma ou carte heuristique, mind map).
Concept crée par un psychologue anglais Tony Buzan .
À partir du résultat du (ou des) mode(s) de questionnement, il faut
choisir les mots-clés (élément distinctif permettant de préciser le sujet,
un mot porteur de sens, termes importants choisis pour définir le thème
de la recherche) et les idées principales qui vont orienter la recherche.

11
2 - Chercher les documents

Document : ensemble formé par un support et une information


généralement enregistrée sur le support de manière permanente, et tel
qu’il puisse être lu par l’homme ou la machine (définition de
l’Organisation Internationale de la Normalisation, ISO).
Notons que le support peut être de type imprimé (support physique),
numérique, électronique audiovisuel, etc.
Les types de documents sont :
i) Document primaire : document original n’ayant subi aucune
transformation. Les livres, les revues, les thèses, les articles de
périodiques, les manuscrits, les documents d’archives, les
disques, les enregistrements magnétiques ou numériques, les
gravures, les films, les vidéogrammes, les dessins, les photos,
les documents numérisés, … sont des documents primaires.
ii) Document secondaire : document issu d’un processus
documentaire : les index, les bibliographies, les catalogues,
résumés … sont des documents secondaires. Il contient des
données signalétiques ou analytiques sur des documents
primaires. Les documents secondaires visent à identifier, décrire
et rechercher les documents primaires
iii) Document tertiaire : document qui constitue un instrument de
traitement d’une publication primaire ou secondaire : un
thésaurus, une liste de vedettes – matière ou une bibliographie
de bibliographie sont des documents tertiaires (La notion de «
document tertiaire » n’est pas employée par tous les
bibliographes).

12
Pour la recherche des documents, il faut d’abord identifier les
lieux de ressources, sources et outils par rapport au sujet (centres
de documentation, bibliothèque etc.). Identifier les différents
types de documents disponibles : document papier,
électroniques (internet, cédéroms),….

Typologie des sources


Usuels : dictionnaire, encyclopédies. On commence généralement une
recherche par la consultation d’usuels qui permettent de faire le point
sur un sujet. Cela permet d’obtenir des mots-clés, des liens vers
d’autres thématiques, des bibliographies
CATALOGUE : ensemble de notices structurées, interrogeables par
divers index combinables entre eux, qui donnent le signalement de
documents (infos signalétiques et analytiques) ainsi que leurs
localisations dans une ou plusieurs bibliothèques (notion de catalogue
COMMUN).
Un catalogue de bibliothèque répertorie des documents « entiers ». On
y trouvera donc des titres de livres, des titres de périodiques, des titres
de congrès.

Un catalogue de bibliothèque NE DECRIT PAS une partie d’un


document. On n’y trouvera donc pas
- de titres d’articles
- de chapitres de livres
- une communication particulière à l’occasion d’un congrès.
Exemple :
SUDOC (système universitaire de documentation) un catalogue national des
bibliothèques universitaires et grands établissements documentaires
français. On y trouve toutes les thèses soutenues en France.

13
BASES DE DONNEES BIBLIOGRPHIQUES : généralement, ces
outils concernent plutôt des articles de périodiques et donnent des
informations bibliographiques avec un résumé. Ces outils permettent de
faire des repérages bibliographiques, mais ne donnent pas accès au
contenu des articles.
Exemple : web of science (WOS) (sur abonnement)
BASES DE DONNEES EN TEXTE INTEGRAL : en plus du
signalement bibliographique, l’accès au texte intégral est possible.
BOUQUETS DE PERIODIQUES : on parle de bouquet lorsqu’une
base de données donne accès à plusieurs titres de périodiques en texte
intégral
Les portails d'accès à la littérature scientifique intègrent plusieurs
sources différentes dans une même base de données. Ce sont
essentiellement des ressources en libre accès mais aussi des ressources
que les portails vont directement rechercher sur les sites des éditeurs ou
sur des sites officiels (universités, sites gouvernementaux, institutions
internationales...).
Notons que chaque publication est décrite par des « champs
documentaires »:le titre, les auteurs, la date de publication, la revue
dans laquelle la publication est parue, le type de publication, un
résumé , et très souvent des mots choisis par les indexeurs de la
banques de données pour désigner les concepts abordés dans la
publication ; ces mots sont des « descripteurs » listés dans un
« thesaurus ». En général, les banques de données bibliographiques en
tiennent compte.
 Une fois identifiées et sélectionnées les ressources pertinentes par
rapport à un besoin d'information, il convient de les interroger.
Retenons les supports électroniques suivants :

14
DISQUETTE, CEDEROM monoposte ou réseau, page web (fichier
html, pdf, ps, etc.)

Les ressources « papier » : la recherche dans les ressources papier


n'est pas aussi aisée que dans les ressources électroniques dotées de
moteurs de recherche, et qui permettent la navigation à l'intérieur de
sources. Pour gagner du temps, il est indispensable d'utiliser des outils
comme :
- les tables des matières des monographies ou les sommaires des
numéros de périodiques
- les index
- les tables annuelles de périodiques...
Il faut également avoir le réflexe de vérifier si certains ouvrages, ou a
fortiori périodiques, ont un équivalent électronique.
Autres supports : microfiche, supports audiovisuels.

Mode de recherche (catalogue ou base de données)


Un document dans un catalogue de bibliothèque ou un article dans une base
de données sont décrits dans une notice bibliographique (auteur, titre, sujet,
nombre de pages,…)

 « Recherche simple » (« basic search » en anglais) contre « Recherche


avancée » (« advanced search » en anglais) : la plupart des catalogues de
bibliothèques mais aussi de nombreuses bases de données interrogent leur
contenu par des critères de recherche. On peut ainsi chercher par auteur,
par titre ou par sujet... Tous ces choix ont trois buts. Permettre d’abord de
savoir quelle zone on interroge. Permettre ensuite de pouvoir combiner
plusieurs critères de recherche (obtenir ainsi des réponses plus précises).
Permettre enfin d’organiser une stratégie de recherche. Quand une
recherche « tous les mots » amène trop de résultats, on choisit plutôt de
chercher par critère « titre » Seuls les documents ayant ce mot dans leur
titre apparaîtront alors.
15
Votre recherche pourra être faite soit en recherche simple (un seul critère de
recherche) ou en recherche avancée (possibilité de croiser plusieurs critères de
recherche).

 Recherche « Tous les mots » ou « Toute la notice ». De plus en plus de


catalogues de bibliothèques proposent de rechercher par « tous les mots »
sous entendu de la notice bibliographique. Ce type de recherche (proche
d’une recherche de type moteur de recherche) permet d’avoir un premier
retour sur le contenu du catalogue mais il n’est pas précisé quel critère de la
notice a permis de renvoyer tel résultat.
ATTENTION, catalogues et bases de données signalent les références qu’ils indexent mais il ne
s’agit pas ici d’une recherche dans le texte intégral des documents.

Moteurs de recherche sur le web (généralistes ou


spécialisés)
Les logiciels de recherche de ces outils ne comprennent pas le langage
naturel humain, n’établissent aucune relation de sens, ne traitent que
des chaînes de caractères (ce sont des « machines »). Par conséquent,
ils ne pardonnent aucune inexactitude (erreur de frappe, d’orthographe,
etc). Cependant, ils font souvent des suggestions (par autocomplétion).
Exemples
 Google (moteur de recherche généraliste)
 Google Scholar (2004) : on y trouve de la littérature scientifique
gratuite : des articles (soit de revues en ligne gratuites, soit en pré-
print = avant publication), des thèses, rapports, etc.
 Scirus (par Elsevier) 16 000 titres de 4 000 éditeurs, en majorité
les domaines médecine, science et technique, SHS.
 CiteUlike (Springer): plus que 5,5 millions d’articles
 Highwire (par l’univ. de Stanford) plus que 1530 publications,
6,7 millions d’articles
 Ingenta Connect : sciences et techniques et biomédical, plus que
4,5 millions de documents

16
 Techxtra (Sci. Ingénieur, mathématiques, informatique) plus que
4 millions de documents
 Citeseer
 Scitopia (Maths, physique, sci. ingénieur) , plius que3,5 millions
de documents
 Scientific commons

Remarque
L'interrogation des ressources électroniques suppose d'obéir à quelques
principes simples, faute de quoi deux phénomènes sont susceptibles de
se produire :
1) le bruit : Il peut être défini comme l'ensemble des réponses non
pertinentes obtenues à l'occasion d'une recherche documentaire
(AFNOR 1987).
Le bruit survient notamment si l'on emploie des termes de
recherche sans les contextualiser. Ces termes pourront donc dans
ce cas de figure revêtir plusieurs significations.
2) le silence : Il peut être défini comme l’ensemble des documents
pertinents non affichés lors d’une recherche documentaire (AFNOR
1987).
Le silence est plus insidieux que le bruit car celui qui effectue une
recherche peut croire que la ressource interrogée n'offre pas le contenu
attendu.

Possibilités des moteurs de recherche sur internet

 Principes des moteurs de recherche (net recherche) Un moteur de


recherche est un outil automatique destiné à collecter un grand nombre de
pages. Il peut être interrogé par mots-clés. Tous les mots significatifs des
pages visitées par un moteur sont indexés et pourront devenir des sujets de
recherche. « Chaque page contenant les mots recherchés est considérée
comme une page pertinente ». Les premières générations de moteurs

17
considéraient simplement les mots comme des chaînes de caractère. A
présent, plusieurs aides existent :
Prise en compte des synonymes
Autocomplétion (vous commencez à saisir une question, le moteur vous
propose certaines associations. Pour « le rouge », il vous proposera ainsi « et le
noir » écrit par Stendhal.
Correction des fautes d’orthographes.
Les données récupérées par le moteur sont classées (ranking) selon des critères
liés aux mots clés (nombre de fois ou un mot clé apparaît dans une page, le mot
apparaît-il en gras, présence du mot dans le titre ou le premiers tiers de la page)
ou depuis quelques années à l’auteur. Malgré cela, on a souvent en utilisant ces
moteurs un sentiment de bruit documentaire (résultats non pertinents pour
l’utilisateur). Les moteurs mettent le plus souvent une seule « recherche simple
» à disposition de leurs utilisateurs.

Langage de commandes
Le langage de commandes est constitué de l'ensemble des commandes
à entrer dans un système documentaire (catalogue, bibliographie, base
de sommaires, moteur de recherche...) pour poser des questions,
visualiser et sélectionner des références.
Les systèmes documentaires proposent généralement deux à trois
modes d'interrogation. Le mode novice ou simple avec une seule zone
de saisie, un mode avancé qui affiche plusieurs zones de saisie et
plusieurs combinaisons et un mode expert où l'utilisateur doit rédiger
lui-même sa question documentaire, en utilisant toute la syntaxe du
langage.
La tendance générale est de proposer d'emblée le mode simple avec une
seule zone de saisie et la possibilité d'entrer quelques termes comme
pour les moteurs de recherche généralistes (Google ou Yahoo).
Les opérateurs booléens

18
Basés sur l'algèbre de Boole, ils permettent de combiner plusieurs
éléments de la recherche (termes ou questions) pour affiner ou élargir
une question.
Il y a trois opérateurs : le ET, le OU et le SAUF.
- Le ET (AND en anglais) représente une intersection.
Avec l'opérateur ET, « A ET B » les références affichées contiennent le
terme A et le terme B. Si un seul des deux termes est présent, la
référence est rejetée. Les références affichées appartiennent
obligatoirement aux deux ensembles. L'opérateur ET a pour effet de
réduire le nombre de réponses à une question. Il est utilisé pour préciser
une question.
Par exemple, pour chercher un document sur les groupes qui sont
cycliques, on utilisera l'équation : "groupes ET cycliques".
Dans la majorité des outils de recherche, l'opérateur ET est l'opérateur
par défaut, c'est-à-dire que l'espace entre deux termes est équivalent à
l'opérateur ET. Il est parfois remplacé par "+"
- L'opérateur OU a pour effet d'augmenter le nombre de réponses,
il additionne les résultats des différents ensembles. Il est utilisé
pour associer des synonymes dans une question documentaire.
Par exemple, pour chercher des documents sur le blé : "ble OU
triticale OU wheat".
Avec certains outils, les termes placés entre parenthèse sont considérés
comme étant reliés avec l'opérateur OU.
- Le SAUF (NOT ou AND NOT en anglais) représente une
exclusion.
Avec l'opérateur SAUF, (A sauf B) les références affichées
contiennent le terme A mais pas le terme B. Toutes les références de
l'ensemble A qui contiennent aussi le terme B sont éliminées.

19
L'opérateur SAUF a pour effet de réduire le nombre de réponses en
excluant des documents non désirés. Par exemple, pour chercher des
documents qui traitent des espaces topologiques: "espaces SAUF
vectoriels ".
L’opérateur SAUF est parfois remplacé par "-".
La troncature
La troncature est utilisée pour remplacer des lettres manquantes.
Elle est utilisée pour raccourcir la frappe, pour sélectionner plusieurs
termes ayant une racine commune ou pour rechercher à la fois le
singulier et le pluriel d'un mot.
On parle le plus souvent de troncature droite mais. Elle peut être
utilisée :
– à droite d'un mot
– à gauche d'un mot
– à l'intérieur d'un mot
Les caractères pour la représenter: * ? % +
Par exemple: transport * donnera transport, transports, transporteur,
etc.
Une racine opérationnelle (bien positionnée) ne donne que des
réponses attendues. Il faut éviter de tronquer des racines trop courtes.
Par exemple "ener*" :
 donnera : énergie, énergies, énergétique et énergivore ;
 mais donnera aussi : énergique, énervant, énergumène ou
énervation.

Les opérateurs arithmétiques : < / > / =


20
Ils permettent de combiner les recherches avec des dates. Ils sont donc
utilisés notamment pour spécifier des périodes, afin de délimiter la
recherche.
Autres outils
Notons que quand on travaille sur un texte intégral, les opérateurs
booléens ne suffisent plus car ils ne permettent pas de limiter le bruit.
Des moteurs de recherche proposent également d'autres outils qui
permettent d'être plus précis encore dans les recherches (ces opérateurs
syntaxiques varient d’une base de données à l’autre).
Les expressions exactes et les opérateurs de proximité
Si on cherche des documents sur les "groupes cycliques", on peut poser
la question : "groupes et cycliques". Les réponses contiendront des
documents sur les " groupes cycliques " mais aussi des documents sur
les " Crible cyclique pour des partitions non croisées généralisées
associées aux groupes de réflexion complexes "..., ce qui ne
correspond pas à la question posée.
Deux outils sont à notre disposition pour préciser la question : les
expressions exactes et les opérateurs de proximité.
L'expression exacte se traduit en langage documentaire par l'utilisation
des guillemets. On peut imposer un multi-terme en utilisant tout
simplement les guillemets, par exemple : "groupes cycliques". Cet
opérateur fonctionne avec quasiment tous les outils existants.
Les opérateurs de proximité permettent une recherche plus précise
dans un texte (titre, résumé...). Ils ne sont proposés que dans certaines
bibliographies, certaines bases de données.
Avec ces opérateurs, on peut demander que deux termes soient côte à
côte ou proches et même préciser, en nombre de mots, la distance entre
ces termes.

21
Il y a deux groupes de commandes : les commandes qui imposent un
ordre d'apparition des termes et celles qui ne tiennent pas compte de cet
ordre d'apparition. Les commandes que l'on peut rencontrer sont
"ADJ", "W", "WITHIN", "NEAR", "SAME" ou "N" suivie ou non d'un
nombre, "P" :
- la fréquence d’apparition d’un terme dans le texte
(AT LEAST 3 : il faut que le terme recherché apparaissent au moins
fois dans le document….)
- la présence des mots dans le même paragraphe :
Exemple : géométrie SAME topologie
- l’adjacence : les termes recherchés sont proches les uns des
autres.
Par exemple, pour imposer que 2 termes soient proches l’un de
l’autre
Exemple: pollution* P/3 eau*
(cf. Sudoc)
« pollution » est à 3 mots de distance (max) de « eau »
(espace* NEAR3 algébrique) ou (espace N/3 algébrique)
Ces opérateurs syntaxiques varient d’une base de données à l’autre. La
commande "W", dans certaines bases de données, impose l'ordre, dans
d'autres, ne l'impose pas. Il faut donc consulter l'aide en ligne si on veut
en tirer parti.
Les parenthèses
Traditionnellement, elles servent à séparer les éléments d'une question,
par exemple : "groupe* AND (symétrique OR permutation OR
bijection*)" qui est équivalent à : "(groupe * AND symétrique) OR
(groupe* AND permutation) OR (groupe* AND bijection *)".
Avec certains outils, les termes entre parenthèses sont considérés
comme liés avec l'opérateur "OU" et ceux à l'extérieur liés avec

22
l'opérateur "ET". Par exemple, la question documentaire ci-dessus se
traduit alors par : "groupe * (symétrique permutation bijection*)"
Il est conseillé de consulter l'aide en ligne pour voir comment les
commandes sont interprétées par le moteur de recherche utilisé.
L'historique
Avec l'historique, il est possible de voir toutes les questions posées, d'y
revenir et de les combiner entre elles.
Cette fonction n'est pas proposée sur tous les outils documentaires. Les
moteurs de recherche généralistes (comme Google ou Yahoo) et les
moteurs de recherche scientifiques ne conservent pas l'historique des
questions posées. Il faut modifier ou récrire la question posée pour
l'améliorer.

Autres outils
L’opérateur filetype: permet d’imposer le format de fichier contenant
des informations recherchées (attention aux 2 points !). Cet opérateur
effectue un tri et ne délivre que des résultats au format demandé.
Exemples
Somme de carré filetype:pdf
Somme de carré filetype:docx
De même l’opérateur ext: permet de préciser le type de fichier.
Quelques extensions de fichiers
.avi Abréviation de "Audio vidéo interleave". Fichier Vidéo pour Windows. Il peut comprendre des
clips vidéo, des animations et des sons.
.eps Fichiers au format Postscript (abréviation d’ "encapsuled Postscript").
.exe Fichier exécutable.
.gz Fichier comprimé WinZip
.jpg Format graphique défini par la Joint Photographers Expert Group pour la plate- forme DOS

23
(extension de trois lettres). Ce format permet de comprimer les informations graphiques.
.pdf Abréviation de "Printer Drive File". Format des documents réalisés au moyen du logiciel
Acrobat d’Adobe. Ce format permet entre autres de verrouiller toute opération de modification du
fichier et même son impression (entre autres pour des raisons d’authentification, de sécurité ou de
copyright
.pps Diaporama Powerpoint
.ppt Format des présentations réalisées au moyen du logiciel préao Powerpoint de Microsoft
.ps Abréviation de Postscript. Extension utilisée généralement pour désigner les fichiers d’impression
Postscript
.xls Format des fichiers du tableur Excel.
.zip Fichiers comprimés avec l’utilitaire Pkzip, Winzip, etc.

La classification décimale Dewey


Il s’agit ici de comprendre les grands principes de la classification
Dewey. On la retrouve dans la signalétique des bibliothèques. Elle
permet de trouver plus facilement les documents ; ouvrages et
périodiques sont classés selon les principes de classification Dewey.
Cette classification a été élaborée en 1876 par le bibliothécaire
américain Melvil Dewey et complétée par la classification décimale
universelle (CDU). Ce système est universellement reconnu et utilisé,
dans les CDI, les bibliothèques, les médiathèques... . On retrouve un
livre ou un périodique grâce à sa cote. Rappelons que la cote d’un
document est un ensemble de symboles (lettres, chiffres, signe), servant
à identifier, classer, ranger et localiser ce document dans un fond de
bibliothèque ou dans un fond ou une série d’archives. (vocab. Doc). La
cote est généralement formée d’un indice de classement, correspondant
au sujet principal du document et de trois lettres correspondant aux
trois premières lettres de l’auteur.
- Le principe de la classification est thématique. Elle a pour but de
regrouper ensemble sur un même rayonnage les ouvrages ou
périodique d’un domaine de connaissance ; par exemple les
mathématiques, l’histoire, la biologie, le droit etc.

24
- Le fonctionnement de la classification Dewey est décimal.
L’ensemble des connaissances est subdivisés en 10 grandes
classes ou catégories avec une couleur pour chaque classe.
Chaque classe est subdivisée en 10 domaines plus précis, eux-
mêmes subdivisés en 10 domaines encore plus précis, etc. Les dix
classes de la classification Dewey sont données dans le tableau ci-
dessous.

000 INFORMATIQUE, INFORMATION, Noir


OUVRAGES GENERAUX
100 PHILOSOPHIE PSYCHOLOGIE Gris
200 RELIGION Orange
300 SCIENCES SOCIALES Beige
400 LANGUES Jaune
500 SCIENCES Vert
600 TECHNOLOGIE Bleu
700 ARTS & LOISIRS Violet
800 LITTERATURE Marron
900 GEOGRAPHIE HISTOIRE Blanc

La subdivision de la catégorie sciences


500 Généralités sur les sciences de la nature et les mathématiques
510 Mathématiques
520 Astronomie et sciences connexes
530 Physiques
540 Chimie et sciences connexes
550 Sciences de la Terre
560 Paléontologie. Paléozoologie
570 Sciences de la vie. Biologie
580 Plantes. Botanique
590 Animaux. Zoologie Langage de commandes

Pour plus d’information consulter le site suivant :


http://www.oclc.org/dewey/resources.en.html

Observons par exemple cette liste ordonnée d'indices Dewey :


360 / 363 / 363.046 / 363.17 / 363.4
...et cette liste ordonnée de cotes :

25
360 ABE / 363 CUF / 363.046 BAL / 363.046 CAL / 363.17
FIL / 363.4 ABE
On note alors
 qu'un indice est constitué de chiffres uniquement
 qu'une cote est constituée d'un indice chiffré suivi
de lettres
Notons que, le classement des livres sur les rayonnages se
fait de gauche à droite et en ordre croissant, on tient
compte d'abord des indices puis des lettres.
635.06 BRU / 635.061 ABI / 635.5 BRU / 635.5 CAR / 640.3
ABI / 640.3 BU

3 - Sélectionner les documents

 Analyser les résultats de la requête en fonction de critères de


qualité :
- source de l’information
- fiabilité de l'information
- actualité de l'information
- objectivité de l'information
- domaine couvert
- niveau d'expertise et réputation de l'auteur
 Analyse rapide des contenus des documents et les sélectionner en
fonction de leur pertinence par rapport au sujet :
- Appliquer des techniques de lecture de repérage, d’exploration
rapide (titre, résumé, table des matières, bibliographie...)
- évaluation du niveau de l'information (document de vulgarisation,
rapport d'étude, thèse, article...), consulté internet !

26
- Conservation des documents pertinents, classement des
documents.
Retenons que les principaux critères de fiabilité des sources
électroniques :
- L'auteur, l'éditeur de la ressource
- La date de publication du document
- Le domaine de la ressource (adresse URL)
- L'objectif du site
- La notoriété, l'indice de popularité du site
- Le contenu de l'information
4 Extraire des informations
L’extraction des informations se fait à la suite de lectures accentuées
des documents pertinents obtenus, bien sûr, en se focalisant sur des
chapitres, des sections (relativement aux informations recherchées).
Prendre des notes à partir des documents
5) Traiter les informations
Il s’agit d’analyser les documents retenus et faire une synthèse.
6) Produire le travail final
Une fois les sources et l'information évaluées, le travail de restitution
peut commencer. Mais là encore, il convient de respecter certaines
règles, et notamment, lors de la rédaction, de citer ses sources et de
respecter le droit d'auteur.
Pourquoi citer ses sources ?
- pour prouver le caractère scientifique de ses démonstrations
- pour que les enseignants ou les membres du jury puissent vérifier
l’exactitude des propos de l'étudiant,
- pour valoriser son travail de recherche en l’enrichissant de références
validées

27
- parce que le plagiat peut être sanctionné durement
(source: Cours BU Saint-Charles - Aix-Marseille 1, SCD Université de
Provence)

Citer ses sources


Ne pas plagier : citer sa source dans le corps du texte en mettant
l’extrait entre guillemets, avec renvoi à la bibliographie finale du
travail.
Rédiger une bibliographie
(Liste des documents consultés pour traiter un sujet)
A chaque document correspond une référence. Les références sont
présentées par ordre alphabétique des noms d'auteurs.
Norme de présentation d’une référence (cas d’un livre)
NOM DE L'AUTEUR, Prénoms. Date de publication. Titre de
l'ouvrage : sous-titre. Collection « ... », No... Mention d'édition. Lieu
d'édition : Editeur, nombre de pages, Année.
ISBN facultatif.
Queques sites utiles
http://www.google.fr/
http://scholar.google.com/
Web of science (abonnement)
http://www.ams.org/mathscinet/
http://search.yahoo.com/
http://www.sciencedirect.com/science/browse/sub/mathematics

28
http://arxiv.org/archive/math
Hal (l’archive française toutes disciplines)
http://hal.archives-ouvertes.fr/
www.bibmath.net/
www.les-mathematiques.net/

Meta moteurs de recherche : Ils interrogent plusieurs moteurs


ou annuaires à la fois et dédoublonnent les résultats. Outils très inégaux
qui donnent beaucoup de résultats Ne peuvent faire de recherche
complexe : ils n’envoient qu’une requête à tous les moteurs et ceux-ci
ont des syntaxes différentes
Exemples de metamoteurs
 Ixquick interface en français (mais on ne sait pas quels moteurs
sont interrogés)

29
 Dogpile affiche sur une même page les meilleurs résultats de
Google, Yahoo, Bing en une liste unique et sans doublon
 Metacrawler (idem, résultats de Google, Yahoo, Bing)
 Mamma
 Yippy

30

Vous aimerez peut-être aussi