documentaire documentaire Un guide pour la documentation scientifique Marie-Agns Gheeraert et Bernard Billoud Universit Pierre et Marie Curie http://webdoc.snv.jussieu.fr Devant la masse documentaire disponible en bibliothque ou sur l'Internet, il est important d'acqurir une mthode apportant l'efficacit dans la recherche de documents. Dcomposer les processus mis en uvre intuitivement au cours de nos recherches, les comprendre, les renforcer et les intgrer dans la mthode propose ici. 2 Quest Quest- -ce que se documenter ? ce que se documenter ? CONNAISSANCE ACQURIR concepts lire informations obtenir analyse synthtique interprtation construire ides } formulation organiser laborer tablir produire document FOURNIR Lorsqu'on dbute une rflexion sur un sujet, mme si l'on a quelques ides, on se documente pour en acqurir une meilleure connaissance. Nos lectures apportent concepts et informations. La construction d'une analyse synthtique et d'une interprtation gnre de nouvelles ides. laborer une nouvelle information et tablir de nouveaux concepts en organisant et formulant nos ides lors de la rdaction (taye et rfrence). On produit alors un nouveau document, qui fournit ainsi de nouvelles connaissances. Le lien entre la dmarche individuelle (partie infrieure du schma) et la socit (en haut) est le document (au centre). 3 Quest Quest- -ce que le document ? ce que le document ? Le document est le mode individuel daccession la connaissance le document est le mode collectif de diffusion de la connaissance Laspect physique du document nest pas le plus important. Pourtant : La reproduction (par limprimeur), la diffusion (par lditeur), la conservation (par le bibliothcaire) dun document confrent son contenu la proprit de sexporter dans lespace et dans le temps Cependant il existe d'autres faons d'acqurir des connaissances: suivre un enseignement, observer, exprimenter etc.. Le document se caractrise par la proprit du langage crit dune part, qui permet la communication en diffr entre deux individus non co-prsents, et d'autre part, lapport des technologies mises en uvre autour de la conservation et la diffusion, en sa qualit de mdia. 4 Les ressources documentaires Les ressources documentaires et les supports de linformation et les supports de linformation texte livres, magazines lecture linaire image photos, dessins observation planches affiches, tracts lecture synthtique son cassettes audio, CD coute, linaire vido cassettes vido, DVD coute et observation, linaire hypertexte Internet, CD lecture, non linaire par nuds, active hypermdia Internet lecture synthtique, active Le document, vhicule de l'information, se retrouve sous diffrents supports. 5 La recherche documentaire: La recherche documentaire: le thsaurus personnel le thsaurus personnel la mthode: dresser une liste de mots avec termes apparents caractrisant notre recherche. Ex: lopard ou panthre, chasse, carnivore, relation prdateur-proie la dmarche: se dfinir un thsaurus personnel laide dun dictionnaire ou dun thsaurus: permet de clarifier sa problmatique permet dapprocher le classement de la bibliothque permet une recherche documentaire plus efficace car mieux cible Dbutons notre recherche. Notre sujet concerne le comportement de chasse du lopard. Comment trouver et slectionner sa documentation ? Par o commencer ? 6 Les langages documentaires: Les langages documentaires: descripteurs et thsaurus descripteurs et thsaurus Un descripteur ou mot-cl (un mot ou une expression) est choisi pour reprsenter un concept. Cest un terme dit prfrentiel (ex: dure), par rapport un autre, dit non prfrentiel, comme un synonyme (ex : longueur est ambigu). Le thsaurus est une liste alphabtique de concepts (termes prfrentiels) et de renvois (termes non prfrentiels) couvrant un domaine particulier et prsentant trois types de relations smantiques: la relation d'quivalence, la relation hirarchique et la relation associative. Les professionnels de l'information, bibliothcaires et documentalistes, utilisent les langages documentaires, vocabulaire normalis et structur pour l'indexation. L'indexation ou analyse documentaire est la description structurale et smantique du document. le classement et le rangement des ouvrages dans la bibliothque est fonction de leur cote de classification, tablie partir de l'indexation. 7 Les langages documentaires: Les langages documentaires: extrait dun thsaurus extrait dun thsaurus pidmie VA anmie TS botulisme intoxication alimentaire intoxication TS maladie autoimmune TS helminthiase trmatodose maladie parasitaire TS MALADIE notre entre mortalit VA phnomne physiopathologique TG Un thsaurus tablit les relations de filiation entre les concepts reprsents par les termes: il peut donc prendre la forme d'un arbre gnalogique, comme dans cet exemple issu de la biologie mdicale. 8 Les langages documentaires: Les langages documentaires: la relation dquivalence dans un thsaurus la relation dquivalence dans un thsaurus un mme terme peut rfrer plusieurs concepts et un mme concept peut tre dsign par plusieurs termes. Les synonymes ( traduction directe par un descripteur) v variante orthographique (CLE = CLEF) v traduction trangres d'usage courant (LOGICIEL = SOFTWARE) v volution du langage (BIODIVERSITE = DIVERSITE BIOLOGIQUE) v synonymie smantique (VITAMINE C = ACIDE ASCORBIQUE) v synonymie d'usage (THIOCOL = THIOALCOOL) v jargon ou langage populaire (BREUVAGE = BOISSON). Les quasi synonymes (significations diffrentes mais notions voisines) v notions juges trop fines pour le thsaurus en question, renvoys sur un terme plus gnral v variantes d'un mme concept (FLUIDITE = VISCOSITE) v termes antonymes (STABILITE = INSTABILITE) 9 Les langages documentaires: Les langages documentaires: les relations hirarchiques dans un thsaurus les relations hirarchiques dans un thsaurus La relation hirarchique smantique exprime les rapports de gnralisation et de spcialisation entre notions chaque terme ou notion spcifique reprsente un cas particulier du terme gnrique et hrite des caractristiques de ce dernier. v TG : SCIENCES NATURELLES . TS : BOTANIQUE l'organisation peut tre soit monohirarchique soit polyhirarchique v TASTE BUDS : BT LINGUAL EPITHELIEUM ; BT SENSE ORGANS ; BT TASTE ; BT TONGUE la relation hirarchique partitive CORPS : TS TETE ; TS THORAX ; TS ABODOMEN la relation hirarchique d'instance REGIONS MONTAGNEUSES : TS ALPES 10 Les langages documentaires: Les langages documentaires: les relations dassociation dans un thsaurus les relations dassociation dans un thsaurus Un concept est associ un autre comme tant relatif au mme sujet, et pour en suggrer un autre aspect. discipline - sujet - objet - proprit - procd - application - processus - moyen - effet - mesure vnement - historique - personnalit : NUCLEAIRE - ENERGIE - URANIUM - RADIOACTIVITE - ENRICHISSEMENT - ELECTRICITE - REACTION EN CHAINE - REACTEUR - RADIATION - BECQUEREL - THCHERNOBYL - MARIE CURIE --- Related Term RT Terme Associ TA ou voir Aussi VA Associative > Narower Term NT Terme spcifique TS < Broader Term BT Terme gnrique TG Hirarchique == Use For UF Employ Pour EP --> Use US Employer EM Equivalence symboles Anglais Franais Relation Tableau des codes : 11 La recherche documentaire: La recherche documentaire: exemple de construction dun thsaurus exemple de construction dun thsaurus lopard flins carnivores panthre panthera pardus panthera felidae fissipeda mammalia nutrition chane alimentaire savane Afrique niche cologique classification biologie comportement cologie prdateur proie chasse fauve En s'aidant du dictionnaire ou d'un thsaurus: v1re tape: rechercher les descripteurs correspondant nos termes ; v2me tape: rechercher les termes gnriques et les termes spcifiques relatifs ces mots-cls, Remarque: pour "Panthera pardus", le lopard, la position systmatique de l'espce constitue un cas particulier mais incontournable de hirarchie smantique. Nous commencerons donc par le situer dans la classification des espces. v2me tape toujours: tablir les relations smantiques hirarchiques entre les descripteurs recenss (flches orientes) ; v3me tape: tablir les relations d'association entre les descripteurs (doubles flches). La liste de mots-cls pourra tre enrichie tout au long de la recherche documentaire, et mesure des dcouvertes. En dfinitive, il apparat que l'tude du comportement de chasse du lopard recouvre des notions issues de systmatique et de biologie, d'thologie et d'cologie. 12 Les langages documentaires: Les langages documentaires: dfinition du thsaurus dfinition du thsaurus Du point vue de de sa fonction, un thsaurus est un instrument de contrle de la terminologie utilis pour transposer en un langage plus strict (langage documentaire, langage d'information) le langage naturel employ dans les documents et par les indexeurs ou les utilisateurs. Du point de vue de sa structure, le thsaurus est un vocabulaire, contrl et dynamique, de termes ayant entre eux des relations smantiques et gnriques et qui s'applique un domaine particulier de la connaissance (Chaumier, 1988). 13 Les langages documentaires: Les langages documentaires: le catalogage le catalogage Le classement, le rangement et lindexation (cote) des ouvrages de la collection dune bibliothque se font partir des descripteurs (rsultat de lanalyse documentaire). On retrouve facilement cette classification par thmes dans le classement par rayonnage La description complte (et standardise) des ouvrages: les notices bibliographiques sont rpertories sur le catalogue le fichier manuel (rang en double par auteurs et par sujets) les bases de donnes bibliographiques 14 Les langages documentaires: Les langages documentaires: les notices bibliographiques les notices bibliographiques
Champ livres articles scientifiques priodiques Numro d'identification ISBN : International Standart Book Number ISSN pour Serial Number Auteur(s) Auteur(s) de l'ouvrage Auteur(s) de l'article Titre Titre de l'ouvrage Titre de l'article Titre de la revue Source Maison d'dition (et/ou srie, et/ou collection) Titre du journal de publication, numro (et volume ou tome) Socit d'dition (et/ou srie, et/ou collection) Anne Date de publication Date de publication Pages Nombre de pages Pages de dbut et de fin d'article
Cote et disponibilit Cote et situation dans la bibliothque Bibliothque et cote dans celle-ci Mots cls et/ou rsum sujets traits dans louvrage extraits de lanalyse documentaire lors de lindexation par les documentalistes
La description structurale du document, la notice bibliographique, comporte plusieurs rubriques (en principe toujours celles-ci) dont le numro didentification unique pour un livre (ISBN) ou un priodique (ISSN). Les rubriques de la fiche constituent diffrents les champs qui structurent la base de donnes bibliographique. Le contenu des notices diffre lgrement selon la nature de louvrage : livre, priodique ou article paru dans une revue. 15 La recherche documentaire: La recherche documentaire: O trouver les notices bibliographiques ? O trouver les notices bibliographiques ? ouvrages contenus dans la bibliothque catalogues sous format papier bases de donnes sur poste ou en ligne v Toutes les bibliothques universitaires (SUDOC) http://www.sudoc.abes.fr/, Bibliothque Centrale du Musum Nat. dHistoire Naturelle http://muscat.mnhn.fr/mnhnbib/, Mdiathque de la Cit des Sciences http://www.cite-sciences.fr/ rfrences bibliographiques d'articles scientifiques, bases de donnes sur poste ou en ligne v BIOSIS (biologie gnrale), Medline (biologie mdicale) http://www4.ncbi.nlm.nih.gov/PubMed/, PASCAL http://www.inist.fr/ la base de donnes Myriade contient le Catalogue Collectif National des Priodiques qui recense toutes les revues disponibles dans les bibliothques de France. Sur CDRom ou 36 17 CCN 16 Les langages documentaires: Les langages documentaires: les langages dinterrogation les langages dinterrogation requtes simples: interroger une notice laide dun descripteur par champ (ex: auteur: Darwin ; sujet: volution) requtes composes: laide de plusieurs descripteurs et doprateurs logiques oprateurs boolens: ET, OU, SAUF oprateurs de comparaison: =, <, > (ex: pour lanne) troncature: impose la recherche seulement sur une portion de mot (ex: volu* pour volution, volutif(ve), voluer...) phrase: permet dinterroger sur des expressions: (ex: slection naturelle) De nombreuses notices sont stockes dans les bases de donnes bibliographiques. On retrouvera les ouvrages intressant notre recherche en formulant des requtes pour interroger la base. 17 La recherche documentaire La recherche documentaire les principes de linterrogation les principes de linterrogation le principe des moteurs de recherche (Alta Vista): donne une liste de sites o a t repre la plus grande frquence dapparition de ce mot dans une collection de textes interrogation sur un langage naturel le principe des moteurs dindexation ou annuaires thmatiques (Yahoo!): donne une liste de sites rfrencs par des documentalistes sur ce sujet interrogation sur un langage documentaire les bases de donnes bibliographiques proposent les deux principes dinterrogation: langage documentaire: champs MOTS-CLES, SUJETS langage naturel: champs RSUME, TITRE on peut imposer le champ de recherche Les moteurs de recherche font appel des robots qui vont oprer une comparaison et rechercher la similitude entre le ou les mots (CQFD une chane de caractres) souhaits et une collection de textes (Alta Vista). Les moteurs dindexation renvoient la liste correspondant au terme dindexation de mme sens ou de sens voisin dans le thsaurus (Yahoo). 18 Exemple de recherche de documentation: Exemple de recherche de documentation: 1 1- - Alta Vista Alta Vista requte Rsultats sur 10 items : rs. pertinents Rsultats non pertinents leopard 3 365 1 1 chien, 1 cirque, 1 voyage, 1 prix, 1 vhicule, 1 militaire, 2 littrature), 1 divinit panthere 2 863 0 1 zoo, 1 cirque, 1 photos, 1 foot, 1 math, 1 M. Ayme, 1 champignon, 2 dco, 1 Afrique leopard OR panthere 8 602 0 2 p perso, 1 quipe, 1 tarzan, 1 dco, 1 blagues, 1 coloriages, 1 icnes, 1 Afrique, 1 ville felins ET afrique 225 1 1 tarzan, 1 safari, 1 antiraciste, 1 fourrures, 1 film, 1 art, 1 Afrique, 2 btiment panthera pardus 37 4 2 safari, 1 paleo, 1 panthere rose, 1 dcret, 1 zoo feli* ET panther* ET leopard 53 5 1 cirque, 1 comte, 1 quipe, 1 film, 1 vtrinaire
Nous recherchons de la documentation sur le comportement de chasse du Lopard. Nous effectuerons une premire recherche de documents sur lInternet laide dAlta Vista et une seconde sur la base de donnes bibliographique Zoological Record . Nous savons a priori que la documentation que nous trouverons partir des notices de Zoological Record sera scientifique et spcialise, tandis que la documentation Web sera plus gnrale et peut-tre moins sre. On considre alors sur le net comme rsultat pertinent un document traitant du mode de vie du lopard. Et, sur Zoological Record, on considre rsultat pertinent un document traitant du comportement de chasse du lopard. 19 Exemple de recherche de documentation: Exemple de recherche de documentation: 2 2- - Zoological Record Zoological Record requte Rsultats sur 10 items : rs. pertinents Rsultats non pertinents leopard 163 2 1 (maladie feline), 1 poisson, 2 reptile, 1 amphibien, 2 "leopard seals", 1 fourrure leopard OU panthere 591 Leopard ET felidae ET panthera 62 5 1 fourrure, 1 nourriture, 3 insmination articielle panthera pardus 84 panthera pardus ET behaviour 4 3 1
Nous allons ainsi tester lefficacit dune part de nos mots-cls, et dautre part lefficacit de les combiner laide doprateurs logiques. Il sagit galement dadapter note stratgie de recherche au type dinterrogation et au fonds documentaire. Lapparition de rsultats non-pertinents (bien que vraisemblable, ex: lopard des mers) est appel le bruit . A linverse, le silence qualifie la rponse pertinente non retrouve. Dans le premier cas, on affinera la recherche en utilisant des termes plus spcifiques ou des oprateurs restrictifs. Dans le second on largira le champ de recherche avec des termes plus gnraux. 20 Les langages documentaires Les langages documentaires Les apports Les apports La construction et lutilisation du thsaurus claircit les ides et la problmatique apporte une logique relationnelle entre les concepts considrs Selon les rsultats obtenus: la recherche sur le terme gnrique largit le champ de rsultats la recherche sur le terme spcifique ou sur une combinaison de termes prcise le champ de rsultats linterrogation sur le langage documentaire permet de diminuer le bruit et le silence et augmente la pertinence des rsultats bruit silence documents trouvs documents pertinents rsultat 21 Les langages documentaires Les langages documentaires Les limites Les limites compar au langage naturel: pose le problme de la rigidit du langage: il est peu volutif, lenrichissement en est retard car il existe un intermdiaire: le travail des documentalistes perte dinformation: v par la diminution de la variabilit du langage v par la perte des nuances de sens Ni les langages documentaires (thsaurus, notices...), ni les langages dinterrogation (troncature, boolens...) ne sont proposs de manire standard: il nexiste pas de vritable code universel ! => on doit chaque fois consulter le mode demploi. 22 La collecte et la prparation de linformation La collecte et la prparation de linformation collecter linformation: la slection des ouvrages constitue une pr-lecture on emploie diffrents niveaux de lecture: v lecture complte v lecture du rsum et/ou de la table des matires... condenser et prsenter linformation: lextraction des concepts, ides, et informations v rduction dun texte par sa synthse (condensation) v collecte de citations, dlments d'information, de donnes, dillustrations etc. 23 L organisation de linformation L organisation de linformation indexer et rfrencer linformation: indexer pour reprer et organiser sa documentation relever les rfrences afin de retrouver Suivant le modle AUTEUR. Date. Titre. Source. Rfrences bibliographiques classiques : v AUTEUR. Date. Titre. Source (dition ou version. Titre de priodique et/ou diteur. Collection. Numro normalis. Lieu de publication. Rfrences bibliographiques lectroniques : v AUTEUR. Date. Titre. [type de support (CDRom, disquette etc)]. diteur, lieu de publication. v AUTEUR. Date de mise jour ou de rvision (jj/mm/anne). Titre. diteur. Available online at http:// 24 Conclusion sur la recherche documentaire: Conclusion sur la recherche documentaire: une dmarche, une mthode, des outils une dmarche, une mthode, des outils inventaire inventaire slection slection analyse analyse Quel sujet trait ? laborer et enrichir son thsaurus personnel tout au long du travail saider dun dictionnaire ou dun thsaurus dj existant dans le domaine considr Quel type dinformation ? gnrale ? scientifique ? en bibliothque ou sur lInternet: ouvrages gnraux (livres, CD-ROM..) en bibliothque spcialise: publications scientifiques Quel type de ralisation ? narration monographie thorie, trait compte-rendu ou rapport expos etc. source de linformation: compulser, comparer, analyser la bibliographie interprter donnes, rsultats Tout au long de ce travail, nous avons suivi la mme dmarche et nous sommes poss ces mmes questions : Quest-ce quon a disposition? (inventaire) ; Quest-ce quon prend? (slection) ; Quest-ce quon en retire? (analyse). Rpondre ces trois questions nous aidera certainement pour rpondre in fine : Quest-ce quon cherche ? 25 Thsaurus et dictionnaires Thsaurus et dictionnaires Thsaurus MeSH Terms (Medline Subject Heading). http://www4.ncbi.nlm.nih.gov/PubMed/ Life Science Thesaurus http://www.csa.com/helpV3/lscthes.html Dictionnaires en biologie Terminology Collection: http://www.uwasa.fi/comm/termino/collect/special/biology.html 26 Rfrences Rfrences Chaumier, J. (1988). Le traitement linguistique de l'information. 3e d. mise jour et augmente. Paris: Entreprise Moderne d'dition. Filippi D. Comment prsenter des rfrences bibliographiques. Universit paris 8. http://www-bu.univ-paris8.fr/Formation/RefBiblio.html Gheereart M-A. (2000). Les thsaurus. UPMC. http://haydn.cicrp.jussieu.fr/documentation/thesaurus/ Gosselin, C. (1995). Linformation et le travail de recherche. ducatechnologiques. Vol 2, n 1. Universit Laval, Qubec, Canada. http://www.fse.ulaval.ca/fac/ten/reveduc/html/vol2/no1/educ_tdm.html MEDIADIX. Initiation la recherche documentaire sur lInternet et la rcupration de donnes. Universit Paris X. http://www.u-paris10.fr/mediadix/doc/inetrd/