Vous êtes sur la page 1sur 17

Systmes documentaires

F. KOHLER

Systme documentaires

Pourquoi automatiser ?

Augmentation de la quantit d'information Limites floues des champs d'intrts Diminution du temps disponible pour rechercher INFORMATION RETRIEVAL Question nuance, dcision incertaine, accs logique (lent) DATA RETRIEVAL Question directe, dcision sre, accs physique (rapide)

Des Banques de rfrences l'information

Principes dun systme documentaire


La slection est automatise compltement Indexation et Requtes sont guides (au moins)
Document original Question LANGAGE

Indexation
Document index

Requte

Slection

Modalits d'utilisation :

Profil ("selective dissemination") : tre rgulirement tenu jour sur un sujet Interrogation ponctuelle (rtrospective) : faire le point sur un sujet

Question indexe

Systme documentaires et langage dindexation


UDC

: Universal decimal Classification

Un code dans un arbre Cr par l'internatinal bibliographic institute Avantage : Standardisation Inconvnients : Manipulation de grand chiffre (erreurs) Degr de prcision insuffisant Insertion d'un item difficile

107

Systme documentaires et langage dindexation


Full

text

Tout le texte est dcoup automatiquement en chane de caractres Avantage : couvre tout Inconvnient : non intelligent Trs utilis dans lindexation de lInternet par les moteurs de recherche

Systme documentaires et langage dindexations

Descripteurs : Mot-Cls

Non pas un code mais un mot du vocabulaire Avantages : standardisation facile manipuler bon degr de prcision facile si multidisciplinaires Inconvnient : utiliser ce mot l et lui seul (liste fige) Non pas un mot mais un langage organis : notion de synonymes, d'appartenance, de proximit... Avantages : idem descripteurs synonymes relations (hirarchie...) exemple : MeSH (medical subject heading)

Thsaurus

Mta-thsaurus + rseau smantique : UMLS (Unified Medical Langage System)

65 000 concepts, 200 000 termes uniques

Qualit d'un systme


Compltude : Description complte du domaine mdical Non ambigut : Les termes ne doivent fairerfrence qu' un seul concept. Non redondance : Chaque concept ne doit pouvoir tre exprim que d'une seule faon. Existence de synonymes : Ce sont des termes intermdiaire qui font rfrence un terme unique Existence de relation explicites : "est-un", "est cause de ", "associ ", "quivalent ", "est dans", "est avant"...

Critres de pertinence
Taux

de rappel : : (relevance) :

Documents pertinents retrouvs / Documents existants 100 - Tx de rappel Documents pertinents retrouvs / Documents retrouvs /

Silence

Prcision

Bruit

: 100 - Prcision

Evaluation d'un systme


Domaine

couvert Priode concerne Nature des documents analyss Frquence des mise jour Richesse des lments fournis Langage d'interrogation et disponibilit

Quelques exemples

Bases bibliographiques :

National Library of Medicine (Betesda)


MEDLINE (Medlars on line) CANCER LINE TOXILINE PASCAL Current contents BIOSIS CHEMABS

Centre National de la Recherche Scientifique

Institute for Scientific Information

Autres sources

Banques d'informations

Sur les mdicaments


BIAM THERIAQUE ADM PDQ

Sur la mdecine en gnral

Sur la cancrologie

Accs :

On LINE :

Rseau tlmatique de tous types : rseau priv, rseau publique (transpac), minitel, Internet... Nombreux serveurs : ESA, QUESTEL ... Livre : Index Medicus, Current contents CD : MEDLINE, PASCAL... Cot environ 10 000 Fr/an pour 4 CD /an. Interrogation gratuite si on possde le matriel et le CD. Bibliothque

Off LINE :

Possibilit la facult de mdecine :

SPI-EAO Facult de mdecine de Nancy

110

Interrogation on line

Principes :

Les bases de donnes bibliographiques

Trs nombreux prestataires (CNRS-INIST pour PASCAL, EDF pour EDF DOC, NLM pour MEDLINE, CANCERNET...) Accessible sur diffrents serveurs (QUESTEL, IRS...) Minitel ou terminal passif Micro-ordinateur - Modem - Rseau tlphonique - Rseau informatique Micro-ordinateur - Rseau informatique (transpac, Internet ...)

Connexion un serveur de base de donnes bibliographique par diffrents moyens :


En gnral accs payant => le plus souvent contrat gratuit (donne un login et un pwd) et interrogation payante avec un tarif dpendant du serveur (10 50 de l'heure pour PASCAL suivant le serveur auquel s'ajoute un tarif par rfrences bibliographiques imprimes. Langage d'interrogation documentaire spcifique du serveur. Trs puissant mais ncessite un apprentissage. Possibilits de download et de commande des articles

Information Retrieval Service


Service

documentaire gr par l'agence spatiale europenne


Plus de 150 "bases de donnes documentaires" en ligne dont pascal Couvre l'ensemble des domaines : mdecine, agriculture, conomie, informatique, banque,chimie,.... Pour chaque base de donnes : description du domaine couvert, du producteur, du contenu, des points d'accs, du cot....

Exemple : Fichier Pascal


SUBJECT COVERAGE Physics Chemistry Life Sciences (Biology, Medicine, Psychology) Applied Sciences and Technology Information Sciences and Documentation Energy Metallurgy Welding and Brazing Civil Engineering Building and PublicWorks Earth Sciences Biotechnology Zoology of Invertebrates Agricultural Sciences Tropical Medicine

Pascal
FILE CATEGORY Bibliographic file (reference file) FILE DESCRIPTION PASCAL is a multidisciplinary file covering the core of the world's scientific and technical literature. It is the online version of the print publication "Bibliographie Internationale." Languages: The titles in the PASCAL file are in their original language and are translated into French and/or English. The controlled terms are in French, English, and Spanish. German controlled terms are also provided in the area of metallurgy. Abstracts are in French or English (English especially from 1 990 on). FILE PRODUCER INIST (Institut de l'lnformation Scientifique et Technique) CNRS (Centre National de la Recherche Scientifique) 2, Alle du Parc de Brabois 54514 VANDOEUVRE-LES-NANCY Cedex France Tel.: 03 83 50 46 00 Fax: 03 83 50 46 50 SOURCES Sources include journal articles (about 92% of the file), theses (mainly French), conference proceedings, technical reports, books, and patents in biotechnology since 1984. The number of joumals scanned regularly is over 8500. Source materials are published in multiple languages: English 70%, French 10%, Russian 9%, Gemman 6%, other languages 5%. AVAILABILITY ON ESA-IRS Time Span .... 1984 to present File Size .... Approximately 4 700 000 references File Update .. Approximately 40 000 references monthly Search Language . . . ESA-QUEST, CCL or EasyQuest (menu-driven) Services ..... QUESTALERT available; QUESTORDER available

PDQ

Banque d'information sur le cancer Permet d'obtenir non seulement des rfrences mais directement les informations en particulier les protocoles thrapeutiques

Exemple :

This information is intended for use by doctors and other health care professionals. If you are a cancer patient, your doctor can explain how it applies to you, or you can call the Cancer Information Service at 1-800-422-6237. CancerNet also contains PDQ information for patients see the CancerNet Contents List for PDQ for more information. Adult Hodgkin's disease 208/00003 ** PROGNOSIS ** (A separate statement containing information on pregnancy and Hodgkin's disease is also available in PDQ.) More than 75% of all newly diagnosed patients with adult Hodgkin's disease are curable with modern radiation therapy and/or combination chemotherapy regimens. Since the selection of treatment is influenced by the stage, careful clinical and/or pathologic staging is essential. Treatment planning by a multidisciplinary team of cancer specialists is required to determine optimal treatment for patients with this disease. National mortality is falling more rapidly for adult Hodgkin's disease than for any other malignancy, largely due to excellent results achieved with modern radiation therapy and effective combination chemotherapy. For patients who have recurrent disease when...

UMLS
Dvelopp

par la NLM Etablit le lien conceptuel entre le besoin d'une information exprim par un utilisateur et diffrentes sources d'informations comme des base de donnes bibliographiques, des systmes de gestion de dossiers mdicaux ou des base de connaissances. Le mtathsaurus contient environ 65 000
SPI-EAO Facult de mdecine de Nancy
118