Académique Documents
Professionnel Documents
Culture Documents
et techniques
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 1
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 2 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 3
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
C’est un nouveau service orienté vers une catégorie précise d’utilisa- ou par les touches fonctions). Un exemple d’application est la récep-
teurs finals. Il abandonne certaines subtilités de la recherche textuelle tion automatique de documents de brevets par télécopie à partir du
plus adaptées aux spécialistes de l’information, et fournit un service numéro de brevet indiqué en audiotext.
complet dépassant les données brutes que constituaient les réfé-
rences bibliographiques. Ces développements et ces modifications
indiqueront si le mythique utilisateur final a pu être enfin atteint [4].
2. Les réseaux
1.6 Matériel d’utilisation
Le développement des réseaux de télétransmission et leur inter-
Les différents composants du matériel correspondent aux élé- connexion au niveau international ont été des facteurs essentiels à
ments complémentaires de la recherche : accès externe et traite- l’utilisation de la télématique (télétransmission et informatique),
ment local, différentes natures de l’information considérées comme permettant l’accès en ligne, à distance et à des coûts moindres que
éléments de recherche et comme résultats trouvés. le réseau téléphonique ordinaire.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 4 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Les éléments essentiels d’Internet sont les protocoles de commu- C’est une infrastructure à quatre niveaux :
nication, les systèmes d’adresses et l’exploitation du couple client- — opérateurs d’infrastructure : installation des supports physi-
serveur. ques de transmission ;
— sociétés de supports de services (network services) : location
■ Le Transmission Control Protocol/Internet Protocol (TCP/IP) est
des lignes physiques, organisation du maillage du réseau, attribu-
un ensemble de protocoles indépendants du réseau physique
tion des noms de domaines ;
support, gérant la transmission entre le demandeur et le destina-
taire, le routage des paquets et la connexion. — services à valeur ajoutée : machines pour le stockage et la
diffusion des données ;
■ Le système d’adressage compte deux adresses : — fournisseurs d’accès Internet (Internet Access Providers) : four-
nisseurs d’information en ligne. Des sociétés telles que Compu-
— l’adresse de l’utilisateur où l’espace est organisé en domaines
serve, Europe Online, Infonie connectent des ordinateurs auxquels
géographiques ou sectoriels : com(merce), edu(cation),
les utilisateurs vont accéder pour obtenir l’information.
gov(ernment) ;
— l’adresse physique, soit permanente pour les nœuds perma-
nents du réseau, soit attribuée par le fournisseur d’accès pour une 2.2.5 Les informations disponibles
session.
■ Enfin, l’exploitation du couple client-serveur permet un dialogue Au départ très orientés sur la communication, les services d’infor-
avec un protocole de haut niveau entre l’ordinateur serveur et l’ordi- mation accessibles par Internet couvrent maintenant les différentes
nateur client qui supporte la version cliente du logiciel serveur et en natures d’information avec la capacité essentielle d’édition électro-
exploite tous les services multimédia. Des groupes d’utilisateurs nique due à la structure HTML [6].
vont partager une même catégorie de logiciels pour s’orienter et
structurer les données dont le plus connu est maintenant le World ■ Services de communication :
Wide Web. — forums de discussion (News group). Des milliers de forums de
discussion sont disponibles sur toutes sortes de thèmes ou de
secteurs d’activité ;
2.2.2 La structuration des données — listes de diffusion. L’utilisateur sélectionne sa liste thématique
de discussion, envoie des notes et en reçoit dans sa boîte aux lettres
électronique ;
La structuration des données peut utiliser différents systèmes :
— lettres d’information. Ces lettres contiennent, dans un
Gopher, Wide Area Information System (WAIS), mais le plus
domaine, le calendrier des congrès, des appels à communication,
répandu est World Wide Web (WWW).
des résumés. Il existe près de 500 lettres d’information sur Internet.
Les trois éléments essentiels du Web sont le protocole d’identifi-
cation, le protocole réseau et le format des documents. ■ Publications et prépublications scientifiques : il existe près de
400 revues électroniques sur Internet permettant une diffusion
■ L’identification des documents est effectué par le protocole Uni- rapide des résultats de la recherche, avec éventuellement des
form Ressource Locator (URL), qui intègre l’adressage Internet. prépublications précédant toute forme de validation.
■ De même, le protocole réseau : http est le nom du protocole, basé ■ Ressources documentaires :
sur TCP/IP pour les ressources Web. — catalogues de bibliothèques. De nombreux catalogues français
et étrangers sont disponibles ;
■ Enfin, HyperText Markup Language (HTML) est le format central
— banques de données professionnelles. Les serveurs commer-
du Web supportant des liens de nature hypertexte. HTML permet
ciaux français et étrangers fournissent l’accès par Internet soit à
une édition directement électronique où les documents, destinés à
leurs services habituels avec les mêmes conditions d’accès (numéro
être lus sur écran, n’ont pas d’édition papier bien que celle-ci soit
de compte, mot de passe) et de tarifs (coût horaire, visualisation en
possible.
ligne, impression du différé, etc.), soit à de nouveaux services qui
utilisent d’autres méthodes tarifaires comme le forfait mensuel ou
annuel avec utilisation illimitée. Les nouvelles méthodes tarifaires
2.2.3 Les instances de régulation forfaitaires ou à l’acte vont se développer par rapport à la tarification
horaire qui a de moins en moins de signification à mesure que les
Bien qu’il n’existe pas de structure centralisée contrôlant le fonc- vitesses de transmission augmentent.
tionnement et le développement d’Internet, des instances de régu- Exemple : exemples de banques de données scientifiques et tech-
lation existent au niveau international et national. niques :
■ L’Internet Society (ISOC) est dirigée par un conseil d’adminis- — brevets américains, QPAT-US : http://www.qpat.com
tration. Des groupes de travail sont organisés par thème ou par zone — laboratoires de recherches français TELELAB : http//
géographique. L’Internet Engineering Task Force (IETF) est un www.mesr.fr
groupe chargé des propositions de standards soumises à l’Internet
Architecture Board. Le nombre de données scientifiques et techniques accessibles
par Internet augmente considérablement : données publiques
■ L’Internet Assigned Numbers Authority (IANA) définit les adres- françaises, européennes et étrangères, prépublications scientifi-
ses Internet. Leur gestion est ensuite assurée régionalement, RIPE ques, forums et actualités des sociétés savantes et associations à
(réseaux IP européens) pour l’Europe qui délègue ensuite au niveau but non lucratif, rapports d’activité des organismes publics et des
national, INRIA (Institut national de recherche en informatique et en sociétés commerciales.
automatique) pour la France.
■ Plusieurs fonctions limitent actuellement l’utilisation d’Internet :
■ Le Web consortium est une association créée à partir du MIT — la lenteur des accès et des transactions qui n’assure pas à l’uti-
(Massachusetts Institute of Technology) et de l’INRIA pour le déve- lisateur la réponse immédiate à laquelle s’engagent par contrat les
loppement des standards du Web. serveurs professionnels ;
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 5
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
— la confidentialité n’est pas assurée dans un réseau aux entrées 3.2 Serveurs français
et aux interconnexions multiples et changeantes ;
— la sécurisation de la facturation va nécessiter un contrat entre
le fournisseur et l’utilisateur qui supprime l’accès occasionnel sans Le principal serveur français de données scientifiques et techni-
forfait comme celui du kiosque télématique ; ques est la société Questel-Orbit du groupe France Télécom issue de
— la nécessaire protection contre les intrusions (Firewalls), étant l’acquisition en 1994 du serveur américain Orbit par Questel. Avec
donné le très grands nombre de surfeurs non identifiés. environ 250 banques de données dans l’ensemble des disciplines
mais plus particulièrement dans les domaines suivants : propriété
En fonction du problème posé, il faut considérer ces sources
industrielle (brevets, marques, dessins et modèles), chimie,
comme une complémentarité et non une concurrence de l’infor-
sciences et biomédical, information sur les sociétés et presse
mation professionnelle dont les caractéristiques sont contractuelle-
(tableau 2). C’est un serveur de niveau international qui affronte les
ment connues de l’utilisateur et l’utilisation payante mais rapide. Si
deux serveurs américains Knight Ridder Information (KRI) et Scien-
l’apport des sources Internet peut être original et son coût théorique
tific and Technical Information Network (STN).
faible, le temps passé peut être très important.
2.2.6 Les coûts d’utilisation Tableau 2 – Principaux serveurs français des banques
de données scientifiques et techniques
Se reporter au doc. R 120 en fin d’article.
Serveurs Secteurs d’activité
Questel-Orbit Propriété intellectuelle, chimie, sciences, techno-
3. Les serveurs logies, médecine, actualités, affaires, énergie et
sciences de la terre, ingénierie, sécurité et environ-
nement, matériaux, sciences humaines et sociales,
presse.
3.1 Fonction des serveurs CEDOCAR Armement, aéronautique, matériaux, métallurgie,
ingénierie, électronique, rapports de recherche.
Les organismes serveurs ont pour fonction de donner l’accès au ABES Catalogue d’ouvrages, catalogues de périodiques,
contenu de différentes banques de données à des utilisateurs exté- thèses, recherches en cours, littérature grise (docu-
rieurs. Cette fonction a son application dans divers services assurés ments, rapports non publiés commercialement)
complètement ou partiellement par le serveur en fonction de CEDOCAR : Centre de documentation de l’armement
chaque contrat producteur-serveur : ABES : Agence bibliographique de l’enseignement supérieur
— chargement et stockage des banques de données : le volume
toujours croissant des données et l’intégration des images utilisent
l’augmentation très rapide des capacités de traitement des
ordinateurs ; Le Centre de documentation de l’armement (CEDOCAR) donne
— maintenance du système et intégration des mises à jour : l’accès à ses propres données ainsi qu’à une dizaine de banques
l’intégration des nouvelles mises à jour à un volume existant très étrangères dans les domaines des techniques de l’ingénierie, de
important de données, la fréquence et le délai des mises à jour exi- l’aérospatiale et des matériaux.
gent une qualité de service qu’utilisateurs et producteurs souhaitent L’Agence bibliographique de l’enseignement supérieur (ABES) et
normaliser ; le Serveur universitaire national d’information scientifique et techni-
— homogénéisation des formats des différentes banques de que (SUNIST) donnent accès aux outils documentaires communs
données: c’est une nécessité pour une recherche efficace dans des des universités : catalogues des périodiques, des ouvrages et des
banques de données complémentaires pour l’utilisateur. Le produc- thèses, répertoires des laboratoires, etc.
teur assure cette cohérence pour ses propres banques, mais c’est au
D’autres banques de données universitaires numériques ou
serveur de le faire pour des banques de différentes origines dans un
factuelles sont accessibles directement aux centres de calcul univer-
secteur commun d’activité ;
sitaires, dans les laboratoires ou indirectement en service bureau
— création et mise à jour des index : c’est le facteur essentiel lorsque l’accès est uniquement local. Exemples de banques de
de la qualité de la recherche avec la complémentarité de zones données universitaires : Thermodata (Institut Polytechnique de Gre-
contrôlées multitermes (pertinence des résultats mais silence) et de noble), Ergodata (Université Paris V), Gaphyor (Université Paris
zones libres unitermes (taux de rappel important mais bruit) ; Sud).
— exploitation et accès aux données par un ou plusieurs
logiciels : les natures différentes d’information traitées par un même
serveur provoquent l’utilisation de plusieurs logiciels, par exemple
textuel et structural ; 3.3 Serveurs européens
— connexion avec les réseaux d’accès : choix des opérateurs des
réseaux internationaux, et, au niveau français, choix de la norme Après l’acquisition de Data Star (Suisse), banques de données
ASCII et/ou de la norme Vidéotex pour les différentes méthodes entreprises, sciences et techniques et biomédical, par Knight Ridder
d’accès ; Information, l’intégration du FIZ Karlsruhe, (Allemagne), banques de
— relations contractuelles avec les utilisateurs et les produc- données sciences et techniques dans STN et la diminution du
teurs, gestion et facturation des services : le serveur propose à l’uti- nombre de banques diffusées par Information Retrieval Service de
lisateur un contrat standard avec des tarifs issus de ses contrats l’Agence spatiale européenne, le panorama européen des serveurs
avec les différents producteurs. Des conditions d’utilisation spécifi- en sciences et techniques est assez restreint.
ques à certaines banques de données, par exemple, droit de repro-
duction des résultats des recherches, sont précisées en annexe du ■ Allemagne
contrat de l’utilisateur. Le serveur DIMDI donne accès à environ 80 banques de données
D’autres services sont répartis entre producteur et serveur : allemandes et internationales dans les domaines médical et biolo-
actions de promotion et de sensibilisation, formation des utilisa- gique : agriculture, biologie, santé, psychologie, médecine, nutri-
teurs. tion, pharmacie, toxicologie, etc.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 6 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Le serveur FIZ Technik donne accès à environ 80 banques de don- 3.5 Diffusion par plusieurs serveurs
nées allemandes et internationales dans les domaines technologi-
ques : automobile, normes, mécanique, chimie industrielle,
ingénierie, énergie, agroalimentaire, bâtiment, électronique, métal- Lors du développement, à la fin des années 1970, des serveurs
lurgie, emballage, textile, soudage, électrotechnique, etc. dans les différents pays européens, l’idée d’une forte organisation
Le serveur GENIOS donne accès à environ 100 banques de nationale complétée par une coordination au niveau européen avait
données en grande partie d’origine allemande dans les domaines de pour objectif d’éviter les multiples mises à disposition des données
l’industrie et des entreprises : transports, chimie, informatique, élec- identiques. En réalité, le manque d’une politique suivie, les initia-
tricité et électronique, alimentation, marketing, textile, conditions de tives privées souvent désordonnées et les concentrations horizon-
travail et répertoires d’entreprises. tales et verticales déjà mentionnées font qu’aujourd’hui, les mêmes
données scientifiques et techniques sont souvent disponibles sur un
■ Royaume-Uni grand nombre de serveurs (tableau 3). L’utilisateur doit profiter de
ces choix pour repérer les différences d’exploitation et s’assurer les
Le serveur BLAISE de la British Library donne accès à une ving- conditions de la recherche la plus efficace :
taine de banques de données, essentiellement des catalogues des — variation des données : dans des fichiers complexes, un
différents départements de la British Library : audiovisuels, mono- ensemble de données complémentaires, textes, nomenclature, clas-
graphies, conférences, documents anciens, périodiques, etc. sification, structures, etc., peut être intégré ou séparé ;
— variation de la date de début d’exploitation : c’est un aspect
■ Italie essentiel mais rapidement vérifiable qui varie fréquemment d’un
Le serveur Information Retrieval Service de l’Agence spatiale serveur à un autre ;
européenne (IRS-ESA) fut le pionnier européen de l’accès aux ban- — variation de la périodicité et des délais de mises à jour : si le
ques de données scientifiques et techniques. Un recentrage récent premier élément est toujours annoncé et facilement vérifiable, le
de son activité a limité son exploitation à une soixantaine de ban- second, très important dans un choix de serveur, n’est pas toujours
ques, en particulier dans les domaines suivants : aéronautique, détaillé en fonction des différentes sources d’information ;
chimie, électronique, défense, génie civil, environnement et maté- — variation des éléments de recherche : la question se pose
riaux. Des passerelles (gateway) permettent néanmoins d’atteindre moins maintenant entre différentes banques de données profes-
d’autres serveurs européens en se connectant à IRS-ESA. sionnelles, car la plupart des champs d’information sont des élé-
ments de recherche. Par contre, c’est souvent ce qui fait la
■ Luxembourg différence, pour les mêmes données, entre un accès professionnel
et un accès vidéotex ;
Le serveur ECHO de la Commission de l’Union européenne — variation des coûts d’utilisation : les coûts varient d’autant
propose l’accès, le plus souvent gratuit, à une trentaine de banques plus que les méthodes de tarification évoluent (coût horaire, coût
de données concernant des publications, des rapports et des aides à par session, par terme de recherche, etc.). Mais cette comparaison
la recherche dans le domaine de l’information et des télécommuni- n’a de sens que si les services sont réellement équivalents.
cations, ainsi que les programmes, projets et résultats des contrats
de recherche de l’Union européenne : Community Research and
Information Service (CORDIS).
3.6 Serveurs vidéotex
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 7
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 8 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 9
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
4.1.1 Métrologie
4.1.2 Chimie
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 10 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Affichage de la question
Lancement de la recherche
Figure 3 – Exemple d’utilisation d’une base de données employant un logiciel structural (Pharmsearch). La base Pharmsearch donne actuellement
accès à plus de 100 000 familles de brevets FR, EP, US, GB, DE et de demande WO. Représentant la plus large couverture de structures de Markush
disponible sur le marché, elle permet des recherches aussi bien structurales que bibliographiques.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 11
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
s
et plus de 70 titres de CD-ROM correspondent à environ
ue
nq
600 nouveaux disques par an ; soit au total pour les données en
ba
4 000 ligne et sur CD-ROM plus de 35 millions de références différentes.
de
e
br
Les États-Unis produisent près d’un tiers (31 %) des banques de
om
3 000
N
données en ligne et l’Europe plus de la moitié (58 %) correspondant
ducteurs principalement aux productions nationales (France, Royaume-Uni,
Année e pro
2 000
bre d Allemagne, etc.) et régionales : Office européen des brevets. Des
Nom
sociétés privées sont actives dans cette production : Derwent Infor-
1 000 eurs mation Limited au Royaume-Uni, IFI Plenum aux États-Unis.
de serv
Nombre
Ces banques de données sont essentiellement caractérisées par
0
1980 1984 1989 1994 une production de couverture nationale (67 % des banques), par une
périodicité rapide des mises à jour (la moitié des banques ont une
Figure 4 – Évolution du nombre de banques de données en ligne mise à jour quotidienne ou hebdomadaire), par des natures d’infor-
dans le monde mation bibliographiques et non bibliographiques : classification,
jurisprudence, texte intégral, structures chimiques, images, et par
une diffusion majoritairement américaine.
TITRE REGLEMENT RELATIF AUX INSTRUMENTS DE PESAGE A FONCTIONNEMENT NON
AUTOMATIQUE. Texte coordonnŽ : AR7509090:MB751218 - AR770218:MB770409
AR780809:MB780819 - AR830426:MB830607 - AR831216:MB831224
AR860120:MB860204 (+ERRATA MB760602) - AR890808:MB890905
4.1.4 Matériaux
30 kg 400
500 kg 750
2 t 1 500 4.2 Nature de l’information
5 t 2 000
10 t 4 000
20 t 6 000
40 t 8 000
La nature de l’information est aussi un élément de choix impor-
60 t 10 000
80 t et plus 12 000 + 100 par
tant en fonction du problème à résoudre et du type de réponse
tonne supplŽmentaire attendu : données pratiques d’aide à la décision, caractéristiques
d’une entreprise ou articles scientifiques récents. Ces différentes
Figure 5 – La banque de données « Réglementation belge natures sont souvent intégrées en particulier dans les nouveaux
de métrologie » : un exemple d’interrogation services orientés vers l’utilisateur final précédemment mentionnés.
Il est néanmoins possible de distinguer six natures de l’information :
données bibliographiques, répertoire, données factuelles (tex-
L’information est formalisée, car la rédaction et la présentation tuelles-numériques), données numériques, texte intégral et images.
des documents ainsi que la présentation des éléments bibliographi-
ques sont normalisées au niveau international.
L’information est centralisée car aux niveaux national, régional 4.2.1 Données bibliographiques
(Office européen des brevets, Organisation africaine de la propriété
intellectuelle, African Regional Industrial Property Organization) et
international (Organisation mondiale de la propriété intellectuelle),
La référence bibliographique (document secondaire) signale un
un seul organisme publie les documents de brevets.
document primaire (article de périodique, ouvrage, rapport, thèse,
L’information est ordonnée par la Classification internationale des etc.). La référence est éventuellement enrichie d’éléments
brevets (CIB) et par la Classification européenne (ECLA). d’indexation (descriptions, indices de classification), et d’analyse
Les caractéristiques des données brevets disponibles en ligne ou (résumé).
sur CD-ROM en font une information stratégique pour l’entreprise.
Les informations sont techniques (titre, abrégé, classifications, Ces banques de données issues de l’informatisation des bulletins
rapport de recherche et éventuellement texte intégral), administra- secondaires imprimés forment les premières banques de données
tives (noms et adresse des déposants, inventeurs et mandataires, scientifiques en ligne (PASCAL, Chemical Abstracts, BIOSIS, INS-
langues de publication, de dépôt et de procédure, date de requête PEC, Medline, etc.).
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 12 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Guide des banques de données Minitel BASES 300 FLA Consultants Fidis-Infotel Vidéotext
pour l’entreprise
ADBS : Association des spécialistes en information et documentation
KRI : Knight Ridder Information
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 13
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
Auteur
Nature de Affiliation
Producteur Pays d’origine
l’information
Type document
Bibliographique 50 % Recherche 40 % France 34 % Source
collective
Langue
English abstract
Factuelle 22 % Recherche 30 % États-Unis 34 %
publique
Répertoire 12 % Allemagne 10 %
Données 1996.
Code classement
Descripteur
Les champs d’information les plus caractéristiques d’une banque
de données bibliographiques sont les suivants :
— titre original et/ou traduit ;
— nom des auteurs ; Terme generique
— affiliation (et adresses) des auteurs ;
— nature du document signalé : article, ouvrage, thèse, etc. ; English descriptor
— référence bibliographique : titre du périodique, date de publi-
cation, volume, tome, page, nombre de références citées, résumé ;
— code de classement ;
— descripteurs issus d’un vocabulaire sémantiquement organisé English generic term
(thesaurus) ou d’une liste de termes.
Spanish descriptor
D’autres éléments peuvent figurer dans une banque de données
bibliographiques, en particulier si elle est multilingue. Spanish generic term
Une référence extraite de la base de données PASCAL précise ces
différents champs d’information (figure 6). Codes PACS
Localisation
Ces éléments représentent un tronc commun des données biblio-
graphiques signalant différents types de documents. Des données Figure 6 – Exemple de référence bibliographique obtenue après
complémentaires complètent ce premier niveau pour des docu- une recherche sur la base PASCAL
ments spécifiques :
— thèses : date de la soutenance, directeur de recherche, prési-
dent du jury, lieux de dépôt ; — URBAMET, dans le domaine de l’aménagement du territoire,
— actes de congrès : dates précises, lieu, organisateur scienti- fournit des références sur les instruments de mesure dans le trans-
fique, éditeur des actes ; port routier (figure 8).
— rapports de recherche : responsable scientifique, dates et
durée de la recherche, organisme financier, disponibilité et condi-
tions d’acquisition du document ; 4.2.2 Répertoire
— normes : origine administrative, filiation, apparentement,
statut juridique ;
Il s’agit d’informations non bibliographiques correspondant à des
— brevet : les natures techniques, administratives et légales du
listes d’organismes (entreprises, laboratoires de recherche), de
document de brevet correspondent à un grand nombre d’infor-
personnes, de recherches en cours, d’annonces de congrès, de
mations complémentaires, déposants, mandataires, priorité, rap-
banques de données, etc. Cela peut correspondre aussi aux listes de
port de recherche, dates et numéros d’enregistrement et de
termes (dictionnaire) ou aux indices de classification constituant
publication des différentes étapes de la vie du brevet.
une aide à la recherche en ligne.
La banque de données PASCAL, généraliste en sciences et techni-
ques, n’est pas la seule à couvrir les domaines de la métrologie et de Ces données fournissent une réponse précise à une demande de
l’automatisme. Parmi les réalisations françaises : renseignement ponctuel :
— IALINE, dans le domaine de l’industrie agroalimentaire, fournit — qui fabrique quoi?
928 références à partir du descripteur instrument de mesure durant — qui recherche quoi?
les neuf dernières années (figure 7) ; — quelle information disponible dans quel domaine?
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 14 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Exemples : de quelques banques de données répertoire : Dans le cas de la banque de données THERMODATA (propriétés
— entreprises : EURIDILE, BOTTIN DES ENTREPRISES, thermodynamiques des éléments, composés stœchiométriques,
EURODUN, HOPPENSTEDT, TELEFIRM ; phases polyconstituées de la chimie minérale sèche et, plus parti-
— personnes : Annuaire électronique, ADMINISTRATEURS, culièrement, métallurgique), des réponses à des problèmes de
ADMITEL ; complexité croissante peuvent être fournies à l’utilisateur (figure 9) :
— laboratoires de recherche : TELELAB ; — caractéristiques thermodynamiques d’un composé en fonction
— recherches en cours : AGREP, BIR/INSERM, FEDERAL de la température ;
RESEARCH IN PROGRESS ; — caractéristiques thermodynamiques d’une réaction en fonction
— annonces de congrès : EVENTLINE, MEETING AGENDA ; de la température ;
— banques de données : INFOBDD, GALE ;
— classification de brevets : CIB, ECLATX ; — équilibres chimiques complexes ;
— dictionnaire chimique : CHEMLINE, CHEMNAME, REGISTRY — températures de flamme ;
FILE. — diagramme de phase ;
— propriétés thermodynamiques de flamme.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 15
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
(Donnée à titre indicatif, la nuance — choix des publications (couverture large ou spécifique, nature
jugée équivalente pouvant différer par des publications, pays d’origine, langues, etc.) ;
certains détails). — sélection des documents ou signalement systématique ;
— méthode et nature de l’indexation ;
Figure 10 – Exemple de renseignements ● pour les données factuelles :
donnés par Vulcain BDM PLUS — origine des données (expérience ou littérature scientifique) ;
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 16 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 17
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
Tableau 9 – Volume d’information des principales banques de données scientifiques et techniques (juin 1997)
Nb. de réf. Accroissement
Banque Origine Début Secteur
(millions) annuel (million)
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 18 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES
Depuis plus de quinze ans, les producteurs français se sont cons- durant les dernières années, quelques axes essentiels peuvent être
titués en association : Groupement français de l’industrie de l’infor- dégagés de ce foisonnement de produits nouveaux.
mation (GFII), lieu d’échanges et de réflexion et force au sein de
l’industrie de l’information au niveau national, européen et interna- ■ Orientation de services vers l’utilisateur final. Initiée en France
tional [12]. Les principaux thèmes étudiés par les groupes de travail avec les services vidéotex en accès kiosque télématique, cette
sont la diffusion des données publiques, la déontologie et la respon- tendance a été confirmée avec les services à vitesse élevée réalisés
sabilité du producteur, la protection juridique des données [13]. par les producteurs pour des clientèles spécifiques avec des tarifi-
De façon analogue, au niveau européen, l’European Information cations adaptées. Cette orientation est liée à la concentration verti-
Industry Association (EIIA) représente les intérêts des producteurs cale (rapport direct entre producteur et utilisateurs) et au
européens, en particulier dans la définition et la mise en pratique développement de services intelligents (par exemple, accès en lan-
d’une politique de l’Union européenne en matière d’information. gage naturel).
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 19
P
O
U
Banques de données scientifiques R
et techniques
E
N
par Bernard MARX
Adjoint au Responsable du Département de la Documentation et de l’Information,
Institut National de la Propriété Industrielle (INPI)
S
A
Données économiques
V
1. Coûts et tarifications des banques de données en ligne 1.2 Utilisation des banques de données
Les coûts d’utilisation des banques de données en ligne correspondent aux
différentes étapes pour atteindre des informations : réseau téléphonique,
Les deux principaux facteurs de tarification de l’utilisation des banques de
données en ligne, durée et résultats obtenus, ont fortement évolué durant les
O
réseau(x) de télétransmission, serveur et banques de données.
1.1 Réseaux téléphoniques et télétransmission
dernières années et vont être complètement remis en cause durant les pro-
chaines années avec les bouquets de services accessibles à très grande
vitesse. Le coût horaire traduit l’influence du serveur avec l’utilisation de son
I
Mise à part l’unité de base du réseau téléphonique (0,73 F), les coûts de télé-
transmission dépendent des réseaux utilisés, de la durée et, dans certains cas,
du volume transmis.
logiciel de recherche, c’est aussi le facteur unique qui intervient dans l’utili-
sation des services accessibles en kiosque télématique. R
La tarification des résultats traduit l’importance du producteur qui a
Le coût d’accès à un serveur français pour un utilisateur français par le construit la banque de données avec la limite, par exemple dans le cas des
réseau Transpac est lié : brevets, de l’intérêt d’un résultat nul qui nécessite néanmoins pour l’obtenir la
constitution coûteuse d’une banque de données.
— à la durée 25,32 F H.T./heure;
— au volume transmis 0,052 F H.T./k octet.
Généralement, le serveur facture plus simplement un coût uniquement
Actuellement, les deux facteurs interviennent encore de façon prépondé-
rante. Par exemple, les banques de données du serveur Questel-Orbit propo-
P
horaire, par exemple dans le cas de Questel-Orbit : 40 F H.T./heure.
Dans le cas des connexions à un serveur étranger, l’utilisateur a le choix
sent des coûts horaires de 300 F à 1 600 F, dont la moyenne est d’environ 500 F
mais qui correspond généralement à différents groupes et tarifs horaires de
produits : presse en texte intégral (350 F/h), marques (400 F/h), fichiers scien-
L
entre la connexion à Transpac puis aux réseaux étrangers par l’intermédiaire
du Nœud de transit international (NTI) ou l’utilisation d’un réseau privé.
L’utilisation du NTI a un coût forfaitaire mensuel (50 F) et dépend de la dis-
tifiques (450 F/h), entreprises (400-800 F/h), brevets (800 F/h).
De la même façon, le coût des résultats imprimés en ligne ou en différé est
U
tance, de la durée et du volume transmis.
très variable (de 2 à 100 F) avec une moyenne de 10 F par résultat et des diffé-
rences importantes suivant la nature d’information : fichiers scientifiques
(4,5 F), brevets (7 F), presse (6 à 12 F), marques (6-10 F), entreprises (11-21 F),
S
bilans (105 F).
Tarifs des appels vers l’étranger Mais la critique fondée du manque de signification du coût horaire entraîne
des modifications des méthodes tarifaires :
Europe et États-Unis Autres pays
Maghreb — forte diminution du coût horaire et augmentation du coût des résultats
(IRS-ESA, DIMDI, STN);
Durée/h 36 F 60 F 81 F
— tarification des termes de recherche (STN);
Volume (1 000 segments) 20 F 38 F 43 F — choix de l’utilisateur pour chaque session de choisir les différents fac-
teurs (STN) :
• coût horaire seul;
Soit un coût moyen total de 110 F/h pour un serveur européen et 180 F/h • coût par terme de recherche seul;
pour un serveur américain. • coût horaire et par terme de recherche.
Des exemples de coûts horaires sont notés pour l’utilisation de quelques D’autres natures de recherche provoquent des tarifications spécifiques :
réseaux privés (tableau A).
— recherche de famille de brevets;
— recherches structurales ou sous-structurales dans lesquelles les diffé-
rentes étapes de la recherche et les opérateurs utilisés sont tarifiés.
Tableau A – Coût d’utilisation des principaux réseaux pour Les données accessibles par les nouveaux bouquets de service proposent
l’accès un abonnement mensuel puis un paiement à l’acte (par exemple, visualisation
des résultats) en fonction du service utilisé.
à des serveurs situés en Europe et aux États-Unis
De la prédominance justement critiquée de coût à la durée, aux tarifs des
Serveurs nouveaux services plus orientés vers l’information de vie pratique, l’infor-
Réseaux mation professionnelle cherche des méthodes de tarification signifiantes et
DATA-STAR STN DIALOG LEXIS-NEXIS acceptables pour les différents utilisateurs et opérateurs concernés.
SPRINTNET 16 FS/H − 12 $/H Compris dans le coût 2. Marché des banques de données
d’interrogation des bases Le tableau B donne le chiffre d’affaires global des fournisseurs d’infor-
TYMNET 7 FS/H 65 F/H 12 $/H
mation électronique (d’après l’Observatoire du marché de l’information de
EUNETCOM 16 FS/H − 21 $/H − l’Union européenne).
CA (Milliards d’Écus) ■ Coûts d’abonnement : ils varient suivant l’abonnement choisi. Pour un
abonnement non permanent de 100 à 1 000 F par mois, la moyenne étant de
en ligne CD-ROM et autres Total l’ordre de 250 F. Par exemple, dans le cas du service Wanadoo de France Télé-
E États-Unis 9,6 0,9 10,5
com (F TTC) :
— inscription : 190 F;
N Europe
Japon
3,6
1
0,6
0,3
4,2
1,3 — abonnement mensuel : 110 F (15 heures de connexions comprises);
Total 14,2 1,8 16 — heures supplémentaires : 19 F.
O Producteurs
Montant
616
%
13 %
Internet en quelques chiffres
— 50 millions d’utilisateurs dans le monde;
I Producteurs/Serveurs
Serveurs
3 160
762
67 %
16 %
—
—
—
16 millions d’utilisateurs aux États-Unis;
300 000 utilisateurs en France (dont 60 000 particuliers);
130 000 serveurs Web dans le monde, + 6 000 par mois;
R CD-ROM
TOTAL
187
4 725
4%
100 %
—
—
—
23 millions d’utilisateurs du WEB dans le monde;
9,5 millions d’utilisateurs du WEB aux États-Unis;
marché d’Internet : 1,1 milliard de dollars.
P Bibliographie
L Références [7] LE LOARER (P.) et NORMIER (E.). – Techni-
ques linguistiques et statistiques pour sélec-
d’annuaires européens et le défi électro-
nique, Monaco, 23-24 mai 1996, 10 pages.
U [1] BOURRETERE (M. F.). – Le point de vue d’un
utilisateur. Gazette du Palais, n° 12-13, 1994,
p. 80-82.
tionner l’information pertinente. IDT 95,
Paris, 21-23 mai 1996, p. 115-120.
[14] Le marché français de l’information électro-
nique professionnelle. Données 1994. Grou-
pement français de l’industrie de l’infor-
S [2] Des banques de données pour les étudiants,
les enseignants, les chercheurs. 7e édition.
[8] BENICHOU (P.), KLIMSZAK (C.), BORNE (P.).
– Handling Genericity in chemical structures
using the Markush Darc Software. J. Chem.
mation (GFII), janvier 1996, 60 p. et annexes.
Répertoires de banques de données
Ministère de l’Éducation nationale, de Inf. Comput. Sci. 1997, 37, p. 43-53.
l’Enseignement supérieur et de la Recherche, ● Gale Directory of Databases. Vol. 1 : Online
1995, 56 p. [9] MARX (B.). – Banques de données scientifi- Databases. Janvier 1997, Gale Research.
ques et techniques. Gazette du Palais, n° 12-
[3] WILLIAMS (J.). – The Scifinder experience. ● Répertoire des banques de données profes-
13, 1994, p. 75-79.
Actes de la Conférence internationale de sionnelles. 15e édition, 1996, ADBS, Paris, 783 p.
[10] Data and knowledge in a changing world. 3 v. ● Répertoire des banques de données Télétel
l’information en chimie, Nîmes 23-25 octobre
édit. J.-E. DUBOIS, N-GERSHON, Actes du pour l’entreprise. 1994-1995, FLA Consultants,
1995, p. 145-159.
14e Colloque international CODATA, Cham- Paris, 343 p.
[4] RAT (N.). – Les grands serveurs ciblent l’utili- béry, 18-22 septembre 1994.
● Répertoire international des banques de don-
sateur final sur l’Internet. Bases, n° 122, [11] SUTTER (E.). – Maîtriser l’information pour
novembre 1996, p. 1-5. nées par le marketing et les études. 1994, FLA Con-
garantir la qualité. AFNOR, Paris, 1993, 134 p. sultants, Paris, 375 p.
[5] Vidéotext. À Jour, Paris, n° 327, 15 juillet [12] Répertoire des membres. Édition 1994-1995, ● Annuaires des banques de données 3628-
1996, p. 6-8. Groupement français de l’industrie de l’infor- 3629. Juin 1994, À Jour, Paris, 64 p.
[6] LINK-PEZET (J.) et LACOMBE-CARRAUD (E.). mation (GFII), 169 p. ● Guide international des banques de données
– Guide pratique d’Internet. À Jour, Paris, [13] CHAMBAUD (S.). – Protection du capital sur les brevets et les marques. 1993, FLA Consul-
1995, 160 p. informationnel, Conférence : Les éditeurs tants, Paris, 279 p.