Vous êtes sur la page 1sur 21

Banques de données scientifiques

et techniques

par Bernard MARX


Adjoint au Responsable du Département de la Documentation et de l’Information,
Institut National de la Propriété Industrielle (INPI)

1. Les utilisateurs .......................................................................................... R 120 — 2


1.1 Grands utilisateurs industriels .................................................................... — 2
1.2 Spécialistes de l’information ....................................................................... — 3
1.3 Petites et moyennes industries (PMI) ......................................................... — 3
1.4 Universitaires................................................................................................ — 3
1.5 Utilisateur final ............................................................................................. — 3
1.6 Matériel d’utilisation .................................................................................... — 3
2. Les réseaux ................................................................................................. — 4
2.1 Réseaux commerciaux................................................................................. — 4
2.2 Internet .......................................................................................................... — 4
3. Les serveurs................................................................................................ — 6
3.1 Fonction des serveurs .................................................................................. — 6
3.2 Serveurs français.......................................................................................... — 6
3.3 Serveurs européens ..................................................................................... — 6
3.4 Serveurs américains..................................................................................... — 7
3.5 Diffusion par plusieurs serveurs ................................................................. — 7
3.6 Serveurs vidéotex......................................................................................... — 7
3.7 Bouquets de services ................................................................................... — 7
3.8 Logiciels ........................................................................................................ — 9
4. Les données disponibles......................................................................... — 9
4.1 Secteurs d’activité ........................................................................................ — 10
4.2 Nature de l’information................................................................................ — 12
4.3 Caractéristiques des données ..................................................................... — 16
4.4 Diversité des moyens d’accès ..................................................................... — 17
4.5 Qualité des services d’information ............................................................. — 17
5. Les producteurs......................................................................................... — 17
6. Marché, coûts et tarification................................................................. — 19
6.1 Marché des banques de données ............................................................... — 19
6.2 Coûts et tarifications .................................................................................... — 19
7. Conclusion .................................................................................................. — 19
Pour en savoir plus ............................................................................ Doc R 120

L’ accès à l’information pertinente est devenu un enjeu essentiel pour tous


les participants de la vie économique et technique, étant donné l’intense
compétitivité qui caractérise leurs relations.
Près de vingt-cinq ans après l’accès en ligne des premières réalisations (méde-
cine, aéronautique, chimie), les banques de données scientifiques et techniques
présentent aujourd’hui une situation de production, d’accès et d’utilisation,

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 1
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

issue de modifications organisationnelles et techniques importantes inter-


venues durant ce dernier quart du vingtième siècle.
■ Au niveau organisationnel, après un accroissement important du nombre des
banques de données des différents pays européens réalisé sans politique
commune de développement des serveurs, l’information professionnelle est
devenue une réelle industrie de l’information. L’accélération des achats, des
ventes et des fusions des différents opérateurs, se traduit au niveau mondial par
des mouvements très importants de concentration horizontale et verticale :
● concentration horizontale entre organismes serveurs qui proposent presque
tous une information pluridisciplinaire : scientifique et technique, activité des
entreprises, affaires, presse, etc. ;
● concentration verticale en particulier entre producteur et serveur assurant
au producteur une diffusion plus complète, voire exclusive, de ses produits au
niveau des sources, de la nature de l’information et de l’antériorité.
■ Au niveau technique, les développements permettent différents modes
d’accès et d’utilisation qui doivent être intégrés pour obtenir un service plus effi-
cace à partir d’éléments complémentaires :
● accès vidéotex aux banques de données en France avec les différents
paliers tarifaires de l’accès kiosque ;
● utilisation en local de volumes importants de données sur CD-ROM et déve-
loppement du multimédia : textes, images, séquences animées et son ;
● utilisation de micro-ordinateurs pour l’accès en ligne aux serveurs profes-
sionnels et aux services Internet : augmentation des vitesses de transmission,
accès aux données par Internet et utilisation des méthodes de recherche de
l’information disponible sur les réseaux, remise en cause des méthodes tradi-
tionnelles de tarification.
Face à ces modifications organisationnelles et techniques, le choix de l’utili-
sateur n’est plus aujourd’hui celui d’il y a quinze ans. À cette époque, l’utili-
sateur s’orientait vers le ou les serveurs où se trouvaient les banques de
données répondant à ses besoins. Aujourd’hui, l’utilisateur réalise un
produit spécifique et cohérent à partir des éléments d’information
nombreux et hétérogènes qui lui sont proposés.
C’est bien le cas du secteur métrologie et mesures dans lequel les banques de
données sont très peu nombreuses (voir § 4.1. secteurs d’activité) et pour
lequel il faudra rechercher dans des domaines voisins (matériaux, mécanique,
etc.) ainsi que dans les banques de données multisectorielles (sciences et tech-
niques, rapports, brevets, etc.)

1. Les utilisateurs 1.1 Grands utilisateurs industriels

Les industries pétrolières, chimiques et pharmaceutiques ont été


Suivant la chronologie des développements des banques de les pionniers de l’utilisation des banques de données en ligne.
données scientifiques et techniques, l’accent a été plus particuliè- L’importance de ces sociétés se traduit par des services internes
rement mis sur l’un ou l’autre des opérateurs : tout d’abord sur le de documentation dont le personnel a la maîtrise de l’identification,
serveur pour un accès cohérent à un grand volume de données, puis et de la pratique des informations pertinentes.
sur le producteur pour la propriété et la responsabilité des données.
Aujourd’hui, une société pétrolière utilise couramment une
Il paraît aujourd’hui plus cohérent de débuter cette étude des centaine de banques de données avec différents accès : en ligne,
banques de données par les utilisateurs dont dépendent la consom- CD-ROM et disquettes [1]. Les sources indispensables étant dispo-
mation donc l’existence des systèmes d’information, ensuite de nibles sur plusieurs serveurs, le choix dépend de l’ensemble des
poursuivre cette démarche pratique avec le matériel utilisé et les services proposés :
réseaux parcourus (§ 2) pour atteindre les serveurs (§ 3) où sont — clusters (agrégats) standards ou sur mesure de banques de
situées les données disponibles réalisées par les producteurs données pour une recherche multibase ;
d’information (§ 4). Une analyse des marchés, des facteurs de coûts — accès et traitement des données non bibliographiques : ima-
et des méthodes de tarification complète cette étude. ges des brevets, logos de marques, données cartographiques, etc. ;

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 2 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

— accès rapides et par la même voie électronique aux documents


primaires ; Tableau 1 – Activités de l’ADBS
— intégration de la recherche d’information dans l’environ-
● Groupes régionaux :
nement informatique de l’utilisateur : déchargement et traitement
des données ; les stations de travail représentent une solution à la Alsace, Aquitaine, Auvergne, Bourgogne, Bretagne, Centre,
gestion d’information de natures différentes (textes, structures, Champagne-Ardennes, Île-de-France, Languedoc-Roussillon, Lor-
dessins) ; raine, Midi-Pyrénées, Nord-Picardie, Haute-Normandie, Pays de la
Loire, Provence-Marseille, Côte d’Azur-Corse-Nice, Rhône-Alpes-
— aménagement des tarifications standards en fonction d’utili-
Lyon, Rhône-Alpes-Grenoble.
sations importantes et de prévisions d’utilisation.
● Groupes sectoriels :
Agriculture-agroalimentaire, Audiovisuel, Culture, Juridique,
Économie-statistique, Éducation-Enseignement, Environnement-
1.2 Spécialistes de l’information Écologie, Formation professionnelle, Électronique-Électricité-
Information-Télécommunications, Pays en développement,
Presse-Édition, Santé-Médecine-Pharmacie-Biologie, Sciences et
Les sélections et les travaux cités en 1.1. sont l’œuvre des spécia- actions sociales, Transport-Équipement-Urbanisme.
listes de l’information. Leur compétence couvre les différentes ● Commissions :
étapes de la recherche d’information : contenu des banques de Action internationale, Formation-Recherche, Métiers et qualifi-
données, caractéristiques des logiciels, conditions d’accès, environ- cations, Statuts, Technologies et méthodes documentaires, Pros-
nement de la recherche et tarification. L’ADBS (l’Association des pective.
professionnels en information et documentation) rassemble plus de
● Formations :
5 500 personnes à travers une structure régionale et sectorielle, et
propose les actions de formation, les éditions et les structures de Techniques documentaires, Nouvelles technologies de l’infor-
travail en commun indispensables à la profession (tableau 1). mation, Internet, Information stratégique, Gestion, Marketing et
management.
L’arrivée de vecteurs d’information orientés vers l’utilisateur
● Publications :
final : kiosque télématique, CD-ROM, Internet, provoque une modifi-
cation du rôle du spécialiste de l’information vers une fonction — Périodiques : « Documentaliste, Sciences de l’information »,
d’évaluation qualitative des données, de conseil pour leur utilisa- « ADBS Info ».
tion et de traitement de questions complexes. — Ouvrages : Répertoire des banques de données profession-
nelles, Les coûts en documentation, Guide pour la gestion d’un
centre de documentation, Les critères d’évaluation des banques de
données, La qualité en marche dans les services d’information,
1.3 Petites et moyennes industries (PMI) Actes des congrès IDT, etc.

La faible pratique, les frais initiaux variables du contrat d’un


serveur, l’investissement en formation, en matériel et en documen- Sept Unités régionales de formation à l’information scientifique et
tation font hésiter les PMI à accéder aux banques de données pro- technique (URFIST) à Bordeaux, Lyon, Nice, Paris, Rennes, Stras-
fessionnelles en ligne. L’utilisation de CD-ROM est une solution si bourg et Toulouse ont pour mission la formation et la sensibilisation
quelques titres couvrent bien le secteur d’activité de l’entreprise. des étudiants, des enseignants, des chercheurs et du personnel des
L’accès aux banques de données en accès kiosque télématique est bibliothèques à l’usage de l’information électronique. Elles propo-
aussi une possibilité de recherche occasionnelle grâce à la démar- sent des stages d’initiation et de perfectionnement à la pratique des
che guidée. principales banques de données en ligne et sur CD-ROM, à la
Pour ces demandes occasionnelles, les PMI ont le plus souvent connaissance des sources d’information scientifique et technique
recours à un broker (courtier) en information qui interroge les diffé- sur Internet.
rentes sources pertinentes pour répondre au problème posé. Depuis
quelques années, les brokers français privés sont regroupés au sein
de l’Association française des intermédiaires de l’information (AFII).
Les PMI ont aussi recours aux Agences régionales de l’information 1.5 Utilisateur final
scientifique et technique (ARIST) localisées dans les Chambres
régionales de commerce et d’industrie (CRCI) pour être sensibilisées
à l’utilisation de l’information professionnelle.
Les articles comparant les recherches d’information effectuées
par le spécialiste de l’information et par l’utilisateur final ont été
publiés dès le début des années 1980, mais il a fallu attendre en
1.4 Universitaires France l’accès par Minitel et l’utilisation locale de CD-ROM pour que
des systèmes de recherche guidée soient disponibles. Aux États-
Unis, l’accès par les réseaux à haut débit a développé des accès
Les bibliothèques universitaires ont proposé l’accès en ligne aux guidés destinés à l’utilisateur final.
banques de données à partir de 1977. Actuellement, 281 sections
de bibliothèques universitaires et inter-universitaires (services Exemple : des services tels que BRAQUE (Information Retrieval
communs de la documentation) fournissent l’accès aux banques de Service de l’Agence Spatiale Européenne, IRS-ESA) et SciFinder de
données de leurs spécialités ainsi qu’aux ressources spécifiques aux Chemical Abstracts Service (CAS) sont caractéristiques des nouveaux
bibliothèques : catalogues collectifs et prêt entre bibliothèques [2]. produits orientés vers l’utilisateur final, le chimiste dans ce cas précis.
L’accès est effectué directement sur le site du producteur, la recher-
Suivant l’exemple des serveurs américains, les serveurs français che textuelle est effectuée en langage naturel, les recherches structu-
proposent, en accord avec les producteurs, des tarifs réduits d’utili- rales et sous-structurales sont possibles, le sommaire et le texte
sation des banques de données pour les universitaires, soit un pour- intégral de revues sont accessibles, le paiement est forfaitaire, indé-
centage du prix public, soit un coût fixe. pendant de l’utilisation mais lié au nombre d’utilisateurs [3].

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 3
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

C’est un nouveau service orienté vers une catégorie précise d’utilisa- ou par les touches fonctions). Un exemple d’application est la récep-
teurs finals. Il abandonne certaines subtilités de la recherche textuelle tion automatique de documents de brevets par télécopie à partir du
plus adaptées aux spécialistes de l’information, et fournit un service numéro de brevet indiqué en audiotext.
complet dépassant les données brutes que constituaient les réfé-
rences bibliographiques. Ces développements et ces modifications
indiqueront si le mythique utilisateur final a pu être enfin atteint [4].
2. Les réseaux
1.6 Matériel d’utilisation
Le développement des réseaux de télétransmission et leur inter-
Les différents composants du matériel correspondent aux élé- connexion au niveau international ont été des facteurs essentiels à
ments complémentaires de la recherche : accès externe et traite- l’utilisation de la télématique (télétransmission et informatique),
ment local, différentes natures de l’information considérées comme permettant l’accès en ligne, à distance et à des coûts moindres que
éléments de recherche et comme résultats trouvés. le réseau téléphonique ordinaire.

■ Le micro-ordinateur, indispensable pour le traitement de la ques-


tion en local, le télédéchargement et la gestion des résultats, permet
des calculs statistiques et des traitements bibliométriques à partir 2.1 Réseaux commerciaux
de la fusion de résultats de différentes origines. Il peut aussi assurer
l’interface d’accès vidéotex pour les banques de données en accès
kiosque télématique. La situation des dernières années avec le monopole des réseaux
nationaux publics reliés entre eux a été rapidement modifiée avec la
■ Le modem externe ou intégré assure la transaction des messages déréglementation européenne des télétransmissions.
entre la liaison téléphonique et l’ordinateur de l’utilisateur. Une Si, en France, le réseau Transpac assure la transmission des don-
caractéristique essentielle du modem est le débit de transmission nées entre le poste de travail de l’utilisateur et l’ordinateur ser-
dont les valeurs courantes sont actuellement situées entre 14 400 et veur, la situation internationale est différente avec l’intervention
28 800 bauds (bits par seconde). Le modem est associé à un logiciel d’opérateurs privés :
de communication facilitant la connexion aux serveurs (en parti-
culier lorsque différentes natures d’informations sont traitées : tex- — soit un accès par Transpac et le Nœud de transit international
tuelle et structurale), fournissant l’accès vidéotex ou donnant l’accès (NTI) de commutation de paquets qui assure les relations techni-
aux services d’Internet, ce qui nécessite des vitesses plus élevées. ques et administratives entre Transpac et environ 300 réseaux X 25
couvrant 170 pays. Le NTI identifie chaque utilisateur par un
■ Le lecteur de CD-ROM présente une structure intégrée ou externe Numéro d’utilisateur international (NUI) ;
au micro-ordinateur. Le volume très important d’information main- — soit un accès par le réseau téléphonique à une adresse située
tenant édité sur CD-ROM (l’intégralité des demandes de brevets en France d’un réseau privé étranger (SPRINTNET, TYMNET,
européens, sans compter les réalisations nationales, occupe plus de EUNETCOM, etc.). La connexion n’est pas effectuée au numéro
100 CD-ROM par an) est géré par des juke-box multidisques (100 ou national Transpac mais à une adresse régionale (3 accès pour
200 disques par unité). EUNETCOM, 4 pour SPRINTNET, 8 pour TYMNET) afin que le coût
L’écran doit disposer de caractéristiques adaptées aux services du réseau téléphonique d’accès ne soit pas prohibitif (figure 1).
consultés. Si les données textuelles codées aux normes ASCII (Ame-
ricain Standard Code for Information Interchange) ne présentent pas
de difficultés particulières, par contre le fac-similé de page de texte 2.2 Internet
avec dessin, les structures chimiques codées nécessitent l’utilisation
d’un écran de meilleure définition.
■ Le Minitel est aussi un élément important du matériel de recher- Internet (Inter Communication Network), le réseau des réseaux,
che d’information étant donné la très grande diffusion en France et est né dans la décennie 1960 à l’initiative du Département de la
le nombre de banques de données professionnelles (environ 400) Défense des États-Unis pour relier entre eux des réseaux de télé-
accessibles par kiosque télématique. La stabilité relative de l’utilisa- transmission et sécuriser le transfert d’information par un maillage
tion actuelle des services Minitel ne doit pas cacher que les caracté- important. Il est ensuite, entre 1970 et 1980, développé aux États-
ristiques qui ont fait le succès du Minitel freinent maintenant le Unis pour la recherche scientifique financée par la National Science
développement d’autres vecteurs mieux adaptés au multimédia [5]. Foundation (NSF). À partir de 1990, son rayon d’action déborde les
États-Unis et intègre le secteur commercial.
Le Minitel est bon marché, largement diffusé, mais il est inintel-
ligent, les possibilités du clavier et de l’écran sont limitées, et la
vitesse de transmission (75/1 200 bauds) est lente. Si la facturation
et le recouvrement assurés par France Télécom simplifient le travail KRI
du producteur et du serveur, la tarification uniquement fondée sur la DATA-STAR (Suisse)
durée et réduite à quelques paliers tarifaires, ne satisfait plus les
industriels de l’information. Le Minitel et les services vidéotex sont Transpac SPRINTNET
maintenant concurrencés par les bouquets de services, accessibles KRI
par Internet et qui proposent une variété de services accessibles à DIALOG (États-Unis)
grande vitesse et dont les tarifications sont variées. EUNETCOM
Utilisateur
■ Un dernier élément matériel relié à la recherche d’information français
est la télécopie qui est un vecteur de réception de résultats complé- STN (Allemagne)
tant la visualisation et l’impression des résultats en ligne et l’impres- Nœud de transit TYMNET
sion en différé. La commande automatique de réception par international
télécopie pallie la vitesse de transmission lente du Minitel et permet (NTI)
NEXIS (États-Unis)
aussi d’obtenir des documents numérisés issus, par exemple,
d’une commande audiotex. La commande d’information par Figure 1 – Exemples d’accès à des serveurs situés en Europe
audiotex utilise uniquement le combiné téléphonique (par la voix et aux États-Unis par différents réseaux

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 4 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

2.2.1 Les éléments de base 2.2.4 Les différents niveaux d’Internet

Les éléments essentiels d’Internet sont les protocoles de commu- C’est une infrastructure à quatre niveaux :
nication, les systèmes d’adresses et l’exploitation du couple client- — opérateurs d’infrastructure : installation des supports physi-
serveur. ques de transmission ;
— sociétés de supports de services (network services) : location
■ Le Transmission Control Protocol/Internet Protocol (TCP/IP) est
des lignes physiques, organisation du maillage du réseau, attribu-
un ensemble de protocoles indépendants du réseau physique
tion des noms de domaines ;
support, gérant la transmission entre le demandeur et le destina-
taire, le routage des paquets et la connexion. — services à valeur ajoutée : machines pour le stockage et la
diffusion des données ;
■ Le système d’adressage compte deux adresses : — fournisseurs d’accès Internet (Internet Access Providers) : four-
nisseurs d’information en ligne. Des sociétés telles que Compu-
— l’adresse de l’utilisateur où l’espace est organisé en domaines
serve, Europe Online, Infonie connectent des ordinateurs auxquels
géographiques ou sectoriels : com(merce), edu(cation),
les utilisateurs vont accéder pour obtenir l’information.
gov(ernment) ;
— l’adresse physique, soit permanente pour les nœuds perma-
nents du réseau, soit attribuée par le fournisseur d’accès pour une 2.2.5 Les informations disponibles
session.

■ Enfin, l’exploitation du couple client-serveur permet un dialogue Au départ très orientés sur la communication, les services d’infor-
avec un protocole de haut niveau entre l’ordinateur serveur et l’ordi- mation accessibles par Internet couvrent maintenant les différentes
nateur client qui supporte la version cliente du logiciel serveur et en natures d’information avec la capacité essentielle d’édition électro-
exploite tous les services multimédia. Des groupes d’utilisateurs nique due à la structure HTML [6].
vont partager une même catégorie de logiciels pour s’orienter et
structurer les données dont le plus connu est maintenant le World ■ Services de communication :
Wide Web. — forums de discussion (News group). Des milliers de forums de
discussion sont disponibles sur toutes sortes de thèmes ou de
secteurs d’activité ;
2.2.2 La structuration des données — listes de diffusion. L’utilisateur sélectionne sa liste thématique
de discussion, envoie des notes et en reçoit dans sa boîte aux lettres
électronique ;
La structuration des données peut utiliser différents systèmes :
— lettres d’information. Ces lettres contiennent, dans un
Gopher, Wide Area Information System (WAIS), mais le plus
domaine, le calendrier des congrès, des appels à communication,
répandu est World Wide Web (WWW).
des résumés. Il existe près de 500 lettres d’information sur Internet.
Les trois éléments essentiels du Web sont le protocole d’identifi-
cation, le protocole réseau et le format des documents. ■ Publications et prépublications scientifiques : il existe près de
400 revues électroniques sur Internet permettant une diffusion
■ L’identification des documents est effectué par le protocole Uni- rapide des résultats de la recherche, avec éventuellement des
form Ressource Locator (URL), qui intègre l’adressage Internet. prépublications précédant toute forme de validation.

■ De même, le protocole réseau : http est le nom du protocole, basé ■ Ressources documentaires :
sur TCP/IP pour les ressources Web. — catalogues de bibliothèques. De nombreux catalogues français
et étrangers sont disponibles ;
■ Enfin, HyperText Markup Language (HTML) est le format central
— banques de données professionnelles. Les serveurs commer-
du Web supportant des liens de nature hypertexte. HTML permet
ciaux français et étrangers fournissent l’accès par Internet soit à
une édition directement électronique où les documents, destinés à
leurs services habituels avec les mêmes conditions d’accès (numéro
être lus sur écran, n’ont pas d’édition papier bien que celle-ci soit
de compte, mot de passe) et de tarifs (coût horaire, visualisation en
possible.
ligne, impression du différé, etc.), soit à de nouveaux services qui
utilisent d’autres méthodes tarifaires comme le forfait mensuel ou
annuel avec utilisation illimitée. Les nouvelles méthodes tarifaires
2.2.3 Les instances de régulation forfaitaires ou à l’acte vont se développer par rapport à la tarification
horaire qui a de moins en moins de signification à mesure que les
Bien qu’il n’existe pas de structure centralisée contrôlant le fonc- vitesses de transmission augmentent.
tionnement et le développement d’Internet, des instances de régu- Exemple : exemples de banques de données scientifiques et tech-
lation existent au niveau international et national. niques :
■ L’Internet Society (ISOC) est dirigée par un conseil d’adminis- — brevets américains, QPAT-US : http://www.qpat.com
tration. Des groupes de travail sont organisés par thème ou par zone — laboratoires de recherches français TELELAB : http//
géographique. L’Internet Engineering Task Force (IETF) est un www.mesr.fr
groupe chargé des propositions de standards soumises à l’Internet
Architecture Board. Le nombre de données scientifiques et techniques accessibles
par Internet augmente considérablement : données publiques
■ L’Internet Assigned Numbers Authority (IANA) définit les adres- françaises, européennes et étrangères, prépublications scientifi-
ses Internet. Leur gestion est ensuite assurée régionalement, RIPE ques, forums et actualités des sociétés savantes et associations à
(réseaux IP européens) pour l’Europe qui délègue ensuite au niveau but non lucratif, rapports d’activité des organismes publics et des
national, INRIA (Institut national de recherche en informatique et en sociétés commerciales.
automatique) pour la France.
■ Plusieurs fonctions limitent actuellement l’utilisation d’Internet :
■ Le Web consortium est une association créée à partir du MIT — la lenteur des accès et des transactions qui n’assure pas à l’uti-
(Massachusetts Institute of Technology) et de l’INRIA pour le déve- lisateur la réponse immédiate à laquelle s’engagent par contrat les
loppement des standards du Web. serveurs professionnels ;

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 5
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

— la confidentialité n’est pas assurée dans un réseau aux entrées 3.2 Serveurs français
et aux interconnexions multiples et changeantes ;
— la sécurisation de la facturation va nécessiter un contrat entre
le fournisseur et l’utilisateur qui supprime l’accès occasionnel sans Le principal serveur français de données scientifiques et techni-
forfait comme celui du kiosque télématique ; ques est la société Questel-Orbit du groupe France Télécom issue de
— la nécessaire protection contre les intrusions (Firewalls), étant l’acquisition en 1994 du serveur américain Orbit par Questel. Avec
donné le très grands nombre de surfeurs non identifiés. environ 250 banques de données dans l’ensemble des disciplines
mais plus particulièrement dans les domaines suivants : propriété
En fonction du problème posé, il faut considérer ces sources
industrielle (brevets, marques, dessins et modèles), chimie,
comme une complémentarité et non une concurrence de l’infor-
sciences et biomédical, information sur les sociétés et presse
mation professionnelle dont les caractéristiques sont contractuelle-
(tableau 2). C’est un serveur de niveau international qui affronte les
ment connues de l’utilisateur et l’utilisation payante mais rapide. Si
deux serveurs américains Knight Ridder Information (KRI) et Scien-
l’apport des sources Internet peut être original et son coût théorique
tific and Technical Information Network (STN).
faible, le temps passé peut être très important.

2.2.6 Les coûts d’utilisation Tableau 2 – Principaux serveurs français des banques
de données scientifiques et techniques
Se reporter au doc. R 120 en fin d’article.
Serveurs Secteurs d’activité
Questel-Orbit Propriété intellectuelle, chimie, sciences, techno-
3. Les serveurs logies, médecine, actualités, affaires, énergie et
sciences de la terre, ingénierie, sécurité et environ-
nement, matériaux, sciences humaines et sociales,
presse.
3.1 Fonction des serveurs CEDOCAR Armement, aéronautique, matériaux, métallurgie,
ingénierie, électronique, rapports de recherche.
Les organismes serveurs ont pour fonction de donner l’accès au ABES Catalogue d’ouvrages, catalogues de périodiques,
contenu de différentes banques de données à des utilisateurs exté- thèses, recherches en cours, littérature grise (docu-
rieurs. Cette fonction a son application dans divers services assurés ments, rapports non publiés commercialement)
complètement ou partiellement par le serveur en fonction de CEDOCAR : Centre de documentation de l’armement
chaque contrat producteur-serveur : ABES : Agence bibliographique de l’enseignement supérieur
— chargement et stockage des banques de données : le volume
toujours croissant des données et l’intégration des images utilisent
l’augmentation très rapide des capacités de traitement des
ordinateurs ; Le Centre de documentation de l’armement (CEDOCAR) donne
— maintenance du système et intégration des mises à jour : l’accès à ses propres données ainsi qu’à une dizaine de banques
l’intégration des nouvelles mises à jour à un volume existant très étrangères dans les domaines des techniques de l’ingénierie, de
important de données, la fréquence et le délai des mises à jour exi- l’aérospatiale et des matériaux.
gent une qualité de service qu’utilisateurs et producteurs souhaitent L’Agence bibliographique de l’enseignement supérieur (ABES) et
normaliser ; le Serveur universitaire national d’information scientifique et techni-
— homogénéisation des formats des différentes banques de que (SUNIST) donnent accès aux outils documentaires communs
données: c’est une nécessité pour une recherche efficace dans des des universités : catalogues des périodiques, des ouvrages et des
banques de données complémentaires pour l’utilisateur. Le produc- thèses, répertoires des laboratoires, etc.
teur assure cette cohérence pour ses propres banques, mais c’est au
D’autres banques de données universitaires numériques ou
serveur de le faire pour des banques de différentes origines dans un
factuelles sont accessibles directement aux centres de calcul univer-
secteur commun d’activité ;
sitaires, dans les laboratoires ou indirectement en service bureau
— création et mise à jour des index : c’est le facteur essentiel lorsque l’accès est uniquement local. Exemples de banques de
de la qualité de la recherche avec la complémentarité de zones données universitaires : Thermodata (Institut Polytechnique de Gre-
contrôlées multitermes (pertinence des résultats mais silence) et de noble), Ergodata (Université Paris V), Gaphyor (Université Paris
zones libres unitermes (taux de rappel important mais bruit) ; Sud).
— exploitation et accès aux données par un ou plusieurs
logiciels : les natures différentes d’information traitées par un même
serveur provoquent l’utilisation de plusieurs logiciels, par exemple
textuel et structural ; 3.3 Serveurs européens
— connexion avec les réseaux d’accès : choix des opérateurs des
réseaux internationaux, et, au niveau français, choix de la norme Après l’acquisition de Data Star (Suisse), banques de données
ASCII et/ou de la norme Vidéotex pour les différentes méthodes entreprises, sciences et techniques et biomédical, par Knight Ridder
d’accès ; Information, l’intégration du FIZ Karlsruhe, (Allemagne), banques de
— relations contractuelles avec les utilisateurs et les produc- données sciences et techniques dans STN et la diminution du
teurs, gestion et facturation des services : le serveur propose à l’uti- nombre de banques diffusées par Information Retrieval Service de
lisateur un contrat standard avec des tarifs issus de ses contrats l’Agence spatiale européenne, le panorama européen des serveurs
avec les différents producteurs. Des conditions d’utilisation spécifi- en sciences et techniques est assez restreint.
ques à certaines banques de données, par exemple, droit de repro-
duction des résultats des recherches, sont précisées en annexe du ■ Allemagne
contrat de l’utilisateur. Le serveur DIMDI donne accès à environ 80 banques de données
D’autres services sont répartis entre producteur et serveur : allemandes et internationales dans les domaines médical et biolo-
actions de promotion et de sensibilisation, formation des utilisa- gique : agriculture, biologie, santé, psychologie, médecine, nutri-
teurs. tion, pharmacie, toxicologie, etc.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 6 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

Le serveur FIZ Technik donne accès à environ 80 banques de don- 3.5 Diffusion par plusieurs serveurs
nées allemandes et internationales dans les domaines technologi-
ques : automobile, normes, mécanique, chimie industrielle,
ingénierie, énergie, agroalimentaire, bâtiment, électronique, métal- Lors du développement, à la fin des années 1970, des serveurs
lurgie, emballage, textile, soudage, électrotechnique, etc. dans les différents pays européens, l’idée d’une forte organisation
Le serveur GENIOS donne accès à environ 100 banques de nationale complétée par une coordination au niveau européen avait
données en grande partie d’origine allemande dans les domaines de pour objectif d’éviter les multiples mises à disposition des données
l’industrie et des entreprises : transports, chimie, informatique, élec- identiques. En réalité, le manque d’une politique suivie, les initia-
tricité et électronique, alimentation, marketing, textile, conditions de tives privées souvent désordonnées et les concentrations horizon-
travail et répertoires d’entreprises. tales et verticales déjà mentionnées font qu’aujourd’hui, les mêmes
données scientifiques et techniques sont souvent disponibles sur un
■ Royaume-Uni grand nombre de serveurs (tableau 3). L’utilisateur doit profiter de
ces choix pour repérer les différences d’exploitation et s’assurer les
Le serveur BLAISE de la British Library donne accès à une ving- conditions de la recherche la plus efficace :
taine de banques de données, essentiellement des catalogues des — variation des données : dans des fichiers complexes, un
différents départements de la British Library : audiovisuels, mono- ensemble de données complémentaires, textes, nomenclature, clas-
graphies, conférences, documents anciens, périodiques, etc. sification, structures, etc., peut être intégré ou séparé ;
— variation de la date de début d’exploitation : c’est un aspect
■ Italie essentiel mais rapidement vérifiable qui varie fréquemment d’un
Le serveur Information Retrieval Service de l’Agence spatiale serveur à un autre ;
européenne (IRS-ESA) fut le pionnier européen de l’accès aux ban- — variation de la périodicité et des délais de mises à jour : si le
ques de données scientifiques et techniques. Un recentrage récent premier élément est toujours annoncé et facilement vérifiable, le
de son activité a limité son exploitation à une soixantaine de ban- second, très important dans un choix de serveur, n’est pas toujours
ques, en particulier dans les domaines suivants : aéronautique, détaillé en fonction des différentes sources d’information ;
chimie, électronique, défense, génie civil, environnement et maté- — variation des éléments de recherche : la question se pose
riaux. Des passerelles (gateway) permettent néanmoins d’atteindre moins maintenant entre différentes banques de données profes-
d’autres serveurs européens en se connectant à IRS-ESA. sionnelles, car la plupart des champs d’information sont des élé-
ments de recherche. Par contre, c’est souvent ce qui fait la
■ Luxembourg différence, pour les mêmes données, entre un accès professionnel
et un accès vidéotex ;
Le serveur ECHO de la Commission de l’Union européenne — variation des coûts d’utilisation : les coûts varient d’autant
propose l’accès, le plus souvent gratuit, à une trentaine de banques plus que les méthodes de tarification évoluent (coût horaire, coût
de données concernant des publications, des rapports et des aides à par session, par terme de recherche, etc.). Mais cette comparaison
la recherche dans le domaine de l’information et des télécommuni- n’a de sens que si les services sont réellement équivalents.
cations, ainsi que les programmes, projets et résultats des contrats
de recherche de l’Union européenne : Community Research and
Information Service (CORDIS).
3.6 Serveurs vidéotex

3.4 Serveurs américains L’utilisation des banques scientifiques et techniques en accès


vidéotex s’est essentiellement développée lorsque le principe du
kiosque télématique a été appliqué au secteur professionnel : le coût
C’est aux États-Unis que se trouvent les deux géants du domaine : du réseau télématique, du réseau Transpac et du serveur (incluant
Knight Ridder Information et STN. De plus, la National Library of les redevances au producteur) est directement prélevé sur la facture
Medicine (NLM) diffuse essentiellement sa production dans le téléphonique. Ces différents paliers tarifaires permettent des coûts
domaine biomédical. horaires compris entre 60 et 550 F TTC. Un grand nombre de
banques de données scientifiques et techniques ont ainsi pu béné-
■ Knight Ridder Information (KRI) est issu de l’achat des serveurs ficier d’un accès simplifié (par le terminal Minitel), d’une utilisation
Dialog en 1988 et Data Star en 1993 par l’éditeur de presse Knight aisée (démarche guidée) pour des questions simples et d’une
Ridder. méthode de tarification simple (voir simpliste) par le coût horaire
prélevé directement.
Les 600 banques de données de KRI couvrent tous les domaines
d’activité avec un renforcement récent des domaines de la propriété Exemple : Le tableau 4 donne des exemples des banques de don-
intellectuelle, des affaires et de la presse. nées accessibles par Minitel.

■ Scientific and Technical Information Network (STN) présente les


caractéristiques d’une concentration verticale et d’une gestion géo-
graphiquement répartie :
3.7 Bouquets de services
— concentration verticale car c’est le producteur Chemical Abs-
tracts Service (CAS) qui en est le fondateur et diffuse ses propres Les dix dernières années ont vu se développer aux États-Unis
données par STN, avec un monopole sur certaines données : anté- puis en Europe des sociétés proposant des bouquets de services :
riorité, résumés, texte intégral ; données grand public (renseignements pratiques, loisirs, tourisme,
— serveur réparti par les liaisons entre CAS (États-Unis), Japan prix), transactions commerciales et données professionnelles. Les
Science and Technology Corporation (JST) au Japon et FIZ données sont soit situées sur l’ordinateur serveur, soit automatique-
Karlsruhe, Allemagne. Les banques de données de STN sont ment reroutées à partir d’autres serveurs.
réparties sur ces trois centres. Au total, près de 200 banques de Une partie de ces services correspond aux services vidéotex fran-
données sont disponibles. Le ministère allemand de la Recherche çais mais avec des caractéristiques techniques différentes : accès
finance fortement le maillon allemand, ce qui n’empêche pas STN par micro-ordinateur, grande vitesse, transmission d’images, accès
de s’ouvrir aux données sur les affaires. centralisé.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 7
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

Tableau 3 – Exemples de banques de données scientifiques Tableau 4 – Banques de données scientifiques


et techniques accessibles par plusieurs serveurs et techniques accessibles en kiosque télématique
Serveurs Serveurs Nom de la banque
Serveurs français Domaines Accès
européens américains de données
Banques de
données
Questel- BDSP Santé publique 08 36 28 00 09
Cedocar IRS-ESA DIMDI KRI STN
Orbit
COMPUBASE Sociétés et produits 08 36 29 45 15
Analytical informatiques
Abstracts X X X
CSTB Réglementation 36 17 CSTB
APILIT X X X technique et produits
certifiés du bâtiment
Aquatic Sc.
and Fische- X X X X CXP Répertoire de progiciels 08 36 29 00 16
ries Abs.
DAUGAZ Techniques et économie 08 36 29 00 35
Biobusiness X X de l’industrie gazière
Biosis X X X X EUDOC Tous les domaines 36 17 EAUDOC
concernant l’eau
CAB X X X X
ECOMINE Techniques et économie 08 36 28 00 03
Cancerlit X X X X des minerais
Chemical X X X X GEOBANQUE Géologie 08 36 29 00 03
Abstracts
Chemical IALINE Industrie 08 36 29 00 85
Industry X X X agroalimentaire
Notes MEDLINE Bio-médical 08 36 29 00 36
CLAIMS X X X X NORIANE + Normes 08 36 29 00 78
Compendex
Plus X X X X X PASCAL Sciences et techniques 08 36 29 36 01

Derwent RESAGRI Agriculture 36 17 RESAGRI


X X X
Drug File TELELAB Laboratoires 36 15 RECHINFO
Embase X X X de recherche français

Energyline X X URBAMET Aménagement urbain, 08 36 29 00 15


fermier et rural
Enviroline X X X X
VULCAIN BDM PLUS Matériaux 08 36 29 00 68
FSTA X X X X X pour le décolletage
et la mécanique
IAC DMT X X X
INPADOC X X X
INSPEC X X X X X
Materials Tableau 5 – Exemples de domaine
X X X X X
Business File des services Compuserve
Medline X X X X ● Ordinateurs et logiciels (1 000 services) : renseignements,
Metadex X X X X X actualités et forums proposés par les fabricants, diffuseurs et grou-
pes d’utilisateurs.
NTIS X X X X X
● Éducation (30 services) : données professionnelles (Disserta-
Pascal X X tions Abstracts, ERIC, Peterson’s College Database) et forums.
● Jeux (50 services).
Pollution
Abstracts X X X ● Loisirs et renseignements généraux (120 services).
● Internet (10 services).
Science Cita- X X X
tion Index ● Journaux et actualités (40 services) : Der Spiegel, Fortune, Le
Monde, AFP, etc.
Derwent
World Patent X X X ● Données professionnelles (140 services). Banques de données
Index professionnelles : COMPENDEX, Books in Print, UK Trademarks,
Cendata, Computer Database, Government Printing Office, Health
Database, Marquis who’s who, NTIS, CLAIMS, Psycinfo, Trade-
markscan, etc., ainsi que de nombreux forums.
Un précurseur et un des leaders de ces services est la société
américaine Compuserve, récemment reprise par la société America
On Line, qui propose près de 1 500 services (tableau 5) à partir d’un
contrat d’abonnement mensuel d’environ 65 francs pour 3 heures La société française Wanadoo, filiale de France Télécom, propose
d’utilisation. Les données professionnelles sont à payer en supplé- l’interrogation d’annuaires professionnels ainsi que l’accès à une
ment, par exemple à la référence obtenue. « galerie marchande » de services.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 8 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

3.8 Logiciels Encadré 1 − Logiciel Questel Plus 2


Exemples de quelques fonctionnalités
Le logiciel de recherche et de gestion est l’apport essentiel du
centre serveur permettant à l’utilisateur d’obtenir l’information qui — Interrogation d’une base ou d’un ensemble de bases
lui est nécessaire. prédéfini (brevets, chimie, etc.) ou déterminé par l’utilisateur.
— Limitation de la recherche à une mise à jour ou à une
Dans le domaine de l’information scientifique et technique, l’utili-
tranche de mises à jour, à une date ou à une période d’entrée
sateur dispose de logiciels textuels, identiques ou analogues au
des documents dans la base, à un sous-ensemble de la base.
traitement des données juridiques ou d’actualité, et à des logiciels
— Recherche de termes de différentes natures ; uniterme,
spécifiques, par exemple logiciel structural adapté à des structures
mot clé, date, donnée numérique.
chimiques, ou logiciel pour des données factuelles ou numériques.
— Différentes troncatures : illimitée, limitée, masque, droite,
intérieure, gauche (sur certaines bases).
— Qualificatifs de termes : choix d’un ou plusieurs index de
3.8.1 Logiciels textuels recherche.
— Qualificatifs de dates et de données numériques : valeur
Tous les logiciels textuels proposent un certain nombre de carac- exacte, tranche de valeurs, supérieur, inférieur, etc.
téristiques communes au niveau de la recherche et de la présenta- — Opérateurs logiques, opérateurs de proximité et de
tion des résultats, quels que soient les habillages spécifiques. concurrence, recherche d’une chaîne de caractères.
— Différents choix et formats de visualisation des résultats en
■ Recherche : ligne et de l’édition en différé.
— sélection de termes et nombre de résultats obtenus ; — Visualisation des images (sur certaines bases).
— précision de la position du terme recherché dans le document ; — Commande en ligne des documents primaires.
— affichage de l’environnement alphabétique du terme ; — Classement des résultats selon leur pertinence et tri
— relations logiques, syntaxiques et de distance entre les suivant les choix de l’utilisateur.
termes ; — Recherche croisée : extraction de termes et stockage dans
— gestion de thesaurus ; une mémoire.
— opérateurs numériques. — Analyse statistique des résultats en fonction des critères de
l’utilisateur.
■ Présentation des résultats : — Sauvegarde des recherches et profils de recherche perma-
— mise en évidence des termes de recherche et de leurs environ- nents.
nements immédiats ; — Liaison entre le logiciel Questel Plus 2 (textuel) et les logi-
— présentation statistique ; ciels DARC (structures chimiques) et Markush DARC (structures
— tri des résultats en fonction d’un ou plusieurs champs ; génériques de brevets).
— utilisation des résultats comme éléments d’une nouvelle
recherche. des nomenclatures chimiques à cause des structures complexes, et
Exemple : à titre d’exemple, quelques fonctionnalités du logiciel d’évolution des nomenclatures. La recherche structurale évite tout a
Questel Plus 2 sont notées (encadré 1). priori sur les fonctions ou les fragments en décrivant le graphe, les
atomes, les liaisons et les degrés de liberté (sites libres).
Les développements récents des logiciels textuels ont surtout Au niveau des brevets, la situation a été compliquée en 1924 par
porté sur l’utilisation complète ou partielle du langage naturel dans la délivrance d’un brevet incluant des structures génériques non
l’expression de la recherche et sur une présentation intelligente des décrites spécifiquement. Le logiciel Markush DARC, issu du logiciel
résultats de la recherche [7]. DARC, résout cette difficulté en prenant en compte les groupements
La constitution de dictionnaires et l’analyse syntaxique des ques- variables (figure 3) [8].
tions permettent d’accepter une expression libre « naturelle » de la
question, ce qui est le cas dans la rubrique de l’Annuaire électro-
nique, quitte à ce que le système propose à l’utilisateur un choix de
rubriques avant de fournir la réponse (figure 2).
Cette utilisation du langage naturel peut être partielle lorsque les
4. Les données disponibles
opérateurs logiques ou de distance sont interprétés par le système
à partir de la question.
La diversité des données disponibles est maintenant très grande,
La présentation intelligente des résultats revient à pondérer la qu’il s’agisse des secteurs d’activité, de la nature de l’information et
pertinence des résultats obtenus et à les présenter suivant un ordre des supports et moyens d’accès [9].
de pertinence décroissante, quitte à ne présenter que ceux qui se
situent au-dessus d’un seuil. De nouveaux moteurs documen- Les trois facteurs principaux ne sont pas indépendants. Par
taires [7] enrichissent les logiciels textuels classiques et permettent exemple, des données bibliographiques couvrent de vastes
de telles présentations à partir des valeurs attribuées aux termes et domaines sectoriels ou multidisciplinaires tandis que des don-
de l’adéquation entre intitulé de la demande et intitulé du document. nées numériques ou factuelles correspondent à des domaines spé-
cifiques. De façon analogue, le traitement des images est plus
Exemple : la question « Analyse de la valeur » est interprétée souvent assuré en local (CD-ROM) qu’en ligne, étant donné les
comme une intersection entre « analyse » et « valeur », avec vitesses de transmission mais, sur ce point précis, la situation
« analyse » précédant « valeur » avec deux mots de distance, ce qui évolue très rapidement.
fournit des réponses pertinentes. Actuellement, le nombre de banques de données en ligne dans le
monde entier signalé par le répertoire américain Gale Directory est
supérieur à 5 000 et l’accroissement durant les 15 dernières années
3.8.2 Logiciel structural a été très rapide même s’il tend actuellement à diminuer d’intensité
(figure 4). Pour l’utilisateur français, le Répertoire des banques de
Le logiciel structural est particulièrement bien adapté aux données professionnelles identifie plus de 2 000 produits acces-
données chimiques car la recherche textuelle se heurte à l’utilisation sibles en ligne.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 9
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

principales de quelques domaines : métrologie, chimie, brevets,


matériaux.

4.1.1 Métrologie

Les différents répertoires de banques de données précédemment


mentionnées qui en identifient plusieurs milliers, n’en mentionnent
que deux spécifiquement consacrées à la métrologie! c’est dire qu’il
faudra chercher ailleurs (autres domaines spécialisés ou fichiers
multidisciplinaires) les compléments indispensables à ces deux réa-
lisations américaine et belge.
■ GIDEP (Government Industry Data Exchange Program)
Il s’agit d’une banque de données factuelles produite et diffusée
par l’US Navy, Naval Warfare Assesment Center situé à Corona,
Californie. La banque est constituée de cinq fichiers : Ingénierie, Fia-
bilité et Maintenance, Métrologie, Défaillance, Produits industriels.
Le fichier Métrologie fournit des données sur les systèmes de tests,
les systèmes d’étalonnage et les technologies de mesure : plus de
25 000 procédures d’étalonnage pour les équipements de tests et
plus de 11 000 manuels de tests de maintenance. Ce fichier inclut les
données du National Institute of Standards and Technology (NIST).
La banque de données prend en compte les données provenant
des États-Unis et du Canada ; sa mise à jour est hebdomadaire et les
données les plus anciennes sont de 1960.
■ MREG (Métrologie Réglementation)
C’est une banque de données de texte intégral produite par le
Département de métrologie du ministère des Affaires économiques
de Belgique. La banque de données recense la réglementation et la
législation métrologique en vigueur en Belgique concernant les
compteurs (électricité, gaz, eau froide), les mesures de liquides, le
pesage des tachygraphes, les thermomètres médicaux, le jaugeage
des bateaux, la masse volumique des céréales, les alcoomètres et
aréomètres pour alcool, les mesures de longueur, de masse de 1 mg
à 50 kg, les unités et les étalons.
Les sources utilisées sont le Moniteur Belge ainsi que les publica-
tions du Département de métrologie. La banque de données bilin-
gue (français et flamand) comporte environ 4 000 documents, elle
est mise à jour lors de la publication de nouveaux textes et elle est
accessible sur le serveur Belindis, Centre de traitement de l’informa-
tion du ministère des Affaires économiques (figure 5).

4.1.2 Chimie

Le secteur correspond à des banques de données généralistes


(tous les aspects de la chimie), à des secteurs plus précis (analyses
Figure 2 – Interrogation de l’Annuaire Électronique
chimiques, chimie industrielle, etc.), à des natures d’information
par secteur d’activité
différentes (références, texte intégral, dictionnaires, structure), ainsi
qu’à des moyens d’accès (surtout en ligne et plus récemment sur
CD-ROM). Cette diversité de l’information chimique est précisée
4.1 Secteurs d’activité pour les accès en ligne (tableau 7).

C’est le premier critère de choix de l’utilisateur : quelles sont les


4.1.3 Brevets
informations répondant à ses besoins dans son domaine d’activité?
Par rapport aux autres sources d’information, les données sur les
Pour faciliter ce choix, les organismes serveurs mettent en évi- brevets ont l’avantage de la rapidité car elles sont déposées et
dence dans leurs catalogues les rassemblements de banques de publiées à des dates précoces. C’est aussi une information forma-
données par grands secteurs montrant ainsi leurs priorités et leurs lisée, centralisée et ordonnée.
axes de développement. Les droits d’un brevet sont ouverts, lors de la délivrance, à partir
D’autres outils, généralistes ou spécialisés, sur support papier ou de la date du premier dépôt. Ce qui explique qu’environ 80 % de
en accès en ligne permettent une première sélection par domaine l’information technique ne soient publiée que dans les brevets.
(tableau 6) D’autre part, les brevets sont toujours antérieurs à toute autre
source documentaire, la publication de l’information dans un pays
Sans reprendre systématiquement toute l’information sectorielle quelconque empêchera la brevetabilité en absence de critère de
de ces répertoires, il est possible d’identifier les caractéristiques nouveauté.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 10 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

Rappel d'une question structurale

Affichage de la question

Lancement de la recherche

La recherche donne 68 réponses

Affichage des réponses structurales


et des références bibliographiques
associées

Figure 3 – Exemple d’utilisation d’une base de données employant un logiciel structural (Pharmsearch). La base Pharmsearch donne actuellement
accès à plus de 100 000 familles de brevets FR, EP, US, GB, DE et de demande WO. Représentant la plus large couverture de structures de Markush
disponible sur le marché, elle permet des recherches aussi bien structurales que bibliographiques.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 11
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

en examen) et légales (différentes dates de vie du brevet, états dési-


6 000 gnés).

5 000 Les brevets représentent plus de 70 banques de données en ligne

s
et plus de 70 titres de CD-ROM correspondent à environ

ue
nq
600 nouveaux disques par an ; soit au total pour les données en

ba
4 000 ligne et sur CD-ROM plus de 35 millions de références différentes.

de
e
br
Les États-Unis produisent près d’un tiers (31 %) des banques de

om
3 000

N
données en ligne et l’Europe plus de la moitié (58 %) correspondant
ducteurs principalement aux productions nationales (France, Royaume-Uni,
Année e pro
2 000
bre d Allemagne, etc.) et régionales : Office européen des brevets. Des
Nom
sociétés privées sont actives dans cette production : Derwent Infor-
1 000 eurs mation Limited au Royaume-Uni, IFI Plenum aux États-Unis.
de serv
Nombre
Ces banques de données sont essentiellement caractérisées par
0
1980 1984 1989 1994 une production de couverture nationale (67 % des banques), par une
périodicité rapide des mises à jour (la moitié des banques ont une
Figure 4 – Évolution du nombre de banques de données en ligne mise à jour quotidienne ou hebdomadaire), par des natures d’infor-
dans le monde mation bibliographiques et non bibliographiques : classification,
jurisprudence, texte intégral, structures chimiques, images, et par
une diffusion majoritairement américaine.
TITRE REGLEMENT RELATIF AUX INSTRUMENTS DE PESAGE A FONCTIONNEMENT NON
AUTOMATIQUE. Texte coordonnŽ : AR7509090:MB751218 - AR770218:MB770409
AR780809:MB780819 - AR830426:MB830607 - AR831216:MB831224
AR860120:MB860204 (+ERRATA MB760602) - AR890808:MB890905
4.1.4 Matériaux

CHAP IX TAXES D' APPROBATION DE MODELE, DE VERIFICATION ET DE CONTROLE


TECHNIQUE ET FRAIS DE PRESTATIONS Dans le secteur plus précis des matériaux, le « Répertoire des
36. TAXES DE VERIFICATION banques de données professionnelles » identifie 50 banques de
36.1 Montant des taxes de vŽrification
données dont la nature et l’origine sont précisées (tableau 8). Ce
TEXTE ..... tel que modifiŽ par : AR890808/MB890905 .... domaine est caractérisé par des données factuelles (caractéristiques
..... tel que modifiŽ par : AR860120/MB860204 .... physiques des matériaux) qui permettent la sélection de matériaux
36.1.1 Instruments en fonction de leurs propriétés. La production est principalement
assurée en France et à l’étranger par des centres de recherche
Valeur maximale de la portŽe
maximale augmentŽe de la
Taxe de vŽrification par instrument collective.
en francs
capacitŽ maximale additive de tare

30 kg 400
500 kg 750
2 t 1 500 4.2 Nature de l’information
5 t 2 000
10 t 4 000
20 t 6 000
40 t 8 000
La nature de l’information est aussi un élément de choix impor-
60 t 10 000
80 t et plus 12 000 + 100 par
tant en fonction du problème à résoudre et du type de réponse
tonne supplŽmentaire attendu : données pratiques d’aide à la décision, caractéristiques
d’une entreprise ou articles scientifiques récents. Ces différentes
Figure 5 – La banque de données « Réglementation belge natures sont souvent intégrées en particulier dans les nouveaux
de métrologie » : un exemple d’interrogation services orientés vers l’utilisateur final précédemment mentionnés.
Il est néanmoins possible de distinguer six natures de l’information :
données bibliographiques, répertoire, données factuelles (tex-
L’information est formalisée, car la rédaction et la présentation tuelles-numériques), données numériques, texte intégral et images.
des documents ainsi que la présentation des éléments bibliographi-
ques sont normalisées au niveau international.
L’information est centralisée car aux niveaux national, régional 4.2.1 Données bibliographiques
(Office européen des brevets, Organisation africaine de la propriété
intellectuelle, African Regional Industrial Property Organization) et
international (Organisation mondiale de la propriété intellectuelle),
La référence bibliographique (document secondaire) signale un
un seul organisme publie les documents de brevets.
document primaire (article de périodique, ouvrage, rapport, thèse,
L’information est ordonnée par la Classification internationale des etc.). La référence est éventuellement enrichie d’éléments
brevets (CIB) et par la Classification européenne (ECLA). d’indexation (descriptions, indices de classification), et d’analyse
Les caractéristiques des données brevets disponibles en ligne ou (résumé).
sur CD-ROM en font une information stratégique pour l’entreprise.
Les informations sont techniques (titre, abrégé, classifications, Ces banques de données issues de l’informatisation des bulletins
rapport de recherche et éventuellement texte intégral), administra- secondaires imprimés forment les premières banques de données
tives (noms et adresse des déposants, inventeurs et mandataires, scientifiques en ligne (PASCAL, Chemical Abstracts, BIOSIS, INS-
langues de publication, de dépôt et de procédure, date de requête PEC, Medline, etc.).

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 12 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

Tableau 6 – Exemples de banques de banques de données


Répertoire de banques de données Banques de données Nombre de banques Producteur Serveur Accès
Répertoire des banques INFOBDD 2 000 ADBS Jouve Vidéotex
de données professionnelles

Gale Directory of Databases GALE 5 600 Gale Research Questel-Orbit, ASCII


KRI
Commission
I’M Guide I’M Guide 4 000 européenne ECHO ASCII et Vidéotex

Guide des banques de données Minitel BASES 300 FLA Consultants Fidis-Infotel Vidéotext
pour l’entreprise
ADBS : Association des spécialistes en information et documentation
KRI : Knight Ridder Information

Tableau 7 – Banques de données chimiques


Bibliographie Répertoire Texte intégral Factuelle Numérique
Tous les aspects chemical abstracts caold, cassi, chem. j. elsevier science gmelin, belstein,
chemical catalog, publishers, chem. j. hodoc
online, janssen, american chem. soc.,
chimitel, cschem, chem. j. royal soc. of
cscorp, chapman chemistry, chem. j. vch
and hall chem d.b. verlagsgesellschaft
online
Chimie industrielle chem. engineering chem. and engieneering chem. activity status chem. economics
and biotech. abs, news, chemishe industrie, report, chem. age handbook, chemsafe
chem. industry notes, europ. chem. news project file,
chemie-wirtschafts chem. plant database,
dok., chemindex, hazardous chem. info.
kirk-othmer online, disposal
speciality chem.
udpate prog, chem.
bus. newsbase
Chimie analytique analytical abstracts chem. j. of aoac cambridge struct. d.b.,
internat. crystal data
identification file,
crysmet, infrared
search syst., crystin,
reg. mass spectral
data, search prog.
infrared spectra,
specinfor, wiley mass
spectral search syst.
Toxicologie chem. safety chemlist chem. eval. search and
newsbase, toxline, retrieval syst., chem.
toxibase, toxlit. hazard response info.
syst., environ. chem.
data inf. network,
internat. chem.
regulatory monitoring
syst., chem. carcinog.
reseach info.
Réactions crds, cheminformrx,
chemreact, derwent j.
of synth methods, cas
react
Nomenclature chemname,
chemsearch,
chemline, claims
compound reg.,
registry file
Structure eurecas, marpat,
substruct.
and nomenclature
search. syst., wpim

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 13
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

Tableau 8 – Caractéristiques des banques de données Copyright


matériaux (Répertoire des banques de données Numero
professionnelles) English title

Auteur
Nature de Affiliation
Producteur Pays d’origine
l’information
Type document
Bibliographique 50 % Recherche 40 % France 34 % Source
collective
Langue
English abstract
Factuelle 22 % Recherche 30 % États-Unis 34 %
publique

Numérique 14 % Sociétés 30 % Royaume-Uni 12 %


industrielles

Répertoire 12 % Allemagne 10 %

Texte intégral 2% Autres 10 %

Données 1996.

Code classement
Descripteur
Les champs d’information les plus caractéristiques d’une banque
de données bibliographiques sont les suivants :
— titre original et/ou traduit ;
— nom des auteurs ; Terme generique
— affiliation (et adresses) des auteurs ;
— nature du document signalé : article, ouvrage, thèse, etc. ; English descriptor
— référence bibliographique : titre du périodique, date de publi-
cation, volume, tome, page, nombre de références citées, résumé ;
— code de classement ;
— descripteurs issus d’un vocabulaire sémantiquement organisé English generic term
(thesaurus) ou d’une liste de termes.
Spanish descriptor
D’autres éléments peuvent figurer dans une banque de données
bibliographiques, en particulier si elle est multilingue. Spanish generic term
Une référence extraite de la base de données PASCAL précise ces
différents champs d’information (figure 6). Codes PACS
Localisation
Ces éléments représentent un tronc commun des données biblio-
graphiques signalant différents types de documents. Des données Figure 6 – Exemple de référence bibliographique obtenue après
complémentaires complètent ce premier niveau pour des docu- une recherche sur la base PASCAL
ments spécifiques :
— thèses : date de la soutenance, directeur de recherche, prési-
dent du jury, lieux de dépôt ; — URBAMET, dans le domaine de l’aménagement du territoire,
— actes de congrès : dates précises, lieu, organisateur scienti- fournit des références sur les instruments de mesure dans le trans-
fique, éditeur des actes ; port routier (figure 8).
— rapports de recherche : responsable scientifique, dates et
durée de la recherche, organisme financier, disponibilité et condi-
tions d’acquisition du document ; 4.2.2 Répertoire
— normes : origine administrative, filiation, apparentement,
statut juridique ;
Il s’agit d’informations non bibliographiques correspondant à des
— brevet : les natures techniques, administratives et légales du
listes d’organismes (entreprises, laboratoires de recherche), de
document de brevet correspondent à un grand nombre d’infor-
personnes, de recherches en cours, d’annonces de congrès, de
mations complémentaires, déposants, mandataires, priorité, rap-
banques de données, etc. Cela peut correspondre aussi aux listes de
port de recherche, dates et numéros d’enregistrement et de
termes (dictionnaire) ou aux indices de classification constituant
publication des différentes étapes de la vie du brevet.
une aide à la recherche en ligne.
La banque de données PASCAL, généraliste en sciences et techni-
ques, n’est pas la seule à couvrir les domaines de la métrologie et de Ces données fournissent une réponse précise à une demande de
l’automatisme. Parmi les réalisations françaises : renseignement ponctuel :
— IALINE, dans le domaine de l’industrie agroalimentaire, fournit — qui fabrique quoi?
928 références à partir du descripteur instrument de mesure durant — qui recherche quoi?
les neuf dernières années (figure 7) ; — quelle information disponible dans quel domaine?

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 14 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

Vous avez 4 référence(s)


Sujet : INSTRUMENT DE MESURE
Sujet : CONTROLE DE QUALITE
Sujet : REFRACTOMETRE
COPYRIGHT : CDIUPA
DOCUMENT : 1/4
NUMERO : 265656
TITRE FRA : Les polarimètres et les
réfractomètres automatiques
OTHER TIT : Automatické polarimetry a
refraktometry
AUTEURS : FRIML M.; TICHA B.
AFFILIAT. : Cukrovarnicky prumysl.
statni podnik vedeckotech.
obchodnich sluzeb. Praha.
CSK
SOURCE : Listy cukrovarnické (CSK).
1990. V. 106. N. 9. P.
197-203. 8 fig.
DOC. TYPE : P
LANGUE : CZE
RESUME : Présentation de plusieurs
de ces instruments de
mesure, appliqués au
contrôle de la pureté du
jus de sucrerie
DESCRIPT. : Jus de sucrerie; Contrôle
de qualité; Instrument de
mesure; Polarimétrie;
Réfractométrie
Figure 8 – Recherche sur des références traitant de la métrologie
Figure 7 – Exemple de référence obtenue par IALINE dans Urbamet

Exemples : de quelques banques de données répertoire : Dans le cas de la banque de données THERMODATA (propriétés
— entreprises : EURIDILE, BOTTIN DES ENTREPRISES, thermodynamiques des éléments, composés stœchiométriques,
EURODUN, HOPPENSTEDT, TELEFIRM ; phases polyconstituées de la chimie minérale sèche et, plus parti-
— personnes : Annuaire électronique, ADMINISTRATEURS, culièrement, métallurgique), des réponses à des problèmes de
ADMITEL ; complexité croissante peuvent être fournies à l’utilisateur (figure 9) :
— laboratoires de recherche : TELELAB ; — caractéristiques thermodynamiques d’un composé en fonction
— recherches en cours : AGREP, BIR/INSERM, FEDERAL de la température ;
RESEARCH IN PROGRESS ; — caractéristiques thermodynamiques d’une réaction en fonction
— annonces de congrès : EVENTLINE, MEETING AGENDA ; de la température ;
— banques de données : INFOBDD, GALE ;
— classification de brevets : CIB, ECLATX ; — équilibres chimiques complexes ;
— dictionnaire chimique : CHEMLINE, CHEMNAME, REGISTRY — températures de flamme ;
FILE. — diagramme de phase ;
— propriétés thermodynamiques de flamme.

4.2.3 Données numériques


4.2.4 Données factuelles (textuelles numériques)
Dans le domaine des sciences et des techniques, les données
numériques concernent particulièrement les propriétés physiques Comme dans le cas des données numériques, les données fac-
et ce, dans des secteurs d’activité très pointus. tuelles fournissent la réponse précise au problème posé. Mais,
l’information ne se limite pas à un tableau de valeurs numériques
Il s’agit, par exemple, de caractéristiques thermodynamiques ou
permettant par exemple la détermination des conditions de réac-
spectroscopiques de composés ou de mélanges de composés
tions chimiques, mais elle fait intervenir des données de natures
chimiques. En fonction d’une ou de plusieurs variables, la banque
différentes, d’autre types d’information (texte, adresses, références
de données fournit les valeurs des grandeurs physiques deman-
de documents, etc.).
dées. Les données peuvent répondre à différents besoins de l’utili-
sateur, qui vont des tableaux de données brutes, analogues à celles L’interrogation de VULCAIN BDM PLUS, produite par le Centre
d’un répertoire imprimé, à l’obtention d’outils d’aide à la décision, technique de l’industrie du décolletage (CTDEC), le Centre tech-
de conception assistée par ordinateur (CAO) ou de synthèse assistée nique des industries mécaniques (CETIM) et le Centre technique des
par ordinateur. C’est cette dernière utilisation qui, par les logiciels de industries de la fonderie (CTIF), fournit pour un matériau donné des
traitement de données, fournit une plus-value considérable à la renseignements complémentaires scientifiques, techniques, chimi-
masse des données numériques initiales. ques et commerciaux (figure 10).

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 15
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

L’importance du rôle des données numériques et textuelles-


numériques a provoqué en 1966 la création de CODATA (Committee
on Data for Science and Technology). Ce comité scientifique interna-
tional a pour objectifs principaux :
— la promotion de l’évaluation et du contrôle de qualité des
données scientifiques et technologiques ;
— le développement des méthodes d’acquisition, de traitement
et d’analyse des données, en stimulant les déterminations expéri-
mentales, les calculs théoriques et les recherches sur les
corrélations ;
— le développement des coopérations entre les producteurs, les
organisateurs et les utilisateurs de données ;
— le développement de la compilation et de la validation à partir
d’une évaluation critique des données ;
— l’étude de méthodologie, d’évaluation, de traitement, d’ana-
lyse, de diffusion recherchant l’optimisation de la compatibilité ;
— l’encouragement à l’utilisation des symboles, des unités, de la
nomenclature, de la terminologie et des constantes recommandées
par les différentes unions scientifiques ;
— le recensement des sources de données existantes.
L’organisation sectorielle (groupes de travail sur des thèmes
précis) et nationale de CODATA (Comités nationaux des différents
pays membres) incite à une amélioration de la production des
données scientifiques et à un développement de leur utilisation [10].

4.2.5 Texte intégral


Figure 9 – Exemple d’interrogation de la base de données
Thermodata Les données en texte intégral se sont développées moins vite
dans les secteurs scientifiques et techniques que dans le domaine
juridique ou dans le domaine de la presse. C’est actuellement une
nature d’information en fort accroissement par le volume d’infor-
mation et la diversité des supports.
V U L C A I N B d m P l u s
(1/3) Il peut s’agir d’un texte complet codé ASCII d’un article dont les
DESIGNATION COMMERCIALE termes sont interrogeables (Journaux de l’American Medical Asso-
Tube en INCONEL G25 ciation, de l’American Chemical Society ou de la Royal Society of
FOURNISSEUR OU PRODUCTEUR Chemistry, textes de brevets américains) ou de documents numé-
CASTER INCO ALLOYS FRANCE
FAMILLE risés (fac-similé de chaque page avec dessins) auxquels sont ajoutés
Tube étiré à froid de petits diamètres des éléments de recherche (fac-similés des demandes de brevets
et de très haute précision en alliage européens : CD-ROM ESPACE).
réfractaire au nickel-chrome-molybdène
avec addition de niobum.
EQUIVALENCE AFNOR 4.2.6 Images
Nuance non normalisée : NC22Nb
C’est une nature d’information en développement très récent, uti-
(Donnée à titre indicatif, la nuance lisant les capacités croissantes de traitement des ordinateurs et les
jugée équivalente pouvant différer par vitesses de transmission plus rapides. Les informations sont dispo-
certains détails). nibles en ligne : logos de dessins de marques, (TRADEMARKSCAN-
U.S. STATE pour les marques américaines ou FMARK pour les
V U L C A I N B d m P l u s marques françaises), dessins de brevets accompagnant les données
PROGRAMME DE FABRICATION bibliographiques (WPI de Derwent ou FPAT de l’INPI). Elles sont
aussi disponibles en CD-ROM avec le texte fac-similé, comme cela
Non défini avec précision sur catalogue était dit au paragraphe précédent.
Consulter le fournisseur (2/3)
DESIGNATION COMMERCIALE
Tube en INCONEL 600 4.3 Caractéristiques des données
FOURNISSEUR OU PRODUCTEUR
LE GUELLEC Le secteur d’activité et la nature des informations ne suffisent pas
FAMILLE
Tube étiré à froid de petits diamètres à caractériser une banque de données. La politique documentaire
et de très haute précision en alliage du producteur détermine une série de choix qui, dans un domaine
nickel-chrome-fer à haute teneur en donné et pour une nature donnée, conduit à une grande variété de
nickel. produits. Dans les choix successifs du producteur, il est possible de
EQUIVALENCE AFNOR noter principalement :
Nuance non normalisée : NC15Fe ● pour les données bibliographiques :

(Donnée à titre indicatif, la nuance — choix des publications (couverture large ou spécifique, nature
jugée équivalente pouvant différer par des publications, pays d’origine, langues, etc.) ;
certains détails). — sélection des documents ou signalement systématique ;
— méthode et nature de l’indexation ;
Figure 10 – Exemple de renseignements ● pour les données factuelles :
donnés par Vulcain BDM PLUS — origine des données (expérience ou littérature scientifique) ;

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 16 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

— type de validation et de contrôle de cohérence des données ;


— nature de l’environnement logiciel et de l’assistance à l’utilisa-
5. Les producteurs
teur.
Ces différents choix du producteur fournissent à l’utilisateur une ■ Au niveau international, l’effort initial des Agences fédérales
série de données qualitatives (en particulier l’indexation) et quanti- américaines, dans le développement des banques de données
tatives (volume, accroissement, périodicité et délais des mise à scientifiques et techniques, a été ensuite relayé par des sociétés
jour). savantes et des sociétés privées.
Sans faire du volume d’information une panacée, car une La présence d’organismes publics reste importante, par exemple,
« petite » banque de données répondant précisément aux préoccu- National Library of Medicine, U.S. Department of Agriculture, U.S.
pations de l’utilisateur peut être plus efficace qu’une « grande » où Department of Commerce, U.S. Department of Energy, U.S. Environ-
la majeure partie des données ne présente pas d’intérêt pour l’utili- nemental Protection Agency, U.S. Patent and Trademark Office.
sateur précis, il est néanmoins utile d’identifier les gisements impor-
tants d’information dans le monde (tableau 9). ■ Les sociétés savantes, associations à but non lucratif, ont
toujours joué un rôle important dans les sciences et les techniques,
ce qui en font des producteurs très actifs de banques de données :
American Chemical Society aux États-Unis, Royal Society of
4.4 Diversité des moyens d’accès Chemistry au Royaume-Uni. L’intérêt d’une couverture mondiale et
les coûts élevés de production incitent à la production de données
par des structures internationales : Agence internationale de l’éner-
La diversité des supports et des moyens d’accès apparaît tout au gie, Organisation pour l’alimentation et l’agriculture, Office euro-
long de cette étude des banques de données scientifiques et techni- péen des brevets, Organisation mondiale de la propriété intellec-
ques : accès professionnel en ligne, accès en ligne orienté vers l’uti- tuelle.
lisateur final, accès vidéotex, accès local. De plus en plus
fréquemment, ces différents accès sont proposés pour une même ■ Les sociétés commerciales interviennent aussi dans ce secteur,
information, c’est à l’utilisateur de sélectionner, en fonction de ses globalement moins rentable que celui des données financières ou
besoins spécifiques, les modes d’accès indispensables : CD-ROM des données juridiques. Des éditeurs de produits scientifiques origi-
pour tous accès fréquents, archivage et édition, accès professionnel naux ont su intégrer rapidement la diffusion de données en ligne ou
pour accès fréquent et diversifié, accès vidéotex pour accès occa- en local. Derwent Publications Limited qui a repris, en 1993, soit
sionnel. Les banques de données scientifiques et techniques sur 40 ans après sa fondation, son nom d’origine : Derwent Information
CD-ROM ont d’abord été analogues aux données bibliographiques Limited montre par ce changement l’évolution des services fournis
en ligne. L’installation de texte intégral avec images en fac-similé mais aussi la lenteur avec laquelle la vision des pionniers s’est
sur CD-ROM a présenté durant les cinq dernières années un intérêt inscrite dans la pratique des utilisateurs. De façon analogue,
par rapport au texte seul ou à la transmission lente des images en d’autres éditeurs ont trouvé une place dans ce secteur ; Institute for
ligne. Avec la transmission de débits d’information de plus en plus Scientific Information, IFI Plenum et Knight Ridder aux Etats-Unis,
importants, cet intérêt du CD-ROM diminue. Reed Elsevier aux Pays-Bas et Royaume-Uni, Bertelsmann en Alle-
Des informations généraliste ou sectorielles sont accessibles sur magne. Cette intervention récente des grands éditeurs modifie
CD-ROM, par exemple : (cf. § 3.4), les conditions organisationnelles et techniques de ce sec-
teur d’activité : concentration verticale intégrant la chaîne complète
— sciences et techniques : PASCAL, AFP-SCIENCES ; de production (producteur de revues primaires, revues secondaires,
— brevets : ESPACE, BREF, COSMOS ; banques de données bibliographiques et texte intégral, CD-ROM et
— chimie : CASurveyor ; serveur de banques de données).
— biomédical : MEDIDOC, VIDAL, BIRD ;
■ En France, la production de banques de données, tous secteurs
— agronomie : SESAME, AVES, ARBRES EXPERT ;
d’activité confondus, a vu progressivement l’émergence d’un sec-
— énergie : PÉTROLE ET GAZ ; teur privé. La répartition des banques de données, d’après la struc-
— urbanisme : URBADISC. ture juridique du producteur, indique une augmentation de 23 % à
À titre d’exemple, quelques comparaisons d’accès sont notées 40 % de sociétés commerciales entre 1982 et 1993. Le secteur scien-
pour les banques Chemical Abstracts et Pascal (tableau 10). tifique et technique reste, par contre, celui des producteurs publics
avec l’Institut national de la propriété industrielle (INPI), l’Institut de
l’information scientifique et technique (INIST) du CNRS, ainsi que
d’autres producteurs plus spécialisés : BRGM, CEA, CEDOCAR,
4.5 Qualité des services d’information CNET, GDF, INRA, INRIA, INSERM. Les centres techniques indus-
triels et les centres de recherche collective sont des producteurs de
données factuelles et bibliographiques pour les entreprises (CETIM,
La grande diversité des services d’information, la disparition,
CTDEC, IFP, LNE) (*).
durant les dernières années, de nombreux produits, ainsi que la
mise à disposition du public de produits imparfaits (couverture (*) BRGM : Bureau de recherches géologiques et minières
réelle par rapport aux objectifs annoncés, indexation, délai et pério- CEA : Commissariat à l’Énergie atomique
dicité des mises à jour, services d’assistance technique, etc.) doivent
CEDOCAR : Centre de documentation de l’armement
inciter utilisateurs, producteurs et serveurs à une efficace politique
de qualité [11]. En France, cette démarche a été perturbée par l’effet CNET : Centre national d’études des télécommunications
Minitel qui rassemble arbitrairement les intérêts divergents des pro- GDF : Gaz de France
ducteurs : données grand public et données professionnelles, ergo-
INRA : Institut national de la recherche agronomique
nomie et contenu, paliers tarifaires faibles et élevés.
INRIA : Institut national de recherche en informatique et automatique
La démarche qualité des banques de données scientifiques et
techniques doit porter principalement sur le contenu et être définie, INSERM : Institut national de la santé et de la recherche médicale
comme toute démarche qualité, par l’adéquation aux besoins des CETIM : Centre technique des industries mécaniques
utilisateurs. Les associations professionnelles (ADBS, GFII, etc.) CTDEC : Centre technique de l’industrie du décolletage
doivent travailler ensemble à la validation de l’offre, première étape
vers une qualification des services sous forme de label, de quali- IFP : Institut français du pétrole
fication ou de norme. LNE : Laboratoire national d’essais

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 17
BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________

Tableau 9 – Volume d’information des principales banques de données scientifiques et techniques (juin 1997)
Nb. de réf. Accroissement
Banque Origine Début Secteur
(millions) annuel (million)

EDOC F/Internat. 1902 27,2 0,7 Brevets


INPADOC Internat. 1968 27 1 Brevets
REGISTRY FILE USA 1957 16,4 0,6 Chimie
SCIENCE CITATION INDEX USA 1974 14,7 0,7 Sciences et techniques
CHEMICAL ABSTRACTS USA 1967 13,2 0,7 Chimie
PASCAL F 1973 12 0,5 Sciences et techniques
JST Japon 1975 10,3 0,6 Sciences et techniques
BIOSIS USA 1969 9 0,48 Biologie
MEDLINE USA 1966 8,8 0,4 Médecine
DERWENT WORLD PATENT INDEX GB 1963 7,5 0,36 Brevets
BELSTEIN Allemagne 1779 6,8 0,3 Chimie
EMBASE Pays-Bas 1974 6,5 0,37 Médecine
INSPEC GB 1969 5,2 0,26 Physique, Électricité, Électronique
JAPIO Japon 1976 4,7 0,25 Brevets
COMPENDEX USA 1970 4,3 0,17 Ingénierie
ENERGY SCIENCE AND TECHNOLOGY USA 1974 3,5 0,16 Énergie
AGRICOLA USA 1970 3,5 0,08 Agriculture
CLAIMS USA 1950 3 0,11 Brevets
CAB GB 1973 2,9 0,15 Agriculture
AGRIS Internat. 1975 2,6 0,16 Agriculture
DEUTSCHE PATENDATENBANK Allemagne 1968 2,6 0,1 Brevets
TOXLINE USA 1965 2,2 0,12 Toxicologie
GEOREF USA 1785 2 0,07 Géologie
NASA USA 1962 2 0,07 Aéronautique
NTIS USA 1964 1,9 0,07 Rapports
DERWENT PATENT CITATION INDEX GB 1970 1,6 0,1 Brevets

Tableau 10 – Complémentarité des accès en ligne et en local


Accès en ligne Accès local

Professionnel Utilisateur final CD-ROM


Chemical Abstracts Contrat avec différents serveurs : Contrat avec CAS : service Scifinder CASurveyor 15 titres de CD-ROM
Questel-Orbit, STN, Knigth Ridder
Information, etc.
Antériorité : 1967 Antériorité : 1993
Mise à jour : hebdomadaire Mise à jour : mensuelle
PASCAL Contrat avec différents serveurs : Accès kiosque télématique : 08 36 29 36 01 PASCAL CD-ROM
Questel-Orbit, Knight Ridder Infor-
mation.
Antériorité : 1973 Antériorité : 1990
Mise à jour : hebdomadaire Mise à jour : trimestrielle

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
R 120 − 18 © Techniques de l’Ingénieur, traité Mesures et Contrôle
_____________________________________________________________________ BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES

Depuis plus de quinze ans, les producteurs français se sont cons- durant les dernières années, quelques axes essentiels peuvent être
titués en association : Groupement français de l’industrie de l’infor- dégagés de ce foisonnement de produits nouveaux.
mation (GFII), lieu d’échanges et de réflexion et force au sein de
l’industrie de l’information au niveau national, européen et interna- ■ Orientation de services vers l’utilisateur final. Initiée en France
tional [12]. Les principaux thèmes étudiés par les groupes de travail avec les services vidéotex en accès kiosque télématique, cette
sont la diffusion des données publiques, la déontologie et la respon- tendance a été confirmée avec les services à vitesse élevée réalisés
sabilité du producteur, la protection juridique des données [13]. par les producteurs pour des clientèles spécifiques avec des tarifi-
De façon analogue, au niveau européen, l’European Information cations adaptées. Cette orientation est liée à la concentration verti-
Industry Association (EIIA) représente les intérêts des producteurs cale (rapport direct entre producteur et utilisateurs) et au
européens, en particulier dans la définition et la mise en pratique développement de services intelligents (par exemple, accès en lan-
d’une politique de l’Union européenne en matière d’information. gage naturel).

■ Services intelligents. L’amélioration continue des logiciels docu-


mentaires est complétée par une intelligence des services, ajoutée
6. Marché, coûts au niveau central ou local. En amont, compréhension de la question
exprimée naturellement, en aval, sélection et présentation des
et tarification résultats. L’utilisateur obtient, comme résultat de sa recherche, un
service élaboré et adapté et non un produit brut. Cette tendance,
comme la précédente, fait évoluer la fonction des professionnels de
l’information vers l’évaluation qualitative des services, le conseil et
6.1 Marché des banques de données la formation des utilisateurs.

■ Concentration verticale. La nécessité d’organismes indépendants


S’il a pu être prématuré, il y a une dizaine d’années, de parler de assurant d’une part, la production et, d’autre part, l’accès à l’infor-
marché de l’information électronique, les études de l’Union euro- mation est moins évidente aujourd’hui qu’il y a vingt ans. Le produc-
péenne, de l’OCDE ou de sociétés commerciales montrent teur assure lui même la vente des publications papier, des CD-ROM
aujourd’hui l’importance économique de ce secteur. L’Observatoire et de services en ligne si la tarification de ces derniers permet de
du marché de l’information de l’Union européenne a publié le chiffre fidéliser la clientèle d’un contenu important d’information.
d’affaires global des fournisseurs d’information électronique en
1992 (cf. doc R 120). ■ Concentration horizontale. C’est une évolution récente des
serveurs et très importante pour l’utilisateur. Le choix n’est plus
En France, une étude du marché de l’information électronique aussi ouvert qu’il y a quelques années : trois serveurs principaux
professionnelle a été effectuée en 1995 par le GFII (cf. doc R 120). Le couvrent au niveau mondial l’information scientifique et technique.
marché français est évalué à environ 4,7 milliards de francs. Au Leur recouvrement étant très important, le chiffre d’affaires du
niveau européen, le marché français est le deuxième (17,3 %), après domaine scientifique et technique relativement restreint, la concur-
le Royaume-Uni (28,8 %) et avant l’Allemagne (14,6 %) et l’Italie rence est d’autant plus forte.
(8,7 %) [14].
■ Complémentarité des services professionnels et des services
Internet. La richesse rapidement croissante des services disponibles
6.2 Coûts et tarifications plus ou moins gratuitement sur Internet, les fait prendre en compte
dans la recherche d’information professionnelle. La recherche
rapide d’une information structurée et payante est complétée par
Se reporter en doc. R 120. une information aléatoire et informelle dont la recherche gratuite est
longue mais dont les résultats sont originaux : recherche universi-
taire, forums et lettres d’associations, rapports d’activité d’entre-
prise.
7. Conclusion Ces différents axes de développement indiquent que le contenu
de l’information, les méthodes de traitement et les moyens d’accès
offrent des possibilités nouvelles à l’utilisateur, à lui d’identifier, de
À la fin de ce panorama rapide des banques de données scienti- rassembler et d’intégrer les différents éléments du puzzle pour
fiques et techniques qui montre des variations fondamentales participer efficacement au développement scientifique et technique.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle R 120 − 19
P
O
U
Banques de données scientifiques R
et techniques
E
N
par Bernard MARX
Adjoint au Responsable du Département de la Documentation et de l’Information,
Institut National de la Propriété Industrielle (INPI)
S
A
Données économiques
V
1. Coûts et tarifications des banques de données en ligne 1.2 Utilisation des banques de données
Les coûts d’utilisation des banques de données en ligne correspondent aux
différentes étapes pour atteindre des informations : réseau téléphonique,
Les deux principaux facteurs de tarification de l’utilisation des banques de
données en ligne, durée et résultats obtenus, ont fortement évolué durant les
O
réseau(x) de télétransmission, serveur et banques de données.
1.1 Réseaux téléphoniques et télétransmission
dernières années et vont être complètement remis en cause durant les pro-
chaines années avec les bouquets de services accessibles à très grande
vitesse. Le coût horaire traduit l’influence du serveur avec l’utilisation de son
I
Mise à part l’unité de base du réseau téléphonique (0,73 F), les coûts de télé-
transmission dépendent des réseaux utilisés, de la durée et, dans certains cas,
du volume transmis.
logiciel de recherche, c’est aussi le facteur unique qui intervient dans l’utili-
sation des services accessibles en kiosque télématique. R
La tarification des résultats traduit l’importance du producteur qui a
Le coût d’accès à un serveur français pour un utilisateur français par le construit la banque de données avec la limite, par exemple dans le cas des
réseau Transpac est lié : brevets, de l’intérêt d’un résultat nul qui nécessite néanmoins pour l’obtenir la
constitution coûteuse d’une banque de données.
— à la durée 25,32 F H.T./heure;
— au volume transmis 0,052 F H.T./k octet.
Généralement, le serveur facture plus simplement un coût uniquement
Actuellement, les deux facteurs interviennent encore de façon prépondé-
rante. Par exemple, les banques de données du serveur Questel-Orbit propo-
P
horaire, par exemple dans le cas de Questel-Orbit : 40 F H.T./heure.
Dans le cas des connexions à un serveur étranger, l’utilisateur a le choix
sent des coûts horaires de 300 F à 1 600 F, dont la moyenne est d’environ 500 F
mais qui correspond généralement à différents groupes et tarifs horaires de
produits : presse en texte intégral (350 F/h), marques (400 F/h), fichiers scien-
L
entre la connexion à Transpac puis aux réseaux étrangers par l’intermédiaire
du Nœud de transit international (NTI) ou l’utilisation d’un réseau privé.
L’utilisation du NTI a un coût forfaitaire mensuel (50 F) et dépend de la dis-
tifiques (450 F/h), entreprises (400-800 F/h), brevets (800 F/h).
De la même façon, le coût des résultats imprimés en ligne ou en différé est
U
tance, de la durée et du volume transmis.
très variable (de 2 à 100 F) avec une moyenne de 10 F par résultat et des diffé-
rences importantes suivant la nature d’information : fichiers scientifiques
(4,5 F), brevets (7 F), presse (6 à 12 F), marques (6-10 F), entreprises (11-21 F),
S
bilans (105 F).
Tarifs des appels vers l’étranger Mais la critique fondée du manque de signification du coût horaire entraîne
des modifications des méthodes tarifaires :
Europe et États-Unis Autres pays
Maghreb — forte diminution du coût horaire et augmentation du coût des résultats
(IRS-ESA, DIMDI, STN);
Durée/h 36 F 60 F 81 F
— tarification des termes de recherche (STN);
Volume (1 000 segments) 20 F 38 F 43 F — choix de l’utilisateur pour chaque session de choisir les différents fac-
teurs (STN) :
• coût horaire seul;
Soit un coût moyen total de 110 F/h pour un serveur européen et 180 F/h • coût par terme de recherche seul;
pour un serveur américain. • coût horaire et par terme de recherche.
Des exemples de coûts horaires sont notés pour l’utilisation de quelques D’autres natures de recherche provoquent des tarifications spécifiques :
réseaux privés (tableau A).
— recherche de famille de brevets;
— recherches structurales ou sous-structurales dans lesquelles les diffé-
rentes étapes de la recherche et les opérateurs utilisés sont tarifiés.
Tableau A – Coût d’utilisation des principaux réseaux pour Les données accessibles par les nouveaux bouquets de service proposent
l’accès un abonnement mensuel puis un paiement à l’acte (par exemple, visualisation
des résultats) en fonction du service utilisé.
à des serveurs situés en Europe et aux États-Unis
De la prédominance justement critiquée de coût à la durée, aux tarifs des
Serveurs nouveaux services plus orientés vers l’information de vie pratique, l’infor-
Réseaux mation professionnelle cherche des méthodes de tarification signifiantes et
DATA-STAR STN DIALOG LEXIS-NEXIS acceptables pour les différents utilisateurs et opérateurs concernés.

SPRINTNET 16 FS/H − 12 $/H Compris dans le coût 2. Marché des banques de données
d’interrogation des bases Le tableau B donne le chiffre d’affaires global des fournisseurs d’infor-
TYMNET 7 FS/H 65 F/H 12 $/H
mation électronique (d’après l’Observatoire du marché de l’information de
EUNETCOM 16 FS/H − 21 $/H − l’Union européenne).

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


est strictement interdite. − © Techniques de l’Ingénieur, traité Mesures et Contrôle Doc. R 120 − 1
P BANQUES DE DONNÉES SCIENTIFIQUES ET TECHNIQUES POUR LES MESURES _____________________________________________________________________
O
U 3. Coût d’utilisation d’Internet

R Tableau B – Chiffre d’affaires des fournisseurs


d’information électronique Les coûts d’utilisation d’Internet comportent plusieurs facteurs.

CA (Milliards d’Écus) ■ Coûts d’abonnement : ils varient suivant l’abonnement choisi. Pour un
abonnement non permanent de 100 à 1 000 F par mois, la moyenne étant de
en ligne CD-ROM et autres Total l’ordre de 250 F. Par exemple, dans le cas du service Wanadoo de France Télé-
E États-Unis 9,6 0,9 10,5
com (F TTC) :

— inscription : 190 F;
N Europe
Japon
3,6
1
0,6
0,3
4,2
1,3 — abonnement mensuel : 110 F (15 heures de connexions comprises);
Total 14,2 1,8 16 — heures supplémentaires : 19 F.

■ Coûts de télécommunication : ils dépendent de la distance entre le poste de


S Le tableau C donne les résultats d’une étude du GFII.
travail de l’utilisateur et le point d’entrée sur Internet de l’ordinateur du four-
nisseur, d’où l’intérêt des communications locales. Le Kiosque Micro France
Télécom permet d’offrir un même tarif pour l’ensemble du territoire.
A ■ Coûts des services : ils sont actuellement gratuits dans la plupart des cas,
Tableau C – Chiffre d’affaires de l’information électronique
V professionnelle en France (MF)
mais un paiement sécurisé devrait permettre des paiements à l’abonnement
et/ou à l’acte.

O Producteurs
Montant

616
%

13 %
Internet en quelques chiffres
— 50 millions d’utilisateurs dans le monde;

I Producteurs/Serveurs
Serveurs
3 160
762
67 %
16 %



16 millions d’utilisateurs aux États-Unis;
300 000 utilisateurs en France (dont 60 000 particuliers);
130 000 serveurs Web dans le monde, + 6 000 par mois;

R CD-ROM
TOTAL
187
4 725
4%
100 %



23 millions d’utilisateurs du WEB dans le monde;
9,5 millions d’utilisateurs du WEB aux États-Unis;
marché d’Internet : 1,1 milliard de dollars.

P Bibliographie
L Références [7] LE LOARER (P.) et NORMIER (E.). – Techni-
ques linguistiques et statistiques pour sélec-
d’annuaires européens et le défi électro-
nique, Monaco, 23-24 mai 1996, 10 pages.
U [1] BOURRETERE (M. F.). – Le point de vue d’un
utilisateur. Gazette du Palais, n° 12-13, 1994,
p. 80-82.
tionner l’information pertinente. IDT 95,
Paris, 21-23 mai 1996, p. 115-120.
[14] Le marché français de l’information électro-
nique professionnelle. Données 1994. Grou-
pement français de l’industrie de l’infor-
S [2] Des banques de données pour les étudiants,
les enseignants, les chercheurs. 7e édition.
[8] BENICHOU (P.), KLIMSZAK (C.), BORNE (P.).
– Handling Genericity in chemical structures
using the Markush Darc Software. J. Chem.
mation (GFII), janvier 1996, 60 p. et annexes.
Répertoires de banques de données
Ministère de l’Éducation nationale, de Inf. Comput. Sci. 1997, 37, p. 43-53.
l’Enseignement supérieur et de la Recherche, ● Gale Directory of Databases. Vol. 1 : Online
1995, 56 p. [9] MARX (B.). – Banques de données scientifi- Databases. Janvier 1997, Gale Research.
ques et techniques. Gazette du Palais, n° 12-
[3] WILLIAMS (J.). – The Scifinder experience. ● Répertoire des banques de données profes-
13, 1994, p. 75-79.
Actes de la Conférence internationale de sionnelles. 15e édition, 1996, ADBS, Paris, 783 p.
[10] Data and knowledge in a changing world. 3 v. ● Répertoire des banques de données Télétel
l’information en chimie, Nîmes 23-25 octobre
édit. J.-E. DUBOIS, N-GERSHON, Actes du pour l’entreprise. 1994-1995, FLA Consultants,
1995, p. 145-159.
14e Colloque international CODATA, Cham- Paris, 343 p.
[4] RAT (N.). – Les grands serveurs ciblent l’utili- béry, 18-22 septembre 1994.
● Répertoire international des banques de don-
sateur final sur l’Internet. Bases, n° 122, [11] SUTTER (E.). – Maîtriser l’information pour
novembre 1996, p. 1-5. nées par le marketing et les études. 1994, FLA Con-
garantir la qualité. AFNOR, Paris, 1993, 134 p. sultants, Paris, 375 p.
[5] Vidéotext. À Jour, Paris, n° 327, 15 juillet [12] Répertoire des membres. Édition 1994-1995, ● Annuaires des banques de données 3628-
1996, p. 6-8. Groupement français de l’industrie de l’infor- 3629. Juin 1994, À Jour, Paris, 64 p.
[6] LINK-PEZET (J.) et LACOMBE-CARRAUD (E.). mation (GFII), 169 p. ● Guide international des banques de données
– Guide pratique d’Internet. À Jour, Paris, [13] CHAMBAUD (S.). – Protection du capital sur les brevets et les marques. 1993, FLA Consul-
1995, 160 p. informationnel, Conférence : Les éditeurs tants, Paris, 279 p.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie


Doc. R 120 − 2 est strictement interdite. − © Techniques de l’Ingénieur, traité Mesures et Contrôle

Vous aimerez peut-être aussi