Vous êtes sur la page 1sur 24

LES SYSTMES DE BASES DE DONNES ET LEUR ADAPTATION LTUDE DES PROBLMES DE LENVIRONNEMENT

1) Les caractristi !es "#ra$es %es %&##es %a#s $e %&'ai#e %e $t!%e %e $e#(ir&##e'e#t La collecte et la mise disposition de donnes est une tape indispensable de tout programme de recherche ayant trait lenvironnement, compte tenu des nombreuses interactions qui existent dans les phnomnes tudis. Cette caractristique commence tre prise en compte par la communaut scienti ique concerne. Les donnes utilises par cette communaut peuvent se sparer en trois grands types ! " les #eux de donnes climatiques provenant de services dobservations ou dobservatoires de recherche en environnement " les observations de campagnes de mesures destines ltude de processus " les donnes spatio"temporelles ournies par des satellites ou des modles, en mode exprimental, oprationnel, ou de ranalyse Ces donnes ont des caractristiques trs di rentes, respectivement ! " sries temporelles longues, portant sur peu de variables, disponibles en temps rel, " observations trs htrognes $couverture, milieu chantillonn, disciplines, techniques employes, etc %& " grand volumes de donnes plus ou moins labores, souvent sur des grilles, rsultant de pr"traitements ou traitements lourds 'our linstant, les utilisateurs ont accs trois niveaux darchivage et de di usion ! " niveau ( ! programme au niveau laboratoire$s& ! collecte et base de ichiers pour mise disposition de la communaut implique. )ravail supplmentaire ncessaire aire pour aller vers le niveau suprieur $au moins validation, mta"donnes( expliquant les donnes, etc..& niveau * ! mise en orme dans une vraie base de donnes dans un centre de + comptence ,, comme ceux -./01C.2/, ou /-/324, 5678/, etc% 2tape qui doit rester proche de la communaut scienti ique niveau 9 ! prennisation, lisibilit internationale, di usion au niveau des utilisateurs $problme ! garantir laccessibilit, i.e. entre autres la gratuit et la non"exclusivit&. .iveau national, ventuellement inter"organismes et1ou europen. 3ta"catalogue*.

" "

1 2

Meta-donne : descriptif complet dun jeu de donnes et des moyens dy accder Meta-catalogue : catalogue de meta-donnes

)) L&r"a#isati&# act!e$$e %es *ases %e %&##es %a#s $e %&'ai#e Oca#+At'&s,-.re Le rapport demand par le C.2/ et le C.4/ 'hilippe :aldteu el en (;;; $+ les bases de donnes pour les gosciences, lments pour un schma directeur ,& a soulign la ncessit de crer des bases de donnes thmatiques en sciences de l0nivers. Celui que 6. <ergametti, '. <essemoulin, C. 3archalot, .. 3et=l, >. )anr et '. :aldteu el ont rdig ! + 'rospective <ases de donnes et services dobservation , prcise les besoins en bases de donnes des services dobservations. La situation des bases de donnes dans le domaine ocan atmosphre a considrablement progress au cours des dernires annes. >e nombreux dveloppements sur des thmes prcis ont t e ectus soit linitiative des organismes de recherche, soit celle des laboratoires ou drations de laboratoires. Ceci est vrai dans le domaine ocanographique comme dans le domaine atmosphrique ! /-/324, C24/?), 56788/, C74-7L-/, 2)@24, 32>-?/, -'/L, % >es bases de donnes se construisent maintenant systmatiquement autour de chaque grande exprience coordonne, et des instituts comme l-'/L ont cAur dtablir un catalogue de lensemble des donnes utilises par leurs chercheurs. Les services cits ci" dessus se sont gnralement bien et utilement mis en place, lexception peut"tre de 56788/, service trop isol ne bn iciant pas dun environnement technico"scienti ique su isant. >ans plusieurs cas, limpulsion du secteur spatial, associ l-./0, a t dterminante, par la mise en place de pBles thmatiques regroupant lexpertise des laboratoires et des moyens spci iques techniques et en personnel $chimie atmosphrique ! 2ther C arosols nuages rayonnement eau ! -C?42 C sur aces continentales ! '7/)2L%&. Ces pBles thmatiques ne sont pas des bases de donnes, mais ont pour vocation de ectuer des traitements de donnes et de grer des bases de donnes relevant de leur thmatique. /ouvent construits autour dexpriences spatiales, ils ont un rBle beaucoup plus large, ncessitant le regroupement de donnes de toutes origines. 2n plus de ces centres thmatiques, les dveloppements des bases de donnes ocanographiques $par -842324 ! /-/324, C24/?),%, ou par le C.2/ ! ?D-/7 pour laltimtrie marine& et du 6-' 32>-?/ trs utilis pour les donnes de campagnes de mesure ont d# rendu de grands services notre communaut. Lannexe ( dcrit quleques"uns des services que nous venons dvoquer. Le dveloppement des services dobservation et des 742s, de mme que la poursuite des observations instrumentales spci iques comme linstrumentation aroporte, ont galement donn lieu la cration dun certain nombre de + petites bases de donnes , spcialises $des r rences y sont donnes dans le document consacr aux services dobservation&. La visibilit de ces bases auprs de la communaut scienti ique ne semble pas optimum, et il conviendrait de lamliorer. Les e orts sur les bases de donnes concernent aussi la acilitation des liens observations E modlisation, qui est de mieux en mieux prise en compte dans llaboration des nouvelles <>>. -l aut noter aussi que lune des principales sources pour lanalyse du climat rcent est maintenant constitue par les r"analyses de donnes par les modles mtorologiques oprationnels. Le dveloppement des modles docan et des techniques dassimilation y a rant conduit la mme volution. 0ne politique volontariste de l-./0 dans ce domaine a donc port ses ruits, en coopration avec dautres institutions, mais les dveloppements ne sont pas termins. Les besoins des utilisateurs, d# di iciles d inir quand on se place purement au niveau de la communaut

scienti ique, doivent tre maintenant r"examins dans le cadre de l-./0"2, en onction des besoins de la socit dans des domaines aussi divers que la qualit de lair et de leau, les risques de pollution atmosphrique ou marine, les risques climatiques et hydrologiques, les vnements extrmes, la sant, lagriculture, la pche, les transports, le tourisme. /) Le c&#te0te i#ter#ati&#a$ >une manire gnrale, il est important de replacer ce problme des bases de donnes dans le contexte international, oF de nombreux services se sont dvelopps avant les nBtres, et se dveloppent maintenant en parallle nos dveloppements nationaux. >s prsent, les chercheurs utilisent largement les bases de donnes trangres, europennes et amricaines. ? cette chelle internationale, le domaine spatial a aussi t moteur C Les institutions amricaines $.?/?, .7??, .C?4& sont trs rquemment utilises, pour des donnes qui ne sont pas uniquement spatiales. Les analyses et ranalyses des modles de grande chelle #ouent un rBle ma#eur dans beaucoup dtudes de processus ou de climatologie. Les donnes issues du C2'33) sont de plus en plus utilise, notamment celles de la nouvelle ranalyse 24?"GH. 0n e ort a t ait au niveau ranIais pour aciliter lutilisation de ces analyses en les rcuprant sur des serveurs nationaux. >ans le domaine de la climatologie observationnelle, les bases de donnes trangres sont aussi largement utilises. Le ait que les 2tats"0nis aient une politique trs librale en matire de distribution de donnes incite les chercheurs utiliser leurs sites. Les donnes europennes sont souvent dun accs plus di icile ! on a longtemps utilis les ranalyses amricaines, daccs totalement libre, plutBt que celles du centre europen, qui demandent des autorisations C dans le domaine spatial, les donnes des satellites amricains sont galement plus aisment disponibles que celles passant par exemple par l2/?. 'our les satellites oprationnels, il est important de noter la mise en place en cours des /atellite ?pplication 8acilities $/?8s& par 2032)/?). -l est important de prvoir un accs de la communaut scienti ique aux donnes quils produiront, qui concernent largement la communaut ocan"atmosphre $et sur ace continentale&. ?ctuellement, laccs des bases de donnes internationales se ait encore souvent au niveau du chercheur individuel, qui est souvent le mieux mme de connaJtre les bonnes ilires pour des donnes trs particulires. >es donnes de base ou dusage trs rquent ont galement t rapatries sur des serveurs ranIais, de aIon en aciliter laccs lensemble de la communaut concerne. -l est important que ces sites dintrt gnral soient bien visibles de cette communaut, et lui soient pratiquement accessibles. Ceci est le premier ob#ecti atteindre, avant mme les e orts vers une + interoprabilit des bases de donnes ,, qui restent encore asse= en amont de la 4echerche 7can"?tmosphre proprement dite. 2n sens inverse, les di rentes bases de donnes existant en 8rance doivent sinsrer dans le contexte international et tre connues et utilisables partir des autres pays. Certains des services ranIais mentionns ci"dessus se sont dvelopps demble dans un cadre international, dautres ont des liens privilgis rsultant des expriences europennes ou internationales dont ils grent tout ou partie des donnes. Cependant, il existe plusieurs cas oF les bases ranIaises restent trop peu connues de lextrieur. >ans ce cas, un portail daccs au niveau national serait certainement un atout pour dvelopper leur notorit. Cependant, rien ne vaudra des dveloppements autour de cooprations scienti iques relles.

1) Les *es&i#s Les dveloppements observs ces dernires annes dans le domaine 7can"?tmosphre, et ceux qui ont lieu en parallle dans des disciplines voisines $-nter aces continentales, avec '7/)2L, par exemple& sont loin dtre connus de toute la communaut 7can ?tmosphre. Le premier besoin est la visibilit des services d# dvelopps et reconnus utiles auprs de la communaut tout entire ! Ceci concerne 3edias"8rance, le centre de >onnes -'/L $dont CL-3/24D&, 2)@24, /-/324, C24/?), -C?42, 7K?'-, '7/)2L , les bases de donnes des services d7bservation et 742s, le /?)37/ pour les donnes de satellite mtorologiques oprationnels, dautres + petites bases de donnes ,%Lexistence dun portail commun inter"organismes pour les bases de donnes en sciences de lenvironnement serait un moyen dassurer une visibilit gnrale. >ans la perspective -./0"2, les applications potentielles aux processus environnementaux et la surveillance de lenvironnement doivent amener un largissement de la communaut des utilisateurs, quil va alloir organiser en les associant ds que possible la d inition des besoins particuliers quils ressentent en matire de bases de donnes. Ceci ncessite une communication entre les secteurs dapplication $hydrologie, inter aces continentales, pollution, biosphre%& et les secteurs scienti iques en amont comme ocanographie, physique et chimie de latmosphre. Les besoins de communication entre disciplines re#oignent l les besoins de compatibilit dans la gestion technique des bases de donnes. -l est essentiel que les services existants se dveloppent en onction des besoins des utilisateurs scienti iques. /il y a un rel besoin de centralisation et de coordination de certains moyens techniques, ainsi que dune + taille critique , pour les bases thmatiques, il est encore plus ondamental que les bases de donnes se dveloppent en relation troite avec leurs utilisateurs $dveloppements initis dans les laboratoires, comits dutilisateurs,%&. -l aut viter la constitution de grands centres plus pilots par la technique que par la thmatique et les besoins rels des utilisateurs. Les besoins di rent dune discipline une autre. Cest la philosophie qui a t retenue pour les pBles thmatiques existants ou en cours de dveloppement, oF les + centres dexpertise , constitus dans les laboratoires d inissent et valident les produits inclure dans les bases de donnes. Cependant, un des besoins entraJns par la multidisciplinarit des sciences de lenvironnement est la possibilit dutiliser en synergie les donnes provenant des divers services existants $ou crer&. Ceci est encore trop souvent une lourde tLche que les utilisateurs hsitent a ronter, mme sils connaissent lexistence des di rentes sources de donnes. /ans tou#ours envisager la solution la plus labore $linteroprabilit complte des bases de donnes& il est ncessaire de mettre en place des ormats et des procdures qui permettent un utilisateur scienti ique dutiliser les donnes provenant de di rents centres dune manire relativement simple. Ceci permettrait par exemple dviter la duplication systmatique des mmes donnes dans des centres di rents. >iverses r lexions sur ce su#et ont t entreprises, par exemple sur lutilisation de normes internationales dans le cadre de 3edias, ou sur celui de grilles de calcul sur les donnes $datagrid& dans le cadre -'/L12urope. M lchelle des laboratoires, des possibilits de calcul sur des machines associes des serveurs de donnes $cas de CL-3/24D& ont d# t employes. -l reste souvent intressant de rapatrier sur un serveur commun permettant des calculs toutes les donnes concernant une exprience particulire C en e et, la plupart des bases de donnes et services crs sont des ournisseurs de donnes, mais

nont pas dans leur onction de permettre des calculs distance sur les donnes quils hbergent. Cependant, il aut se garder dune gnralisation trop hLtive. Les besoins existent dans tous les domaines, mais ils peuvent tre trs di rents suivant les utilisateurs et les sous" disciplines ! il aut tenir compte la ois des utilisateurs recherchant des systmes automatiques permettant par exemple de trouver la valeur dun paramtre en un lieu et un instant prcis et de ceux cherchant combiner et e ectuer des oprations sur de gros ichiers spatio"temporels provenant de satellites, dobservations sol, de modles. 'ar ailleurs, il existe encore des domaines oF le ort de cration de bases de donnes reste aible par rapport lintrt potentiel de ces donnes ! " certaines donnes de services dobservations ou de rseaux dobservations, " les variables biologiques " les simulations de modles $utilisables par des non"modlistes& Ces trois domaines relvent de solutions asse= varies ! Les services et rseaux dobservation se constituent gnralement des bases de donnes adaptes leur problme, mais une plus grande coordination entre eux serait pro itable. -l est galement ondamental que leurs donnes soient prennises. Le problme des variables biologiques relve surtout de la constitution de catalogues et mta catalogues de donnes, et de la volont des chercheurs de aire connaJtre leurs donnes, car il nexiste pas encore dans ce domaine une culture dchange des donnes $voir annexe *&. Les simulations de modles ont lavantage de se prsenter do ice dans des ormats standard lisibles par des logiciels courants. >ans ce cas, le besoin est aussi de cataloguer les simulations qui existent et leurs conditions dobtention, a in quelles puissent servir une communaut plus large que celle des modlisateurs stricto"sensu. >ans ce cadre galement, il est important de prvoir la simulation dobservations par les modles, ce qui suppose gnralement, pour les instruments de tldtection, la mise en Auvre dalgorithmes de trans ert radiati . ?ctuellement, il nexiste pas de politique concerte darchivage des simulations de modles, ceci est gnralement ait au niveau dexpriences particulires, sur des serveurs associs aux centres de calcul utiliss. L aussi, une plus grande transparence devrait simposer, elle serait acilite par un portail daccs commun. >es mcanismes incitati s sont mettre en place pour que ces actions se ralisent ! )out pro#et soumis en rponse un appel do res devrait tre accompagn dun plan de gestion des donnes $donnes ncessaires au pro#et, et donnes produites par le pro#et&. Les moyens et coNts ncessaires cette gestion des donnes doivent tre estims et aire partie de la demande.

2) Acti&#s s&!-aites %a#s $es ,r&c-ai#es a##es 3 Acti&#s i''%iates (. 3ise en place un portail dOaccs C.4/1-./0 vers les di rentes bases de donnes concernant nos thmatiques $ocan"atmosphre"sur aces continentales&. *. 'oursuite du dveloppement des trois services thmatiques mis en place dans la logique du rapport :aldteu el, en coordination C.2/"-./0 ! 2)@24, '7/)2L, -C?42. ?ssurer la compatibilit entre ces services, et avec les services pr"existants $ex ! /?)37/& 9. 3me dmarche pour les donnes des services dobservation 1 742 ! centralisation de lOin ormation sur les donnes disponibles et les moyens dOy accder P assurer la prennisation des donnes. 0n portail 742 doit tre mis en place. R4$e0i&#s 5 'e#er ra,i%e'e#t G. 3ise en place dun pBle de comptence du mme type que ceux dcrits ci"dessus pour lensemble de locanographie. Le pBle doit se dvelopper autour des moyens d# mis en place par -842324 $/-/324, C24/?),%& qui #ouent ds prsent un rBle indispensable pour lOocanographie. Q. 'our les campagnes de mesure, les services et les rseaux dOobservation, les simulations de modles, ren orcement et coordination des actions au niveau des laboratoires et instituts ! bases de donnes gres par l-'/L, 3edias"8rance,% >veloppement sur des bases concrtes $exemple ! ?33?&. R. 'our les simulations de modles, mise en place dOun catalogage des simulations disponibles et des moyens dOy accder.. S. 'our les variables biologiques, r lexion sur la constitution dOun centre thmatique spci ique. La r lexion sur ce su#et est encore trs embryonnaire, et un groupe de travail ad" hoc devrait tre constitu. -l existe probablement dOautres + domaines non couverts , oF la prennisation de certaines donnes est ncessaire. Les chargs de mission -./0 sont les mieux placs pour enquter sur la ralit de ces besoins. Pr&c%!res 5 'ettre e# ,$ace T. 3ise en place concrte dOune obligation de plan de gestion de donnes pour tout pro#et nouveau $ intgrer dans les appels dOo res de tous les programmes& ;. )outes les bases nOayant pas le mme rBle ni le mme statut, poursuite de lOe ort pour prciser la onction de chaque service, pour assurer lOhomognisation et lOinteroprabilit des bases lorsquOelle apparaJt ncessaire aux besoins scienti iques, pour augmenter la visibilit et la notorit des services.

(H. )outes ces actions ncessitent un travail dOenqute et de mise en place qui nOa pu tre ralis dans la prparation de ce document. 2nvisager la cration dOune onction de + charg de mission <>> 7.?./-C , destin coordonner ce travail U -l est important que la politique dans ce domaine soit d inie au niveau inter"organismes. -l est galement souhaitable que des rgions, des ministres tels que celui de lOcologie et du dveloppement durable, des transports, de la sant, de lOagriculture, de lOquipement puissent tre associs la r lexion . 3ais le plus important, rappelons"le, est que les bases de donnes rpondent dabord aux besoins des utilisateurs et des programmes de recherche et se dveloppent en interaction rquente avec eux. Cette proccupation doit rester prsente tous les niveaux dorganisation. 6) $es '&7e#s #cessaires 'our les grands centres identi is ci"dessus $2)@24, /-/324, -C?42, 32>-?/, -'/L,%& la taille critique se situe autour de (H in ormaticiens $type -4& selon limportance et la varit des donnes grer, la part relative du dveloppement et de lexploitation. -l est donc ncessaire de regrouper des moyens au niveau de centres techniques de taille su isante. Cependant, le dveloppement scienti ique de base et la validation des produits doit se aire en interaction troite avec les chercheurs et gagne tre dcentralis au niveau des laboratoires $philosophie des centres thmatiques et de 3edias&. Les postes ncessaires comportent des ingnieurs in ormaticiens et des + thmaticiens ,. -ls doivent permettre la ois de constituer des services + centraliss , techniquement e icaces et de maintenir un rBle scienti ique amont et aval appropri dans les laboratoires. Lintervention des laboratoires est souvent ragilise par leur dpendance dun trs aible nombre de personnel appropri. Leur regroupement dans des instituts drati s ou 7/0 est susceptible de diminuer les risques. Les priorits dattribution des postes doivent sappuyer sur les programmes scienti iques soutenus par les organismes concerns, et sur la ncessit de suivi long terme des variables environnementales, en particulier par les services dobservation et 742s.

ANNE8E 1 3

E8EMPLES DE SERVI9ES RALISS OU EN 9OURS DE RALISATION


$contributions de di rents services concerns&

1. La base de donnes du ple chimie atmosphrique Ether http://ether.ipsl.jussieu.fr 4dig par 8. 6irod 1C.2/, C. <oonne1-'/L, '. 4icaud1 L9?< le (H avril *HH9 9&#te0te "#ra$ Les donnes en chimie de lOatmosphre sont issues dOexpriences embarques bord de satellites, dOexpriences embarques sous ballon stratosphriques, par ois de uses sondes. 0n rseau de stations sols ournit aussi des donnes sur lOo=one de aIon rgulire. >es campagnes ponctuelles sont organises rgulirement. 2lles concernent des mesures aussi bien aux hautes latitudes, quaux moyennes et sous les tropiques: -l existe aussi un ensemble important de modles $9> C)3 42'47<0/, 3-37/?, et assimilation& pouvant ournir des donnes la demande. La plus grande quantit de donnes concerne la stratosphre $en onctionnement ! 7>-.1/34, 7>-.17/-4-/, 6737/, '7?3 ---, -L?/ --, 4seau .>/C, /?7V, 6732 ..&. Les tudes de la troposphre se multipliant des donnes ont leur apparition et sOaccentueront dans les prochaines annes $37V?-C, 2W'42//7, 2/C73')2, L'3?, 3-'?/, /C@-?3?C@X, -?/- ..&. La ma#orit des donnes disponibles sont des pro ils ou des quantit de colonne totale $pro ils $ou quantits de colonne& au point de mesure ou recalcules sur des grilles rgulires& . /ur certaines expriences en maJtrise dOoeuvre ranIaise, il y a des donnes de niveau H $donnes brutes& et ( $donnes calibres&. -l commence apparaJtre des champs assimils mlangeant des donnes de modles et des donnes relles $programme 7VD?L partir des donnes 6737/ ou 7>-.1/34 couples au modle 3/>7L& 0ne partie des donnes dcrites prcdemment sont dans dOautres bases de donnes internationales $2/?, .4L, >??C& mais 2ther est le point dOentre ranIais sur ces donnes assurant de plus une expertise et des services associs.. . Les donnes de campagne qui ne sont pas gres dans 2ther doivent avoir une visibilit via 2ther. Le pBle 2ther est organis pour valoriser les activits ranIaises du domaine, mais aussi permettre aux scienti iques ranIais de rcuprer et traiter des donnes travers un portail unique. La base de donnes du pBle 2ther ne cherche pas remplacer les bases existantes $2xemple les donnes .>/C ne sont pas recopies dans 2ther, seules les donnes ranIaises qui peuvent servir dOautres pro#ets, que ceux rentrant dans le cadre du rseau .>/C, sont stocYes dans 2ther&, mais essaie de crer des liens physiques sur les bases internationales et dOapporter en plus une connaissance voire une expertise sur les donnes quOelles contiennent. La base de donnes du pBle 2ther doit tre mise en rseau avec les uturs centres comme -C?42 et '7/)2L a in que chacun bn icie des travaux des autres sans avoir les reproduire. 'ar exemple 2ther dispose dOun logiciel de simulation des tempratures et pressions de la sur ace (HH Ym daltitude partir des donnes 2C3:8 qui peut tre utile dOautres thmatiques. >e mme, il serait dommage que des donnes chimie soient copies dans des bases de donnes auxiliaires comme ?33?/?), alors que lOon pourrait organiser des changes e icaces entre les bases et les centres thmatiques. Le pBle 2ther doit voluer de la stratosphre vers la troposphre. -l nOest pas encore dcid si 2ther doit rcuprer des donnes de pollution. Ce peut tre un moyen relativement acile de grer ce type de donnes. -l est toute ois vident que lOon atteindra des limites en particulier en personnel, mais qui ne sont pas ce #our quanti ies.

/ans vouloir empiter sur les domaines spci iques de 3to"8rance en la matire, 2ther commence prendre en compte des donnes chimie issues de modles ou dOassimilations sur des priodes en corrlation avec des donnes acquises par divers instruments. 'ar contre 2ther nOa pas la ressource $technique et humaine& pour exploiter les modles. Le systme de gestion des donnes Le systme de gestion des donnes du pBle chimie atmosphrique 2ther est lO-'/L. LO-'/L gre 2ther pour le compte de lO-./0"2. ;&#cti&#s %! ce#tre 3 6estion des donnes spatiales et acquises par des moyens sols Cration de produits valeur a#oute 'romotion des donnes et des activits scienti iques 8ourniture de services utilisateurs Deille technologique M&7e#s e# ,ers&##e$ /cienti ique de pro#et ! plan de charge QHZ.. IPSL ! 0ne personne C.4/ $-4 & temps plein qui assure plusieurs onctions ! 4esponsable thmatique ! plan de charge actuel QHZ 4esponsable de dveloppement, maintenance et exploitation QHZ 0ne personne en C>> $?- & temps plein charge de lOexploitation des donnes. 2n attente dOembauche C.4/ Les ingnieurs systmes de lO-'/L assurent le maintien en onctionnement des moyens in ormatiques dO2ther $rseau, scurit&. 9NES 0n responsable pro#et qui a assur la spci ication du pro#et, la gestion du dveloppement et la mise en exploitation. et assure le suivi de lOvolution du systme. Or"a#isati&# Le comit directeur -./0"C.2/ 2ther a demand au groupe pro#et sous la direction du scienti ique de pro#et de red inir une organisation du pBle 2ther, sOappuyant sur les structures grant les activits scienti iques en chimie atmosphrique cOest dire le '.C?, la C/7?, voire )7/C?. Cette note dOorganisation devra tre prsente au sminaire de prospective de lO-./0"2 de septembre *HH9.

Expriences Th$es Mo4ens

#asse troposphre La$p, LSCE

Troposphre LPMA, SA, LISA, LA

Stratosphre SA, LPCE, ACRI

.M.S SA (01L #erta!x", ACRI

Ether
.'I& L/A# (P. Rica!%" Assi$ilation SA (A. *a!checorne" , ACRI Ca$pa2nes troposphre LA (R. 'el$as" 3 M%ias

Resp Th. C. Boonne IPSL


Sc. de Projet P. Ricaud L3AB Ch. de Projet F.Girod CNES Groupe utilisateur Comit !irecteur

Expriences ballons SA (F. o!tail", LPCE

Rsea! %e stations &'SC SA (P. (ec)!t"

E&+ISAT

IASI LPMA, SA 3 &o-eltis

Mo%les C&RM (+. Pe!ch" SA (F. Le,-re"

P"le Ether

): Les *ases %e %&##es %e Me%ias+;ra#ce (Michel Hoepffner) (une base de donnes au service des programmes de recherche sur lenvironnement) (. Le point sur les bases de donnes actuelles et utures en environnement

0n certain nombre de bases de donnes ont t constitues en 8rance depuis une vingtaine dannes partir de donnes acquises dans le cadre dexpriences de terrain, de rseaux scienti iques ou de simulation, a in de permettre de mieux exploiter scienti iquement ces donnes, mais aussi de pouvoir acqurir une mmoire des volutions de lenvironnement. ?insi, des bases de donnes d [expriences scienti iques $@apex"/ahel en (;;*, 2xpresso en (;;R, 8etch en (;;T, 2scompte en *HH( et *HH*, %& sont disponibles pour la communaut scienti ique, restreint au groupe participant lexprimentation dans un premier temps, tendu ensuite au domaine publique aprs quelques annes $* ans dans la plupart des cas&. >autre part, la division 7can"?tmosphre de l-nsu a avoris la cration dobservatoires de recherche sur lenvironnement partir de rseaux scienti iques. 'our certains dentre eux $3o=a\c, -da , %&, les bases de donnes qui ont t constitues permettent de suivre sur le long terme lvolution temporelle de paramtres de lenvironnement $composition chimique des eaux de pluie, des ga= et des arosols, o=one troposphrique, %&. Le rapport demand par le Cnes et le C.4/ 'hilippe :aldteu el en (;;; $+ les bases de donnes pour les gosciences, lments pour un schma directeur ,&a bien mis en vidence lintrt de constituer de telles bases de donnes. Celui que 6. <ergametti, '. <essemoulin, C. 3archalot, .. 3et=l, >. )anr et '. :aldteu el ont rdig sur ! + 'rospective <ases de donnes et services dobservation , prcise les besoins en bases de donnes des services dobservations. 'ar ailleurs, le C.4/ a dcid de rassembler dans des systmes de bases de donnes relationnelles les donnes acquises dans le cadre de programmes comme le '2D/ $'rogramme 2nvironnement, Die et /ocits& pour les (* Vones"?teliers quil a slectionns et que doit reprendre la division /@/ de l-nsu, ou le programme 2clipse $2nvironnement et CL-mat du 'ass, hi/toire et 2nvironnement, de />0, />D et /@/& pour les SQ pro#ets slectionns lors des trois derniers appels do re. >autre part, la division + /ciences de la )erre , de l-nsu a dcid de rassembler les donnes de godsie 6'/, de sdimentologie, de $micro"&palontologie ou de gochimie dans des bases de donnes. C [est ce que compte aire aussi la division + /ur aces et -nter aces Continentales , de l-nsu pour les donnes recueillies dans le cadre des 7bservatoires de 4echerche sur l2nvironnement grs par elle $?mma"Catch, <D2), @P, 7@3CD, 4esyst, %&. Ces bases de donnes ont t conIues et ralises $ou le seront& en compatibilit totale avec les normes dinteroprabilit d inies au niveau international. ?insi, des travaux importants sont entrepris avec le Cnes pour utiliser la norme internationale de mtadonnes -/7 (;((Q, ainsi que le standard amricain 86>C. >autres travaux sont en cours, par exemple sur la possibilit, avec un outil de type + x" proxy ,, de aire des requtes communes auprs de bases de donnes + distribues ,. Linteroprabilit serait encore plus mani este avec la constitution dun portail commun lensemble des bases de donnes sur lenvironnement.

0ne des inter aces entre les quatre divisions de l-nsue pourrait tre la ralisation et la gestion de ce portail commun, la constitution de bases de mtadonnes bases sur la mme norme, ainsi que la conception dinter aces simples et robustes dextraction de donnes. >e mme, les rgles dacquisition de donnes acquises et gres par les + arsenaux de donnes , $3to"8rance, -6., -nsee, %& devraient tre communes lensemble des organismes de recherche du domaine public, sur le principe dun accs gratuit assorti de remerciements dans les articles scienti iques. 7n pourrait en in constituer ce rseau de chercheurs intresss par la constitution et lutilisation de ces bases de donnes, comme le prconisait 'hilippe :aldteu el dans son rapport de (;;;. Ce rseau pourrait par exemple tre linitiateur et le ralisateur de sessions de ormation et de per ectionnement dans le domaine des bases de donnes, et exercer ensemble cette indispensable veille technologique qui permet de suivre lvolution constante des logiciels et matriels in ormatiques, sur le march comme sur l-nternet. *. Le rBle de 3dias"8rance $http!11medias .obs"mip. r& Le 6roupement d-ntrt 'ublic 3dias"8rance $constitu avec le Cnes, le C.4/, l-4>, 3to"8rance, l0niversit 'aul"/abatier, CL/ et /pot"-mage& a ralis ou a particip activement la construction des bases de donnes cites plus haut, la veille technologique in ormatique, la ormation dagents du C.4/ dans le domaine des bases de donnes, ainsi qu lutilisation de la norme -/7 (;((Q pour les mtadonnes, de mme qu cet outil + x" proxy ,. 3dias"8rance est donc particulirement intress par la possibilit de d inir avec la C/7?, la C//) et la C//-C les moyens mettre en Auvre pour amliorer les outils daccs aux donnes sur lenvironnement. 2n e et, la principale activit du 6-' 3dias"8rance est de soutenir les programmes de recherche sur lenvironnement par la constitution dinter aces dextraction de donnes spci iques aux pro#ets soutenus par ces programmes. C [est ainsi que prs dune cinquantaine de bases de donnes ont pu tre constitues ou sont en cours de constitution par le 6-' pour permettre aux partenaires des expriences et des rseaux de recherche dextraire des donnes en onction de critres spatio"temporels et thmatiques. La liste de ces bases de donnes qui est ournie en pices #ointes permet de constater que la thmatique 7can"?tmosphre $qui incluse l-nsue la chimie atmosphrique& y est prpondrante. ? ce titre, une quipe de neu in ormaticiens spcialiss dans le dveloppement in ormatique en bases de donnes a pu tre constitue 3dias"8rance pour rpondre aux besoins actuels. /ix de ces in ormaticiens ont t a ects au 6-' par le Cnes, le C.4/, l-4> et 3to" 8rance pour mutualiser ces comptences au pro it de lensemble de la communaut scienti ique. )rois nouveaux postes budgtaires doivent tre attribus pour rpondre laugmentation sensible des demandes en bases de donnes $pro#ets 742, Vones"?teliers, ?mma, 6-CC, %&. 3dias"8rance dveloppe aussi une activit importante au pro it du pBle thmatique 'ostel $'Ble d7bservation de la /ur ace de la )erre aux 2chelles Larges&, en particulier dans lintgration de savoirs scienti iques $provenant des laboratoires de recherches& dans une perspective oprationnelle.

Etat Ocan/Atmosp /Chimie davancement hre atmosphrique

Sciences de la Terre

SIC

SHS

SD

Outils

Ter$ins

EMET5CEP *APE65 SA*EL 0 .FS: ELMASIFA EPIT*ERME FETC* 0 .FS> PL7+I.M

E6PRESS. I'AF .RE9M.;AIC PIC '7 MI'I ./. AIR=7AL I AC I @ S PRE5 ESC.MPTE 'E#ITS PREPA: .RE9I'AF ESC.MPTE

P.LLE& S7'5SA*EL 8'C5A (EP'" (E''I" F.RMAT AP' CPC C'5Ro$ Pollen 'IAF 65PR.6A RES.L+E ECLIPSE A'AM M'M .SS9LIFE AI'5C'' ;A9.RM E$ercase E ;A9APM Mtis5 ForBt C*.LCLI M I$a2es5 #9.SS

8E#5Site C'R.M Me%iterranee ME'ESERT << 7&ISPACE III IS rass

#ASS >??? CE.S5C'R.M >???

En co!rs

EMERCASE MES IMFRE6 ME'58ATER

RICAMARE ICC: SEARC* 8E#5Site ISIS AMMA P.L(A IMME'IAS E7F.RE.

PS .RE9RETAS .RE9PC## .RE9*3 .RE9CATC*

Pr-!s A$$a9*isto9M ta ProMe% S>E9Ar2os Enso9P&E'C

I AC Meta PA ES9Meta% ata Prepa> M!lti5prox4 A$$a9Chi$ie Palontolo2ie

Intra#io'iPostel MES5&.8

Sesa$e #ir%

ICC> CIESI& ACMA' IME'IAS9ISS S>E9AR .S PLA& #LE7 MA;7R(A MES9in,or$atio ns SI 5MEA

S%i$entolo2i .RE9PAES e ochi$ie .RE9Incen%i es Corinthe eolan%

/ : Le ce#tre %e %&##es %e $IPSL (Danile Hauser) (un service au niveau dun ensemble de laboratoires et une structure participant aux ples thmatiques)

(.(" 'rsentation gnrale Le centre de donnes de l-nstitut 'ierre /imon Laplace $-'/L& est le rsultat dune des actions dratives de l-nstitut C il a pour but de documenter et de mettre disposition la plupart des donnes produites et utilises l-'/L. >abord tourn vers les besoins de ses utilisateurs internes, il sest rapidement orient vers des actions au service de lensemble de la communaut ocan"atmosphre. L-'/L est la ois + producteur de donnes , et + consommateur , de donnes. >ans ce cadre, il met en place! ] une gestion des donnes proche des quipes de recherche $pour partie dcentralise dans les di rent laboratoires de l-'/L, pour partie centralise& ] une approche thmatique $ex ! bases de donnes dexpriences ou de programmes spci iques, base de donnes sur la chimie atmosphrique 2)@24, contribution en tant que centre dexpertise au pro#et -C?42 sur la thmatique nuages1arosols1rayonnement1eau& ] une gestion des donnes proche des sorties de modles, permettant des analyses intgrant modles et observations ] une gestion des donnes proche des moyens de calculs, permettant une utilisation + avance , des donnes incluant des calculs Le centre de donnes gre un 3tacatalogue de donnes qui comporte $ou comportera terme& lensemble des descripti s des donnes produites par les chercheurs de l-'/L ou auxquelles les chercheurs de l-'/L ont eu accs. -l propose galement une expertise aux chercheurs impliqus dans la mise en place de base de donnes. Le centre de donnes #oue un rBle national ou international. Cest le cas avec la base de donnes de chimie de latmosphre $2)@24& et cet aspect est amen se dvelopper avec sa participation au pro#et -C?42 rassemblant des donnes sur la thmatique nages1rayonnement dans le cadre de nouvelles missions spatiales, ainsi que pour la gestion dune partie des donnes du pro#et ?33? $?33?"satellites et ?33?"modles&. (.* 7rganisation LO-'/L est rparti gographiquement sur plusieurs sites en rgion parisienne. LOarchitecture du centre de donnes suit cette rpartition. 2lle repose sur G serveurs de donnes principaux, situs sur di rents sites de lO-'/L et hbergeant chacun di rentes bases de donnes thmatiques. Le parti pris concernant la rpartition des serveurs est de garder les donnes autant que possible prs des chercheurs et de lOexpertise scienti ique concernant les donnes. LOun de ces G serveurs, situ lO-'/L10niversit 'ierre et 3arie"Curie, 'aris, centralise lOaccs aux di rentes bases de donnes des autres serveurs et aux diverses bases de donnes locales hberges dans les laboratoires de l-'/L. /ur le plan des moyens humains, lorganisation repose sur i& le travail des personnels techniques a ects au centre de donnes lui"mme $0niversit"'ierre et 3arie"Curie, 'aris& ! * ingnieurs permanents avec encadrement dun 9 ingnieur, et * 9 C>>, ii& le travail de quelques ingnieurs dans les laboratoires de l-'/L $* 9 en rgion parisienne&, iii& un comit de pilotage compos de chercheurs de l-'/L et reprsentant la plupart des types de besoins en matire de donnes. Ce comit de pilotage a pour mission de prospecter les besoins de

l-'/L, de proposer au comit de direction de l-'/L des priorits sur les travaux mener, et de rechercher des cooprations avec dautres centres de donnes. (.9" 'rincipales bases de donnes du centre de donnes -'/L (.9"( >onnes rapatries de lextrieur " 4"analyses du modle de circulation atmosphrique europen du C2'33) $24?(Q et 24?GH&, analyses oprationnelles et prvisions. (accs libre aux membres de lIPSL et aux chercheurs travaillant sur des pro ets communs ! ceci r"sulte des restrictions daccs impos"es par les m"t"os) " " 4"analyses du modle de circulation atmosphrique amricain du .C2'(accs libre) climatologies diverses, donnes satellitales diverses, bathymtrie (accs libre)

(.9"* <ases thmatiques " chimie atmosphrique ! 2)@24 C double gestion par le C.2/ et par l-'/L, mandate par l-./0 C observations de la stratosphre par satellite $missions '7?3 --, -36, -L?/, -/?3/, CL?2/, 7>-., 2.D-/?)& et in situ $avions, ballons stratosphriques& C services valeur a#outeC 2xtension en cours des donnes troposphriques. (accs bien entendu libre) " nuages"rayonnement $long terme "global& ! rBle initial de CL-3/24D ! gestion par le L3>1-'/L C comprend principalement des donnes satellites et des sorties de modles, (accs libre pour la plupart des eux de donn"es) " ?33?/?) ! gestion par le L3>1-'/L $autour de CL-3/24D& C en cours de dveloppement ! base de donnes satellitales autour du pro#et dtude de la 3ousson ? ricaine $?33?&.(accs libre) " donnes des services dobservation de l-'/L $7-/7, 4?3/2/, .>/C& C gestion par les services dobservation de l-'/LC en cours de mise en place (coordination de laccs # mettre en place au niveau I$S%) " /-4)? ! gestion par L3>1-'/L $CL-3/24D& C contient les donnes du site dobservation + /-4)? , de l-'/L $radars1lidos1radiomtres, mesures mtorologiques in situ,%&. (&ccs ouvert aux utilisateurs ext"rieurs pour les exp"riences coordonn"es nationales ou europ"ennes aux'uelles participe le SI()&) " donnes de campagnes ou associes ! gestion par C2)'1-'/L C contient des donnes dexpriences coopratives $82)C@, 8?/)2W,%& (accs ouvert) (.9"9 3tacatalogue 4 rencement des donnes -'/L bas sur la nome >-8/. 2n cours de inalisation Cet outil est utilisable en interne et en externe lIPSL. Il devrait constituer une vitrine des donnes IPSL pour lextrieur.

1 Les *ases %e %&##es &ca#&"ra,-i !es i# sit! (*atherine Maillard+ I,(-M-(.SISM-() (. >escription gnrale de la gestion des donns ocanographiques Les donnes ocanographiques in situ sont en ma#orit collectes lors de campagnes scienti iques et couvrent un large spectre de paramtres. -l existe galement des observatoires visant une certaine permanence, comme les rseau cBtiers /73L-), 3?42l, 4.7, 42'@-, 423-, les observatoires ond de mer comme 627/)?4 et les donnes de locanographie oprationnelle reIues en temps rel par les pro ileurs drivants ?rgo1Coriolis, les mesures de sur ace et de subsur ace opres bords de navires dopportunit et les mouillages '-4?)? dans la =one tropicale atlantique. )oute ois ces rseaux et observatoires + temps rel , ne concernent encore quun relativement petit nombre de paramtres. Ces donnes se caractrisent par une grande htrognit. Certains types de donnes comme la bathymtrie multi aisceaux et la sismique reprsentent de trs gros volumes. Les donnes physiques et bio"chimiques correspondent un nombre de paramtres trs lev $tous les composants physiques, chimiques et organiques dans leau, les matires en suspension, le sdiment et le biota&. 'our les donnes biologiques, il aut a#outer la taxinomie. >e plus les mthodes de collecte ntant pas tou#ours inter"comparables, il est particulirement important de garder toute lin ormation ncessaire sur les conditions de collecte. Les donnes de base comme la gophysique collecte en route, la physique et les principaux composants sont compils systmatiquement par les centres de donnes. Les autres paramtres sont archivs au cas par cas selon les pro#ets, beaucoup de scienti iques pensant que la publication dans des revues su it assurer leur prennit, bien que pour tout traitement ultrieur, il soit ncessaire de les identi ier et digitaliser. Les utilisateurs actuels des donnes sont essentiellement la communaut scienti ique, mais la tendance est chercher une ouverture plus large vers les pro essionnels, les tudiants, les dcideurs et le grand public. 'our cela les centre de donnes cherchent dvelopper des produits valeur a#oute et simple dutilisation, ce qui ncessite certaines conditions, qui ne sont pas dailleurs pas typiques locanographie ! ?ccs aux donnes les plus rcentes, y compris le temps rel ?ccs de longues sries temporelles de donnes de mme type Cohrence et compatibilit des donnes issues de di rentes sources et systmes 8ourniture de produits lis aux donnes permettant de suivre et dvaluer les systmes de collecte 8ourniture de produits scienti iques plus labors comme une estimation des champs moyens maills, des luctuations saisonnires et des tendances 8ourniture des donnes, meta"donnes et produits par les outils de communications les plus adapts /auvegarde prenne des donnes, quelle que soit lvolution des systmes. La gestion des donnes collectes et la politique de di usion sont des su#ets trs dbattus. 'ourtant lexprience a montr que les donnes disperses dans les laboratoires scienti iques sous divers systmes et sans normalisation avaient de grandes chances dtre perdues terme. 'our y pallier, les instances internationales, en particulier la Commission 7canographique -ntergouvernementale de l0.2/C7 $C7-&, ont recommand quun centre national de donnes ocanographiques $.7>C& soit cr dans chaque pays, pour assurer larchivage et la di usion des donnes nationale et pour servir de point ocal aux changes internationaux de donnes et din ormation. Ce rseau de centres de donnes reprsente une in rastructure pro essionnelle, participant des groupes de travail internationaux pour llaboration des normes et capable dassurer la gestion long terme des donnes qui lui sont con ies.

Les normes consistent d inir quelles in ormations doivent accompagner les donnes, les ormats dchange et les procdures de contrBle qualit appliquer pour assurer la cohrence des bases de donnes intgres. La d inition et lapplication de ces normes impliquent une troite coopration scienti iques"gestionnaires de donnes, et en outre de disposer pour chaque pro#et ! (& dun plan de gestion de donnes bien d ini, ainsi quune politique de di usion parmi les partenaires et hors du pro#et *& de logiciels adapts pour toutes les tapes de la gestion, en particulier pour appliquer les contrBles de qualit et di user les donnes en ligne ou sur tout autre media 9& dun inancement et dun support humain su isant, ce dernier point tant en gnral sous"valu.
)) R<$e %! SISMER

L-842324 est lorganisme mandat par le gouvernement pour grer le .7>C ranIais, ce qui est dvolu au service /-/324. Ce service gre un ond de bibliothque de donnes de base qui sont ! (& La banques nationale de gophysique marine $bathymtrie, gravit, magntisme, sismique& *& La banque nationale de physique et chimie marine $hydrologie, prlvements bio" chimiques, courantomtrie, tomographie acoustique& 9& Le centre international de donnes de subsur ace responsable maintenant du centre de donnes temps rel ?rgo1Coriolis G& 0n /-6 de donnes de r rence bathymtriques, climatologiques cadastrales etc.. produites par divers organismes, cible environnement cBtier et dutilisation limite en interne l-842324 Q& >ivers catalogues gnraux comme les + campagnes ocanographiques , ou thmatiques. /-/324 contribue aux groupes de travail internationaux de normalisation dans le cadre des C7-, C-23, C-2/3, 5C733. -l contribue galement la structure de gestion de donnes de plusieurs programmes nationaux $Coriolis, '.2C&, europens $6X47/C7'2, 38/, 3)'--" 3?)2, 32>?4"32>?)L?/, 7C)7'0/, ?C32, 2/7.2), 2>-7/, 3?3?, 2047/2-/3-C, /2?"/2?4C@& et internationaux $)76?, :7C2, ?rgo&. LOimportante ralisation du support logiciel est assure par un travail dquipe avec le service associ -/- $-ngnierie des systmes din ormation& de l-842324 et du support logistique du systme darchivage de l-842324. /-/324 dispose ainsi de systmes experts pour le contrBle qualit, de bases de donnes relationnelles, doutils de di usion en ligne et de logiciels de publication de donnes sur C>rom. La di usion des donnes est soumise certaines rgles qui dpendent du type de donnes. Les plus restrictives sont appliques aux donnes de gosciences sur les =ones conomiques. Les donnes rcentes sont en gnral, soumises lapprobation du responsable de la collecte en mer. )oute ois lob#ecti est de suivre, lorsque cela est possible, la politique de di usion dict par la C7-, cest dire autant que possible + libre, gratuit et sans restriction ,. Serveur du SISM-( / 0001ifremer1fr 2ilan de lactivit" des de la p"riode 344567887 r"di9" pour http:// !i"remer!"r/sismer/program/iode/doc/#$%&'()"rance!*%+ la *:I/

2) Le ce#tre %e c&',te#ces t-'ati !e I9ARE (Michel Desbois+ ,ran;ois6Marie 2r"on) Le pBle thmatique -C?42 ait partie dees pBles de comptences thmatiques lis au spatial prconise par le + rapport :aldteu el ,. -C?42 est une initiative C.2/" -./0, qui a pu dmarrer grace laction des chercheurs du L7?"Lille et au soutien de la rgion .ord"'as de Calais. Les pBles thmatiques doivent regrouper des moyens spci iques pour exploiter les expriences spatiales, par thmatique ! Chimie atmosphrique, /ur ace continentale, 7can, %, mais aussi avoriser la mise disposition par thmatique, des donnes de toutes origines et des moyens de traitement communs. Les besoins de traiter des donnes de sources multiples, oprationnelles ou exprimentales $y compris des rsultats de modlisation& se ait en e et sentir dans toutes les disciplines. -C?42 cherche rpondre ces proccupations dans le domaine ! .uages, arosols, rayonnement, eau . Le pBle de comptence thmatique -C?42 a pour ob#ecti gnral de ournir aux communauts nationale et internationale impliques dans la thmatique + arosols"nuages"rayonnement"eau , un ensemble de donnes, produits et services permettant une utilisation optimale des systmes dobservation relevant de cette thmatique des ins de modlisation et1ou dtudes climatiques. Le pBle thmatique -C?42 a pour missions ! " dassurer un rBle technique de d inition de produits au travers de la mise au point de mthodes physiques de traitement du signal, de spci ication de produits utilisant ces mthodes, de production, dtalonnage et de validation, dOarchivage et de distribution de ces produits, et de support leurs utilisateursC dassurer un rBle scienti ique de conception et dexpertise sur les produits, mais galement dutilisation des donnes pour la mise en Auvre de modlisations ou la ralisation de climatologies.

"

Les quipes concernes par -C?42 sont! " " " " " Les laboratoires engags dans des expriences spatiales ! 'older, 'arasol, Calipso, Cloudsat $?qua train&, 3egha")ropiques $/aphir, /ca4a<, 3adras&, /37/ Les quipes travaillant sur dautres instruments satellitaires sur les mmes thmes ! 3eteosat, 3/6, .7??1)7D/, )433, ?-4/1-?/-, //31-, ?3/0, ?3/4, /ca4a<, C242/, 624<, L-)2,% Les quipes exprimentales de mesures in"situ et tldtection sol ou avion, /-4)? Les quipes de modlisation et de paramtrisation $nuages, convection,%& Les quipes des pro#ets exprimentaux comme ?33?.

La structure d-C?42 -C?42 est organis autour dun centre de gestion et de traitement de donnes $C6)>&, implant Lille, et de centres dexpertise constitus par les laboratoires concerns par sa thmatique. Le C6)> regroupe et met disposition des utilisateurs les donnes spatiales et les donnes de validation correspondantes. -l met en Auvre des logiciels dvelopps dans les centres

dexpertise. -l traite et archive les donnes, maintient et amliore les logiciels, gnre et distribue des produits. Les centres dexpertise ont un double rBle, dune part dans la conception des algorithmes et leur validation, dautre part dans lexploitation scienti ique $non exclusive& des donnes mises en place au C6)>. >eux centres dexpertise importants sont constitus par le L7? Lille et l-'/L en rgion 'arisienne. Le centre dexpertise -'/L sappuie localement sur les moyens du centre de donnes -'/L. Les responsabilits d-C?42 sont rparties entre un responsable /cienti ique de lensemble $C6)> P coordination des centres dexpertise&, un che de pro#et et une quipe pro#et, un Comit des utilisateurs, un Comit >irecteur compos de reprsentants des organismes.

3oyens et actions soutenir -C?42 a dmarr sur la mise en place $ou la promesse& de moyens inanciers importants $rgion P C.2/ ^ T 3_& Le personnel est compos par une une partie des ingnieurs d# existant dans les labos $et l-'/L& se consacrant aux bases de donnes, des C>> C.2/ a ects soit aux expriences spatiales, soit directement -C?42. 0ne ouverture de postes permanents -C?42 par l-./0 est galement espre. Le Comit des 0tilisateurs souhaite que ce pro#et soit soutenu dans le cadre de la prospective -./0"2 $chapitre spatial et chapitre bases de donnes& >es actions sont mener pour qu-C?42 ne reste pas seulement un centre de traitement dexpriences spatiales du C.2/, mais devienne un rel centre thmatique, ce qui implique une mobilisation de la communaut des utilisateurs. >es actions ultrieures sont prvoir pour mieux intgrer lchelle europenne. Le Comit des 0tilisateurs a recommand le soutien de pro#ets"pilote visant dmontrer lapport d-C?42 certains pro#ets. Ces pro#ets"pilote concernent aussi bien lutilisation des satellites + nominaux , du pro#et -C?42, que des tudes thmatiques + climat , portant sur des analyses de longues sries de donnes satellitales. -l serait souhaitable par la suite de aire r rence lutilisation possible d-C?42 dans les appels do res des programmes nationaux concerns par sa thmatique, et de susciter lutilisation d-C?42 par un appel do res spci ique.

6: La 'ise 5 %is,&siti&# %e $a c&''!#a!t scie#ti4i !e %es %&##es c$i'at&$&"i !es c&#(e#ti&##e$$es 3 O=API 5 Mt&+;ra#ce 3to"8rance dveloppe un systme daccs aux donnes climatologiques des stations ranIaises, dont ladresse internet est donne ci"dessous. 0ne procdure daccs gratuit pour lutilisation recherche est maintenant mise en place, avec certaines restrictions. http!11climatheque.meteo. r1oYapi

C C

?ccs gratuit un catalogue restreint de produits climatologiques hauteur dun quota maximum de points ix. 7uverture dun compte avec le pro il [recherche.

La demande de cration dun compte avec le pro il 4echerche12nseignement doit se aire de la aIon suivante !

] sil sagit dun client rgional $une universit par exemple& lorganisme 4echerche12nseignement concern sadresse au correspondant recherche1enseignement de la >-4 rgion mtorologique&, C ] sil sagit dun client national ou international, lorganisme 4echerche12nseignement concern sadresse 3to"8rance >'1/ervices18>' $>irection de la 'roduction&

0ne plaquette destination du secteur recherche1ducation va tre ralise prochainement. 2n revanche, il est tou#ours di icile davoir accs des donnes couvrant dautres rgions. Ceci est le cas par exemple pour les donnes couvrant l? rique de l7uest, en ce qui concerne les tudes sur la mousson ? ricaine. ?u niveau global, les e orts pour regrouper les donnes et en tirer les in ormations climatologiques sont essentiellement aits aux 2tats"0nis $.C>C&, ou au 4oyaume 0ni $@adley Center P 0niversity o 2ast ?nglia&. Les archives des donnes mtorologiques existent auprs de centres comme le C2'33) $qui les utilisent pour leurs analyses et r"analyses&, mais sont di iciles daccs et de maniement.

ANNE8E )

R;LE8ION SUR LES BASES DE DONNES > VARIABLES BIOLO?I@UES A


(Marc )rousselier)
(" -l y a au moins une spci icit en ce qui concerne les bases de donnes concernant des variables biologiques ! elles peuvent rsulter de mesures sensu stricto oF lautomatisme est dominant $e.g., chl a, pigments mesurs automatiquement en luorimtrie 3?42L&, mais elles peuvent aussi rsulter dobservations i.e. de procdures oF lobservateur est prpondrant $e.g., identi ication et comptage des espces phytoplanctoniques $rseau 42'@X&& ou encore se situer entre les deux $e.g., dnombrement de bactries dintrt sanitaire sur milieu slecti $rseau 423-&&. >autre part les mthodologies sont trs volutives. 'ar exemple, la classi ication des espces est loin dtre stabilise, les tests de toxicit changent au pro it dune plus grande sensibilit, ... 2n in de nouveau type de donnes apparaissent, lexemple des squences dacides nucliques. >e ce ait, pour une partie au moins de ces donnes les tapes de renseignement des donnes acquises et de leur validation sont extrmement importantes. La capacit volutive des bases de donnes est tout aussi essentielle. *" 'lus globalement, si lon considre le ort ncessaire pour archiver et rendre disponible les donnes acquises, il me paraJt ncessaire de ne pas con iner les bases de donnes au seul rBle dune mmoire passive mais de aire en sorte que la plupart dentre elles soient des r rences actives. -l sagit non seulement de rentabiliser les investissements consentis $dans le dernier colloque de prospective /-C, il a t indiqu quen moyenne un chercheur nord"amricain consacre 9HZ de son temps pour constituer et1ou alimenter des bases de donnes...&, mais aussi de susciter une motivation et une reconnaissance pour les personnels qui sinvestissent dans cette mission. Lutilisation des donnes en tant que telles est le plus souvent et normalement le ait dquipes ou dindividus di rents de ceux qui grent les bases. Les donnes servent alors rpondre des questions spci iques. Cependant, on peut concevoir que les quipes gestionnaires puissent aussi exploiter les donnes quelles grent de aIon moins spci ique mais tout aussi utile ! " Les bases de donnes ou de connaissances comportent une couche din ormations $descripteurs& qui renseigne sur la nature des donnes et le contexte de leur obtention. Lanalyse $statistique& de cette couche din ormation serait trs intressante pour connaJtre lvolution de la nature des donnes recueillies $nombre et type des variables&, des mthodologies danalyse, des stratgies dchantillonnage, des =ones gographiques considres, des priodes de mesure, des + ournisseurs , de donnes, ... /ans parler danalyse en temps rel, bien quelle soit aussi envisageable, des bilans rguliers constitueraient des indications trs utiles $c . ci"aprs&.

" Laccs aux donnes en elles"mmes permettrait de mettre en vidence les tendances dvolution temporelle et spatiale pour di rentes chelles de temps et despace de certaines variables. -l serait galement possible de #uger du degr de redondance ou encore didenti ier les sites sous"chantillonns. " 7n peut aussi concevoir que les quipes grant les bases de donnes se voient con ier ou participent activement des missions de recherche sur laggrgation des variables et la mise en place dindices intgrs renseignant sur ltat de sant des cosystmes. Les collaborations pourraient aussi stendre aux tapes de calibration et de validation de di rents types de modles. 'ar lappropriation de tout ou partie de ces missions, la valorisation des activits des quipes investies dans la constitution et la gestion des bases de donnes serait alors acilite ! " 7n peut envisager des + produits , classiques par la ralisation de publications scienti iques avec des degrs de collaboration divers sagissant de lexploitation et de lanalyse de donnes particulires. 0n rBle essentiel serait celui de gnrer ou de contribuer des synthses sur les points orts, les points aibles, les tendances, les perspectives mthodologiques, logistiques, stratgiques... Ces synthses peuvent contribuer la ralisation de revues scienti iques ciblant une mthodologie et ses applications ou une thmatique. 3on exprience rcente dans ce genre dexercice $c . Legendre et al. *HH(9, 3orris et al. *HH*G& ma sensibilise labsence doutils et de source din ormations standardises et acilement accessibles. " 7n peut aussi concevoir que des tats de lart + ob#ecti s , destination des organismes de recherche puissent tre constitus soit partir des revues prcites soit partir de bilans multicritres plus spci iques pour aider d inir une politique scienti ique ou une stratgie dquipement.

Legendre L., Courties C. and Troussellier M. 2001. Flow cytometry in Oceanography: two decades of discovery and progress. Cytometry 44: 164-172.
4

Morris C.E., Bardin M., Berge O., Frey-Klett P., Fromin N., Girardin H., Ginebretiere M-H., Lebaron P., Thiery J. M. and Troussellier M. 2002. Microbial biodiversity : approaches to experimental design and hypothesis testing in primary scientific literature from 1975 to 1999. Microb. Mol. Biol. Rev. 66 : 592-616.