Vous êtes sur la page 1sur 25

Rapport dactivit 2013-2015

Huma-Num est une trs grande infrastructure (TGIR) ne de la


#1 fusion du TGE-Adonis et de IR-Corpus. Elle vise faciliter le tournant
numrique de la recherche en sciences humaines et sociales.

Pour remplir cette mission, la TGIR Huma-Num est btie sur une
organisation originale consistant mettre en uvre un dispositif
humain (concertation collective) et technologique (services numriques
prennes) lchelle nationale et europenne en sappuyant sur un
important rseau de partenaires et doprateurs.

En savoir plus

TGIR Huma-Num
Ple communication
190, avenue de France
75013 PARIS
INFORMER PARTAGER DIFFUSER
huma-num.fr
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 3

SOMMAIRE

Contexte dactivit de la TGIR Huma-Num (2013-2015). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5


I - Mission de la TGIR Huma-Num. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
II - Organisation de linfrastructure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
III - Rpartition des services numriques.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
IV - Dimension internationale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
V - Perspectives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
VI - Liste des consortiums au 30 juin 2015. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Direction dHuma-Num

Marc Renneville,
Directeur de recherche CNRS,
directeur.
Stphane Pouyllau
Ingnieur de recherche CNRS,
directeur-adj.technique .
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 5

Contexte dactivit de la TGIR Huma-Num


(2013-2015)

Prvue dans la feuille de route 2008-2012 du MESR sur les


infrastructures de recherche, la dcision de fusionner le TGE
Adonis (cr en 2004) et lIR Corpus (cr en 2011) reposait sur
le constat de la complmentarit des services et des ralisations
des infrastructures prcites : par la cration et la rflexion sur
les corpus, les consortiums dIR-Corpus tendaient favoriser
lacculturation du numrique dans les communauts SHS. Men
par les chercheurs, le processus de concertation faisait merger
des besoins en partie couverts par les outils prcdemment forgs
par le TGE Adonis : grille de services et de traitement de donnes,
archivage long terme, portail daccs unifi aux donnes SHS,
mise en rseau au niveau europen. La nouvelle TGIR devait donc
mettre en synergie la concertation collective des communauts
scientifiques et loffre doutils numriques.

La russite de lopration de fusion pouvait ainsi tre consid-


re comme acquise ds lors que la nouvelle TGIR aurait atteint
les trois objectifs suivants :

Objectif 1 : la reprise et la consolidation des missions et


des activits opres par le TGE Adonis et Corpus IR.
Objectif 2 : le dveloppement de nouveaux services ddis
aux donnes de la recherche.
Objectif 3 : offrir rapidement une bonne visibilit de la
nouvelle infrastructure dans les communauts scientifiques SHS.

La fusion a t ralise au 1er mars 2013. Deux annes aprs,


ce bilan intermdiaire a pour but de mesurer le chemin accompli et
dapprcier la dynamique engage par la TGIR Huma-Num.

Juillet 2015
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 7

I - Mission de la TGIR Huma-Num


Huma-Num est une trs grande infrastructure (TGIR) visant faciliter le tournant
numrique de la recherche en sciences humaines et sociales.
Pour remplir cette mission, la TGIR Huma-Num est btie sur une organisation
originale consistant mettre en uvre un dispositif humain (concertation collective)
et technologique (services numriques prennes) lchelle nationale et europenne
en sappuyant sur un important rseau de partenaires et doprateurs.

La TGIR Huma-Num favorise ainsi, par lintermdiaire de consortiums regroupant


des acteurs des communauts scientifiques, la coordination de la production
raisonne et collective de corpus de donnes (recommandations scientifiques, bonnes
pratiques technologiques). Elle dveloppe galement un dispositif technologique
unique permettant le traitement, la conservation, laccs et linteroprabilit des
donnes de la recherche en SHS. Ce dispositif est compos dune grille de services,
dune plateforme daccs unifi (ISIDORE) et dune procdure darchivage long
terme, ddis aux besoins des communauts SHS.

La TGIR Huma-Num propose en outre des guides de bonnes pratiques tech-


nologiques gnra-listes destination des chercheurs. Elle mne rgulirement des
actions dexpertise et de formation. Elle porte la participation de la France dans le
projet DARIAH en coordonnant la contribution nationale.

II - Organisation de linfrastructure
Statut de la structure : UMS 3598 (tutelles CNRS-Aix-Marseille Universit-EPCS
Condorcet) suite la fusion de lUPS 2916 (ADONIS) et de lUMS 3534 (CORPUS) au
01/03/2013.

1. Organigramme Organigramme - TGIR Huma-Num

Directeur : Marc Renneville (DR, CNRS)


Directeur technique : Stphane Pouyllau (IR, CNRS)

Administration et Communication /
gestion nancire Formation
Ariane Allet (IE, CNRS), resp. Nadine Dardenne (IE, CNRS), resp.
Alain Belvindrah (T, CNRS) Latitia Najar (IE, cdd)

Ple Ple donnes Ple infrastructure


International (archivage et accs) numrique

Sophie David (CR, CNRS), resp. Jol Marchand (IR, CNRS), resp.
Nicolas Larrousse (IR, CNRS), resp.
Anne Joly (IR, cdd) Grald Foliot (IR, CNRS)
Shadia Kilouchi (IE, CNRS)
Nicolas Larrousse (IR, CNRS) Pierre-Yves Jallud (IE, CNRS)
Jean-Luc Minel (PU)
Jean-Luc Minel (PU) Nicolas Larrousse (IR, CNRS)

Huma-Num - Trs Grande Infrastructure de Recherche - UMS 3598 avril 2014


2. Gouvernance

La TGIR Huma-Num est dote dun comit de pilotage et dun conseil scientifique.

Comit de pilotage

Missions :
approuver les programmes scientifiques ;
valider la proposition de budget annuel dans le cadre dune programmation
pluriannuelle et de son excution ;
mettre en place un conseil scientifique et un comit des utilisateurs ;
mettre en place les instances dvaluation requises ;
approuver les projets de collaboration ;
prparer lvolution et leuropanisation de la TGIR Huma-Num

Il comprend neuf membres :


Patrice Bellot, Reprsentant de Monsieur le Prsident de lUniversit
Aix-Marseille
Olivier Baude, Prsident du Conseil Scientifique
Patrice Bourdelais, Directeur de lInstitut des Sciences Humaines et sociales
(InSHS)
Christian Chardonnet, Chef du dpartement Grandes Infrastructures de
Recherche, Ministre de lEnseignement Suprieur et de la Recherche
Alain Fuchs, Prsident de lAlliance Athna
Bertrand Jouve, Directeur adjoint scientifique, en charge des TGIR, Institut des
Sciences Humaines et sociales (InSHS)
Sylvie Max-Colinart, adjointe au Chef de la Mission, Ministre de la culture et de
la communication/SG/SCPCI/Dpartement de la recherche, de lenseignement
suprieur et de la technologie
Laurent Pinon, Reprsentant du Prsident du comit des trs grands quipe-
ments scientifiques et grandes infrastructures (CNRS)
Jean-Claude Waquet, Prsident du Campus Condorcet

Mokrane Bouzeghoub, reprsentant de lINS2I (CNRS) et la direction de la TGIR


Huma-num assistent aux runions du Comit de pilotage.

Conseil scientifique

Le conseil scientifique donne son avis sur toute question scientifique et tech-
nologique concernant les activits de la TGIR Huma-Num.
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 9

En particulier, le conseil scientifique :

donne un avis densemble sur les priorits de la TGIR Huma-Num ;


value les propositions dactions soumises par la direction de la TGIR
Huma-Num ainsi que les procdures retenues (type dappels doffres, valu-
ation, etc.) ;
value annuellement lactivit de la TGIR Huma-Num et prcise les critres et
les indicateurs qui lui paraissent pertinents ;
peut procder, la demande du comit de pilotage, des valuations
ponctuelles.

Il comprend douze membres :


Olivier Baude, Matre de confrences, Laboratoire Ligrien de Linguistique
Frdrique Brunet, Charge de recherche au CNRS, ArScAn, quipe Archologie
de lAsie Centrale
Philippe Casella, Directeur de la direction du dveloppement de la recherche,
EHESS
David Fiala, Matre de confrences, Centre dEtudes Suprieures de la
Renaissance
Franoise Genova, Directrice de recherche au CNRS, Observatoire astronom-
ique de Strasbourg
Brigitte Marin, Directrice de la Maison Mditerranenne des Sciences de
lHomme
Frdric-David Martin, Conservateur dEtat des bibliothques, Bibliothque
nationale de France
Pierre Mounier, Directeur-adjoint, Centre pour lEdition Electronique Ouverte
Yann Nicolas, Chef du dpartement Etudes et Projets, Agence Bibliographique
de lEnseignement Suprieur
Olivier Rouchon, Responsable du dpartement Archivage et diffusion, Centre
informatique nationale de lenseignement suprieur
Julien Sicot, Responsable du systme dinformation documentaire, Universit
de Rennes 2
Marcello Vitali Rosati, professeur au dpartement des littratures de langue
franaise luniversit de Montral

Le conseil scientifique est prsid par Olivier Baude. Franoise Genova en est la
vice-prsidente.
La direction de la TGIR Huma-Num participe aux runions du conseil scientifique.
Alexandre Gefen, reprsentant du conseil scientifique de lINSHS est invit perma-
nent de ce conseil.

Site web : http://www.huma-num.fr/


3. Contexte local, franais et international

La TGIR Huma-Num travaille au niveau national avec :

le CC-IN2P3 (Centre de Calcul de lIN2P3) pour lexploitation de linfrastructure


numrique
le CCSD (Centre pour la Communication Scientifique Directe) pour la mise en
uvre de la plateforme de recherche ISIDORE
le CINES (Centre Informatique National de lEnseignement Suprieur) pour
larchivage long terme
LABES (Agence Bibliographique de lEnseignement Suprieur) pour le travail
sur lexposition et le signalement des donnes (Star, Numes, Sudoc)
Le rseau des Maisons des Sciences de lHomme pour lorganisation des
consortiums
Les plateformes de publications scientifiques Clo/revues.org et Perse.
Le CLEO (Centre pour ldition lectronique ouverte)

Les activits du ple international dHuma-Num sinscrivent dans le cadre de poli-


tiques scientifiques tablies aussi bien au niveau europen quau niveau national.

4. Concertation collective

ACCOMPAGNER LES COMMUNAUTS DE RECHERCHE

PROJETS DE RECHERCHE OUTILS ET SERVICES


UMR . ANR . ERC . EA Stocker . Traiter . Diffuser
Labex . Equipex, ... Exposer . Signaler . Archiver

CONSORTIUMS RESEAU EUROPEEN


Numrisation Partage . Expertise
Bonnes pratiques
Expertises

La TGIR est centre sur la mise disposition de services numriques permet-


tant lorganisation, lexploitation et la valorisation de la production des
donnes numriques de la recherche en SHS. Cest ce titre quelle contribue
lorganisation de la concertation des communauts scientifiques sur les
enjeux du numrique.
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 11

La concertation collective organise par la TGIR sappuie sur 11 consortiums


disciplinaires (voir la liste en fin de document) regroupant plus 120 quipes (UMR,
UMS, quipes daccueil universitaires, Maison des sciences de lHomme) dotant les
communauts scientifiques des SHS dun rseau dchanges et de travail sur les
questions autour de lappropriation du numrique pour les donnes de la recherche
et leurs outils de traitements (corpus ; signalement ; diffusion). Lensemble des activ-
its des consortiums nourrit et oriente la stratgie de dploiement de services de la
TGIR (cf. ci-dessous) dans le but de les rendre accessibles au plus grand nombre et
de les ancrer dans une forte lgitimit scientifique. Les consortiums sont labliss
sur un programme dactivit et pour une dure de 4 ans par le comit de pilotage,
aprs valuation du conseil scientifique. Lactivit 2014 des consortiums est dtaille
dans les rapports des consortiums (ils peuvent tre obtenus sur demande la TGIR)
et au travers des valuations annuelles faite par le conseil scientifique (cf. rapport
du prsident du conseil scientifique en dcembre 2014). En 2015, 4 consortiums
lancs en 2011 - finissent leur priode de labellisation ; un processus dvaluation
des rsultats a t mis en place et sera effectu par le conseil scientifique de la TGIR.

Les consortiums et plus gnralement les communauts ou quipes scientifiques


ralisant des projets de recherche, peuvent sappuyer sur un ensemble de services
pour le traitement, le stockage, la diffusion et la conservation des donnes num-
riques de la recherche en sciences humaines et sociales. La seconde vocation de
la TGIR Huma-Num est de dvelopper, de grer et de maintenir en phase avec les
besoins des communauts SHS un ensemble de services couvrant lintgralit des
besoins lis au cycle de vie des donnes de la recherche (voir ci-dessous).
III - Rpartition des services numriques
La TGIR dploie un ensemble de services numriques ouverts, accessibles
lensemble des communauts scientifique SHS de lESR. Les services sont organiss
autour de 6 grandes thmatiques et regroupent chacun dentre-eux, un ou plusieurs
outils.

SERVICES POUR LES DONNES NUMRIQUES

STOCKER ARCHIVER
Entreposer . Organiser Prservation long terme

TRAITER SIGNALER
Outils . Logiciels Enrichissement smantique
Accs unifi

DONNES
DIFFUSER DE LA RECHERCHE EXPOSER
Machines virtuelles Documenter . Partager
Diffusion web

Partenariat avec le CC-IN2P3, le CINES, et le CCSD

Stocker : Il sagit de solutions pour entreposer et organiser les donnes num-


riques dans un espace scuris professionnel. Ce service est ralis en partenariat
avec le centre de calcul In2p3/CNRS.

Traiter : Ensemble de solutions adaptes aux besoins de transformations ou


danalyses sur les donnes en SHS : logiciels de traitement, de visualisation (calcul de
rseaux, tuilage de donnes), dencodage, de projections cartographiques, daccs
de la puissance de calcul, etc.

Diffuser : Il sagit ici dune large palette de solutions pour diffuser les donnes.
Loffre vise couvrir tous les niveaux de besoins, du plus basique au niveau expert.
Elle va de packs logiciels prconfigurs et optimiss pour lcosystme des SHS :
bibliothques numriques, interoprabilit Europeana ; Gallica ; Isidore, etc) jusqu la
fourniture de machines virtuelles prfigures pour les communauts SHS (exemple :
mise en uvre de BaseX pour la diffusion de corpus XML/TEI). Ce service est intero-
prable avec les services dexposition de donnes de la TGIR (NAKALA) et de signale-
ment (ISIDORE).

Archiver : Huma-Num fournit conseil et accompagnement dans le processus


darchivage long terme des donnes numriques : aide aux choix des formats de
donnes, normalisation des mtadonnes, transfert dans le systme darchivage du
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 13

CINES. Ce service est opr dans le cadre dune convention, renouvele en 2014 pour 4
ans, entre la TGIR Huma-Num, le CINES et le SIAF (Service Interministriel des Archives
de France). Lexpertise de la TGIR Huma-Num est aujourdhui largement reconnue sur
ces aspects darchivage des donnes numriques, au-del mme des SHS. En 2015,
larchivage de plusieurs programmes nationaux est en cours (OpenEdition, IRHT,
Equipex Ortolang) ainsi que larchivage des donnes dEcole Franaise ltranger
(EFEO). Pour rappel, cest laide de ce dispositif que les donnes de larchive ouverte
nationale HAL sont archives.

Signaler : Cr en 2010, ISIDORE est un service multilingue de rfrence pour le


signalement, lenrichissement, et laccs aux donnes en libre accs de la recherche
en sciences humaines et sociales. Depuis janvier 2015, ISIDORE est devenu une
plateforme internationale avec une nouvelle version permettant de collecter, enrichir,
indexer les donnes numriques des sciences humaines et sociales en trois langues
: anglais, espagnol, franais. Cette fonction permet un chercheur non-francophone
davoir accs des enrichissements et des classifications en anglais et en espagnol
lui permettant de mesurer lintrt de ressources en langue franaise quil est en
train de rechercher. Elle fait dISIDORE un moteur de recherche scientifique inno-
vant et reconnu sur le plan international. En effet, motivs par le fait de relier et de
signaler leurs donnes et documents dans un environnement de plus trois millions de
ressources en SHS, plusieurs partenaires europens et internationaux ont souhait
participer et sont intresss par les enrichissements trilingues reliant les donnes
entre elles mais galement disponibles pour crer des applications dans le web
smantique. Le CSIC (Madrid, Espagne)1 tait dj prsent dans ISIDORE depuis le
mois de fvrier et depuis la plateforme de livres en libre accs OAPEN (Amsterdam,
Pays-Bas) est prsente dans ISIDORE et y expose plus de 2000 ouvrages issus des
disciplines SHS. Plus rcemment 2 , la plateforme SOAS (University of London, UK),
les archives royales dEspagne (Madrid, Espagne), les archives institutionnelles de
lUniversit de Valncia la plateforme RODERIC et la bibliothque numrique de
Bibliotecas de Castilla y Len (Espagne) ont galement rejoint ISIDORE.

Par ailleurs, deux nouvelles fonctionnalits ont t dveloppes pour la version


pour tablettes et mobiles dans le cadre dexprimentations sur la visualisation des
donnes issues des enrichissements trilingues : les principales disciplines associes
un auteur sont maintenant reprsentes sous forme dun radar disciplinaire. Cette
visualisation graphique permet de se faire une ide rapide du profil d'un chercheur
dans Isidore. Depuis mai 2015, un module - Isidore Suggestions - a t dvelopp pour
le systme de gestion de contenu web (CMS) WordPress (le plus utilis au monde).
Ce module permet d'afficher sur la page d'un article des suggestions de ressources
enrichies venant d'ISIDORE. Il est possible de cibler la recherche en slectionnant une
ou plusieurs disciplines scientifiques des SHS. Depuis sa publication sur WordPress.
org, la plateforme internationale des modules pour ce CMS en mai 2015, ce module a
t install plus de 100 fois et plusieurs mises jour ont eu lieu afin de rpondre aux
demandes des premiers utilisateurs. Des discussions sont en cours avec OpenEdition
afin de proposer ce module dans la plateforme de carnet de recherche hypotheses.org.

1 Voir http://tinyurl.com/pw75ou3 [d.c. 2015/06/12].


2 Voir http://humanum.hypotheses.org/1448 [d.c. 2015/06/12].
Exposer : Partant du constat que de nombreuses quipes de recherche en SHS qui
produisent des donnes scientifiques ne disposent pas de l'infrastructure numrique
ncessaire qui permettrait un accs persistant et interoprable leurs donnes, la
TGIR Huma-Num a conu et lanc en 2014 un service d'exposition de donnes (texte,
audio, vido, etc.). Le service NAKALA sadresse aux quipes de recherche ayant peu
de moyens informatiques pour diffuser elles-mmes leurs donnes dans les rgles
de lart (en particulier lheure du cloud et des enjeux daccs et de confidentialit des
donnes) et dans de bonnes conditions dinteroprabilit.

NAKALA propose deux grands types de services : des services d'accs aux donnes
et des services de prsentation des mtadonnes. Les producteurs de donnes
numriques ainsi soulags de la gestion purement technique, peuvent se consacrer
la valorisation scientifique de leurs donnes. Un identifiant unique est associ
chaque donne et permet ainsi de citer les donnes indpendamment de leur locali-
sation relle : la technologie propose est base sur lattribution didentifiants de
type handle, qui possdent un mcanisme dadressage gnrique, sans lien avec
linstitution qui porte le service. Cest ce qui rend prenne laccs la donne, mme
en cas de changement ou dvolution de linstitution qui porte le service.
NAKALA dispose dun entrept RDF (Resource Description Framework) de type
Triple Store, qui permet de partager les informations en utilisant les principes, mth-
odes et technologies du Web de donnes. Lutilisation de ces technologies standardi-
ses permet de btir des applications de valorisation de ces donnes, par exemple
des cartes interactives. Les donnes peuvent ainsi tre moissonnes par des
services spcialiss, comme ISIDORE, mais aussi Europeana, Gallica, etc., ce qui
permettra den accrotre la visibilit. La complmentarit avec le service ISIDORE est
totale, puisque les deux services partagent les mmes principes.

Les services numriques de la TGIR sont issus de linfrastructure Adonis ,


finance en 2009 par le plan de relance gouvernemental. La cration dHuma-Num
a permis den faire un bilan fonctionnel en 2013 entrainant sa restructuration en
2014 afin dtre en capacit damliorer les services existants et den accueillir de
nouveaux. Cette lourde opration a t prsente en conseil scientifique de la TGIR
et valide en comit de pilotage en juin 2014. cette occasion, un bilan financier a
t ralis au regard de linvestissement engag et des matriels et services mis
disposition par le CC-IN2P3 : il apparait que les 410 k reprsentent bien prcisment
la valeur d'usage sur 5 ans.
La nouvelle infrastructure de la TGIR Huma-Num a t dploye en deux phases
(2013 : priode de transition ; 2014-2015 exploitation de la nouvelle infrastructure)
sous la forme de progressions itratives (cluster #1 vers cluster #2 la fin 2015).
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 15

Caractristique de la nouvelle infrastructure physique et logique


(2013-2015).

Cluster #1 :
- Mise en uvre de 8 serveurs achets fin 2013, ralisant un hbergement
modernis de l'ensemble des services et premire srie d'actions pour la bascule de
l'infrastructure de 2009 vers la nouvelle dans le courant de 2014.
- Mise jour des solutions de stockage de donnes (NAS)
- Objectif de migration complte fin 2015

Cluster #2 :
- tude comparative et maquettage des solutions de virtualisation de serveurs :
cosystme VMware, cosystme KVM (virt-manager, Proxmox, oVirt/RHEL), virtu-
alisation lgre (Linux Vserver, OpenVZ, LXC, Docker)
- Choix de l'cosystme KVM plus ouvert et plus utilis au sein de la communaut
Recherche (dont les SHS), et de LXC pour la virtualisation lgre
- Prsentation de cette tude un workshop
- Achat et mise en uvre de 2 serveurs pour dmarrer lavirtualisation de
l'infrastructure
- S1-2015 : passage en production pour une dizaine de machines virtuelles
- S2-2015 :
Virtualisation complte des serveurs
Capacit d'accueil importante dans les 2 modes (virtualisation lourde et lgre)
Mise en production de nouveaux services sur le Cluster #2 :
- Mise en production de services dditorialisation/diffusion des donnes de la
recherche dans lcosystme SHS
- Service de listes de diffusion (logiciel SYMPA) mise en uvre pour nos utilisateurs
- Documentation dtaille et publicit autour des logiciels commerciaux achets par
Huma-Num pour les communauts SHS : en particulier les licences pour les diteurs
de donnes de la recherche.

IV - Dimension internationale
La TGIR Huma-Num porte la participation de la France dans lERIC DARIAH et
participe 3 programmes H2020 accepts dans le cadre de son action pour les
humanits et le patrimoine numriques de la recherche en SHS et arts. Dans ces 3
programmes H2020, la TGIR Huma-Num fournit soit des services ddis et issus des
savoir-faire maitriss par la TGIR, soit de lexpertise sur le domaine des infrastruc-
tures de recherche en SHS. Dans ce cadre, la stratgie de la TGIR est de porter ses
services numriques dans le cadre europen des infrastructures de recherche dans
le respect des modles de dveloppement des infrastructures nationales des pays
de lUnion et dans celui des normes et standards en vigueur dans les donnes des
SHS numriques.

PARTHENOS (infradev2) : http://www.parthenos-project.eu - 388k pour la


France (partenaires : Huma-Num, INRIA) sur 4 ans.

Le programme PARTHENOS (Pooling Activities, Resources and Tools for Heritage


E-research Networking, Optimization and Synergies), qui vient dtre accept dans
le cadre dH2020 et dans lequel Huma-Num est partenaire, vise renforcer la coh-
sion de la recherche en SHS dans les disciplines du patrimoine culturel, de lhistoire,
de larchologie, de la linguistique et plus largement des humanits. Il sagit aussi
de proposer un cluster thmatique aux infrastructures europennes de recherche
(CLARIN, DARIAH) en vue dune intgration des outils et mthodes des e-infrastruc-
tures et dautres infrastructures internationales.

PARTHENOS regroupe 15 partenaires europens qui vont travailler pour mettre en


commun des standards issus des communauts scientifiques, mais aussi dvelopper
des services mutualiss interconnectant soit des services existants chez les parte-
naires, soit dfinissant de nouveaux services qui seront co-construits. PARTHENOS
sintressera plus particulirement aux diffrents cycles de vie des donnes num-
riques dans les disciplines SHS de son primtre. Dfinir, lchelle de lEurope, une
politique daccs aux donnes, dinteroprabilit, darchivage et de rutilisation des
donnes est un programme important qui devra se nourrir des expriences/projets
des partenaires de PARTHENOS.
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 17

PARTHENOS est construit en coordination avec les infrastructures europennes


CLARIN et DARIAH, dont il est pour cette dernire un projet affil. Il est coor-
donn par lItalie et le Pr. Franco Niccolucci. Le lancement officiel aura lieu au dbut
de lt 2015 Florence.

La TGIR Huma-Num dveloppe des services ddis PARTHENOS et participe la


rdaction de guide de bonnes pratiques.

DARIAH-H2020 (infradev3) : http://www.dariah.eu - 312k pour la France


(partenaires : Cleo, Huma-Num, CESR, Atilf, MoDyCo, ArScan, CIHAM, Frantiq,
IRHT, consortium IRCOM, ABES, ministere de la Culture et de la Communication)
sur 2 ans.

Il sagit dun appel cibl, conu par la CE pour les ERIC nouvellement crs afin
daider leur dmarrage. Le dossier de rponse a t labor lautomne 2014 par
lERIC DARIAH auquel taient associs les trois institutions de pays membres fonda-
teurs de lERIC : la France (avec le CNRS & les partenaires nationaux), lAllemagne
(avec luniversit de Gttingen) et les Pays-Bas (avec le DANS). Le projet est prvu
pour une dure de deux ans et il est organis autour de huit Work-Packages (WP).
La TGIR Huma-Num a coordonn la rponse franaise et a sollicit les contributeurs
DARIAH en 2015 en fonction des diffrents WP affects la France par lERIC. La
France est en charge du WP n4 (Training and Education).

RITRAIN (infrasupp3) : http://cordis.europa.eu/project/rcn/194941_en.html -


39 000 euros (partenaire : CNRS) sur 4 ans.

Le projet RITRAIN laborera un programme de formation permettant aux infra-


structures de recherche en Europe - dans tous les domaines des sciences - d'acqurir
une expertise sur la gouvernance, l'organisation, la gestion financire et le personnel,
le financement, la proprit intellectuelle, la prestation de services et de sensibilisa-
tion dans un contexte international. Il est conu et dvelopp par des experts qui ont
mis en place et/ou grs des infrastructures de recherche du concept maturit. La
rponse est pilote par lERIC BBMRI. Le CNRS (via la TGIR Huma-Num) est parte-
naire dans le cadre dapports sur les questions dexpertises.

Coordination de la participation de la France dans DARIAH

La TGIR Huma-Num porte et coordonne la participation de la France dans lERIC


DARIAH qui est entr aprs une longue phase de prparation (2011-2014) dans
sa phase de construction (cration de lERIC le 15 aot 2014, inauguration en nov.
2014 Paris au MENESR). A ce titre, Huma-Num tablit la feuille de route nationale,
finance la contribution financire annuelle (cash : 151k) et organise le rassemble-
ment des contributions en nature (in-kind). En 2014, la coordination opre par la
TGIR Huma-Num a t centre sur le rassemblement des contributions en nature
(appel a contributions en 2014 pour 2015 - chiffrage des contributions en nature
pour 2015 : 4 millions euros) :
- 51 contributions ont t dposes, toutes les contributions ont t examines au
niveau franais par le conseil scientifique de la TGIR, des recommandations aux candi-
dats ont t formules. Toutes les contributions ont t valides au niveau europen.
- 28 entites contributrices (ABES, Archeovision, Arscan, CCSD, CESR, CHJ, CIHAM,
CINES, Cleo, FMSH, FRANTIQ, Huma-Num, INIST, InVisu, IRHT, MAP, MMSH, Modyco,
Praxiling, les consortiums COSME, IRCOM, Archives des ethnologues et CAHIER, les
Equipex Ortolang et Biblissima, enfin la DREST, la DSIP et la BNF, qui dpendent du
ministere de la Culture et de la Communication)
- 27 disciplines SHS representees
- 243 personnes impliquees ; 232 representent plus de 33 ETP, issues de 40
etablissements dont 23 universites
- Mise en ligne des descriptifs des contributions franaises (version francaise) sur le
site de DARIAH-FR

La participation des communauts franaises reste dterminante dans lERIC


DARIAH car les contributions franaises, en particulier celles issues des plateformes
nationales de premier plan (ditions, archives ouvertes, donnes, bibliomtrie, etc.)
sont les principaux fournisseurs de services, de savoir-faire, et dexpertises dans
DARIAH.
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 19

V - Perspectives
On peut apprcier les perspectives de la nouvelle TGIR au regard de lopration de
fusion du TGE Adonis et de lIR Corpus, des caractristiques dHuma-Num et de sa
prospective.

1. valuation de la fusion

Lopration de fusion peut tre value selon les objectifs initiaux :

- Objectif 1 : la maintenance et la consolidation des missions et des activits opres


par le TGE Adonis et Corpus IR.
Indicateurs de russite : reprise complte de larchitecture de linfrastructure num-
rique, en cours dachvement. Passage dIsidore au multilinguisme, mise en produc-
tion de larchivage long terme avec le CINES, cration de lERIC Dariah en 2014,
ralisation dune action nationale de formation par an.

- Objectif 2 : le dveloppement de nouveaux services ddis aux donnes de la


recherche.
Indicateurs de russite : labellisation de deux nouveaux consortiums (Musica et 3D),
cration du service dexposition de donnes Nakala largement utilis par les commu-
nauts SHS, du service daccueil de projets sur VM, du service de pack Omeka.

- Objectif 3 : offrir rapidement une bonne visibilit de la nouvelle infrastructure dans


les communauts scientifiques SHS.
Indicateurs de russite : cration et diffusion dune identit propre la nouvelle
structure (nouveau nom, nouvelle identit visuelle, nouveaux sites, prsence sur les
rseaux sociaux)

2. Caractristiques actuelles

Huma-Num appuie son action sur une forte implication des communauts
scientifiques SHS pour la dfinition, lusage et le suivi de ses services.
Huma-Num est leader en matire de web smantique dans le domaine de la
recherche en SHS, en particulier en matire de mise en uvre des mthodes et
techniques du web smantique (web de donnes) grande chelle (big data).
Huma-Num est lunique partenaire labellis par les Archives de France pour
larchivage long terme des donnes numriques de la recherche (en coopra-
tion avec le CINES).
Huma-Num coordonne la participation de la France dans DARIAH (ERIC).
La TGIR Huma-Num prsente une forte valeur ajoute par rapport aux infrastruc-
tures similaires existantes dans son domaine scientifique par les points suivants :
Dfinition et mise en uvre de services numriques tourns vers les donnes
de la recherche en SHS et adapts aux besoins multiples des communauts
SHS (services spcifiques pousant les pratiques de recherche).
Convention CINES/MCC sur larchivage long terme des donnes numriques
Mise en uvre du web smantique pour les donnes en SHS (publications,
donnes de la recherche). Dans ce domaine la TGIR Huma-Num est reconnue
au niveau mondial pour son expertise en matire de signalement des donnes
de la recherche SHS dans le web smantique (Linked Open Data) avec les
services ISIDORE et NAKALA.
Articulation de ses services au niveau national, europen et international si
applicable

3. Prospective

La TGIR Huma-Num doit poursuivre son ancrage en tant quinfrastructure de


recherche dployant des services numriques forgs au sein des communauts
scientifiques des SHS et portes lchelle nationale, europenne et internationale.
Il sagit de dployer des services et des outils au meilleur niveau et au bon moment
dans les processus de recherche, en tenant compte des modalits dappropriation et
dutilisation diffrents selon les disciplines scientifiques.

Il sagira aussi daccrotre la lisibilit des services, den dvelopper/adapter/dployer


de nouveaux en co-animation avec les quipes scientifiques et lquipe de la TGIR. La
mise en exploitation sur le long terme sera lun des enjeux majeurs pour les annes
venir. Les programmes H2020 dans lesquels la TGIR est partenaire apporteront des
pistes de collaboration internationale quil faudra articuler aux services dploys pour
les communauts nationales. La TGIR Huma-Num devra anticiper toute croissance
la lumire de ses moyens humains, de la qualit de ses services pour les commu-
nauts SHS et de lcosystme de le-science internationale. Sur le plan national, elle
devra parachever son rseau distribu en poursuivant et structurant la coopration
avec les MSH notamment.

La TGIR Huma-Num se positionne ainsi dans le paysage des grandes infrastruc-


tures de recherche internationales. Son assise lui permet de dployer des services
ddis aux donnes de la recherche linternational et en coopration avec le rseau
dacteurs SHS et digital humanities autour de DARIAH-ERIC et dont il faudra valuer
rgulirement les gains pour les communauts nationales. Les actions de la TGIR
Huma-Num sinscrivent de plus en plus au sein de cooprations internationales non-
europennes (via la Research Data Alliance) avec des partenaires universitaires du
monde francophone (dont lUniversit de Montral) et non-francophone avec des
collaborations dj inities avec des rseaux europens tel que le REDIAL/CEISAL,
Calcul Qubec, Universit de Stanford (en particulier autour des projets ISIDORE,
NAKALA).
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 21

VI - Liste des consortiums au 30 juin 2015

Les consortiums runissent plusieurs units et quipes autour de thmatiques et


dobjets communs pour lesquels ils dfinissent des procdures et standards num-
riques partags. Ils formulent un programme de numrisation ou de documentation
pluriannuel pour lequel ils sengagent apporter une partie des moyens ncessaires
(en particulier en personnel), et pour lequel ils demandent, en outre, un soutien de la
part de la TGIR. Afin dobtenir ce soutien, les consortiums doivent tre labelliss.

Consortium Musica

Labellis en 2014

Le consortium Musica runit plusieurs units et quipes de recherches autour


dune thmatique commune : la valorisation et lexploitation de donnes musi-
cales numriques par lutilisation de rfrentiels communs, la diffusion de bonnes
pratiques dencodage et des oprations de numrisation des donnes.

Lun des objectifs de Musica sera de coordonner la rflexion pistmologique des


chercheurs, ainsi que le dveloppement de nouveaux outils de reprsentation et
danalyse de la musique. Ces outils pourront prendre appui sur les langages HTML5,
CSS3 et javascript, qui constituent les nouveaux standards de linternet et permettent
de raliser des dispositifs multimdia interactifs facilement adaptables dun projet
lautre. Une attention particulire sera porte aux manires dintgrer ces nouveaux
outils de reprsentation ceux dvelopps dans les axes du consortium, notamment
la constitution de corpus de partitions et le dveloppement de plateformes darchives
sonores en ligne.

En savoir plus : http://humanum.hypotheses.org/503

Consortium 3D

Labellis en 2014

Les usages des technologies 3D se diversifient et occupent une place de plus


en plus importante dans les processus dtude des socits humaines. Plusieurs
quipes de recherches jouent un rle dans lappropriation de ces nouveaux outils et
collaborent ainsi lmergence de nouvelles pratiques. Le consortium 3D se propose
de fdrer ces pratiques en les adossant un rseau dunits fortement impliques,
afin doptimiser linsertion des mthodologies 3D au service dobjectifs de recherche,
tant au niveau rgional, national, quinternational.

En savoir plus : http://humanum.hypotheses.org/480


Consortium Mmoires des archologues et des sites archologiques
(MASA)
Labellis en 2012

Ce consortium runit un certain nombre dacteurs nationaux dj rassembls


dans le rseau national des Maisons des Sciences de lHomme (GIS RMSH) traitant
darchologie et le Muse darchologie nationale.

En vue de favoriser toute recherche nationale ou internationale, ce consortium


propose la mise en place dun accs unifi des corpus numriss avec des proc-
dures et des outils documentaires et archivistiques communs.

En savoir plus : http://masa.hypotheses.org

Consortium Sources Mdivales (COSME)

Labellis en 2012

Le positionnement de ce consortium est clairement pluridisciplinaire : il sappuie


sur une communaut scientifique largement ouverte toutes les disciplines, rassem-
blant archologues, historiens, historiens de lart, philosophes, linguistes, littraires
et runie autour dune pratique commune : celle de la recherche sur le pass mdival
par le biais des sources les plus diverses. Ces sources sont au cur des proccupa-
tions du consortium : projets ddition ou de transcription, de reproduction num-
rique ou dun rpertoire les recensant.

En savoir plus : http://cosme.hypotheses.org

Consortium Cartes et photographies pour les gographes

Labellis en 2012

En France, quelques portails cartographiques et plateformes de diffusion de


donnes et mtadonnes ont t mis en place, principalement par des institutions,
mais il est ncessaire de dvelopper ce travail une autre chelle afin de gn-
raliser laccs dautres fonds pertinents et damliorer la diffusion des images
gographiques. Lobjectif de ce consortium est donc de rendre accessibles, consulta-
bles et mobilisables des donnes cartographiques et photographiques nombreuses
et parses, qui constituent des fonds de laboratoires de recherche, de bibliothques
remarquables ou des fonds de chercheurs, ressources en gnral sous-exploites
faute daccs en ligne ou de documentation suffisante.

En savoir plus : http://humanum.hypotheses.org/191


BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 23

Consortium Archives des sciences sociales du politique (Archipolis)

Labellis en 2012

Ce consortium a pour mission darchiver les recherches engages linterface des


sciences sociales et portant sur les diffrentes composantes de lobjet politique des
plus spcifiques telles que les lections, les partis, les syndicats et autres organisa-
tions politiques, le mtier politique, laction publique, les institutions, la citoyennet,
mais aussi plus largement toutes formes collectives dappartenances et de compor-
tements mettant en jeu les rapports de pouvoir.

En savoir plus : http://archipolis.hypotheses.org et http://humanum.hypotheses.


org/147

Consortium Archives des mondes contemporains


Labellis en 2012

Ce consortium a pour objet la cration dun instrument de recherche collectif qui


permette de rpondre aux problmes qui dcoulent de la nature mme des archives
de la priode contemporaine (XIXe-XXe sicle) qui sont caractrises tout la fois par
leur masse, lhtrognit des supports (du papier au microsillon en passant par la
photographie ou les disquettes informatiques, CD-rom et les supports vido anciens
et rcents), leur fragilit, la diversit de leur statut juridique (public ou priv), et la
dispersion des lieux o elles sont conserves.

En savoir plus : http://arcmc.hypotheses.org et http://humanum.hypotheses.


org/231

Consortium CAHIER - Corpus dAuteurs pour les Humanits : Infor-


matisation, dition, Recherche

Labellis en Septembre 2011

CAHIER est un consortium transversal interdisciplinaire. Il a pour objectif de


fdrer les diffrentes initiatives existantes ou en projet en France dans les domaines
des corpus dauteurs, quils relvent de la littrature, de la philosophie ou dune
thmatique lie une cole ou une pratique, afin dapporter coordination, partage
dexpriences et de favoriser laccs aux donnes.

Les corpus pris en compte dans ce consortium sont fortement associs une
activit ditoriale, quelle soit seulement numrique ou quelle ait un double support
(sur papier et en ligne). CAHIER se dfinit par rapport lexistence dune uvre
(incluant les documents prparatoires), ou de plusieurs uvres identifies, dont la
cohrence mrite dtre souligne, publie et outille pour donner lieu de nouvelles
recherches.

En savoir plus : http://cahier.hypotheses.org/


Consortium Corpus Oraux et Multimodaux (IRCOM)

Labellis en 2011

Ce consortium a vocation fdrer les quipes, laboratoires, chercheurs et ensei-


gnants-chercheurs engags dans la constitution de corpus oraux et multimodaux,
afin de faire converger les pratiques et de les rendre conformes aux standards
internationaux.

En savoir plus : http://ircom.huma-num.fr et http://humanum.hypotheses.


org/184

Consortium Corpus crits

Labellis en 2011

Ce consortium se donne prcisment pour but de fdrer les quipes et labo-


ratoires, les chercheurs, enseignants-chercheurs, ou ingnieurs engags dans la
production de corpus numriques crits, quels que soient la langue et lalphabet
considrs et doffrir la reprsentation la plus large possible de cette communaut,
afin daccompagner le dveloppement des corpus crits, den faire converger les
pratiques et les besoins, et de financer des actions rpondant ses missions. Il vise
ainsi rpondre aux besoins dinformation, de formation, de partage des bonnes
pratiques et de diffusion des standards europens et internationaux en matire de
cration, production, dveloppement et valorisation des corpus numriques crits.

En savoir plus : http://corpusecrits.huma-num.fr et http://humanum.hypotheses.


org/315

Consortium Archives des ethnologues

Labellis en Juillet 2011

Ce consortium est cr pour rpondre aux questions spcifiques qui se posent aux
ethnologues devant la singularit de leurs corpus, limportance thorique et patrimo-
niale de leurs travaux, la richesse et la diversit humaine quils reprsentent. Il sagit,
dans un premier temps, dassurer la conservation et la prennisation des donnes
collectes par les ethnologues sur le terrain ainsi que de tous documents pouvant
aider la contextualisation de ces donnes ou une meilleure comprhension de
llaboration des travaux anthropologiques. Dans un deuxime temps, lobjectif du
consortium est de mettre disposition ces matriaux dans le respect de la proprit
intellectuelle et des normes thiques.

En savoir plus : http://ethnologues.huma-num.fr


BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 25

FMSH - Paris 2013

Retrouvez toute lactualit dHuma-Num sur :


http://www.huma-num.fr
http://humanum.hypotheses.org