Vous êtes sur la page 1sur 245

Les bases de la science ouverte

Cécile Arènes
ENSAM, 5 juillet 2022
Qui suis-je ?
Cécile Arènes
Conservatrice des bibliothèques
Chargée de mission Données de la recherche et Humanités numériques à la
bibliothèque de Sorbonne Université
Membre du GTSO données de Couperin et du collège Données du CoSO
Déroulé de la journée
Horaires Objectif Points à aborder Modalités
9h30 – 10h (15') - accueil Modalités pratiques, tour de table
10h - 10h45 (45’) - séquence 1 Science ouverte Un peu d’histoire Exposé
International
PNSO
Définitions (science ouverte, OA, open data, reproductibilité, sciences
citoyennes)
Financements de la recherche

10h45 - 11h (15') - activité 1 Privés de savoir Introduction aux enjeux de la publication scientifique Vidéo
11h - 11h15 (15') - pause break
11h15 - 12h15 (60') - séquence 2 Archives ouvertes Mouvement de l’OA Exposé
Bibliométrie
Open access : les voies
APC
Preprints
LPRN volet OA
Exigences des financeurs : Plan S
Editeurs prédateurs

12h15 - 12h30 (15') - activité 2 approfondissement Questions et échanges sur l’OA Quizz en équipes
12h30 - 13h30 (60') - déjeuner break
13h30 – 14h (30’) – séquence 2 – suite Archives ouvertes – suite Éditeurs : modèle économique et négociations (Christine) Exposé
14h – 15h (60') - séquence 3 Données de la recherche Types de données Exposé, vidéos
Cycle de vie
Plan de gestion des données
Exigences des financeurs : données
Data papers
Codes et logiciels
Cahiers de labos

15h - 15h15 (15') - activité 3 approfondissement Questions et échanges sur les données Quizz en équipes
15h15 - 15h30 (15') - pause break
15h30- 16h (30') - séquence 4 RGPD, cadre juridique Données personnelles : définition, cadre juridique et enjeux (collecte de Exposé
Ressources éducatives libres ces données par les éditeurs, protection de ces données dans les
projets de recherche)
Open access et mandat de dépôt (rappel droit d’auteur, exemple du
contentieux de Nantes)
Cadre sur les données
Ressources éducatives libres
Tour de table
INTRODUCTION,
UN PEU
D’HISTOIRE
Documenter
– Au cours du 17e siècle, on passe du registre,
largement utilisé depuis le 13e siècle, à la
fiche.
– La fiche est plus facile à manipuler, à
déplacer et à classer.
– Voir : Bert, Jean-François. Une histoire de la
fiche érudite. Nouvelle édition [en ligne].
Villeurbanne : Presses de l’enssib, 2017
(généré le 31 décembre 2021). Disponible
sur Internet :
http://books.openedition.org/pressesenssib
/6211
Un précurseur, Paul
Otlet
– 1895 : Création de l’Office international de bibliographie (OIB).
Objectif : élaborer un Répertoire Bibliographique Universelle (RBU),
sorte de bibliographie du savoir humain rassemblant les notices de
tous les ouvrages publiés dans le monde quel qu’en soit le sujet ou le
temps.
– 1919-1920 : ouverture du Mundaneum, centre scientifique
documentaire, éducatif et social
– Notion de “document” très élargie : outre les livres, prise en compte
d’une grande variété de supports
– Anticipe la notion d’hypertexte : “complexe de machines associées
pouvant réaliser sept opérations dont « l’établissement des
documents de manière à ce que chaque donnée ait son individualité
propre et dans ses relations avec celles de tout l’ensemble, qu’elle y
soit rappelée là où il est nécessaire”
– Anticipe aussi l’internet : “Réseau universel d’information et de
documentation, capable de mettre en relation tous les organismes
particuliers de documentation. Sous nos yeux, écrit-il, est en voie de
se constituer une immense machinerie pour le travail intellectuel.
Elle se constitue par la combinaison des différentes machines
Voir : « Savoirs CDI: Paul Otlet ». s. d. Consulté le 4 janvier 2022.
existantes, dont les liaisons nécessaires s’entrevoient. Cette
https://www.reseau-canope.fr/savoirscdi/index.php?id=524. machinerie constituerait un véritable cerveau mécanique et
Image : Wikimedia Commons. Domaine Public.
https://commons.wikimedia.org/wiki/File:Paul_Otlet_%C3%A0_son_bureau_(cropped).jpg collectif”
L’hypertexte
– Au croisement de l’informatique et de la documentation
– 1945 : notion de Memex (pour Memory Extender), Vannevar Bush : " sorte
de bibliothèque et de fichier mécanisés. C’est un dispositif dans lequel un
individu stocke ses livres, ses enregistrements, toutes les informations qu’il
reçoit, automatisées de telle manière qu’il puisse compulser l’ensemble avec
le maximum de rapidité et de liberté "
– années 1960 : expérimentations de Douglas Engelbart et Ted Nelson et
création du terme “hypertexte”
Voir : Serres, Alexandre. 1995. « Hypertexte : une histoire à revisiter », 1995
https://archivesic.ccsd.cnrs.fr/sic_01180259/.
Internet et le web
– 1973 : création du protocole TCP/IP
par Vint Cerf : ensemble des règles de
communication sur internet et se
base sur la notion adressage IP
– 1989 : Tim Berners Lee “invente” le
web :
• attribution d’une adresse à
chaque document (URL) afin de le
localiser dans le système et liens
entre les pages créées par un
système de liens hypertextes.
• ajout d’un protocole de transfert,
http, et un langage, html,
complètent le dispositif
– Web sémantique : évolution du web, qui permet
d’utiliser les données structurées (par exemple, les
Web métadonnées contenues dans un catalogue de
bibliothèque) et de les rendre intéropérables

sémantique et – Web de données :


• promouvoir une vision du Web comme une base
de données globale,
web de • relier les données sur le Web de la même façon
que l’hypertexte permet de relier des
données Source :
documents (les pages Web)

https://archive.wikiwix.com/cache/index2.php?url=http%3
A%2F%2Fwww.bnf.fr%2Ffr%2Fprofessionnels%2Fweb_sem
antique_donnees%2Fs.web_semantique_intro.html
Nouvelles évolutions
– Big data et IA, nouvelles logiques : on ne classe plus en amont, mais on cherche
dans la masse (en résumant à gros traits).
– Notion de 4e paradigme :
• 1er paradigme (il y a 1000 ans) : recherche empirique pour décrire les
phénomènes naturels
• 2e paradigme (depuis 100 ans) : recherche théorique, à partir de modèles et
de généralisations
• 3e paradigme (depuis quelques décennies) : recherche informatisée basée sur
des simulations de phénomènes complexes
• 4e paradigme (aujourd’hui) : exploration de données, intégration des théories,
simulations et expérimentations
Grande heure de gloire de la donnée
Source : https://lalist.inist.fr/?p=8013 et
https://docs.google.com/presentation/d/1nh5Sv-CjUUMlc30BK-gE8Z2Hun7ZvIOx/edit?usp=sharing&ouid=102297717099282383677&rtpof=true&sd=true (slide 5)
Une lecture
Cardon, Dominique. Culture
numérique. Paris, France:
SciencesPo les presses, 2019.
SCIENCE
OUVERTE
Définition
“Open Science is the practice of science in such a way that others can
collaborate and contribute, where research data, lab notes and other
research processes are freely available, under terms that enable reuse,
redistribution and reproduction of the research and its underlying data
and methods.”

FOSTER. s. d. « Open Science Definition ». Consulté le 3 octobre 2021.


https://www.fosteropenscience.eu/foster-taxonomy/open-science-definition
Un terme ombrelle
지우 황 . CC BY 2.0.
https://www.flickr.com/photos/100477638@
N03/10204741904
Une nouveauté ?

1665 : Philosophical
Transcations

1665 : Journal des


sçavans

Illustrations : Wikimedia Commons, Royal Society


Robert Merton
1942 : Robert Merton
- “universalisme”
- “communalisme”
- “désintéressement”
- “scepticisme organisé”

Illustrations : Wikimedia Commons


Open access, entre initiatives des
pionniers, dark open access et
politiques institutionnelles

Lancement
d’ArXiv, Amsterdam Call
développé par Ouverture de Lancement de for Action on
Paul Ginsparg HAL Sci-Hub… Open Science

1999 2002 2012

1991 2001 2011 2016

Lancement de Budapest Open San Francisco


E-biomed, Access Initiative Declaration on
aujourd’hui Research
PubMed Assessment
Central, sous (DORA)
l’impulsion de
Harold Varmus

Sources : Pogens. “Paul Ginsparg”, CC BY-SA 3.0. https://commons.wikimedia.org/wiki/File:Ginsparg_at_Cornell_University.jpg.


Matthew Septimus (photographer), “Harold Varmus”, CC BY-SA 4.0.
https://commons.wikimedia.org/wiki/File:National_Cancer_Institute_director_Harold_E._Varmus_(3)_(cropped).jpg. Apneet Jolly,
“Alexandra Elbakyan, CC BY 2.0. https:
Le mouvement de l’open data : des initiatives
anciennes
– 1992 : Genbank
– 2007 : travaux sur l’
Open government data à l’i
nitiative
de Lawrence Lessig, Tim
O’Reilly, Ethan Zuckermann,
Joseph Hall, Aaron
Schwartz et Carl Mamamud

Principes : accessibilité,
données non-propriétaires,
licences ouvertes, etc.
Images : Silvio Tanaka, « Tim Berners-Lee, CC BY 2.0. https://commons.wikimedia.org/wiki/File:Tim_Berners-Lee_CP.jpg
Lessig 2016, CC BY 2.0. https://commons.wikimedia.org/wiki/File:Lawrence_Lessig_Headshot.jpg
Christopher Michel, “Tim O’Reilly”, CC BY 2.0. https://commons.wikimedia.org/wiki/File:Tim_O%27Reilly_-2017(38700700672)_(cropped).jpg
Sage Ross, CC BY-SA 2.0. https://commons.wikimedia.org/wiki/File:Aaron_Swartz_2_at_Boston_Wikipedia_Meetup,_2009-08-18.jpg
David Orban, CC:BY, Open Government Working Group. https://www.flickr.com/photos/davidorban/2095565103/in/album-72157603410393877/
Le mouvement de l’open data : du côté du web
Echelle 5 étoiles, Tim Berners-Lee, 2006

★ publiez vos données sur le Web (peu importe leur format) avec
une licence ouverte

★★ publiez-les en tant que données structurées (par exemple, un


document Excel au lieu d’une image scannée d’un tableau)

★★★ publiez-les dans un format ouvert et non-propriétaire (par


exemple, un CSV plutôt qu’un Excel)

★★★★ utilisez des URI pour désigner des choses dans vos
données, afin que les gens puissent faire des références à celles-ci

★★★★★ liez vos données à d’autres données pour y ajouter du


contexte
Le mouvement de l’open (data) : répondre à une
attente citoyenne

Sous l’impulsion de Barack Obama, lancement


de l’Open government partnership, 2011, une
initiative réunissant près de 80 pays

« OGP’s vision is that more governments


become sustainably more transparent, more
accountable, and more responsive to their
own citizens, with the ultimate goal of
improving the quality of governance, as well
as the quality of services that citizens
receive. »
Le mouvement de
l’open (data) : en
France
– Ouverture de data.gouv.fr en 2011
– Création de la mission interministérielle
Etalab en 2013
– Pour une action publique transparente et
collaborative : plan d’action national pour la
France, 2015-2017, puis 2018-2020
• 21 engagements : engagement 18 :
« Construire un écosystème de la
science ouverte »
– Partenariat pour un gouvernement ouvert
2021-2023
A l’international
Aux Etats-Unis, un programme fédéral dans le cadre de l’OGP :
- thirty-two United States agency funders collaborate to improve the preservation, discoverability,
accessibility, and usability of Federally funded scientific research
- Facilitating coordination across Federal Government agencies on open science efforts;
- Developing appropriate incentives to encourage researchers to adopt open science principles; -
Streamlining and synchronizing agency and researcher data management practices for maximum
utility to the public;
- Collaborating with academia, researcher communities, and industry toward the development of
research data standards that further open science.
Source :
https://www.opengovpartnership.org/wp-content/uploads/2019/02/United-States_Action-Plan_2
019-2021.pdf

Des financeurs déterminés :


- Un DMP obligatoire pour les financements des NIH à partir de 2023
En Europe, 1
– Une commissaire à
l’innovation à la
recherche, la culture,
l’éducation et la
jeunesse, Mariya Gabriel
– Une direction, la DG-RTD
https://ec.europa.eu/info
/sites/default/files/organ
isation_charts/organisati
on-chart_dg-rtd_fr_0.pdf
En Europe, 2

– Un commissaire, chargé du
marché intérieur, de la
politique industrielle, du
tourisme, du numérique, de
l’audiovisuel, de la défense
et de l’espace, Thierry
Breton
– Une direction, la DG CNECT
https://ec.europa.eu/info/si
tes/default/files/organisatio
n_charts/dg_connect_orga
nisation_chart_2022.03.16
_-_english.pdf
En Europe, 3
– Une politique volontariste en faveur de l’open science
– Des financements avec des exigences d’ouverture des produits de la recherche
– La construction d’un espace européen de la recherche
– L’implémentation d’EOSC

De nombreux rapports commandés donnant lieu à des recommandations et des


directives
https://eur-lex.europa.eu/legal-content/FR/TXT/PDF/?uri=CELEX:32018H0790&from=
GA#:~:text=Le%20libre%20acc%C3%A8s%20permet%20de,croissance%20%C3%A9con
omique%20et%20l’innovation
En Europe, 4
En pratique, des financements sur projets
- L’exemple de FOSTER
- Portail d’auto-formation à la science
ouverte
- Financement H2020

https://www.fosteropenscience.eu/
En France
Plan national pour la science ouverte,
2018 et 2021.

« La France s’engage pour que les


résultats de la recherche
scientifique soient ouverts à tous,
chercheurs, entreprises et citoyens,
sans entrave, sans délai, sans
paiement. »
PNSO 1, OA
Axe 1, généraliser l’accès ouvert aux
publications
- Rendre obligatoire la publication en
accès ouvert des articles et livres issus
de recherches financées par appel
d’offres sur fonds publics.
- Créer un fond pour la science ouverte.
- Soutenir l’archive ouverte nationale
HAL et simplifier le dépôt par les
chercheurs qui publient en accès
ouvert sur d’autres plateformes dans
le monde.
PNSO 1, données
Axe 2, structurer et ouvrir les données
de la recherche
– Rendre obligatoire la diffusion
ouverte des données de recherche
issues de programmes financés par
appels à projets sur fonds publics.
– Créer la fonction d’administrateur
des données et le réseau associé
au sein des établissements.
– Créer les conditions et promouvoir
l’adoption d’une politique de
données ouvertes associées aux
articles publiés par les chercheurs.
Le plan national pour
la science ouverte 2,
2021
Les 4 axes du 2e Plan national pour la science
ouverte
– Généraliser l’accès ouvert aux
publications
– Structurer, partager et ouvrir les
données de la recherche
– Ouvrir et promouvoir les codes sources
produits par la recherche
– Transformer les pratiques pour faire de
la science ouverte le principe par défaut
PNSO 2, OA
Axe 1 : Généraliser l’accès ouvert aux
publications
– Généraliser l’obligation de publication
en accès ouvert des articles et livres
issus de recherches financées par
appel à projets sur fonds publics
– Soutenir les modèles économiques
d’édition en accès ouvert sans frais de
publication pour les auteurs (modèle
« diamant »)
– Favoriser le multilinguisme et la
circulation des savoirs scientifiques
par la traduction des publications des
chercheurs français
PNSO 2, données
Axe 2 : structurer, partager et ouvrir les
données de la recherche
– Mettre en œuvre l’obligation de
diffusion des données de recherche
financées sur fonds publics
– Créer Recherche Data Gouv, la
plateforme nationale fédérée des
données de recherche
– Promouvoir l’adoption d’une politique
de données sur l’ensemble du cycle
des données de la recherche, pour les
rendre faciles à trouver, accessibles,
intéropérables et réutilisables (FAIR)
PNSO 2, codes et
logiciels
Axe 3 : ouvrir et promouvoir les codes
sources produits par la recherche
– Valoriser et soutenir la diffusion sous
licence libre des codes sources issus
de recherches financées sur fonds
publics
– Mettre en valeur la production des
codes sources de l’enseignement
supérieur, de la recherche et de
l’innovation
– Définir et promouvoir une politique
en matière de logiciels libres
PNSO 2, bonnes
pratiques
Axe 4 : Transformer les pratiques pour faire de
la science ouverte le principe par défaut
– Développer et valoriser les
compétences de la science ouverte
tout au long du parcours des étudiants
et des personnels de la recherche
– Valoriser la science ouverte et la
diversité des productions scientifiques
dans l’évaluation des chercheurs et
enseignantschercheurs, des projets et
des établissements de recherche
– Tripler le budget de la science ouverte
en s’appuyant sur le Fonds national
pour la science ouverte et le
Programme d’investissements d’avenir
Pourquoi
ouvrir les
publications ?

Source : Boudry, Christophe, Patricio Alvarez-Muñoz, Ricardo Arencibia-Jorge, Didier Ayena, Niels J. Brouwer, Zia Chaudhuri, Brenda Chawner, et al. 2019. « Worldwide Inequality in Access to Full Text
Scientific Articles: The Example of Ophthalmology ». PeerJ 7 (octobre): e7850. https://doi.org/10.7717/peerj.7850 .
Pourquoi ouvrir les données ?
– 50 % des expériences sont considérées comme non-reproductibles.
– 80 % des données produites ces 20 dernières années seraient perdues.
– 93 % des établissements d’enseignement supérieur n’ont pas de démarche de plan de
gestion des données de la recherche.
– 90 % des chercheurs interrogés dans le cadre d’un sondage européen disent effectuer de
manière individuelle le stockage, l’archivage ou la transmission de leurs données.
– 33 % de ces mêmes chercheurs n’ont jamais entendu parler des plans de gestion de
données ou estiment qu’ils n’en ont pas besoin.
– Plus de 80 % des données produites sont stockées ailleurs que dans des entrepôts.

DATACC. « Gestion des données : une nouvelle exigence, de nouvelles compétences », 2020.
https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/gestion-des-d
onnees-une-nouvelle-exigence-de-nouvelles-competences/
Les données
sont fragiles !
Chaque année augmente de
17% le risque de non-
disponibilité des données.

Vines et al., The Availability of Research Data Declines Rapidly with


Article Age. Current Biology 24 , 94–97, January 6, 2014
https://doi.org/10.1016/j.cub.2013.11.014
Les licences nationales
– Préserver les acquisitions
électroniques
– Permettre la fouille de texte
– Se réapproprier la propriété des
archives des publications
Préserver le patrimoine
scientifique
Sources :
Fonds Michel Foucault. Notes de lecture et manuscrits. Notes de lecture des débuts, 1952-1955.
Neurophysiologie Lagache & EEG. NAF 28730 (44 A).
https://gallica.bnf.fr/ark:/12148/btv1b525128619/f12.item
Heimburger, Franziska. « Gérer la documentation II - une approche possible utilisant Zotero ». La boîte à
outils des historiens (blog), 2012. http://www.boiteaoutils.info/2012/11/gerer-la-documentation-ii-une-
approcha/
En d’autres termes, faire de la curation de données

« Les activités de curation de données permettent de faciliter la


découverte et la récupération de données, de maintenir la
qualité des données, de leur ajouter de la valeur et d’en fournir
pour de futures réutilisations. Ce nouveau champ inclut la
représentation, l’archivage, l’authentification, la gestion, la
préservation, la récupération, et l’utilisation. »

« Frequently Asked Questions about Data Curation ». s. d. Digital Humanities Data Curation (blog). Consulté le 3 octobre 2021.
https://guide.dhcuration.org/faq/
Puren, Marie. 2021. « Créer son plan de gestion des données ». École thématique. Lille, France: MESH, Lille.
https://hal.archives-ouvertes.fr/hal-03183724
SUJETS LIÉS À
LA SCIENCE
OUVERTE
Ethique
- Les grandes questions que posent les progrès de la science et leurs répercussions
sociétales
- Dimension culturelle: doit se discuter en permanence puis s’impose
- Concerne : tous les chercheurs
- Implique : des comités mixtes
Enjeux :
Intégrité du chercheur
reproductibilité - Les règles qui gouvernent la pratique de la recherche

et intégrité - Dimension universelle : s’impose comme un code professionnel de “droit


souple” (en France : dans un cadre réglementaire depuis 2020)

scientifique - Concerne : tous les chercheurs


- Implique : des référents chercheurs

Déontologie du fonctionnaire français


- Le contrôle des liens d’intérêts & cumuls d’activité des fonctionnaires
- Loi Le Pors 1983 rév. 2016 : “Le fonctionnaire exerce ses fonctions avec dignité,
Source : L’intégrité scientifique, pilier d’une recherche responsable,
Olivier Le Gall, 2022 impartialité, intégrité et probité”
https://www.anrt.asso.fr/sites/default/files/anrt_petit_dejeuner_ofis_i
ntegrite_scientifique_18.01.2022_final.pdf
- Concerne : tous les fonctionnaires français - Implique : des référents juristes
Décret sur l’intégrité scientifique
Article 5
Les résultats bruts des travaux scientifiques mentionnés au troisième alinéa de l’article L. 211-2 du
code de la recherche sont constitués des données produites au cours du processus de recherche, ou à défaut
des données traitées et scientifiquement validées, ainsi que des codes sources utilisés dans le traitement de
ces données.

Article 6
Les établissements publics et fondations reconnues d’utilité publique mentionnés au troisième alinéa
de l’article L. 211-2 du code de la recherche définissent une politique de conservation, de communication et
de réutilisation des résultats bruts des travaux scientifiques menés en son sein. A cet effet, ils veillent à la mise
en œuvre par leur personnel de plans de gestion de données et contribuent aux infrastructures qui
permettent la conservation, la communication et la réutilisation des données et des codes sources.

Décret n° 2021-1572 du 3 décembre 2021 relatif au respect des exigences de l’intégrité scientifique par les établissements publics contribuant au service public de la recherche et les
fondations reconnues d’utilité publique ayant pour activité principale la recherche publique, 2021. https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000044411360
Rétractations d’articles
Des causes multiples
• Erreur dans la méthode
• Erreur dans le traitement et l’analyse de données
• Manipulation d’images
• Plagiat
• …
https://retractionwatch.com/retraction-watch-database-user-guide/retraction-wat
ch-database-user-guide-appendix-b-reasons/
Reproductibilité
Plusieurs niveaux :
- Répéter une manipulation au cours d’une même expérience
- Réanalyser les données d’une étude et obtenir des résultats identiques
- Reproduire une étude avec la même méthode et obtenir des données
et des résultats compatibles
- Réaliser une étude avec une autre méthode et obtenir des résultats
compatibles

Source : SABY M. « Formation Diffuser et rendre réutilisables ses données : enjeux, méthodes et outils (2019) ».
22 mai 2019. Disponible sur : < https://osf.io/x72ga/ > (consulté le 7 juin 2022)
Une crise de la
reproductibilité
Un exemple bien connu
« Diederik Stapel remplissait lui-même
les tableaux de données, jetait les
questionnaires vierges à la poubelle
et, révèle Science, mangeait les
paquets de friandises censées servir
de récompenses aux participants de
ses tests ! »

http://passeurdesciences.blog.lemonde.fr/2012/12/
09/le-scandale-stapel-ou-comment-un-homme-seul-
a-dupe-le-systeme-scientifique/
Rendre la recherche plus reproductible
– Depuis une dizaine d’années, incitations croissantes à diffuser les données de la
recherche.
• Mouvement impliquant les Etats, les universités, les organismes de recherche,
les associations scientifiques, les financeurs publics et privés, les revues.
– Inscription plus globale dans le cadre de la « science ouverte »
• Diffuser ses données mais aussi ses protocoles, méthodes, codes
informatiques… peut favoriser la reproductibilité d’une étude.

Source : SABY M. « Formation Diffuser et rendre réutilisables ses données : enjeux,


méthodes et outils (2019) ». 22 mai 2019. Disponible sur : < https://osf.io/x72ga/ >
(consulté le 7 juin 2022)
Recherche reproductible

MOOC INRIA.
https://www.fun-mooc.fr
/fr/cours/recherche-reproducti
ble-principes-methodologiques-
pour-une-science-transparente/
Les sciences citoyennes
- Contribution des citoyens amateurs à la collecte et à
l’analyse de données (scientifiques, amateurs)
- Objectif : Produire des connaissances et indicateurs,
Sciences avec éduquer les citoyens aux méthodes scientifiques

et pour la Les recherches participatives


- Collaboration entre chercheurs et groupes de citoyens ou
société de professionnels pour résoudre des problèmes
(professionnels, utilisateurs, associations, coopératives,
chercheurs, médiateurs)
- Objectif : Produire des connaissances actionnables dans
une perspective d’innovation et de transformation sociale

HOULLIER F., MERILHOU-GOUDARD J.-B. Les sciences participatives en France [En


ligne]. [s.l.] : [s.n.], 2016. Disponible sur : https://hal.inrae.fr/hal-02801940 (consulté
le 10 mars 2022)
“Les sciences et recherches
participatives sont des formes de
production de connaissances
scientifiques auxquelles participent,
Sciences avec des chercheurs, des acteurs de la
société civile, à titre individuel ou
participatives collectif, de façon active et délibérée.”

https://www.science-ensemble.org/pdf/charte-fr
ancaise-des-sciences-et-recherches-participatives.
pdf
Une
complémentarité
avec la science
ouverte

SCHADE S., PELACHO M., VAN NOORDWIJK T. (C. G. E. ), VOHLAND K., HECKER S., MANZONI M. « Citizen Science and Policy ». In : VOHLAND K, LAND-ZANDSTRA A, CECCARONI L, LEMMENS R, PERELLÓ J, PONTI M, SAMSON
R, WAGENKNECHT K, ÉD. The Science of Citizen Science [En ligne]. Cham : Springer International Publishing, 2021. p. 351‑371. Disponible sur : < https://doi.org/[10.1007/978-3-030-58278-4_18 > (consulté le 14 juin
2022)ISBN : 978-3-030-58278-4.
FINANCEMENTS
DE LA
RECHERCHE
Fonctionnement de la recherche
– Avant : des crédits annuels
– Après : un financement sur projet soumis à des agences de financements
– Les agences de financement françaises : ANR, INCa, ADEME, …
– Taux de réussite : environ 15%, en augmentation actuellement
– Signature d’une déclaration commune en faveur de la science ouverte
– Engagements pour les équipes financées : accès ouvert aux publications,
plan de gestion des données et, de plus en plus, ouverture des données
Depuis la LOLF, 2001
Organisation en mission,
programmes, actions

Mission interministérielle
pour la recherche et
l’enseignement supérieur
(MIRES) :
P150 : Formations supérieures
et recherche universitaire
P172 : Recherches
scientifiques et technologiques
pluridisciplinaires

https://publication.enseignementsup-recherche.gouv.fr/eesr/8/EESR8_Annexe_2-mires_programmes_lolf_pour_la_recherche.php
Quels acteurs, quelles
fonctions ?
• Grandes orientations et définition des
MESRI enjeux

Organismes et • Programmes de recherche, définition


agences (CNRS, des priorités et allocation des moyens
INSERM, ANR)

Universités, • Opérateurs
organismes

HCERES • Evaluation

https://publication.enseignementsup-recherche.gouv.fr/eesr/8/EESR8_Annexe_2-mires_programmes_lolf_pour_la_recherche.php
Financements
des
laboratoires

Source : https://www.snesup.fr/sites/default/files/fichier/ces-cneser-aap-20190611-vote.pdf
L’espace européen de
la recherche
– Espace européen de la recherche :
• Depuis 2000
• Espace commun pour la recherche,
l’innovation et le transfert de
technologie

– Financements par programmes cadres :


• FP1, 1984-1987
• …
• H2020, 2014-2020
• Horizon Europe, 2021-2027
Horizon europe
3 piliers pour Horizon Europe
- Pilier 1 : science d’excellence avec ERC, Marie
Curie (mobilité des chercheurs, notamment
doctorants et postdoc), infrastructures de
recherche - 23Md€

- Pilier 2 : interface entre entreprises et monde


académique, avec des missions identifiés (pôles) -
47Md€

- Pilier 3 : actions en direction des entreprises, via


Conseil européen de l’innovation, Ecosystèmes eur
et d’innovation, Institut européen d’innovation et
de techno (EIT) - 12Md€
Horizon
Europe et la
science
ouverte
Engagement des
financeurs français pour
la science ouverte
Les agences soulignent ainsi leur attachement commun aux
principes essentiels de la science ouverte :
– promouvoir le libre accès aux publications scientifiques ;
– favoriser l’ouverture des données de la recherche dans le
respect du paradigme “aussi ouvert que possible, aussi fermé
que nécessaire” ;
– partager les pratiques et modalités d’évaluation de la qualité
scientifique des projets, conformément aux recommandations
de la Déclaration de San Francisco ;
– informer et sensibiliser les bénéficiaires en partageant des
bonnes pratiques ;
– ouvrir les données relatives aux projets financés2 par chaque
institution en accord avec l’Open Government Partnership3 et
conformément à la loi pour une République numérique4
– publier un bilan annuel des actions et différentes mesures mises
en œuvre en faveur de la science ouverte
https://anr.fr/fr/actualites-de-lanr/details/news/signature-dune-declaration-conjointe-en-faveur-de-la-science-ouverte-
par-un-reseau-dagences-franc/
Mais qu’ont-ils tous avec la science ouverte ?
Directive européenne sur les données ouvertes et la réutilisation des informations
du secteur public
, juin 2019 (2019/1024)

« Les informations du secteur public constituent une source


extraordinaire de données qui peuvent contribuer à améliorer le
marché intérieur et à développer de nouvelles applications pour les
consommateurs et les personnes morales. L’utilisation intelligente de
données, y compris leur traitement par des applications utilisant
l’intelligence artificielle, peut avoir un effet de transformation sur tous
les secteurs de l’économie. » (considérant 9)
ACTIVITÉ 1
Activité 1

Privés de savoir…
https://youtu.be/WnxqoP-c0Z
E
LES
PUBLICATIONS
SCIENTIFIQUES
Un peu d’histoire
– XVIIe-XVIIIe siècles : Sociétés
savantes, discussions en assemblée,
comptes-rendus et mémoires
– 1750 : une douzaine de revues (+
ouvrages)
– 1850 : presque un millier de revues
– 1950 : croissance exponentielle du
nombre de revues
– 2016 : plus de 117 000 revues
scientifiques
Maisons d’éditions scientifiques
– XIXe : multiplication des maisons d’édition
• Masson : 1804,
• Wiley : 1807,
• Springer-Verlag : 1842,
• Dunod : 1876,
• Elsevier : 1880
– Années 1920 : disparition ou rachat de nombreuses maisons d’édition
– Années 1950 : concentration des maisons d’édition en multinationales
– Années 1960 : croissance exponentielle du nombre de revues scientifiques,
hausse du prix des abonnements vs. baisse des coûts de production
(délocalisations, nouvelles technologies du numérique)

Source : ANCELIN-FABRE J. « Science ouverte en bibliothèque ». 2021. (slide 13)


https://urfist.chartes.psl.eu/sites/default/files/u227/20210504_ancelin-fabre_stage_os_bib.pdf
Le coût de l’édition scientifique
– 4 acteurs se partagent le marché
– 9500€ pour publier un article dans Nature
– Des marges situées entre 35% et 40%, plus élevées que celles
d’Apple ou d’Amazon
– “C’est comme si le New Yorker ou The Economist exigeaient que les
journalistes écrivent et relisent le travail des uns et des autres
gratuitement, et demandaient au gouvernement de régler la note.”
[…]
– “Un rapport de la Deutsche Bank daté de 2005 le qualifiait de
système « bizarre » « à triple profit », dans lequel « l’État finance la
plus grande partie de la recherche, paie les salaires de la plupart de
ceux qui vérifient la qualité de la recherche, et ensuite achète la
plus grande partie du produit publié ».”

Source :
https://www.theguardian.com/science/2017/jun/27/profitable-business-scientific-publishing-bad-for-science
Peer-reviewing
– “analyse critique d’un manuscrit soumis à une revue par des experts qui ne
font généralement pas partie du comité de rédaction”
– analyse exhaustive : recherche, hypothèse, matériels et méthodes (dont les
statistiques), résultats (le cas échéant, dont les jeux de données),
interprétation de ces résultats et implications, références

Fovet-Rabot, C. 2021. Comprendre les modèles d’évaluation par les pairs d’un
article scientifique en 7 points. CIRAD. https://doi.org/10.18167/coopist/0081
Circuit de soumission d’un article
– Les “corresponding authors” soumettent un manuscrit à une revue
– Le comité de rédaction (editorial board) rejette certains des manuscrits dès cette étape
– Le manuscrit, lorsqu’il est retenu, est pris en charge par un “editor” (rédacteur) qui cherche
les “reviewers” (relecteurs)
– Les reviewers, le plus souvent anonymes pour les auteurs, rédigent un rapport d’évaluation
– Le rédacteur étudie les avis et rédige une synthèse et l’envoie aux auteurs, avec des
demandes de modifications importantes ou mineures (major, minor revisions)
– Les auteurs peuvent adresser une réponse
– Le manuscrit révisé est appelé “postprint”, “accepted author manuscript”, ou manuscrit
auteur accepté

Fovet-Rabot, C. 2021. Comprendre les modèles d’évaluation par les pairs d’un article scientifique en 7 points. CIRAD.
https://doi.org/10.18167/coopist/0081
Bibliométrie
“La bibliométrie est l’application de méthodes statistiques et
mathématiques pour mesurer, évaluer, étudier, la production et la diffusion
d’ouvrages, d’articles et d’autres publications.”

– Années 1960 : création de l’Institute for Scientific Information / Eugène Garfield


– Développement de la base bibliographique et bibliométrique Science Citation
Index (SCI)
– Commercialisé aujourd’hui par Clarivate avec le Web of Science

Source : Bertignac, Catherine, Fouquet, Josiane, Marie, Emilie. “La bibliométrie”. In UBL (Université Bretagne
Loire). Formadoct. Rennes : UBL, 2010 (dernière maj le 11 novembre 2016). Disp. sur : http://guides-formadoct.u-
bretagneloire.fr/bibliometrie
Le facteur d’impact
“Le facteur d’impact (FI)
d’une revue à l’année N
est calculé en divisant le
nombre de citations
cette année-là de ses
articles publiés les deux
années précédentes par
le nombre d’articles
Source : Bertignac, Catherine, Fouquet, Josiane, Marie, Emilie. “La bibliométrie”. In UBL (Université Bretagne Loire). Formadoct. Rennes : UBL,
2010 (dernière maj le 11 novembre 2016). Disp. sur : http://guides-formadoct.u-bretagneloire.fr/bibliometrie
publiés dans cette revue
les années N-1 et N-2.”
Le h-index
– créé en 2005 par Jorge Hirsch
– nombre d’articles H cité au moins H fois chacun
– valorise les chercheurs à la carrière avancée
– problème pour les auteurs ayant peu de publications, mais toutes
très citées
– ne prend pas en compte l’ordre des auteurs
– compte les différentes versions d’une même publication

Boyer, A., Chirouze, E. 2017. Accéder au h-index d’un chercheur pour mesurer l’impact de ses publications.
CIRAD. https://doi.org/10.18167/coopist/0048](https://doi.org/10.18167/coopist/0048
Dérives : publish or perish
– Toujours plus de publications
– pratiques répréhensibles : inflation des auto-citations, échanges de
citations …
– valeur de l’article : celle de la revue
– invisibilité des SHS et des langues autres que l’anglais
– en santé, système SIGAPS génère une inflation des publications

Bertignac, Catherine, Fouquet, Josiane, Marie, Emilie. “La bibliométrie”. In UBL (Université Bretagne Loire). Formadoct.
Rennes : UBL, 2010. http://guides-formadoct.u-bretagneloire.fr/bibliometrie
Le Monde.fr. « Lancetgate » : publier beaucoup dans des revues scientifiques peut rapporter gros », 2020.
https://www.lemonde.fr/sciences/article/2020/06/15/lancetgate-publier-beaucoup-dans-des-revues-scientifiques-peut-
rapporter-gros_6042952_1650684.html
Dérives – deux lectures
Malscience / Nicolas Chevassus-au-Louis. La
Découverte, 2016
• Record mondial de publications, R. Kratitzky,
2215 publications co-signées entre 1953 et 2010
• Didier Raoult, 1996-2011, 1252 articles co-
signés

Les dérives de l’évaluation de la recherche" /


Yves Gingras. Raisons d’agir, 2014
Peu de publications des résultats négatifs
Deux types :
- Problème de définition des résultats négatifs : expérience qui n’a pas fonctionné, hypothèse nulle, notion de p
- Incapacité de reproduire des résultats décrits dans un article : résultats dissidents, qui invalident des travaux
antérieurs

Cause de la faible diffusion de ces résultats :


- manque de temps,
- complexité de la restitution de ce type de résultats (l’éditeur demande de spéculer sur les causes de l’échec, ce qui
peut être compliqué)
- crainte de donner des idées à la concurrence,
- parasiter une littérature déjà très fournie,
- oser aller à rebours d’une tendance de recherche
Herbet, Marie-Emilia, Jérémie Léonard, Maria Grazia Santangelo, et Lucie Albaret. « Dissimuler ou disséminer ? Une étude sur le sort réservé aux résultats négatifs ». Zenodo, 30 septembre 2021.
https://doi.org/10.5281/zenodo.5541589
ARCHIVES
OUVERTES
Une réponse, le libre accès
Définition la plus souvent reprise (Budapest Open Access Initiative, 2002)

“Par”accès libre" à [la] littérature [scientifique], nous entendons sa mise à


disposition gratuite sur l’Internet public, permettant à tout un chacun de lire,
télécharger, copier, transmettre, imprimer, chercher ou faire un lien vers le
texte intégral de ces articles, les disséquer pour les indexer, s’en servir de
données pour un logiciel, ou s’en servir à toute autre fin légale, sans barrière
financière, légale ou technique autre que celles indissociables de l’accès et
l’utilisation d’Internet. La seule contrainte sur la reproduction et la
distribution, et le seul rôle du copyright dans ce domaine devrait être de
garantir aux auteurs un contrôle sur l’intégrité de leurs travaux et le droit à
être correctement reconnus et cités."
http://www.budapestopenaccessinitiative.org/translations/french-translation
Principes
– Accès et lecture gratuits
– Surtout appliqué aux articles mais peut concerner tout type de document
scientifique
– L’immédiateté n’est pas une obligation
– Le libre accès « complet » suppose d’accorder des droits de réutilisation
larges, pour des humains et des machines (rediffusion, utilisation
pédagogique, citation, extraction de texte, données et images, traduction…)
– En pratique on accepte une forme de libre accès minimal sans droits de
réutilisation

Saby, Mathieu. « Ouverture Des Publications et Des Données : Les Demandes Des Financeurs (ANR et
Commission Européenne) », 2020. https://doi.org/10.17605/OSF.IO/UK734
L’open access,
plusieurs voies - 1

Source : Larousserie, David, et Sandrine


Cabut. 2013. « A qui appartient le savoir ? »
Le Monde.fr, 28 février 2013.
https://www.lemonde.fr/sciences/article/201
3/02/28/a-qui-appartient-le-savoir_1840797
_1650684.html
.
Quel manuscrit ?

Saby, Mathieu. « Ouverture Des


Publications et Des Données :
Les Demandes Des Financeurs
(ANR et Commission
Européenne) », 2020.
https://doi.org/10.17605/OSF.I
O/UK734
L’open access, plusieurs voies - 2

Saby, Mathieu. « Ouverture Des


Publications et Des Données :
Les Demandes Des Financeurs
(ANR et Commission
Européenne) », 2020.
https://doi.org/10.17605/OSF.I
O/UK734
Voie verte
Green open access ou voie verte :
- publications scientifiques pas nécessairement revues par les pairs (ex. :
preprints, communications, littérature grise)
- autoarchivées par l’auteur lui-même sur des plateformes de dépôt de
publications (archives ouvertes).
Exemples :
- HAL, arXiv.
- Le dépôt de travaux sur une archive ouverte n’équivaut pas à une validation
scientifique.

BOUCHARD A. Rechercher des publications scientifiques en accès libre


https://urfist.chartes.psl.eu/sites/default/files/ab/bouchard_urfistparis_oaetri_052022.pdf
Archive nationale
- HAL, France https://hal.archives-ouvertes.fr/
Archives Etablissements :
institutionnelles - ORBI, Liège https://orbi.uliege.be/
- DASH, Harvard https://dash.harvard.edu/
- SAM, ENSAM :) https://sam.ensam.eu/
– Preprints :
“manuscrits de recherche qui n’ont pas
été examinés par le comité de lecture
d’une publication savante ou scientifique
traditionnelle (par exemple, une revue, les
Plateformes actes d’une conférence, une
monographie)”
de preprints – ArXiv et ses différentes branches, BioArXiv,
etc.
– RePeC, économie

Hettne, K & al. « Les préprints : guide pratique »,


2021. https://doi.org/10.13143/0603-7h42
Voie dorée - 1
Gold open access ou voie dorée :
- modèle auteur-payeur, mais pas que
- Cas 1 : les auteurs doivent payer des frais de publication (APC : article processing charges) en
amont de la diffusion de leurs travaux.
- Ces frais sont parfois très élevés, et visent à « compenser » la perte de revenus des éditeurs qui
renoncent à vendre leurs productions (abonnements aux revues notamment).

Le modèle auteur-payeur est en train de devenir dominant


Inconvénients :
- sélection en fonction des moyens du laboratoire du chercheur
- Le CNRS, l’université de Lorraine déconseillent le paiement des APC

Ancelin-Fabre, Justine. Initiation à la science ouverte : niveau intermédiaire. 2021.


https://urfist.chartes.psl.eu/sites/default/files/u227/2-initiation_science_ouverte_intermediaire.pptx
Article processing charges
- frais de publications demandés par
certains éditeurs ayant des revues en open
access ou des revues hybrides
- couverture du coût de la publication
APC - de 400$ à 9500$ pour Nature (coût réel
estimé à 200$)
- hausse de 57% en un an (2012-2020)

Bassinet & al. (2022). Article processing charges (APC) :


l’Université de Lorraine recommande de les éviter.
https://doi.org/10.5281/zenodo.6387480
APC, coûts en France
Enquête Couperin
- 2015 : dépense totale de 3 262 869 euros et APC médian de 1 297 euros
- 2017 : dépense totale de 5 595 087 euros et APC médian de 1 500 euros
- progression de 31 % du nombre d’articles, de 47 % de la dépense totale
et de 15 % de l’APC médian

Ancelin-Fabre, Justine. « Initiation à la science ouverte ». 2021.


https://urfist.chartes.psl.eu/sites/default/files/u227/20210504_initiation_science_ou
verte.pptx
Voie dorée - 2
On distingue plusieurs modèles économiques pour la voie dorée :

Voie « platine » (platinum open access) ou modèle freemium :


- mise en accès libre immédiat
- services à valeur ajoutée sont payants (ex. : téléchargement du PDF, statistiques d’usages).
Exemple : OpenEdition

Voie « bronze » :
- les publications sont librement accessibles
- on ignore sous quelles conditions elles peuvent être réutilisées.
- Il s’agit d’accès ouvert, mais pas d’accès libre.

BOUCHARD A. Rechercher des publications scientifiques en accès libre


https://urfist.chartes.psl.eu/sites/default/files/ab/bouchard_urfistparis_oaetri_052022.pdf
Voie diamant
Voie « diamant » (diamond open access)
- modèle plus éthique de publication
académique non lucratif
- exclut le modèle auteur-payeur et le modèle
freemium, par exemple par un financement
par une université, une institution publique
ou une organisation à but non lucratif,
- s’appuie sur des licences de réexploitation
larges mais non commerciales.
Exemple : Centre Mersenne

BOUCHARD A. Rechercher des publications scientifiques


en accès libre
https://urfist.chartes.psl.eu/sites/default/files/ab/bouc
hard_urfistparis_oaetri_052022.pdf
Revues hybrides
– accessibles uniquement sur abonnement
– facturation d’APC aux auteurs pour que les articles soient en OA chez
l’éditeur
– les établissements paient deux fois
– souvent les revues les plus prestigieuses

Les revues hybrides. Science ouverte Rennes 1. https://scienceouverte.univ-rennes1.fr/les-revues-hybrides


Guide pratique pour le suivi des dépenses de publication. Couperin.
https://www.couperin.org/breves/1434-guide-pratique-pour-le-suivi-des-depenses-de-frais-de-publication
Revues hybrides et revues miroirs
– Revue en libre accès selon la voie dorée (modèle auteur-payeur),
qui duplique le titre et le comité éditorial d’une revue existante
disponible sur abonnement
– Produite par le même éditeur
– Pas acceptées dans le cadre du Plan S

Ancelin-Fabre, Justine. « Initiation à la science ouverte ». 2021.


https://urfist.chartes.psl.eu/sites/default/files/u227/20210504_initiation_science_ouverte.pptx
Coalition S. Les principes du plan S.
https://www.coalition-s.org/plan-s-principes-et-mise-en-oeuvre/
Accords transformants
– accords entre les éditeurs et les établissements
– compensations sur les dépenses liées à la publication en Open Access de
leurs chercheurs (Article Processing Charges ou APC)
– système de jetons pour les APC
– pas de garantie sur le contrôle des dépenses ni sur la pérennité de
l’ouverture des contenus…

Les accords transformants. Open sciene Pasteur.


https://openscience.pasteur.fr/2021/05/21/les-accords-transformants/
DUFOUR Q., PONTILLE D., TORNY D. Contracter à l’heure de la publication en accès ouvert. Une
analyse systématique des accords transformants, 2021. https://doi.org/10.52949/2
Financeurs et articles
– Exigent le dépôt des articles sur une archive ouverte :
• engagement contractuel
– Projets européens :
• archive compatible avec l’infrastructure européenne OpenAIRE (PubMed
Central, ArXiv)
– ANR :
• HAL, ou via une archive connectée à HAL (ArXiv)
Plan S
– initiative de la Coalition S, regroupement de financeurs, dont l’ANR
– stratégie de rétention des droits pour les auteurs, qui doivent indiquer à l’éditeur
qu’ils placent leurs publications sous licence CC:BY
– APC éligibles au remboursement dans le financement du projet, sauf pour les
revues hybrides
– pas d’embargo
– plusieurs possibilités :
• revue sous abonnement et dépôt sur une archive ouverte
• revue open access, sauf hybride
• revue figurant dans un accord transformant
– outil : Journal checker tool
Mais comment se parlent
ces archives ?
Un protocole, l’OAI-PMH
- Open Archives Initiative – Protocol for
Metadata Harvesting
- 1999
- permet le moissonnage et l’échange de
métadonnées via internet
- un client envoie des requêtes au serveur en
http
- le serveur répond par un flux de données en
XML

https://www.bnf.fr/fr/protocole-oai-pmh
Indicateurs
PIWOWAR H., PRIEM J.,
LARIVIÈRE V., ALPERIN J. P.,
MATTHIAS L., NORLANDER B.,
FARLEY A., WEST J., HAUSTEIN
S. « The state of OA: a large-
scale analysis of the prevalence
and impact of Open Access
articles ». PeerJ [En ligne]. 13
février 2018. Vol. 6, p. e4375.
https://doi.org/
10.7717/peerj.4375
Baromètre science ouverte
– France
https://barometredelasci
enceouverte.esr.gouv.fr/

– Europe
https://ec.europa.eu/info
/research-and-innovation
/strategy/strategy-2020-2
024/our-digital-future/op
en-science/open-science-
monitor/trends-open-acc
ess-publications_en

https://www.data.gouv.fr/fr/reuses/baromet
re-de-la-science-ouverte/
– SciELO (Scientific Electronic Library Online) :
• environ 1800 revues à comité de lecture
en libre accès total issues d’Amérique
Autres latine et Caraïbes, Espagne, Portugal,
Afrique du Sud.
modèles – Érudit :
• ressources SHS publiées en français en
Amérique du Nord (revues, ouvrages,
actes, mémoires…).
– Dépôt du manuscrit sur une archive ouverte
par l’auteur
– Le comité éditorial de l’épi-revue se charge
du peer-reviewing de l’article
Epirevues – En France, Episciences (CCSD) : plateforme
d’épi-revues, héberge et diffuse les
publications de toutes disciplines en accès
ouvert diamant
https://www.episciences.org/
– PCI : Peer Community In
https://peercommunityin.org/
– plateforme de peer-reviewing ouverte

Evaluation par – une quinzaine de communautés


disciplinaires
les pairs – entre 2 et 3 relectures par manuscrit
déposé
ouverte – chaque reviewer publie ses
recommandations
– Un exemple :
https://paleo.peercommunityin.org/articles
/rec?id=114
Altmetrics
– mesure de l’impact d’une publication sur internet
– nombre de téléchargements et de visite de la page web
– nombre de citations sur Twitter, Facebook, Mendeley, blogs, wikis, journaux,
etc.
– sources de données très instables
– pas de révision par les pairs

Dupré, S. ; Deboin, M.C. ; Fovet-Rabot, C. 2016. Se familiariser avec les altmetrics,


mesures alternatives d’impact d’une publication, en 6 points. CIRAD.
https://doi.org/10.18167/coopist/0049
– notoriété en ligne vs reconnaissance par les pairs
– nombre total de followers sur Twitter / nombre de
citations dans les revues
Kardashian
index ;) Hall, Neil. « The Kardashian Index: A Measure of
Discrepant Social Media Profile for Scientists ». Genome
Biology 15, no 7 (30 juillet 2014): 424.
https://doi.org/10.1186/s13059-014-0424-0.

Eva Rinaldi, CC BY-SA 2.0 via Wikimedia Commons


https://commons.wikimedia.org/wiki/File:Kim_Kardashian_West
_2014.jpg
– Sci-Hub
– Research Gate
– Academia.edu

Nombreuses copies d’articles hors archives


Black or rogue institutionnelles ou sites d’éditeurs

open acess BJÖRK B.-C. « Gold, green, and black open access ».
Learned Publishing 2017. Vol. 30, n°2. https://doi.org/
10.1002/leap.1096
LEVINE-CLARK M., MCDONALD J., PRICE J. « Access to
Freely Available Journal Articles: Gold, Green, and
Rogue Open Access Across the Disciplines », 2017.
https://doi.org/10.5703/1288284316494
Editeurs prédateurs
– apparition avec l’augmentation du modèle auteur-payeur
– publient tout ce qui est soumis, sans réelle révision par les pairs
– impact négatif pour un chercheur quand la revue est identifiée comme négative
– difficulté pour les chercheurs de retirer les articles
– parutions de listes (Beale, Cabell), mais obsolètes dès leur parution
– promouvoir plutôt des bonnes pratiques :
• Compass to publish https://app.lib.uliege.be/compass-to-publish/
• Think Check Submit https://thinkchecksubmit.org/

IAP. Lutter contre les revues et conférences académiques prédatrices.


https://www.interacademies.org/publication/predatory-practices-summary-French
Un exemple :
https://www.mimiryudo.com/blog/2020/08/le-meilleur-article-de-tous-les-temps/
Qu’en pensent les chercheurs ?
Rousseau-Hans, Françoise, Christine Ollendorff, et Vincent Harnais. « Les pratiques
de publications et d’accès ouvert des chercheurs français en 2019 ». Other.
Consortium Couperin, 2020. https://hal-cea.archives-ouvertes.fr/cea-02450324

– Globalement favorables à l’accès ouvert


– Soutiennent la diffusion des résultats de la science de façon libre et gratuite
– Sont plus réservés pour changer leurs habitudes et bousculer le paysage
éditorial qu’ils connaissent
Rechercher des revues en OA
Moteurs de recherches : scientifiques latino-américaines en libre accès.
– Bielefeld Academic Search Engine (BASE) : Moteur de recherche Trouver des livres :
spécialisé sur les publications académiques en libre accès (archives – Directory of Open Access Book (DOAB) : Plateforme de livres en libre
ouvertes, thèses en ligne, ouvrages, revues). accès. S’inscrit dans la continuité de Directory of Open Access Journals
– COnnecting REpositories (CORE) : permet de rechercher dans les (DOAJ)
archives ouvertes qui ont été moissonnées – Open Edition Books (OpenEdition): Plateforme de livres en libre accès
– OAISTER (créé en 2009 par l’Université du Michigan avec le soutien de dans les domaines des sciences humaines et sociales.
OCLC), OAIster est un moteur qui permet de rechercher simultanément Répertoires :
dans plus de 30 millions de ressources en libre accès. – Registry of Open Access Repositories (ROAR) : recense les plateformes
– 1findr : Recense des articles publiés en libre accès or, hybride ou vert, d’archives ouvertes, classées par type et par pays.
du monde entier, résultant du moissonnage de milliers de sites et de – Directory of Open Access Repositories – OpenDOAR : recense les
dépôts d’organismes. plateformes d’archives ouvertes, classées par type, par sujet, par pays
Trouver des revues : et par langue.
– Directory of Open Access Journals (DOAJ) : Plateforme internationale de
revues scientifiques en libre accès. Couperin. Où trouver des revues en OA ?
– Persée : Portail d’archives de revues francophones (Annales, https://scienceouverte.couperin.org/ou-trouver-des-ressources/#:~:te
Bibliothèque de l’Ecole des chartes, l’Homme, Revue de l’art, Revue xt=Trouver%20des%20revues%20%3A,fran%C3%A7aise%20de%20scie
française de science politique…). nce%20politique%E2%80%A6
– Revues.org (OpenEdition) : Plateforme de revues en libre accès dans les
domaines des sciences humaines et sociales.
– Scientific Electronic Library Online (Scielo) : Plateforme de revues
– Open Access Button :
Des outils https://openaccessbutton.org/
– Unpaywall : http://unpaywall.org/
pour repérer – Istex : https://addons.istex.fr/

des contenus – Panist : https://addons.panist.fr/

en OA Pubpeer (commentaires) :
https://pubpeer.com/static/extensions
Règles de signatures
– De très nombreuses variantes dans la façon dont les affiliations sont ajoutées dans
les publications
– Deux chercheurs d’un même laboratoire ont parfois deux signatures différentes
– Les établissements adoptent de plus en plus une signature dite “monoligne” qui
prend en compte les différentes tutelles
– Dans la majorité des cas, l’université de rattachement doit apparaître en premier,
c’est elle qui est prise en compte dans les classements internationaux
– Exemple :
https://www.sorbonne-universite.fr/sites/default/files/media/2020-02/doctorat-re
gles-signature.pdf
– Site Science ouverte de Couperin :
https://scienceouverte.couperin.org/
Guides et – Ressources du site Ouvrir la science :
https://www.ouvrirlascience.fr/category/re
ressources ssources/
et portail HAL Ouvrir la science :
https://hal-lara.archives-ouvertes.fr/OUVRI
R-LA-SCIENCE/
Une lecture

Rentier, Bernard, et Philippe Busquin. Science


ouverte, le défi de la transparence. Bruxelles,
Belgique: Académie Royale de Belgique,
2018.
ACTIVITÉ 2 –
ARCHIVES
OUVERTES
Pour
progresser
dans leur A- publier le plus d’articles possible
B- publier l’article le plus long
carrière, les C- publier dans les revues scientifiques à forte
chercheurs notoriété

doivent
prioritairement
A- Data open acces journals
Qu’est-ce que B- Director of open access junior
C- Directory of open access journals
le DOAJ ? D- Digital object access journal
À partir de
janvier 2025, les
agences de
financement
Vrai
obligent les Faux
chercheurs à
diffuser leurs
publications en
libre accès
Qu’est-ce que A- la version de l’article publié avec les rectificatifs
apportés après publication
la version B- la version corrigée et validée par les pairs avant
sa mise en page par la revue
postprint d’un C- la version en ligne de l’article après sa
article ? publication dans la revue papier
La voie verte
du libre accès
Vrai
est coûteuse Faux

pour le
chercheur
Dans la A- la diffusion et la citation des travaux du
chercheur
carrière du B- la libre exploitation des documents du
chercheur
chercheur, le C- l’accès aux savoirs
libre accès D- de répondre aux critères exigés par les
organismes de financement (nationaux et
permet européens)
Les chapitres
d’ouvrages
déposés dans
une archive Vrai
ouverte peuvent Faux
faire l’objet d’un
embargo imposé
par l’éditeur
Les articles
publiés en
libre accès Vrai

sont plus cités Faux

que les autres


articles
Les
chercheurs
qui relisent
des articles de Vrai
revue ne sont Faux

pas
rémunérés
par la revue
Qu’est-ce
qu’un A- le délai pendant lequel un éditeur n’autorise
embargo pour pas l’accès ouvert d’un article
B- l’interdiction de rémunérer les auteurs
une d’articles
C- un article dont la publication est interdite
publication
scientifique ?
Un chercheur
qui publie en
libre accès Vrai

renonce à ses Faux

droits
d’auteur
Comment
savoir si vous
A- vous avez toujours le droit de le faire
pouvez B- vous vérifiez sur le site SHERPA/RoMEO

diffuser le C- vous demandez à Christine


D- vous interrogez votre boule de cristal
preprint de
votre article ?
Certaines
revues publient
des articles en
libre accès et Vrai

des articles Faux

accessibles
seulement aux
abonnés
Que signifie A-Directory of Open Access Books
B- Droit d’Origine pour l’Agriculture Biologique
DOAB ? C- Directory Of Accessible Business
DONNÉES DE
LA
RECHERCHE
“Enregistrements factuels (chiffres, textes, images et
sons) qui sont utilisés comme sources principales pour la
recherche scientifique et sont généralement reconnus par
la communauté scientifique comme nécessaires pour
valider des résultats de recherche.”

Les données OECD. 2007. « OECD Principles and Guidelines for Access to
Research Data from Public Funding ».
de la https://www.oecd.org/sti/inno/38500813.pdf

recherche : « Research data means data in the form of facts,


observations, images, computer program results,
recordings, measurements or experiences on which an
définitions argument, theory, test or hypothesis, or another research
output is based. Data may be numerical, descriptive,
visual or tactile. It may be raw, cleaned or processed, and
may be held in any format or media. »

DANS, « What Is Research Data », 2017.


https://www.ands.org.au/__data/assets/pdf_file/0006/7318
23/Whatis-research-data.pdf
Différents types de données ?

Source : Rivet, Alain, Marie-Laure


Bachèlerie, Auriane Denis-Meyere,
et Delphine Tisserand. 2018.
« Traçabilité des activités de
recherche et gestion des
connaissances : Guide pratique de
mise en place ».
http://qualite-en-recherche.cnrs.fr
/IMG/pdf/guide_tracabilite_activit
es_recherche_gestion_connaissanc
es.pdf
Différents types de données – 1
– Données d’observation capturées en temps réel : habituellement uniques, impossible à
reproduire
• Ex.: mesures sismiques, images d’une étoile, enquêtes sociologiques, fouilles
archéologiques…
– Données d’expérimentation : obtenues à partir d’équipements de laboratoire souvent
reproductibles, parfois coûteuses
• Ex.: résultats de réactions chimiques, observations sur des individus en situation de test…
– Données computationnelles : générées par des modèles informatiques souvent reproductibles
si le modèle est correctement documenté
• Ex.: modélisation du changement climatique, « reproduction » du Big Bang, modèles
économiques…

Source : Ancelin-Fabre, Justine. 2021. « Rédiger un plan de gestion pour ses données de recherche ».
https://urfist.chartes.psl.eu/sites/default/files/docs/20210601_ancelin-fabre_pgd.pdf
Différents types de données – 2
– Records (C. Borgman) : documents témoignant d’un phénomène ou d’une activité humaine,
uniques ou non (=> “traces” dans la traduction française)
• Ex.: fonds de photographies, documents d’archives, textes de loi, ouvrages littéraires…
– Données compilées ou dérivées : issues du traitement de données brutes souvent
reproductibles mais coûteuses
• Ex.: bases de données compilées, corpus textuel préparé pour le TDM…
– Données « de référence » : validées par la communauté, réutilisables
• Ex.: décodage du génome humain, certaines données astronomiques…

Source : Ancelin-Fabre, Justine. 2021. « Rédiger un plan de gestion pour ses données de
recherche ». https://urfist.chartes.psl.eu/sites/default/files/docs/20210601_ancelin-fabre_pgd.pdf
Quelques
exemples
Source, donnée, publication – 1

Sources : https://upload.wikimedia.org/wikipedia/commons/4/45/Regenmesser.jpg
http://hmf.enseeiht.fr/travaux/CD0001/travaux/optsee/bei/2/g2a/g21a/garde1.htm
https://hal.archives-ouvertes.fr/hal-02664009
Source, donnée, publication – 2

Source :
https://www.dariah.eu/2020/07/27/dariah-theme-2018-2019-standard-sus
tainability-improving-the-usability-of-the-text-encoding-initiative-tei/
• Données « brutes » : données tout juste
De la donnée collectées, non organisées

brute à la • Données traitées : organisation, correction des


données brutes
donnée • Données dérivées : réorganisées, compilées
• Données analysées : données publiées
analysée
Autre typologie de données
– Données sources : matériaux de base de la recherche
– Données sources externes : non produites par l’équipe, données réutilisées
– Données sources collectées : bases d’enquêtes de terrain, bases de questionnaires,
corpus textuels élaborés à partir de données du web
– Données résultats : données produites après exploitation et traitement des
données sources
– Documentation sur les données : renseignement sur les données utilisées
(méthodo, matériaux d’analyse utilisés, traitement, etc.), métadonnées, mais aussi
autorisations CNIL, dictionnaires de données, etc.

Source : Bonneville & al. « Données de la recherche : pratiques et besoins dans un


laboratoire pluridisciplinaire SHS ». 2021. https://hal.archives-ouvertes.fr/hal-03265603
Les données par les
chercheuses et les chercheurs

What is data? - Interviews with French


researchers
https://youtu.be/J7nkClygNng

What are the impacts of FAIRification? -


Interviews with French researchers
https://youtu.be/JxDm4lmw8Vs
Le cycle de
vie des
données
Un peu trop parfait pour être
vrai…
Le cycle de
vie des
données
Plus souvent itératif
Cerner le périmètre des données
Dans le cadre du plan de gestion des données, on ne prendra pas en compte ces
productions :
– Analyses préliminaires et projets de documents scientifique
– Programmes de travaux futurs
– Examens par les pairs
– Communications personnelles avec des collègues
– Objets matériels
– Publications scientifiques
– Supports de formations
– Données administratives
Attention, elles constituent des archives et certaines sont à conserver de façon
pérenne. (voir : Référentiel de gestion des archives de la recherche)
Ouvrir les données, un
enjeu économique
2007 : Parution du rapport de l’OCDE,
« Principes et lignes directrices de l’OCDE
pour l’accès aux données de la recherche
financée sur fonds publics ».
http://www.oecd.org/fr/science/inno/3850
0823.pdf
« As open as possible, as closed as necessary. »
Un principe d’ouverture par défaut ; Des limitations en fonction du
Principes FAIR type de données.
Mise en œuvre : production de données FAIR

Logo FAIR : SangyaPundir. CC:BY-


SA4.0.
Principes FAIR
Détail des principes FAIR :
https://www.force11.org/group
/fairgroup/fairprinciples
Image : ANDS. CC:BY4.0.
Principes
FAIR - 2
Données FAIR vs données
ouvertes

Mons B, NeylonC,VelteropJ, Dumontier M, da Silva Santos LOB,


Wilkinson MD. Cloudy, increasingly FAIR; revisiting the FAIR
Data guiding principles for the European Open Science Cloud.
Information Services & Use. 2017;37(1):49‑56.
https://doi.org/10.3233/ISU-170824
Principes FAIR, Findable
– F1 : Les données et les
métadonnées sont identifiées
par un identifiant global unique
et pérenne.
– F2 : Les métadonnées décrivant
les données sont riches.
– F3 : Les données et les
métadonnées sont enregistrées
et indexées dans un dispositif
permettant de les rechercher.
– F4 : Les métadonnées spécifient
l’identifiant de la donnée.
Principes FAIR, Accessible
– A1 : Les données et les
métadonnées sont accessibles
par leur identifiant via un
protocole de communication
standardisé.
• A1.1 : Le protocole utilisé
est ouvert, libre et peut être
implémenté de manière
universelle.
• A1.2 : Le protocole utilisé
permet l’authentification et
l’autorisation si besoin.
– A2 : Les métadonnées sont
accessibles même quand les
données ne le sont plus.
Principes FAIR, Interopérable
– I1 : Les données et les
métadonnées utilisent un
langage formel, accessible,
partagé et largement
applicable pour la
représentation des
connaissances.
– I2 : Les données et les
métadonnées utilisent des
vocabulaires qui respectent
les principes FAIR.
– I3 : Les données et les
métadonnées incluent des
liens vers d’autres
(méta)données.
Principes FAIR, Réutilisable
– R1 : Les données et les métadonnées
ont des attributs multiples et
pertinents.
• R1.1 : Les données et les
métadonnées sont mises à
disposition selon une licence
explicite et accessible.
• R1.2 : Les données et les
métadonnées sont associées à
leur provenance.
• R1.3 : Les données et les
métadonnées correspondent
aux standards des
communautés indiquées.
Exigences des financeurs de
la recherche pour les PGD
ANR :
– DMP obligatoire pour tout projet, non évalué
– Pas d’obligation d’ouverture des données

Europe, Horizon Europe :


– DMP obligatoire pour tout projet, évalué
– Critère d’excellence selon les appels, bonnes
pratiques de gestion des données selon les
principes FAIR
– Ouverture des données si leur régime juridique le
permet

Europe, H2020 :
– Si pilote, DMP obligatoire pour tout projet
– Si pilote, ouverture des données si leur régime
juridique le permet
Un document synthétique qui aide à
organiser et anticiper toutes les étapes
du cycle de vie de la donnée. Il explique
Le plan de pour chaque jeu de données comment
seront gérées les données d’un projet,
gestion des depuis leur création ou collecte jusqu’à
leur partage et leur archivage.
données :
définition Source : INIST-CNRS, doranum

Le DMP est un document évolutif, demandé, en


général, à trois moments du projet.
Le PGD en quelques dates
– 1966 : esquisses de DMP dans le domaine de l’aéronautique
– 1973 : la NASA publie un rapport technique qui s’apparente à un DMP.
– 2007 : le Wellcome trust (Royaume-Uni), aujourd’hui membre du Plan S, requiert la mise en
place de DMP pour les projets qu’il finance
– 2007 : lignes directrices de l’OCDE
– 2011 : mise en place de DMP par la National Science Foundation (Etats-Unis) pour les projets
financés.
– 2014 : DMP pour les projets financés dans le cadre de H2020
– 2019 : l’ANR requiert la mise en place de DMP pour les projets qu’elle finance

Sources :
– DATACC. « Gestion des données : une nouvelle exigence, de nouvelles compétences », 2020.
https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/gestion-des-donnees-une-nouvelle-exigence-de-nouvelles-compet
ences/

– Chronologie inspirée de : Smale, Nicholas, et al. « The History, Advocacy and Efficacy of Data Management Plans ». BioRxiv, octobre 2018.
www.biorxiv.org, https://doi.org/10.1101/443499
Exemple de modèle de
DMP : ANR
Modèle suivant le cycle de vie des données
Informations générales
1. Description des données et collecte ou
réutilisation des données
2. Documentation et qualité des données
3. Stockage et sauvegarde pendant le
processus de recherche
4. Exigences légales et éthiques, codes de
conduite
5. Partage des données et conservation à
long terme
6. Responsabilités et ressources en matière
de gestion de données
Exemple de modèle de
DMP : Horizon Europe
1.Résumé descriptif des données
2.Données FAIR
2.1. Rendre les données Faciles à trouver, en
incluant la mise à disposition des métadonnées
2.2. Rendre les données librement Accessibles
2.3. Rendre les données Interopérables
2.4. Accroître la Réutilisation des données (au
moyen de licences)
3. Allocation de ressources
4. Sécurité des données
5. Aspects éthiques
6. Autres

https://ec.europa.eu/info/funding-tenders/opportu
nities/portal/screen/how-to-participate/reference-d
ocuments;programCode=HORIZON
D’autres modèles de PGD
Consulter les modèles sur DMP OPIDoR
– Financements européens :
• Horizon Europe, (H2020)
• ERC
– Financeurs français :
• ANR
• INCa
– Etablissements :
• Institut Pasteur
• CEA
• INRAE
• Université de Strasbourg
– Disciplinaires (unités, consortium,
projets)
• ICM
• MASA
• PRESOFT project
• PRODIG UMR
Partager les données ? Les entrepôts de données
• Un entrepôt de données ?
• Archive en ligne permettant le dépôt, la description, la conservation, la
recherche et la diffusion de jeux de données
Le data paper : objectif
Quoi ?
– Article décrivant un jeu de données, notamment les méthodes de recueil
– Détaille les potentiels de réutilisation de données
– Les articles font l’objet d’un peer-reviewing
Comment ?
– Le PGD peut servir de trame
– Il peut être publié dans une revue académique classique, plus souvent publié dans un data
journal
Pourquoi ?
– Informer la communauté scientifique de la disponibilité de ces jeux de données et de leur
potentiel pour des utilisations futures
– Montrer l’originalité et la portée du jeu de données décrit
Le data paper, ce que
les chercheuses et les
chercheurs en disent
The data paper, 1
https://youtu.be/dl-3aYBbu7Y
The data paper, 2
https://youtu.be/kGtu1g7G6U8
The data paper, 3
https://youtu.be/GyGPMuIcmGU

Gay, Victor. « Un data paper en SHS : pourquoi, pour qui,


comment ? » In #dhnord2021 - Publier, partager, réutiliser les
données de la recherche : les data papers et leurs enjeux. Lille,
France: MESHS, 2021.
https://hal.archives-ouvertes.fr/hal-03434216.
Le data paper : trame
La particularité du texte d’un data paper porte sur la description fine à la fois de la méthode de production des
données et des données elles-mêmes, ainsi que sur l’absence de résultat et discussion :
– contexte de la recherche et travaux antérieurs dans lesquels celle-ci s’inscrit, apport des données dans
ce contexte et potentiel de réutilisation ;
– protocole de production des données : qualification du producteur des données, méthode de
constitution de l’échantillon, matériel utilisé, procédures de traitement, mise en œuvre du contrôle
qualité sur les données, questions éthiques soulevées par la collecte de ces données (consentement de
patients), etc.
– description du jeu de données : nature ou type de données, format ainsi que version du format le cas
échéant, volume de données, date de publication des données dans l’entrepôt choisi par l’auteur ou
préconisé par l’éditeur, identifiant des données (attribué par l’entrepôt), lien pérenne versl’entrepôt
choisi, licence d’utilisation attribuée aux données.
L’article regroupe donc un texte spécifique à la description des données, ainsi qu’un lien vers le jeu de données
décrit, dans l’entrepôt où celui-ci a été déposé.

Source : Reymonet, Nathalie. 2017. « Améliorer l’exposition des données de la recherche : la publication de
data papers » https://archivesic.ccsd.cnrs.fr/sic_01427978/document.
Deux exemples de data papers
– Leach TH, Winslow LA, Acker FW, Bloomfield JA, Boylen CW, Bukaveckas PA,
et al. Long-term dataset on aquatic responses to concurrent climate change
and recovery from acidification. Scientific Data [Internet]. 2018 [cité 28 mars
2019];5. Disponible sur: https://www.nature.com/articles/sdata201859
– Susini, Vanessa, Laura Caponi, Veronica Lucia Rossi, Antonio Sanesi, Nadia
Romiti, Aldo Paolicchi, et Maria Franzini. « Data about Performances of
Whole and Monovalent Half-Fragments Antibodies in Immunosorbent
Assays ». Data in Brief 35 (avril 2021): 106778.
https://doi.org/10.1016/j.dib.2021.106778.
Quelques exemples de data journals
– Biomedical Data Journal (Biomédical)
– Journal of Open Health Data (Données de santé)
– Gigascience (Sciences de la vie)
– Scientific Data (Multidisciplinaire)
– Data in Brief (Multidisciplinaire)

Voir aussi :
– CIRAD. Rédiger et publier un data paper dans une revue scientifique.
https://coop-ist.cirad.fr/gerer-des-donnees/rediger-un-data-paper/1-qu-est-ce-qu-un-data-
paper
– DORANUM. Data papers et data journals : fiche synthétique.
https://doranum.fr/data-paper-data-journal/fiche-synthetique/
Et le cahier de labo ?
– Le cahier de labo est mentionné dans la plupart des modèles de PGD, dont
celui de l’ANR.
– Il n’est pas à partager, mais doit rester accessible.
– Pas forcément exploitable pour reproduire les résultats (documenter pour
soi vs rendre reproductible)

– A conserver !
• AAF. 2012. « Référentiel de gestion des archives de la recherche »
https://www.archivistes.org/IMG/pdf/referentiel_recherche_intro_septe
mbre2012_corrige_.pdf
D’autres formats de
cahiers
– Carnets de terrain, etc.
– Souvent considérés comme des documents
personnels, rédigés pour soi, qui ne sont pas
à partager
– Cahiers computationnels : exemple des
Jupyter notebooks, notes et code exécutable,
parfois partagés

Rule, Adam, Aurélien Tabard, et James D. Hollan.


« Exploration and Explanation in Computational
Notebooks ». 2018.
https://dl.acm.org/doi/10.1145/3173574.3173606
Logiciels libres et recherche
– Copyleft, 1970
– Manifeste GNU / Richard Stallman, 1985
– Free Software Foundation, 1985
– Licence GNU GPL : 1989
– Linux, 1991
– Parution de La Cathédrale et le bazar / Eric Raymond, 1997
– Open Source Initiative, 1998

4 libertés :
- modification
- diffusion
- étude du code source
- utilisation
Codes et logiciels
Le logiciel joue dans la recherche un triple rôle :
1. il sert d’outil dans de nombreux domaines, en traitant efficacement divers types de données
pour construire et tester des modèles visant à étayer ou invalider des hypothèses ;
2. il peut constituer en lui-même un résultat de recherche, en tant que preuve d’existence d’une
solution algorithmique efficace à un problème donné, cette efficacité étant évaluée à l’aune des
capacités des ordinateurs du moment ;
3. il peut être lui-même objet de recherche. En particulier, la communauté scientifique s’intéresse
aux modes de développement des logiciels et à la preuve de leurs propriétés, en lien notamment
avec les enjeux sociétaux liés à la transparence et à la confiance dans les traitements informatisés.

Clément-Fontaine, Mélanie, Roberto Di Cosmo, Bastien Guerry, Patrick Moreau, et François


Pellegrini. « Note d’opportunité sur la valorisation des logiciels issus de la recherche ». CoSO, 2019.
https://hal-lara.archives-ouvertes.fr/hal-03606374
Pourquoi ouvrir codes et logiciels
“Sometimes, if you don’t have the software, you
don’t have the data.” Christine L. Borgman,
Journées Nationales pour la Science Ouverte, 2018

Trois piliers pour la science ouverte :


- open access
- open data
- open source repositories

Des données sans logiciel ne sont pas toujours


reproductibles !

Voir : Stodden, Victoria, et Sheila Miguez. « Best


Practices for Computational Science: Software
Infrastructure and Environments for Reproducible
and Extensible Research ». SSRN Scholarly Paper.
Rochester, NY: Social Science Research Network, 6
septembre 2013.
Trois piliers de la Science Ouverte, Software Heritage CC-By https://papers.ssrn.com/abstract=2322276
4.0 2019
Codes et logiciels :
partage et archivage
– Plateformes de développement collaboratif, “forges
logicielles” :
• GitHub, GitLab.com, BitBucket, instances de GitLab
institutionnelles, etc.
• Finalité : développer un logiciel de façon
collaborative
• Risques : aucune garantie de pérennité (nombreux
exemples de fermetures brutales : Gitorious.org,
Google Code, Bitbucket)
• Ne remplacent pas un archivage pérenne !

– Archives :
• Software Heritage
– Finalité : garantir une conservation et un accès pérennes
– Enjeux : garantir l’accès et la possibilité d’utiliser des
codes et des logiciels de manière pérenne
– Constituer un patrimoine informatique
Software Heritage
– Une initiative d’INRIA
– Portée par Roberto Di Cosmo
– Trois principaux objectifs pour
les codes sources :
• Collecter,
• Préserver à long terme
• Partager

Abramatic, J.-F., Di Cosmo, R., &


Zacchiroli, S. (2018). Building the
universal archive of source code.
https://cacm.acm.org/magazines/2018
/10/231366-building-the-universal-arc
hive-of-source-code/fulltext
– Partenariat avec HAL : dépôt des codes sources de
logiciels via HAL, et archivage pérenne automatique
dans Software Heritage.
– Dépôt dans HAL => archivé automatiquement dans
Software Heritage

Software – Dépôt dans Software Heritage => signalement dans


HAL, vial le PID
– A préparer avant le dépôt :
Heritage et • fichier README
• liste normalisée d’auteurs
HAL • choisir une licence
– Chaque version du logiciel archivé dispose d’un
identifiant unique et pérenne.

Voir :
https://doc.archives-ouvertes.fr/deposer/deposer-le-code-sour
ce/
Une fois le code archivé, il peut être cité finement
:

Citer du code - Citation du code : ajout du lien vers le dépôt


complet sur Software Heritage
avec Software - Citation d’une version précise : ajout du lien de
la version sur Software Heritage
Heritage - Citation d’une ou des lignes spécifiques dans
une version precise : ajout du lien vers la ou les
lignes de la version sur Software Heritage
Articles exécutables - 1
L’article traditionnel et les autres
produits de recherche

Problèmes :
- on a l’article, mais pas les données
- on n’a pas les codes

Nauge, Michael. « Executable papers :


vers une science plus ouverte,
transparente et réutilisable ». In
Progedo : Semaine DATA SHS. Poitiers,
France, 2020.
https://hal.archives-ouvertes.fr/hal-03
128918
Articles exécutables - 2
L’article exécutable permet :
- le contrôle de version, pour garder les
traces de modifications
- l’accessibilité à l’article, mais aussi aux
données associées et aux codes
- la possibilité d’exécuter à nouveau le code

Voir : Desquilbet, Loïc L. et al. Vers une


recherche reproductible. URFIST de
Bordeaux, 2019.
https://hal.archives-ouvertes.fr/hal-0214414
2
Identifiants
– Nécessité de lier un auteur à ses
publications, ses jeux de données,
etc.
– Identifiants auteurs :
• ORCID,
• IDREF (ABES),
• VIAF,
• ISNI
– DOI et autres PID
EOSC
Nuage de services et
d’infrastructures européennes

Pour les chercheurs : EOSC


marketplace, une suite de
services https://eosc-portal.eu/

Pour les fournisseurs : EOSC


portal,
https://providers.eosc-portal.e
u/home
EOSC
“EOSC is the basis for a
science, research and
innovation data space that
will bring together data
resulting from research and
deployment programmes
and will be connected and
fully articulated with the
sectoral data spaces.”

European Data Strategy,


COM(2020) 66 final
EOSC
– Fournir des règles d’accès et de réutilisation des
données
– Avoir des standards de nouvelles générations,
des outils et des infrastructures pour stocker et
analyser les données
– Mutualiser les infrastructures
– Mise en commun des données européennes
dans des secteurs clés, avec des espaces de
données communs et interopérables à l'échelle
de l'UE
– Permettre aux utilisateurs d’avoir des droits su
leurs données, des outils et des compétences
pour garder le contrôle de leurs productions
Glinos, Kostas. European Open Science policy and EOSC. 2021.
https://eoscfrance.sciencesconf.org/342553
EOSC
Organisation

Glinos, Kostas. European Open Science policy and EOSC. 2021.


https://eoscfrance.sciencesconf.org/342553
S’auto-former

Bracco, Laetitia, Mathilde Barthe, Stéphanie Cheviron, Agnès Faller, Madeleine Hubert, Sylvie Steffan, Noël Thiboud, et Jean-Baptiste Vu Van.
« Former les professionnels de l’information et de la documentation aux données de la recherche en 45 minutes ». 9 septembre 2020.
https://doi.org/10.5281/zenodo.4020355.
Bracco, Laetitia, Mathilde Barthe, Stéphanie Cheviron, Agnès Faller, Madeleine Hubert, Sylvie Steffann, Noël Thiboud, et Jean-Baptiste Vu
Van. « Guide d’autoformation aux données de la recherche ». 29 juin 2020. https://doi.org/10.5281/zenodo.3920869.
Deux lectures

• Borgman, C. L. (2020). Qu’est-ce que le travail scientifique des


données ? : Big data, little data, no data (C. Matoussowsky,
Trans.). OpenEdition Press.
http://books.openedition.org/oep/14692

• Leonelli, S. (2019). La recherche scientifique à l’ère des big data:


cinq façons dont les big data nuisent à la science et comment la
sauver. Mimésis.
ACTIVITÉ 3 –
DONNÉES DE LA
RECHERCHE
Qu’est-ce que A- une nouvelle danse
B- un amas nuageux dans le ciel
le « cloud » ? C- des serveurs distants de stockage de données
Un jeu de
données
disponible
Vrai
dans un Faux

entrepôt est
forcément
libre de droits
Qu’est-ce A- un magasin où l’on entrepose des objets à
qu’un donner
B- une infrastructure pour stocker, rechercher et
entrepôt de accéder aux données numériques
C- un disque dur externe pour stocker des fichiers
données ?
Il n’y a pas
encore de
Vrai
règles pour Faux

citer un jeu de
données
Le DOI
identifie
uniquement
les Vrai
publications Faux

et les jeux de
données
numériques
Quels sont les
formats à A- des formats que suis sur·e de réutiliser
privilégier B- des formats non-propriétaires
C- des formats ouverts
pour le D- des formats si possible communément
partagés par la communauté
partage de
données ?
A- une licence qui n’engage à rien
Qu’est-ce que B- une licence qui permet de placer son œuvre au
plus près du domaine public
la licence C- une licence qui permet d’abandonner tous ses
droits d’auteur (dans la limite de ceux exigés par
CC0 ? la loi)
D- cette licence n’existe pas
Quelle licence
est
A- CC BY-ND-NC-SA
déconseillée B- ODbL
pour une base C- PDDL
D- LO
de données
ouverte ?
Quels sont les A- crypter ses informations pour être seul à les
avantages comprendre
B - faire plaisir aux services administratifs
d’un plan de C- synthétiser la description et l’évolution des
jeux de données de votre projet de recherche
gestion des D- gérer les données utilisées et générées dans le
cadre de son activité ou projet de recherche
données ?
Quand faut-il
commencer la
rédaction d’un A- quand on veut
B- dès le début du projet
plan de C- au moment de publier son article
D- quand toutes les données sont collectées ou
gestion des produites

données
(PGD) ?
A- un ensemble de données à traiter
Que signifient B- des données faciles à trouver, accessibles,
interopérables et réutilisables
« FAIR » ? C- des données exactes, non falsifiées et
compréhensibles
Qu’est-ce A- une collection de données recueillies pendant un
jeu
qu’un jeu de B- un ensemble de données dédiées au jeu

données ? C- un ensemble cohérent de données


Lequel de ces
éléments n’est
pas une A- attribution (BY)
B- utilisation seulement pour la recherche (USR)
clause des C- partage dans les mêmes conditions (SA)
licences D- pas d’utilisation commerciale (NC)

Creative
Commons ?
Faut-il
déposer ses
données dans A- jamais
un entrepôt B- toujours
C- pas toujours
pour pouvoir
publier un
Data paper ?
Pourquoi
déposer vos A- pour les conserver dans un environnement
réfrigéré
jeux de B- pour les cacher avec d’autres données
C- pour les faire connaitre et faciliter leur
données dans réutilisation

un entrepôt ?
Que permet A- conserver le document à long terme
l’archivage B- le rendre accessible à long terme
C- permettre sa réutilisation
pérenne ?
Dans le cadre
d’un projet, il
faut
s’accorder sur Vrai
les règles de Faux

gestion et de
partage des
données
Pourquoi est-il
important de
décrire vos A- pour gagner le grand prix de l’excellence
données scientifique
B- pour vous rappeler ce que vous avez déposé
quand vous C- pour faciliter la réutilisation de vos données
les déposez par d’autres chercheurs

dans un
entrepôt ?
Qu’est-ce que A- la règle de répartition des bénéfices entre
l’éditeur, l’imprimeur et l’auteur
la règle du 3- B- la règle qui permet de trier les entrepôts de
données fiables
2-1 ? C- la règle de sécurisation physique des données
Je dépose
mes données
à plusieurs
endroits, je Vrai
suis mieux Faux

référencé·e et
davantage
cité·e
Convention de
nommage ?
L’essentiel est
que je m’y Vrai
retrouve dans Faux

le nommage
de mes
fichiers…
Dans le cas d’un
projet avec de
multiples A- il est conseillé de rédiger un seul DMP pour
partenaires et l’ensemble du projet
B- il est conseillé de rédiger un DMP par
des données très partenaire
diverses, C- il est conseillé de rédiger un DMP par type de
comment données
procéder pour
rédiger le DMP ?
QUELQUES
POINTS
JURIDIQUES
Droit d’auteur, rappel
– Droits moraux : droit de paternité, droit de divulgation, droit au respect de
l’intégrité de l’œuvre, droit de retrait/repentir. Inaliénable et perpétuel
– Droits patrimoniaux : droit de reproduction (fixation sur un support) et droit
de représentation (communication au public). Cessible et limité dans le
temps (70 ans après la mort de l’auteur)
Qu’est-ce qui est protégé par le droit d’auteur ?
– « Œuvres » même sans caractère artistique, si elles présentent un degré minimal
d’« originalité »: textes, discours, photos, vidéos, musique, cartes, sculptures…
– Code informatique, mais les droits appartiennent à l’établissement
– Marques, dessins, modèles
– Brevets, éléments brevetés
– Droits des bases de données

En revanche, ne sont pas protégées les :


- informations purement factuelles (mesures, comptages…)
- œuvres tombées dans le domaine public (pour être précis il reste un droit moral, inaliénable)
Le fait que la collecte des données ait demandé un investissement (humain, matériel, financier)
n’est pas créateur de droit d’auteur.
Loi de programmation de la recherche
Article 48, https://www.legifrance.gouv.fr/loda/article_lc/LEGIARTI000042750323/

“La politique de science ouverte, qui promeut la diffusion libre des publications et, autant que
possible, des données de la recherche, est un des leviers de cette refondation de la place des
chercheurs dans la société. Elle saisit toutes les opportunités offertes par le numérique pour libérer le
potentiel scientifique, économique, politique et culturel de la recherche et elle permet l’accès de tous
- citoyens, étudiants, associations, entreprises, etc. - aux savoirs issus de la recherche. Le plan national
de science ouverte porté par le ministère de l’enseignement supérieur, de la recherche et de
l’innovation avec les établissements de l’ESRI, appuyé sur le fonds national de la science ouverte lancé
en 2019, a donné une impulsion dont les premiers effets sont déjà bien visibles ; il sera poursuivi,
amplifié et complété par une politique de soutien à l’édition car la vitalité de l’édition scientifique est
une des conditions de la vitalité de la recherche. Par ailleurs, des travaux seront engagés pour faciliter
l’accès à certaines données détenues par des personnes morales de droit privé qui pourraient être
d’intérêt pour l’ensemble de la recherche publique et qui seraient ainsi considérées comme des données
d’intérêt général.”
Loi pour une République numérique
Article 30, codifié dans le Code de recherche, articleL533-4 https://www.legifrance.gouv.fr/codes/article_lc/LEGIARTI000033205794/
I.-Lorsqu’un écrit scientifique issu d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités
territoriales ou des établissements publics, par des subventions d’agences de financement nationales ou par des fonds de l’Union européenne est
publié dans un périodique paraissant au moins une fois par an, son auteur dispose, même après avoir accordé des droits exclusifs à un éditeur,
du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, sous réserve de l’accord des éventuels coauteurs, la
version finale de son manuscrit acceptée pour publication, dès lors que l’éditeur met lui-même celle-ci gratuitement à disposition par voie
numérique ou, à défaut, à l’expiration d’un délai courant à compter de la date de la première publication. Ce délai est au maximum de six mois
pour une publication dans le domaine des sciences, de la technique et de la médecine et de douze mois dans celui des sciences humaines et
sociales. La version mise à disposition en application du premier alinéa ne peut faire l’objet d’une exploitation dans le cadre d’une activité
d’édition à caractère commercial.
II.-Dès lors que les données issues d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités
territoriales, des établissements publics, des subventions d’agences de financement nationales ou par des fonds de l’Union européenne ne sont
pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques par le chercheur, l’établissement
ou l’organisme de recherche, leur réutilisation est libre.
III.-L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre
de sa publication.
IV.-Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite.
Un droit, pas une obligation
– La LPRN donne des droits aux chercheurs, mais ne les oblige en rien
– Les obligations sont souvent contractuelles dans le cadre des financements
– Contrairement aux autres agents de la fonction publique, les chercheurs
conservent leurs droits d’exploitation (droit de représentation et de
reproduction)
– Certaines universités ont voté une obligation de dépôt dans HAL, comme à
Nantes : contentieux en cours (cf. rapport OPECST), à suivre…
Cadre d’ouverture des données
✅ Open data : principe de communication et de réutilisation libre et gratuite
– En Europe : Directive PSI
– En France :
• Lois CADA, Valter et loi pour une République numérique
• Code des relations entre le public et l’administration
En pratique, tout dépend du type de données :
✅ Communication obligatoire
• Directive INSPIRE : géographie
• Convention d’Aarhus : environnement
Cadre d’ouverture des données
🔴 Communication interdite des données portant atteinte :
– A la défense et la politique étrangère de la France, aux délibérations du gouvernement, au
pouvoir exécutif
– A la sûreté de l’État, la sécurité publique, à la sécurité des personnes , à la sécurité des
biens de l’établissement et de ses systèmes d’informations
– Au secret professionnel (médical, etc.)
– Au secret industriel et commercial
🔶 Communication possible sous conditions de données :
– Protégées par le droit d’auteur ou autres droits de propriété intellectuelle
– Relatives à des personnes privées (données personnelles, vie privée)
– Soumises au secret statistique
– Liées à un contrat avec un tiers non soumis à une obligation de service public
– Présentant des risques pour la protection du potentiel scientifique et technique de la nation
(« unité protégée » ou « Zone à régime restrictif »)
Licences ouvertes

– Œuvres :
• Creative Commons
• Licence ouverte française,
dite Etalab
– Logiciels et bases de données
• Bases de données :
Licences de l’Open Knowled
ge Foundation
, PDDL, ODC-By, ODC-ODbL
• Logiciels : licences GNU
– Un outil pour trouver une
licence publique :
https://ufal.github.io/public-
license-selector/
Source : FOSTER. Introduction to RDM concepts and tools / S. Venkataraman. 2018.
https://www.fosteropenscience.eu/node/2514
Décret intégrité scientifique
– Intégrité scientifique : “ensemble des règles et valeurs qui doivent régir les activités
de recherche pour en garantir le caractère honnête et scientifiquement rigoureux.”
– Article 2 : les établissements “promeuvent la diffusion des publications en accès
ouvert et la mise à disposition des méthodes et protocoles, des données et des
codes sources associés aux résultats de la recherche afin d’en garantir la traçabilité
et la reproductibilité. Ils incitent à la publication des résultats de recherche dits
négatifs.”
– Article 6 : “ils veillent à la mise en œuvre par leur personnel de plans de gestion de
données et contribuent aux infrastructures qui permettent la conservation, la
communication et la réutilisation des données et des codes sources.”

https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000044411360
Texte and data mining
– Enfin un cadre juridique !
– Ordonnance en novembre 2021
https://www.legifrance.gouv.fr/jorf/id/JORFT
EXT000044362034

– Décret en juin 2022


https://www.legifrance.gouv.fr/jorf/id/JORFT
EXT000045960058

Voir : Maurel, Lionel et Rennes, Stéphanie. La fouille


de textes et de données à des fins de recherche : une
pratique confirmée et désormais opérationnelle en
droit français. 2021
https://www.ouvrirlascience.fr/la-fouille-de-textes-et
-de-donnees-a-des-fins-de-recherche-une-pratique-c
onfirmee-et-desormais-operationnelle-en-droit-franc
ais/
Données personnelles : définition
toute information relative à une personne physique susceptible d’être identifiée, directement ou
indirectement.

Par exemple : un nom, une photo, une empreinte, une adresse postale, une adresse mail, un numéro de
téléphone, un numéro de sécurité sociale, un matricule interne, une adresse IP, un identifiant de connexion
informatique, un enregistrement vocal, etc.
Peu importe que ces informations soient confidentielles ou publiques.
A noter : pour que ces données ne soient plus considérées comme personnelles, elles doivent être rendues
anonymes de manière à rendre impossible toute identification de la personne concernée : noms masqués,
visages floutés, etc.
Attention : s’il est possible par recoupement de plusieurs informations (âge, sexe, ville, diplôme, etc.) ou par
l’utilisation de moyens techniques divers, d’identifier une personne, les données sont toujours considérées
comme personnelles.

Source : CNIL. Une donnée à caractère personnel, c’est quoi ?


https://www.cnil.fr/fr/cnil-direct/question/une-donnee-caractere-personnel-cest-quoi
Recueil de données sensibles
Description du risque : décrire les données sensibles collectées
– Données personnelles
– Données de patients
– Données biologiques

Gestion du risque : identifier les personnes qui vont vous aider à gérer les données sensibles
– Protection renforcée
• Autorisation d’accès
• Sécurité renforcée du stockage des données
– Diffusion des données
• Anonymisation réversible ou irréversible
• Pseudonymisation
• Limitation de la réutilisation à certains usages
• Demande d’autorisation d’accès

Source : Puren, Marie. 2021. « Créer son plan de gestion des données ». École thématique. Lille, France: MESH,
Lille. https://hal.archives-ouvertes.fr/hal-03183724
Le RGPD : bases légales
Il est permis de traiter des données personnelles lorsque le traitement repose sur une des 6 bases légales
mentionnées à l’article 6 du RGPD :

– le consentement : la personne a consenti au traitement de ses données ;


– le contrat : le traitement est nécessaire à l’exécution ou à la préparation d’un contrat avec la personne
concernée ;
– l’obligation légale : le traitement est imposé par des textes légaux ;
– la mission d’intérêt public : le traitement est nécessaire à l’exécution d’une mission d’intérêt public ;
– l’intérêt légitime : le traitement est nécessaire à la poursuite d’intérêts légitimes de l’organisme qui
traite les données ou d’un tiers, dans le strict respect des droits et intérêts des personnes dont les
données sont traitées ;
– la sauvegarde des intérêts vitaux : le traitement est nécessaire à la sauvegarde des intérêts vitaux de
la personne concernée, ou d’un tiers.

Source : CNIL. « La licéité du traitement : l’essentiel sur les bases légales prévues par le RGPD ». Consulté le 3
octobre 2021. https://www.cnil.fr/fr/les-bases-legales/liceite-essentiel-sur-les-bases-legales
Principes du RGPD
Les 5 grands principes des règles de protection des données personnelles sont les suivants :

– Le principe de finalité : le responsable d’un fichier ne peut enregistrer et utiliser des informations sur
des personnes physiques que dans un but bien précis, légal et légitime ;
– Le principe de proportionnalité et de pertinence : les informations enregistrées doivent être
pertinentes et strictement nécessaires au regard de la finalité du fichier ;
– Le principe d’une durée de conservation limitée : il n’est pas possible de conserver des informations
sur des personnes physiques dans un fichier pour une durée indéfinie. Une durée de conservation
précise doit être fixée, en fonction du type d’information enregistrée et de la finalité du fichier ;
– Le principe de sécurité et de confidentialité : le responsable du fichier doit garantir la sécurité et la
confidentialité des informations qu’il détient. Il doit en particulier veiller à ce que seules les personnes
autorisées aient accès à ces informations ;
– Les droits des personnes

Source : CNIL. « Quels sont les grands principes des règles de protection des données personnelles ? ».
Consulté le 3 octobre 2021.
https://www.cnil.fr/fr/cnil-direct/question/quels-sont-les-grands-principes-des-regles-de-protection-des-donn
ees
– Université Paris Lumières. 2019. « Fiches pratiques
sur le Règlement Général pour la Protection des
Données ».
https://www.parisnanterre.fr/dpd-guide-rgpd-94329
5.kjsp?RH=1557908685504

– Sciences humaines
Guides sur le • InSHS. 2021. « Les sciences humaines et sociales
et la protection des données à caractère

RGPD personnel dans le contexte de la science


ouverte : guide pour la recherche - v2 ».
Exemples de fiches p. 30 & sq.
https://www.inshs.cnrs.fr/sites/institut_inshs/fil
es/pdf/Guide_rgpd_2021.pdf

– Santé
• CNIL. 2018. « Recherche médicale : quel est le
cadre légal ? » 2018.
https://www.cnil.fr/en/node/24981
Certains éditeurs scientifiques se présentent aujourd’hui comme éditeurs
scientifiques et revendent les données d’usage dans les pays où la législation le
permet

“Ce pistage scientifique est effectué avec un ensemble d’outils qui


va du suivi des visites de sites via les dispositifs d’authentification
jusqu’à des données détaillées en temps réel sur le
comportement informationnel des personnes et des institutions.”

L’importance Nominé, Jean-François, et Thomas Porquet. « Traçage des données dans la


recherche : Agrégation et utilisation ou vente des données d’usage par les
éditeurs scientifiques », avril 2022.

des données https://hal-cnrs.archives-ouvertes.fr/hal-03642035

personnelles Voir aussi :


- Dunning, Alastair. « Rough Notes on ‘Surveillance Capitalism in Our Libraries’ ».
Open Working, 2022. https://openworking.wordpress.com/2022/01/11/4396
- Fried, Eiko. « Welcome to Hotel Elsevier: You Can Check-out Any Time You like …
Not » ». Eiko Fried, 2022.
https://eiko-fried.com/welcome-to-hotel-elsevier-you-can-check-out-any-time-yo
u-like-not/

- Galonnier, Juliette. « Penser la protection des chercheurs, de leurs enquêtés et


de leurs données à l’heure de la science ouverte ». La vie de la recherche
scientifique, 2021. https://hal-sciencespo.archives-ouvertes.fr/hal-03419665
RESSOURCES
ÉDUCATIVES
LIBRES
Définition
« matériaux d'enseignement,
d'apprentissage ou de recherche
appartenant au domaine public ou
publiés avec une licence de propriété
intellectuelle permettant leur
utilisation, adaptation et distribution
à titre gratuit »
Types de ressources
éducatives libres
• Manuels en libre accès
• Notes de cours et présentations
• Multimédias
• Audio
• Illustrations
• Animations
• Devoirs
• Tests

Source : Ehlers et al (2018). Attribution : Ralf Schmitzer, Noun Projet, CC BY, à l’exception des icônes d’animation, UNESCO-
UNEVOC/Hayoung Park, CC0. https://unesdoc.unesco.org/ark:/48223/pf0000373887/PDF/373887fre.pdf.multi
En France, le portail CEL du CCSD

https://cel.archives-ouvertes.fr/
Un rapport sur les REL
Proudman, Vanessa, Gema Santos-Hermosa,
Jen Smith, et Victoria Ficarra. « Open
Education in European Libraries of Higher
Education ». Zenodo, 24 juin 2020.
https://doi.org/10.5281/zenodo.3903175; ht
tps://web.archive.org/web/20220702095634
/https://zenodo.org/record/3903175
.
ACTIVITÉ 4 –
CAS PRATIQUES
Protéger la vie Un petit exercice éloquent
https://cpg.doc.ic.ac.uk/observatory/explore
privée
Cas pratiques
 Une chercheuse vous dit que ses données sont à elle

 Un chercheur vous dit qu'il publie avec des collègues étrangers chez un éditeur non-européen et que
vous irez en prison si vous l'incitez à déposer dans HAL

 Un chercheur vous dit que ses données ne sont pas publiques

 Une chercheuse travaille sur la prostitution chez les mineures, quid du RGPD ?

 Un chercheur a une collection de photos personnelles d'images de sceaux pris dans divers musées mais
ne veut pas les prêter à des collègues

 Une chercheuse reçoit une demande via la CADA pour ouvrir ses données et ne veut pas le faire

 Un chercheur vous dit qu’il comprend qu’il doit partager ses données, mais qu’il a encore deux
publications d’article issues du même jeu de données
– Une loi européenne contraignant les
principaux navigateurs à se mettre en
conformité sur l’utilisation des données
personnelles.
Qu’est-ce que – Un règlement européen sur le partage des
données au sein des entreprises.
le RGPD ? – Un règlement de l’Union européenne qui
vise à harmoniser la gouvernance des
informations personnelles, notamment en
termes de sécurisation et de protection des
données personnelles.

Source https://blog.atinternet.com/fr/rgpd-quiz-15-questions-pour-tester-vos-connaissances/
– Les organisations doivent mettre en place
des mesures techniques et
organisationnelles pour assurer
continuellement une protection optimale
des données et être en mesure de la
démontrer en documentant leur
Qu’exige le conformité.
– Les organisations doivent conserver les
RGPD ? données des internautes européens
pendant 5 ans minimum.
– Les entreprises doivent partager, par souci
de transparence, toutes les données des
utilisateurs avec les institutions
européennes.
Comment le – Il s’agit de toute information relative à une
RGPD définit-il personne physique susceptible d’être
identifiée ou identifiable.
les « données – Il s’agit de vos coordonnées bancaires et/ou
votre adresse postale.
à caractère – Il s’agit de vos adresses IP et de toutes vos
informations en ligne personnelles.
personnel » ?
Qu’est-ce que le RGPD considère
comme un consentement licite ?

– Le simple fait de télécharger un


document sur un site ou une
application mobile.
– Une poursuite de navigation sur un
site ou une application mobile par un
simple scroll.
– Un acte positif clair par lequel la
personne exprime librement, de
manière spécifique et éclairée, son
consentement au traitement des
données.
Quelle est
l’amende – 50 millions d’euros (€) et 50 % du chiffre
d’affaires mondial annuel.
maximale en – 10 millions d’euros (€) et 2 % du chiffre
d’affaires mondial annuel.
cas de non- – 20 millions d’euros (€) ou jusqu’à 4 % du
respect du chiffre d’affaires mondial annuel.

RGPD ?
Parmi les données
analytics
collectées, quelles
– Adresses IP, cookies, nom du site consulté
catégories de et heure de consultation de la page.
données sont – Cookies uniquement.
considérées – Adresses IP uniquement
comme étant à «
caractère
personnel » ?
À quoi – Data Protection Officer, Délégué à la
protection des données.
correspond – Data Positioning Officer, Agent de
positionnement des données.
l’acronyme – Data Preservation Officer, Délégué à la
DPO ? préservation des données.
L’une des
obligations du
– La liste de tous les sous-traitants impliqués
RGPD est de dans l’opération de traitement.
tenir des – Les finalités du traitement, une description
registres des des catégories de personnes concernées et
des catégories de données à caractère
activités de personnel.
traitement. Que – Le volume de données traitées.
doit contenir ce
document ?
– Une approche visant à intégrer la
protection de la vie privée dès les
spécifications de conception et
Qu’est-ce que d’architecture des nouveaux systèmes et
processus.
le privacy-by- – Un principe visant à protéger le partage des
design ? données au sein des entreprises.
– Une méthodologie de documentation de
toutes les actions de mise en conformité
initiées par les responsables de traitement.
Le(s)quel(s)
de ces
A- la photo d’une personne de dos
éléments B - la photo d’une personne de profil
C- un souvenir conservé depuis l’enfance
correspond à D- un numéro de portable
une donnée
personnelle ?
Puis-je utiliser une photographie issue
de Google image où aucun individu
n’apparaît ?

Vrai
Faux
CONCLUSION
Structures de la science ouverte en France
– Un coordinateur national de la science ouverte au MESR : Marin Dacos
– Une Administratrice ministérielle des données, des algortithmes et des codes (AMDAC) : Isabelle Blanc
– SPSO
• Secrétariat permanent pour la science ouverte
• prépare les travaux du comité de pilotage et veille à la mise en œuvre de ses décisions.
• coordonne l’action des collèges du Comité pour la science ouverte
– CoSO
• prend les arbitrages concernant les aspects les plus stratégiques de la politique nationale de science
ouverte
• mise en oeuvre du plan national pour la science ouverte
• se constitue en Conseil des partenaires du groupement d’intérêt scientifique Fonds national pour la
science ouverte (GIS FNSO) pour décider des appels et initiatives financés
– Collèges et groupes d’expertise du CoSO : avis et orientations d’experts
– FNSO : instrument financier du PNSO
– SPSIN : secrétariat Permanent du CoSIN
– CoSIN
• Comité pour les Services et Infrastructures Numériques
• Collège EOSC
Vers une ouverture
massive des résultats
de la recherche
– Inventaire non exhaustif :
articles, données, codes et
logiciels, mais aussi pré-
enregistrements, rapports
enregistrés, cahiers numériques,
protocoles d’études, protocoles
de recherche, carnets de
recherche
– Ressources éducatives libres
Recommandation de l’Unesco pour la science
ouverte, 2021
Sept domaines principaux pour les états membres :
1. la promotion d’une compréhension commune de la science ouverte et des avantages et des défis
qui y sont associés, ainsi que des approches variées de la science ouverte ;
2. le développement d’un environnement politique favorable à la science ouverte ;
3. l’investissement dans les infrastructures et les services qui contribuent à la science ouverte ;
4. l’investissement dans la formation, l’éducation, la culture numérique et le renforcement des
capacités, afin de permettre aux chercheurs et aux autres parties prenantes de participer à la science
ouverte ;
5. la promotion d’une culture de la science ouverte et l’harmonisation des incitations à la science
ouverte ;
6. la promotion d’approches innovantes de la science ouverte à différentes étapes du processus
scientifique ;
7. la promotion de la coopération internationale et multipartite dans le contexte de la science
ouverte en vue de réduire les écarts numériques, technologiques et de savoir

https://fr.unesco.org/news/lunesco-etablit-normes-internationales-ambitieuses-science-ouverte
Un défi pour demain, changer l’évaluation
– Depuis DORA, en 2012, peu d’évolutions notables, malgré la signature de
nombreux établissements
– Appel de Paris sur l’évaluation de la recherche
https://osec2022.eu/fr/appel-de-paris/
– Une nécessaire adaptation de l’évaluation : conclusions du conseil de l’UE en
juin 2022, “Research assessment and implementation of Open Science”
https://www.consilium.europa.eu/media/56958/st10126-en22.pdf
DES
QUESTIONS ?
Merci de votre attention !
Contact :
cecile.arenes@sorbonne-universite.fr et
@carenes

Retrouvez et réutilisez cette présentation


sur Zenodo
EVALUATION
DU STAGE

Vous aimerez peut-être aussi