Académique Documents
Professionnel Documents
Culture Documents
Cécile Arènes
ENSAM, 5 juillet 2022
Qui suis-je ?
Cécile Arènes
Conservatrice des bibliothèques
Chargée de mission Données de la recherche et Humanités numériques à la
bibliothèque de Sorbonne Université
Membre du GTSO données de Couperin et du collège Données du CoSO
Déroulé de la journée
Horaires Objectif Points à aborder Modalités
9h30 – 10h (15') - accueil Modalités pratiques, tour de table
10h - 10h45 (45’) - séquence 1 Science ouverte Un peu d’histoire Exposé
International
PNSO
Définitions (science ouverte, OA, open data, reproductibilité, sciences
citoyennes)
Financements de la recherche
10h45 - 11h (15') - activité 1 Privés de savoir Introduction aux enjeux de la publication scientifique Vidéo
11h - 11h15 (15') - pause break
11h15 - 12h15 (60') - séquence 2 Archives ouvertes Mouvement de l’OA Exposé
Bibliométrie
Open access : les voies
APC
Preprints
LPRN volet OA
Exigences des financeurs : Plan S
Editeurs prédateurs
12h15 - 12h30 (15') - activité 2 approfondissement Questions et échanges sur l’OA Quizz en équipes
12h30 - 13h30 (60') - déjeuner break
13h30 – 14h (30’) – séquence 2 – suite Archives ouvertes – suite Éditeurs : modèle économique et négociations (Christine) Exposé
14h – 15h (60') - séquence 3 Données de la recherche Types de données Exposé, vidéos
Cycle de vie
Plan de gestion des données
Exigences des financeurs : données
Data papers
Codes et logiciels
Cahiers de labos
15h - 15h15 (15') - activité 3 approfondissement Questions et échanges sur les données Quizz en équipes
15h15 - 15h30 (15') - pause break
15h30- 16h (30') - séquence 4 RGPD, cadre juridique Données personnelles : définition, cadre juridique et enjeux (collecte de Exposé
Ressources éducatives libres ces données par les éditeurs, protection de ces données dans les
projets de recherche)
Open access et mandat de dépôt (rappel droit d’auteur, exemple du
contentieux de Nantes)
Cadre sur les données
Ressources éducatives libres
Tour de table
INTRODUCTION,
UN PEU
D’HISTOIRE
Documenter
– Au cours du 17e siècle, on passe du registre,
largement utilisé depuis le 13e siècle, à la
fiche.
– La fiche est plus facile à manipuler, à
déplacer et à classer.
– Voir : Bert, Jean-François. Une histoire de la
fiche érudite. Nouvelle édition [en ligne].
Villeurbanne : Presses de l’enssib, 2017
(généré le 31 décembre 2021). Disponible
sur Internet :
http://books.openedition.org/pressesenssib
/6211
Un précurseur, Paul
Otlet
– 1895 : Création de l’Office international de bibliographie (OIB).
Objectif : élaborer un Répertoire Bibliographique Universelle (RBU),
sorte de bibliographie du savoir humain rassemblant les notices de
tous les ouvrages publiés dans le monde quel qu’en soit le sujet ou le
temps.
– 1919-1920 : ouverture du Mundaneum, centre scientifique
documentaire, éducatif et social
– Notion de “document” très élargie : outre les livres, prise en compte
d’une grande variété de supports
– Anticipe la notion d’hypertexte : “complexe de machines associées
pouvant réaliser sept opérations dont « l’établissement des
documents de manière à ce que chaque donnée ait son individualité
propre et dans ses relations avec celles de tout l’ensemble, qu’elle y
soit rappelée là où il est nécessaire”
– Anticipe aussi l’internet : “Réseau universel d’information et de
documentation, capable de mettre en relation tous les organismes
particuliers de documentation. Sous nos yeux, écrit-il, est en voie de
se constituer une immense machinerie pour le travail intellectuel.
Elle se constitue par la combinaison des différentes machines
Voir : « Savoirs CDI: Paul Otlet ». s. d. Consulté le 4 janvier 2022.
existantes, dont les liaisons nécessaires s’entrevoient. Cette
https://www.reseau-canope.fr/savoirscdi/index.php?id=524. machinerie constituerait un véritable cerveau mécanique et
Image : Wikimedia Commons. Domaine Public.
https://commons.wikimedia.org/wiki/File:Paul_Otlet_%C3%A0_son_bureau_(cropped).jpg collectif”
L’hypertexte
– Au croisement de l’informatique et de la documentation
– 1945 : notion de Memex (pour Memory Extender), Vannevar Bush : " sorte
de bibliothèque et de fichier mécanisés. C’est un dispositif dans lequel un
individu stocke ses livres, ses enregistrements, toutes les informations qu’il
reçoit, automatisées de telle manière qu’il puisse compulser l’ensemble avec
le maximum de rapidité et de liberté "
– années 1960 : expérimentations de Douglas Engelbart et Ted Nelson et
création du terme “hypertexte”
Voir : Serres, Alexandre. 1995. « Hypertexte : une histoire à revisiter », 1995
https://archivesic.ccsd.cnrs.fr/sic_01180259/.
Internet et le web
– 1973 : création du protocole TCP/IP
par Vint Cerf : ensemble des règles de
communication sur internet et se
base sur la notion adressage IP
– 1989 : Tim Berners Lee “invente” le
web :
• attribution d’une adresse à
chaque document (URL) afin de le
localiser dans le système et liens
entre les pages créées par un
système de liens hypertextes.
• ajout d’un protocole de transfert,
http, et un langage, html,
complètent le dispositif
– Web sémantique : évolution du web, qui permet
d’utiliser les données structurées (par exemple, les
Web métadonnées contenues dans un catalogue de
bibliothèque) et de les rendre intéropérables
https://archive.wikiwix.com/cache/index2.php?url=http%3
A%2F%2Fwww.bnf.fr%2Ffr%2Fprofessionnels%2Fweb_sem
antique_donnees%2Fs.web_semantique_intro.html
Nouvelles évolutions
– Big data et IA, nouvelles logiques : on ne classe plus en amont, mais on cherche
dans la masse (en résumant à gros traits).
– Notion de 4e paradigme :
• 1er paradigme (il y a 1000 ans) : recherche empirique pour décrire les
phénomènes naturels
• 2e paradigme (depuis 100 ans) : recherche théorique, à partir de modèles et
de généralisations
• 3e paradigme (depuis quelques décennies) : recherche informatisée basée sur
des simulations de phénomènes complexes
• 4e paradigme (aujourd’hui) : exploration de données, intégration des théories,
simulations et expérimentations
Grande heure de gloire de la donnée
Source : https://lalist.inist.fr/?p=8013 et
https://docs.google.com/presentation/d/1nh5Sv-CjUUMlc30BK-gE8Z2Hun7ZvIOx/edit?usp=sharing&ouid=102297717099282383677&rtpof=true&sd=true (slide 5)
Une lecture
Cardon, Dominique. Culture
numérique. Paris, France:
SciencesPo les presses, 2019.
SCIENCE
OUVERTE
Définition
“Open Science is the practice of science in such a way that others can
collaborate and contribute, where research data, lab notes and other
research processes are freely available, under terms that enable reuse,
redistribution and reproduction of the research and its underlying data
and methods.”
1665 : Philosophical
Transcations
Lancement
d’ArXiv, Amsterdam Call
développé par Ouverture de Lancement de for Action on
Paul Ginsparg HAL Sci-Hub… Open Science
Principes : accessibilité,
données non-propriétaires,
licences ouvertes, etc.
Images : Silvio Tanaka, « Tim Berners-Lee, CC BY 2.0. https://commons.wikimedia.org/wiki/File:Tim_Berners-Lee_CP.jpg
Lessig 2016, CC BY 2.0. https://commons.wikimedia.org/wiki/File:Lawrence_Lessig_Headshot.jpg
Christopher Michel, “Tim O’Reilly”, CC BY 2.0. https://commons.wikimedia.org/wiki/File:Tim_O%27Reilly_-2017(38700700672)_(cropped).jpg
Sage Ross, CC BY-SA 2.0. https://commons.wikimedia.org/wiki/File:Aaron_Swartz_2_at_Boston_Wikipedia_Meetup,_2009-08-18.jpg
David Orban, CC:BY, Open Government Working Group. https://www.flickr.com/photos/davidorban/2095565103/in/album-72157603410393877/
Le mouvement de l’open data : du côté du web
Echelle 5 étoiles, Tim Berners-Lee, 2006
★ publiez vos données sur le Web (peu importe leur format) avec
une licence ouverte
★★★★ utilisez des URI pour désigner des choses dans vos
données, afin que les gens puissent faire des références à celles-ci
– Un commissaire, chargé du
marché intérieur, de la
politique industrielle, du
tourisme, du numérique, de
l’audiovisuel, de la défense
et de l’espace, Thierry
Breton
– Une direction, la DG CNECT
https://ec.europa.eu/info/si
tes/default/files/organisatio
n_charts/dg_connect_orga
nisation_chart_2022.03.16
_-_english.pdf
En Europe, 3
– Une politique volontariste en faveur de l’open science
– Des financements avec des exigences d’ouverture des produits de la recherche
– La construction d’un espace européen de la recherche
– L’implémentation d’EOSC
https://www.fosteropenscience.eu/
En France
Plan national pour la science ouverte,
2018 et 2021.
Source : Boudry, Christophe, Patricio Alvarez-Muñoz, Ricardo Arencibia-Jorge, Didier Ayena, Niels J. Brouwer, Zia Chaudhuri, Brenda Chawner, et al. 2019. « Worldwide Inequality in Access to Full Text
Scientific Articles: The Example of Ophthalmology ». PeerJ 7 (octobre): e7850. https://doi.org/10.7717/peerj.7850 .
Pourquoi ouvrir les données ?
– 50 % des expériences sont considérées comme non-reproductibles.
– 80 % des données produites ces 20 dernières années seraient perdues.
– 93 % des établissements d’enseignement supérieur n’ont pas de démarche de plan de
gestion des données de la recherche.
– 90 % des chercheurs interrogés dans le cadre d’un sondage européen disent effectuer de
manière individuelle le stockage, l’archivage ou la transmission de leurs données.
– 33 % de ces mêmes chercheurs n’ont jamais entendu parler des plans de gestion de
données ou estiment qu’ils n’en ont pas besoin.
– Plus de 80 % des données produites sont stockées ailleurs que dans des entrepôts.
DATACC. « Gestion des données : une nouvelle exigence, de nouvelles compétences », 2020.
https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/gestion-des-d
onnees-une-nouvelle-exigence-de-nouvelles-competences/
Les données
sont fragiles !
Chaque année augmente de
17% le risque de non-
disponibilité des données.
« Frequently Asked Questions about Data Curation ». s. d. Digital Humanities Data Curation (blog). Consulté le 3 octobre 2021.
https://guide.dhcuration.org/faq/
Puren, Marie. 2021. « Créer son plan de gestion des données ». École thématique. Lille, France: MESH, Lille.
https://hal.archives-ouvertes.fr/hal-03183724
SUJETS LIÉS À
LA SCIENCE
OUVERTE
Ethique
- Les grandes questions que posent les progrès de la science et leurs répercussions
sociétales
- Dimension culturelle: doit se discuter en permanence puis s’impose
- Concerne : tous les chercheurs
- Implique : des comités mixtes
Enjeux :
Intégrité du chercheur
reproductibilité - Les règles qui gouvernent la pratique de la recherche
Article 6
Les établissements publics et fondations reconnues d’utilité publique mentionnés au troisième alinéa
de l’article L. 211-2 du code de la recherche définissent une politique de conservation, de communication et
de réutilisation des résultats bruts des travaux scientifiques menés en son sein. A cet effet, ils veillent à la mise
en œuvre par leur personnel de plans de gestion de données et contribuent aux infrastructures qui
permettent la conservation, la communication et la réutilisation des données et des codes sources.
Décret n° 2021-1572 du 3 décembre 2021 relatif au respect des exigences de l’intégrité scientifique par les établissements publics contribuant au service public de la recherche et les
fondations reconnues d’utilité publique ayant pour activité principale la recherche publique, 2021. https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000044411360
Rétractations d’articles
Des causes multiples
• Erreur dans la méthode
• Erreur dans le traitement et l’analyse de données
• Manipulation d’images
• Plagiat
• …
https://retractionwatch.com/retraction-watch-database-user-guide/retraction-wat
ch-database-user-guide-appendix-b-reasons/
Reproductibilité
Plusieurs niveaux :
- Répéter une manipulation au cours d’une même expérience
- Réanalyser les données d’une étude et obtenir des résultats identiques
- Reproduire une étude avec la même méthode et obtenir des données
et des résultats compatibles
- Réaliser une étude avec une autre méthode et obtenir des résultats
compatibles
Source : SABY M. « Formation Diffuser et rendre réutilisables ses données : enjeux, méthodes et outils (2019) ».
22 mai 2019. Disponible sur : < https://osf.io/x72ga/ > (consulté le 7 juin 2022)
Une crise de la
reproductibilité
Un exemple bien connu
« Diederik Stapel remplissait lui-même
les tableaux de données, jetait les
questionnaires vierges à la poubelle
et, révèle Science, mangeait les
paquets de friandises censées servir
de récompenses aux participants de
ses tests ! »
http://passeurdesciences.blog.lemonde.fr/2012/12/
09/le-scandale-stapel-ou-comment-un-homme-seul-
a-dupe-le-systeme-scientifique/
Rendre la recherche plus reproductible
– Depuis une dizaine d’années, incitations croissantes à diffuser les données de la
recherche.
• Mouvement impliquant les Etats, les universités, les organismes de recherche,
les associations scientifiques, les financeurs publics et privés, les revues.
– Inscription plus globale dans le cadre de la « science ouverte »
• Diffuser ses données mais aussi ses protocoles, méthodes, codes
informatiques… peut favoriser la reproductibilité d’une étude.
MOOC INRIA.
https://www.fun-mooc.fr
/fr/cours/recherche-reproducti
ble-principes-methodologiques-
pour-une-science-transparente/
Les sciences citoyennes
- Contribution des citoyens amateurs à la collecte et à
l’analyse de données (scientifiques, amateurs)
- Objectif : Produire des connaissances et indicateurs,
Sciences avec éduquer les citoyens aux méthodes scientifiques
https://www.science-ensemble.org/pdf/charte-fr
ancaise-des-sciences-et-recherches-participatives.
pdf
Une
complémentarité
avec la science
ouverte
SCHADE S., PELACHO M., VAN NOORDWIJK T. (C. G. E. ), VOHLAND K., HECKER S., MANZONI M. « Citizen Science and Policy ». In : VOHLAND K, LAND-ZANDSTRA A, CECCARONI L, LEMMENS R, PERELLÓ J, PONTI M, SAMSON
R, WAGENKNECHT K, ÉD. The Science of Citizen Science [En ligne]. Cham : Springer International Publishing, 2021. p. 351‑371. Disponible sur : < https://doi.org/[10.1007/978-3-030-58278-4_18 > (consulté le 14 juin
2022)ISBN : 978-3-030-58278-4.
FINANCEMENTS
DE LA
RECHERCHE
Fonctionnement de la recherche
– Avant : des crédits annuels
– Après : un financement sur projet soumis à des agences de financements
– Les agences de financement françaises : ANR, INCa, ADEME, …
– Taux de réussite : environ 15%, en augmentation actuellement
– Signature d’une déclaration commune en faveur de la science ouverte
– Engagements pour les équipes financées : accès ouvert aux publications,
plan de gestion des données et, de plus en plus, ouverture des données
Depuis la LOLF, 2001
Organisation en mission,
programmes, actions
Mission interministérielle
pour la recherche et
l’enseignement supérieur
(MIRES) :
P150 : Formations supérieures
et recherche universitaire
P172 : Recherches
scientifiques et technologiques
pluridisciplinaires
https://publication.enseignementsup-recherche.gouv.fr/eesr/8/EESR8_Annexe_2-mires_programmes_lolf_pour_la_recherche.php
Quels acteurs, quelles
fonctions ?
• Grandes orientations et définition des
MESRI enjeux
Universités, • Opérateurs
organismes
HCERES • Evaluation
https://publication.enseignementsup-recherche.gouv.fr/eesr/8/EESR8_Annexe_2-mires_programmes_lolf_pour_la_recherche.php
Financements
des
laboratoires
Source : https://www.snesup.fr/sites/default/files/fichier/ces-cneser-aap-20190611-vote.pdf
L’espace européen de
la recherche
– Espace européen de la recherche :
• Depuis 2000
• Espace commun pour la recherche,
l’innovation et le transfert de
technologie
Privés de savoir…
https://youtu.be/WnxqoP-c0Z
E
LES
PUBLICATIONS
SCIENTIFIQUES
Un peu d’histoire
– XVIIe-XVIIIe siècles : Sociétés
savantes, discussions en assemblée,
comptes-rendus et mémoires
– 1750 : une douzaine de revues (+
ouvrages)
– 1850 : presque un millier de revues
– 1950 : croissance exponentielle du
nombre de revues
– 2016 : plus de 117 000 revues
scientifiques
Maisons d’éditions scientifiques
– XIXe : multiplication des maisons d’édition
• Masson : 1804,
• Wiley : 1807,
• Springer-Verlag : 1842,
• Dunod : 1876,
• Elsevier : 1880
– Années 1920 : disparition ou rachat de nombreuses maisons d’édition
– Années 1950 : concentration des maisons d’édition en multinationales
– Années 1960 : croissance exponentielle du nombre de revues scientifiques,
hausse du prix des abonnements vs. baisse des coûts de production
(délocalisations, nouvelles technologies du numérique)
Source :
https://www.theguardian.com/science/2017/jun/27/profitable-business-scientific-publishing-bad-for-science
Peer-reviewing
– “analyse critique d’un manuscrit soumis à une revue par des experts qui ne
font généralement pas partie du comité de rédaction”
– analyse exhaustive : recherche, hypothèse, matériels et méthodes (dont les
statistiques), résultats (le cas échéant, dont les jeux de données),
interprétation de ces résultats et implications, références
Fovet-Rabot, C. 2021. Comprendre les modèles d’évaluation par les pairs d’un
article scientifique en 7 points. CIRAD. https://doi.org/10.18167/coopist/0081
Circuit de soumission d’un article
– Les “corresponding authors” soumettent un manuscrit à une revue
– Le comité de rédaction (editorial board) rejette certains des manuscrits dès cette étape
– Le manuscrit, lorsqu’il est retenu, est pris en charge par un “editor” (rédacteur) qui cherche
les “reviewers” (relecteurs)
– Les reviewers, le plus souvent anonymes pour les auteurs, rédigent un rapport d’évaluation
– Le rédacteur étudie les avis et rédige une synthèse et l’envoie aux auteurs, avec des
demandes de modifications importantes ou mineures (major, minor revisions)
– Les auteurs peuvent adresser une réponse
– Le manuscrit révisé est appelé “postprint”, “accepted author manuscript”, ou manuscrit
auteur accepté
Fovet-Rabot, C. 2021. Comprendre les modèles d’évaluation par les pairs d’un article scientifique en 7 points. CIRAD.
https://doi.org/10.18167/coopist/0081
Bibliométrie
“La bibliométrie est l’application de méthodes statistiques et
mathématiques pour mesurer, évaluer, étudier, la production et la diffusion
d’ouvrages, d’articles et d’autres publications.”
Source : Bertignac, Catherine, Fouquet, Josiane, Marie, Emilie. “La bibliométrie”. In UBL (Université Bretagne
Loire). Formadoct. Rennes : UBL, 2010 (dernière maj le 11 novembre 2016). Disp. sur : http://guides-formadoct.u-
bretagneloire.fr/bibliometrie
Le facteur d’impact
“Le facteur d’impact (FI)
d’une revue à l’année N
est calculé en divisant le
nombre de citations
cette année-là de ses
articles publiés les deux
années précédentes par
le nombre d’articles
Source : Bertignac, Catherine, Fouquet, Josiane, Marie, Emilie. “La bibliométrie”. In UBL (Université Bretagne Loire). Formadoct. Rennes : UBL,
2010 (dernière maj le 11 novembre 2016). Disp. sur : http://guides-formadoct.u-bretagneloire.fr/bibliometrie
publiés dans cette revue
les années N-1 et N-2.”
Le h-index
– créé en 2005 par Jorge Hirsch
– nombre d’articles H cité au moins H fois chacun
– valorise les chercheurs à la carrière avancée
– problème pour les auteurs ayant peu de publications, mais toutes
très citées
– ne prend pas en compte l’ordre des auteurs
– compte les différentes versions d’une même publication
Boyer, A., Chirouze, E. 2017. Accéder au h-index d’un chercheur pour mesurer l’impact de ses publications.
CIRAD. https://doi.org/10.18167/coopist/0048](https://doi.org/10.18167/coopist/0048
Dérives : publish or perish
– Toujours plus de publications
– pratiques répréhensibles : inflation des auto-citations, échanges de
citations …
– valeur de l’article : celle de la revue
– invisibilité des SHS et des langues autres que l’anglais
– en santé, système SIGAPS génère une inflation des publications
Bertignac, Catherine, Fouquet, Josiane, Marie, Emilie. “La bibliométrie”. In UBL (Université Bretagne Loire). Formadoct.
Rennes : UBL, 2010. http://guides-formadoct.u-bretagneloire.fr/bibliometrie
Le Monde.fr. « Lancetgate » : publier beaucoup dans des revues scientifiques peut rapporter gros », 2020.
https://www.lemonde.fr/sciences/article/2020/06/15/lancetgate-publier-beaucoup-dans-des-revues-scientifiques-peut-
rapporter-gros_6042952_1650684.html
Dérives – deux lectures
Malscience / Nicolas Chevassus-au-Louis. La
Découverte, 2016
• Record mondial de publications, R. Kratitzky,
2215 publications co-signées entre 1953 et 2010
• Didier Raoult, 1996-2011, 1252 articles co-
signés
Saby, Mathieu. « Ouverture Des Publications et Des Données : Les Demandes Des Financeurs (ANR et
Commission Européenne) », 2020. https://doi.org/10.17605/OSF.IO/UK734
L’open access,
plusieurs voies - 1
Voie « bronze » :
- les publications sont librement accessibles
- on ignore sous quelles conditions elles peuvent être réutilisées.
- Il s’agit d’accès ouvert, mais pas d’accès libre.
https://www.bnf.fr/fr/protocole-oai-pmh
Indicateurs
PIWOWAR H., PRIEM J.,
LARIVIÈRE V., ALPERIN J. P.,
MATTHIAS L., NORLANDER B.,
FARLEY A., WEST J., HAUSTEIN
S. « The state of OA: a large-
scale analysis of the prevalence
and impact of Open Access
articles ». PeerJ [En ligne]. 13
février 2018. Vol. 6, p. e4375.
https://doi.org/
10.7717/peerj.4375
Baromètre science ouverte
– France
https://barometredelasci
enceouverte.esr.gouv.fr/
– Europe
https://ec.europa.eu/info
/research-and-innovation
/strategy/strategy-2020-2
024/our-digital-future/op
en-science/open-science-
monitor/trends-open-acc
ess-publications_en
https://www.data.gouv.fr/fr/reuses/baromet
re-de-la-science-ouverte/
– SciELO (Scientific Electronic Library Online) :
• environ 1800 revues à comité de lecture
en libre accès total issues d’Amérique
Autres latine et Caraïbes, Espagne, Portugal,
Afrique du Sud.
modèles – Érudit :
• ressources SHS publiées en français en
Amérique du Nord (revues, ouvrages,
actes, mémoires…).
– Dépôt du manuscrit sur une archive ouverte
par l’auteur
– Le comité éditorial de l’épi-revue se charge
du peer-reviewing de l’article
Epirevues – En France, Episciences (CCSD) : plateforme
d’épi-revues, héberge et diffuse les
publications de toutes disciplines en accès
ouvert diamant
https://www.episciences.org/
– PCI : Peer Community In
https://peercommunityin.org/
– plateforme de peer-reviewing ouverte
open acess BJÖRK B.-C. « Gold, green, and black open access ».
Learned Publishing 2017. Vol. 30, n°2. https://doi.org/
10.1002/leap.1096
LEVINE-CLARK M., MCDONALD J., PRICE J. « Access to
Freely Available Journal Articles: Gold, Green, and
Rogue Open Access Across the Disciplines », 2017.
https://doi.org/10.5703/1288284316494
Editeurs prédateurs
– apparition avec l’augmentation du modèle auteur-payeur
– publient tout ce qui est soumis, sans réelle révision par les pairs
– impact négatif pour un chercheur quand la revue est identifiée comme négative
– difficulté pour les chercheurs de retirer les articles
– parutions de listes (Beale, Cabell), mais obsolètes dès leur parution
– promouvoir plutôt des bonnes pratiques :
• Compass to publish https://app.lib.uliege.be/compass-to-publish/
• Think Check Submit https://thinkchecksubmit.org/
en OA Pubpeer (commentaires) :
https://pubpeer.com/static/extensions
Règles de signatures
– De très nombreuses variantes dans la façon dont les affiliations sont ajoutées dans
les publications
– Deux chercheurs d’un même laboratoire ont parfois deux signatures différentes
– Les établissements adoptent de plus en plus une signature dite “monoligne” qui
prend en compte les différentes tutelles
– Dans la majorité des cas, l’université de rattachement doit apparaître en premier,
c’est elle qui est prise en compte dans les classements internationaux
– Exemple :
https://www.sorbonne-universite.fr/sites/default/files/media/2020-02/doctorat-re
gles-signature.pdf
– Site Science ouverte de Couperin :
https://scienceouverte.couperin.org/
Guides et – Ressources du site Ouvrir la science :
https://www.ouvrirlascience.fr/category/re
ressources ssources/
et portail HAL Ouvrir la science :
https://hal-lara.archives-ouvertes.fr/OUVRI
R-LA-SCIENCE/
Une lecture
doivent
prioritairement
A- Data open acces journals
Qu’est-ce que B- Director of open access junior
C- Directory of open access journals
le DOAJ ? D- Digital object access journal
À partir de
janvier 2025, les
agences de
financement
Vrai
obligent les Faux
chercheurs à
diffuser leurs
publications en
libre accès
Qu’est-ce que A- la version de l’article publié avec les rectificatifs
apportés après publication
la version B- la version corrigée et validée par les pairs avant
sa mise en page par la revue
postprint d’un C- la version en ligne de l’article après sa
article ? publication dans la revue papier
La voie verte
du libre accès
Vrai
est coûteuse Faux
pour le
chercheur
Dans la A- la diffusion et la citation des travaux du
chercheur
carrière du B- la libre exploitation des documents du
chercheur
chercheur, le C- l’accès aux savoirs
libre accès D- de répondre aux critères exigés par les
organismes de financement (nationaux et
permet européens)
Les chapitres
d’ouvrages
déposés dans
une archive Vrai
ouverte peuvent Faux
faire l’objet d’un
embargo imposé
par l’éditeur
Les articles
publiés en
libre accès Vrai
pas
rémunérés
par la revue
Qu’est-ce
qu’un A- le délai pendant lequel un éditeur n’autorise
embargo pour pas l’accès ouvert d’un article
B- l’interdiction de rémunérer les auteurs
une d’articles
C- un article dont la publication est interdite
publication
scientifique ?
Un chercheur
qui publie en
libre accès Vrai
droits
d’auteur
Comment
savoir si vous
A- vous avez toujours le droit de le faire
pouvez B- vous vérifiez sur le site SHERPA/RoMEO
accessibles
seulement aux
abonnés
Que signifie A-Directory of Open Access Books
B- Droit d’Origine pour l’Agriculture Biologique
DOAB ? C- Directory Of Accessible Business
DONNÉES DE
LA
RECHERCHE
“Enregistrements factuels (chiffres, textes, images et
sons) qui sont utilisés comme sources principales pour la
recherche scientifique et sont généralement reconnus par
la communauté scientifique comme nécessaires pour
valider des résultats de recherche.”
Les données OECD. 2007. « OECD Principles and Guidelines for Access to
Research Data from Public Funding ».
de la https://www.oecd.org/sti/inno/38500813.pdf
Source : Ancelin-Fabre, Justine. 2021. « Rédiger un plan de gestion pour ses données de recherche ».
https://urfist.chartes.psl.eu/sites/default/files/docs/20210601_ancelin-fabre_pgd.pdf
Différents types de données – 2
– Records (C. Borgman) : documents témoignant d’un phénomène ou d’une activité humaine,
uniques ou non (=> “traces” dans la traduction française)
• Ex.: fonds de photographies, documents d’archives, textes de loi, ouvrages littéraires…
– Données compilées ou dérivées : issues du traitement de données brutes souvent
reproductibles mais coûteuses
• Ex.: bases de données compilées, corpus textuel préparé pour le TDM…
– Données « de référence » : validées par la communauté, réutilisables
• Ex.: décodage du génome humain, certaines données astronomiques…
Source : Ancelin-Fabre, Justine. 2021. « Rédiger un plan de gestion pour ses données de
recherche ». https://urfist.chartes.psl.eu/sites/default/files/docs/20210601_ancelin-fabre_pgd.pdf
Quelques
exemples
Source, donnée, publication – 1
Sources : https://upload.wikimedia.org/wikipedia/commons/4/45/Regenmesser.jpg
http://hmf.enseeiht.fr/travaux/CD0001/travaux/optsee/bei/2/g2a/g21a/garde1.htm
https://hal.archives-ouvertes.fr/hal-02664009
Source, donnée, publication – 2
Source :
https://www.dariah.eu/2020/07/27/dariah-theme-2018-2019-standard-sus
tainability-improving-the-usability-of-the-text-encoding-initiative-tei/
• Données « brutes » : données tout juste
De la donnée collectées, non organisées
Europe, H2020 :
– Si pilote, DMP obligatoire pour tout projet
– Si pilote, ouverture des données si leur régime
juridique le permet
Un document synthétique qui aide à
organiser et anticiper toutes les étapes
du cycle de vie de la donnée. Il explique
Le plan de pour chaque jeu de données comment
seront gérées les données d’un projet,
gestion des depuis leur création ou collecte jusqu’à
leur partage et leur archivage.
données :
définition Source : INIST-CNRS, doranum
Sources :
– DATACC. « Gestion des données : une nouvelle exigence, de nouvelles compétences », 2020.
https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/gestion-des-donnees-une-nouvelle-exigence-de-nouvelles-compet
ences/
– Chronologie inspirée de : Smale, Nicholas, et al. « The History, Advocacy and Efficacy of Data Management Plans ». BioRxiv, octobre 2018.
www.biorxiv.org, https://doi.org/10.1101/443499
Exemple de modèle de
DMP : ANR
Modèle suivant le cycle de vie des données
Informations générales
1. Description des données et collecte ou
réutilisation des données
2. Documentation et qualité des données
3. Stockage et sauvegarde pendant le
processus de recherche
4. Exigences légales et éthiques, codes de
conduite
5. Partage des données et conservation à
long terme
6. Responsabilités et ressources en matière
de gestion de données
Exemple de modèle de
DMP : Horizon Europe
1.Résumé descriptif des données
2.Données FAIR
2.1. Rendre les données Faciles à trouver, en
incluant la mise à disposition des métadonnées
2.2. Rendre les données librement Accessibles
2.3. Rendre les données Interopérables
2.4. Accroître la Réutilisation des données (au
moyen de licences)
3. Allocation de ressources
4. Sécurité des données
5. Aspects éthiques
6. Autres
https://ec.europa.eu/info/funding-tenders/opportu
nities/portal/screen/how-to-participate/reference-d
ocuments;programCode=HORIZON
D’autres modèles de PGD
Consulter les modèles sur DMP OPIDoR
– Financements européens :
• Horizon Europe, (H2020)
• ERC
– Financeurs français :
• ANR
• INCa
– Etablissements :
• Institut Pasteur
• CEA
• INRAE
• Université de Strasbourg
– Disciplinaires (unités, consortium,
projets)
• ICM
• MASA
• PRESOFT project
• PRODIG UMR
Partager les données ? Les entrepôts de données
• Un entrepôt de données ?
• Archive en ligne permettant le dépôt, la description, la conservation, la
recherche et la diffusion de jeux de données
Le data paper : objectif
Quoi ?
– Article décrivant un jeu de données, notamment les méthodes de recueil
– Détaille les potentiels de réutilisation de données
– Les articles font l’objet d’un peer-reviewing
Comment ?
– Le PGD peut servir de trame
– Il peut être publié dans une revue académique classique, plus souvent publié dans un data
journal
Pourquoi ?
– Informer la communauté scientifique de la disponibilité de ces jeux de données et de leur
potentiel pour des utilisations futures
– Montrer l’originalité et la portée du jeu de données décrit
Le data paper, ce que
les chercheuses et les
chercheurs en disent
The data paper, 1
https://youtu.be/dl-3aYBbu7Y
The data paper, 2
https://youtu.be/kGtu1g7G6U8
The data paper, 3
https://youtu.be/GyGPMuIcmGU
Source : Reymonet, Nathalie. 2017. « Améliorer l’exposition des données de la recherche : la publication de
data papers » https://archivesic.ccsd.cnrs.fr/sic_01427978/document.
Deux exemples de data papers
– Leach TH, Winslow LA, Acker FW, Bloomfield JA, Boylen CW, Bukaveckas PA,
et al. Long-term dataset on aquatic responses to concurrent climate change
and recovery from acidification. Scientific Data [Internet]. 2018 [cité 28 mars
2019];5. Disponible sur: https://www.nature.com/articles/sdata201859
– Susini, Vanessa, Laura Caponi, Veronica Lucia Rossi, Antonio Sanesi, Nadia
Romiti, Aldo Paolicchi, et Maria Franzini. « Data about Performances of
Whole and Monovalent Half-Fragments Antibodies in Immunosorbent
Assays ». Data in Brief 35 (avril 2021): 106778.
https://doi.org/10.1016/j.dib.2021.106778.
Quelques exemples de data journals
– Biomedical Data Journal (Biomédical)
– Journal of Open Health Data (Données de santé)
– Gigascience (Sciences de la vie)
– Scientific Data (Multidisciplinaire)
– Data in Brief (Multidisciplinaire)
Voir aussi :
– CIRAD. Rédiger et publier un data paper dans une revue scientifique.
https://coop-ist.cirad.fr/gerer-des-donnees/rediger-un-data-paper/1-qu-est-ce-qu-un-data-
paper
– DORANUM. Data papers et data journals : fiche synthétique.
https://doranum.fr/data-paper-data-journal/fiche-synthetique/
Et le cahier de labo ?
– Le cahier de labo est mentionné dans la plupart des modèles de PGD, dont
celui de l’ANR.
– Il n’est pas à partager, mais doit rester accessible.
– Pas forcément exploitable pour reproduire les résultats (documenter pour
soi vs rendre reproductible)
– A conserver !
• AAF. 2012. « Référentiel de gestion des archives de la recherche »
https://www.archivistes.org/IMG/pdf/referentiel_recherche_intro_septe
mbre2012_corrige_.pdf
D’autres formats de
cahiers
– Carnets de terrain, etc.
– Souvent considérés comme des documents
personnels, rédigés pour soi, qui ne sont pas
à partager
– Cahiers computationnels : exemple des
Jupyter notebooks, notes et code exécutable,
parfois partagés
4 libertés :
- modification
- diffusion
- étude du code source
- utilisation
Codes et logiciels
Le logiciel joue dans la recherche un triple rôle :
1. il sert d’outil dans de nombreux domaines, en traitant efficacement divers types de données
pour construire et tester des modèles visant à étayer ou invalider des hypothèses ;
2. il peut constituer en lui-même un résultat de recherche, en tant que preuve d’existence d’une
solution algorithmique efficace à un problème donné, cette efficacité étant évaluée à l’aune des
capacités des ordinateurs du moment ;
3. il peut être lui-même objet de recherche. En particulier, la communauté scientifique s’intéresse
aux modes de développement des logiciels et à la preuve de leurs propriétés, en lien notamment
avec les enjeux sociétaux liés à la transparence et à la confiance dans les traitements informatisés.
– Archives :
• Software Heritage
– Finalité : garantir une conservation et un accès pérennes
– Enjeux : garantir l’accès et la possibilité d’utiliser des
codes et des logiciels de manière pérenne
– Constituer un patrimoine informatique
Software Heritage
– Une initiative d’INRIA
– Portée par Roberto Di Cosmo
– Trois principaux objectifs pour
les codes sources :
• Collecter,
• Préserver à long terme
• Partager
Voir :
https://doc.archives-ouvertes.fr/deposer/deposer-le-code-sour
ce/
Une fois le code archivé, il peut être cité finement
:
Problèmes :
- on a l’article, mais pas les données
- on n’a pas les codes
Bracco, Laetitia, Mathilde Barthe, Stéphanie Cheviron, Agnès Faller, Madeleine Hubert, Sylvie Steffan, Noël Thiboud, et Jean-Baptiste Vu Van.
« Former les professionnels de l’information et de la documentation aux données de la recherche en 45 minutes ». 9 septembre 2020.
https://doi.org/10.5281/zenodo.4020355.
Bracco, Laetitia, Mathilde Barthe, Stéphanie Cheviron, Agnès Faller, Madeleine Hubert, Sylvie Steffann, Noël Thiboud, et Jean-Baptiste Vu
Van. « Guide d’autoformation aux données de la recherche ». 29 juin 2020. https://doi.org/10.5281/zenodo.3920869.
Deux lectures
entrepôt est
forcément
libre de droits
Qu’est-ce A- un magasin où l’on entrepose des objets à
qu’un donner
B- une infrastructure pour stocker, rechercher et
entrepôt de accéder aux données numériques
C- un disque dur externe pour stocker des fichiers
données ?
Il n’y a pas
encore de
Vrai
règles pour Faux
citer un jeu de
données
Le DOI
identifie
uniquement
les Vrai
publications Faux
et les jeux de
données
numériques
Quels sont les
formats à A- des formats que suis sur·e de réutiliser
privilégier B- des formats non-propriétaires
C- des formats ouverts
pour le D- des formats si possible communément
partagés par la communauté
partage de
données ?
A- une licence qui n’engage à rien
Qu’est-ce que B- une licence qui permet de placer son œuvre au
plus près du domaine public
la licence C- une licence qui permet d’abandonner tous ses
droits d’auteur (dans la limite de ceux exigés par
CC0 ? la loi)
D- cette licence n’existe pas
Quelle licence
est
A- CC BY-ND-NC-SA
déconseillée B- ODbL
pour une base C- PDDL
D- LO
de données
ouverte ?
Quels sont les A- crypter ses informations pour être seul à les
avantages comprendre
B - faire plaisir aux services administratifs
d’un plan de C- synthétiser la description et l’évolution des
jeux de données de votre projet de recherche
gestion des D- gérer les données utilisées et générées dans le
cadre de son activité ou projet de recherche
données ?
Quand faut-il
commencer la
rédaction d’un A- quand on veut
B- dès le début du projet
plan de C- au moment de publier son article
D- quand toutes les données sont collectées ou
gestion des produites
données
(PGD) ?
A- un ensemble de données à traiter
Que signifient B- des données faciles à trouver, accessibles,
interopérables et réutilisables
« FAIR » ? C- des données exactes, non falsifiées et
compréhensibles
Qu’est-ce A- une collection de données recueillies pendant un
jeu
qu’un jeu de B- un ensemble de données dédiées au jeu
Creative
Commons ?
Faut-il
déposer ses
données dans A- jamais
un entrepôt B- toujours
C- pas toujours
pour pouvoir
publier un
Data paper ?
Pourquoi
déposer vos A- pour les conserver dans un environnement
réfrigéré
jeux de B- pour les cacher avec d’autres données
C- pour les faire connaitre et faciliter leur
données dans réutilisation
un entrepôt ?
Que permet A- conserver le document à long terme
l’archivage B- le rendre accessible à long terme
C- permettre sa réutilisation
pérenne ?
Dans le cadre
d’un projet, il
faut
s’accorder sur Vrai
les règles de Faux
gestion et de
partage des
données
Pourquoi est-il
important de
décrire vos A- pour gagner le grand prix de l’excellence
données scientifique
B- pour vous rappeler ce que vous avez déposé
quand vous C- pour faciliter la réutilisation de vos données
les déposez par d’autres chercheurs
dans un
entrepôt ?
Qu’est-ce que A- la règle de répartition des bénéfices entre
l’éditeur, l’imprimeur et l’auteur
la règle du 3- B- la règle qui permet de trier les entrepôts de
données fiables
2-1 ? C- la règle de sécurisation physique des données
Je dépose
mes données
à plusieurs
endroits, je Vrai
suis mieux Faux
référencé·e et
davantage
cité·e
Convention de
nommage ?
L’essentiel est
que je m’y Vrai
retrouve dans Faux
le nommage
de mes
fichiers…
Dans le cas d’un
projet avec de
multiples A- il est conseillé de rédiger un seul DMP pour
partenaires et l’ensemble du projet
B- il est conseillé de rédiger un DMP par
des données très partenaire
diverses, C- il est conseillé de rédiger un DMP par type de
comment données
procéder pour
rédiger le DMP ?
QUELQUES
POINTS
JURIDIQUES
Droit d’auteur, rappel
– Droits moraux : droit de paternité, droit de divulgation, droit au respect de
l’intégrité de l’œuvre, droit de retrait/repentir. Inaliénable et perpétuel
– Droits patrimoniaux : droit de reproduction (fixation sur un support) et droit
de représentation (communication au public). Cessible et limité dans le
temps (70 ans après la mort de l’auteur)
Qu’est-ce qui est protégé par le droit d’auteur ?
– « Œuvres » même sans caractère artistique, si elles présentent un degré minimal
d’« originalité »: textes, discours, photos, vidéos, musique, cartes, sculptures…
– Code informatique, mais les droits appartiennent à l’établissement
– Marques, dessins, modèles
– Brevets, éléments brevetés
– Droits des bases de données
“La politique de science ouverte, qui promeut la diffusion libre des publications et, autant que
possible, des données de la recherche, est un des leviers de cette refondation de la place des
chercheurs dans la société. Elle saisit toutes les opportunités offertes par le numérique pour libérer le
potentiel scientifique, économique, politique et culturel de la recherche et elle permet l’accès de tous
- citoyens, étudiants, associations, entreprises, etc. - aux savoirs issus de la recherche. Le plan national
de science ouverte porté par le ministère de l’enseignement supérieur, de la recherche et de
l’innovation avec les établissements de l’ESRI, appuyé sur le fonds national de la science ouverte lancé
en 2019, a donné une impulsion dont les premiers effets sont déjà bien visibles ; il sera poursuivi,
amplifié et complété par une politique de soutien à l’édition car la vitalité de l’édition scientifique est
une des conditions de la vitalité de la recherche. Par ailleurs, des travaux seront engagés pour faciliter
l’accès à certaines données détenues par des personnes morales de droit privé qui pourraient être
d’intérêt pour l’ensemble de la recherche publique et qui seraient ainsi considérées comme des données
d’intérêt général.”
Loi pour une République numérique
Article 30, codifié dans le Code de recherche, articleL533-4 https://www.legifrance.gouv.fr/codes/article_lc/LEGIARTI000033205794/
I.-Lorsqu’un écrit scientifique issu d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités
territoriales ou des établissements publics, par des subventions d’agences de financement nationales ou par des fonds de l’Union européenne est
publié dans un périodique paraissant au moins une fois par an, son auteur dispose, même après avoir accordé des droits exclusifs à un éditeur,
du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, sous réserve de l’accord des éventuels coauteurs, la
version finale de son manuscrit acceptée pour publication, dès lors que l’éditeur met lui-même celle-ci gratuitement à disposition par voie
numérique ou, à défaut, à l’expiration d’un délai courant à compter de la date de la première publication. Ce délai est au maximum de six mois
pour une publication dans le domaine des sciences, de la technique et de la médecine et de douze mois dans celui des sciences humaines et
sociales. La version mise à disposition en application du premier alinéa ne peut faire l’objet d’une exploitation dans le cadre d’une activité
d’édition à caractère commercial.
II.-Dès lors que les données issues d’une activité de recherche financée au moins pour moitié par des dotations de l’Etat, des collectivités
territoriales, des établissements publics, des subventions d’agences de financement nationales ou par des fonds de l’Union européenne ne sont
pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques par le chercheur, l’établissement
ou l’organisme de recherche, leur réutilisation est libre.
III.-L’éditeur d’un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre
de sa publication.
IV.-Les dispositions du présent article sont d’ordre public et toute clause contraire à celles-ci est réputée non écrite.
Un droit, pas une obligation
– La LPRN donne des droits aux chercheurs, mais ne les oblige en rien
– Les obligations sont souvent contractuelles dans le cadre des financements
– Contrairement aux autres agents de la fonction publique, les chercheurs
conservent leurs droits d’exploitation (droit de représentation et de
reproduction)
– Certaines universités ont voté une obligation de dépôt dans HAL, comme à
Nantes : contentieux en cours (cf. rapport OPECST), à suivre…
Cadre d’ouverture des données
✅ Open data : principe de communication et de réutilisation libre et gratuite
– En Europe : Directive PSI
– En France :
• Lois CADA, Valter et loi pour une République numérique
• Code des relations entre le public et l’administration
En pratique, tout dépend du type de données :
✅ Communication obligatoire
• Directive INSPIRE : géographie
• Convention d’Aarhus : environnement
Cadre d’ouverture des données
🔴 Communication interdite des données portant atteinte :
– A la défense et la politique étrangère de la France, aux délibérations du gouvernement, au
pouvoir exécutif
– A la sûreté de l’État, la sécurité publique, à la sécurité des personnes , à la sécurité des
biens de l’établissement et de ses systèmes d’informations
– Au secret professionnel (médical, etc.)
– Au secret industriel et commercial
🔶 Communication possible sous conditions de données :
– Protégées par le droit d’auteur ou autres droits de propriété intellectuelle
– Relatives à des personnes privées (données personnelles, vie privée)
– Soumises au secret statistique
– Liées à un contrat avec un tiers non soumis à une obligation de service public
– Présentant des risques pour la protection du potentiel scientifique et technique de la nation
(« unité protégée » ou « Zone à régime restrictif »)
Licences ouvertes
– Œuvres :
• Creative Commons
• Licence ouverte française,
dite Etalab
– Logiciels et bases de données
• Bases de données :
Licences de l’Open Knowled
ge Foundation
, PDDL, ODC-By, ODC-ODbL
• Logiciels : licences GNU
– Un outil pour trouver une
licence publique :
https://ufal.github.io/public-
license-selector/
Source : FOSTER. Introduction to RDM concepts and tools / S. Venkataraman. 2018.
https://www.fosteropenscience.eu/node/2514
Décret intégrité scientifique
– Intégrité scientifique : “ensemble des règles et valeurs qui doivent régir les activités
de recherche pour en garantir le caractère honnête et scientifiquement rigoureux.”
– Article 2 : les établissements “promeuvent la diffusion des publications en accès
ouvert et la mise à disposition des méthodes et protocoles, des données et des
codes sources associés aux résultats de la recherche afin d’en garantir la traçabilité
et la reproductibilité. Ils incitent à la publication des résultats de recherche dits
négatifs.”
– Article 6 : “ils veillent à la mise en œuvre par leur personnel de plans de gestion de
données et contribuent aux infrastructures qui permettent la conservation, la
communication et la réutilisation des données et des codes sources.”
https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000044411360
Texte and data mining
– Enfin un cadre juridique !
– Ordonnance en novembre 2021
https://www.legifrance.gouv.fr/jorf/id/JORFT
EXT000044362034
Par exemple : un nom, une photo, une empreinte, une adresse postale, une adresse mail, un numéro de
téléphone, un numéro de sécurité sociale, un matricule interne, une adresse IP, un identifiant de connexion
informatique, un enregistrement vocal, etc.
Peu importe que ces informations soient confidentielles ou publiques.
A noter : pour que ces données ne soient plus considérées comme personnelles, elles doivent être rendues
anonymes de manière à rendre impossible toute identification de la personne concernée : noms masqués,
visages floutés, etc.
Attention : s’il est possible par recoupement de plusieurs informations (âge, sexe, ville, diplôme, etc.) ou par
l’utilisation de moyens techniques divers, d’identifier une personne, les données sont toujours considérées
comme personnelles.
Gestion du risque : identifier les personnes qui vont vous aider à gérer les données sensibles
– Protection renforcée
• Autorisation d’accès
• Sécurité renforcée du stockage des données
– Diffusion des données
• Anonymisation réversible ou irréversible
• Pseudonymisation
• Limitation de la réutilisation à certains usages
• Demande d’autorisation d’accès
Source : Puren, Marie. 2021. « Créer son plan de gestion des données ». École thématique. Lille, France: MESH,
Lille. https://hal.archives-ouvertes.fr/hal-03183724
Le RGPD : bases légales
Il est permis de traiter des données personnelles lorsque le traitement repose sur une des 6 bases légales
mentionnées à l’article 6 du RGPD :
Source : CNIL. « La licéité du traitement : l’essentiel sur les bases légales prévues par le RGPD ». Consulté le 3
octobre 2021. https://www.cnil.fr/fr/les-bases-legales/liceite-essentiel-sur-les-bases-legales
Principes du RGPD
Les 5 grands principes des règles de protection des données personnelles sont les suivants :
– Le principe de finalité : le responsable d’un fichier ne peut enregistrer et utiliser des informations sur
des personnes physiques que dans un but bien précis, légal et légitime ;
– Le principe de proportionnalité et de pertinence : les informations enregistrées doivent être
pertinentes et strictement nécessaires au regard de la finalité du fichier ;
– Le principe d’une durée de conservation limitée : il n’est pas possible de conserver des informations
sur des personnes physiques dans un fichier pour une durée indéfinie. Une durée de conservation
précise doit être fixée, en fonction du type d’information enregistrée et de la finalité du fichier ;
– Le principe de sécurité et de confidentialité : le responsable du fichier doit garantir la sécurité et la
confidentialité des informations qu’il détient. Il doit en particulier veiller à ce que seules les personnes
autorisées aient accès à ces informations ;
– Les droits des personnes
Source : CNIL. « Quels sont les grands principes des règles de protection des données personnelles ? ».
Consulté le 3 octobre 2021.
https://www.cnil.fr/fr/cnil-direct/question/quels-sont-les-grands-principes-des-regles-de-protection-des-donn
ees
– Université Paris Lumières. 2019. « Fiches pratiques
sur le Règlement Général pour la Protection des
Données ».
https://www.parisnanterre.fr/dpd-guide-rgpd-94329
5.kjsp?RH=1557908685504
– Sciences humaines
Guides sur le • InSHS. 2021. « Les sciences humaines et sociales
et la protection des données à caractère
– Santé
• CNIL. 2018. « Recherche médicale : quel est le
cadre légal ? » 2018.
https://www.cnil.fr/en/node/24981
Certains éditeurs scientifiques se présentent aujourd’hui comme éditeurs
scientifiques et revendent les données d’usage dans les pays où la législation le
permet
Source : Ehlers et al (2018). Attribution : Ralf Schmitzer, Noun Projet, CC BY, à l’exception des icônes d’animation, UNESCO-
UNEVOC/Hayoung Park, CC0. https://unesdoc.unesco.org/ark:/48223/pf0000373887/PDF/373887fre.pdf.multi
En France, le portail CEL du CCSD
https://cel.archives-ouvertes.fr/
Un rapport sur les REL
Proudman, Vanessa, Gema Santos-Hermosa,
Jen Smith, et Victoria Ficarra. « Open
Education in European Libraries of Higher
Education ». Zenodo, 24 juin 2020.
https://doi.org/10.5281/zenodo.3903175; ht
tps://web.archive.org/web/20220702095634
/https://zenodo.org/record/3903175
.
ACTIVITÉ 4 –
CAS PRATIQUES
Protéger la vie Un petit exercice éloquent
https://cpg.doc.ic.ac.uk/observatory/explore
privée
Cas pratiques
Une chercheuse vous dit que ses données sont à elle
Un chercheur vous dit qu'il publie avec des collègues étrangers chez un éditeur non-européen et que
vous irez en prison si vous l'incitez à déposer dans HAL
Une chercheuse travaille sur la prostitution chez les mineures, quid du RGPD ?
Un chercheur a une collection de photos personnelles d'images de sceaux pris dans divers musées mais
ne veut pas les prêter à des collègues
Une chercheuse reçoit une demande via la CADA pour ouvrir ses données et ne veut pas le faire
Un chercheur vous dit qu’il comprend qu’il doit partager ses données, mais qu’il a encore deux
publications d’article issues du même jeu de données
– Une loi européenne contraignant les
principaux navigateurs à se mettre en
conformité sur l’utilisation des données
personnelles.
Qu’est-ce que – Un règlement européen sur le partage des
données au sein des entreprises.
le RGPD ? – Un règlement de l’Union européenne qui
vise à harmoniser la gouvernance des
informations personnelles, notamment en
termes de sécurisation et de protection des
données personnelles.
Source https://blog.atinternet.com/fr/rgpd-quiz-15-questions-pour-tester-vos-connaissances/
– Les organisations doivent mettre en place
des mesures techniques et
organisationnelles pour assurer
continuellement une protection optimale
des données et être en mesure de la
démontrer en documentant leur
Qu’exige le conformité.
– Les organisations doivent conserver les
RGPD ? données des internautes européens
pendant 5 ans minimum.
– Les entreprises doivent partager, par souci
de transparence, toutes les données des
utilisateurs avec les institutions
européennes.
Comment le – Il s’agit de toute information relative à une
RGPD définit-il personne physique susceptible d’être
identifiée ou identifiable.
les « données – Il s’agit de vos coordonnées bancaires et/ou
votre adresse postale.
à caractère – Il s’agit de vos adresses IP et de toutes vos
informations en ligne personnelles.
personnel » ?
Qu’est-ce que le RGPD considère
comme un consentement licite ?
RGPD ?
Parmi les données
analytics
collectées, quelles
– Adresses IP, cookies, nom du site consulté
catégories de et heure de consultation de la page.
données sont – Cookies uniquement.
considérées – Adresses IP uniquement
comme étant à «
caractère
personnel » ?
À quoi – Data Protection Officer, Délégué à la
protection des données.
correspond – Data Positioning Officer, Agent de
positionnement des données.
l’acronyme – Data Preservation Officer, Délégué à la
DPO ? préservation des données.
L’une des
obligations du
– La liste de tous les sous-traitants impliqués
RGPD est de dans l’opération de traitement.
tenir des – Les finalités du traitement, une description
registres des des catégories de personnes concernées et
des catégories de données à caractère
activités de personnel.
traitement. Que – Le volume de données traitées.
doit contenir ce
document ?
– Une approche visant à intégrer la
protection de la vie privée dès les
spécifications de conception et
Qu’est-ce que d’architecture des nouveaux systèmes et
processus.
le privacy-by- – Un principe visant à protéger le partage des
design ? données au sein des entreprises.
– Une méthodologie de documentation de
toutes les actions de mise en conformité
initiées par les responsables de traitement.
Le(s)quel(s)
de ces
A- la photo d’une personne de dos
éléments B - la photo d’une personne de profil
C- un souvenir conservé depuis l’enfance
correspond à D- un numéro de portable
une donnée
personnelle ?
Puis-je utiliser une photographie issue
de Google image où aucun individu
n’apparaît ?
Vrai
Faux
CONCLUSION
Structures de la science ouverte en France
– Un coordinateur national de la science ouverte au MESR : Marin Dacos
– Une Administratrice ministérielle des données, des algortithmes et des codes (AMDAC) : Isabelle Blanc
– SPSO
• Secrétariat permanent pour la science ouverte
• prépare les travaux du comité de pilotage et veille à la mise en œuvre de ses décisions.
• coordonne l’action des collèges du Comité pour la science ouverte
– CoSO
• prend les arbitrages concernant les aspects les plus stratégiques de la politique nationale de science
ouverte
• mise en oeuvre du plan national pour la science ouverte
• se constitue en Conseil des partenaires du groupement d’intérêt scientifique Fonds national pour la
science ouverte (GIS FNSO) pour décider des appels et initiatives financés
– Collèges et groupes d’expertise du CoSO : avis et orientations d’experts
– FNSO : instrument financier du PNSO
– SPSIN : secrétariat Permanent du CoSIN
– CoSIN
• Comité pour les Services et Infrastructures Numériques
• Collège EOSC
Vers une ouverture
massive des résultats
de la recherche
– Inventaire non exhaustif :
articles, données, codes et
logiciels, mais aussi pré-
enregistrements, rapports
enregistrés, cahiers numériques,
protocoles d’études, protocoles
de recherche, carnets de
recherche
– Ressources éducatives libres
Recommandation de l’Unesco pour la science
ouverte, 2021
Sept domaines principaux pour les états membres :
1. la promotion d’une compréhension commune de la science ouverte et des avantages et des défis
qui y sont associés, ainsi que des approches variées de la science ouverte ;
2. le développement d’un environnement politique favorable à la science ouverte ;
3. l’investissement dans les infrastructures et les services qui contribuent à la science ouverte ;
4. l’investissement dans la formation, l’éducation, la culture numérique et le renforcement des
capacités, afin de permettre aux chercheurs et aux autres parties prenantes de participer à la science
ouverte ;
5. la promotion d’une culture de la science ouverte et l’harmonisation des incitations à la science
ouverte ;
6. la promotion d’approches innovantes de la science ouverte à différentes étapes du processus
scientifique ;
7. la promotion de la coopération internationale et multipartite dans le contexte de la science
ouverte en vue de réduire les écarts numériques, technologiques et de savoir
https://fr.unesco.org/news/lunesco-etablit-normes-internationales-ambitieuses-science-ouverte
Un défi pour demain, changer l’évaluation
– Depuis DORA, en 2012, peu d’évolutions notables, malgré la signature de
nombreux établissements
– Appel de Paris sur l’évaluation de la recherche
https://osec2022.eu/fr/appel-de-paris/
– Une nécessaire adaptation de l’évaluation : conclusions du conseil de l’UE en
juin 2022, “Research assessment and implementation of Open Science”
https://www.consilium.europa.eu/media/56958/st10126-en22.pdf
DES
QUESTIONS ?
Merci de votre attention !
Contact :
cecile.arenes@sorbonne-universite.fr et
@carenes