Vous êtes sur la page 1sur 55

Introduction à

l’Archivage électronique
Présenté dans le cadre du cours d’Archivistique de P.-A. TALLIER
27/10/2017

Sébastien SOYEZ, Archiviste-Chef de travaux


Service DIGI-P@T (Préservation & Accès numériques)
Archives générales du Royaume
-
PLAN
 Notions fondamentales
 Enjeux juridiques
 Aspects organisationnels
 Défis techniques
 Plan stratégique de préservation numérique
 Synthèse
 Q&R
NOTIONS
FONDAMENTALES
Archivage électronique ?

 L’archivage électronique c’est archiver


 des données / de l’information numérique
= des objets numériques
 de manière pérenne,
 afin d’assurer leur intégrité, authenticité, lisibilité dans le temps
Archivage électronique ?

 Modèle hiérarchique de l’information


 Données Sagesse

- Faits, observations, éléments bruts


- Peu de signification (si pas traitées) Connaissances

 Informations
- Données interprétées, porteuses de sens, contextualisées Informations
- Qui ? quoi ? quand ? où ?
 Connaissances Données
- Informations comprises / assimilées
- Pourquoi ? comment ?
 Sagesse
- Stade ultime de l’évolution cognitive
- L’archivage électronique c’est archiver
Archivage électronique ?

 De l’information numérique, c’est :


 Un contenu
 Enregistré sur un support
 Présenté sous une certaine forme

Support Contenu

Forme
Archivage électronique ?

 De l’information numérique, c’est :


 Un contenu
- des Bits & Bytes
Unité de mesure = byte ou octet (1 byte = 8 bits)
(bits = quantité de données)
Archivage électronique ?

 De l’information numérique, c’est :


 Un contenu
 Enregistré sur un support
- Magnétiques (Disques, Disquettes, Bandes)
- Optiques (CD, DVD, Blu-Ray)
- Semi-conducteurs (Clés USB, Cartes mémoires)
Archivage électronique ?

 De l’information numérique, c’est :


 Un contenu
 Enregistré sur un support
 Présenté sous une certaine forme
- Documents bureautiques, Images, Sons, Vidéos, Données scientifiques, Documents
multimédia, …
Archivage électronique ?

Source : Chabin, 2006


Source : Novarchive, 2016
Archivage électronique ?

 Conserver de l’information numérique


n’est pas qu’un problème technique,
c’est avant tout un problème transversal
Organisationnel

Juridique Technique
Archivage électronique ?

 Juridique
 Cadre légal : Archives & Connexe

 Organisationnel
 Normes & Standards

 Technique
 Supports, Formats, Métadonnées

 à mettre en œuvre à l’aide d’une stratégie globale


ENJEUX JURIDIQUES
Cadre légal générique

 Loi sur les Archives (fédéral + entités fédérées)


 Loi qui encadre l’archivage électronique globalement

 Loi sur les services de confiance (21/07/2016)


 Plus spécifique en matière d’archivage électronique, de signature/cachet/horodatage électronique,
+ valeur probante copie numérique

 Mise en œuvre du règlement européen e-IDAS


 = DIGITAL ACT (Livre XII « Economie électronique », < Code de Droit économique)
http://arch.arch.be/index.php?l=fr&m=actualites&r=toutes-les-actualites&a=2016-10-27-digital-act-une-avancee-belge-dans-le-domaine-de-l-archivage-electronique

 Projet de plateforme fédérale d’archivage électronique = « Archiving-as-a-Service – AaaS »


 Un des services du catalogue G-Cloud (< août 2017)
(https://www.gcloud.belgium.be/fr/index.html)
Cadre légal générique

 Loi sur les services de confiance (21/07/2016) = « DIGITAL ACT »


 Introduction d’un « service de confiance d’archivage électronique »
 Comprend deux volets :
 Numérisation de documents papier
ET/OU
 Conservation numérique
 Prévoit deux niveaux :
 Non qualifié = en conformité avec les exigences légales mais non certifié
 Qualifié = en conformité avec les exigences ET certifié sur base d’un audit
Cadre légal connexe

 Législation « Publicité de l’administration »


 Réf. sur le site internet des Archives de l’Etat
 < directive européenne du Public Sector Information – PSI -Directive 2003/98/EC : ”Since 2013
content held by museums, libraries and archives falls within the scope of application as
well” .
 + cadre européen de l’Open-Data
Cadre légal connexe

 Législation « Vie privée »


 Réf. sur le site internet des Archives de l’Etat
 Libertés fondamentales versus surveillance des communications électroniques, contrôle et rétention
de l’information
 !!! Nouveau règlement européen GDPR (entrée en vigueur en mai 2018)
Cadre légal connexe

 Législation « Confidentialité »
 Réf. sur le site internet des Archives de l’Etat
 Sécurité des données, Criminalité informatique, Secret
Cadre légal connexe

 Législation « Droit d’auteur »


 Réf. sur le site du SPF Economie (étude avec le CRIDS/UNamur)
 Susceptible de concerner une œuvre protégée

 + d’autres législations spécifiques


 Sectorielles, Droit des contrats, Marchés publics, …
ASPECTS
ORGANISATIONNELS
Normes & Standards

 Pourquoi utiliser des normes / des standards?


 Obligation légale?
 Automatiser et normaliser des processus
 Faciliter l’interopérabilité
 Aider dans la préparation d’un cahier des charges
Normes en
présence Normes managériales Normes conceptuelles et organisationnelles
Reference
Producer-
Archive
Model for an Interface
Open Archival Methodology
Information Abstract
System (OAIS) Standard
15489 30300 14721 20652 (PAIMAS)

Normes fonctionnelles

16175 NF Z 42 013 14641-1

Normes & Standards techniques / metadata

NF Z 44 022
MEDONA (ex-SEDA) …
23081

15836 ISAD-G, ISAAR-CPF, ISDIAH… EAD, EAC, EAG…


Paysage normatif

RM

SAE

Source : Chabin, 2012


Les 2 normes essentielles

 « Record Management »
 ISO 15489 - Information et Documentation – Records Management (< méthodologie pour mise en
œuvre)
 + MoReq = Modular Requirements for Records Systems

 « Conservation électronique »
 ISO14721 (OAIS) - Open Archival Information System
= guide orientant la réflexion (modèle fonctionnel) et ce qu’il faut faire pour préserver des
données/informations numériques, mais pas comment
RM versus SAE

 Distinction courante entre « Record Management » et « Conservation électronique »


 Distinction intéressante mais fonctionnellement peu pertinentes : les systèmes sont quasi similaires
 Même dans un système de Record Management, des données doivent être conservées plus de 10 ans
de manière intègre, lisible et intelligible
 Distinction tenant plus aux rédacteurs et cercles gravitant autour des normes
RM versus SAE

SMURF

Source : Lappin, 2011


PRESERVATION PLANNING

DATA MANAGEMENT

PRODUCER INGEST ACCESS CONSUMER

DIP
STORAGE

SIP = Submission Information Package


AIP = Archival Information Package
Source :
DIP = Diffusion Information Package
www.digitalbevaring.dk
Schéma fonctionnel OAIS

 Notion de « paquet d’informations »


 Création d’un paquet distinct à chaque étape de manipulation au sein du système
- Versement, Description, Stockage, Communication
 Paquet = unité de base pour la préservation
- Dans OAIS, on ne parle plus de document!

DIP

Paquets à verser Paquet diffusé


Paquets archivés
Les normes & standards

 Sont à un stade de maturité


 même si certaines questions restent encore en suspens surtout d’un point de vue organisationnel

 Contribuent à améliorer la crédibilité, l’efficacité, l’efficience et la productivité des


organisations
(et la vôtre)
 si elles font l’objet d’un consensus et de l’aval de la direction
DÉFIS TECHNIQUES
Enjeux techniques

 Enjeu générique de la conservation = pourquoi conserve-t-on de l’information ?


 A court terme, l’horizon « dynamique »
= Utilité primaire de l’information
< raisons administratives, juridiques, financières

 A long terme, l’horizon « statique »


= Utilité secondaire de l’information
< raisons historiques, patrimoniales
Enjeux techniques

 Enjeu de l’indépendance des systèmes de gestion et de préservation par rapport à


l’information
 Contenant versus Contenu
 Fin de l’indissociabilité entre support d’information et son contenu avec comme enjeu
majeur
- de conserver à travers le temps tout contenu d’information
- de le garder intelligible en toute indépendance par rapport à l’appareillage technologique (logiciels,
matériels, périphériques, systèmes d’exploitation)
Enjeux techniques

 Enjeu du sens = contextualiser l’information


 Métadonnées – Classement
- Description -> métadonnées
Ex : DublinCore = 15 éléments descriptifs
-> contenu (Title, Subject, Description, Source, Language, Relation, Coverage),
-> propriété intellectuelle (Creator, Contributor, Publisher, Rights)
-> instanciation (Date, Type, Format, Identifier)

 Répercussions sur authenticité, compréhension


Risques techniques

 Risques technologiques (obsolescence)


 Supports de stockage
- Dégradation naturelle, équipements de lecture indisponibles

 Logiciels et systèmes
- Écrit numérique lisible SSI la chaîne complète qui va du support à sa restitution est compatible
- Problème : évolution différente des médias, hardware, systèmes d’exploitation et logiciel
Risques techniques

 Risques technologiques (obsolescence)


 Formats de représentation
- Absence d’une documentation descriptive complète
< lecture par un seul logiciel = formats propriétaires,
< protection engendrant perte temporaire ou définitive d’information
- Problème : corruption possible des données lors de transformation de format (migration)
- Complexité des formats composites (ex. PDF) ou cryptés : entraînant difficulté de migration ou d’émulation
voire de perte
PLAN STRATÉGIQUE DE
PRÉSERVATION NUMÉRIQUE
Plan de préservation numérique

 Stratégies de migration, de recopie et de sécurité de l’information

 Critères de choix des supports et des formats adaptés en fonction de la finalité


(gestion/préservation)
Plan de préservation numérique

 Stratégie de migration
 Veille technologique pour anticiper migrations
- Transfert -> nouveau support
- Indépendance des données (formats ouverts)

 Traduction d’un encodage en un autre


- « équivalent de traduire L’Iliade du grec ancien à l’anglais,
en passant par langues intermédiaires < 2500 ans » (J. Rothenberg)
 Coûteuse, laborieuse, susceptible d’erreur, perte d’info (forme)
- Mais seule solution actuelle praticable à large échelle
Ex. : le NARA a converti 30 millions d’e-mails < administration Clinton vers le format XML
Plan de préservation numérique

 Stratégie de recopie de l’information


 Plusieurs types de supports
- Supports de nature différente (disques + bandes)

 Dupliquer l’information
- Au minimum sur 2 sites distants
Plan de préservation numérique

 Stratégie de sécurité de l’information


 Redondance des équipements (+ alimentations électriques)
 Accès, applications, données
 Sauvegarde
 Réversibilité
Plan de préservation numérique

 Critères pour bien choisir son support de stockage (1)


 Capacité de stockage
- Besoins actuels et prévisionnels (croissance future)
 Stabilité du support
ƒ
- Quelle est sa robustesse (résistance aux agressions) et la durée de vie annoncée par le fabricant /
réelle?
 Existence d’outils de contrôle du support
ƒ
 Caractère plus ou moins répandu de la technologie
- Offre multi-constructeurs
 Technologie reposant sur des normes publiques
 Disponibilité d’équipements
- Permet de stocker et manipuler automatiquement des ensembles de supports (silos de stockage +
robotique)
Plan de préservation numérique

 Critères pour bien choisir son support de stockage (2)


 Coût du support ET des équipements de lecture et d’écriture
ƒ
- Prise en compte du coût proportionnel
 Vitesse de lecture et d’écriture et le mode d’accès
 Caractère réinscriptible ou non des supports
- Apporte certaines garanties supplémentaires par rapport à l’intégrité des données
Ex. : DVD-R versus DVD-RW ; disques ou bandes WORM
 Simplicité des opérations de recopie
 Existence de protections contre l’effacement accidentel
- Beaucoup de supports optiques et magnétiques permettent une récupération partielle des
données après effacement accidentel
- Pour certains type de supports, l’effacement est irréversible!
Ex. : les supports « semi-conducteurs »
Plan de préservation numérique
Plan de préservation numérique

 Critères pour bien choisir son format de fichier

 Identifier les formats qui vont faciliter la conservation des informations


ƒ
Convertir les formats qui poseront problème à court ou long terme
Plan de préservation numérique

 Critères pour bien choisir son format de fichier

 Ouverture et/ou large diffusion


ƒ
- Formats publiés et ouverts seront privilégiés.
formats ouverts = peuvent être lus et modifiés grâce à la documentation qui les accompagne
(les codes sources sont publiés).
- Formats propriétaires (codes sources non publiés mais largement diffusés comme TIFF) sont
parfois préférables aux formats ouverts peu utilisés.
- Plus un format est diffusé, plus il existe d’outils développés pour l’exploiter et le garder
compatible avec les formats plus récents.
- Une large diffusion d’un format n’est pas à elle seule un critère qui apporte la garantie de
pouvoir utiliser ce format sur le long terme
Plan de préservation numérique

 Critères pour bien choisir son format de fichier

 Indépendance
- Le format ne doit pas être dépendant d’autres formats ou d’un système d’exploitation
Ex. : Les plus anciens logiciels IBM ne pouvaient être exploités que par les machines de cette
marque et de cette époque.
Plan de préservation numérique
SYNTHÈSE
Stratégie, outils et responsabilités

 Schéma de la stratégie / Champ normatif


 Solution à envisager
 Comment la choisir efficacement?

 Mise en place d’un outil de gestion / de préservation


 Plan de gestion (RM)
 Plan de préservation (SAE)
 Critères de choix : supports, formats, métadonnées

 Responsabilités
 Aspects organisationnels et de contenu (RM / e-archiviste)
 Aspects techniques (Ingénieurs-systèmes, sécurité)
Stratégie, outils et responsabilités

 Mettre en place un système de gestion et de préservation, c’est œuvrer à une (bonne)


gouvernance de l’information
 Tous les gestionnaires d’information doivent être impliqués
 définir leur propre plan
 contribuer à un plan global de gestion et d’archivage
Questions & Réponses
More information and registration:
https://hectorcolloquium2017.wordpress.com/
Références
- BANAT-BERGER, F., DUPLOUY L. et HUC C., L’archivage numérique à long terme : les débuts de la maturité ?, Direction
des Archives de France (Manuels et guides pratiques), La Documentation française, Paris, 2009.
- GIRAUDON A., Fiche pratique sur le Records management, Ecole nationale supérieure des sciences de l’information et
des bibliothèques (ENSSIB), Paris, 2009.
- Records management et archivage, Guide pratique Archimag, Paris, 2005.
- SAFFADY W., Records and information management. Fundamentals of Professional Practice, ARMA International,
2004.
- DEMOULIN M. et SOYEZ S., L'archivage électronique dans le secteur public : entre archivage légal et archivage
patrimonial. In L'archivage électronique et le droit, ss. la dir. de DEMOULIN M., 37-54. Bruxelles, éd. Larcier, 2012.
- HULSTAERT A., Archivage : Aperçu du paysage normatif, Smals, Section Recherches, avril 2013 :
http://www.smalsresearch.be/archivage-normes-et-referentiels-explications
- LAPPIN J., Why a link between MoReq2010 and the OAIS model would benefit both records managers and archivists,
Thinking Records, juillet 2012 : http://thinkingrecords.co.uk/2012/07/13/why-a-link-between-moreq2010-and-the-
oais-model-would-benefit-both-records-managers-and-archivists
Références (2)
- Association des professionnels de l'information et de la documentation - http://www.adbs.fr/
- Le portail français du records management (AFNOR et ADBS) –
http://www.records-management.fr
- Centre informatique national de l’enseignement supérieur : http://www.cines.fr
- International Research on Permanent Authentic Records in Electronic Systems (INTERPARES-) -
http://www.interpares.org/ & http://www.interparestrust.org/
- Archive17 - www.archive17.fr
- SerdaLAB - http://www.serdalab.com/
- Norme OAIS - http://public.ccsds.org/publications/archive/650x0m2.pdf

- www.docsafe.be
- www.arch.be
Sébastien SOYEZ
Service DIGI-P@T (Préservation & Accès numériques)
Archives générales du Royaume

sebastien.soyez@arch.be
LinkedIn

Vous aimerez peut-être aussi