Vous êtes sur la page 1sur 103

Introduction la GED et lECM

Stefane Fermigier - Cours lEpita - 2011/10/03

Wednesday, October 5, 2011

Wednesday, October 5, 2011

This presentation contains lots of TLAs!


Wednesday, October 5, 2011

Le contexte

Wednesday, October 5, 2011

Source: Wikipedia
Wednesday, October 5, 2011

Knowledge-based Economy
"The concept that supports creation of knowledge by organizational employees and helps and encourages them to transfer and better utilize their knowledge that is in line with company/organization goals"

Source: Wikipedia
Wednesday, October 5, 2011

Knowledge-based Economy
The initial foundation for the Knowledge Economy was rst introduced in 1966 in the book The Effective Executive by Peter Drucker. In this book, Drucker described the difference between the manual worker and the knowledge worker. The manual worker, according to him, works with his hands and produces goods or services. In contrast, a knowledge worker (page 3) works with his or her head not hands, and produces ideas, knowledge, and information.
Source: Wikipedia
Wednesday, October 5, 2011

Le revers de la mdaille

Wednesday, October 5, 2011

LInfobsit

Wednesday, October 5, 2011

Quelques chiffres
50% de contenu produit chaque anne en
plus par les entreprises

1.8 zettaoctets en 2011 (10^21) En 2005, un employ perdait en moyenne


3.5 heures / semaine chercher sans succs des documents existants, et 3 heures les recrer

Wednesday, October 5, 2011

Un peu dhistoire

Wednesday, October 5, 2011

Classication de Dewey (1876)

Source: Wikipedia
Wednesday, October 5, 2011

The Filing Cabinet (1898)

Source: Wikipedia
Wednesday, October 5, 2011

Microches (1906)

Source: Wikipedia
Wednesday, October 5, 2011

La dmatrialisation (depuis 1970)


Echanges sur les places de marchs boursires Echanges entre entreprises (ex: EDI, EDIFACT) Echanges entre ltat et les administrs (ex: impts en ligne, appels doffres...) Dans bien des secteurs, on conserve une dualit papier / numrique, avec transformation de lun lautre (scan / impression)
Wednesday, October 5, 2011

Le groupware (1981)
Processus humain et organisationnel du travail en groupe et outils technologiques ncessaires laccomplissement de ce travail Concrtement: messagerie + agenda partag + dossiers partags + confrence Ex: Lotus Notes, MS Exchange, Google Apps

Wednesday, October 5, 2011

Le disque partag (1984 et 1988)


Parfois appel disque windows NFS (Sun): 1984 et SMB (Microsoft): 1988 Encore le moyen dominant de partager des documents dans les entreprises Documents classs selon le principe du plan de classement hirarchique

Wednesday, October 5, 2011

La GED (1980)
Indexation de documents stocks physiquement hors du systme informatique (bibliothques, archives physiques, microches) Numrisation sur disques optiques (COLD) Gestion de la production de documents complexes et forte valeur ajoute (pharma, arospatial...) partir de 1990 Gestion des documents de rfrence de lentreprise
Wednesday, October 5, 2011

Le Web (~1995)

Wednesday, October 5, 2011

Google (1998)

Wednesday, October 5, 2011

LECM (2000)
Apparat comme la convergence de plusieurs technologies lies au documents: GED, WCM, DAM, Demat, etc. Ide de remplacer des solutions ponctuelles de gestion du contenu ou de linformation par une infrastructure structurante

Wednesday, October 5, 2011

Le Web 2.0 (2003)

Source: Tim OReilly - http://oreilly.com/web2/archive/what-is-web-20.html


Wednesday, October 5, 2011

LEntreprise 2.0 (2006)

Source: Dion Hinchcliffe - http://www.zdnet.com/blog/hinchcliffe/the-state-of-enterprise-20/143


Wednesday, October 5, 2011

Les tablettes? (2010)

Wednesday, October 5, 2011

Contenu, document, etc.


Les dnitions fondamentales

Wednesday, October 5, 2011

La hirarchie DIKW

Wednesday, October 5, 2011

Wednesday, October 5, 2011

Information

L'information est une collection de donnes organises pour donner forme un message.

Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)


Wednesday, October 5, 2011

Contenu
Un contenu est une forme d'expression pourvue d'une valeur culturelle associe un vhicule matriel, il exprime une signication et suscite une rception et une interprtation. Ex: Une dnition donne oralement est un contenu.

Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)


Wednesday, October 5, 2011

Inscription
Une inscription est un contenu x sur un support matriel, tel qu'il lui apporte une permanence dans le temps. Ex: Une dnition crite est une inscription.

Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)


Wednesday, October 5, 2011

Document
Un document est une inscription de contenus sur un support prenne, tablie dans un contexte de production et pour un contexte de rception. Ex: un glossaire de dnitions publi sur un livret, par un enseignant pour ses tudiants est un document.
Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)
Wednesday, October 5, 2011

Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)


Wednesday, October 5, 2011

Composition dun document (texte)


Les documents lectroniques, tout comme les documents traditionnels, sont composs des quatre lments formels : un contenu (le texte brut), une structure (lorganisation logique du texte), une prsentation (la mise en page) et un contexte de cration. Un document permet de conserver et de communiquer une information.
Wednesday, October 5, 2011

GED (1980)
Le terme de GED (gestion lectronique de documents) apparat dans les annes 80. Son objectif initial est la gestion de l'archivage de documentations papiers, puis lectronique, par la gestion de mtadonnes.

Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)


Wednesday, October 5, 2011

GEIDE (1994)
Le terme de GEIDE est promu en 1994 pour ancrer la gestion des formats lectroniques et le passage la numrisation/dmatrialisation (images scannes, PDF, bureautique via RTF notamment)

Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)


Wednesday, October 5, 2011

ECM (2000)
L'ECM (Enterprise Content Management ou gestion de contenu dentreprise) regroupe les systmes informatiques permettant de grer les processus documentaires au sein d'une organisation

Source: Ingnierie documentaire, Stphane Crozat et Bruno Bachimont (CC BY-NC-SA)


Wednesday, October 5, 2011

ECM (def. alt.)


Enterprise Content Management (ECM) is a formalized means of organizing and storing an organization's documents, and other content, that relate to the organization's processes. The term encompasses strategies, methods, and tools used throughout the lifecycle of the content.

Wednesday, October 5, 2011

Les enjeux pour lentreprise

Wednesday, October 5, 2011

Types davantages concurrentiels


Efcience: faire correctement, mieux, plus vite, ce quon fait dj (baisser les prix, augmenter les marges) Rduction des risques Retour sur actifs: augmenter les gains gnrs par des resources existantes Stratgique: lancer de nouvelles offres, tablir une barrire lentre
Wednesday, October 5, 2011

Wednesday, October 5, 2011

Source: Capitalizing on Complexity - Insights from the Global CEO Study, IBM, 2010
Wednesday, October 5, 2011

Exercice
Donner une liste davantages concurrentiels que lon peut attendre de la GED ou de lECM (dans les domaines de lefcience, du retour sur actifs et de lavantage stratgique)

Wednesday, October 5, 2011

Gains de productivit

Source: IDC, 2005


Wednesday, October 5, 2011

Agilit
Il ne faut pas pour autant ger les processus au point de ne plus pouvoir rpondre au changement Les outils 2.0 ou de collaboration mergente intgrent cette dimension, tout comme le case management adaptatif

Wednesday, October 5, 2011

Meilleur service
En exploitant mieux linformation disponible dans lentreprise, et en ayant des processus de rponse mieux contrls, on amliore la qualit des rponses aux clients (ex: propositions commerciales, support, etc.)

Wednesday, October 5, 2011

In what seems a growing fog of data, CEOs have never expressed a greater need to obliterate their blind spots.Too often, they say, information based on customer interactions is trapped in organizational silos. Organizations that are able to combine, or layer, many kinds of information from different customer channelswith frequencyare best positioned to succeed.
Source: Capitalizing on Complexity - Insights from the Global CEO Study, IBM, 2010
Wednesday, October 5, 2011

Matrises des risques


Lutilisation de lECM permet de contrler les processus documentaires dans lentreprise Donc den mieux matriser les ventuels drapages (retard dans des rponses, pertes de documents, conservation de documents compromettant!)

Wednesday, October 5, 2011

Contraintes lgales
Toutes les organisation sont soumises des contraintes lgales (ex: conservation des documents comptables) ou rglementaires (ex: pharma) Legal discovery A contrario, conserver certains documents trop longtemps peut constituer un risque

Wednesday, October 5, 2011

Statut juridique du document lectronique


Aux termes de larticle 1316-1 du code civil, la reconnaissance juridique de lcrit ne dpend ni de sa forme (format), ni du support utilis, ni des modalits de transmission. Cette disposition sapplique galement pour la validit des crits lectroniques en droit civil. Pour que lcrit original soit requis titre de preuve ou titre de validit il devra, notamment, se conformer la double exigence fonctionnelle dont dispose larticle 1316-1 du code civil, savoir : limputabilit de lacte et la garantie de son intgrit.
Wednesday, October 5, 2011

Gouvernance de linformation
En entreprise, linformation est souvent isole dans des silos (un par dpartement, ou un par application informatique) Grce une approche globale de la gestion de ces actifs numriques, lECM doit permettre une meilleure circulation de linformation pertinente et donc une meilleure valorisation de celle-ci

Wednesday, October 5, 2011

Gestion des connaissances


LECM peut servir de support une dmarche de gestion des connaissances: percevoir, identier, analyser, organiser, mmoriser, et partager des connaissances entre les membres de lorganisation, en particulier les savoirs crs par l'entreprise elle-mme (ex: marketing, R&D) ou acquis de l'extrieur (ex: intelligence conomique) en vue d'atteindre l'objectif x.
Wednesday, October 5, 2011

Wednesday, October 5, 2011

LECM comme discipline fdratrice

Wednesday, October 5, 2011

Capture / Dmat (Digital Imaging)

Wednesday, October 5, 2011

Document Management (GED)


Gestion des documents de rfrence de lentreprise Archivage

Wednesday, October 5, 2011

GED Collaborative
Gestion de la production documentaire de lentreprise De la bureautique simple... ... la coordination de documents trs complexes (mythique documentation dun Airbus)

Wednesday, October 5, 2011

Web Content Management (WCM)


Gestion de sites web (besoin qui explose n des annes 90) Notion de front ofce / back ofce Plus rcemment, WEM (Web Engagement Management)

Wednesday, October 5, 2011

Digital Asset Management (DAM)


En franais: photothque / vidothque / multimdiathque March: producteurs de contenu multimdia (ex: agence dimages), services marketing (catalogue dimages de produits)

Wednesday, October 5, 2011

Enterprise Search
Techniques dindexation appliques aux contenus dentreprise (google pour lintranet) Challenges: Multiplicit des sources Htrognit des formats Droits daccs

Wednesday, October 5, 2011

Wednesday, October 5, 2011

Record Management (RM)


En franais: Systme dArchivage Electronique Archives courantes: entre la cration du document et la n de son usage courant Archives intermdiaires: entre la n de lusage courant et lchance lgale de conservation Archives dnitives: conservation dnitive des documents valeur historique, aprs lapplication dune rgle de sort nal, et la destruction des documents sans valeur historique

Wednesday, October 5, 2011

Case Management
Gestion de dossiers complexes impliquant plusieurs documents et plusieurs acteurs Ex: gestion des dossiers de sinistres (assurance), gestion de courrier pour les administrations, gestion de cas cliniques ou sociaux

Wednesday, October 5, 2011

Collaboration mergente
Wiki dentreprises Rseaux sociaux dentreprises

Wednesday, October 5, 2011

CEVAs
CEVA = Content Enabled Vertical Applications Applications mtiers centres sur le contenu

Wednesday, October 5, 2011

Les grands types de documents

Wednesday, October 5, 2011

Quelques tentatives de classcations


Persuasif Transactionnel Mtier Ofciel ou legal Contractuel De savoir De gestion interne

Source: Forrester Research (2005)


Wednesday, October 5, 2011

Source: Aproged (2005)

Source: Forrester Research (2005)


Wednesday, October 5, 2011

Wednesday, October 5, 2011

Le cycle de vie du document

Wednesday, October 5, 2011

Quatres grandes tapes


Cration Gestion Diffusion Conservation

Wednesday, October 5, 2011

Wednesday, October 5, 2011

Wednesday, October 5, 2011

Wednesday, October 5, 2011

Wednesday, October 5, 2011

Les grandes fonctions de lECM

Wednesday, October 5, 2011

Wednesday, October 5, 2011

Capturer
Numrisation / dmatrialisation de documents entrants (conversion analogique / digitale) Production de contenu depuis des applications bureautique Production de contenu depuis des applications mtiers (formulaires)

Wednesday, October 5, 2011

Trater
Compression OCR (Optical Character Recognition) RAD (Reconnaissance automatique de documents) LAD (Lecture Automatique de documents) Extraction de mtadonnes Analyse smantique

Wednesday, October 5, 2011

Stocker
Le stockage sur disque optique nest pratiquement plus utilis Utilisations de serveurs ou de baies de stockage (NAS et SAN) Dbut dutilisation du stockage dans le cloud

Wednesday, October 5, 2011

Exercice
Combien de documents peut-on stocker dans 1 petaoctets de disques ? Combien ca cote ? Combien de temps pour remplir lespace ? (ex: Banque francaise, AFP, Facebook, Wikipedia)

Wednesday, October 5, 2011

Source: ldlc.com
Wednesday, October 5, 2011

Source: ldlc.com
Wednesday, October 5, 2011

Source: backblaze.com (2009)


Wednesday, October 5, 2011

Wednesday, October 5, 2011

Use cases
Banque franaise Agence France-Presse (10000 dpches / jour, 5000 images / jour) Facebook (700 millions de photos / mois n 2008) Wikipedia

Wednesday, October 5, 2011

Banque franaise
3.3 milliards de chques / an en 2009 ~500 millions pour la plus grande 100 ko par scan -> 50 traoctets / an (?)

Wednesday, October 5, 2011

Wikipedia
20 millions darticles ~3 ko / article en moyenne 40 edits / article 15 millions de binaires (images, sons, videos) Double tous les deux ans Total (naf): 1 To

Wednesday, October 5, 2011

Wikipedia
Cf. http://en.wikipedia.org/wiki/ Wikipedia:Database_download Dump XML: 7 Go compresss, 31 Go dcompress Avec lhistorique: 5 To (et en plus cass!)

Wednesday, October 5, 2011

Classer / Cataloguer
Typologie documentaire Organisation hirarchique (plan de classement / taxonomie) Mtadonnes Vocabulaire controls et thesauri vs. folksonomies (free tagging) Rseaux de relations (ontologies)

Wednesday, October 5, 2011

Mtadonnes
Donnes propos de donne Peut tre disjointe du document lui mme (ex: notice bibliographique) ou embarques dans le document (ex: fonction proposes par les outils bureautiques, mais trs peu utilise en pratique) Indispensable pour une bonne utilisation des documents

Wednesday, October 5, 2011

Droits et condentialit
Notion de principal: personne ou groupe; de rle (manager, utilisateur, invit...); et de droit (lecture, criture...) Connexion avec un SGI (ex: annuaire LDAP) Granularit variable: niveau dun dossier, niveau dun document, niveau dun champ dun document

Wednesday, October 5, 2011

Indexer / Rechercher
Extraction du texte partir de format divers Recherches plein texte ou par mtadonnes (ou mixte des deux) Recherches enregistres, recherche et navigation par facettes, par similarit Difcult technique: la gestion des droits

Wednesday, October 5, 2011

Recherche par facettes

Wednesday, October 5, 2011

Travail collaboratif
(sur les documents)
Notion despaces de travail Versionning Check-in / Check-out Transactions Commentaires Edition synchrone Timeline des utilisateurs et des espaces

Wednesday, October 5, 2011

Workow
Processus de validation de documents Ex. simple: brouillon -> en attente de validation -> publi -> obsolte Peut tre beaucoup plus complexe dans les organisation trs hirarchiques Mais besoin aussi de souplesse pour ne pas se retrouver bloqus

Wednesday, October 5, 2011

Publication
Mise disposition des documents de rfrence dans un espace de consultation (intranet, site Web) Transformation selon des feuilles de style (ex: XSLT) Agrgation (ex: catalogue partir de notices individuelles) Impression personnalise en masse (ditique)

Wednesday, October 5, 2011

Rutilisation
Ad hoc Contenu existant index envue dune rutilisation Institutionnalise Modles de documents Documents composites, dition structure

Wednesday, October 5, 2011

Gestion des archives


Intelligibilit (capacit dun document tre aisment lu et compris) Imputabilit ou authentication de lauteur Prennit (capacit garantir la permanence du support et des donnes, et leur stabilit dans la dure)

Wednesday, October 5, 2011

Gestion des archives


Intgrit (capacit garantir quun document na pas subi daltrations ou de modications) Scurit (capacit protger un document et son contenu, grer ses accs et sa diffusion) Traabilit (capacit suivre et enregistrer les modications apportes un document)

Wednesday, October 5, 2011

Signature et coffre-fort lectronique


Moyens techniques dimplmenter la nonrpudiation, et la prnit des documents archivs Souvent fournis par des tiers de conance

Wednesday, October 5, 2011

Repository ou base documentaire


Middleware entre les applications et le systme de stockage physique Service de persistence Abstraction plus proche du domaine mtier Outil technique qui simplie la cration dapplications mtiers orientes contenu (CEVAs)
Wednesday, October 5, 2011

Exercice nal
Quelle diffrence en un ECM et un systme de chiers? Un SGBDR? Quel effort pour implmenter un ECM audessus dun FS, dun SGBDR? Quelles sont les autres options?

Wednesday, October 5, 2011

Merci!
Wednesday, October 5, 2011