Vous êtes sur la page 1sur 90

GED : les meilleures

solutions open

source

WWW.SMILE.FR

Page 1

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 2

PREAMBULE

WWW.SMILE.FR

SMILE
Smile est une socit dingnieurs experts dans la mise en uvre de solutions open source et
lintgration de systmes appuys sur lopen source. Smile est membre de lAPRIL, lassociation
pour la promotion et la dfense du logiciel libre, du PLOSS le rseau des entreprises du
Logiciel Libre en Ile-de-France et du CNLL le conseil national du logiciel libre.
Smile compte prs de 700 collaborateurs dans le monde, dont plus de 500 en France (mars
2013), ce qui en fait le premier intgrateur franais et europen de solutions open source.
Depuis 2000, environ, Smile mne une action active de veille technologique qui lui permet de
dcouvrir les produits les plus prometteurs de lopen source, de les qualifier et de les valuer,
de manire proposer ses clients les produits les plus aboutis, les plus robustes et les plus
prennes.
Cette dmarche a donn lieu toute une gamme de livres blancs couvrant diffrents
domaines dapplication. La gestion de contenus (2004), les portails (2005), la business
intelligence (2006), la virtualisation (2007), la gestion lectronique de documents (2008), les
PGIs/ERPs (2008), les VPN open source (2009), les Firewall et Contrle de flux (2009), les
Middleware orients messages (2009), lecommerce et les Rseaux Sociaux d'Entreprise (2010)
et plus rcemment, le Guide de lopen source et NoSQL (2011). Chacun de ces ouvrages
prsente une slection des meilleures solutions open source dans le domaine considr, leurs
qualits respectives, ainsi que des retours dexprience oprationnels.
Au fur et mesure que des solutions open source solides gagnent de nouveaux domaines,
Smile sera prsent pour proposer ses clients den bnficier sans risque. Smile apparat dans
le paysage informatique franais comme le prestataire intgrateur de choix pour
accompagner les plus grandes entreprises dans ladoption des meilleures solutions open
source.
Ces dernires annes, Smile a galement tendu la gamme des services proposs. Depuis 2005,
un dpartement consulting accompagne nos clients, tant dans les phases davant-projet, en
recherche de solutions, quen accompagnement de projet. Depuis 2000, Smile dispose dun
studio graphique, devenu en 2007 Smile Digital agence interactive, proposant outre la
cration graphique, une expertise e-marketing, ditoriale, et interfaces riches. Smile dispose
aussi dune agence spcialise dans la TMA (support et lexploitation des applications) et dun
centre de formation complet, Smile Training. Enfin, Smile est implant Paris, Lille, Lyon,
Grenoble, Nantes, Bordeaux, Poitiers, Aix-en-provence et Montpellier. Et prsent galement
en Espagne, en Suisse, au Benelux, en Ukraine, au Maroc et en Cte dIvoire.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 3

QUELQUES REFERENCES DE
SMILE

WWW.SMILE.FR

SMILE est fier davoir contribu, au fil des annes, aux plus grandes ralisations Web franaises
et europennes. Vous trouvez ci-dessous quelques clients nous ayant adress leur confiance.

Gestion documentaire
Generali, HEC, JCDecaux, Serimax, Pierre Audoin Consultant, Alstom Power services, NetasQ,
CS informatique, SNCF - Direction du matriel, Mazars, EDF R&D, EDF Nuclaire, Conseil
Rgional du Centre, Leroy Merlin, Primagaz, Renault F1, INRIA, Ministre belge de la
Communaut Franaise, APAVE, CNIL, Services du Premier Ministre...
Sites Internet
EMI Music, Salon de lAgriculture, Mazars, Areva, Socit Gnrale, Gtes de France, Patrice
Pichet, Groupama, Eco-Emballage, CFnews, CEA, Prisma Pub, Volia, NRJ, JCDecaux,
01 Informatique, Spie, PSA, Boiron, Larousse, Dassault-Systmes, Action Contre la Faim, BNP
Paribas, Air Pays de Loire, Forum des Images, IFP, BHV, ZeMedical, Gallimard, Cheval Mag,
Afssaps, Benetaux, Carrefour, AG2R La Mondiale, Groupe Bayard, Association de la Prvention
Routire, Secours Catholique, Canson, Veolia, Bouygues Telecom, CNIL
Portails, Intranets et Systmes dInformation
HEC, Bouygues Telecom, Prisma, Veolia, Arjowiggins, INA, Primagaz, Croix Rouge, Eurosport,
Invivo, Faceo, Chteau de Versailles, Eurosport, Ipsos, VSC Technologies, Sanef, Explorimmo,
Bureau Veritas, Rgion Centre, Dassault Systmes, Fondation dAuteuil, INRA, Gaz Electricit de
Grenoble, Ville de Niort, Ministre de la Culture, PagesJaunes Annonces
E-Commerce
Krys, La Halle, Gibert Joseph, De Dietrich, Adenclassifieds, Macif, Furet du Nord, Gtes de
France, Camif Collectivit, GPdis, Projectif, ETS, Bain & Spa, Yves Rocher, Bouygues Immobilier,
Nestl, Stanhome, AVF Primdical, CCI, Pompiers de France, Commissariat lEnergie
Atomique, Snowleader, Darjeeling

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 4

ERP et Dcisionnel

WWW.SMILE.FR

Veolia, La Poste, Christian Louboutin, Eveha, SunR, Home Cin Solutions, Pub Audit, Effia,
France 24, Publicis, iCasque, Nomadvantage, Gets, Nouvelles Frontires, Anevia, Jus de Fruits
de Moora, Espace Loggia, Bureau Veritas, Skyrock, Lafarge, Cadremploi, Meilleurmobile.com,
Groupe Vinci, IEDOM (Banque de France), Carrefour, Jardiland, Trsorerie Gnrale du Maroc,
Ville de Genve, ESCP, Sofia, Faiveley Transport, INRA, Deloitte, Yves Rocher, ETS, DGAC,
Generalitat de Catalunya, Gilbert Joseph, Perouse Mdical
Infrastructure et Hbergement
Agence Nationale pour les Chques Vacances, Pierre Audoin Consultants, Rexel, Motor Presse,
OSEO, Sport24, Eco-Emballage, Institut Mutualiste Montsouris, ETS, Ionis, Osmoz, SIDEL, Atel
Hotels, Cadremploi, SETRAG, Institut Franais du Ptrole, Mutualit Franaise

Consulter nos rfrences, en ligne, ladresse : http://www.smile.fr/clients.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 5

CE LIVRE BLANC
Ce document a pour objectif de prsenter notre approche de la gestion documentaire,
notamment par rapport la gestion de contenu, et de vous apporter une aide au choix d'une
solution logicielle pour vos projets.

WWW.SMILE.FR

Pour cela, nous vous proposons une analyse des rponses apportes par une slection de
solutions open source des problmatiques concrtes, ainsi quune approche en termes de
mthodes pour vous orienter dans la mise en uvre de votre projet.
Il ne sagit ni dun rpertoire de solutions, ni dune approche thorique de la gestion de
contenu documentaire, mais bien dune confrontation entre la ralit des besoins et le march
de la GED (Gestion Electronique de Documents) open source.
Si les solutions open source rpondent trs bien de nombreux besoins, le savoir-faire
spcifiquement documentaire demeure, avant les outils, le principal enjeu des projets de
Gestion Electronique de Documents ou de Gestion de Contenus d'Entreprise (ECM).
Ainsi, cet ouvrage sefforce de runir :

une approche gnrale des notions sous-jacentes de la gestion documentaire,


fondements mthodologiques des projets de GED
une description des grandes fonctionnalits attendues pour ce type de projet et de
leurs enjeux
un recensement des principales solutions open source de gestion de contenu
documentaire
une prsentation des meilleurs outils, une valuation de leurs forces, de leurs limites,
de leur maturit

Ce livre blanc est le rsultat de retours dexpriences collectifs. Nous serions trs heureux
dchanger avec vous sur le sujet.

Nhsitez pas nous transmettre vos avis et valuations sur les produits prsents
dans ce livre blanc. Une seule adresse : contact@smile.fr

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 6

Version 1.0
Paru peu aprs que Smile se soit intress au domaine de la GED open source, notamment
avec larrive dune quipe ddie. Nous avons voulu proposer une vision de la gestion
documentaire la fois structurante et oprationnelle pour permettre tout un chacun de se
faire une opinion et disposer des atouts ncessaires la mise en place de son projet.

WWW.SMILE.FR

Version 2.0
Une mise jour importante, ralise entre octobre 2009 et janvier 2010. Mise jour des
parties mthodologiques, des retours dexprience de notre ple d'expertise et des volutions
du march.

Version 3.0
La version 2011 visait intgrer de nouveaux retours d'exprience et les nouveauts des
applications. Nous avons galement modifi la liste des applications concernes. Une tendance
en notable avec larrive du SaaS dans la GED.

Version 4.0
Nous avons modifi la liste et les pondrations des applications compares. Autre fait notable,
larrive de Jahia Wise et de solutions ou de fonction de DAM (digital asset management) sur
un march maintenant mature en open source. Nous avons galement mis en retrait plusieurs
solutions dont lvolution ou le caractre open source ne nous semble plus rpondre aux
attentes du march.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 7

LOPEN SOURCE EN
ENTREPRISE

Gestion documentaire non open source

WWW.SMILE.FR

De nombreuses solutions existent et apportent leurs lots de fonctions et de rponses aux


problmatiques de gestion documentaire.
Parmi la multitude de solutions propritaires connues dans le domaine, on peut citer
Documentum dEMC, FileNet dIBM, SharePoint de Microsoft, Open Text de la socit
ponyme, ou encore Ever.
Le march des solutions propritaires de gestion documentaire suit la mme tendance que
celui des outils de gestion de contenu Web, il y a quelques annes. Les solutions qui
demeurent sont soit sur des marchs de niches et incorporent un savoir-faire mtier
important, soit disposent dun positionnement trs haut de gamme, associ une notorit
qui leur permet de continuer trouver des clients.
Sur le fond, il faut comprendre quun diteur vocation exclusivement commerciale na pas
que des intrts convergents avec ceux de ses clients. Certes, il volue dans un march
concurrentiel, et son produit doit tre meilleur que ses concurrents, mais une fois sa position
bien assise, lditeur peut faire lanalyse suivante :

son produit doit tre ouvert, mais pas trop, pour garder la matrise du client (cest le
fameux vendor lock-in )
son produit doit tre performant, mais pas trop, car laccroissement du nombre de
serveurs rime avec laugmentation du nombre de licences vendues
son produit doit tre robuste, mais complexe, car il faut continuer vendre des
prestations de service et du support
son produit doit tre utile, mais surtout tre attractif. En effet, les dcideurs sont
parfois loigns de la ralit du terrain et un produit trs bien packag, mais peu
volutif ou ne rpondant pas de faon assez prcise aux attentes oprationnelles, peut
alors apparatre comme la meilleure alternative, alors que sa valeur ajoute sera faible
finalement.

Nous ne disons pas que les diteurs propritaires seraient machiavliques au point de rendre
leurs produits moins bons quils ne pourraient ltre, mais leurs priorits ne portent pas
exclusivement sur la valeur ajoute du produit.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 8

Le choix de lopen source


Lopen source gagne chaque anne de nouveaux domaines dapplication, dans une
extraordinaire dynamique. De nouveaux acteurs sont apparus, les diteurs open source et la
pertinence de leur business model est aujourdhui dmontre. Les offres de solution sont de
plus en plus matures, et sont de vraies alternatives aux solutions historiques, propritaires.

WWW.SMILE.FR

Voyons quels sont les critres de choix, lis au caractre open source des solutions.
Les bnfices conomiques sont parmi les premires raisons du choix de solutions open
source. Mme si implmenter une solution ne signifie jamais un cot de projet nul, ne serait-ce
quen temps de monte en comptence et dimplmentation. De nombreuses tudes
constatent que le cot total des projets open source est significativement infrieur sur la
dure. Les gains constats pouvant aller de 20 80% en fonction du degr de maturit de
lopen source dans le domaine considr.
Le cot de licence des solutions propritaires est bien entendu le premier facteur voqu : il
constitue un investissement initial important, avant mme que ladquation de la solution ne
soit prouve. Ceci est accentu par un prix de prestations qui tend tre moins lev dans le
domaine de lopen source, car louverture du produit facilite la diffusion de la connaissance.
Enfin, le cot de possession (maintenance, volution) tend galement tre moins important.
Leur volution ne dpend pas de leur rentabilit ou de considrations marketing. Tant quune
communaut sy intresse, le produit vivra.
La diffusion du savoir-faire associ leur implmentation est garantie par des barrires quasi
nulles son acquisition (tlchargement et documentation sont libres et accessibles).
La standardisation, le respect des normes et standards, et louverture sont dans les gnes des
dveloppeurs open source, qui cherchent avant tout ne pas rinventer la roue, et mettre en
uvre des solutions performantes.
La possibilit de faire des modifications dans les sources est fondamentale, sur le plan
thorique, mais risque sur le plan pratique. Ce nest donc pas en ces termes quil faut
apprcier louverture, mais plutt dans la capacit accepter des extensions ou sinterfacer
avec dautres applications.
La prennit : la libre disposition des sources est un gage fondamental de prennit. Cela
mme si il faut le souligner il nest nullement ncessaire que lentreprise cliente les
matrise.
En matire de prennit, le pire qui puisse arriver une solution open source, est une lente
dsaffection de la part des communauts, gnralement au profit dune solution plus
prometteuse. Ainsi, il est possible quil faille un jour changer de produit. Mais le phnomne
est toujours lent et les utilisateurs ont le temps dorganiser la migration.
Dans le cas dun diteur open source, il faut souligner aussi que, mme sil tait un jour
dfaillant, il reste toujours possible pour une communaut de reprendre en main le produit et
ses volutions, cest le principe des licences open source.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 9

WWW.SMILE.FR

Ainsi au fur et mesure que ces solutions arrivent maturit, le moindre cot nest plus le
premier critre de choix. Et ce sont bien les autres qualits de lopen source que nous mettons
le plus en avant.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 10

SOMMAIRE
PREAMBULE ............................................................................................... 1
SMILE................................................................................................................................................................... 2
QUELQUES REFERENCES DE SMILE .............................................................................................................................. 3
CE LIVRE BLANC ...................................................................................................................................................... 5
LOPEN SOURCE EN ENTREPRISE ................................................................................................................................. 7

WWW.SMILE.FR

SOMMAIRE ......................................................................................................................................................... 10

INTRODUCTION A LA GESTION DOCUMENTAIRE .......................................12


POURQUOI UNE SOLUTION DE GESTION DOCUMENTAIRE ? ............................................................................................ 12
PRESENTATION DES CONCEPTS ................................................................................................................................ 13
VERS LA GESTION DE CONTENU DENTREPRISE ............................................................................................................ 17
ENJEUX PRINCIPAUX DE LA GED .............................................................................................................................. 20

LES PRINCIPALES SOLUTIONS DE GESTION DOCUMENTAIRE OPEN


SOURCE .....................................................................................................25
ALFRESCO ........................................................................................................................................................... 25
NUXEO ............................................................................................................................................................... 30
KNOWLEDGE TREE ................................................................................................................................................ 34
JAHIA ................................................................................................................................................................. 36
MAARCH ............................................................................................................................................................ 39

SOLUTIONS SPECIFIQUES POUR LA GESTION DE MEDIA.............................41


AUTRES SOLUTIONS............................................................................................................................................... 42

LES FONCTIONNALITES ..............................................................................48


METADONNEES .................................................................................................................................................... 48
GESTION DES VERSIONS ......................................................................................................................................... 52
REFERENTIEL DE CLASSEMENT ................................................................................................................................. 53
MOTEUR DE RECHERCHE ........................................................................................................................................ 60
NUMERISATION.................................................................................................................................................... 63
GESTION DES DROITS ............................................................................................................................................. 65
FONCTIONS COLLABORATIVES.................................................................................................................................. 66
WORKFLOW ........................................................................................................................................................ 68
REGLES DE GESTION .............................................................................................................................................. 71
GESTION DU CYCLE DE VIE ...................................................................................................................................... 73
GESTION DES DOSSIERS .......................................................................................................................................... 77
IMPORT/EXPORT .................................................................................................................................................. 79
GESTION DES EMAILS............................................................................................................................................. 81

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 11

INTEGRATION DE LA GED ....................................................................................................................................... 82


INTEGRATION TECHNIQUE ...................................................................................................................................... 85

WWW.SMILE.FR

SYNTHESE ..................................................................................................89

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 12

INTRODUCTION A LA GESTION
DOCUMENTAIRE

WWW.SMILE.FR

POURQUOI UNE SOLUTION DE


GESTION DOCUMENTAIRE ?
La dcision de dployer une solution de GED rsulte encore souvent dune crise ou dune
tension dans la gestion de linformation ; une situation qui ncessite la mise en place dune
organisation plus structure, dune traabilit ou dune meilleure utilisabilit. Linformatique
est le plus souvent le meilleur moyen de fournir une rponse adapte.
Les crises peuvent se manifester de diverses faons : limpossibilit de reconstituer un dossier
client complet dans un dlai raisonnable, de retrouver la dernire version dun document
lectronique qui a ncessit des jours de travail, etc. Bien quinsidieuse dans notre re
hautement numrique, la crise la plus frquente est probablement la perte par dilution .
Dilution dune information importante dans un ensemble beaucoup trop vaste. Il y a perte de
connaissance ou de mmoire au niveau de lorganisation.
Les tensions rsultent de difficults chroniques dans lusage des documents ou de temps
perdu. Le temps perdu en recherche est le facteur le plus frquemment cit. La rutilisation de
documents existants est galement problmatique, lorsque des ensembles documentaires
autonomes croissent dans lorganisation ; lefficacit du travail peut alors tre largement
dgrade du fait dun manque dorganisation, de traabilit ou simplement de visibilit dans
lorganisation documentaire. Il sagit ici de perte de productivit.
Notons par ailleurs que la gestion documentaire fait partie des processus qualit (ISO 9001,
14001 notamment) et si lutilisation dun logiciel de gestion documentaire nest pas requise
pour sy conformer, elle permet de bnficier pleinement de lapplication des normes en
matire de gestion documentaire, au-del de la stricte application des critres qualit.
Le retour sur investissement peut tre complexe calculer pour ce type dapplication. Il
dpend de critres souvent immatriels dont lvaluation la plus fine est dans la comparaison
avant/aprs, critres qui plus sont souvent difficiles quantifier numriquement. Nanmoins, il
sagit encore dune mthode incontournable pour prouver lintrt dun projet et on trouve
souvent des critres d'valuation de bon sens et contextuels qui donnent toute satisfaction.
Ds que cest possible, il est intressant dvaluer des donnes objectives et de fixer des
objectifs damlioration pour ce type dapplication. On peut citer par exemple : le temps de
traitement des courriers, dans le cas dune GED de correspondance ; le taux de bonne
application des normes et procdures, dans le cas dune GED qualit ; le temps de traitement
du renouvellement des contrats pour une contrathque ou le taux de doublons dune mme
image dans lorganisation pour une application de gestion de mdias

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 13

PRESENTATION DES CONCEPTS


Nous nous efforons ici de positionner la gestion documentaire vis--vis dun certain nombre
de domaines ou de notions connexes.
Les concepts prsents ci-dessous ne reprsentent pas lexhaustivit de lenvironnement de la
gestion documentaire, mais nous semblent ncessaires pour bien apprhender nos
explications.

WWW.SMILE.FR

Document lectronique
La notion de document, si elle ne pose gure de problme dans un univers matriel, doit tre
prcise ds lors quil sagit de documents lectroniques, de fichiers.
Notre approche de la gestion documentaire prend l'acception issue de la norme ISO : Un
document est lensemble constitu dun support dinformation et des donnes enregistres sur
celui-ci, sous une forme en gnrale permanente et lisible par lhomme ou par une machine.
En matire de documents lectroniques, le support est un format de fichier. Un fichier est cr,
modifi et rendu lisible par une application. Par exemple, un document .doc est cr,
modifi et rendu lisible par lapplication Microsoft Word. Les informations quant elles sont
des donnes informatiques comprises dans lenveloppe du fichier.
Nous verrons plus loin que les applications de GED introduisent la notion dobjet
documentaire, qui runit conceptuellement le fichier et les mtadonnes qui lui sont
attaches.

Contenu
Le terme contenu est employ pour dsigner un composant informatif cohrent. Lobjet
documentaire, comme cit plus haut, est un contenu. Le terme sapplique toute information
numrique porteuse de sens.
Les contenus sont, le plus souvent, structurs, c'est--dire constitus dun ensemble de
champs dinformation. Dans ce cas, on parle de contenus documentaires ou structurs.
Il est parfois difficile de faire la diffrence entre un ensemble de contenus et un document
lectronique. Cest souvent le contexte dutilisation et les traitements raliss qui permettent
de distinguer la nature de linformation et le domaine fonctionnel concern, et de dfinir le
meilleur type doutil pour la grer.
Quelques exemples qui peuvent tre considrs comme un document et/ou comme un
contenu, pour illustrer notre propos : une brve sur un site dactualit, une revue darticles de
presse, une image et sa lgende, une fiche descriptive de produit, une notice de document, un
catalogue de produits en format PDF, un module documentaire en format SCORM.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 14

WWW.SMILE.FR

Gestion documentaire
Objectif

Prendre en charge le stockage, le partage et la restitution de


documents lectroniques. Il s'agit majoritairement de systmes
grant des fichiers incluant un fond (le contenu informatif) et une
forme (lenveloppe de prsentation).

Priorit

Gestion de documents lectroniques.

Orientation

Stockage, partage, recherche.

Termes
rencontrs

GED - Gestion Electronique de Document, EDM(S) - Electronic


Document Management (System), DMS Document Management
System.

Gestion de contenu Web


Objectif

Prendre en charge la rdaction, la validation et la mise en ligne de


contenus destination de sites web.

Priorit

Mise en ligne dinformation.

Orientation

Diffusion, restitution de contenus structurs et/ou ditoriaux,


contribution au second plan.

Termes
rencontrs

WCM - Web Content Management, CMS Content Management


System, souvent employ pour dsigner la gestion de contenu Web.

Gestion de contenu
Objectif

Permettre la gestion des contenus numriques, au travers de


fonctions de conception, diffusion, utilisation, recherche et
archivage.
On peut considrer la gestion de contenu comme un surensemble
pour la GED et le WCM. Les solutions de gestion de contenu incluent
le plus souvent des aspects procduraux de workflow (BPM
Business Process Management) et de travail collaboratif
(Groupware).

Priorit

La gestion de contenu dentreprise (ECM) est le concept le plus


rcent de la gestion dinformations numriques, puisquelle adresse

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 15

WWW.SMILE.FR

la fois linformation structure et non structure, sur lensemble


des tapes du cycle de vie des contenus numriques.
Orientation

Gestion des contenus au sens large, c'est--dire l'intgration des


outils de GED, de WCM, parfois mme de portail.

Termes
rencontrs

CMS Content Management System, ECM Entreprise Content


Management, BPM Business Process Management, EIM Enterprise Information Management.

A noter quon rencontre parfois le terme de gestions de contenu dans un sens plus limit, en
voulant dire gestions de contenu web du fait de lamalgame historique avec les CMS,
prcurseur de ce type doutil, ddi aux sites internet.

Gestion de contenu multimdia


Objectif

Grer les spcificits des actifs multimdias numriques (les


Digital Assets, anglo-saxons) : images, musiques et vidos.

Priorit

Contenus images et sons, navigation et recherche au sein du


rfrentiel, gestion spcifique des droits dauteurs.

Orientation

Mtadonnes, navigation, recherche, DRM


management), gestion des volumes importants.

Termes
rencontrs

DAM Digital Asset Management ou gestion des actifs numriques.

(digital

right

Il sagit dune spcialit au sein de la GED. De nombreuses fonctionnalits sont communes


quant la catgorisation, la gestion des droits et cycles de vie. Mais si les mtadonnes
spcifiques la gestion des droits dauteurs peuvent tre modlises avec nimporte quel outil
de GED, certaines fonctionnalits spcifiques sont propres au DAM, manipulation dimages,
gestion des droits dauteurs, panier de slection, extraction des imagettes (miniature ou
thumbnail), prvisualisation de vidos, gestion des descripteurs EXIF ou IPTC, notamment.

Workflow - processus
Objectif

Permettre de formaliser et de fluidifier des processus, via


lenchanement de tches unitaires entre diffrents acteurs.

Priorit

Gestion de processus et de formulaires. Le BPM couvre les besoins


dinteractions formelles entre des acteurs de lactivit de
lorganisation, quil sagisse dhumains ou de systmes, puisque les

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 16

processus font souvent interagir les deux.


Orientation

Gestion de tches attaches des profils dutilisateur. Cependant, il


sagit le plus souvent doutils qui permettent dorchestrer des
webservices produits par diffrentes applications en vue dorganiser
des actions unitaires simples pour produire un rsultat complexe.

WWW.SMILE.FR

On notera que certains outils sont spcialiss par rapport des


objets auxquels ils se rapportent : par exemple le Docflow un
document.
Termes
rencontrs

BPM Business Process Management, gestion de formulaire,


workflow, flux de travail, cycle de vie, instance de processus.

Il est noter que les processus rencontrs dans l'univers de la gestion documentaire sont trs
lis au document. Ils sont exploits des fins d'orchestration de tches de validation ou de
publication essentiellement. Cela constitue une petite part de ce qu'il est possible de faire avec
un outil de BPM autonome.

Archivage Record Management


Objectif

Permettre de grer les phases de vie des documents aprs leur


priode dutilit (la Dure dUtilit Administrative)

Priorit

La prservation des enregistrements (pices) darchives.

Orientation

Lensemble du processus de gestion archivistique mme de


garantir la prise en compte, la scurisation, la fiabilit et la prennit
des archives de lorganisation.
Notons que les applications de RM sont de plus en plus
frquemment fondues dans les applications de GED. En effet, il a
t dmontr que larchivage est mieux pris en compte, lorsquil est
gr ds la cration de la pice darchive (dossier, document).

Termes
rencontrs

SAE systme lectronique darchivage, RM Record Management,


archivage, archivistique, gestion du cycle de vie.

Travail collaboratif
Objectif

Faciliter le travail de groupes de personnes au moyen doutils


ddis, souvent de communication ou dinteraction en temps rel
(synchrone) ou diffr (asynchrone). Par exemple : email, agenda

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 17

WWW.SMILE.FR

partag ...
Priorit

Faciliter le travail en quipe.

Orientation

Partage dinformations oprationnelles

Termes
rencontrs

groupware travail en quipe, Chat (messagerie instantane), Blog


(mode de communication personnel via des billets thmatiques),
Wiki (mode de partage dinformation via la codition de pages),
Agenda partag, Document multi-auteurs (comme Google Docs, par
exemple, qui permet la collaboration synchrone et asynchrone).

Moteur de recherche
Objectif

Permettre de retrouver une information existante.

Priorit

Indexation ou interrogation de bases de contenu.

Orientation

Lobjectif est de permettre aux utilisateurs de retrouver une


information. Les outils de recherche se concentrent, dune part, sur
lindexation de ces contenus ou lusage dindex externes dans le cas
des mtamoteurs et, dautre part, sur les outils damlioration de la
pertinence (adquation de ce qui est cherch, avec ce qui est
retourn par le moteur).

Termes
rencontrs

Moteur de recherche, Search Engine, SEO (Search engine


optimisation), Findability, Meta moteur, Crawler, Oprateur de
recherche.

VERS LA GESTION DE
CONTENU DENTREPRISE
Depuis quelques annes dj, la prdominance du terme dECM (Enterprise Content
Management), pour gestion de contenu dentreprise, tend supplanter les acronymes DMS et
GED.
Cette volution de la gestion documentaire la gestion de contenu dentreprise traduit
une certaine ralit, au-del de laspect marketing vident qui la caractrise.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 18

Le primtre de la GED
La Gestion Electronique de Documents traite des documents numriques. A ce titre une
solution de GED peut intgrer :

WWW.SMILE.FR

des outils : de numrisation, de stockage, de circulation, de diffusion et de recherche,


notamment
des spcificits mtiers : application des procdures qualit, gestion du cycle de vie,
rgles de gestion, interaction avec des applications mtier, etc.
des spcificits techniques : transformation de format de fichier, prvisualisation de
fichiers multimdias, pages Web, contenus structurs, groupe de travail, etc.

Les applications de GED pures nexistent quasiment plus : elles intgrent presque toujours
des fonctions empruntes aux domaines voqus plus haut, ou des domaines mtier.

Le concept dECM
La gestion de contenu dentreprise (traduction d'Enterprise Content Management) regroupe
les solutions mme de grer l'ensemble des contenus numriques d'une organisation.
Il s'agit de prendre en compte (acqurir, capturer) les informations lectroniques (structures
ou documentaires) pour les grer (stockage, dition, diffusion) en rpondant aux exigences des
utilisateurs (ergonomie, fonctionnalit) et aux processus de lorganisation (scurit, fiabilit,
processus).
Bien que couvrant essentiellement le domaine technique, l'ECM intgre ou se rfre donc
une part importante de mthodes et de modlisation.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source

WWW.SMILE.FR

Page 19

Ce schma vise positionner les domaines de la GED, du WCM et de lECM, les uns par rapport
aux autres et vis--vis dun certain nombre de domaines connexes.
Notons que la notion de portail dentreprise est frquemment associe celle dECM. Bien
que fonctionnellement, les intersections soient faibles, laspect globalisant des solutions dECM
ne doit pas masquer la finalit fondamentalement diffrente des deux outils. Exposer les
outils/services de lorganisation (portail) versus grer les contenus de lorganisation.
La capacit pour une solution dECM ou de GED sintgrer un portail est une qualit
importante. Notamment, lorsque le service informatique de votre organisation ne souhaite pas
agrger dans une seule application lensemble des solutions daccs linformation.

Evolution des outils


Les solutions de GED taient initialement orientes vers la gestion de fichiers, puis vers la prise
en compte de documents spcifiques, avec une typologie de plus en plus large (mail,
formulaire, image, vido). Leur volution naturelle est donc de s'intgrer de mieux en mieux
aux processus de gestion documentaire, notamment par une meilleure prise en compte du
contexte d'dition et de la structure des fichiers document (MS Word, Open Document, PDF...)
qui permettra, demain, de traiter les documents comme une agrgation de contenus.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 20

Lvolution de la couverture fonctionnelle des solutions de GED tend rsoudre diffrents


problmes lis aux usages. Dune part en intgrant la gestion des contenus structurs en
parallle de celle des contenus documentaires (on parle parfois de contenu semi-structur) et
dautre part en permettant la ralisation dactions collaboratives pousses.
LECM recouvre le primtre de la GED et ltend aux autres contenus dentreprise,
notamment les contenus Web (WCM), voire les contenus grs par des applications tierces, on
parle alors de fdration.

WWW.SMILE.FR

Translation des mthodes


Lvolution dans la gestion des contenus suit deux logiques bien distinctes : dune part, un
largissement en termes de contenus grs et, dautre part, une adaptation des mthodes de
gestion ces contenus, drives de la gestion documentaire.
On constate, en effet, que nombre des mthodes de lECM sont issues de la GED. Un contenu
est souvent considr comme un fichier (ou un ensemble de fichiers) et les actions que lon
applique sapparentent celles quun utilisateur est familiaris appliquer sur des documents.
Deux facteurs expliquent cette translation de mthodes entre GED et ECM.
1. Les solutions dECM sont souvent issues des diteurs de GED, ceux-ci tentent dlargir
leur march en largissant le primtre de leur solution.
2. Et cest surtout les utilisateurs, en quittant le paradigme issu de leur vision naturelle
(culturelle) du document papier - sparation entre document (forme) et contenu
(fond) - lorsquils grent des documents ou des contenus lectroniques qui conduisent
naturellement les fournisseurs de solution vouloir eux aussi saffranchir de cette
dichotomie et grer ensemble tous les contenus lectroniques.
Il est en effet logique de constater que les utilisateurs envisagent plus facilement de grer un
contenu considr comme un ensemble cohrent, que les morceaux dun quelque chose
qui na pas de forme et dont il est complexe de sapproprier le rendu (la forme).
En clair, une page de site web est plus facile considrer et manipuler que plusieurs
contenus (par exemple, trois images, une bannire de publicit et plusieurs blocs de texte), qui
une fois agencs sur lcran, forment une page Web.

ENJEUX PRINCIPAUX DE LA
GED
La gestion documentaire (GED) est un domaine avant tout organisationnel, contrairement la
gestion de contenu Web (WCM) qui relve essentiellement de problmatiques techniques.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 21

WWW.SMILE.FR

Les outils de gestion de contenu Web sorientent vers la diffusion de contenus structurs : leur
mise en forme, leur publication, leur facilit daccs par un large public, etc... Alors que les
outils de gestion documentaire mettent laccent sur les processus de gestion en amont,
comme la possibilit de raliser une indexation riche ou dintgrer des rgles de traitement
(workflow, transformation, alertes conditionnelles), par exemple.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 22

La mise en place dune solution de GED doit donc impliquer les futurs utilisateurs de faon
importante.
Nous constatons que le succs des dploiements dapplications de GED repose essentiellement
sur la bonne utilisation dun certain nombre doutils et de principes dcrits ci-dessous.

WWW.SMILE.FR

Lergonomie de lapplication doit sadapter lusage dune application de gestion, utilise par
un nombre important de personnes, au mme titre quune application de messagerie, par
exemple.

Structuration des mtadonnes


La gestion des documents lectroniques sapparente encore souvent une gestion en aveugle.
En labsence de formats ouverts (voir plus loin), le document-fichier est un objet opaque et
impntrable pour toutes les applications autres que celles qui la cr, et donc pour
lapplication de GED, qui ne connat au dpart du document que son nom (le nom du fichier) et
son type (type MIME).
Les mtadonnes sont les informations associes aux documents grs. Elles servent qualifier
les documents, leur apporter une information complmentaire qui soit exploitable. La
mtadonne est directement utile en tant quinformation, mais surtout elle est la base des
fonctions de recherche, ou de traitements slectifs appliqus aux documents.
Pour disposer de fonctions avances, un systme de GED doit permettre dassocier aux
documents des informations structures exploitables. Cest tout lenjeu des mtadonnes.
Les mtadonnes typiques incluent, par exemple, le titre, lauteur, la description, la langue et
la date de publication.
Il existe des nomenclatures standard de mtadonne, notamment le Dublin Core, qui dfinit 15
champs principaux de mtadonnes. Diffrents mtiers disposent de leur propre standard
(musique, architecture, sant ou archivistique, par exemple).
Afin dapprhender un maximum de besoins, les solutions doivent donc grer diffrents jeux
(ou sets) de mtadonnes en fonction des types de documents et prvoir un large ventail de
types de mtadonnes, information textuelle (champ texte), liste de valeurs issues de tables de
rfrences, dates ou nombres sur la base desquels des rgles de gestion pourront tre
calcules...

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 23

Rfrentiel de classement
La plupart des solutions de gestion de contenu intgrent un ou plusieurs rfrentiels de
classement.

WWW.SMILE.FR

Ds lors que lon parle dorganisation professionnelle, de mtiers spcifiques et de procdures


de gestion documentaire, il est indispensable de disposer dune structure qui serve de colonne
vertbrale au systme de gestion documentaire cest le rle du rfrentiel de classement. Il
s'agit de l'un des outils les plus importants. Les usages qui reposent sur cet outil constituent un
facteur non ngligeable dans le choix d'une solution.
Les outils de GED sont plus ou moins labors, mais permettent a minima de dfinir un plan de
classement c'est--dire une arborescence hirarchique par rapport laquelle sont classs les
documents. Ils peuvent aller jusqu' permettre de grer des vocabulaires mtiers avec
synonyme, liens de proximit smantique, multihirarchies et traductions de termes. On
parlera alors de thsaurus ou dontologie.
L'utilit d'un rfrentiel de classement concerne diffrentes fonctions : aide l'indexation,
vocabulaires communs (glossaires), recherche avance (avec prise en compte des synonymes,
de la proximit smantique, par exemple), ou encore navigation par facettes.

Prise en compte du cycle de vie


Pour optimiser la gestion des ressources documentaires, il faut grer leur cycle de vie qui
stend de leur cration jusquau-del de leur utilit oprationnelle.
Un document est dabord conu en mettant en uvre un ensemble de processus avant de
pouvoir tre utilis. Par exemple, un contrat est rdig, modifi, valid, imprim, sign puis
envoy, souvent sous forme papier. Le cycle de vie inclut toutes ces phases, depuis son
laboration jusqu son archivage dfinitif ou sa destruction.
La gestion du cycle de vie des documents lectroniques doit tre ralise au moins aussi
finement que celle des documents papier. En effet, du fait de la facilit de duplication, de
transmission et de stockage des documents lectroniques, leur nombre est nettement plus
important. Ceci induit diffrents problmes, notamment de traabilit entre versions, de
capacit trouver une information prcise ou encore de volume de stockage.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures

source

solutions open

Page 24

Brouillons

WWW.SMILE.FR

Archiv

Appliqu

Valid

Diffus

Exemple de cycle de vie simple

Dmatrialisation et transformation numrique


Les solutions de GED sont mme de grer diffrents types de documents, quils soient issus
dapplications bureautiques ou dun processus de numrisation.
La numrisation ou dmatrialisation (galement appele dmat ) consiste en la
transformation dun document dun support matriel en donnes lectroniques. Il peut sagir
par exemple de la numrisation dun document papier vers un document bureautique, dun
ensemble de formulaires vers une base de donnes, de la transformation dun film ou dun
enregistrement sonore sur bande en fichier multimdia, etc.
Depuis de nombreuses annes, le zro papier est prsent comme un objectif, mme si
tous saccordent sur le fait que le zro ne sera probablement jamais atteint. La
dmatrialisation permet nanmoins de bnficier des avantages du numrique sur lensemble
des contenus dmatrialiss.
Certaines organisations ont intgr cela et leurs projets de gestion dinformations sorientent
vers le tout-en-un qui permet de bnficier daccs et de modes de gestion unifis pour
tous les contenus, quils soient physiques et numriques.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 25

LES PRINCIPALES SOLUTIONS DE GESTION


DOCUMENTAIRE OPEN SOURCE

WWW.SMILE.FR

ALFRESCO
Alfresco (www.alfresco.com) est un diteur anglais, fond en 2005 par d'anciens dirigeants de
Documentum et Business Object. La socit est aujourd'hui prsente en Angleterre, en France
et aux Etats-Unis et compte plus de 3000 clients de par le monde.
Alfresco est une solution J2E (java) qui propose un large socle de fonctionnalits :
mtadonnes, typage des documents, workflow documentaire et BPM (avec le module
ACTIVITI (www.activiti.org), gestion de catgories, outils collaboratifs, recherche (y compris un
module SOLR), gestion de bases indpendantes, stockage et publication de contenus Web,
transformation (bureautique et multimdia), pour citer les principales.

Tableau de bord dun utilisateur


Alfresco se distingue par diffrents apports :

une orientation collaborative la fois au niveau des fonctions et de linterface native

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 26

WWW.SMILE.FR

une architecture fonctionnelle et technique de trs bon niveau, lui permettant de se


positionner en tant que socle de GED pour de trs grandes organisations. Alfresco est
trs ouvert et ses APIs et ses outils de dveloppement sont nombreux et bien
documents
les rgles de gestion, directement accessibles aux utilisateurs, permettent de dporter
une part des amnagements fonctionnels au niveau des gestionnaires et non plus des
dveloppeurs ou des administrateurs
un composant de gestion des contenus web, parallle la gestion documentaire. Ce
module est ddi la gestion des contenus structurs leur distribution sur des
frontaux de consultations distants
les facilits dintgration avec le poste de travail. On citera notamment une bonne
utilisation du protocole Sharepoint et Webdav pour ldition en ligne ou encore la
synchronisation avec le poste de travail (via un outil de type DropBox)
un module de Record Management, c'est--dire de gestion darchives, bas sur la
norme amricaine DoD 5015.02 (Smile a dvelopp des modules ddis la gestion
d'archives, orients sur les rgles europennes - Moreq notamment)
une interface dadministration permet de garder une vue sur les fonctions principales
et notamment les modules de la version entreprise
des modules techniques avancs, tels que le load balancing ou la gestion de plusieurs
instances dans une seule installation (multi tenancy)
l'interface Share apporte une interface prte l'emploi pour la collaboration
une visibilit trs importante sur la scne internationale, du fait de sa communication,
de son activit marketing et du grand nombre de clients
Enfin, la double orientation Cloud et mobile accentue avec les dernires versions
apporte une valeur ajoute complmentaire - lhybridation - qui autorise des
architectures dinformation innovantes pour le partage et la valorisation des contenus.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source

WWW.SMILE.FR

Page 27

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 28

Alfresco est disponible en deux versions : une version Community (ou Labs), gratuite et sous
licence GPL, et une version Entreprise , dont le code est ouvert sous une licence
commerciale, qui donne accs au support diteur, aux diffrents modules. Le montant de cette
souscription dpend de diffrents facteurs : le niveau de service de support attendu (SLA), les
modules mis en uvre et le nombre de processeurs utiliss.

WWW.SMILE.FR

Alfresco dispose dune forte dynamique de dveloppement, ainsi que dune communaut
dutilisateurs et de dveloppeurs importante. On notera lexistence du site Alfresco Forge
(http://forge.alfresco.com) qui hberge de nombreux plug-ins.

La version 4, sortie en dcembre 2011, intgre de nombreuses amliorations, parmi lesquelles


nous citerons :

Les amliorations notables de linterface collaborative Alfresco Share avec notamment


le glisser/dposer, plus de finesse de personnalisation et de gestion des droits pour les
espaces collaboratifs, enrichissement de la console dadministration, la catgorisation
de rsultats
lintgration dun serveur de transformation amlior pour les fichiers bureautiques
bass sur MS Office
un plug-in intgr au poste de travail de lutilisateur permettant tout un chacun de
disposer dune slection des documents dAlfresco sur son poste de travail (fonction
telle que la DropBox)
lamlioration des fonctions sociales (suivi des personnes, des contenus les plus aims,
des contenus modifis, partage et publication vers des sites sociaux)
larchitecture hybride : synchronisation vers des espaces en mode Cloud et accs
Mobile. Il sagit sans doute dune perce majeure dans le domaine de la gestion de
contenu puisque pour la premire fois, la mise disposition lextrieur du firewall de
lentreprise est largement simplifie et accessible lutilisateur final ; en toute scurit
lamlioration de la gestion des images et vidos.
Ceci passe par la dernire nouveaut dAlfresco, non encore publi au moment o
nous crivons ses lignes, mais que nous avons eu loccasion de tester et qui viendra
complter les fonctions de gestions des mdias (images et vidos). Ce module (Mdia
Management) viendra sintgrer dans linterface standard et y apportera des fonctions
non seulement dans linterface mais galement ct serveurs, comme des
transformations.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source

WWW.SMILE.FR

Page 29

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 30

NUXEO

WWW.SMILE.FR

Nuxeo (www.nuxeo.fr) est une socit franaise, ditrice de la solution de GED open source
ponyme depuis 2001. La socit est aujourd'hui prsente en France et aux Etats Unis.
Nuxeo est une solution J2E (java), transcrite du Pyton (Nuxeo CPS) en 2007, et qui reprend le
primtre complet de la gestion de contenu dentreprise : mtadonnes, types de documents,
workflow avanc, gestion de catgories, fonctions de collaboration, recherche, gestion de
contenu complexes, multibases, outils de transformation bureautique et multimdia,
paramtrage via un outil graphique.

Loutil se distingue par diffrents aspects :

une notion de relations avance qui permet de typer la vole des liens entre
contenus. Par exemple est la traduction de / est traduit de ou a pour pice jointe
/ est la pice jointe de
une interface standard facilement utilisable pour des projets de GED simple et dote
dune ergonomie satisfaisante (cliquer-glisser, clic droit, prsentation en onglet,
arborescence multiple),
la notion de publication qui permet de d-corrler lespace de travail des utilisateurs
de ce qui est donn voir aux diffrents publics
la structure technique de la solution permet de lintgrer aussi bien dans de petites
structures, que de grands groupes internationaux, et mme dtre intgre comme
brique de gestion documentaire par dautres projets (le Portail-ESUP par exemple)
lAdmin center est une interface de gestion (backoffice) riche qui se rvle
suffisante lusage

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 31

WWW.SMILE.FR

Nuxeo Studio est un outil de configuration graphique qui permet de mettre en uvre
de faon oprationnelle la plupart des fonctions disponibles dans loutil

Enfin, notons la Marketplace , site de dpt de plug-ins prts intgrer et facilement


installable via lAdmin Center.

Plusieurs distributions complte loffre de Nuxeo. Une est destine la gestion des mdias
(images et vidos), Nuxeo DAM. Et une est essentiellement destine la gestion de dossier et
de courrier, Nuxeo CMF et Nuxeo Collaboration ddi au collaboratif dquipe.
Nuxeo CMF est un framework de Case Management pour grer les dossiers au sein de la
Nuxeo Platform
Principales fonctionnalits :

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 32

WWW.SMILE.FR

content routing pour la configuration des workflows


capture des mails
diffusion par mailing list des dossiers traiter.

Nuxeo DAM, pour la gestion des contenus multimdia (vido, audio, image).
Principales fonctionnalits :

acquisition des contenus et modification des mtadonnes en masse


annotation des images
prvisualisation des contenus
encodage, conversion des formats
gestion des droits.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source

WWW.SMILE.FR

Page 33

Planche contact

Dtail dune image


Nuxeo Collaboration, orient vers la gestion dquipe et le partage social .

La version 5.6 est sortie en septembre 2012 et apporte de nouvelles fonctionnalits :

Pour Nuxeo Studio


o un nouvel outil de cration graphique et de gestion de workflow - Content
Routing - il est destin la fois aux utilisateurs finaux de niveau avanc et aux
dveloppeurs
o le Tab Designer qui permet dsormais aux utilisateurs finaux de niveau avanc
de grer le paramtrage du contenu et des vues de chaque onglet dun objet
o le rechargement chaud de la plateforme pour une intgration immdiate des
modifications effectues depuis Nuxeo Studio a t amlior

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 34

la dfinition de proprits complexes qui sera mise profit pour le


paramtrage dans les formulaires et les vues au travers des schmas de
contenu
La synchronisation bidirectionnelle de fichiers via Nuxeo Drive, sur les postes
utilisateurs des utilisateurs nomades (quivalent de Dropbox) est en release candidate
Le partitionnement ou multi-tenant pour optimiser lutilisation des ressources
systme, notamment dans les projets qui utilisent plusieurs bases documentaires sur
un serveur unique
La comparaison automatique des documents pour assurer un suivi encore plus fin des
modifications du contenu, des mtadonnes et des proprits
Le dveloppement du mode collaboratif avec lvolution du module Social
Collaboration qui intgre un nouveau mur (Wall), le vote (Like) sur les documents
ainsi que le dclenchement des notifications via un bouton ddi
Une interface utilisateur amliore
o la modification de lergonomie de la page rsum
o une barre dactions personnalisables
Enfin, le Framework dapplication mobile reprenant les fonctionnalits les plus
utilises (recherche, navigation, prvisualisation, fil dactivits) permettra de dployer
simplement des applications mobiles bases sur Nuxeo
o

WWW.SMILE.FR

KNOWLEDGE TREE
Knowledge Tree (www.knowledgetree.com) est une solution de GED dveloppe par la socit
sud-africaine JamWarehouse. Knowledge Tree existe en deux versions, Enterprise et
Community clairement diffrencie dans cette page (http://tinyurl.com/c9zv5ry). La solution
dispose dun ensemble complet de fonctionnalits de GED et plusieurs modules qui permettent
une bonne intgration dans lenvironnement bureautique.
La version open source de Knowledge Tree semble de plus en plus en replis par rapport la
version commerciale, bien quelle intgre une bonne partie de loffre. Plusieurs modules ou
fonctions importantes ne sont pas inclus dans la version Community, notamment : lintgration
MS Office, des fonctions de personnalisation et de confort, la comparaison de document, les
alertes, le reporting, la signature lectronique ou la traduction de linterface dans diffrentes
langues (notamment en franais !).
Notons que la licence logicielle de KnowledgeTree est spcifique, il sagit dune licence open
source base sur le Mozilla Public License avec des clauses supplmentaires relatives la
marque et la rtention copyright. Ceci dnote dune volont de lditeur de verrouiller, peut
tre un peu trop, sa solution.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source

WWW.SMILE.FR

Page 35

Lapplication est globalement de bonne facture et permet de disposer dune GED simple et
efficace. Nous apprcions particulirement plusieurs points :

une interface standard pure et rapidement oprationnelle


une recherche avance qui satisfera les plus exigeants
des fonctions dadministration, accessibles pour une large part du paramtrage
des modes de navigation virtuelle implments par dfaut, notamment par type de
document
lergonomie du module intgr MS Office qui permet, contrairement ses
concurrents, de grer les mtadonnes de la GED depuis la bureautique.

La dernire version propose plusieurs avances importantes :

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 36

WWW.SMILE.FR

une verticalisation pour les quipes de vente et de marketing oriente vers un usage
SaaS (nouvelle stratgie de la socit)
la refonte graphique et ergonomique trs importante qui fait suite la refonte
technique de la version prcdente (bas sur Zend)
lintgration des protocoles : CMIS, permettant dinterroger la solution via des
webservices normaliss et Open Search permettant de rechercher dans les contenus
et de rcuprer des rponses de son moteur de recherche via des mthodes
normalises

Notons enfin que lditeur continue de sloigner sensiblement de lopen source, non
seulement par la licence, mais galement par son approche SaaS ou encore par le
renforcement de la version Entreprise au dtriment da la version communautaire.

JAHIA
Jahia est une plateforme intgre de portail web et de gestion de contenu, propose par
lditeur suisse du mme nom.
Elle est propose sous deux distributions : Jahia Community et Jahia Enterprise. La premire
est open source sous licence GPL v2, la seconde est sous licence commerciale, et intgre
notamment des fonctions destination des organisations et est supporte par lditeur.
Cette solution rpond principalement aux besoins de gestion de contenus et documentaires
Web, ainsi qu une partie des besoins de portail (agrgation), notamment avec le support de
la norme JSR 168.
Jahia permet galement de grer un rfrentiel de fichiers la norme JCR, ceux-ci peuvent tre
utiliss par les diffrentes interfaces de Jahia.
Jahia est bti sur un socle regroupant le stockage des contenus et les fonctions lies : Jahia
Content Platform. Sur ce socle, deux solutions principales sont proposes :

Jahia xCM (eXtended Content Management) pour la gestion de contenu

Jahia Wise, une solution de partage documentaire, sociale et collaborative.

Dans cette nouvelle dition du livre blanc, une place particulire est donne Jahia Wise,
nouveau produit, orient GED et collaboration de Jahia.
L'intrt des fonctionnalits GED de Jahia xCM rside la fois dans lusage qui peut tre fait
des contenus documentaires dans un contexte de site (internet, intranet, application web) ;
mais aussi avec Jahia Wise sur des aspects plus collaboratifs. Notons que Jahia Wise est
disponible uniquement aux clients de la version entreprise.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 37

Jahia permet des fonctionnalits apprciables sur les images : rotation, recadrage en ligne,
redimensionnement, traitements simples, vignettes automatiques, extraction des donnes
EXIF.
Des volutions importantes sont arrives avec la version 6.5, notamment autour de la gestion
documentaire :

WWW.SMILE.FR

possibilit d'accs aux fichiers via CIFS, SMB


amlioration des fonctions de recherche sur les documents : possibilit d'enregistrer
des requtes, autocompltion, support des facettes y compris des facettes
hirarchiques
gestion de versions sur les documents au sein du gestionnaire de fichiers
intgration automatique des mails
utilisation graphique de workflow avec visualisation de lavancement
intgration dans linterface Wise de fonction de blog, wiki, forum et de gestion des
tches, outils pratiques voire indispensables pour le travail collaboratif

Jahia Wise, qui nous intresse donc plus particulirement dans ce livre blanc, prsente une
approche collaborative du partage de documents oriente sur les fonctionnalits cls pour les
utilisateurs, notamment suivi et historique des versions, verrouillage et possibilit de restaurer
des versions antrieures ; drag-and-drop web; gestion des tags et des catgories ; import en
masse de documents et auto-tagging ; recherche multi-facettes ; affichage des images sous
forme de galerie.
Jahia Wise est structur autour de la notion despaces collaboratifs, qui peuvent reflter tout
type dorganisation souhaite par le client : les mtiers de lentreprise, les directions et
services, les projets ou autres

Un dossier de la bibliothque et les tags associs.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source

WWW.SMILE.FR

Page 38

Une galerie dimages dans Jahia Wise en


mode vignettes .

Une galerie en mode diaporama .

Collaboration sociale : les espaces collaboratifs permettent aux utilisateurs dchanger des
commentaires sur des projets ou des documents, de soumettre des documents un workflow
de validation ou de publication, daffecter des tches et de suivre leur avancement. Les
fonctionnalits sociales telles que les blogs, les sondages, les forums, les wikis, la recherche
dutilisateurs et de comptences, les notifications et les collections partages offrent aux
utilisateurs le meilleur des pratiques du web 2.0.

Collaboration autour dun document


(dition, commentaire et tche).

Forum de discussion.

Contenu Web : Jahia Wise peut tre install de faon autonome dans un systme
dinformation ou en synergie avec Jahia xCM et tre rapidement oprationnel sans
dveloppement spcifique. Lintgration de Jahia Wise avec Jahia xCM permet aux entreprises
dabolir les barrires entre conception et partage de documents collaboratifs dun ct et
publication de documents ou ressources valides sur leurs sites internet de lautre.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 39

WWW.SMILE.FR

De plus, Jahia Wise offre la possibilit


innovante denvoyer du contenu dans un
espace collaboratif partir dun simple email, quil sagisse de contenu trouv sur le
web, ou dune conversation par messagerie
lectronique, afin de lintgrer aux
ressources collaboratives de lespace.

Jahia a donc pris un net virage avec Jahia Wise et propose dsormais des fonctions et une
interface rsolument oriente vers le travail collaboratif autour des documents. Sans toutefois
tourner le dos ce qui a fait son succs, notamment la publication des contenus sur diffrentes
interfaces (site Web, Intranet, interface Wise) et lutilisation des fonctions de Portail et de
CMS pour enrichir lexprience utilisateur.

MAARCH
Maarch (www.maarch.org), est une solution PHP dveloppe par la socit franaise ponyme.
La solution regroupe lensemble des fonctions sous une unique distribution open source :
Maarch Enterprise.
Les fonctions de Letter Box sont maintenant intgres Maarch. Ceci permet notamment de
grer les interfaces avec un scanner ou de grer le cycle de vie du courrier dans lentreprise :
rception, traitement de la rponse et recherche.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 40

Maarch Entreprise est structur comme un SAE (Systme dArchivage Electronique) et est
ddi la conception d'applications de gestion de flux documentaire. Cette distribution inclut
les fonctions ncessaires une GED dentreprise.

WWW.SMILE.FR

Solution de plus en plus mature et intressante, notamment pour ces capacits dans les
contextes dans lesquels elle excelle, en particulier : gestion de courrier, de dossier, document
finaux, ou gestion darchives (SAE systme darchivage lectronique).
Maarch propose un mode multi instance SaaS Factory , installation unique permettant de
grer plusieurs environnements compartiments. Le service SaaS Factory prend en compte
la mise en place dune infrastructure haute disponibilit et dispose dun outil complet
dadministration des divers environnements.
Notons enfin que la communaut autour de la solution est de petite taille, concentre autour
de son diteur.
Parmi les nouveauts des deux dernires versions (dont la 1.4 qui sortira dans quelques
semaines), les volutions suivantes nous on paru particulirement intressantes :

un moteur de notifications dvnements, qui historise lactivit et permet des


notifications par email ou par flux RSS

un module de capture de documents qui permet dingrer des documents de


diffrentes natures et provenances, avec des outils de traitement (OCR, parsing de
mail, gestion de spool, LAD) et diffrents connecteurs de versement vers Maarch

intgration et contribution la norme SEDA, norme de gestion franaise de gestion des


archives lectroniques

intgration bureautique permettant de piloter certains outils bureautiques sur le poste


client pour gnrer des documents (publipostage)

portabilit de linterface sur supports nomades (Mac et Androd).

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 41

SOLUTIONS SPECIFIQUES POUR LA


GESTION DE MEDIA

WWW.SMILE.FR

PhraseaNet
Application de DAM (Digital Assent Management) oriente vers la gestion de mdia (image,
vido), Phraseanet fait partit de ses (trop) rares solutions qui sont converties lopen source
(en 2010) aprs une exprience longue et fructueuse dans le monde propritaire.
Lapplication apporte lensemble des fonctions essentielles dun outil de gestion de mdias,
notamment lupload intelligent, les paniers et reportage, la prvisualisation, les alertes (push
dinfo) etc. Lensemble agenc de faon trs cohrente devant une interface dadministration
et de paramtrage complte.
Et dispose galement de composants avancs, tels que la gestion de thsaurus, une API de
dveloppement dinterface, un reporting et une gestion des workflows (tches) adapts au flux
de production dans le monde de limage (agence de presse, muse, presse)

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 42

RessourceSpaces

WWW.SMILE.FR

Dans la catgorie des solutions de DAM, citons galement RessourceSpace


(http://www.resourcespace.org), qui bien que plus modeste, permet galement dadresser le
besoin spcifique de gestion dimages et de vidos.

AUTRES SOLUTIONS
Plusieurs autres solutions de GED existent dans le monde open source. Leur niveau de qualit
est variable et ces outils sont comparativement limits, par rapport aux solutions phares du
march. Cette limitation peut tre soit entendue, soit par rapport leur adaptabilit au monde
de lentreprise soit par rapport leur primtre fonctionnel qui ne couvre pas lensemble de
celui de la GED.
Ces solutions pourraient nanmoins correspondre des besoins bien spcifiques, dans des
contextes particuliers, notamment pour les besoins souvent simples de PME.
Ces outils ne sont pas systmatiquement intgrs dans les comparatifs prsents dans chaque
chapitre fonctionnel de ce livre blanc.
On peut galement citer : DocMgr, OpenGED, myDMS, eDMS et bien dautres dont la
maturit, la prennit ou le niveau fonctionnel nous semblent aujourdhui trop faibles et que
nous ne prconisons pas.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 43

SilverPeas

WWW.SMILE.FR

SilverPeas est avant tout une solution de portail J2E, avec une forte connotation vers la
collaboration. SilverPeas est dj ancien, puisque dvelopp entre 2001 et 2003. Cest un autre
exemple de passage en open source puisque la solution a connu une premire vie dans le
monde propritaire avant de devenir open source.

SilverPeas est la croise des univers du portail, du CMS et des outils de travail collaboratifs.
C'est un portail, car il utilise la norme JSR-168 et est ainsi capable d'agrger des ressources
htrognes. Il permet ainsi de proposer l'utilisateur une vue synthtique de l'ensemble de
ses ressources. De plus, SilverPeas fournit chaque utilisateur un espace personnel extensible
et personnalisable.
SilverPeas est galement un CMS permettant de construire simplement des minisites avec une
interface WYSIWYG simple. Le CMS intgr SilverPeas est efficace dans le cadre de petites
sections de publications la disposition des utilisateurs. Cet outil permet galement de crer
rapidement en quelques clics des flashs infos, des sondages, des enqutes en ligne. Cette
fonction est couple un outil de GED proposant des classements paramtrables par
l'utilisateur.
Enfin, SilverPeas aligne un ensemble d'outils collaboratifs rpondant lessentiel du besoin. On
y trouve un agenda partag, un forum, un blog, un annuaire commun ou encore outil de
gestion de projet avec tches et visuel Gantt intgr.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 44

Exo DMS

WWW.SMILE.FR

Exo est un diteur franais fond en 2003 par le franais Benjamin Mestralet. La socit est
aujourdhui prsente en France, aux Etats-Unis, au Vietnam, en Ukraine et en Tunisie.

Lapplication initiale, un portail dintgration, a rapidement volu vers la suite eXo Platform,
toffe de nombreux modules et briques techniques, couvrant de faon intgre lensemble
des besoins dun ECM moderne. Citons la gestion dun portail dintgration (eXo Portal), la
gestion de contenu web (eXo WCM), la gestion documentaire (eXo DMS pour Document
Management System), la gestion des workflows avec notamment lintgration du projet Bonita
et mme un WebOS, sorte de portail en forme de poste de travail ddi fournir une solution
de bureau virtuel.
La partie DMS (cest--dire la GED) ne constitue pas un axe majeur de la suite, mme si cette
brique sert au stockage de tous les fichiers. Raison pour laquelle nous avons choisi de ne pas la
faire figurer systmatiquement dans les comparatifs de solution.
Nous ne parlerons, dans ce livre blanc, que de cette brique, en prenant en compte son
appartenance un ensemble plus vaste.
Lapplication eXo DMS dispose de caractristiques diffrenciantes importantes, parmi
lesquelles nous retenons notamment :

une interface standard qui intgre nativement les facilits de lexplorateur Windows :
cliquer-glisser, raccourcis clavier, affichage selon plusieurs modes
la base de contenu (JCR) globale pour lensemble des contenus (Web et document)
peut tre utilise via Webdav, FTP et CIFS
lintgration bureautique relativement pousse, avec un plug-in spcifique pour
MS Office et une intgration Open Office
la possibilit dadapter, de faon trs importante, les interfaces utilisateurs en fonction
de leurs profils. En effet, eXo DMS, comme toutes les applications eXo, se base sur eXo
Portal, application de gestion de portail

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 45

il sagit dune application oriente technique, et non fonctionnelle. Lutilisation dun


package fourni par lditeur ou une intgration soigne est ncessaire pour en
apprcier la qualit et en tirer pleinement parti.

Quotero

WWW.SMILE.FR

Jeune solution en JAVA (la v1.0 date de mars 2009) dite et porte par la socit de service,
galement diteur : Core-techs.
L'offre est centre sur quatre composants : le serveur documentaire, l'interface web
d'interrogation, lintgration MS Office et le client lourd. Certains composants sont lis
une licence commerciale, la version open source tant limite aux fonctions de bases.

Parmi les fonctionnalits prsentes, nous citerons : indexation et recherche plein texte,
rservation (check-in / check-out), alertes email et RSS, workflows documentaires avec jBPM,
liens entre documents, paramtrage graphique des mtadonnes.
On trouve de plus dans la version commerciale des fonctions intressantes :

ouverture et modification de documents depuis MS Office et OpenOffice


drag & drop de documents depuis Windows et Linux via une application cliente.

La communaut autour de la solution semble principalement porte par lditeur et nest plus
active. Le caractre open source est, dans ce cadre, dun intrt plus limit.
La solution Quotero est permet de rpondre des besoins modestes (PME, par exemple) pour
lesquelles une solution plus riche ne se justifie pas, mais qui souhaite nanmoins disposer des
fonctions essentielles dune GED pour stocker et partager ses documents.

LogicalDOC
LogicalDOC (www.logicaldoc.com), anciennement Contineo, est un outil de gestion
documentaire, dit par la socit italienne Logical Objects. La solution est aujourdhui en
version 6.6.
La solution est distribue dune part dans une distribution open source ainsi que sous une
dition commerciale, non libre, qui ajoute des fonctions et permet de bnficier du support de
lditeur.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 46

WWW.SMILE.FR

Parmi les fonctionnalits proposes, on peut citer : gestion des versions, envoi de document
par mail ou par lien gnr, intgration dun webmail, gestion des langues de documents,
discussions.

LogicalDoc propose les fonctionnalits essentielles dun outil de GED ainsi que quelques
fonctions intressantes comme une gestion des droits graphiques, via des cases cocher sur
une grille.
Mais lusage de la version open source est limit :

pas dintgration bureautique, la solution dans son ensemble nest pas axe vers les
fonctions collaboratives
les fonctions dimport/export sont absentes
lauthentification sur un annuaire dentreprise nest disponible que dans la version
entreprise
la communaut autour de la version open source est quasi inexistante
larchitecture documentaire est trs simple, ce qui limite grandement son extensibilit.

Des modules compltent la version open source, avec quelques fonctions intressantes, parfois
indispensables :

la reconnaissance optique de caractres (OCR) et intgration aux outils de


numrisation
lexploitation des formats AutoCAD et MS Office rcents
un workflow documentaire, paramtrable via une interface graphique
des fonctions de traabilit (audit)
la possibilit dintgrer des mails comme des documents, directement sur le serveur.

Lusage de LogicalDoc est donc rserv des besoins simples et trs orients vers les quelques
points forts de la solution. La solution ne bnficie pas suffisamment de la dimension
open source de sa distribution (communaut, extension, etc.).

Etherpad
Enfin, Etherpad (http://etherpad.org), qui nest PAS une solution de GED, mais qui nous semble
intressante de prsenter dans ce livre blanc tant les demandes ddition collaborative (en
temps rel) sont aujourdhui frquentes.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 47

WWW.SMILE.FR

Cette solution open source a en effet pour unique vocation venir concurrencer Google sur sa
chasse garde de llaboration collaborative. Etherpad est intgrable la plupart des outils de
GED de ce livre blanc pour y ajouter cette fonction dlaboration collaborative en temps rel.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 48

LES FONCTIONNALITES
Nous prsentons dans ce chapitre les principales fonctionnalits des solutions de gestion
documentaire, et, pour chacune, nous indiquons comment les outils cits prcdemment se
positionnent.

WWW.SMILE.FR

Il sagit de dcrire non seulement la fonction en elle-mme, mais aussi les impacts quelle a
dans le contexte dun projet.
Les meilleures applications de GED open source sont aujourdhui trs abouties et tendent
intgrer dautres fonctions que celles historiquement rserves au domaine de la GED. De
mme, certaines applications dautres domaines intgrent des fonctions de GED, en relation
troite avec les fonctions mtiers.
Les concepteurs de solutions capitalisent donc sur des expriences acquises dans diffrents
domaines : documentation, moteur de recherche, bureautique, numrisation, reprsentation
de processus Les fonctions le plus souvent intgres aux solutions de gestion documentaire
sont : la collaboration, la gestion de contenu structure et le workflow.
Puisque les solutions assurent les fonctions essentielles, cest donc sur leur optimisation et leur
sophistication, ainsi que sur la mise disposition de fonctions de hauts niveaux, que va porter
lessentiel de notre attention, en vue du choix dune solution adapte chaque contexte.

METADONNEES
Lindexation est une fonction centrale des outils de GED, qui consiste en premier lieu
attacher des mtadonnes aux documents et/ou dossiers.

Types de document
Chaque type de document peut tre qualifi par un ensemble de mtadonnes. Chaque
document sera donc dot de mtadonnes propres et sera ventuellement associ des rgles
de gestion sappuyant sur ces mtadonnes.
Notons quil peut tre intressant dindexer plusieurs fichiers avec un seul jeu de
mtadonnes. La relation entre notice documentaire et fichiers stocks doit donc idalement
tre souple pour permettre davoir de zro n fichiers attachs une seule fiche.

Structure des notices


On appelle notice lensemble de mtadonnes associes un document, le contenu de cette
notice est le plus souvent saisi au moyen dun formulaire.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 49

Il est fondamental que le degr de finesse dans la qualification des documents puisse tre
ajust chaque projet. Il faut trouver le bon compromis entre la richesse dinformations,
lexploitation qui doit pouvoir en tre faite, et la quantit de travail ou de dveloppement que
reprsente lalimentation des mtadonnes.
En effet, sil est parfois contre-productif dobliger saisir 15 mtadonnes pour un document
courant, certaines utilisations peuvent, au contraire, ncessiter des jeux de mtadonnes
importants.

WWW.SMILE.FR

La structure des notices des types de document doit :

permettre une indexation pertinente, qui reflte prcisment les documents dcrits
tout en incitant les contributeurs alimenter
couvrir lensemble des informations utiles lexploitation. La recherche bien entendu,
mais galement les processus et traitements appliqus aux documents tels que les
alertes, la traabilit, laffichage

Attention ne pas tomber dans la sur indexation (trop de mtadonnes pour un type de
document) ou lindexation libre (nombre insuffisant de contrles) qui entranent soit des cots
dindexation trop importants par rapport la valeur ajoute, soit des dfauts dans
lexploitation qui peut en tre faite (bruit et silence en recherche, notamment).

Fonctions relatives aux typages de linformation


Il sagit des fonctions permettant de fiabiliser lindexation et de raliser des traitements
documentaires propres un type de document. Par exemple :

champs multivalus, c'est--dire permettant de saisir plusieurs valeurs


rgles de cohrence sur un champ et entre champs. Par exemple un format de date
pour un jour, ou un nombre positif pour un prix
champs calculs permettant de faire dpendre la valeur dun champ dune ou plusieurs
autres valeurs ou conditions
liaisons entre documents et typage de ces associations, par exemple, un courrier
qui a pour annexe ou un contrat qui concerne un dossier dsign.

La dfinition et la structuration des types de document constituent une phase fondamentale


de la mise en place dune GED. Elle ne doit en aucun cas tre nglige.

Indexation manuelle
Interface de saisie
La notice (ou fiche) dcrivant un document est souvent le premier point dentre des
utilisateurs. Cest galement ce formulaire qui est le plus utilis par les contributeurs, puisquils
devront saisir de linformation.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 50

Pour ce faire, et dans un souci dergonomie, de fiabilit et de productivit, les solutions de GED
doivent faciliter la contribution, directement ou par le biais dune intgration lgre, par
exemple :

WWW.SMILE.FR

copier/coller entre le document lectronique et les mtadonnes. Ceci est


particulirement pertinent lorsque le document lectronique est issu dune
numrisation et quil est possible de le visualiser sur le mme cran que la fiche
dindexation
aide la saisie, ds que possible, par exemple :
o des listes de contrle qui permettent de fiabiliser le fond (smantique) et la
forme (orthographe notamment) de la saisie
o des cases cocher ou des boutons radio pour les choix multiples
o des botes de dialogue adaptes aux tables des valeurs de rfrence (listes des
choix possibles). Ceci pouvant aller de la simple liste droulante, des
interfaces disposant dune recherche avec autocompltion ou dune navigation
(abcdaire, arbre) dans les valeurs de rfrence
o suggestions pour un champ donn (cf Induction de mtadonnes ).

Table de rfrence
Lobjectif est de proposer, ds que cest possible, des listes de valeurs. Ceci pour limiter les
questions que lutilisateur peut se poser lors de la contribution, mais galement pour fiabiliser
la saisie et ainsi amliorer lusage des mtadonnes.
Parmi les tables de rfrences, on trouve par exemple :

les rfrentiels de classement (voir le chapitre Rfrentiel de classement, page 53)


les listes de valeurs enrichies par la saisie ou figes, par exemple le nom des auteurs
des documents (dj prsent dans le systme) ou la liste des services dune
organisation.

Lobjectif de ces tables est doffrir des aides la saisie et dapporter des contraintes et
contrles lors de celles-ci.

Indexation automatique et extraction de mtadonnes


Il existe plusieurs modes dextraction de mtadonnes.

Rcupration dinformations

Chaque fichier informatique est dot dinformations issues du systme de gestion de fichiers.
Certaines peuvent tre pertinentes comme des mtadonnes : le nom du fichier, les dates de
cration et de modification, sa taille, son emplacement

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 51

Les solutions de GED proposent de rcuprer certaines de ces informations. Il est galement
possible, notamment dans le cadre dune reprise dhistorique, de les travailler de faon
reconstituer une indexation par mot cl, par exemple en dcomposant lemplacement ou la
structure dun nom sous forme dune succession de termes qui serviront lindexation.

Extraction de donnes structures

WWW.SMILE.FR

Certains formats de fichier disposent dune structure lisible. Cest notamment le cas pour
nombre de formats ouverts, ODF par exemple, mais galement des formats MS Office, par le
biais de leurs proprits.
Lorsque ces structures sont connues et documentes, il est possible dutiliser des automates
pour extraire les informations pertinentes directement depuis le fichier et les utiliser pour
alimenter une fiche dindexation.

Induction de mtadonnes
Certaines solutions, les plus labores, permettent de dterminer automatiquement les
mtadonnes les plus pertinentes pour indexer un document.
Ce type dinduction de mtadonnes est souvent ralis par :

des outils de reconnaissance, qui retrouvent dans un document les chanes de


caractres prsentes dans un rfrentiel pouvant tre ajoutes la notice
des outils statistiques, qui analysent les chanes de caractres les plus prsentes et
donc potentiellement les plus reprsentatives
des outils smantiques, capables dextraire automatiquement les mots et expressions
les plus pertinents, voire de reconnatre sil sagit de mot-cl, de date, du titre

Ces diffrentes approches sont souvent combines.


Les outils les plus volus permettent, au prix dune diminution de la pertinence dindexation
par rapport lindexation manuelle, de prendre en compte trs rapidement, de trs grandes
quantits dinformations.

Alfresco gre les types de documents par une combinaison daspects. Un aspect contient un
ensemble de mtadonnes types, avec ou sans contraintes, que lon peut appliquer sur
nimporte quel document. Lajout dun aspect et la saisie des mtadonnes peuvent tre
manuels, ou bien automatiques en se basant sur le contenu du fichier, son nom, son
emplacement ou ses proprits. Notons quun aspect peut galement modifier le
comportement dun document dans le rfrentiel : les fonctions daudit et de gestion des
versions sont actives par laspect correspondant. Les aspects sont ajouts par configuration
XML.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 52

eXo DMS propose une gestion avance des mtadonnes. Plusieurs types dobjets peuvent
tre grs, dont certains peuvent tre complexes. Cette gestion peut notamment exploiter des
taxonomies. La structuration des mtadonnes peut tre gre directement dans linterface
deXo DMS.

WWW.SMILE.FR

Jahia permet galement davoir des types de contenus. La nature des mtadonnes des
contenus Web et celles relatives aux documents sont sensiblement diffrentes. La saisie des
informations peut tre partiellement automatise, que ce soit par lextraction pour certains
types de document pour lusage de rgles (avec Drools).
Knowledge Tree permet ladministrateur de crer des types de documents et des ensembles
de mtadonnes depuis linterface web dadministration. La saisie des mtadonnes se fait
manuellement, mais il est possible de paramtrer des filtres pour automatiser certaines
extractions.
LogicalDoc utilise des modles pour diffrencier les documents. Ces modles sont dfinis via
linterface graphique. La saisie des mtadonnes se fait manuellement.
Maarch permet de crer facilement diffrents types de documents. Ces types de documents
sinscrivent dans des collections documentaires dont la logique est proche de celle de
larchivage physique pour faciliter la gestion et les traitements qui peuvent y tre rattachs.
Nuxeo utilise la notion de facette pour ajouter de nouveaux types de documents. Les nouveaux
types de documents sont crs partir de schmas XML (XSD) ou de Nuxeo Studio, de mme
que les crans de saisie ou de restitution. Ils sont ajouts larchitecture de la solution en
ajoutant de nouveaux plug-ins (extension). Nuxeo Studio, service associ au support de
lditeur, permet de disposer dune interface graphique pour ces paramtrages.

GESTION DES VERSIONS


La gestion des versions dun document est lun des domaines o la GED apporte un bnfice
important.
En effet, dans un contexte de travail en groupe, qui plus est, avec des changes demails
multiples, il devient vite complexe de connatre, avec certitude, la dernire version dun
document ou la version applicable.
La gestion des versions permet donc la fois de tracer les volutions dun document, et, par un
systme de rservation (check-in/check-out), de garantir quun utilisateur ne puisse prendre la
main sur un document et le modifier sil est dj en cours ddition.

Rservation (check-in/check-out)
La rservation peut tre implmente de diffrentes faons, mais doit, dans tous les cas,
garantir quun utilisateur qui fait une rservation verrouille le document jusqu la ralisation
dune condition. Cette condition est en gnral un check-in. On peut galement envisager
quun check-out soit libr automatiquement au-del dun certain dlai.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 53

Techniquement, le check-out peut tre ralis automatiquement ds quun utilisateur ouvre


un document et le check-in ralis ds quil le ferme ; mais la rservation dun document peut
galement impliquer que lutilisateur sorte le document du systme le temps de la
modification et donc ncessiter un systme dclaratif de la part de lutilisateur.

Incrmentation des versions

WWW.SMILE.FR

En gnral, lincrmentation des versions est un compteur automatique qui dfinit un numro
squentiel chaque version successive dun document.
On peut galement avoir des mthodes de calcul de l'incrmentation plus labores, par
exemple pour prendre en compte les notions de versions mineures/majeures, ou des rgles
mtiers prtablies, qui dfinissent la construction des numros de version.
Dans tous les cas, lhistorique des versions est conserv et il doit tre possible de visualiser une
version antrieure dun document. Chaque modification de document doit donner lieu une
nouvelle version. Ces deux points sont essentiels pour la traabilit globale du systme de
gestion documentaire.
Des rgles de gestion particulires doivent pouvoir tre dclenches par rapport des
conditions issues du versionning, par exemple lors de la cration dune version majeure, ou
selon le temps coul depuis la dernire version majeure ou encore selon lidentification des
volutions entre deux versions.
Alfresco, Nuxeo, eXo DMS et Knowledge Tree proposent des fonctions avances de
rservation et de gestion de versions. Ils proposent aussi : la distinction entre versions
mineures et majeures, les commentaires dune version donne, voire la rservation
automatique lors de l'dition en ligne d'un document. Les systmes de versionning peuvent
tre surchargs pour prendre en compte des contraintes mtier particulires comme dans la
sant ou le btiment.
LogicalDoc propose galement la rservation et la gestion de versions, mais les possibilits,
notamment de paramtrage, sont en retrait par rapport aux autres solutions.
Jahia propose ces fonctionnalits, mais essentiellement pour les contenus web. Il existe dans la
version 6.5 des possibilits de versionning des fichiers, toutefois relativement en de de ce
que propose un outil de GED.
Maarch ne propose ce type de fonctionnalits que sur les courriers sortants. Cette fonction est
associe la production du document sur la base de modle bureautique.

REFERENTIEL DE CLASSEMENT
Un rfrentiel de classement est, avant tout, un ensemble structur de mots cls ou
dexpressions. On parle aussi de vocabulaires mtiers.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 54

Les solutions GED proposent des implmentations plus ou moins profondes, la fois en termes
de complexit des rfrentiels (hirarchie, liens typs...) et dutilisations possibles.
Lextensibilit des solutions prsente un intrt tout particulier, puisquelle permet denvisager
dtendre le modle de rfrentiel en fonction de ses besoins (voir Ontologie ).

Lexique

WWW.SMILE.FR

Il sagit dune liste des termes utiles dans un contexte donn et organis le plus souvent par
ordre alphabtique. Il est parfois possible d'en donner une dfinition.

Plan de classement
Un plan de classement est un ensemble de termes hirarchiss logiquement les uns par
rapport aux autres.
Il sagit du rfrentiel utilis pour raliser des classements physiques (papier ou autres).
On trouve souvent des ctes ou codes affects chaque terme. Lutilisation classique du plan
de classement, consiste ranger physiquement les documents en affectant chacun, un et un
seul terme du plan de classement.
Dans un usage lectronique, il devient possible daffecter plusieurs termes du plan de
classement un mme document, ce qui donne autant de cls pour le retrouver. Une
catgorisation multiple donc.

Thsaurus
En plus de la structure logique et hirarchique du plan de classement, le thsaurus introduit
plusieurs notions permettant denrichir lutilisation du rfrentiel documentaire. Le thsaurus
est un ensemble de termes parfaitement dfinis, sur lequel on sappuie dans un domaine
dapplication particulier.
Plusieurs normes ISO dfinissent des relations entre les termes dits descripteurs qui
constituent un thsaurus. Parmi les termes les plus courants, on retiendra :

terme gnrique , qui correspond au pre dans la hirarchie. Un terme peut


avoir plusieurs pres
terme spcifique , qui correspond un fils dans la hirarchie
terme employ pour , qui correspond aux synonymes dont on ne retient pas
lutilisation dans le rfrentiel, mais qui pourraient tre employs la place du
descripteur retenu
terme proche ( voir aussi ), qui dfinit des liens transversaux entre termes
descripteurs, du fait de leur proximit smantique

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 55

Aucune solution de GED de ce livre blanc, lexception de Phraseanet nimplmente de gestion


de Thsaurus.
Notons quune solution de gestion de multi-Thsaurus est en cours de ralisation, initie par le
Ministre de la Culture et ralise par Smile.

Rfrentiel de conservation

WWW.SMILE.FR

En matire de GED, le rfrentiel de conservation, appel galement tableau de gestion, sert


tablir les politiques de conservation, c'est--dire les rgles qui prsideront la conservation
des documents lectroniques.
Ce rfrentiel est gnralement construit sur la base dun plan de classement, qui associe
chaque terme plusieurs informations :

la dure de conservation : ventuellement une dure oprationnelle (dans le bureau)


et obligatoirement une dure darchivage
le sort final lissue de la dure darchivage
les textes de rfrence qui justifient la dure de conservation, procdure qualit, loi,
rglement afin de permettre la rvision.

Tout lintrt de cet outil est de permettre lassociation des dures et des conditions de
conservations chaque lment du corpus documentaire (document ou dossier) en fonction
dune classification. Cet outil est indispensable lapplication de rgles de conservation.
Son utilit est spcifique au domaine des archives et de la conservation des documents vitaux,
c'est--dire le record management.

Ontologie
Les ontologies fonctionnent sur le mme principe que les thsaurus, c'est--dire par la mise en
place de relations entre termes. Il sagit dun type de rfrentiel extensible , c'est--dire
dont la structure mme prvoit quelle peut voluer.
Deux exemples de liens : a pour fournisseur / est fournisseur de , est la filiale de /
est la socit mre de .
Il s'agit d'un outil qui n'est pas souvent implment dans les solutions de GED. Certains
permettent nanmoins, de par la structuration XML de leur rfrentiel de classement, de
mettre en uvre ce type d'outil.
A la diffrence des thsaurus, il ny a pas de prdtermination, ni de limitation dans les types
de relations. Il est donc possible de crer autant de relations quon le souhaite, entre les
termes dune ontologie, et dy associer contraintes et rgles dinfrences.
Leur exploitation est aujourdhui encore assez limite, et essentiellement base sur les RDF
(Ressource Description Framework), modle de reprsentation dontologie, normalise par le
W3C.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 56

Le concept dontologie est la base du web smantique, lvolution pressentie par Tim Berners
Lee pour rendre le web plus intelligent en permettant des machines de raliser seules des
associations pertinentes entre contenus.

WWW.SMILE.FR

Dans le cadre dune application documentaire, la mise en place dontologie(s) permet de


disposer doutils extrmement puissants et adaptables la fois au corpus documentaire trait
et aux profils des utilisateurs.
Une ontologie peut, par exemple, dfinir des relations mtiers qui pourront tre exploites par
un moteur de recherche, en fonction du profil de lutilisateur ou de son optique de
recherche. Elles pourraient galement permettre de dfinir des plans de classement
contextuels en fonction de paramtres qui indiquent quels liens de lontologique sont utiliss.
Notons que des pousses intressantes dans le monde du Web et de la GED, notamment avec
Nuxeo font jour ces derniers mois dans le domaine de la smantique, dont les ontologies sont
lun des supports principaux. On notera par exemple lusage dontologies publiques comme
DBPedia
pour
enrichir
les
requtes
(une
initiative
de
Wikipedia
http://en.wikipedia.org/wiki/DBpedia).

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 57

Utilisation des rfrentiels


Etudions quelques utilisations envisageables.
Les objectifs principaux des rfrentiels de classement visent faciliter lusage de la base
documentaire, notamment en rduisant le bruit et le silence lors de recherche ou dautres
types dexploitations.

WWW.SMILE.FR

Restitution des contenus


La navigation par arborescence permet lutilisateur de retrouver un document selon une
logique hirarchique, voire plusieurs logiques hirarchiques diffrentes.
Nous parlerons alors de facettes . Pour illustrer, cest comme si on proposait lutilisateur
les mmes objets (le fonds documentaire) selon plusieurs points de vue (les facettes).
Ainsi, si un contenu est rfrenc, catgoris selon /Europe/France/Paris, mais galement
selon /Etablissements/Restaurants/Trois-Etoiles, lutilisateur pourra parvenir ce contenu par
une navigation correspondante la logique (ou facette ) gographique, ou bien la logique
(ou facette ) gastronomique.
Cette approche est trs puissante, puisquelle propose chaque utilisateur une vision et une
exploitation de la base documentaire qui correspond son usage.
Gestion multi rfrentiels
Dans un contexte professionnel, on est souvent amen prsenter une mme information
diffrents publics. On doit parfois grer plusieurs ensembles de vocabulaires contrls. Par
exemple : une liste de mots-cls et une liste dunits organisationnelles.
La gestion de multi rfrentiels impose de grer certains cas complexes tels que les
homonymies, les liens entre rfrentiels, etc. La plupart des applications GED tudies
disposent dun seul rfrentiel de classement complexe (lorsquelles en disposent), il est donc
important de valider la cohabitation de plusieurs rfrentiels si ce point est important dans
votre contexte projet.
Gestion des synonymes
Il sagit, pour un vocabulaire donn, de pouvoir non seulement grer les synonymes et les
acronymes, mais galement de rendre leur utilisation aussi transparente que possible
lutilisateur.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 58

Les fonctions les plus utiles sont :

WWW.SMILE.FR

lenrichissement facile de la base de synonymes, ventuellement par les utilisateurs


eux-mmes
lutilisation automatique des synonymes lors dune recherche sur le terme principal
(voir Outil de recherche)
la dtection automatique et le remplacement des synonymes par le terme retenu lors
de lindexation, afin dhomogniser lindexation.

Outil de recherche
Les relations des rfrentiels peuvent tre utilises de diffrentes faons par le moteur de
recherche.

Expansion de requtes

Une exploitation possible de rfrentiels riches est de permettre la dfinition de


lenvironnement smantique dun terme. Certains moteurs de recherche sont ainsi capables
dtendre la recherche automatiquement en utilisant les relations indiques dans le
rfrentiel.
Par exemple, en indiquant automatiquement avec un OU boolen quune recherche faite
sur le terme voiture concerne galement tout ce qui parle de automobile , de
bagnole ... Ainsi, tous les documents qui contiennent ces termes seront effectivement dans
les rsultats de recherche (rduction du silence).
Le moteur peut galement tendre la requte par proximit smantique, par exemple entre
pcheur, bateau, poisson...
Les expanseurs de requte peuvent galement reposer sur des analyseurs syntaxiques ou
smantiques, qui construisent automatiquement des dictionnaires de correspondance partir
de lanalyse des documents indexs.

Suggestion lutilisateur

Lanalyse des mots-cls du rfrentiel trouvs dans les fiches des rponses une requte
donne une autre occasion dexploiter les rfrentiels existants.
Par exemple, en proposant lutilisateur des termes proches de ceux trouvs le plus
frquemment dans les rsultats de sa recherche.
Ce type dutilisation est souvent plus riche lorsquon utilise un moteur syntaxique ou
smantique pour raliser ces associations de mots-cls.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 59

Reprsentation en cluster

Il sagit ici de ranger un ensemble de documents selon une arborescence de mots-cls en


rapport avec ces documents.
Lorsque le regroupement est fait partir dune liste prtablie de valeurs dans un ou plusieurs
champs, on parle de catgorisation.

WWW.SMILE.FR

Le terme de cluster est gnralement rserv aux solutions qui proposent un calcul dynamique
bas sur lanalyse de termes prsents dans les documents eux-mmes.
Ce type de fonction est, par exemple, utilis pour reprsenter des rsultats de recherche sous
la forme dune arborescence structure par thme ou par domaine. Ainsi, lutilisateur verra
immdiatement les thmatiques reprsentes dans les documents trouvs et pourra, le cas
chant, prciser sa requte en ajoutant ou excluant certains termes du cluster.
La recherche est lun des domaines ou lnergie est la plus palpable, la fois en terme
dinnovation que dattentes des utilisateurs. Les solutions, y compris open source, ne sy
trompent pas et propose de plus en plus de fonctions avances sur cet aspect.

Alfresco propose un plan de classement sous la forme dune hirarchie de catgories. Il


propose galement dafficher le contenu du rfrentiel de classement selon larborescence des
catgories. Lintgration de SolR permet daffiner les rsultats selon des facettes
administrables.
eXo DMS recommande dutiliser sa gestion de taxonomie pour catgoriser les documents. Le
classement des documents est par ailleurs trs similaire celui dun systme de fichier.
Jahia permet de disposer dun plan de classement et des tags. Ce dernier est utilisable pour
indexer les documents lorsquils sont associs des contenus. Une notion dauto tagging
permet dautomatiser facilement la cration de tags en fonction des projets sur Jahia Wise.
Knowledge Tree permet de crer aussi bien des lexiques que des plans de classement. La
navigation par facette est gnre automatiquement pour certains types de contenus.
LogicalDoc utilise un lexique quil est possible dexplorer lettre par lettre pour retrouver les
documents associs.
Maarch propose un plan de classement li la typologie des dossiers. Un module
d'AUTOFOLDERING permet de constituer la demande des arborescences bases sur des
mtadonnes (navigation virtuelle).
Nuxeo propose un systme de gestion de rfrentiel qui permet de structurer lensemble des
rfrentiels. Ils sont notamment utiliss pour l'indexation des documents, le typage des liens
entre documents ou la navigation par facette.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 60

Quotero propose un plan de classement navigable. Il est possible d'effectuer des recherches au
sein de ce plan de classement.

MOTEUR DE RECHERCHE
Il sagit bien entendu dune brique essentielle des applications de gestion dinformations.
Trois tendances non exclusives existent dans les solutions de GED :

WWW.SMILE.FR

lintgration dun moteur de recherche, les solutions open source intgrent souvent
Lucene, moteur de rfrence du monde open source.
lexploitation de la recherche sur de la base de donnes, ceci peut limiter les fonctions
disponibles (notamment lemmatisation, troncatures)
louverture vers des solutions de recherche du march (propritaire) via des
connecteurs.

Il est donc ncessaire de savoir comment on souhaite rechercher, notamment en termes de


fonctions et de primtre de recherche.

Fonctions de base
A minima, le moteur de recherche dune GED doit :

indexer les fiches documentaires, c'est--dire toutes les mtadonnes d'un document
indexer les documents lectroniques en texte intgral (ou full text ), c'est--dire en
prenant en compte le contenu des fichiers lectroniques, pour tous ceux qui incluent
du contenu textuel
filtrer ses rsultats de recherche selon les habilitations en lecture de lutilisateur, cest-dire ne lui proposer que des documents quil a le droit de consulter
permettre des recherches aussi bien sur lintgralit dun document que sur un ou
plusieurs champs spcifiques de mtadonnes.
permettre lutilisation des tables de rfrence dans les interfaces de recherche
permettre les recherches utilisant plusieurs critres associs avec des oprateurs
boolens (ET, OU, SAUF), ainsi que des parenthses
permettre de mixer les approches documentaires, sur les mtadonnes et le texte
intgral
autoriser les troncatures centrales et droite, implicitement ou par lutilisation de
caractres gnriques qui remplacent un ou plusieurs caractres (classiquement
ltoile * ou le ? )
permettre de personnaliser les pages de recherche, si possible plusieurs pages
diffrentes, pour correspondre aux attentes des utilisateurs

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 61

Fonctions avances
Lutilisation de moteurs labors est souvent envisage pour prendre en charge des fonctions
avances comme :

WWW.SMILE.FR

permettre lenregistrement de rsultats sous forme de panier par exemple, pour


permettre aux utilisateurs de constituer une slection
permettre lenregistrement des stratgies de recherche, c'est--dire les critres utiliss
pour la recherche, afin de pouvoir les relancer simplement
rechercher par tapes successives de faon affiner une requte par rapport aux
rsultats de la recherche prcdente
tendre une recherche, par rapport des synonymes par exemple
fdrer la recherche sur plusieurs bases documentaires
automatiser les approximations, suggestion orthographique et la lemmatisation (c'est-dire la recherche sur les racines des mots)
permettre la recherche en langage naturel ou recherche par lexemple, c'est--dire
dduire lquation de recherche dune phrase ou dun texte interprt par le moteur
suggrer des rsultats approchant lissue dune recherche, par diffrents moyens :
o explicites, via des liens entre documents spcifis dans lindexation de chacun
o implicites, des rapprochements issus de calculs statistiques ou smantiques
dtecter automatiquement des entits nommes , c'est--dire des noms propres
(personnes, lieux), et leurs relations.

La fonction de recherche est centrale dans les projets de GED. Il sagit souvent de la
fonctionnalit la plus utilise et la plus importante pour les utilisateurs, sous rserve quelle
soit adapte pour rpondre leurs attentes spcifiques.
Parmi les besoins frquemment voqus, on retrouve par exemple : la navigation par
arborescence, la recherche sur intervalle de dates, la recherche simple (pour les aficionados de
Google), la recherche par rfrence, la recherche fdre couvrant la fois la GED et
applications tierces.
Il est donc fondamental danalyser les attentes des utilisateurs pour dfinir leurs besoins de
recherche. Cest un bon point de dpart pour btir larchitecture (structure des donnes et
ergonomie) de lapplication cible.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 62

Tous les outils proposent une fonction de recherche a minima sur les mtadonnes.
Alfresco utilise le moteur Lucene ou SolR pour indexer ses contenus, documents et
mtadonnes. Cette intgration permet de disposer nativement dune solution puissante et
largement configurable. Lcran de recherche avance de linterface standard est
paramtrable. OpenSearch est galement disponible.

WWW.SMILE.FR

eXo DMS propose une fonction de recherche complte sur le contenu des fichiers et des
mtadonnes. Des paramtrages avancs permettent de dfinir des synonymes ainsi quun
premier niveau de configuration de Lucene.
Jahia permet galement de rechercher sur les documents et les mtadonnes par lintgration
de SolR. Les fonctions du moteur sont donc puissantes et largement configurables. OpenSearch
est galement disponible.
KnowledgeTree intgre un moteur de recherche simple et puissant, qui propose de
nombreuses options pratiques (historique de recherche, recherche par type de contenu, par
localisation). Mais la caractristique la plus intressante se trouve dans linterface de
recherche avance qui permet de btir trs simplement des recherches extrmement
sophistiques croisant potentiellement lensemble des critres de la base documentaire.
LogicalDoc ne prend en compte que les types de documents les plus simples dans la recherche
de sa version communautaire. Les fonctions de recherche prsentent nanmoins deux
fonctions intressantes : la configuration de lcran de recherche avance par lutilisateur et la
recherche de documents par similarit (base sur la frquence des mots).
Maarch intgre un module de recherche bas sur Lucene pour la recherche full text coupl
une recherche sur la base de donnes pour la recherche documentaire.
Nuxeo utilise par dfaut le moteur de la base de donnes. Il est galement possible de
dutiliser dautres moteurs. Les fonctions de linterface standard sont de bon niveau, mais
limites aux fonctions de recherche de la base de donnes sous-jacente.
Quotero propose un configurateur graphique de type de documents avec mtadonnes
personnalises.

Les fonctions de recherche plus avances ne seront pas disponibles nativement et


demanderont, la plupart du temps, une intgration ou une configuration.
Parmi les moteurs non open source qui apportent une valeur ajoute non ngligeable,
notamment sur le plan smantique, citons des outils tels que Sinequa, Antidot, Exalead,
Polyspot, Autonomy ou Fast.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 63

NUMERISATION
Les applications de gestion documentaire ne prennent, en gnral, pas en charge la
numrisation, ni les traitements associs ceux-ci sont gnralement couverts par des
solutions ddies. Elles traitent les phases initiales depuis la conversion du support, jusqu'
l'injection du document dans la GED. L'application documentaire reprend la main sur les
traitements mtiers, notamment d'indexation, une fois le fichier inject .

WWW.SMILE.FR

Les fonctions voques ci-dessous entrent dans le spectre de la gestion documentaire, mais ne
sont en gnral pas prises en compte directement par les solutions de GED.

Pilotage de scanner et pr indexation


Dans une chane de dmatrialisation, il sagit de la premire fonction prendre en compte.
C'est le plus souvent via une application installe sur le poste connect au scanner qu'est
ralise la numrisation, mais cela peut galement tre mis en uvre via une interface Web.
L'objectif tant de faciliter au maximum le processus qui comprend la numrisation et la saisie
des premires mtadonnes du document (on parle de pr indexation), on sefforce
doptimiser linterface propose loprateur pour numriser et pr indexer les documents
dans la GED.
Encore souvent perue comme fastidieuse par les oprateurs, cette premire phase est
cruciale pour garantir la prise en main et la russite de lapplication de dmatrialisation.
En effet, cest l que sont saisies les mtadonnes explicites (date de numrisation, expditeur,
destinataire, montant dune facture...). Leur exactitude et leur compltude vont dterminer
une part importante de l'efficacit des traitements ultrieurs et donc, de la valeur ajoute du
systme.
Des procds de gestion par lots et lintroduction de la reconnaissance automatique
permettent damliorer ces processus.

Reconnaissance automatique
On trouve plusieurs catgories doutils de reconnaissance automatique. Leur finalit est
toujours de retranscrire linformation issue du support physique (papier) en son quivalent
lectronique, en minimisant les pertes, les erreurs et les interventions humaines.
Ces outils sont largement dpendants de la qualit de la numrisation : inclinaison, dfinition,
visibilit de la trame du papier Ces considrations doivent donc tre prises en compte
dautant plus prcisment quune reconnaissance automatique est prvue.
Les acronymes du domaine de la reconnaissance automatique :

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 64

WWW.SMILE.FR

OCR : Optical Character Recognition ou reconnaissance optique de caractres.


Les bons OCR atteignent des taux de reconnaissance du document numris de
plus de 95% et savent remettre en forme des tableaux, reconnatre les styles, etc.
ICR : Intelligent Character Recognition ou reconnaissance intelligente de caractres.
Ddies la reconnaissance de lcriture cursive (manuscrite), ces applications sont
notamment trs utilises par les banques pour les chques.
LAD : Lecture Automatique de Document.
Pour lacquisition de donnes structures dans une base de donnes par rapport des
champs pralablement identifis.
RAD : Reconnaissance Automatique de Document.
Lobjectif est dorienter les documents vers le bon processus de reconnaissance (plus
haut). Ceci permet notamment dappliquer des rgles particulires en fonction du type
de document reconnu.

Bass sur des algorithmes complexes, ces outils sont largement dpendants de la qualit de la
reconnaissance et de lutilisation de dictionnaires linguistiques et mtiers. Les meilleurs
utilisent des notions dapprentissage et de suggestion de reconnaissance par association.
Lintgration de ces fonctions dans une GED consiste le plus souvent en ladjonction dune
application ddie et la mise en place dun injecteur (ou connecteur) pour rcuprer dans
la GED le rsultat des flux numriss.
Notons quil nexiste pas de solution rellement satisfaisante de reconnaissance automatique
distribue sous licence open source.

Alfresco sinterface avec Kofax Ascent Capture, solution commerciale de pilotage de scanner et
de reconnaissance automatique de contenus. Notons qu'un partenariat a t rcemment
conclu avec Ephesoft (www.ephesoft.com)- diteur de la premire solution open source
totalement ddie la dmatrialisation.
LogicalDoc propose ce type dintgration dans sa version commerciale.
Knowledge Tree intgre, dans son dition commerciale, un outil spcifique qui permet la fois
le pilotage de scanner et lOCR. Cet outil est une chane de numrisation simple qui permet de
piloter le scanner, de raliser des manipulations simples du fichier gnr et dindexer ce
fichier dans la GED.
Maarch propose une interface standard avec Kofax Ascent Capture avec les scanners Fujitsu et
Kodak ainsi que nombres de scanners de productions. Des chanes de numrisation
ergonomiques et adaptes la gestion de courrier peuvent tre mises en place simplement
avec Maarch.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 65

Nuxeo dispose de points dextension pour une intgration avec des solutions de numrisation,
notamment dans le cadre de son axe vertical de gestion de courrier, bas sur Nuxeo Case
Management Framework (Nuxeo CMF). A noter la sortie de la dernire version 1.7 en juin
2011.
Jahia ne propose pas nativement ce type dintgration.

WWW.SMILE.FR

GESTION DES DROITS


Dans la GED comme dans une majorit dapplications de gestion susceptibles davoir une
diversit dutilisateurs, la gestion des droits est une pierre angulaire.
La gestion des droits passe, le plus souvent, par lassociation dautorisations sur des lments
de la base documentaire. Ces autorisations permettent de dfinir un ensemble de droits pour
un utilisateur ou un groupe dutilisateurs.

Niveaux de gestion
La gestion des droits doit pouvoir tre suffisamment fine, a minima par nud darborescence
(rpertoire dans un systme de fichiers), et si possible au niveau de chaque document. Certains
systmes vont jusqu offrir une gestion au niveau de chaque mtadonne, afin de grer des
problmatiques de confidentialit extrmement pointues. La gestion des droits prend
galement en compte les actions possibles en fonction du rle (profil) de chaque utilisateur
(voir le paragraphe ci-dessous).
La gestion des droits ou habilitations des utilisateurs doit pouvoir tre rgle finement et de
faon dcentralise. C'est--dire que ce sont les gestionnaires de la GED et non des techniciens
qui sont en capacit de les administrer. Elle permet principalement de dfinir comment est
implmente la notion de confidentialit dans la GED.

Gestion des profils


Un utilisateur peut cumuler diffrents profils, en fonction de son appartenance un service,
un niveau hirarchique, mais galement de son rle par rapport un processus transverse, par
exemple contributeur sur le site Web, responsable dun dossier client
La gestion des autorisations peut elle-mme faire l'objet d'une autorisation, ce qui permet de
disposer d'administrateurs locaux, en charge de la gestion des droits dlgue sur une section
de la base documentaire.
Dans la mesure du possible, il est prfrable de sappuyer sur une mta dfinition des droits au
niveau dun annuaire dentreprise. Ceci se traduit par lutilisation des groupes de lannuaire
central dans le systme de GED. De faon optimale, on ne gre dans la GED que laffectation de
rles des groupes sur des objets documentaires, ceci de faon totalement impersonnelle, la
gestion des individus tant dlgue lannuaire dentreprise.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 66

Annuaire et SSO
Les applications documentaires peuvent reposer sur des annuaires LDAP et dispositifs de Single
Sign-On (SSO) pour la gestion de la connexion de leurs utilisateurs.

WWW.SMILE.FR

Les diffrentes solutions prsentes se distinguent notamment par rapport leurs capacits de
synchronisation avec lannuaire, leur capacit sinterfacer rapidement avec des systmes de
SSO du march ou la possibilit de crer des utilisateurs pour la GED, en dehors de
lannuaire.
Toutes les solutions prsentes ici permettent de sinterfacer avec un annuaire externe. Elles
proposent toutes une gestion suffisamment fine des droits, au minimum par dossier.

Alfresco, eXo DMS, Nuxeo et Jahia supportent la configuration dun systme de SSO et
lauthentification chane sur plusieurs annuaires.
Alfresco permet galement de disposer dune base dutilisateurs secondaire dans le cadre de
son interface Share, ceci afin de pouvoir inviter des utilisateurs externes.
eXo DMS permet de dfinir des droits sur une multitude de niveaux : les contenus, les
lments dinterfaces, certaines fonctions Ces comportements sont notamment hrits du
composant portail sur lequel est bas eXo DMS.
LogicalDoc supporte lidentification via un annuaire LDAP.
Maarch utilise un systme de gestion avance la fois sur les modules applicatifs et par
rapport aux contenus. Maarch est compatible avec une authentification LDAP et le SSO.
Knowledge Tree propose en plus du modle standard, un mode de gestion dynamique des
permissions, bases sur les mtadonnes de documents.
Nuxeo permet galement dans son interface standard la dfinition des droits en ngatif, c'est-dire le retrait ponctuel de droits et une gestion dynamique en fonction des mtadonnes.

FONCTIONS COLLABORATIVES
La GED centralise la documentation de l'entreprise et offre de facto un dpt unique pour les
documents, notamment bureautiques. Les fonctions collaboratives prennent donc tout leur
sens, ceci bien au-del de loutil de base : lemail.
Il existe plusieurs concepts dans l'dition collaborative de documents cest dire, lorsque
plusieurs utilisateurs souhaitent travailler sur un mme document prsent sur la GED :

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 67

WWW.SMILE.FR

Rservation explicite : une copie de travail est cre afin que l'utilisateur puisse
lditer sur son poste de travail. L'original reste en accs lecture seule sur la GED. Ce
principe s'appelle check-out ou rservation. Une fois le document modifi,
l'utilisateur met en ligne la nouvelle version et libre sa rservation. Le document est
en gnral versionn (le numro de version incrment) et remis en accs libre : il
sagit du check-in ou libration de rservation
Modification en ligne : lutilisateur qui souhaite modifier le document, ralise cette
modification en ligne, c'est--dire sur la version du serveur. Tant que le document est
ouvert sur son poste, le document est rserv, et donc en lecture seule. Ds que
lutilisateur ferme le document sur son poste de travail, la rservation est libre. Ce
procd est le plus confortable pour lutilisateur, mais il trouve ses limites, car il
ncessite dtre perptuellement on-line
Modification concurrente : les utilisateurs ditent le document en temps rel depuis
leur poste. Si le document a t ouvert par plusieurs utilisateurs en mme temps, la
GED gre l'dition concurrentielle en pointant les carts et en demandant une
intervention. Cette pratique est exceptionnelle, car les formats de documents
bureautiques se prtent trs mal ce type ddition

On apprciera galement dautres fonctions telles que les alertes sur modification, lenvoi
demails depuis la GED, les commentaires et discussions sur les documents ou encore la
prvisualisation.
Les fonctions indispensables sur laspect collaboratif sont la rservation et la gestion de
version.
Alfresco permet de raliser les ditions collaboratives, via la rservation, via la modification en
ligne ou via lintgration MS Office. Alfresco propose, en standard, des outils dalertes
configurables par ladministrateur. Share fournit galement des outils de gestion de contenu
tels quun wiki, un forum, un blog et un calendrier partag compatible iCal. Chaque utilisateur
dispose dun tableau de bord remontant toutes les informations utiles pour les sites auxquels il
participe.
eXo DMS intgre peu de fonctions collaboratives directement utilisables. Un vertical ddi la
collaboration dans la suite eXo propose un ensemble doutils, notamment calendrier, email,
forum
Knowledge Tree fournit des fonctionnalits de rservation et dintgration MS Office dans sa
version commerciale ; notons que lintgration Office repose sur une intgration trs
ergonomique avec le poste de lutilisateur. La solution permet galement de crer des
documents Word et Excel directement partir de linterface Web dans la GED.
Nuxeo permet de raliser des ditions collaboratives via la modification en ligne via le module
LiveEdit dployer sur les postes clients. Nuxeo propose galement un systme de
synchronisation pousss des mtadonnes (de la GED) avec les (le contenu des) documents
bureautiques. Enfin, linterface Nuxeo Collaboration dvoile des fonctions intressantes
orientes vers le social .
Maarch nest pas orient vers ce type de fonctions.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 68

WORKFLOW
Deux types de workflows (processus) sont mis en uvre dans le cadre des solutions de gestion
de contenu. Il sagit de lune des frontires entre le domaine de la GED et celui de lECM. En
effet, dans les solutions de GED, on trouvera des workflows appliqus aux documents. Dans les
solutions dECM, on trouvera galement des procdures automatises, en dehors de tout
contexte documentaire : on parlera alors de BPM ou de workflow mtier.
Diffrents niveaux de processus de gestion sont adresss par les solutions :

WWW.SMILE.FR

Workflow documentaire, par exemple : validation, approbation, diffusion de


document
Workflow mtier, par exemple : instruction de dossier, traitement de donnes,
dmatrialisation de formulaire

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 69

Workflow documentaire
Il sagit de mettre en uvre un circuit de validation de documents, souvent pour les publier ou
pour les archiver : on trouve parfois le terme de Docflow . Diffrentes mthodes sont
implmentes par les outils slectionns.

WWW.SMILE.FR

Le workflow repose en gnral sur des fonctions standards de mises disposition des outils : la
gestion des droits, envoi demails, dplacement de fichiers, etc.
Les outils qui permettent de crer des workflows la demande peuvent tre bass sur une
gestion de rgles sous-jacente lapplication. Ils permettent dajouter, de juxtaposer
diffrentes fonctions, partir de rgles simples, assembles les unes avec les autres.
Il peut galement sagir de dveloppements simples et souvent peu paramtrables,
notamment en termes de nombre dtapes, de notifications ou de rsultats du workflow.

Workflow mtier ou BPM


Lobjectif est de permettre la dmatrialisation des procdures, quelles aient ou non un lien
avec des documents. Les outils mis en uvre sont des moteurs de workflow, c'est--dire des
applications ddies au paramtrage et lexcution de processus.
Les applications documentaires, lorsquelles proposent une gestion de processus labore,
intgrent une brique open source pour la motoriser .
Il existe de nombreux projets de moteur de workflow open source de qualit, le plus souvent
en technologie Java. Ce sont des outils relativement complexes, parmi lesquels on peut citer
Intalio, Bonita, jBPM, Processmaker, Orchestra ou OSWorkflow.
De mme que pour une solution de gestion documentaire open source, il convient de :

se poser la question de leur prennit, par rapport aux critres de communaut,


dutilisateurs, de niveau fonctionnel
sassurer que limplmentation du moteur de BPM dans la GED est de bonne qualit,
notamment en termes de gestion des utilisateurs (lorsquils sont communs), de
persistance des donnes ou de design des processus en regard de leur interaction avec
les fonctions documentaires

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 70

Reprsentation de workflow
Il existe plusieurs mthodes de reprsentation de processus.

WWW.SMILE.FR

Les moteurs les plus labors sappuient sur une reprsentation graphique des workflows pour
en raliser le paramtrage, tandis que la modlisation sous-jacente est souvent en XML. La
transcription dans le moteur peut tre plus ou moins riche, depuis la simple interprtation des
tapes jusqu la possibilit de paramtrer graphiquement les alertes, les conditions et les
interactions avec dautres applications, voire des traitements spcifiques (scripts).

Implmentation dans la GED


Lintgration du moteur de workflow dans loutil de gestion documentaire peut tre plus ou
moins forte, notamment en ce qui concerne : la gestion des droits et des rles, linteraction
entre les objets documentaires (document, dossier) et les objets de workflow (processus,
tapes) et les interfaces des deux outils.
Lintgration des interfaces proposes aux utilisateurs masque le plus souvent linterface
du workflow et donne lutilisateur limpression dutiliser une seule application.
La gestion des droits doit tre transversale entre GED et BPM. Les utilisateurs ont des rles au
sein des processus. Ils peuvent tre destinataires de certaines tches en fonction des
processus. Paralllement, ils ont des droits sur la base documentaire et sont donc autoriss
raliser des actions sur certains objets. L'intgration d'un moteur de workflow doit donc bien
apprhender ce lien pour viter les situations o un utilisateur serait destinataire d'une tche,
mais ne disposerait pas des autorisations ncessaires pour la raliser, par exemple.

Tableau de bord et suivi


Lun des objectifs du BPM est de permettre le suivi et la traabilit des processus.
Toutes les fonctions de log et leur exploitation doivent donc faire lobjet dune attention
particulire au moment de choisir limplmentation de la solution de BPM dans la GED.
A minima, chaque utilisateur doit pouvoir visualiser ses tches en cours. Pour aller plus loin, il
est souhaitable de disposer des indicateurs suivants : la liste des tches des subordonns
hirarchiques, lhistorique des tches ralises, la liste des tches des groupes auxquels
appartient lutilisateur, des statistiques dutilisation au niveau de lindividu, du groupe
Ces informations sont, le plus souvent, prsentes dans linterface de la GED, sans quil soit
besoin daccder une interface tierce, sauf lorsque la solution de BPM est utilise pour
motoriser des processus qui nont pas de rapport avec la gestion documentaire. Dans ce
cas, il peut tre prfrable de regrouper toutes les tches dans un tableau de bord externe la
GED.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 71

Alfresco dispose dun outil trs complet bas sur un moteur de workflow (Activity). Il est bien
intgr lapplication et permet de raliser des workflows mtiers facilement. Par ailleurs,
Alfresco dispose dun outil de conception de workflow simple, bas sur lusage de son moteur
de rgles intgr. Ce second type de workflow peut tre gnr par un utilisateur fonctionnel.

WWW.SMILE.FR

eXo DMS intgre Bonita comme moteur ddi la modlisation et lautomatisation des
workflows documentaires. Bonita est galement utilis dans la suite eXo pour piloter diffrents
processus. Il sagit de loutil de BPM le plus complet parmi ceux intgrs aux solutions
prsentes ici.
Jahia propose son propre mcanisme de workflow. Il est relativement souple, orient vers la
publication, que ce soit par page, celle-ci regroupant des contenus web et des fichiers, ou par
type de contenu.
Knowledge Tree utilise le moteur ProcessMaker. Il est facilement paramtrable pour des
processus documentaires et son intgration sous forme dun module est pragmatique.
LogicalDoc propose, dans sa version entreprise, un systme de workflow documentaire
paramtrable graphiquement.
Maarch dispose dun systme de workflow faisant appel des paramtrages complexes.
Maarch dispose nativement de fonction de dlgation et de gestion dabsences.
Nuxeo dispose dun outil trs complet bas sur le moteur de workflow. Limplmentation de
base qui est propose est largement paramtrable et permet de raliser des workflows mtiers
de diffrents types. Ce module - Content Routing - permet de dfinir graphiquement via Nuxeo
Studio, des flux de travail et des tats de document correspondant.

REGLES DE GESTION
Fonctions de gestion
Grer des documents implique de pouvoir disposer de fonctions permettant la prise en compte
des rgles de gestion inhrentes aux mtiers concerns. Par rapport aux documents, cela se
traduit notamment par des actions sur : lacquisition, les notifications, la conservation, les
transformations...

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 72

On trouvera, selon les applications, des fonctions diverses, par exemple :

WWW.SMILE.FR

transformation en PDF de documents bureautiques


calcul dun numro de chrono pour afficher un cartouche de document en fonction de
mtadonnes
diffusion dinformations en fonction de diffrents critres par exemple : une stratgie
de recherche prenregistre, un mot-cl, la validation dun document ou dun
ensemble de documents
notification par email, par flux RSS, dans un tableau de bord
dfinition des formats daffichage des fiches dindexation, par exemple : par profil
dutilisateur, selon des optiques mtiers ou par type de document. Ceci afin de mettre
en valeur les champs les plus pertinents pour chacun
affectation conditionnelle de mtadonnes un document, par exemple, par rapport
la personne qui lindexe ou son dossier dappartenance
manipulation dimages, dans une approche Mdiathque. Ceci permet dviter de
sortir limage de lapplication pour des actions simples, par exemple : recadrage,
rotation, balance de couleur
changes collaboratifs autour dun document ou dun dossier, par exemple par des
fonctions de type forum, via les annotations sur un document

Moteur de rgles
Sur le mme concept que les fonctions de gestion ci-dessus, les outils reposant sur un moteur
de rgles permettent de paramtrer des actions plus complexes et combinant les rgles les
unes aux autres.
Ces rgles constituent un enchanement dactions unitaires, par exemple : copie,
transformation, alimentation dune mtadonne, envoi demails, etc. Elles peuvent galement
tre plus complexes et reflter des besoins mtiers.
De plus, il est souvent plus facile dimplmenter de nouvelles fonctions travers un moteur de
rgles (ex. : Drools). Ceux-ci sont en effet btis sur des architectures extensibles et permettent
dajouter facilement des cas de fonctionnement qui ne sont pas prvus nativement.
Les applications de GED se distinguent ici de faon importante selon quelles soient crites en
PHP ou en JAVA. Les premires tablent sur leur plus grande rapidit de dveloppement, les
secondes sur une architecture technique extensible facilitant lajout de nouvelles fonctions.

Alfresco dispose de nombreuses fonctions de gestion. Celles-ci sont par ailleurs largement
extensibles, que ce soit par lintermdiaire de plug-ins existants ou par des dveloppements.
Alfresco intgre galement un moteur de rgles. Certaines rgles sont manipulables via
linterface Web standard ce qui en facilite lusage.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 73

eXo DMS ne propose pas de moteur de rgles. Nanmoins, la solution intgre un large choix
doutils techniques permettant limplmentation de rgles mtier.
KnowledgeTree propose peu de fonctions de gestion spcifiques. Il existe cependant de
nombreux modules qui permettent lintgration avec dautres applications ou lajout de
fonctions dans linterface. Certains de ces modules sont uniquement disponibles dans la
version commerciale.

WWW.SMILE.FR

LogicaDoc ne propose pas de moteur de rgles, mais permet de sabonner aux modifications
dun document ou dun rpertoire, ou de dcompresser automatiquement le contenu dun
fichier zip.
Maarch permet de mettre en place des rgles de gestion par ladjonction de module
spcifiques, notamment pour la ralisation de traitements particuliers.
Jahia intgre le moteur Drools, rfrence en la matire. Il permet l'intgration de rgles
relatives aux dpts de fichiers (extraction de mtadonnes, gestion des vignettes, ajouts de
mtadonnes en fonction de caractristique du fichier...).
Nuxeo dispose de nombreuses fonctions de gestion qui sont presque systmatiquement
apportes comme des modules. Cest loutil Nuxeo Studio qui intgre les interfaces graphiques
de manipulation du moteur de rgles. Bien que relativement intuitive, celui-ci ncessite une
trs bonne connaissance de Nuxeo.

GESTION DU CYCLE DE VIE


Politique de conservation
La conservation, la prservation et la scurisation de linformation entrent, de plus en plus,
dans les projets de gestion documentaire mesure que les entreprises prennent conscience de
la valeur des documents quelles brassent quotidiennement.
Les politiques de conservation existent depuis longtemps dans le domaine papier (physique),
mais ne sont que depuis peu appliques aux donnes lectroniques.
Ce sont les disciplines couvrant les fonctions de larchivage qui permettent de rpondre aux
questions lies la politique de conservation, on parle darchivistique ou de Record
Management , dans le monde anglo-saxon. Le Record Management est parfois considr
comme plus adapt au domaine numrique, dans la mesure o il prend en compte un sousensemble de documents archiver. Sous-ensemble qui correspond alors aux documents
vitaux de lentreprise, c'est--dire ncessaires lactivit quotidienne de lorganisation.
La dfinition dune politique de conservation dans une application de gestion documentaire
permet :

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 74

de dfinir des ensembles de contenus, par rapport des types ou des critres
dindexation
de relier chacun de ces ensembles, des actions de conservation, processus de
destruction, dure, format et support de conservation

Archivage

WWW.SMILE.FR

Larchivage peut tre apprhend de diffrentes faons en fonction du contexte de


lapplication. Du simple tag archive sur les lments considrs comme archivs, jusqu la
mise hors ligne (off Line) des contenus sur des supports optiques, par exemple.
La ncessit et la complexit de la prise en compte de larchivage numrique vont crotre avec
le volume et la criticit des informations gres.
Les applications intgrent donc des fonctions qui permettent :

de grer des informations de conservation


de grer les formats de fichiers dans la GED en fonction de leur prennit
de dclencher automatiquement des traitements darchivage
de permettre la recherche ou non parmi les lments archivs.

Diffrents types de traitements peuvent tre envisags pour rpondre ces problmatiques de
prennit, de compltude, de fiabilit et de traabilit des archives.
Parmi les fonctions envisageables, on citera :

figer les lments archivs, par exemple en calculant des empreintes cryptographiques
(signature numrique) pour en garantir linaltrabilit
faire valider larchivage ( le versement en archive ) dun ensemble de documents, en
termes de date et de responsabilit
grer les supports de stockage des contenus et leurs mtadonnes pour les conserver
sur des supports adapts (longue dure de vie, accs frquent).

Format de fichier
Le format des fichiers grs dans une application documentaire revt une importance
particulire.
Contrairement aux documents format papier, dont luniformit permet de sabstraire de la
plupart des questions lies au support de linformation, le format des contenus numrique (le
fichier) revt plusieurs caractres critiques.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 75

Fonctions lies au format


La plupart des applications de GED peuvent stocker nimporte quel type de fichier, cependant
certaines fonctions ne sont disponibles que pour certains formats.

WWW.SMILE.FR

La recherche en texte intgral, c'est--dire dans les fichiers eux-mmes. En effet, les
formats documentaires sont encore trop souvent ferms et opaques. Nanmoins, il
existe, de plus en plus souvent, la possibilit den extraire le contenu textuel afin de
lindexer et donc de la retrouver par des moteurs de recherche. Les formats les plus
courants (PDF, MS Office, OpenOffice, HTML) figurent presque toujours parmi ceux
reconnus par dfaut. La question se posera pour des plus formats particuliers tels que :
DWG AutoCAD ou MP3 (pour les tags textuels), par exemple
La prvisualisation, c'est--dire la possibilit de visualiser un fichier sans louvrir avec
son application associe. Cette notion est particulirement utile pour les fichiers trs
lourds (image, vido), puisque lapplication permet de visualiser rapidement une partie
du contenu, sans avoir les tlcharger.
Lextraction dinformations et notamment de mtadonnes. En effet, la plupart des
formats de fichiers utilisent une faon spcifique de grer les mtadonnes quils
embarquent. Connatre ces faons ou recourir une normalisation (open document,
JPEG ou TIFF, par exemple) permet de faciliter la rcupration des mtadonnes
renseignes par les applications ou les matriels ayant gnr les fichiers.

Cette liste nest pas exhaustive.


Formats ouverts
Les formats ouverts et/ou normaliss sont une question dactualit avec la monte en
puissance de la standardisation des formats bureautiques. En effet, ce phnomne que lon
observe depuis plusieurs annes dans les domaines techniques, o le besoin dinteroprabilit
est trs fort, devient une question la convergence de nombreux projets.
Il existe deux enjeux principaux pour un projet de GED :

le premier est de disposer dun format ouvert, document, libre (non soumis un
brevet ou un droit dusage) et trs largement rpandu. Ce qui garantit de fait la
prennit des fichiers
le second est de disposer dun format dont la structure est connue, ce qui permet sa
manipulation (ldition). Ceci permet notamment doffrir des fonctions de
manipulation du contenu tout comme du fichier : transformations, combinaisons et
mme ajout de donnes dans le fichier lui-mme (la rfrence dans la GED ou une
table des matires)

Formats de conservation
Si les documents stocks dans le systme documentaire doivent souvent tre conservs
plusieurs annes (au-del de 5 ans), leur conservation doit galement inclure leur prservation,
c'est--dire a minima quils seront lisibles.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 76

En effet, la problmatique de la conservation se trouve de plus en plus pose pour les


documents lectroniques, dans la mesure o ils remplacent de plus en plus le papier, alors
quils ne faisaient que le complter, il y a encore quelques annes.

WWW.SMILE.FR

Les formats de fichiers mme de garantir la lisibilit des documents sur plus de dix annes
sont, soit des formats simples et trs rpandus, les normes de fait, par exemple : les fichiers
texte (.txt) dont les fichiers XML sont parmi les plus courants et les plus utiles pour la
conservation de donnes structures, soit les formats normaliss au niveau international
comme le PDF/A (ISO 19005-1:2005), le PDF/E (ISO 24517-1 en cours) ou lODF (ISO/IEC
26300:2006 - Open Document Format).
Dans le cas o ces documents sont porteurs de signatures lectroniques, la problmatique
sen trouve complexifie (cf Archivage numrique valeur probante , ci-dessous).

Archivage numrique valeur probante


Aux questions darchivage viennent sajouter, les questions darchivage lgal ou valeur
probante , cest--dire la conservation des documents lectroniques pouvant servir de
preuve.
Pour limplmentation dun archivage lgal, il est ncessaire de garantir :
lintgrit : les archives ne doivent pas avoir t modifies
lauthenticit : une signature nominative et vrifiable
la traabilit : la vie de chaque document doit tre connue sans faille possible, notamment
via lhorodatage certifi et contigu (sans discontinuit)
l'auditabilit : le systme doit pouvoir tre vrifi pour prouver que ses processus ne
peuvent tre altrs
Cet aspect de larchivage nest en gnral pas couvert directement par la solution de GED, mais
par des fonctions annexes qui grent les signatures lectroniques, les relations avec le tiers de
confiance et la traabilit de la conservation.

Alfresco propose de grer le cycle de vie selon deux approches. D'une part, un module de
Records Management, certifi DoD 5015-2 (c'est--dire par le dpartement amricain de la
dfense) qui permet notamment de grer un plan de classement darchivage. Et dautre part,
un module de gestion du cycle de vie (ILM Information Life Cycle) ddi la gestion des
supports de stockage en fonction des politiques de conservation.
eXo DMS et Jahia proposent des fonctions de gestion associe au cycle de publication des
contenus, dans une optique de diffusion Web.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 77

WWW.SMILE.FR

Maarch dispose de nombreuses fonctionnalits lies la gestion des archives (rappelons que
cest son cur de mtier). La Politique dArchivage est sous-tendue par la convention
darchivage passe avec les producteurs et la gestion des cycles de vie. Les fonctions
diffrenciantes de Maarch en la matire sont les suivantes : slection fine des candidats au
cycle, indicateur darchive fige, double slection manuelle/automatique, fonctions de gestion
des archives valeur probante, la gestion des espaces de stockage, le contrle priodique des
archives, lautomatisation de la rplication, le stockage nativement OAIS et lintgration du
protocole SEDA en version 1.0 !
Nuxeo propose de grer le cycle de vie des contenus et la politique de conservation des
contenus par le biais de fonctions standards : mtadonnes, plan de classement et cycle de vie
des contenus. Notons que ces fonctions ne sont pas spcifiques un module darchivage, mais
transverses lapplication.
Les autres solutions ne proposent pas de fonctions spcifiques pour la gestion du cycle de vie
ou de larchivage.

GESTION DES DOSSIERS


Notions relatives la gestion de dossiers
A limage de la gestion des fichiers sur un poste de travail (elle-mme issue de la gestion de
documents papier dans des classeurs), lergonomie des solutions de GED en matire de
gestion de dossiers se rapproche de la logique des utilisateurs. Ici, un dossier nest pas un
simple rpertoire, mais un ensemble de documents lis par une finalit commune.
La notion de dossier est cependant fluctuante et il convient de prciser les trois acceptions que
nous lui donnerons :

Dans l'optique professionnelle courante, le dossier est un ensemble de documents


dont le regroupement apporte de la cohrence, et partir duquel des utilisateurs
accompliront des tches le dossier projet ou dinstructions, par exemple
Dans l'optique documentaire, le dossier runit des documents ayant des
caractristiques communes : un thme ou une mtadonne, par exemple dossier des
articles de presse du jour ou lanalyse financire dune socit, par exemple
Dans l'optique du systme dinformation, le dossier regroupe alors numriquement
des informations issues de diffrentes briques du systme dinformation pour en
faciliter lexploitation - le dossier client, par exemple

Ces approches peuvent tre complmentaires.


Il existe deux diffrences fondamentales entre les dossiers papier et lectroniques :

le format numrique permet le multipositionnement. Un mme document peut tre


prsent dans plusieurs dossiers, utilis par plusieurs utilisateurs avec des approches
mtiers diffrentes

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 78

le format numrique vite duplication et scission des dossiers. Un mme dossier peut
tre partag par plusieurs entits, gographiquement ou fonctionnellement distinctes,
en permettant chacune de conserver la main sur ses contenus, sans quil soit
ncessaire de crer plusieurs dossiers enfants. En effet, le partage dune partie du
patrimoine dinformations conduit souvent la duplication des dossiers, ces derniers
vivent alors leur propre vie.

WWW.SMILE.FR

Les outils de la gestion de dossiers


Plusieurs moyens importants existent pour grer ces dossiers dans les outils de GED, citons
notamment : les informations de dossier, portes par les mtadonnes et les tches associes,
le plus souvent, un dossier dans le cadre dun workflow.
Dautres fonctions peuvent tre adaptes dans un systme de GED ou dveloppes comme des
modules part entire.
Nous regroupons ci-dessous les fonctions les plus frquemment rencontres.
Le partage dinformations

dfinition de mta-informations par dossier


possibilit de structurer un dossier par regroupement de documents, notamment via
ses mtadonnes ou des sous-dossiers
liens entre dossiers (hirarchie, thmatique, rglementation, type daffaires, type de
client)
gestion des droits des utilisateurs (initialisation, agent traitant, superviseur, dcideur)
et leurs prrogatives respectives sur chaque partie (cf structuration des dossiers cidessus)

La gestion des dossiers

avec des dclencheurs automatiques ; par exemple pour larchivage ou les rappels,
dans le cadre dune procdure ou lors de la rception dune pice
interaction entre documents et donnes dune application de gestion tierce ou dune
base de donnes (pour des formulaires notamment)
application de rgles sur des sous-ensembles de documents constitutifs du dossier
vrification de la compltude du dossier par rapport des listes connues
possibilit de gnrer des documents partir de modles, de conditions ou de
caractristiques du dossier. Par exemple un formulaire ou une trame de courrier
gestion de workflow de traitements pour automatiser les transitions et permettre un
suivi automatique de linstruction

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 79

Le classement

la relation entre les pices physiques et numriques peut tre importante dans le cas
o des pices en format papier ont un caractre lgal
identification du dossier : rgles de constitution, rgles de nommage, nomenclature

Traabilit

WWW.SMILE.FR

toute action sur chaque dossier doit tre trace pour permettre des audits sur le
traitement des dossiers

Alfresco permet de grer des dossiers en combinant rpertoire, mtadonnes, rgles de


gestion et fonctions daudit. La prsentation par facette permet de proposer des vues
distinctes aux diffrents acteurs des processus dentreprise. Les notions de vue custom sur
la visualisation de chaque dossier permettent dajouter facilement des informations ou des
outils de gestion simple des dossiers (check-list ou tat davancement, par exemple)
eXo DMS gre les dossiers comme un type de contenu, c'est--dire quils peuvent disposer de
mtadonnes et de toutes fonctions associes. Si aucune fonction spcifique nest disponible,
tout est prvu pour permettre den dvelopper la demande.
Jahia permet de grer des dossiers dynamiques en fonction de mtadonnes, mais n'intgre
pas nativement de rgles de gestion paramtrables au sein des interfaces graphiques. Il est
toutefois possible d'utiliser le moteur de rgles intgr Jahia pour dfinir des ensembles de
comportements/actions lors du dpt de fichiers.
Maarch permet de grer des dossiers dynamiques, correspondants des requtes
paramtres et de les attribuer des utilisateurs en fonction de leur rle.
Nuxeo rpond la problmatique de gestion de dossier avec une interface et des fonctions
ddies, Nuxeo CMF. Loutil propose des notions de regroupement souple permettant de
positionner chaque contenu dans autant despaces que voulu en fonction de rgles ou de
caractristiques. La prsentation permet de proposer aux diffrents acteurs des processus
dentreprise, des vues distinctes. La notion de section (publication) autorise une abstraction
supplmentaire, transversale et indpendante des mtadonnes.

IMPORT/EXPORT
Les fonctions dimport et dexport sont fondamentales dans une solution de GED. En effet,
elles permettent dentrer et de sortir les contenus dune solution une autre et donc de rester
maitre de ses choix d'outils.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 80

Import/export en masse
Lobjectif est ici de permettre lentre ou la sortie rapide dun grand nombre de documents.
Ces fonctions permettent de prendre en compte les mtadonnes, les fichiers et, si possible, la
gestion des autorisations.

WWW.SMILE.FR

Les meilleures solutions proposent des outils ddis ou des API de bas niveau permettant
dinteragir avec la base documentaire pour notamment : injecter ou extraire des contenus,
ajouter ou modifier des mtadonnes et les droits associs aux contenus.

Export sur support physique


Deux optiques diffrentes sont envisager ici :

lexport dfinitif, des fins darchivage notamment, qui consiste sortir certains
documents et leurs mtadonnes sur des supports dits de long terme, souvent plus
lents que les disques durs (disques optiques, bandes DAT). Idalement, la GED
conserve lhistorique des documents sortis, de faon permettre des recherches sur
les mtadonnes
lexport des fins de consultation hors ligne. Il consiste exporter une partie de la
base documentaire sur le poste de travail de lutilisateur ou sur un support numrique
dot de sa propre interface de consultation

Alfresco permet dimporter et dexporter sous forme darchives des espaces entiers du
rfrentiel, en incluant les mtadonnes ainsi que les rgles et les droits associs au format
XML. Alfresco gre galement la synchronisation complte ou slective de contenus vers le
Cloud, et via son module WCM ddi aux contenus pour sites Web, la publication des contenus
vers des serveurs distants.
eXo DMS propose des fonctions et des routines techniques dimport-export au niveau de
limplmentation de son JCR (base de contenu).
Jahia dispose dun module dimport-export de lensemble des donnes au format XML
(contenus et droits, catgories, utilisateurs ainsi que les fichiers lis).
Knowledge Tree est capable dimporter le contenu dun fichier Zip, avec ladjonction de
mtadonnes communes et dexporter une slection de fichiers.
Maarch permet de grer limport et lexport de donnes. Les changes de donnes la norme
SEDA 1.0 sont galement pris en charge.
Nuxeo dispose dun module qui ralise des oprations dimport et dexport de documents et
de mtadonnes, y compris pour les droits. Ces fonctions peuvent tre pilotes par une
interface en ligne de commande : le Nuxeo Shell . Nuxeo permet galement de raliser la
rplication automatique de contenus entre plusieurs bases Nuxeo. On peut aussi exporter une
slection de documents au format zip. Enfin, un mode off Line (ralis avec Smile) permet la
consultation de la base documentaire sur des postes non connects au serveur Nuxeo.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 81

GESTION DES EMAILS

WWW.SMILE.FR

La gestion des emails est une fonction trs demande en matire de gestion documentaire, la
fois pour que ces lments d'information participent la mmoire collective, mais aussi pour
des raisons rglementaires (Sarbanes-Oxley ou Ble II imposent des rgles de conservation des
emails).
Les problmatiques de gestion de la connaissance impliquent de partager et de capitaliser les
informations, mme si leur degr de formalisation est faible, ce qui est typiquement le cas des
emails. Leur stockage et leur partage facilitent le travail en quipe. Les contrles, quils soient
rglementaires ou qualit, simposent galement de plus en plus. Ils poussent les organisations
conserver tous les changes avec leurs employs et leurs partenaires commerciaux.
La mutualisation plus ou moins automatique des emails peut donc apparatre comme une
solution ces problmatiques.

Slection des emails archiver


Le processus darchivage dun email peut trs difficilement tre totalement automatique, sous
peine de voir stocker une multitude de pourriels (spam), de messages sans intrt, voire de
messages privs (qui doivent rester en dehors des mcanismes de mutualisation).
Les solutions de GED doivent donc proposer des processus de slection pour larchivage des
emails. Celle-ci peut passer par lintgration dun plug-in dans le gestionnaire de courrier
(Mozilla, Outlook) ou par lintgration automatique demails envoys une adresse email
spcifique du type stockage_ged@votreorganisation.com, par exemple.

Gestion des emails


La gestion des emails pose plusieurs problmes la fois techniques et mthodologiques.
Dune part, il nexiste pas dhomognit quant au nombre ou au format des pices jointes. Le
format des emails eux-mmes est variable (HTML ou texte, voire formats propritaires selon le
client de messagerie utilis). Par ailleurs, les changes par email sont le plus souvent
multipartites ( plus de deux interlocuteurs), le stockage dun email en plusieurs exemplaires
gnrerait alors des doublons inutiles.
Il ne sagit l que dun chantillon des questions souleves par la gestion des emails.
La GED, dans une optique dECM, doit donc proposer des solutions pour :

grer les formats de conservation des emails et des pices jointes, afin dassurer une
restitution optimale
dtecter les doublons pour viter les stockages multiples et proposer des processus de
travail collaboratif, par exemple lors de lchange dune pice jointe lgrement
modifie dans plusieurs emails successifs

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 82

WWW.SMILE.FR

indexer le contenu des emails et les pices jointes, et grer les liens entre ces
diffrents contenus

Alfresco permet de grer les emails par simple glisser-dposer depuis Outlook. Les
informations de base (expditeur, destinataires, sujet) sont automatiquement extraites. Le
contenu de lemail et des pices jointes est disponible en recherche texte intgrale. Prcisons
galement que dans Alfresco, chaque document ou dossier dispose de sa propre adresse email,
ce qui permet de lui adresser un email. Le comportement peut tre paramtr : un dossier
va ainsi stocker le mail et les pices jointes, un document peut recevoir une annotation
correspondant au contenu de lemail
eXo DMS ne dispose pas nativement de la gestion des emails. Cependant, il existe dans la suite
eXo un outil ddi cet usage qui repose sur le mme stockage deXo DMS.
Knowledge Tree, dans sa version commerciale, dispose dune trs bonne intgration
Outlook. Il est possible darchiver les emails dont les mtadonnes sont automatiquement
extraites, mais aussi dattacher des fichiers du rfrentiel lors de lenvoi dun email.
Nuxeo permet de grer les emails via simple glisser-dposer depuis Outlook. Le contenu de
lemail et des pices jointes est disponible en recherche texte intgrale. Nuxeo propose
galement un type de dossier courriel quil est possible de lier une boite de messagerie
(rcupration automatique de tous les messages de cette boite dans Nuxeo). Les utilisations
sont multiples et facilitent lusage de boites emails partages en les rendant disponibles dans la
base documentaire.
Maarch propose un module d'import demails : Maarch Mail Capture qui permet dextraire le
contenu dune boite mail dans Maarch.
Les autres outils ne disposent pas de telles fonctions.

INTEGRATION DE LA GED
Lorsque lapplication de GED vise en grande partie la production de documents bureautiques,
son intgration aux applications du poste de travail de lutilisateur est alors dterminante.
Dans ce contexte, lergonomie et lefficacit du travail au quotidien, la fluidit du passage de la
GED aux applications utilisatrices de documents numriques (applications bureautiques par
exemple), sont des critres dterminants en ce qui concerne lacceptation de loutil et donc de
la russite du projet.
Deux principaux niveaux dintgration sont envisageables. Notons que le choix impacte la fois
la complexit de lenvironnement technique et la qualit de lergonomie.
Toutes les solutions prsentes proposent une interface Web pour interagir avec la GED.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 83

Espace de stockage

WWW.SMILE.FR

La GED peut tre considre comme un espace de stockage, similaire un disque dur ou un
espace rseau : possibilit de gestion de dossiers, de navigation entre les diffrents niveaux,
voire de dplacements dlments directement par glisser-dposer depuis le poste de
lutilisateur.
Lessentiel intrt de cette approche est que le changement est mineur pour les utilisateurs,
par rapport aux simples serveurs de fichiers auxquels ils taient habitus. Cela facilite
lacceptation de loutil. La contrepartie immdiate est la perte dlments tels que les
mtadonnes ou linterface de recherche. Cette approche est donc le plus souvent complte
par une interface Web ou bureautique ddie la GED qui apporte ces fonctions.
Lutilisation du rfrentiel documentaire est alors propose dans lenvironnement habituel des
utilisateurs, prenant en compte la gestion des habilitations de la GED, mais sans tirer
pleinement parti de lapplication de gestion documentaire sous-jacente.
Technologiquement, cette approche est rendue possible par des interfaces telles que Webdav,
CIFS, WSS (Microsoft) ou mme FTP. Il sagit de technologies implmentes comme surcouche
dune base documentaire et qui permettent daccder la GED par des outils standard du
poste client.

Accs depuis la bureautique


Il sagit de permettre laccs lapplication documentaire partir des applications associes
aux documents (par exemple MS Office, OpenOffice, AutoCAD, Photoshop) et ainsi optimiser
la fluidit du processus de cration ou de modification de documents.
Les utilisateurs demandent pouvoir raliser des tches habituelles depuis leurs outils
bureautiques : ouverture, indexation, enregistrement dans la base documentaire, voire
avancement dun workflow.
Tout lintrt de cette approche est dtre trs peu intrusive par rapport aux habitudes des
utilisateurs notamment en ce qui concerne les phases de travail les plus frquentes, tout en
apportant les bnfices dun systme de fichiers classiques.
Cette approche, lorsquelle nest pas implmente par lapplication documentaire, ncessite
un investissement important.
Remarque : louverture par Microsoft du code source de son protocole WSS, utilis entre
SharePoint et MS Office, a permis de nombreuses applications de GED de lintgrer. Ceci
permet dutiliser MS Office et Windows comme sils taient en relation avec un serveur
Sharepoint, c'est--dire via les panneaux intgrs la suite bureautique et le montage de
disque rseau sous Windows.
Ces plug-ins permettent de disposer, lorsque limplmentation est complte, des fonctions
suivantes : ouverture, dition, rservation, accs aux versions, accs aux workflows et la
navigation dans les espaces.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 84

Alfresco a, de longue date, t prcurseur dans le domaine de lintgration bureautique. Il


propose notamment laccs la base par un partage rseau (en CIFS), laccs en webdav, FTP
ou lintgration dans la suite bureautique Microsoft via un module spcifique. Lintgration
WSS est aujourdhui oprationnelle et remplace avantageusement toutes ces fonctions.
Notons galement lintgration avec Google Drive.

WWW.SMILE.FR

eXo DMS propose un accs Webdav, CIFS et FTP son rfrentiel de contenu. Deux modules
installer sur les postes de travail permettent lintgration aux suites MS Office et Open Office.
Jahia propose une intgration limite au poste de travail, via la navigation de la mdiathque
depuis lexplorateur Windows ou Internet ( webfolders ). La gestion des versions et la
notion de rservation ne sont pas prises en charge. Une gestion de version lgre est en place
depuis la version 6.5.
Knowledge Tree dispose dun accs Webdav et de modules complmentaires (non open
source) permettant une trs bonne intgration dans Windows (exploration du rfrentiel via
un navigateur ddi et notion de hot folder ), MS Office (dition des documents) et Outlook
(indexation des emails). Ces extensions sont une exclusivit de la version commerciale.
LogicaDoc propose un accs Webdav au rfrentiel. La solution propose galement une
fonction intressante de rfrencement de document sur des postes rseau distants. Ce
rfrencement comprend lauthentification sur le poste et mme lajout de templates et de
tags par dfaut pour les documents rfrencs.
Maarch dispose dune extension (applet JAVA) qui permet aux utilisateurs dditer les fichiers
bureautiques directement dans leur application bureautique, sans avoir besoin de tlcharger
le document au pralable. Signalons galement une fonction de publipostage (utilisant
TinyButStrong) avec Open Office, des fonctions de visualisation et dintgration avec les
scanners qui facilite leur indexation. Maarch permet galement de modifier un document
bureautique depuis linterface Web.
Nuxeo propose une interface Webdav et WSS pour laccs aux documents. Lintgration WSS
est oprationnelle et permet de disposer de nombreuses fonctions classiques en terme
dintgration bureautique. Lajout de document est galement possible par glisser-dposer
entre le poste de travail et linterface web. Enfin, Nuxeo propose, via le plug-in LiveEdit,
lautomatisation du processus de modification en ligne depuis MS Office et Open Office.
Quotero propose une intgration Webdav. Il annonce galement une intgration MS Office et
OpenOffice, et un accs via client riche que nous navons pas pu tester.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 85

INTEGRATION TECHNIQUE
Les outils de GED peuvent tre considrs de plusieurs faons en matire dintgration
technique. Dune part, ils peuvent tre considrs comme des applications part entire, sans
rel lien avec le systme dinformation en dehors de la gestion des utilisateurs. Ou alors,
comme c'est de plus en plus souvent le cas, ils sont considrs comme l'une des briques dun
systme plus global o est centralis lensemble des documents dune organisation.

WWW.SMILE.FR

Configuration de linterface
Un outil de GED peut tre trs complet, et parfois dlivrer des interfaces qui ne conviennent
pas aux utilisateurs cibles. Sil est toujours envisageable, avec des solutions open source, de
faire les adaptations directement sur le code de lapplication, cest au risque de rendre les
mises jour plus complexes. Certaines solutions rpondent ce problme en permettant de
modifier leur interface par configuration ou via des outils ddis.

Alfresco dispose de deux interfaces relativement figes et dun framework de dveloppement.


Linterface Alfresco UI propose en standard un trs grand nombre de fonctions, beaucoup
sont adaptables par configuration XML : dfinition des assistants et actions disponibles ainsi
que certains comportements. Les volutions peuvent tre assembles sous la forme dun
module ou bien dveloppes sous forme de custom view comme ajout linterface
standard, ce qui permet de les appliquer facilement lors de mises jour. Share, la seconde
interface, est btie sur le framework SURF. Share est totalement ddie au travail collaboratif.
Notons que le principe dune page daccueil totalement configurable par lutilisateur est
commun aux deux interfaces standards. Il existe dans la communaut Alfresco plusieurs autres
interfaces plus ou moins matures.
eXo DMS est bti sur eXo portal, solution elle-mme ddie la conception de portail Web. De
ce fait, tous les lments de linterface deXo DMS sont paramtrables et extensibles.
Linterface propose nativement est assez technique et ncessite une adaptation. Rappelons
cependant queXo DMS est le plus souvent utilis par des profils semi-techniques .
Jahia propose nativement une interface dune grande simplicit dutilisation. Etant donn son
orientation vers la publication de contenus, linterface concerne est celle du back-office.
Linterface de restitution offre quant elle une trs grande souplesse dans ladaptation aux
besoins des utilisateurs. Nous sommes ici dans une logique de conception dinterfaces ddies.
Notons que le mode insite editing pour lajout de composant directement dans les pages des
sites gnrs (depuis la 6.5) propose une grande souplesse de restitution.
Knowledge Tree permet de modifier facilement le texte des diffrents messages de son
interface, mais il nest pas prvu doutils spcifiques de manipulation de linterface au-del de
la page daccueil. Les adaptations sont donc le plus souvent ralises dans le code mme de
linterface.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 86

LogicaDoc propose quelques options dinterface, mais ne dispose pas doutils spcifiques pour
leur conception. Les adaptations sont ralises par lusage de thmes ou skins.

WWW.SMILE.FR

Maarch propose plusieurs possibilits dadaptation simple de linterface par paramtrage.


Nuxeo dispose dinterfaces relativement compltes, ainsi que dun diteur de thmes pour
configurer certains aspects (disposition, thme...). Pour les modifications plus pousses,
linterface tout entire (fonctionnellement et graphiquement) est construite sur un systme de
plug-ins qui permet de packager les modifications dveloppes pour faciliter leur application
sur les versions ultrieures. Nuxeo Studio permet dapporter une souplesse importante dans la
configuration de certains lments dinterface : page daccueil, logo, crans de saisie, de
modification et de recherche avance. Notons galement que la page daccueil est totalement
configurable par lutilisateur via lutilisation de gadgets Open social.

Intgration applicative
Lintgration permet aux applications de gestion de contenu de sintgrer, de converser avec
dautres applications, le plus souvent productrices ou utilisatrices de contenus.
Plusieurs standards et technologies sont disponibles pour cela :
Les Web services
Les services REST et SOAP, qui sont deux formats d'changes et d'expositions de fonctions
mtiers utiliss dans la cration d'API Web.
Web services SOAP
Spcification utilisant le langage XML au format standard SOAP (Simple Object Access
Protocol). Les Web Services permettent de raliser des changes entre un client et un serveur
via le protocole HTTP. Les Web Services mettent disposition un ensemble de points d'entre
mtier (Endpoint) dcrit dans un contrat au format standard WSDL (Web Services Description
Language).
Web services REST
Plus simple et plus performant que la spcification SOAP, les services REST (REpresentational
State Transfer) se limitent lutilisation du protocole HTTP pour les entres-sorties. Ils ne sont
pas contraints utiliser XML comme langage et leurs changes entre le client et le serveur sont
moins verbeux que ceux de SOAP, ce qui les rend plus performants.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 87

CMIS pour Content Management Interoperability Services

WWW.SMILE.FR

Il sagit dune norme mergente, probablement lune des plus prometteuses depuis le JCR ou le
Webdav, pour homogniser les accs une gestion de contenu, notamment documentaire.
Cette norme consiste proposer un accs technique homogne aux outils de gestion des
contenus qui propose cette interface. En dautres termes, cela permet quune application
comme eZ Publish (CMS ddi la conception de site Web) puisse exploiter les contenus
stocks dans des bases de gestion documentaire telles que : Alfresco, Nuxeo ou Knowledgte
Tree de faon agnostique.

Interfaces simplifies
Une autre faon simple dintgrer loutil de GED dans le systme dinformation est de proposer
une ou plusieurs interfaces utilisateurs simplifies et limites une utilisation prcise. On peut
citer parmi les cas dutilisations : linsertion dans un portail ou dans une application mtier, par
exemple.
Les solutions proposant des frameworks de conception dinterfaces sont les mieux mme de
rpondre ce besoin.

Portlets dans un portail


Loutil de GED peut fournir un certain nombre de portlets , composants qui sinstallent sur
un portail JEE et qui donnent directement accs certaines fonctionnalits.
Certaines applications de GED proposent nativement la portletisation (mise en portlet
standard) de certains composants ou pages (tableaux de bord, recherche ou navigation, par
exemple).
Nous vous invitons consulter le livre blanc Portails open source (http://www.smile.fr/Livresblancs) pour plus de dtails sur ce sujet.

Alfresco dispose dun grand ventail dAPI : web services, REST et galement webscripts, pour
la ralisation dinterfaces simplifies base de HTML et de JavaScript.
eXo DMS est une solution ddie lintgration. Comme nous lavons vu plus haut, son usage
est essentiellement pertinent dans le cadre de la suite eXo Platform. En effet, eXo DMS se
comporte principalement comme une interface de gestion des contenus exploits par les
autres briques de la plateforme. eXo DMS dispose donc de tous les lments ncessaires pour
pouvoir tre intgr, lments trs largement orients vers les autres briques de la suite eXo.
Jahia propose une architecture oriente service et une couche d'accs REST aux contenus de la
plateforme. De plus, il permet le dveloppement de composants d'accs et de manipulation de
ces donnes.
Knowledge Tree dispose de webservices.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 88

Maarch dispose de webservices SOAP et REST.


LogicaDoc propose quelques webservices.
Nuxeo dispose dun ensemble de webservices, technologies de remoting EJB, SOAP et REST,
ainsi quun systme de plug-ins qui permet dtendre facilement les fonctionnalits de loutil.
La disponibilit de l'interface client lourd Eclipse RCP facilite le dveloppement d'applications
sur le poste de travail ou ncessitant des traitements lourds.

WWW.SMILE.FR

Mode SaaS
2009 a vu lmergence de nombreuses solutions en mode SaaS - Software as a Service les
applications de gestion de contenu, notamment de GED nont pas chapp la tendance et on
a vu lclosion du portage de diffrentes solutions de GED, notamment open source, sur le
Cloud.
Ce mode permet dapprhender les projets de GED sous un angle nouveau en voyant
lapplication comme un service et non plus comme une solution, le dploiement est plus
simple, puisquil est industrialis, souvent par lditeur lui-mme. La contrepartie est que les
dveloppements sont souvent plus limits.
Ce type doffre est encore souvent vu aujourdhui, soit comme une faon de lancer trs
rapidement un projet, puisquune infrastructure complte peut tre monte en quelques
heures, soit comme la premire phase dun projet plus ambitieux en se servant de linstance de
Cloud comme dun projet pilote pour valider.

Alfresco propose une machine Amazon EC2 pour ses versions Labs et entreprise (limites 30
jours).
Nuxeo propose un service de location dinstance packag sur la plate-forme dAmazon EC2.
KnowledgeTree propose la version KnowledgeTreeLive galement hberge chez Amazon EC2.
Cette version propose notamment des plug-ins commerciaux spcifiques tels que lintgration
avec Zoho, solution de bureautique en ligne.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 89

SYNTHESE

WWW.SMILE.FR

La gestion documentaire dans les organisations a pour finalit la gestion d'une information
oprationnelle et souvent vitale. Le corollaire est que beaucoup de projets de gestion
documentaire sont complexes, car ils mlent les aspects techniques et fonctionnels propres
la gestion de contenu numrique, mais aussi mtiers, propre diffrentes fonctions dans
lorganisation.
La GED est une brique stratgique du systme dinformation, aussi vital que le mail ou le
partage de fichiers (partage rseau) qui existe dans la trs large majorit des organisations.
Le caractre open source dune telle solution offre des atouts importants : robustesse,
volutivit et prennit en premier lieu ; mais aussi des avantages qui dcoulent de
lcosystme open source lui-mme : des prestataires nombreux, ainsi quun support de haut
niveau et un dynamisme dans lvolution des produits sans gal, car ces deux aspects sont le
socle du business modle des diteurs open source.
Les cots ventuels associs lutilisation de certaines solutions refltent deux types de
besoins : la garantie du patrimoine dinformation qui est hberg (support) ou des fonctions
complmentaires qui ne seraient pas contenues dans la version communautaire des
solutions (modules).
L'open source dispose dun cot dentre extrmement comptitif puisque la souscription
nest pas obligatoire. Ceci permet de recourir ces solutions pour prototype ou raliser un
pilote un cot extrmement faible. Et ce faisant, convaincre sur lutilis de la GED dans
lorganisation, jalon encore important de lintroduction de la GED dans le systme
dinformation centrale des organisations.
Comme vous avez pu le voir travers ce livre, deux produits se distinguent par leur qualit et
leur excellente facult raliser des projets de GED : Alfresco et Nuxeo. Quatre autres
correspondant des typologies de projets un peu diffrentes : Jahia, Maarch, Knowledge Tree
et Phraseanet.
Tous disposent dune prennit de trs bon niveau, de services de support par leur diteur et
dun rseau dintgrateurs consquent mme de raliser des projets.
Le choix de la bonne solution pour votre projet seffectuera donc sur trois critres principaux :
les fonctionnalits natives, les questions darchitecture technique et sur le modle conomique
permettant doptimiser la valeur de chaque projet.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

GED : les meilleures


solutions open

source
Page 90

Notre objectif tait non seulement de prsenter les solutions, mais galement notre vision de
la gestion documentaire.
Nous esprons vous avoir clair sur ces questions et restons votre disposition pour mettre
notre expertise la disposition de vos projets. Une seule adresse : contact@smile.fr

WWW.SMILE.FR

Dautres livres blancs Smile sont disponibles en ligne, en libre tlchargement, sur
www.smile.fr/Livres-blancs.

dition mars 2013 Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation