Vous êtes sur la page 1sur 56

Solutions Open Source de

Business Intelligence
ETAT DE L'ART
Copyright 2008 - ADULLACT
tat de l'art : Solutions Open Source Business Intelligence
Prambule
ADULLAT
ADULLACT est une association rgie par la loi du 1er juillet 1!1 et le dcret du 1" ao#t 1!1$
a%ant pour no& : Association des D'eloppeurs et des Utilisateurs de Logiciels Li(res pour les
Ad&inistrations et les ollecti'its Territoriales)
L'association a t cre en septe&(re *!!*$ par Claude LA+B,- et .ran/ois ,LI,)
L'o(jecti0 de l'ADULLACT est de soutenir et coordonner l1action des ad&inistrations et des
collecti'its pour pro&ou'oir$ d'elopper$ &utualiser et &aintenir un patri&oine co&&un de
logiciels li(res utiles au2 &issions de ser'ice pu(lic 3ad&inistration$ ducation$ &onde
associati0$ sant)))4)
5our satis0aire les contraintes de transparence$ de scurit$ d1interopra(ilit et d1'oluti'it$
indispensa(les pour grer dans de (onnes conditions les in0or&ations propres au2 ad&inistrs$
en 0a'orisant les tl6procdures) Ce patri&oine logiciel respectera les standards et les
protocoles ou'erts$ et sera li(re&ent utilisa(le$ copia(le$ &odi0ia(le et redistri(ua(le par
7uicon7ue sans aucune discri&ination)
Les standards et protocoles sont dits ou'erts s1ils sont pu(li7ue&ent docu&ents$ li(re&ent
utilisa(les et i&pl&enta(les)
L1ADULLACT apporte son soutien 8 l1usage de Logiciels Li(res dans les ad&inistrations et dans
les collecti'its territoriales$ et se propose de participer au d'eloppe&ent de Logiciels
applicati0s Li(res)
ADULLAT Pro!et
ADULLACT 5rojet est une SCIC 3Socit ooprati'e d'Intr9t o&&un4 rgie par la loi du 1!
septe&(re 1:; portant statut de la coopration$ et la loi du *: juillet 1<"; sur les socits 8
capital 'aria(le) ,lle a t cre en octo(re *!!")
,n optant pour cette 0or&e de socit$ les porteurs du projet poursui'ent$ en accord a'ec les
ad=rents de l1ADULLACT 8 l1origine de cette SCIC$ leur action$ inscrite dans l1intr9t collecti0$
en 0a'eur de l1opti&isation des s%st>&es d1in0or&ation au sein des collecti'its territoriales et
du &onde de la sant et$ d1une &ani>re gnrale$ en 0a'eur du d'eloppe&ent du Logiciel
Li(re au sein des Ser'ices 5u(lics)
La SCIC ADULLACT 5rojet s1est donne pour (ut$ dans un esprit de coopration entre les
acteurs pu(lics 3usagers4 et pri's 3oprateurs tec=ni7ues$ salaris4 :
De rpondre au2 (esoins de re0onte des s%st>&es d'in0or&ation des ad&inistrations$
collecti'its territoriales et organisations rele'ant des ser'ices 5u(lics 8 (ase de
Logiciels Li(res)
De &utualiser les co#ts de d'eloppe&ent des logiciels dit Libres ou Open Source dont
les a'antages 3co#ts$ prennit$ acc>s au code source4 ne sont plus 8 d&ontrer)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age * @ A"
tat de l'art : Solutions Open Source Business Intelligence
S1ajoutent :
Le souci de prser'er totale&ent son indpendance et sa neutralit 'is686'is des
organisations cono&i7ues ou industrielles pri'es$ pour garantir la &eilleure
o(jecti'it de ses ser'ices$ acco&pagne&ents ou aides)
La 'olont de &nager$ a'ec les organisations pu(li7ues$ des partenariats de =aute
pro2i&it$ organiss de &ani>re 8 0aire (n0icier ses partenaires des a'ances
tec=nologi7ues les plus rcentes)
et ou"rage
La Business Intelligence$ ou In0or&ati7ue Dcisionnelle$ est un do&aine (ien spci0i7ue des
s%st>&es d'in0or&ation$ 7ui n'c=appe pas 8 l'Open Source)
Ainsi$ cet ou'rage s'e00orce :
De &ettre en a'ant les enjeu2 et les d0is de la Business Intelligence dans l'Open
Source)
De d0inir les di00rents outils dcisionnels a0in de dco&ple2i0ier ce do&aine)
De prsenter les solutions 7ui sont$ ou ont t$ les plus pertinentes dans c=a7ue 0a&ille
d'outils)
D'ta(lir une anal%se de ces applications a0in d'en retirer une s%nt=>se &ettant en
a'ant les intr9ts$ et incon'nients$ de c=acun)
Cette tude est 0onde sur plusieurs &ois de tra'ail de rec=erc=e) ,lle n'a pas pour o(jecti0
d'ta(lir un classe&ent entre les di00rents outils &ais de &ettre en a'ant leurs potentiels
respecti0s a0in 7ue c=a7ue lecteur puisse s'orienter 'ers celui 7ui con'iendra le &ieu2 8 ses
(esoins et attentes)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B @ A"
tat de l'art : Solutions Open Source Business Intelligence
Table des mati#res
Prambule$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$%
ADULLACT))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))*
ADULLACT 5rojet)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))*
Cet ou'rage))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))B
Introduction$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$&
Business Intelligence))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))A
Deux systmes d'information : transactionnel et dcisionnel.......................................................................5
Historique de la usiness !ntelli"ence......................................................................................................5
#"les conceptuelles ............................................................................................................................$
Open Source)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))"
Dfinition du Lo"iciel Libre.....................................................................................................................$
%&olution de ce modle conomique........................................................................................................$
'ritres de c(oix..................................................................................................................................$
L'Open Source Business Intelligence 3OSBI4))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))));
)pports et a&anta"es............................................................................................................................*
+erspecti&es.........................................................................................................................................*
Les outils dcisionnels$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$'
,2tract Trans0or& Load 3,TL4))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Data Care=ouse et Data +art))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))
Cu(es OLA5 ))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))11
Anal%se &ultidi&ensionnelle))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))1B
Data +ining)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))1:
Dnrateur d'tat)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))1A
S%nt=>se)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))1;
Les solutions dcisionnelles$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$()
,TL))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))1<
'lo&er.,-L..........................................................................................................................................*
,n(ydra Octopus................................................................................................................................/0
+enta(o Data !nte"ration 1ex. 2ettle3..................................................................................................../.
-alend Open Studio 1-OS3..................................................................................................................../4
Data Care=ouse))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))*A
i5"res............................................................................................................................................../5
!n"res.............................................................................................................................................../5
6yS7L.............................................................................................................................................../$
+ost"reS7L......................................................................................................................................../$
Ser'eur OLA5))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))*;
+enta(o )nalysis Ser&ices 1ex. 6ondrian3.............................................................................................../8
+alo................................................................................................................................................../9
Client OLA5)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))B1
:ree)nalysis.......................................................................................................................................4.
;palo.................................................................................................................................................44
;pi&ot................................................................................................................................................4<
;rubi=................................................................................................................................................4$
Data +ining)))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))B<
>ai=ato ,n&ironment for 2no?led"e )nalysis 1>,2)3.............................................................................4*
Dnrateur d'tat))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))):!
usiness !ntelli"ence and #eportin" -ools 1!#-3....................................................................................<0
;asper#eport......................................................................................................................................</
+enta(o #eportin" 1ex. ;free#eports3....................................................................................................<<
Open#eports......................................................................................................................................<$
Suites dcisionnelles))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))))):<
;asper !ntelli"ence..............................................................................................................................<*
6ar&el !- Das(...................................................................................................................................50
+enta(o.............................................................................................................................................5.
Spa"o !...........................................................................................................................................5<
S*nt+#se$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$&,
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age : @ A"
tat de l'art : Solutions Open Source Business Intelligence
Introduction
Business Intelligence
Selon la d0inition de ?o(ert ?,IE$ F un systme d'information est un ensemble or"anis de
ressources 1matrielles@ lo"icielles@ personnelles@ donnes@ procdures...3 permettant
d'acqurir@ de traiter@ de stoc=er des informations 1sous forme de donnes@ textes@ ima"es@
sons...3 dans et entre or"anisations A) Le c=oi2 de l'appellation systme n'est pas anodin) Il
re0l>te la logi7ue sous6jacente considrant ce dernier co&&e un ense&(le d'entits en
interaction entre elles$ 7ue l'on pourrait considrer co&&e autant de &aillons 0or&ant une
c=aGne) De ce 0ait$ ce dernier peut 9tre ainsi o(ser' 8 di00rents degrs de prcision$ soit en le
considrant co&&e un s%st>&e d'in0or&ation glo(al$ soit en accentuant le Hoo& a0in de &ettre
en 'aleur deu2 sous s%st>&es)
Deu- s*st#mes d'in.ormation / transactionnel et dcisionnel
D'une part le s%st>&e d'in0or&ation transactionnel) Il g>re les applications 7uotidiennes et se
rapproc=e 8 ce titre de la couc=e oprationnelle) Il est t%pi7ue&ent utilis par les acteurs
&tiers et se 'oit plus co&&e un outil utilis par ces derniers a0in de rpondre 8 des (esoins
de si&pli0ication et d'auto&atisation)
D'autre part le s%st>&e d'in0or&ation dcisionnel$ angle d'approc=e de cet ou'rage$ 7ui est
utilis pour prendre les dcisions de l'entreprise$ et 8 ce titre doit per&ettre au2 dcideurs
d'a'oir un certain recul sur leur entreprise) Il 0ournit pour cela les in0or&ations ncessaires et
pertinentes a0in de 0aire les (ons c=oi2) Le Dartner Droup d0init$ en 1B$ la Business
Intelligence co&&e l'F ensemble des moyens et mt(odes permettant de rassembler@
consolider@ analyser et rendre accessible les donnes d'une entreprise dans une perspecti&e
d'aide B la dcision I) Le dcisionnel est donc 8 l'in0or&ation de l'entreprise ce 7ue les
&at=&ati7ues sont 8 la pense)
.orce est de constater 7ue le concept de Business Intelligence n'est pas rcent$ et 7ue$ depuis
sa cration$ des 'olutions nota(les peu'ent 9tre distingues) Il est ncessaire de connaGtre
ces &utations a0in de (ien saisir les tenant et a(outissant de leur structure actuelle)
0istori1ue de la Business Intelligence
Au d(ut des annes !$ l'in0or&ati7ue est au ser'ice de l'entreprise p%ra&idale) D'une
&ani>re tr>s classi7ue$ elle re&onte les in0or&ations de la (ase 'ers le =aut) Cette po7ue est
celle des E2ecuti'e In0or&ation S%ste&s 3,IS4)
+ilieu des annes !$ les (esoins d'in0or&ations co&posites r'>lent des lacunes dans les
s%st>&es d'in0or&ations) Les tec=nologies Data Care=ouse et Data +art se (analisent et
l'in0or&ati7ue dcisionnelle se tourne 'ers les cu(es OLA5$ dans un soucis d'anal%se plus
pousse)
De nos jours$ le dcisionnel n'est plus l'apanage des instances dirigeantes et toutes les couc=es
de l'entreprise re'endi7uent un (esoin d'in0or&ation pertinente$ propre 8 leur 0onction) Jue ce
soit dans des soucis de pilotage par les acteurs du top &anage&ent$ pour des (esoins
particuliers 0or&uls par des e2perts ou dans des logi7ues de reporting classi7ue de&andes
par les acteurs &tiers$ cette &utation culturelle s'appuie sur la (analisation et l'accessi(ilit
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age A @ A"
tat de l'art : Solutions Open Source Business Intelligence
des tec=nologies Ce($ 7ui rendent cette di'ulgation d'in0or&ation possi(le 8 &oindre co#ts)
.orce est de constater gale&ent 7ue certaines r>gles conceptuelles se sont inconscie&&ent
standardises$ et actuelle&ent le s%st>&e d'in0or&ation dcisionnel peut 9tre sc=&atis sous
trois tapes)
R#gles conceptuelles
Tout d'a(ord$ l'e2traction des donnes) L'entreprise tant co&pose d'in0or&ations aussi
'aries en ter&e de structure$ de 0or&at$ de taille))) le s%st>&e se doit d'e2traire les
in0or&ations a0in de les a&ener 'ers la deu2i>&e tape)
,nsuite$ la consolidation) Ces donnes doi'ent 9tre consolides a0in de pou'oir e00ectuer le
tra'ail ncessaire dessus)
,n0in le traite&ent) Il doit 0ournir au2 dirigeants les in0or&ations pertinentes sous 0or&e
d'indicateurs$ tout en rpondant au2 7uestions 7ue toute &ise en place doit se poser : Juelles
in0or&ations K Sous 7uelle 0or&e K Tous les co&(ien K)))
Open Source
Bien plus 7u'un si&ple cop%rig=t$ la ter&inologie Open Source 3gale&ent connue sous
l'appellation Logiciel Li(re4 re0l>te une certaine p=ilosop=ie) ?ic=ard STALL+AL$ le p>re
0ondateur de la .ree So0tMare .oundation a coutu&e de rsu&er ce 7u'est le Logiciel Li(re par
F Libert@ ,"alit@ :raternit A)
D.inition du Logiciel Libre
Le Logiciel Li(re est ainsi d0ini par :
La li(ert d1utiliser et@ou d1e2cuter un logiciel pour tout o(jecti0)
La li(ert d1e2a&iner et@ou d1tudier le 0onctionne&ent d1un logiciel et de l1adapter 8
ses propres (esoins 3pour ceci l1acc>s au code source est une condition re7uise4)
La li(ert de 0aire des copies pour des tiers)
La li(ert d1a&liorer le logiciel et de rendre ces a&liorations large&ent disponi(les
pour le (ien pu(lic)
2"olution de ce mod#le conomi1ue
Ce &od>le de d'eloppe&ent colla(orati0$ 7ue certains consid>rent encore co&&e utopi7ue et
ne prenant pas en co&pte les logi7ues de &arc=s actuelles$ s'a'>re en ralit 9tre plus 7ue
raliste) ,n e00et$ dans son dition de Nan'ier *!!; du Baro&>tre des tendances *!!"$
l'O(ser'atoire du Logiciel Li(re 3O*L4$ co&pos de AnasOa et du Droupe Cegos$ &et
nota&&ent en 'idence une progression sur un an de B!P des 'entes de ser'eurs sous Linu2$
de B!P gale&ent des 0or&ations (ureauti7ue 3tel OpenO00ice4 et de A!P de celles
concernant la (ase de donnes +%SJL) Ces o(ser'ations re0l>tent un rel engoue&ent pour les
solutions Open Source$ de la part des entreprises 7ui les jugent asseH 0ia(les pour 9tre
i&plantes au sein de leur organis&e)
rit#res de c+oi-
Lan&oins$ une i&plantation de solution Open Source doit se 0aire en prenant en co&pte
certains crit>res de c=oi2$ non pris en considration lors de l'intgration de logiciels
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age " @ A"
tat de l'art : Solutions Open Source Business Intelligence
propritaires car spci0i7ues au &od>le de d'eloppe&ent colla(orati0)
Popularit
La 'isi(ilit sur la toile est$ en plus d'9tre un 0acteur de taille$ un (on outil pour d0inir la
popularit de la solution$ et donc plus de 0acilit 8 trou'er sa co&&unaut)
De la &9&e 0a/on le tau2 de 0r7uentation tant le no&(re de tlc=arge&ent du produit$ il
re0l>te$ de la &9&e 0a/on 7ue la 'isi(ilit sur la toile$ la popularit de la solution)
L'Qge du projet per&et de se 0aire une ide de la &aturit de la solution) Ce crit>re est
nan&oins tr>s su(jecti0 car il n'% a pas de relle pr0rence 8 a'oir entre un projet jeune ou
un 'ieu2)
Documentation
Dans l'open source$ la co&&unaut est la =otline) La taille de la co&&unaut doit 9tre prise
en considration$ et Il con'ient donc de c=oisir des projets a'ec de ric=es 0oru&$ une =o&e
page$ des .AJ ddies et 'isi(les sur le net)
Les aspect de docu&entation per&ettent gale&ent de dlester une (onne partie de la c=arge
de l'7uipe ani&atrice) De plus$ elle peut 9tre considre co&&e un gage de 7ualit)
Dveloppement
Le tau2 d'acti'it concerne le d'eloppe&ent et dsigne le te&ps pass entre deu2 'ersions 3il
ne doit pas e2cder " &ois$ doit 9tre relati'is et co&par au tau2 de 0r7uentation4)
Le no&(re de contri(uteurs doit 9tre distingu de la co&&unaut car il est un garant de la
sta(ilit de la solution$ de sa prennit et de son 'oluti(ilit)
Les co&ptences internes de l'entreprise doi'ent gale&ent 9tre prises en co&pte et il
con'ient de pri'ilgier les projets &aintena(les ou a(orda(les en interne$ et de prendre
gale&ent en co&pte les co&ptences des partenaires)
Dploiement
La porta(ilit et l'interopra(ilit r'>lent la co&pati(ilit de l'application a'ec les 0ic=iers
entrant6sortant$ ainsi 7u'a'ec les di00rents s%st>&es d'e2ploitation)
Le ni'eau de 5acOaging concerne l'installation) ,lle co&porte aussi (ien une docu&entation
d'installation 7u'une d0inition des pr6re7uis)
Droit
Di00rentes licences de logiciels li(re e2istent$ et il con'ient de pri'ilgier D5L et CeCiLL) 'iter
les licences de t%pe F BSD I)
L'Open Source Business Intelligence 3OSBI4
De &9&e 7ue pour les autres classes d'outils 3C?+$ D,D)))4$ le rapproc=e&ent entre Open
Source et Business Intelligence s'a'>re de plus en plus per0or&ant$ et ce depuis 7uel7ues
annes) Bien 7u'a%ant pQti de leur &an7ue de &aturit et de sta(ilit$ les solutions de
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age ; @ A"
tat de l'art : Solutions Open Source Business Intelligence
Business Intelligence Open Source s'a'>rent 9tre actuelle&ent asseH solides pour 9tre
e&plo%es par no&(re d'entreprises et de collecti'its$ et pour possder leur pre&ier salon
pro0essionnel 7ui s'est tenu 8 l'arc=e de la D0ense 8 5aris$ le 1< &ars *!!<)
Organis par +icropole6Uni'ers et l'Arc=e Lu&ri7ue$ ce salon a dress un portrait de l'Open
Source dans le dcisionnel par le (iais de con0rences$ ateliers$ ta(les rondes))) Ani&s par de
no&(reu2 partenaires d'i&portance dont nota&&ent les socits +%SJL$ Talend et NasperSo0t)
Apports et a"antages
L'engoue&ent des entreprises pour ces solutions peut s'e2pli7uer sur plusieurs points)
Intrts financiers
Tout d'a(ord dans une logi7ue de co#ts) Une solution Open Source n'entraGne pas$ de par sa
d0inition &9&e$ de co#ts de licence) ,lle s'a'>rent donc actuelle&ent 9tre une alternati'e plus
7u'intressante pour les socits) De &9&e$ certaines entits telles 7ue les T5,@5+, pro0itent
de cet aspect de par un co#t d'entre &oins onreu2)
Mutualisation des comptences
La possi(ilit de coopration entre entreprises$ a0in de &utualiser les co&ptences et
d'a&oindrir les in'estisse&ents$ tant sur le plan 0inancier 7u'=u&ain) Co&&e le souligne
Ste0ano SCAURRO$ Tec=nical +anager c=eH ,ngineering$ F Les entreprises sont aussi bien en
concurrence sur certains domaines et en collaboration sur d'autres@ ce qui cre un co systme
de &aleurs oC c(acun doit trou&er sa place et Douer son rEle I)
Tester la solution
La possi(ilit de tester le logiciel a'ant d'in'estir dedans$ et ce sans li&ite de te&ps ou de
0onctionnalit) L'entreprise peut ainsi s'aperce'oir d'elle &9&e$ sans (iais co&&ercial ou
li&itation$ de la pertinence de la solution) Cette logi7ue d'a'ant 'ente se 0ait de 0ait par les
utilisateurs 7ui ne se tournent ensuite 'ers les SSLL 7ue pour des (esoins de connaissances et
de 0or&ations)
Personnalisation et innovation
5ersonnalisation et inno'ation sont gale&ent des 0acteurs cle0s de ce c=oi2) ,n e00et$ outre
l'inno'ation entraine par le d'eloppe&ent colla(orati0$ Stp=ane LAISL,$ ?esponsa(le
d'tude de solutions c=eH Lectra souligne 7ue F l'Open Source permet une relle collaboration
car le client apporte &raiment sa touc(e en donnant sa &ision de la solution@ ce qui permet
d'une part de la personnaliser mais "alement de la faire &oluer en ce sens I)
Perspecti"es
Bien 7ue des co&posants co&&e les ,TL ou les (ases de donnes s'a'>rent 9tre les plus
a(outis$ les outils Open Source de Business Intelligence doi'ent encore s'enric=ir sur des
aspects &tiers et 0onctionnels$ et arri'er 8 &aturit sur certaines (ri7ues logicielles)
Lan&oins$ l'arri'e de di00rents acteurs sur ce &arc=$ ainsi 7ue la &arc=e de progression
possi(le de par sa 0ai(le part dans la BI$ nous autorise 8 en'isager une 'olution grandissante)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age < @ A"
tat de l'art : Solutions Open Source Business Intelligence
Les outils dcisionnels
Contraire&ent au2 autres applications s'intgrant 8 d'autres 0onctions de l'entreprise$ co&&e
par e2e&ple les SC+ 7ui g>rent la c=aGne logisti7ue ou les C?+ 7ui s'occupent de la relation
client$ l'In0or&ati7ue Dcisionnelle est co&pose de plusieurs outils 7ui$ i&(ri7us les uns au2
autres ou utiliss spar&ent$ conduisent 8 crer un 'rita(le s%st>&e dcisionnel) Lous
'errons donc ici les di00rents co&posants de ce do&aine$ en partant de la couc=e la plus
in'isi(le de l'ice(erg$ jus7u'8 sa partie la plus 'isi(le)
E-tract Trans.orm Load 3ETL4
Un ,TL$ pour ,2tract Trans0or& Load$ est utilis pour ali&enter le Data Care=ouse 8 partir des
(ases de donnes de production)
Co&&e son no& l'indi7ue$ un ,TL :
,2tract : e2trait les donnes 8 partir de di00rentes sources)
Trans0or& : trans0or&e ces derni>res a0in de les uni0ier sous un &9&e 0or&at)
Load : c=arge les donnes dans le Data Care=ouse)
Les intr9ts d'un ,TL sont &ultiples :
Il peut prendre en c=arge di00rentes natures de sources 3SDBD relationnels$ 0lu2 E+L$
0ic=iers CSS)))4$ 7ue ce soit en entre co&&e en sortie)
L'intgration d'un nou'eau 0lu2 ne ncessite pas de d'eloppe&ent spci0i7ue$ une
con0iguration interacti'e$ par le (iais d'inter0ace grap=i7ue$ des B tapes 'ues
prcde&&ent su00it)
L'intgration d'outil de plani0ication$ au sein &9&e des ,TL$ per&et d''iter le
d'eloppe&ent de progra&&es (atc= spci0i7ues$ ainsi 7ue leur &aintenance)
Il est cependant i&portant de souligner 7u'un ,TL 0onctionne sous un &ode +oint B +oint) Bien
7u'il rcup>re les donnes de plusieurs sources$ il n'a pas pour 'ocation de construire un 0lu2
agrg entre deu2 sources di00rentes)
A0in de ne pas reto&(er dans les erreurs du pass 3c=ec de ralisation$ dpasse&ent de
(udget)))4 relati'es 8 la &ise en place de projets dcisionnels$ il est i&prati0 d'apprcier 8 sa
juste 'aleur cette p=ase de collecte et de prparation des donnes$ et ainsi d'% consacrer les
ressources ncessaires) A titre in0or&ati0$ cette p=ase doit reprsenter en'iron les T te&ps du
projet)
Data 5are+ouse et Data 6art
Littrale&ent entrepot de donnes$ Le Data Care=ouse est une (ase de donnes recueillant et
grant toutes les donnes collectes au sein de l'organis&e$ dans le cadre de la prise de
dcision)
,n ce sens$ elle est :
,2clusi'e&ent rser'e 8 cet usage)
Organise$ structure et prpare 8 des 0ins de traite&ent dcisionnel)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age @ A"
tat de l'art : Solutions Open Source Business Intelligence
Ali&ente en donnes depuis les (ases de production a l'aide d'outils de t%pe ,TL)
Bill I&&on$ p>re du concept du Data Care=ouse$ le dcrit co&&e tel :
'' SubDect oriented@ inte"rated@ non&olatile@ time &ariant collection of data in support of
mana"ement decisions '' F uildin" t(e Data >are(ouse@ ;o(n >iley and son@ .99$
Il doit donc rpondre 8 : caractristi7ues essentielles :
1) Orient su!et / les donnes sont organises par t=>&e)
*) Intgr / les donnes pro'enant de sources =trog>nes$ elles utilisent c=acune un
t%pe de 0or&at) ,lles doi'ent donc 9tre intgres a'ant d'9tre proposes 8 utilisation)
B) 7on "olatile / les donnes ne disparaissent pas et ne c=angent pas au 0il des
traite&ents$ au 0il du te&ps)
:) 0istoris / les donnes sont =orodates$ a0in de 'isualiser l''olution dans le te&ps
d'une 'aleur donne)
Le degr de dtail de l'arc=i'age est (ien entendu relati0 8 la nature des donnes) Toutes les
donnes ne &ritent pas d'9tre arc=i'es)
Il e2iste plusieurs natures de Data Care=ouse possi(les 3(ases relationnelles$ (ases OLA5$
(ases =%(rides)))4) Lous ne les recenserons pas ici &ais proposerons plutUt ce ta(leau &ettant
en a'ant les caractristi7ues di00renciant les Data Care=ouse et les (ases de donnes
relationnelles classi7ues)
omparati. entre Base de Donnes etData 5are+ouse
aractristi1ue Base de Donnes Data 5are+ouse
Opration Destion courante)
5roduction)
Anal%se)
Support 8 la dcision)
Modle de donnes ,ntit @ relation) BL.)
,toile)
.locon de neige)
Normalisation .r7uente) 5lus rare dans les Data
+arts)
Donnes Actuelles)
Brutes)
Vistorises)
5ar0ois agrges)
Mise jour I&&diate)
Te&ps rel)
Sou'ent di00re)
Niveau de
consolidation
.ai(le) ,le')
Perception Bidi&ensionnelle) +ultidi&ensionnelle)
Oprations Lecture)
+ises 8 jour)
Suppressions)
Lectures)
Anal%ses croises)
?a0raGc=isse&ents)
Taille ,n giga6octets) ,n tra6octets)
Source : >i=ipdia
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1! @ A"
tat de l'art : Solutions Open Source Business Intelligence
ubes OLAP
Le concept OLA5 3On Line Anal%tical 5rocessing4 a t d0ini en 1B par le Dr ,0 Codd) Ce
dernier doit respecter 1* r>gles de conception :
6ultidimensionalit / le &od>le OLA5 l'est par nature)
Transparence / l'e&place&ent p=%si7ue du ser'eur OLA5 est transparent pour
l'utilisateur)
Accessibilit / l'utilisateur OLA5 dispose de l'accessi(ilit 8 toutes les donnes
ncessaires 8 ses anal%ses)
Stabilit / la per0or&ance des reportings reste sta(le indpenda&&ent du no&(re de
di&ensions)
lient8Ser"eur / le ser'eur OLA5 s'int>gre dans une arc=itecture de la sorte)
Dimensionnement / il est gnri7ue$ a0in de ne pas 0ausser les anal%ses)
9estion compl#te / le ser'eur OLA5 assure la gestion des donnes clairse&es)
6ulti8utilisateurs / le ser'eur OLA5 o00re un support &ulti6utilisateurs 3gestion des
&ises 8 jour$ intgrit$ scurit)))4)
Inter Dimension / Le ser'eur OLA5 per&et la ralisation d'oprations inter di&ensions
sans restriction)
Intuiti. / Le ser'eur OLA5 per&et une &anipulation intuiti'e des donnes)
:le-ibilit / La 0le2i(ilit 3ou souplesse4 de l'dition des rapports est intrins>7ue au
&od>le)
Anal*se sans limites / Le no&(re de di&ensions et de ni'eau2 d'agrgation possi(les
est su00isant pour autoriser les anal%ses les plus pousses)
Cette notion a 'u le jour du 0ait 7ue les (ases de donnes de t%pe relationnel 3SDBD?4 sont
inadaptes au2 (esoins dcisionnel) ,n e00et$ les re7u9tes dcisionnelles$ particuli>re&ent
co&ple2es par principe$ &o(ilisent a(usi'e&ent les ressources &ac=ines et pertur(ent les
traite&ents de production)
Les outils OLA5 per&ettent de &odliser l'acti'it d'une entreprise sui'ant des a2es ou
para&>tres$ rpondant ainsi 8 ces contraintes) 5our ce 0aire$ la structure de donnes construite
est par0ois appel sc(ma en toile$ du 0ait de sa 0or&e :
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 11 @ A"
,xemple de modle de donnes en toile
TE6PS
IDWT,+5S
Date
PRODUIT
IDW5?ODUIT
LO+W5?ODUIT
POI7T DE
;E7TE
IDW5S
AD?W5S
;E7DEUR
IDWS,LD,U?
LO+WS,LD,U?
5?,LO+WS,LD,U?
;E7TE
IDWT,+5S
IDW5?ODUIT
IDW5S
IDWS,LD,U?
Juantite
5ri2
tat de l'art : Solutions Open Source Business Intelligence
Lous pou'ons ainsi distinguer deu2 t%pes de ta(les :
Celles 0or&ant les (ranc=es des toiles$ utilises co&&e crit>res d'anal%se) ,lles sont
appeles dimensions ou axes)
Celle 7ui 0or&e le centre de l'toile) Appele table de fait$ elle contient les indicateurs$
gale&ent appels mesures)
Ces indicateurs sont donc 0onctions des di00rentes di&ensions$ c'est pour cela 7ue l'on
e&ploie le ter&e &ultidi&ensionnel)
Si l'on reprsente cette conceptualisation sous 0or&e sc=&ati7ue$ on o(tient ce t%pe de
grap=i7ue :
La reprsentation de cette (ase de donnes donne donc un Cu(e) On appelle 'ube OL)+ une
reprsentation des donnes selon des a2es) Cette structure prsente de no&(reu2 a'antages
pour des applications de Business Intelligence$ en particulier grQce 8 sa capacit 8 0aire
'oluer$ recalculer et trans0or&er les ta(leau2 de (ord) Le concept OLA5 s1est spcialis a'ec
di00rentes dclinaisons : &ultidi&ensionnelles$ =%(rides$ desOtopX Le Cu(e co&plet est
appel population d'analyse) D>s 7u'on dpasse trois di&ensions$ on parle d'(ypercube)
Dans la &esure oY toutes les cases du Cu(e ne seront pas 0orc&ent re&plies 3e2) : tel point
de 'ente ne 'end pas tel produit4$ il est possi(le d'indi7uer au &oteur OLA5 les
caractristi7ues d'une 'aria(le$ di&ension dense ou parse$ a0in d'opti&iser la gestion de
l'espace dis7ue et l'acc>s au2 donnes)
Il peut 9tre intressant de d0inir des (irarc(ies sur les di&ensions) Ainsi$ l'a2e Te&ps pourra
se dcouper en jour$ se&aine$ &ois))) ,t de &9&e pour 5oint de Sente 7ui pourra se dcouper
en 'ille$ canton$ dparte&ent))) On utilisera les ter&es parents$ enfants))) pour dcrire les
di00rents ni'eau2 entre eu2)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1* @ A"
Te&ps
5roduits
5oints de Sente
5rod) A 5rod) B 5rod) C 5rod) D
.9'rier
A'ril
+ars
Nan'ier
L%on 5aris Lantes +ontpellier
,xemple de 'ube OL)+
tat de l'art : Solutions Open Source Business Intelligence
Ainsi$ le &od>le conceptuel dcoulant de ces di00rentes =irarc=ies donne :
La structure de cette (ase de donnes$ dans la &9&e ligne 7ue l'appellation sc(ma en
toile$ est appele sc(ma en flocons)
Sous cette 0or&e l8$ les seuls indicateurs possi(les sont donc$ co&&e 'u prcde&&ent$ la
7uantit et le pri2) Lan&oins$ il n'est pas ncessaire de d0inir$ 8 l'origine$ tous les indicateurs
possi(les) Ainsi$ d'autres indicateurs$ non stocOs 8 la (ase$ seront calculs 8 partir de ceu2
stocOs$ selon certains calculs) Ils sont sou'ent appels formules)
Anal*se multidimensionnelle
L'anal%se &ultidi&ensionnelle s'e00ectue 8 partir des Cu(es OLA5) Les Cu(es OLA5$ co&&e 'u
prcde&&ent$ co&portent de no&(reu2 dou(lons du 0ait de leur structure) Il con'ient donc
d'agrger certaines donnes a0in de 0aciliter la co&pr=ension des rsultats)
Les jeu2 d'in0or&ations sont caractriss par :
Des attributs$ 7uali0iant l'in0or&ation 3r0rence client$ date$ rgion )))4)
Des "randeurs$ portant l'in0or&ation 7uantitati'e 37uantits$ pri2)))4)
On distingue gale&ent :
Des grandeurs cu&ula(les 3&ontant$ no&(re d'ite&s)))4)
Des grandeurs non cu&ula(les 3Qge$ date)))4)
Les attri(uts constituent les a2es potentiels d'anal%se) Lan&oins$ la redondance de certaines
in0or&ations$ (ien 7ue ncessaire dans un pre&ier te&ps$ est telle 7u'il est ncessaire
d'agrger dans un second te&ps$ certaines donnes en 0onction d'a2es potentiels d'anal%se
d0inis$ les plus pertinentes tant gnrale&ent les grandeurs cu&ula(les)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1B @ A"
,xemple de modle de donnes en flocons
<OUR
IDWNOU?
D,SCWNOU?
6OIS
IDW+OIS
D,SCW+OIS
SE6AI7E
IDWS,+AIL,
D,SCWS,+AIL
,
TE6PS
IDWT,+5S
IDWNOU?
IDW+OIS
IDWS,+AIL,
;E7TE
IDWT,+5S
IDW5?ODUIT
IDW5S
IDWS,LD,U?
Juantite
5ri2
POI7T DE ;E7TE
IDW5S
IDWSILL,
;ILLE
IDWSILL,
IDWCALTOL
D,SCWSILL,
A7TO7
IDWCALTOL
D,SCWCALTOL
tat de l'art : Solutions Open Source Business Intelligence
L'anal%se &ultidi&ensionnelle 8 propre&ent parler consistera 8 slectionner les a2es
d'anal%ses sou=aits$ ainsi 7ue leur ordre) C=a7ue =irarc=isation d'a2es d1anal%se correspond
8 une 7uestion 7ue l1on se pose$ et il n'est pas 0orc&ent ncessaire de les utiliser tous)
Les a2es sont gale&ent scinds selon deu2 t%pes :
A 'aleur discr>te$ 3ou discontinues4 : d0inis par un no&(re 0ini de 'aleurs 3code postal$
seg&ent CS5)))4)
A 'aleurs continues 3date$ pri2)))4)
Il est plus intressant de disposer d'a2es 8 'aleur discr>te$ plus ais&ent &anipula(les) Ainsi$
on ra&>nera$ autant 7ue 0aire ce peut$ les 'aleurs continues en 'aleurs discr>tes 3en
d0inissant des tranc=es par e2e&ple4)
Data 6ining
Jue l'on peut traduire par fora"e de donnes$ le Data +ining consiste donc 8 0orer dans un
grand 'olu&es de donnes a0in d'en e2traire des in0or&ations pertinentes pour le dcideur)
Le point i&portant du Data +ining est 7ue l'utilisateur ne sait pas ce 7u'il c=erc=e) ,n e00et$ les
outils de Data +ining rec=erc=ent$ de &ani>re se&i6auto&atiss$ des corrlations in&isibles
entre des donnes n'a%ant 8 priori aucun lien entre elles)
L'utilit &9&e du Data +ining peut 9tre co&prise par l'e2e&ple 3plus ou &oins lgendaire4
Call6+art) Cette entreprise A&ricaine$ spcialise dans la grand distri(ution$ utilisa les
pre&i>res tec=ni7ues de Data +ining sur leurs donnes produits) Ainsi$ les rsultats de ces
rec=erc=es &irent en a'ant une corrlation entre les 'entes de couc=es et celles de (i>res le
sa&edi apr>s6&idi) Apr>s anal%se$ il s'a'ra 7ue le lien entre ces deu2 produits tait induit par
le 0ait 7ue le sa&edi apr>s6&idi$ pour les couples a%ant un ou plusieurs en0ants en (as Qge$ les
0e&&es dl>guaient les courses 8 leur &ari) Ces derniers ac=etaient ainsi les couc=es pour
leur nourrissons$ ainsi 7ue des (i>res pour eu26&9&es) De ce 0ait$ une rorganisation de
l'agence&ent des ra%ons$ &ettant cUte 8 cUte les ra%ons couc=es et (i>res$ 0irent gri&per les
'entes de ces derni>res en 0l>c=e)
Cet e2e&ple du Data +ining est tout particuli>re&ent lo7uent car il &et en a'ant les points
essentiels de cet outil :
1) Ce n'est pas l'utilisateur 7ui c=erc=e des rponses 8 des 7uestions spci0i7ues &ais
l'application 7ui &et en 'aleur des a2es de r0le2ion 8 sui're)
*) Cet outil est particuli>re&ent adapt au traite&ent de grands 'olu&es de donnes)
B) Une anal%se des rsultats o(tenus doit 9tre e00ectue a0in de d0inir$ d'une part 7uel
t%pe de relation se cac=e derri>re ces rsultats 3cause 8 e00ets$ rsultante d'une cause
conjointe)))4$ et d'autre part les causes de cette relation)
:) L'in0or&ation pertinente$ rsultante de cette anal%se$ doit a(outir 8 des prconisations
utilisa(les par le dcideur)
Il en dcoule ainsi plusieurs points :
1) Le Data +ining est plus considr co&&e un art 7ue co&&e une science$ car sa
pertinence rside dans l'anal%se e00ectue$ et les rsultats 7ui en dcoulent$ sur les
donnes retournes)
*) Il s'utilise sur un 'olu&e de donnes i&portant$ dont une c=ronologie peut 9tre ta(lie
3t%pi7ue&ent des Data Care=ouse4$ 8 contrario de l'anal%se statisti7ue)
B) Cette tec=ni7ue peut tout aussi (ien 9tre utilise 8 des 0ins e2plicati'es 7ue dans un
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1: @ A"
tat de l'art : Solutions Open Source Business Intelligence
o(jecti0 prdicti0)
Il e2iste ainsi non pas une tec=ni7ue de Data +ining &ais plusieurs$ c=acune reposant sur des
algorit=&es &at=&ati7ues (ien spci0i7ues$ 8 c=oisir en 0onction des rsultats esco&pts :
Les &t=odes utilisant les tec=ni7ues de classi0ication et de seg&entation)
Les &t=odes utilisant des principes d'ar(res de dcision asseH proc=es des tec=ni7ues
de classi0ication
Les &t=odes 0ondes sur des principes et des r>gles d'associations ou d'analogies
Les &t=odes e2ploitant les capacits d'apprentissage des rseau2 de neurones
Les algorit=&es gnti7ues$ utiliss pour les tudes d''olution des populations)
Une utilisation per0or&ante des outils de Data +ining ncessite B conditions o(ligatoires$
c=acune possdant ses contraintes :
Une collecte des donnes co&pl>te$ &inutieuse et 0ia(le 3longue et co#teuse4)
Une tude des rsultats appro0ondie$ 8 &ettre en relation a'ec d'autres tec=ni7ues
d'anal%se 3ncessite du te&ps et des co&ptences4)
Une a(sence de rponse du s%st>&e ne doit pas 9tre s%st&ati7ue&ent considre
co&&e une ngation) Il peut par0ois indi7uer la ncessit d'a(order le pro(l>&e sous
un autre angle 3ncessite du te&ps et le recul ncessaire4)
9nrateur d'tat
Le gnrateur d'tat per&et de raliser des tats$ appels gale&ent reportin"$ 7ui sont des
rapports prsentant de &ani>re s%nt=ti7ue et lisi(le des donnes$ sous 0or&e de ta(leau2 de
c=i00res$ tout en grant la &ise en page 3en6t9te$ pied de pages)))4)
D'une &ani>re gnrale$ le 0onctionne&ent d'un gnrateur d'tat se dcline sous : p=ases :
1) O(tention d'un 0ic=ier &od>le E+L)
*) Construction d'un rapport 8 partir du &od>le)
B) ?e&plissage du &od>le 8 l'aide des sources de donnes)
:) ,2portation sous di00rents 0or&ats)
Lous pou'ons ainsi le sc=&atiser de la sorte :
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1A @ A"
Sc(ma de fonctionnement d'un "nrateur d'tat
+oteur de reporting
Outil de designer
+od>le E+L
?apport re&pli
.ic=iers Base de donnes
Etape
(
Etape
%
Etape
=
Etape
>
tat de l'art : Solutions Open Source Business Intelligence
La particularit d'un gnrateur d'tat est 7u'il peut se dcliner sous deu2 aspects :
Interacti. / l'utilisateur pourra tout aussi (ien gnrer un tat en le dclinant sous
plusieurs 'ariantes 3anne$ produit$ rgion)))4)
:ig / les r>gles de gestion sont d0inies 8 la (ase et l'utilisateur ne se ser'ira de
l'application 7ue dans un &ode Client6Ser'eur)
Cette particularit induit ainsi deu2 &odes de conception dia&trale&ent opposs :
Dans le &ode interacti0$ la p=ase de para&trage et de production ne re7uiert aucune
e2pertise particuli>re car elle est sous le contrUle de l'utilisateur 0inal)
Dans le &ode 0ig$ a contrario$ l'utilisateur ne peut &odi0ier les para&>tres des tats)
La conception initiale ncessite donc une e2pertise spci0i7ue et rigoureuse)
Il est cependant plus intressant de &ettre 8 disposition des gnrateurs d'tat 0igs) Bien 7ue
cette orientation ncessite un co#t plus i&portant$ aussi (ien en ter&e de te&ps 7ue d'argent$
et 7u'elle rigidi0ie les possi(ilits d'utilisation$ l'e2prience &ontre 7ue les utilisateurs ont en
gnral d'autres priorits 7ue celles de l'apprentissage de l'application et de la d0inition des
ses para&trages)
Le principal incon'nient des gnrateurs d'tats 'ient de leur utilisation) ,n e00et$ (ien 7u'ils
per&ettent au dcideur de disposer d'une 'ue d'ense&(le prcise de son organisation$ ils sont
plus utiliss a0in de rendre des co&ptes) Cela s'inscrit dans une logi7ue de &anage&ent par le
contrUle$ et non dans celle de la Business Intelligence)
Il e2iste gale&ent des gnrateurs de grap=i7ues 7ui$ co&&e leur no& l'indi7ue$ per&ettent
la 'isualisation des donnes sous 0or&e de grap=es) Lan&oins$ (ien 7ue certains docu&ents
distinguent ces outils des gnrateurs d'tats$ nous ne 0erons pas la di00rence dans cet
ou'rage car la plupart de ces gnrateurs sont actuelle&ent utiliss co&&e des &oteurs
grap=i7ues i&pl&ents directe&ent dans les gnrateurs d'tats)
Point important / il ne 0aut pas con0ondre reporting et ta(leau de (ord) Le pre&ier est
gnr par le gnrateur d'tat alors 7ue le second propose une 'ision plus glo(ale)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1" @ A"
tat de l'art : Solutions Open Source Business Intelligence
S*nt+#se
Apr>s a'oir d0ini les di00rents outils$ nous proposerons ici une 'ue d'ense&(le de leurs
articulations et de leur liens$ sous une reprsentation grap=i7ue t=ori7ue)
Cette reprsentation est sc=&ati7ue) ,n e00et$ elle illustre d'une &ani>re glo(ale les
di00rentes interactions entre c=a7ue outil) ,lle doit 9tre considrer co&&e un socle d'anal%se
et non co&&e une 'rit a(solue) C=a7ue cas d'i&pl&entation d'une solution de Business
Intelligence est uni7ue$ et doit 0aire l'o(jet d'une tude des (esoins) Ainsi$ il n'est pas rare de
'oir de no&(reu2 s%st>&es d'in0or&ation dcisionnels dpour'us de solution de Data +ining$
ou (ien encore d'en rencontrer oY les donnes 8 anal%ser tant uni7ue&ent stocOes dans une
(ase de donnes relationnelle$ les gnrateurs d'tats tra'aillent directe&ent dessus sans
passer par un ,TL$ un Data Care=ouse et un Data +art) Ainsi$ il est (on d'a'oir une
reprsentation glo(ale des di00rents l&ents de Business Intelligence &ais elle doit 9tre
adapter au2 di00rents cas et conte2tes rencontrs)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1; @ A"
BD Interne
BD ,2terne
.ic=iers TET$
CSS)))
Source de
Donnes
Dnrateur
d'tat
Anal%se
+ultidi&ensionnelle
Data +ining
Ta(leau2 de
(ord
E-traction Stoc?age Restitution
#prsentation d'un sytme d'information dcisionnel
,TL
Data +art
Data Care=ouse
Data +art
Data +art
Cu(e OLA5
tat de l'art : Solutions Open Source Business Intelligence
Les solutions dcisionnelles
Lous anal%serons dans cette partie un panel des solutions e2istants dans le dcisionnel$ en
dcri'ant les aspects tec=ni7ues$ les 0onctionnalits des outils et les caractristi7ues glo(ales
des co&&unauts s'articulant autour)
ETL
lo"er$ETL
Clo'er),TL est un ,TL Open Source$ (as sur un 0ra&eMorO Na'a 7ui peut 9tre
utilis pour trans0or&er des donnes structures) Il peut 9tre utilis seul$
co&&e un ser'eur d'application$ ou peut 9tre e&(ar7u dans d'autres
applications$ co&&e une li(rairie de trans0or&ation)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de B ans)
Bonne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par OpenS%s$ un ad&inistrateur et si2
d'eloppeurs ont claire&ent taient identi0is)
Taille de la co&&unaut et 'isi(ilit Internet asseH
0ai(le)
Tau2 de 0r7uentation tr>s (on)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
.ai(le ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Tr>s (on)
0/ a&ril /00*
!ccs au" donnes
L'acc>s au2 donnes est so&&e toute juste &o%en) Bien 7ue reconnaissant la plupart des
0ic=iers plats$ 0ournissant un outil de cration de re7u9tes$ per&ettant leur e2cution et a%ant
une tr>s (onne reconnaissance des (ases de donnes$ il ne g>re pas les relations a'ec les
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1< @ A"
tat de l'art : Solutions Open Source Business Intelligence
cu(es OLA5 et ne per&et pas la lecture et l'criture de t%pes de donnes co&ple2es)
#aractristi$ues spcifi$ues
Il ne poss>de 7ue de 0ai(les caractristi7ues spci0i7ues$ co&&e un outil de de(ugging$ &ais
ne per&et pas la gnration de docu&entation 0onctionnelle ou tec=ni7ue) De plus$ il ne
poss>de pas d'outil d'anal%se d'i&pact$ contraire&ent 8 d'autres ,TL)
Dclenchement des processus
Aucun dclenc=e&ent des processus n'est possi(le$ ni leur plani0ication)
Dploiement et mise en production
Une 0acilit de dploie&ent et de &ise en production et cependant 8 noter) Bas sur ,clipse
?C5$ le code est 'isi(le et autono&e$ ce 7ui per&et de ne pas a'oir ncessaire&ent 8 l'installer
sur les ser'eurs de production) Lan&oins$ aucune 'isualisation de l'=istori7ue de &ise en
production n'est possi(le)
Traitement des donnes
Le traite&ent des donnes est asseH 0ai(le) Il est certes possi(le d'ajouter de nou'elles
trans0or&ations et processus &tiers$ &ais le &an7ue de certaines 0onctions nati'es$ telles
7ue la trans0or&ation des dates$ des no&(res ou de statisti7ues de 7ualit se 0ait ressentir)
%curit
Le ni'eau de scurit est asseH 0ai(le$ il se (ase uni7ue&ent sur celle du SDBD utilis)
Lan&oins$ certaines 0onctions de (ase co&&e la gestion auto&atise des logs et des
s%st>&es de test ou de de(ugging sont prsentes)
#onclusion
,ncore asseH jeune$ il n'apparaGt pas co&&e su00isa&&ent &ature pour 9tre utilis) Les
caractristi7ues tec=ni7ues approc=ent 0ai(le&ent la &o%enne de ce 7ui se 0ait et la scurit
n'est pas au rendeH 'ous) Il est pour le &o&ent rser' 8 une utilisation personnelle et pour
spcialiste &ais poss>de une co&&unaut 0lorissante et tr>s acti'e) Il con'ient de sui're son
'olution car ses perspecti'es$ nota&&ent de par son intgration dans O(jectCe($ peu'ent
s'a'rer intressantes) A sui're)))
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age 1 @ A"
tat de l'art : Solutions Open Source Business Intelligence
En+*dra Octopus
,n=%dra Octopus est un ,TL (as sur du Na'a) Il peut se connecter 8 n'i&porte
7u'elle source de donnes 'ia NDBC et ralise les trans0or&ations d0inies en 0ic=ier
E+L)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de " ans)
+au'aise docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par Toget=er Tea&lZsungen ,DS6
Dienstleistungen D&(V$ trois ad&inistrateurs et 7uatre
d'eloppeurs ont claire&ent taient identi0is)
Taille de la co&&unaut et 'isi(ilit Internet asseH
0ai(le)
Tau2 de 0r7uentation non co&&uni7u)
7i"eau d'accessibilit
5as d'inter0ace grap=i7ue$ ni de traduction .ran/aise)
.ai(le ni'eau de pacOaging)
OS Indpendant)
Tau- d'acti"it
,n c=ute li(re depuis *!!:)
0/ a&ril /00*
!ccs au" donnes
De &9&e 7ue pour Clo'er),TL$ l'acc>s au2 donnes s'a'>re 9tre tout juste &o%en) De
caractristi7ues asseH si&ilaires$ il se di00rencie par le 0ait 7u'il ne dispose pas d'outil de
cration de re7u9te)
#aractristi$ues spcifi$ues
Il ne poss>de aucune relle caractristi7ue spci0i7ue et aucun &o%en de dclenc=e&ent de
processus)
Dclenchement des processus
Son dploie&ent est cependant asseH (on) Bas sur Na'a$ son code est gale&ent 'isi(le et
autono&e et ne per&et pas la 'isualisation de l'=istori7ue de &ise en production)
Traitement des donnes
Le traite&ent des donnes est asseH 0ai(le$ de &9&e 7ue pour Clo'er),TL$ 8 la di00rence
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *! @ A"
tat de l'art : Solutions Open Source Business Intelligence
nota(le 7ue ,n=%dra Octopus poss>de nati'e&ent des 0onctions de trans0or&ations de dates et
de no&(res)
%curit
Le ni'eau de scurit est asseH 0ai(le$ il se (ase uni7ue&ent sur celle du SDBD utilis)
Lan&oins$ certaines 0onctions de (ase co&&e la gestion auto&atise des logs et des
s%st>&es de test ou de de(ugging sont prsentes)
#onclusion
L'a pour &rite 7ue le 0ait d'a'oir t l'un des prcurseur dans le do&aine des ,TL Open
Source) De 0ai(les caractristi7ues tec=ni7ues et scuritaires$ un ni'eau d'accessi(ilit tr>s
&au'ais et une co&&unaut sur le dclin depuis *!!:) ,TL 8 'iter)
Penta+o Data Integration 3e-$ @ettle4
5enta=o Data Integration est un puissant ,TL a%ant pour o(jecti0 de 0aire
le lien entre Business et Tec=nologies de l'In0or&ation$ une trans0or&ation
des donnes de l'entreprise en pro0its)
Fiche didentit
aractristi1ues gnrales de la solution
Intgr 8 5enta=o depuis * ans)
Tr>s (onne docu&entation)
Distri(u sous +oHilla 5u(lic Licence 1)1
ommunaut
Sponsoris par 5enta=o$ ad&inistrateurs et 1
d'eloppeurs ont claire&ent taient identi0is)
Tau2 de 0r7uentation et 'isi(ilit Internet tr>s (on)
Taille de la co&&unaut di00icile 8 dter&iner car relie
directe&ent 8 la suite dcisionnelle 5enta=o)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
Dispose d'une traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
AsseH &odeste)
0/ a&ril /00*
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *1 @ A"
tat de l'art : Solutions Open Source Business Intelligence
!ccs au" donnes
5enta=o Data Integration se r'>le 9tre un outil per0or&ant en ce 7ui concerne l'acc>s au2
donnes) ,n e00et$ =or&is la possi(ilit de lier des 0ic=iers plats de t%pe CSS$ ELS))) Il per&et la
liaison a'ec les cu(es OLA5 +ondrian) De plus$ certains connecteurs sont dj8 e2istant$ co&&e
SA5$ ce 7ui 'ite leur &ise en relation &anuelle) Il peut gale&ent 9tre li 8 des Ce( Ser'ices)
#aractristi$ues spcifi$ues
Il ne poss>de pas de grande caractristi7ue spci0i7ue) Le seul point positi0 est 7u'il est
possi(le de disposer d'outils d'anal%se d'i&pact et de de(ugging)
Dclenchement des processus
Le dclenc=e&ent par processus est disponi(le sous deu2 0or&es) L'une est par t%pe de
polling$ l'autre est par plani0ication des e2cutions$ 8 l'aide de 5an et [itc=en)
Dploiement et mise en production
Son dploie&ent est cependant asseH (on) Bas sur SCT$ son code n'est &al=eureuse&ent
pas 'isi(le$ ni autono&e$ ce 7ui ncessite de disposer d'un co&posant pour 0aire tourner les
No(s)
Traitement des donnes
Le traite&ent des donnes est tout juste &o%en) Vor&is la possi(ilit d'ajouter de nou'elles
trans0or&ations et processus &tiers$ il est gale&ent possi(le d'e00ectuer des jointures
e2ternes)
%curit
Le ni'eau de scurit est s#re&ent le &eilleur des ,TL tudis dans cet ou'rage) La &ise en
place d'une console d'ad&inistration per&et un ni'eau de scurit i&portant$ tant au ni'eau
de l'acc>s au2 &tadonnes 7ue sur celui de la cration de scnarios et &9&e sur leur &ise 8
jour) De plus$ une gestion auto&atise des logs ainsi 7ue des s%st>&es de test et de
de(ugging)
#onclusion
Ancienne&ent [ettle$ poursuit une ascension des plus 0ortes depuis 7u'il a rejoint le projet
5enta=o) .ort de caractristi7ues tec=ni7ues et d'un ni'eau de scurit plus 7ue (on$ il peut
gale&ent se 'anter d'9tre d'un e2cellent ni'eau d'accessi(ilit) Il p9c=e nan&oins par ce 7ui
0ait sa 0orce : la suite Dcisionnelle 5enta=o) ,n e00et$ il n'e2iste pas relle&ent de
co&&unaut propre 8 cet ,TL &ais plutUt une glo(ale concernant la suite Dcisionnelle$ ce 7ui
e2pli7ue son 0ai(le tau2 d'acti'it) Bien 7u'tant une e2cellente solution$ elle s'inscrira plutUt
dans une perspecti'e d'intgration glo(ale de la suite Dcsionnelle 5enta=o 7ue pour une
utilisation seule)
Talend Open Studio 3TOS4
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age ** @ A"
tat de l'art : Solutions Open Source Business Intelligence
Talend Open Studio est dot de capacits a'ances 7ui a&liorent
grande&ent la producti'it des &od>les d'intgration de donnes$ et ce tout
en conser'ant une 2ecution opti&ale)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de B ans)
Bonne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par Talend$ B ad&inistrateurs et 1<
d'eloppeurs ont claire&ent taient identi0is)
Taille$ tau2 de 0r7uentation et 'isi(ilit Internet tr>s
(on)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
Dispose d'une traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Tr>s (on 3en'iron une nou'elle 'ersion tous les &ois4)
0/ a&ril /00*
!ccs au" donnes
Talend Open Studio poss>de les caractristi7ues tec=ni7ues les plus per0or&antes des ,TL
traites ici) L'acc>s au2 donnes est 7uasi&ent par0ait) ,n e00et$ il g>re aussi (ien les 0ic=iers
plats 7ue les cu(es OLA5$ dispose d'un outil de cration de re7u9te$ et est dot de connecteurs
nati'e&ent$ tel Sugar C?+ et Sales.orce) De plus$ il peut gale&ent se connecter 8 des
sources de donnes co&ple2es co&&e les donnes cartograp=i7ues)
#aractristi$ues spcifi$ues
Vor&is les spci0icits standards de gnration de docu&entation$ le point intressant de TOS
est la possi(ilit de co&(iner l'approc=e ,TL classi7ue a'ec celle de l',LT) Cette derni>re
per&et d'utiliser les ressources du SDBD? pour e2cuter les trans0or&ations$ ce 7ui per&et
ainsi de di&inuer considra(le&ent les ressources ncessaires)
Dclenchement des processus
La plupart des dclenc=e&ents de processus sont disponi(les$ 7ue ce soit par &essage ou par
polling) Il est gale&ent possi(le de plani0ier les e2cutions)
Dploiement et mise en production
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *B @ A"
tat de l'art : Solutions Open Source Business Intelligence
Son dploie&ent et sa &ise en production sont asseH (onnes) Bas sur ,clipe ?C5$ son code
est 'isi(le et autono&e ce 7ui n'entraGne pas ainsi la ncessit d'installer TOS sur les ser'eurs
de production)
Traitement des donnes
Le traite&ent des donnes est 7uant 8 lui de tr>s (onne 7ualit car (ien 7u'il e2iste la
possi(ilit d'ajouter de nou'elles 0onctions$ de no&(reuses 0onctions de trans0or&ation des
dates$ no&(res ou de statisti7ues a'ances sont dj8 incorpores) De plus$ il supporte les
jointure de 0lu2)
%curit
Le ni'eau de scurit ri'alise pres7ue a'ec celui de 5enta=o Data Integration) Dot des &9&es
caractristi7ues$ TOS se distingue cependant par l'a(sence de scurit sur le lance&ent des
tQc=es$ d'un s%st>&e de test et de de(ugging en te&ps rel ainsi 7u'un t%pe de scurit
propritaire)
#onclusion
Sans nul doute le &eilleur ,TL Open Source du &o&ent) ,2cellentes caractristi7ues
tec=ni7ues$ tr>s (on ni'eau de scurit et une 0acilit de prise en &ain plus 7u'accessi(le) De
plus$ il est soutenu par une co&&unaut e2tr9&e&ent acti'e 7ui 0ocalise tous ses e00orts sur
cet outil) Le serait ce 7ue pour l'anne *!!;$ le no&(re de nou'elles 'ersions s'est le' 8 une
par &ois) De plus$ il 8 t c=oisi pour 9tre l',TL de r0rence par les suites Dcisionnelles
Nasper et Spago BI) Lous ne traiterons pas ici du c=oi2 d'une suite dcisionnelle 8 adopter &ais
il est plus 7ue certain 7ue Talend Open Studio est l',TL par e2cellence)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *: @ A"
tat de l'art : Solutions Open Source Business Intelligence
Data 5are+ouse
Lous a'ons dcid de ne pas traiter$ 8 propre&ent parler$ les solutions de Data Care=ouse en
Open Source) Ce c=oi2 dli(r rsulte directe&ent de la pertinence de son utilisation) ,n
e00et$ la dcision de &ettre en place un Data Care=ouse entraGne :
Le re&plissage de ce dernier en in0or&ations par le (iais d'un ,TL)
L'utilisation de ce Data Care=ouse par la &ise en place d'un outil de restitution)
Ce c=oi2 peut a'oir ses a'antages dans le d'eloppe&ent d'une solution de Business
Intelligence cre de toutes pi>ces) Lan&oins$ dans la &esure ou plusieurs plate60or&es
dcisionnelles rpondent 8 ce (esoin$ et ce$ co&&e nous le 'errons$ 8 di00rents ni'eau2 de
pertinence$ cet ou'rage ne traitera pas di00rentes possi(ilits)
Lous e00ectuerons tout de &9&e un (re0 aper/u des di00rents possi(ilits$ a0in d'a'oir une
ide glo(ale des solutions e2istantes)
BiAgres
Le projet BiHgres a t enregistr d(ut *!!A) S'appu%ant sur 5ostgreSJL$ il a
t cr a0in de spcialiser ce dernier pour du Data Care=oue) Dreenplu& est
sponsor principal de ce projet) Le projet est sous licence BSD) La derni>re neMs
en ce 7ui concerne le projet date de septe&(re *!!") Lan&oins$ si l'on anal%se en
pro0ondeur le projet et les di00rents acteurs$ on s'aper/oit gale&ent 7ue la pre&i>re 'ersion
de la Dreenplu& Data(ase a t propose tr>s peu de te&ps apr>s cette 'ersion) Cette
solution s'appuie sur BiHgres &ais n'est pas distri(ue sous la &9&e licence$ car elle i&pose
un contrat de licence pour de l'utilisation) De plus$ Dreenplu& proposant$ et a%ant en c=arge
tout ou partie du projet BiHgres$ il n'est pas inconsidr de penser 7ue le projet BiHgres a t
relgu au placard$ et 7ue Dreenplu& dploie tout ses e00orts sur son uni7ue produit) Il nous
se&(le donc 7ue$ d'une part$ 7ue le projet BiHgres n'est plus relle&ent sui'i$ et d'autre part
7ue la Dreenplu& Data(ase ne correspond pas au2 crit>res Open Source de cet ou'rage)
Ingres
Ingres a t d'elopp en 1;;) 5ossdant une grosse notorit dans les
annes <! et ! c=eH les grands co&ptes$ il poss>de encore de tr>s (onne
r0rences c=eH ces derniers tel 7ue l'Oral$ Lero% +erlin ou ,i00age)
Lan&oins$ le projet n'est distri(u sous licence Open Source 7ue depuis peu) ,n e00et$ 8
l'origine le projet est sous licence propritaire$ &ais en *!!A ce dernier est cd par Co&puter
Associates 8 un 0ond d'in'estisse&ent 7ui$ par l'inter&diaire de la socit Ingres Corporation$
le distri(ue en licence D5L a0in de red%na&iser son d'eloppe&ent) Bien 7ue rput pour sa
ro(ustesse et pour sa capacit 8 &onter en c=arge$ il apparaGt encore tr>s dlicat d'&ettre un
a'is sur ce projet) ,n e00et$ (ien 7ue co&&enc en 1;;$ nous pou'ons considrer 7ue le
projet est so&&e toute tr>s jeune car Open Source depuis *!!A) De plus$ le c=ange&ent de
&od>le cono&i7ue d'une logi7ue propritaire 8 une Open Source doit 9tre tudi sur le
te&ps$ nota&&ent du 0ait de l'i&portance d'acteurs &ajeurs 7ue sont +%SJL et 5ostgreSJL$
dj8 prsents sur ce secteur depuis de no&(reuses annes)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *A @ A"
tat de l'art : Solutions Open Source Business Intelligence
6*SBL
Apparu en 1A$ le projet +%SJL a 'u la socit en c=arge de son d'eloppe&ent$
+%SJL AB$ rce&&ent rac=ete par Sun +icros%ste&) Disponi(le sous la plupart
des s%st>&es d'e2ploitation$ il est distri(u sous licence D5L) Soutenu par une
co&&unaut tr>s i&portante$ +%SJL apparaGt co&&e un incontourna(le de la (ase de
donnes Open source) Si&ple de con0iguration$ de dploie&ent et d'utilisation$ il s'a'>re 9tre
grande&ent utilis lors de la conception de sites Ce($ et c'est pour cela 7ue la plupart des
=(ergeurs gratuits le supportent) Lan&oins$ de no&(reuses structures pro0essionnelles
l'utilisent gale&ent co&&e (ase de donnes interne$ et non pour l'usage uni7ue de site Ce()
,n e00et$ +%SJL est le plus 8 &9&e pour traiter les donnes d'une &asse 'olu&i7ue asseH
courante) Lan&oins$ (ien 7ue plus per0or&ant et plus rapide 7ue 5ostgreSJL$ ses a'antages
ont gale&ent le re'ers de la &daille) Lous pou'ons noter deu2 principau2 points ngati0s :
D'une part cette rapidit d'e2cution s'e2pli7ue par le 0ait 7ue +%SJL ne g>re pas
l'intgrit r0rentielle)
D'autre part +%SJL s'a'>re 9tre li&it lors d'une &asse de donnes i&portante)
L'e2e&ple nota&&ent de la &igration de Source.orge d'une (ase de donnes +%SJL 8
une 5ostgreSJL s'e2pli7ue par ce point l8$ +%SJL ne grant plus asseH e00icace&ent les
&ontes en c=arge)
PostgreSBL
La pre&i>re 'ersion du projet 5ostgreSJL$ appel 5ostgre 8 l'origine$
re&onte 8 1<") De'enu li(re et distri(u sous licence BSD depuis 1"$ il
est intressant de noter 7ue le crateur de 5ostgreSJL est gale&ent le
crateur d'Ingres) ?put pour ses e2cellentes per0or&ances$ il poss>de de solides r0rences
c=eH les grands co&ptes$ co&&e +to .rance ou la ?AT5) Le 0ait 7ue ce projet ne 0onctionnait
pendant longte&ps 7ue sous s%st>&e ULIE e2pli7ue les raisons d'une co&&unaut plus 0ai(le
7ue c=eH +%SJL) Lan&oins$ depuis la 'ersion <)!$ il est disponi(le sous CindoMs) Un peu
plus co&ple2e de prise en &ain 7ue +%SJL$ il est nan&oins plus 8 &9&e de traiter les
&asses de donnes i&portantes et garantie une co=rence de la 7uasi6totalit des donnes car
il g>re l'intgrit r0rentielle) Lotre ou'rage traitant les di00rents &odules de la Business
Intelligence$ il est gale&ent i&portant de signaler 7ue Talend$ leader de l',TL dans l'Open
Source$ et ,nterpriseDB$ acteur &ajeur proposant des solutions (ases sur 5ostgreSJL$ ont
rce&&ent annonc un partenariat tec=nologi7ue sous 0or&e d'o00re co&(ine entre les (ases
de donnes 5ostgreSJL et l'intgrateur de donnes Open Source de Talend) L'o(jecti0 de ce
partenariat est de 0ournir une solution de gestion de donnes capa(le de supporter des
transactions co&ple2es et d'9tre distri(ue 8 tra'ers de no&(reu2 sites gograp=i7ues)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *" @ A"
tat de l'art : Solutions Open Source Business Intelligence
Ser"eur OLAP
A'ant toute anal%se des t%pes de Cu(es et des di00rents ser'eurs$ B points i&portants sont 8
noter$ en ce 7ui concerne l'OLA5 :
1) Un client +6OLA5 3e2) : 5alo Ce( Client4 ne pourra pas tra'ailler sur un ser'eur ?6OLA5
3e2) : +ondiran4$ et in'erse&ent)
*) Le projet OLA5:N c=erc=e 8 d0inir une A5I co&&une pour tous ces projets)
B) +ondrian tra'aille directe&ent sur le SDBD? alors 7ue 5alo doit i&porter les donnes)
Penta+o Anal*sis Ser"ices 3e-$ 6ondrian4
+ondrian est un ser'eur OLA5 crit en Na'a) Il autorise une anal%se
interacti'e tr>s large des donnes stocOes dans une (ase de donnes
SJL sans a'oir 8 crire de code SJL)
Fiche didentit
aractristi1ue spci.i1ue de la solution
T%pe de Cu(e : ?6OLA5)
5oint 0ort : la capacit)
aractristi1ues gnrales de la solution
5rojet Qg de " ans)
Tr>s (onne docu&entation)
Distri(u sous Licence C5L)
ommunaut
Sponsoris par 5enta=o$ 1 ad&inistrateur et **
d'eloppeurs ont claire&ent taient identi0is)
Tau2 de 0r7uentation et 'isi(ilit Internet tr>s (on)
Taille de la co&&unaut di00icile 8 dter&iner car relie
directe&ent 8 la suite dcisionnelle 5enta=o)
7i"eau d'accessibilit
5as d'inter0ace grap=i7ue)
0ai(le ni'eau de pacOaging)
Le dispose pas d'une traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
5lutUt (on)
04 a&ril /00*
#har&ement des donnes
Le te&ps de c=arge&ent des donnes dans le Cu(e est tr>s 0ai(le) ,n e00et$ les donnes sont
directe&ent intgres dans le Cu(e lors de leur e2traction$ par le (iais d'un ,TL)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *; @ A"
tat de l'art : Solutions Open Source Business Intelligence
Dveloppement
D'une &ani>re gnrale$ il est sou'ent ncessaire de d'elopper des connecteurs spci0i7ues
pour traiter les ta(les agrga(les) De &9&e pour les ta(les tr>s dtailles$ il est sou'ent
i&prati0 de d'elopper des sur6ta(les a0in de re&dier au2 pro(l>&es de per0or&ances lis 8
l'i&portance de ces ta(les)
Fonctionnalits
Bien 7ue$ de part leur conceptualisation +6OLA5 il n'e2iste pas la possi(ilit d'utiliser les
tec=ni7ues d'anal%ses propres au2 cu(es ?6OLA5$ le pro(l>&e est relati'e&ent contourn
grQce au2 'olutions du langage SJL dans le do&aine de l'anal%se &ultidi&ensionnelle)
Outils
Il e2iste un no&(re i&portant d'outils 8 disposition de l'utilisateur) Le principal pro(l>&e 'ient
du 0ait 7ue$ co&&e nous l'a'ons soulign prcde&&ent$ le traite&ent s'a'>re di00icile sur les
ta(les dtailles pro'enant de donnes agrges) Lan&oins$ le point 0ort de 5enta=o Anal%sis
Ser'ices 'ient de sa conceptualisation sous 0or&e ?elationnelle$ 7ui per&et ainsi 8 d'autre
outils$ tel les outils classi7ues de reporting$ d'9tre utiliss sur ces Cu(es) Lotons tout de &9&e
7ue$ d'une &ani>re glo(ale$ les outils sont &oins per0or&ants 7ue ceu2 e2istants sur les Cu(es
+6OLA5)
'e$utes
Les outils de traite&ent de donnes non agrga(les$ co&&e les te2tes descripti0s par e2e&ple$
(n0icient d'une (onne per0or&ance) Lan&oins$ ces outils sont peu appropris au2 &od>les
ne traitant pas (ien le SJL$ co&&e nota&&ent les rapports 0inanciers)
%curit
Le ni'eau de scurit est directe&ent li 8 celui de la (ase de donnes traite) Il est ainsi
possi(le d'o(tenir un (on ni'eau en utilisant les outils disponi(les a'ec cette derni>re)
(olume de donnes
,n opposition au2 Cu(es +6OLA5$ 5enta=o Anal%sis Ser'ice est plus 8 &9&e de traiter une
&asse i&portante de donnes)
#onclusion
DrQce 8 un (on couplage a'ec un ,TL per0or&ant$ les Cu(es ?6OLA5 (n0icient d'un te&ps de
c=arge&ent des donnes des plus 0ai(les) Bien 7ue leur approc=e relationnelle ne leur
per&ette pas d'utiliser les &t=ode d'anal%ses pousses propres au2 Cu(es
&ultidi&ensionnels$ ce pro(l>&e est contourn grQce au2 'olutions du langage SJL dans ce
do&aine) De plus$ le no&(re i&portant d'outils et la possi(ilit$ de par leur approc=e
relationnelle$ d'utiliser d'autres outils de reporting directe&ent sur ces Cu(es$ en 0ont une
arc=itecture plus 7u'intressante$ et co&(le le 0ait 7ue les di00rents outils sont$ d'une &ani>re
glo(ale$ &oins per0or&ants 7ue ceu2 utilisant l'approc=e +6OLA5$ et traitent &oins (ien les
ta(les dtailles) La (onne per0or&ance des outils de traite&ent de donnes non agrga(les$
telles 7ue les te2tes$ la possi(ilit d'o(tenir un (on ni'eau de scurit en utilisant les
para&>tres de la (ase de donnes traite et le 0ait 7ue ce t%pe de Cu(e est plus 8 &9&e de
traiter un 'olu&e de donnes i&portant 0ont 7ue la plupart des outils Open Source sont 0onds
sur cette approc=e) 5oint ngati0 8 prendre en co&pte : il est sou'ent ncessaire de
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age *< @ A"
tat de l'art : Solutions Open Source Business Intelligence
d'elopper des connecteurs spci0i7ues pour les ta(les agrga(les$ ainsi 7ue des sur6ta(les
pour palier les pro(l>&es de per0or&ance des ta(les dtailles) De plus$ signalons 7ue ces
outils$ de part leur utilisation SJL$ se r'>lent peu appropris sur des &od>les tels 7ue les
rapports 0inanciers)
Le ser'eur +ondrian est 0ond sur l'approc=e ?6OLA5) Les outils utilisant ce dernier (n0icient
des spci0icits propres 8 ce t%pe d'arc=itecture$ 7ue ce soit les points positi0s ou ngati0s)
D'une &ani>re plus gnrale$ le projet +ondrian a rejoint le projet 5enta=o$ il (n0icie donc 8
ce titre d'une co&&unaut glo(ale 8 ce projet$ plus 7ue d'une propre 8 lui) Sa popularit est
plus 7ue 0orte$ ainsi 7ue sa 'isi(ilit Internet) .ort d'une e2cellente docu&entation$ il p9c=e
nan&oins sur un ni'eau d'accessi(ilit asseH 0ai(le$ lors7u'il s'agit de l'i&pl&enter seul$ =ors
suite Dcisionnelle 5enta=o) De plus il est i&portant de souligner 7ue de no&(reu2 clients$ tels
7ue Nru(iO ou Npi'ot pour ne citer 7u'eu2$ sont con/us pour ne 0onctionner 7u'a'ec lui)
Palo
5alo est un ser'eur &ultidi&ensionnel Le s%st>&e op>re en te&ps rel et
supporte la consolidation =irarc=i7ue co&&e de no&(reu2 outils de
Business Intelligence)
Fiche didentit
aractristi1ue spci.i1ue de la solution
T%pe de Cu(e : +6OLA5)
5oint 0ort : la per0or&ance)
aractristi1ues gnrales de la solution
5rojet Qg de * ans)
Tr>s &au'aise docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par Nedo2 AD$ 1 ad&inistrateur et 11
d'eloppeurs ont claire&ent taient identi0is)
Tau2 de 0r7uentation est asseH 0ai(le)
Taille 'isi(ilit Internet relati'e&ent (onne)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Bon ni'eau de pacOaging)
Dispose pas d'une traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Di00icile 8 dter&iner du 0ait de son jeun Qge)
04 a&ril /00*
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age * @ A"
tat de l'art : Solutions Open Source Business Intelligence
#har&ement des donnes
Les outils disponi(les de c=arge&ent de donnes sont peu rapides)
Fonctionnalits
De part leur conceptualisation$ il est possi(le d'utiliser pleine&ent les tec=ni7ues d'anal%se
propres au2 Cu(es OLA5)
Outils
D'une &ani>re glo(ale$ les outils sont plus per0or&ants 7ue ceu2 e2istants pour les Cu(es
?6OLA5) Lan&oins$ il est 8 noter 7ue d'une part$ certains outils ont du &al 8 traiter les (ases
de donnes de plus di2 di&ensions et$ d'autre part$ 7ue de par leur &ultidi&ensionnalit$ les
clients OLA5 sont les seuls outils capa(les de co&&uni7uer a'ec)
'e$utes
L'opti&isation du stocOage per&et une rapidit d'e2cution des re7u9tes) Cependant$ leur
per0or&ance n'est pas au rendeH 'ous sur ce t%pe de donnes)
%toc)a&e
La taille de stocOage des donnes est plus 0ai(le 7ue dans les Cu(es relationnels$ et ce &9&e
pour des donnes si&ilaires) De plus$ le &od>le ta(leau per&et l'utilisation d'un inde2age
naturel 7ui s'a'>re puissant)
(olume de donnes
Bien 7ue ce t%pe de Cu(e ait des di00icults 8 traiter un grand no&(re de donnes$ le pro(l>&e
est appro2i&ati'e&ent contourn par la &ise en place de processus incr&entau2$ 'ri0iant
uni7ue&ent les donnes &odi0ies$ ou les &ises 8 jour)
#onclusion
Le point 0ort de l'arc=itecture &ultidi&ensionnelle est la possi(ilit d'utiliser des tec=ni7ues
d'anal%se e2tr9&e&ent pousses) Bien 7ue certains outils aient du &al 8 traiter des (ases de
plus de di2 di&ensions$ il restent tout de &9&e plus per0or&ant$ 7ue ceu2 reposant sur les
Cu(es ?6OLA5) A noter cependant 7u'il ne sera pas possi(le d'utiliser des outils de reporting
di00rents sur ces ta(les$ de par leur arc=itecture) La conception du Cu(e est gale&ent 8 la
(ase d'un des atouts 0ort du +6OLA5 : une taille de stocOage plus 0ai(le$ du 0ait d'une
conception opti&ise$ ainsi 7u'une rapidit d'e2cution des re7u9tes) Bien 7ue ce &od>le ne
soit pas le plus 8 &9&e p traiter un 'olu&e i&portant de donnes$ le pro(l>&e est contourn
par la &ise en place de processus incr&entau2) Lan&oins$ soulignons 7ue les outils de
c=arge&ent des donnes sont peu rapides$ et 7ue la conception de Cu(es +6OLA5 entraGne
une redondance des donnes)
Le ser'eur 5alo repose 7uant 8 lui sur une arc=itecture de t%pe +6OLA5) Bien 7ue son ni'eau
d'acti'it soit &oins i&portant 7ue celui de +ondrian$ &ettons cet aspect en relation a'ec son
jeune Qge 3&oins de deu2 ans4) Ce point doit tout de &9&e 9tre pris en considration car il
i&pli7ue gale&ent 7ue la docu&entation autour de ce projet est tr>s 0ai(le et 7ue les
co&ptences partenaires 8 son sujet sont rares) Le point 0ort de 5alo est 7ue ce dernier
s'int>gre dans un projet propre 8 l'anal%se di&ensionnelle$ incluant ainsi un client Ce( 35alo
Ce( Client4 et un client lourd 35alo Client4)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B! @ A"
tat de l'art : Solutions Open Source Business Intelligence
lient OLAP
Il est pri&ordial de &ettre en relation cette anal%se a'ec celle des ser'eurs) ,n e00et$ (ien 7u'il
soit possi(le d''aluer certains aspects tec=ni7ues et 0onctionnels des di00rents clients$ on ne
peut co&parer 7ue ce 7ui est co&para(le) Co&&e 'u dans l'anal%se des ser'eurs$ un cu(e
?6OLA5 n'est pas con/u pour rpondre au2 &9&es (esoins 7u'un cu(e +6OLA5) Il est donc
i&portant de d0inir a'ant toute c=ose le t%pe de cu(e sou=ait$ en 0onction des (esoins$ a0in
de pou'oir cadrer le c=oi2 d'un client appropri)
:reeAnal*sis
La plate60or&e .reeAnal%sis 0ournit aussi (ien un acc>s Na'a 7u'un acc>s Ce( au2
donnes &ultidi&ensionnelles$ tout en 0ournissant un grand no&(re d'applications
pour grer les projets OLA5$ de la d0inition du Cu(e 8 son dploie&ent)
Fiche didentit
aractristi1ue spci.i1ue de la solution
T%pe de Cu(e : ?6OLA5 et +6OLA5)
aractristi1ues gnrales de la solution
5rojet Qg de B ans)
Tr>s &au'aise docu&entation)
Distri(u sous Licence +5L 1)1)
ommunaut
Sponsoris par B5+ Conseil$ aucun contri(uteur
claire&ent identi0i)
Taille$ tau2 de 0r7uentation et 'isi(ilit Internet asseH
0ai(le)
7i"eau d'accessibilit
inter0ace grap=i7ue)
.ai(le ni'eau de pacOaging)
Dispose d'une traduction .ran/aise)
OS : Linu2 et CindoMs E5)
Tau- d'acti"it
Tr>s (on tau2 d'acti'it)
0* a&ril /00*
Plate*forme
.reeAnal%sis dispose d'une e2cellente plate60or&e) L'utilisateur n'a certes pas le c=oi2 de
&odi0ier son inter0ace &ais l'ergono&ie est e2cellente$ ce 7ui n'apporte donc 7ue peu
d'incon'nients) * t%pes de clients sont gale&ent 8 noter$ un lourd$ d'elopp en Na'a$ et un
lger$ (as sur la tec=nologie Dojo)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B1 @ A"
tat de l'art : Solutions Open Source Business Intelligence
#har&ement des donnes
L'atout &ajeur est 7ue .reeAnal%sis g>re aussi (ien les Cu(es ?6OLA5 de t%pe +ondrian$ 7ue
les Cu(es de t%pe +6OLA5 de t%pe 5alo) La conception des cu(es peut se 0aire grap=i7ue&ent
et intuiti'e&ent 8 l'aide de l'application Sc=e&aDesign et$ (ien 7ue la connection E+L@A puisse
se 0aire sur un ser'eur d'anal%se$ on regrettera tout de &9&e 7u'elle soit i&pose)

Fonctionnalits
Les tec=ni7ues d'anal%se &ultidi&ensionnelle sont disponi(les et .reeAnal%sis per&et
gale&ent la gnration de grap=i7ues) Il ne 0aut cependant pas lui de&ander une anal%se
pousse des donnes)
Pu+lication des rsultats
D'une &ani>re gnrale$ on peut ais&ent a00ir&er 7ue toutes les possi(ilits de pu(lication de
rsultats sont disponi(les$ 7ue ce soit aussi (ien la cration de rapports$ la d0inition de 0ic=iers
d'e2port sous E+L ou la pu(lication 'ia une inter0ace Ce()
%curit
Bien 7u'il n'e2iste pas de console d'ad&inistration$ la gestion des droits est con0igura(le 'ia
l'A5I disponi(le)
#onclusion
5lus un ense&(le de logiciels 7u'un si&ple client 8 propre&ent parler) Il co&prend aussi (ien
un concepteur de cu(e$ un client OLA5 et un outil de pu(lication) Le point 0ort de .reeAnal%sis
rside dans sa capacit 8 pou'oir se connecter 8 un ser'eur ?6OLA5 3+ondrian4 et +6OLA5
35alo4) Dot de caractristi7ues tec=ni7ues intressantes$ nota&&ent en ce 7ui concerne la
plate60or&e$ il p9c=e cependant par une docu&entation e2tr9&e&ent &au'aise) Sa
co&&unaut n'est pas non plus un point 0ort de ce projet$ cette derni>re tant asseH 0ai(le
3s#re&ent d# 8 son jeune Qge4) Il serait prso&ptueu2 de 'ouloir utiliser .reeAnal%sis
actuelle&ent$ nan&oins son pri&>tre de 0onctionnalit et ses perspecti'es d''olution
doi'ent 9tre sur'eills a'ec la plus grande attention)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B* @ A"
tat de l'art : Solutions Open Source Business Intelligence
<palo
Npalo per&et la &odlisation des donnes$ la 'isualisation de ces derni>res$ la
cration et la pu(lication de rapports 8 partir de re7u>tes sur des (ases de
donnes &ultidi&ensionnelles)
Fiche didentit
aractristi1ue spci.i1ue de la solution
T%pe de Cu(e : +6OLA5)
aractristi1ues gnrales de la solution
5rojet Qg de * ans)
+au'aise docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par Tensegret% So0tMare D(&V$ 1
ad&inistrateur et 1 d'eloppeur claire&ent identi0i)
Taille asseH (onne)
Tau2 de 0r7uentation et 'isi(ilit plutUt 0ai(le)
7i"eau d'accessibilit
inter0ace grap=i7ue)
Bon ni'eau de pacOaging)
Le dispose pas d'une traduction .ran/aise)
OS indpendant)
Tau- d'acti"it
Di00icult pour 7uali0i de part la jeunesse du projet)
0* a&ril /00*
Plate*forme
Tr>s (onne inter0ace grap=i7ue de par son ergono&ie 7ui n'autorise donc pas la possi(ilit de
l'utilisateur 8 &odi0ier cette derni>re) De la &9&e 0a/on 7ue pour .reeAnal%sis$ deu2 t%pes de
clients e2istent : un lger en ANAE et un lourd en en'ironne&ent ,clipse)
#har&ement des donnes
La 7ualit du c=arge&ent des donnes est asseH 0ai(le car il n'inclue pas de concepteur de
Cu(e$ ni de connection au ser'eur co&pati(le +DE@E+LA) Il poss>de cependant la capacit 8
se connecter au ser'eur 5alo)

Fonctionnalits
5ossi(ilit d'e00ectuer des anal%ses classi7ues et pousses) Le d0aut pri&ordiale serait dans le
0ait 7u'il ne dispose pas d'inter0ace grap=i7ue a0in de conce'oir les Cu(es)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age BB @ A"
tat de l'art : Solutions Open Source Business Intelligence
Pu+lication des rsultats
5ossi(ilit de crer des rapports et de les pu(lier 'ia une inter0ace Ce() La spci0icit de Npalo
est dans le 0ic=ier d'e2port c=oisi 7ui est propre 8 Npalo)
%curit
Aucun ni'eau de scurit)
#onclusion
L, c=allenger du couple p=are +ondrian@N5i'ot) ?eposant sur un ser'eur ?6OLA5 actuelle&ent$
la possi(ilit de connection 8 un ser'eur +6OLA5 est actuelle&ent en d'eloppe&ent) Bien 7ue
sa co&&unaut utilisateur ne soit pas tr>s i&portante$ il con'ient de &ettre en relation sa
'isi(ilit Internet a'ec son jeune Qge pour s'aperce'oir 7ue de no&(reu2 espoirs sont ports
sur lui 3il est nota&&ent inclus dans la ?oad +ap de SpagoBI4) Lan&oins$ ses
caractristi7ues tec=ni7ues sont asseH 0ai(les dans l'tat actuel des c=oses et l'un des aspects
les plus d0a'ora(les est 7u'il ne per&et pas de reprsentation grap=i7ue$ ce 7ui peut 9tre
considr$ au 'u des utilisateurs$ co&&e un crit>re discri&inatoire)
<pi"ot
Npi'ot est une NS5 custo& tag li(rar% 7ui per&et la cration de ta(les OLA5 et per&et
8 l'utilisateur d'utiliser les 0onctions classi7ues de l'anal%se &ultidi&ensionnelle)
Fiche didentit
aractristi1ue spci.i1ue de la solution
T%pe de Cu(e : ?6OLA5)
aractristi1ues gnrales de la solution
5rojet Qg de " ans)
+au'aise docu&entation)
Distri(u sous Licence C5L)
ommunaut
Sponsoris par TOLB,LL,?$ 1 ad&inistrateur et 1<
d'eloppeur claire&ent identi0i)
Taille et 'isi(ilit Internet asseH (onne)
Tau2 de 0r7uentation tr>s (on)
7i"eau d'accessibilit
inter0ace grap=i7ue)
Bon ni'eau de pacOaging)
Le dispose pas d'une traduction .ran/aise)
OS indpendant)
Tau- d'acti"it
5as un grand tau2 d'acti'it &ais sta(le depuis B ans)
0* a&ril /00*
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B: @ A"
tat de l'art : Solutions Open Source Business Intelligence
Plate*forme
5late60or&e asseH ergono&i7ue &ais 7ui poss>de la particularit d'9tre &odula(le 'ia
l'utilisation de 0euilles de st%le) Ainsi$ l'utilisateur peut &odi0ier l'inter0ace a0in de disposer de
celle 7ui lui con'ient le &ieu2) Cette plate60or&e n'est disponi(le 7u'en client lger Ce()
#har&ement des donnes
La conception de Cu(es n'est pas prise en c=arge par l'application) Lan&oins$ l'utilisateur
dispose$ s'il le sou=aite$ d'une connection E+L@A) Les Cu(es utiliss par cette solution sont de
t%pe +ondrian)
Fonctionnalits
Les 0onctionnalits de Npi'ot sont les plus a(outies des Client OLA5 car elle poss>de tout aussi
(ien les l&ents d'anal%se classi7ue co&&e celles plus pousses$ ainsi 7ue la possi(ilit de
rcuprer des grap=i7ues)
Pu+lication des rsultats
La cration des rapports est possi(le$ ainsi 7ue l'e2port au 0or&at 5D. ou ,2cel) Lan&oins$ la
pu(lication de rapport n'est pas co&prise dans cette solution)
%curit
Aucun ni'eau de scurit)
#onclusion
L, client OLA5 de r0rence) Inclus dans les suites dcisionnelles les plus pro&etteuses 3Nasper
Intelligence$ 5enta=o et SpagoBI4$ il poss>de des caractristi7ues tec=ni7ues tr>s (onnes) ,n
e00et$ il n'est pas le plus per0or&ant dans tous les do&aines &ais il peut se 'anter d'9tre le
plus =o&og>ne$ sui'i par la co&&unaut la plus i&portante) De plus$ sa sta(ilit n'est plus 8
d&ontrer car il est le ser'eur OLA5 Open Source le plus ancien 3A ans4) Bien 7u'tant$
co&(in a'ec +ondrian$ L, couple OLA5 Open Source incontourna(le$ une criti7ue peut
nan&oins lui 9tre 0or&ule : la docu&entation n'est pas 8 la =auteur de ses capacits)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age BA @ A"
tat de l'art : Solutions Open Source Business Intelligence
<rubi?
Nru(iO est un client OLA5 d'elopp en Na'a@SMing et (as sur les co&posants du
projet Npi'ot) Le client se connecte au2 sources de donnes de +ondrian et les
re7u9tes OLA5 peu'ent 9tre 0aites en langage +DE)
Fiche didentit
aractristi1ue spci.i1ue de la solution
T%pe de Cu(e : ?6OLA5)
aractristi1ues gnrales de la solution
5rojet Qg de : ans)
+au'aise docu&entation)
Distri(u sous Licence C5L)
ommunaut
Aucun sponsor n'a t identi0i en tant 7ue tel$ B
ad&inistrateur et B d'eloppeur claire&ent identi0i)
Taille$tau2 de 0r7uentation et 'isi(ilit Internet asseH
(onne)
7i"eau d'accessibilit
inter0ace grap=i7ue)
Bon ni'eau de pacOaging)
Le dispose pas d'une traduction .ran/aise)
OS indpendant)
Tau- d'acti"it
Aucune acti'it depuis 0in *!!")
0* a&ril /00*
Plate*forme
5late60or&e e2tr9&e&ent ergono&i7ue dot ainsi d'une (onne inter0ace) Cette derni>re est
(ase sur du Na'a)
#har&ement des donnes
5as de concepteur de Cu(e incorpor &ais la possi(ilit d'une part de se connecter en E+L@A
sur un ser'eur +ondrian central) D'autre part$ il est gale&ent possi(le d'e&(ar7uer +ondrian
si on le sou=aite)

Fonctionnalits
5as de 0onctionnalit d'anal%se &ultidi&ensionnelle pousse &ais de (onnes 0onctionnalits
d'anal%se &ultidi&ensionnelle classi7ue) De plus$ la cration de grap=i7ues est gale&ent
possi(le)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B" @ A"
tat de l'art : Solutions Open Source Business Intelligence
Pu+lication des rsultats
La pu(lication de rapports ne peut 9tre e00ectue &ais il est possi(le de les e2porter 'ia des
5D.$ des E+L$ des VT+L)))
%curit
Aucun ni'eau de scurit)
#onclusion
Il est pri&ordial de &ettre en relation cette anal%se a'ec celle des ser'eurs) ,n e00et$ (ien 7u'il
soit possi(le d''aluer certains aspects tec=ni7ues et 0onctionnels des di00rents clients$ il
con'ient de co&parer ce 7ui est co&para(le) Co&&e 'u dans l'anal%se des ser'eurs$ un cu(e
?6OLA5 n'est pas con/u pour rpondre au2 &9&es (esoins 7u'un cu(e +6OLA5) Il est donc
i&portant de d0inir a'ant toute c=ose le t%pe de cu(e sou=ait$ en 0onction des (esoins$ a0in
de pou'oir cadrer le c=oi2 d'un ser'eur appropri)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B; @ A"
tat de l'art : Solutions Open Source Business Intelligence
Data 6ining
5ai?ato En"ironment .or @noCledge Anal*sis 35E@A4
C,[A est une collection d'algorit=&es pour les tac=es de Data +ining) Les
algorit=&es peu'ent 9tre appli7us directe&ent au2 donnes ou appels par le
code Na'a) C,A[ contient les outils pour di00rents traite&ents)
Fiche didentit
aractristi1ue spci.i1ue de la solution
Anal%se de donnes et &od>les prdicti0s)
aractristi1ues gnrales de la solution
D'elopper en Na'a)
Tr>s (onne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Uni'ersit CaiOato)
B ad&inistrateur et B d'eloppeur claire&ent identi0is)
Sponsoris par 5enta=o)
Acti"it
5rojet lanc en 1B)
D(ut du d'eloppe&ent Na'a en 1;)
/5 a&ril /00*
Tau" dactivit
Le &ode de d'eloppe&ent de C,[A est tout particuli>re&ent intressant par le 0ait 7u'il n'est
pas linaire) ,n e00et$ le passage d'une 'ersion B)E 8 la B)- n'i&pli7ue pas l'arr9t du
d'eloppe&ent de la 'ersion B)E) Ainsi$ tout en apportant des a&liorations nota(les 7ui
i&pli7uent le passage 8 une 'ersion suprieure$ la 'ersion antrieure n'est pas ou(lie pour
autant et se trou'e entretenue pendant 7uel7ues te&ps) Cette 0a/on de procder per&et 8 des
utilisateurs d'une 'ersion de ne pas 0orc&ent a'oir 8 passer 8 la 'ersion suprieure$ dans la
&esure oY la 'ersion actuelle les satis0ait$ tout en pro0itant de 7uel7ues a&liorations)
Lan&oins$ (ien 7u'il e2iste actuelle&ent A 'ersions de C,[A$ seules les deu2 derni>res
3'ersions B): et B)A4 sont entretenues$ co&&e l'illustre le grap=i7ue sui'ant)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B< @ A"
tat de l'art : Solutions Open Source Business Intelligence
Traitements
C,[A supporte plusieurs de no&(reu2 t%pes de sources de donnes) D'une part il peut
tra'ailler a'ec les (ases de donnes$ &ais d'autre part il peut gale&ent e2traire les
in0or&ations de 0ic=iers plats de t%pe )ar00)
5lusieurs t%pes de traite&ents des donnes sont ensuite disponi(les$ les principau2 tant :
:iltrage / per&ettant ainsi de prparer les donnes a'ant de les traiter)
lassi.ication / utiliser pour de l'anal%se prdicti'e)
lustering / anal%se descripti'e$ per&et d'identi0ier des groupes d'enregistre&ents)
R#gles d'associations / anal%se prdicti'e gale&ent$ per&et d'identi0ier des
corrlations entre donnes)
!ccessi+ilit
Vor&is une (onne docu&entation$ ainsi 7u'une co&&unaut relati'e&ent acti'e$ C,[A
poss>de l'a'antage de disposer de plusieurs inter0aces grap=i7ues possdant leurs propres
utilits :
SI6PLE LI / ni'eau d'accessi(ilit le plus (as$ c'est une console per&ettant
l'utilisation de &odules de calculs)
EDPLORER / utilis pour l'anal%se d'un jeu de donnes$ il per&et le para&trage de ce
dernier ainsi 7ue la 'isualisation des rsultats)
EDPERI6E7TER / anal%se pousse per&ettant ainsi d'utiliser les &t=odes d'anal%se
co&ple2es sur plusieurs jeu2 de donnes)
@7O5LED9E:LO5 / c=a7ue traite&ent poss>de ses co&posants grap=i7ues et cette
inter0ace per&et d'e00ectuer des anal%ses en 0onction)
#onclusion
C,[A est sans nul doute l'outil de Data +ining le plus &ature de l'Open Source) 5ossdant une
co&&unaut (ien acti'e$ 0ourni a'ec une (onne docu&entation et a%ant intgr plusieurs
suites dcisionnelle$ la sta(ilit de ce projet est prsente) Les di00rentes inter0aces lui
con0>rent une certaine accessi(ilit 7ui s'a'>re asseH si&ple d'utilisation) De plus$ les di00rents
traite&ents possi(les au 'u des di00rents algorit=&es d'anal%se intgrs lui per&ettent de
rpondre 8 di00rents (esoins) Lan&oins$ un point i&portant 8 prendre en co&pte ne 'ient
pas tant de l'outil &ais plus du Data +ining en gnral) Le Data +ining se doit d'9tre intgr 8
un s%st>&e dcisionnel sta(le et &ature) Ses points 0orts ne se r'>lent 7ue dans une
structure dcisionnelle 0orte) Ainsi$ un outil de Data +ining doit plutUt 9tre considr co&&e
l'tape 0inale d'une solution de Business Intelligence)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age B @ A"
-aux dacti&it des diffrentes &ersions de >,2)
2000 2001 2002 2003 2004 2005 2006 2007
0
1
2
3
4
5
Weka 3.0
Weka 3.2
Weka 3.3
Weka 3.4
Weka 3.5
N
o
m
b
r
e
s
Annes
tat de l'art : Solutions Open Source Business Intelligence
9nrateur d'tat
Business Intelligence and Reporting Tools 3BIRT4
BI?T est s%st>&e de reporting$ open source$ (as sur ,clipse 7ui$ intgr au2
applications Na'a@N*,, produit des rapports co&pils)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de B ans)
Bonne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par Actuate$ * ad&inistrateurs et 1!
d'eloppeurs ont claire&ent taient identi0is)
Taille de la co&&unaut et 'isi(ilit Internet tr>s 0orte)
Tau2 de 0r7uentation non co&&uni7u)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Tr>s (on)
.< a&ril /00*
#onnectivit
BI?T est l'outil de reporting possdant nati'e&ent le &oins de connecti'it) ,n e00et$ les
possi(ilits se rsu&ent au2 0ic=iers plats$ au2 0ic=iers E+L$ au2 NDBC et 5lain Old Na'a O(ject)
Lan&oins$ il poss>de un point 0ort non ngligea(le sur les autres solutions : la possi(ilit
d'crire en Na'a$ ou en Na'ascript$ des scripts ren'o%ant les donnes) Ainsi$ (ien 7ue n'a%ant
pas le plus large 'entail de connecti'it en se 0ocalisant sur le court ter&e$ il est celui 7ui a la
perspecti'e d'intgration la plus 0orte)
Indicateurs
BI?T utilise la li(rairie grap=i7ue BI?T C=art) Cette derni>re lui per&et de disposer d'8 peu
pr>s tous les diagra&&es possi(les et i&agina(les$ 7u'il s'agisse des diagra&&es de lignes
classi7ues jus7u'au2 jauges$ en passant par les diagra&&es de Hone) Il est$ de toutes les
solutions anal%ses$ celle 7ui poss>de la plus grande o00re de 'isualisation) Il o00re gale&ent
la possi(ilit de personnaliser les rapports &is selon des &od>les prd0inis)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :! @ A"
tat de l'art : Solutions Open Source Business Intelligence
Format de sortie
Les possi(ilits d'e2traction sont correctes) ,n e00et$ il per&et d'e2traire les ta(leau2 de (ord
dans la plupart des 0or&ats classi7ues$ t%pe 5D.$ CSS ou VT+L) Lan&oins$ l'e2traction au
0or&at E+L n'est pas propose)
Fonctionnement
#onclusion
BI?T est un tr>s (on outil de reporting) L'une des caractristi7ues les plus attra%antes est la
possi(ilit de crer des scripts d'e2traction de donnes) Certes on pourra regretter 7u'il n'o00re
pas en nati0 de no&(reuses connecti'its &ais cet atout lui per&et$ a'ec un peu de
d'eloppe&ent en a&ont$ de s'intgrer dans la plupart des s%st>&es) La ric=esse de
indicateurs et les 0or&ats de sortie disponi(les per&ettent de rpondre au2 (esoins de la
plupart des cas d'utilisation) A noter gale&ent 7ue BI?T est prsent dans les suites
dcisionnelles 5enta=o et Spago BI) On peut donc dire de BI?T 7u'il est 8 en'isag tr>s
srieuse&ent lors de la &ise en place d'un outil de reporting seul)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :1 @ A"
Sc(ma de fonctionnement de !#-
Source de donnes
BI?T Designer +od>le E+L
BI?T ,ngine ?apport re&pli
tat de l'art : Solutions Open Source Business Intelligence
<asperReport
Nasper?eports est une li(rairie Na'a e&(ar7ua(le) ,lle per&et
d'acclrer le d'eloppe&ent des rapports co&par au2 approc=es de
construction traditionnelle$ et est un support pour tout ta(leau de (ord)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de * ans)
Tr>s (onne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par NasperSo0t$ * ad&inistrateur et 1!
d'eloppeurs ont claire&ent taient identi0is)
Taille de la co&&unaut et tau2 de 0r7uentation tr>s
0ort)
Bonne 'isi(ilit Internet)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Tr>s (on)
.< a&ril /00*
#onnectivit
Nasper?eports poss>de le plus large panel de connecti'its) De &9&e 7ue pour BI?T$ il peut se
connecter au2 0ic=iers plats$ au2 0ic=iers E+L))) De plus$ il est co&pati(le a'ec le ser'eur OLA5
et autorise une conne2ion au2 ser'eur E+L@A) Lan&oins$ il ne poss>de pas de 0onction
per&ettant d'crire des scripts a0in de retourner les donnes$ et ne peut gale&ent pas se
connecter 8 Npi'ot)
Indicateurs
A ni'eau gal a'ec BI?T$ il utilise 7uand 8 lui la li(rairie grap=i7ue N0ree C=art) 5ossdant une
&ultitude d'indicateurs gale&ent$ il est tr>s co&plet) Le point ngati0 serait le &an7ue de
personnalisation des ta(leau2 de (ord 0ourni)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :* @ A"
tat de l'art : Solutions Open Source Business Intelligence
Format de sortie
De &9&e 7ue pour BI?T$ la plupart des 0or&ats standards tels 7ue le 5D.$ le CSS ou VT+L
sont disponi(les) Il se caractrise cependant par deu2 aspects : il n'o00re pas la possi(ilit
d'e2porter au 0or&at DOC &ais per&et l'e2traction au 0or&at E+L)
Fonctionnement
#onclusion
Nasper?eports est L, gnrateur d'tat le plus rpandu$ ou tout du &oins le plus connu) ,n
e00et$ il se trou'e intgr dans les suites dcisionnelles Open Source les plus crdi(les$ 8 sa'oir
Nasper Intelligence$ 5enta=o et Spago BI$ et dans celles &oins connues$ co&&e nota&&ent
+ar'el IT) Sa 0acilit d'intgration e2pli7ue en partie cet aspect l8 car il est celui de tous les
outils de reporting 7ui poss>de le plus large panel de connecti'it) Les di00rents indicateurs et
0or&ats de sortie sont de tr>s (onne 7ualit$ &ais on regrettera tout de &9&e l'i&possi(ilit
de personnaliser les ta(leau2 de (ord) Dans le cadre d'une i&pl&entation d'une suite
dcisionnelle$ il paraGt i&pensa(le de ne pas en'isager d'intgrer Nasper?eport)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :B @ A"
i?eport +od>le E+L Nasper Design
Nasper ?eports
?apport re&pli Nasper 5rint
Source de donnes
Sc(ma de fonctionnement de ;asper #eports
tat de l'art : Solutions Open Source Business Intelligence
Penta+o Reporting 3e-$ <.reeReports4
5enta=o ?eporting est une collection de projets open source principale&ent
0ocaliss sur la cration$ la gnration et la distri(ution de contenu de
rapports ric=es et sop=isti7us$ 8 partir de toutes sources d'in0or&ations)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de ; ans)
Tr>s (onne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par 5enta=o$ A ad&inistrateur et 1*
d'eloppeurs ont claire&ent taient identi0is)
Taille et tau2 de 0r7uentation (on)
Taille de la co&&unaut di00icile 8 dter&iner car relie
directe&ent 8 la suite dcisionnelle 5enta=o)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
AsseH 0ai(le &ais sta(le)
.< a&ril /00*
#onnectivit
Les connecti'its de 5enta=o ?eporting ne sont pas les plus 0a(uleuses) ,n e00et$ il n'est pas
possi(le d'crire un script ren'o%ant les donnes$ ce 7ui est une spci0icit de BI?T) Il peut
nan&oins se connecter au ser'eur OLA5 +ondrian &ais ne peut ni se connecter au2
Na'aBeans$ ni au2 ,NB$ ni au ser'eur E+L@A)
Indicateurs
Utilisant gale&ent la li(rairie grap=i7ue N0ree C=art$ il se r'>le nan&oins un peu &oins
0ourni en indicateurs 7ue les deu2 solutions 'ues prcde&&ent) A l'in'erse de Nasper?eports$
il poss>de 7uand 8 lui la possi(ilit de personnaliser les ta(leau2 de (ord)
Format de sortie
D'un ni'eau juste correct$ il g>re certains t%pes de 0or&at standard co&&e le VT+L ou le 5D.
&ais n'accepte pas l'e2port au 0or&at CSS$ DOC ou E+L) +al=eureuse&ent$ il ne poss>de pas
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :: @ A"
tat de l'art : Solutions Open Source Business Intelligence
de caractristi7ues propres 8 lui a0in de cou'rir ces lacunes)
Fonctionnement
#onclusion
Outil de reporting correct$ il a rejoint$ co&&e son no& l'indi7ue$ la suite dcisionnelle 5enta=o)
Il apparaGt plus co&&e un gnrateur d'tat &o%en$ asseH standard$ sans relle 'aleur
apporte) ,n e00et$ il poss>de des connecti'its$ des indicateurs et des 0or&ats de sortie d'un
ni'eau &o%en) De plus$ aucune caractristi7ue spci0i7ue 8 lui ne sont 8 noter) Il s'a'>re 9tre
un gnrateur d'tat correct$ pou'ant 9tre su00isa&&ent per0or&ant pour rpondre 8 certains
(esoins$ dans un conte2te prcis et dans un cas d'intgration prcis)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :A @ A"
Sc(ma de fonctionnement de +enta(o #eportin"
5enta=o ?eport
Designer
5enta=o ?eport
Design
+od>le E+L
5enta=o
?eporting
?apport re&pli
Source de donnes
tat de l'art : Solutions Open Source Business Intelligence
OpenReports
Open?eports est un outil de reporting 0le2i(le 7ui 0ournit un na'igateur$ un outil de
para&trage et gn>re des rapports d%na&i7ues$ tout en per&ettant une
progra&&ation te&porelle)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de ; ans)
Bonne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par Open Source So0tMare Solutions$ un
ad&inistrateur et un d'eloppeurs ont claire&ent taient
identi0is)
Taille de la co&&unaut et 'isi(ilit Internet asseH
0ai(le)
Tau2 de 0r7uentation (on)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
AsseH 0ai(le &ais sta(le)
.< a&ril /00*
#onnectivit
Les connecti'its d'Open ?eports sont so&&e toute asseH restreintes) Lan&oins$ et ces
caractristi7ues s'appli7uent gale&ent au Dnrateurs d'tat prcde&&ent cits$ la
co&pati(ilit a'ec les NDBC per&et d'accepter la plupart des (ases de donnes) Lotons
gale&ent 7u'il per&et l'utilisation du ser'eur OLA5 +ondrian$ ainsi 7ue$ et c'est une
caractristi7ue 7ui lui est propre$ le ser'eur Npi'ot)
Indicateurs
Co&&e la plupart des outils de reporting 'us prcde&&ent$ Open?eports utilise la li(rairie
grap=i7ue N0ree C=art) Au ni'eau des indicateurs$ il % a peu de c=oses 8 dire car il poss>de un
large c=oi2 d'indicateurs 8 &9&e de rpondre 8 tous les (esoins utilisateurs) Lotons 7ue dans
notre tude$ Open?eports int>gre tous les indicateurs tudis)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :" @ A"
tat de l'art : Solutions Open Source Business Intelligence
Format de sortie
D'un (on ni'eau$ il rpond 8 la plupart des 0or&ats de sortie tel 7ue 5D.$ VT+L))) Bien 7ue
n'a%ant pas le panel le plus 0ourni en ce 7ui concerne la possi(ilit d'e2portation$ il se distingue
cependant de par sa possi(ilit de 0ournir en ligne les rapports$ et ce par le (iais d'une
application Ce( per&ettant gale&ent la gestion de droits$ de groupes)))
Fonctionnement
#onclusion
Open?eports n'est pas a considrer co&&e un gnrateur d'tat co&&e les autres) ,n e00et$ il
est plus 8 'oir co&&e une sur couc=e per&ettant$ d'une part$ d'utiliser les &oteurs de
reporting des B solutions prcdentes$ et d'autre part de di00user 'ia une application Ce($ et
sui'ant certains droits$ les ta(leau2 et@ou rapports raliss) il sera un outil intressant dans
une opti7ue d'intgration a%ant de no&(reu2 utilisateurs co&&e ci(le)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :; @ A"
Sc(ma de fonctionnement de Open#eports
Source de donnes
Open?eports
Designer
+od>le E+L
?apport re&pli Nasper
?eports
5enta=o
?eporting
NELS
BI?T
tat de l'art : Solutions Open Source Business Intelligence
Suites dcisionnelles
<asper Intelligence
5late60or&e Open Source de Business Intelligence per&ettant de dplo%er
aussi (ien des outils de reporting$ d'anal%se et d'intgration de donnes
utilisant le le langage N*,,)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de * ans)
Bonne docu&entation)
Distri(u sous Licence D5L et co&&erciale)
ommunaut
Sponsoris par NasperSo0t$ B ad&inistrateur et B1
d'eloppeurs ont claire&ent taient identi0is)
Taille de la co&&unaut et 'isi(ilit Internet asseH
(onne)
Tau2 de 0r7uentation di00icile 8 dter&iner$ pas de
0r7uentation propre 8 la suite &ais au2 co&posants)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
.ai(le ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
AsseH (on)
./ mai /00*
Fonctionnalits
La cou'erture des 0onctionnalits de restitution est co&pl>te car Nasper Intelligence per&et
d'utiliser l'intgralit des 0onctionnalits de Nasper?eport et Npi'ot@+ondrian) De plus$ outre
cette cou'erture opti&ale$ la plani0ication possi(le des rapports$ la possi(ilit de les rece'oir
par &ail$ ainsi 7ue celle de les stocOer dans un rpertoire r0rentiel per&et un c=oi2 total de
di00usion d'une part$ &ais gale&ent un =istori7ue et un sui'i d'autre part) La gestion des droit
d'acc>s$ des pro0ils etc))) a gale&ent t prise en co&pte a0in de pou'oir d0inir certains
ni'eau2 de scurit$ &ais gale&ent de per&ettre une personnalisation des inter0aces)
La spci0icit de cette suite dcisionnelle 'ient principale&ent du 0ait 7ue$ 8 contrario des
autres solutions e2istantes$ l'inter0ace n'est pas con/ue sous 0or&e de portail) ,n e00et$ une
application Ce( a t d'eloppe spci0i7ue&ent)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age :< @ A"
tat de l'art : Solutions Open Source Business Intelligence
Nasper Intelligence co&prend gale&ent son propre concepteur de Cu(e OLA5$ sous le no& de
NasperCorO(enc=$ 7ue l'on peut considrer co&&e une surcouc=e par rapport 8 l'dition
&anuelle des 0ic=iers E+L)
Lous pou'ons cependant regretter le 0ait 7ue deu2 licences e2istant$ l'une D5L et l'autre
co&&erciale$ la solution disponi(le sous licence Open Source ne co&prenant pas l'intgralit
des 0onctionnalits disponi(les sous licence co&&erciale)
#omposants
ETL Nasper ,TL :
Talend Open Studio)
9nrateur d'tat Nasper ?eport)
Anal*se 6ultidimensionnelle Nasper Anal%sis :
+ondrian)
Npi'ot)
Plani.icateur JuartH)
#onclusion
Cette solution de suite dcisionnelle s'a'>re 9tre asseH si&ple de prise en &ain$ dont toutes les
0onctions principales sont prsentes) La na'igation so&&e toute asseH (asi7ue se trou'e ainsi
9tre asseH allge)
Deu2 grands incon'nients sont cependant 8 noter :
D'une part$ l'outil de reporting de BI?T est a(sent de cette suite$ ce 7ui est asseH
do&&agea(le)
D'autre part$ au 'u des co&posants prsents$ 0orce est de penser 7ue NasperSo0t
sou=aite &ettre en a'ant ces propres produits au dtri&ent des solutions les plus
pertinentes) Il est donc peu pro(a(le 7ue d'autres outils de reporting soient intgrs 8
cette solution)
,n conclusion$ NasperIntelligence s'a'>re 9tre une solution asseH intressante de par sa
si&plicit$ sa lg>ret et sa rapidit de prise en &ain$ &ais (ien 7ue possdant la plupart des
0onctionnalits i&portantes 7ue l'on de&ande 8 une suite dcisionnelle$ elle s'a'>re 9tre asseH
restreinte et elle peut 9tre sou&ise 8 des contraintes F &arOeting I)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age : @ A"
tat de l'art : Solutions Open Source Business Intelligence
6ar"el IT Das+
Das= est une plate60or&e de d'eloppe&ent gratuite 7ui per&et un
dploie&ent rapide des ta(leau2 de (ord dans le cadre d'une solution de
Business Intelligence)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de * ans)
Bonne docu&entation)
Distri(u sous Licence Open Source))
ommunaut
Sponsoris par +ar'elIT$ B ad&inistrateurs et B
d'eloppeurs ont t claire&ent identi0is)
Taille de la co&&unaut$ 'isi(ilit Internet et tau2 de
0r7uentation tr>s 0ai(le)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Tr>s 0ai(le)
./ mai /00*
Fonctionnalits
Cette suite dcisionnelle est prsente sous 0or&e de portail) L'ad&inistration se 0ait
directe&ent sur ce dernier$ inter0ace sous la7uelle l'ad&inistrateur dispose de la possi(ilit
d'intgrer di00rents portlets$ a0in d'a00ic=er les grap=i7ues ou les tats) Le para&trage des
donnes se 0ait directe&ent 8 ce ni'eau l8)
Les portlets sont au no&(re de : :
A00ic=age d'un grap=i7ue)
A00ic=age d'un tat)
Ou'erture d'un tat en 5D. ou VT+L) Il est gale&ent 8 noter 7ue la possi(ilit de
plani0ier la gnration et l'en'oi d'un tat 8 plusieurs adresses &ail donnes est
prsent)
Ad&inistration pour la d0inition des sources et la dclaration des tats)
#ommunaut
5as de co&&unaut 'isi(le sau0 la socit)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age A! @ A"
tat de l'art : Solutions Open Source Business Intelligence
#omposants
9nrateur d'tat Nasper ?eport)
Portail Apac=e Netspeed 1)" .usion)
Plani.icateur JuartH)
#onclusion
Cette solution est la &oins a(outie de toutes les solutions tudies) Disposant de
0onctionnalits tec=ni7ues asseH li&ites$ l'in'isi(ilit de la co&&unaut autour de ce projet en
0ait une suite dcisionnelle peu 8 &9&e d'9tre c=oisie pour du long ter&e) Lan&oins$ elle
peut s'a'rer intressante$ de part sa si&plicit$ pour un usage li&it ou pour une initiation
au2 suites dcisionnelles) La possi(ilit de disposer de 0onctions plus e2=austi'es entraGnera
de se tourner 'ers les autres solutions)
Penta+o
Une plate60or&e de Business Intelligence 7ui co&prend le reporting$
l'anal%se OLA5$ les ta(leau2 de (ord$ le Data +ining et l'intgration de
donnes par le (iais d'un ,TL) ,lle peut 9tre utilise co&&e une suite
co&pl>te ou co&posant par co&posant)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de Bans)
Tr>s (onne docu&entation)
Distri(u sous Licence +5L 1)1
ommunaut
Sponsoris par 5enta=o$ < ad&inistrateurs et 1
d'eloppeurs ont claire&ent taient identi0is)
Taille de la co&&unaut$ 'isi(ilit Internet et tau2 de
0r7uentation tr>s (on)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Tr>s (on)
./ mai /00*
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age A1 @ A"
tat de l'art : Solutions Open Source Business Intelligence
Fonctionnalits
5enta=o poss>de deu2 possi(ilits d'inter0ace : soit par le (iais d'une application N*,,$ Noss
5ortal$ soit par une application Ce() Les deu2 solutions proposent les &9&es t%pes de
0onctionnalits$ 8 sa'oir la possi(ilit de consulter les tats$ d'utiliser les 0onctions d'e2ploration
des donnes et de constituer des ta(leau2 de (ord) L'ense&(le des 0onctions d'ad&inistration
sont gale&ent disponi(les sous les deu2 solutions) A noter gale&ent 7u'il est possi(le
d'interagir d%na&i7ue&ent sur les docu&ents)
La di00usion des docu&ents peut se 0aire sous plusieurs 0or&es$ par l'auto&atisation d'un en'oi
par &ail$ selon certaines c=ances ou selon certaines conditions) Des 0onctions de gestion des
droits par le (iais de co&ptes utilisateurs sont gale&ent &ises 8 la disponi(ilit de
l'ad&inistrateur$ per&ettant ainsi de li&iter et@ou de personnaliser les pro0ils et les acc>s)
Le portail per&et 7uant 8 lui$ par les (iais de di00rents &odules$ d'intgrer un tat$ de
co&poser des ta(leau2 de (ord$ de co&(iner des grap=i7ues et de parcourir l'ense&(le des
actions possi(les)
La 5late60or&e est organise ainsi$ co&&e la &ajorit des suites dcisionnelles$ autour de *
co&posants :
Un &oteur de MorO0loM$ ,n=%dra S=arO) C=a7ue 0onctionnalit de ce dernier correspond
8 l'2ecution d'une action sous 0ic=ier E+L$ ces derni>res tant tout si&ple&ent une
succession d'tapes si&ples) 5enta=o dispose de son outil de conception des actions$
sous le no& de 5enta=o Design Studio$ per&ettant ainsi une cration grap=i7ue de ces
derni>res$ aug&entant de ce 0ait l'accessi(ilit) De plus$ tous les co&posant prsents
dans la suite dcisionnelle 5enta=o sont considrs co&&e des tapes 7u'il est ainsi
possi(le d'auto&atiser)
Un plani0icateur de tQc=es$ JuartH) Ce dernier donne ainsi la possi(ilit d'e00ectuer un
contrUle du plani0icateur$ 7ue ce soit &anuelle&ent ou en utilisant les tapes
correspondantes dans une action)
5enta=o se distingue par son outil +etatada editor$ 7ui per&et de crer des 'ues &tiers de
(ase de donnes) Ainsi$ on ne 'oit plus les ta(les sous leur 0or&e classi7ue &ais des
regroupe&ents d'in0or&ations) Il est ainsi possi(le de crer des re7u9tes sans passer par du
SJL)
#ommunaut
La co&&unaut autour de ce projet est tr>s acti'e et d%na&i7ue) Le 0ait 7ue no&(res de
projets dcisionnels aient rejoint 5enta=o a accentu cet e00et par le rallie&ent de leur
co&&unaut respecti'e 8 ce projet) De plus$ cette intgration de plusieurs (ri7ues
dcisionnelles autour de cette suite dcisionnelle entraGne une par0aite i&pl&entation et une
'olution co=rente de l'ense&(le)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age A* @ A"
tat de l'art : Solutions Open Source Business Intelligence
#omposants
ETL [ettle)
9nrateur d'tat ,clipse BI?T)
Nasper ?eports)
N0ree?eport)
Anal*se 6ultidimensionnelle Npi'ot)
+ondrian)
Data 6ining CeOa)
Portail N(oss 5ortal)
Plani.icateur JuartH)
5or?.loC ,n=%dra s=arO)
#onclusion
5enta=o est une solution co&pl>te$ grant l'intgralit des ni'eau2 du dcisionnel$ disposant
de l'intgralit des 0onctionnalits sou=aites et disposant de la &ajorit des solutions
disponi(les dans le secteur de la Business Intelligence en Open Source) Sa co&&unaut est
tr>s acti'e et sa logi7ue d'intgration$ par le (iais de l'acceptation de plusieurs projets au sein
du sien en 0ont une solution co=rente dans son arc=itecture$ et per&et un sui'i 'oluti0
pertinent dans son ense&(le) 5enta=o est ainsi la solution 7ui se distingue par le 0ait 7u'elle
peut cou'rir l'ense&(le des conte2tes d'in0or&ati7ue dcisionnelle) Lan&oins$ il est 8 noter
7ue son large c=oi2 d'outils dcisionnels en 0ont une solution 7ui peut certes cou'rir
l'intgralit des cas possi(les$ &ais 7ui ne s'a'>rera pas la plus pertinente dans la &esure ou
d'autre solutions$ &oins 0ournies$ s'a'>reront plus rapides de &ise en place et tout aussi
pertinentes$ dans certains conte2tes)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age AB @ A"
tat de l'art : Solutions Open Source Business Intelligence
Spago BI
SpagoBI est une plate60or&e de Business Intelligence Open Source 7ui utilise de
no&(reu2 &oteurs anal%ti7ues$ les int>gre dans une in0rastructure 7ui o00re une
'ision cooprati'e et co=rente entre le reporting$ les cu(es OLA5$ le Data
+ining$ les ta(leau2 de (ord et le Data Care=ouse)
Fiche didentit
aractristi1ues gnrales de la solution
5rojet Qg de B ans)
Bonne docu&entation)
Distri(u sous Licence D5L)
ommunaut
Sponsoris par ,ngineering Ingegneria In0or&atica$ un
ad&inistrateur et < d'eloppeurs ont claire&ent taient
identi0is)
Taille de la co&&unaut asseH &o%enne)
Sisi(ilit internet tr>s pau're)
Aucune in0or&ation au ni'eau du tau2 de 0r7uentation)
7i"eau d'accessibilit
Inter0ace grap=i7ue)
Tr>s (on ni'eau de pacOaging)
5as de traduction .ran/aise)
OS Indpendant)
Tau- d'acti"it
Tr>s (on)
./ mai /00*
Fonctionnalits
L'inter0ace de SpagoBI est d'eloppe sous 0or&e de protail) ,lle utilise 8 ce titre eEo plat0or&
&ais per&et gale&ent une intgration si&pli0ie au portail Li0era%)
L'intgration de 0onctionnalits se 0ait sous 0or&e de portlets$ per&ettant d'a00ic=er les
grap=i7ues$ les tats et@ou les indicateurs) Il est 8 noter gale&ent 7ue certains grap=i7ues et@
ou indicateurs peu'ent 9tre actualiss auto&ati7ue&ent$ sans ncessit d'une 7uelcon7ue
inter'ention de l'utilisateur) Ces indicateurs d%na&i7ues sont en 0las= et sont gnrs par la
plate60or&e Open LasHlo)
Spago BI dispose de son propre s%st>&e de CorO0loM de pu(lication$ intgrant ainsi les
di00rentes 0onctions de cration$ de tests et de 'alidation) La cration per&et gale&ent de
crer des (rouillons a0in de les tester a'ant de les pu(lier) La gestion des droits d'acc>s$ de
pro0ils etc)) est gale&ent incluse et un r0rentiel de gestion de docu&ents est gale&ent
disponi(le$ utilisant la nor&e NC?$ a0in de conser'er les di00rentes 'ersions de c=a7ue tat
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age A: @ A"
tat de l'art : Solutions Open Source Business Intelligence
a0in de les stocOs pour en conser'er un =istori7ue)
L'une des 0onctionnalits intressante de Spago BI est son co&posant d'aide 8 la cration de
re7u9tes$ d'elopp spci0i7ue&ent par Spago BI) Il per&et de co&poser des re7u9tes sous
0or&e grap=i7ue$ per&ettant ainsi une si&plicit d'utilisation plus accessi(le)
Il est gale&ent possi(le de dclenc=er et plani0ier des traite&ents depuis le portail)
#ommunaut
+oins i&portant 7ue 5ent=o &ais son appartenance au consortiu& OC* lui per&et de crer
une d%na&i7ue et un partage d'autres &odules Open Source) De plus (ien 7ue plus 0ai(le$ sa
co&&unaut n'en reste pas &oins i&portante et d%na&i7ue$ les 'olutions de Spago BI tant
d'ailleurs rguli>res)
#omposants
ETL Talend Open Studio)
9nrateur d'tat Nasper ?eport)
BI?T)
Anal*se 6ultidimensionnelle Npi'ot)
+ondrian)
Data 6ining CeOa)
Portail eEo plat0or&)
5or?.loC 5ropre 8 Spago BI)
#onclusion
Spago BI est une solution dcisionnelle ric=e et &ature) Certes &oins 'olu 7ue 5enta=o$ elle
dispose cependant des &eilleures applications dcisionnelles e2istantes dans c=a7ue tape$
7ue ce soit Talend Open Studio pour l',TL ou BI?T pour le reporting) Bien 7ue n'a%ant pas un
aussi large c=oi2 7ue 5enta=o$ elle se distingue par le c=oi2 de solutions &oins e2=austi0s &ais
tout aussi pertinent$ sa &ise en production et son para&trage s'en trou'ant ainsi si&pli0ie)
Son appartenance au consortiu& OC* lui con0>re une d%na&i7ue et un partage d'autres
&odules Open Source 7ui lui per&et de pallier une co&&unaut de &oindre i&portance 7ue
5enta=o$ (ien 7ue so&&e toute i&portante)
Un point intressant de cette solution est l'e2istence d'un connecteur Business O(ject) Bien
7ue ce point puisse s'a'rer un dtail et 7ue ce connecteur ne sera 7ue 0ai(le&ent utilis dans
la &ajorit des cas$ cela r'>le nan&oins une 'olont d'intgration et d'ou'erture de la part
de Spago BI)
Ainsi$ cette suite dcisionnelle s'a'>re cou'rir un c=a&p d'actions certes &oindre 7ue 5enta=o
&ais rpond au2 attentes de la plupart des cas de dcisionnel e2istant$ et si&pli0ie son
dploie&ent par un c=oi2 pouss des outils intgrs$ dans une opti7ue de pertinence plutUt
7ue d'e2=austi'it) ,lle rpondra ainsi au2 attentes et au2 (esoins de la plupart des cas d'une
&ani>re plus rapide 7ue 5enta=o)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age AA @ A"
tat de l'art : Solutions Open Source Business Intelligence
S*nt+#se
Le do&aine la Business Intelligence dans l'Open Source est un secteur en pleine croissance$
aussi (ien du cUt de la de&ande 7ue de l'o00re) La &aturit et la sta(ilit de certaines
solutions actuelles per&ettent de relle&ent en'isager leur utilisation au sein d'une structure
pro0essionnelle)
La di'ersit des (ri7ues logicielles et leur di00rents cas d'utilisation per&et de rpondre au2
(esoins d'aide 8 la dcision$ &ais gale&ent de c=oisir la solution F sur mesure I$ sans
0orc&ent s'enco&(rer d'applications secondaires 7ui seraient inutiles dans ce cas l8) Lous
proposerons en ce sens une &atrice s%nt=ti7ue per&ettant de d0inir les cas d'utilisation des
B outils de reporting$ 8 sa'oir les gnrateurs d'tats$ les outils d'anal%se &ultidi&ensionnelle
et ceu2 de Data +ining$ en 0onction de * crit>res : les (esoins en anal%se et la &asse
'olu&i7ue de donnes 8 traiter)
6atrice de c(oix d'un outil de reportin"
Lous laissons 8 la li(re apprciation du lecteur le c=oi2 d'utiliser une suite dcisionnelle ou un
ense&(le de (ri7ues c=oisit$ en 0onction de ses (esoins et attentes$ ainsi 7ue$ co&&e
&entionn dans le pra&(ule$ le c=oi2 de la solution$ cet ou'rage a%ant pour (ut d'claircir le
c=a&p de la Business Intelligence et d'e00ectuer un tat de l'art des di00rentes solutions Open
Source$ et non d'e00ectuer un classe&ent des di00rentes applications)
Aurlien CAB?OL 6 +ai *!!< Copyright 2008 - ADULLACT 5age A" @ A"
Dnrateur d'tat
Anal%se
+ultidi&ensionnelle
Data +ining
Dnrateur d'tat
.ai(le
Dnrateur
d'tat
Dnrateur
d'tat
Dnrateur
d'tat
Anal%se
+ultidi&ensionnelle
Anal%se
+ultidi&ensionnelle
Anal%se
+ultidi&ensionnelle
Anal%se
+ultidi&ensionnelle
+o%enne .orte
.
a
i
(
l
e
+
o
%
e
n
.
o
r
t
6asse "olumi1ue de donnes
B
e
s
o
i
n

e
n

a
n
a
l
*
s
e
Dnrateur d'tat
Anal%se
+ultidi&ensionnelle