Vous êtes sur la page 1sur 120

Cours dInformatique Dcisionnelle

Version de mars 2014


Lge de pierre : gestion de
linformation
Image source : http://commons.wikimedia.org/wiki/File:Pech_Merle_main.jpg

Dessin et peinture sur


la roche

main ngatie
prhistori!ue de la
"rotte du Pech
Merle #$ot% France&.
Lge de pierre

Tout au dbut de la civilisation, lhomme


prhistorique :
'
Commence sadapter son en!ironnent"
'
Il apprend la fa#on de tirer pro$t des
ressources qui sont sa disposition"
'
Dun autre c%t" il gra!e &stoc'e( linformation
sur la pierre &la roc)e(" art" gra!ures ou
peintures rupestres" dans grottes" ou o*lisque"
totems" etc+
Lge du *ron,e &mtal(
image source http://commons.wikimedia.org/wiki/File:(ois)du)$uc_)_Fondeurs_d*+,art.-P" licenced
under the .reatie .ommons /ttri0ution 1.2 3nported license. /ttri0ution : -ean)Pol "4/5DM657
Lge du mtal

A lge de bronze, lhomme commence :


'
sa!oir comment transformer la roc)e en
mtal"
'
-uis crer des outils partir du mtal"
'
De nou!elles tec)niques apparaissent"
'
De nou!eau. procds apparaissent+
L/re industrielle
Image source : http://commons.wikimedia.org/wiki/File:8tandard_6il.jpg
L/re industrielle

Lhomme :
'
gnralise lapproc)e utilise pour crer des
outils en mtal et en *ois" des outils de sa
propre cration :
'
Il commence crer des mac)ines comple.es"

D*ut !ers 1000" apparition de la mac)ine


!apeur" le train" lautomo*ile" etc+

Les procds de cration de mac)ines sont


de plus en plus nom*reu." comment les
documenter 1
2esoin de stoc'er et
darc)i!er linformation

Avec le dveloppement de lindustrie :


'
Le *esoin de stoc'er et darc)i!er les donnes
est cr" a$n de :
'
3!oir un mo4en de contr%ler lacti!it des
entreprises en gnral"
'
5arder une trace crite et"
'
-ou!oir ritrer les m6mes processus
organisationnels en question" autant que
ncessaire dans le temps"
7toc'er 8papier: de
linformation
image source http://en.wikipedia.org/wiki/File:Fondos_archio.jpg licenced under the .reatie .ommons
/ttri0ution)8hare /like 1.2 3nported% +.9 "eneric% +.2 "eneric and :.2 "eneric license. /ttri0ution : /rchio)F8P
Dp%ts dinformation

Le premier support de stoc'age dinformation est


le papier &pap4rus" etc+(" il en dcoule plusieurs
dp%ts dinformation :

Centre darc)i!es dindustries" dentreprises"


'
;egistres des entres<sorties"
'
=istoriques des ac)ats<!entes"

Li!res" manuscrits" *i*liot)/ques &pri!es ou


pu*liques(

-rocessus organisationnels et donnes non


documentes & documenter(+
Informatique et nou!elles
possi*ilits

3!ec lapparition des premiers ordinateurs


en 1>?0" permettant de stoc'er et de
traiter des donnes "

Il est de!enu possi*le den!isager le


stoc'age de donnes sur un support autre
que le support -3-I@;"

La gnralisation de lapproc)e m/ne la


cration des centres de donnes
&ser!eurs(+
Data Center &centre de
donnes(
image source http://commons.wikimedia.org/wiki/File:(altic8erers_data_center.jpg $icenced
under the .reatie .ommons /ttri0ution)8hare /like 1.2 3nported licence. /ttri0ution : Fleshas
Data Center &centre de
donnes(

Capacit de stockage des centres de


donnes actuels !"#$% :
'
-ar e.emple" le centre de donnes de lAB3=
&centre amricain national de c4*er scurit (
'
1 @2 C 10000000000000000002 C 10
1D
*4tes C
1000 peta*4tes C 1 *illion giga*4tes &1 milliard
de giga octets C 1 milliard E 1000
?
E

octets(+
Data Center &centre de donnes(
Image source :
http://en.wikipedia.org/wiki/File:3tah_Data_.enter_o;_the_58/_in_(lu;;dale_3tah_ector.sg
Fou!elle pro*lmatique : Information
G!erload &surc)arge dinformation(
image source http://commons.wikimedia.org/wiki/File:India)7ruck)6erload.jpg licenced under
under the .reatie .ommons /ttri0ution)8hare /like 1.2 3nported% +.9 "eneric% +.2 "eneric and
:.2 "eneric license. /ttri0ution : Peter <rim0acher% Moe0ius:
;ec)erc)e dinformation

5ouelle pro0lmati!ue : comment accder


rapidement = l>in;ormation ?

In;ormation = propos d>un sujet donn%

7olution un pro*l/me donn"

Dcision prendre"

-lan dactions sui!re+


-rincipe des moteurs de
rec)erc)e
image source http://en.wikipedia.org/wiki/File:8earch)engine)diagram)en.sg licenced under the .reatie .ommons
/ttri0ution)8hare /like 1.2 3nported% +.9 "eneric% +.2 "eneric and :.2 "eneric license. /ttri0ution : -ako0 @oss
Limites des moteurs de rec)erc)e
&locau. et He*(

Les rsultats de recherche sont :


'
3Ic)s sous forme de listing"
'
Les rsultats sont tr/s nom*reu."
'
@t il n4 a pas de conclusion ou de corrlation
gnrale entre ces rsultats"
'
La surc)arge dinformation reste !ala*le"
'
Il 4 a un nou!eau *esoin en ce qui concerne
lacc/s linformation utile" pertinente+
Les 3ges de l)omme

3ge de pierre"

3ge du *ron,e"

3ge industriel"

3ge de linformation"

3ge de lintelligence :
'
Intelligence conomique
Intelligence et Intelligence

Il est ncessaire de diJrencier entre :

Intelligence &en anglais(" et

2usiness intelligence &2I("

La premi/re dsigne le degr dimplication K ou L


intrusi!e dun organisme dans ce quon appelle
lespionnage industriel+
Intelligence daJaires
&conomique(

La deu.i/me dsigne plut%t la capacit dune


entreprise 6tre en parfait contr%le des donnes
et informations relati!es son propre domaine
daJaires &*usiness(+

ensem*le dactions et de ractions" *ases sur


lutilisation 8 intelligente : de linformation pour
des $ns utilit conomiques+
D$nition de lintelligence
conomique

ensem*le de t)ories" mt)odologies" procdures


&fonctionnelles et tec)niques(" processus"
arc)itectures et tec)nologies +

collectent" consolident" modlisent" transforment"


et restituent des collections de donnes *rutes

en informations pertinentes et utiles


destination des acteurs 8mtier: pour leur
permettre dagir" des $ns conomiques et
stratgiques+
D$nition de lintelligence
conomique

traiter de grandes quantits dMinformations &du


pass(+

pour aider identi$er et d!elopper de nou!elles


opportunits &pour le futur(+

@n consquence" lusage de ces nou!elles


opportunits et mettre en Nu!re une stratgie
eIcace peut fournir un a!antage concurrentiel et
la sta*ilit de lacti!it ou entreprise long
terme+
2ases de linformatique
dcisionnelle
Informatique dcisionnelle

Linformatique dcisionnelle :
' en anglais: D77 pour Decision 7upport 74stem
' ou encore 2I pour 2usiness Intelligence

dsigne les mo4ens" les outils et les mt)odes et les


tec)niques

qui permettent dMoJrir une aide la dcision et

de permettre au. responsa*les de la stratgie dun


organisme &conomique" administratif" ou politique("

da!oir une !ue densem*le de lacti!it traite" et


dla*orer un processus de prise ou daide la
dcision+
@.emple de s4st/me de support
lMaide la dcision &gograp)ique(
Image source :
http://en.wikipedia.org/wiki/File:Decision_8upport_8Astem_;or_-ohn_DaA_4eseroir.jpg
-rise de dcision

La prise de dcision peut 6tre considre comme


le processus cognitif "

qui entraOne la slection dMun plan dMaction parmi


plusieurs scnarios alternatifs+

C)aque processus dcisionnel produit un c)oi.


$nal+ La sortie<output peut 6tre une action ou une
opinion" ou un c)oi.+
@.emple de prise de
dcision
Image source : http://en.wikipedia.org/wiki/File:Bikipedia_article)creation)+.sg
3r*re de dcision :
K<P calcul de pro*a*ilits
Image source : http://commons.wikimedia.org/wiki/File:7a0leau_Donnees_/r0re.jpg
3r*re de dcision :
K<P calcul de pro*a*ilits
Image source :http://commons.wikimedia.org/wiki/File:/r0re_de_decision.jpg
;elation entre dcisionnel et
intelligence conomique

Dans le domaine des $nances" et de lconomie"


une simple dcision ou simple mau!ais c)oi. peut
coQter lentreprise des millions+

Le dcisionnel atteint sa plus grande importance


dans le domaine $nancier+
-rocessus de prise de dcision
dans la *usiness intelligence

La prise de dcision puis laction


stratgique & suivre sera base :
'
Fon pas sur les donnes *rutes"
'
Fon pas sur les donnes e.traites" et traites"
'
Rais sur le rsultat de transformation" puis de
c)argement puis reprsentation de ces
donnes :

7ous forme de rapports" diagrammes" etc+


74st/me dinformation

LMutilisation com*ine de mo4ens informatiques"


lectroniques et de procds de
tlcommunication permet auSourdM)ui L

selon les *esoins et les intentions e.primsP


dMaccompagner" dMautomatiser presque toutes les
oprations incluses dans les acti!its en
entreprise+
74st/me dinformation

An s4st/me dMinformation &7I( est un ensem*le


organis de ressources &matriels" logiciels"
personnel" donnes et procdures(

qui permet de collecter" regrouper" classi$er"


traiter et diJuser de lMinformation sur un
en!ironnement donn+
74st/me dinformation daide
la dcision &ou dcisionnel(

Ds que lon parle de 8Informatique


dcisionnelle:" nous sommes o*lig dintroduire
le terme de 7ID &74st/me dInformation
Dcisionnel(+

Le 7ID a pour o*Sectif de fournir des indicateurs


sur la !ie de lentreprise+ -our cela" il e.ploite une
ric)esse dS sa disposition : lensem*le des
donnes quune entreprise gn/re dans le cadre
de son acti!it+
=istorique de la 2I : ;alp) 'im*all

;alp) Tim*all &F en 1>44( est un auteur autour du


suSet 8entrep%ts de donnes: et de la *usiness
intelligence+ Il est largement considr comme lMun
des arc)itectes du 8dataUare)ouse:+

7a mt)odologie" aussi connu comme la modlisation


dimensionnelle ou la mt)odologie de Tim*all" est
de!enu le standard dans le domaine de lMaide la
dcision+

LMapport de la mt)odologie 'im*all est de montrer la


mani/re de mener *ien un proSet dcisionnel" cMest
dire comment crer un s4st/me dMinformation
dcisionnel+
=istorique de la 2I : 2ill Inmon

Hilliam =+ Inmon &n en 1>4V( est un


informaticien amricain" reconnu par *eaucoup
comme le p/re du dataUare)ouse+

Inmon crit le premier li!re" tient la premi/re


confrence &a!ec 3rnie 2arnett(" a crit la
premi/re colonne dans un maga,ine et a t le
premier oJrir des cours sur le suSet+
=istorique de la 2I : 2ill Inmon

Inmon donne la d$nition de ce quun


dataUare)ouse : cest un ensem*le de donnes
non !olatiles" orient par un suSet donn" relatif
un temps donn" en support des dcisions pour
le management+

-ar rapport lMapproc)e ;alp) Tim*all" lMapproc)e


de Inmon est sou!ent caractrise comme une
approc)e topPdoUn+

LMapport de lMapproc)e de *ill inmon consiste


montrer ce que doit faire un s4st/me
dMinformation dcisionnel+
Construction dun entrep%t de donnes
Image source :
http://en.wikipedia.org/wiki/File:Data_warehouse_oeriew.-P"
Wuelques e.plications
GD7: operational data storage+

7er!eur de stoc'age de donnes oprationnel+


7CR: suppl4 c)ain management+

5estion de la c)aOne logistique+


@;-: enterprise ressource planning+

-rogiciel de gestion intgr+


Data !ault: modlisation de 2DD relationnelles
7ources de donnes

Il faut sa!oir quun 7I )a*ituel traite et


gn/re un ensem*le de donnes 8*rutes: "
les sources de donnes &Xinances" @;-"
C;R" etc+( utilises dans lentrep%t de
donnes peu!ent pro!enir de :

Donnes structures :
'
2ase de donnes relationnelles )trog/nes"
R7 7WL 7@;V@;" I2R D22" Gracle" Informi."
YRL" @.cel"
7er!eurs applicatifs" C;R &gestion de relation client("

Donnes non structures :


'
Xic)iers plats" logs de scripts"
@.emple dM@;-: open@;-
image source http://commons.wikimedia.org/wiki/File:6penC4P_@D.png licenced under the
.reatie .ommons /ttri0ution)8hare /like 1.2 3nported license. /ttri0ution : 5icos interests
Xic)ier plat

Ane *ase de donnes oriente te.te est un


mod/le de *ase de donnes sous la forme dMun
simple $c)ier+

An $c)ier plat est un $c)ier te.te ou du te.te


com*in a!ec un $c)ier *inaire contenant
gnralement un seul enregistrement par ligne+
4e; : http://;r.wikipedia.org/wiki/Fichier_plat
@.tract Bransform and Load
'
le.traction &rcupration<collecte( de donnes
stoc'es partir de diJrentes sources de
donnes" applications de lentreprise" puis"
'
La transformation du rsultat pour 6tre
adquat a!ec le format destination sou)ait
&!oir cu*e GL3-(" puis
'
Le c)argement<intgration<enregistrement du
rsultat dans des datamarts indpendantes+
@.emple doutil @BL :
Balend Gpen 7tudio
Image source :http://marketplace.eclipse.org/sites/de;ault/;iles/7alend)2:.jpg
Bransformation de donnes

Le *ut est de transformer" traduire" con!ertir les


donnes *rutes prcdemment e.traites au
format du dataUare)ouse au moment de la copie+

en des informations dotes de sens" et utiles de


point de !ue conomique" stratgique ou
organisationnel+

Brier" rsumer" consolider" !ri$er lintgrit"


raliser les indices+
Intgration de donnes

si la donne unitaire est la mati/re premi/re" elle


na que peu dintr6t en tant que telle+

@lle ne prend tout son sens que lorsque"


regroupe a!ec dautres donnes unitaires" elle
forme un indicateur utile+

DoZ lintr6t de ce que lon appelle lintgration


de donnes+
Intgration de donnes
LMintgration consiste concentrer les donnes
collectes dans un espace uni$" dont le socle
informatique essentiel est lMentrep%t de donnes+
[lment central du dispositif" il permet au.
applications dcisionnelles de *n$cier dMune
source dMinformation commune" )omog/ne"
normalise et $a*le" suscepti*le de masquer la
di!ersit de lMorigine des donnes+
Intgration de donnes : fusion
de 2 ta*les contenant les
m6mes c)amps
image source https://deelopers.google.com/;usionta0les/docs/articles/data_gathering licenced
under under the .reatie .ommons /ttri0ution 1.2 $icense. /ttri0ution : <athrAn EurleA
Fetto4age des donnes :
pourquoi

3pr/s lagrgation de lensem*le des donnes


pro!enant des diJrentes sources de donnes" il
se peut que lon aie comme rsultat :

Des redondances &des nPuplets identiques("

Des inco)rences &des nPuplets contradictoires("


erreurs de saisie" etc+

Des erreurs &une transformation non russie(+


Fetto4age de donnes :
solution

Le netto4age des donnes permet de:

!ri$er et de corriger les donnes

tout en assurant la standardisation des formats


des nPuplets des ta*les de *ases de donnes+

Les procds de netto4age de donnes


permettent doptimiser la qualit et la co)rence
de lensem*le des donnes+
Fetto4age de donnes :
quoi

Le netto'age de donnes consiste & :


'
Corriger les erreurs de saisie" de frappe"
'
Vri$er lintgrit des domaines par e.+ les
dates" &1V<02<2000 !s 02<1V<2000( pour les
notations francop)ones et anglop)ones" les
!aleurs telles que Centrim/tre ou -ouce" TR ou
Rile" etc+
'
-roposer une alternati!e au. donnes nulles"
manquantes" c)amps !ides"
Fetto4age de donnes :
comment

(aleurs manquantes nulles%


'
Ignorer le tuple
'
;emplacer par une !aleur $.e ou par la
mo4enne

(aleurs errones ou inconsistantes


'
Dtecter par une anal4se de !oisinage
[cart par rapport la mo4enne
'
;emplacer par une !aleur $.e ou par la
mo4enne

)nspection manuelle de certaines donnes*


DataUare)ouse et Datamart

-armi les termes qui re!iennent le plus sou!ent


dans le domaine de lintelligence conomique" on
note :

DataUare)ouse: regroupe toutes les donnes


applicati!es de lentreprise" et reprsente
llment principal du s4st/me dinformation
dcisionnel+
DataUare)ouse
&entrep%ts de donnes(

LMentrep%t de donnes assure la consolidation


des contenus sous forme de structures destines
en faciliter la manipulation par les outils
dManal4ses" puis le stoc'age de ses donnes+

*ase de donnes centrale utilise pour le


traitement" stoc'age" et prsentation dun
ensem*le de donnes pro!enant de diJrentes
sources de donnes indpendantes" et
)trog/nes+
Datamart &magasin de donnes(

Les datamarts &2DD;( gnralement aliments


depuis les donnes du dataUare)ouse" sont des
sousPensem*les dinformations

destins fournir des donnes &et informations(


au. utilisateurs $nau."

sou!ent spcialiss !ers un groupe" dpartement"


ou un t4pe dMaJaire &*usiness(" ou mtier
particulier de lentreprise &mar'eting" risque"
contr%le de gestion+(
@.emple de datamarts pour le
domaine de la gestion de production
Image source : http://commons.wikimedia.org/wiki/File:DM7_D48.-P"
GL3- : reprsentation des
donnes en 7ID

Gnline 3nal4tical -rocessing est un terme utilis dans


le domaine du dcisionnel" pour dsigner le traitement
anal4tique en ligne+

GL3- est une application<tec)nique informatique


orient !ers lManal4se instantan de donnes
conomiques selon plusieurs a.es &dimensions("

dans le *ut dMo*tenir des rapports de s4nt)/se tels


que ceu. utiliss en anal4se $nanci/re" et aider la
direction a!oir une !ue trans!ersale de lMacti!it
dMune entreprise+
@.emple de cu*e GL3- :
ta*leau multiPdimentionnel
Image source : http://0irtworld.0logspot.com/+2:2/2,/0irt)and)olap.html
GL3- : reprsentation des ta*les
de donnes en Cu*e ?
dimensions
+roduit
s
(illes Temps
-1 V1 B1
-1 V2 B2
p2 V1 B1
p? V? B?
-erspecti!e C Dimensions

-roduit" et ;gion reprsentent ici des points de


!ue ou perspecti!es ou dimensions

Ane dimension est tout ce qui permet de


consulter les donnes &les !entes( selon une
catgorie ou rep/res" et nous donner une
meilleure<diJrente perspecti!e<point de !ue+
Ba*le de dimension

La Table de dimension contient :


' les a.es &dimension( tudies dans lManal4se
' selon lesquels on !eut tudier des donnes mesurer
&les faits(+

,-emple de dimension :
' Les produits &rfrence" famille" etc+
' le temps &Sour" mois" priode" anne" etc+
' La Localisation &ville" pa4s" territoire" etc+"
Ventes par produit et par
priode

-ar e.+ !ous pou!e, a!oir *esoin de consulter les


!entes dun produit selon<durant une anne+
+roduits.Anne
!""# !""!
-1 1000 >D>
p2 12000 10>>
p? 1220 122?
Vente par rgion et par
priode

-uis" !ous pou!e, sou)aiter da!oir un point de


!ue diJrent sur les !entes en consultant les
performances dun produit selon une rgion+
+roduits./gion
A0rique ,urope Amrique
-1 1?000 1>D> 124V
p2 100 12?4 20\0
p? 0 1?4? ?42
Ba*le de faits :

La Ba*le des faits contient les donnes


o*ser!a*les &les faits" par e.emple Wuantit"
Rontant( que lMon poss/de sur un suSet et que lMon
!eut tudier"

selon di!ers a.es dManal4se &les dimensions(" par


e.emple : -roduit" Ville" 3nne+
Les ta*les situes au. e.trmits sont les
ta*les de dimensions ou ni!eau. de sui!i+
Xait : mesure

An fait est lMa*r!iation de 8fait o*ser!a*le:" on


peut lMappeler galement 8mesure:" qui est
la*r!iation de mesure conomique+

-our e.emple" on peut a!oir la ncessit de


mesurer la quantit" le pri. de !ente" et le
montant &de !ente totale( concernant des
produits !endus" par t4pe de produit" par date" et
par localisation+
Resures : intersection de deu.
dimensions

7i lon consid/re que lon doit manipuler des


ta*les deu. dimensions" considrons titre
dMe.emple les deu. dimensions sui!antes
8produit: et 8anne:"

linformation<ou donne &en !ert dans la BDX( qui


!a rsulter de lintersection de ces deu.
dimensions peut 6tre :
'
-ro$t" Vente" -ri." Wuantit" etc+
Rod/le en toile

le mod/le de donnes 8en toile: est t4pique


des structures multidimensionnelles stoc'ant des
donnes atomiques ou agrges+

La ta*le situe au centre de lMtoile est la ta*le


des faits ou mesures &ou encore mtriques(: ce
sont les lments mesurs dans lManal4se comme
les montants" les quantits" les tau." etc+
Rod/le en toile : sc)ma
image source http://commons.wikimedia.org/wiki/File:8tar)schema.png licensed under
the .reatie .ommons /ttri0ution)8hare /like 1.2 3nported licence. /ttri0ution : 8!lPac
Rod/le en toile : e.emple
image source http://en.wikipedia.org/wiki/File:8tar)schema)eFample.png licensed under the .reatie .ommons
/ttri0ution)8hare/like 1.2 $icense. /ttri0ution : 8!lPac #talk&
=irarc)ie : $ls de
dimension

Considrons cette foisPci" que !ous !oule, consulter


les !entes par rgion" mais que !ous !oule,
approfondir !otre rec)erc)e par !ille" etc+

Cest ici" que la notion de )irarc)ie inter!ient en


dcomposant les dimensions" en sousPunits
permettant

da!oir une meilleure granularit des rsultats+

Xlocon : !ariante du mod/le en toile: c)aque ta*le


de dimension fait apparaOtre la )irarc)ie sousPSacente
&catgorie pour produit(+
Rod/le de donnes en ]ocon
image source http://en.wikipedia.org/wiki/File:8now;lake)schema.png licensed under the
.reatie .ommons /ttri0ution)8hare/like 1.2 $icense. /ttri0ution : 8!lPac
Rod/le de donnes en
]ocon : e.emple
image source http://en.wikipedia.org/wiki/File:8now;lake)schema)eFample.png licensed under the
.reatie .ommons /ttri0ution)8hare /like 1.2 3nported licence. /ttri0ution: 8!lPac at Cnglish
Bikipedia
C)argement de donnes

Cela consiste reprsenter les donnes dans un


format compr)ensi*le &rapports(+

-uis le distri*uer<pu*lier !ers lutilisateur $nal" en


gnral dtenant des comptences danal4se
$nanci/re<conomique" ou stratgique+ La
distri*ution peut 6tre par portail He*" mail" ou
autre" etc+
;estitution" ;eprsentation"
et diJusion des donnes

;eprsentation !isuelle des donnes rentre sous


le terme 8data !isuali,ation:+

La reprsentation grap)ique de donnes


statistiques ou !isualisation de donnes
statistiques est un rsum !isuel des donnes
c)iJres+ @lle permet en un seul coup dMNil dMen
saisir la tendance gnrale+
;apports grap)iques
image source http://en.wikipedia.org/wiki/File:C.C_weeklA_+19.gi; licensed under the .reatie
.ommons /ttri0ution)8hare /like 1.2 3nported% +.9 "eneric% +.2 "eneric and :.2 "eneric licence.
/ttri0ution : 35C.C
Limites de la restitution de
donnes

La reprsentation de rsultats sous


forme de rapports & !aleur
conomique( ou le 8reporting: nest
pas suIsant pour pou!oir conclure
des dcisions stratgiques+

An autre domaine inter!ient ici" cest


ce que lon appelle 8data
anal4tics:" ou lanal4se de donnes+
2eaucoup de donnes mais sans
information premier a*ord
image source : http://en.wikipedia.org/wiki/File:8ao_Paulo_8tock_CFchange.jpg licensed under the
.reatie .ommons /ttri0ution +.2 "eneric licence. /ttri0ution : 4a;ael Matsunaga
Data anal4tics

G*tenir linformation partir de la donne"

;egrouper les lments de prise de dcision"

Atilisa*ilit du ta*leau de *ord par


'
Des emplo4s a!ec connaissance limite en:

*ureautique"
'
Des emplo4s sans connaissance approfondie
en :

Informatique" *ases de donnes"

@n $nancePcompta*ilit"

;essources )umaines"

Logistique" productique"
Gutils de *usiness
intelligence
2usiness Intelligence
;eporting Bool

2I;B est un s4st/me de reporting pour les


applications *ases sur ^a!a et ^a!a @@ &en
particulier(+

2I;B a deu. composantes principales:


'
un concepteur de rapport *as sur @clipse"
'
et un composant dMe.cution que !ous pou!e,
aSouter !otre ser!eur dMapplications+
'
2I;B propose galement un moteur de
diagrammes qui !ous permet dMaSouter des
grap)iques pour !otre propre application+
-ossi*ilits de 2I;B

3!ec 2I;B " !ous pou!e, aSouter une ric)e !arit


de rapports !otre application +

Listes P Les rapports les plus simples sont des


listes de donnes + Comme les listes sMallongent "
!ous pou!e, aSouter le regroupement pour
organiser les donnes & commandes groupes par
client" produits regroups par le fournisseur( +

7i !os donnes sont numriques" !ous pou!e,


facilement aSouter des totau. &sum(" des
mo4ennes &a!g( et dMautres rsums +
-ossi*ilits de 2I;B

5rap)iques P Les donnes numriques sont


*eaucoup plus faciles comprendre lorsquMils
sont prsents sous forme de grap)iques+ 2I;B
fournit des camem*erts" grap)iques linaires et
*eaucoup plus+ Les

Les 5rap)iques 2I;B peu!ent 6tre rendus en 7V5


et soutien des !nements pour permettre une
interaction de lMutilisateur +
@.emple de diagramme
image source : http://www.eclipse.org/0irt/phoeniF/project/nota0leG.+.php
-ossi*ilits de 2I;B

Ba*leau. croiss &galement appels un ta*leau


8crossta*: ou matrice( montre les donnes en
deu. dimensions : les !entes par trimestre par
e.emple+

Lettres _ Documents P 3!is" des lettres et dMautres


documents te.tuels sont faciles crer a!ec 2I;B+

Les documents peu!ent inclure du te.te" mise en


forme " des listes " des ta*leau. et plus +
Ba*leau crois a!ec @clipse
2I;B
image source : http://www.eclipse.org/0irt/phoeniF/project/nota0le+.+.php
Cration de cu*e GL3- a!ec
2I;B
image source :http://0irtworld.0logspot.com/+2:2/2,/0irt)and)olap.html
-ossi*ilits de 2I;B

;apports composs P De nom*reu. rapports doi!ent


com*iner tout ce dont on a parl en un seul
document +

-ar e.emple" une dclaration la client/le peut


indiquer lMinformation pour le client" fournir un te.te
sur les promotions en cours" et de fournir des listes de
paiements et les c)arges+

An rapport $nancier peut inclure des a!ertissements"


des grap)iques" des ta*leau." toutes a!ec *eaucoup
de formatage qui correspond des couleurs de
lMentreprise+
-ossi*ilits de 2I;B
Les ;apports 2I;B se composent de quatre parties
principales : les donnes " les transformations de donnes "
la logique 8mtier: et prsentation +
Les Donnes P 2ases de donnes " ser!ices He*" o*Sets
^a!a" peu!ent fournir des donnes !otre rapport de 2I;B+
2I;B oJre un support pour les sources de donnes ^D2C "
YRL " He* 7er!ices " et $c)iers plats" ainsi que le soutien
pour lMutilisation de code pour o*tenir dMautres sources de
donnes +
@n outre" un seul rapport peut inclure des donnes
pro!enant de plusieurs sources de donnes + 2I;B fournit
galement une fonctionnalit qui permet au. sources de
donnes disparates pour 6tre com*ins en utilisant
Sointures internes et e.ternes+
-ossi*ilits de 2I;B
La Bransformation des donnes L les rapports prsentent
des donnes tries" rsumes" $ltres et regroupes pour
rpondre au. *esoins de lMutilisateur+
2ien que les *ases de donnes peu!ent faire partie de ce
tra!ail" 2I;B doit le faire pour les sources 8simples: de
donnes telles que des $c)iers plats ou des o*Sets ^a!a+
2I;B permet des oprations comple.es telles que le
regroupement sur les sommes &sur diJrentes dimensions"
ce qui nMest pas possi*le a!ec lMutilisation dMun simple
groupe *4 et decode(" les pourcentages des totau. glo*au.
et plus+
-ossi*ilits de 2I;B

2usiness Logic &la logique mtier( L les donnes du


monde rel sont rarement structures e.actement
comme on le sou)aite pour un rapport+

De nom*reu. rapports e.igent une logique mtier


spci$que pour con!ertir des donnes *rutes en
informations utiles pour lMutilisateur+

7i la logique est Suste pour le rapport" nous pou!ons


utilise, un script" puisque 2I;B supporte ^a!a7cript+ 7i
!otre application contient dS la logique" !ous pou!e,
lMutilise, dans !otre code ^a!a e.istant+
-ossi*ilits de 2I;B

-rsentation P Ane fois que les donnes sont


pr6tes" !ous a!e, un large !entail dMoptions pour
le prsenter lMutilisateur+ Ba*leau." grap)iques"
te.te et plus encore+

An seul ensem*le de donnes peut apparaOtre


dans de multiples fa#ons" et un seul rapport peut
prsenter des donnes partir de plusieurs
ensem*les de donnes+
3rc)itecture de 2I;B
image source : http://www.eclipse.org/0irt/phoeniF/project/description.php
Limites de 2I;B

-our lMinstant 2I;B ne g/re pas:

LManal4se statistique"

Les outils de Data Rining"

Les outils de modlisation du Data Hare)ouse"

Les outils @.tract Bransform and Load &@BL(+


7pago 2I

7pago2I est une solution de 2usiness Intelligence


enti/rement open source+

Cette solution fait partie de lMinitiati!e li*re<open


source 7pagoHorld" fonde et soutenue par
@ngineering 5roup+

7pago2I est distri*u sous licence Ro,illa -u*lic


License" qui est compati*le a!ec les usages
commerciau.+
7pago2I 3rc)itecture
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/8pago(I8erer
7pago2I
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(IModules
7pago2I studio" sd'" meta
7pago2I 7tudio est len!ironnement de d!eloppement
intgr qui permet au. d!eloppeurs de conce!oir et
modi$er les mod/les des diJrents moteurs danal4se"
comme rapports" diagrammes" rapports danal4se
gograp)ique et ta*leau. de *ord+
Ce module soutient la p)ase de dploiement" oZ les
documents anal4tiques sont tests et pu*lis sur 7pago2I
7er!er" a!ec lequel 7pago2I 7tudio interagit grce
7pago2I 7DT+
7pago2I 7DT est utilis pour lintgration des ser!ices
fournis par 7pago2I 7er!er+ Il permet dintgrer des
documents tra!ers un !entail de ser!ices Ue* et de
pu*lier les documents 7pago2I dans de portails et
applications e.ternes+
7pago 2I

7pago2I Reta a t spci$quement con#u pour la


gestion et interrogation des mtadonnes+

La plateforme permet la gestion des


mtadonnes tec)niques et des mtadonnes
mtier" en permettant au. administrateurs et
utilisateurs dinterprter correctement leurs
sources de donnes+

7pago2I 7er!er est le module principal de la


suite" qui oJre toutes les fonctionnalits centrales
et anal4tiques de la plateforme+
;apports" pour lMaIc)age
des donnes structures"
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
;apports" pour lMaIc)age
des donnes structures"
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
3nal4se GL3-" pour consulter et
na!iguer tra!ers les donnes"
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
Diagrammes" pour lMaIc)age
simple et intuitif des informations"
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
Ba*leau. de *ord en temps rel" pour
sui!re lM!olution des indicateurs cl
de performance"
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
Rod/les dMIndicateurs cl de performance pour
d!elopper et tester des mod/les de monitorage
des performances"
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
Coc'pits" pour gnrer des ta*leau.
de *ord structurs et interactifs"
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
@.cuter les processus e.ternes qui peu!ent
interagir a!ec des s4st/mes de traitement
de transactions en ligne &GLB-("
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
7mart Xilter" pour la slection
guide des donnes
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
3nal4se goPrfrence" pour
lMaIc)age des informations sur une
*ase gograp)ique
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
3nal4se goPrfrence" pour
lMaIc)age des informations sur une
*ase gograp)ique
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
7pago @BL

7pago2I comprend un outil de c)argement et la


gestion des donnes &@BL( dans lMentrep%t de
donnes+

Le Roteur @BL 7pago2I int/gre la suite open


source Balend Gpen 7tudio BG7 de produits open
source+
@BL< @II" pour collecter les donnes
de diJrentes sources+
image source : http://www.spagoworld.org/Fwiki/0in/iew/8pago(I/(I.omponents
Balend Gpen 7tudio

Balend est un diteur de logiciels open source qui


permet :

lMintgration des donnes"

la gestion des donnes"

lMintgration dMapplications dMentreprise

Lintgration des logiciels et les ser!ices de donnes


grand+

Loutil qui nous intresse de pr/s est : Balend Gpen


7tudio for Data Integration: une application open
source pour la conception des tc)es &So*s(
dMintgration de donnes a!ec un en!ironnement de
d!eloppement grap)ique+
Balend @BL
Image source : http://;r.talend.com/products/es0
-enta)o

Le deu.i/me outil open source et gratuit le plus


populaire est 8-enta)o Data Integration:+
-enta)o est une entreprise fonde en 2004"

Il propose une suite de produits open source pour


la *usiness intelligence appels -enta)o
2usiness 3nal4tics pour fournir des ser!ices:

pour lMintgration de donnes" les ser!ices GL3-"


reporting" ta*leau. de *ord" lMe.ploration de
donnes et les outils @BL+
@BL de -enta)o &'ettle pour
l@BL" et spoon pour la 5AI(
Image source : http://;orums.pentaho.com/showthread.php?9HH22)8poon)"3I)changes
-enta)o @BL &'ettle pour
l@BL" et spoon pour la 5AI(
Image source : http://source;orge.net/projects/pentaho/
Gutils de 2I pa4ants
'
Ricrosoft 2I &idal pour les 752D microsoft 7WL
ser!er" a!ec ses diJrentes composantes ssrs"
ssas" ssis" etc+(
'
7ap 2usiness G*Sects &idal pour les s4st/mes
utilisant des @;- de 73-("
'
Gracle 2usiness Intelligence @nterprise @dition
&idal pour les 752D oracle("
'
I2R cognos &idal pour les 752D d*2("
Xutur de la *usiness
intelligence

1ig 2ata :
'
3nal4ser dnormes quantits de donnes"
'
` partir de sources structures :

2ase de donnes" s4st/mes oprationnels"


7er!ers" etc+
'
` partir de sources non structures :

2logs" ;seau. sociau." sites He* de tous


genres" etc+

2ata (isualization :
'
Visualisation de donnes de fa#on faire
apparaOtre linformation rapidement et la
rendre compr)ensi*le par les utilisateurs+
Rerci pour !otre attention
Wuestions 1