Vous êtes sur la page 1sur 10

DEUXIEME PARTIE : PROBLEMATIQUE

1. Introduction
A. Entrepts de donnes : Gnralits
B. Entrepts orients processus mtiers
2. Etat de lart : synthse
3. Motivations
4. Problmatique

DEUXIEME PARTIE : PROBLEMATIQUE


1 .Introduction
A. Entrepts de donnes : Gnralits
1. Dfinition
Un Entrept de donnes est une base de donnes regroupant l'ensemble des donnes
fonctionnelles d'une entreprise. Il entre dans le cadre de l'informatique dcisionnelle ;
son but est de fournir un ensemble de donnes servant de rfrence unique, utilise
pour la prise de dcisions dans l'entreprise par le biais de statistiques et de rapports
raliss via des outils de reporting.
D'un point de vue architectural, il existe deux manires de l'apprhender :
L'architecture "de haut en bas" : selon Bill Inmon, l'entrept de donnes est une
base de donnes au niveau dtail, consistant en un rfrentiel global et
centralis de l'entreprise. En cela, il se distingue du Datamart, qui regroupe,
agrge et cible fonctionnellement les donnes.
L'architecture "de bas en haut" : selon Ralph Kimball, l'entrept de donnes est
constitu peu peu par les Datamarts de l'entreprise, regroupant ainsi diffrents
niveau d'agrgation et d'historisation de donnes au sein d'une mme base.
La dfinition la plus communment admise est un mlange de ces deux points de vue.
Le terme "data warehouse" englobe le contenant et le contenu : il dsigne d'une part la
base dtaille qui est la source de donnes l'origine des Datamarts, et d'autre part
l'ensemble constitu par cette base dtaille et ses Datamarts. De la mme manire, les
mthodes de conception actuelles prennent en compte ces deux approches, privilgiant
certains aspects selon les risques et les opportunits inhrents chaque entreprise.

2. Principe de fonctionnement

Intgration
Dans les faits, les donnes alimentant l'Entrept de donnes sont htrognes, issues de
diffrentes applications de production, voire de fichiers dits "plats" (fichiers Excel,
fichiers texte, XML...). Il sagit alors de les intgrer, de les homogniser et de leur
donner un sens unique comprhensible par tous les utilisateurs. La transversalit
recherche sera dautant plus efficace que le systme dinformation sera rellement
intgr dans sa globalit. Cette intgration ncessite notamment :
une forte activit de normalisation et de rationalisation, oriente vers la qualit ;
une bonne gestion des rfrentiels, incluant une vrification constante de leur
intgrit ;
une parfaite matrise de la smantique et des rgles de gestion des mtadonnes
manipules.
La problmatique de l'intgration repose sur la standardisation de donnes internes
l'entreprise, mais aussi des donnes externes (provenant par exemple de clients ou de
fournisseurs).
Ce nest quau prix dune intgration pousse que lon peut offrir une vision homogne
et vritablement transverse de lentreprise. Ceci suppose que le systme dinformation
de lentreprise en amont soit bien structur, bien matris, et bnficie dj dun niveau
dintgration suffisant. Si tel n'est pas le cas, la mauvaise qualit des donnes peut
empcher la mise en uvre de l'entrept de donnes.
Historisation
L'historisation d'un Datawarehouse repose sur le principe de conservation des
donnes (ou de non-volatilit des donnes). Afin de conserver la traabilit des
informations et des dcisions prises, les donnes une fois entres dans l'Entrept sont
stables, en lecture seule, non modifiables par les utilisateurs. Une mme requte lance
plusieurs fois diffrents moments doit ainsi restituer les mmes rsultats. Ds quune
donne est qualifie pour tre introduite dans l'Entrept de donnes, elle ne peut donc
plus tre altre, modifie ou supprime (en del dun certain dlai de purge). Elle
devient, de fait, partie intgrante de lhistorique de lentreprise.
Le principe de non-volatilit tranche avec la logique des systmes de production, qui
bien souvent remettent jour les donnes par annule et remplace chaque nouvelle
transaction. Chaque donne collecte se voit affecter une date ou un numro de version
pour viter de recouvrir une information dj prsente dans la base de donnes, et
permettre de suivre son volution au cours du temps. Il y a de cette manire
conservation de l'historique.
Dun point de vue fonctionnel, cette proprit permet de suivre dans le temps
lvolution des indicateurs et de raliser des analyses comparatives (par exemple, les

ventes d'une anne sur l'autre). De ce fait, dans un entrept de donnes, un rfrentiel
de temps unique est ncessaire.
Organisation fonctionnelle
L'Entrept de donnes intgre au sein d'une mme base les informations provenant de
multiples applications oprationnelles. On passe ainsi dune vision verticale de
lentreprise, dicte par des contraintes techniques, une vision transversale, dicte par
le besoin mtier, qui permet de croiser fonctionnellement les informations. Lintrt de
cette organisation est de disposer de lensemble des informations utiles sur un sujet le
plus souvent transversal aux structures fonctionnelles (services) de lentreprise. On dit
que l'Entrept de donnes est orient mtier , en rponse aux diffrents mtiers de
lentreprise dont il prpare lanalyse.
D'un point de vue conceptuel, les donnes d'un Data warehouse sont interprtables
sous forme d' indicateurs rpartis selon des axes (ou dimensions) : par exemple, le
nombre de clients (indicateur) rparti par jour de vente, magasin ou segment de
clientle (axes). Techniquement, la modlisation de l'Entrept de donnes peut
matrialiser cette organisation sous forme de tables de fait ou et de tables de
rfrentiel.
Structure de donnes
L'Entrept de donnes a une structure de donnes qui peut en gnral tre reprsente
par un modle de donnes normalis 3FN ((en)3NF) pour les donnes de dtail et/ou
en toile ou en flocon pour les donnes agrges et ce dans un SGBD relationnel
(notamment lorsqu'il s'agit de donnes lmentaires ou unitaires non agrges). La
traduction technique de ce modle se fait souvent au sein d'un cube OLAP.
L'Entrept de donnes est conu pour contenir les donnes en adquation avec les
besoins de lorganisation, et rpondre de manire centralise tous les utilisateurs.
Ainsi, il nexiste pas de rgle unique en matire de stockage ou de modlisation.
Ainsi, ces donnes peuvent donc tre conserves :
de prfrence, sous forme lmentaire et dtaille (exemple : pour une banque,
chaque opration sur chaque compte de chaque client) si la volumtrie le
permet. Les donnes lmentaires prsentent des avantages vidents
(profondeur et niveau de dtail, possibilit d'appliquer de nouveaux axes
d'analyse et mme de revenir a posteriori sur le pass ) mais reprsentent un
plus grand volume et ncessitent donc des matriels plus performants.
ventuellement, sous forme agrge selon les axes ou dimensions d'analyse
prvus (mais ces agrgations sont plutt ralises dans les datamarts que dans
les entrepts de donnes proprement dits). Les donnes agrges prsentent
d'autres avantages (facilit d'analyse, rapidit d'accs, moindre volume). Par
contre, il est impossible de retrouver le dtail et la profondeur des indicateurs

une fois ceux-ci agrgs : on prend le risque de figer les donnes selon une
certaine vue avec les axes d'agrgation retenus, et de ne plus pouvoir revenir sur
ces critres si l'on n'a pas conserv le dtail (par exemple, si l'on a agrg les
rsultats par mois, il ne sera plus possible de faire une analyse par journe).

B. Entrepts orients processus mtiers


Nous citerons plusieurs travaux en rapport avec les processus mtiers notamment :
1.Un processus mtiers(BP) se compose d'un ensemble de tches et d'activits
coordonnes utilis pour atteindre un but ou un but mtier. Dans les entreprises
modernes, les BP sont raliss par un mlange des droulements des oprations, des
systmes des TI, services Web.
La comprhension des processus mtiers et l'analyse de l'excution de Donnes de
BP (par exemple, registres contenant des vnements, des messages d'interaction, etc.)
est difficile cause du manque de documentation et particulirement la faon dont des
vnements de processus travers ces systmes sont corrls dans les exemples de
processus qui sont subjectifs : dpendre de la perspective de l'analyste de processus.
Comme par exemple, un analyste peut vouloir comprendre les retards la commande
d'un processus (les bouts bout de la commande la livraison) pour un client
spcifique, tandis qu'un autre analyste est seulement considr avec le processus
dempaquetage pour tous les ordres dans le dpartement d'expdition. Certainement,
un modle de processus ne servirait pas le but d'analyse pour les deux situations.
La premire tape de l'analyse de processus est le recueil et l'intgration des donnes
de processus d'excution dans le registre de l'vnement de processus partir de
divers, potentiellement htrognes, systmes et services.
La prochaine tape fournit des techniques pour permettre aux utilisateurs de dfinir les
rapports entre les vnements de processus.
Ceci est illustr dans larticle : A query language for analyzing business processes
execution de Seyed-Mehdi-Reza Beheshti, Boualem Benatallah, Hamid Reza
Motahari-Nezhad et Sherif Sakr.
Leur travail se rsume ainsi :
Deux points essentiels ont t reprsents : un modle de donnes et un langage de
requtes pour interroger et analyser les donnes de lexcution des processus mtiers.
Le modle de donnes prend en charge les entits structures et non structures, et
introduit les nuds dossiers et chemins comme abstractions de la premire
classe. Les dossiers permettent de dcomposer un registre dvnements en de petits

groupes plus clairs. La fouille des nuds dossiers peut rsulter de la dcouverte
processus-relations centrales (ex. instances de processus) et les abstractions (ex.
modle de processus) qui peuvent tre stocks dans des nuds chemin pour les
analyses futures. Le langage de requtes, c..d. FPSPARQL, dfinie comme une
extension du SPARQL pour la manipulation et linterrogation des entits, les nuds
chemin et dossier. Pour valuer le bon fonctionnement du FPSPARQL, on a conduit
les expriences travers un large registre dvnements.

2. La condition de traiter un nombre croissant de modles de processus mtiers dans


des organismes forme la fois un dfi et une opportunit. Le dfi tant comment
traiter raisonnablement de tels grands volumes de modles et comment adapter ces
grands entrepts les approches qui fonctionnent avec un petit ensemble de modles.
L'occasion qui nous est offerte se situe en exploitant cette source potentiellement riche
en contenu en combinaison avec les nombreux outils et techniques de contrle de
processus industriel qui sont dj disponibles, pour crer de nouveaux modles et ainsi
apprhender les scnarios d'application qui taient imprvus l'heure au niveau de leur
conception. La demande de la gestion grande chelle de modle de processus est
conduite par la croissante pression de crer des initiatives au niveau de l'entreprise de
BPM.
Larticle ADVANCED PROCESS MODEL REPOSITORIES (APROMORE)
deMarcello La Rosa and Michael Rosemann BPM Group, Queensland University of
Technology parle de a,en voice donc un petit rsum:
Pour relever les dfis et exploiter les occasions lies l'utilisation de grandes
collections de modles de processus, le groupe de contrle de processus mtiers
(BPM) l'universit de technologie du Queensland propose les fondements pour le
dveloppement d'un entrept de modle de processus avanc (APROMORE).
APROMORE fournira une plateforme ouverte et extensible pour stocker et exploiter
les modles de processus mtiers. Celle-ci se construira sur les outils et techniques
existants, pour fournir les dispositifs du dernier cri pour la prsentation du modle,
l'analyse, l'intgration, l'amlioration, et la rutilisation. On s'attend ce quelle
soulage sensiblement et amliore l'utilisation industrielle des modles de processus
mtiers car APROMORE profitera pleinement des technologies disponibles et
naissantes (par exemple Web 2.0, cloud computing) comme stimule davantage de

recherches dans la discipline de modlisation de processus. Spcifiquement, des


fonctionnalits d'APROMORE peuvent tre classifies selon quatre larges services :
Evaluation, comparaison, gestion et prsentation.
Et larchitecture dAPROMORE se prsente comme suit :

3. Business Process Reengineering John Mylopoulos 2002


Conception et analyse dun systme dinformation
Les points essentiels sont :
Identification du problme : quel est lobjectif du projet ?
Le problme est toujours dfini par le client
Par exemple une grande compagnie dassurance veut rduire le temps moyen entre le
processus de rclamation dune assurance de deux mois deux semaines
Ampleur du problme : comment aborder la vision, lobjectif ?

La prochaine chose qui doit tre trait pendant lanalyse est lampleur du problme
quon va aborder. Cest la slection parmi diffrentes contraintes pour que le problme
soit abord, par exemple un nouveau systme qui manipule uniquement des ordres
d'achat, contre un qui manipule des budgets.
En plus, nous supposons que les objectifs d'organisation sont fixes, ainsi l'analyste
fonctionnel na pas de souci au sujet de cette dimension (dans la pratique, ceci peut ne
pas tre raliste.)

Choisir parmi les alternatives des BP


Il sagit de choisir le moyen souhait parmi les diffrents moyens daccomplir une
mme tche

Choisir les alternatives parmi les solutions automatises


Pour chaque processus mtier propos, on examine quelles tches peuvent tre
informatises, ou facilites par le systme.

ringnierie des BP
- Les alternatives de lanalyse des besoins qui peuvent impliquer des changements
dans la manire dont une organisation ou entreprise fait les mtiers
- changer lorganisation des BP cest devenu populaire de nos jours et cela se rfre au
BPR(business process reengineering)
- BPR rclame une restructuration nergique et globale d'une organisation qui limine
les limites entre les dpartements et fait que l'organisation se base sur les processus
mtiers globaux, ce qui dfinir ses mtiers.

4. Les entrepts de modle de processus mtiers reprsentent la connaissance


prcieuse d'une organisation ou d'un domaine mtier. Dans beaucoup de cas, ces
entrepts contiennent des centaines ou mme des milliers de modles et sont le fruit de
plusieurs annes d'effort humain. Avec le temps, les entrepts de modle de processus
tendent accumuler les fragments doubles (doublons), par la cration de nouveaux
modles de processus en copiant et en fusionnant des fragments d'autres modles.
Larticle clone detection in repositories of business process models de Marlon
Dumas, Luciano Garcia-Banuelos, Marcello La Rosa, et Reina Uba 2010

propose une mthode pour dtecter les fragments doubles dans les modles de
processus. Ces derniers peuvent tre refactoriss en tant que sous-processus spars
afin d'augmenter la lisibilit et l'entretien.
Pour cela une structure d'indexation pour faciliter la dtection rapide des clones dans
de grands entrepts de modle de processus a t prsente. Il prsente une mthode
pour indexer les modles de processus afin d'identifier les fragments SESE doubles
(clones) qui peuvent refactoriss dans des sous-processus spars. Les fragments
SESE (single-entry single-exit) sont lune des conditions que doit supporter la
structure dindex propose. La proposition combine une mthode pour dcomposer les
modles de processus en fragments SESE avec une mthode qui gnre une variable
unique d'un graphe marqu. Cette variable est employe pour dterminer si un
fragment SESE dans un modle apparat ailleurs dans le mme modle ou dans un
autre modle.
Une valuation exprimentale a t effectue avec deux entrepts de modle de
processus. Lobservation dmontre que lapproche de dtection de clone propos
amliore le temps de recherche et mieux encore, peut sadapter sur des entrepts de
catgorie commerciale.
Une autre possibilit serait dteindre la technique propose afin d'identifier les clones
approximatifs. Ceci a des applications dans le cadre de standardisation de processus,
quand les analystes cherchent identifier les fragments semblables mais pas identiques
et les remplacer par les fragments normaliss afin d'augmenter lhomognit des
pratiques en matire de travail.

5. Querying business process model repositories Jianmin Wang, Tao Jin,


Raymond K. Wong, Lijie Wen 2013
La technologie de BPM devient de plus en plus populaire, ayant pour rsultat la
cration de plus en plus des modles conomiques. Par consquent, il y a un besoin de
ces modles de BP d'tre affectivement contrls. Pour la gestion efficace des modles
BP, pouvoir questionner efficacement le grand nombre de modles de BP est essentiel.
Par exemple, il est prfrable de trouver un modle semblable ou proche pour adapter
aux besoins du client, plutt que la construction dun nouveau modle partir de zro.
Ceci pargnerait non seulement le temps, mais serait galement moins sujet aux
erreurs et plus cohrent avec les modles existants de l'entreprise. Questionner
efficacement des grands nombres de modles de processus d'affaires est galement
essentielle pendant la fusion de compagnie, dans laquelle les modles de processus
mtiers des compagnies multiples doivent tre examins et intgrs. Larticle fournit :
une vue d'ensemble du champ de questionner les modles de processus mtiers ; un

rsum de sa littrature ; et une liste de dfis (et de quelques solutions potentielles) qui
doivent tre adresss encore. En particulier, nous visons comparer les diffrences
entre questionner les modles de processus mtiers et questionner les graphes
gnrales. Nous discutons galement le travail de littrature de la recherche de
questionnement de graphes qui peut tre employe en questionnant les modles de
processus mtiers.

3. Motivations
les processus mtiers jouent un rle fondamental dans la ralisation de systmes
informatiques rpondant aux objectifs du mtier.
Processus mtiers, partie intgrante de la description dun systme dinformation
Le systme dinformation, particulirement dans une perspective durbanisation,
prsente deux aspects : dun ct celui de ses processus et acteurs, de lautre celui de
ses fonctions logiques et entits informationnelles.
Cest lidentification des processus qui oriente la construction de larchitecture dun
systme dinformation en trois facettes interdpendantes : larchitecture mtier,
larchitecture fonctionnelle et larchitecture informatique.
Le processus est galement au centre de la mise en uvre de certains outils logiciels,
notamment les progiciels intgrs et les outils de gestion de workflow.

4. Problmatique
Plusieurs concepts ont t proposs dans le domaine des
entrepts des donnes, notre projet vise d'avoir une gestion dans
les entrepts pour les processus mtier.

Pour couvrir les besoins spcifiques de lutilisateur dans les


environnements mtiers,
Lide est le dveloppement dun entrept orient processus
mtier.
Un entrept qui prend en charge un ensemble des fragments dans
une spcification bien dfinit et qui rpond des objectifs.