Vous êtes sur la page 1sur 81

UNIVERSITE MOHAMMED V AGDAL ECOLE MOHAMMADIA DINGENIEURS

Dpartement : Gnie Informatique Section : Systmes dInformation

Mmoire de Projet de Fin dEtudes N INF 09 /12

Conception et mise en place dun systme dcisionnel pour le suivi du flux de stock du compte ATAC

Ralis par: Mle. NADIA BENHACHEM Mle. ASMAA ELOURAOUI Dirig par: Mme. LAILA BENHLIMA M.SLIMANE BAH M.SAID ABOUKS

Anne 2011-2012

Ddicaces A ta mmoire papa, enfin ta petite fille qui avait que 5ans achve son parcours universitaire. Jaurai aim que tu sois l mais je sais que tu assiste den haut et jespre que tu es fier de ta petite KHRIBIKA. Je te rends hommage cher papa et je te ddie ce modeste travail. A toi maman, pour la premire fois je ralise que les mots ne servent rien et quoi que je dise je ne saurai exprimer ma gratitude ton gard. Tu as vraiment consenti tant de sacrifices pour faire de moi la personne que je suis aujourdhui. Que Dieu le tout puissant te bni chre maman. A mes chers frres Younes et Karim je vous adore tant. A ux plus belles surs du monde Saloua et Mouna . A ma clique du lyce militaire Meryem,Hoda,Hakima,Zineb,Fatima,Fadoua, merci de mavoir appris le vrai sens de lamiti. A mes chers amis hajjatiii, Fidaa, Safaa,Laila,Sarra ,adnane,adel merci dtre les meilleurs amis du monde . A tous ceux qui ont marqu ma vie et que jai oubli de citer. Je vous ddie ce modeste travail avec lexpression de ma profonde gratitude Asmaa..

Ddicaces
Aux deux tres qui ont donn sens mon existence, mes chers parents : Aucun remerciement, aucun mot damour, aucune expression de gratitude ne sera suffisante pour vous exprimer mon respect et ma reconnaissance pour tous vos sacrifices dploys afin de mlever dignement et dassurer mon ducation dans les meilleures conditions. Merci pour votre amour inconditionn, votre capacit me pardonner, votre confiance qui ma couronne. Que ce travail humble devant le votre soit pour vous un tmoignage de ma vive reconnaissance et de mon amour filial. A ma trs chre surette Sanaa Merci pour tes encouragements, ta confiance, ta prsence et ton soutien dans les moments difficiles. Tu es pour moi la meilleure sur au monde. Jespre que tous tes rves soient exhausss et je te souhaite tout le bonheur du monde ma chrie. A mon oncle Samir et ma chre tante Fouzia Franchement je ne trouve pas les expressions pour vous remercier, vous mavez toujours considr comme votre fille, vous tiez toujours l me soutenir et mindiquer la bonne voie sans toutefois attendre de rcompense. Vous tes pour moi le plus magnifique modle de gnrosit, de labeur et de persvrance. Merci pour vos efforts fournis afin de me soutenir Merci pour le temps que vous avez consacr mon futur A Mon oncle Simohamed et ma chre tante Atika Vous tes trs chers moi vous les deux, vous avez contribu de prs ma russite, vous navez jamais hsit me soutenir dans le meilleur et dans le pire. Milles merci pour vos encouragements, votre soutien et vos prires Pour votre volont ardente de me voir russir Pour votre bienveillance sur mon avenir Je vous aime tant A ma trs chre grand-mre Toute ma reconnaissance pour ton amour, tes encouragements et ta tendresse. Que dieu te garde et te prserve pour nous. A mes adorables cousines et cousins : Dounia, Anis, Rda et ma petite Hiba Pour votre soutien et votre amour, pour tous les agrables moments que nous avons partag ensemble, je vous ddie ce travail et je vous souhaite une vie pleine de bonheur et de russite. A mes amis:Soukaina, Laila, Hanaa, Meriem,Soukaina hadane,Ilham,imane, Mohammed,Anass chaouki,Mostafa,Smail,Hassan,Youssef,Anas douras Merci dtre toujours l pour moi

Nadia
II

REMRECIEMENTS

Au terme de ce travail, nous tenons remercier vivement et profondment tous ceux qui ont contribu de prs ou de loin sa ralisation. De prime bord, nous souhaitons exprimer toute notre gratitude nos encadrants lEcole Mohammadia dIngnieurs, Madame Laila Benhlima et Monsieur Slimane Bah qui nous ont soutenu tout au long de notre projet avec leurs directives pertinentes et leurs remarques trs constructives. Nos ardents remerciements sadressent galement Monsieur Said Abouks, Ingnieur dtat au sein de lquipe ATAC du groupe HP CDG, pour la qualit de son encadrement, sa permanente disponibilit, et ses prcieux conseils qui nous ont permis de mener bien notre stage. Nous remercions chaleureusement Monsieur Anass Elouradani, Ingnieur et membre de lquipe ATAC, pour son soutien, sa collaboration, ses orientations et ses explications enrichissantes. Nous exprimons galement toute notre reconnaissance Monsieur Mohamed Hadid, chef de lquipe ATAC qui nous a fait lhonneur de nous confier ce projet, ainsi que tous les membres de lquipe pour lagrable ambiance de travail qui nous a permis une meilleure intgration dans un environnement chaleureux et bienveillant. Nos sincres remerciements pour les membres du Jury Madame Ounsa Roudies et Monsieur Driss Ghanami pour le temps quils nous ont rserv afin dvaluer notre humble travail. Nous tenons rendre hommage au corps professoral du dpartement informatique qui nous a fourni la matire premire pour reprsenter notre cole avec une meilleure image.

III

Rsum
Affectes au ple Business Intelligence de lquipe ATAC au sein du groupe HP CDG, notre projet de fin dtude sinscrit dans le cadre de linformatique dcisionnelle. ATAC se charge de la gestion informatique de la totalit des entrepts et des magasins du client ATAC Market qui reprsente une filiale de la chane des supermarchs du groupe Auchan. Dans ce contexte, et afin doffrir aux managers du groupe un meilleur usage des donnes pour leur prise de dcision, lquipe se base actuellement dans son processus dcisionnel sur une solution logicielle appele Mapping. En fait, ldition des tableaux de bord via cette solution ncessite lintervention dun informaticien qui doit slectionner les tables concernes, laborer les requtes, et faire le traage manuel de linterface de ses rapports. De plus, lquipe ATAC ne dispose pas dun entrept de donnes propre au processus dcisionnel, mais accde directement la base de production pour la restitution des donnes. Cette mthode savre critiquable puisquelle augmente le temps de rponse de la base et cre une sorte de concurrence sur laccs simultan aux donnes entre les traitements oprationnels et dcisionnels. Pour remdier tous ces problmes, notre projet vise la mise en place un datamart destin au suivi des diffrentes sorties du stock des magasins du compte ATAC. Lalimentation du datamart va seffectuer en utilisant loutil Talend. En outre, nous visons migrer le processus danalyse et de reporting vers la suite logicielle de Business Object afin de faciliter ldition des tableaux de bord dun cot, et permettre aux dcideurs de consulter les indicateurs et crer eux mme leurs propres rapports dun autre cot, et cela en mettant leur disposition une reprsentation mtier organise des donnes. Notre systme va donc permettre de gagner en terme dautonomie, dergonomie des interfaces, et de temps dans llaboration des rapports qui va tre rduit quelques secondes .

IV


" "ATAC . HP CDG "" Business Intelligence

" "ATAC " ."Auchan "."Mapping . " "ATAC . . " "datamart " ."ATAC " ."Talend " "Reporting " Business "Object . .

Abstract
As member of the ATAC teams business intelligence center within HP CDG group, our project is a part of the decision-making support system. ATAC is responsible of IT management of all warehouses and stores of its customer said ATAC Market customer. This later is a subsidiary of the supermarket chain Auchan. ATAC managers, as any manager, have to make the right decisions. Currently, in order to offer to the groups managers a better use of the huge amount of data for decision making, the ATAC team is using a software solution called Mapping. However, publishing scorecards via this solution requires the involvement of an IT professional. Indeed, this later must select the relevant tables, implement queries, and make manual drawing of reports interface. Besides, the ATAC team does not have a specific data warehouse to support decision making. In other words, it retrieves data directly from the production database. This method is questionable as it increases the database response time and creates competition between operational and decision-making treatments due to simultaneous access to data. To address these issues, our project will implement a datamart for monitoring the various outputs of the ATAC accounts stores inventory. The datamart will be fed using the Talend tool. Furthermore, we aim to migrate the analysis and reporting process to the Business Object software suite. The goal is, on one hand, to make scorecards creation easier and on the other hand, to enable decision makers to view and create their own reports thanks to an organized business representation of the data. Therefore, our proposed system will have several benefits: autonomy, ergonomic interfaces, and time-saving for reporting. In fact, time will be reduced to few seconds only.

VI

Liste des abrviations :


ABREVIATION
APPS BI BPO CA CDG ERP ETL GSD HP ID ISO IT ITIL ITO PGC RCP SWT TOS TTC TVA

DESIGNATION
Applicatif Services Business Intelligence Business Process Outsourcing Chiffre dAffaires Caisse de Dpt et de Gestion Entreprise Resource Planning Extract Transform Load Global Service Desk Hewlett Packard Informatique Dcisionnelle International Organisation for Standardization Information Technology Information Technology Infrastructure Library Infrastructure Technology Outsourcing Produits Grande Consommation Rich Client Platform Standard Widget Toolkit Talend Open Source Toutes Taxes Comprises Taxes sur la Valeur Ajoute

VII

Liste des Figures :


Figure 1.1 : Organigramme de l'equipe atac .................................................................................... 5 Figure 1.2 : Interface de l'erp gold ................................................................................................... 7 Figure 1.3 : Schema illustrant la demarche du traage des tableaux de bord ................................... 9 Figure 1.4 : Planning de deroulement du pfe ................................................................................. 11 Figure 2.1 : Schema de lorganisation geographique du compte atac ............................................ 14 Figure 2.2 : Exemple de la structure marchandise du secteur pgc ............................................... 15 Figure 2.3 : Diagramme de cas dutilisation decrivant les fonctionnalites du systeme .................. 16 Figure 2.4 : Diagramme de sequence- elaborer un rapport ............................................................ 17 Figure 2.5 : Schema en etoile ......................................................................................................... 19 Figure 2.6 : Schema en en flocon ................................................................................................... 20 Figure 2.7 : Schema conceptuel de literation vente ...................................................................... 22 Figure 2.8 : Schema conceptuel de literation demarque ............................................................... 24 Figure 2.9 : Schema conceptuel de literation rupture de stock ...................................................... 25 Figure 2.10 : Schema conceptuel global du datamart ...................................................................... 26 Figure 2.11 : Processus decisionnel ................................................................................................. 27 Figure 3.1 : Diagramme de radar pour la comparaison des trois etls ............................................. 32 Figure 3.2 : Diagramme radar et le tableau devaluation des outils de reporting........................... 36 Figure 4.1 : Chargement de la dimension structure marchandise .................................................. 40 Figure 4.2 : Chargement de la table structure organisation ............................................................ 41 Figure 4.3 : Chargement de la table dimension temps ................................................................... 42 Figure 4.4 : Transformation de la date ........................................................................................... 43 Figure 4.5 : Chargement de la dimension type demarque .............................................................. 43 Figure 4.6 : Chargement de la table de fait vente ........................................................................... 45 Figure 4.7 : Traitement effectue pat le composant taggregaterow ................................................. 45 Figure 4.8 : Planification des jobs .................................................................................................. 45 Figure 4.9 : Temps de chargement de la table de fait demarque .................................................... 46 Figure 4.10 : Lunivers ATAC ......................................................................................................... 49 Figure 4.11 : Interface desktop intelligence ..................................................................................... 50 Figure 4.12 : Navigation dans la hierarchie ..................................................................................... 50 Figure 4.13 : Rapport du pourcentage du chiffre daffaires des magasins dans le reseau sud ......... 52 Figure 4.14 : Evolution du chiffre daffaires dans le temps ............................................................. 52 Figure 4.15 : Quantite de demarques dans chaque secteur en fonction des types de demarque ...... 53 Figure 4.16 : Diagramme des quantites des demarques ................................................................... 53 Figure 4.17 : Nombre darticle en rupture....................................................................................... 54 Figure 4.18 : Taux de demarque en 2011 ......................................................................................... 54

VIII

Liste des tableaux :


TABLEAU 3.1 : ILLUSTRATION DU RESULTAT DE LEVALUATION. 32 TABLEAU 4.1 : COMPOSANTS DE TALEND UTILISES. 39 TABLEAU 4.2 : ETATS REALISES AU PROFIT DU COMPTE ATAC. 51

IX

Sommaire
Introduction .......................................................................................................................... 1 Chapitre 1 : Contexte gnral du projet .............................................................................. 3
1.1 Organisme daccueil ......................................................................................................... 4 Prsentation du groupe HP-CDG ............................................................................... 4 Prsentation de lquipe ATAC ................................................................................. 5 1.1.1 1.1.2 1.2

Cadrage du projet .............................................................................................................. 6 Cadre du projet .......................................................................................................... 6 Description du projet................................................................................................. 6 Etude de lexistant .................................................................................................... 7

1.2.1 1.2.2 1.2.3 1.3 1.4 1.5

Problmatique ................................................................................................................... 9 Objectifs et solutions ...................................................................................................... 10 Conduite et dmarche du projet .................................................................................... 11

Chapitre 2 : Analyse et conception .................................................................................... 13


2.1 2.2 2.3 Analyse des besoins......................................................................................................... 14 Les cas dutilisation du systme ..................................................................................... 16 Modlisation .................................................................................................................... 18 Notions cls de la modlisation multidimensionnelle .......................................... 18

2.3.1

2.3.1.1 Concept de dimension ............................................................................................ 18 2.3.1.2 Concept de fait ........................................................................................................ 18 2.3.1.3 Modle de donnes ................................................................................................. 19 2.3.2 2.3.3 Choix du modle de donnes .................................................................................. 20 Modlisation de litration vente : ......................................................................... 21

2.3.3.1 Indicateurs recueillis ................................................................................................ 21 2.3.3.2 Dimensions recueillies .............................................................................................. 21 2.3.3.3 Schma conceptuel de litration Vente .................................................................. 22 2.3.4 Modlisation de litration dmarque et dons aux associations :....................... 23

2.3.4.1 Indicateurs recueillis ................................................................................................ 23 2.3.4.2 Dimensions recueillies .............................................................................................. 23 2.3.4.3 Schma conceptuel de litration Dmarque ...................................................... 23 2.3.5 Modlisation de litration rupture de stock ....................................................... 24

2.3.5.1 Indicateurs recueillis .............................................................................................. 24 X

2.3.5.2 Dimensions recueillies ........................................................................................... 25 2.3.5.3 Schma conceptuel de litration rupture de stock .............................................. 25 2.3.6 Schma conceptuel global du datamart ................................................................. 26

Chapitre 3 : Etude comparative des outils ......................................................................... 28


3.1 Outils ETL ......................................................................................................................... 29 Prsentation des ETL choisis .................................................................................. 29 Choix de loutil ETL .................................................................................................. 30 3.1.1 3.1.2 3.2

Outils Reporting ............................................................................................................. 33 Prsentation des outils Reporting .......................................................................... 33 Choix de loutil Reporting ....................................................................................... 34

3.2.1 3.2.2

Chapitre 4 : Ralisation...38
4.1 Alimentation du Datamart .............................................................................................. 39 Composants Talend utiliss .................................................................................... 39 Alimentation des tables de dimensions ................................................................. 40 Alimentation des tables de faits ........................................................................... 44 Paramtrage de la frquence de la mise jour du datamart ............................... 45 Analyse du temps de chargement........................................................................... 46

4.1.1 4.1.2 4.1.3 4.1.4 4.1.5 4.2

Cration de lunivers et reporting ................................................................................... 47 Cration de lunivers................................................................................................ 47 Analyse et reporting ................................................................................................ 49

4.2.1 4.2.2

4.2.2.1 Analyses multidimensionnelles ................................................................................ 49 4.2.2.2 Reporting .................................................................................................................. 51

Conclusion .......................................................................................................................... 56 Bibliographie et Webographie............................................................................................ 57 Annexes.......59

XI

Introduction
Dans leur qute de comptitivit, les entreprises essaient de plus en plus dexploiter les informations dont elles disposent pour amliorer leur processus de prise de dcision. Cependant, face la multiplication des sources de linformation, le volume des donnes collectes crot progressivement et rend difficile dorganiser, dexploiter, ou de comprendre ce quexpriment ces informations: des tendances, des faiblesses ou des forces caches. Ce problme nuit grandement la stratgie de lentreprise et la met dans lobligation de bien manager ses informations pour en faire un rel avantage concurrentiel.

Tel est le cas pour la chane des supermarchs ATAC Market, filiale du groupe Auchan et acteur majeur de la grande distribution en France. Elle dispose de plus de 400 magasins situs dans diverses rgions. Ces magasins mettent la disposition de leurs clients plus de 10 000 rfrences de produits. Dans ce contexte, si le chiffre daffaires baisse dans une priode bien prcise, de nombreuses questions se posent : quelle est la gamme de produits touche par cette baisse ? Dans quel segment de distribution ? Dans quelle rgion ? Le chiffre daffaires varie-t-il de la mme faon chaque anne ?...etc. Pour rpondre ces questions, lquipe ATAC charge de la gestion informatique de la chaine des supermarchs ATAC Market utilise la solution logicielle Mapping dans son processus dcisionnel. En fait, lutilisateur de Mapping labore ses rapports en interrogeant directement la base de production. Ceci augmente le temps de rponse du systme puisquil ncessite lexcution dun certain nombre de jointures et dagrgations pour obtenir le rsultat souhait. De plus, Mapping adapte une mthode de traage manuelle des interfaces des rapports, Ce traitement fastidieux peut prendre toute une journe pour llaboration dun seul tableau de bord. Il savre donc ncessaire de mettre en place un systme propre au processus dcisionnel englobant des donnes cibles, agrges et bien structures avec une interface flexible et facile utiliser. Ce dernier va permettre alors danalyser le pass, le prsent et de simuler lavenir pour anticiper les changements de lentreprise.

Ainsi notre projet de fin dtude sinscrit dans le cadre de linformatique dcisionnelle (ID) ou le Business Intelligence (BI). Il consiste mettre en place un systme qui rpond au besoin de notre client ATAC, et qui permet dobtenir une vision globale sur lvolution de son activit. Ainsi ATAC, serait en mesure dvaluer efficacement le flux de stock dans les diffrents magasins en traitant les ventes, les dmarques (en dautres terme les pertes produites dans les diffrents points de vente), ainsi que les diverses causes qui contribuent la rupture des articles. Pour atteindre ces objectifs, notre projet sest droul en deux phases principales. La premire a consist crer une base de donnes dcisionnelle (Datamart) qui englobe des donnes agrges et bien structures. Son rle est d'intgrer et de stocker l'information utile aux dcideurs et de conserver l'historique des donnes qui fera lobjet des analyses effectues pour des prises de dcision. Quant la deuxime phase, elle permet de reprsenter les donnes collectes auparavant sous forme de tableaux de bord ou de graphes permettant ainsi aux managers dlaborer eux mme des rapports selon leurs propres besoins sans avoir recours au service informatique grce aux fonctionnalits quoffre loutil Business Object.

Ce prsent rapport se compose de quatre chapitres. Dans le premier nous introduisons le contexte gnral ainsi que la conduite du notre projet, ensuite nous passons lanalyse et la modlisation conceptuelle de la base dcisionnelle dans le deuxime chapitre. Le troisime chapitre parlera du choix des outils utiliser, et finalement nous consacrons le dernier chapitre aux tapes de ralisation du projet savoir la phase dalimentation du Datamart et la phase de reporting. Enfin nous ouvrons quelques perspectives pour notre projet

Rapport PFE

Chapitre 1 : Contexte gnral du projet

Chapitre 1

Rapport PFE

Chapitre 1 : Contexte gnral du projet

1.1 Organisme daccueil : Nous prsentons dans cette partie le groupe HP-CDG avec ses diffrentes activits, ainsi que lquipe ATAC ou sest droul notre stage. 1.1.1 Prsentation du groupe HP-CDG Le groupe HP-CDG est le rsultat dun partenariat entre HP, le leader mondial du march IT et la Caisse de dpt et de gestion (CDG). Ce partenariat vient dans le cadre du dveloppement dune plateforme de services informatiques tourne vers loffshore francophone et hispanophone et destination du march intrieur marocain. [CDG, 2009] Depuis fin 2009, il est tabli dans la technopole de Rabat, Technopolis. Au dbut de 2012, le capital humain de HP CDG IT Services Maroc slve 715 personnes, la tranche dge est majoritairement de 19 29 ans. Il est important de noter que HP-CDG a dcroch la certification ISO 27001 en Fvrier 2011 et la certification ISO 9001 en Aout. De plus, 72 % des ressources de l'entreprise sont certifies ITIL v3. Les activits de HP CDG :

L'entreprise offre des services dans diffrents domaines qui sont : Data Center Services (ITO) : son but est de soutenir les projets et le fonctionnement d'un centre de donnes, avec comme activits principales : La gestion du stockage des donnes. La gestion du rseau informatique.

Global Service Desk (GSD): Point daccs unique pour toutes les demandes du service informatique, cest donc linterface oprationnelle principale entre le service informatique et les utilisateurs. Service applicatif (APPS) : Assure la conception, lintgration, le dploiement des quipements applicatifs, ses principales activits sont : La maintenance des logiciels. La mise en place d'une mthode de test aux diffrentes tapes d'un projet. Lintgration ERP. Le dveloppement informatique. Lassistance matrise douvrage.

Rapport PFE

Chapitre 1 : Contexte gnral du projet

Business Process Outsourcing (BPO) : Sa principale activit est la rception et le traitement des demandes des clients. [wiki, 2011] Notre projet de fin dtudes sest droul dans le cadre du dveloppement informatique du service applicatif APPS au sein de lquipe ATAC. 1.1.2 Prsentation de lquipe ATAC

La socit HP CDG prend en charge la gestion de plusieurs comptes clients parmi lesquels lenseigne ATAC qui est une chane de supermarchs du groupe Auchan en France et qui contient prs de 400 Supermarchs et 14 Entrepts rgionaux qui reprsentent les fournisseurs logistiques des points de vente. [HP CDG, 2012] La gestion de ce compte client est assure au Maroc par lquipe Back office ATAC divise en 3 domaines : Domaine Gold Stock : se charge du processus logistique, dinventaire, et de transport ainsi que des dtails de la facturation et des dlais de livraison des marchandises. Domaine Gold Central : centralise tous les flux de vente, dachat et de rapprovisionnement, et travaille sur loptimisation des prvisions de ventes et des stratgies de rapprovisionnement des stocks. Domaine BI : gre le flux entre Gold Stock et Gold Central ainsi que le processus dcisionnel.

Figure 1.1 : Organigramme de l'quipe ATAC

Rapport PFE

Chapitre 1 : Contexte gnral du projet

Une quipe de support N1 est disponible pour recevoir et rpondre aux demandes du client en premier lieu au cas o elle dispose des procdures ncessaires ce travail, sinon elle renvoie le problme lquipe du niveau 2. En plus de lquipe Back office du Maroc, il y a lquipe front office situe en France qui se charge de la maintenance et de lvolution des projets. 1.2 Cadrage du projet Aprs avoir prsent notre organisme daccueil, nous passons la prsentation du cadre de notre projet ainsi que sa description. 1.2.1 Cadre du projet

Le dveloppement rapide de la technologie, la forte concurrence dans le domaine commercial, le besoin dune gestion archive des donnes ainsi que de connaitre les tendances des clients sont tous des fortes raisons qui ont motiv ATAC pour dvelopper un systme daide la dcision visant amliorer sa politique de vente dans ses divers magasins. Relativement ce fait, notre projet sinscrit dans le domaine de linformatique dcisionnelle connue en anglais par BI (Business Intelligence). Cette discipline dsigne les outils et les mthodes qui permettent de collecter, modliser et restituer les donnes dune entreprise afin de lui donner une vision globale sur son activit, et permettre aux

dirigeants de se baser sur des indicateurs et des analyses prcises dans leurs dcisions. Tout cela se fait via un entrept de donnes ( datawarehouse) qui reprsente une base centralise de donnes spcifiques afin de faciliter lanalyse des informations de lentreprise. Un datamart dsigne un sous ensemble du datawarehouse contenant les donnes dun secteur particulier exemple (Vente, Ressources humaines). (Voir annexe E) 1.2.2 Description du projet une tude globale de lensemble de ses

Lquipe ATAC o notre projet se droule gre la totalit des sites (entrepts et magasins) de lenseigne en question. Cela ncessite

supermarchs pour donner aux dcideurs les informations ncessaires sur leur activit commerciale, en particulier lvolution du chiffre daffaires des ventes qui prsente sans doute la raison dtre de tout projet commercial.

Rapport PFE

Chapitre 1 : Contexte gnral du projet

De ce fait, notre travail a vis la mise en place dun systme dcisionnel au profit du client ATAC pour le suivi des diffrents types des sorties du stock de ses magasins savoir : Les ventes. Les dons aux associations. Les articles en dmarque qui correspondent lensemble des pertes des produits des magasins. Ce systme va pouvoir fournir des donnes agrges et analyses aux dirigeants de lenseigne sous forme de rapports et statistiques prcises pour aider et contribuer lamlioration de la politique de vente. 1.2.3 Etude de lexistant : Afin de rpondre ses besoins dcisionnels, lquipe ATAC se basait auparavant sur un ensemble doutils existants que nous allons expliciter dans ce qui suit. o LERP GOLD : Tous les membres du groupe Auchan travaillent dans un environnement applicatif identique qui dploie lERP G.O.L.D. Cest un progiciel commercialis par lditeur Aldata et conu spcialement pour rpondre aux besoins des industries de la grande distribution du commerce de gros et de la logistique [Aldata, 2012]. G.O.L.D est structur en deux modules : Module Gold Stock Module Gold Central

Cela justifie la classification des domaines Gold Stock et Central Stock de lquipe ATAC.

Figure 1.2: Interface de l'ERP GOLD 7

Rapport PFE

Chapitre 1 : Contexte gnral du projet

Gold offre des fonctionnalits pour aider lensemble des grands distributeurs de vente tels que la gestion des oprations en magasin, les prvisions, le rapprovisionnement, la logistique, la distribution, la gestion des fournisseursetc. Cette solution repose sur une base de donnes unique TPXTMI sur laquelle se basera notre projet. o Mapping Suite Pour lexploitation de cette base de donnes dans la gnration des rapports et des tableaux de bord, lquipe ATAC utilise Mapping Suite. Cest une solution logicielle qui autorise la cration et le pilotage de lensemble des ditions sur toute plateforme (iSeries/AS400, Unix, Linux, Windows), quelque soit lorigine des informations (base de donnes, ERP, fichiers, ditions) et la destination (papier, mail, fax, Web). Il faut noter galement quelle dispose dun ordonnanceur qui permet dimprimer les ditions selon un paramtrage personnalis en fonction du temps et du poste.

ATAC a acquis 3 modules Mapping qui sont principalement : SPOOLER MAPPING : ce module permet de visualiser, supprimer, librer et transfrer les spools (fichiers d'dition envoys vers un priphrique d'impression). MAPREPORT : permet d'extraire les donnes des sources diverses. MAPDRAW : Il inclut une interface de dessin destine la ralisation des fonds des pages et une autre permettant d'laborer les maquettes. [Mapp, 2012] Malgr la diversit des fonctionnalits que Mapping suite offre, elle son utilisation reste critiquable dans certains points parmi lesquels: Lexploitation directe de la base de donnes : elle accde directement aux donnes de la base de production ce qui augmente le temps de rponse pour les utilisateurs quotidiens et altre donc les performances de la base. Traage des tableaux de bord manuellement. En effet, une fois les donnes sont restitues depuis la base source, lutilisateur est amen tracer lui-mme linterface graphique de ses rapports dans le module MAPDRAW, et cela en indiquant les coordonnes (X, Y, L, H) selon la taille des champs quil veut insrer. Cette dmarche de traage est schmatise dans la figure 1.3 suivant :

Rapport PFE

Chapitre 1 : Contexte gnral du projet

Coordonnes (X,Y,Y,Z)

Figure 1.3 : Schma illustrant la dmarche du traage des tableaux de bord

Ces inconvnients rendent le travail fastidieux et inflexible pour lquipe BI surtout pour le dveloppement et la maintenance des ditions de reporting oprationnelles ou dcisionnelles. A travers ltude et lanalyse du systme existant, nous avons pu dgager un ensemble de failles et de problmes qui entravaient le bon droulement du processus dcisionnel, ce qui va prsenter lobjet de la problmatique. 1.3 Problmatique Lquipe BI du back office labore des rapports oprationnels qui traitent lactivit des sites du groupe ATAC quotidiennement, ainsi que dautre dcisionnels pour offrir aux dcideurs une vision dtaille et bien analyse sur leur projet. Pour ce faire, elle accde directement la base de production pour restituer les donnes. En effet, pour calculer un indicateur donn tel que le chiffre daffaires par exemple, il faut parcourir la base de donnes pour effectuer les agrgations et les jointures ncessaires afin dobtenir le rsultat souhait puisquon ne dispose pas des donnes calcules et agrges propres lanalyse. Cette mthode savre critiquable puisquelle altre la performance de la base ainsi que son temps de rponse qui augmente progressivement en fonction du nombre des traitements faire, surtout quand il sagit dune base aussi volumineuse que celle du client ATAC. De ce

Rapport PFE

Chapitre 1 : Contexte gnral du projet

fait, llaboration des rapports prendra un temps assez considrable surtout les rapports dcisionnels qui ncessitent une historisation de donnes long terme. En outre, la manipulation graphique des interfaces et le traage manuel des tableaux de bord rend le travail difficile et fastidieux. De plus, ldition des rapports en utilisant cette solution ncessite lintervention dun informaticien qui doit slectionner les tables concernes, laborer les requtes, et faire le traage manuel de linterface de ses rapports. Le recours cette solution cre aussi une sorte de concurrence sur laccs simultan aux donnes de production entre les traitements quotidiens effectus dans la base et les requtes visant tablir les rapports dcisionnels. 1.4 Objectifs et solutions Pour rpondre cette problmatique, le client ATAC a jug utile de concevoir et mettre en place un datamart qui englobe tous les indicateurs stratgiques et essentiels son mtier et qui permet danticiper sur lavenir tout en rduisant le temps et les efforts dploys pour assembler, transformer, modliser et diffuser analystes du service commercial. La mise en place du nouveau datamart vise alors : Diminuer la charge de gnration des rapports et des tableaux de bord sur la base de production. Produire des rapports sur des donnes de longue dure dhistorisation et avec un temps de rponse acceptable. Garantir la fiabilit des informations. Sparer le traitement quotidien effectu dans la base de production des requtes provenant du processus dcisionnel. Le client ATAC dcide galement de migrer une partie de son processus de reporting vers la suite logicielle de Business Object afin de : Faciliter le processus grce la flexibilit quil offre dans llaboration des rapports. Permettre aux dcideurs de consulter et diter mme les rapports sans avoir recours au service informatique grce sa couche smantique qui est une prsentation des donnes avec un vocabulaire mtier. Permettre le partage des rapports entre les services concerns. les informations aux dcideurs et aux

10

Rapport PFE

Chapitre 1 : Contexte gnral du projet

Ainsi nous souhaitons assurer un suivi de tous les types des sorties du stock magasin savoir : les ventes, les articles en dmarque et les dons aux associations selon plusieurs axes danalyse afin de mettre la disposition des dcideurs des informations prcises et efficientes sur des indicateurs stratgiques tels que : le chiffre daffaires de chaque site, les quantits vendues selon les marques des produits, le nombre darticles en dmarque pour un rayon donn etc. Pour mener bien notre projet nous dcrivons dans la suite la conduite quil va adopter. 1.5 Conduite et dmarche du projet Pour raliser la solution propose, nous avons adopt la dmarche suivante : Etude de lexistant : cette phase sert connaitre le systme de production de lentreprise, notamment les donnes utiles pour le projet afin de bien cerner la problmatique existante. Analyse des besoins : cette phase vise dterminer les besoins des dcideurs en termes dindicateurs calculer et daxes analyser. Etude comparative et installation des outils : cette phase est consacre au choix de loutil le plus adapt aux besoins du projet et aux contraintes techniques de lentreprise. Conception et modlisation : cette tape prsente le modle de donnes du datamart ralis, tout en se basant sur les besoins exprims dans la phase prcdente. Ralisation : il sagit dans cette tape de la cration et lalimentation du datamart et puis son exploitation dans ldition des rapports via les outils choisis.

Figure 1.4: Planning de droulement du PFE 11

Rapport PFE

Chapitre 1 : Contexte gnral du projet

Nous avons adopt dans cette conduite le Prototypage incrmental comme cycle de vie. En effet, le dveloppement suit une dmarche incrmentale qui consiste segmenter le travail en plusieurs itrations (voir figure 1.4). Aprs lvaluation et la validation du prototype, on passe au suivant et ce cycle est rpt jusqu atteindre un produit complet et satisfaisant les besoins du client. [Hugues, 2002] Dans notre cas nous nous sommes focalises dans un premier temps analyser, concevoir et raliser la partie rserve aux ventes et qui reprsente notre premier prototype, puis nous sommes passes au 2me prototype en ajoutant le volet des dmarques qui inclut aussi les dons aux associations et finalement la dernire partie que nous avons suggre et qui concerne lanalyse des ruptures des articles en stock. Conclusion : Cette tude nous a permis de connaitre lenvironnement du travail, danalyser lexistant constitu de lERP GOLD et de la suite Mapping et de poser finalement la problmatique. Pour rsoudre cette dernire, nous avons propos la mise en place dun nouveau datamart, ainsi que la migration du processus reporting vers la suite logicielle de Business Object. Nous passons dans le chapitre suivant lanalyse des besoins et la modlisation du datamart que nous souhaitons ralis.

12

Rapport PFE

Chapitre 2 : Analyse et conception

Chapitre 2

13

Rapport PFE

Chapitre 2 : Analyse et conception

Nous nous intressons dans le prsent chapitre lanalyse des besoins du client ATAC, nous dcrivons ensuite les diffrents indicateurs relatifs cette analyse ainsi quaux objectifs cits dans le premier chapitre et en fin nous prsentons le modle de donnes du datamart que nous avons labor. 2.1 Analyse des besoins Notre projet vise satisfaire les besoins de la srie des supermarchs du groupe Auchan qui souhaite faire un suivi des sorties de son stock selon plusieurs axes danalyse compris : Lorganisation gographique ou le rseau commercial : reprsente la structure selon y

laquelle les magasins sont organiss gographiquement. En effet, il existe 9 rseaux chacun contient un nombre dfini de rgions et chaque rgion englobe plusieurs magasins [HP CDG, 2012]. Cette structure est schmatise comme suit :

Figure 2.1: Schma de lorganisation gographique du compte ATAC

Les rseaux intgrs contiennent les propres sites dATAC par contre les franchiss sont ceux qui commercialisent les produits dun autre groupe de supermarchs selon un contrat de franchise. la structure interne des marchandises : elle dcrit lhirarchie selon laquelle les articles sont stocks dans le magasin en partant du secteur jusquaux articles et elle est constitu de 7 niveaux hirarchiques. Afin de bien saisir cette notion dhirarchie nous proposons dans la figure 2.2 un exemple de la structure marchandise du secteur des produits grande consommation (PGC).

14

Rapport PFE

Chapitre 2 : Analyse et conception

Figure 2.2 : Exemple de la structure marchandise du secteur PGC

Relativement cette rpartition gographique des sites du groupe et prenant en considration le regroupement hirarchique des articles au sein des magasins, nous avons pu dfinir les principaux besoins du client ATAC comme suit : Analyse du chiffre daffaires ralis, de la quantit vendue, ainsi que du rendement de la srie des supermarchs selon plusieurs axes afin de cibler les zones fortes en terme de rentabilit et chercher amliorer le rendement des autres. Etude des dmarques qui correspondent lensemble des pertes des produits des magasins en termes de valeur et de quantit selon les diverses types de dmarque (la casse, les produits prims) afin de pouvoir calculer le taux de dmarque ou de perte par rapport aux ventes ralises. Calcul en quantit et en valeur des dons aux associations pour avoir une ide globale sur leur pourcentage par rapport aux bnfices. De plus, nous avons jug quil serait aussi judicieux danalyser les ruptures du stock dans les diffrents sites, puisquelles influencent ngativement au bon droulement du processus des ventes. Ceci aura ncessairement de limpact sur le chiffre daffaires de la srie qui prsente lobjectif et lindicateur primordial de chaque unit commerciale.

15

Rapport PFE

Chapitre 2 : Analyse et conception

De ce fait nous avons propos une analyse des ruptures en suggrant deux autres indicateurs calculer, savoir : Le nombre des produits en rupture dans les stocks des magasins en fonction des sites, de la structure marchandise, et de la cause de la rupture. La dure moyenne de rupture des articles dans les diffrents magasins en fonction du motif de la rupture. Dans le cadre de cette spcification des besoins du projet, nous avons tabli un diagramme de Usecase pour dfinir aussi bien les acteurs de notre systme que les services quil offre. 2.2 Les cas dutilisation du systme : Il y a 3 acteurs qui interagissent avec le systme que nous avons labor savoir : le dcideur, lanalyste de lquipe marketing et ladministrateur ou linformaticien de lquipe BI. Nous rsumons les diffrents services offerts par notre systme dans le diagramme suivant :

Figure 2.3: Diagramme de cas dutilisation dcrivant les fonctionnalits du systme

Les services offerts par le systme sont : Consultation des rapports : Le dcideur ainsi que lanalyste du service commercial et marketing accdent au systme aprs une authentification puis choisissent parmi les rapports et les tableaux de bord dj labors ceux quils souhaitent visualiser. Elaboration des rapports : le systme offre aussi aux dcideurs et aux analystes du service commercial la possibilit de crer leurs propres rapports juste en cliquant sur les indicateurs et les axes selon lesquels ils veulent possibilit, les analystes les laborer. Grce cette marketing de lenseigne ATAC vont pouvoir suivre les

variations des diffrents indicateurs. Cela va permettre de cibler les produits de faible
16

Rapport PFE

Chapitre 2 : Analyse et conception

rentabilit pour analyser les causes de ces variations et proposer aux dcideurs des solutions capables damliorer le rendement du groupe. Ajout des indicateurs : ladministrateur du systme ou linformaticien de lquipe BI du compte ATAC peut ajouter dautres indicateurs en relation avec les donnes du datamart selon lvolution des besoins du groupe. Paramtrage du systme : ladministrateur peut aussi modifier ou rectifier la politique du rafraichissement des donnes du datamart selon ses besoins. Nous dtaillons dans la figure 2.4 le cas dutilisation de llaboration des rapports sous forme du diagramme de squence.

Figure 2.4: Diagramme de squence- Elaborer un rapport

Aprs lauthentification, lutilisateur choisit dabord la forme du rapport quil souhaite cre, ensuite il indique les indicateurs et les dimensions selon lesquels il veut effectuer ses analyses, et finalement il pose ses conditions souhaites sur les donnes pour excuter et rcuprer le rapport la fin. Apres avoir analys les besoins du client ATAC et prsent les fonctionnalits de notre systme nous passons maintenant aux diffrentes tapes de sa modlisation.

17

Rapport PFE

Chapitre 2 : Analyse et conception

2.3 Modlisation Avant dentamer la modlisation nous tions amens tout dabord collecter et comprendre les donnes relatives au domaine de la vente du groupe Auchan afin de slectionner ce qui nous sera utile pour rpondre aux besoins tablis. Ainsi nous avons suivi les tapes suivantes : Dterminer les tables sources dans la base de production sur lesquelles nous allons se baser pour rcuprer les donnes ncessaires notre projet. Identifier les diffrents indicateurs de performance calculer et exprimer en fonction des besoins expliqus auparavant. Identifier les dimensions ou les axes danalyse suivant les besoins des dcideurs tout en attribuant chaque axe une certaine hirarchie afin daccroitre le degr danalyse. Etablir le schma conceptuel. Suivant le cycle de vie de notre travail cette dmarche a t adopte dans chaque itration. 2.3.1 Notions cls de la modlisation multidimensionnelle :

Un entrept de donnes est le lieu de stockage centralis d'un extrait des bases de production, il est organis suivant dcisionnels. Suivant cette dfinition, les donnes analyser au niveau d'un entrept doivent correspondre une structuration selon plusieurs axes d'analyse pouvant reprsenter des notions varies telles que le temps, la localisation gographiqueetc. On parle alors de modlisation et des traitements multidimensionnels des donnes. Conceptuellement, cette modlisation multidimensionnelle a donn naissance deux concepts: fait et dimension [Dw, 2006] un modle spcifique qui facilite les traitements

2.3.1.1 Concept de dimension : Une dimension modlise une perspective de l'analyse. Elle contient des attributs permettant de qualifier ou dexpliquer lactivit. Elle peut tre aussi munie d'une hirarchie pour restreindre ou accrotre le degr d'analyse. [Dw, 2006] 2.3.1.2 Concept de fait : Le fait modlise le sujet de l'analyse. En effet. Cest une table forme de mesures correspondantes aux informations de l'activit analyse. Ces mesures sont numriques et
18

Rapport PFE

Chapitre 2 : Analyse et conception

reprsentent les indicateurs de performances que visent les analystes comme le chiffre daffaires, la quantit vendueetc. Cette table contient donc de plus les identifiants des tables de dimensions. [Dw, 2006] 2.3.1.3 Modle de donnes : Un modle de donnes est une faon de mettre en relation les dimensions et les faits dans un entrept de donnes. Nous prsentons trois types de modles savoir: le modle en toile, le modle en flocon et le modle en constellation. [Dw, 2006] Modle en toile: Dans un schma en toile comme le montre la figure 2.5, une table centrale de fait rfrence les tables de dimensions par des cls trangres. Chaque dimension est dcrite par une seule table dont les attributs reprsentent les diverses granularits possibles. Il est appel modle en toile parce que toutes les dimensions sont directement relies la table de faits. [Dw, 2006]

Figure 2.5: Schma en toile

Modle en flocon : Dans un schma en flocon illustr dans la figure 2.6, la table de fait rfrence juste les tables de dimensions du premier niveau. Contrairement au modle en toile, ce type de modlisation consiste dcomposer les dimensions en sous hirarchies. La modlisation en flocon est donc une manation du modle en toile. En effet, le fait est conserv et les dimensions sont clates selon lhirarchie des paramtres. Nous dcrivons le mme exemple du modle en toile mais cette fois ci en utilisant le modle en flocon [Dw, 2006] :

19

Rapport PFE

Chapitre 2 : Analyse et conception

Figure 2.6: Schma en en flocon

Modle en constellation : Une constellation est une srie d'toiles relies entre elles par des dimensions. Il s'agit donc d'toiles avec des dimensions en commun. Lobjectif est davoir un environnement dcisionnel o il serait possible de naviguer d'toile en toile la recherche de l'information. [Dw, 2006]

2.3.2

Choix du modle de donnes

Pour modliser notre systme dcisionnel nous avions le choix entre deux types de modlisation savoir : le modle en toile et le modle en flocon de neige. Nous avons opt pour le modle en toile parce ce nous avons jug quil est le mieux adapt notre cas dutilisation puisquil est considr comme tant le modle le plus simple, surtout au niveau des jointures entre les diffrentes tables du datamart. En effet, nos tables de dimensions contiennent plusieurs niveaux dhirarchie donc le choix du modle en flocon donnera naissance des requtes plus complexes et moins performantes causes de la multiplicit des jointures. Le modle en toile permet donc de faciliter la navigation entre les tables de fait et de dimension et rend la restitution des donnes plus fluide. En outre, le modle en flocon est considr comme tant le mieux adapt pour la cardinalit (n-n) entre les tables de dimensions. Or dans notre cas toutes les dimensions recueillis sont de cardinalit (1-n). En effet, si on prend lexemple de la structure marchandise, la relation entre les diffrents niveaux dhirarchie est toujours de cardinalit (1-n) : un article appartient un seul segment et un segment contient plusieurs articles et de

20

Rapport PFE

Chapitre 2 : Analyse et conception

mme pour les autres niveaux de la structure. Par consquent, le modle en toile est trs suffisant pour rpondre nos besoins. 2.3.3 Modlisation de litration vente : 2.3.3.1 Indicateurs recueillis : En se basant sur les besoins exprims des utilisateurs finaux de notre systme, nous avons pu dgager un ensemble dindicateurs ncessaires valuer les ventes du client ATAC et qui sont : Le chiffre daffaires (CA) ou le montant total des ventes de chaque entit du

rseau commercial du groupe Auchan, et par rapport aux diffrents niveaux de la structure marchandise (rayon, famille, segment). Cet indicateur va permettre aux dcideurs de distinguer entre les surfaces de ventes de fort rendement et dautres qui ne ralisent pas un grand chiffre daffaires. Le CA sera aussi calcul pour une unit de temps bien prcise qui va dune journe une anne par rapport aux marques des produits et leur type afin de montrer aux dirigeants les articles les plus sollicits par les clients. Cet indicateur est calcul via la relation suivante : Chiffre daffaires TTC (toute taxe comprise) = Prix unitaire TTC * quantit vendue La marge ou la rentabilit de la srie des supermarchs qui se calcule comme suit Marge = chiffre daffaires cot de revient Le cot de revient prsente la somme des dpenses ou des charges mises en uvre pour la production dun article de la srie. Quantit vendue des articles par magasin, par secteur, par marqueetc. et mme par unit de temps ce qui va aider savoir les priodes de lanne o la consommation augmente et quels sont les types des produits qui sont concerns ?

2.3.3.2 Dimensions recueillies


Selon lanalyse des besoins que nous avons effectu et prenant en compte les donnes disponibles et les indicateurs calculer, nous avons relev les dimensions suivantes qui nous ont permis grce leur hirarchie de dtailler lanalyse tout en passant dun niveau de granularit un autre plus fin et vice versa.

Dimension temps : Cest laxe d'analyse le plus frquent dans la construction des

datamarts. Il est commun toutes les tables de fait de notre entrept de donnes. Son

21

Rapport PFE

Chapitre 2 : Analyse et conception

importance vient du fait quil permet de situer dans le temps chaque fait enregistr, ainsi que de suivre son volution priodique.

Dimension Rseau commercial ou structure de lorganisation gographique. Cette

dimension va permettre de savoir par exemple : les rgions qui sont plus rentables, quel rseau appartiennent-elles ? ...etc. Ce qui va dtecter les prfrences des clients par secteur gographique.

Dimension structure marchandise pour dtailler lanalyse et pouvoir prciser par

exemple quelle est la famille des produits la plus sollicite ? quel est le secteur qui gnre un grand chiffre daffaires ?...etc. 2.3.3.3 Schma conceptuel de litration Vente Lidentification des indicateurs calculer et le choix des axes danalyse nous a men laborer la premire table de fait vente illustre dans la figue 2.7 qui contient toutes les donnes relatives aux ventes et ncessaires pour le calcul des indicateurs recueillis, savoir : le chiffre daffaires, la quantit vendue et la marge ou la rentabilit du groupe. La table vente est aussi lie aux trois dimensions ncessaires au calcul des indicateurs et lanalyse des donnes : le rseau commercial, la structure des marchandises et finalement laxe temps.

Figure 2.7: Schma conceptuel de litration vente

22

Rapport PFE

Chapitre 2 : Analyse et conception

2.3.4 Modlisation de litration dmarque et dons aux associations : 2.3.4.1 Indicateurs recueillis ATAC comme toute autre unit commercial enregistre chaque priode du temps une quantit de perte au niveau de ses produits. De ce fait, nous nous sommes intresses calculer les indicateurs en relation avec les dmarques ainsi que les dons quoffre le groupe aux associations savoir : Quantit des dmarques ou de lensemble des pertes des produits et cela inclut aussi la quantit des dons aux associations. Valeur des dmarques : prsente le cot de perte que gnre une dmarque. Taux de dmarque : prsente la valeur des dmarques par rapport au chiffre daffaires dune entreprise : Taux de dmarque = valeur des dmarques / chiffre daffaires. Ce dernier indicateur permet dvaluer le poids des pertes des produits dans les diffrents magasins ce qui permettra de mesurer l'efficacit des pratiques d'entreposage et de gestion du stock. Pour calculer ces mesures nous avions besoin de quatre dimensions. 2.3.4.2 Dimensions recueillies Les dmarques seront aussi analyses selon lchelle temporelle, gographique, et mme suivant la structure des marchandises pour dterminer les familles des produits qui enregistrent plus de pertes, les rseaux qui soutiennent plus les associations, etc. Par consquent cette itration partage avec les ventes les trois dimensions : Temps, Structure marchandise et Rseau commercial. De plus, nous rajoutons une dimension spcifique aux dmarques qui est : Dimension Type Dmarque : Cette dimension dfinit le type de dmarque, sil sagit dune casse ou un produit prim par exemple. Elle inclut aussi les dons aux associations puisque tous les deux ne participent pas lvolution du chiffre daffaires. Donc la distinction entre les dons et les pures dmarques se fera en spcifiant juste lid_type correspondant. 2.3.4.3 Schma conceptuel de litration Dmarque Le calcul des indicateurs propres litration dmarque se fait via la table de fait Dmarque qui regroupe toutes les informations lies aux deux types de mouvements : dmarques et dons aux associations dans le stock du compte ATAC. Afin de diffrencier
23

Rapport PFE

Chapitre 2 : Analyse et conception

entre les dons et les autres dmarques nous avons filtr selon le type de dmarque comme le montre la figure 2.8. La table de fait Dmarque est relie aux quartes dimensions cites auparavant.

Figure 2.8: Schma conceptuel de litration dmarque

2.3.5 Modlisation de litration rupture de stock 2.3.5.1 Indicateurs recueillis Toujours dans le cadre de lamlioration de la politique des ventes du groupe, nous avons propos danalyser les ruptures dans le stock des magasins pour remdier tout problme provenant de ce type dvnement et altrant par consquent le bon droulement du processus vente. Pour ce faire nous avons valu les mesures suivantes : Dure rupture : Cet indicateur sert valuer la dure que prennent les articles pour rapparaitre dans lassortiment dun point de vente donn, en dautre termes, cest la dure ncessaire pour quun article redevienne disponible dans la liste des produits proposs la vente aprs sa rupture. Nombre darticle : il permet de visualiser le nombre darticle en rupture dans le stock des magasins et de dtecter mme la cause de ces ruptures, ce qui permettra au groupe dagir pour les viter ou au moins les diminuer.

24

Rapport PFE

Chapitre 2 : Analyse et conception

2.3.5.2 Dimensions recueillies Afin de permettre aux dcideurs de prendre les mesures ncessaires et capables de remdier aux problmes des ruptures du stock nous avons jug intressant de connaitre le nombre darticles en rupture dans chaque zone gographique, la dure moyenne de rupture dans un rayon donn des marchandises etc. Do la ncessit dune analyse selon les trois dimensions : Temps, Structure marchandise et Rseau commercial. En outre, nous avons propos la dimension suivante : Dimension Cause Rupture : cette dimension spcifie les diffrentes causes qui peuvent tre lorigine de la rupture dun article comme exemple Vente. C'est--dire que le produit est suspendu parce quil tait compltement vendu. Cette dimension aidera avoir un aperu sur les causes les plus frquentes et donc de prvoir des prcautions pour viter ou diminuer les ruptures. 2.3.5.3 Schma conceptuel de litration rupture de stock : Les deux indicateurs proposs : nombre darticle et dure moyenne de rupture vont tre calculs dans la table de fait Rupture schmatise dans la figure 2.9. Afin dassurer lanalyse multidimensionnelle, cette table est relie aux quartes dimensions dj explicite:

Figure 2.9: Schma conceptuel de litration rupture de stock

25

Rapport PFE

Chapitre 2 : Analyse et conception

2.3.6 Schma conceptuel global du datamart La suite logique de notre conception nous a men concevoir un schma en constellation pour notre datamart qui consiste fusionner plusieurs modles en toile utilisant des dimensions communes.

Figure 2.10: Schma conceptuel global du datamart

Ainsi la figure 2.10 englobe les trois tables de fait : vente, dmarque et rupture

qui

construisent le schma final de notre datamart. Lanalyse est partage selon trois dimensions essentielles : temps, rseau commercial et structure marchandise. Les deux autres dimensions spcifiques type dmarque et cause rupture feront lobjet de lanalyse des dmarques et des ruptures respectivement. Ce dernier schma va tre transform en ralit des tables dans un nouveau datamart. Ces tables contiendront les donnes ncessaires lanalyse et au reporting. Nous illustrons alors brivement ce processus dcisionnel dans ce qui suit. 2.2 Processus dcisionnel : Comme tout projet BI, notre projet passe par un processus dcisionnel qui part de la collecte des donnes jusqu leur affichage sous forme dtats de reporting. Nous rsumons ainsi les quatre phases de notre chaine dcisionnelle dans la figure 2.11. Identification des sources de donnes : pour la collecte des donnes, nous nous sommes bases sur la base de donnes oracle de lERP GOLD. Il suffit donc de slectionner les tables ncessaires notre thmatique.
26

Rapport PFE

Chapitre 2 : Analyse et conception

Alimentation de la base de donnes dcisionnelle : Cest ce niveau quapparait la premire couche logicielle de lenvironnement dcisionnel savoir lETL qui fait le traitement ncessaire et alimente la base dcisionnelle destinataire. (Voir annexe E)

Cration de lunivers et analyse multidimensionnelle : consiste crer tout dabord une reprsentation mtier des donnes appele univers avec loutil Business Object. Cet univers contient les indicateurs calculs et prts tre analyser selon les besoins. Une fois lunivers est cre, le systme offre la possibilit danalyser les donnes selon les diverses dimensions et de naviguer dans les diffrents niveaux hirarchiques afin de permettre une analyse plus pouss des donnes.

Reporting : cest ltape finale et le fruit de tout processus BI, elle consiste crer des tats sous plusieurs formes : tableaux, digrammes de camembert, histogramme, etc. Cette bonne reprsentation des donnes permet de bien les manager pour en faire un rel support daide la dcision. (Voir annexe E)

Figure 2.11: Processus dcisionnel

Conclusion : Dans ce chapitre, nous avons relev un ensemble dindicateurs stratgiques calculer suivant des axes danalyses adquats. Ensuite nous avons explicit la modlisation de chaque itration du projet en utilisant le modle en toile pour donner au final le schma conceptuel global de notre datamart. Pour mener bien le processus dcisionnel pr dcrit qui part de la collecte de donnes jusqu leur prsentation sous forme dtats, il faut faire le bon choix des outils utiliss. Cest ce qui fera lobjet du chapitre suivant.
27

Rapport PFE

Chapitre 3 : Etude comparative des outils

Chapitre 3

28

Rapport PFE

Chapitre 3 : Etude comparative des outils

Nous avons consacr ce chapitre la justification du choix des outils utiliss dans les deux phases de notre projet, savoir lalimentation du datamart et la phase du reporting pour la prsentation des rapports. Pour la premire phase, nous avons choisi de comparer entre les Open source Talend Open Studio, Pentaho Data Integration ( Kettle l'origine), et Clover ETL puisque notre socit ne souhaite pas investir financirement dans lachat dune licence dun logiciel de ce genre. La 2me partie sera ddie la comparaison du BusinessObject et Pentaho Reporting suite . 3.1 Outils ETL : LETL est l'acronyme de Extract Transform -Load . Il permet de faire lextraction ou le chargement des donnes depuis diffrentes sources qui peuvent tre htrognes, puis leurs transformations afin de les rendre homognes, et enfin le chargement dans la base cible. Pour raliser notre datamart, nous avons choisi de comparer entre Pentaho Data Integration , Talend Open Studio et Clover ETL , car ils nous apparaissent les plus utiles et intressants lheure actuelle comme tant des ETL Open source. Nous prsentons dans ce qui suit chacun de ses outils et nous tablissons ensuite ltude comparative selon diffrents critres. 3.1.1 Prsentation des ETL choisis : Talend Open Studio Talend Open Studio est dvelopp par Talend en 2006, qui est une socit franaise relativement jeune. Il gnre un code spcifique en Java ou Perl pour intgrer les donnes. Talend Open Studio utilise une interface graphique, le Job Designer qui permet la cration des processus de manipulation de donnes. Il contient aussi une palette graphique de plus de 250 composants et connecteurs. [Atol, 2007] Pentaho Data Integration (Enciennement KETTLE) Pentaho Data Integration est un outil ETL de la suite dcisionnelle Open Source Pentaho. Il dispose d'une interface graphique Spoon depuis laquelle on peut crer les traitements qui sont stocks dans un rfrentiel (repository). [Atol, 2007] Clover ETL Clover a cr deux outils : Clover ETL qui est un framework et Clover.GUI interface graphique facilitant la cration de flux de donnes, mais elle est disponible sous licence commerciale, et tous les deux sont bass sur la technologie Java. Clover met la
29

Rapport PFE

Chapitre 3 : Etude comparative des outils

disposition des utilisateurs une quarantaine de composants de transformation et supporte en natif plusieurs SGBD. [Axege, 2012] 3.1.2 Choix de loutil ETL :

Nous avons effectu ltude des 3 outils Talend Open Studio, Pentaho Data Integration et selon plusieurs aspects de comparaison. Nous prsentons ci-aprs une synthse de la comparaison de ces outils par critre : Communaut Une communaut dynamique et large dun outil constitue un critre important pour reflter sa rputation et sa fiabilit. Ainsi nous pensons quil serait logique que notre choix opte pour celui qui est soutenu ou financ par un grand organisme ou des experts. Concernant cet aspect, nous signalons un avantage de Talend Open Studio et de Pentaho Data Integration qui sont les plus utiliss au monde, et qui sont tous les deux dvelopps par les socits Talend Open Integration solutions et Pentaho. Quant Clover ETL, il savre que sa communaut est beaucoup plus restreinte et moins active que les deux autres. [Atol, 2007] [Axege, 2012] Ergonomie Linterface Clover ETL ncessite linstallation dEclipse sur la machine, Pentaho et Talend disposent dune interface graphique base respectivement sur SWT(Standard Widget Toolkit) et Eclipse RCP(Rich Client Platform).Mais Talend reste le plus facile utiliser du point de vue ergonomique. [Atol, 2007] [Axege, 2012] Intgration dans une suite BI Talend est partenaire des diteurs des suites dcisionnelles connues sur le march savoir SpagoBI et JasperIntelligence, alors que lintgration de Kattle dans la suite Pentaho est en cours. Par contre, Clover ETL na pas t intgr jusqu prsent. [Atol, 2007] [Axege, 2012] Documentation La disponibilit de documentation, des supports professionnels et des sminaires de formation sur lutilisation et les fonctionnalits quoffre un outil sont ncessaires pour le succs de son dploiement. Actuellement, Les socits qui prennent en charge Talend Open Studio et Pentaho Data Integration effectuent de nombreux sminaires qui suscitent un trs grand intrt de la part de la communaut BI. [Atol, 2007] [Axege, 2012]

30

Rapport PFE

Chapitre 3 : Etude comparative des outils

Accessibilit Pour ce critre il faut noter que lutilisation de linterface graphique Clover GUI est payante contrairement Talend Open Source(TOS) et Pentaho Data Integration(PDI). [Atol, 2007] [Axege, 2012] Compatibilit TOS et PDI grent la plupart des SGBD nativement et permettent aussi laccs une trs grande diversit de fichiers (XML, Excel, CSV, ZIP, etc.). Cependant, Clover ETL, mme s'il est compatible avec les principaux formats mais reste moins satisfaisant ce niveau. [Atol, 2007] [Axege, 2012] Lecture et criture dans un SGBD Talend Open Studio montre ici un avantage par rapport aux autres ETL puisquil permet : La lecture et lcriture des donnes complexes des systmes dinformations gographiques. un designer graphique de requtes et sauvegarde excutes dans un fichier sql. A ce niveau Les offres de Pentaho Data Integration et Clover ETL sont moins satisfaisantes. Mme sils permettent, toutefois, l'excution des procdures stockes, la normalisation et la dnormalisation de tables. [Atol, 2007] [Axege, 2012] Calcul et transformations TOS et PDI permettent de faire peu prs toutes les transformations envisageables dans le cadre d'un projet, grce de nombreux composants. En effet, en termes de fonctionnalits, les composants Talend sont plus que 250 en Java et Perl, alors que Pentaho comprend environ 180 composants. Clover ETL reste moins complet que ses derniers avec environ 57 composants. [Atol, 2007] [Axege, 2012] Planification Talend dispose dun Planificateur (scheduler) pour la planification des Jobs. Clover ETL dispose galement dun scheduler intgr, mais juste pour la version payante. En ce qui concerne Pentaho, il est ncessaire dutiliser un scheduler externe. [Atol, 2007] [Axege, 2012] Option dadministration Pentaho Data Integration offre davantage des services gratuits ce niveau du fait qu'il a t dvelopp pour excuter des transformations sur un serveur distant.

31

Rapport PFE

Chapitre 3 : Etude comparative des outils

Pour Talend Open Studio, il propose de nombreuses options dadministration dont, cependant, certaines sont payantes. Les options dadministration offertes par Clover ETL, quant elles, sont toutes payantes. [Atol, 2007] [Axege, 2012]

Pour valuer les trois outils tudis, nous avons adopt un systme de points sur une chelle de 5. Nous navons, toutefois, pas utilis un systme de points pondrs car nous considrons dans notre cas que tous les critres tudis ont presque le mme degr dimportance et dimpact sur le choix de loutil adopter. Nous rcapitulons ci aprs dans un tableau le rsultat de notre valuation :
TABLEAU 3.1 : ILLUSTRATION DU RESULTAT DE LEVALUATION

Critre dvaluation Communaut documentation Ergonomie Accessibilit Intgration dans une suite BI Compatibilit Lecture et criture dans un SGBD Calcul et transformations Planification Option dadministration Total

Talend 5 5 5 5 5 5 5 5 5 3 53

Pentaho 5 5 4 5 4 5 3 4 0 5 44

Clover.ETL 3 4 4 0 0 4 3 3 0 0 25

En utilisant le diagramme de radar qui sert comme comparateur multidimensionnel, nous obtenons la reprsentation suivante :

Option Planification Calcul et Lecture et

6 4 2 0

Document Ergonomie Accessibilit Intgration

Talend Open Studio Pentaho Data Integration Clover ETL

Compatibilt

Figure 3.1: Diagramme de radar pour la comparaison des trois ETLs 32

Rapport PFE

Chapitre 3 : Etude comparative des outils

On lit sur chaque axe partant du centre, la valeur que prend chaque critre, nous remarquons clairement que Talend Open Studio est en avance par rapport Pentaho Data Integration et Clover ETL suivant les diffrents axes. Par consquent, nous optons pour loutil Talend Open Studio qui donne des avantages supplmentaires bien utiles dans notre projet. 3.2 Outils Reporting : Lefficacit de certaines solutions open sources permettent rellement denvisager leur utilisation au sein d'une structure professionnelle. Pour cela nous avons tabli une tude comparative entre Business Object que notre client possde, et Pentaho Reporting suite qui se classe devant Jaspersoft et BIRT et les autres outils de reporting selon une tude tablie par des experts (Pentaho (47%) des entreprises, devant Jaspersoft (28%), autres(25%) ). Avant de passer la comparaison nous commenons par prsenter chacun de ces outils. [Legran, 2010] 3.2.1 Prsentation des outils Reporting : Pentaho Reporting suite : Prsentation : Pentaho est une plateforme complte dinformatique dcisionnelle open source entirement dveloppe en Java et permettant le reporting simple et l'OLAP. Un autre aspect spcifique de la suite Pentaho, cest dtre sponsorise et dappartenir la un organisme priv Pentaho Corporation. Modules :

Pentaho intgre ou supporte la plupart des composants dcisionnels open sources existants savoir : CUBE DESIGNER : permet la cration des cubes afin dtre utiliss par la Suite Pentaho. PENTAHO ANALYSIS : sert lanalyse des cubes OLAP. PENTAHO REPORT DESIGNER : pour la gnration de rapports. BI PENTAHO : la plateforme qui permet la publication des rapports et la ralisation des analyses OLAP sous formes de web services. [Loria, 2008]

33

Rapport PFE

Chapitre 3 : Etude comparative des outils

Business Object : Prsentation : Business Object est avant tout une socit franco-amricaine ne en 1989 et a conu un outil d'aide la dcision accessible l'utilisateur final. Il permet l'interrogation, la prsentation et l'analyse des donnes issues d'un systme d'informations afin de prendre des dcisions. Modules :

DESIGNER : Permet de construire les Univers, les documenter et les mettre la disposition des quipes utilisatrices. En effet, Un Univers est une reprsentation totale ou partielle de la base de donnes adapte un mtier de l'entreprise ou un domaine d'application particulier. Il regroupe un ensemble de mots du vocabulaire mtier. DESKTOP INTELLIGENCE : Permet de crer des rapports partir des univers dj conus. WEB INTELLIGENCE : Permet dinterroger, de mettre en forme et danalyser les informations des rapports sur le Web. SUPERVISOR : Gre les droits d'accs, dfinit les groupes et les utilisateurs, leur affecte des droits sur les diffrents modules et leur fonctionnalits, et sur les ressources de lUnivers. OUTILS DE CONVERSION DE RAPPORT : Permet de convertir les rapports desktop intelligence au format web intelligence. [Loria, 2008] 3.2.2 Choix de loutil Reporting : Aprs avoir prsent les deux logiciels proposs, nous passons ltude comparative qui va sarticuler autour de quatre axes que nous jugeons utile dans le choix de loutil reporting savoir : Installation Documentation IHM Scurit

o Installation : BusinessObject : linstallation se fait travers un seul excutable qui permet dinstaller automatiquement la totalit des modules. Pentaho Reporting suite : disponible sous nombreux formats, mais ncessite de rassembler les excutables de chaque composant. [Loria, 2008]
34

Rapport PFE

Chapitre 3 : Etude comparative des outils

o Documentation : BusinessObject: plus de 1000 pages disponibles sur le site officiel du BO, permettant de faciliter la manipulation de cet outil en dtaillant le fonctionnement partir des exemples illustratifs. Pentaho Reporting suite : malheureusement la documentation de qualit est un problme rcurrent chez Pentaho pour la suite de reporting, ce qui complique la russite se servir des fonctionnalits quoffrent les diffrents composants. [Loria, 2008] o IHM Nous analysons ce critre selon deux phases : la cration des cubes qui consiste laborer les dimensions et les indicateurs, et la phase de prsentation des rapports. Cration des cubes : BusinessObject : linterface est agrable, lutilisateur est guid par des messages derreurs ou dinformations sil manque des choses importantes, les icnes sont assez parlantes et offrant un nombre important doptions qui facilite la cration des dimensions et des mesures en choisissant juste les donnes et les oprateurs. Les mesures ou les dimensions sont reprsentes sous forme de mots du vocabulaire professionnel en masquant leur correspondance SQL, on parle alors dobjets. En outre BO adopte aussi la notion de classe qui regroupe ses objets selon le thme (exemple : vente, achat). Tous ces concepts saffichent dans lUnivers. Pentaho : linterface de Pentaho propose un ensemble de fonctionnalits sous forme dune ligne de boutants un peu rigides et non parlants et par consquent la cration des mesures et des dimensions ncessite un certain niveau dinnovation. [Loria, 2008] Prsentation des rapports : BusinessObject : Business Object offre une couche smantique qui permet de traduire les concepts techniques un vocabulaire mtier afin de permettre aux dcideurs non informaticiens dinterroger eux- mme de faon intuitive la base de donnes dcisionnelle, ainsi il peut prsenter les donnes restitues sous forme de tableaux, tableaux croiss, des graphesetc. Pentaho : la prsentation des rapports passe ncessairement par un service informatique. En effet, Pentaho propose un assistant ddition de rapport qui utilise les concepts technique et ncessite une bonne connaissance de la
35

Rapport PFE

Chapitre 3 : Etude comparative des outils

structure de la base de donnes. En outre, Pentaho lui manque la reprsentation des rapports en tableaux croiss. [Loria, 2008] o Scurit : BusinessObject : L'Univers accde aux donnes d'un serveur via une connexion SGBDR dj scurise. l'accs aux Univers est gr par le module SUPERVISOR . De mme, l'accs certains objets peut tre interdit par ce dernier selon leur niveau de confidentialit. Pentaho : comporte galement une plate-forme d'administration (Pentaho Administration Console) qui permet la gestion des droits d'accs, la planification d'vnements, la gestion centralise des sources de donnes. Mais cette plateforme reste basique et cest la version commerciale qui complte les fonctionnalits dadministration et de personnalisation des actions. [Loria, 2008] Pour valuer ces critres nous suivons le mme barme utilis dans la partie ETL. Nous rsumons le rsultat dans la figure suivante :
outils Business Object Pentaho Installation 5 3 Documentation 5 2 IHM 5 1 Scurit 5 3

Installation 5 4 3 2 1 Scurit 0 Documentation Business Object Pentaho

IHM

1: Figure 3.2: Diagramme Radar et le tableau dvaluation des outils de reporting

Daprs ce diagramme de radar, Business Object est en avance avec un grand cart. Nous estimons alors qu'il est plus efficace utiliser que Pentaho, notamment grce l'exploration de lunivers qui offre plusieurs fonctionnalits utiles dans llaboration des

36

Rapport PFE

Chapitre 3 : Etude comparative des outils

rapports dcisionnels. De plus, l'investissement consenti par le client ATAC dans lobtention de sa licence soutient fortement notre choix.

Conclusion : Ce chapitre nous a permis de choisir parmi les outils proposs ceux qui sont les plus adapts aux besoins de notre travail. En effet, nous avons opt pour lETL Talend Open Studio pour le chargement des tables de notre base de donnes dcisionnelle et Business Object pour la reprsentation des donnes restitues. Nous mettons en lumire diffrentes phases de la ralisation de notre projet les

dans le chapitre suivant.

37

Rapport PFE

Chapitre 4 : Ralisation

Chapitre 4

38

Rapport PFE

Chapitre 4 : Ralisation

Apres avoir conu le modle de donnes du datamart et fait le choix des outils utiliser, nous prsentons dans ce prsent chapitre la ralisation du projet en deux grandes parties : alimentation du datamart et cration de lunivers et reporting. 4.1 Alimentation du Datamart Cette partie est considre comme tant la phase la plus dlicate. Elle contient trois tapes : lextraction, la transformation et le chargement des donnes (voir annexe E). Cette phase intermdiaire dans le projet savre importante et demande beaucoup de rflexion et de prcision car les donnes charges doivent videmment tre compltes et exactes. Nous commenons tout dabord par donner un aperu sur les composants de loutil utilis, ensuite nous expliquons les dtails dalimentation du datamart. 4.1.1 Composants Talend utiliss : Daprs ltude comparative tablie dans le chapitre prcdent notre choix a port sur loutil Talend que nous avons jug convenable pour la ralisation de cette phase. Nous prsentons ainsi un ensemble de ses composants qui nous ont servi crer et alimenter nos tables destinataires.
TABLEAU 4.1 COMPOSANTS DE TALEND UTILISES

tOracleOutput tOracleOutput

permet de lire et extraire les tables partir de notre base de donnes source Sert alimenter des tables de faits et de dimensions nouvellement cres en insrant les donnes provenant des diffrentes sources. cest le composant le plus utilis dans notre projet, il permet deffectuer plusieurs oprations savoir les jointures, le filtrage, les transformations des flux, gre les sorties multiples ce composant permet de filtrer lenregistrement selon les conditions souhaites sur les colonnes. comme son nom lindique, il sert filtrer et choisir des colonnes dune table source et mme a mapper les colonnes sources aux colonnes cibles. Ce composant sert fusionner les entres dans la mme sortie et supprimer les doublons du flux dentre avant de procder au chargement Ce composant reoit un flux et lagrge selon une ou plusieurs colonnes. Il sert dupliquer un flux de donnes autant de fois que ncessaire.

tMap

tFilterRow

tFilterColomuns

tUniquRow

tAggregateRow

tReplicate

39

Rapport PFE

Chapitre 4 : Ralisation

Aprs avoir prsent les composants utiliss dans cette phase, nous passons aux dtails du chargement des tables de notre magasin de donnes. Pour raliser cette partie nous avons donn la priorit aux tables de dimensions afin dassurer les contraintes dintgrit dans les tables de faits qui contiennent les cls primaires des tables de dimensions. Cette dmarche a t suivie pour chaque itration de notre projet. Nous prsentons donc en premier lieu le chargement de chaque table de dimensions puis nous dtaillerons le traitement appliqu dans lalimentation dune des trois tables de fait. 4.1.2 Alimentation des tables de dimensions : Au cours du processus itratif adopt dans notre travail, nous tions amens alimenter cinq tables de dimension savoir : la structure marchandise, le rseau commercial, le temps, le type des dmarques et le type des ruptures. Ces deux dernire dimensions sont spcifiques aux itrations dmarque et rupture respectivement. Le chargement de ces dextraire les donnes et dy effectuer les transformations ncessaires pour finalement dans les tables destinataires. Dimension structure marchandise : Cette phase consiste alimenter la table de dimension structure marchandise qui contient plusieurs niveaux dhirarchie comme nous lavons montr dans la figure 2.2, et par consquent plusieurs champs slectionner et plusieurs jointures effectuer. Pour ce faire, nous nous sommes bases sur cinq tables sources comme cest illustr dans la figure 4.1 :
Diffrencie les magasins des entrepts

tables passe les stocker

imprativement par lexcution des jobs. En effet, un job est un traitement qui permet

Type et Marque

Jointure

Article RacineSegment-FamilleSecteur

Les units de vente Libells

Figure 4.1:Chargement de la dimension Structure Marchandise

40

Rapport PFE

Chapitre 4 : Ralisation

La table MG_STRUCTURE_MARCHANDISE contient les identifiants de chaque lment de la structure (article, segment, famille). Sa petite granularit est la racine de larticle titre dexemple Coca Cola . Par contre la table ARTUV permet de rcuprer les diffrentes units de vente que peut avoir une racine dun article, pour notre exemple nous aurons (Coca 1/2L, Coca 1L, Coca 2L) comme units de vente. La table STRUCTOBJ contient son tour les libells de chaque objet (unit de vente, racine de larticle, segment, famille), et finalement la table ATRAC qui spcifie le type et la marque de chaque article. Le composant tMap_3 fait alors les jointures ncessaires entre ces tables et renvoie le rsultat la table cible Structure_marchandise . Dimension structure organisation De mme que pour la dimension marchandise, le chargement de la dimension organisation Consiste rliser une jointure entre quatres sources :
MG_STRUCTURE_ORGANISATION qui renvoie les differents identifiants du rseau

commercial (magasin, rseau, rgion), et trois autres sources qui nous renseignent sur les libells correspondants ces codes. La figure 4.2 indique le rle du composant tMap qui fait le filtrage et la jointure entre les tables .

Jointure avec tMap

Figure 4.2 : Chargement de la table Structure Organisation

Dimension temps : Suivant le cycle de vie de notre projet, cette table a t alimente en 3 phases : La premire pour stocker les dates lies la vente, la deuxime phase intgre les dates des dmarques, et la dernire rajoute les dates propres aux ruptures.
41

Rapport PFE

Chapitre 4 : Ralisation

Aprs laccomplissement des trois itrations nous avons labor un seul job dcrit dans la figure 4.3, et qui permet dextraire, de transformer et de rcuprer en une seule excution les dates provenant des trois sources.
Source des donnes de Vente et Dmarque

Fusion des dates Filtrage du champ Date

Source des donnes de rupture

Extraction du mois, jour..

Figure 4.3:Chargement de la table Dimension Temps

Nous avons tabli travers ce job deux jointures la fois : une entre la table STOMVT qui enregistre tous les mouvements des sorties du stock et la table SIDGENE qui nous renseigne sur les magasins du compte ATAC, et ceci pour se focaliser sur les ventes et les dmarques juste dans les magasins. Une autre entre ARTRUPT et SITDGENE pour le mme but mais concernant les ruptures cette fois ci. Le flux provenant de SITDGENE a t dupliqu grce au composant tReplicat. Ensuite, aprs avoir filtr les mouvements et converti les champs qui ncessitent ce traitement, nous avons fusionn les diffrents champs de date avec le composant tUnit pour leur appliquer des procdures de transformation visant sparer les jours, mois, libell mois et anne et rajouter mme le trimestre comme illustre la figure 4.4 suivante :

42

Rapport PFE

Chapitre 4 : Ralisation

Procdure de transformation

Figure 4.4: Transformation de la date

Dimension type Dmarque et type Rupture :


Cette phase consiste alimenter la table type dmarque qui permettra de prciser sil sagit dune

perte produite par une casse, une transformation au niveau de larticle, ou plutt un don offert aux associations.

Figure 4.5: Chargement de la dimension type dmarque

Comme le montre le job de la figure 4.5, il sagit de filtrer les enregistrements correspondants aux dmarques partir de la table STOMVT et de les joindre dattribuer chaque identifiant son libell correspondant. Pour alimenter la table type rupture, nous avons suivi les mmes dmarches mais en se basant cette fois ci sur les donnes de la table ARTRUPT au lieu de STOMVT.
43

avec la table

de

paramtrage TRA_PARPOSTES qui contient la signification des codes restitus afin

Rapport PFE

Chapitre 4 : Ralisation

4.1.3 Alimentation des tables de faits : Nous tions amens dans notre projet alimenter trois tables de fait savoir : les ventes, les dmarques et les ruptures. Nous prsentons dans ce qui suit lalimentation dtaille de la table Vente. Le traitement des autres tables est explicit dans lannexe A. Fait Vente : Pour alimenter la table de fait vente nous avons conu le job illustr dans la figure 4.6 qui est en mesure de calculer les indicateurs suivants : La quantit vendue. Le chiffre daffaires(CA). La marge ou la rentabilit.

Pour ce faire, nous avons effectu les traitements suivants explicits dans la figure 4.6 : Jointure entre la table qui enregistrent les mouvements de vente (STOMVT) et celle qui renseigne sur les magasins (SITDGENE). Filtrage des mouvements propres aux ventes. Conversions des champs de quantit, prix... pour pouvoir leur appliquer des calculs grce au composant tConvertType. Calcul de lindicateur du chiffre daffaires et de la valeur totale du prix de revient avec le composant tMap_8 et en utilisant les relations suivantes : Chiffre daffaires = Quantit vendue *prix hors taxe *(1+TVA). Prix de revient = prix de revient unitaire * quantit. Calcul du chiffre daffaires, la quantit vendue et du prix de revient pour la plus petite granularit du groupe qui constitue la cl primaire de la table Vente savoir : le magasin (STMSITE), larticle (STMCINL) et la date du mouvement(STMDMVT). Ce calcul est fait grce au composant tAggregatRow illustr dans la figure 4.7. Calcul de la marge via le tMap_2 avec la relation : Marge = chiffre daffaires prix de revient. Ce dernier composant identifie aussi la cl de la nouvelle table et envoie les donnes la base cible.

44

Rapport PFE

Chapitre 4 : Ralisation

Filtrage des champs ncessaires au calcul des indicateurs de vente

Calcul des indicateurs

Figure 4.6: Chargement de la table de fait Vente

Axes danalyse

Mesures Figure 4.7:Traitement effectu pat le composant tAggregateRow

4.1.4 Paramtrage de la frquence de la mise jour du datamart : Les donnes dun datamart doivent tre constamment mises jour. Pour ce faire, nous avons paramtr les actions du rafraichissement que proposent Talend selon notre besoin (voir lannexe B). En outre, une fois quun flux dextraction-transformation-chargement est dfini, il est possible de le dclencher de manire ponctuelle ou priodique. Ceci grce un outil de planification de tches. La figure 4.8 illustre ce planificateur des jobs.

Figure 4.8: Planification des jobs 45

Rapport PFE

Chapitre 4 : Ralisation

Cet ordonnanceur permet dexcuter les jobs du chargement des tables de fait quotidiennement ainsi que la table de dimension Temps, puisque les magasins effectuent dune faon permanente leurs transactions de vente. Par contre les autres jobs relatifs aux autres dimensions (structure marchandise, structure organisation, type dmarque) se lancent dune faon hebdomadaire vu quils voluent lentement dans le temps. 4.1.5 Analyse du temps de chargement Le temps de chargement ne varie pas beaucoup entre les diffrentes procdures (jobs) puisque nous utilisons le mme type de source savoir la base de donnes du client ATAC. Par contre, ce temps peut varier dune table une autre et entre lextraction de la source et le chargement dans la base cible. Ce temps change aussi en fonction du traitement effectu, sil sagit dune jointure simple, dune transformation ou dun calcul faire. Ainsi nous remarquons travers la figure 4.9 que le temps de lextraction des donnes depuis la base source est estim entre 30 et 40 lignes par secondes, alors que le temps du chargement dans la base de destination peut aller jusqu' 2100 lignes par secondes. Le calcul se fait aussi rapidement dans Talend dans lordre de 2000 lignes par secondes.

Figure 4.9: Temps de chargement de la table de fait Dmarque

La table la plus volumineuse de la base est la table STOMVT qui contient plus de 5 millions de lignes et qui englobe les diffrents mouvements des ventes et des dmarques. Cependant, la mise jour du datamart sera quotidienne pour les tables de fait, donc la moyenne des transactions de ventes par exemple qui peuvent tre enregistres chaque jour est de lordre de 30.000 lignes. Le chargement de ces lignes se fera approximativement en 10 minutes.

46

Rapport PFE

Chapitre 4 : Ralisation

Aprs avoir construit et aliment notre magasin de donnes, nous passons maintenant son exploitation dans le processus reporting qui constitue la fin logique de chaque projet BI. Pour ce faire, nous avons utilis l'outil Business Object prsent dans le troisime chapitre pour mettre tout dabord la disposition des dcideurs une prsentation mtier organise des donnes, et gnrer ensuite des rapports et des statistiques qui seront utiles pour le compte ATAC dans sa prise de dcision 4.2 Cration de lunivers et reporting Nous prsentons dans la premire partie les tapes suivies dans la cration de lunivers puis nous donnons les tats raliss dans la partie reporting. 4.2.1 Cration de lunivers Comme nous lavons prsent dans le chapitre de ltude comparative des outils, Business Objects dispose dun module Designer qui permet la cration des Univers. En effet, lunivers est une reprsentation mtier des donnes techniques issues du datamart, Il offre son utilisateur la possibilit dinterroger la base, danalyser et dlaborer des rapports avec son vocabulaire quotidien et sans avoir l'obligation de comprendre le langage SQL, ou la structure complexe de la base de donnes. (Voir lannexe C) Dans notre cas, nous avons cre lunivers ATAC partir des trois tables de fait : vente, dmarque et rupture avec les diffrentes dimensions danalyses. Pour ce faire nous avons suivi les tapes suivantes : Cration et paramtrage de la connexion au datamart. Insertion des tables depuis le datamart. Traitement des ambiguts. En effet, lutilisation multiple dune table dans lunivers peut causer une certaine ambigit. Tel est le cas des tables de dimension qui sont partages entre les trois tables de fait. Pour remdier ce problme, ils existent plusieurs solutions parmi lesquelles la cration des alias c'est--dire des noms logiques que nous affectons des tables tel que la table structure_marchandise2, Temps2, et structure_organisation2 illustres dans la figure 4.10 dans le cas ou ces tables sutilisent diffremment pour plusieurs fois. Apres avoir cre la connexion, insr les tables et rsolu le problme des ambiguts nous sommes pass la structuration de lunivers sous forme de classes et dobjet.

47

Rapport PFE

Chapitre 4 : Ralisation

Cration des objets : lobjet est un lment constitutif de lunivers qui sera directement manipul par lutilisateur, vu que cest une information composs de donnes de la base mais dfinie avec le vocabulaire mtier. Il y a trois types dobjets : Dimension : comme son nom lindique, elle reprsente une donne qualitative dun axe danalyse sur laquelle nous allons effecteur un calcul (ex : magasin, rgion, rseau...) Indicateur : ce sont les indicateurs unitaires que nous avons calcul dans la phase de lalimentation du datamart, mais sur lesquels nous avons appliqu des oprations de comptage ou de moyenne selon les besoins de lanalyse. (ex : nombre darticle en rupture, chiffre daffaires ). Objet information dun rayon) : cest un objet qui prsente gnralement un

complment dinformation sur une dimension dj dfinie (ex. : libell

Cration des classes : une classe est un regroupement thmatique des objets. Dans notre cas, et comme cest indiqu dans la figure 4.10, nous avons cre trois classes : une pour les ventes, une autre pour les ruptures de stock et une troisime pour les dmarque. Dans chaque classe, nous avons mis deux sous-classe : une pour les dimensions et une autre propre aux indicateurs afin doffrir lutilisateur une interface bien structure.

48

Rapport PFE

Chapitre 4 : Ralisation

Figure 4.10: LUnivers ATAC

4.2.2

Analyse et reporting

Avant de passer la phase de reporting, nous prsentons dabord lanalyse multidimensionnelle qui permet justement danalyser les indicateurs calculs en fonction des diffrentes dimensions. 4.2.2.1 Analyses multidimensionnelles Une fois lunivers ATAC est cre, Business Object offre une interface conviviale appele Desktop Intelligence. Cest une interface ddie lutilisateur final pour lui faciliter lutilisation des diffrentes fonctionnalits de lunivers. Grce cette interface intuitive, lutilisateur peut alors effectuer ses analyses et ses rapports de faon autonome sans avoir aucune connaissance technique. En effet, il na qu glisser les indicateurs et les dimensions ncessaires son analyse dans longlet objet du rsultat comme cest illustr dans la figure 4.11 et prciser ensuite les restrictions et les conditions quil souhaite poser dans longlet condition . Les requtes SQL correspondantes sont gnres automatiquement par le systme.

49

Rapport PFE

Chapitre 4 : Ralisation

Figure 4.11: Interface Desktop Intelligence

La figure 4.11 montre lexemple dune requte gnre automatiquement pour visualiser la quantit des dmarques dans les diffrents magasins de la rgion Damien Rancheard en fonction des types de dmarque en 2011. Lutilisateur peut aussi raliser ses rapports et ses statistiques suivant les diffrents niveaux. En effet, comme le montre la figure 4.12, il peut naviguer facilement dans la hirarchie des dimensions lors de son analyse.

Figure 4.12: Navigation dans la hirarchie

La figure 4.12 montre que nous pouvons dtailler le pourcentage du chiffre daffaires dun rseau par exemple, juste en cliquant sur ce dernier pour expliciter les pourcentages de ses diffrentes rgions, de mme nous pouvons cliquer sur une rgion pour obtenir le pourcentage du chiffre daffaires des magasins qui y appartiennent. Cette possibilit de navigation entre les
50

Rapport PFE

Chapitre 4 : Ralisation

niveaux hirarchiques facilite la visualisation des dtails et aide lutilisateur aller plus loin dans son analyse. 4.2.2.2 Reporting Le reporting prsente le fruit de tout projet dcisionnel. Il permet dtudier, de visualiser et dexploiter les donnes de lentreprise dans lobjectif de les bien manager pour en faire un rel support daide la dcision. (Voir lannexe E) Dans notre cas et afin de rpondre aux besoins dcisionnels du client ATAC, nous avons tabli un certain nombre dtats (Annexe D) sous forme de tableaux croiss ou des graphiques paramtrables comme lhistogramme, les camemberts, les courbes, diagrammes en aires etc. Nous rsumons dans le tableau suivant les tats raliss au profit du compte ATAC :
Tableau 4.2 : Etats Raliss au profit du compte ATAC

Etats raliss
Pourcentage du chiffre daffaires des magasins dans le rseau Sud Evolution du chiffre daffaires par jour et par rayon au mois de Janvier 2011 Quantit des dmarques dans chaque secteur en fonction des types de dmarque Nombre darticles en rupture en fonction du motif Taux de dmarques des sous rayons des magasins dans le dernier trimestre de lanne 2011.

Valeur des dmarques des rgions par type de dmarque


Rentabilit de chaque rseau. Dure moyenne de rupture compare entre quatre rgions Chiffre daffaires des dix premiers magasins Evolution de la quantit vendue dans les rseaux par mois et par famille de produit. Pourcentage des dons aux associations dans les rgions du rseau Est. Nombre darticles en rupture dans le magasin VIRTY par famille de produits. Evolution du nombre darticle en rupture depuis lanne 2010 Dure moyenne de rupture des sous familles en fonction des causes de rupture

Nous prsentons ainsi quelques exemples de ces tats. La figure 4.13 prsente un exemple dtat sous forme de diagramme de camemberts qui fournit le pourcentage du chiffre daffaires ralis dans chaque magasin du rseau Sud. Ceci donnera aux dcideurs une vue

51

Rapport PFE

Chapitre 4 : Ralisation

globale sur leurs sites les plus rentable comme Duplex Paris XV et les aidera amliorer le rendement des magasins de faible rentabilit comme le magasin Golbey.

pourcentage du chiffre daffaires des magasins dans le rseau Sud

Figure 4.13: Rapport du pourcentage du chiffre daffaires des magasins dans le rseau Sud

Pour suivre lvolution de ce chiffre daffaires dans une priode donne, nous avons propos ltat illustr dans la figure 4.14 qui prsente cette volution au mois de Janvier dans les rayons les plus importants des supermarchs du groupe Auchan.

Figure 4.14: Evolution du chiffre daffaires dans le temps 52

Rapport PFE

Chapitre 4 : Ralisation

Concernant les dmarques, le tableau de la figure 4.15 indique leur quantit dans les quatre secteurs de produits en fonction des types de dmarques dans lanne 2011.

Figure 4.15 Quantit de dmarques dans chaque secteur en fonction des types de dmarque

Pour mieux visualiser ces rsultats, nous avons accompagn ce tableau avec le diagramme illustr dans la figure 4.16. On constate que les articles prims et casss prsentent la plus grande quantit de perte.

Figure 4.16: Diagramme des quantits des dmarques

Pour les ruptures de stock, la figure 4.17 prsente le nombre des articles en rupture dans les diffrentes rgions du rseau Franchise en fonction des causes de ces ruptures. Cet tat donne une vision dtaille sur les rgions ou se produisent plus de ruptures afin dinciter les dcideurs prendre les mesures ncessaires pour les viter ou au moins les diminuer.

53

Rapport PFE

Chapitre 4 : Ralisation

2: Figure 4.17 : Nombre darticle en rupture

La dernire figure 4.18 illustre la valeur des dmarques y compris les dons aux associations par rapport au chiffre daffaires ralis en 2011. Cette valeur est reprsente par lindicateur taux de dmarque que nous avons calcul dans les diffrents sous- rayons des magasins du compte ATAC.

Figure 4.18: Taux de dmarque en 2011

54

Rapport PFE

Chapitre 4 : Ralisation

Conclusion : Ce chapitre a dcri la ralisation de notre systme dcisionnel. En effet, nous avons

commenc tout dabord par lalimentation de notre datamart via loutil Talend. Ensuite, nous avons cre lunivers ATAC sur lequel sest effectue lanalyse multidimensionnelle des indicateurs stratgiques recueillis avec loutil Business Object, pour finir par la gnration des tableaux et des rapports de synthses exploitables par les preneurs de dcision.

55

Conclusion
Notre projet de fin dtude a t pour nous non seulement une tape franchir pour achever notre parcours acadmique, mais aussi une grande opportunit de prendre part un projet rel qui sinscrit dans le cadre de linformatique dcisionnelle. Cette dernire a pour objectif doffrir un meilleur usage du flot de donnes afin daider les managers la prise de dcision. Nous rappelons que notre stage qui sest droul au sein de HP CDG consistait mettre en place un systme dcisionnel qui facilite llaboration des rapports dcisionnels au profit du compte ATAC. Ce systme a permis alors de gagner en termes de temps, dergonomie et dautonomie grce au datamart mis en place et lunivers cre sous Business Object. En effet, le processus reporting dispose dsormais dun entrept cibl, structur et propre son traitement. Il est donc devenu indpendant et spar des traitements quotidiens. Ldition des rapports qui prenait toute une journe auparavant est devenue instantane en quelque clic seulement. Laffichage du rsultat se fait actuellement en glissant juste les indicateurs et les dimensions qui sont reprsentes par des boutons et peut prendre plusieurs formes, tableau crois, graphique barres, secteurs, nuages de pointsetc. Ainsi un manager qui a peu de connaissances en informatique peut crer un ensemble dtats de reporting selon ses besoins et les visualiser en choisissant le graphe le plus significatif et le plus parlant. Ce stage a galement t une occasion pour nous de dcouvrir le dynamisme et lenthousiasme qui marquent lquipe ATAC au sein de HP CDG. Le travail avec cette quipe nous a permis de concrtiser nos connaissances techniques et thoriques ainsi que dacqurir dautres propres au monde professionnel. Les difficults majeures rencontres durant ce projet rsident essentiellement dans la nouveaut des technologies savoir Talend et Business Object qui nous taient compltement inconnus au dpart. De plus, le travail et la collaboration dans une grande quipe telle que lquipe ATAC a ncessit de dvelopper plus notre esprit dquipe afin daboutir nos objectifs cibls. Comme perspective ce projet, nous proposons aussi de mettre en place deux autres
datamarts. Un pour la gestion des commandes des magasins, et un autre pour le traitement du flux de stock dans les entrepts. En effet, la srie ATAC comprend les magasins ou les surfaces de vente et les entrepts qui reprsentent leurs fournisseurs logistiques. Lensemble de ces datamarts va mettre en lumire lactivit commerciale de lintgralit de la srie ATAC.
56

Bibliographie et Webographie
[CDG, 2009] : http://www.cdg.ma/index.php?option=com_content&task=view&id=34&Itemid=
249

Site officiel de la caisse de dpt et de gestion.


[Wiki, 2011]

http://fr.wikipedia.org/wiki/HP-CDG_IT_services_Maroc

Informations sur le groupe HP CDG. [HPCDG,2012]: Documentation offerte par la socit HP CDG. [Aldata, 2012]:
http://www.aldata.com/fr/produits/aldata-gold

Site officiel dAltdata diteur de lERP GOLD.


http://www.mappingsuite.com/fr/produits/composition-impression-archivagediffusion-pilotage-0032.html.

[Mapp, 2012] :

Site officiel de la suite logicielle Mapping. [Hugues, 2002]: http://users.polytech.unice.fr/~hugues/GL/chapitre2.pdf Description du cycle de vie Prototypage.
http://www.dwfacile.com/Portail_md.htm

[Dw, 2006]

Les notions cls de la modlisation multidimensionnelle. [Atol, 2007] : http://www.atolcd.com/fileadmin/Publications/Atol_CD_Livre_Blanc_ETL_Open_


Source.pdf

Les ETL Open source.

[Axege ,2012] : http://www.axege.com/Evaluation-de-deux-ETL-Clover-ETL-vs-Talend-OpenStudio.html

ETL Clover et Talend Open Studio.


http://www.legrandbi.com/2010/01/beyenetwork-third-nature-etude-bipentaho/ 57

[Legran, 2010] :

Etude Comparative entre les outils de Reporting Open source. [Loria, 2008]
: http://www.loria.fr/~peguiron/miage/Projet_Bibliographique.pdf

Les outils de Reporting Open source. [Com, 2012] :


http://www.commentcamarche.net/contents/entreprise/datawarehousedatamart.php3

Les notions sur datawarehouse et datamart

58

ANNEXES

Annexe A : Alimentation des tables de fait Dmarque et rupture

1. Alimentation de la table de fait Dmarque

Figure A1: alimentation de la table de fait Dmarque

Lalimentation de la table de fait dmarque seffectue de la mme faon peu prs que celle des ventes vue quelles sont toutes les deux extraites de la mme source, la diffrence apparait plutt dans le filtrage et la partie des calculs. En effet, on filtre les champs STMMOTF entre 10 et 19 et STMTMVT entre 100 et 124 pour avoir les mouvements des dmarques et des dons aux associations, puis on calcule les indicateurs recueillis dans cette partie en prenant la valeur absolue des donnes car elles sont enregistres ngatives dans la base source pour indiquer quelles prsentent des pertes .

2. Alimentation de la table de fait Rupture: Cette partie se base principalement sur la table ARTRUP qui englobe toutes les donnes concernant les ruptures du stock au sein des magasins ATAC: Afin dalimenter la table de fait
Rupture nous avons tabli le job suivant : 59

Figure A2: Chargement de la table de fait Rupture4

Nous avons effectu la jointure entre ARTRUP et Mg_Structure_Marchandise pour regrouper toutes les donnes ncessaires lidentification dun article en rupture, Ensuite, La partie calcul a consist calculer le nombre darticle en rupture ainsi que la dure moyenne que peut prendre ces proposs la vente. articles avant de redevenir disponibles dans la liste des produits

60

Annexe B : Paramtrage du rafraichissement du datamart selon Le besoin

Les donnes dun Datamart doivent tre constamment mises jour. Pour ce faire, loutil Talend permet de choisir la politique de rafraichissement propice chaque table. En effet , il est possible de choisir comme action sur les donnes update or insert comme le montre la figure A3 si lon prvoit un nombre de lignes mettre jour suprieur celui des lignes insrer ou bien insert or update dans la situation inverse.

Figure B1: Rafraichissement des tables destinataires

Dans notre cas, nous avons choisi laction insert or update pour toutes les tables de fait ainsi que la dimension temps puisque le nombre dinsertions des mouvements de vente, dmarque et rupture sera surement suprieur aux nombres de rafraichissement et cest pareil pour les dates. Concernant les autres dimensions qui ncessitent plus de mises jour que dinsertions nous avons opt pour laction update or insert .

61

Annexe C : Univers de Business Object

1. Rle de lunivers Lunivers a comme rle de fournir une interface simple utiliser et comprhensible permettant des exploiteurs de BUSINESS OBJECTS d'excuter des requtes dans une base de donnes afin de crer des rapports et d'effectuer des analyses de donnes. On utilise DESIGNER pour crer des objets qui reprsentent les structures de la base de donnes, par exemple les colonnes et les fonctions de base de donnes, dont les utilisateurs ont besoin pour accder et interroger la base, afin d'obtenir les informations ncessaires leur activit professionnelle. [Loria, 2008]

2. Designer pour crer des univers : DESIGNER offre une interface graphique qui permet de slectionner et d'afficher des tables dans une base de donnes. Les tables de bases de donnes sont reprsentes par des symboles de tables dans un diagramme de schma. A partir de cette interface, on peut manipuler des tables, crer des jointures qui lient les tables, crer des tables d'alias et des contextes, et rsoudre des boucles dans le schma. Les utilisateurs BUSINESS OBJECTS ne voient pas ce schma. [Loria, 2008]

62

Annexe D : Exemple dtats labors

Figure D1 : valeur des dmarques des rgions par type de dmarque

63

Figure D2 : Rentabilit des rseaux

Figure D3 : Nombre darticles en rupture dans le magasin VIRTY par famille de produits

64

Figure D4 : Dure moyenne de rupture compare entre quatre rgion

65

Annexe E : Termes usuels du dcisionnel :


Datawarehouse :

Le lieu de stockage intermdiaire des diffrentes donnes en vue de la constitution du systme d'information dcisionnel est appel entrept de donnes (en anglais datawarehouse). Le datawarehouse est ainsi le lieu unique de consolidation de l'ensemble des donnes de l'entreprises. Le crateur du concept de DataWareHouse, Bill Inmon, le dfinit comme suit : Un datawarehouse est une collection de donnes thmatiques, intgres, non volatiles et historises pour la prise de dcisions.

Ses principales caractristiques sont donc les suivantes : Orientation sujet du data warehouse : Le DW est organis autour des sujets majeurs de lentreprise, contrairement aux donnes des systmes de production gnralement organises par processus fonctionnel. Lintrt de cette organisation est de disposer de lensemble des informations utiles sur un sujet, le plus souvent transversal aux structures fonctionnelles et organisationnelles de lentreprise. Les donnes sont intgres : Les donnes alimentant le DW proviennent de multiples applications sources htrognes. Les donnes des systmes de production doivent tre converties, reformates et nettoyes, de faon tre intgres dans le data warehouse. Les donnes sont non-volatiles et historises : Les donnes des systmes oprationnels sont constamment manipules, modifies ; elles sont mises jour chaque nouvelle transaction. Ainsi, une mme requte demande quelques semaines dintervalle pourra fournir des rsultats diffrents. Par opposition, les donnes du data warehouse sont le reflet dune photo instantane des donnes du systme oprationnel. Lorsque intervient un changement important dans les donnes, une nouvelle photo est prise de faon ce que le DW garde une trace de lhistorique des donnes. Ainsi, Le DW est arriv comme une reconnaissance de la valeur et du rle de linformation, savoir son utilisation des fins stratgiques. Cest une plate-forme avec des donnes de trs bonne qualit qui supportent des applications de type informationnel, comme les applications daide la dcision, ainsi que les processus dans lentreprise. Il augmente la productivit des dcideurs dentreprise en consolidant, convertissant, transformant et intgrant les donnes de
66

diffrents systmes oprationnels et en leur fournissant une vue consistante, globale et unifie de leur entreprise. [Com, 2012] Datamart :

Le terme Datamart (littralement magasin de donnes) dsigne un sous-ensemble du datawarehouse contenant les donnes du datawarehouse pour un secteur particulier de l'entreprise (dpartement, direction, service, gamme de produit, etc.) en vue de restreindre les donnes au primtre mtier dun groupe dutilisateurs. [Com, 2012] ETL :

un outil ETL (Extraction / Transformation / Loading) permet partir de diverses sources de donnes, d'extraire de l'information, de faire des transformations afin de nettoyer les donnes et de charger des donnes utiles dans le datawarehouse ou le datamart . Les sources de donnes peuvent tre diverses (HTML, XML, base de donnes, fichiers texte, tableurs, ERP etc.) come illustre la figure E1. [Atol, 2007]

Figure E1 : Processus ETL Lacronyme ETL signifie Extract :Extraire Accder la majorit des systmes de stockage de donnes (SGBD, ERP, fichiers plat...) afin de rcuprer les donnes identifies et slectionnes. Prendre en compte les questions de synchronisation et de priodicit des rafraichissements.

67

Transform :Transformer : Toutes les donnes ne sont pas utilisables telles quelles. Elles mritent d'tre vrifies, reformates, nettoyes afin d'liminer les valeurs aberrantes et les doublons et consolides. Load :Charger : Insrer les donnes dans le Datawarehouse ou le Datamart. Elles sont ensuite disponibles pour les diffrents outils d'analyse et de prsentation que sont le Datamining, l'analyse multidimenensionnelle OLAP, les analyses gographiques, les requteurs et autres reportings et bien sr les tableaux de bord .

Reporting :

Les outils de cration de rapport (reporting tools) extraient les donnes et proposent une mise en forme destine la diffusion : par impression ou par des services Internet ou Intranet. Ils sont trs utiliss pour gnrer des tableaux de bord conventionnels, qui sont souvent composs et diffuss automatiquement et priodiquement sans demande spcifique des utilisateurs. Ces tableaux de bord peuvent tre transforms en graphes pour donner une reprsentation intelligente des informations afin de faciliter aux dcideurs lanalyse et linterprtation des tats. [Loria, 2008]

68

69