Vous êtes sur la page 1sur 28

Rapport du Projet de Fin dAnne

Mise en place dune base de donnes


dcisionelle pour des actions
Ralis par : tlspectateurs
Ayoub MANAR
Omar OUKILI

Encadr par :

Mr ABOUABDELLAH

Anne Universitaire : 2009 - 2010


Remerciements

En prambule ce mmoire, Nous souhaitons adresser ici nos


remerciements toutes les personnes qui nous ont apport leur soutien et leur
aide et qui ont ainsi contribu llaboration de ce mmoire.

Nos remerciements les plus sincres sont adresss notre encadrant Mr


ABOUABDELLAH pour le soutien, laide et le temps quil a bien voulu
nous consacrer et sans qui ce mmoire naurait jamais vu le jour.

Nos remerciements sadressent galement nos professeurs, ainsi qu tous


ceux qui nous ont fait lhonneur de bien vouloir valuer mon travail.

Nous exprimons notre gratitude nos parents, et notre famille qui nous
ont toujours soutenue et encourag tout au long de nos tudes.

Enfin, nous adressons nos plus sincres remerciements tous nos amis qui
ont rendu ce travail possible par leurs conseils, remarques et encouragements.

2
Rsum

Dans le cadre des projets de fin dannes organis par lEcole Marocaine des Sciences de
lingnieur, on nous a charg de la conception et la ralisation de la partie dcisionnelle du module
tlvision de loprateur BreeFox qui est destine aux manager de la socit.

Durant toutes les sances dencadrement et les heures de travail chez nous, on avait pour
mission dans une premire tape dtudier la Business Intelligence ou en franais linformatique
dcisionnelle, qui est une solution qui permet d'utiliser les donnes transitant par le Systme
d'information en informations susceptibles, d'tre exploites des fins dcisionnelles.

La deuxime tape consistait en lanalyse du cahier de charge et des indicateurs qui seront utilis
pour gnrer un Schma dcisionnelle, et plus prcisment les informations des Foyer, des chaines,
des actions et des missions, qui constituent les axes principaux du module tlvision de loprateur
BreeFox. Aprs cette analyse et conception du systme, on a abouti une base de production.

La troisime tape consiste la gnration du cube, et la fin la mise en place de la solution


retenue pour llaboration des tableaux de bord.

3
Abstract

As part of year-end projects hosted by the School of Moroccan Engineering Sciences, we were
responsible for designing and implementing the party's decision-making module BreeFox
television operator that is intended to manager Society.

Throughout the coaching sessions and hours of work with us, it was charged in a first step to study
the French business intelligence or business intelligence, which is a solution which allows to use
the data passing through System information into information that, to be used for decision making
purposes.

The second phase involved the analysis of the specifications and indicators that will be used to
generate a decision diagram, specifically information from Foyer, chains, stocks and emissions,
which are the main components of the module Television BreeFox operator. Following this
analysis and system design, it has led to a production base.

The third step is to generate the cube, and eventually to the establishment of the solution for the
development of dashboards

4
Liste des Figures

Figure 1 : Organisation dun systme dcisionnel.............................................................................. 13

Figure 2 : Diagramme des uses cases ................................................................................................ 18

Figure 3 : Diagramme de classes ....................................................................................................... 20

Figure 4 : Cube................................................................................................................................. 22

Figure 5 : Exemple de rapport 1 ....................................................................................................... 23

Figure 6 : Exemple de rapport 2 ....................................................................................................... 24

Figure 7 : Exemple rapport 3............................................................................................................ 24

Figure 8 : Exemple de graphe 1 ........................................................................................................ 25

Figure 9 : Exemple de graphe 2 ........................................................................................................ 26

5
Liste des Abrviations

BI Business Intelligence

ETL Extract Transform Loading

OLAP Online Analytical Processing

OLTP Online Transaction Processing

DM datamart

UML Unified Modeling Language

RG Rgle de gestion

6
Table des Matres

Remerciements ....................................................................................................................................... 2
Rsum .................................................................................................................................................... 3
Abstract ................................................................................................................................................... 4
Liste des Figures ...................................................................................................................................... 5
Liste des Abrviations ............................................................................................................................. 6
Table des Matires .................................................................................................................................. 7
Introduction Gnrale ............................................................................................................................. 9
Chapitre I Prsentation gnrale........................................................................................................ 10
I. Contexte gnral du projet ............................................................................................... 10

II. Objectifs du projet ............................................................................................................. 10

Chapitre II Conception technique ....................................................................................................... 12


I. Systme dcisionnel .......................................................................................................... 12

II. ETL ..................................................................................................................................... 14

II.1. Dfinition dun ETL .................................................................................................... 14

II.2. Les fonctionnalits dun ETL ...................................................................................... 14

III. Entrept de donnes ......................................................................................................... 14

III.1. Analyse des types dutilisation des entrepts de donnes ....................................... 14

IV. Reporting ........................................................................................................................... 15

IV.1. Dfinition du Reporting ............................................................................................. 15

IV.2. Modes de restitution ................................................................................................. 15

V. Analyse des donnes : Cube OLAP .................................................................................... 16

VI. Solution adopte ............................................................................................................... 16

Chapitre III Conception ....................................................................................................................... 17


I. Base de production............................................................................................................ 17

I.1. Base de production........................................................................................................ 17

I.2. Dtermination des faits ................................................................................................. 20

7
I.3. Modlisation de lentrept :.......................................................................................... 21

Chapitre IV Ralisation ....................................................................................................................... 23


Conclusion Gnrale ............................................................................................................................. 27
Bibliographie / Webographie ................................................................................................................ 28

8
Introduction Gnrale

L'informatique ne cesse de s'innover, rendant ainsi la prvision et le recueil du "feed back"


du "business" choses aises. Actuellement, et grce aux outils de la Business Intelligence [BI], on
peut facilement et automatiquement crer des processus adapts la structure traite, qui pourront
en plus de faciliter la vie aux grants, rendre la collecte des feed back et l'amlioration des services
une tche systmatique.

Dans notre cas, loprateur BreeFox cherche amliorer le rendement de ses services et sa
position dans le march. Le Reporting relatif toutes ses activits savre ncessaire. En fait, les
outils daide la dcision proposs doivent rpondre trois critres : Le premier sagit de collecter,
nettoyer et consolider les diffrentes donnes de lentreprise ; quant au deuxime, il assure le
stockage de ses donnes et finalement le troisime exploite la richesse informationnelle que les
donnes reclent. Cette exploitation passe par des analyses, permettant la prise des dcisions
adquates pour la correction et lamlioration des situations.

Lobjectif de notre projet fut donc de raliser un Datawarehouse qui permettra davoir une
visibilit sur les donnes vitales et sur les indicateurs mis en point pour aider le manager de BreeFox
dans sa prise de dcision.

Le prsent rapport constitue une synthse des travaux raliss pour atteindre les objectifs
prcits. Ses diffrents chapitres retracent les tapes de ralisation de notre projet. Il est organis
en quatre chapitres :

Le premier porte sur une description gnrale du projet.

Le deuxime est consacr la modlisation des spcifications fonctionnelles gnrales de


lapplication.

Le troisime prsente les outils techniques utiliss.

Et enfin le dernier chapitre dcrit les dtails de la solution dveloppe.

9
Chapitre I Prsentation gnrale

I. Contexte gnral du projet

L'oprateur BreeFox propose ses abonns un boitier routeur ADSL qui groupe un
accs IP, le tlphone et un bouquet de chanes de tlvision interactives. Nous ne nous
intresserons qu' cette dernire fonction dans notre entrept de donnes.

Les chanes de tlvision proposes par BreeFox dans son bouquet sont des chanes
nationales et des chanes page. Seulement, les interruptions publicitaires (des chanes
nationales et page) peuvent tre personnalises en fonction du profil du foyer (ou des
adultes du foyer quand le contrle parental est dverrouill). Le tlspectateur peut ragir
(interactivement) de plusieurs manires aux missions et aux publicits qu'il reoit au moyen
de sa tlcommande (ie Zapette):

A tout moment, il peut zapper vers une autre chane

A tout moment, il peut teindre son poste

Pendant une publicit, il peut zapper la pub suivante sans attendre la fin de la
publicit en cours (la dure de visualisation est importante).

Pendant une publicit, il peut demander plus d'information sur le produit prsent (la
dure de visualisation est importante) puis revenir l'mission en cours.

II. Objectifs du projet

Le projet propos sinscrit dans la catgorie de ces nouveaux systmes daide la


dcision.

10
Il sagit de crer un entrept de donnes centr sur les actions du tlspectateur.
L'objectif de cet entrept est de profiler au plus prcis le foyer (ou plutt le tlspectateur
qui dtient la tlcommande) afin de maximiser la demande d'information sur les produits
prsents par les publicits.

En effet, l'oprateur peroit plus d'argent de la part de l'annonceur quand le


spectateur demande plus d'information au moment ou l'annonce est passe.

Le projet vise donc raliser :

- Une base de donnes qui permet darriver cet entrept de donnes,


- Mettre en place le cube de cet entrept de donnes,
- Raliser un tableau de bord sur les tlspectateurs selon diffrents indicateurs :
dure dmission, nombre dactions par date, nombre de chaines zappes et qui permet
dimprimer les diffrents tats possible aidant le manager dans sa prise de dcision.

11
Chapitre II Conception technique

I. Systme dcisionnel

Le dcisionnel est un ensemble de solutions informatiques permettant lanalyse des


donnes de lentreprise, afin den dgager les informations qualitatives, quelles soient
tactiques ou stratgiques ncessaires la prise de dcision.

Les bases de donnes de production et Datawarhouse ont des objectifs diffrents. Ils
stockent les donnes de manire diffrente et font lobjet de requtes diffrentes. Ils sont
ainsi bass sur deus systmes diffrents : OLTP et OLAP.

OLTP(On line Transaction Processing) est le modle utilis par les SGBD. Le mode de
travail est transactionnel. Lobjectif est de pouvoir insrer, modifier et interroger
rapidement et en scurit la base de donnes. Ces actions doivent pouvoir tre effectues
trs rapidement par de nombreux utilisateurs simultanment. Chaque transaction travaille
sur de faibles quantits dinformations, et toujours sur les versions les plus rcentes des
donnes.

Par contre les Datawarehouses reposent sur le systme OLAP(On Line Analytical
Processing).Ce systme travaille en lecture seulement. Les programmes consultent
dimportantes quantits de donnes pour procder des analyses des objectifs principaux
sont de regrouper, organiser des informations provenant de sources diverses, les intgrer et
les stocker pour donner lutilisateur une vue oriente mtier, retrouver et analyser
linformation facilement et rapidement. Cela ncessite de consulter des versions historiques
de la base et peut se permettre dignorer temporairement les dernires mises jour. Ces
bases sont souvent dun ordre de grandeur nettement suprieur celle des bases OLTP,
du fait de la conversation de lhistorique.

Il est important de sparer les bases de production du Datawarhouse. Pour des raisons
de performance. Premirement car les systmes de production ne sont pas prvus pour

12
rpondre efficacement aux requtes des systmes daide la dcision. De plus les systmes
de production ne conservent pas leurs donnes, alors quun Datawahouse repose sur des
donnes histories. Aussi un Datawarhouse repose sur des systmes de production
diffrents dont les donnes ne sont pas ncessairement uniformises.

-Les dmarches suivre :

Pour laborer un projet dcisionnel il faut passer par les tapes suivantes reprsentes
dans la figure suivante :

Figure 1 : Organisation dun systme dcisionnel

1. La collecte et le nettoyage des donnes via un ETL (Extract Transform Loading)

Cest ltape qui va permettre lextraction des donnes des systmes de production,
pour les prparer lalimentation des bases dcisionnelles.

2. Le stockage des donnes dans le systme dcisionnel (Data Warehouse, Data Marts)

Permet de conserver les donnes, sous forme relationnelle ou le plus souvent


multidimensionnelle, prtes tre inclues dans des rapports.

3.La restitution et lanalyse des donnes sous la forme de rapports et de tableaux de bord.

13
II. ETL
II.1. Dfinition dun ETL

Tout Projet dcisionnel ou dintgration de donne se base sur limplmentation des


processus dETL qui consiste extraire des donnes depuis des sources divers pour ensuite
effectuer des insertions ou des mises jour vers des cibles.

II.2. Les fonctionnalits dun ETL

Un processus dETL efficaces et fiables comprend de nombreux challenges:

Les volumes de donnes sont en croissance exponentielle, et les processus dETL


doivent traiter des quantits importantes de donnes granulaires (produits vendus,
appels tlphoniques, transactions bancaires,)
Alors que les systmes dinformation se complexifient, la varit des sources de
donnes saccrot galement. Les processus dETL doivent disposer dune large palette
de connecteurs des progiciels (ERP, CRM, etc.), des bases de donnes (Oracle,
MySQL..), des mainframes, des fichiers (CSV, Excel), des Services Web etc.
Les structures et applications dcisionnelles incluent des entrepts de donnes, des
applications OLAP pour lanalyse etc.

Toutes ces structures cibles prsentent des besoins diffrents en termes de


transformation de donnes, ainsi que des latences diffrentes.

Les transformations des processus dETL peuvent tre trs complexes. Les donnes
doivent tre agrges, converties, calcules, traites statistiquement, etc. Certaines
transformations spcifiques au dcisionnel sont aussi requises, comme les Dimensions
Evolution Lente

III. Entrept de donnes


III.1. Analyse des types dutilisation des entrepts de donnes

Nous avons gnralement trois types dutilisation dentrept de donnes :

14
Lentrept de donnes en temps rel qui est devenu populaire ces dernires annes,
principalement cause dun dsir croissant de disposer de linformation la plus rcente
possible pour battre la concurrence.
Lentrept de donnes traditionnel qui, comme son nom lindique, est le type
dutilisation auquel on pense le plus souvent quand on parle dentrepts de donnes.
Brassant de gros volumes de donnes, soumis des taux de rafrachissement peu
frquents (qui ne sont pas dfinis en termes dheures, et parfois ne sont mme pas
quotidiens) et desservant un public important et vari.
Lentrept de donnes historiques est relativement nouveau et est apparu la suite de
lois assez rcentes qui obligent de nombreuses entreprises conserver de grandes
quantits dinformations la disposition du gouvernement ou pour rpondre dautres
contraintes de conformit.

Dans notre projet nous sommes amenez concevoir un entrept de donnes traditionnel
avec des rafraichissements quotidiens ( partir de minuit) et nous sommes amen
conserver ces donnes les trois derniers mois.

IV. Reporting
IV.1. Dfinition du Reporting

Le terme restituer ou bien Reporting reprsente le moyen technique, applicatif qui


permet la consommation d'information base directement sur les outils de production ou
en aval d'une chane dcisionnelle.

IV.2. Modes de restitution

Il est commun de distinguer trois modes de restitution :

Rapport statique : il s'agit d'un rapport dont la structure est fige tant en termes de
prsentation que du primtre des donnes prsentes.

Rapport dynamique : il s'agit d'un rapport ayant une structure de prsentation semi statique
au sein duquel le primtre des donnes peut varier. Cela en offrant l'utilisateur final la
possibilit de choisir les valeurs de paramtres dynamiques intgrs dans le rapport.

15
Rapport Ad hoc : il s'agit d'un rapport librement amnag par l'utilisateur final. Il amnage
les donnes qui l'intressent dans une structure type tableau ou graphique en dfinissant le
primtre de consultation de ses axes et indicateurs.

V. Analyse des donnes : Cube OLAP


Lapproche OLAP (On-Line Analytical Processing) qui dsigne non seulement le
concept de la structure de modlisation des donnes, mais galement la technologie
danalyse de ces donnes.

Notre modle dimensionnel permet l'analyse des mesures de la table de faits partir de
plusieurs axes. Pour effectuer ces analyses on a opt a la cration des cube OLAP qui
fournisse des rponses rapides des requtes interrogeant une grande quantit de donnes
et de permettre une interaction en temps rel avec ces donnes.

VI. Solution adopte


Nous avons conu utiliser SQL Server 2008 et Visual Studio vu qu ils fournissent un
environnement unique regroupant plusieurs modules couvrant tous les besoins danalyses
et daide la dcision depuis lintgration des donnes laide de son service dintgration
et les outils ETL (Extraction, Transformation et Chargement de donne) quil utilise, suivi
par le service danalyse qui permet entre autre de reprsenter les donnes de faon
multidimensionnelle dans le but dacclrer les requtes lors de la gnration de rapport ,
jusquau le service de Reporting de SQL Server 2008 .

16
Chapitre III Conception

I. Base de production

I.1. Base de production


Le but de la conceptualisation est de comprendre et structurer les besoins du client,
il ne faut pas chercher l'exhaustivit, mais clarifier, filtrer et organiser les besoins. Une fois
identifis et structurs, ces besoins :

o dfinissent le contour du systme modliser (ils prcisent le but atteindre),

o permettent d'identifier les fonctionnalits principales (critiques) du systme.

Le modle conceptuel doit permettre une meilleure comprhension du systme, et


servir d'interface entre tous les acteurs du projet.

Les besoins des clients sont des lments de traabilit dans un processus intgrant UML

I.1.1. Modle fonctionnel


il s'agit de la solution UML pour reprsenter le modle conceptuel.
Les use cases permettent de structurer les besoins des utilisateurs et les objectifs
correspondants d'un systme. La figure 1 reprsente le modle des use cases pour notre
system :

17
Figure 2 : Diagramme des uses cases

I.1.2. Modle de donnes


Dictionnaire des donnes

N Identificateur Description Format


1 adresse Adresse de lannonceur string
2 catgorie Categorie de l emission String

3 dateNaissance Date de naissance du pre du foyer Date


4 dateCration La date de la creation de la chaine Date

5 dureAct Dure de laction Integer


6 dureRestante Dure restante de la pub Integer

7 drapeauContParen Drapeau du contrle parental Boolean

8 dure Dure de l mission Integer


9 dateDebutEmis Date du dbut de lmission Date
10 email Email de lannonceur String

18
11 Montant Montant a pay pour une chaine Entier

12 numFoyer Numro du foyer String


13 nomAbonn Le nom de l abonn String

14 numCha Numro de la chaine String

15 nomCha Nom de la chaine String

16 numAction Numro daction String


17 numAnno Numro dannonceur String
18 nomAnno Nom dannonceur String
19 numEmis Numro dmission String
20 numType Numro du type de laction String
21 nomAction Le nom de laction String
22 Profession La profession de l abonn String
23 Telephone Tel de l abonn String
24 Ville Ville de l abonn String

Rgle de gestion
- RG1 : Les chanes de tlvision proposes par BreeFox dans son bouquet sont des
chanes nationales et
- des chanes page
- RG2 : Seulement, les interruptions publicitaires (des chanes nationales et page)
peuvent tre personnalises en fonction du profil du foyer (ou des adultes du foyer quand
le contrle parental est dverrouill).
- RG3 : Le tlspectateur peut ragir (interactivement) de plusieurs
- manires aux missions et aux publicits qu'il reoit au moyen de sa tlcommande
(ie Zapette)
- RG4 : Le tlspectateur peut tout moment, zapper vers une autre chane
- RG5 : A tout moment, le tlspectateur peut teindre son poste
- RG6 : Pendant une publicit, il peut zapper la pub suivante sans attendre la fin de
la publicit en cours (la dure de visualisation est importante).
- RG7 : Pendant une publicit, il peut demander plus d'information sur le produit
prsent (la dure de visualisation est importante) puis revenir l'mission en cours.

19
Diagramme de classes :

Un diagramme de classes est un diagramme UML reprsentant un ensemble d'lments


dclaratifs (statics) du modle comme les classes, les types ainsi que leurs contenus et
relations. Ce dernier (figure 3) a t tablit aprs une tude profonde de notre cahier de
charges :

Figure 3 : Diagramme de classes

I.2. Dtermination des faits


La table de fait sur la quelle seffectue toutes les mesures est << T_Action>>.

20
Les dimensions

T_Emission, T_Chaine, T_publicit, T_Foyer, T_date, T_Annonceu et T_Typeaction.

Les indicateurs
- Dure dmission par foyer/date
- Nombre de chaine par ville/date
- Nombre daction par ville/date
- Nombre de chaine par foyer/date
- Nombre de demande dinfo par date/foyer/chaine
- Nombre daction par foyer
- Nombre de chaines zappes par foyer/date/ville
- Nombre de publicits zappes par foyer/date/ville
- Nombre daction par foyer/ville

I.3. Modlisation de lentrept :


Ce cube (Figure 4) prsente les diffrentes informations analyser qui sont stockes
dans la table de faits T_Action . Ces informations sont appeles des mesures :

Le nombre et le pourcentage des actions.

Lanalyse est toujours faite selon un axe danalyse :

Le foyer, les chaines zapps, les missions, les villes, les types dactions, les date
des missions.

Toutes les dimensions sont directement relies la table de faits, qui contient les donnes
analyser :

La table de faits est relie aux dimensions par des relations (1, n).

Pour analyser une ligne de fait par Foyer par exemple, il faut qu'il y ait une relation
entre cette ligne et la dimension T_Foyer.

Chaque ligne de la table de fait une relation avec chacune des dimensions.

21
Figure 4 : Cube

22
Chapitre IV Ralisation
Les tats de sortie sont sous format de diagrammes, de graphes et de tableaux, le prsent
chapitre fait lobjet de la description de quelques uns.

Figure 5 : Exemple de rapport 1

Cette fentre [figure 5] prsente un rapport synthtique des dures totales des actions
effectues, filtr par Foyer , qui est compos dune hirarchie : Nom abonn, Date de
naissance, Profession, Tlphone, Ville et le total calcul.

23
Figure 6 : Exemple de rapport 2

La [figure 6] prsente un rapport synthtique des dure totales des actions effectues
filtr par ville et Foyer, compos dune hirarchie : Ville, Nom abonn, Date de naissance,
Profession, Tlphone et la dure total calcul.

Figure 7 : Exemple rapport 3

La figure ci-dessus [figure 7] reprsente un rapport des actions effectues filtr par
Foyer, qui est compos dune hirarchie : Nom abonn, Date de naissance, Profession,

24
Tlphone, ville et le nombre dactions calcules. En bas est mentionn le total de toutes
les actions.

Figure 8 : Exemple de graphe 1

Ce graphe nous retourne le nombre de demandes dinformations par anne et par


chaine. Dans notre cas nous avons 12 demandes pour la RTM en 2005, 4 en 2006 et 2
seulement en 2007.

25
Figure 9 : Exemple de graphe 2

Ci-avant, une prsentation graphique, du total des dures dactions filtres par foyer.

26
Conclusion Gnrale

A travers ce rapport, nous avons essay de prsenter les diffrentes tapes de


notre travail pour notre projet de fin danne. Un projet qui consistait tablir un
module dcisionnel destin la gestion des actions des tlspectateurs pour la
socit BreeFox.

Limplmentation des diffrentes phases de la chaine dcisionnelle constituant


larchitecture de lapplication, facilitent la ralisation du projet.

Le projet ft une occasion dor pour, aussi bien mettre en pratique nos

connaissances acadmiques, que den acqurir, et de dvelopper de nouvelles


notions informatiques complmentaires celles acquises au sein de lEcole
Marocaine des Sciences de lIngnieur. On a du donc approfondi nos connaissances
analyser les problmes et les besoins et les reformuler afin de pouvoir les
modliser

Au terme de ce travail, nous pouvons dire que ce projet facilitera la prise de


dcision pour le garant de BreeFox, et permettra damliorer la qualit des services
de la socit offerts ses clients.

27
Bibliographie / Webographie

Bibliographie

[KIMBALL, 2001] Ralph KIMBALL, Concevoir et dployer un Data Warehouse, EYROLLES,


2001

Webographie

[SystemeETL.com] http://www.systemeetl.com/plan_projet.htm, Dcisionnel


[Developpez.com, 2000] Guillaume ROSSOLONI, 2000, 2009, Disponible sur
http://www.developpez.com, 20 Mai 2009
[INMON] http://www.commentcamarche.com, datawarehouse et datamarts

28