Vous êtes sur la page 1sur 107

2020 - 2021

INFORMATIQUE

Mise en place d’une solution d’aide à la


décision dans le domaine de grande
distribution pour le client FnacDarty

Réalisé par : KROUT Wassim

Encadrant ESPRIT : Mme BELHADJAMMAR Wafa

Encadrant Entreprise : Mr JANDOUBI Alaeddine


Validation des encadrants

J’autorise l’étudiant de faire le dépôt de son rapport


de stage en vue d’une soutenance .
Encadrant professionnel, Mr JANDOUBI Alaeddine
Signature et cachet

J’autorise l’étudiant de faire le dépôt de son rapport


de stage en vue d’une soutenance .
Encadrante académique, Mme BELHADJAMMAR
Wafa
Signature
Dédicaces

A mes très chers parents Azaiez et Samia,


Nul mot ne pourra exprimer ma gratitude envers vous deux. Je ne cesserais de vous remercier
pour tous les sacrifices que vous avez faits à mon égard. Vous êtes les étoiles qui ornent mon
univers. Sans vous, je ne serais pas l’homme que je suis aujourd’hui.

A mes chères sœurs Wiem et Nihel et mon beau frère Ali,


Merci pour tout l’amour que vous m’accordez, pour toutes les leçons que vous m’apprennent.
Que cet humble travail puisse vous rendre fièrs de moi.

A mes neveux Taha et Moslem et ma nièce Zaineb,


Qui me procurent le bonheur du monde par leur présence , ceux que j’oublie ma fatigue et ma
frustration à leur côté , un grand merci pour la force que vous m’avez apporté pour parvenir à
pousser jusqu’au bout.

A mes cheres amis,


Merci pour tout vos conseils et supports et pour les moments mémorables qu’on a pu passer
ensemble.

Wassim Krout

i
Remerciements

Au terme de ce projet de fin d’études, nous remercions en premier lieu, le bon Dieu de nous
avoir donner la force et le courage de le mener à terme.

Avant d’entamer ce rapport, nous adressons tout d’abord à Madame Wafa Belhadjammar,
notre encadrante académique pour son aide et ses conseils tout au long de ce projet. Nous avons
eu le grand plaisir de travailler sous votre direction.

Nos vifs remerciements s’adressent à Monsieur Jalel Besbes, le directeur général de DELTA
SOFT INTERNATIONAL pour avoir eu l’amabilité de m’accueillir au sein de son équipe.

Nous remercions également Monsieur Abdelmajid Hamdi et Monsieur Alaeddine Jandoubi,


mes encadrants professionnels, pour nous avoir impliqués dans ce projet, pour le savoir-faire
qu’ils nous ont transféré et pour leurs aides considérables.

Nous remercions vivement Mesdames et Messieurs les membres du jury d’avoir accepté
d’évaluer notre projet.

ii
Table des matières

Table des figures viii

Liste des abréviations x

Introduction générale 1

1 Cadre général du projet 3


1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Présenation de l’organisme d’accueil . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Histoire : Naissance de l’entreprise DELTA GROUP . . . . . . . . . . 4
1.2.2 Equipe et valeur de l’entreprise . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Les solutions de l’entreprise . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Présentation du projet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1 Etude de l’existant . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.3 Solution proposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Méthodologie de travail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.1 Méthodologie de Ralph Kimball . . . . . . . . . . . . . . . . . . . . . 11
1.4.2 Méthodologie de Gimsi . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.3 Choix de la méthodologie . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Planification du projet et spécification des besoins 15


2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Planification du projet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Identification des acteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4 Spécification des besoins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.1 Identification des besoins fonctionnels . . . . . . . . . . . . . . . . . . 19
2.4.2 Identification des besoins non fonctionnels . . . . . . . . . . . . . . . 20
2.5 Diagramme de cas d’utilisation . . . . . . . . . . . . . . . . . . . . . . . . . . 21

iii
TABLE DES MATIÈRES

2.5.1 Diagramme de cas d’utilisation général . . . . . . . . . . . . . . . . . 21


2.5.2 Diagramme de cas d’utilisation raffiné . . . . . . . . . . . . . . . . . 23
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Architecture et environnement technique 28


3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Architecture technique du système . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3 Environnement technique du travail . . . . . . . . . . . . . . . . . . . . . . . 32
3.3.1 SQL Server Intégration Services (SSIS) . . . . . . . . . . . . . . . . . 33
3.3.2 Microsoft SQL server . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3.3 Power Bi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3.4 StarUML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3.5 Jupyter Notebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4 Intégration et préparation des données 37


4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2 Modélisation dimensionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2.1 Entrepôt de données . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2.2 Identification des dimensions . . . . . . . . . . . . . . . . . . . . . . 41
4.2.3 Identification des tables de faits . . . . . . . . . . . . . . . . . . . . . 45
4.3 La conception physique du modèle dimensionnel . . . . . . . . . . . . . . . . 50
4.4 Développement de la zone de préparation des données . . . . . . . . . . . . . 51
4.4.1 Les connexions aux bases de données sources et destinations . . . . . . 52
4.4.2 Alimentation de l’Ods (Operational Data Store) . . . . . . . . . . . . . 52
4.5 Alimentation de la Data Warehouse . . . . . . . . . . . . . . . . . . . . . . . 54
4.5.1 Alimentation des dimensions . . . . . . . . . . . . . . . . . . . . . . . 55
4.5.2 Alimentation des tables de faits . . . . . . . . . . . . . . . . . . . . . 60
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5 Restitution des données 64


5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2 Développement de l’application utilisateur . . . . . . . . . . . . . . . . . . . 65
5.2.1 Interface d’accueil . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.2 Suivi de vente pour les marchandises . . . . . . . . . . . . . . . . . . 66
5.2.3 Suivi de vente pour les services . . . . . . . . . . . . . . . . . . . . . 70
5.2.4 Gestion de stock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

iv
TABLE DES MATIÈRES

5.2.5 Gestion d’achat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76


5.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6 Analyse prédictive 80
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2 Etude prédictive au niveau de ventes par jour . . . . . . . . . . . . . . . . . . 81
6.2.1 La fonction ‘train_test_split’ . . . . . . . . . . . . . . . . . . . . . . . 83
6.2.2 Le forêt aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.2.3 La régression logistique . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.2.4 L’arbre de décision . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6.2.5 Interprétation et choix de modèle . . . . . . . . . . . . . . . . . . . . 91
6.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

Conclusion générale 92

Webographie 93

v
Table des figures

1.1 Logo de DELTA GROUP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4


1.2 Logo de FnacDarty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Microsoft Dynamic Nav FnacDarty . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Cycle de vie de la solution décisionnelle selon l’approche Ralph Kimball . . . 12

2.1 Phase de planification du projet selon « Ralph Kimball » . . . . . . . . . . . . 16


2.2 Diagramme de Gantt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Diagramme de cas d’utilisation général . . . . . . . . . . . . . . . . . . . . . 22
2.4 Diagramme de cas d’utilisation de développeur Bi . . . . . . . . . . . . . . . 24
2.5 Diagramme de cas d’utilisation de décideur . . . . . . . . . . . . . . . . . . . 26

3.1 Phase d’architecture technique selon « Ralph Kimball » . . . . . . . . . . . . . 29


3.2 Architecture technique de la solution décisionnelle . . . . . . . . . . . . . . . 30
3.3 Processus d’un ETL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4 Logo SSIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5 Logo Sql Server . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Logo Power Bi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.7 Logo StarUML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.8 Logo Jupyter Notebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1 Phase de modélisation selon « Ralph Kimball » . . . . . . . . . . . . . . . . . 38


4.2 Modèle en étoile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3 Modèle en flocon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Modèle en constellation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5 Structure de la table Dim_Article . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.6 Structure de la table Dim_Fournisseur . . . . . . . . . . . . . . . . . . . . . . 43
4.7 Structure de la table Dim_Magasin . . . . . . . . . . . . . . . . . . . . . . . . 44
4.8 Structure de la table Dim_Entreprise . . . . . . . . . . . . . . . . . . . . . . . 44
4.9 Structure de la table Dim_Date . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.10 Structure de la table FaitCaisse . . . . . . . . . . . . . . . . . . . . . . . . . . 46

vi
TABLE DES FIGURES

4.11 Structure de la table FaitEcritureValeur . . . . . . . . . . . . . . . . . . . . . . 48


4.12 Structure de la table FaitStock . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.13 Modèle du DataWarehouse (Schéma en constellation) . . . . . . . . . . . . . 51
4.14 Interface de gestion de connexions SSIS . . . . . . . . . . . . . . . . . . . . . 52
4.15 SQL TRUNCATE (Ods_Location) . . . . . . . . . . . . . . . . . . . . . . . . 53
4.16 Alimentation des tables de l’ODS . . . . . . . . . . . . . . . . . . . . . . . . 53
4.17 Alimentation de la table " ODS_ Magasin " . . . . . . . . . . . . . . . . . . . 54
4.18 Chargement des dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.19 Récupération de données pour Dim_Article . . . . . . . . . . . . . . . . . . . 56
4.20 Transformation des colonnes pour Dim_Article . . . . . . . . . . . . . . . . . 57
4.21 Récupération de clé-étranger (idFournisseur_FK) . . . . . . . . . . . . . . . . 58
4.22 Configuration du composant Dimension à variation lente . . . . . . . . . . . . 59
4.23 Alimentation de la table Dim_Article . . . . . . . . . . . . . . . . . . . . . . . 60
4.24 Alimentation de la table de fait " FaitCaisse " . . . . . . . . . . . . . . . . . . 61
4.25 Alimentation de la table de fait " FaitEcritureValeur " . . . . . . . . . . . . . . 62
4.26 Alimentation de la table de fait " FaitStock " . . . . . . . . . . . . . . . . . . . 63

5.1 Phase de restitution selon « Ralph Kimball » . . . . . . . . . . . . . . . . . . . 65


5.2 Interface d’accueil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.3 Tableau de bord vente marchandise FnacDarty . . . . . . . . . . . . . . . . . . 67
5.4 Tableau de bord vente marchandise Fnac . . . . . . . . . . . . . . . . . . . . 69
5.5 Tableau de bord vente marchandise Darty . . . . . . . . . . . . . . . . . . . . 69
5.6 Tableau de bord vente service FnacDarty . . . . . . . . . . . . . . . . . . . . . 71
5.7 Tableau de bord vente service Fnac . . . . . . . . . . . . . . . . . . . . . . . 72
5.8 Tableau de bord vente service Darty . . . . . . . . . . . . . . . . . . . . . . . 73
5.9 Tableau de bord gestion de stock FnacDarty . . . . . . . . . . . . . . . . . . . 74
5.10 Tableau de bord gestion de stock Fnac . . . . . . . . . . . . . . . . . . . . . . 75
5.11 Tableau de bord gestion de stock Darty . . . . . . . . . . . . . . . . . . . . . . 76
5.12 Tableau de bord gestion d’achat FnacDarty . . . . . . . . . . . . . . . . . . . 77
5.13 Tableau de bord gestion d’achat Fnac . . . . . . . . . . . . . . . . . . . . . . . 78
5.14 Tableau de bord gestion d’achat Darty . . . . . . . . . . . . . . . . . . . . . . 79

6.1 Fichier PredictionVente.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81


6.2 Fichier PredictionVente.csv après la transformation . . . . . . . . . . . . . . . 82
6.3 Jeux de données de SommeVente . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.4 implémentation de la fonction train_test_split . . . . . . . . . . . . . . . . . . 83
6.5 Implémentation de l’algorithme forêt aléatoire . . . . . . . . . . . . . . . . . 84

vii
TABLE DES FIGURES

6.6 La moyenne des erreurs et la précision de forêt aléatoire . . . . . . . . . . . . 85


6.7 La représentation graphique de la valeur réelle et prévue (Le forêt aléatoire ) . . 86
6.8 Implémentation de la régression logistique . . . . . . . . . . . . . . . . . . . 87
6.9 La moyenne des erreurs et la précision de la régression logistique . . . . . . . 88
6.10 La représentation graphique de la valeur réelle et prévue (régression logistique ) 88
6.11 Implémentation de l’arbre de décision . . . . . . . . . . . . . . . . . . . . . . 89
6.12 La moyenne des erreurs et la précision de l’arbre de décision . . . . . . . . . . 90
6.13 La représentation graphique de la valeur réelle et prévue (L’arbre de décision) . 91

viii
LISTE DES TABLEAUX

Liste des tableaux

2.1 Tâches effectuées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2 Description du diagramme de cas d’utilisation global . . . . . . . . . . . . . . 23

2.3 Description du diagramme de cas d’utilisation de développeur Bi . . . . . . . 25

2.4 Description du diagramme de cas d’utilisation de décideur . . . . . . . . . . . 27

4.1 Etude des données de la table DIM_Article . . . . . . . . . . . . . . . . . . . 42

4.2 Etude des données de la table DIM_Fournisseur . . . . . . . . . . . . . . . . 43

4.3 Etude des données de la table DIM_Magasin . . . . . . . . . . . . . . . . . . 44

4.4 Etude des données de la table DIM_Entreprise . . . . . . . . . . . . . . . . . 45

4.5 Etude des données de la table DIM_Date . . . . . . . . . . . . . . . . . . . . 45

4.6 Etude des données de la table FaitCaisse . . . . . . . . . . . . . . . . . . . . 47

4.7 Etude des données de la table FaitEcritureValeur . . . . . . . . . . . . . . . . 49

4.8 Etude des données de la table FaitStock . . . . . . . . . . . . . . . . . . . . . 50

ix
Liste des abréviations

BI = Business Intelligence.

ETL = Extract-Transform-Load.

ODS = Operational Data Store.

SQL = Tructured Query Language.

OLE DB = Object Linking and Embedding Database.

SSIS = SQL Server Integration Services.

SGBD = Key Performance Indicator.

KPI = Système de gestion de base de données.

ERP = Enterprise Resource Planning.

DAX = Data Analysis Expressions

UML = Unified Modeling Language.

x
Introduction générale

L’informatique décisionnelle est un sujet en pleine évolution, interprétée par Hans Peter
Luhn comme « un système automatique pour diffuser des informations aux différentes parties
prenantes d’une organisation industrielle, scientifique ou gouvernementale ».

Tout d’abord, notons bien que la technologie a connu une grande évolution principalement
dans le monde de l’informatique et surtout au niveau de la collecte et du traitement des données,
ces derniers sont volumineux et incompréhensibles. Il existe un véritable besoin pour rendre ces
informations lisibles pour une vision claire de leurs données. Ces différents problèmes montrent
le besoin de l’utilisation de l’informatique décisionnelle ou Business Intelligence « BI » qui
permet aux entreprises d’analyser les données pour améliorer leurs prises de décisions.

Dans ce contexte, s’inscrit notre projet de fin d’étude intitulé « Mise en place d’une solution
d’aide à la décision pour le client FnacDarty » au sein de l’entreprise « DELTA SOFT » pour
les modules de vente, achat et stock.
Ceci sera pour le compte d’une société dans la grande distribution afin de fournir des
informations de qualités aux décideurs sous forme de tableaux de bord facilement
compréhensibles et significatifs avec des axes d’analyses et des indicateurs clés de performances
qui répondent aux besoins de l’entreprise.

Le présent rapport synthétise tout le travail que j’ai réalisé au cours de mon projet s’articule
autour de six chapitres :

• Chapitre 1 : « Cadre général du projet » qui consiste à mettre le projet dans son contexte,
nous allons commencer par présenter l’organisme d’accueil, par la suite nous allons

1
INTRODUCTION GÉNÉRALE

analyser l’existant, aborder la problématique, proposer une solution adéquate et parler


de la méthodologie de travail choisie pour notre projet.

• Chapitre 2 : « Planification du projet et spécification des besoins » qui exposera la


planification des différentes étapes du projet, les acteurs ainsi que les besoins fonctionnels
et non fonctionnels de notre solution.

• Chapitre 3 : « Architecture et environnement technique » qui fera l’objet d’une étude sur
l’architecture technique ainsi qu’une présentation de l’outil sur lequel porte notre projet.

• Chapitre 4 : « Intégration et préparation des données » qui consiste à décrire la mise en


place du modèle d’aide à la décision et à détailler la conception physique du modèle à
élaborer ainsi que la phase d’alimentation et de modélisation de notre projet.

• Chapitre 5 : « Restitution des données » qui porte sur le développement de l’application


utilisateur qui se base sur des imprimes écrans des tableaux de bord de l’application
réalisée.

• Chapitre 6 : « Analyse prédictive » qui illustrera la phase d’analyse prédictive que nous
allons ajouter.

2
Chapitre

1
Cadre général du projet

Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Présenation de l’organisme d’accueil . . . . . . . . . . . . . . . 4
1.2.1 Histoire : Naissance de l’entreprise DELTA GROUP . . . . . . 4
1.2.2 Equipe et valeur de l’entreprise . . . . . . . . . . . . . . . . . . 5
1.2.3 Les solutions de l’entreprise . . . . . . . . . . . . . . . . . . . . 5
1.3 Présentation du projet . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1 Etude de l’existant . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.3 Solution proposée . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Méthodologie de travail . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.1 Méthodologie de Ralph Kimball . . . . . . . . . . . . . . . . . 11
1.4.2 Méthodologie de Gimsi . . . . . . . . . . . . . . . . . . . . . . 13
1.4.3 Choix de la méthodologie . . . . . . . . . . . . . . . . . . . . . 14
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

1.1 Introduction

Chaque organisation possède ses propres spécificités et se distingue des autres structures qui
l’entourent. Il y a donc lieu de la présenter sous ses différents aspects organisationnels
et fonctionnels afin d’avoir une idée précise sur la nature de ses activités, les relations, souvent
complexes, qu’elle peut entretenir avec son environnement aussi bien interne qu’externe, et dans
ce contexte nous allons découvrir un groupe solide et pérenne tel que DELTA GROUP. Dans
ce chapitre, nous commencerons par la présentation de la société et le cadre du projet, et par
la suite, nous exposerons le système actuel et nous mettrons en évidence la problématique du
travail à faire et la solution à réaliser , et enfin nous mettrons l’accent sur la méthodologie à
suivre.

1.2 Présenation de l’organisme d’accueil

1.2.1 Histoire : Naissance de l’entreprise DELTA GROUP

DELTA GROUP est le partenaire informatique des PME PMI depuis plus de 15 ans et leader
dans le domaine d’intégration des systèmes d’information ERP en Tunisie et à l’international,
grâce au savoir-faire de ses équipes expertes et certifiées. Elle englobe les meilleures
technologies et compétences pour proposer des solutions innovantes et globales (Infrastructure,
ERP et Décisionnel) et Services (conseil, intégration, support, formation) à ses clients afin de
leur garantir un système d’information perfermant.[1]

F IGURE 1.1: Logo de DELTA GROUP

4
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

1.2.2 Equipe et valeur de l’entreprise

DELTA GROUP fait quotidiennement sans possible pour garantir un haut niveau de service
à ses clients pour assurer le succès de ses projets et la satisfaction de ses clients. Elle met des
consultants métiers et des chefs de projets certifiés sur les dernières innovations dans le monde
des nouvelles technologies de l’information et de la communication. En outre, elle fidélise ses
collaborateurs à travers d’une politique rigoureuse de gestion de carrières qui s’inscrit dans
la durée. Le groupe fournit trois équipes riches de valeurs, de parcours et de compétences
complémentaires :

• Une équipe Consulting : Cette équipe est chargée du conseil, du diagnostic, des études
de cahiers de charge et de l’élaboration des schémas directeurs informatiques. Elle est
chargée aussi du pilotage et de la mise en place des solutions de gestion au niveau de
toutes les phases d’initialisation, de conception du nouvel environnement, de formation,
de paramétrage, d’accompagnement et d’optimisation.[2]

• Une équipe de développement : Cette équipe est constituée d’ingénieurs développement


de haut niveau, certifiés pour intervenir chez les clients et réaliser des développements
spécifiques autour des solutions standard mises en place, et ce pour répondre aux besoins
exprimés par les entreprises avant ou après la mise en place de l’ERP.[2]

• Une équipe systèmes & réseaux : Cette équipe assure le conseil, le diagnostic du parc
matériel (hardware), l’installation, la configuration et la maintenance des solutions
informatiques mises en place chez nos clients. Les ingénieurs et techniciens sont par
ailleurs responsables de l’assistance et de la formation aux nouveaux administrateurs du
hardware, réseaux, systèmes d’exploitation, bases de données, etc...[2]

1.2.3 Les solutions de l’entreprise

• Solution ERP : DELTA GROUP assure plusieurs types d’ERP via les produits Microsoft
Dynamics :

5
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

– Microsoft Dynamics 365 BUSINESS CENTRAL : Est une solution de gestion


d’entreprise tout-en-un conviviale et modulable, qui aide l’entreprise à relier les
finances, les ventes, le service client et les opérations afin de rationaliser les processus
d’affaires, d’améliorer les interactions avec les clients et de prendre de meilleures
décisions.

– Microsoft Dynamics NAV : Est une solution de gestion d’entreprise multilingue


et multidevise qui aide plus de 117 000 entreprises dans le monde dans la gestion
de leurs finances, leur comptabilité, les chaînes logistiques et l’exploitation. Elle est
rapide à implémenter, simple à utiliser, multi-devices et à la hauteur des ambitions
commerciales.

– Microsoft Dynamics AX : Est une solution de gestion d’entreprise qui offre plus de
1000 fonctionnalités nouvelles, standard ou sectorielles. Elle permet de développer
la valeur métier, l’agilité et la visibilité globale dans l’entreprise. Sa grande simplicité
permet une adoption plus large, tout en facilitant la maintenance et mises à jour.

• Solution métier : DELTA GROUP assure plusieurs solutions métier dans plusieurs
secteurs :

– FOODWARE 365 : Basée sur Microsoft Dynamics 365 Business Central permet de
gérer l’ensemble des activités de l’entreprise et d’automatiser les processus et de
travailler plus efficacement. Il offre également une couverture fonctionnelle adaptée
aux spécificités des différentes filières agroalimentaires (Fruits & légumes,
Fromagerie & laitage, Biscuiterie, Viande & Volaille, Boulangerie & Panification,
Prоduits dе la mеr, Cоnfisеriе, Plats cuisinés & prоduits élabоrés, etc....).

– ELVA DMS 365 : Basée sur Microsoft Dynamics 365 Business Central (NAV).........
et déployée chez les concessionnaires multi marques et permet de contrôler...............
et d’optimiser l’activité tout en augmentant.la fidélité des.clients.et.de.fournir.le....
meilleur.service...........................................................................

– LS Central : Une solution logicielle basée sur Microsoft Dynamics 365 Business.
Central, hautement configurable, économique et de qualité aide les détaillants,.les.
boutique.de.stations-service et les.services d’accueil.dans le.monde entier à.optimiser

6
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

leurs pratiques commerciales, à augmenter leur chiffre d’affaires et à répondre aux


attentes de clients existants et nouveaux plus facilement, plus simplement et plus
rapidement.

– REFLEX WMS :.Apporte une réponse globale aux enjeux logistiques des entreprises...
dans.leurs.usines,.entrepôts et points de.vente. Elle contribue à gagner en performance,
qualité de service et réactivité,.afin de répondre aux attentes.de clients de plus en plus...
exigeants,.internationaux.et.connectés...................................................................................

– Sana E-Commerce : Solution E-Commerce intégrée qui permet de Créer et gérer un


site.e-commerce en.tirant.parti des données.existantes de.l’ERP Microsoft Dynamics.

• Solution Bi Parmi les solutions Bi on trouve :

– Power Bi : Permet aux clients de surveiller leurs activités à travers de tableaux de


bord enrichis disponibles sur l’ensemble de ces appareils. Il transforme les données
de leurs entreprises en riches éléments visuels pour les organiser sans difficulté
et pour concentrer sur ce qui est vraiment important.

– QlikView ,Qlik Sense : Permet aux utilisateurs métiers de prendre des décisions
adéquates en un temps réduit et de saisir immédiatement les nouvelles opportunités
et d’augmenter les performances.

1.3 Présentation du projet

FnacDarty :.Est.une.entreprise.spécialisée dans.la distribution.de.matériel.électroménager,.


électronique.et.de.produits.culturels..L’activité.du.groupe.s’organise.autour.de.4.pôles.:..............

• La distribution de produits culturels, informatiques et électroniques pour grand le public.:


livres, jouets, consoles de jeux, disques de musique, téléphones, produits informatiques
(ordinateurs, tablettes, périphériques, logiciels, etc.), produits hi-fi (télévisions, chaînes
hi-fi,.lecteurs et.enregistreurs de DVD), appareils.photos et.caméscopes,.baladeurs.MP3,.
films.DVD,.appareils.électroménagers,.etc. . .

• La vente de services de développement de photos.

7
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

• La distributiоn de billets de spectacles : cоncerts, pièces de théâtre, оpéras, expоsitiоns,....


cirques, musées, etc. . ................

• La vеntе dе vоyagеs ( Fnac Vоyagе )................................

F IGURE 1.2: Logo de FnacDarty

1.3.1 Etude de l’existant

Il est nécessaire de bien étudier le système existant et de dégager ses fonctionnalités déjà
développées, afin d’extraire les nouveaux besoins et de concevoir et mettre en place une nouvelle
solution convenable.
Notre Client FnacDarty suit ses activités via ERP Microsft Dynamic Nav. Donc ce dernier
permet d’obtenir une vue complète de l’activité en temps réel, peu importe où les données ont
été créées ou stockées. Ce système ERP spécifique à FnacDarty gère les opérations financières,
stock , achat, commerciales, et comptabilité ect . . .
Nous présentons les différentes opérations par des modules comme suit :

• Module des ventes


Ce module assure les fonctions suivantes :...........................................................................

– Dоnnées de base pоur la cоmptabilité client...............................................................

– Limites.de.crédit..............................................................................................................

– La saisie des articles......................................................................................................

– Cоnsultatiоn des stоcks.............................

– Traitеmеnt dеs rеmisеs...............................................................................................

8
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

– Datеs dе livraison еct...

• Module des achats


Le module de gestion des achats réunit toutes les fonctionnalités dont FnacDarty avait
besoin tel que :

– Prоcessus cоmplet : Demandes de prix, cоmmandes d’achat, factures, réclamatiоns,


retours de livraison, avoirs.

– Dоnnées de base fоurnisseurs structurée.

– Accomptе, livraison partiеllе, facturе partiеllе.

– Archivagе dеs dоcumеnts.

– Budgеts d’achats.

• Module des stocks


Ce module assure les fonctions suivantes :

– Gestion structurée des données articles.

– Prix d’achat.

– Planification des inventaires spécifiques à chaque entrepôt.

– Réservation d’articles.

– Transfert de stock, stock de transit.

– Prix de vente et d’achat différenciés.

– Démarques et majorations des marchandises.

La figure (1.3) représente un exemple de l’ERP de notre client FnacDarty :

9
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

F IGURE 1.3: Microsoft Dynamic Nav FnacDarty

1.3.2 Problématique

Avant de commencer la première étape du projet, nous avons distingué que le système
existant ne répond pas complètement aux exigences des décideurs et ne satisfait pas les besoins
de notre client à cause du volume important de la quantité d’informations recherchées par les
utilisateurs , ce qui rend l’analyse et la prise de décision de plus en plus complexe. Ainsi, la
base de données commence à croitre et le nombre des utilisateurs augmente, les performances
deviennent vite catastrophiques. Des ensembles de données devenus si volumineux qu’ils
dépassent l’intuition et les capacités humaines d’analyse et même celles des outils informatiques
classiques de gestion de base de données ou de l’information.

1.3.3 Solution proposée

Pour satisfaire les besoins de notre client ‘FnacDarty’, nous avons proposé une solution qui
permet de :

– Collecter les informations pour qu’elles soient accessibles aux utilisateurs des entrepôts
de données.

– Consоlider l’ensemble des dоnnées pоur lеs achats, lеs vеntеs еt lеs stоcks etc...

– Transfоrmer les dоnnées en infоrmatiоns fiables, cоhérentes et pertinentes.

10
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

– Automatiser le processus de décision en se basant sur des indicateurs de performances


fiables et pertinentes......................................................................................................................

– Exploiter.de.l’entrepôt.et l’extraction de connaissances.à partir des tableaux.de bord.selon


plusieurs axes................................................................................................................................

DELTA SOFT INTERNATIONAl est chargée de développer une solution décisionnelle


permettant à notre client FnacDarty de surveiller ses activités d’une période à une autre. Cette
solution BI offre aux décideurs de l’entreprise la possibilité de visualiser les indicateurs de
performance dans un dashboard qui répond à tous les besoins du client.

1.4 Méthodologie de travail

Dans cette partie nous aborderons les méthodologies de travail Kimball et Gimsi. Nous
examinerons également les facteurs qui différencient ces deux approches.

1.4.1 Méthodologie de Ralph Kimball

La conception décisionnelle ascendante de Ralph Kimball, auteur et expert reconnu dans le


domaine des entrepôts de données, est le partisan d’une approche de la conception décisionnelle
d’entrepôt de données du bas vers le haut. Cette méthode est aussi appelée “Bottom-Up”. Dans
l’approche ascendante, les magasins de données ou datamarts sont donc créés pour fournir des
rapports et une capacité d’analyses dédiées à certains processus métiers spécifiques, donc plus
faciles à utiliser que des entrepôts de données complexe.
La figure (1.4) illustre les étapes du cycle d’un projet décisionnel tel que défini par Ralph
Kimball. Ces étapes sont groupées en quatre phases principales : le lancement, l’architecture,
l’implémentation et le déploiement.

11
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

F IGURE 1.4: Cycle de vie de la solution décisionnelle selon l’approche Ralph Kimball

Le cycle de Ralph Kimball est composé de 12 phases :

1. Planification du projet : La planification du projet a une influence sur la définition


et la portée du projet. elle dépend des besoins, comme indiqué par la flèche à double sens
reliant ces deux activités.[3]
2. Définition des besoins de l’entreprise : Les besoins de l’entreprise peuvent se définir
par la bonne compréhension des utilisateurs et de leurs besoins, ainsi comprendre les
facteurs clés qui conduisent l’entreprise à vouloir déterminer ses besoins et traduire les
facteurs pour les intégrer lors de la phase de conception.[3]
3. Définition de l’architecture technique : Définir les outils et les technologies nécessaires
pour l’intégration et le développement dans un environnement de datawarehouse et fournir
une vision globale de la structure de l’architecture technique à mettre en œuvre.[3]
4. Installation et sélection des produits : En se basant sur l’architecture technique, et en
répondant aux besoins de notre projet nous avons choisi de définir l’outil sur lequel se
base notre projet.[3]
5. Modélisation dimensionnelle des données : En premier lieu : Définir la méthodologie
choisie ainsi que les différents modèles, en deuxième lieu : La conception du modèle

12
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

multidimensionnel.:.Identification des faits.et des.dimensions et en dernier.lieu :.Définir.


les.dimensions.ainsi.que.les.mesures.[3]................................................................................
6. Conception du modèle physique de données :.Définir.les.structures.physiques...............
nécessaires.pоur l’implémentatiоn de la base de dоnnées lоgique.[3]
7. Conception et développement des éléments de la zone de préparation des données :..
Préparation.des dimensions et de la table des faits ainsi, l’implémentation..de l’ETL...
(l’extraction, la transformation et le chargement des données).[3]
8. Spécification de l’application utilisateur : Préparation des maquettes d’états selon les..
critères.de.l’utilisateur.[3].
9. Développement de l’application utilisateur : Développement des tableaux de bords qui..
vont répondre aux besoins de l’utilisateur à partir de l’ETL.[3]
10. Déploiement :.Convergence.de.la technologie,.des données,.et des.applications.utilisateurs
accessibles.à partir du poste de.travail et mise en place des processus.de.communication,...
support.utilisateur,.prise.en.compte.des.demandes.d’évolution.ou de.correction.[3]
11. Maintenance et croissance : Assurer le fonctionnement optimal du système et fournir..
un.service.de.supprt.et.une.formation.continue.[3]
12. Gestion du projet : Garantir le bon déroulement et la synchronisation des activités du
cycle.de vie.dimensionnel.et contrôler l’état.d’avancement.du projet,.Ainsi, détecter.........
еt résоudre les prоblèmes et contrôler les changеmеnts.[3]

1.4.2 Méthodologie de Gimsi

Comme.étant.une.méthode.qui.assure les.conditions de.réussite.d’un.projet.Business..........


Intelligence,.la méthodologie de GIMSI sera présentée dans la partie suivante de notre.rapport
C’est une méthode originale de conception du système de business intelligence.qui favorise la
coopération entre les décideurs (les décideurs ne sont pas isolés), le partage de la connaissance
et.l’intégration.performante.des outils.et.techniques.de.la.Business.Intelligence.[4].......................
Cette.méthode.se compose.de.4 phases.principales.découpées.en.10 étapes :.................................

1. Identification : Stratégie de l’entreprise : Analyse de l’environnement économique et de


la stratégie de l’entreprise afin de définir le périmètre et la portée du projet. Processus de

13
CHAPITRE 1. CADRE GÉNÉRAL DU PROJET

l’entreprise : Analyse.de la structure de.l’entreprise pour.pouvoir par la suite.identifier.les


processus.et.les.acteurs.concernés................................................................................................
2. Conception : Objectifs de performance : Sélection des objectifs tactiques de chaque
équipe en fonction de la stratégie générale. Conception du tableau de bord : Définition
du tableau de bord de chaque équipe. Choix des indicateurs : Choix des indicateurs
en fonction des objectifs choisis, du contexte et des acteurs concernés. C’est une tache
réalisée en coopération avec les décideurs. Collecte des informations : Identification des
informations nécessaires à la construction des indicateurs. Système de tableaux de bord.
Construction du système de tableaux de bord : Contrôle de la cohérence globale.
3. Mise en œuvre : Le choix des progiciels : Elaborer la grille de sélection afin de choisir
les progiciels adéquats. Intégration et déploiement : Implantation des progiciels
et déploiement à l’entreprise.
4. Amélioration : Audit : Suivi permanent du système.

1.4.3 Choix de la méthodologie

Après avoir étudier les deux approches, nous remarquons que la méthodologie de Gimsi
est une méthode coopérative basée sur la prise de décision répartie ce qui implique la présence
d’un très grand nombre de décideurs, chose que notre client FnacDarty ne détient pas, nous
avons décidé donc de travailler avec l’approche de Ralph Kimball qui est la plus adéquate pour
notre projet vu qu’elle s’adapte mieux à nos besoins en terme de compétences, de temps, de
coût et d’exigence en ce qui concerne l’intégration de données et vu qu’elle offre une meilleure
organisation du travail.

1.5 Conclusion

Dans ce chapitre, nous avons présenté l’entreprise d’accueil, le cadre général de notre projet
en déterminant l’étude de l’existant, la problématique, et la solution proposée et nous avons
terminé ce chapitre par la méthodologie adoptée pour la réalisation du projet.

14
Chapitre

2
Planification du projet et spécification
des besoins

Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Planification du projet . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Identification des acteurs . . . . . . . . . . . . . . . . . . . . . . 18
2.4 Spécification des besoins . . . . . . . . . . . . . . . . . . . . . . 19
2.4.1 Identification des besoins fonctionnels . . . . . . . . . . . . . . 19
2.4.2 Identification des besoins non fonctionnels . . . . . . . . . . . . 20
2.5 Diagramme de cas d’utilisation . . . . . . . . . . . . . . . . . . 21
2.5.1 Diagramme de cas d’utilisation général . . . . . . . . . . . . . 21
2.5.2 Diagramme de cas d’utilisation raffiné . . . . . . . . . . . . . . 23
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

15
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

2.1 Introduction

Dans ce chapitre, nous allons déterminer nos besoins fonctionnels/non fonctionnels et à


partir de cette capture nous passons à la modélisation de notre système en se basant sur quelques
diagrammes. Dans la figure ci-dessous, nous présentons la planification et les besoins de notre
solution suivant le cycle de vie dimensionnel de Ralph Kimball :

F IGURE 2.1: Phase de planification du projet selon « Ralph Kimball »

2.2 Planification du projet

Afin d’avoir une vue complète sur notre projet et sur les tâches, nous avons eu recours
au diagramme de Gantt qui va nous permettre d’avoir une bonne organisation du projet.

16
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

F IGURE 2.2: Diagramme de Gantt

Nous allons détailler la figure (2.2) dans un tableau qui va contenir les tâches et leurs dates
de début et de fin :

Nom de la tâche Date Début Date fin

Planification du projet 22/02/2021 01/03/2021

Spécification de besoin de l’entreprise 01/03/2021 15/03/2021

Définition de l’architecture technique 16/03/2021 17/03/2021

Installation des outils 18/03/2021 18/03/2021

Conception du modèle dimensionnelle 19/03/2021 08/04/2021

Préparation et alimentation des données 09/04/2021 31/05/2021

Réalisation des tableaux de bord 01/06/2021 12/07/2021

Analyse prédictive 13/07/2021 26/07/2021

Rédaction du rapport 02/03/2021 26/07/2021

TABLE 2.1: Tâches effectuées

17
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

2.3 Identification des acteurs

Un acteur est une entité qui définit le rôle joué par un utilisateur ou par un système qui
interagit avec le système modélisé.
Au niveau de cette section, nous présentons les différents acteurs susceptibles d’interagir avec
le système. La mise en marche du système nécessite essentiellement deux acteurs :

• Développeur bi :

– Permet de gérer, d’organiser et de traiter des volumes importants de données.

– Analyser les besoins des clients.

– La conception de l’architecture logicielle de projet.

– La gestion de ETL, par l’extraction des données sources : résolution des problèmes
d’intégration et qualité des données depuis la source vers la cible, la transformation
des données par appliquation de filtres, élimination des doublons et réalisation des
jointures et enfin le chargement des données par la validation des règles d’insertion,
d’intégrité et de conformité des données et la correction des erreurs pour passer à la
phase du reporting.

– La création d’un nouveau rapport selon des kpi, pour gérer les tableaux de bords,
les modifier, les supprimer et les déployer.

• Décideur :

– Son rôle consiste à analyser la situation ainsi que les difficultés auxquelles fait face
son entreprise.

– Il gère les tableaux de bord par la consultation des rapports pour réagir et prendre
des décisions concernent la situation actuelle.

– Il modifie les rapports de visualisation ainsi qu’il choisit un axe d’analyse où il


applique les filtres pour détailler les résultats obtenus.

18
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

2.4 Spécification des besoins

L’identification des besoins consiste à déterminer les objectifs du projet et à dégager les
fonctionnalités à réaliser. Ceci facilite la compréhension des tâches à mettre en œuvre.

2.4.1 Identification des besoins fonctionnels

Il s’agit des fonctionnalités de l’application. Le système à concevoir doit permettre aux


différents utilisateurs d’effectuer ces besoins :

• L’intégration des données : Pour faire l’intégration des données, nous devons assurer la
partie ETL (extraire, transformer et charger les données) à partir du fichier backup.bac
sous SQL server qui contient les détails nécessaires de système d’information (ERP
microsoft dynamics nav) de notre client et nous allons effectuer les transformations
nécessaires dans le but de concevoir un modèle dimensionnel qui va aider le client à avoir
une nouvelle structure de ses données suivant ses besoins.

• La réalisation des tableaux de bord : Après avoir créer le modèle dimensionnel nous
pouvons passer à la phase de restitution de données qui consiste à développer des tableaux
de bord sur plusieurs axes d’analyse et contenant des indicateurs clés de performance pour
répondre aux besoins du client.

• Suivi de vente marchandise et service :

– Calcul de chiffre d’affaires de l’année N et N-1, l’écart entre ces deux années et la
progression.

– Comparaison de chiffre d’affaires de l’année N et N-1.

– Top articles les plus vendus.

– Le nombre de transaction et la quantité vendue, de l’année N et N-1, l’écart entre


ces deux années et la progression.

– La marge de l’année N et N-1, l’écart entre ces deux années et la progression.

– Le panier moyen de l’année N et N-1, l’écart entre ces deux années et la progression.

19
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

– Calcul du montant des remises.

– Evolution du chiffre d’affaires vendue par année.

– Répartition des ventes par division, catégorie article, catégorie produit et nom
d’article.

• Gestion de stock :

– Détermination de la quantité du stock de l’année N et N-1.

– Détermination du montant de stock de l’année N et N-1.

– Evolution de quantité et montant de stock par magasin.

– Evolution de quantité et montant de stock par mois.

– Calcul la quantité sortie et la quantité restante de stock.

– Classement de division, catégorie article et catégorie produit par quantité en stock.

• Gestion d’achat :

– Calcul du montant des achats de l’année N et N-1 et l’écart entre ces deux années.

– Calcul de la quantité achetée de l’année N et N-1 et l’écart entre ces deux années.

– Evolution du montant des achats et de la quantité achetée par magasin et par division.

– Comparaison du montant d’achat de l’année N et N-1.

– Classement des achats par fournisseurs.

2.4.2 Identification des besoins non fonctionnels

Ce sont les imperfections qui empêchent la solution de fonctionner de façon efficace......


Dans ce cas, notre projet devra respecter un ensemble de propriétés pour avoir une meilleure
performance telle que :

• La performance : Un tableau de bord doit être performant c’est-à-dire à travers ses


fonctionnalités, répond à toutes les exigences des usagers d’une manière optimale.

• L’extensibilité : L’application devra être extensible, c’est à dire qu’il pourra avoir une
possibilité d’ajouter ou de modifier de nouvelles fonctionnalités.

20
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

• L’ergonomie : Le thème adopté par l’application doit être inspiré des couleurs et du
logotype de l’entreprise et leurs site web. Les indicateurs de performance, les couleurs,
les images et les objets graphiques utilisés doivent être en harmonie pour que le produit
soit exploitable convenablement.

• La facilité d’utilisation : L’utilisation de tableaux de bord de la plateforme doit être


simple et facile à comprendre pour que l’analyste puisse bénéficier de toutes fonctionnalités
du système.

2.5 Diagramme de cas d’utilisation

Le diagramme de cas d’utilisation permettant de décrire le comportement de système de


point de vue utilisateur. Il permet aussi de structurer les besoins des utilisateurs et les objectifs
de système ainsi que décrire l’interaction entre le système et ses acteurs.

2.5.1 Diagramme de cas d’utilisation général

La figure (2.3) illustre la description de diagramme de cas d’utilisation général.

21
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

F IGURE 2.3: Diagramme de cas d’utilisation général

Nous détaillerons le schéma de cas d’utilisation global pour chaque acteur , son rôle et une
description de chaque tâche. Le tableau ci-dessous illustre le diagramme de cas d’utilisation
global.

22
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

Acteur Action Description


- Gérer les dоnnées (extractiоn,
transfоrmation, et chargement de dоnnées)
et de faire de déplоiement et la mise à jоur
Développeur Bi Gérer l’ETL
automatique de ces derniers pоur avоir un
mоdèle adapté au besоin du client grâce à
l’оutil SSIS.

- Choisir les données à analyser : Préciser


le sujet d’analyse, les dimensiоns et les
Gérer les tableaux
Développeur Bi mesures.
de bоrd
- Visualiser les dоnnées sоus fоrme de
cоurbes selоn les besоins.

Cоnsulter les - Visualiser les tablеaux de bоrd déployés


Décideur / Développeur Bi
tableaux de bоrd et fairе dеs analysеs

Mоdifier les - Modifiеr les tablеaux dе bord selоn


Décideur / Développeur Bi
tableaux de bоrd les besоins de client.

- Le dévelоppeur bi et le décideur dоivent


Décideur / Développeur Bi Authentificatiоn s’authentifier pоur accéder à la sоlutiоn.

TABLE 2.2: Description du diagramme de cas d’utilisation global

2.5.2 Diagramme de cas d’utilisation raffiné

Description du cas d’utilisation de Développeur Bi :

La figure (2.4) illustre la description de diagramme de cas d’utilisation de développeur Bi :

23
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

F IGURE 2.4: Diagramme de cas d’utilisation de développeur Bi

Nous allons décrire ce diagramme par ce tableau qui illustre en détails le cas d’utilisation
de développeur Bi :

24
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

Action Description
- Cоllecter les dоnnées à partir de sоurce de dоnnées (ERP,
Extraire les données
Sql Server).

- Nettоyer et nоrmaliser les dоnnées.


Transformer les données - Appliquer les transfоrmation ( ajout des colonnеs, jointurе,
utilisation dеs cоnditiоns, tri ...)

- Créer les tables de faits et les tables de dimensions au sein


Charger les dоnnées
de datawarehouse.
- Choisir le typе de visuеl et le tablеau de bord sеlon lе bеsoin
Créer un tableau de bоrd
de cliеnt.

Mоdifier un tableau de - Chоisir le tableau de bоrd à mоdifier.


bоrd - Sauvegarder les mоdificatiоns.
Supprimer un tableau de - Chоisir le tableau de bоrd à supprimеr.
bоrd - Sauvеgardеr les modificatiоns.
- Déterminеr lеs mеsurеs existantеs dans lеs tablеs dе fait
Chоisir les mesures
sеlon notrе bеsoin.

- Calculer les clés de perfоrmance cоnvenable pоur l’aide à la


Créer les KPI
décisiоn grâce à l’outil DAX de power bi.

TABLE 2.3: Description du diagramme de cas d’utilisation de développeur Bi

Description du cas d’utilisation de décideur :

Le diagramme de cas d’utilisation présenté dans cette figure (2.5) détaille le cas d’utilisation
de décideur :

25
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

F IGURE 2.5: Diagramme de cas d’utilisation de décideur

Nous allons décrire ce diagramme par ce tableau qui illustre en détails le cas d’utilisation
de décideur :

26
CHAPITRE 2. PLANIFICATION DU PROJET ET SPÉCIFICATION DES BESOINS

Action Description
Chоisir les axеs
- Déterminer les dimensiоns de datawarehоuse à analyser.
d’analyses

Analyser les tablеaux de - Faire des analyses pоur les tableaux de bоrd selоn les critères
bоrd prédéfinis.

Appliquer les filtrеs - Chоisir les filtrеs convеnables à la sоlutiоn sеlon lе bеsoin.
- Expоrtеr lеs dоnnées en plusieurs fоrmat ( Pdf, Excel,
Expоrter les dоnnées
Images ...)

Ajоuter , Mоdifiеr et - Ajоutеr , mоdifiеr et supprimеr d’un indicateur de perfоrmance


supprimеr un KPI ’KPI’ selоn le besоin du client.

TABLE 2.4: Description du diagramme de cas d’utilisation de décideur

2.6 Conclusion

Nous avons consacré ce chapitre à la présentation des tâches que nous allons effectuer
durant ce projet et nous avons les planifier à l’aide du diagramme de Gantt. Ensuite, nous avons
identifié les besoins fonctionnels et non fonctionnels du projet et les acteurs impliqués, ce qui
a permis de dégager les différents cas d’utilisation. Dans le chapitre suivant, nous présenterons
l’architecture que nous allons adopter et l’environnement technique.

27
Chapitre

3
Architecture et environnement technique

Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Architecture technique du système . . . . . . . . . . . . . . . 29
3.3 Environnement technique du travail . . . . . . . . . . . . . . . 32
3.3.1 SQL Server Intégration Services (SSIS) . . . . . . . . . . . . . 33
3.3.2 Microsoft SQL server . . . . . . . . . . . . . . . . . . . . . . . 33
3.3.3 Power Bi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3.4 StarUML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3.5 Jupyter Notebook . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

28
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

3.1 Introduction

Après avoir fait l’analyse et la spécification des besoins fonctionnels et opérationnels


et identifier les acteurs principaux de notre portail et leurs rôles, nous entamons la partie de
la présentation de l’environnement, et l’architecture technique. Dans la figure ci-dessous, nous
présentons l’environnement technique de notre solution suivant le cycle de vie dimensionnel de
Ralph Kimball :

F IGURE 3.1: Phase d’architecture technique selon « Ralph Kimball »

3.2 Architecture technique du système

Pour mettre en place notre système, une source de données d’entreprise nous a été fournie en
entré, cette source est provenu de l’ERP Microsft Dynamic Nav qui permet de gérer l’ensemble
des processus de l’entreprise FnacDarty. Donc nous allons extraire les informations depuis ce
système d’information afin de faciliter le stockage et la manipulation de nos données. Nous
avons commencé par implémenter une base de donnée ODS (Operational data store) qui est
une base de données conçue pour centraliser les données issues de sources hétérogènes et qui
facilite le filtrage et la purge des données en éliminant les doublons et les redondances.

29
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

Par la suite nous avons effectué les transformations, les croisements des tables en utilisant l’ODS
comme source. Une fois les données extraites et transformées nous allons les intégrer dans notre
entrepôt de donnée puis les restituées sous forme de tableaux de bord et d’analyses faite avec
des algorithmes de data mining.
La figure ci-dessous illustre l’architecture globale de notre projet :

F IGURE 3.2: Architecture technique de la solution décisionnelle

• La phase de la collecte d’informations et préparation des données :

– La phase de la collecte et de préparation des données est primordiale. C’est une


étape qui permet de détecter, de sélectionner, d’extraire et de filtrer les données
brutes issues des environnements pertinents pour obtenir des indicateurs utiles dans
le cadre de l’aide à la décision. Ces données applicatives sont donc extraites,
transformées et chargées dans un entrepôt de données par un outil de type ETL
(Extract-Tranform-Load) ou en français ETC (Extraction-Transformation
et Chargement) qui est un processus automatisé qui prend les données brutes, extrait
l’information nécessaire à l’analyse, la transforme en un format qui peut répondre
aux besoins opérationnels et la charge dans un Data Warehouse.

30
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

– Extraction (Extract) : L’extraction des données est la première des étapes . Il permet...
la lecture et l’extraction des données du système source. Il s’agit de collecter des...
attributs spécifiques.à partir des sources hétérogènes de données.Il Consiste à :...
Cibler.les.données à extraire,.appliquer des.filtres et.définir.la fréquence.de.................
chargement.........................................................................................................................

– Transformation (Transform) : C’est l’étape la plus complexe. Elle permet d’appliquer.


aux.données.des règles.correspondantes.aux besoin.de l’entreprise.de façon.à.répondre
aux exigences en matière de reporting..Elle Consiste à : Nettoyer et standardiser.les...
données, assurer la Conformité des données, gérer des tables de fait et gérer des...
dimensions............................................................................................................................

– Chargement (Load) : C’est l’étape d’injection des données dans la base de données...
du data Warehouse. Il permet de déplacer des données et de les charger dans des...
tables. La figure (3.3) permet de mieux comprendre le processus ETL qui est considéré
comme le plus important pour garantir la fiabilité des données chargées dans notre
entrepôt de données :

F IGURE 3.3: Processus d’un ETL

• La phase de modélisation :

31
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

– Cette phase permet de stocker les données sous une forme adaptée. Parce que les
requêtes.décisionnelles.sont.très.consommatrices.en ressources.machines,.les...........
données.doivent être.stockées dans.une base.spécialisée,.l’entrepôt.de.données.ou....
datawarehouse..Le datawarehouse se charge de stocker.et de centraliser les.données
en.vue.de la constitution.du système.d’information.décisionnel................................

• La phase de restitution :

– Après l’intégration et la modélisation au niveau de l’entrepôt de données, l’étape


suivante est appelée reporting, durant cette phase nous allons présenter les données
sous forme de tableaux de bord pour permettre aux utilisateurs finaux de les analyser
et les interprété.

• La phase d’analyse :

– Dans cette partie, l’utilisateur final intervient pour analyser les informations fournies
et on a recours à la data science pour utiliser des outils de statistique et pour faire
des prévisions ou des futures estimations avec l’implémentation datamining.

3.3 Environnement technique du travail

Pour la réalisation et la mise en place de la solution, il a été nécessaire de recourir à un


certain.nombre.d’outils et.mettre en.place des.environnements.d’exécution................................
L’environnement.logiciel.sur.lequel repose.notre.projet.est le.suivant :.......................................

– StarUML : Pour la modélisation des diagrammes de cas d’utilisation.

– Microsoft SQL server : Pour le stockage de données.

– SQL Server Intégration Services (SSIS) : Pour la partie ETL.

– PowerBI : Pour la partie Reporting.

– Jupyter Notebook : Pour la partie Data Mining.

32
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

3.3.1 SQL Server Intégration Services (SSIS)

SSIS est un ETL (Extract Transform Load). Il permet de se connecter à n’importe quelle
source de données (Excel, fichier plat csv, XML, base de données, etc...). SSIS offre la possibilité
de collecter des données, de les transformer en données exploitables par les outils d’analyse
qui, elles-mêmes, vont alimenter une ou plusieurs bases de données dédiées (bases de données
relationnelles ou multidimensionnelles)[5]. Cet outil offre plusieurs avantages :

– Plusiеurs cоnnecteurs dispоniblеs (Oraclе, ERP, ...).

– Facilité de mise en œuvre.

– C’est un оutil très ergоnоmique.

– Créatiоn de nоuvеaux mоdulеs.

F IGURE 3.4: Logo SSIS

3.3.2 Microsoft SQL server

Est un système de gestion de base de données développé par la société Microsoft qui permet
aux utilisateurs la manipulation, le contrôle, le tri, la mise à jour, et l’exploitation des bases de
données. Parmi les fonctionnalités principales de SQL Server :

– Gestiоn de bases de dоnnées relatiоnnelles.

– Optimisatiоn de stоckage des bases de dоnnées vоlumineuses (tablеs еt indexеs


partitiоnnées, cоmpressiоn de dоnnées, . . . ).

– Gеstiоn de la hautе dispоnibilité.

– Gеstiоn de la sécurité.

– Gеstiоn de la réplicatiоn.

33
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

F IGURE 3.5: Logo Sql Server

Notre client FnacDarty utilise l’ERP Microsoft Dynamics NAV comme système
d’information opérationnel qui est liée à une base de données sous SQLSERVER, donc DELTA
SOFT nous a attribué une source de données de type backup.bac qui possède tous les détails
provenants de l’ERP. Au niveau de magasin de données ; nous avons utilisé SQL SERVER
comme SGBD car il est un système de gestion de base de données relationnelles et objet, il est
utilisé par DELTA SOFT.

3.3.3 Power Bi

Est une solution de Business Intelligence développée par Microsoft pour permettre aux
entreprises d’agréger, d’analyser et de visualiser les données en provenance de sources multiples.
Power Bi est un service analytique professionnel pour :

– Dispоser des bоnnes infoоmatiоns en temps réel pоur agir rapidement.

– Gagner du temps, dоnc de l’argent et se cоncentrer sur les tâches à valeur ajоutée.

– Traitement des dоnnées vоlumineuses.

– Rеnvоyer unе bonnе imagе.

– Sourcеs d’impоrtatiоn nоmbrеusеs.

– Licеnce standard gratuite et complète, licence pro à faible coût.

Power Bi s’adresse à :

– Toute personne travaillant de manière régulière avec Microsoft Excel et souhaitant


optimiser davantage ses travaux dans Power Bi.

– Gagner du temps, dоnc de l’argent et se cоncentrer sur les tâches à valeur ajоutée.

– Tоute persоnne ayant une cоmpétance pоur l’analyse de dоnnées.

34
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

– Tоute persоnne chargée d’établir des tableaux de bоrd, repоrting et présentatiоns


(contrôlеurs dе gеstion, chеfs de projеts, cоnsultants, . . . ).

F IGURE 3.6: Logo Power Bi

3.3.4 StarUML

StarUML est un outil de modélisation logiciel open source qui utilise le frameworkUML
(Unified Modeling Language) pour la modélisation des systèmes logiciels. Il fournit plusieurs
types des diagrammes, de plus il est simple d’utilisation et ne nécessite pas beaucoup de
ressources système d’où c’est un logiciel qui se comporte comme une excellent option pour
une familiarisation à la modélisation.

F IGURE 3.7: Logo StarUML

3.3.5 Jupyter Notebook

Jupyter Notebook est un outil open source Créé à partir de Python en 2014, permettant
d’écrire du code ,des équations, des visualisations ou du texte et de le partager pour collaborer.
Grâce à ses nombreux avantages, ce bloc-note de calcul est devenu une référence incontournable
pour les Data Scientists.[6]

35
CHAPITRE 3. ARCHITECTURE ET ENVIRONNEMENT TECHNIQUE

F IGURE 3.8: Logo Jupyter Notebook

3.4 Conclusion

Dans ce chapitre, nous avons détaillé l’architecture technique du notre projet en expliquant
ses différentes phases. Par la suite, nous avons défini l’environnement du travail et les
technologies adoptées pour la réalisation de notre projet.

36
Chapitre

4
Intégration et préparation des données

Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2 Modélisation dimensionnelle . . . . . . . . . . . . . . . . . . . . 38
4.2.1 Entrepôt de données . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2.2 Identification des dimensions . . . . . . . . . . . . . . . . . . . 41
4.2.3 Identification des tables de faits . . . . . . . . . . . . . . . . . 45
4.3 La conception physique du modèle dimensionnel . . . . . . . 50
4.4 Développement de la zone de préparation des données . . . 51
4.4.1 Les connexions aux bases de données sources et destinations . . 52
4.4.2 Alimentation de l’Ods (Operational Data Store) . . . . . . . . . 52
4.5 Alimentation de la Data Warehouse . . . . . . . . . . . . . . . 54
4.5.1 Alimentation des dimensions . . . . . . . . . . . . . . . . . . . 55
4.5.2 Alimentation des tables de faits . . . . . . . . . . . . . . . . . . 60
4.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

37
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

4.1 Introduction

Dans ce chapitre, nous abordons la partie intégration et préparation des données. Durant
cette partie, nous allons réaliser la branche du milieu du cycle de vie dimensionnel qui contient
la modélisation dimensionnelle, la conception du modèle physique et le développement des
éléments de la zone de préparation des données. Dans la figure ci-dessous, nous présentons
la phase de préparation des données de notre solution suivant le cycle de vie dimensionnel de
Ralph Kimball :

F IGURE 4.1: Phase de modélisation selon « Ralph Kimball »

4.2 Modélisation dimensionnelle

Nous arrivons à l’une des parties la plus importante dans ce projet, nous donnerons la
possibilité de comprendre nos besoins en tenant compte de ce que nous possédons comme
ressources (données). Bien évidemment, comme chaque entreprise, FnacDarty possède son
propre système d’information qui est l’Erp Microsft Dynamic Nav. Ce dernier contient des
bases de données volumineuses. Nous nous intéressons au module de vente, achat et stock et
nous allons manipuler seulement les tables qui comptent dans notre solution.

38
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

4.2.1 Entrepôt de données

Un entrepôt de données, ou datawarehouse, est l’élément central de l’informatique...............


décisionnelle et qui présente une vision centralisée sur toutes les informations de l’entreprise.
C’est une structure qui regroupe et intègre des données pour établir des analyses et pour aider à
la décision.stratégique,.elle consiste.à.améliorer les.performances.de.l’entreprise.......................

• Concept de fait :

Une table de faits est la table centrale d’un modèle dimensionnel, où les mesures de
performances sont stockées. Une ligne d’une table de faits correspond à une mesure.
Ces mesures sont généralement des valeurs numériques, additives, cependant des mesures
textuelles peuvent exister mais sont rares.

• Concept de dimension :

Les tables de dimension sont les tables qui raccompagnent une table de faits, elles
contiennent les descriptions textuelles de l’activité. Une table de dimension est constituée
de nombreuses colonnes qui décrivent une ligne. C’est grâce à cette table que l’entrepôt
de données est compréhensible et utilisable ; elles permettent des analyses en tranches
et en dés.

• Différents modèles de la modélisation dimensionnelle :

Les tables de dimension sont les tables qui raccompagnent une table de faits, elles
contiennent les descriptions textuelles de l’activité. Une table de dimension est constituée
de nombreuses colonnes qui décrivent une ligne. C’est grâce à cette table que l’entrepôt
de données est compréhensible et utilisable, elles permettent des analyses en tranches
et en dés.

– Modèle en étoile : Ce modèle se présente comme une étoile dont le centre n’est
autre que la table des faits et les branches sont les tables de dimension. La force
de ce type de modélisation est sa lisibilité et sa performance.La figure ci-dessous
montre le modèle en étoile :

39
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.2: Modèle en étoile

– Modèle en flocon : Identique au modèle en étoile, sauf que ses branches sont éclatées
en hiérarchies. Cette modélisation est généralement justifiée par l’économie d’espace
de stockage, cependant elle peut s’avérer moins compréhensible pour l’utilisateur
final, et très couteuse en terme de performances. La figure ci-dessous montre le
modèle en flocon :

F IGURE 4.3: Modèle en flocon

40
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

– Modèle en constellation : Ce n’est rien d’autre que plusieurs modèles en étoile liés
entre eux par des dimensions communes. La figure ci-dessous montre le modèle en
constellation :

F IGURE 4.4: Modèle en constellation

4.2.2 Identification des dimensions

Chaque table de dimension contient les attributs de la dimension en question plus une clé
primaire (c’est une clé d’entreprise) indépendante de ces attributs. Les axes d’analyse que nous
allons insérer dans notre modèle sont :

• DIM_Article.

• DIM_Fournisseur.

• DIM_Magasin.

• DIM_Entreprsie.

• DIM_Date.

DIM_Article :
Cette dimension contient les informations nécessaires liées à l’article :

41
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.5: Structure de la table Dim_Article

Nb : La dimension Article contient la hiérarchie suivante : Division -> Catégorie Article ->
Catégorie Produit -> Nom Article.

Nom de la table Attributs Désignation

Num_Article Le numéro et la clé primaire de l’article.


idFournisseur_FK La clé étranger de la dimension fournisseur.
Le type 1 désigne Fnac et le type de désigne
Type
Darty.
Nom_Article Le nom de l’article.
DIM_Article Code_CatégoriePorduit Le code de catégorie produit.
CatégorieProduit Le catégorie produit de l’article.
Code_CatégorieArticle Le code de catégorie article.
CatégorieArticle Le catégorie de l’article.
Code_division Le code de division article.
Division La division de l’article.
Statut_Article Le statut de l’article dans l’erp bloqué ou non.

TABLE 4.1: Etude des données de la table DIM_Article

42
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

DIM_Fournisseur :
Cette dimension contient des informations relatives au fournisseur :

F IGURE 4.6: Structure de la table Dim_Fournisseur

Nom de la table Attributs Désignation

idFournisseur La clé primère de fournisseur.


NumFournisseur Le numéro de fournisseur.
type Le type 1 désigne Fnac et le type 2 désigne Darty.
Nom Le nom de fournisseur.
Dim_Fournisseur Adresse L’adresse de fournisseur.
Ville La vie de fournisseur.
NumTelephone Le numéro de téléphone de fournisseur.
Email L’email de fournisseur.
Activité L’activité de fournisseur.

TABLE 4.2: Etude des données de la table DIM_Fournisseur

DIM_Magasin :
Cette dimension contient des informations relatives au magasin :

43
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.7: Structure de la table Dim_Magasin

Nom de la table Attributs Désignation

idMagasin La clé primaire de magasin.


CodeMagasin Le code de magasin.
type Le type 1 désigne Fnac et le type 2 désigne Darty.
Dim_Magasin nomMagasin Le nom de magasin.
Ville La ville de magasin.
adresseMagasin L’adresse de magasin.
CodePostal Le code postal de magasin.

TABLE 4.3: Etude des données de la table DIM_Magasin

DIM_Entreprise :
Cette dimension contient des informations relatives au entreprise :

F IGURE 4.8: Structure de la table Dim_Entreprise

44
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

Nom de la table Attributs Désignation

idEntreprise La clé primaire de l’entreprise.


Dim_Entreprise
NomEntreprise Désigne le nom de l’entreprise Fnac ou bien Darty.

TABLE 4.4: Etude des données de la table DIM_Entreprise

DIM_Date :
Cette dimension contient des informations relatives à la date :

F IGURE 4.9: Structure de la table Dim_Date

Nom de la table Attributs Désignation

idDate La clé primaire de la date.


Dim_Date
DateComplet Désigne la date complet ( jour, mois et année).

TABLE 4.5: Etude des données de la table DIM_Date

4.2.3 Identification des tables de faits

La table de fait contient l’ensemble des mesures relatives aux informations de l’activité à
analyser ainsi que toutes les clés primaires des dimensions correspondantes. Notre entrepôt de
données est composé de 4 tables de faits. Leurs structures de base dans notre cas se présentent
comme suit :

Table FaitCaisse :
Cette table correspond à l’enregistrement d’entrées et de sorties d’argent en espèces.

45
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.10: Structure de la table FaitCaisse

46
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

Nom de la table Attributs Désignation

NumTranscation Le numéro de la transcation.


NumArticle La clé étranger de la table Dim_Article.
idDate La clé étranger de la table Dim_Date.
idMagasin La clé étranger de la table Dim_Magasin.
idEntreprise La clé étranger de la table Dim_Entreprise.
PrixTTC Désigne le prix ttc correspond à la transaction.
Désigne le prix hors taxe correspond à la
PrixHorsTaxe
FaitCaisse transaction.
Quantité Désigne la quantité de la transaction.
CoutTotal Désigne le coût total.
RemiseCout Désigne la remise de coût.
CoutHorsTaxe Désigne le coût hors taxe.
CoutTva Désigne le coût avec tva.
Désigne le statut de la transaction correspond
StatutTransaction
à l’état de la transaction clôturé ou pas.
Désigne le type de vente marchandise ou
PublicationGroup
service.
RetourNumeroVente Désigne si il y a un retour par le client ou pas.

TABLE 4.6: Etude des données de la table FaitCaisse

Table FaitEcritureValeur :
Cette Table contient toutes les opérations réalisées par l’entreprise qui sont enregistrés dans un
document nommé journal.

47
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.11: Structure de la table FaitEcritureValeur

48
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

Nom de la table Attributs Désignation

NumArticle La clé étranger de la table Dim_Article.


idDate La clé étranger de la table Dim_Date.
idMagasin La clé étranger de la table Dim_Magasin.
idEntreprise La clé étranger de la table Dim_Entreprise.
Ce champ contient le type de la transaction
FaitEcritureValeur de l’écriture comptable qui a provoqué cette
TypeEntréRegistre
écriture de valeur (achat, vente,
consommation...).
Ce champ contient le prix de l’article pour
Prix_vente_reel
une entrée de vente.
QuantitéRéel Désigne la quantité réel de la transaction.
CoutUnitaire Désigne le coût pour une unité.
Désigne le coût réel de l’article pour une
Cout_reel
entrée d’achat.
Désigne le coût affiché lorsque le système
Cout_attendu
ne connait pas encore le prix d’achat réel.
Remise Désigne la remise relative de l’article.

TABLE 4.7: Etude des données de la table FaitEcritureValeur

Table FaitStock :
Cette table contient les informations nécessaires à chaque modification de la quantité de stock.

49
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.12: Structure de la table FaitStock

Nom de la table Attributs Désignation

NumArticle La clé étranger de la table Dim_Article.


idDate La clé étranger de la table Dim_Date
FaitStock idMagasin La clé étranger de la table Dim_Magasin.
idEntreprise La clé étranger de la table Dim_Entreprise.
Quantité Cet attribut désigne la quantité de stock disponible.

TABLE 4.8: Etude des données de la table FaitStock

4.3 La conception physique du modèle dimensionnel

Après avoir dégager les dimensions, les clés étrangères et les mesures de notre solution,
nous avons pu déduire un modèle de donnée performant en terme de calcul pour notre solution
afin de produire des rapports cohérents et précis. La Figure (4.13) présentera le modèle physique
de données pour notre datawarehouse.

50
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.13: Modèle du DataWarehouse (Schéma en constellation)

4.4 Développement de la zone de préparation des données

Après la présentation de notre architecture proposée pour la création du datamart en définissant


les données d’entrée et de données de sortie, nous allons détailler les étapes de création de notre
outil SSIS dans ce qui suit.Cet outil garanti la création :

– Des packages d’extractiоn, de transfоrmatiоn еt dе chargеmеnt (ETL).

– Optimisation de stockage des bases de données volumineuses (tables et indexes partitionnées,


compression.de.données, . . . )...........................................................................................................

– Des transfоrmatiоns.des dоnnées (nettоyer, d’agréger, de fusiоnner et de cоpier)...................

51
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

– De débоguer dеs packagеs.

– Chargеr еt еxtrairе dеs dоnnées depuis des sоurces de dоnnées et des dеstinatiоns.

4.4.1 Les connexions aux bases de données sources et destinations

Pour créer notre ETL (Extract, Transform, Load) à partir de la base de données sous SQL
Server, nous établissons les connexions nécessaires avec les bases sources et destinations (OLE
DB source et OLE DB destination). La figure (4.14) présentera l’interface de gestion de
connexions qui contient des différentes bases de données du serveur localhost.

F IGURE 4.14: Interface de gestion de connexions SSIS

4.4.2 Alimentation de l’Ods (Operational Data Store)

Après la modélisation et la conception du modèle physique, nous allons entamer la partie


alimentation de la base de données temporaire (ODS). Cette phase servira à extraire les données
à partir la source (DB_FnacDarty) vers une base de données destination (ODS_FnacDartyFinal).
Dans la mise à jour du package ODS, la requête « Truncate » permet de nettoyer toutes les
tables, ensuite les faires charger dans la base (ODS_FnacDartyFinal) comme l’indique la table
Ods_Location par exemple :

52
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.15: SQL TRUNCATE (Ods_Location)

Nous présentons donc l’alimentation de notre ODS_FnacDartyFinal comme l’indique la


figure (4.16).

F IGURE 4.16: Alimentation des tables de l’ODS

53
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

Exemple : Cas de l’alimentation de la table « ODS_Magasin» :


La figure (4.17) présente l’alimentation de la table « ODS_ Magasin » qui consiste à :

– Extraire les données de source Fnac et source Darty de la base (DB_FnacDarty) à travers
le composant ‘OLE DB Source’.

– Ajouter une colonne ‘Entreprise’ à la source Fnac et à la source Darty qui contient le nom
de l’entreprise pour différencier les deux sources avec le composant ‘Colonne dérivé’.

– Fusionner les deux sources dans un seule table à travers le composant ‘Unir Tout’.

– Charger la table « ODS_ Magasin » vers la base de données destination


(ODS_FnacDartyFinal ) avec le composant ‘OLE DB Destination’.

F IGURE 4.17: Alimentation de la table " ODS_ Magasin "

4.5 Alimentation de la Data Warehouse

Suite à l’alimentation de la partie ODS, nous avons présenté dans cette étape l’alimentation
de notre Data Warehouse qui contient les dimensions et les tables de faits.

54
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

4.5.1 Alimentation des dimensions

La figure (4.18) illustre le chargement de données des dimensions :

F IGURE 4.18: Chargement des dimensions

Exemple : Cas de l’alimentation de la table « Dim_Article » :


Pour implémenter la dimension « Dim_Article », nous avons utilisé les outils SSIS suivants :

– Source OLE DB : Pour extraire les données de la source inclus dans la base de données
« ODS_FnacDartyFinal » , puis dans ce composant nous allons faire les
transformations nécessaires de (nettoyage ,agrégation, jointure ...) comme l’indique
le schéma ci-dessous :

55
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.19: Récupération de données pour Dim_Article

– Colonne dérivé : Pour faire des transformations nécessaires sur les colonnes récupérés
selon notre besoins comme l’indique le schéma ci-dessous :

56
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.20: Transformation des colonnes pour Dim_Article

– Recherche (lookup) : Effectue des recherches en joignant des données dans des colonnes
d’entrée à des colonnes d’un ensemble de données de référence, donc on a utilisé ce
composant pour faire la correspondance et assurer l’existance de la clé étrangère de la
(dim_Fourinsseur) comme l’indique le schéma ci-dessous :

57
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.21: Récupération de clé-étranger (idFournisseur_FK)

– Dimension à variation lente (Slowly changin dimension) : Ce composant est utilisé pour
insérer ou mettre à jour des enregistrements de données dans la table de dimension
Dim_article. Il compare les données source entrantes aux données de table de dimension
de destination existantes à l’aide d’une clé commerciale qui est le numéro d’article dans
notre cas. Si aucun enregistrement ne correspond, il sera traité comme une nouvelle ligne
dans notre table de dimension ou si l’enregistrement des correspondances, il compare
les attributs des attributs modifiés si les données semblent actualisées, puis met à jour
l’enregistrement ou dans le cas contraire, il reste tel quel dans notre table dim_Article.

58
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.22: Configuration du composant Dimension à variation lente

Donc La figure (4.23) présentera l’interface de l’implémentation de la Dim_Article :

59
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.23: Alimentation de la table Dim_Article

4.5.2 Alimentation des tables de faits

Pour implémenter les tables de faits « FaitCaisse », « FaitEcritureValeur » et « FaitCaisse »


nous avons utilisé les outils SSIS suivants :

– Source OLE DB : Pour extraire les données de la table source inclus dans la base de
données « ODS_FnacDartyFinal ».

– Recherche (Lookup) : Ce composant permet de faire la correspondance entre la source


et les tables de dimensions et pour faire la référence à travers la récupération des clés de
chaque dimension.

– Destination OLE DB : pour faire le chargement des données dans la table de fait de la
base de Data Warehouse (DW_FnacDartyFinal).

La figure (4.24) présentera l’interface de l’implémentation de la table de faits FaitCaisse :

60
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.24: Alimentation de la table de fait " FaitCaisse "

La figure (4.25) présentera l’interface de l’implémentation de la table de faits


FaitEcritureValeur :

61
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.25: Alimentation de la table de fait " FaitEcritureValeur "

La figure (4.26) présentera l’interface de l’implémentation de la table de faits FaiStock :

62
CHAPITRE 4. INTÉGRATION ET PRÉPARATION DES DONNÉES

F IGURE 4.26: Alimentation de la table de fait " FaitStock "

4.6 Conclusion

Durant ce chapitre, nous avons expliqué les étapes de modélisation dimensionnelle de notre
projet. Nous avons surtout mis l’accent sur les dimensions et les tables de fait qui constituent
notre modèle de données. Dans le chapitre suivant, nous allons attaquer la phase de restitution
des données.

63
Chapitre

5
Restitution des données

Sommaire
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.2 Développement de l’application utilisateur . . . . . . . . . . . 65
5.2.1 Interface d’accueil . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2.2 Suivi de vente pour les marchandises . . . . . . . . . . . . . . 66
5.2.3 Suivi de vente pour les services . . . . . . . . . . . . . . . . . . 70
5.2.4 Gestion de stock . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2.5 Gestion d’achat . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

64
CHAPITRE 5. RESTITUTION DES DONNÉES

5.1 Introduction

Après la partie intégration et préparation des données, nous passons à la phase de restitution
des données qui consiste à créer et à déployer les tableaux de bord de notre système décisionnel
pour notre Client FnacDarty . Dans la figure ci-dessous, nous présentons la phase de restitution
des données de notre solution suivant le cycle de vie dimensionnel de Ralph Kimball :

F IGURE 5.1: Phase de restitution selon « Ralph Kimball »

5.2 Développement de l’application utilisateur

Cette partie se compose essentiellement des tableaux de bords réalisés et qui vont permettre
à notre client FnacDarty de suivre ces activités. Les tableaux de bords réalisés sont très clairs
et faciles à manipuler sous plusieurs formes de composants visuels comme les indicateurs, les
tableaux, des graphiques où ces tableaux de bords contiennent une partie qui définissent les
différents filtres et les axes d’analyses.

65
CHAPITRE 5. RESTITUTION DES DONNÉES

5.2.1 Interface d’accueil

La figure ci dessous présentera l’interface d’accueil de notre application décisionnelle :

F IGURE 5.2: Interface d’accueil

5.2.2 Suivi de vente pour les marchandises

• Suivi de vente FnacDarty pour les marchandises :

Le tableau de bord suivant se focalise sur le suivi de vente de marchandise pour les
deux entreprises Fnac et Darty ensemble. Ce tableau de bord contient les visualisations
suivantes :

– Un tableau qui contient le chiffre d’affaire marchandise N, le chiffre d’affaires


marchandise N -1, la transaction N, la transaction N -1 et le panier moyen N pour
tous les magasins Fnac et Darty.

– Un graphique à barres empilées qui affiche le chiffre d’affaires des articles les plus
vendus.

– Un graphique indicateur de performance clé qui donne une comparaison de chiffre


d’affaires de l’année actuelle et l’année précédente.

66
CHAPITRE 5. RESTITUTION DES DONNÉES

– Un graphique à barre groupées qui contient l’évolution de chiffre d’affaires de


l’année actuelle et l’année précédente par mois.

– Une carte qui contient la marge de vente de l’année actuelle.

– Une carte qui contient la marge de vente de l’année précédente.

– Une carte qui contient le nombre de transaction pour la vente.

– Une carte qui contient la quantitée vendue.

– Une carte qui contient l’écart entre le chiffre d’affaire de l’année actuelle et le chiffre
d’affaires de l’année précédente.

– Une carte qui contient le panier moyen de vente.

Ce tableau de bord est interactif et subit plusieurs filtres :année, trimestre, jour, mois
et top N article.

F IGURE 5.3: Tableau de bord vente marchandise FnacDarty

• Suivi de vente Fnac pour les marchandises :

Le tableau de bord suivant permet de suivre les ventes pour les marchandises de
l’entreprise Fnac. Ce tableau de bord contient ces visualisations :

– Un tableau qui contient le chiffre d’affaire marchandise N, le chiffre d’affaires


marchandise N -1 , la transaction N, la transaction N -1 , le panier moyen N et le

67
CHAPITRE 5. RESTITUTION DES DONNÉES

panier moyen N -1 pour les catégories articles et les catégories produits de l’entreprise
Fnac.

– Un graphique indicateur de performance clé qui donne une comparaison de chiffre


d’affaires de l’année actuelle et l’année précédente de l’entreprise Fnac.

– Un graphique à barre groupées qui contient l’évolution de chiffre d’affaire de l’année


actuelle et l’année précédente de l’entreprise Fnac par mois.

– Une carte à plusieurs lignes qui possède les promotions de vente pour chaque division
d’article de l’entreprise Fnac.

– Une carte qui contient la marge de vente de l’année actuelle de l’entreprise Fnac.

– Une carte qui contient la marge de vente de l’année précédente de l’entreprise Fnac.

– Une carte qui contient la progression de chiffre d’affaires par rapport à l’année
précédente de l’entreprise Fnac.

– Une carte qui contient l’écart entre le chiffre d’affaires de l’année actuelle et le
chiffre d’affaires de l’année précédente de l’entreprise Fnac.

– Une carte qui contient l’écart entre la transaction de l’année actuelle et la transaction
de l’année précédente de l’entreprise Fnac.

– Une carte qui contient l’écart entre la marge de l’année actuelle et la marge de
l’année précédente de l’entreprise Fnac.

Ce tableau de bord est interactif et subit plusieurs filtres : année, trimestre, jour, mois
et semaine.

68
CHAPITRE 5. RESTITUTION DES DONNÉES

F IGURE 5.4: Tableau de bord vente marchandise Fnac

• Suivi de vente Darty pour les marchandises :

Le tableau de bord suivant permet de suivre les ventes pour les marchandises de
l’entreprise Darty. Ce tableau de bord contient les mêmes visualisations que
l’entreprise Fnac :

F IGURE 5.5: Tableau de bord vente marchandise Darty

69
CHAPITRE 5. RESTITUTION DES DONNÉES

5.2.3 Suivi de vente pour les services

• Suivi de vente FnacDarty pour les services :

Le tableau de bord suivant se focalise sur le suivi de vente de service pour les deux
entreprise Fnac et Darty ensemble. Ce tableau de bord contient les visualisations suivantes :

– Un tableau qui contient le chiffre d’affaires et le nom d’article.

– Un histogramme empilé qui contient le chiffres d’affaire par mois.

– Un graphique indicateur de performance clé qui donne une comparaison de chiffre


d’affaires de l’année actuelle et l’année précédente.

– Un graphique en secteurs qui contient le chiffre d’affaire par division.

– Un graphique à barre groupées qui contient l’évolution de chiffre d’affaires de


l’année actuelle et l’année précédente par mois.

– Une carte qui contient le chiffre d’affaires total.

– Une carte qui contient la marge de vente de l’année actuelle.

– Une carte qui contient la marge de vente de l’année précédente.

– Une carte qui contient le panier moyen de vente.

– Une carte qui contient l’écart entre le chiffre d’affaire de l’année actuelle et le chiffre
d’affaires de l’année précédente.

Ce tableau de bord est interactif et subit plusieurs filtres : année, trimestre, jour, mois,
semaine et magasin .

70
CHAPITRE 5. RESTITUTION DES DONNÉES

F IGURE 5.6: Tableau de bord vente service FnacDarty

• Suivi de vente Fnac pour les services :

Le tableau de bord suivant permet de suivre les ventes pour les services de l’entreprise
Fnac. Ce tableau de bord contient ces visualisations :

– Un tableau qui contient le chiffre d’affaires et le nom d’article de l’entreprise Fnac.

– Un histogramme empilé qui contient le chiffre d’affaires par mois de l’entreprise


Fnac.

– Un graphique indicateur de performance clé qui donne une comparaison de chiffre


d’affaires de l’année actuelle et l’année précédente de l’entreprise Fnac.

– Un graphique en secteurs qui contient le chiffre d’affaires de l’entreprise Fnac par


division.

– Un graphique à barre groupées qui contient l’évolution de chiffre d’affaires de


l’année actuelle et l’année précédente de l’entreprise Fnac par mois.

– Une carte qui contient le chiffre d’affaires total de l’entreprise Fnac.

– Une carte qui contient la marge de vente de l’année actuelle de l’entreprise Fnac.

– Une carte qui contient la marge de vente de l’année précédente de l’entreprise Fnac.

71
CHAPITRE 5. RESTITUTION DES DONNÉES

– Une carte qui contient le panier moyen de vente de l’entreprise Fnac.

– Une carte qui contient l’écart entre le chiffre d’affaires de l’année actuelle et le
chiffre d’affaires de l’année précédente de l’entreprise Fnac.

Ce tableau de bord est interactif et subit plusieurs filtres : année, trimestre, jour, mois,
semaine et magasin.

F IGURE 5.7: Tableau de bord vente service Fnac

• Suivi de vente Darty pour les services :

Le tableau de bord suivant permet de suivre les ventes pour les services de l’entreprise
Darty. Ce tableau de bord contient les mêmes visualisations que l’entreprise Fnac :

72
CHAPITRE 5. RESTITUTION DES DONNÉES

F IGURE 5.8: Tableau de bord vente service Darty

5.2.4 Gestion de stock

• Gestion de stock pour FnacDarty :

Le tableau de bord suivant se focalise sur la gestion de stock pour les deux entreprise
Fnac et Darty ensemble Ce tableau de bord contient les visualisations suivantes :

– Un tableau qui contient la quantité de stock total, le montant de stock, la quantité de


stock sortie et la quantité de stock restante pour les divisions d’articles.

– Un graphique à barres empilées qui contient l’évolution pour le montant de stock


par magasin.

– Un graphique à barres empilées qui contient l’évolution de quantité de stock par


magasin.

– Une carte qui contient la quantité de stock de l’année actuelle.

– Une carte qui contient la quantité de stock de l’année précédente.

– Une carte qui contient le montant de stock de l’année actuelle.

– Une carte qui contient le montant de stock de l’année actuelle précédente.

73
CHAPITRE 5. RESTITUTION DES DONNÉES

– Une carte qui contient le taux de rotation.

Ce tableau de bord est interactif et subit plusieurs filtres : année, trimestre, jour, mois,
semaine et fournisseur.

F IGURE 5.9: Tableau de bord gestion de stock FnacDarty

• Gestion de stock pour Fnac :

Le tableau de bord suivant permet de suivre la gestion de stock l’entreprise Fnac.


Ce tableau de bord contient ces visualisations :

– Un tableau qui contient la quantité de stock N, la quantité de stock N -1, le montant


de stock N, le montant de stock N -1 pour les numéros d’articles et les noms d’article
Fnac.

– Une arborescence de décomposition pour voir la répartition de stock selon les


divisions, les catégories articles et les catégories produits Fnac.

– Un graphique à barre empilées qui contient l’évolution de la quantité de stock par


mois pour l’entreprise Fnac.

– Une carte qui contient la quantité de stock de l’année actuelle pour l’entreprise Fnac.

– Une carte qui contient la quantité de stock de l’année précédente pour l’entreprise
Fnac.

74
CHAPITRE 5. RESTITUTION DES DONNÉES

– Une carte qui contient le montant de stock de l’année actuelle pour l’entreprise Fnac.

– Une carte qui contient le montant de stock de l’année précédente pour l’entreprise
Fnac.

– Une carte qui contient le pourcentage pour la progression de quantité de stock.

Ce tableau de bord est interactif et subit plusieurs filtres : année, trimestre, jour, mois
et semaine.

F IGURE 5.10: Tableau de bord gestion de stock Fnac

• Gestion de stock pour Darty :

Le tableau de bord suivant permet de suivre la gestion de stock l’entreprise Darty.


Ce tableau de bord contient les mêmes visualisations que l’entreprise Fnac :

75
CHAPITRE 5. RESTITUTION DES DONNÉES

F IGURE 5.11: Tableau de bord gestion de stock Darty

5.2.5 Gestion d’achat

• Gestion d’achat pour FnacDarty :

Le tableau de bord suivant se focalise sur la gestion d’achat pour les deux entreprise Fnac
et Darty ensemble. Ce tableau de bord contient les visualisations suivantes :

– Un histogramme groupé qui contient l’évolution de quantité d’achat de l’année


actuelle et l’année précédente par magasin.

– Un graphique à barres groupées qui contient l’évolution de montant d’achat de


l’année actuelle et l’année précédente par division.

– Un histogramme groupé qui contient l’évolution de montant d’achat de l’année


actuelle et l’année précédente par magasin.

– Une carte qui contient la quantité d’achat de l’année actuelle.

– Une carte qui contient la quantité d’achat de l’année précédente.

– Une carte qui contient le montant d’achat de l’année actuelle.

– Une carte qui contient le montant d’achat de l’année précédente.

76
CHAPITRE 5. RESTITUTION DES DONNÉES

– Une carte qui contient l’écart entre la quantité d’achat de l’année actuelle et la
quantité d’achat de l’année précédente.

– Une carte qui contient l’écart entre le montant d’achat de l’année actuelle et la
quantité d’achat de l’année précédente.

Ce tableau de bord est interactif et subit plusieurs filtres : année, trimestre, jour, mois,
semaine et fournisseur.

F IGURE 5.12: Tableau de bord gestion d’achat FnacDarty

• Gestion d’achat pour Fnac :

Le tableau de bord suivant permet de suivre la gestion d’achat l’entreprise Fnac.


Ce tableau de bord contient ces visualisations :

– Un tableau qui contient la quantité d’achat N, la quantité d’achat N -1, le montant


d’achat N et le montant d’achat N -1 pour les catégories articles et les catégories
produits de l’entreprise Fnac.

– Un graphique indicateur de performance clé qui donne une comparaison de montant


d’achat de l’année actuelle et l’année précédente de l’entreprise Fnac.

– Un graphique à barres groupées qui contient l’évolution de montant d’achat de


l’année actuelle et l’année précédente par mois pour l’entreprise Fnac.

77
CHAPITRE 5. RESTITUTION DES DONNÉES

– Un entonnoir qui dévoile le montant d’achat par division de l’entreprise Fnac.

– Une carte qui contient la quantité d’achat de l’année actuelle l’entreprise Fnac.

– Une carte qui contient la quantité d’achat de l’année précédente l’entreprise Fnac.

– Une carte qui contient le montant d’achat de l’année actuelle l’entreprise Fnac.

– Une carte qui contient le montant d’achat de l’année précédente l’entreprise Fnac.

– Une carte qui contient l’écart entre la quantité d’achat de l’année actuelle et la
quantité d’achat de l’année précédente l’entreprise Fnac.

– Une carte qui contient l’écart entre le montant d’achat de l’année actuelle et la
quantité d’achat de l’année précédente l’entreprise Fnac.

Ce tableau de bord est interactif et subit plusieurs filtres : année, trimestre, jour, mois
et semaine.

F IGURE 5.13: Tableau de bord gestion d’achat Fnac

• Gestion d’achat pour Darty :

Le tableau de bord suivant permet de suivre la gestion d’achat l’entreprise Darty.


Ce tableau de bord contient les mêmes visualisations que l’entreprise Fnac :

78
CHAPITRE 5. RESTITUTION DES DONNÉES

F IGURE 5.14: Tableau de bord gestion d’achat Darty

5.3 Conclusion

Dans ce chapitre, nous avons résumé les différentes étapes de mise en œuvre de notre projet
en présentant les tableaux de bord qu’on a mis en place.

79
Chapitre

6
Analyse prédictive

Sommaire
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2 Etude prédictive au niveau de ventes par jour . . . . . . . . . 81
6.2.1 La fonction ‘train_test_split’ . . . . . . . . . . . . . . . . . . 83
6.2.2 Le forêt aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.2.3 La régression logistique . . . . . . . . . . . . . . . . . . . . . . 86
6.2.4 L’arbre de décision . . . . . . . . . . . . . . . . . . . . . . . . 89
6.2.5 Interprétation et choix de modèle . . . . . . . . . . . . . . . . . 91
6.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

80
CHAPITRE 6. ANALYSE PRÉDICTIVE

6.1 Introduction

Après la partie restitution des données, nous allons implémenter une couche prédictive dans
notre projet décisionnel qui concerne les ventes par jour qui joue un rôle essentiel dans le
développement d’une entreprise.

6.2 Etude prédictive au niveau de ventes par jour

Notre objectif est de prédire la somme des ventes par jour dans notre entreprise, pour ce faire
nous allons utiliser trois algorithmes de régression qui sont : la régression logistique, le forêt
aléatoire et l’arbre de décision. Par la suite, nous choisissons le meilleur modèle entre eux en
se basant sur des indicateurs de performance bien définis. Nous commençons par la préparation
d’un fichier CSV contenant deux colonnes, une colonne possède la date complète et une autre
colonne possède notre variable cible qui est la somme des ventes pour cette date.
Pour que nous pourrons implémenter les différents algorithmes, nous allons tout d’abord
appliquer la commande «pd.read_excel)» pour pouvoir lire et charger notre fichier. Dans la
figure ci-dessous nous illustrons le fichier PredictionVente.csv.

F IGURE 6.1: Fichier PredictionVente.csv

81
CHAPITRE 6. ANALYSE PRÉDICTIVE

– La deuxième étape consiste à changer le type de la colonne Date qui est de type ‘Object’
en type ‘date’ puis le divise en jour, mois et année pour appliquer nos algorithmes à des
valeurs numériques comme l’indique la figure ci-dessous :

F IGURE 6.2: Fichier PredictionVente.csv après la transformation

– La troisième étape consiste à mettre notre colonne cible ‘sommeVente’ dans une autre
variable et le supprimer de la source principale pour faire nos analyses de prédiction
comme l’indique la figure ci-dessous :

F IGURE 6.3: Jeux de données de SommeVente

82
CHAPITRE 6. ANALYSE PRÉDICTIVE

6.2.1 La fonction ‘train_test_split’

Après cette transformation nous allons implémenter une fonction qui s’appelle
‘train_test_split’ permettant de diviser les tableaux de données en deux sous-ensembles : Pour
les données d’entraînement et pour les données de test.
La variable ‘data’ contient toutes les colonnes de l’ensemble de données, à l’exception de la
colonne « SommeVente ». La variable ‘dataframeTarget’ contient les valeurs de la colonne
« SommeVente ».

• X_train : Cela inclut toutes les variables indépendantes (jour,mois,année), celles-ci


seront utilisées pour entraîner le modèle, et dans notre cas nous avons spécifié le test_size
= 0,2 cela signifie que 80 % des observations de données complètes seront utilisées pour
entraîner/ajuster le modèle et se reposer 20 % sera utilisé pour tester le modèle.

• X_test : Il s’agit de la partie restante de 20% des variables indépendantes des données
qui ne seront pas utilisées dans la phase d’apprentissage et seront utilisées pour faire des
prédictions afin de tester la précision du modèle.

• Y_train : Il s’agit de la variable dépendant (SommeVente) qui doit être prédite par le
modèle.

• Y_test : Ces données ont des étiquettes de catégorie pour les données de test, ces
étiquettes seront utilisées pour tester la précision entre les catégories réelles et prévues.

La figure ci-dessous illustre l’implémentation de cette fonction :

F IGURE 6.4: implémentation de la fonction train_test_split

Maintenant nous passons à implémenter nos algorithmes.

83
CHAPITRE 6. ANALYSE PRÉDICTIVE

6.2.2 Le forêt aléatoire

C’est une technique de machine learning facile à interpréter, stable, intuitif à comprendre,
rapide à entraîner, présente en général de bonnes précisions et qui peut être utilisée pour des
tâches de régression ou de classification.[7]
Nous illustrions ci-dessous les différentes instructions utilisées pour implémenter l’algorithme
forêt aléatoire :

F IGURE 6.5: Implémentation de l’algorithme forêt aléatoire

D’après la figure :

– Nous allons implémenter la fonction RandomForestRegressor() pour appliquer notre


algorithme puis nous allons utiliser la fonction fit() qui prend les données d’apprentissage
comme arguments pour entrainer notre modèle (Bloc B1, Figure 6.5).

– Nous allons prédire la somme des ventes et nous devons tester notre modèle sur la partie
de données destinée au test avec la commande predict() (Bloc B2, Figure 6.5).

– Nous vérifions la différence entre les valeurs réelles et les valeurs de prédictions (Bloc
B3, Figure 6.5).

84
CHAPITRE 6. ANALYSE PRÉDICTIVE

Après l’implémentation de l’algorithme nous devons tester la moyenne des erreurs ainsi que la
précision du modèle comme l’indique la figure ci-dessous :

F IGURE 6.6: La moyenne des erreurs et la précision de forêt aléatoire

– La moyenne des erreurs (Mean Absolute Error) Indique la différence moyenne entre
la valeur réelle des données et la valeur prédite par le modèle qui est dans notre cas
18587.66, cela signifie que notre algorithme a fait une prédiction, mais il a besoin de
beaucoup d’améliorations.

– La précision (Accuracy) : est une mesure pour évaluer notre modèle et donne la fraction
des prédictions que notre modèle a obtenues qui est 73.91 % dans notre cas qui n’est pas
un très bon score et il y a beaucoup de possibilités d’amélioration.

Enfin, nous traçons la différence entre la valeur réelle et la valeur prévue de notre modèle
comme l’indique la figure ci-dessous :

85
CHAPITRE 6. ANALYSE PRÉDICTIVE

F IGURE 6.7: La représentation graphique de la valeur réelle et prévue (Le forêt aléatoire )

6.2.3 La régression logistique

La régression logistique est un modèle d’analyse multivariée, très utilisé dans le domaine du
machine learning qui étudie le rapport entre une variable principale et des variables explicatives.
Elle est dite logistique, quand il existe un lien de fonction logistique entre la variable d’intérêt
et les autres variables.[8]
Nous illustrions ci-dessous les différentes instructions utilisées pour implémenter l’algorithme
régression logistique :

86
CHAPITRE 6. ANALYSE PRÉDICTIVE

F IGURE 6.8: Implémentation de la régression logistique

D’après la figure :

– Nous allons implémenter la fonction LogisticRegression () pour appliquer notre algorithme


puis nous allons utiliser la fonction fit() qui prend les données d’apprentissage comme
arguments pour entrainer notre modèle (Bloc A1, Figure 6.8).

– Nous allons prédire la somme des ventes et nous devons tester notre modèle sur la partie
de données destinée au test avec la commande predict() (Bloc A2, Figure 6.8).

– Nous vérifions la différence entre les valeurs réelles et les valeurs de prédictions (Bloc
A3, Figure 6.8).

Nous pouvons mesurer la performance du modèle par le calcul de la moyenne des erreurs
ainsi que la précision du modèle comme l’indique la figure ci-dessous :

87
CHAPITRE 6. ANALYSE PRÉDICTIVE

F IGURE 6.9: La moyenne des erreurs et la précision de la régression logistique

– La moyenne des erreurs (Mean Absolute Error) dans notre cas est 20468.92 , cela signifie
que notre algorithme a fait une prédiction, mais il a besoin de beaucoup d’améliorations.

– La précision (Accuracy) : est 70.98 % dans notre cas qui n’est pas un très bon score et il
y a beaucoup de possibilités d’amélioration.

Enfin, nous traçons la différence entre la valeur réelle et la valeur prévue de notre modèle
comme l’indique la figure ci-dessous :

F IGURE 6.10: La représentation graphique de la valeur réelle et prévue (régression logistique )

88
CHAPITRE 6. ANALYSE PRÉDICTIVE

6.2.4 L’arbre de décision

C’est une des méthodes d’apprentissage supervisé les plus populaires pour les problèmes
de classification et de régression de données. Concrètement, un arbre de décision modélise une
hiérarchie de tests pour prédire un résultat.[9]
Nous illustrions ci-dessous les différentes instructions utilisées pour implémenter l’algorithme
arbre de décision :

F IGURE 6.11: Implémentation de l’arbre de décision

D’après la figure :

– Nous allons implémenter la fonction DecisonTreeRegressor () pour appliquer notre


algorithme puis nous allons utiliser la fonction fit() qui prend les données d’apprentissage
comme arguments pour entrainer notre modèle (Bloc C1, Figure 6.11).

– Nous allons prédire la somme des ventes et nous devons tester notre modèle sur la partie
de données destinée au test avec la commande predict() (Bloc C2, Figure 6.11).

– Nous vérifions la différence entre les valeurs réelles et les valeurs de prédictions (Bloc
C3, Figure 6.11).

89
CHAPITRE 6. ANALYSE PRÉDICTIVE

Après l’implémentation de l’algorithme nous devons tester la moyenne des erreurs ainsi que
la précision du modèle comme l’indique la figure ci-dessous :

F IGURE 6.12: La moyenne des erreurs et la précision de l’arbre de décision

– La moyenne des erreurs (Mean Absolute Error) dans notre cas est 379.3, cela signifie que
notre algorithme a fait une prédiction, et il possède moins des erreurs par rapport aux
deux modèles précédentes.

– La précision (Accuracy) : 99 % qui est un très bon score dans notre modèle

Nous traçons enfin la différence entre la valeur réelle et la valeur prévue de notre modèle
comme l’indique la figure ci-dessous :

90
CHAPITRE 6. ANALYSE PRÉDICTIVE

F IGURE 6.13: La représentation graphique de la valeur réelle et prévue (L’arbre de décision)

6.2.5 Interprétation et choix de modèle

Afin de prédire la somme des ventes par jour, nous avons eu recours à trois algorithmes de
régression qui sont : la régression logistique, le forêt aléatoire et l’arbre de décision qui nous
permettent de constater en comparant les résultats de calcul des indicateurs de performance ( la
moyenne des erreurs et la précision ). Nous avons conclu que le modèle « Arbre de
décision » donne moins d’erreurs et des meilleurs résultats pour la précision par rapport à la
régression logistique et le forêt aléatoire.
D’où nous pouvons conclure que le modèle « Arbre de décision » est le plus approprié pour
prédire la somme des ventes de l’entreprise .

6.3 Conclusion

Dans ce dernier chapitre, nous avons implémenté une couche prédictive en illustrant les
interprétations nécessaires. Ce qui nous conduit à terminer ce rapport après avoir présenté les
différentes phases du cycle de vie dimensionnel.

91
Conclusion générale

Ce rapport est le résultat des travaux réalisés au cours de notre stage chez « DELTA SOFT
INTERNATIONAL ».

Dans cette période de stage, nous avons fourni une solution d’aide à la décision dédiée au
client FnacDarty dans le domaine de grande distribution pour le suivi des ventes , achat et stock
afin de faciliter la prise de décisions aux décideurs.

Notre travail s’est déroulé en six étapes : Dans une première partie nous avons dégagé la
problématique suivie par la proposition de la solution adéquate. Par la suite, après avoir choisi
la méthodologie de travail, nous avons spécifié les besoins qui nous ont permis de distinguer
les différents acteurs interagissant avec l’application et de déterminer les besoins fonctionnels
et non fonctionnels du système . Durant la troisième phase, nous avons défini l’architecture
de notre solution et les technologies utilisées. La quatrième phase est consacrée au modèle
physique et la partite ETL de l’application . Puis, tout au long de la cinquième phase, nous
avons réalisé les tableaux de bord finaux. Enfin, la dernière phase était consacrée à l’analyse
prédictive .

Dans ce projet, nous avons eu l’occasion de développer l’esprit de recherche et du travail


collaboratif. Il nous a permis de découvrir les réalités de l’entreprise, d’approfondir nos
compétences dans le secteur de l’informatique décisionnelle.

Notre projet de fin d’études satisfait les exigences de l’entreprise d’accueil. En termes de
perspective, nous pouvons améliorer notre système décisionnel en ajoutant un volet pour le
suivi financier et comptable de l’entreprise selon le besoin du décideur ainsi que nous pouvons
mieux développer la partie DataMining en travaillant sur la prédiction des résultats futurs pour
d’autres indicateurs.

92
Webographie

• |1| Le site officiel de DeltaGroup Disponible sur :


https ://www.deltagroup.com.tn/

• |2| Equipe DeltaGroup Disponible sur :


https ://www.deltagroup.com.tn/presentations/nos-equipes/

• |3| Cycle de vie de la méthodologie de Ralph Kimball Disponible sur :


https ://www.eyrolles.com/Chapitres/9782212116007/chap02.pdf

• |4| Cycle de vie de la méthodologie de Gimsi Disponible sur :


https ://slideplayer.fr/slide/11788051

• |5| Les fonctionnalités de Microsoft Sql Server Disponible sur :


https ://www.next-decision.fr/editeurs-bi/base-de-donnees/microsoft-sql-server

• |6| Définition de l’outil Jupiter Notebook Disponible sur :


https ://www.lebigdata.fr/jupyter-notebook

• |7| Définition de forêt aléatoire Disponible sur :


https https ://datascientest.com/random-forest-definition

• |8| Définition de la régression logistique Disponible sur :


https ://whatis.techtarget.com/fr/definition/Regression-logistique

• |9| Définition de l’arbre de décision Disponible sur :


https ://dataanalyticspost.com/Lexique/arbre-de-decision/

93
Résumé
Le présent rapport s’inscrit dans le cadre du projet de fin d’études au sein de l’organisme
d’accueil DELTA SOFT INTERNATIONAL pour l’obtention du diplôme national d’ingénieur
en informatique.

Notre projet consiste à la mise en place d’une solution d’aide à la décision dans le domaine
de grande distribution pour le client FnacDarty. Ce système doit permettre aux décideurs, à
travers les tableaux de bord, le contrôle et le suivi des ventes, achats et stocks.

Pour la réalisation de ce projet, nous avons couvert tout le processus BI. D’abord, nous
avons traité les données dans la phase ETL d’extraction, de transformation et de chargement
des données. Ensuite, nous avons généré notre modèle de donnée. À la fin, nous avons généré
les tableaux de bords et implémenté la couche prédictive.

Mots clés : Un système décisionnel, BI (Business Intelligence), ETL (Extract Transform


Load), Tableaux de bord, la couche prédictive.

Abstract
This report is part of the graduation project at the host organization DELTA SOFT
INTERNATIONAL to obtain the national diploma in computer engineering.

Our project consists on setting up a decision support solution in the field of mass distribution
for the client FnacDarty. This system must allow decision makers to control and monitor,
through dashboards, to control and monitor sales, purchases and stocks.

To realize this project, we covered the whole process BI . First, we processed the data in
the ETL phase by extracting, transforming and loading the data. Then, we generated our data
model. Finally, we generated the dashboards and implemented the predictive layer.

Key-words : A decision-making system, BI (Business Intelligence), ETL (Extract Transform


Load), Dashboards, the predictive layer.

Vous aimerez peut-être aussi