Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Présenté par
Karima Bougrne
&
Encadré par :
Nous tenons, tout d’abord, à exprimer nos sincères gratitudes envers notre encadrant
Mr. Marouane SKITI, enseignant au département informatique au sein du centre CIGMA de
la faculté des sciences et techniques de l’université Hassan I, d’avoir partagé sa passion
d’enseignement, pour son encadrement, son soutien, ainsi que pour ses conseils instructifs
durant toute la période de l’établissement de ce travail.
Nos professeurs au centre CIGMA, qui sont présents ou non comme jury, pour le travail et le
temps qu’ils nous ont consacré pour mener à bien cette formation.
Nous tenons aussi à remercier tous les membres du jury qui nous ont fait l’honneur
d’accepter de juger notre travail.
Nous tenons aussi à remercier tous nos collègues de CIGMA, pour leur soutien au quotidien.
Ce rapport est le fruit du travail que nous avons réalisé dans le cadre de notre projet de
fin d’études.
(ETL, SI, …), permettant d’avoir un Dashboard des KPI’S et des visualisations par rapport aux
opportunités de ventes de la société DELL, ainsi qu’une base de données servante à
historiser les data.
Le présent rapport permet de présenter les différentes étapes par lesquelles nous sommes
passés dans le but de réaliser le travail qui nous a été confié.
1.2.2 Problématique.................................................................................................................. 14
1.2.3 Objectif du projet ........................................................................................................................ 15
À l'aide d'éléments visuels comme les graphiques et les cartes, une visualisation de données
permet de voir et de comprendre des tendances ou des valeurs inhabituelles dans les
données, de manière très accessible.
Dans le monde du Big Data, les outils et technologies de visualisation de données sont
indispensables pour analyser d'énormes volumes d'informations et prendre des décisions en
s'appuyant sur les données.
Il serait difficile de trouver un secteur d'activité qui n'aurait aucun intérêt à mieux
interpréter ses données. Dans les domaines scientifiques et techniques, dans
l'administration, dans la finance, en marketing, dans le secteur des services ou dans le sport,
la visualisation de données joue un rôle de plus en plus important.
Nous pourrions parler indéfiniment des visualisations de données (nous sommes sur le site
de Tableau après tout), mais il est important d'aborder les applications concrètes.
Mieux vous réussissez à faire passer votre message visuellement, que ce soit dans un tableau
de bord ou une présentation, mieux vous réussirez à tirer parti de ces informations.
C’est dans ce sens que notre projet s’inscrit. Notre mission consiste avant de créer le
Dashboard final, nous récupérons l’historique nécessaire afin que vous puissiez
correctement mener vos analyses de comparaison et apprécier les tendances dans vos
données.
Ce n’est qu’une fois l’historique récupéré que nous créons le Dashboard sur la solution de
data visualisation choisie au début de la mission.
Contexte général
du projet
La présentation du contexte général a pour but de situer le projet
dans son environnement organisationnel et contextuel. Ce chapitre
commence par présenter l’organisme d’accueil.
La première partie de ce chapitre cite quelques informations sur la société DELL, et décrit ses
métiers et ses domaines d’activités ainsi que ses différents actionnaires.
Même si Dell Computer est surtout connu pour les PC qu'il conçoit, fabrique et vend aux
particuliers et aux professionnels, il est également présent sur les marchés de serveurs
d'entreprise, de systèmes de sauvegarde et stockage de données et du matériel spécifique
aux réseaux informatiques.
Dell propose également des logiciels et des périphériques comme des imprimantes, appareils
photos numériques, et beaucoup d'autres encore.
Dell était coté au Nasdaq à New York sous le symbole DELL jusqu'en 2013, sorti de la bourse en
2013 et réintroduit en 2018.
Au 5 janvier 2020 :
Moniteurs
Logiciels et périphériques
Imprimantes
Pour l'entreprise :
XPS (Anciennement pour le jeu. Actuellement ce modèle est conçu pour être mobile et performant)
Inspiron (PC fixes et portables)
Alienware (PC fixes et portables spécialement configurés pour les jeux)
Axim (PDA)
SmartPC
Vostro (PC fixes, portables et mini-ultra-portables)
Dell Adamo (PC portables ultra fins et au design luxueux)
La gamme Axim est celle des Assistants Personnels de Dell (PDA).
Selon le site spécialisé Mobimania, Dell aurait décidé de se désengager de ce secteur dont il
détient la deuxième place mondiale en termes de parts de marché.
1.2.2 - Problématique :
L’objectif du projet :
Etant donné le Cube MIB est un « Trusted Data Source » , assurant une performance optimale en terme de
d’extraction des données , Cette dernière fait l’objet d’un ETL afin de les hoster sur un Serveur Local (SQL Server basé
en USA) pour :
Data
Cleaning
Etude de la
platforme BI
Ce chapitre a pour objectif de présenter l’analyse, les
techniques et les méthodologies sur lesquelles est basé le
projet .
D’analyse et de décision, il s’agit d’avoir une visibilité sur une activité, de détection de
etc.
Les dimensions de la BI
S’étendre pour offrir aux organisations une meilleure visibilité dans un temps réduit.
Début, les organisations livraient aux utilisateurs de simples rapports formatés. Ces
Rapports étaient prédéfinis, statiques et en format papier. Ils ne faisaient que reporter sur des
Faits passés d’une manière assez compréhensible par les utilisateurs. Avec les avancées
Survenues dans le web, le reporting est devenu plus interactif et plus dynamique.
Actuellement, les développeurs se basent sur des technologies telles qu’AJAX et flash afin de
Créer des rapports de plus en plus interactifs et qui peuvent même être considérés comme des
La dimension Analyse
Au début des années 90, un besoin de flexibilité des rapports est de plus en plus
Ressenti. Les utilisateurs demandaient des outils d’analyse plus dynamiques. En conséquence,
Les éditeurs ont lancé des solutions pour l’analyse ad hoc et des outils OLAP permettant aux
Utilisateurs d’effectuer des « slice/dices » sur leurs données. C’est ainsi qu’apparait
La dimension Planification
A la fin des années 90, les éditeurs des solutions BI se sont rendu compte que les
utilisateurs exportaient les rapports et analyses sur des tableurs pour effectuer des
planifications, prévisions et modélisations. Ils ont par conséquent intégré ces activités comme
une dimension additionnelle de la BI. Les éditeurs ont profité des avancés réalisé dans la
discipline du BPM (Business Process Management) afin d’aligner les utilisateurs et les
Entre les années 2000-2005, un nouveau besoin a surgit, celui de la livraison des
données voulues dans les délais voulus et dans le cas d’événements critiques nécessitant
l’attention des décideurs. Les éditeurs BI ont alors commencé à livrer en plus de leurs
outils d’analyse, reporting et planification, des tableaux de bords et des interfaces scorecard.
Ces deux outils permettent aux utilisateurs de comparer les performances et les objectifs
De plus en plus, les entreprises se demandent comment obtenir plus de valeur de leur
En effet, les nouvelles plateformes BI embarquent de plus en plus des algorithmes de datamining afin
d’accélérer les analyses et les interprétations sans avoir recours à des connaissances avancées en
statistiques ou en intelligence artificielle.
Ces données sont multiples : des données internes (bases de données clients,
d’Internet).
Datawarehouse :
Un entrepôt de données, plus connu sous le nom de Datawarehouse, est, selon le grand
dictionnaire, «une structure informatique dans laquelle est centralisé un volume important de
notamment les bases de données internes et qui est conçue de manière que les personnes
intéressées aient accès rapidement à l’information stratégique dont elles ont besoin ».
C’est une base de données dédiée au stockage de l’ensemble des données nécessaires à
La modélisation d’un entrepôt de données se base sur deux concepts: les faits et les
dimensions. Les faits étant ce que je voulais analyser et les dimensions, les données suivant
Table de faits :
(Exemple: nombre de carte d’émission et de réception). Elle regroupe également les clés
associées aux dimensions. Il s’agit de clés étrangères dans la table de faits. En général une
table de faits contient peu de colonnes et plus d’enregistrements qu’une table de dimension.
Dans une table de faits, on trouve, en plus des clés étrangères, des attributs
quantitatifs qui doivent être additifs, semi-additifs ou utilisés pour faire des sommes, des
Représente, quant à elle, les axes d’analyse des mesures contenues dans la table de
faits. Par exemple, si je voulais analyser le nombre de cartes selon les types, la mesure
« nombre de cartes » sera contenu dans la table des faits et analysée suivant l’axe « site »,
Modèles multidimensionnels :
La différenceréside dans la simple normalisation des tables de dimensions. Les données sont alors
hiérarchisées et les attributs de chaque niveau hiérarchique sont mis dans une table
de dimension à part.
Le cube :
Cette structure est prévue à des fins d’analyses interactives par une ou plusieurs personnes (souvent ni
informaticiens ni statisticiens) du métier que ces données sont censées représenter.
Les outils ETL permettent de récupérer les données quels que soient leurs sources et
les systèmes qui les supportent (système d’exploitation, SGBD, formats etc.), d’automatiser et
limiter les développements spécifiques. Ces outils permettent de construire, de mettre à jour et
Notons que la plupart des ETL disposent d’une interface graphique permettant L’élaboration des
différents scénarios d’intégration.
Le travail des développeurs en est ainsi grandement facilité, tant au niveau de la conception que
de la maintenance des traitements de données.
Les ETL sont communément utilisés dans l’informatique décisionnelle afin de permettre l’alimentation des
datawarehouses (entrepôts de données).
Ces derniers servent de supports pour l’analyse des données sous plusieurs formes :
Ce terme s’oppose à OLTP qui désigne les systèmes transactionnels. C’est un mode de stockage permettant
l’analyse statistique des données.
Une base de données OLAP peut être représentée comme un cube à N dimensions
Les requêtes sur les cubes OLAP sont écrites en langage MDX (Multidimensionnel Expressions). C’est
l’équivalent du langage SQL pour le modèle OLTP. Il permet de définir, D’utiliser et de récupérer des
données à partir d’objets multidimensionnels.
Reporting :
Le terme restituer ou bien « Reporting » représente le moyen technique, applicatif qui permet la
consommation d’information basée directement sur les outils de production ou en aval d’une chaîne
décisionnelle.
Modes de restitution :
Rapport statique : il s’agit d’un rapport dont la structure est figée tant en termes de présentation
que du périmètre des données présentées.
Rapport dynamique : il s’agit d’un rapport ayant une structure de présentation semi statique au
sein duquel le périmètre des données peut varier. Cela en offrant à l’utilisateur final la possibilité
de choisir les valeurs de paramètres dynamiques intégrés dans le rapport.
Conclusion
Pour conclure ce chapitre, il est important de se rendre compte de l’utilité de l’informatique décisionnelle.
La BI est riche en solutions et concepts et elle permet de mettre en place des projets pour les grandes
entreprises d’aujourd’hui.
Conception
du projet
1. La méthode UML
UML (Unified Modeling Language, que l’on peut traduire par langage de modélisation unifié) est une
notation permettant de modéliser un problème de façon standard.
Ce langage est né de la fusion de plusieurs méthodes existant auparavant, et est devenu désormais
la référence en terme de modélisation objet, à un tel point que sa connaissance est souvent nécessaire
pour obtenir un poste de développeur objet.
Pour la conception d’un nouveau projet décisionnel, j’ai adopté une méthode d’analyse dite
multidimensionnelle qui met en évidence les thèmes de gestion que l’utilisateur souhaite étudier et les
différentes dimensions ou axes d’analyse qui lui permettent d’explorer les données, tenons compte de
cette logique on trouve que le modèle multidimensionnel communément appelé modèle en étoile est le
modèle qui répondra aux exigences, en effet sa structure de donnée est considérée comme étant la
structure de données la plus utilisée et la plus appropriée aux requêtes d’analyses destinées à la prise de
décision. Elle est simple à créer, stable et intuitivement compréhensible par les utilisateurs finaux.
Le modèle en étoile est un modèle de conception conçu à fin d’être utilisé dans un cadre décisionnel il est
optimisé pour les requêtes d’analyse et considéré comme un modèle non normalisé.
Il est composé d’une table de faits qui est située au centre et des tables de dimensions ou axes d’analyses
qui sont situées aux extrémités de la table de faits, ce sont les dimensions explorées dans l’analyse comme
le grade, statut, zone géographique et ainsi de suite.
Le principe d’optimisation de ce modèle en étoile est le suivant : une clé (clé générique) sert de jointure
entre les tables de dimensions et la table des faits.
Chaque thème de gestion est modélisé sous forme d’un schéma en étoile, avec au centre la table de Faits,
entourée des tables dimensions qui représentent les différents axes ou niveaux d’analyse.
La clé de la table de ‘’Faits’’ est formée par l’ensemble des clés des tables ‘’dimension’’, alors que les
attributs correspondent aux valeurs numériques mesurables relatives à un sujet donnée, comme les
montants, les nombres, les quantités, les taux, etc.
Table de faits :
Elle contient des mesures correspondant aux données de l’activité à analyser (exemple: nombre de carte
d’émission et de réception). Elle regroupe également les clés associées aux dimensions. Il s’agit de clés
étrangères dans la table de faits. En général une table de faits contient peu de colonnes et plus
d’enregistrements qu’une table de dimension.
Dans une table de faits, on trouve, en plus des clés étrangères, des attributs quantitatifs qui doivent être
additifs, semi-additifs ou utilisés pour faire des sommes, des moyennes ou des ratios.
Représente, quant à elle, les axes d’analyse des mesures contenues dans la table de faits. Par exemple, si je
voulais analyser le nombre de cartes selon les types, la mesure « nombre de cartes » sera contenu dans la
table des faits et analysée suivant l’axe « site », attribut de la table de dimension objet.
Comme cela a été expliqué précédemment la problématique se situe au niveau de l’exploitation des
données, qui ne peuvent pas se faire à l’état brut. Il est difficile, sans des outils informatiques d’extraire les
données nécessaires.
La figure suivante illustre la chaîne complète de mise à disposition des données, dans le but de mieux
appréhender le besoin du client.
La figure montre les étapes de développement de notre système avec les outils qui permettent de réaliser
chaque partie.
Le premier outil c’est pour réaliser la partie ETL, la génération du cube utilisé dans la phase de présentation
des rapports et des tableaux de bords.
3. ETL
Le processus d’extraction, de transformation et de chargement des données a été réalisé Il est capable
de fonctionner avec un référentiel partagé qui permet de disposer de plusieurs connexions aux bases de
données
La requête Dax Permet d’avoir une Table Flate avec toutes les données en provenance des
Dimensions et Facts disponibles dans le Cube Distant.
Le package SSIS Fait en sorte à Insérer les Données dans Une table Sql Server sur la machine Local
avec la date d’extraction (Derived column)
La transformation et le chargement des données se font en local sur les données faisant l’objet
de(s) extraction(s) précédente(s) :
Tout Package SSIS Garde une copie en Flat file pour tout diagnostique relatif à l’exactitude des données
Une connexion à SQL server se fait sur le serveur local en mode Import. et un model a été construit
comme suit (Figure ci-dessous :)