Académique Documents
Professionnel Documents
Culture Documents
Je dédie ce travail
Mohamed
Dédicace
Du plus profond de mon cœur, je dédie ce travail
Je dédie ce travail
Aymen
Remerciement
Au terme de ce travail, nous avons le plaisir d’exprimer nos sincères remerciements à
tous ceux qui ont bien voulu nous apporter leur aide précieuse pour la réalisation de
ce projet de fin d’études.
Faiza pour avoir acceptées d’encadrer notre projet, pour leurs conseils, toujours
donnés avec extrême amabilité et leurs recommandations pédagogiques et
méthodologiques.
Pour avoir participé à la prise de décision utile et pour avoir donné les conseils et les
orientations nécessaires et mis en place toutes les facilités pour rendre le travail Plus
facile.
Enfin, nous remercions tous les enseignants de l’ISIMS qui ont contribué à notre
formation universitaire.
Table des Matières
Introduction Générale ............................................................................................................................................ 1
Chapitre 1 : Cadre du projet................................................................................................................................... 3
I. Introduction .................................................................................................................................................... 4
1. L’organisme d’accueil.................................................................................................................................... 4
2. Présentation de l’entreprise d’accueil ............................................................................................................ 4
3. Objectif de la société ...................................................................................................................................... 5
4. Répartition Géographique .............................................................................................................................. 5
5. Les Services de Clinisys ................................................................................................................................ 6
6. Les nouvelles solutions de CliniSys ............................................................................................................... 6
7. Cadre du projet ............................................................................................................................................... 6
8. Etude de l’existant.......................................................................................................................................... 7
9. Problématique ................................................................................................................................................ 7
10. Solution proposée ......................................................................................................................................... 8
10.1 Objectifs ................................................................................................................................................. 8
11. Travail demandé........................................................................................................................................... 9
12. Plan de déroulement du projet ..................................................................................................................... 9
II. Conclusion ..................................................................................................................................................... 9
Chapitre 2 : Informatique décisionnelle ........................................................................................................... 10
1. Le décisionnel .............................................................................................................................................. 11
2. Revue historique de l’informatique décisionnelle........................................................................................ 11
3. Avantage du BI ............................................................................................................................................ 12
4. Limite du BI ................................................................................................................................................. 12
5. Les principes de l’informatique décisionnelle ............................................................................................. 13
6. L’architecture décisionnelle ......................................................................................................................... 13
7. Entrepôt de données ..................................................................................................................................... 14
7.1 Définition ............................................................................................................................................... 14
8. Magasin de données (Data Mart) ................................................................................................................. 15
9. Modélisation Entité/Relation ....................................................................................................................... 15
10. Modélisation multidimensionnelle ............................................................................................................. 16
11. Modélisation conceptuelle ......................................................................................................................... 16
11.1 Concepts de base ...................................................................................................................................... 16
11.1.1 Modèle en étoile ................................................................................................................................ 17
11.1.2 Modèle en flocon de neige ................................................................................................................ 17
11.1.3 Modèle en constellation .................................................................................................................... 18
12. Processus ETL (Extract, Transform, Load) ............................................................................................... 19
12.1 Extraction ............................................................................................................................................. 19
12.2 Transformation ..................................................................................................................................... 19
12.3 Chargement .......................................................................................................................................... 19
13. Serveur OLAP ........................................................................................................................................... 19
14. Cube OLAP ................................................................................................................................................ 20
15. ROLAP ...................................................................................................................................................... 20
16. MOLAP...................................................................................................................................................... 20
17. Différence entre ROLAP et MOLAP ......................................................................................................... 21
18. Besoin Fonctionnel .................................................................................................................................... 22
19. Les Besoins Non-fonctionnel ..................................................................................................................... 22
II. Conclusion .................................................................................................................................................... 22
Chapitre 3 : Modélisation Conceptuelle ............................................................................................................ 23
I. Introduction .................................................................................................................................................. 24
1. Méthodologie de travail ............................................................................................................................... 24
2. Processus de modélisation d’un ED ............................................................................................................. 24
3. Méthodes de conception d’un ED ................................................................................................................ 25
3.1. Méthode Ascendante (Botton-up) ......................................................................................................... 25
3.2. Méthode descendante (Top-down) ........................................................................................................ 25
3.4. Méthode mixte ...................................................................................................................................... 25
II. Schéma Source de la base de données ......................................................................................................... 26
4. Méthode Ascendante ................................................................................................................................... 27
4.1. Analyse schéma source ........................................................................................................................ 27
5. Méthode Descendante .................................................................................................................................. 32
5.1 Spécification des Besoins....................................................................................................................... 35
6. Méthode Mixte ............................................................................................................................................. 37
Chapitre 4 : Conception et développement de processus de L’ETL et l’enchainement d’un cube OLAP .......... 40
I. Introduction .................................................................................................................................................. 41
1. Conception de l’ETL.................................................................................................................................... 41
2. Diagrammes d’activités................................................................................................................................ 42
2.1 Diagramme d’activité de processus ETL ............................................................................................... 42
3. Développement de l’ETL ............................................................................................................................ 45
3.1. Microsoft SQL Server 2019 .................................................................................................................. 45
3.2. Microsoft SQL Server Intégration Services (SSIS) .............................................................................. 45
3.3. Microsoft SQL Server Mangement studio 18 (SSMS) ......................................................................... 45
3.4. Microsoft Analysis Services ................................................................................................................. 45
3.5. Microsoft Visual Studio 2019 ....................................................................................................................... 46
4. connexion au SQL SERVER ....................................................................................................................... 46
5. les composants de l’ETL ............................................................................................................................. 48
5.1 Flux de contrôle ..................................................................................................................................... 48
5.2 Paramétrage du projet SSIS ................................................................................................................... 50
5.3 Gestionnaire de connexion ..................................................................................................................... 51
6. Flux de données ........................................................................................................................................... 52
6.1 Extraction des données........................................................................................................................... 52
6.2 Transformation et chargement des données ........................................................................................... 54
7. Création du cube OLAP ............................................................................................................................... 58
7.1 Définition ............................................................................................................................................... 58
7.2 Vue de source de données ...................................................................................................................... 58
7.3 Création des dimensions ........................................................................................................................ 59
7.4 Création du Cube ................................................................................................................................... 60
7.5 Déploiement et traitement ..................................................................................................................... 60
I. Conclusion ................................................................................................................................................... 61
Chapitre 5 : Restitution ........................................................................................................................................ 62
I. Introduction .................................................................................................................................................. 63
1. Définition ..................................................................................................................................................... 63
1.1 Microsoft Power BI ................................................................................................................................ 63
1.2 Fonction DAX ........................................................................................................................................ 63
2. Connexion et Chargement Power BI............................................................................................................ 64
3. Modelé ........................................................................................................................................................ 65
4. Diagramme de cas d’utilisation.................................................................................................................... 66
5. Tableaux de bord.......................................................................................................................................... 70
5.1 Power BI ................................................................................................................................................ 70
6. Fonction DAX .............................................................................................................................................. 75
6.1 Création de la table Dates ...................................................................................................................... 75
6.2 Les fonctions .......................................................................................................................................... 76
Fonction ............................................................................................................................................................... 76
CALENDARAUTO ............................................................................................................................................. 76
7. Visualisation Excel ...................................................................................................................................... 77
7.1 Microsoft Excel .................................................................................................................................. 77
II. Conclusion ................................................................................................................................................... 79
CONCLUSION GENERALE .............................................................................................................................. 80
Liste des figures
Figure 1 : Logo de CliniSys ....................................................................................................................... 4
Figure 2 : Répartition géographique........................................................................................................ 5
Figure 3 : Processus du travail ................................................................................................................. 8
Figure 4 : Architecture décisionnelles ................................................................................................... 13
Figure 5 : Architecture décisionnelle ..................................................................................................... 15
Figure 6 : Modèle en étoile.................................................................................................................... 17
Figure 7 : Modèle en flocon de neige .................................................................................................... 18
Figure 8 : Modèle en constellation ........................................................................................................ 18
Figure 9 : Représentation d’un cube OLAP............................................................................................ 21
Figure 10 : Processus de modélisation d’un entrepôt de données ....................................................... 24
Figure 11 : Diagramme de classe du schéma source ............................................................................. 26
Figure 12 : Lien de dépendance entres les classes ................................................................................ 28
Figure 13 : Hiérarchisation des dimensions et définition de la granularité de l’analyse ...................... 29
Figure 14 : Démarche Ascendante ........................................................................................................ 31
Figure 15 : démarche descendante ....................................................................................................... 36
Figure 16 : démarche Mixte................................................................................................................... 38
Figure 17 : Processus ETL ....................................................................................................................... 41
Figure 18 : Diagramme d’activités globales pour le processus de l’ETL ................................................ 42
Figure 19 : Diagramme d'activité flux de contrôle ................................................................................ 43
Figure 20 : Diagramme d'activité flux de données "Client" .................................................................. 43
Figure 21 : diagramme d’activités d’un fait ........................................................................................... 44
Figure 22 : connexion au serveur SQL ................................................................................................... 46
Figure 23 : l’entrepôt de données Local ................................................................................................ 47
Figure 24 : Flux de contrôle ................................................................................................................... 48
Figure 25 : Boite de message ................................................................................................................. 49
Figure 26 : Editeur de boucle foreach ................................................................................................... 50
Figure 27 : Liste de la connexion ........................................................................................................... 51
Figure 28 : Liste des variables ................................................................................................................ 51
Figure 29 : Gestionnaire de connexion .................................................................................................. 52
Figure 30 : Flux de données ................................................................................................................... 52
Figure 31 : Flux de données du processus de chargement de fait règlement ...................................... 54
Figure 32 : Editeur de source OLE DB .................................................................................................... 55
Figure 33 : Editeur de transformation de fractionnement conditionnel fait règlement ...................... 56
Figure 34 : Editeur de transformation de Recherche ............................................................................ 57
Figure 35 : Création de la vue de source de données ........................................................................... 58
Figure 36 : Création de dimension Client .............................................................................................. 59
Figure 37 : Hiérarchies de la dimension Client ...................................................................................... 59
Figure 38 : Table de groupes de mesures.............................................................................................. 60
Figure 39 : Déploiement réussi .............................................................................................................. 60
Figure 40 : Structure du cube dans Microsoft Analysis Server.............................................................. 61
Figure 41 : Connexion au serveur .......................................................................................................... 64
Figure 42 : Tables a chargées ................................................................................................................ 64
Figure 43 : Modèle power BI ................................................................................................................ 65
Figure 44 : Diagramme de cas d'utilisation ........................................................................................... 66
Figure 45 : Menu.................................................................................................................................... 70
Figure 46 : Filtre sur société ................................................................................................................. 71
Figure 47 : Rapport de facture payant .................................................................................................. 71
Figure 48 : Rapport de Règlement par organisme et payant ................................................................ 72
Figure 49 : Rapport de Règlement contentieux et organisme .............................................................. 73
Figure 50 : Rapport de Règlement contentieux et passagers ............................................................... 74
Figure 51 : Rapport de Balance et organisme payant ........................................................................... 75
Figure 52 : COD DAX pour la table DATES ............................................................................................. 75
Figure 53 : facture Payant (Excel) .......................................................................................................... 77
Figure 54 : facture règlement par organisme et par payant (Excel) ..................................................... 78
Figure 55 : Flux Payant contentieux (Excel) ........................................................................................... 79
Liste des tableaux
Acronyme Définition
BI Business Intelligence
SQL Structured Query Language
ERP Enterprise Ressource Planning
ETL Extract-Transform-Load
OLAP Online Analytical Processing
SGBD Système de Gestion de Base de Données
SSMS SQL Server Management Studio
SSIS SQL Server Integration Services
SSAS SQL Server Analysis Services
BD Base de Données
DWH Data Warehouse
DAX Data Analysis Expressions
Introduction Générale
Les entreprises se situent actuellement dans un marché très concurrentiel qui ne cesse d’évoluer
rapidement. Pour garder leur stabilité et acquérir de nouvelles parts du marché, l’entreprise doit
mieux comprendre ses clients et être réactive pour identifier les nouveaux relais de croissance. Dans
ce sens, l’étude de l’évolution du marché devient un défi pour détecter les opportunités et les
menaces. Pour ce faire, l’entreprise a besoin d’outils qui lui permettent de déceler tous ces éléments.
C’est dans cette optique que l’informatique décisionnelle vient pour résoudre les problèmes qui font
face aux entreprises dans l’aide à la décision à travers des moyens, des outils et des méthodes qui
permettent de collecter, consolider, modifier et restituer les données d’une organisation en vue
d’offrir une aide à la décision.
L’analyse de l’évolution de l’activité commerciale devient une tâche fastidieuse pour les décideurs
de la Société Nationale d'édition des logiciels de santé en Tunisie (Clinisys) en absence des outils
appropriés. En outre, il a fallu mettre en place des requêtes complexes, coûteuses en temps de réponse
et en ressources informatiques. Dès lors, l’entreprise souhaite acquérir un système décisionnel qui
permet de répondre à ses besoins d’analyse. Les outils de Business Intelligence permettent de
collecter les informations nécessaires à la mise en place de tableaux de bord adaptés aux besoins des
décideurs. L’entreprise pourra par le biais des applications de Business Intelligence, avoir une image
parfaite de son activité et de faciliter la prise de décision.
C’est dans cette optique que « Clinisys » a exprimé son besoin de mise en place d’un système
décisionnel : une optique qui a pour but de prévoir les futurs objectifs et les moyens dont elle aura
besoin pour cerner également les défis du marché, les pressions de la concurrence et l’évolution des
technologies. Ainsi, ce présent mémoire qui est l’illusion du travail effectué dans ce stage, relate les
différentes phases ainsi que les moyens auxquels nous avons eu recours pour atteindre les objectifs
fixés, et ceci en cinq chapitres.
1
Ce rapport est articulé autour de cinq chapitres
2
Chapitre 1 : Cadre du projet
3
Chapitre 1 : Cadre du projet
I. Introduction
À travers ce chapitre nous allons présenter l’organisme d’accueil au sein duquel s’est déroulé notre
projet, situons le présent travail dans son contexte général et mettrons en relief le choix
méthodologique que nous avons adopté tout au long de son élaboration.
1. L’organisme d’accueil
Ce Projet de fin d’études a été réalisé au sein de l’entreprise Clinisys (Computer System) durant une
période de quatre mois qui s’étale du 1 février jusqu’au 31 Mai 2022.
Depuis plus de 25 ans, CliniSys a réussi à moderniser la gestion des hôpitaux dans des
environnements difficiles et très hostiles et réussi à intégrer dans plus de 130 hôpitaux en Tunisie,
en Egypte, en Libye et au Maroc tous les aspects administratifs, financiers, organisationnels,
médicaux et décisionnels avec un seul produit : CLINISYS.
4
Chapitre 1 : Cadre du projet
3. Objectif de la société
Les réflexions, les orientations et les efforts sont orientés principalement sous ces quatre objectifs :
4. Répartition Géographique
- 100 hôpitaux/cliniques en Tunisie.
- 30 hôpitaux/cliniques à l'international.
- 30 000 utilisateurs.
- 12 000 lits.
5
Chapitre 1 : Cadre du projet
7. Cadre du projet
Dans le cadre de la préparation du projet de fin d’étude en vue de l’obtention du diplôme de licence
en science informatique spécialité Big Data et analyse des données ce travail consiste à réaliser un
tableau de bord pour analyser le recouvrement d’un groupe de polycliniques en Tunisie analysant
l’activité commerciale de ce groupe.
6
Chapitre 1 : Cadre du projet
8. Etude de l’existant
Actuellement les établissements hospitaliers connaissent une véritable révolution de leur capital
informationnel. Ils agrègent des volumes de données de plus en plus importants, issus de
canaux hétérogènes, qu’il s’agisse des applications de gestion, des applications métier, etc.
Ces établissements ont besoin de collecter, stocker, interpréter et analyser ces données en temps
réel afin de les utiliser pour la prise de décision.
Ainsi, au sein de ces établissements, les décideurs du métier ont besoin de suivre leurs états
budgétaires, leurs chiffres d’affaires, etc. Ces décideurs ont à leur disposition une diversité de
données provenant des différents systèmes transactionnels. Ainsi, ces données doivent être
regroupées pour pouvoir être analysées. Pour cela, l’informatique décisionnelle peut être une
solution pour la mise en place d’une méthodologie et d’outils exploitant ces données.
La solution Business Intelligence que nous proposons doit permettre de :
Centraliser les données dans un entrepôt de données.
Obtenir une vision synthétique d’un service ou de l’ensemble de la clinique.
Aider à la prise de décision via une exploitation efficace des données.
Les partenaires de CliniSys possèdent plusieurs sources de données éparpillées sur des
différents systèmes d’information. Ces systèmes sont représentés essentiellement dans les outils
suivants :
L’ERP CliniSys : C’est un ERP qui permet la gestion et le suivi au quotidien, l’ensemble
des informations et des services opérationnels des cliniques (développé en .Net).
Les fichiers Excel : Contiennent toutes les traces financières et budgétaires des cliniques.
Les BDs transactionnelles de ces différents systèmes ne sont pas conçues pour répondre à des
besoins d’analyse et à réaliser des rapports directement à partir de ces bases.
9. Problématique
Les rapports actuels réalisés par CliniSys ne répondent pas aux besoins des décideurs et posent
un problème de lourdeur de cette base de données avec une diminution de la qualité des
données.
En effet, les principales limites du processus de travail actuel qui font face aux décideurs se
résument en ces différents points :
Une complexité des requêtes de restitution : les informations utiles aux décideurs sont
stockées sur des sites de natures diverses (application web, application mobile, bases de
données relationnelles, fichiers, etc.) ce qui rend difficile l’extraction des données en
vue d’établir un document.
7
Chapitre 1 : Cadre du projet
10.1 Objectifs
Ce projet a pour but d’ajouter une couche BI au sein de l’ERP CliniSys tout en conférant aux
responsables des cliniques un support fiable pour une meilleure prise de décision concernant la
gestion et le pilotage de la clinique. Ce support permet de :
Prendre en entrée toute base de données provenant du système utilisé par la clinique.
Regroupe et stocke les données dans un entrepôt de données.
Avoir des rapports et des tableaux de bords interactifs pour une analyse détaillée.
Garantir une exploitation optimale des données par rapport aux BDs relationnelles.
Rendre l’architecture existante conforme aux normes de l’informatique décisionnelle.
8
Chapitre 1 : Cadre du projet
Après un certain nombre de discussions avec les décideurs pour analyser leurs besoins
et une analyse des données sources, les tâches que nous avons réalisées au cours de
ce projet sont :
Conception d’un entrepôt de données (Data Warehouse).
Création des tables de dimensions et des faits.
Déploiement du projet pour l’exécuter et création des jobs.
Conception et développement d’un cube pour l’analyse multidimensionnelle.
Conception et développement des packages d’alimentation de l’entrepôt de
données à partir du système opérationnel de collecte de données.
II. Conclusion
Au cours de ce premier chapitre nous avons présenté le cadre général de notre projet, dont
le premier objectif est la mise en place d’un système décisionnel pour l’ERP CliniSys.
Le deuxième chapitre nous définissons l’informatique décisionnelle, découvrons ses
fonctionnalités essentielles et ses concepts qui feront l’objet du chapitre suivant.
9
Chapitre 2 : Informatique décisionnelle
10
Chapitre 2 : Informatique décisionnelle
I. Introduction
Le Business Intelligence (BI) est un processus technologique d’analyse des données et de
présentation d’informations exploitables pour aider les dirigeants, managers et autres
utilisateurs finaux de l’entreprise à prendre des décisions commerciales éclairées .le BI
englobe une grande variété d’outils, d’applications et de méthodologies qui permettent aux
organisations de collecter des données à partir de systèmes internes et de sources externes,
de les préparer pour l’analyse, de développer et d’exécuter des requêtes par rapport à ces
données, et de créer des rapports, tableaux de bord et visualisations de données pour rendre
les résultats analytiques disponibles aux décideurs et au personnel opérationnel.
1. Le décisionnel
La Business Intelligence (BI), également "intelligence d'affaires" ou "informatique
décisionnelle", englobe les solutions informatiques apportant une aide à la décision avec, en
bout de chaîne, rapports et tableaux de bord de suivi à la fois analytiques et prospectifs. Le
but est de consolider les informations disponibles au sein des bases de données de
l'entreprise.
Les grandes firmes qui étaient déjà dotées d’un service informatique ont été les premières à
essayer d’exploiter leur BD transactionnelle comme un moyen d’aide à la décision. Elles se
sont appuyées dans les années 70 sue les infocentres : qui mettaient aux dispositions
d’utilisateurs finaux toute la puissance de calcul d’un ordinateur central (Mainframes) au
moyen de terminaux. Dans les années 80, les données de l’informatique transactionnelle,
notamment des ERP, ne se prêtaient pas à une exploitation dans un cadre d’analyse
décisionnelle.
11
Chapitre 2 : Informatique décisionnelle
3. Avantages du BI
L’alignement d’une organisation autour d’un ensemble cohérant d’indicateurs clés de
performance et de mesures.
L’accélération de la prise de décision fondée sur des faits.
La simplification de la présentation graphique des indicateurs de performance clés et
des paramètres d’analyse décisionnelle.
La présentation uniforme d’informations fiables.
La combinaison de plusieurs sources de données (ERP, systèmes comptable, feuilles de
calcul, des budgets …).
L’automatisation permet l’accélération de la collecte et de la diffusion de l’information
La performance dans le calcul d’agrégat sur de gros volume de données.
4. Limites du BI
Rationalisation excessive et processus complexes :
Les systèmes décisionnels produisent des indicateurs ou s'appuient sur des modèles dont
l'objectif est de simplifier la réalité pour aider à la prise de décision.
Mais la décision doit bien réintégrer des évaluations humaines qui la replacent dans sa
réalité, qui est restée complexe.
12
Chapitre 2 : Informatique décisionnelle
6. L’architecture décisionnelle
Une architecture BI, est un ensemble de concepts, de méthodes, de technologies et d’outils
13
Chapitre 2 : Informatique décisionnelle
7. Entrepôt de données
7.1 Définition
Bill Immon définit le datawarehouse dans son livre considéré comme étant la référence
dans le domaine «Building the Data Warehouse » comme suit :
Le DWH peut être aussi défini comme étant une structure pour l’organisation des systèmes
d’information. Il s’agit d’un processus d’aide à la décision a la gestion de la connaissance
tant pour l’usage quotidien que pour l’élaboration de stratégies à long terme. Les
paragraphes suivants illustrent les caractéristiques citées dans la définition d’Immon :
Orienté sujet : Les donneés dans un datawarehouse sont organisées autour des sujets
majeurs de l’entreprise (Clients, services, achats…).
Intègres : la Datawarehouse permet l’intégration des données hétérogènes provenant de
différentes sources.
Evolutives dans le temps : Contrairement aux systèmes opérationnels qui permettent de
mettre à jour des données, dans un système décisionnel l’historisation des différentes
valeurs d’une donnée est très importante. Cela permet le suivi, la comparaison et l’évolution
de ces valeurs dans le temps.
Généralement, dans un DWH, chaque valeur et associée à un moment bien déterminé
Non volatiles : C’est ce qui est, en quelque sorte, la conséquence de l’historisation décrite
précédemment. Une donnée peut être mise à jour ou supprimée dans un système
opérationnel.
Mais dans un Datawarehouse les données ne disparaissent pas et ne changent pas.
Organisées pour le support d’un processus d’aide à la décision : Les données du
Datawarehouse sont organisées de maniéré a permettre l’exécution des processus d’aide à
la décision (Reporting, datamining…).
14
Chapitre 2 : Informatique décisionnelle
Les data marts accélèrent les processus en permettant de définir un accès aux données
stockées dans un data warehouse (Ou autre gisement de données opérationnelles) en
quelques jours au lieu de plusieurs mois ou plus .Il s'agit d'une solution peu coûteuse qui
permet de transformer les données en connaissance exploitable.
9. Modélisation Entité/Relation
C’est un modèle de conception qui permet d’éclairer les relations microscopiques entre les
données ; en éliminant les données redondantes ; ce qui apporte de nombreux avantages au
niveau du traitement des transactions, qui deviennent alors très simples et déterministes. Ce
type de modélisation est adapté au traitement de transaction mais non plus aux requêtes
d’analyse.
D’après Kimball :
"Les modèles entité-relation ne peuvent pas servir de base pour construire des entrepôts
de données de l’entreprise"
15
Chapitre 2 : Informatique décisionnelle
16
Chapitre 2 : Informatique décisionnelle
Avantages
Facilite la navigation.
Il est facile compréhensible par les utilisateurs.
Inconvénients
Redondance au niveau des attributs de la dimension.
Alimentation complexe.
Dans un schéma en flocon, cette même table de faits, référence les tables de dimensions de
premier niveau, au même titre que le schéma en étoile. La différence réside dans le fait que
les dimensions sont décrites par une succession de tables représentant la granularité de
l’information. Ce schéma évite les redondances d’information mais nécessite des jointures
lors de l’agrégation de ces dimensions.
Avantage
Réduction du volume dans les tables de dimension.
Offre une structure plus facile à modifier lorsque les besoins évoluent.
Inconvénients
Navigation difficile.
17
Chapitre 2 : Informatique décisionnelle
Avantage :
Facilite les corrélations entre les différents sujets d’analyse.
Simplifie la modélisation avec la possibilité de partager les dimensions.
18
Chapitre 2 : Informatique décisionnelle
Les processus ETL prennent en charge la récupération des données depuis l’ensemble des
sources opérationnelles existantes et de les changer vers le système décisionnel.
12.1 Extraction
L'objectif de ces processus est de produire des données propres, faciles d'accès et qui
peuvent être exploitées efficacement par l'analytique, la Business Intelligence ou/et les
opérations commerciales. Les données brutes peuvent être extraites de différentes sources,
en particulier
- Bases de données existantes.
- Logs d'activité (trafic réseau, rapports d'erreurs, etc.)
- Comportement, performances et anomalies des applications.
12.2 Transformation
L’étape de transformation d’applique à une série de règles ou de fonction aux données
extraites de la source afin de dériver les données pour le chargement. Pour certaines source
de sonnées, il faudra une manipulation très légère voire aucune, des données. Dans d’autres
cas, un ou plusieurs des types de transformation suivant peuvent être nécessaire pour
répondre aux besoins technico-commerciaux de de la base de données cibles.
12.3 Chargement
La dernière étape du processus ETL standard consiste à charger les données extraites et
transformées dans leur nouvel emplacement. En général, les data Warehouse supportent
deux modes pour le chargement des données : chargement complet et chargement
incrémental.
19
Chapitre 2 : Informatique décisionnelle
Le terme cube fait ici référence à un jeu de données multidimensionnel, qui est aussi parfois
appelé hypercube si le nombre de dimensions est supérieur à 3.
15. ROLAP
ROLAP : est un modèle de traitement analytique en ligne relationnel, dans lequel les
données sont stockées comme dans une base de données relationnelle, c'est-à-dire
des lignes et des colonnes dans l'entrepôt de données. Dans le modèle ROLAP, les données
sont présentes devant l'utilisateur sous la forme multidimensionnelle. Pour afficher les
données, dans une vue multidimensionnelle, une couche sémantique de métadonnées est
créée, laquelle mappe la dimension aux tables relationnelles. Les métadonnées prennent
également en charge l’agrégation des données.
16. MOLAP
MOLAP : est un modèle de traitement analytique en ligne multidimensionnel. Les
données utilisées pour l'analyse sont stockées dans des bases de données
multidimensionnelles spécialisées (MDDB). Les systèmes de gestion de base de données
multidimensionnels sont des systèmes logiciels propriétaires.
20
Chapitre 2 : Informatique décisionnelle
ROLAP MOLAP
Les données sont stockées sous forme de Les données sont stockées dans le grand tableau
tables relationnelles (Etoile, flocon de multidimensionnel composé de cubes de
Forme de données neige) données.
Stockage & Les données sont stockées et extraites de Les données sont stockées et extraites à partir
Récupération l’entrepôt de données principal. des MDDBs de la base de données propriétaire.
21
Chapitre 2 : Informatique décisionnelle
Pour un développeur BI :
Création d’une base de données source et ses différentes tables.
Création d’un entrepôt de données.
Création d’un cube OLAP.
Pour un décideur :
Génération des rapports de table de bord interactifs et dynamique permet aux clients
de mieux prendre des décisions afin de réduire le risque d’erreurs.
Il s'agit des besoins qui caractérisent le système. Ce sont des besoins en matière de
performance, de type de matériel ou le type de conception. Ces besoins peuvent concerner
les contraintes d'implémentation (langage de programmation, type SGBD, de système
d'Exploitation...).
La fiabilité.
La facilité d'utilisation (utilisabilité).
Le rendement et l'efficacité.
La maintenabilité.
La portabilité.
II. Conclusion
Ce chapitre est une étape très importante dans laquelle nous avons cité les principales
méthodes de recueil d’information. Puis nous avons élaboré une justification métier de la
méthode adoptée dans notre processus de spécification de besoins.
Nous allons passer à l’étape de conception de l’entrepôt de données qui fera l’objet du
chapitre suivant.
22
Chapitre 3 : Modélisation Conceptuelle
23
Chapitre 3 : Modélisation Conceptuelle
I. Introduction
La modélisation des données est l’élaboration des structures de données pour les données
qui seront enregistrées dans une BD. L’Objectif de la modélisation est de représenter la
réalité telle qu'elle est perçue par les utilisateurs.
Le processus de modélisation et la définition de son résultat sous forme d'un schéma
conceptuel est appelé conception de la base de données La qualité de la conception de la BD
est un facteur critique de réussite.
1. Méthodologie de travail
La méthode de Kimball débute par les besoins du client. Par la suite, la création de l’entrepôt
de données, tels que trois chemins sont empruntés en parallèles.
La conception de l’architecture technique : on choisit l’architecture technique et les outils
matériels et logiciels nécessaires pour la mise en place de l’entrepôt de données.
La modélisation dimensionnelle : on définit la modélisation dimensionnelle de l’entrepôt
et des magasins de données, et on définit les outils ETL.
Conception des applications BI : développement des applications décisionnelles tels que
les rapports, les tableaux de bord… Ces trois chemins convergent en fin du projet au
moment du déploiement. Le processus complet est répété pour chaque nouveau magasin de
données demandé par les utilisateurs finaux tout en assurant l’évolution et la maintenabilité
du système.
24
Chapitre 3 : Modélisation Conceptuelle
Cette méthode propose un ensemble d’étapes pour la définition des faits, des dimensions et
des hiérarchies à partir du schéma de la source. Le fait représente les événements fréquents
dans le monde de l’entreprise. Les dimensions sont formées à partir d’une portion du
schéma source qui dépend de la relation représentant le fait. Les attributs de cette portion
sont extraits puis réorganisés et épurés pour former les hiérarchies.
La méthode mixte est la combinaison des deux méthodes : ascendante et descendante. Elle
intègre à la fois les données des sources et les besoins des décideurs dans la définition du
modèle dimensionnel. En effet, elle résout les problèmes rencontrés dans les méthodes
précédentes pour répondre aux différents besoins utilisateurs en respectant les données
sources.
25
Chapitre 3 : Modélisation Conceptuelle
26
Chapitre 3 : Modélisation Conceptuelle
4. Méthode Ascendante
MntPECCLI = {SUM}
MntPECHO = {SUM}
27
Chapitre 3 : Modélisation Conceptuelle
Le graphe suivant représente les liens de dépendance fonctionnelle entre les classes
représentatives et les autres classes de la source de données
28
Chapitre 3 : Modélisation Conceptuelle
29
Chapitre 3 : Modélisation Conceptuelle
DimObservation
Les différentes observations de chaque client
DimFacture
Toutes les listes de factures
30
Chapitre 3 : Modélisation Conceptuelle
31
Chapitre 3 : Modélisation Conceptuelle
5. Méthode Descendante
Une conception descendante (Top/Down) est souvent assimilée à tort à de la conception en place.
Le principe de base de la conception descendante est de partir de la contrainte (environnement,
épure, lot de paramètres…) pour aller jusqu'à la définition des éléments les plus simples (les pièces).
32
Chapitre 3 : Modélisation Conceptuelle
Légende
33
Chapitre 3 : Modélisation Conceptuelle
Col N
Col N -1
Evol / %Evol
Ecart/% Ecart
Ratio
Balance
Recouvrement
Payant
AVG
Recouvrement
Taux Recouvrement
performance
Collection solde
PEC
Créance payant
Montant facturé
honoraire
Solde
honoraire/clinique
34
Chapitre 3 : Modélisation Conceptuelle
Fait Facture /
Fait Règlement /
35
Chapitre 3 : Modélisation Conceptuelle
36
Chapitre 3 : Modélisation Conceptuelle
6. Méthode Mixte
La méthode mixte est « un modèle de recherche qui implique de combiner les éléments
d'une approche ascendante et descendante à des fins de compréhension et de corroboration,
ses atouts s'inscrivent d'abord, dans des différents designs, aussi dans des stratégies
poursuivies.
Après avoir définies chacune des deux démarches ascendantes et descendantes nous avons
décidé de supprimer les dimensions « Bordeau_Envoi », « caisse », « Responsable » et
« avance-organisme » parce qu'ils ne sont pas utilisés lors de l’analyse des sujets.
En se basant sur le schéma source de la base du clinique , nous avons dégagées trois types
de fait au bout de laquelle nous aurons défini les mesures nécessaires la première concerne
le suivie de facture dont le but et de calculer les montants suivants : {Montant PEC :
montant prise en charge (payant/organisme), MontantPECCLI : montant prise en charge
clinique, Montant PECHO : montant prise en charge honoraire} par les dimensions
suivants : Responsable, client, société, PEC, Etat, clinique la deuxième concerne le suivie
règlement ou le but et de calculer le montant du règlement par les dimensions suivants :
société ,régler, facture, clinique, temps concernant la troisième c’est le suivie payant que
nous intéressent ou on va analyser le montant payant contentieux par les dimensions
suivants : Responsable, client, facture, société, observation.
Finalement notre schéma contient 3 faits et 8 dimensions chacune a une relation (1…*) on
choisit donc le schéma en constellation.
37
Chapitre 3 : Modélisation Conceptuelle
38
Chapitre 3 : Modélisation Conceptuelle
Conclusion
Après avoir appliqué les différentes démarches de la modélisation conceptuelle de l’entrepôt il
ne reste qu’à le construire ; qui fera l’objet du chapitre suivant.
39
Chapitre 4 : Conception et développement
de processus de L’ETL et l’enchainement
d’un cube OLAP
40
Chapitre 4 : Construction
I. Introduction
Dans ce chapitre, nous définissons les différentes phases de la construction de l’entrepôt de
données en détaillant la phase d’intégration des données où nous présentons la conception
et le développement de l’ETL
1. Conception de l’ETL
Les processus ETL représentent le cœur du projet décisionnel. La conception de ce processus
permet d’avoir une vision claire de cette phase et d’éviter les erreurs d’implémentation.
41
Chapitre 4 : Construction
2. Diagrammes d’activités
Le langage de modélisation unifié regroupe plusieurs sous-catégories de diagrammes,
notamment les diagrammes de structure, les diagrammes d'interaction et les diagrammes
comportementaux. Les diagrammes d’activités, ainsi que les diagrammes de cas d’utilisation et
d'états-transitions sont considérés comme des diagrammes comportementaux, car ils décrivent
ce qui doit arriver dans le système modélisé.
Ce diagramme présente la phase d’intégration générale qui consiste à récupérer les données
à partir de la source et à les charger dans la base de la destination.
42
Chapitre 4 : Construction
Les figures ci-dessous nous montrent les diagrammes d’activités du flux de contrôle et d’un
exemple d’une dimension :
43
Chapitre 4 : Construction
Description de la figure : Ce diagramme d’activité représente l’extraction des données d’une fait,
au niveau de la colonne dérivée nous avons utilisé la variable « clinique » puis la transformation
de recherche pour joignez les colonnes d’entrée aux colonnes de destinations, ensuite nous avons
fait des conditions pour nos mesures en utilisant le fractionnement conditionnel en effet s’il y a un
changement des données dans la source donc il y a une correspondance sinon le processus passe
directement au destination
44
Chapitre 4 : Construction
3. Développement de l’ETL
Les outils de développement exploités pour assurer la phase d’intégration des données sont
présentés ci-dessous :
Données géospatiales.
Est l'un des outils de gestion de SQL Server, quel que soit votre emplacement, utilisé pour
concevoir des requêtes et gérer des bases de données et des entrepôts de
données via un ordinateur personnel ou le Cloud.
45
Chapitre 4 : Construction
C’est pour cela nous avons décidé de créer notre entrepôt au niveau SQL SERVER mais tout
d’abord nous devons connecter au serveur
Après la connexion nous avons créé un entrepôt de données sous le nom du « projet pfe » en
effet cette entrepôt contient plusieurs tables qui définissent les dimensions et les faits.
46
Chapitre 4 : Construction
La figure ci-dessous montre notre serveur connecté et l’entrepôt de données qu’on a créé.
47
Chapitre 4 : Construction
Le package SSIS Comportent un flux de contrôle qui définit un flux de taches à exécuter, il
effectue des opérations telle que le chargement des données, l’exécution des instructions
SQL, gérer la gestion d'erreur, vérifier une condition et appelle les différentes tâches (y
compris les flux de données), etc.
48
Chapitre 4 : Construction
Notre source est une variable nommé « clinique », la propriété Valeur de la variable contient le
texte de la requête, nous définissons la propriété Valeur/Type de la variable en tant que type de
données String, puis nous tapons ou copions l’instruction SQL dans la propriété Value
Lorsqu’ on exécute l’ETL une boite de message s’affiche en indiquant le début d’exécution
de la 1ère base de données de la clinique dans la table « Sourcelist ». Finalement Lorsqu'un
flux de contrôle est terminé, il a échoué ou réussi.
Ce message est affiché suite a la l’execution d’une commande SQL qui
permet d’acceder a la bes de données de la table « sourceList ».
Figure 25 : Boite de
message
Tache de script :
Le conteneur de boucles Foreach définit un flux de
contrôle répétitif dans un package, il répète le flux de
contrôle pour chaque membre d'un énumérateur spécifié.
La boucle Foreach :
Le conteneur de boucles Foreach définit un flux de
contrôle répétitif dans un package, il répète le flux de
contrôle pour chaque membre d'un énumérateur spécifié.
49
Chapitre 4 : Construction
Au niveau de flux de données, nous avons configuré les étapes de l’ETL Pour les
dimensions et les faits
En effet, les paramètres permettent d’exposer à l’extérieur les parties variables de notre
solution.
50
Chapitre 4 : Construction
Les connexions contiennent les informations nécessaires pour ce connecté à une source de
données. Dans le cadre de notre projet, nous avons utilisé principalement cinq paramètres
pour chaque connexion :
- Le serveur.
- La base de données.
C’est pour ce but, on a opté de créer une base de connexions qui contient les différentes
connexions utilisées pour notre ETL
D’autre part, nous avons créé trois variables pour spécifier le nom de la base de données
source à parcourir ainsi que les chemins des bases de données à traiter et qui sont utilisées
par la suite comme paramètres pour la configuration de la boucle foreach.
51
Chapitre 4 : Construction
6. Flux de données
Le flux de données est le cœur de l’ETL SSIS. Il permet d’intégrer des données dans un
Data Warehouse, elle doit contenir au moins une source. Généralement elle contient aussi
une destination et plusieurs transformations reliées par des chemins d’accès au flux de
données qui véhiculent les lignes de données d’un composant à l’autre.
52
Chapitre 4 : Construction
Un flux de données peut inclure une ou plusieurs sources, la source d'un flux de données
comporte généralement une sortie normale. La sortie normale contient des colonnes de
sortie, qui sont les colonnes ajoutées par la source au flux de données.
La figure ci-dessus représente l’importation des données, en effet nous avons utilisé « la
source OLE DB » pour extraire les données de quelconque table et les chargées dans notre
entrepôt par l’outil « destination d’insertion ».
La Source OLE DB :
La source OLE DB extrait des données d'une série de bases
de données relationnelles compatibles OLE DB à l'aide
d'une table de BD d'une vue ou d'une commande SQL.
La destination OLE DB :
Charge des données dans différentes bases de données
compatibles OLE DB à l'aide d'une table ou d'une vue de
base de données ou d'une commande SQL.
Au niveau ce chargement nous avons incluent d’autres outils « colonne dérivée » qui
contient la variable « clinique » et « la dimension à variation lente » qui définit le type des
données et détecte la variation des attributs dimensionnels dans le temps, tous les attributs
sont de type modifiable.
53
Chapitre 4 : Construction
Au niveau de cette tache une requête SQL est générée permet de mettre à jour les données si l’Ya
une modification dans les données
La commande OLE DB :
Vous permettez d’exécuter une instruction SQL qui insère,
met à jour ou supprime des lignes dans une table de base
de données.
54
Chapitre 4 : Construction
55
Chapitre 4 : Construction
56
Chapitre 4 : Construction
Nous avons utilisé la transformation Recherche au niveau des trois faits pour effectuer des
recherches en joignant les données des colonnes d’entrées aux colonnes de l’entrepôt de
données référée, en effet nous avons fait une recherche sur le montant facturé à partir des
colonnes d’entrée aux colonnes de sorties
57
Chapitre 4 : Construction
7.1 Définition
Un cube est une structure multidimensionnelle qui contient des informations à des fins
analytiques ; les constituants principaux d'un cube sont des dimensions et des mesures. Les
dimensions définissent la structure du cube que vous utilisez pour la découpe, et les mesures
fournissent des valeurs numériques agrégées qui intéressent l'utilisateur final.
58
Chapitre 4 : Construction
Chaque dimension nécessite une hiérarchie qui permet de naviguer et d’agréger à différents
niveaux.
59
Chapitre 4 : Construction
60
Chapitre 4 : Construction
I. Conclusion
A travers ce chapitre nous avons définis la modélisation logique adoptée pour notre entrepôt,
celle d’après la modélisation physique pour aboutir à la construction réelle de l’entrepôt dont
nous avons définis la conception de l’ETL ensuit son développement. A ce stade-là, il ne reste
qu’à implémenter l’application d’interrogation de l’entrepôt de données.
61
Chapitre 5 : Restitution
62
Chapitre 5: Restitution
I. Introduction
La visualisation des données est la représentation des données à l'aide de graphiques
courants, tels que des graphiques, des tracés, des infographies et même des animations. Ces
affichages visuels d'informations communiquent des relations de données complexes et des
informations basées sur les données d'une manière facile à comprendre.
La visualisation des données peut être utilisée à diverses fins, et il est important de noter
qu'elle n'est pas uniquement réservée aux équipes de données. La direction s'en sert
également pour transmettre la structure et la hiérarchie organisationnelles, tandis que les
analystes de données et les spécialistes des données l'utilisent pour découvrir et expliquer
les modèles et les tendances.
Nous avons décidé de créer des rapports interactifs et des chartes graphiques à l’aide de
l’outil Microsoft Power BI avec des requêtes DAX qui prennent notre projet SSIS comme
source de données, et on utilisant le Microsoft EXCEL et qui prennent notre CUBE
multidimensionnelle comme source des données.
1. Définition
63
Chapitre 5: Restitution
La figure 5.3 ci-dessous montre les tables de faits et les dimensions a chargé
64
Chapitre 5: Restitution
3. Modelé
La vue Modèle affiche toutes les tables, colonnes et relations de votre modèle. Cette vue
peut être particulièrement utile lorsque votre modèle comporte des relations complexes
entre de nombreuses tables.
65
Chapitre 5: Restitution
66
Chapitre 5: Restitution
Titre
Gestion des rapports
Acteur
Chef services
Objectif
Permettre au Chef services de consulter quelques données au niveau
de la visualisation (il n’a pas tout droit à accéder à tous les tableaux
de bord)
Précondition
Post-condition
Le chef service voir les tableaux de bord qui sont destiné à lui.
Scenario nominal
Scenario alternatif
Le système affiche « Impossible d’ouvrir le visuel »
67
68
Chapitre 5: Restitution
Titre
Consultation des tableaux de bord.
Acteur
PDG de la clinique
Objectif
Permettre au PDG de la clinique de consulter le tableau de bord.
Précondition
Le PDG lance l’application et s’authentifie.
Post-condition
Le PDG explore les données.
Scenario nominal
- Le PDG accède à l’application.
Scenario alternatif
69
Chapitre 5: Restitution
5. Tableaux de bord
5.1 Power BI
5.1.1 Menu
Ce visuel donne une vision générale sur les mesures qu’on va analyser pour le groupe de
sante « AMEN SANTE » au niveau de ces six cliniques a Tunisie regroupé dans Cinq ville
« Beja, Bizerte, Marsa, Mutuelle-Ville, Nabeul »
Le Balance organisme.
Figure 45 : Menu
70
Chapitre 5: Restitution
71
Chapitre 5: Restitution
72
Chapitre 5: Restitution
73
Chapitre 5: Restitution
Ce rapport présente le montant Balance organisme et payant par clinique, état, client
et PEC
A travers ce rapport, le décideur peut avoir une vision globale sur :
La balance par clinique (Marsa a le nombre de balance le plus élevé)
En utilisant le visuel « Treemap ».
La balance par année durant 7 ans (de 2015 à 2021) en utilisant le visuel « Graphique
a barre empilé ».
La balance de chaque société dans la période de 7 ans en utilisant le visuel «
Matrice».
74
Chapitre 5: Restitution
6. Fonction DAX
75
Chapitre 5: Restitution
Fonction
Description
Renvoie une table avec une seule colonne nommée "Date" qui
contient un ensemble contigu de dates
CALENDARAUTO
76
Chapitre 5: Restitution
7. Visualisation Excel
Ce rapport donne une vision globale sur le Montant de facture dans les cliniques, en effet à
travers ce tableau de bord le décideur peut faire ses analyses en connaissant :
Le montant PEC (Prise en charge) facturé honoraire et par clinique en utilisant le graphe
« Histogramme Groupé ».
Le montant facturé pour chaque société, on a montré seulement les tops six sociétés qui ont
le montant le plus élevé en utilisant le « secteur ».
Le montant facturé pour chaque année durant les 11 dernières années (depuis 2010 à 2021)
en utilisant la « courbe ».
Le Montant facturé par Années, Trimestre, mois et par clinique pendant les 4 dernières
années en utilisant le « Tableau croisé ».
77
Chapitre 5: Restitution
Ce rapport donne une vision globale sur Le montant par clinique, société et par PEC, en effet
à travers ce tableau de bord le décideur peut faire ses analyses en connaissant :
Le montant règlement par année, trimestre, mois et clinique pendant les 3 derniers ans en
utilisant le « tableau croisé ».
Le montant règlement par année pendant les 12 dernières années depuis (2005 à 2021) en
utilisant « la courbe ».
Le montant règlement par PEC (par organisme & par payant) en utilisant « l’histogramme
groupé ».
La figure ci-dessous montre le règlement par organisme et payant
78
Chapitre 5: Restitution
Ce rapport donne une vision globale sur flux payant contentieux par clinique, société et par
PEC, en effet à travers ce tableau de bord le décideur peut faire ses analyses en connaissant :
Le flux payant par années durant chaque 2 année depuis (1998 à 2020).
II. Conclusion
Dans ce chapitre nous avons présenté la modélisation de l’application BI ainsi que son
développement à travers l’enchainement des différentes interfaces d’analyses décisionnelles.
79
CONCLUSION GENERALE
L’environnement concurrentiel dans lequel évolue notre société aujourd’hui, exige une
surveillance très étroite du marché afin de ne pas se laisser distancer par les concurrents et cela
en répondant, le plus rapidement possible, aux attentes du marché, de leur clientèle et de leurs
partenaires. Dans ce contexte, le suivi des mesures n’est pas une question de gain ou de perte,
c’est une question de survie. En réponse à ces besoins, les systèmes décisionnels sont définis
afin d’offrir aux décideurs une assistance dans leur processus d’aide à la décision.
Tout au long de notre travail de conception et de réalisation, nous avons suivi une
démarche mixte, alliant de ce fait entre deux approches connues dans le domaine de
l’entreposage de données, à savoir l’approche descendante (guider par le besoin d’analyse) et
l’approche ascendante (guidé par la source de données). Cette démarche a permis de répondre
aux attentes et besoins des utilisateurs tout en exploitant au mieux les données générées par le
système opérationnel de manière à anticiper sur des besoins non exprimés. Dans un deuxième
temps, la modélisation de la zone de stockage des données s’est faite grâce aux principes de la
modélisation multidimensionnelle en adoptant un schéma en étoile.
La partie ETL, a été la partie du projet la plus fastidieuse et consommatrice en temps. Cette
étape nous a permis de concevoir et de réaliser les routines d’extraction, transformation et
chargement des données sous l’outil SSIS de SQL Server.
Étant basé sur un entrepôt de données, notre système d’aide à la décision est ouvert aux futures
évolutions :
80
Bibliographie
81