Académique Documents
Professionnel Documents
Culture Documents
Définition
✓ Système d'information décisionnel: Entrepôts de données ou
Datawarehouse
Comment ?
Pr. A. ELOUARDIGHI
Présentation Générale
3
➢Connexion
➢Accès simple
✓ Etc...
Pr. A. ELOUARDIGHI
Présentation Générale
4
Pr. A. ELOUARDIGHI
Présentation Générale
5
Exploitation:
✓ Interrogation
✓ Analyses
✓ Prévision
Pr. A. ELOUARDIGHI
Architecture générale d’un Système
décisionnel
6
Pr. A. ELOUARDIGHI
Objectifs du cours
7
Pr. A. ELOUARDIGHI
Plan du cours les entrepôts de données
(Datawarehouse)
8
Pr. A. ELOUARDIGHI
9
Partie1:
Notions et architectures des entrepôts de
données
Pr. A. ELOUARDIGHI
Plan
10
❖ Motivations
❖ Les concepts des entrepôts de données
❖ Différence entre OLAP et OLTP
❖ Définition et caractéristiques d’un entrepôt de données
❖ Notions de magasin de données ( Datamart)
❖ Architecture d’un entrepôt de données
Pr. A. ELOUARDIGHI
Le contexte et les motivations
11
Pr. A. ELOUARDIGHI
Les données utilisables par les décideurs
12
Pr. A. ELOUARDIGHI
Problématique
13
Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
14
❑ Systèmes transactionnels
✓ Outils traditionnels de gestion et d’exploitation de données transactionnel
ou OLTP (On-Line Transaction Processing)
✓ L’exploitation de données est tourné vers la saisie, le stockage, la mise à
jour, la sécurité et l’intégrité des données.
✓ Les systèmes transactionnels sont développés pour gérer des transactions
quotidiennes
Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
15
❑ Systèmes transactionnels
✓ Ces systèmes supportent habituellement des applications particulières
telles que les inventaires de magasins, les réservations d’hôtel, etc…
Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
16
✓ Effacement
✓ Mise à jour des enregistrements
✓ Requêtes simples
✓ Interrogations et modifications fréquentes des données par de nombreux
utilisateurs
Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
17
❑ Systèmes décisionnels:
✓ Le terme décisionnel « Business Intelligence (BI) » couvre l'ensemble
des technologies permettant de collecter, consolider, modéliser et
restituer les données , en vue d'offrir une aide à la décision.
✓ SI capable d'agréger les données internes ou externes et de les
transformer en information servant à une prise de décision rapide.
❑ SI capable de répondre à certains types de questions:
✓ Quelles sont les ventes du produit X pendant le trimestre A de l'année B
dans la région C ?
✓ Comment se comporte le produit X par rapport au produit Y?
✓ Quel type de client peut acheter le produit X?
✓ Est-ce qu'une baisse de prix de 10% par rapport à la concurrence ferait
redémarrer les ventes du produit X ?
Pr. A. ELOUARDIGHI
Applications transactionnelles v.s
Applications décisionnelles
18
Pr. A. ELOUARDIGHI
Différence entre OLTP et OLAP
19
Actuelles Historiques
Données
Détaillées Résumées, agrégées
Peuvent être mises à jour Pas de mises à jour
Accessibles de façon individuelle Accessibles de façon ensembliste
Pr. A. ELOUARDIGHI
Incompatibilités des deux activités
20
Pr. A. ELOUARDIGHI
Naissance des entrepôts de données
21
Pr. A. ELOUARDIGHI
Datawarehouse : Définition
22
Pr. A. ELOUARDIGHI
Caractéristiques des données d'un entrepôts
de données
23
❑ Orientées sujet:
✓ Organisées autour de sujets ou thèmes majeurs de l’entreprise
✓ Données pour l’analyse et la modélisation en vue de l’aide à la décision,
et non pas pour les opérations et transactions journalières
❑ Intégrées:
✓ Construit en intégrant des sources de données multiples et hétérogènes
➢ BD relationnelles, fichiers, enregistrements de transactions
✓ Les données doivent être mises en forme et unifiées afin d’avoir un état
cohérent
✓ Phase la plus complexe (60 à 90 % de la charge totale d’un projet BI)
Pr. A. ELOUARDIGHI
Caractéristiques des données d'un entrepôts
de données
24
❑ Historisées:
✓ Stockage de l'historique des données, pas de mise à jour
❑ Non volatiles:
✓ Conséquence de l’historisation
✓ Pas de mises à jour des données dans un entrepôt de données
Pr. A. ELOUARDIGHI
Données multidimensionnelles
25
❑ Notion de dimension
✓ C’est une catégorie linguistique selon laquelle les données sont
organisées:
➢ Nom de la dimension (Date)
➢ Valeurs de la dimention ( Année, Trimestre, Mois, Semaine)
Pr. A. ELOUARDIGHI
Représentation
26
Pr. A. ELOUARDIGHI
…Autres représentation
27
Info 5 12 18
Phys 5 8 12
Philo 18 9 22
Droit 7 15 25
Pr. A. ELOUARDIGHI
…Autres représentation
28
1998
30
25
20
15
10
5
Pr. A. ELOUARDIGHI
Notion de Datamart
29
❑ Définition:
« C'est un sous-ensemble de données dérivées de l’entrepôt de
données ciblé sur un sujet unique».
Pr. A. ELOUARDIGHI
Les différents types de Datamart
30
✓ Datamart dépendant
➢ Les données sont extraites des systèmes OLTP et stockées
en premier lieu dans l’entrepôt de données
➢ L’entrepôt de données alimente les datamarts avec les
données
Pr. A. ELOUARDIGHI
Les différents types de Datamart
31
✓ Datamart indépendant
➢ Les datamarts sont alimentés directement a partir des
systèmes OLTP.
➢ Adapté pour les petites organisations
Pr. A. ELOUARDIGHI
Les différents types de Datamart
32
✓ Datamart hybride
➢ Les datamarts sont alimentés a partir de l’entrepôt de
données et des systèmes OLTP.
Pr. A. ELOUARDIGHI
Architecture générale d’un Système
décisionnel
33
Pr. A. ELOUARDIGHI
Les flux de données
34
❑ Flux entrant:
✓ Extraction: multi-source, hétérogène
✓ Transformation: filtrer, trier, homogénéiser, nettoyer etc…
✓ Chargement: insertion des données dans l’entrepôt
❑ Flux sortant:
✓ Mise à disposition des données pour les utilisateurs finaux
Pr. A. ELOUARDIGHI
Les différentes zones de l’architecture
35
Pr. A. ELOUARDIGHI
Les différentes zones de l’architecture
36
Pr. A. ELOUARDIGHI
Exemple: un entrepôt dans les télécoms
38
❑ Sujets
✓ Comportement de la clientèle
✓ Comportement du réseau
❑ Historique
✓ 1 an pour le comportement de la clientèle
❑ Sources
✓ Fichiers clients élaborés par les agences
✓ Fichiers de facturation
Pr. A. ELOUARDIGHI
Exemple de Requêtes (comportement clientèle)
39
Pr. A. ELOUARDIGHI
Quelques domaines d’application du
décisionnel
40
✓ Banque: Risques d’un prêt, profils des solvables et des non solvables
Pr. A. ELOUARDIGHI
Bilan Partie 1
41
Pr. A. ELOUARDIGHI
42
Partie 2 :
OLAP et Analyse multidimensionnelles
Pr. A. ELOUARDIGHI
Plan
43
❖ Concepts OLAP
❖ Vue multidimensionnelles
❖ Niveaux d’agrégations
❖Hiérarchie des dimensions
Pr. A. ELOUARDIGHI
Concepts OLAP
44
Pr. A. ELOUARDIGHI
Vue multidimensionnelle
45
Pr. A. ELOUARDIGHI
Vue multidimensionnelle
46
Pr. A. ELOUARDIGHI
Agrégation des données
47
Taille de l’entrepôt
Pr. A. ELOUARDIGHI
Hiérarchie des dimensions
48
Pr. A. ELOUARDIGHI
Les différents types d’hiérarchies
49
Pr. A. ELOUARDIGHI
Les différents types d’Hiérarchies
50
Pr. A. ELOUARDIGHI
Les différents types d’Hiérarchies
51
Pr. A. ELOUARDIGHI
OLAP et le principe d’agrégation
52
Pr. A. ELOUARDIGHI
Bilan Partie 2
53
✓ L’approche Multidimensionnelle
✓ Granularité et les niveaux d’agrégation
✓ Hiérarchie des dimensions
Pr. A. ELOUARDIGHI
54
Partie 3:
Modélisation et Conception d’un entrepôt
de données
Pr. A. ELOUARDIGHI
Plan
55
Pr. A. ELOUARDIGHI
Conception d’un entrepôt de données
56
Pr. A. ELOUARDIGHI
Conception d’un entrepôt de données
57
Pr. A. ELOUARDIGHI
Partie 3:
Modélisation et Conception d’un entrepôt de données
58
Pr. A. ELOUARDIGHI
Etude préalable
59
Pr. A. ELOUARDIGHI
Etude préalable
60
Pr. A. ELOUARDIGHI
Etude préalable
61
Pr. A. ELOUARDIGHI
Etude préalable
62
Pr. A. ELOUARDIGHI
Etude préalable
63
❑ Coûts de déploiement:
✓ Nécessite des machines puissantes, souvent une machine parallèle
Pr. A. ELOUARDIGHI
Modèles de données
65
❑ Niveau conceptuel:
✓ Un entrepôt de données est basé sur une modélisation
multidimensionnelle qui représente les données dans un cube
➢ Tables de dimensions
➢ La table des faits contient les mesures et les clés des dimensions
Pr. A. ELOUARDIGHI
Table de faits
66
Pr. A. ELOUARDIGHI
Table de faits (suite)
67
❑ Fait:
✓ Ce que l’on souhaite mesurer
✓ Trois types de faits:
➢ Additif
➢ Semi additif
➢ Non additif
Pr. A. ELOUARDIGHI
Typologie des faits
68
❑ Additif:
✓ Additionnable suivant toutes les dimensions
✓ Peut être le résultat d’un calcul:
✓ Exemple:
➢ Quantités vendues, montant des ventes…
➢ Bénéfice = montant vente – coût
❑ Semi additif:
✓ Additionnable suivant certaines dimensions
✓ Exemple: Solde d’un compte bancaire:
➢ Pas de sens d’additionner sur les dates
➢ Σ sur les comptes: on connaît ce que nous possédons en banque
❑ Non additif:
✓ Non additionnable quelque soit la dimension
✓ Exemple: Prix unitaire
Pr. A. ELOUARDIGHI
Table de dimension
69
✓ Axe d’analyse selon lequel vont être étudiées les données observables
(faits)
✓ Contient le détail des dimensions
Pr. A. ELOUARDIGHI
Les schémas de référence
70
❑ Niveau Logique:
✓ Un schéma donne la description logique de toute la base de données
✓ Plusieurs schémas types sont proposés pour représenter un entrepôt de
données:
➢ Schéma en étoile;
➢ Schéma en flocon;
➢ Schéma en constellation.
Pr. A. ELOUARDIGHI
Les schémas de référence
71
❑ Schéma en étoile:
✓ Une table de faits : identifiants des tables de dimension ; une ou
plusieurs mesures .
✓ Plusieurs tables de dimension : descripteurs des dimensions.
Pr. A. ELOUARDIGHI
Les schémas de référence
72
❑ Schéma en flocon:
✓ Raffinement du schéma étoile avec des tables normalisées par
dimensions.
Pr. A. ELOUARDIGHI
Les schémas de référence
73
❑ Schéma en constellation
✓ Consiste à fusionner plusieurs modèles en étoile utilisant des
dimensions communes ou conforme
✓ Un modèle en constellation comprend donc plusieurs tables de faits et
des tables de dimensions communes ou non à ces tables de faits.
Pr. A. ELOUARDIGHI
Partie 3:
Modélisation et Conception d’un entrepôt de données
74
Pr. A. ELOUARDIGHI
Alimentation
75
Pr. A. ELOUARDIGHI
Alimentation
76
Pr. A. ELOUARDIGHI
Extraction
77
❑ Extraction:
✓ Depuis différentes sources: Base de données, Fichiers plats, etc …
✓ Utilisation divers connecteurs : ODBC, JDBC etc …
✓ Périodique et répétée
✓ Difficulté:
➢ Ne pas perturber les applications OLTP
Pr. A. ELOUARDIGHI
Transformation
78
✓ C’est une suite d’opérations qui a pour but de rendre les données
cibles homogènes et puissent être traitées de façon cohérente.
➢ Unification des modèles
➢ Convertir / uniformiser les noms des attributs
➢ Uniformiser les valeurs d ’attributs
➢ Nettoyer ( Valeurs manquantes, aberrantes…)
Pr. A. ELOUARDIGHI
Chargement
79
Pr. A. ELOUARDIGHI
Définition d’un ETL
80
Pr. A. ELOUARDIGHI
Outils ETL
81
Pr. A. ELOUARDIGHI
Partie 3:
Modélisation et Conception d’un entrepôt de données
82
Pr. A. ELOUARDIGHI
Restitution
83
✓ Tableaux de bord
Pr. A. ELOUARDIGHI
Restitution
84
Pr. A. ELOUARDIGHI
Bilan Partie 3
85
Pr. A. ELOUARDIGHI