Académique Documents
Professionnel Documents
Culture Documents
Chapitre 1 -
Systèmes décisionnels et
entrepôts de données
Master Systèmes d’Information et Génie Logiciel
Année académique - 2020/2021
Laetitia MOUAFO
Historique – générations de SGBD
2
Historique – Applications
3
Historique – Applications
4
Historique – Structure et Type de données
5
Historique – Exemples de SGBD
6
7
L’information
• en 2000 :
• entre 1 et 2 ExaOctets par année (1 Eo =
220 To)
• 90% électronique
• taux de croissance annuel de 50 %
• en 2003 : 5 Eo en 2002, 92% électronique
Extracteur
Integrateur
Referentiel
Extracteur
Entrepôt de
données
Extracteur
Sources Décideurs
Des bases de données aux entrepôts de données
Entrepôt de données : définition
16
• Exemples :
• Dans les bases de données opérationnelles : assurance vie,
assurance automobile, paye, facturation.
• Pas de suppressions.
• Nécessité d’un référentiel de temps.
• L’historisation permet
• l’extrapolation,
• la mesure de l’impact d’une décision par comparaison
de la situation avant et après la mise en application de
cette décision.
• Exemple :
• Suivi des évolutions des comportements des clients.
« Agrégées »
• 20
Niveau de granularité.
•Exemple :
• Stockage de tous les appels téléphoniques pour un client
APPEL_TELEPHONIQUE (n° client, horo-date, durée,
correspondant, étranger, etc...)
(300 clients, 200 tuples par client, 60000 tuples d’appels).
• Stockage agrégé par client sur 1 mois
APPEL_TELEPHONIQUE (n° client, mois, nombre
d’appel, durée moyenne, nombres d’appels vers l’étranger)
(300 tuples d’appels).
« Prise de décision »
21
• Les systèmes " opérationnels " (ou de " production
", ou de " gestion " ) sont dédiés aux métiers de
l’entreprise pour les assister dans leurs tâches de
gestion quotidiennes (et directement opérationnels).
Enterprise Resource Planning
• Les systèmes " décisionnels " sont dédiés au
management de l’entreprise pour l’aider au pilotage
de l’activité (et indirectement opérationnels).
Ils offrent au décideur une vision transversale de
l’entreprise.
DataWarehouses
Architecture des DWH
22
Architecture DWH multi-tiers
23
Quelques Exemples
24
• Suivi du comportement de la clientèle dans les télécommunications
• Nombre moyen d’heures par mois et par région,
• répartition des appels clients sur la semaine,
• Répartition des appels clients sur la journée,
• nombre moyen d’appels représentant 20% d’une facture,
• Durée moyenne d’une communication urbaine,
• Durée moyenne d’une communication internationale.
• Suivi du marché (lignes installées, désinstallées, services choisis, répartition
géographique)
• Comportement du réseau (pannes)
Quelques Exemples
25
• Quel est le volume des ventes par produit, par région, pour le 3ième
trimestre 2009 ?
• Quel est le volume des ventes de produits laitiers, pour la région
parisienne, par an, pour les 5 dernières années ?
• Quel est le type de produits dont les ventes baissent constamment
dans les 6 derniers mois de l’année en cours ?
• Est-ce qu’une baisse de 10% ferait redémarrer les ventes de
disques ?
Différences transactionnel / décisionnel
26
Transactionnel Décisionnel
Données - sur une période courte - historisées
- détaillées - agrégées
- personnelles - peuvent être anonymes
- mises à jour - recalculées
- temps de validité, de - temps de validité, de
transaction transaction, d’extraction
Traitements - requêtes simples - requêtes complexes
- répétitives - variées
- très sensible aux - échelle de performance
performances différente
Différences transactionnel / décisionnel
27
Transactionnel Décisionnel
Conception - orientée fonction - orientée sujet
- relativement statique - évolutif
Utilisateurs - agents opérationnels - manager
Nbres d’ utilisateurs
- milliers - centaines
tuples accédés - dizaines/centaines - millions
• Exercice 1
VOITURE NUM COULEUR VOITURE NUM COULEUR
1 AZUR 1 BLEU
2 VIOLET 2 BLEU
4 VERT 3 ROUGE
4 VERT
Source 1
Source 2
Intégration ?
L’intégration des données
36
• Exercice 2
ETUDIANT NUM NOM SEXE POIDS
1 JEAN 1 54,2
Source 1
2 LAURA 2 65,6
3 HENRI 1 48,4
Intégration ?
L’intégration des données
37
• Exercice 3
ETUDIANT NUM NOM ADRESSE
1 JEAN 4 AV GAL DE
GAULLE
2 SOPHIE 13 AV DES
TILLEULS
3 PAUL
2 principales utilités
• Pour analyser ces données, on peut par exemple placer les mois en
ligne et les catégories en colonne.
• Si l ’on veut comparer les ventes par rapport aux catégories, par
magasin et par mois. Il devient difficile de dessiner un simple
tableau.
• On parle alors de cube
Représentation graphique
47
multidimensionnelle
Toutes les ventes pour un magasin
48
Toutes les ventes d’une catégorie d’article
49
Toutes les ventes d’un mois
50
Les ventes d’un mois pour une
51
catégorie dans un magasin
Le modèle multidimensionnel
52
• Souvent appelé modèle OLAP (On Line
Analytical Processing) (Codd, 1993).
• Présenté comme une alternative au modèle
relationnel.
• Correspond mieux aux besoins du décideur.
• "Orienté sujet".
• " Cube" centré sur une activité.
• Exemple : vente.
Les faits
53
• Un cube relate un fait. L’activité est caractérisée par des
faits qui se produisent (événements).
• Exemples :
• fait de vente,
• fait de notation,
• fait de passage de transaction boursière,
• fait de consultation médicale,
• fait de dépense dans un hôpital,
• fait d’absence de cours,
• fait de marquage de but,
• fait de fréquentation d’un cinéma.
Les indicateurs
54
• Les faits sont quantifiés par des indicateurs, également appelés
"métriques", ou "mesures", ou "variables".
• Par exemple le fait de vente se caractérise par la quantité vendue et le
montant de la vente.
• Ce sont les cellules du cube. Les indicateurs représentent une
quantité mesurable, un fait observé.
• Chaque indicateur a une fonction d’agrégat (on peut les additionner,
ou calculer le minimum, ou la moyenne).
• Ils sont généralement numériques et additifs :
Le montant des ventes est additif (se somme sur toutes les
dimensions), le niveau du stock est semi-additif (se somme sur les
produits, mais pas sur le temps), la moyenne de fréquentation est
non additive.
Les indicateurs
55
• Exemples :
• CA par produit/agence/dans le temps,
• coût moyen d’une hospitalisation par pathologie,
• le nombre de visiteurs moyens dans un établissement,
• taux d’occupation des lits,
• nombre d’articles en stock,
• satisfaction,
• taux de remplissage des avions par vol,
• temps d’attente moyen au supermarché,
• nombre de connexions sur un site web,
Les indicateurs
56
clé_produit
description
Temps marque
Fait de Vente
catégorie
clé_temps sous_catégorie
heure clé_temps
clé_produit couleur
jour taille
semaine clé_magasin
mois
année montant_ventes
férié quantité_vendue Magasin
événement
clé_magasin
adresse
ville
département
secteur_vente
surface
Modélisation en flocons
59
Produit Sous_catégorie
clé_produit clé_sous_catégorie
description sous_catégorie
Temps marque catégorie
Fait de Vente clé_sous_catégorie
clé_temps couleur
heure clé_temps taille
jour clé_produit
semaine clé_magasin
mois
année montant_ventes Magasin
quantité_vendue Localisation
férié
événement clé_magasin clé_localisation
clé_localisation adresse
secteur_vente ville
surface département
clé_produit
description
Temps marque
Fait de Vente clé_sous_catégorie
clé_temps couleur
heure clé_temps taille
jour clé_produit
semaine clé_magasin
mois
année montant_ventes Magasin
férié quantité_vendue
événement clé_magasin
clé_localisation
secteur_vente
surface