Académique Documents
Professionnel Documents
Culture Documents
Data Marts
EXTRACTION
• Extraire les données de leur environnement
d’origine (bases de données relationnelles, fichiers
plats, …).
• Utiliser une technique appropriée pour n ’extraire
que les données nécessaires : données créées ou
modifiées depuis la dernière opération d’extraction.
Architecture d’un Data
warehouse
2 Opérations sur les données
TRANSFORMATION
• Une même donnée peut avoir une structure ou une valeur différente
en fonction de la base (production, externe, utilisateurs) dont elle
provient.
• On peut être confronté à des redondances (un même client peut
apparaître avec différents attributs et propriétés selon la source
consultée).
• Il faut supprimer certaines données aberrantes qui risqueraient de
fausser les analyses.
• Il faut donc épurer et transformer les données.
Architecture d’un Data
warehouse
2 Opérations sur les données
CHARGEMENT/RAFRAICHISSEMENT
• Effectuer sur les données des opérations de calcul et d’agrégation.
• Remplacer certaines bases si aucune solution d’extraction satisfaisante n’est
possible.
• Mettre en place des procédures de chargement et de restauration (en cas de
problème).
• Typiquement, la fréquence du chargement est quotidienne et il est effectué
en tout début de matinée.
• Si la disponibilité du système ne peut être interrompue, envisager la mise en place
de systèmes redondants.
Architecture d’un Data warehouse
2 Opérations sur les données
LES OUTILS
• On peut automatiser tout ou partie des opérations
décrites.
• Des outils sont disponibles : Extract d’ETI, SIS de
MICROSOFT, SAS/Warehouse Administrator de
SAS…
• Le développement d’outils spécifiques est
envisageable mais risque d ’alourdir les tâches.
Architecture d’un Data warehouse
3 Dictionnaire de Données
Exemple:
– Temps: année→ mois→Trimestre→ semaine → jour →heure;
– Produit: famille→ catégorie→ marque→ produit;
– Lieu: pays→ province→région→ ville→ code→ postal.
Dimension Temps
Centrale car la plupart des faits correspondent à des
événements d'affaires de l'entreprise;
Le modèle en étoile
Le modèle en étoile
➢ Une (ou plusieurs) table(s) de faits : identifiants des tables de
dimension ; une ou plusieurs mesures .
➢ Plusieurs tables de dimension : descripteurs des dimensions.
Avantages :
Facilité de navigation
Performances : nombre de jointures limité .
Gestion des agrégats
Fiabilité des résultats
Inconvénients :
♦ Toutes les dimensions ne concernent pas les mesures
♦ Redondances dans les dimensions
♦ Alimentation complexe.
Propriétés des mesures
Heures
Analyse : consommation
d'essence,
Qte
commandée,
Qte précommandée,
kilométrage,nombre de visites,
etc.
Exemple 1
Exemple 2
12000
4000
PRODUIT
Analyse Multidimentionnelle
1- obtenir des informations déjà agrégées selon les besoins de l’utilisateur.
2- simplicité et rapidité d’accès
3- capacité à manipuler les données agrégées selon différentes dimensions
4- un cube utilise les fonctions classiques d’agrégation : min, max, count, sum,
avg, mais peut utiliser des fonctions d’agrégations spécifiques.
Analyse Multidimentionnelle
Analyse Multidimentionnelle
LES DIMENSIONS
LES VARIABLES
Date
NumFou 2021 350 600 300
2020 300 500 400
250 200 F2
NumPro 2019
F1
P1 P2 P3
La granularité des dimensions
Temps Jours Mois Trimestres Années
Le multidimensionnel
Exemple
Montant des ventes fonction de (Mois, région, Produit)
Magasin Jour
Mois
Le multidimensionnel
La navigation multidimensionnelle
Projection en 2 dimensions Coupe d ’un cube
Produits Produits
pour une région donnée
CA CA
Région
Temps en semaines
Réduction selon 1 dimension
Zoom selon une dimension
Produits
France