Académique Documents
Professionnel Documents
Culture Documents
Data Marts
EXTRACTION
• Extraire les données de leur environnement
d’origine (bases de données relationnelles, fichiers
plats, …).
• Utiliser une technique appropriée pour n ’extraire
que les données nécessaires : données créées ou
modifiées depuis la dernière opération d’extraction.
Architecture d’un Data
warehouse
2 Opérations sur les données
TRANSFORMATION
• Une même donnée peut avoir une structure ou une valeur différente
en fonction de la base (production, externe, utilisateurs) dont elle
provient.
• On peut être confronté à des redondances (un même client peut
apparaître avec différents attributs et propriétés selon la source
consultée).
• Il faut supprimer certaines données aberrantes qui risqueraient de
fausser les analyses.
• Il faut donc épurer et transformer les données.
Architecture d’un Data
warehouse
2 Opérations sur les données
CHARGEMENT/RAFRAICHISSEMENT
• Effectuer sur les données des opérations de calcul et d’agrégation.
• Remplacer certaines bases si aucune solution d’extraction satisfaisante n’est
possible.
• Mettre en place des procédures de chargement et de restauration (en cas de
problème).
• Typiquement, la fréquence du chargement est quotidienne et il est effectué
en tout début de matinée.
• Si la disponibilité du système ne peut être interrompue, envisager la mise en place
de systèmes redondants.
Architecture d’un Data warehouse
2 Opérations sur les données
LES OUTILS
• On peut automatiser tout ou partie des opérations
décrites.
• Des outils sont disponibles : Extract d’ETI, SIS de
MICROSOFT, SAS/Warehouse Administrator de
SAS…
• Le développement d’outils spécifiques est
envisageable mais risque d ’alourdir les tâches.
Architecture d’un Data warehouse
3 Dictionnaire de Données
Exemple:
– Temps: année→ mois→Trimestre→ semaine → jour →heure;
– Produit: famille→ catégorie→ marque→ produit;
– Lieu: pays→ province→région→ ville→ code→ postal.
Dimension Temps
Centrale car la plupart des faits correspondent à des
événements d'affaires de l'entreprise;
Le modèle en étoile
Le modèle en étoile
➢ Une (ou plusieurs) table(s) de faits : identifiants des tables de
dimension ; une ou plusieurs mesures .
➢ Plusieurs tables de dimension : descripteurs des dimensions.
Avantages :
Facilité de navigation
Performances : nombre de jointures limité .
Gestion des agrégats
Fiabilité des résultats
Inconvénients :
♦ Toutes les dimensions ne concernent pas les mesures
♦ Redondances dans les dimensions
♦ Alimentation complexe.
Propriétés des mesures
Heures
Analyse : consommation
d'essence,
Qte
commandée,
Qte précommandée,
kilométrage,nombre de visites,
etc.
Exemple 1
Exemple 2