Vous êtes sur la page 1sur 10

Systèmes d'information décisionnels

Business Intelligence: BI

Cours:
• Systèmes Transactionnels et systèmes décisionnels
• ETL Extract-Transform-Load
• Datawarehouse
• DataMart
• Systèmes OLAP
• Cube et Hypercube
La Chaine Décisionnelle

Planification ETL Stockage Analyse Restitution


La Chaine Décisionnelle

ETL : Extract, Transform, Load


Extraction des données a partir d’une ou plusieurs
sources de
données : fichiers texte, Excel, base de données...
Transformation des données agrégées
Chargement des données dans la banque de
données de destination (datawarehouse)

La phase d’ETL est incontournable car elle


conditionne et influence la qualité du projet par la
ETL suite
Question
Pourquoi est-il nécessaire de faire l’intégration des données?

 Les problèmes des sources de données diverses;


 Sources sur différentes plateformes et OS;
 Applications utilisant des BD et autres technologies obsolètes;

 Structure des systèmes sources changeante dans le temps;


 Incohérence entre les différentes sources;
 Données dans un format difficilement interprétable ou ambigu.

 Historique de changement non-préservé dans les sources (entrepôt


de données);
 Qualité de données douteuse et changeante dans le temps;
Alimentation par l’ETL

 Transférer des données du système opérationnel vers le DW

 Tâche complexe: 60 à 90 % de la charge totale d’un projet DW

 Nécessite la collaboration avec l’administrateur des bases de productions

 Il est indispensable de déterminer:

 Quelles données seront chargées

 Les transformations et les vérifications nécessaires

 La périodicité et le moment de transferts des données


ETL : EXTRACT, TRANSFORM LOAD

 Extraction de données de tous types (Excel, fichier plat ou CSV, BDD,


etc…)

 Transformation de données (Création de colonnes, changement de type,


Jointure de tables)

 Chargement de données (Chargement dans l’entrepôt de données ou


des fichiers)
Extraction

 Depuis les bases sources

 Périodique et Répétée

 Dater ou marquer les données envoyées

 Difficulté: Ne pas perturber les applications OLTP


Transformation

But : Rendre les données cibles homogènes et puissent être


traitées de façon cohérente.

 Unification des modèles

 Convertir / uniformiser les noms des attributs

 Uniformiser les valeurs d ’attributs

 Nettoyer ( Valeurs manquantes, aberrantes…)


Chargement: Load

Caractéristiques:

 Ca consiste à charger les données nettoyées et préparées

 Une longue opération

 Mettre en place des stratégies pour assurer de bonnes


conditions à sa réalisation

 Définir la politique de rafraîchissement.

 Une phase mécanique


Outils ETL utilisé

Autres outils ETL sur le marché

Oracle Corporation, Warehouse builder,

IBM, Websphere Datastage

Business Objects

Vous aimerez peut-être aussi