Académique Documents
Professionnel Documents
Culture Documents
Évolution de l’entrepôt de
données
Architecture de l’information 30-722-17
Agenda — Séance 8
Évolution de l’entrepôt de données
1. Introduction
3. Travail en équipe
2 30-722-17
Les séances de formation
30-722-17 Architecture de l’information
Partie 1 Partie 2
Partie 3
Les fondements de la gestion des S'initier aux principaux
composants de l'architecture de Comprendre la gestion des
données et de l'architecture
référence d'information données
d'information
3 30-722-17
Ce que nous allons faire aujourd’hui
4 30-722-17
Introduction
30-722-17 5
Gestions des données analytiques
DMBOK
6 30-722-17
Petite histoire des
entrepôts de données et
de l’analytique
Évolution de l’entrepôt de données
30-722-17 7
Petite histoire des entrepôts de données et de
l’analytique
• Fin des années 80 le concept « Business Data Warehouse » est décrit par Barry Devlin et
Paul Murphy [1].
• Se veut une suite logique de l’arrivée des bases de données relationnelles
• Automatisation des opérations dans plusieurs systèmes
• Besoin de rendre les données structurées plus facilement accessibles pour produire des
rapports
• Début des années « 90 »; deux philosophies en émergence
• 1990; Red Brick Warehouse, un système de base de données spécifiquement pour les
entrepôts de données est créé par Ralph Kimball.
• Nouveau type d’index, le Star Index, pour les schémas en étoile (dimensionnel)
[1] « An architecture for a business and information system », Barry A. Devlin et Paul T. Murphy,
8 IBM System Journal, Vol 27 No.1, 1988 30-722-17
L’entrepôt de données
Deux philosophies d’architecture
9 30-722-17
Exemple de modélisation de données
NORMALISÉ DIMENSIONNEL
10 30-722-17
Architecture classique d’entrepôt de données et
d’analyse décisionnelle
• Obtenir une seule version de la vérité pour l’entreprise
• Capacités clés :
• Acquisition et consolidation des données structurées
(opérationnelles et externes),
• Conservation des données historiques et détaillées,
• Flexibilité pour la création de magasins de données ayant des
modèles de données variés;
• 3 FN (3e Forme normale),
• Dimensionnel,
• Multidimensionnel.
11 30-722-17
Architecture classique d’entrepôt de données et
d’analyse décisionnelle
Sources de Acquisition de Entrepôt de données Enrichissement Magasins de Accès au
données données (Data Warehouse) données données
(Datamatrs)
Plateforme de
Magasin rapports et
Application A Finance tableaux de
(Données bord
opérationnelles) Staging
Métadonnées
Extraction, Extraction,
Application B Métadonnées
Transformation et Entrepôt de données Transformation et
(Données d’accès
Chargement corporatif Chargement
opérationnelles) Magasin
(ETL) (Données (ETL)
Marketing
analytiques) Métadonnées Data Mining
Métadonnées
ETL ETL
Application C Métadonnées
(Données
opérationnelles)
Métadonnées
Métadonnées
d’accès
12 30-722-17
Architecture classique d’entrepôt de données et
d’analyse décisionnelle
Défis et enjeux
• Difficulté de synchronisation des extractions de données
sources pour maintenir la cohérence.
• La modélisation de données des entrepôts et magasins de
données est variée et complexe.
• Les données sont transportées et recopiées plusieurs fois.
• Latence pouvant être de plusieurs jours entre le moment où est
effectuée une transaction et celui de sa disponibilité pour de
l’analyse décisionnelle.
13 30-722-17
Tendances actuelles en
entrepôts de données
30-722-17 14
Tendances et évolution des entrepôts de données
• Tendances actuelles
• Entrepôt de données dynamique.
• Virtualisation pour créer des entrepôts logiques
• Visualisation et exploration de données.
15 30-722-17
Entrepôt de données dynamique
• Ce qui le caractérise :
• Fournis des analyses en temps voulu selon le contexte d’affaires,
• Extrais et intègre des connaissances provenant de données structurées et
non structurées,
• Mets en force l’architecture d’entreprise d’information (AIE) pour supporter
les divers niveaux de services.
16 30-722-17
Exemple d’architecture d’entrepôt de données
dynamique
Services de présentation et distribution
Fournisseurs Applications UI* UI* Collage
UI* Ligne Applications Portails
de données Web Pan Productivité/Col Recherche composite
d’affaires mobiles d’entreprise
tiers entreprises laboration d’entreprise (Mashup)
Présentation de Services de
Recherche et Services de Services de
Analytique intégré performance Présentation
requête Processus Collaboration
d’affaires (portail & Web)
Connectivité et interopérabilité
17 30-722-17
Capacités accrues de visualisation et d’exploration de
données
• Quelques défis :
• Gouvernance du mode exploratoire,
• Perception que ceci remplace les outils BI existants, ce qui n’est pas le cas, et
• Intégration dans les environnements BI existants.
18 30-722-17
Exercice en classe
30-722-17 20
Le Big Data (mégadonnées)
21 30-722-17
Défis relativement à la gestion des données
22 30-722-17
Exemple d’adaptation de l’architecture des entrepôts
de données
Gouvernance de l’information
Données externes
(structurées)
de données
Magasin
Marketing
Exploration de
données
Journaux de
traitements
Ingestion des
Data Mining
Ingestion
Données
Documents HDFS
structurées
Machine
MapReduce Requêtes Learning
Web et (HiveQL)
Média
sociaux Analytique
ELT géospatiale
Capteurs Traitements Metadata
et Analytique
senseurs
cognitive
• Quelques défis :
• Intégrer les entrepôts de données existants,
• Identifier le style de mise en œuvre adéquat pour les besoins de l’entreprise.
24 30-722-17
Style d’entrepôt de données logique
25 30-722-17
Source Gartner :
« Decision Point for Logical Data Warehouse Implementation Style » — G00250883, Analyste : May Selvage
Composants de l’architecture de l’entrepôt de
données logique [1]
Outils analytiques
Consommation
Couche sémantique
métadonnées
Gestion des
Processus
Référentiel Virtualisation
distribué
Données sources
26 30-722-17
[1] Source Gartner :
« Decision Point for Logical Data Warehouse Implementation Style » — G00250883, Analyste : May Selvage
Travail en équipe
30-722-17 27
Étude de cas — identifier l’apport de systèmes analytiques.
• Objectif :
• Identifier l’apport de systèmes analytiques dans le contexte de votre
entreprise.
• Durée :
• 30 minutes
• Conseils :
• Identifier 2 à 3 questions importantes, pour la gestion de votre entreprise,
avec lesquelles l’analytique pourra vous aider.
• Décrire comment vos systèmes analytiques vont vous aider à y répondre.
28 30-722-17
Conclusion
30-722-17 29
Points saillants de cette séance (1/2)
30 30-722-17
Points saillants de cette séance (2/2)
31 30-722-17
Prochaine séance
32 30-722-17
Annexes
30-722-17 33
Démarrer la
vidéo
Une confiance absolue dans le Big Data …
34 30-722-17
Annexes A — Références
35 30-722-17
Annexes A — Autres références
• Recherches Gartner
• « What Data Discovery Means for You »
• Parue le 17 décembre 2014
• Analystes : Joao Tapadinhas, Dan Sommer
• « Magic Quadrant for Business Intelligence and Analytics Platforms »
• Parue le 23 février 2015
• Analystes : Rita L. Sallam, Bill Hostmann, Kurt Schlegel, Joao Tapadinhas, Josh Parenteau, Thomas W. Oestreich
• « Decision Point for Logical Data Warehouse Implementation Style »
• Parue le 13 mai 2013 — G00250883
• Analyste : May Selvage
• Building the Data Warehouse
• Auteur : William H. Inmon
• Parution : 1992
• ISBN: 0471569607
• The Data Warehouse Toolkit
• Auteur : Ralph Kimball
• Parution : 16 février1996
• ISBN 978-0-471-15337-5
• Data Warehouse from Architecture to Implementation
• Auteur : Barry Devlin
• Parution : 4 novembre 1996
• ISBN 0-201-96425
36 30-722-17
Diagramme de vue d’ensemble d’architecture
Architecture Overview Diagram (AOD)