Académique Documents
Professionnel Documents
Culture Documents
Actualités du cours
http://eric.univ-lyon2.fr/~jdarmont/?page_id=2519
Entrepôts de données
http://eric.univ-lyon2.fr/~jdarmont/?feed=rss2
Année 2015-2016
Jérôme Darmont
https://twitter.com/darmont_lyon2 hashtag #edemse
http://eric.univ-lyon2.fr/~jdarmont/
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 1
Traitement
Synthétiser/résumer
Visualiser
Analyser
Utilisateurs
Non informaticiens
Non statisticiens www.rhpsoft.com
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 4 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 5
1
24/12/2015
Entrepôt
de
données
2
24/12/2015
docs.oracle.com
3
24/12/2015
H JOUR
FAIT
H VILLE VENTE DIM FAIT DIM
H MOIS
LOCALISATION VENTE TEMPS
H REGION
H TRIM.
DIM FAIT
H PAYS
H ANNEE VENDEUR SAL.
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 18 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 19
Avantages
Facilité et faible coût de mise en œuvre
Stockage de gros volumes de données
Evolution facile
SQL
Inconvénients
olap.com/which-olap-is-best/ Performance (jointures)
Reformatage nécessaire des résultats pour les utilisateurs finaux
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 22 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 23
4
24/12/2015
N-uplet 9 8 7 6 5 4 3 2 1
Nombre de comédies Science Fiction 0 0 1 1 0 0 0 0 1
Compter le nombre de 1 dans Drame 0 0 0 0 0 1 1 1 0
le bitmap associé Comédie 1 1 0 0 1 0 0 0 0
en 1995 Comédie 1 1 0 0 1 0 0 0 0
5
24/12/2015
Avantages
Bon compromis coût/performance sur de gros volumes de données
Exploite les fonctionnalités de SQL
Cube connecté à l’entrepôt relationnel
Inconvénients
Difficulté de mise en œuvre
Pas aussi rapide que MOLAP
Yannis Sismanis et al., 1992 Passage à l’échelle moins facile qu’en ROLAP
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 32 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 33
6
24/12/2015
www.imc.com
holowczak.com
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 38 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 39
Extraction Transformation
Sources de données variées Unification des données
Bases de données opérationnelles Noms des attributs
Fichiers Types (ex. précision numérique)
Logs Formats (ex. dates)
Web… Unités de mesure
7
24/12/2015
Transformation Chargement
Politiques de chargement
Complet / incrémental
En ligne / hors ligne
Mises à jour des dimensions
Ecrasement de l’ancienne valeur
Versionnement
Traitement particulier des dimensions à évolution rapide
Rafraîchissement des index et vues matérialisées
Oubli des données anciennes
Suppression
Didier Donsez, Université Grenoble 1 Agrégation
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 42 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 43
Localisation
Produit
Temps
8
24/12/2015
Drill down
Drill down
Didier Donsez, Université Grenoble 1
Didier Donsez, Université Grenoble 1
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 48 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 49
SQL MDX
SELECT attribut(s) SELECT axe(s)
FROM table(s) FROM cube
www.mssqltips.com
WHERE condition(s) WHERE filtre(s)
www.mssqltips.com geekswithblogs.net/darrengosbell/
Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 52 Entrepôts de données http://eric.univ-lyon2.fr/~jdarmont/ 53
9
24/12/2015
Confidentialité de données
BI4people : le décisionnel pour tous
décisionnelles partagées dans le nuage
Travail basé sur CryptDB
NoETL
Source documents
Automatic Simple
modeling OLAP
css.csail.mit.edu/cryptdb/
10