Vous êtes sur la page 1sur 183

Introduction

Systèmes d'information décisionnels


Entrepôt de données
OLAP

Base de données décisionnelles

Chaimae ANIBOU

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Plan

1 Introduction

2 Systèmes d'information décisionnels

3 Entrepôt de données

4 OLAP

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Qu'est ce que l'information?

L'information c'est...
+ une indication
+ une ressource organisationnelle
+ la composante reliant tous les éléments des environnements
internes et externes de l'entreprise
Données: Signe+code
Information:donnée+ modèle d'interprétation;information doit être
able et pertinente.

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

La notion de système d'information

Une "organisation" (entreprise, administration, collectivité, tout


groupe social organisé exerçant une activité) peut être modélisé
comme comportant trois sous systèmes :
le système de pilotage (celui qui rééchit, décide, oriente)
le système opérant (celui qui produit, transforme, agit)
le système d'information

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Figure: Le système d'information


Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Système d'information: Un ensemble organisé de

ressources(matériel, logiciel, personnel, données, procédures...)


permettant de collecter, stocker, traiter et communiquer les
informations.

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Système d'information: Un ensemble organisé de

ressources(matériel, logiciel, personnel, données, procédures...)


permettant de collecter, stocker, traiter et communiquer les
informations.
Système d'information de l'entreprise:Ensembles des moyens et

procédures qu'il utilise(traitements manuels et/ou automatisés,


traitements centralisés et /ou répartis..)

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Système d'information: Un ensemble organisé de

ressources(matériel, logiciel, personnel, données, procédures...)


permettant de collecter, stocker, traiter et communiquer les
informations.
Système d'information de l'entreprise:Ensembles des moyens et

procédures qu'il utilise(traitements manuels et/ou automatisés,


traitements centralisés et /ou répartis..)
1 Système opérationnels: assure les transactions

2 Système d'aide à la décision: exploitent des modèles d'analyses


de problème

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Besoins

Objectif:

Améliorer les performances décisionnelles de l'entreprise

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Besoins

Objectif:

Améliorer les performances décisionnelles de l'entreprise


Comment ?

en répondant aux demandes d'analyse des décideurs

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Besoins

Objectif:

Améliorer les performances décisionnelles de l'entreprise


Comment ?

en répondant aux demandes d'analyse des décideurs


Exemple:

-clientèle : Qui sont mes clients ? Pourquoi sont-ils mes clients ?


Comment les conserver ou les faire revenir ? Ces clients sont-ils
intéressants pour moi ?
-marketing, actions commerciales : Où placer ce produit dans les
rayons ? Comment cibler plus précisément le mailing concernant ce
produit ?

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Une grande masse de données:

Distribuée
Hétérogène
Très Détaillée
A traiter :

Synthétiser / Résumer
Visualiser
Analyser
Pour une utilisation par :

des experts et des analystes d'un métier


NON informaticiens
NON statisticiens
Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Plan

1 Introduction

2 Systèmes d'information décisionnels


La problématique de l'entreprise-Besoins liés aux SID)
Informatique décisionnelle
Fonctions et architecture

3 Entrepôt de données

4 OLAP

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L'entreprise est confrontée à un double dé :

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L'entreprise est confrontée à un double dé :


gérer l'immense quantité de données externes et internes
auxquelles elle a de plus en plus facilement accès,

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L'entreprise est confrontée à un double dé :


gérer l'immense quantité de données externes et internes
auxquelles elle a de plus en plus facilement accès,
la transformer en informations utiles à un pilotage ecace de
son action s'adaptant, qui plus est, à l'évolution continue de
son environnement.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L'entreprise est confrontée à un double dé :


gérer l'immense quantité de données externes et internes
auxquelles elle a de plus en plus facilement accès,
la transformer en informations utiles à un pilotage ecace de
son action s'adaptant, qui plus est, à l'évolution continue de
son environnement.
- Mis au point d'une stratégie susceptible de mieux atteindre les
objectifs, d'élaboration de plan d'actions,...

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L'entreprise est confrontée à un double dé :


gérer l'immense quantité de données externes et internes
auxquelles elle a de plus en plus facilement accès,
la transformer en informations utiles à un pilotage ecace de
son action s'adaptant, qui plus est, à l'évolution continue de
son environnement.
- Mis au point d'une stratégie susceptible de mieux atteindre les
objectifs, d'élaboration de plan d'actions,... → recours aux
technologies de l'information pour aider les gestionnaires dans leur
prise de décision

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs(1)

Toute entreprise doit anticiper des événements de plusieurs type:

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs(1)

Toute entreprise doit anticiper des événements de plusieurs type:

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs(2)
Ne veulent plus seulement savoir :
Combien de clients ont acheté tel produit pendant telle
période ?
Mais des nouvelles questions métiers :
clientèle :
Quel est leur prol ?
Quels autres produits les intéresseront ?
Quand seront-ils intéressés ?
Comment les conserver ou les faire revenir ?
marketing, actions commerciales :
Où placer ce produit dans les rayons ?
Comment cibler plus précisément le mailing concernant ce
produit ?
Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Diculté techniques(exemple store)

Les requêtes lourdes et complexes dégradent les performances


du système transactionnel
Données réparties entre données actuelles et archivés, rendant
la vue historique des données dicile ou impossible
Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Technologies de l'information(logiciels, bases de données...)→


recueillir,traiter, stocker et diuser de gros volumes
d'information,plus rapidement,un cout raisonnable.
Organisation dans une base de données décisionnelles →
analyse et exploitation de l'information à des ns de prise de
décisions.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L 'informatique décisionnelle (BI pour Business Intelligence) désigne


les moyens, les outils et les méthodes qui permettent de collecter,
consolider, modéliser et restituer les données d'une entreprise en
vue d'orir une aide à la décision et de permettre aux responsables
de la stratégie d'une entreprise d'avoir une vue d'ensemble de
l'activité traitée.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L 'informatique décisionnelle (BI pour Business Intelligence) désigne


les moyens, les outils et les méthodes qui permettent de collecter,
consolider, modéliser et restituer les données d'une entreprise en
vue d'orir une aide à la décision et de permettre aux responsables
de la stratégie d'une entreprise d'avoir une vue d'ensemble de
l'activité traitée.
Sélectionner les données (par rapport à un sujet et/ou une
période)
Trier, regrouper ou répartir ces données selon certains critères
Élaborer des calculs récapitulatifs "simples " (totaux,
moyennes conditionnelles, etc.)
Présenter les résultats de manière synthétique (graphique
et/ou tableaux de bord)REPORTING

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L 'informatique décisionnelle (BI pour Business Intelligence) désigne


les moyens, les outils et les méthodes qui permettent de collecter,
consolider, modéliser et restituer les données d'une entreprise en
vue d'orir une aide à la décision et de permettre aux responsables
de la stratégie d'une entreprise d'avoir une vue d'ensemble de
l'activité traitée.
Sélectionner les données (par rapport à un sujet et/ou une
période)
Trier, regrouper ou répartir ces données selon certains critères
Élaborer des calculs récapitulatifs "simples " (totaux,
moyennes conditionnelles, etc.)
Présenter les résultats de manière synthétique (graphique
et/ou tableaux de bord)REPORTING

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

L 'informatique décisionnelle (BI pour Business Intelligence) désigne


les moyens, les outils et les méthodes qui permettent de collecter,
consolider, modéliser et restituer les données d'une entreprise en
vue d'orir une aide à la décision et de permettre aux responsables
de la stratégie d'une entreprise d'avoir une vue d'ensemble de
l'activité traitée.
Sélectionner les données (par rapport à un sujet et/ou une
période)
Trier, regrouper ou répartir ces données selon certains critères
Élaborer des calculs récapitulatifs "simples " (totaux,
moyennes conditionnelles, etc.)
Présenter les résultats de manière synthétique (graphique
et/ou tableaux de bord)REPORTING

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Processus décisionnel

Figure: Processus d'un système décisionnel

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Processus décisionnel

1 L'identication du sujet.
2 Information
3 Réexion
4 Validation
5 suivi de la décision

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Système de gestion vs. Système de décision

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs d'un SID

Accessibilité rapide et facile aux informations

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs d'un SID

Accessibilité rapide et facile aux informations


Cohérence des informations

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs d'un SID

Accessibilité rapide et facile aux informations


Cohérence des informations
Adaptation aux changement

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs d'un SID

Accessibilité rapide et facile aux informations


Cohérence des informations
Adaptation aux changement
Présentation des informations à temps

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs d'un SID

Accessibilité rapide et facile aux informations


Cohérence des informations
Adaptation aux changement
Présentation des informations à temps
Protection et sécurisation des informations

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Objectifs d'un SID

Accessibilité rapide et facile aux informations


Cohérence des informations
Adaptation aux changement
Présentation des informations à temps
Protection et sécurisation des informations
Conversion de la masse de données en une valeur métier

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Retenons...

Pourquoi BI?

Historisation

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Retenons...

Pourquoi BI?

Historisation
Centralisation

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Retenons...

Pourquoi BI?

Historisation
Centralisation
Normalisation

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Retenons...

Pourquoi BI?

Historisation
Centralisation
Normalisation
Données déjà consolidées

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Retenons...

Pourquoi BI?

Historisation
Centralisation
Normalisation
Données déjà consolidées
Analyse

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Architecture d'un système d'information décisionnel

Figure: Architecture d'un système d'information décisionnel

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Figure: Architecture d'un système d'information décisionnel

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Figure: Architecture d'un système d'Information décisionnel

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

1.Collecte de données(Datapumping)

Récolte de données à partir de plusieurs sources opérationnelles de


l'entreprise. Les sources de données peuvent être:

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

1.Collecte de données(Datapumping)

Récolte de données à partir de plusieurs sources opérationnelles de


l'entreprise. Les sources de données peuvent être:
a Les systèmes opérationnelles de production: Fichiers plats du
SE, système de BD, ERP(Entreprise Resource Planing).
b Les archives
c Les données internes : feuilles de calculs et les classeurs
individuels
d Les données externes: les informations d'analyse concurrentiels,
les rapports périodiques provenant des sources extérieurs..

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

1.Collecte de données(Datapumping)

Récolte de données à partir de plusieurs sources opérationnelles de


l'entreprise. Les sources de données peuvent être:
a Les systèmes opérationnelles de production: Fichiers plats du
SE, système de BD, ERP(Entreprise Resource Planing).
b Les archives
c Les données internes : feuilles de calculs et les classeurs
individuels
d Les données externes: les informations d'analyse concurrentiels,
les rapports périodiques provenant des sources extérieurs..

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

1.Collecte de données(Datapumping)

Récolte de données à partir de plusieurs sources opérationnelles de


l'entreprise. Les sources de données peuvent être:
a Les systèmes opérationnelles de production: Fichiers plats du
SE, système de BD, ERP(Entreprise Resource Planing).
b Les archives
c Les données internes : feuilles de calculs et les classeurs
individuels
d Les données externes: les informations d'analyse concurrentiels,
les rapports périodiques provenant des sources extérieurs..

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

1.Collecte de données(Datapumping)

Récolte de données à partir de plusieurs sources opérationnelles de


l'entreprise. Les sources de données peuvent être:
a Les systèmes opérationnelles de production: Fichiers plats du
SE, système de BD, ERP(Entreprise Resource Planing).
b Les archives
c Les données internes : feuilles de calculs et les classeurs
individuels
d Les données externes: les informations d'analyse concurrentiels,
les rapports périodiques provenant des sources extérieurs..

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

2. Le processus ETL

Système par lequel vont passer toutes les données avant


d'arriver à la forme souhaitée dans DW
Les données en sortie seront nettoyés, contextualisées, prêtes à
être reçu dans DW
L'intermédiaire entre le système opérationnel et l'interface du
système décisionnel

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

2. Le processus ETL

Système par lequel vont passer toutes les données avant


d'arriver à la forme souhaitée dans DW
Les données en sortie seront nettoyés, contextualisées, prêtes à
être reçu dans DW
L'intermédiaire entre le système opérationnel et l'interface du
système décisionnel
1 Extraction

2 Transformation

3 Chargement

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

3.Stockage de données

Centraliser un volume important de données dans un même endroit


unié et accessible par tous les utilisateurs.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

3.Stockage de données

Centraliser un volume important de données dans un même endroit


unié et accessible par tous les utilisateurs.
=⇒ Datawarehouse: Ensemble de données répertoriées, complètes
et cohérentes d'une entreprise
=⇒ Datamart:Un extrait d'un DW, données adaptées à un usage
particulier ou à une classe de décideurs. Se focalise sur les données
d'un seul département de l'entreprise(Marketing, vente...)

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

4.Analyse et restitution

Des outils(Applications) simples( Reporting, tableau de bord..)ou


sophistiquées(Datamining), pour faciliter l'accès à l'information et
d'extraire les éléments de décisions pour dynamiser la réactivité
globale dans l'entreprise.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

De l'entreposage à la fouille de données(Initiation)

L'entreposage de données se découpe en deux phases principales:


la phase de préparation des données
La modélisation multidimensionnelle

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

De l'entreposage à la fouille de données(Initiation)

OLAP: orir une vue de ce qui se passe


Data mining: prévoir ce qui se passera et pourquoi
s'appuie sur des techniques d'intelligence articielle
met en évidence des liens cachés entre les données.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

KDD
(knowledge data discovery) est un processus : Pré-traitement
(Pre-processing),Data mining, Post-traitement (Post-processing)

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Exemple: Données médicales

Entrepôt pour le suivi de maladies infectieuses


Analyse OLAP
Analyse du taux d'aectation par ville, par département, par
année
Fouille des données
Corrélation entre le taux d'aectation et le taux de présence de
certains polluants

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Applications

Secteur bancaire:
Déterminer les prols clients
Utilisation du score de risque pour proposer le montant de
crédit le plus adapté à chaque client
Aide à la décision de paiement
Déterminer le meilleur taux de réponse des compagnes
marketing
Découverte de segments de clientèle
Identication des clients susceptibles de partir à la concurrence
Adaptation à la communication marketing à chaque segment
de clientèle

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Applications

Assurance
Sur des produits obligatoires(automobile,habitation)
soit prendre un client à un concurrent

soit faire monter en gamme un client que l'on détient déjà

besoin de décisionnel du à la concurrence de nouveaux

entrants(banc assurance)

Économétrie
prédiction du trac autoroutier
Ressources humaines
adéquation activité/personnel
Santé
épidémiologie(VIH,amiante...)

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Applications

Logistique
adéquation demande/production
Commerce
ciblage de clientèle
aménagement des rayons(2 produits en corrélation)
E-commerce
personnalisation des pages d'un site web en fonction du prole
de chaque internaute
optimisation de la navigation sur un site web
Détection de fraudes
Banques
Télécommunications

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Applications

Gestion de stocks
quand commander un produit
quelle quantité demander
Analyse nancière
maximiser l'investissement de portefeuilles d'actions.
Médecine et pharmacie
diagnostic:découvrir d'après les symptômes du patient sa
maladie
le choix du médicament le plus approprié pour guérir une
maladie donnée
Bioinformatique et génome
ADN mining,...

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Exemple d'application(Marketing)

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Exemple d'application(Marketing)

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Déclinaisons métiers

SPM (Strategic Performance Management)


- Déterminer et contrôler les indicateurs clé de la performance de l'entreprise
FI (Finance Intelligence)
- Planier, analyse et diuser l'information nancière.
- Mesurer et gérer les risques.
HCM (Human Capital Management)
- Aligner les stratégies RH, les processus et les technologies.
CRM (Customer Relationship Management)
- Améliorer la connaissance client, Identier et prévoir la rentabilité client.
- Accroître l'ecacité du marketing client.
SRM (Supplier Relationship Management)
- Classier et évaluer l'ensemble des fournisseurs.
- Planier et piloter la stratégie Achat.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Gestion de la relation client

Dénition
Un terme de l'industrie des systèmes d'information englobant des
méthodologies, du software et habituellement des capacités Internet
qui aident une entreprise à gérer les relations avec ses clients d'une
manière structurée.
E-CRM
L'e-crm est un processus continu d'amélioration de la relation client
sur Internet

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Gestion de la relation client

Objectifs et enjeux
Conquérir un prospect coûte 10 fois plus cher que de déliser
un client.
5% d'amélioration de la délisation augmente de 10 à 15% les
prots.
2/3 des entreprises ne savent pas combien de clients elles ont
perdus l'année précédente ni même l'impact exact sur leur
résultats.
→ CRM est utilisée pour répondre à ce type de problématique.
→ Améliorer la relation et la connaissance de vos clients et
prospects
Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Gestion de la relation client


Bénéces du CRM
Augmenter les revenus: les entreprises mettent l'accent sur la
réduction constante de leurs dépenses an d'augmenter leur
prot.Se tourner vers des solutions axées sur l'augmentation de
leurs revenus en capitalisant sur leur base de clients installés.
Maximiser le service aux clients: il est plus coûteux de gagner
de nouveaux clients que de les conserver. Mieux analyser les
besoins de vos clients à partir d'un historique centralisé et
accessible à tous vos collaborateurs.
Exploiter d'avantage les échanges entre les clients et vos
vendeurs :vos clients n'ont pas tous les mêmes besoins et les
mêmes valeurs ! Une CRM vous permettra d'orir un niveau
de service personnalisé à vos clients.
Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Augmenter la qualité du service après-vente: à travers un suivi


de vos clients.
Fidéliser vos clients: par une attention particulière en rendant
le coût de transfert vers un concurrent plus élevé.
Réduire les coûts: commerciaux et marketing.
Gain de productivité : les tableaux de bord proposés par une
CRM permettent aux gestionnaires de suivre en temps réel
l'évolution de l'entreprise et de réagir à temps.

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Les fonctionnalités d'une CRM

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Les fonctionnalités d'une CRM


1 Le Marketing:
apporter des produits ou des services adaptés aux besoins des
clients
les regrouper dans des catégories telles que leurs métiers, leurs
régions, leurs CA ou leurs ux par exemple
gérer vos emailings ou des campagnes de phoning
2 La gestion des ventes:
Gestion des équipes commerciales
Connaissance de vos clients et de vos prospects
Gestion des opportunités (appels spontanés)
Consultation des aaires en cours
Informations sur les produits / services et gestion de votre
catalogue produits / services
Bons de livraison
3 Les services après vente:
Enregistrement desANIBOU
Chaimae incidents et des demandes de vos clients
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Vue complète des informations liées à vos clients (historique de


leurs commandes, leurs diérents appels, etc.)

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Mise en place d'une solution de relation client

1 Démarrer le projet
2 Faire l'inventaire de l'existant et l'évaluer
3 Choisir sa solution
4 Implémenter la solution
5 Évaluer les résultats

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Exemples de CRM

SalesForce
Siebel CRM
Sugar CRM
Vtiger CRM

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Un exemple d'application du E-CRM

Objectifs
Conception d'un outil d'aide à la décision, associé, à un site de
e-commerce
Architecture du système

Chaimae ANIBOU
Introduction La problématique de l'entreprise-Besoins liés aux SID)
Systèmes d'information décisionnels Informatique décisionnelle
Entrepôt de données Fonctions et architecture
OLAP

Conclusion

L'informatique décisionnelle est un outils puissant qui aide les


décideurs à mettre en place leurs stratégies.
SID parmi les premières occupation des entreprises pour
disposer des informations précises → assurer un pilotage
ecace de son activité
Il est nécessaire de passer par un entrepôt de données pour
arriver à déployer un SID au niveau d'une organisation.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Plan

1 Introduction

2 Systèmes d'information décisionnels

3 Entrepôt de données
Dénition de Datawarehouse
Alimentation du DataWarehouse
Architecture d'un entrepôt de données
Modélisation du DataWarehouse
Les diérentes zones
Datamarts et architecture

4 OLAP

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Dénitions
Le Data Warehouse, ou entrepôt de données, est une base de

données dédiée au stockage de l'ensemble des données utilisées


dans le cadre de la prise de décision et de l'analyse décisionnelle.
- Le terme d'entrepôt de données a été créé par William H. Inmon,
connu comme le " père du Data Warehouse".

→ Le processus d'entreposage de données


implique simplement la construction et l'utilisation de l'entrepôt de
données.
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Les données sont recueillies à partir d'une variété de sources


pertinentes pour l'entreprise telles que :
Les données des clients,
Les données des entreprises concurrentes et
Les données transactionnelles.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Les 4 caractéristiques du Data Warehouse:


William Inmon décrit DW comme un ensemble intégré, non-volatile,
variable dans le temps, et orienté sur des thèmes, de données qui
viennent soutenir le processus décisionnel de la direction de
l'entreprise.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Les 4 caractéristiques du Data Warehouse:


William Inmon décrit DW comme un ensemble intégré, non-volatile,
variable dans le temps, et orienté sur des thèmes, de données qui
viennent soutenir le processus décisionnel de la direction de
l'entreprise.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Les 4 caractéristiques du Data Warehouse:


William Inmon décrit DW comme un ensemble intégré, non-volatile,
variable dans le temps, et orienté sur des thèmes, de données qui
viennent soutenir le processus décisionnel de la direction de
l'entreprise.

Le Data Warehouse n'est pas une simple copie des données de


production. Le data Warehouse est organisé et structuré.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

1 Orienté sujet: Au coeur du Data warehouse, les données


sont organisées par thème. Les données propres à un thème,
les ventes par exemple, seront rapatriées des diérentes bases
OLTP de production et regroupées.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

1 Orienté sujet: Au coeur du Data warehouse, les données


sont organisées par thème. Les données propres à un thème,
les ventes par exemple, seront rapatriées des diérentes bases
OLTP de production et regroupées.

Intégré: Les données proviennent de sources hétérogènes


utilisant chacune un type de format. Elles sont intégrées avant
d'être proposées à utilisation.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

1 Non volatile: Les données ne disparaissent pas et ne


changent pas au l des traitements, au l du temps
(Read-Only).

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

1 Non volatile: Les données ne disparaissent pas et ne


changent pas au l des traitements, au l du temps
(Read-Only).

Historisé:Les données non volatiles sont aussi horodatées.


On peut ainsi visualiser l'évolution dans le temps d'une valeur
donnée. Le degré de détail de l'archivage est bien entendu
relatif à la nature des données. Toutes les données ne méritent
pas d'être archivées.
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Deux modes de fonctionnement de l'entrepôt :


en ligne : exécution des requêtes des utilisateurs

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Deux modes de fonctionnement de l'entrepôt :


en ligne : exécution des requêtes des utilisateurs
hors ligne : alimentation

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Le processus d'alimentation des données

représente une part majeure des eorts de développements


nécessite une attention tout au long du cycle de vie du système
il doit être pris au sérieux le plutôt possible
le garant de la qualité des données
il représente jusqu'à 40 % du budget total du projet
doit s'exécuter périodiquement, il doit donc être:

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Le processus d'alimentation des données

représente une part majeure des eorts de développements


nécessite une attention tout au long du cycle de vie du système
il doit être pris au sérieux le plutôt possible
le garant de la qualité des données
il représente jusqu'à 40 % du budget total du projet
doit s'exécuter périodiquement, il doit donc être:
Optimisé: Le temps du processus= temps d'indisponibilité de
l'entrepôt
Les temps de réponse du DW dépendent de la qualité des
agrégats qui sont gérés par le processus
Automatisé :Il est nécessaire d'industrialiser le processus au
maximum
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

La problématique est aussi ancienne que les SI


Depuis toujours le transfert de chiers

pas sécurisé
pas normalisé
cher à
maintenir

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Les phases de l'alimentation d'un datawarehouse sont les suivantes


:
Découverte des données : Il s'agit d'identier dans les systèmes
sources les données à importer dans le datawarehouse. Il faut
prendre les données les plus judicieuses. Un mauvais choix peut
considérablement compliquer les phases suivantes de l'alimentation.
Adresse complète ou code postal?
L'âge du client est-il nécessaire?
Extraction des données : Il s'agit de collecter les données utiles
dans les systèmes de production. Il faut identier les données ayant
été modiées an d'importer le minimum de données dans le
datawarehouse.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Transformation des données : Il faut rendre les données


cohérentes avec la structure du datawarehouse. On applique alors
des ltres sur les données. Il peut être nécessaire de convertir le
format des données (EBCDIC vers ASCII par exemple) ou
d'harmoniser les formats de dates (jj/mm/aaaa). Il faut également
associer les champs source avec les champs cibles. Un champ source
" adresse " pourra ainsi par exemple être décomposé en " numéro ",
" rue ", " code postal " , " ville " ou l'inverse. Enn des données
des systèmes de production doivent être agrégées ou calculées avant
leur chargement.
Chargement des données : C'est la dernière phase de
l'alimentation d'un datawarehouse. Il s'agit d'insérer les données au
sein du datawarehouse. C'est une phase délicate car les quantités de
données sont souvent très importantes.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Flux de données et données statiques

Données statiques
Image à un instant donné de l'état de l'entreprise
Rapports d'activité, bilans, inventaire
Flux de données
Mise à jour en temps réel
Compte rendus quotidiens, commandes, livraisons

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Comment sont mes sources ?


Avant de faire un ETL, il faut bien étudier les sources de données.
Le rapatriement des données peut se faire de trois façons
diérentes :
Push : la logique de chargement est dans le système de

production, il " pousse " les données vers le Staging quand il


en a l'occasion. L'inconvénient est que si le système est
occupé, il ne poussera jamais les données.
Pull : " tire " les données de la source vers le Staging.
L'inconvénient de cette méthode est qu'elle peut surcharger le
système s'il est en cours d'utilisation.
Push-Pull : La source prépare les données à envoyer et prévient le
Staging qu'elle est prête. Le Staging va récupérer les données. Si la
source est occupée, le Staging fera une autre demande plus tard.
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Comment traiter les données

Une fois les données sont dans le Staging, va falloir nettoyer tout
ça ! C'est l'opération la plus importante du processus.
Une erreur dans un champ aecte forcément les analyses

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Comment traiter les données

Une fois les données sont dans le Staging, va falloir nettoyer tout
ça ! C'est l'opération la plus importante du processus.
Une erreur dans un champ aecte forcément les analyses
Des questions à se poser à cette étape :
Quels sont les champs les plus sujets à erreurs ?
Ai-je les moyens de corriger les erreurs automatiquement ?
Comment permettre à un utilisateur de corriger les erreurs ?
Quelle politique vais-je utiliser pour le traitement des erreurs
(chier log, table dans BD) ?
Comment montrer à l'utilisateur nal que des données n'ont
pas été totalement chargées à cause d'erreurs ?
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Types d'inconsistances

Présence de données fausses dès leur saisie


fautes de frappe
diérents formats dans une même colonne
texte masquant de l'information (e.g., "N/A")
valeur nulle
incompatibilité entre la valeur et la description de la colonne
duplication d'information, ...

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Exemple de transformations

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chargement

Deux cas sont à prendre en compte:


le chargement initial:eectué au tout premier chargement de
l'entrepôt et après la perte des données de l'entrepôt
les chargements incrémentiels:le fait d'ajouter des données à
un entrepôt existant, c'est l'opération qui va se répéter dans le
temps (chaque jour par exemple)

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Fondamental
L'objectif du data Warehouse est de permettre des requêtes sur de
grands ensembles des données, la plupart du temps sous forme
d'agrégats (GROUP BY) an d'en obtenir une vision synthétique
(propre à la prise de décision).

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Lors de la conception d'un Data Warehouse, deux approches se


confrontent :
la méthode de Bill Inmon (Top-down)
la méthode de Ralph Kimball (Bottom-up)
→chacune adaptée à son environnement d'intégration et présentant
ses avantages et inconvénients.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Méthode de Bill Inmon (Top-down)

C'est la méthode la plus lourde, la plus contraignante et la plus


complète en même temps. Elle consiste en la conception de tout
l'entrepôt, puis en la réalisation. Cette méthode est très longue
mais elle ore l'avantage d'avoir une vision complète du projet.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Méthode de Kimball(Bottom-up)

C'est l'approche inverse, elle consiste à créer les étoiles une par une, puis
les regrouper par des niveaux intermédiaires jusqu'à obtention d'un
véritable entrepôt pyramidal avec une vision entreprise.
Cette méthode permet de réaliser l'entrepôt progressivement, et d'avoir
des résultats assez rapidement.
L'inconvénient de cette méthode est la possibilité de redondance entre les
étoiles (car elles sont faites indépendamment les unes des autres).

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Middle-Out : C'est l'approche hybride, et conseillée par les


professionnels du BI. Elle consiste en la conception totale de
l'entrepôt de données (concevoir toutes les dimensions, tous
les faits et toutes les relations), puis créer des divisions plus
petites et plus gérables et les mettre en œuvre. Cela équivaut
à découper notre conception par éléments en commun et
réaliser les découpages un par un. Cette méthode tire le
meilleur des deux précédentes sans avoir les contraintes. Il faut
juste noter que cette méthode implique, parfois, des
compromis de découpage (dupliquer des dimensions identiques
pour des besoins pratiques).

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Cycle de vie
Diérentes phases:
1 Analyse et Conception
1 Dénir la nalité du DW : Piloter quelle activité de l'entreprise
?
2 Dénition du modèle de données (modèle en étoile/ocon)
2 Acquisition des données
1 Déterminer et recenser les données à entreposer: recherche des
données dans les sources de l'entreprise
2 Nettoyage des données
3 Démarches d'alimentation
3 Dénir les aspects techniques de la réalisation
4 Dénir les modes de restitution, indicateurs, …
5 Dénir les stratégies d'administration, évolution, maintenance.
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Un projet de système décisionnel se structure selon quatre grands


axes :
1 Étude des besoins et de l'existant
Étude des besoins utilisateurs
Étude des données existantes
2 Modélisation et conception
Modélisation dimensionnelle
Architecture technique
Spécication des outils d'exploitation
3 Implémentation du data warehouse
Implémentation du DW et des DM
Mise en place de l'ETL
4 Implémentation des outils d'exploitation
Implémentation des outils de reporting
Implémentation des outils d'exploration
Implémentation des outils de prédiction
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Types d'objectifs métiers

Stratégique -pour des buts à long terme;


Tactique : - Pour des buts à court terme ou immédiats;
Orientés résultats: - Contribue à la réalisation des objectifs
tactiques;

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Schéma conceptuel

A partir du sujet et des questions métiers :


Sujet = fait
QMs= Mesures + dimensions + Granularité

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Modélisation

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Exemple de Schéma en étoile

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Schéma ocon
Provient de la normalisation des tables de dimension;

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Modélisation en étoile, un cas

A.Le cas
On vous demande de créer un data Mart (une étoile) pour l'analyse
de l'activité des représentants d'une entreprise de vente
d'imprimantes. Le chef d'entreprise veut savoir ce qui se passe pour
ses vendeurs. Les employés font ils leur travail, quelle est la zone de
couverture des vendeurs, ou sont les endroits où les vendeurs sont
le moins ecaces, quelle est la moyenne de ventes des
représentants, etc., etc. L'entreprise possède un système de gestion
de ressources humaines, un système de gestion des ventes et des
feuilles de routes avec des informations concernant les vendeurs :
kilomètres parcourus, litres d'essence utilisée, frais de voyage,
ventes, promesses de ventes, etc.
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Modélisation en ocon
Créer des hiérarchies de dimensions, de telle manière à avoir moins
de lignes par dimensions

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

La modélisation en ocon n'intervenant que lorsque des


problèmes de performances apparaissent ou sont facilement
prédictibles.
Une règle informelle en BI préconise de oconner que si l'on a
la relation (1-1000). C'est-à-dire que si l'on réussit à créer une
hiérarchie de deux dimensions avec une ligne de la dimension
père (groupe produit par exemple) faisant référence à plus de
1000 lignes de la dimension lle (produit par exemple). Dans
ce cas, il est peut être temps de penser aux ocons.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

La modélisation en étoile ou en ocon, elle, ne s'intéresse qu'à


la conception d'un sous ensemble d'entrepôt, une seule table
de fait.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

La modélisation en étoile ou en ocon, elle, ne s'intéresse qu'à


la conception d'un sous ensemble d'entrepôt, une seule table
de fait.
On ne peut même pas dire qu'une étoile ou un ocon
représente un data Mart, car une fonction de l'entreprise peut
comporter plusieurs tables de faits

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

La modélisation en étoile ou en ocon, elle, ne s'intéresse qu'à


la conception d'un sous ensemble d'entrepôt, une seule table
de fait.
On ne peut même pas dire qu'une étoile ou un ocon
représente un data Mart, car une fonction de l'entreprise peut
comporter plusieurs tables de faits
Exemple: La fonction commerciale d'une entreprise peut

comporter une étoile pour les ventes, un ocon pour les


commandes, une autre étoile pour les retours.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

La modélisation en étoile ou en ocon, elle, ne s'intéresse qu'à


la conception d'un sous ensemble d'entrepôt, une seule table
de fait.
On ne peut même pas dire qu'une étoile ou un ocon
représente un data Mart, car une fonction de l'entreprise peut
comporter plusieurs tables de faits
Exemple: La fonction commerciale d'une entreprise peut

comporter une étoile pour les ventes, un ocon pour les


commandes, une autre étoile pour les retours.
Ce qui est juste, c'est qu'un entrepôt de données est
l'ensemble de ces étoiles et/ou ocons. Mais comment
organiser tout ça ?

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Une constellation est une série d'étoiles ou de ocons reliées entre


eux par des dimensions. Il s'agit donc d'étoiles avec des dimensions
en commun.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Nous savons faire une étoile, mais comment les regrouper pour
mettre en œuvre un entrepôt de données?
Top-Down : c'est la méthode la plus lourde, la plus

contraignante et la plus complète en même temps. Elle


consiste en la conception de tout l'entrepôt (ie : toutes les
étoiles), puis en la réalisation de ce dernier. Imaginez le travail
qu'une telle méthode implique : savoir à l'avance toutes les
dimension et tous les faits de l'entreprise, puis réaliser tout ça…
Le seul avantage que cette méthode comporte est qu'elle ore
une vision très claire et très conceptuelle des données de
l'entreprise ainsi que du travail à faire.
Bottom-Up : c'est l'approche inverse, elle consiste à créer les

étoiles une par une, puis les regrouper par des niveaux
intermédiaires jusqu'à obtention d'un véritable entrepôt
pyramidal avec une vision d'entreprise. L'avantage de cette
méthode est qu'elle est simple à réaliser (une étoile à la fois),
Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Méta données
Information dénissant et décrivant les structures, opérations
et le contenu du système de BI;
Trois types: technique, d'aaires et de processus

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Agrégats

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Rappels sur les agrégats

Exemple de BD
Produit(GENCOD, Designation, Marque, Nature, PrixAchat,
PrixReventeConseille)
Vente (GENCOD, NMAG, Date, Qte, PrixVente)
Magasin(NMAG, Enseigne, Adresse, Ville, Dept)
Nat2Cat(Nature, Categorie)
Cat2Ray(Categorie, Rayonnage)
Dep2Reg(Dept, Region)
Exercice - Donnez les clés primaires et les clés étrangères

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Questions et Requêtes

Montant totale des ventes par ville et par produit

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Questions et Requêtes

Montant totale des ventes par ville et par produit


select ville, produit, sum(qte*prixvente) from vente, produit,
magasin where produit.GENCOD = vente.GENCOD and
vente.NMAG = magasin.NMAG group by ville, produit

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Questions et Requêtes

Montant totale des ventes par ville et par produit


select ville, produit, sum(qte*prixvente) from vente, produit,
magasin where produit.GENCOD = vente.GENCOD and
vente.NMAG = magasin.NMAG group by ville, produit
par région et par catégorie

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Questions et Requêtes

Montant totale des ventes par ville et par produit


select ville, produit, sum(qte*prixvente) from vente, produit,
magasin where produit.GENCOD = vente.GENCOD and
vente.NMAG = magasin.NMAG group by ville, produit
par région et par catégorie
select region, categorie, sum(qte*prixvente) from vente,
produit, magasin, dep2reg, nat2cat where produit.GENCOD =
vente.GENCOD and vente.NMAG = magasin.NMAG and
produit.nature = nat2cat.nature and magasin.dept =
dep2reg.dept group by region, categorie

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

par région et par catégorie et par année

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

par région et par catégorie et par année


select region, categorie, semestre(date), sum(qte*prixvente)
from vente, produit, magasin, dep2reg, nat2cat where
produit.GENCOD = vente.GENCOD and vente.NMAG =
magasin.NMAG and produit.nature = nat2cat.nature and
magasin.dept = dep2reg.dept group by region, categorie,
year(date) Remarque : year(date) n’est pas toujours disponible

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

par région et par catégorie et par année


select region, categorie, semestre(date), sum(qte*prixvente)
from vente, produit, magasin, dep2reg, nat2cat where
produit.GENCOD = vente.GENCOD and vente.NMAG =
magasin.NMAG and produit.nature = nat2cat.nature and
magasin.dept = dep2reg.dept group by region, categorie,
year(date) Remarque : year(date) n’est pas toujours disponible
par région et par catégorie en 2000

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

par région et par catégorie et par année


select region, categorie, semestre(date), sum(qte*prixvente)
from vente, produit, magasin, dep2reg, nat2cat where
produit.GENCOD = vente.GENCOD and vente.NMAG =
magasin.NMAG and produit.nature = nat2cat.nature and
magasin.dept = dep2reg.dept group by region, categorie,
year(date) Remarque : year(date) n’est pas toujours disponible
par région et par catégorie en 2000
select region, categorie, sum(qte*prixvente) from vente,
produit, magasin, dep2reg, nat2cat where produit.GENCOD =
vente.GENCOD and vente.NMAG = magasin.NMAG and
produit.nature = nat2cat.nature and magasin.dept =
dep2reg.dept and year(date) = 2000 group by region, categorie

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Un datamart (ou magasin de données) est une vue partielle du


datawarehouse mais orientée métier. C'est un sous-ensemble du
datawarehouse contenant des informations se rapportant à un
secteur d'activité particulier de l'entreprise ou à un métier qui y est
exercé. Il se situe en aval du datawarehouse et est alimenté par
celui-ci. On peut donc créer plusieurs datamart correspondant au
diérent besoin des utilisateurs. Cela permet de réduire le nombre
d'opération sur les bases de production. De plus cela permet
d'orir aux utilisateurs un outil spéciquement adapté à leurs
besoins. Cet outil sera plus petit et permettra donc un accès plus
rapide à l'information.

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

Pourquoi des data marts ?


Les data marts sont destinés à pré-agréger des données disponibles
de façon plus détaillée dans les data warehouse, an à traiter plus
facilement certaines questions spéciques, critiques, etc

Chaimae ANIBOU
Introduction Dénition de Datawarehouse
Systèmes d'information décisionnels Alimentation du DataWarehouse
Entrepôt de données Architecture d'un entrepôt de données
OLAP Modélisation du DataWarehouse
Datamarts et architecture

La préparation de la donnée pour une utilisation directe, inhérente


au DataMart, peut revêtir plusieurs formes. Il faut noter que toutes
représentent une simplication par rapport au niveau de données
inférieur ; on peut citer pour exemple :
L'agrégation de données : le DataMart ne contient pas le
détail de toutes les opérations qui ont eu lieu, mais seulement
des totaux, repartis par groupements.
Le retrait de données inutiles : le DataMart ne contient que les
données qui sont strictement utiles aux utilisateurs.
L'historisation des données : le DataMart contient seulement
la période de temps qui intéresse les utilisateurs.

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Plan

1 Introduction

2 Systèmes d'information décisionnels

3 Entrepôt de données

4 OLAP

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

OLAP (On-Line Analytical Processing) :fonctionnalités qui


servent à faciliter l'analyse multidimensionnelle : opérations
réalisables sur l'hypercube
Types de systèmes OLAP :
ROLAP : Relational OLAP (ROLAP) systems work primarily
with the data in a relational database
MOLAP : Multidimensional OLAP (MOLAP) systems are
widely regarded as the classic form of OLAP
HOLAP: Hybrid OLAP (HOLAP) is the result of attempting to
incorporate the best features of MOLAP and ROLAP into a
single architecture
WOLAP : Web OLAP (WOLAP) refers to the OLAP
application accessible via the web browser.
DOLAP :Desktop OLAP (DOLAP) allows you to download a
section of data from the database or source and work with that
dataset locally or on your desktop
mOLAP : Mobile OLAP (mOLAP) refers to OLAP
functionalities on aANIBOU
Chaimae wireless or mobile device
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Exemple de cube OLAP

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Hiérarchie du cube

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Opérations sur l'Hypercube

But

Visualisation/Utilisation d'un fragment de l'Hypercube


Opérations OLAP

Drill Up(roll-up) : résumer, agréger des données


En montant dans une hiérarchie ou en oubliant une dimension
: Semaine → Mois
Drill Down : inverse de roll-up
En descendant dans une hiérarchie ou en ajoutant une
dimension : Mois → Semaine
Rotate : Réorienter le cube (Région,Produit)→(Région, Mois)
Slicing et Decing : Projection et sélection selon un axe
Mois = 04-2003 ; Projeter(Région, Produit)

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Drill up/Down

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Rotate

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Slicing

Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Quelques outils
Oracle
OLAP API = Datacube
Express = Analyse
Report = Reporting
Business Object
BusinessQuery = Requêtage
BusinessObject = Requêtage + Analyse + Reporting
WebIntelligence = Datacube
Cognos
Impromptu = Reporting
Powerplay = Datacube
Query = Requêtage
Hyperion
ESS Base =Chaimae
Base ANIBOU
MOLAP
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

Requêtes analytiques

Exemple:
- 300 magasins;
- 40,000 produits;
- 80 marques (500 produits par marque);
- Environ une vente à chaque semaine, pour chaque produit,
dans chaque magasin.
Requête sur 1 produit, 1 magasin, 1 semaine:
– Agrégation de 1 ligne de la table de faits.
Requête sur 1 produit, tous les magasins, 1 semaine:
– Agrégation de 300 lignes de la table de faits.
Requête sur 1 marque, tous les magasins, 1 année:
– Agrégation de 7,800,000 lignes de la tables de faits
Chaimae ANIBOU
Introduction
Systèmes d'information décisionnels
Entrepôt de données
OLAP

The End

Chaimae ANIBOU

Vous aimerez peut-être aussi