Vous êtes sur la page 1sur 85

1

Master Ingénierie de la décision


Semestre 1
Cours les systèmes d’informations
décisionnels
Année universitaire 2022-2023
Pr. A. ELOUARDIGHI
jalilelouardighi@gmail.com
Présentation Générale
2

Définition
✓ Système d'information décisionnel: Entrepôts de données ou
Datawarehouse

✓ Système d’information pour les Décideurs

✓ Exploitation : Aide à la décision

Comment ?

✓ En regroupant et exploitant tous les données disponibles

Pr. A. ELOUARDIGHI
Présentation Générale
3

Où sont ces données ?


✓ Systèmes d'informations (Base de données: Oracle, MySQL
etc…)

➢Connexion

✓ Fichiers (Excel, CSV, XML, etc...)

➢Accès simple

✓ Etc...

Pr. A. ELOUARDIGHI
Présentation Générale
4

Caractéristiques de ces données:


✓ Données dispersées et format hétérogène
➢ Nécessite une phase d’extraction (Extract)
✓ Non structurées, male représentées, erronées, manquantes etc ..

➢ Appliquer une série de transformation (Transform)

✓ Données doivent être historisées et non volatiles


➢ Les données transformées doivent être chargées (Loding) dans une base
de données dédier:
Système d’information décisionnel, Entrepôt de données ou un
Datawarehouse

Pr. A. ELOUARDIGHI
Présentation Générale
5

Exploitation:
✓ Interrogation

✓ Analyses

✓ Rapports et des tableaux de bords

✓ Prévision

Pr. A. ELOUARDIGHI
Architecture générale d’un Système
décisionnel
6

Pr. A. ELOUARDIGHI
Objectifs du cours
7

✓ Concepts entrepôts et des magasins de de données


✓ Architectures des entrepôts de données
✓ Conception et modélisation d’un entrepôt de données
✓ Alimentation d’un entrepôt de données
✓ Exploitation d’un entrepôt de données

Pr. A. ELOUARDIGHI
Plan du cours les entrepôts de données
(Datawarehouse)
8

❑ Cours les entrepôts de données


✓ Partie 1: Notions et architecture des entrepôts de données

✓ Partie 2: Concept OLAP et l’analyse multidimensionnelle

✓ Partie 3: Conception et modélisation des entrepôts de données

❑ Travaux dirigés de conception des entrepôts de données


❑ Évaluation:
✓ Examen Ecrit

Pr. A. ELOUARDIGHI
9

Partie1:
Notions et architectures des entrepôts de
données

Pr. A. ELOUARDIGHI
Plan
10

❖ Motivations
❖ Les concepts des entrepôts de données
❖ Différence entre OLAP et OLTP
❖ Définition et caractéristiques d’un entrepôt de données
❖ Notions de magasin de données ( Datamart)
❖ Architecture d’un entrepôt de données

Pr. A. ELOUARDIGHI
Le contexte et les motivations
11

✓Besoin: prise de décisions stratégiques et tactiques

✓Pourquoi: besoin de réactivité

✓Qui: les décideurs (non informaticiens)


✓Comment: analyse des données disponibles

Pr. A. ELOUARDIGHI
Les données utilisables par les décideurs
12

❑ Données opérationnelles (de production):


✓ Bases de données (Oracle, SQL Server, MySQL …)

✓ Fichiers plats, XML, CSV, Excel….

✓ Bulletins de paye, Devis, gestion des commandes…

❑ Caractéristiques de ces données:


✓ Distribuées: systèmes éparpillés

✓ Hétérogènes: systèmes et structures de données différents

✓ Pas adaptées à l’analyse : les requêtes lourdes peuvent bloquer le système


transactionnel

✓ Volatiles: pas d’historisation systématique

Pr. A. ELOUARDIGHI
Problématique
13

❑ Comment répondre aux demandes des décideurs?


✓ En donnant un accès rapide et simple à l’information stratégique

✓ En donnant du sens aux données


Mettre en place un système d’information dédié aux applications
décisionnelles: Les entrepôts de données (Le Datawarehouse )

Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
14

❑ Systèmes transactionnels
✓ Outils traditionnels de gestion et d’exploitation de données transactionnel
ou OLTP (On-Line Transaction Processing)
✓ L’exploitation de données est tourné vers la saisie, le stockage, la mise à
jour, la sécurité et l’intégrité des données.
✓ Les systèmes transactionnels sont développés pour gérer des transactions
quotidiennes

Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
15

❑ Systèmes transactionnels
✓ Ces systèmes supportent habituellement des applications particulières
telles que les inventaires de magasins, les réservations d’hôtel, etc…

✓ Les données sont très détaillées (détails de chacune des transactions)


✓ Le contenu est fait de données actuelles, pas d’archives
✓ La mise à jour s’effectue par de nouvelles transactions

✓ Très souvent plusieurs de ces systèmes existent indépendamment les uns


des autres

Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
16

❑ Opérations dans les systèmes transactionnels


✓ Ajout

✓ Effacement
✓ Mise à jour des enregistrements
✓ Requêtes simples
✓ Interrogations et modifications fréquentes des données par de nombreux
utilisateurs

Pr. A. ELOUARDIGHI
Systèmes transactionnels vs Systèmes décisionnels
17

❑ Systèmes décisionnels:
✓ Le terme décisionnel « Business Intelligence (BI) » couvre l'ensemble
des technologies permettant de collecter, consolider, modéliser et
restituer les données , en vue d'offrir une aide à la décision.
✓ SI capable d'agréger les données internes ou externes et de les
transformer en information servant à une prise de décision rapide.
❑ SI capable de répondre à certains types de questions:
✓ Quelles sont les ventes du produit X pendant le trimestre A de l'année B
dans la région C ?
✓ Comment se comporte le produit X par rapport au produit Y?
✓ Quel type de client peut acheter le produit X?
✓ Est-ce qu'une baisse de prix de 10% par rapport à la concurrence ferait
redémarrer les ventes du produit X ?

Pr. A. ELOUARDIGHI
Applications transactionnelles v.s
Applications décisionnelles
18

✓Les applications transactionnelles sont constituées de


traitements factuels de type OLTP ( On Line Transaction
Processing)
✓Les applications d'aide à la décision sont constituées de
traitements ensembliste de type OLAP (On Line Analytical
Processing)

Pr. A. ELOUARDIGHI
Différence entre OLTP et OLAP
19

Conception Orientée application Orientées sujet


Structure statique Structure évolutive

Actuelles Historiques
Données
Détaillées Résumées, agrégées
Peuvent être mises à jour Pas de mises à jour
Accessibles de façon individuelle Accessibles de façon ensembliste

Servent les agents opérationnels Servent les managers


Utilisateurs
Traitées de façon répétitive Traitées de façon heuristiques
Utilisation
Requêtes simples Requêtes complexes
Sensibles aux performances Non sensibles aux performances

Nb Utilisateur Des milliers


Des centaines
Taille BD 100 Mo - Go 100 Go -To

Pr. A. ELOUARDIGHI
Incompatibilités des deux activités
20

✓ Les deux activités (OLTP & OLAP) ne peuvent coexister dans le


même système d’information.

✓ Leurs objectifs sont opposés:


➢ Les requêtes complexes et lourdes dégradent les performances des
systèmes transactionnels,
➢ Les données sont réparties entre données actuelles et données
archivées, rendant la vue historique très difficile ou impossible,
✓ Le support efficace d’une activité OLAP nécessite la
constitution d’un système d’information propre: Les entrepôts
de données( Le Datawarehouse).

Pr. A. ELOUARDIGHI
Naissance des entrepôts de données
21

Pr. A. ELOUARDIGHI
Datawarehouse : Définition
22

❑ Définition selon Bill Inmon:

« Collection de données orientées sujets, intégrées,


non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision »

« Base de données dans laquelle sont déposées après nettoyage


et homogénéisation les données en provenance des différents
systèmes de production de l’entreprise OLTP »

Pr. A. ELOUARDIGHI
Caractéristiques des données d'un entrepôts
de données
23

❑ Orientées sujet:
✓ Organisées autour de sujets ou thèmes majeurs de l’entreprise
✓ Données pour l’analyse et la modélisation en vue de l’aide à la décision,
et non pas pour les opérations et transactions journalières
❑ Intégrées:
✓ Construit en intégrant des sources de données multiples et hétérogènes
➢ BD relationnelles, fichiers, enregistrements de transactions
✓ Les données doivent être mises en forme et unifiées afin d’avoir un état
cohérent
✓ Phase la plus complexe (60 à 90 % de la charge totale d’un projet BI)

Pr. A. ELOUARDIGHI
Caractéristiques des données d'un entrepôts
de données
24

❑ Historisées:
✓ Stockage de l'historique des données, pas de mise à jour
❑ Non volatiles:
✓ Conséquence de l’historisation
✓ Pas de mises à jour des données dans un entrepôt de données

Pr. A. ELOUARDIGHI
Données multidimensionnelles
25

❑ Notion de dimension
✓ C’est une catégorie linguistique selon laquelle les données sont
organisées:
➢ Nom de la dimension (Date)
➢ Valeurs de la dimention ( Année, Trimestre, Mois, Semaine)

Pr. A. ELOUARDIGHI
Représentation
26

DuréeMoy Départ. Mois Année

5 Info Janv 1998


5 Phys Janv 1998
18 Philo Janv 1998
7 Droit Janv 1998
12 Info Févr 1998
8 Phys Févr 1998
9 Philo Févr 1998
15 Droit Févr 1998
18 Info Mars 1998
12 Phys Mars 1998
22 Philo Mars 1998
25 Droit Mars 1998

Pr. A. ELOUARDIGHI
…Autres représentation
27

1998 Janv Févr Mars

Info 5 12 18
Phys 5 8 12
Philo 18 9 22
Droit 7 15 25

Pr. A. ELOUARDIGHI
…Autres représentation
28

1998
30
25
20
15
10
5

Droit Philo Phys Info

Pr. A. ELOUARDIGHI
Notion de Datamart
29

❑ Définition:
« C'est un sous-ensemble de données dérivées de l’entrepôt de
données ciblé sur un sujet unique».

Pr. A. ELOUARDIGHI
Les différents types de Datamart
30

✓ Datamart dépendant
➢ Les données sont extraites des systèmes OLTP et stockées
en premier lieu dans l’entrepôt de données
➢ L’entrepôt de données alimente les datamarts avec les
données

Pr. A. ELOUARDIGHI
Les différents types de Datamart
31

✓ Datamart indépendant
➢ Les datamarts sont alimentés directement a partir des
systèmes OLTP.
➢ Adapté pour les petites organisations

Pr. A. ELOUARDIGHI
Les différents types de Datamart
32

✓ Datamart hybride
➢ Les datamarts sont alimentés a partir de l’entrepôt de
données et des systèmes OLTP.

Pr. A. ELOUARDIGHI
Architecture générale d’un Système
décisionnel
33

Pr. A. ELOUARDIGHI
Les flux de données
34

❑ Flux entrant:
✓ Extraction: multi-source, hétérogène
✓ Transformation: filtrer, trier, homogénéiser, nettoyer etc…
✓ Chargement: insertion des données dans l’entrepôt
❑ Flux sortant:
✓ Mise à disposition des données pour les utilisateurs finaux

Pr. A. ELOUARDIGHI
Les différentes zones de l’architecture
35

❑ Zone de préparation (Staging area)


✓ Zone temporaire de stockage des données extraites
✓ Réalisation des transformations avant l’insertion dans
l’entrepôt de données:
➢ Nettoyage
➢ Normalisation…

✓ Données souvent détruites après chargement dans l’entrepôt

Pr. A. ELOUARDIGHI
Les différentes zones de l’architecture
36

❑ Zone de stockage (Datawarehouse, Datamart)


✓ On y transfère les données nettoyées
✓ Stockage permanent des données
❑ Zone de présentation
✓ Donne accès aux données contenues dans l’entrepôt
✓ Peut contenir des outils d’analyse programmés
❑ Zone d’exploitation
✓ Requêtes / Rapports
✓ Analyse (OLAP), Tableaux de bords
✓ Datamining
Pr. A. ELOUARDIGHI
Les métadonnées
37

✓ Les métadonnées jouent un rôle central dans l'alimentation de


l’entrepôt.

✓ Ce sont les "données sur les données".

✓ Elles sont utilisées dans la phase de préparation des données (


l'extraction, l'agrégation, transformation, le filtrage et le transfert des
données).

Pr. A. ELOUARDIGHI
Exemple: un entrepôt dans les télécoms
38

❑ Sujets
✓ Comportement de la clientèle
✓ Comportement du réseau

❑ Historique
✓ 1 an pour le comportement de la clientèle

✓ 1 mois pour le comportement du réseau

❑ Sources
✓ Fichiers clients élaborés par les agences

✓ Fichiers de facturation

Pr. A. ELOUARDIGHI
Exemple de Requêtes (comportement clientèle)
39

✓ Nombre moyen d'heures par client, par mois et par région


✓ Répartition des appels clients sur la journée
✓ Nombre moyen de numéros appelés
✓ Durée moyenne d'une communication urbaine par ville
✓ Durée moyenne d'une communication internationale
✓ Etc …

Pr. A. ELOUARDIGHI
Quelques domaines d’application du
décisionnel
40

✓ La gestion de la relation client (CRM): est l’un des premiers champs


d’application de la Business Intelligence.

✓ Banque: Risques d’un prêt, profils des solvables et des non solvables

✓ Commerce: Ciblage de clientèle, Déterminer des promotions, les


prévisions des ventes, l’optimisation des territoires…

✓ Logistique: Adéquation demande/production

✓ Assurance: Risque lié à un contrat d’assurance

✓ La direction marketing: pour le ciblage, le pilotage de gamme, les


applications de géomarketing, de fidélisation clients…

✓ Les ressources humaines: pour la gestion des carrières,

Pr. A. ELOUARDIGHI
Bilan Partie 1
41

✓ Définition et caractéristiques d’un Entrepôt de données


✓ Différence entre les deux activités OLTP et OLAP
✓ Définition d’un Datamart
✓ Architecture d’un entrepôt de données (les différentes
zones et leurs rôles)

Pr. A. ELOUARDIGHI
42

Partie 2 :
OLAP et Analyse multidimensionnelles

Pr. A. ELOUARDIGHI
Plan
43

❖ Concepts OLAP
❖ Vue multidimensionnelles
❖ Niveaux d’agrégations
❖Hiérarchie des dimensions

Pr. A. ELOUARDIGHI
Concepts OLAP
44

✓ Il s’agit d’une catégorie de logiciels axés sur l’exploration et


l’analyse rapide des données selon:
➢ Une vue multidimensionnelle
➢ Plusieurs niveaux d’agrégation .

Pr. A. ELOUARDIGHI
Vue multidimensionnelle
45

✓ Souvent représentés par une structure à plusieurs dimensions


✓ Une dimension est un attribut ou un ensemble d’attributs:
➢ Temps
➢ Géographie
➢ Produits
✓ Les cellules contiennent des données agrégées appelées Faits ou
Indicateurs:
➢ Nombre d’unités vendues
➢ Chiffre d’Affaire
➢ Coût
✓ Représentations:
➢ Relations,
➢ Cube de données,

Pr. A. ELOUARDIGHI
Vue multidimensionnelle
46

Pr. A. ELOUARDIGHI
Agrégation des données
47

❑ Plusieurs niveaux d’agrégation


✓ Les données peuvent être groupées à différents niveaux de granularité
✓ Les regroupements sont pré-calculés,
➢ Par exemple, le total des ventes pour le mois dernier calculé à partir de la somme de
toutes les ventes du mois.
✓ Granularité : niveau de détail des données emmagasinées dans un
entrepôt de données.

Précision des analyses +


- Finesse

Taille de l’entrepôt

Pr. A. ELOUARDIGHI
Hiérarchie des dimensions
48

✓ Une dimension contient des membres organisés en hiérarchie

✓ Chacun des membres appartient à un niveau hiérarchique (ou niveau de


granularité) particulier

✓ Granularité d’une dimension : nombre de niveaux hiérarchiques

Pr. A. ELOUARDIGHI
Les différents types d’hiérarchies
49

❑ Balanced hiérarchies (Hiérarchie équilibrée)


✓ Dans ce type de hiérarchie, chaque membre descend au même niveau
(profondeur).

Pr. A. ELOUARDIGHI
Les différents types d’Hiérarchies
50

❑ Unbalanced hiérarchies (Hiérarchie non équilibrée)


✓ Dans cette hiérarchie quelques branches ont plus de niveaux (profondeur)
que d'autres.

Pr. A. ELOUARDIGHI
Les différents types d’Hiérarchies
51

❑ Ragged hierarchies (Hiérarchie déchiquetées)


✓ Dans cette hiérarchie, au moins une branche qui inclut un membre dont le parent
logique n'est pas le niveau immédiatement au-dessus de ce membre.

Pr. A. ELOUARDIGHI
OLAP et le principe d’agrégation
52

Pr. A. ELOUARDIGHI
Bilan Partie 2
53

✓ L’approche Multidimensionnelle
✓ Granularité et les niveaux d’agrégation
✓ Hiérarchie des dimensions

Pr. A. ELOUARDIGHI
54

Partie 3:
Modélisation et Conception d’un entrepôt
de données

Pr. A. ELOUARDIGHI
Plan
55

❖ Conception d'un entrepôt de données


❖ Etude préalable
❖ Modélisation
❖ Alimentation
❖ Restitution

Pr. A. ELOUARDIGHI
Conception d’un entrepôt de données
56

❑ Caractéristiques d’un entrepôt de données


✓ L’entrepôt de données est différent des bases de données de production:
➢ Les besoins pour lesquels on veut le construire sont différents
➢ Il contient des informations historisées, organisées selon les métiers de
l’entreprise pour un processus d’aide à décision
✓ Un entrepôt de données n’est pas un produit ou un logiciel mais un
environnement, qui se bâtit et ne s’achète pas.

Pr. A. ELOUARDIGHI
Conception d’un entrepôt de données
57

❑ Phases de construction d’un entrepôt de données


✓ L’étude préalable qui va définir les objectifs, la démarche à suivre, le
retour sur investissement,…
✓ L’étude du modèle de données qui représente l’entrepôt de données
conceptuellement et logiquement
✓ L’étude de l’alimentation de l’entrepôt

Pr. A. ELOUARDIGHI
Partie 3:
Modélisation et Conception d’un entrepôt de données
58

❖ Conception d'un entrepôt de données


❖ Etude préalable
❖ Modélisation
❖ Alimentation
❖ Restitution

Pr. A. ELOUARDIGHI
Etude préalable
59

❑ Etude des besoins:


✓ Définir les objectifs de l’entrepôt de données
✓ Déterminer le contenu de l’entrepôt de donnée et son organisation,
d’après:
➢ Les résultats attendus par les utilisateurs,
➢ Les requêtes qu’ils formuleront,
➢ Les projets qui ont été définie.
✓ Recenser les données nécessaires au bon fonctionnement de l’entrepôt de
donnée:
➢ Recenser les données disponibles dans les bases de production
➢ Identifier les données supplémentaires requises

Pr. A. ELOUARDIGHI
Etude préalable
60

❑ Etude des besoins:


✓ Choisir les dimensions

➢ Typiquement: le temps, le client, le produit, le magasin...

✓ Choisir les mesures de fait

➢ De préférences des quantités numériques additifs

✓ Choisir la granularité des faits

➢ Niveau de détails des dimensions

Pr. A. ELOUARDIGHI
Etude préalable
61

❑ Méthodologie de Bill Inmon (Top-Down)


✓ Concevoir tout l’entrepôt intégralement

Pr. A. ELOUARDIGHI
Etude préalable
62

❑ Méthodologie de Ralph Kimbal (Bottom-up)


✓ Créer les datamarts un par un puis les regrouper par des niveaux
intermédiaires jusqu'à obtention d'un véritable entrepôt.

Pr. A. ELOUARDIGHI
Etude préalable
63

❑ Coûts de déploiement:
✓ Nécessite des machines puissantes, souvent une machine parallèle

✓ Capacité de stockage très importante (historisation des données)

➢ Evaluer la capacité de stockage

✓ Equipes de maintenance et d’administration

✓ Les coûts des logiciels

➢ Les logiciels d’administration du DW

➢ Les outils ETL (Extract-Transform- Loading)

➢ Les outils d’interrogation et de visualisation

➢ Les outils de Datamining Pr. A. ELOUARDIGHI


Partie 3:
Modélisation et Conception d’un entrepôt de données
64

❖ Conception d'un entrepôt de données


❖ Etude préalable
❖ Modélisation
❖ Alimentation
❖ Restitution

Pr. A. ELOUARDIGHI
Modèles de données
65

❑ Niveau conceptuel:
✓ Un entrepôt de données est basé sur une modélisation
multidimensionnelle qui représente les données dans un cube

✓ Un cube permet de voir les données suivant plusieurs dimensions:

➢ Tables de dimensions

➢ La table des faits contient les mesures et les clés des dimensions

Pr. A. ELOUARDIGHI
Table de faits
66

✓ Table principale du modèle dimensionnel


✓ Contient les données observables (les faits) sur le sujet étudié selon divers axes
d’analyse (les dimensions)

Pr. A. ELOUARDIGHI
Table de faits (suite)
67

❑ Fait:
✓ Ce que l’on souhaite mesurer
✓ Trois types de faits:
➢ Additif
➢ Semi additif
➢ Non additif

Pr. A. ELOUARDIGHI
Typologie des faits
68

❑ Additif:
✓ Additionnable suivant toutes les dimensions
✓ Peut être le résultat d’un calcul:
✓ Exemple:
➢ Quantités vendues, montant des ventes…
➢ Bénéfice = montant vente – coût
❑ Semi additif:
✓ Additionnable suivant certaines dimensions
✓ Exemple: Solde d’un compte bancaire:
➢ Pas de sens d’additionner sur les dates
➢ Σ sur les comptes: on connaît ce que nous possédons en banque
❑ Non additif:
✓ Non additionnable quelque soit la dimension
✓ Exemple: Prix unitaire
Pr. A. ELOUARDIGHI
Table de dimension
69

✓ Axe d’analyse selon lequel vont être étudiées les données observables
(faits)
✓ Contient le détail des dimensions

Pr. A. ELOUARDIGHI
Les schémas de référence
70

❑ Niveau Logique:
✓ Un schéma donne la description logique de toute la base de données
✓ Plusieurs schémas types sont proposés pour représenter un entrepôt de
données:
➢ Schéma en étoile;
➢ Schéma en flocon;
➢ Schéma en constellation.

Pr. A. ELOUARDIGHI
Les schémas de référence
71

❑ Schéma en étoile:
✓ Une table de faits : identifiants des tables de dimension ; une ou
plusieurs mesures .
✓ Plusieurs tables de dimension : descripteurs des dimensions.

Pr. A. ELOUARDIGHI
Les schémas de référence
72

❑ Schéma en flocon:
✓ Raffinement du schéma étoile avec des tables normalisées par
dimensions.

Pr. A. ELOUARDIGHI
Les schémas de référence
73

❑ Schéma en constellation
✓ Consiste à fusionner plusieurs modèles en étoile utilisant des
dimensions communes ou conforme
✓ Un modèle en constellation comprend donc plusieurs tables de faits et
des tables de dimensions communes ou non à ces tables de faits.

Pr. A. ELOUARDIGHI
Partie 3:
Modélisation et Conception d’un entrepôt de données
74

❖ Conception d'un entrepôt de données


❖ Etude préalable
❖ Modélisation
❖ Alimentation
❖ Restitution

Pr. A. ELOUARDIGHI
Alimentation
75

✓ L’alimentation est la procédure qui permet de transférer des données du


système opérationnel vers l’entrepôt de données
✓ La conception de cette opération est une tâche complexe
✓ Elle doit être faite en collaboration avec l’administrateur des bases de
productions
✓ Il est nécessaire de déterminer:
➢ Quelles données seront chargées
➢ Les transformations et les vérifications nécessaires
➢ La périodicité et le moment de transferts des données

Pr. A. ELOUARDIGHI
Alimentation
76

❑ Les étapes de base de l’alimentation


✓ Extraction (Extract)
✓ Transformation (Transform)
➢ Filtrer
➢ Homogénéiser
➢ Nettoyer
➢ Etc …
✓ Chargement (Loading)

Pr. A. ELOUARDIGHI
Extraction
77

❑ Extraction:
✓ Depuis différentes sources: Base de données, Fichiers plats, etc …
✓ Utilisation divers connecteurs : ODBC, JDBC etc …
✓ Périodique et répétée
✓ Difficulté:
➢ Ne pas perturber les applications OLTP

Pr. A. ELOUARDIGHI
Transformation
78

✓ C’est une suite d’opérations qui a pour but de rendre les données
cibles homogènes et puissent être traitées de façon cohérente.
➢ Unification des modèles
➢ Convertir / uniformiser les noms des attributs
➢ Uniformiser les valeurs d ’attributs
➢ Nettoyer ( Valeurs manquantes, aberrantes…)

Pr. A. ELOUARDIGHI
Chargement
79

✓ C’est l’opération qui consiste à charger les données nettoyées et


préparées dans l’entrepôt de données
✓ Insertion ou modification des données dans l’entrepôt
✓ Utilisation de connecteurs: (ODBC, JDBC etc…)
✓ C’est une opération qui peut être longue
➢ Mettre en place des stratégies pour assurer de bonnes conditions à sa
réalisation
➢ Définir la politique de rafraîchissement.

Pr. A. ELOUARDIGHI
Définition d’un ETL
80

✓ Offre un environnement de développement


✓ Offre des outils de gestion des opérations et de maintenance
✓ Permet de découvrir, d’extraire les données à partir de sources
hétérogènes
✓ Permet de nettoyer et standardiser les données
✓ Permet de charger les données dans un entrepôt

Pr. A. ELOUARDIGHI
Outils ETL
81

❑ Exemples d’outils ETL Commerciaux


✓ BusinessObjects, Data Integrator,
✓ IBM, Websphere Datastage ,
✓ Oracle Corporation, Warehouse builder,
❑ Exemples d’outils ETL Open source
✓ Talend Open Studio
www.talend.com/
✓ Pentaho Data Integration (PDI)
kettle.pentaho.org/
✓ Clover ETL
https://www.cloveretl.com/

Pr. A. ELOUARDIGHI
Partie 3:
Modélisation et Conception d’un entrepôt de données
82

❖ Conception d'un entrepôt de données


❖ Etude préalable
❖ Modélisation
❖ Alimentation
❖ Restitution

Pr. A. ELOUARDIGHI
Restitution
83

✓ Requêteurs : Donne une réponse à une question plus ou moins


complexe (type SQL)

✓ EIS (Executive Information Systems): Outils de visualisation et de


navigation dans les données

✓ Applications spécialisées : applications développées spécialement


pour les besoins de l’entreprise

✓ Tableaux de bord

✓ Data Mining : Outils évolués de prédiction, simulation, ...

Pr. A. ELOUARDIGHI
Restitution
84

Pr. A. ELOUARDIGHI
Bilan Partie 3
85

✓ Les étapes de conception d’un entrepôt de données


✓ Les méthodologies de conception d’un entrepôt de données
✓ Structure des tables de démentions et des tables de faits
✓ Les schémas de références
✓ L’alimentation et l’exploitation d’un entrepôt de données

Pr. A. ELOUARDIGHI

Vous aimerez peut-être aussi