Académique Documents
Professionnel Documents
Culture Documents
1
06/03/2021
Comment: répondre aux demandes d’analyse des données, Données opérationnelles (de production)
◦ Bases de données (Oracle, SQL Server)
dégager des informations qualitatives nouvelles
◦ Fichiers, …
◦ Paye, gestion des RH, gestion des commandes…
Pourquoi et
Qui sont mes
meilleurs
comment le Caractéristiques de ces données:
clients?
chiffre ◦ Distribuées: systèmes éparpillés
d’affaire a
◦ Hétérogènes: systèmes et structures de données
baissé?
différents
◦ Détaillées: organisation des données selon les processus
A combien fonctionnels, données surabondantes pour l’analyse
Quels tunisiens s’élèvent mes ◦ Peu/pas adaptées à l’analyse : les requêtes lourdes
consomment
beaucoup de
ventes peuvent bloquer le système transactionnel
poisson?
journalières? ◦ Volatiles: pas d’historisation systématique
5 6
7 8
2
06/03/2021
9 10
1, h,f
Ass. Vie Ass. Auto Ass. Santé
0
Client homme,
femme
Police GBP
EUR
CHF
USD
11 12
3
06/03/2021
Répertoire
Accès Calendrier
Entrepôt
Code Année Mois Code
Code Nom
Nom Mois
Ville
Modification Chargement de données Code
1 Année
2005 Mois
Mai 1
1 Dupont
Dupont Paris
Paris
1 2005 Mai
1
1 Durand
Durand Lyon
Lyon
2 2006 Juillet
13
2 Dupont Marseille 14
Collecte
Bases de Stockage et Analyse
Données gestion
4
06/03/2021
19 20
5
06/03/2021
Domaine de la grande distribution fortement demandeur d’ED : Domaine très concurrentiel des télécommunications utilise
beaucoup les ED
intéressant de regrouper les informations de ventes pour déterminer les
grande masse de données concernant les abonnés et les appels
produits à succès, mieux suivre les modes, détecter les habitudes d’achats,
les préférences des clients par secteur géographique
est enregistrée
Plusieurs mois de description détaillée des appels comprenant,
La fouille de données (data mining) a permis de développer des techniques
pour chaque appel appelant, appelé, heure et durée sont
sophistiquées d’exploitation de données qui aident à mettre en évidence les disponibles chez les opérateurs
règles de consommation
En respectant les lois de sécurité et liberté, que peut-on faire de
Explorer le panier de la ménagère est devenu un exercice d’école : il s’agit de telles données ?
trouver à partir de l’enregistrement des transactions quelles sont les
Couplées ou non avec des informations comptables,
habitudes d’achats, plus précisément quels sont les produits achetés en l’exploitation de ces données regroupées en ED par des
même temps techniques d’analyse et d’exploration permet :
Apports constatés dans la grande distribution : ◦ D’analyser le trafic
◦ augmentation des ventes grâce à un meilleur marketing ◦ De mieux cerner les besoins des clients,
◦ amélioration des taux de rotation de stocks ◦ De classer les clients par catégories,
◦ De comprendre pourquoi certains changent d’opérateurs et mieux
◦ élimination des produits obsolètes
◦ répondre à leur besoins
◦ réduction des rabais, remises, ristournes
◦ meilleure négociation des achats
21 22
23 24
6
06/03/2021
25 26
Processus en 3 phases :
Phase 1: Construction de la base de données
décisionnelle
◦ Modélisation conceptuelle des données multiformes et
multisources
◦ Alimentation de l’entrepôt (extraire, nettoyer, transformer,
charger)
◦ Stockage physique des données
Sélection des données à analyser :
◦ Besoins d’analyse de l’utilisateur
◦ Data mart
◦ Cubes multidimensionnels
◦ Tableaux ou tables bidimensionnels
Analyse des données :
◦ Stastiques et reporting, OLAP, Data Mining
27 28