Vous êtes sur la page 1sur 8

Exercice 1 :

Enoncé

Une grande entreprise à succursales multiples veut rassembler toutes les nuits dans un
entrepôt de données des informations sur les ventes du jour afin de dresser des tableaux de bord
sur les ventes.

L’entreprise dispose d’un système d’information complexe, constitué des éléments suivants :
- des applications et bases de données éparses et hétérogènes sur les produits qu’elle
vend,
- des applications et BD, également variées, sur les clients,
- idem sur les personnels de l’entreprise.

L’ED à modéliser doit pouvoir fournir le chiffre d’affaires des ventes d’un produit, par date,
client, et vendeur, ainsi que toutes les sommations possibles de chiffre d’affaires.

Une vente correspond à un produit et un seul,


Les produits sont regroupés par famille de produits.
La vente est effectuée par l’un des vendeurs du service de vente spécialisé dans le produit. La
semaine de vente est le numéro de semaine dans l’année.
Exercice 2 : La PME de produits chimiques
Le cahier des charges utilisateurs fait état des demandes de tableaux suivants :

Tableau 1 : chiffre d'affaires mensuel


Mois de vente : juin 2008

Pays Région Dépt CA HT CA cumulé


commerciale depuis
janvier

France Rhône-Alpes 69 100 480

42 75 354

PACA 13 150 678

Tableau 2 : Suivi des ventes par site


Mois de vente : juin 2008 – 2e trimestre Site de Lyon Bron

Famille Sous-famille Produit Conditionnemen Q vendue CA


t

Liquide Acide Acide Bidon 50 l 25 56


phosphorique

Container 500 l 2 25

Acide chloridrique Bidon 20 l 143 856

Bidon 50 l 10 567

Acide base Bidon 50 l 138 1300

Tableau 3 : Liste des clients par commerciaux


Commercial : J. Durand

Yoplait RA 75 cours Charlemagne 69002 Lyon 04.37.22.33.44

Rhodia St Fons RD12 69600 St Fons 04.72.04.04.04

Commercial : R. Faucourt

Elf Feyzin Chemin de la lanterne 69700 Feyzin 04.37.12.33.49


Tableau 4 : Suivi des ventes par client
Mois de vente : mars 2008

Région commerciale : Rhône Alpes

Département commerciale : Rhône (69)

Commercial : J. Durand

Client : Yoplait RA

Produit Conditionnement Q vendue CA

Acide Bidon 50l 125 230


phosphorique

Container 500l 0 45

Sucre Vrac 143 856

Colorant E230 Bidon 50l 45 300

1- Un client peut être amené à changer de commercial. Nous souhaitons pouvoir suivre l’historique de la
relation Client/Commercial.

Exercice 3 : Le chômage
Une des missions de Pôle Emploi est de rendre compte aux ministères du nombre de demandeurs d’emploi en
France.

Les experts fonctionnels de Pôle Emploi expliquent que :

 Un individu est comptabilisé comme demandeur d’emploi une fois inscrit à une agence de Pôle Emploi. Au
cours de sa vie, il peut être inscrit plusieurs fois.
 Un individu est soustrait de la « liste des demandeurs d’emploi » lorsqu’il est radié ou, plus précisément,
son inscription a cessé.

Lors de l’inscription d’un individu, les opérateurs saisissent les données suivantes :

 Le NOM, le PRENOM, la DATE DE NAISSANCE, l’ADRESSE, tranche d’age et situation familiae du


demandeur d’emploi et le système attribue au demandeur d’emploi un IDENTIFIANT

 Dés l’inscription, un dossier est ouvert avec un code.


 Le MOTIF D’INSCRIPTION (« licenciement », « démission », …)
 La CATEGORIE DE DEMANDEUR D’EMPLOI
 La DATE DE TRAITEMENT DE L’INSCRIPTION
 Date d’inscription
 La DATE D’EFFET DE L’INSCRIPTION
 …

A la cessation d’une inscription, les opérateurs saisissent les données suivantes :

 L’IDENTIFIANT DU DEMANDEUR D’EMPLOI


 La DATE DE TRAITEMENT DE LA CESSATION D’INSCRIPTION
 La DATE D’EFFET DE LA CESSATION D’INSCRIPTION
 La RAISON DE CESSATION D’INSCRIPTION
 CATEGORIE DU DEMANDEUR D’EMPLOI

La direction souhaite :

 Une analyse agrégée par mois du nombre de demandeurs d’emploi par catégorie, zone géographique et
motif d’inscription.
 Le suivi journalier des inscriptions.
 Une analyse agrégée par mois, par catégorie & par agence du nombre de cessation.

Merci de modéliser.

Exercice 4
1. Objectif de l'exercice - Contexte

Nous sommes une entreprise qui souhaite créer un outil d'analyse des commandes en attente.
On dispose d'une base de données opérationnelle (ERP) décrite dans un schéma OLTP. Cette BD
peut nous permettre d'alimenter un entrepôt de données.
Il s'agit de définir les dimensions pertinentes pour l'analyse du délai de traitement des commandes.

2. Hypothèse sur la notion de commandes en attente


On a retenu un flux Commande client > Bulletin de livraison > facture client
On considère une commande en attente si elle existe à un des stades suivants :
commande client à solder, commande client liquidée
bulletin de livraison à confirmer, bulletin de livraison confirmé
On considère que lorsque le Bulletin de livraison est liquidé, alors la commande n'est plus en attente.

3. Schéma en étoile OLAP


Au centre du schéma, se trouve la table de faits commandes en attente. Les
différents champs retenus (et dimensions) sont les suivants :
produit : la mise à disposition de certains produits peut poser des problèmes
- approvisionnement de composants (pb fournisseurs), retard de fabrication
distribution : les performances de la chaîne de distribution peuvent varier d'une région à l'autre client : -
limite de crédit, retards de paiement qui retarde la confirmation d'une commande
- commandes trop spécifiques
- client pointilleux qui bloque le processus (conteste les délais)
La table date indique la date du jour à laquelle a eu lieu l'extraction de données.

3. Requêtes SQL

a) requête2 = calcul de la moyenne du nombre des commande en attente pour un mois donné et pour un
produit donné

Schéma en étoile
Exercice 5
Dans cet exercice, nous considérons une chaîne de magasins spécialisée dans la vente de
journaux et de magazines. Sont vendus plusieurs types de publication (mode, sport, voiture,
enfant, ...) d’´éditeurs variés.

Le type de magasin varie entre le kiosque de coin de rue et la grande surface.

Chaque soir, le manager de chaque magasin doit faire le bilan de ses ventes quotidiennes sous forme
d’un tableur. Plus précisément, il y reporte le nombre d’exemplaires de chaque journal ou magazine
vendu. Il envoie ensuite ce fichier `a l’administration centrale. Pour l’instant, ce mode
opératoires est le seul moyen utilisé par l’administration centrale pour collecter et analyser
des données globales. L’objectif de l’administration centrale est d’améliorer le processus afin de
mieux analyser le nombre de ventes par publication (et type de publication). A cette fin, un entrepôt
de données doit ˆetre d´enveloppé.

Mettez-vous `à la place du d´développeur de cet entrepˆot de donn´ees. Sont nottament `a r´esoudre


les probl`emes suivants, en se reportant au processus de d´eveloppement vu en cours.

1. D´développer un modèle multidimensionnel pour le scénario d´ecrit ci-dessus. Votre solution


doit comprendre entre autre les hiérarchies et les attributs n´écessaires. Notez qu’une publication
peut avoir plusieurs ´éditions.

2. D´enveloppez un schéma en étoile.

3. D´enveloppez un schéma en flocon.

4. Formulez une requête SQL déterminant le nombre de ventes de toutes les publications de la
catégorie sport en 2011 en prenant en compte

(a) le schéma en ´étoile de (2)

(b) le schéma en flocon de (3)

Discutez les avantages et inconvénients des deux solutions.

Exercice 6 :
Une compagnie aérienne souhaite suivre et analyser les vols qu’elle programme. La maîtrise
d’ouvrage fournit les éléments suivants :

 La compagnie aérienne gère un ensemble de lignes pour ses clients.


 Une ligne est caractérisée par numéro de ligne, date d’ouverture de la ligne, le vol, aéroport
de départ, d’arrivé, date d’ouverture, distance et durée de vol.
 Un même vol peut être affecté à plusieurs lignes.
 Un vol est caractérisé par un numéro et un libellé (ex. AT505, AT600 …)
 Lorsqu'un VOL est programmé, il constitue un DEPART
 Il est caractérisé par un NUMERO, une AEROPORT DE DEPART, un AEROPORT
D’ARRIVEE, une HEURE-DEPART, une HEURE-ARRIVEE, une DISTANCE prévisionnelle,
une DUREE et une catégorie d’avion, chiffre d’affaire prévisionnel, chiffre d’affaire réalisé,
nombre de passager)
 A chaque DEPART est affecté un AVION.
 Un AVION est caractérisé par un NUMERO, un CONSTRUCTEUR, un MODELE et une
CAPACITE
 Pour chaque départ, un certaine QUANTITE DE CARBURANT est prévue pour accomplir le
trajet.
Nous souhaitons gérer dans le modèle multidimensionnelle l’ouverture des lignes et la
programmation des départs.

Exercice 7 :

Il s'agit de modéliser le Data Warehouse d’un institut privé spécialisé dans les formations
soucieux de suivre le déroulement des sessions qu’il organise. La maîtrise d’ouvrage nous
donne les éléments suivants :

 Un COURS est caractérisé par un NUMERO, un LIBELLE, une DUREE en jours et une
FILIERE
 Un cours donné correspond à une SESSION débutant à une DATE DE DEBUT et
finissant à une DATE DE FIN
 Les PARTICIPANTS s’inscrivent aux différentes sessions et communiquent leur PROFIL
(« débutant », « initié », « confirmé », …) lors de l’inscription. Un participant est
caractérisé par un NUMERO, un NOM et un PRENOM
 On enregistre également, pour chaque participant, le NOM et l’ADRESSE DE
L’ENTREPRISE payante. La session est caractérisée par un prix pour chacune des
entreprises. On désire pouvoir suivre et analyser le CHIFFRE D’AFFAIRES MENSUEL
des sessions !

Par ailleurs, on désire pouvoir suivre et analyser les interventions des animateurs au cours
des sessions.

 Une session est le plus souvent assurée par plusieurs ANIMATEURS et est placée sous
la responsabilité d'un ANIMATEUR PRINCIPAL défini à la programmation de la session
 Un animateur peut intervenir dans plusieurs sessions au cours de l'année. Pour
chaque session un NOMBRE D’HEURES d’intervention est effectué par chaque
animateur et est enregistré dans le système
 L’animateur ne peut pas intervenir à deux sessions différentes la même journée
 Un animateur est caractérisé par un MATRICULE, un NOM, un PRENOM et une
SPECIALISATION
La direction souhaite suivre et analyser le NOMBRE D’HEURES MENSUEL effectué par
chaque animateur.

Exercice 8 :

Une agence de voyage aimerait pouvoir analyser ses données afin de planifier de
meilleures campagnes de promotion auprès de ses clients. Plus particulièrement, elle
aimerait analyser le nombre et le montant des ventes en fonction:
 De la destination: hôtel, ville, pays, région, catégorie de région (ex: bord de mer,
alpine, etc.), catégorie de destination (ex: familial ou non), catégorie hôtel (ex: 1-
4 étoiles) ;
 De la date d'achat: jour de l'année, jour de la semaine, mois, année, saison
touristique (ex: basse ou haute saison);
 De la date de départ: jour de l'année, jour de la semaine, mois, année, saison
touristique (ex: basse ou haute saison);
 Du forfait: nombre de personnes, nombre de nuits, type de forfait (ex: tout inclus,
repas inclus, etc.), type de chambre (ex: standard, suite, penthouse, etc.) ;
 Du client: groupe d'âge, sexe, adresse, type d'acheteur (ex: nouveau, récurrent, etc.)
;
 Du canal de vente: catégorie (ex: magasin, internet, etc.) ;
 De la promotion: catégorie (ex: 2 pour 1, rabais 10%, rabais 25%, etc.), début et fin
de validité ;
 Du mode de paiement: catégorie (ex: crédit, comptant, etc.) ;

a) Proposez un schéma en étoile permettant de faire ces analyses. Identifiez clairement les
clés primaires et étrangères des tables de faits et de dimension;

b) Identifiez, pour chaque table de dimension, une hiérarchie de niveaux de granularité


(e.g., attribut1 ← attribut2 ← …) ;

c) Proposez une stratégie d'agrégation ajoutant une nouvelle table de faits agrégés.
Donnez le code SQL permettant de créer cette nouvelle table.

Vous aimerez peut-être aussi