Vous êtes sur la page 1sur 2

ENSAM - Université Mohammed V de Rabat

Filière INDIA (Semestre 4) A.U. : 2023/2024 Pr. A. El Qadi


TD/TP n2 en Business Intelligence
Exercice 1 : Modélisation décisionnelle d’un Entrepôt de Données pour le suivi des cybernautes d’un
site marchand.
Un site marchant sur Internet souhaiterait mieux connaître sa clientèle afin de mieux cibler les offres
promotionnelles en fonction du profil du client (visiteur) qui apparaissent dans les bannières des pages
que consultent les clients. Un des buts ultimes de cette connaissance est le JIT (Just In Time) : c’est à
dire l’adaptation temps réel du contenu des pages retournées au visiteur pour maximiser la terminaison
d’une visite par un achat. Suivi de lien sur un site Web après un mailing personnalisé.
Pour cela, la société qui gère le site marchant souhaite mettre en place un entrepôt de données.
L’entrepôt est alimenté (en information) à partir des journaux du serveur Web et du système de prise de
commande.
Les journaux contiennent la liste des requêtes HTTP. Chaque entrée contient :
- La Date et heure de la requête ; L’Adresse IP du visiteur ; Le cookie ID identifiant une session d’un
visiteur ; La page, le document ou le script demandé ; Le type de la requête (GET ou POST) ; L’URL
de la page à partir de laquelle le visiteur est entré sur le site (par exemple depuis du page de résultat de
recherche d’un moteur de recherche comme Google, …); Le navigateur (agent) utilisé (usuellement
Netscape ou Internet Explorer).
Ces informations sont trop brutes pour être utilisé : elles sont complétées par les informations trouvées
dans le système de prise de commande.
Le schéma de l’entrepôt est constitué des bases suivantes :
- Session (SessionKey, TypeSession, ComportementVisiteur…)
 TypeSession peut être « SessionSansAchat », « SessionAvecPaiement »,…
- Date (DateKey, Année, Mois, JourDeMois, JourDeSemaine, TrancheHoraire, …)
- Visiteur (VisiteurKey, AdresseIP, Nom, Prenom, FuseauHoraire, …)
- Produit (ProduitKey, Designation, Couleur, TypeProduit, …)
- Page (PageKey, ProfondeurDepuisLaRacine, TypePage…)
 TypePage peut être « Information », « Formulaire »,…
 ProfondeurDepuisLaRacine représente le nombre minimum de pages à parcourir depuis la
racine du site (www.sitemarchand.com) pour arriver jusqu’à la page.
- Référent (ReferentKey, URL, TypeReferent, …)
 TypeReferent peut être « Moteur de recherche Public», « Magazine en ligne », « Bannière sur
un site sponsorisé », « URL Entrée Manuellement Ou Bookmark», « Interne », « Moteur De
Recherche Interne », « Newsletter »
- Promotion (PromotionKey, TypePromotion...)
- Requete (SessionKey, Date, VisiteurKey, ProduitKey, PageKey, ReferentKey, PromotionKey,
VisiteId,
NombrePagesTraverséesAvantLaPage, NombreSecondesPasséesDansLaPage,
MontantAchétéDansLaPage)
 NombrePagesTraverséesAvantLaPage est le nombre de pages du site marchant que le visiteur a
traversées avant cette page. NombrePagesTraverséesAvantLaPage=1 signifie que c’est la
première page par laquelle le visiteur est arrivé sur le site marchand (il arrive à partir d’un
référent qui peut être par exemple un moteur de recherche).
 MontantAchétéDansLaPage peut être positif, négatif (retrait d’un produit), zéro (pas d’achat).
Questions:
1) Quelle est la table de fait dans cet entrepôt
2) A partir des informations suivantes : Nombre de visiteurs par jour 200 000 ; Nombre de requêtes par
visite 10 ; Ration de visiteurs ayant déjà fréquenté le site 0,3 ; Ratio d’achats par visite 0,1; Nombre de
jours 1200 ; Nombre de tranches horaires 48; la taille des clés et des attributs (4 Octets).
a) Donnez le nombre d’enregistrements de la table de fait.
b) Donnez la taille d’un enregistrement de la table de fait ?
c) Donnez la taille (en Octets) de stockage de la table de fait ?
3) Donner la requête SQL qui donne moyenne des achats dans les sessions du type «SessionAvecAchat».
Exercice 2 : Le directeur d'une entreprise de la grande distribution souhaite analyser et suivre les ventes
de produits dans son réseau de magasins. Il souhaite obtenir une réponse aux questions suivantes :
- Quels produits dégagent la plus forte rentabilité dans le temps ?
- Existe-t-il des disparités régionales de consommation des produits ?
- Quel est la répartition des ventes entre les produits de marque des fabricants et ceux de la marque du
distributeur ?
- Quel est le chiffre d'affaire réalisé avec les plus gros fournisseurs ?
L'ensemble des informations seront issues des tickets de caisse.
Nous identifions un certain nombre d'axes d’analyse :
- l'axe produit, - l'axe magasin, - l'axe temps, - l'axe région, - l'axe fournisseur
Il faut ensuite décrire la hiérarchie de chacun de ces axes :
- pour l'axe produit : un produit appartient à une sous-famille de produits, laquelle appartient à une
famille de produits, laquelle appartient à une gamme de produit.
- Pour l'axe magasin : un magasin est rattaché à une enseigne.
- Pour l'axe fournisseur : un fournisseur appartient à un groupe de fournisseurs.
- Pour l'axe département : un département est rattaché à une région, laquelle est rattachée à un pays.
- Pour l'axe temps : un mois est rattaché à un trimestre qui est rattaché à un semestre qui est rattaché à
une année.
On cherche alors à décrire les indicateurs suivants : les ventes par produit, par magasin par fournisseur,
par région et dans le temps.
Questions :
1. Proposer un schéma en étoile et en flocon pour ce cas.
2. Cube de données : définir le cube de données, avec ses dimensions et indicateurs, correspondant
au schéma en étoile ci-dessus ; en proposer une ou plusieurs représentations graphiques.
Exercice 3 : Une école d'enseignement supérieur cherche à étudier les facteurs influant sur la réussite
de ses étudiants aux examens. Pour cela elle décide de construire un Data Warehouse.
Elle souhaite pouvoir répondre aux questions suivantes :
- Quel est le nombre de réussites aux examens pendant le semestre d'hiver 2016?
- Quel est le nombre de réussites aux examens par cours, pour l'année 2016 ?
- Quel est le nombre des étudiants ont validé les examens d'un cours obligatoire, pour l'année 2016 ?
- Combien d'étudiants ayant un âge de 22 ans ont réussi leurs examens de Système d’information ?
Pour cela elle dispose des données suivantes anonymes : Pour chaque examen passé, on connaît l'âge et
le code de l'étudiant, le nom du cours, la date de l'examen, la note obtenue et si l'examen est réussi ou
non.
Question : Proposer un modèle en étoile pour cette application. Rechercher tout d'abord les différentes
dimensions et proposer une hiérarchie pour ces dimensions.
Exercice 4 : Un centre médical souhaite faire une étude sur les activités de chaque service. Les
informations dont il dispose sont les suivantes :
Le centre est composé de plusieurs services
Le personnel médical (docteur, infirmiers, résidents, …) est rattaché à un service donne.
Lors de la prise en charge d’un patient au sein d’un service, les informations suivantes sont
enregistrées :
 Informations personnelles (nom, prénom, date de naissance, CIN,)
 La maladie pour laquelle il a été admis
 Date d’admission
 Traitements appliques
 Date de sortie
 Date du décès
1. Quelles sont les tables de dimensions et de fait ?
2. Proposer un modèle en étoile/flocon.

Vous aimerez peut-être aussi