Académique Documents
Professionnel Documents
Culture Documents
(M.E.S.R.I)
------------------
Secrétariat Général
------------------
Université Pr Joseph KI-ZERBO (U.J.K.Z)
PROJET :
CREATION D’UN ENTREPOT DE
DONNEES
Etudiant : Mamadou ZO
Pour répondre à ces questions, nous avons divisé ce projet en trois parties. La première partie qui est
une étude préalable consiste à déterminer les informations qui nous aidera pour la modélisation. La
seconde partie qui est la modélisation consiste à déterminer le schéma de notre entrepôt de données.
La troisième partie consiste à implémenter l’entrepôt de données et à l’alimenter.
I. Etude préalable
1. Objectifs
A partir des bases de données FRINGUES_CLIENTS et BASE_GEO, nous devons créer l’entrepôt de
données permettant d’effectuer l’analyse des ventes réalisées auprès des clients. Plus précisément,
pour chaque vente de produit à un client, nous souhaitons disposer des deux critères d’analyse
suivants :
2. Démarche
3. Sources de données
D’après les objectifs, nous allons utiliser les données provenant des BD FRINGUES_CLIENTS et
BASE_GEO qui sont accessibles à l’adresse suivante : http://www.irit.fr/~Gilles.Hubert/supports.
Comme l’illustre le figure ci-dessus, ce sont des BD Access dont les schémas sont montrés par les
figures suivantes.
Figure 2: Schéma de la BD FRINGUES_CLIENTS
Dans la pratique nous avons utilisé MySQL au lieu d’Access à cause des problèmes techniques. Nous
avons donc transféré ces BD Access vers MySQL et nous avons travaillé avec les BD sous MySQL.
4. Dimensions
Lorsqu'on fait un schéma de BD pour un système d'information classique, on parle en termes de tables
et de relations, une table étant une représentation d'une entité et une relation une technique pour
lier ces entités. Et bien en entrepôt de données, on parle en termes de Dimension et de Faits. C'est
une autre approche des données, on entend par dimensions les axes avec lesquels on veut faire
l'analyse. Dans notre cas, les dimensions utilisées pour faire l’analyse des ventes sont :
La dimension client ;
La dimension produit ;
La dimension temps
5. Les faits
Les faits, en complément aux dimensions, sont ce sur quoi va porter l'analyse. Ce sont des tables qui
contiennent des informations opérationnelles et qui relatent la vie de l'entreprise. Un fait est tout ce
qu'on voudra analyser. Dans notre projet, ce sont les ventes que vous voudrons analyser. Nous avons
donc un seul fait qui est vente.
II. Modélisation
Dans la partie précédente, nous avons déterminer les objectifs de notre entrepôt, les sources de
données, les dimensions et le fait. Dans cette partie, nous allons déterminer les différentes
informations que va contenir les dimensions ainsi que celles des faits puis nous déterminerons les
relations entre les dimensions et les faits.
1. Niveau logique
La dimension produit
o Id_produit : c’est l’identifiant du produit ;
o Designation : le nom du produit ;
o Marque : la marque du produit ;
o prixUnit : le prix unitaire du produit ;
o tauxTVA : le taux TVA ;
o categorie : la classe du produit ;
o Secteur : le secteur du produit.
La dimension client
o Id_client : l’identifiant du client ;
o Nom : le nom du client ;
o Prenom : le prénom du client ;
o Id_ville : l’identifiant de la ville du client ;
o Code_dept : le code du département du client ;
o Region : la région ou est situé le client.
La dimension temps
o Date : la date d’achat du produit par le client ;
o id_mois : contient seulement le mois et l’année de la date d’achat du produit ;
o Annee : contient seulement l’année de la date d’achat du produit.
Le fait vente
o Id_produit de la dimension produit ;
o Id_client : de la dimension client ;
o Id_temps : de la dimension temps ;
o montantTTC : le montant total TTC de l’achat ;
o quantite : la quantite de produits vendue.
2. Niveau conceptuel
Le type de schéma que nous avons opté pour notre entrepôt de données est le schéma en étoile car
nous ne disposons que d’une seule table de fait et toutes les dimensions sont reliées directement à
cette table de fait. La figure suivante illustre le schéma en Etoile de notre entrepôt de données.
III. Alimentation
Dans cette partie nous allons implémenter l’entrepôt de données suivant le schéma défini dans la
section précédente et alimenter l’entrepôt en utilisant l’outil Talend.
Pour notre projet, nous avons utilisé la version 7.3.1 de TOS. Nous avons conçu un job qui contient des
sous-job.
Après exécution du job, la table dim_client est créée puis des enregistrements y sont insérés. La
figure ci-dessus nous montre que 30 lignes ont été insérées.
SELECT
`vente`.`id_produit`,
`vente`.`id_client`,
`vente`.`date_facture` AS id_temps,
sum(`vente`.`quantite`) AS quantite,
sum(((quantite*prixUnitHT)-remise/100)*(1+tauxTVA)) AS montantTTC
FROM `vente`
GROUP BY date_facture, id_produit, id_client
Puis nous avons placé les données extraites dans une table vente (figure 9).