Académique Documents
Professionnel Documents
Culture Documents
Exemple 1:: Une Relation Est en 2FN Si
Exemple 1:: Une Relation Est en 2FN Si
• Type de relation particulier entre les entités contient une valeur atomique (non multiple, non composée) constante
dans le temps.
• Permet d’éviter les anomalies transactionnelles dues à une
mauvaise modélisation des données Contiennent une valeur atomique non décomposable
Ex : Attribut Adresse « N° Nom rue CP Ville » => 5 attributs différents
• Permet de vérifier la robustesse de la conception des modèles de
données pour éviter les problèmes de redondance et de mise à Contiennent des valeurs non répétitives. Sinon : choisir le domaine
jour du contexte de valeur liste.
• Détecter et étudier les dépendances fonctionnelles à l’intérieur des Sont constants dans le temps (utiliser par exemple la date de
tables pour éliminer les informations redondantes et les anomalies naissance plutôt que l'âge).
qui en résultent. Problème Solution
Dans le modèle OLTP, il existe 8 formes normales (on s’intéresse à 3) Produit Fournisseur Produit Fournisseur
• Elles s’emboitent les unes dans les autres Téléviseur Vidéo SA, Hitek LTD Téléviseur Vidéo SA
• Le respect d’une FN de niveau supérieur implique le respect des Téléviseur Hitek LTD
FN des niveaux inférieurs
Modélisation multidimensionnelle 2021-2022 5 Modélisation multidimensionnelle 2021-2022 6
Mesure :
Elément de donnée sur lequel vont porter les analyses, en
23 fonction des différentes dimensions/axes
Ex : coût des travaux, nombre d’accidents, ventes
Valeurs numériques que l’on compare (ex : montant_ventes,
qte_vendue)
Résultat d’une opération d’agrégation des données :
⇒stockées dans les tables de fait
Année Pays
Semaine
Client
Jour
Temps Temps
déterminent des valeurs de faits, comme une combinaison de valeurs • Par Véhicule Puissance
Vue 3
Trimestre
Région Quantité
Modélisation multidimensionnelle 2021-2022 45 Modélisation multidimensionnelle 2021-2022 46
Année
L’intégration de chaque nouvelle vue est donc susceptible de
modifier le grain sur une ou plusieurs dimensions
Trimestre
Le grain d’un contexte découle de la combinaison des grains
Mois Client de toutes les dimensions. Il définit le niveau de détail pouvant
Fait de vente être obtenu par la requête la plus sélective et la plus fine
Marge possible mettant en jeu toutes les dimensions.
Revenu
Produit
Quantité
Région
Après intégration :
Le grain de la dimension Temps est Mois
Gamme Pays Le grain de la dimension Territoire est Région
Marque
Inconvénients
Toutes les dimensions ne concernent pas les mesures (expl :
créateur dans la dimension produit)
Redondances dans les dimensions.
Alimentation complexe..
Modélisation multidimensionnelle 2021-2022 55 Modélisation multidimensionnelle 2021-2022 56
Modélisation multidimensionnelle 2021-2022 61 Modélisation multidimensionnelle 2021-2022 62
Modèle en étoile 1. Choisir le processus d'affaires : Doit impliquer les cadres supérieurs
Taille de dimension plus grosse (dénormalisée) Isoler les faits à étudier ⇒ Schéma des tables de faits
Modèle en flocon de neige 2. Définir le grain: "à quoi correspond une ligne de la table de faits ?"
Jointures pour reconstruire (normalisation des dimensions)
3. Identifier les dimensions : Découle directement de la définition du
Modèle en constellation >> Modèle en étoile grain
plusieurs tables de faits Définir les dimensions ⇒ Axes d'analyse
4. Identifier les faits ⇒ Dictionnaire des mesures
5. Normaliser les dimensions : Éclater en plusieurs tables liés par
contraintes référentielles (si schéma en flocon)
6. Intégrer l'ensemble : Plusieurs tables de faits partagent quelques
tables de dimension (constellation d’étoiles)
Multidimensional OLAP:
Utiliser un système multidimensionnel « pur » qui gère les structures multidimensionnelles
natives (les cubes) Hybride OLAP:
Les données sont stockées comme des matrices à plusieurs dimensions : Cube[1:m,1:n,1:p] tables de faits et tables de dimensions stockées dans SGBD
(mesure) relationnel (données de base)
Accès direct aux données dans le cube données agrégées stockées dans des cubes
Indexation rapide des données calculées
Solution hybride MOLAP et ROLAP : Concept de Drill-Through
Plus difficile à mettre en place
Accès aux données agrégées avec MOLAP (Cube)
Formats souvent propriétaires Accès aux détails avec le ROLAP (tables relationnelles)
Conçu exclusivement pour l’analyse multidimensionnelle
Bon compromis au niveau coût et performance
Capacité de stockage limitée
0:n