Vous êtes sur la page 1sur 13

Questions/Réponses

« Modélisation »
1. Qu’est-ce qu’un système d’information (SI) ?
Le système d’information peut être défini comme l’ensemble des moyens humains, matériels
et immatériels mis en œuvre afin de gérer l’information au sein d’une unité ou d’une
entreprise.

2. Quelles sont ces fonctions essentielles ?


Le SI possède 4 fonctions essentielles que sont :

 La saisie ou la collecte de l’information


 La mémorisation de l’information à l’aide de fichier ou de base de données
 Le traitement de l’information afin de mieux l’exploiter (consultation, organisation,
mise à jour)
 La diffusion de l’information

3. Qu’est-ce que la modélisation ?


La modélisation est la représentation d’un phénomène (ou situation) réel sous forme de
modèle. Deux grands types de modèle d’analyse sont utilisés. UML et merise. En France on
utilise la méthode merise.

4. Qu’est-ce qu’un modèle ?

Un modèle est une représentation simplifiée d’une réalité sur laquelle on veut être renseigné

Un modèle s’exprime avec un ensemble de concepts, dotés de règles d’utilisation et de


représentations.

5. Pour quoi on modélise une base de données ?

- Pour éviter les redondances

- Assurer les références

- Normaliser : assure la cohérence

6. Quel est la démarche à suivre pour modéliser ?

- Etablir la liste des attributs

 Décomposer l’attribut si c’est possible (nom, prénom)

 Le disposer à un seul endroit (dans une seule classe ou classe-association)

 Trouver un identifiant (technique + métier) pour chaque

- Déterminer les associations

 Ne pas se tromper sur les cardinalités maximales


 Statuer sur les doublons pour chaque couple de classes

 Héritage

7. Quel sont Les étapes pour élaborer un Modèle Conceptuel de Données ?

 Analyser l'existant

 Epurer les données : synonymes, poly-sèmes

 Identifier les entités pertinentes

 Identifier les associations entre les entités

 Recenser les attributs des entités et des associations (constitution du dictionnaire de


données)

 Déterminer les cardinalités entre entités et associations

8. A quoi sert la méthode Merise ?


C’est une méthode d’analyse et de conception des SI basée sur le principe de la séparation des
données et des traitements.

9. Quels sont les différents modèles de la méthode Merise ?


Nous avons plusieurs modèles ou encore appelé schéma. Ils sont repartis à 3 niveaux qui
sont :

 Le niveau conceptuel
 Le niveau logique
 Le niveau physique

10. Définissez chaque model ?


Il existe trois types de modèles de données : conceptuel, logique et physique. Le
niveau de complexité et de détail augmente du modèle conceptuel au modèle logique
en passant par un modèle physique.
Le modèle conceptuel présente un niveau de conception très basique, tandis que le
modèle de données physique présente une vue très détaillée de la conception.
Le modèle conceptuel ne fera que décrire les noms des entités et leurs relations. La
figure 1 illustrée dans la dernière partie de cet article décrit un modèle conceptuel.
Le modèle logique affichera les noms des entités, les relations entre entités, les
attributs, les clés primaires et les clés étrangères de chaque entité. La figure 2
illustrée à l'intérieur de la question 4 dans cet article décrit un modèle logique.
Le modèle de données physique affichera les clés primaires, les clés étrangères, les
noms de table, les noms de colonne et les types de données de colonne. Cette vue
explique en fait comment le modèle sera effectivement implémenté dans la base de
données.

11. Qu’est-ce que le modèle conceptuel de données (MCD)


Le modèle conceptuel de données permet de représenter la structure d’information du point de
vu des données. Il définit également les dépendances ou les relations entre les différentes
données.

12. Qu’elle est la différence entre les systèmes OLTP et OLAP ?


OLTP signifie système de traitement des transactions en ligne et OLAP signifie système de
traitement en ligne. OLTP conserve les données transactionnelles de l'entreprise et est
généralement hautement normalisé. Au contraire, OLAP est utilisé à des fins d’analyse et de
rapport et il est sous une forme dé-normalisée.
Cette différence entre OLAP et OLTP vous permet également de choisir la conception du
schéma. Si votre système est OLTP, vous devez utiliser la conception de schéma en étoile et si votre
système est OLAP, vous devez utiliser le schéma en flocon de neige.

13. QUELQUES DÉFINITION


a. Qu’est-ce qu’une entité ?
C’est un ensemble d’attributs qui partagent des propriétés communes, ayant un identifiant
dont ils sont dépendants. (Chaque entité est unique)

b. Comment se définie l’association ?


C’est une liaison qui a une signification précise entre deux ou plusieurs entités.

c. Qu’est-ce qu’un attribut ?


Un attribut est une propriété d’une entité ou d’une association. C’est une information
élémentaire non déductible d’autres informations.

d. Qu’est-ce qu’un identifiant ?


C’est une propriété particulière telle qu’il n’existe pas deux occurrences pour les quelles cette
propriété pourrait prendre une même valeur.

e. Qu’est-ce qu’une cardinalité ?


Elle se définit comme le nombre d’occurrence d’une entité par rapport à une autre. Elle a une
borne minimale (0 ou 1) et une borne maximale (1 ou N)
14. Sur quoi est basé le MCD ?
Il est basé sur les entités et les associations. D’où sa seconde appellation entité-association

15. Qu’est-ce que le modèle logique de données ?


C’est une méthode d’analyse qui consiste à décrire la structure de données utilisées sans faire
référence à un langage de programmation. Il s’agit donc de préciser le type de données
utilisées lors des traitements.

16. Qu’est-ce qu’une relation ?


Une relation est une association qui représente les liens qui peuvent exister entre une ou
plusieurs entités.

17. Qu’est-ce qu’une clé primaire ?


C’est un ensemble minimum d’attributs (colonnes ou champs) qui détermine tous les autres.
Toute relation doit obligatoirement avoir au moins une clé et elle doit être soulignée.

18. Qu’est-ce qu’une clé étrangère ?


C’est un attribut d’une clé primaire.

19. Qu’est-ce qu’une base de données ?


C’est une collection d’informations stockées sur un support. Elle est structurée, cohérente et
persistante.

20. Qu'est-ce qu'une clé de substitution ?et en quoi est-ce différente d'une clé
primaire?

En pratique, un attribut numérique est imposé par une clé primaire appelée clé de
substitution. Cette clé remplace les clés naturelles. Au lieu d’avoir une clé primaire ou des clés
primaires composites, les modélisateurs de données créeront cette clé, ce qui est très utile pour
identifier un enregistrement, créer un logiciel de requête SQL et obtenir de bonnes performances.

La clé de substitution est un identifiant unique ou une clé numérotée générée par le systèmepouvant
servir de clé primaire. Ce peut être une colonne ou une combinaison de colonnes. Contrairement à
une clé primaire, elle n'est pas extraite des champs de données d'application existants.

21. C’est quoi la normalisation ?


Le but essentiel de la normalisation est d'éviter les anomalies transactionnelles pouvant découler
d'une mauvaise modélisation des données et ainsi éviter un certain nombre de problèmes potentiels
tels que les anomalies de lecture, les anomalies d'écriture, la redondance des données et la contre-
performance.
La normalisation s’applique à toutes les entités et aux relations porteuses de propriétés.
Les formes normales s'emboitent les unes dans les autres, tant et si bien que le respect d'une forme
normale de niveau supérieur implique le respect des formes normales des niveaux inférieurs. Dans
le modèle relationnel de type OLTP, il existe huit formes normales, les trois premières étant les plus
connues et utilisées :

1. La première forme normale notée 1FN ;


2. La deuxième forme normale notée 2FN ;
3. La troisième forme normale notée 3FN ;

22. Quels sont les 3 premières formes normales ?

Première forme normale (1FN) correspond à la règle d’énumération :


Tous les attributs contiennent une valeur atomique
Exemple : une table personne :
Personne

Id
Nom
Prenoms

Là on suppose qu’une personne, peut avoir 2 prénom, donc l’attribut prénom n’est pas atomique.
La solution c’est de mettre au lieu de l’attribut prénoms, 2 attributs dans la table personne : prénom1
et prénom2
Personne

Id
Nom
Prenom1
Prenom2

- Deuxième forme normale (2FN) correspond à la règle de pleine dépendance :


Tout attribut n’appartenant pas à la clé ne dépend pas (fonctionnellement) d’une partie de la
clé
Exemple : on a une table acheter qui contient comme attribut :
Acheter

NumClient
NumProduit
Quantite acheté
Description_produit

Dans cette table la clé primaire c’est NumClient et NumProduit


La Deuxième forme normale veut dire que tous les attributs de cette table (acheter) doivent
dépondre de cette clé (NumClient et NumProduit) et non pas que de NumClient ou que NumProduit
Pour cet exemple : l’attribut quantité acheté dépond de numproduit (quantité achetée du produit), et
de numClient(quantité achetée par le client)
Par contre l’attribut Description_produit dépond de numProduitseulement, la description du produit
je peux l’obtenir à partir de numProduit seulement, ce qui ne respecte pas la 2eme forme normale.
Solution : enlever description_produit de cette table et mettre dans la table produit comme attribut.
- Troisième forme normale (3FN) correspond à la règle de dépendance directe :
Tout attribut n’appartenant pas à la clé ne dépend pas d’un attribut non-clé

Exemple :
Personne

Id
Nom
Prenom
Rue
Ville

Dans cet exemple : on a une dépendance entre rue et ville(de la rue, je peux déduire c’est quelle
ville)
La solution :
1. C’est de laisser que la rue dans cette table
2. Créer une nouvelle table qui va contenir : la dépendance entre la rue et la ville (une table qui
va avoir la rue comme clé primaire et la ville comme attribut).

23. C’est quoi la dénormalisation ? et pourquoi dénormaliser ?


On ne dénormalise que dans le cas des infocentres qui sont des entrepôts de données de plusieurs
applications et qui servent à faire des statistiques.
La dénormalisation sert essentiellement a la consultation de données volumineuses pour accélérer le
temps de réponse des requêtes.
Elle n’est pas adapté à un traitement transactionnel ( insert, delete, update) car elle dégrade la
concurrence et le temps d’accès et de mise à jour

24. Est-ce vrai que toutes les bases de données devraient être en 3NF?
Il n'est pas obligatoire qu'une base de données soit en 3NF. Cependant, si votre objectif est une
maintenance facile des données, une redondance réduite et un accès efficace, vous devriez opter
pour une base de données dé-normalisée.

25. Qu’elles sont les règles de passage du model Conceptuel au modèle physique de
données (MPD)

A partir d’un projet, nous devons constituer un système d’information de façon à obtenir un
résultat.
Ce système d’information, en étroite collaboration avec le projet, doit nous donner en premier
temps un « Modèle Conceptuel de traitement MCT », et un « Modèle Organisationnel de
Traitement MOT » avec les règles de gestion et les différentes tâches à effectuer, puis il vient
le « Modèle conceptuel de Données MCD » (à citer les entités, les relations, et les
cardinalités).
A partir d’un MCD va découler le modèle logique de données MLD, c’est à partir de ce
modèle que la base de donnée va être constitué.
A partir d’un MCD, on va découler le modèle logique de données MLD. Pour passer du MCD
au MLD, nous avons 3 règles, appelées « règles de dérivation » que nous devons réaliser
chronologiquement.
Règle 1

Toute Entité devient une table. Les propriétés de l’Entité sont les propriétés de la Table,
l’identificateur de l’Entité est l’identificateur de la Table (clé).
Règle 2
Dans le cas d’une association de cardinalités maximales d’un côté égale à 1(-, 1) et de l’autre
côté égale à n (-, n) on ajoute dans la table de cardinalité du côté 1, une propriété de même
type que l’identificateur de la table de cardinalité maximale côté n.
Règle 3

Dans le cas d’une cardinalité maximale n de chaque côté (-, n), on crée une table dans laquelle
on ajoute autant de propriété de même type que l’identificateur de chaque table associé et les
propriétés de l’association si nécessaire.

26. Quels sont les types de relations importants dans un modèle de données et les
expliquer ?
Il existe trois types de relations dans un modèle de données. Ils sont
généralement, dans un modèle de données, nous avons des tables parent et des tables
enfants. Et ils sont tous deux connectés par une ligne de relation.
Si la présence d'une entité ou d'une ligne dans une table enfant dépend d'une ligne ou
d'une entité dans une table parent, la relation est alors représentée par une ligne épaisse
en reliant ces deux tables. Ceci s'appelle Identifier la relation.
Si les attributs de clé primaire du parent ne doivent pas devenir des attributs de clé
primaire de l'enfant, la relation est alors représentée par des lignes en pointillé en reliant
ces deux tables. Ceci est appelé Relation non identifiante.
La clé primaire de la table est connectée à la colonne autonome de la même table,
appelée relation récursive.

27. Qu’est-ce qu’une mesure ?


La base de la BI, une mesure est un indicateur numérique représentant une grandeur (comme par
exemple le chiffre d’affaire ou le prix d’un produit). Le moyen mnémotechnique pour s’en souvenir
est de penser qu’une mesure peut se mesurer (tout simplement).

28. Qu’est-ce qu’une dimension ?


Une dimension est un ensemble de membres (modalités) pouvant être organisés ou non selon une ou
plusieurs hiérarchies. Une dimension peut être discrète, ce qui implique que ses membres n’ont pas
d’ordre particulier (par exemple les départements de France). Elle peut également être continue,
dans ce cas l’ordre des membres a une importance : la dimension temps.

29. Qu’est-ce qu’un Data Mart et un Data Warehouse ?


Un data mart, également appelé magasin de données est un entrepôt de données organisées,
permettant de répondre aux problématiques d’une branche métier de l’entreprise. Un data
warehouse quant à lui est constitué d’un ensemble de datamart. Par exemple, si une entreprise
possède divers départements (marketing, finance, RH), alors nous aurons trois data mart associés à
ces départements. Le regroupement de ces data mart est appelé Data Warehouse.

30. Qu’est-ce que les métadonnées ?


- Les métadonnées sont des données sur les données. Il vous indique quel type de données
est réellement stocké dans le système, à quoi sert-il et à qui il est destiné.

31. Quels sont les différents schémas de conception dans la modélisation de


données?Expliquez avec l' exemple ?
Il existe deux types de schémas différents dans la modélisation de données
 Schéma en étoile
 Schéma de flocon de neige
 Shémaen constellation

Le plus simple des schémas est le schéma en étoile où nous avons une table de faits au centre qui
fait référence à plusieurs tables de dimensions autour de lui.
Toutes les tables de dimension sont connectées à la table de faits. La clé primaire dans toutes les
tables de dimension fait office de clé étrangère dans la table de faits.
Le diagramme ER de ce schéma ressemble à la forme d’une étoile. C’est pourquoi ce schéma est
appelé schéma en étoile.

32. Quel est le meilleur schéma - étoile ou flocon de neige ?


Le choix d'un schéma dépend toujours des exigences et des scénarios du projet.
Etant donné que le schéma en étoile est sous une forme dé-normalisée, vous avez besoin de moins
de jointures pour une requête. La requête est simple et s'exécute plus rapidement dans un schéma en
étoile. En ce qui concerne le schéma flocon de neige, étant donné qu’il se présente sous une forme
normalisée, il faudra un certain nombre de jointures par rapport à un schéma en étoile, la requête
sera complexe et l’exécution sera plus lente que le schéma en étoile.
Une autre différence significative entre ces deux schémas est que le schéma en flocon de neige ne
contient pas de données redondantes et qu'il est donc facile à gérer. Au contraire, le schéma en
étoile a un haut niveau de redondance et est donc difficile à maintenir.
Maintenant, lequel choisir pour votre projet? Si le but de votre projet est de faire plus d’analyse de
dimension, vous devriez opter pour un schéma en flocon de neige. Par exemple, si vous devez
savoir que « combien d'abonnés liés à un plan particulier sont actuellement actifs ?», Optez pour
le modèle flocon de neige.
Si le but de votre projet est de faire plus d’analyses de métriques, vous devriez utiliser un schéma
en étoile. Par exemple, si vous devez savoir que « quel est le montant de la réclamation versée à
un abonné particulier ?», Utilisez un schéma en étoile.
Une autre raison de l’utilisation du schéma flocon de neige est qu’il consomme moins de mémoire.
33. Qu’est-ce qu’une table de fait sans fait ? Et pourquoi l'utilisons-nous ?
La table de faits sans faits est une table de faits qui ne contient aucune mesure factuelle. Il ne
contient que les clés de dimension.
Parfois, certaines situations dans l’entreprise peuvent nécessiter une table d’information
factuelle. Par exemple, supposons que vous mainteniez un système d’enregistrement de présence
des employés, vous pouvez avoir une table de faits non factuelle comportant trois clés.
Employee_ID

Department_ID

Time_ID
Vous pouvez voir que le tableau ci-dessus ne contient aucune mesure. Maintenant, si vous voulez
répondre à la question ci-dessous, vous pouvez facilement utiliser la table de faits unique ci-dessus
sans fait, plutôt que de disposer de deux tables de faits distinctes:
"Combien d'employés d'un département particulier étaient présents un jour donné?"
Ainsi, la table de faits sans fait offre une flexibilité à la conception.

34. C’est quoi un data Mart ?


Les magasins de données sont pour la plupart destinés à une branche d’activité isolée. Ils sont
conçus pour les différents départements. Par exemple, j’ai travaillé pour une société d’assurance
maladie dans laquelle se trouvaient différents départements tels que Finance, Reporting, Vente, etc.
Nous avions un entrepôt de données qui contenait les informations relatives à tous ces départements,
puis nous avons peu de magasins de données construits au-dessus de cet entrepôt de données. Ces
DataMart étaient spécifiques à chaque département. En termes simples, vous pouvez dire qu'un
DataMart est un sous-ensemble d'un entrepôt de données.
35. Qu’est-ce qu’une hiérarchie ?
Après avoir parlé de dimension, quoi de plus normal que de parler de hiérarchie ? Une hiérarchie est
une organisation logique des membres d’une dimension de manière hiérarchique. Par exemple, une
hiérarchie géographique dont le plus haut niveau serait le continent, contiendrait le niveau pays,
puis le niveau région et ainsi de suite...

36. Qu’est-ce qu’une agrégation ?


Une agrégation est la valeur résultante de l’application d’une règle de calcul (somme, moyenne,
min, etc.) à une mesure explorée selon une ou plusieurs dimensions. Par exemple le calcul de la
somme du CA d’un magasin pendant un trimestre est le résultat (donc l'agrégation) de la somme de
l’ensemble des données de CA journalière pendant ce trimestre.

37. Qu’est-ce qu’un cube de données ?


Un cube de données est une méthode de stockage des données qui contient aussi la définition
des mesures, des dimensions, des hiérarchies. Cette structure est utilisée dans les logiciels de BI et
permet d’obtenir rapidement et simplement des données agrégées.

38. Qu’est-ce qu’une relation récursive? donnez un exemple ?


Une relation récursive se produit dans le cas où une entité est liée à elle-même. Oui, j'ai rencontré
un tel scénario.
Exemple :
Prenant par exemple ledomaine de la santé, il est possible qu'un prestataire de soins de santé
(disons un médecin) soit un patient pour tout autre prestataire de soins de santé. Parce que, si le
médecin lui-même tombe malade et nécessite une intervention chirurgicale, il devra consulter un
autre médecin pour obtenir le traitement chirurgical. Donc, dans ce cas, l’entité - fournisseur de
soins de santé est liée à elle-même. Une clé étrangère du numéro du fournisseur d'assurance
maladie devra figurer dans le dossier de chaque membre (patient).

39. Citez quelques erreurs courantes rencontrées lors de la modélisation des données?
Vous trouverez ci-dessous les quelques erreurs courantes rencontrées lors de la modélisation de
données.
 Construction de modèles de données volumineux : les modèles de données volumineux
ont plus de défauts de conception. Essayez de limiter votre modèle de données à 200 tables
maximum.
 Manque de but : Si vous ne savez pas quelle est la solution à laquelle votre entreprise est
destinée, vous pouvez créer un modèle de données incorrect. Il est donc très important de
clarifier l'objectif de l'entreprise afin de proposer un modèle de données approprié.
 Utilisation inappropriée de clés de substitution : La clé de substitution ne doit pas être
utilisée inutilement. Utilisez la clé de substitution uniquement lorsque la clé naturelle ne
peut pas servir l'objectif d'une clé primaire.
 Dénormalisation inutile : ne dénormalisez pas avant et sauf si vous avez une raison solide
et claire de le faire, car la dénormalisation crée des données redondantes difficiles à gérer.

Vous aimerez peut-être aussi