Vous êtes sur la page 1sur 28

Introduction aux

bases de données
Table des
matières

Objectifs

Introduction

I - Présentation des Systèmes de Gestion de Base de Données (SGBD)

1. Un système d'information

2. Notion de Base de données

3. Notion de système de gestion de Base de données (SGBD)

4. Les objectifs d'un SGBD

5. Les architectures de SGBD Clients-serveur

6. Quelques SGBD sur le marché

II - Exercice : Activité d'Auto-évaluation No 1

III - Les modèles de SGBD

1. Modèle hiérarchique

2. Modèle réseau

3. Modèle de base de données orientée objet

4. Modèle déductif

5. Modèles de bases de données NoSQL

6. Modèle relationnel

IV - Exercice : Activité d'Auto-évaluation No 2

V - Méthodologie générale de conception d'une base de données

1. L'analyse

2. Le modèle conceptuel de données

VI - Exercice : Activité d'Auto-évaluation No 1

VII - Les approches de modélisation d'une base de données


1. La méthode Merise

2. La méthode UML

VIII - Exercice : Activité d'Auto-évaluation No 2

Conclusion
Objectifs

À la fin de cette leçon, l'apprenant sera capable de :


Présenter correctement une base de données et un système de gestion de base de
données (sgbd)
Décrire les différents modèles de SGBD
Décrire la méthodologie générale de conception d'une Base de Données;
Décrire les grandes méthodes de conception d'une Base de Données ;
Introduction

L'informatique évolue vers le traitement de masses d'informations de plus en plus grandes dans des environnements
répartis géographiquement où doivent cohabiter des matériels hétérogènes. Dans ce contexte, les bases de données sont
utilisées de façon intensive pour de nombreux domaines d'application tels que le domaine médical, les administrations
ou les associations.
Avant, Le traitement des données se faisaient par des méthodes classiques :
- Enregistrement sur des papiers et rangement dans des dossiers physiques
- Enregistrement et rangement dans des fichiers et dossiers numériques
De ces méthodes classiques l'on a pu dégager ces défauts suivants:
- La redondance de données ;
- La dépendance pleine entre données et traitement ;
- Le manque de normalisation au niveau de stockage de données.
Pour remédier à cette situation, il a été mis au point la notion de base de données répondant aux questions suivantes:
- L'accès aux données selon les multiples critères ;
- L'intégration des données ;
- La relation entre les données.
Cette dernière remplace avantageusement celle de fichiers.
- L'ordre dans le stockage de données ;
- L'utilisation simultanée des données par différents utilisateurs.
Aujourd'hui, la disponibilité de systèmes de gestion de base de données fiables permet aux organisations de toutes
tailles de gérer des données efficacement, de déployer des applications utilisant ces données et de les stocker. Les bases
de données sont actuellement au cœur du système d'information des entreprises.
Présentation des Systèmes de Gestion de Base de Données (SGBD)
Présentation des Systèmes de Gestion de Base de Données (SGBD)

Présentation des Systèmes


de Gestion de Base de I
Données (SGBD)
Un système d'information
Un système d'information

1. Un système d'information
Définition

Le système d'information ou SI, peut être défini comme étant l'ensemble des moyens humains, matériels et
immatériels mis en œuvre afin de gérer l'information au sein d'une unité, une entreprise par exemple.

Les fonctions d'un système d'information

Le SI possède 4 fonctions essentielles :


- La saisie ou collecte de l'information
- La mémorisation de l'information à l'aide de fichier ou de base de données
- Le traitement de l'information afin de mieux l'exploiter (consultation, organisation, mise à jour, calculs
pour obtenir de nouvelles données, ...)
- La diffusion de l'information
Autrefois, l'information était stockée sur papier à l'aide de formulaires, de dossiers, ... et il existait des procédures
manuelles pour la traiter. Aujourd'hui, les systèmes informatisés, comme les systèmes de gestion de bases de
données relationnelles (SGBDR), sont mis au service du système d'information.
Notion de Base de données
Notion de Base de données

2. Notion de Base de données


Définition

Le concept de Base de Données (BDD ou BD) est apparu vers 1960, face au nombre croissant d'informations que
les entreprises devaient gérer et partager. Celles-ci devrait permettre de structurer, organiser et stocker de grandes
quantités d'informations afin d'en faciliter l'exploitation (ajout, mise à jour, recherche et consultions de données).
- Approche définitionnelle 1 :
Une base de données est un ensemble de données bien structurées, apparentées, enregistrées sur un
support de stockage représentant un univers du monde réel et accessibles via un système de gestion de base
de données (SGBD).
- Approche définitionnelle 2 :
Une base de données (informatisée) est un ensemble structuré de données enregistrées sur des supports
accessibles par l'ordinateur, représentant des informations du monde réel et pouvant être interrogées et
mises à jour par une communauté d'utilisateurs.

Critères d'une base de données

Une base de données doit répondre aux trois critères suivants :


- L'exhaustivité : C'est la présence dans cette base de tous les enseignements qui ont trait aux applications
en question.
- La non redondance des données : Non répétition d'une donnée plusieurs fois.
- La structure : C'est l'adaptation du mode de stockage de données au traitement ; structuration que la base
doit avoir est liée à l'évolution de la technologie.
Notion de système de gestion de Base de données (SGBD)
Notion de système de gestion de Base de données (SGBD)

3. Notion de système de gestion de Base de données (SGBD)


Définition

Un SGBD est un logiciel ou application permettant d'interagir avec une base de données. Elle permet la création
de la base de données, l'enregistrement, la modification, la récupération et la suppression des informations au sein
de celle-ci. Pour interagir avec un SGBD, on utilise un langage appelé le SQL (Structured Query Language).

Illustration

Le SGBD reçoit des commandes aussi bien des programmes d'application que des utilisateurs : il commande les
manipulations de données, généralement par l'intermédiaire d'un SGF (Système de Gestion de Fichiers).

Les fonctions que doit remplir un SGBD

- L'intégration des données afin d'éviter l'incohérence d'éventuelles données dupliquées (tout est intégré
dans un seul ensemble cohérent).
- La séparation entre les moyens de stockage physique des données et la logique des applications.
- Un contrôle unique de toutes les données afin de permettre l'utilisation simultanée par plusieurs
utilisateurs.
- La possibilité d'utiliser des structures de fichiers et des méthodes d'accès complexes, de façon à ce que les
relations correctes entre les données puissent être exprimées et les données utilisées le plus efficacement
dans un grand nombre d'applications.
- Des facilités pour le stockage, la modification, la réorganisation, l'analyse et la consultation des données,
sans que le système impose des
restrictions à l'utilisateur.
- Des contrôles de sécurité afin d'empêcher l'accès illégal à certaines données.
- Des contrôles d'intégrité pour prévenir une modification indue des
données (exemple: contrôle d'exactitude, de validité).
- La compatibilité avec les principaux langages de programmation, les programmes-sources existants, et les
données extérieures à la base.
- Posséder une capacité de stockage élevée.
- Pouvoir répondre à des requêtes avec un niveau de performances adapté.
- Fournir des facilités pour la gestion des méta-données.
Les objectifs d'un SGBD Les objectifs d'un SGBD

4. Les objectifs d'un SGBD


Pour pallier aux inconvénients des méthodes classiques de gestion de fichiers, les SGBD visent quatre objectifs :
- intégration et corrélation,
- flexibilité (indépendance),
- disponibilité,
- sécurité.
Ces objectifs exigent une distinction nette entre les données et les procédures de manipulation de ces données :
aux données, on associera une fonction d'administration des données, aux procédures de manipulation une
fonction de programmation.

Intégration et corrélation

Dans les systèmes classiques :


- chaque application gère ses données dans ses propres "fichiers”, d'où : Un risque de redondance, et un
danger d'incohérence des données.
- La même donnée peut appartenir à plusieurs applications, induisant une déperdition de stockage
- Toute modification de cette donnée est à enregistrer plusieurs fois : si cette mise à jour multiple n'est pas
effectuée correctement, les données deviennent incohérentes.
- Le coût de la mise à jour augmente du fait de la multiplication des entrées sorties physiques, une
difficulté pour créer de nouveaux traitements
- Les nouvelles applications entraînent des duplications supplémentaires de données.
- Leur intégration avec les applicatifs en exploitation entraîne des modifications importantes
Dans l'approche SGBD :
Un "réservoir" commun (intégration) est constitué, représentant une modélisation (corrélation) aussi fidèle que
possible de l'organisation réelle de l'entreprise, toutes les applications puisent dans ce réservoir les données qui les
concernent, évitant ainsi les duplicationset facilitant l’accès aux données.
- Administration centralisée des données (intégration) : toutes les données doivent être centralisées dans
un réservoir unique commun à toutes les applications. En effet, des visions différentes des données (entre
autres) se résolvent plus facilement si les données sont administrées de façon centralisée.
- Non-redondance des données : afin d'éviter les problèmes lors des mises à jour, chaque donnée ne doit
être présente qu'une seule fois dans la base.
- Cohérence des données : Les données sont soumises à un certain nombre de contraintes d'intégrité qui
définissent un état cohérent de la base. Elles doivent pouvoir être exprimées simplement et vérifiées
automatiquement à chaque insertion, modification ou suppression des données. Les contraintes d'intégrité
sont décrites dans le Langage de Description de Données (LDD).
- Accès aux données : L'accès aux données se fait par l'intermédiaire d'un Langage de Manipulation de
Données (LMD). Il est crucial que ce langage permette d'obtenir des réponses aux requêtes en un temps «
raisonnable ». Le LMD doit donc être optimisé, minimiser le nombre d'accès disques, et tout cela de façon
totalement transparente pour l'utilisateur.
- Partage des données  : il s'agit de permettre à plusieurs utilisateurs d'accéder aux mêmes données au
même moment de manière transparente. Si ce problème est simple à résoudre quand il s'agit uniquement
d'interrogations, cela ne l'est plus quand il s'agit de modifications dans un contexte multiutilisateur, car il
faut : permettre à deux (ou plus) utilisateurs de modifier la même donnée « en même temps » et assurer un
résultat d'interrogation cohérent pour un utilisateur consultant une table pendant qu'un autre la modifie.

Flexibilité ou indépendance

Dans les systèmes classiques, tout changement intervenant dans le stockage des données (support, méthode
d'accès physique) entraîne des modifications lourdes des applications correspondantes.
L'approche SGBD poursuit trois objectifs, pour assurer l'indépendance des données par rapport aux traitements :
- Indépendance physique: tout changement de support, de méthode d'accès reste transparent au niveau de
l'utilisateur.
Indépendance logique : les programmes d'application sont rendus transparents à une modification dans
- l'organisation logique globale, par la définition de sous-schémas couvrant les besoins spécifiques en
données.
- Indépendance vis-à-vis des stratégies d'accès : l'utilisateur n'a plus à prendre en charge l'écriture des
procédures d'accès aux données. Il n'a donc pas à intégrer les modifications tendant à optimiser les
chemins d'accès (ex: création d'index).

Disponibilité

- Le choix d'une approche SGBD ne doit pas se traduire par des temps de traitement plus longs que ceux
des systèmes antérieurs. L'aspect "performance" est donc crucial dans la mise en œuvre d'une base de
données. Un tel objectif ne peut être atteint que si la conception d'une base de données est menée de façon
rigoureuse avec un découpage fonctionnel adéquat
- L'utilisateur doit ignorer l'existence d'utilisateurs concurrents.
- Résistance aux pannes : que se passe-t-il si une panne survient au milieu d'une modification, si certains
fichiers contenant les données deviennent illisibles ? Il faut pouvoir récupérer une base dans un état « sain
».

Sécurité

La sécurité des données recouvre deux aspects :


- L'intégrité, ou protection contre l'accès invalide (erreurs ou pannes), et contre l'incohérence des données
vis-à-vis des contraintes de l'entreprise.
- La confidentialité, ou protection contre l'accès non autorisé ou la modification illégale des données. Pour
cela, on associee à chaque utilisateur des droits d'accès aux données.
Les architectures de SGBD Clients-serveur
Les architectures de SGBD Clients-serveur

5. Les architectures de SGBD Clients-serveur


Architecture Client-Serveur

Depuis les années 80, les SGBD sont basés sur une architecture clients-serveur.
- Serveur : On appelle logiciel serveur un programme qui offre un service sur le réseau. Le serveur accepte
des requêtes, les traite et renvoie le résultat au demandeur. Le terme serveur s'applique à la machine sur
lequel s'exécute le logiciel serveur. (Gère les données partagées et exécute le code du SGBD).
- Clients : On appelle logiciel client un programme qui utilise le service offert par un serveur. Le client
Communiquent avec le serveur envoie une requête et reçoit la réponse. Le client peut-être raccordé par
une liaison temporaire.
Qu'appelle-t-on architecture client/serveur ?
- C'est la description du fonctionnement coopératif entre le serveur et le client.
- Les services internet sont conçus selon cette architecture. Ainsi, chaque application est composée de
logiciel serveur et logiciel client. A un logiciel serveur, peut correspondre plusieurs logiciels clients
développés dans différents environnements: Unix, Mac, PC...; la seule obligation est le respect du
protocole entre les deux processus communicants.
Illustration

Quelques SGBD sur le marché


Quelques SGBD sur le marché
6. Quelques SGBD sur le marché
Les SGBD payants :

- Oracle Database
- Microsoft SQL Server
- DB2
- Microsoft Access
- Sybase

Les SGBD gratuits :

- MySQL
- PostgreSQL
- MariaDB
- SQLite
- MongoDB

Classement des SGBD

Voici ci-dessous un tableau présentant le classement des SGBD les plus populaires pour l'année 2014. Ce
classement a été produit par Solid IT une firme qui a fait de du classement des SGBD son domaine d'expertise.
Exercice : Activité d'Auto-évaluation No 1
Exercice : Activité d'Auto-évaluation No 1

Exercice : Activité d'Auto-


évaluation No 1 II

Exercice
Un système d'information est :

Un ensemble des moyens humains, matériels et immatériels mis en œuvre afin de gérer l'information au
sein d'un gouvernement.

Un ensemble des moyens humains, matériels et immatériels mis en œuvre afin de gérer l'information au
sein d'une unité.

Un ensemble de données bien structurées, apparentées, enregistrées sur un support de stockage
représentant un univers du monde réel

 est un logiciel permettant de collecter, stocker et traiter les informations d'un entreprise
Exercice : Les fonctions d'un système d'informatique sont :
Les fonctions d'un système d'information sont :

 La diffusion de l'information

 La duplication d'information

 La saisie ou collecte de l'information

 La rationalisation d'information

 La normalisation de l'information

 La mémorisation de l'information

 La compression de l'information

 Le traitement de l'information
Exercice
Un SGBD est :

Un ensemble des moyens humains, matériels et immatériels mis en œuvre afin de gérer l'information au
sein d'une unité.

un ensemble de données bien structurées, apparentées, enregistrées sur un support de stockage représentant
un univers du monde réel
 est un logiciel permettant d'interroger une base de donnée

un logiciel permettant la création de la base de données, l'enregistrement, la modification, la récupération
et la suppression des informations au sein de celle-ci.
Les modèles de SGBD
Les modèles de SGBD

Les modèles de SGBD


III

Un modèle de base de données illustre la structure logique d'une base de données, y compris les relations et les
contraintes qui déterminent comment les données peuvent être stockées et accessibles. Les modèles de base de
données individuels sont conçus en fonction des règles et concepts du modèle de données plus général adopté par
les concepteurs. La plupart des modèles de données peuvent être représentés par un diagramme de base de
données.
Les bases de données sont apparues à la fin des années 60, à une époque où la nécessité d'un système de gestion
de l'information souple se faisait ressentir.
Il existe plusieurs modèles de SGBD, différenciés selon la représentation des données qu'elle contient :
- Modèle de base de données hiérarchique
- Modèle réseau
- Modèle relationnel (SGBDR) ou Modèle entité-association
- Modèle de base de données orientée objet (SGBDO)
- Le modèle relationnel-objet, qui associe les deux éléments qui composent son nom
- Le modèle déductif
- Modèles de bases de données NoSQL
- etc.
Dans cette partie, nous présenterons quelques modèles, mais le modèle qui fera l'objet de notre étude est le
modèle relationnel.
Modèle hiérarchique
Modèle hiérarchique

1. Modèle hiérarchique
- Le modèle hiérarchique organise les données dans une structure arborescente, où chaque enregistrement
dispose d'un seul parent (racine).
- Les enregistrements frères et sœurs sont triés dans un ordre particulier. Cet ordre est suivi pour le stockage
physique de la base de données.
- Ce modèle convient à la description de nombreuses relations du monde réel.
Il a surtout été utilisé par les systèmes de gestion d'information d'IBM dans les années 60 et 70, qui ont
aujourd'hui majoritairement disparu en raison de certaines inefficacités opérationnelles.

Modèle réseau
Modèle réseau
2. Modèle réseau
- Le modèle réseau est une extension du modèle hiérarchique qui autorise des relations plusieurs-à-plusieurs
entre des enregistrements liés, ce qui implique plusieurs enregistrements parents.
- Basé sur la théorie mathématique des ensembles, ce modèle s'articule autour d'ensembles
d'enregistrements connexes. Chaque ensemble se compose d'un enregistrement propriétaire (ou
enregistrement parent) et d'un ou plusieurs enregistrements membres (ou enfants).
- Un enregistrement peut être un membre ou un enfant dans plusieurs ensembles, ce qui permet à ce modèle
de traduire des relations complexes.
Son pic de popularité remonte aux années 70, après qu'il a été officiellement défini par la conférence sur les
langages de systèmes de traitement de données (Conference on Data Systems Languages, CODASYL)

Modèle de base de données orientée objet


Modèle de base de données orientée objet

3. Modèle de base de données orientée objet


Ce modèle définit une base de données comme une collection d'objets, ou d'éléments logiciels réutilisables,
associés à des caractéristiques et des méthodes. Il existe plusieurs types de bases de données orientées objet :
- Une base de données multimédia réunit des médias, tels que des images, qui ne peuvent pas être stockés
dans une base de données relationnelle.
- Une base de données hypertextuelle permet à n'importe quel objet d'être relié à un autre. Elle est utile
pour organiser de nombreuses données disparates, mais peu adaptée à l'analyse numérique.
Modèle déductif
Modèle déductif

4. Modèle déductif
- Un SGBD Déductif est un SGBD qui peut faire des déductions sur la base des règles et des faits
enregistrés dans la base de données.
- Le but est d'utiliser des méthodes semblables à celles pratiquées pour la déduction en intelligence
artificielle.
- Une base de données déductive (BDD) est constituée de: BDE et BDI.
- Base de données extensionnelle (BDE): Ensemble des faits connus (tuples) dans la BDD relationnelle.
- Base de données intentionnelle (BDI): Ensemble des faits ou règles déduits.
- Les BDD déductives ne sont pas une nouvelle technologie de SGBD, mais elles rajoutent des
fonctionnalités supplémentaires qui permettent de générer des données dérivées (ou déduites) à partir de
données déjà existante dans la base.
Modèles de bases de données NoSQL
Modèles de bases de données NoSQL

5. Modèles de bases de données NoSQL


Outre le modèle de base de données orienté objet, d'autres modèles non SQL sont venus s'opposer au modèle
relationnel :
Le modèle de base de données orienté graphe, qui est encore plus flexible qu'un modèle réseau, car il
- permet la connexion entre tous les nœuds, quels qu'ils soient.

- Le modèle multi-valeur, qui se distingue du modèle relationnel en permettant aux attributs de contenir une
liste de données plutôt qu'un seul point de données.
- Le modèle orienté document, qui est conçu pour stocker et gérer des documents ou des données semi-
structurées plutôt que des données atomiques.
Modèle relationnel
Modèle relationnel

6. Modèle relationnel
Définition
En informatique, une base de données relationnelle est une base de données où l'information est organisée dans
des tableaux à deux dimensions appelés des relations ou tables1, selon le modèle introduit par Edgar F. Codd en
1970. Selon ce modèle relationnel, une base de données consiste en une ou plusieurs relations. Les lignes de ces
relations sont appelées des nuplets ou enregistrements. Les colonnes sont appelées des attributs.

C'est un article publié en 1969 par un mathématicien du centre de recherche IBM, Codd, qui définit les bases de
ce modèle relationnel. Codd s'est intéressé au concept d'information et a cherché à le définir sans se préoccuper de
la technique informatique, de ses exigences et de ses contraintes. Il a étudié un modèle de représentation des
données qui repose sur la notion mathématique de "relation".

Caractéristiques du modèle

- Schéma de données facile à utiliser : toutes les valeurs sont des champs de tables à deux dimensions.
- Améliore l'indépendance entre les niveaux logique et physique : pas de pointeurs visibles par l'utilisateur.
- Fournit aux utilisateurs des langages de haut niveau pouvant éventuellement être utilisés par des non-
informaticiens (SQL, L4G) et un ensemble d'opérateurs basé sur l'algèbre relationnelle : union,
intersection, différence, produit cartésien, projection, sélection, jointure, division.
- Optimise les accès aux bases de données.
- Améliore l'intégrité et la confidentialité : unicité de clé, contrainte d'intégrité référentielle.
- Prend en compte une variété d'applications, en gestion et en industriel.
- Fournir une approche méthodologique dans la construction des schémas. Il est évident qu'une base de
données relationnelle présente des avantages tels que :
- L'indépendance des utilisateurs vis à vis de la structure logique, la structure physique, la stratégie
d'accès aux données.
- La puissance de représentation grâce à conception rigoureuse du schéma (approche
méthodologique).
- La rapidité d'écriture du code.
- La manipulation par des non informaticiens pour des cas simples sinon la connaissance de la
structure de la base de données et de la maîtrise de l'algèbre relationnelle sont nécessaires.
- L'approche non procédurale permettant un traitement uniforme de la définition, de la manipulation
et du contrôle des données.
- L'évolutivité.
- La prise en compte des contraintes d'intégrité.
Illustration
Exercice : Activité d'Auto-évaluation No 2
Exercice : Activité d'Auto-évaluation No 2

Exercice : Activité d'Auto-


évaluation No 2 IV

Exercice
Quatre modèles de SGBD sont :

 Modèle non Structuré

 Modèle réseau

 Modèle organisationnel

 Modèle de base de données hiérarchique

 Modèles de bases de données NoSQL

 Modèle Business

 Modèle inférentiel

 Modèle relationnel
Exercice
une base de données relationnelle est :

une base de données où l'information est organisée dans entités multivaluées et liées par des liens de
covalence selon le modèle introduit par Edgar F. Codd

une base de données où l'information est organisée dans des documents, selon le modèle introduit par
Edgar F. Codd

une base de données où l'information est organisée dans des tableaux à deux dimensions appelés des
relations ou tables, selon le modèle introduit par Edgar F. Codd

un ensemble de données apparentées et normalisées reflétant un univers du monde réel et optimiser sur un
support de stockage
Exercice
Les caractéristiques du modèle de SGBD relationnel sont :

 Optimisation des accès aux bases de données.

 Intégration de protocoles de communication ouverts

 Structuration réseautique des données


 Amélioration de l'intégrité et la confidentialité

 Disposition linéaire et scalaire des données

 Amélioration de l'indépendance entre les niveaux logique et physique


Méthodologie générale de conception d'une base de données
Méthodologie générale de conception d'une base de données

Méthodologie générale de
conception d'une base de V
données

On distingue quatre étapes dans la conception d'une base de données :


- L'analyse : Elle consiste à étudier le problème et à consigner dans un document, la note de clarification,
les besoins, les choix, les contraintes.
- La modélisation conceptuelle  : Elle permet de décrire le problème posé, de façon non-formelle (en
générale graphique), en prenant des hypothèses de simplification. Ce n'est pas une description du réel,
mais une représentation simplifiée d'une réalité.
- La modélisation logique : Ele permet de décrire une solution, en prenant une orientation informatique
générale(type de SGBD typiquement), formelle, mais indépendamment de choix d'implémentation
spécifiques.
- L'implémentation : Elle correspond aux choix techniques, en terme de SGBD choisi et à leur mise en
œuvre (programmation, optimisation...)
La réalisation d'une base de données est une tâche complexe, le découpage en quatre étapes permet de gérer cette
complexité.

L'analyse
L'analyse

1. L'analyse
Fondamental
- Bien analyser le problème posé en amont
- Bien modéliser le problème au niveau conceptuel avant de passer au niveau logique et à l'implémentation

Conseil : L'importance de l'étape d'analyse


- La première étape de la conception repose sur l'analyse de l'existant et des besoins. De la qualité de la
réalisation de cette première étape dépendra ensuite la pertinence de la base de données par rapports aux
usages. Cette première étape est donc essentielle et doit être menée avec soins.
- Si la première étape est fondamentale dans le processus de conception, elle est aussi la plus délicate. En
effet, tandis que des formalismes puissants existent pour la modélisation conceptuelle puis pour la
modélisation logique, la perception de l'existant et des besoins reste une étape qui repose essentiellement
sur l'expertise d'analyse de l'ingénieur.

L'analyse de l'existant et des besoins

- La phase d'analyse de l'existant et des besoins est une phase essentielle et complexe. Elle doit aboutir à des
spécifications générales qui décrivent en langage naturel les données manipulées, et les traitements à
effectuer sur ces données.
- On se propose de donner une liste non exhaustive d'actions à mener pour rédiger de telles spécifications

Le recueil d'expertise métier

Les données que la base va devoir manipuler sont toujours relatives aux métiers de l'entreprise, et il existe des
experts qui pratiquent ces métiers. Le dialogue avec ces experts est une source importante d'informations. Il
permet également de fixer la terminologie du domaine.

Le dialogue avec les usagers

La base de données concerne des utilisateurs cibles, c'est à dire ceux qui produiront et consommeront
effectivement les données de la base. Il est nécessaire de dialoguer avec ces utilisateurs, qui sont les détenteurs des
connaissances relatives aux besoins réels, liés à leur réalité actuelle (aspects de l'organisation fonctionnant
correctement ou défaillants) et à la réalité souhaitée (évolutions, lacunes, etc.)

Conseil
Voici quelques moyens de recueillir des informations avant de créer la base de données :
- Interroger les personnes qui vont l'utiliser
- Analyser des formulaires d'entreprise, tels que des factures, des feuilles de présence, des enquêtes
- Passer en revue tout système de données existant (en incluant tous les fichiers physiques et numériques)

L'étude des autres systèmes informatiques existants

La base de données va généralement (et en fait quasi systématiquement aujourd'hui) s'insérer parmi un ensemble
d'autres logiciels informatiques travaillant sur les données de l'entreprise.Il est important d'analyser ces systèmes,
afin de mieux comprendre les mécanismes existants,leurs forces et leurs lacunes, et de préparer l'intégration de la
base avec ces autres systèmes.
Le modèle conceptuel de données
Le modèle conceptuel de données

2. Le modèle conceptuel de données


Conseil : L'importance de l'étape de modélisation conceptuelle
- Étant donnée une analyse des besoins correctement réalisée, la seconde étape consiste à la traduire selon
un modèle conceptuel.
- Le modèle conceptuel étant formel, il va permettre de passer d'une spécification en langage naturel, et
donc soumise à interprétation, à une spécification non ambigüe.
- Le recours aux formalismes de modélisation tels que E-A ou UML est donc une aide fondamentale pour
parvenir à une représentation qui ne sera plus liée à l'interprétation du lecteur.
- La traduction d'un cahier des charges spécifiant l'existant et les besoins en modèle conceptuel reste
néanmoins une étape délicate, qui va conditionner ensuite l'ensemble de l'implémentation informatique. En
effet les étape suivantes sont plus mécaniques, dans la mesure où un modèle logique est déduit de façon
systématique du modèle conceptuel et que l'implémentation logicielle est également réalisée par traduction
directe du modèle logique.
- La modélisation conceptuelle en bases de données relationnelle est souvent faite avec le formalisme E-A
de la méthode MERISE que nous en parlerons après.
- En BD on utilise uniquement le diagramme de classe d'UML (nous en parlerons dans la 2è partie) pour
modéliser conceptuellement les données.

L'objection du modèle conceptuel est de représenter le problème à l'aide de représentations graphiques et


partiellement formelles. Les principales caractéristiques du modèle conceptuel sont :
- Une représentation graphique simple
- Une puissance d'expression élevée pour un nombre de symboles raisonnables
- Une lecture accessible à tous et donc un bon outil de dialogue entre les acteurs techniques et non
techniques
- Une formalisation peu ambiguë et donc un bon outil de spécification détaillée
Le niveau conceptuel représente les informations et leurs relations d'une part, les utilisations qui en sont faites et
les contraintes d'autre part.
- En terme de données, cette description fait appel au formalisme Entité-Association et se traduit par des
entités de base et par des relations avec ces entités.
- En terme de traitements, ces mêmes entités vont être décrites par leurs sollicitations ou par les réactions
qu'elles déclenchent de la part du système d'information, donc par les traitements dont elles sont les causes
et les conséquences. Ceci se fait à l'aide d'événements, de synchronisation et d'opérations.
*  *
*

La modélisation est incontournable pour celui qui conçoit une base de donnée. Il s'agit tout d'abord un travail de
collecte de données, de compréhension et de traduction. L'analyste programmeur (c'est le nom que l'on donne au
professionnel qui modélise) consiste à :
- Bien comprendre ce qui doit être informatisé (quelles informations, quels acteurs, quels flux d'informations).
- Passer du temps avec les utilisateurs finaux afin de comprendre leur vision de leur tâche. Passer du temps
avec les personnes en amont et en aval ainsi qu'avec les décideurs afin d'être bien au clair avec les attentes et les
enjeux.
- Extraire un schéma de fonctionnement idéalisé et représentatif de la réalité.
- Transformer tout ça et créer la base de données.
>> La troisième étape est la plus difficile : elle nécessite une maîtrise d'un outil de modélisation. Le plus courant est
Merise. Assez abstrait et difficile à appréhender pour les débutants, il se révèle être un outil redoutable et un socle de
discussion très pratique pour que les utilisateurs finaux et les informaticiens se comprennent.
>> La dernière étape est essentiellement technique et se déroule sur ordinateur. Elle consiste à transformer le modèle
en base de données réellement utilisable.
>> Mais la plus grande difficulté de la modélisation est celle qui est en amont de la modélisation : faire comprendre
qu'une base de données ne s'improvise pas et qu'un travail initial préparatoire qui semble être une perte de temps et
d'argent est en fait la meilleure approche possible.
Exercice : Activité d'Auto-évaluation No 1
Exercice : Activité d'Auto-évaluation No 1

Exercice : Activité d'Auto-


évaluation No 1 VI

Exercice
La modélisation conceptuelle permet :

 de décrire une solution, en prenant une orientation informatique générale et formelle

 de faire un choix techniques, en terme de SGBD choisi et à leur mise en œuvre



une représentation simplifiée d'une réalité en décrivant le problème posé de façon non-formelle ou
graphique.

 de définir l'ensemble des concepts à utiliser


Exercice
Les quatre étapes dans la conception d'une base de donnée sont :

 La modélisation logique

 La modélisation uni-valuée

 La modélisation multi-valuée

 La modélisation conceptuelle

 Le codage

 L'implémentation

 L'analyse

 Les tests unitaires


Exercice
La phase d'analyse d'une BD consiste à :

 faire une étude technique du problème et décrire de façon formelle la solution



étudier le problème et à consigner dans un document la note de clarification, les besoins, les choix, les
contraintes.

 décrire une solution, en prenant une orientation informatique générale et formelle

 définir l'ensemble des concepts et solutions pour résoudre le problème posé


Les approches de modélisation d'une base de données
Les approches de modélisation d'une base de données

Les approches de
modélisation d'une base VII
de données

La conception d'un système d'information n'est pas évidente car, il faut réfléchir sur l'ensemble de l'organisation,
que l'on doit mettre en place. La phase de conception nécessite des méthodes permettant de mettre en place un
modèle sur lequel il faut s'appuyer. La modélisation consiste à créer une représentation virtuelle d'une réalité de
telle façon à faire ressortir les points auxquels l'on
s'intéresse, Elle nécessite une analyse approfondie du monde réel ainsi que des besoins des futurs utilisateurs.
Des méthodes de conception de BDD ont donc été développées, nous avons deux principales méthodes de
conception que sont :
- La méthode UML
- La méthode MERISE
La méthode Merise
La méthode Merise

1. La méthode Merise
MERISE (Méthode d’Études et de Réalisation Informatique pour les Systèmes d'Entreprise) est une méthode
française née dans les années 70, développée initialement par Hubert Tardieu. Elle fut ensuite mise en avant dans
les années 80, à la demande du Ministère de l'Industrie qui souhaitait une méthode de conception des SI.
MERISE est donc une méthode d'analyse et de conception des SI basée sur le principe de la séparation des
données et des traitements. Elle possède un certain nombre de modèles (ou schémas) qui sont répartis sur 3
niveaux :
- Le niveau conceptuel,
- Le niveau logique ou organisationnel,
- Le niveau physique.
Ces différents niveaux répondent aux questions suivantes :
- Modèles Conceptuels : Quoi Faire ? Avec Quelles Données ?
- Modèles Organisationnels : Qui ? Ou ? Quand ?
- Modèles Opérationnels ( Physique) : Comment ?
Ces étapes du processus de modélisation sont parallèles aux étapes du cycle de vie:
- planification stratégique,
- étude préliminaire,
- étude détaillée,
- développement,
- mise en œuvre et maintenance.
C'est une méthode d'analyse basée sur le modèle entité-relation. En utilisant Merise, vous pouvez concevoir des
tables avec des relations pour créer une base de
données relationnelle.

La notion de Modèle

Un modèle est une représentation simplifiée d'une réalité sur laquelle on veut être renseigné
Un modèle s'exprime avec un ensemble de concepts , dotés de règles d'utilisation et de représentation (souvent
graphique)
Les modèles servent à :
- Communiquer : vérifier que l'analyste a bien compris les utilisateurs (phase d'analyse).
- Préparer la réalisation : grâce à un modèle de la solution (phase de conception).

Illustration

Analyse et conception

Au sens informatique, l'analyse consiste d'une part à comprendre et modéliser le fonctionnement d'un domaine de
gestion d'une organisation, et d'autre part à concevoir la solution informatique adéquate.
- Analyse :
- on s’intéresse en général à un domaine d'activité de l'entreprise ( vente, production, logistique,
finances, RH, etc.)
- on prend en compte les besoins des utilisateurs
- on définit le problème à résoudre (fonctionnalités et qualités attendues)
- Conception : on définit une solution informatique
- Structuration des données
- organisation des traitements
- définition des postes de travail
- choix techniques : matériels, langages de programmation, logiciel de gestion (SGBD)

Principes de base de la méthode Merise

Séparation des données et des traitements


- Traitements :
- Étude des événements
- Indépendances entre les domaines
- Données
- Étude du vocabulaire de l'organisation
- Intégration des domaines : Vue globale
Forces et faiblesses de MERISE

Les points forts :


- La méthode s'appuie sur une approche systémique : C'est donc une approche globale.
- Les concepts sont peu nombreux et simples.
- Elle est assez indépendante vis à vis de la technologie.
- Elle est la plus utilisée en France dans les domaines de gestion.
- Elle sert de référence aux enseignements sur les méthodes.
Les critiques :
- Elle ne s'occupe pas de l'interface utilisateur.
- Elle ne permet pas réellement une validation rapide de la part des utilisateurs.
- Il est très difficile de valider les traitements par rapport aux données et cela au niveau conceptuel ou
organisationnel.
La validation en cours de l'étude par des personnes concernées permet d'assurer que le système en construction est
conforme aux objectifs. Si on ne respecte pas les étapes de validation on risque de produire des applications loin
de la demande initiale ce qu'on nomme « l'effet tunnel ». Sans oublier que les applications développées sont
destinées aux utilisateurs et non au plaisir des informaticiens.

Définition : Notion de Système


Un système est un ensemble d'éléments interagissant entre eux selon certains principes ou règles. Un système est
déterminé par :
- sa frontière, c'est-à-dire le critère d'appartenance au système (déterminant si une entité appartient au
système ou fait au contraire partie de son environnement) ;
- sa mission (ses objectifs et sa raison d'être) ;
- ses interactions avec son environnement ;
- ses fonctions (qui définissent ce qu'ont le droit de faire ou non les entités faisant partie du système, leur
organisation et leurs interactions) ;
- ses ressources, qui peuvent être de natures différentes (humaine, naturelle, matérielle, immatérielle...), leur
organisation et leurs interactions.

Notion de système d'information

Le système d'information (SI) est un ensemble organisé de ressources qui permet de collecter, stocker, traiter et
distribuer de l'information1, en général grâce à un ordinateur
Le système d'information est défini comme le cœur de l'entreprise, il fait interface entre le système opérant et le
système de pilotage et fournit les réponses aux deux systèmes.
- Système opérant :
- Chargé de la production
- répond à la finalité de l'entreprise
- Système de pilotage :
- dirige l'entreprise
- cible les objectifs à une fonction d'arbitrage, d'allocations de ressources, de suivi de leurs
utilisations, d'adaptation du fonctionnement de l'entreprise à son environnement.
Dans un système d'information d'une grande entreprise, on trouve les ERP - enterprise resource planning (en
français : PGI pour progiciel de gestion intégré) - qui intègre théoriquement tous les systèmes informatisés
transactionnels dont les modalités de fonctionnement sont désormais bien connues des informaticiens et des
hommes de l'Art de chaque métier. Les ERP permettant de soutenir le fonctionnement de l'entreprise ;

RÔLE DU SYSTÈME D'INFORMATION


- Collecter des informations provenant :
- d'autres éléments du système
- de l'environnement
- Mémoriser des données :
- base de données
- Fichiers
- Historique, Archivage
- Traiter les données stockées :
- traitements automatisables
- aide à la prise de décision
- Communiquer
Un projet informatique a pour objectif de construire une application informatique (logiciel et base de données),
support d'un système d'information informatisé, inclus dans un
système d'information organisationnel.

Exemple : Des systèmes d'applications


On trouvera par exemple, des applications de :
- gestion de la relation client (GRC, ou CRM pour customer relationship management) : regroupe toutes les
fonctions permettant d'intégrer les clients dans le système d'information de l'entreprise.
- gestion de la chaîne logistique (GCL, ou SCM pour supply chain management) : regroupe toutes les
fonctions permettant d'intégrer les fournisseurs et la logistique au système d'information de l'entreprise
- Système d'information des ressources humaines (SIRH) pour la gestion des ressources humaines (GRH),
ou HRM pour human resource management.
La méthode UML
La méthode UML

2. La méthode UML
Définition
UML signifie « Unified Modeling Language ». Il s'agit d'un langage de modélisation graphique normalisé
permettant de représenter les multiples aspects de la conception d'un système. Il propose plusieurs types de
diagrammes, chacun permettant de décrire les différentes facettes du système (fonctionnalité, architecture logique
ou physique...).

Le méta-modèle UML fournit une panoplie d'outils permettant de représenter l'ensemble des éléments du monde
objet (classes, objets, ...) ainsi que les liens qui les relie. Toutefois, étant donné qu'une seule représentation est trop
subjective, UML fournit un moyen astucieux permettant de représenter diverses projections d'une même
représentation grâce aux vues.
Une vue est constituée d'un ou plusieurs diagrammes.
Ainsi, UML définit 9 types de diagrammes dans deux catégories de vues, les vues statiques et les vues
dynamiques.
- Vues statiques, c'est-à-dire représentant le système physiquement :
- Les diagrammes de cas d'utilisation décrivent le comportement et les fonctions d'un système du
point de vue de l'utilisateur
- Les diagrammes de classes décrivent la structure statique, les types et les relations des ensembles
d'objets
- Les diagrammes d'objets décrivent les objets d 'un système et leurs relations
- Les diagrammes de composants décrivent les composants physiques et l'architecture interne d'un
logiciel
- Les diagrammes de déploiement décrivent la répartition des programmes exécutables sur les
différents matériels
- Vues dynamiques, montrant le fonctionnement du système :
- Les diagrammes de collaboration décrivent les messages entre objets (liens et interactions)
- Les diagrammes d'états-transitions décrivent les différents états d'un objet
- Les diagrammes d'activités décrivent les comportements d'une opération (en termes d'actions)
- Les diagrammes de séquence décrivent de manière temporelle les interactions entre objets et
acteur
Comme n'importe quel type de projet, un projet informatique nécessite une phase d'analyse, suivi d'une étape de
conception.
- Dans la phase d'analyse, on cherche d'abord à bien comprendre et à décrire de façon précise les besoins
des utilisateurs ou des clients :
- Que souhaitent-ils faire avec le logiciel ?
- Quelles fonctionnalités veulent-ils ?
- Pour quel usage ?
- Comment l'action devrait-elle fonctionner ?
C'est ce qu'on appelle « l'analyse des besoins ». Après validation de notre compréhension du besoin, nous
imaginons la solution. C'est la partie analyse de la solution.
- Dans la phase de conception, on apporte plus de détails à la solution et on cherche à clarifier des aspects
techniques, tels que l'installation des différentes parties logicielles à installer sur du matériel.
Exercice : Activité d'Auto-évaluation No 2
Exercice : Activité d'Auto-évaluation No 2

Exercice : Activité d'Auto-


évaluation No 2 VIII

Exercice
Deux grandes approches de modélisation d'une base de données sont :

 La méthode AOD

 La méthode MERISE

 La méthode SYSOADA

 La méthode épi-phénomène

 La méthode UML
Exercice
MERISE signifie :

 Méthode d'Études et de Réalisation des Informations pour les Systèmes E-Commerce

 Méthode d'Études et de Réalisation Informatique pour les Systèmes d'Entreprise

 Modèle d'Études et de Réalisation des Informations pour les Systèmes Électronique

 Modèle d'Études et de Réalisation Informatique pour les Systèmes d'Entreprise


Exercice
Le principes de base de la méthode Merise est :

 La définition des principes de gestion des données

 La normalisation des règles de stockage et de gestion des données

 La fusion des données et des traitements

 La séparation des données et des traitements

 La modélisation heuristique des données


Conclusion
En d'autres termes, « les bases de données assurent une gestion de données exactes, complètes et disponibles à tout
moment, depuis n'importe où et dans la forme voulue ».
Les SGBD les plus évolués actuellement disponibles disposent de la plupart de ces fonctions, mais pas toutes. Il en
résulte des différences significatives entre leurs caractéristiques, leur fonctionnement et leurs usages possibles. Il
convient de signaler également que les bases de données sont plus qu'une nouvelle technique de stockage et de
manipulation des données. Elles impliquent une nouvelle approche de la conception et de l'utilisation des systèmes
d'information et peuvent avoir des conséquences organisationnelles qui sortent largement du cadre du service
informatique. Elles obligent les utilisateurs à considérer les données comme une ressource de l'entreprise qui doit être
gérée comme le sont les ressources traditionnelles (personnel, locaux, moyens de production, capitaux) pour être
accessible à un grand nombre d'utilisateurs.

Vous aimerez peut-être aussi