Vous êtes sur la page 1sur 23

Introduction aux BD

Introduction aux BD
enjeux de la matire
objectifs de la partie I
histoire
dfinition 1
definion 2 : par les objectifs d'un Systme
d'Information
Le champ d'application
Les mthodologies de conception de BD
retour aux modles

enjeux de la matire
Information: ressource de l'entreprise
Histoire - Actualit - Devenir
Analyse et contrle des informations
Diminuer l'incertitude des processus de dcision
La place du gestionnaire
Dcider avec l'information
Contrler avec l'information
Modifier l'organisation
- communication des informations
- capture de l'information
- traitement de l'information
Intervenir dans la spcification du SI
- fixant objectifs
- schma directeur informatique
- validant les systmes mis en place

objectifs de la partie BD
La BD <-> Entreprise
introduction aux BD
champ d'application
spcification
Lecture de schma de BD
rappel mathmatique
dfinition de la relation
modlisation des donnes
Interrogation des donnes
Algbre relationnelle
langage SQL

histoire: trier, compter


Recencement amricain 1890 (63 mio)
1 personnes = plusieurs cartes perfores
1 critres = plusieurs colonnes (1mia de trous)
=> machine lectro-mcanique
trier + compter
rpondre des questions
- enfants ns, vivants, famille parlant anglais
=> utiliser jusqu'en 1960 (mcanographie)
Lien
Histoire des techniques de l'information
Histoire des techniques de gestion

histoire: les imprimantes, les bandes


premires machines EDVAC, ENIAC, ...(1944, )
peu de donnes,
beaucoup de calcul,
peu de rsultats
=> machine scientifique
premire machine commercialise UNIVAC 1 (1951, ..)
peu de donnes,
beaucoup de calcul,
peu de rsultats
=> machine de gestion
imprimante haut dbit
lecteur de bande magntique
Univac 1 = 12000 char centrale + 10 drouleurs
bandes
(200 drouleurs bandes- BIZMAC de RCA
anne 50)
Langage de programation
Flow-matic (1955) -> Cobol (1960)
description des donnes spare des instructions

histoire: approche par les fichiers


cration de fichiers spcifiques des programmes:
dfinition du fichier dans le programme
interprtation du fichier exige le programme
maintenance coteuse car il s'agit d'un programme
structure des donnes dpend de l'analyse des
traitements
partage difficile entre applications
duplification de l'information (plusieurs vues des mmes
donnes)
assembleur

fichiers

------------------------indpend. physique-------------langage prog


histoire des standarts
caractres = EBCDIC & ASCII
langage de prog = COBOL
Base de donnes = SQL

B.D

concept de base de donnes: par


une dfinition
une dfinition
"Une base de donnes est un ensemble structur de donnes enregistres sur des supports accessibles par
l'ordinateur pour satisfaire simultanment plusieurs
utilisateurs de faon slective et en un temps opportun"
Dans: Bases de donnes et systmes relationnels, C.
Delobel et M. Adiba, Dunod 1982.
Les donnes
Les donnes de la BD reprsentent des faits, des activits ou des vnements de l'entreprise. La BD doit tre
considre comme la mmoire de l'entreprise. De ce fait,
le contenu de la BD doit tre:
- pertinent (donnes utiles)
- fiable (donnes cohrentes et justes)
- utilisable (accessible aux traitements)
La structure
Les objets mmoriss dans la BD possdent des proprits communes, permettant ainsi de les regrouper par
type d'objet. La structure de la BD est le "plan" qui permettra d'interprter les donnes stockes. La gestion de
la base de donnes se fait par rapport cette structure.
Les supports
La base de donnes peut comporter quelques
milliers de caractres pour une petite base sur microordinateur, donc elle peut tre stocke sur disquette ou
elle est constitue de plusieurs milliards de caractres et

elle doit tre stocke sur des units de disques d'un


"gros" ordinateur. Malgr les diffrences de tailles, les
techniques et les concepts utiliss sont similaires.
Les utilisateurs
Les donnes mmorises sont appeles tre utilises
par diffrents services de l'entreprise, avec des
utilisateurs appartenant principalement trois catgories:
- Les informaticiens; grant la BD, concevant les
nouvelles applications.
- Les utilisateurs "avertis"; sachant faire des requtes
d'interrogation pour leurs propres besoins qui ne
sont pas spcifiables (les gestionnaires).
- Les utilisateurs "nafs"; dont la tche est entirement
spcifiable (rptitive),saisie de l'information.
La slectivit
La BD est surtout utilise en interrogation, le langage
d'interrogation est donc un lment essentiel du systme,
il doit tre:
- facile apprendre (pour les utilisateurs avertis)
- masquer la structure physique de la base de
donnes (Index, paramtres, ...)
- avoir une smantique claire (comprendre le sens de
la question et de la rponse)
L'opportunit
On entend par l que si l'information existe dans la BD,
alors on peut l'obtenir dans un dlai raisonnable (court si
l'on travaille de manire interactive (guichet de banque)
ou temps (pour prendre une dcision))

definion 2 : par les objectifs d'un


Systme d'Information
Les objectifs de l'organisation
La conception d'une application BD est une opration
demandant des ressources financires (achat des ordinateurs, logiciel de gestion de BD, ...) ainsi que des
ressources humaines (concepteur, programmeur, opratrices de saisie, ...), il est donc important que
l'organisation examine les avantages qu'elle doit en retirer. Les arguments suivants peuvent motiver
l'organisation:
- simplifier une tche de l'entreprise (gestion du stock)
- augmenter la qualit d'un service (rservation pour
un htel)
- permettre une meilleure prise de dcision (gestion
de portefeuilles)
- rentabiliser les ressources matrielles et humaines
(entreprise de dmnagement)
En rsum, la BD doit conserver les donnes
stratgiques de l'entreprise pour que l'on puisse les
utiliser d'une manire optimale. Les objectifs de
l'entreprise peuvent s'chelonner en plusieurs tapes ou
bien voluer dans le temps, d'o l'importance d'une
conception et d'un systme de gestion de base de
donnes (SGBD) autorisant les volutions et les
modifications.

Le champ d'application
Les objectifs de l'organisation dlimitent un champ
d'application dans la ralit dont la BD est le reflet
(mthode: Schma directeur). Ses lments sont:
- les traitements effectuer
- les requtes d'interrogation excuter
- les donnes ncessaires mmoriser
- les rgles d'intgrit respecter
ralit

frontire du champ
d'application

HOTEL
SERVICE
ETAGE

COMPTA
BILITTE

RESERVATION
CUISINE

PERSONNEL
MENU,QTE, ...

Les traitements
Les traitements de l'application sont dfinis par toutes les
modifications envisages sur les donnes de la BD. Trois
types d'actions sont possibles:
- La cration; un "objet" nouveau apparat dans la
ralit et celui-ci est dans le champ d'application,
donc il doit tre enregistr dans la base de donnes
(un nouveau client)
- La mise jour; un "objet" dj enregistr dans la
BD se modifie et ceci doit tre report dans la BD
(changement dans la quantit stocke d'un article)
- La destruction; un "objet" enregistr dans la BD
sort du champ d'application et doit donc tre limin
de la BD (changement d'anne comptable, un
salari quitte l'entreprise)
ralit

destruction

mise jour

cration

champ
d'application

En rsum, les traitements permettent de modifier la BD


pour tenir compte des changements intervenant dans la
ralit du champ d'application.

Les interrogations
Il s'agit d'identifier les besoins de chaque utilisateur devant utiliser la BD, en se posant les questions suivantes:
- Quelles sont les informations de la BD ncessaires
l'accomplissement de la tche de cet utilisateur (le
magasinier, la rceptionniste de l'htel)?
- Quelle est la frquence de ces questions, le temps
de rponse exig? Le couple (100 req/jour, 15 secondes) sera examin diffremment de celui (1
req/mois, dans la matine).
- Qui peut examiner et modifier les informations? Ce
point concerne le degr de confidentialit et de scurit de chaque information.

Les donnes
Les donnes mmoriser dans la BD sont celles dfinies
par le champ d'application. Les traitements les crent, les
mettent jour et les dtruisent. Les requtes
d'interrogation les utilisent en lecture pour rpondre aux
utilisateurs.
La slection des donnes
Nous avons vu que c'est dans le cadre de la dfinition du
champ d'application qu'elle s'effectue. Le choix des proprits enregistrer dans la BD doit tre ncessaire et
suffisant pour excuter les traitements et rpondre aux requtes d'interrogation:
ncessaire: court terme, pour tre aussi efficace que le
systme remplac et moyen terme, pour rpondre de
nouvelles questions (que l'on vite de se poser car dans
un systme manuel, elles sont trop onreuses).
suffisant: pour viter de mmoriser des informations qui
seront peu ou pas utilises.
Pour une personne, nous pouvons la dfinir par exemple:
nom, prnom, taille, profession, adresse, numro de tlphone, revenu, poids, appartenance politique, sports pratiqus, tat civil, nombre d'enfants, ....
Chacune de ces proprits a un sens dans un contexte
bien dfini, par contre elles sont inutiles dans un autre.
Chaque information (compte en caractres) a un prix
calcul avec les cots suivants:
cot de saisie (opratrice, poste de saisie)
cot de stockage (disques, bandes d'archivage)

cot de manipulation (taille ordinateur ...)

Les rgles d'intgrit


Les rgles d'intgrit refltent les rglements de
l'organisation, le "bon sens" de la ralit. On peut les
exprimer:
sur les donnes; le fait que la BD respecte les
rgles d'intgrit permet d'assurer une certaine
cohrence des donnes, donc assure aux utilisateur
des informations de qualit (Une chambre n'est
rserve qu'une fois, les quantits du stock sont
positives, les clients ont plus de 18 ans, ...)
sur les traitements; ici ils s'agit d'exprimer l'ordre
dans lequel doivent s'effectuer les modifications de
la BD.

Les mthodologies de conception de


BD
Nous pouvons constater que les principaux lments
cits sont interdpendants. De plus, dans un approche
classique, chaque lment doit traverser plusieurs tapes
dans le processus de conception.
1) Analyse des besoins: par rapport aux objectifs
de l'organisation (Vers O ?)
2) Spcification: une description prcise de chaque
lment (Quoi ? Comment organisationnel ?)
3) Conception Informatique: une description de
l'ensemble du systme en termes informatiques
4) Codage: chaque lment est "cod" dans le
langage supportant la gestion de la BD
5) Test
6) Maintenance
Pour assister l'quipe de conception, il existe des
mthodologies et des outils informatiques (UML,
MERISE, IDA, USE, MTG, ...). Ceux-ci permettent de
guider la conception et de construire des prototypes.

retour aux modles: les fichiers


Le fichier (1950-..); c'est l'organisation la plus simple (et
encore la plus utilise). Les donnes d'un mme objet
sont dfinies par un enregistrement physique, l'ensemble
des enregistrements physiques constitue le fichier.
La description de l'enregistrement est implicite et elle est
code dans les programmes qui utilisent le fichier. Si l'on
modifie la structure du fichier, on est donc oblig de
modifier les programmes.
Les systmes de base de donnes contournent cet
inconvnient majeur en rendant explicite la structure
des donnes, rendant ainsi indpendants les
programmes de la reprsentation physique.
Les SGBD possdent donc tous une description explicite
de la structure de donne, mais il existe plusieurs faon
de dcrire les liens existant entre les objets du champ
d'application; on parle alors de modle de donnes.

modle hirarchique
modle hirarchique (1965-..);
dans ce modle les liens existant entre les objets sont
strictement arborescent.
DEPARTEMENT
NODPT, NOMDPT
EMPLOYE
NOEMP, NOMEMP, DATE-EMB

PROJET
NOPJ, NOMPJ,RESP-PJ

SALAIRE
ANNEE, SAL

Dans l'exemple, on remarquera que si une feuille de


l'arbre doit tre utilise dans une autre arborescence il
faudra la duplifier.
IMS est un SGBD hirarchique.

modle rseau
modle rseau (1965-..); ce modle est une extension
du modle prcdent, les liens entre objets peuvent
exister sans restriction.
DEPARTEMENT
NODPT, NOMDPT
EMPLOYE
NOEMP, NOMEMP, DATE-EMB

SALAIRE
ANNEE, SAL

PROJET
NOPJ, NOMPJ,RESP-PJ

EMP-PROJET
NOPJ, NOEMP, DUREE

Pour retrouver une donne dans une telle modlisation, il


faut connatre le chemin d'accs (les liens), ceci rend
encore les programmes dpendants de la structure de
donnes.
IDMS, TOTAL, MDBS-III sont des SGBD de ce type.

modle relationnel
le modle relationnel (1970-..); Ce modle est bas sur
la notion de relation. Une relation est un ensemble de nuplet (n est fixe) qui correspondent chacun une
proprit de l'objet dcrire.

DEPARTEMENT
NODPT NOMDPT
45

PROJET
NOPJ NOMPJ RESP-PJ NODPT

gestion

EMPLOYE
NOEMP NOMEMP DATE-EMB NO DPT

EMP-PROJET
NOPJ NOEMP DUREE

DEPARTEMENT, PROJET, EMPLOYE, EMP-PROJET


sont des relations. Les lignes dessines en pointill sont
les liens entre les relations, mais ici il n'est plus
ncessaire de dcrire explicitement les liens, les chemins
d'accs sont indpendants de la modlisation.
INGRES, ORACLE, RDB, DB2, SYBASE sont des SGBD
relationnels.
C'est dans ce modle que nous allons travailler.

Systme d'excution et d'interconnexion

CO
AX
FI
BR
ES

PC
M
AC
...

SU
N

HP

IB
M

DE
C
x

/n
et

IP

P/

ec

TC

...

M
SDO
S
O
SM
AC

M
VS

VM
S

ni

2
es

as

ph

ur

ite

on

...

it

co

an

Tr

se

ba

Sy

cl

ra

es

gr

In
n
de

io

at

Systme d'exploitation et de communication

Noyau SGBD et intgrit transactionnelle


u)

en

(m

tin

ip

cr

-S

...

gr

in

ra

s
n
pp s
or
ta
ts
bl
ea
u
gr x de
ap
hi bor
qu d
es

ra

io

at

m
an

SD
SS

EI

de
s
ur
at
Pr ion
od
uc
tio
Ac
n
Ad ha
m ts
in
is
tra
tio
n
Fi
na
nc
e
... s
ct

Fa

om

oc

St

Em

eu

ul
at

rs

M
o
X- tif
W
in
W dow
in
do
w
3.
Fi
nd ..
er
te
rm
in
al
24
X8
... 0

Niveaux conceptuels
Niveaux conceptuels du SI

Interface utilisateur

Applications

Outils de dveloppement

Distribution des BD

DONNEES
Serveur

Finances
DONNEES
Serveur

Production - Achat

DONNEES

PTT

Serveur

Serveur

DONNEES

DONNEES

PTT

PTT

Serveur

DONNEES

PTT

Serveur

units de vente - stockage


dlocalise