Vous êtes sur la page 1sur 39

Bases de donnes:

Introduction et
Objectifs

1. Introduction
Les entreprises grent des volumes de donnes trs grands
Giga,Terra, Pta octets
Numriques,Textuelles, Multi-mdia (images, films,...)

Il faut pouvoir facilement


Archiver les donnes sur mmoires secondaires permanente
Retrouver les donnes pertinentes un traitement
Mettre jour les donnes variant dans le temps

Les donnes sont structures et identifies


Donnes lmentaires ex:Votre salaire,Votre note en BD
Donnes composes ex:Votre CV, vos rsultats de l'anne
Identifiant humain ex: NSS ou machine: P26215

Qu'est-ce qu'une BD ?
Collection de donnes structures relies par des relations
Interrogeable et modifiable par des langages de haut niveau

La hirarchie des mmoires


Capacit
vs
Cot &
Vitesse
5-10 ms

80-200 ns

Mmoire
terciaire

Mmoire
secondaire
Mmoire principale
(RAM)

3-10 ns

Cache (SRAM)

2-5 ns

Registres

Un accs disque est environ 100,000


fois plus lent quun accs mmoire!

Eviter les accs disques


grande mmoire principale
Amortir les accs disques
placement des donnes
Minimiser le nombre daccs disques
mthodes daccs

Un peu d'histoire
Annes 60:
Rcipients logique de donnes fichiers sur dique
Accs squentiel puis sur cl
Lire (Nomf, Article), Ecrire (Nomf, Article)
Lire (Nomf, Article, Cl), Ecrire (Nomf, article, Cl)

Annes 70:
Avnement des Bases de Donnes Rseaux (BD)
Ensemble de fichiers relis par des pointeurs
Langage d'interrogation par navigation

Annes 80:
Avnement des Bases de Donnes Relationnelles (BDR)
Relations entre ensemble de donnes
Langage d'interrogation par assertion logique
4

Systmes de fichiers

Comptabilit

Caractristique
s

Chirurgie

Problmes
Consultations

Psychiatrie

Format des fichiers


Dupont
Symptomes : y
Turlututu : sqj
Symptomes : y
Turlututu : sdd
Analyses : xxx

Dupond
Turlututusqjsk
Symptom: yyyy
Analyses xxxx
Turlututudhjsd
Analyses :xx

Caractristique
s
Plusieurs applications

plusieurs formats

plusieurs langages

Problmes
Difficults de gestion

Duhpon

Duipont
Turlututu : sq

Symptomes : yy
Analyses : xxxx

Symptomyyyy
Analysesxxxx

Symptomes : yy

Turlututudhjsd

Redondance (donnes)
Dupont
Symptomes : y
Turlututu : sqj
Symptomes : y
Turlututu : sdd
Analyses : xxx

Dupond
Turlututusqjsk
Symptom: yyyy
Analyses xxxx
Turlututudhjsd
Analyses :xx

Caractristique
s
Plusieurs applications

plusieurs formats

plusieurs langages

Redondance de donnes

Problmes
Difficults de gestion
Incohrence des donnes

Duhpon

Duipont
Turlututu : sq

Symptomes : yy
Analyses : xxxx

Symptomyyyy
Analysesxxxx

Symptomes : yy

Turlututudhjsd

Interrogations
Symptomes : y
Turlututu : sqj
Symptomes : y
Turlututu : sdd
Analyses : xxx

Dupond
Turlututusqjsk
Symptom: yyyy
Analyses xxxx
Turlututudhjsd
Analyses :xx

ChiruSoft

ComptaSoft

Dupont

Caractristique
s
Plusieurs applications

plusieurs formats

plusieurs langages

Redondance de donnes
Pas de facilit dinterrogation

Question dveloppement

Problmes

ConsultSoft

Duhpon

Duipont
Turlututu : sq

Symptomes : yy
Analyses : xxxx

Symptomyyyy
Analysesxxxx

Symptomes : yy

Turlututudhjsd

PsychiaSoft

Difficults de gestion
Incohrence des donnes
Cots levs
Maintenance difficile

Pannes ???
Symptomes : y
Turlututu : sqj
Symptomes : y
Turlututu : sdd
Analyses : xxx

Dupond
Turlututusqjsk
Symptom: yyyy
Analyses xxxx
Turlututudhjsd
Analyses :xx

ChiruSoft

ComptaSoft

Dupont

Caractristique
s
Plusieurs applications

plusieurs formats
plusieurs langages

Redondance de donnes
Pas de facilit dinterrogation

Question dveloppement

Redondance de code

ConsultSoft

Duhpon

Duipont
Turlututu : sq

Symptomes : yy
Analyses : xxxx

Symptomyyyy
Analysesxxxx

Symptomes : yy

Turlututudhjsd

PsychiaSoft

Problmes
Difficults de gestion
Incohrence des donnes
Cots levs
Maintenance difficile
Gestion de pannes ???
9

Partage de donnes
Symptomes : y
Turlututu : sqj
Symptomes : y
Turlututu : sdd
Analyses : xxx

Dupond
Turlututusqjsk
Symptom: yyyy
Analyses xxxx
Turlututudhjsd
Analyses :xx

ChiruSoft

ComptaSoft

Dupont

Caractristique
s
Plusieurs applications

plusieurs formats
plusieurs langages

Redondance de donnes
Pas de facilit dinterrogation

Question dveloppement

Redondance de code

ConsultSoft

Duhpon

Duipont
Turlututu : sq

Symptomes : yy
Analyses : xxxx

Symptomyyyy
Analysesxxxx

Symptomes : yy

Turlututudhjsd

PsychiaSoft

Problmes
Difficults de gestion
Incohrence des donnes
Cots levs
Maintenance difficile
Gestion de pannes ???
Partage des donnes ???
10

Confidentialit
Symptomes : y
Turlututu : sqj
Symptomes : y
Turlututu : sdd
Analyses : xxx

Dupond
Turlututusqjsk
Symptom: yyyy
Analyses xxxx
Turlututudhjsd
Analyses :xx

ChiruSoft

ComptaSoft

Dupont

Caractristique
s
Plusieurs applications

plusieurs formats
plusieurs langages

Redondance de donnes
Pas de facilit dinterrogation

Question dveloppement

Redondance de code

ConsultSoft

Duhpon

Duipont
Turlututu : sq

Symptomes : yy
Analyses : xxxx

Symptomyyyy
Analysesxxxx

Symptomes : yy

Turlututudhjsd

PsychiaSoft

Problmes
Difficults de gestion
Incohrence des donnes
Cots levs
Maintenance difficile
Gestion de pannes ???
Partage des donnes ???
Confidentialit ???

11

Lapproche Bases de donnes


Modlisation
des donnes

Logiciel
Systme de
Gestion de
Bases de
Donnes

Eliminer la redondance de donnes


Centraliser et organiser correctement les donnes
Plusieurs niveaux de modlisation
Outils de conception

Factorisation des modules de contrle des


applications
- Interrogation, cohrence, partage, gestion de
pannes, etc
Administration facilites des donnes
12

Modlisation du rel
Rel
Modle
conceptuel
Modle
logique
Modle
Physique

Indpendant du
modle de donnes
Indpendant du
SGBD
Dpendant du
modle de donnes
Indpendant du
SGBD

Mdecin

Codasyl

effectue

Relationnel

Visite

Objet

XML

Organisation physique des donnes

Dpendant du
modle de donnes

Structures de stockage des donnes

Dpendant du SGBD

Structures acclratrices (index)


13

Modlisation Relationnelle (1)


Champs, attributs,
colonnes

Relation ou table

Id-D

Nom

Prnom

Dupont

Pierre

Durand

Paul

Masse

Jean

..

Tuples, lignes ou nuplets


14

Modlisation Relationnelle (2)


Docteurs

Prescriptions

Id-D

Nom

Prnom

Dupont

Pierre

Durand

Paul

Masse

Jean

..

Id-V

Ligne

Id-M

Posologie

12

1 par jour

Visites
Id-D

Id-P

Id-V

Date

Prix

10 gouttes

15 juin

250

2 par jour

12 aot

180

12

1 par jour

13 juillet

350

2 gouttes

1 mars

250

Patients
Mdicaments

Id-P

Nom

Prnom

Ville

Lebeau

Jacques

Paris

Id-M

Nom

Description

Troger

Zoe

Evry

Aspegic 1000

..

Doe

John

Paris

Fluisdal

..

Perry

Paule

Valenton

Mucomyst

..

..

..
15

2. Objectifs des SGBD


I- Indpendance
Physique
X - Standards

II- Indpendance
Logique

IX - Gestion de la
confidentialit
VIII - Concurrence
daccs

III Langage de
manipulation

BD

IV - Gestion des
vues
V - Optimisation des
questions

VII - Gestion des


pannes
VI - Gestion de la
cohrence

16

I - Indpendance Physique
Indpendance des programmes
d'applications vis vis du
modle physique :
Possibilit de modifier les
structures de stockage (fichiers,
index, chemins d'accs, ) sans
modifier les programmes;
Ecriture des applications par des
non-spcialistes des fichiers et
des structures de stockage;
Meilleure portabilit des
applications et indpendance vis
vis du matriel.

17

II - Indpendance Logique
Les applications peuvent dfinir des vues logiques de la BD
Gestion des mdicaments

Cabinet du Dr. Masse

Nombre_Mdicaments
Id-M

Nom

Description

Prescription

Aspegic 1000

..

30

Fluisdal

..

20

Mucomyst

..

230

..

..

Visites

Nombre

Id - D

Id - P

Id - V

Date

Prix

15 juin

250

1 mars

250

Id - V

Ligne

Id - M

12

Posologie
1 par jour

10 gouttes

Patients
Mdicament

Id - P

Nom

Prnom

Lebeau

Jacques

Id - M

Troger

Zoe

..

Description

Aspegic 1000

..

Fluisdal

..

Mucomyst

Docteur

Nom

..

..
..

Prescription

Id-D

Nom

Prnom

Dupont

Pierre

Durand

Paul

Masse

Jean

..

Id-V

Ligne

Id-M

12

1 par jour

10 gouttes

12

350

2 gouttes

250

Visites
Id-D

Id-P

Id-V

Date

Prix

15 juin

250

12 aot

180

13 juillet

1 mars

Posologie

2 par jour
1 par jour

Patients
Id-P

Nom

Prnom

Lebeau

Jacques

Troger

Zoe

Mdicament
Id-M

Nom

Description

Aspegic 1000

..

Fluisdal

..

Mucomyst

..

Perry

Paule

..

..

Doe

John

18

Avantages de lindpendance logique


Possibilit pour chaque application
d'ignorer les besoins des autres
(bien que partageant la mme BD).
Possibilit d'volution de la base
de donnes sans rcriture des
applications :

ajout de champs, ajout de


relation, renommage de
champs.

Possibilit d'intgrer des


applications existantes sans
modifier les autres.
Possibilit de limiter les
consquences du partage :
Donnes confidentielles.

19

III - Manipulation aise

La manipulation se fait via un langage dclaratif


La question dclare lobjectif sans dcrire la mthode
Le langage suit une norme commune tous les SGBD
SQL : Structured Query Langage

Smantique

Logique du 1er ordre ++

Syntaxe (aperu !)

SELECT <structure des rsultats>


FROM <relations>
WHERE <conditions>
20

IV Des vues multiples des donnes

Les vues permettent dimplmenter


lindpendance logique en permettant de crer
des relations virtuelles
Vue = Question stocke
Le SGBD stocke la dfinition et non le rsultat
Exemple :

la vue des patients parisiens


la vue des docteurs avec leurs patients
La vue des services statistiques
...
21

V Excution et Optimisation
Traduction automatique
des questions dclaratives
en programmes
procduraux :
Utilisation de lalgbre
relationnelle

Optimisation
automatique des
questions
Utilisation de laspect
dclaratif de SQL
Gestion centralise des
chemins d'accs (index,
hachages, )
Techniques doptimisation
pousses

Economie de l'astuce des


programmeurs
milliers d'heures d'criture
et de maintenance de
logiciels.

22

VI - Intgrit Logique

Objectif : Dtecter les mises jour errones


Contrle sur les donnes lmentaires
Contrle de types: ex: Nom alphabtique
Contrle de valeurs: ex: Salaire mensuel entre 5 et 50kf

Contrle sur les relations entre les donnes


Relations entre donnes lmentaires:
Prix de vente > Prix d'achat

Relations entre objets:


Un lecteur doit tre inscrit sur une seule liste lectorale
23

Contraintes dintgrit
Avantages :
simplification du code des applications
scurit renforce par l'automatisation
mise en commun des contraintes

Ncessite :
un langage de dfinition de contraintes d'intgrit
la vrification automatique de ces contraintes
24

VII - Intgrit Physique


Motivations :
Tolrance aux
fautes

Transaction Failure : Contraintes d'intgrit, Annulation


System Failure : Panne de courant, Crash serveur ...
Media Failure : Perte du disque
Communication Failure : Dfaillance du rseau

Assurer l'atomicit des transactions


Garantir la durabilit des effets des transactions commises
Objectifs :

Journalisation : Mmorisation des tats successifs des donnes


Mcanismes de reprise
Moyens :

25

Transaction
Incohrence possible...
Etat cohrent

Etat cohrent

Begin

Commit
Transaction

Begin
CEpargne = CEpargne - 3000
CCourant = CCourant + 3000
Commit T1
26

Atomicit et Durabilit
DURABILITE

ATOMICITE
Panne

Begin
CEpargne = CEpargne - 3000
CCourant = CCourant + 3000
Commit T1

Begin
CEpargne = CEpargne - 3000
CCourant = CCourant + 3000
Commit T1
Crash disque

Annuler le dbit !!

Sassurer que le
virement a t fait !
27

VIII - Partage des donnes


BD

Accs concurrent aux mmes donnes


Conflits daccs !!
28

Isolation et Cohrence
BD

Le SGBD gre les accs concurrents


Chacun limpression dtre seul (Isolation)
Cohrence conserve (Pas de maj conflictuelles)
29

IX Confidentialit

Objectif : Protger les donnes de la BD


contre des accs non autoriss

Deux niveaux :
Connexion restreinte aux usagers rpertoris
(mot de passe)
Privilges d'accs aux objets de la base

Usagers : Usager ou groupe dusagers

Objets : Relation, Vue, autres objets


(procdures, etc.)

30

X - Standardisation

Lapproche bases de donnes est base sur


plusieurs standards
Langage SQL (SQL1, SQL2, SQL3)
Communication SQL CLI (ODBC / JDBC)
Transactions (X/Open DTP, OSI-TP)

Force des standards


Portabilit
Interoprabilt
Applications multisources
31

3. Architecture des SGBD


Les architectures physiques de SGBD sont trs lies au mode de
rpartition.
BD centralise
BD client/serveur
BD client/multi-serveurs
BD rpartie
BD htrogne
BD mobile
Le challenge se dplace des Pta-bases aux Pico-bases.
Pta-bases => paralllisme et grandes mmoires
Pico-bases => faible empreinte et forte scurit

Architecture centralise
Terminaux passifs

rseau

Appli 1

Appli 2

Appli n

Mainframe

SGBD
donnes

33

Architecture client-serveur
Clients intelligents
Appli 1
Appli 2
Appli n

rseau

serveur

SGBD
code

donnes

Architecture Client-Multiserveurs

Appli 1

SQL

ODBC

SQL

ODBC
SQL

SQL

SGBD 1
code

donnes

SGBD 2
code

donnes
35

Architecture rpartie

Appli 1
Appli 2
Appli n

SGBD 1
code

donnes

SGBD 2
code

donnes

Architecture mobile
Clients intelligents
mobiles

Donnes rpliques
et/ou personnelles

Rseau sans fil

serveur

SGBD
code

donnes

4. Applications traditionnelles
des SGBD
OLTP (On Line Transaction Processing)

Cible des SGBD depuis leur existence


Banques, rservation en ligne ...
Trs grand nombre de transactions en parallle
Transactions simples

OLAP (On Line Analytical Processing)


Entrepts de donnes, DataCube, Data Mining
Faible nombre de transactions
Transactions trs complexes

38

Evolution des BD
BD
dentreprise

BD
personnelles

BD light
(PDA / Tl.)

PicoDBMS
carte puce

Capacit

Prix

Nombre

39

Vous aimerez peut-être aussi