Vous êtes sur la page 1sur 53

Bases de données 2

ISE / 2e Année
ENSAE
2021-2022

B. D. DIACK: bayedemba@gmail.com 1
Chapitre 1
Introduction
aux bases de données

B. D. Diack /Admin
BD
Qu’est-ce qu’une donnée ?

Qu’est-ce qu’une information?


B. D. Diack /Admin
BD
3
Différence entre donnée et
information
Donnée Information

une information quelconque Concept ayant plusieurs sens, Connaissance

Mesurable , repérable L'information est immatérielle

Stocké Renseignement sur quelque chose


relation entre des informations Action d'informer ou de s'informer
Ex: fichier Excel Ex: Jean enseigne les bases de données

B. D. Diack /Admin 4
BD
L'approche de systèmes de fichiers

Problèmes:
Difficultés de gestion, Lourdeur d’accès, Incohérence des données, Coûts élevés
Maintenance difficile, Gestion de pannes ???,
Partage des données(concurrence accès) ???, Confidentialité ???,Pas de sécurité
B. D. Diack /Admin
BD
Pourquoi ne pas utiliser un simple
système de gestion de fichiers ?
➢ Les données dans les programmes qui les utilisent
– duplication des données
– pb de maintenance, de cohérence des données,
– accroissement de la masse des données
➢ Les données dans un fichier
– performance (temps d’accès aux données)
– coût d’exploitation des données : multiplications des
programmes
– ad-hoc pour l’accès aux données (requêtes), la gestion de la
– cohérence,
– concurrence,
– confidentialité,
– etc.
B. D. Diack /Admin 6
BD
Définitions
• Une base de données (son abréviation est BD,
en anglais DB, database) est une entité dans
laquelle il est possible de stocker des données
de façon structurée et avec le moins de
redondance possible.
• Une base de données est un gros ensemble
d’informations structurées mémorisées sur un
support permanent.

B. D. Diack /Admin 7
BD
L'approche base de données
Eliminer la redondance de données

Centraliser et organiser Partage de données


correctement les données Indépendance données et
traitements

Intégrité des données


(règles permettant d’éliminer les données non plausibles)

B. D. Diack /Admin
BD
SGBD?
Un Système de Gestion de Bases de Données
(SGBD) est un logiciel de haut niveau qui
permet de manipuler les informations
stockées dans une base de données :
• construction
• maintenance
• interrogation
• sécurité
B. D. Diack /Admin 9
BD
Propriétés fondamentales d’un SGBD
• Indépendance des données : données physiques /
conceptuelles /applications
• Accès efficace aux données (Langage de
manipulation de Données)
• Partage des données (Accès concurrents +
sécurité des données)
• Intégrité et sécurité des données
• Administration centralisée des données
• Récupération sur «crash»

B. D. Diack /Admin 10
BD
Système de Gestion de Base de Données

Un SGBD peut être défini comme un ensemble de


logiciels systèmes permettant de stocker et
d’interroger un ensemble de fichiers
interdépendants.
BASE
DE
SGBD DONNEES

DEFINITION DE MANIPULATION SECURITE


DONNEES DE DONNEES CONFIDENTIALITE
COHERENCE

INTERFACE GRAPHIQUE
PROGRAMME UTILISATEURS
UTILISATION DEVELOPPEMENT

B. D. Diack /Admin
BD
Applications des SGBDs
• En gestion
– Banque - Finance - Assurance
– Gestion du personnel / clients / stocks d’une
entreprise
– Système d’information d’une entreprise : ensemble
organisé de ressources (données, procédures,
matériels, logiciels, . . .) permettant d’acquérir, de
stocker, de structurer et de communiquer des
informations sous forme de textes, images, sons, ou
de données codées dans des organisations
[Wikipedia].

B. D. Diack /Admin BD 12
Applications des SGBDs
• Applications transactionnelles
– Gestion de réservations (transports, hotels,
spectacles, . . .)
– Consultations et modifications très fréquentes
• En Statistique
– Collectes de données en ligne
– Sondages en lignes
– Résultats en temps réel

B. D. Diack /Admin BD 13
Applications des SGBDs
• En géographie
– SIG
– Géolocalisation
– Tracking
• En médecine
les banques de données qui servent à collecter et
permettre la publication d'un ensemble d'informations
librement consultables et relatives à un domaine de

B. D. Diack /Admin BD 14
Types d'utilisations
• Votre entreprise vend plusieurs produits ? Elle
souhaite mettre son catalogue à disposition
de ses clients ?
• La mise en place d’une base de données
accessible sur internet ou en extranet
permettra à vos clients d’accéder rapidement
à l’information voulue à l’aide d’une recherche
multicritères (prix, référence, stocks…).

B. D. Diack /Admin BD 15
Types d'utilisations
• Vous êtes une association et vous souhaitez avoir
des informations toujours à jour sur vos membres
?
Une base de données pourrait vous permettre de
trouver rapidement ces informations : entrez le
nom, vous obtenez toutes les informations
concernant la personne.
• Mais une base de données pourrait également
permettre aux membres d’actualiser eux-mêmes
les informations les concernant, générant ainsi un
gain de temps pour votre association.

B. D. Diack /Admin BD 16
Types d'utilisations
• Vous êtes une association et vous souhaitez
avoir des informations toujours à jour sur vos
membres ?
Une base de données pourrait vous permettre
de trouver rapidement ces informations :
entrez le nom, vous obtenez toutes les
informations concernant la personne.

B. D. Diack /Admin 17
BD
• Si la mise en ligne de catalogue et le stockage
d'informations (sur vos membres, vos clients..)
sont les besoins les plus fréquents nécessitant
l'utilisation d'une base de données, d'autres
besoins complètement différents peuvent se
trouver satisfaits de la même façon.
• En effet, les possibilités offertes par les bases
de données sont très nombreuses et peuvent
répondre à des attentes très précises...
• Peut-être aux vôtres ? N'hésitez pas à
demander conseil, poser des questions.
18
Types d'utilisations
• Un moteur de recherche est un logiciel qui
permet de retrouver des ressources (fichiers,
documents, pages web) associées à des mots
quelconques. La liste des mots et des
ressources associées sont stockés dans une
base de données.

B. D. Diack /Admin 19
BD
Types d'utilisations
• Un entrepôt de données est une base de
données qui est utilisée pour collecter et
stocker définitivement des informations
historiques qui seront utilisées pour des
statistiques et des analyses. Les informations
sont souvent collectées à intervalle régulier
depuis un système d'informations.

20
SGBD
3 niveaux de description
1. Niveau interne (gestion des accès) : schéma
physique
2. Niveau conceptuel (intégrité-cohérence) :
schéma logique, issu d’un processus de
modélisation
3. Niveau externe (confidentialité), n schémas
externes associés à n types d’utilisateurs
B. D. Diack /Admin 21
BD
Niveaux d’abstraction

SCHEMA SCHEMA SCHEMA -Vues utilisateurs


EXTERNE 1 EXTERNE 2 …...... EXTERNE n

-Représentation du monde réel


-Non redondant.
REEL SCHEMA -validé par les traitements
CONCEPTUEL -L4G,VUE

I -Contraintes du système de gestion


de bases de données utilisé
N SCHEMA -Chemins d’accès
LOGIQUE -Performances des traitements
T -Redondances autorisées
E -LDD,LMD,LR

R -Répartition physique des données :


choix des unités physiques de stockage,
N SCHEMA taille des blocs, des fichiers, ...
PHYSIQUE -Choix des paramètres physiques de
E stockage.
B. D. Diack /Admin
BD
Exemples de SGBD
Principaux systèmes Sur micro :
• Oracle • Access
• DB2 (IBM) • Paradox
• FoxPro
• Ingres • 4D
• Informix • Windev
• Sybase Sharewares :
• SQL Server (Microsoft) • MySQL
• O2 • MSQL
• Postgres
• Gemstone • InstantDB

B. D. Diack /Admin 23
BD
Différents modèles de Bases de
Données
• Le modèle hiérarchique (années 60) : Premier
modèle de SGBD, les données sont classées
hiérarchiquement.
• Ce modèle utilise des pointeurs entre les
différents enregistrements, organisés dans
une structure arborescente de façon à ce que
chaque enregistrement n’ait qu’un seul
possesseur.

B. D. Diack /Admin 24
BD
B. D. Diack /Admin 25
BD
Différents modèles de Bases de
Données
• Le modèle réseau (années 70) : lève de
nombreuses limites du modèle hiérarchique
grâce à la possibilité d’établir des liaisons de
type n-n, les liens entre objets pouvant exister
sans restriction.
• Pour retrouver une donnée dans ce modéle, il
faut connaître le chemin d’accès (les liens), ce
qui rend les programmes dépendants de la
structure de données.

B. D. Diack /Admin 26
BD
Exemple modèle réseau

B. D. Diack /Admin 27
BD
Différents modèles de Bases de
Données
• Le modèle Relationnel (Codd, fin des années
60). Les données sont représentées dans des
tables, sous forme de n-uplets.
• NB:Modèle le plus utilisé :
• A donné lieu au langage SQL, extension de
l’algèbre relationnelle, standardisation en
1987.
• Près de 80% des utilisations en entreprise.

28
Exemple

B. D. Diack /Admin 29
BD
Différents modèles de Bases de
Données
• Le modèle Orienté Objet (géré par des
OODBMS), les données sont des objets. Encore
en phase de recherche, BD avancées en MI1.
• Le modèle Multidimensionnel: Les données sont
représentées sous la forme d’un cube. Très utilisé
en analyse de données, M2.
• Le modèle Semi-structuré (fichiers XML). Les
données sont représentées sous la forme d’arbre,
M2.
B. D. Diack /Admin 30
BD
Modèle Object

B. D. Diack /Admin 31
BD
Le modèle Multidimensionnel

B. D. Diack /Admin 32
BD
Le modèle Semi-structuré (fichiers
XML)

B. D. Diack /Admin 33
BD
De nos Jours
• BD NoSQL
• Big Data
• BI
• BD distribuées
• …

B. D. Diack /Admin 34
BD
Objectifs et avantages des SGBD

Que doit permettre un SGBD ?

B. D. Diack /Admin
BD
Décrire les données
indépendamment des applications (de
Manière intrinsèque)
⇒ langage de définition des données
DATA DEFINITION LANGUAGE (DDL)

36
Manipuler les données
• interroger et mettre à jour les données sans
préciser d'algorithme d'accès dire QUOI sans
dire COMMENT
• langage de requêtes déclaratif ex.:
• quels sont les noms des produits de prix <
100F ?
• ⇒ langage de manipulation des données
• DATA MANIPULATION LANGUAGE (DML)
37
Contrôler les données
• intégrité
• vérification de contraintes d'intégrité
• ex.: le salaire doit être compris entre 400F et
20000F
• confidentialité
• contrôle des droits d'accès, autorisation ?
langage de contrôle des données
• DATA CONTROL LANGUAGE (DCL)
38
Partage
• une BD est partagée entre plusieurs
utilisateurs en même temps
• contrôle des accès concurrents
• notion de transaction
• L'exécution d'une transaction doit préserver la
cohérence de la BD

39
• Sécurité
–reprise après panne, journalisation
•‰
Performances d'accès
–index (hashage, arbres balancés ...)

40
Indépendance physique
• Pouvoir modifier les structures de
stockage ou les index sans que cela ait de
répercussion au niveau des applications
• Les disques, les méthodes d’accès, les
modes de placement, le codage des
données ne sont pas apparents

41
Indépendance logique
• Permettre aux différentes applications
d’avoir des vues différentes des mêmes
données
• Permettre au DBA de modifier le schéma
logique sans que cela ait de répercussion
au niveau des applications

42
Synthèse
• Les objectifs que l’on assigne généralement aux
bases de données et aux systèmes qui les
supportent sont les suivants :
• la centralisation,
• L’accès concurrent,
• l’indépendance entre les données et les
traitements,
• la structuration de données complexes,
• le partage des données,
• l’intégrité et la cohérence,
• la confidentialité,
• la sécurité.
43
L’architecture ANSI/SPARC
• proposition en 75 de l’ ANSI/SPARC (Standard
Planning And Requirement Comitte)
• 3 niveaux de représentation des données
• Vue

44
45
L’architecture ANSI/SPARC
• La première innovation de l’architecture Ansi-
Sparc est la distinction claire entre la
représentation interne des données au niveau
physique (structure de données) et la
représentation logique de celles-ci. Une base
de données est définie et manipulée via le
niveau conceptuel (SC) sans avoir à se soucier
des détails de l’implémentation physique (SI).

46
L’architecture ANSI/SPARC
• Par exemple, il est possible de définir un
index sur un ensemble de données, mais
comment celui-ci est réalisé au niveau
physique n’a pas besoin d’être spécifié.
Sur le même principe, lors d’une requête,
l’usager n’a pas besoin d’indiquer
comment utiliser l’index pour maximiser
l’efficacité de la recherche.
47
L’architecture ANSI/SPARC
• La deuxième grande innovation de ce modèle
est la possibilité de créer des schémas
externes qui sont en fait des portions de la
base de données (sous-bases virtuelles)
destinées à différents usagers. Un usager
particulier ne peut manipuler que les données
appartenant à son propre schéma externe. De
nos jours, le terme schéma externe est
remplacé par celui de « vue ».
48
Le niveau externe
• Le concept de vue permet d'obtenir
l'indépendance logique La modification du
schéma logique n’entraîne pas la modification des
applications (une modification des vues est
cependant nécessaire)
• Chaque vue correspond à la perception d’une
partie des données, mais aussi des données qui
peuvent être synthétisées à partir des
informations représentées dans la BD (par ex.
statistiques)

49
Le niveau conceptuel
• il contient la description des données
et des contraintes d’intégrité
(Dictionnaire de données)
• le schéma logique découle d’une
activité de modélisation

50
Le niveau interne
• il correspond aux structures de
stockage et aux moyens d’accès
(index)

51
En résume
Les fonctions des SGBD
• DEFINITION DES DONNEES
– Langage de définition des données (DDL)
– (conforme à un modèle de données)
• MANIPULATION DES DONNEES
– Interrogation
– Mise à jour
– insertion, suppression, modification
– Langage de manipulation des données (DML)
– (langage de requête déclaratif)

52
En résume
Les fonctions des SGBD
CONTRÔLE DES DONNEES
– Contraintes d'intégrité
– Contrôle des droits d'accès
– Gestion de transactions
– Langage de contrôle des données (DCL)

53

Vous aimerez peut-être aussi