Académique Documents
Professionnel Documents
Culture Documents
Administration des
Bases de Données
Conservatoire National des Arts et
Métiers
Aix-en-Provence
Olivier Michelet
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 3
CNAM Aix en Provence -
Conception et Administration des Bases de Données
– Définitions
Un système de fichier sert à conserver et à mettre à disposition des informations
indépendamment des unités de traitement.
C’est la mémoire de masse ou mémoire secondaire.
Un fichier est utilisable par la mémoire centrale sans y être nécessairement rattaché
« géographiquement » ou localement.
Le gestionnaire de fichiers est la couche interne d'un SGBD, il fait également partie
intégrante du système d’exploitation.
En ce sens, le SGBD s'intègre entièrement avec les fonctions intrinsèques de ce
dernier quant à la gestion physique des données.
Olivier Michelet 4
CNAM Aix en Provence -
Conception et Administration des Bases de Données
– Volume (Disk)
– Fichier (File)
Olivier Michelet 5
CNAM Aix en Provence -
Conception et Administration des Bases de Données
– Article (Record)
● Elément composant d'un fichier correspondant à l'unité de traitement par les
programmes d'application. C’est un ensemble de données.
Olivier Michelet 6
CNAM Aix en Provence -
Conception et Administration des Bases de Données
- Fichier permanent
Sert à conserver des données dans le temps. Soit pour une utilisation courante, soit
pour archivage ou constitution d’historique, par exemple. (Nota : pour archiver, il
vaut mieux utiliser des support moins onéreux – lecteurs de bandes ou cd/dvd,
par exemple)
- Fichier (temporaire) de travail
Sert à manipuler des données qui ne peuvent être conservées en mémoire centrale
le temps d’un traitement. Sa durée de vie est éphémère, le temps du traitement.
- Fichier de liaison
Sert à transférer des données d’un programme à un autre lors d’une chaîne de
traitement.
- Fichier de mouvement
Sert à la mise à jour d’un fichier permanent.
Olivier Michelet 7
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Article
Olivier Michelet 8
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Lecture
Lecture
Olivier Michelet 9
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Relative
Les articles sont « alignés » les uns à la suite des autres, comme dans un fichier
séquentiel mais ils sont accédés selon leur « numéro d’ordre » dans le fichier.
Avantages : simple à gérer et à mettre en place, rapide (1 accès par lecture et par
écriture).
Olivier Michelet 10
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Aléatoire
L’emplacement des articles dans le fichier est géré par le système d’exploitation en
fonction de certains critères permettant d’accélérer et d’optimiser les temps d’accès
aux données. Cette organisation nécessite la création et la gestion par le système
d’une table des « emplacements » pour retrouver les données.
Olivier Michelet 11
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Indexée
Les données sont organisées par le système de gestion de fichiers du système
d’exploitation dans le but d’optimiser et d’accélérer l’accès aux données.
Cette organisation distingue physiquement les données de la gestion de leur
emplacement. L’organisation physique des enregistrements est indépendante de celle
de leur clé d’accès. Cela autorise une très grande souplesse de manipulation des
enregistrements (Ajout, suppression).
Avantages : données triées, très bonnes performances, opérations simples sur les
articles (insertion, suppression, modification).
Inconvénients : lecture des index coûteuse (en temps), nécessité de régénérer les
index en fonction de l’activité sur les données, réorganisations indispensables des
fichiers, performances dégradées en fonction du nombre de débordements.
Olivier Michelet 12
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 13
CNAM Aix en Provence -
Conception et Administration des Bases de Données
METHODES
D'ACCES
ANALYSEUR
MODULES
D'E/S
Olivier Michelet 14
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Les systèmes cherchent en première approche à insérer les fichiers (les paquets) dans
leur totalité. Lorsque la place disponible ne l’autorise plus, la solution consiste à gérer
des débordements.
Il existe plusieurs techniques, notamment :
– l'adressage ouvert
qui place l'article à insérer dans le premier paquet suivant ayant suffisamment de
place libre; il faut alors mémoriser tous les paquets dans lequel un paquet plein a
débordé.
– le chaînage
qui constitue un paquet logique par chaînage d'un paquet de débordement à un
paquet plein.
– le rehachage
qui applique une deuxième fonction de hachage lorsqu'un paquet est plein pour placer
en débordement.
Olivier Michelet 15
CNAM Aix en Provence -
Conception et Administration des Bases de Données
On utilise fréquemment les fonctions de hachage dans des structures de données : les
tables de hachage.
Le principe est d'utiliser les empreintes des clés comme index des cases de la table.
Ces empreintes sont des nombres entiers obtenus en hachant la clé des objets à stocker,
souvent une chaîne de caractères.
Une fonction, dite de hachage, donne pour chaque valeur de clé C l’adresse f(C) d’un
espace de stockage où l’élément doit être placé.
On peut retrouver un objet à partir de sa clé: il suffit de lire dans le tableau la case dont
l'index est l'empreinte de cette clé.
Les avantages apportés par ce type d'indexation sont sa simplicité, une relative bonne
performance sur des accès par clé, très peu d'impact en termes d'espace disque.
En revanche, les recherches par intervalle sont onéreuses et peu performantes, peu
adapté aux mises à jour, risque de chaînage important,
Olivier Michelet 16
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Index optionnel
Olivier Michelet 17
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Clé Fonction de
hachage
0 1 2
…………
i
………
n
} Paquets
Olivier Michelet 18
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 19
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Problème :
Nécessité de réorganisation
● Un fichier ayant débordé ne garantit plus de bons temps d'accès (2 et plus
accès disque en écriture, 1 en lecture)
● Le nombre de paquets primaires est fixe, ce qui peut entraîner un mauvais taux
de remplissage
Solution idéale :
Réorganisation progressive
● Un fichier ayant débordé devrait rester analogue à un fichier n'ayant pas
débordé.
● Il serait souhaitable de changer la fonction d'adressage.
Olivier Michelet 20
CNAM Aix en Provence -
Conception et Administration des Bases de Données
– Moyens :
Utilisation de tables permettant la recherche de l'adresse de l'article à partir de sa clé.
– Les Index
Table « annexe » permettant d'associer à une clé d'article l'adresse relative de ce
dernier.
Olivier Michelet 21
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 22
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 23
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Niveau 3
21 30
Niveau 2
12 21 30
Niveau 1
2 5 12 14 18 21 23 25 30
Olivier Michelet 24
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 25
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 26
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 27
CNAM Aix en Provence -
Conception et Administration des Bases de Données
– Un arbre-B d'ordre m est un arbre au sens de la théorie des graphes tel que:
● Toutes les feuilles sont au même niveau
● Tout nœud non feuille a un nombre NF de fils tel que
m+1 <= NF < 2m+1
sauf la racine qui a un nombre NFR de fils tel que 0 <= NFR < 2m+1.
Olivier Michelet 28
CNAM Aix en Provence -
Conception et Administration des Bases de Données
– Le nombre de niveaux d'un arbre-B est déterminé par son degré et le nbre de clés.
Si l'arbre est rempli au minimum, il existe:
une clé à la racine,
deux branches qui partent avec m clés,
(m+1) branches qui partent avec m clés.
Pour un arbre de niveaux h, le nombre de clés est donc:
N = 1 + 2 m (1+ (m+1) + (m+1)2 + … + (m+1)h-2)
soit, par réduction du développement limité:
N = 1 + 2 ((m+1)h-1-1)
D'où l'on déduit que pour stocker N clés, il faut:
h = 1 + logm+1 ((N+1)/2) niveaux.
Olivier Michelet 29
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 30
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 31
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 32
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 33
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 34
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 35
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 36
CNAM Aix en Provence -
Conception et Administration des Bases de Données
– Les disques
Olivier Michelet 37
CNAM Aix en Provence -
Conception et Administration des Bases de Données
Olivier Michelet 38