Vous êtes sur la page 1sur 9

S.

Laporte LMS

Les systmes de gestion de fichier (SGF)

I. Int ro duc tio n

Les systmes de fichier ont pour rle d'organiser, en l'optimisant, l'implantation des donnes sur le(s)
disque(s) et autres mmoires externes.

La faon dont sont organises ces donnes est relativement importante connatre car le
disque est souvent source d'erreurs et, de plus, il s'agit de l'un des "goulets d'tranglement" du
systme en terme de performances.

Comparaison :
(temps d'accs en ms - 10-3 - alors qu'en mmoire le temps d'accs se mesure en ns - 10-9).

Le fait de connatre ces techniques permet donc :


- de mieux comprendre l'organisation des donnes sur le disque
- de retrouver et ventuellement, de corriger plus facilement une zone corrompue, ( et donc de
rcuprer de prcieux fichiers endommags ou effacs),
- de reprer certains virus,
- d'optimiser les performances du systme par des oprations d'administration ou d'exploitation
telles que la dfragmentation des disques ou la compression de fichiers...

Les systmes de fichiers gnralement rencontrs dans le monde de la gestion sont :

FAT (File Allocation Table) et ses diffrentes versions trs rpandu dans le monde micro Windows
NTFS (Windows NT File System) utilis uniquement sur Windows NT, W2000, XP
UNIX et ses nombreuses variantes utilis plutt sur les gros systmes (serveurs )...
EXT2FS sous Linux
HFS sous MacOS

II. Notio ns pr liminaire s


A. Cluster ou bloc ou unit dallocation

Un cluster (ou unit dallocation ou bloc) est la plus petite unit de disque que le systme
dexploitation est capable de grer.

Un fichier occupe un nombre entier de cluster.

Un petit fichier, aussi petit soit- il, occupe tout un cluster. Un fichier peut occuper plusieurs
clusters, mais le dernier cluster ne sera pas rempli.

Consquence :
il y a un gaspillage de lespace disque, dautant plus grand que la taille des clusters est
grande.

1
S. Laporte LMS

Plus la taille dun cluster est importante, moins le systme dexploitation aura dentits grer
et plus il sera rapide
En contrepartie, tant donn quun systme dexploitation ne sait grer que des units
dallocation entire, cest--dire quun fichier occupe un nombre entier de cluster, le
gaspillage despace disque est dautant plus grand que le secteur est grand.

il faut choisir une taille de cluster optimale pour ne pas trop ralentir lOS et ne pas trop
gaspiller despace disque.

On comprend alors toute limportance du choix du systme de gestion de fichiers.

B. Le Formatage
1. Rappel : Le formatage physique ou de bas niveau
Le but du formatage de bas niveau est de diviser la surface des disques en lments basiques:
pistes
secteurs
cylindres
Un disque dur est constitu de plusieurs plateaux circulaires tournant autour d'un axe et recouverts de part et
d'autre par un oxyde magntique, qui, en tant polaris, va pouvoir stocker des donnes.
Les pistes sont des zones concentriques crites de part et d'autre d'un plateau.
Enfin ces pistes sont dcoupes en quartiers appels secteurs.
Les pistes se comptent par milliers et comptent chacune de 60 120 secteurs environ.
On appelle cylindre l'ensemble des donnes situes sur une mme pistes de plateaux diffrents (c'est--dire la
verticale les unes des autres) car cela forme dans l'espace un "cylindre" de donnes.
Le formatage physique consiste organiser la surface de chaque plateau en entits appeles pistes et secteurs

(512 octets), en polarisant grce aux ttes d'criture des zones du disques. Les pistes sont numrotes en partant
de 0, puis les ttes polarisent concentriquement la surface des plateaux. Lorsque l'on passe la piste suivante, la
tte laisse un "trou" (appel gap en anglais) et ainsi de suite. Chaque piste est elle-mme organise en secteurs
(numrots en commenant partir de 1) spars entre eux par des gaps.
Chacun de ces secteurs commence par une zone rserve aux informations du systme appele prfixe et se
termine par une zone appele suffixe. Il est ralis en usine.

Rsum :
Le formatage de bas niveau a pour but de prparer la surface du disque accueillir des
donnes. Il ne dpend donc pas du systme d'exploitation et permet grce des tests effectus
par le constructeur de marquer les secteurs dfectueux.

C. Formatage de haut niveau ou formatage logique

Formatage logique :
Le formatage logique dun disque permet de crer un systme de gestion de fichiers sur le
disque, qui va permettre un systme d'exploitation (DOS, Windows, UNIX, ...) d'utiliser
l'espace disque pour stocker et utiliser des fichiers.
Le formatage logique s'effectue aprs le formatage de bas niveau (et ventuellement le
partitionnement). Il cre un systme de gestion de fichiers sur le disque (plus exactement, la
partition), qui va permettre un systme d'exploitation (DOS, Windows 95, Linux, OS/2,
Windows NT, ...) d'utiliser l'espace disque pour stocker et utiliser des fichiers.
2
S. Laporte LMS

Pour installer des systmes d'exploitation de natures diverses il est ncessaire de crer des
partitions qui auront des SGF diffrents (voir paragraphe suivant).

Le formatage logique est ralis sous DOS par le biais de la commande FORMAT.
Il consiste placer des informations complmentaires, selon le systme de gestion de
fichiers employ, dans les secteurs pralablement dfinis lors du formatage de bas niveau.

Les informations enregistres lors d'un formatage logique sont :


criture du secteur d'amorage des partitions,
enregistrement de l'octet d'Identification systme (ID System) dans la table des
partitions du disque dur,
informations du systme de fichiers sur l'espace disponible, l'emplacement des
fichiers et des rpertoires...
reprage des zones endommages...

D. Le Partitionnement

Une fois format physiquement, le disque dur peut tre divis en plusieurs sections physiques
ou partitions.
Chaque partition fonctionne comme une unit individuelle et peut tre formate logiquement
avec tout systme de fichiers. Une fois que la partition de disque a t formate logiquement,
elle est considre comme un volume.

On appelle partitionnement le processus qui consiste crire les secteurs qui constitueront la
table de partition qui contient les informations sur la partition: taille de celle-ci en terme de
nombre de secteurs, position par rapport la partition principale, types de partitions prsentes,
systmes d'exploitation installs,...
Lorsque la partition est cre, on lui donne un nom de volume (ou de lecteur)
qui va permettre de l'identifier facilement.

Combien faut-il crer de partitions ? :


Il y a au minimum autant de partitions que de systmes d'exploitation utilisant des systmes
de gestion de fichiers diffrents.

Dans le cas d'un systme d'exploitation unique, il peut y avoir une seule partition recouvrant
tout le lecteur, sauf si l'utilisateur dsire en crer plusieurs pour faire par exemple plusieurs
lecteurs dont les donnes sont spares.

Il y a trois sortes de partitions:


les partitions principales,
la partition tendue et
les lecteurs logiques.

Un disque peut contenir jusqu' quatre partitions principales (dont une seule peut tre
active), ou trois partitions principales et une partition tendue .

Dans la partition tendue l'utilisateur peut crer des lecteurs logiques (c'est--dire faire en
sorte que l'on ait l'impression qu'il y a plusieurs disques durs de taille moindre).

3
S. Laporte LMS

La partition active :
Cest la partition sur laquelle un des systmes d'exploitation est dmarr au lancement de
l'ordinateur. Les partitions autres que celle sur laquelle vous dmarrez seront alors caches (au
moment du boot). Ainsi, les donnes d'une partition principale ne sont accessibles qu' partir
du systme d'exploitation install sur cette partition. Un fois lordinateur dmarr, les donnes
contenues sur les autres partitions dun SGF compatible avec lOS actif sont alors accessibles,
travers un nom de volume spcifique.

La partition tendue :
La partition tendue a t mise au point pour outrepasser la limite des quatre partitions
principales, en ayant la possibilit de crer autant de lecteurs logiques que vous dsirez dans
celle-ci. Au moins un lecteur logique est ncessaire dans une partition tendue, car vous ne
pouvez pas y stocker de donnes directement.

Remarque :
Beaucoup de machines sont formates en une grande partition utilisant l'intgralit de l'espace disponible du
lecteur. Ce n'est pourtant pas la solution la plus avantageuse en terme de performances et de capacit.

Crer plusieurs partitions possde plusieurs avantages :


installer plusieurs systmes d'exploitation sur votre disque
conomiser de l'espace disque
augmenter la scurit de vos fichiers
organiser les donnes plus facilement

Exemple de partitionnement de disques

Disque 0 C : (pp) (non dos)


2 Go FAT 16 Netware
400 Mo 1.6 Go

Disque 1 C : (pp) D: (pe) E: (pe) F: (pe)


3 Go FAT 16 FAT 32 NTFS Unix
50 Mo 1 Go 1 Go 1 Go

Le reprage de ces partitions est fait grce une table de partitions situe dans un
enregistrement particulier dit enregistrement d'amorage (dmarrage) principal

Quest-ce que le multi boot ?

Cest la possibilit de prsenter lutilisateur un menu permettant de choisir lOS charger.

Un fichier boot.ini contient ce menu.


Il est cr sur la partition principale active (en gnral sur la P.P. dos) et propose de charger
un des diffrents OS prsents sur le disque et pralablement installs dans des partitions
tendues.

4
S. Laporte LMS

III. Syst me de ge stio n de f ic hie rs e t s yst me d'e xplo itat ion

Le SGF est dpendant de lOS.

Systme d'exploitation Types de systme de fichiers supports

DOS FAT16
Windows 95 FAT16
Windows 95 OSR2 FAT16, FAT32
Windows 98 FAT16, FAT32
Windows NT4 FAT16, NTFS (version 4)
Windows 2000 et XP (NT5) FAT16, FAT32, NTFS (versions 4 et 5)
MacOS HFS
Linux EXT2FS

Dune manire gnrale, plus le systme dexploitation est rcent plus le nombre de systmes
de fichiers supports sera important.

Ainsi, sous DOS et sur les premires versions de Windows 95 la FAT16 est de rigueur.
A partir de Windows 95 OSR2 vous avez le choix entre les systmes de fichiers FAT16 et
FAT32.

Si la taille de la partition est suprieure 2Go, le systme de fichier FAT16 est exclu, vous devez donc utiliser le
systme FAT32 (ou modifier la taille de la partition).

En dessous de cette limite, la FAT16 est recommande pour des partitions dune capacit infrieure 500Mo,
dans lautre cas lutilisation de FAT32 est prfrable.

Dans le cas de Windows NT (jusqu la version 4) vous avez le choix entre le systme FAT16 et NTFS, par
contre celui-ci ne supporte pas la FAT32.
Dune manire gnrale le systme NTFS est conseill car il procure une scurit plus grande ainsi que des
performances accrues par rapport la FAT.

Microsoft recommande en fait dutiliser une petite partition (comprise entre 250 et 500Mo) de type FAT pour le
systme dexploitation, afin de pouvoir dmarrer partir dune disquette DOS bootable en cas de malheur, et de
conserver les donnes sur une seconde partition .

Sous Windows NT5 lventail sagrandit puisquil accepte des partitions de type FAT16, FAT32 et NTFS.
Une fois de plus, le systme de gestion de fichiers le plus rcents (NTFS 5) est conseill, puisquil offre de plus
nombreuses fonctionnalits que les systmes FAT.

IV. Le syst me de ge st ion de f ic hie rs FAT


Il comprend les lments suivants :
un enregistrement d'amorage principal avec la "Table des partitions" (MBR),
une zone rserve au secteur de chargement (Boot Loader),
un exemplaire de la FAT,
une copie optionnelle de la FAT,
le rpertoire principal ou rpertoire racine,
la zone des donnes et sous-rpertoires.

5
S. Laporte LMS

A. La Table des partitions

Cest le secteur de dmarrage (MBR ) (cylindre 0, tte 0 et secteur 1), il contient la table de
partitions et le code qui, une fois charg en mmoire, va permettre d'amorcer le systme
(booter).
Ce programme, une fois en mmoire, va dterminer sur quelle partition le systme va
s'amorcer, et il va dmarrer le programme (appel bootstrap) qui va amorcer le systme
d'exploitation prsent sur cette partition.

Importance de ce secteur
D'autre part, c'est ce secteur du disque qui contient toutes les informations relatives au disque
dur (fabricant, numro de srie, nombre d'octets par secteur, nombre de secteurs par
cluster,) Ce secteur est donc le secteur le plus important du disque dur, il sert au setup du
BIOS reconnatre le disque dur.
Ainsi, sans celui-ci le disque dur est inutilisable, c'est donc une des cibles prfres des virus.

Remarque : Il est appel le boot manager sous windows NT

1. Le contenu des rpertoires


Les rpertoires stockent toutes les informations sur chaque fichier qu'ils contiennent

le nom de fichier
la taille du fichier
la date et l'heure de la dernire modification du fichier
les attributs du fichier (lecture seule, archive, )
le numro du cluster auquel le fichier commence(les autres clusters constitutifs tant
retrouvs par la FAT
le rpertoire parent (pour les rpertoires autre que racine)

Les rpertoires sont grs comme des fichiers particuliers, qui contiennent une entre avec les
informations ci-dessus

2. Le rpertoire racine
Le systme de gestion de fichier FAT utilise un rpertoire racine (reprsent sur les
systmes d'exploitations qui utilisent ce type de systmes de fichiers par le signe C:\ ) , qui
doit tre situ un endroit spcifique du disque dur.
Ce rpertoire racine stocke les informations sur les sous-rpertoires et fichiers qu'il contient.
Comme tous les autres rpertoires, le rpertoire racine possde une entre de 32 octets qui
contient les informations ci-dessous sur les fichiers:

3. La table dallocation de fichiers


Le systme de gestion de fichier FAT est aussi caractris par l'utilisation d'une table
d'allocation de fichiers et de clusters (ou blocs).

Principe :

6
S. Laporte LMS

Fichier1.txt 0002
Fichier2.txt 0005
Fichier3.txt 0007

Rpertoire

Entres de 0 1 2 3 4 5 6 7 8 9...
FAT
0003 0004 FFFF 0006 0008 FFFF FFFF ....

La FAT (File Allocation Table: table d'allocation des fichiers) est le cur du systme de
gestion de fichiers.
Elle est localise dans le secteur 1 du cylindre 0 la tte 1

La Table dAllocation de Fichiers est une liste de valeurs numriques permettant de dcrire
lallocation des clusters dune partition, cest--dire ltat de chaque cluster de la partition
dont elle fait partie.

La table dallocation est en fait un tableau dont chaque case (ou entre) correspond un
cluster.
Chaque case contient un chiffre qui permet de savoir si le cluster quelle reprsente est utilis
par un fichier, et, le cas chant, indique lemplacement du prochain cluster que le fichier
occupe.

On obtient donc une chane FAT, cest--dire une liste chane de rfrences pointant vers les
diffrents clusters successifs, jusquau cluster de fin de fichier.

Chaque entre de la FAT a une longueur de 16 ou 32 bits (selon quil sagit dune FAT16 ou
dune FAT32).
Les deux premires entres permettent de stocker des informations sur la table elle- mme,
tandis que les entres suivantes permettent de rfrencer les clusters.
Certaines entres peuvent contenir des valeurs indiquant un tat du cluster spcifique.

Ainsi la valeur 0000 indique que le cluster nest pas utilis, FFF7 permet de marquer le
cluster comme dfectueux pour viter de lutiliser, et les valeurs comprises entre FFF8 et
FFFF spcifient que le cluster contient la fin dun fichier.

Chaque partition contient en ralit deux copies de la table, stockes de manire contigu sur
le disque, afin de pouvoir la rcuprer si jamais la premire copie est corrompue.
Derrire la copie de la fat commence le rpertoire principal.

4. Diffrentes versions
FAT16
Cest un systme 16 bits, cela signifie quil ne peut pas adresser les clusters sur plus de 16
16
bits. Le nombre maximum de clusters reprables avec le systme FAT est ainsi de 2 , soit
65535 clusters. Or, tant donn quun cluster est constitu dun nombre fix (4,8,16,32,64) de

7
S. Laporte LMS

secteurs de 512 octets contigs, la taille maximale dune partition FAT se trouve en
multipliant le nombre maximum de clusters par la taille dun cluster.
Avec des clusters dune taille 32Ko (64*512), la taille maximale dune partition FAT est donc
de 2Go (32 767 * 65535= 2 147 385 345).

Ainsi, quelle que soit la taille de la partition ou du disque les clusters doivent tre
suffisamment grands pour que toute l'espace disque puisse tre contenu dans ces 65525
clusters.

Calculer la taille du cluster si le disque est de 1,2 Go (1 207 959 552 octets) en FAT 16
1 207 959 552 / 65535 = 18433 octets / 512 = 36 secteurs
Ainsi, plus la taille du disque (ou de la partition) est importante, plus la taille des clusters
doit tre importante.

Le systme FAT16 permet de dcrire un fichier par un nom dune longueur de 8 caractres et
une extension qui en comporte 3.

VFAT

Pour amliorer ce point, la version originale de Windows 95 a t dote dune prise en charge
amliore de la FAT, il sagit du systme VFAT (Virtual FAT). La VFAT est un systme 32
bits permettant denregistrer un fichier avec un nom de 255 caractres de long. Les
programmeurs ont toutefois d veiller la compatibilit ascendante, de telle faon a pouvoir
accder ces fichiers partir denvironnements 16 bits (DOS). La solution a donc t
daffecter un nom pour chaque systme. Cest la raison pour laquelle il est possible dutiliser
des noms longs sous Windows 95, tout en pouvant y accder sous DOS.

FAT32

Bien que la VFAT soit astucieuse, elle ne permet pas de remdier aux limitations de la
FAT16. Ainsi, un nouveau systme de fichiers (et non une meilleure prise en charge de la
FAT telle que VFAT) est apparu avec Windows 95 OSR2.
Ce systme de fichiers, appel FAT32 utilise des valeurs 32 bits pour les entres de la FAT.

Avec lapparition du systme de fichiers FAT32, le nombre maximal de clusters par partition
est pass de 65535 268 435 456.
La FAT32 autorise donc des partitions dune taille beaucoup plus leve (jusqu 2
traoctets).

Puisquune partition FAT32 peut contenir beaucoup plus de clusters quune partition FAT16,
il est possible de rduire de faon signifiante la taille des clusters et de limiter par la mme
occasion le gaspillage despace disque.
A titre dexemple, pour une partition de 2Go, il est possible dutiliser des clusters de 4Ko
avec le systme FAT32 (au lieu de 32Ko en FAT16), ce qui diminue lespace gaspille par un
facteur 8.

Le nombre de clusters tant limit, la taille maximale d'une partition dpend de la taille de
chaque cluster.
Voyons voir la taille maximale d'une partition suivant la taille des clusters et du systme de
fichiers utilis:

8
S. Laporte LMS

Taille d'un cluster Systme de fichier FAT16 Systme de fichier FAT32


4 Ko 256 Mo 8 Go
8 Ko 512 Mo 16 Go
16 Ko 1 Go 32 Go
32 Ko 2 Go 2 To

5. Le systme de gestion de fichier NTFS

NTFS (New Technology File System) utilise un systme bas sur une structure appele
table de fichiers matre , ou MFT (Master File Table), permettant de contenir des
informations dtailles sur les fichiers .

Ce systme permet ainsi lutilisation de noms longs, mais, contrairement au systme FAT32,
il est sensible la casse, cest--dire quil est capable de diffrencier des noms en
majuscules de noms en minuscules.

Pour ce qui est des performances, laccs aux fichiers sur une partition NTFS est plus rapide
que sur une partition de type FAT car il utilise une technique plus performants pour localiser
les fichiers (un arbre binaire).

La limite thorique de la taille dune partition est de 16 exaoctets (17 milliards de To), mais la
limite physique dun disque est de 2To.
Cest au niveau de la scurit que NTFS prend toute son importance, car il permet de dfinir
des attributs de scurit pour chaque fichier.
La version 5 de ce systme de fichiers (en standard sous Windows 2000 alias NT 5) amne
encore de nouvelles fonctionnalits parmi lesquelles des performances accrues, des quotas de
disque par volume dfinis pour chaque utilisateur.
NTFS v.5 devrait aussi apporter la possibilit dadministration distance...

La table des fichiers matres : MFT

La FAT est un tableau de valeurs numriques dont chaque case permet de dcrire lallocation
des clusters dune partition, cest--dire ltat (l'occupation ou non par un fichier) de chaque
cluster de la partition dont elle fait partie.

Le systme de fichiers NTFS est bas sur une structure diffrente, appele table de fichiers
matre, contenant des enregistrements sur les fichiers et les rpertoires de la partition.

Le premier enregistrement, appel descripteur, contient des informations sur la MFT (une
copie de celui-ci est stocke dans le second enregistrement).

Le troisime enregistrement contient le fichier journal, un fichier qui contient toutes les
actions effectues sur la partition.

Les enregistrements suivants, constituant ce que lon nomme le noyau, rfrencent chaque
fichier et rpertoire de la partition sous forme dobjets affects dattributs.

Cela signifie que les informations relatives chaque fichier sont stocks dans le fichier, qui
est lui mme enregistr au sein de la MFT. La MFT reprsente donc une structure de
stockage des donnes de la partition, et non une liste de clusters .

Vous aimerez peut-être aussi