Vous êtes sur la page 1sur 13

INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Cours Fichiers

Chapitre 1 : Généralités sur les fichiers.


 Introduction et Définitions.
 Caractéristiques d’utilisation d’un fichier.
 Typologies des fichiers.

Chapitre 2 : Traitement sur les fichiers.

 Principaux traitements sur les fichiers


 Opération sur les fichiers

Chapitre 3 : supports de mémorisation.


 Les Différents supports de mémorisation.
 Format des enregistrements.
 Nouveaux supports CDROM.
Chapitre 4 : structure des fichiers.

 Structure générale des fichiers


 L’enregistrement logique
 L’enregistrement physique ou bloc.
 Protection et sécurité sur les fichiers

Chapitre 5 : les différentes organisations.

 Principales méthode d’organisations


 Organisation séquentielle indexée.
 Organisation adressée.
 L’organisation séquentielle chaînée.
 L’organisation séquentielle partitionnée.

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Chapitre 1 : Généralités sur les fichiers.

Introduction :
L’informatique est par définition le traitement automatique de l’information. Les informations sont
stockées (mémorisées) sur des supports externes (disques, disquettes, CD, bandes magnétiques..) sous
forme de Fichiers.

Un fichier (anglais : file) est un regroupement logique de données mémorisées sur un support permanent
(disque dur, par exemple) afin de permettre une réutilisation ultérieure des informations qu’il contient.

Selon la structuration des données dans un fichier, on peut distinguer deux types de fichiers :

 Les fichiers structurés :


Permettent d’enregistrer des données de même nature. Ils sont composés d’enregistrements (ou articles)
contenant les mêmes champs (ou rubrique). Généralement, chaque enregistrement correspond à une
ligne. Par exemple, au sein d’un fichier « Clients », un enregistrement correspond aux données relatives à
un client.

 Les fichiers non structurés :


On peut énumérer dans cette catégorie tous les fichiers de types documents, codes sources, etc. Ils sont
constitués d’un texte donc la structure n’est pas déterminée : on ne trouve pas de notion de données
élémentaires. (Les *.doc sont lus par MS Word).

Dans ce chapitre, on s’intéresse aux fichiers structurés.

Définitions :
Un fichier : est un ensemble cohérent de données de même nature, enregistrées d'une manière organisée,
susceptibles de faire l'objet de traitements définis et qui sont stockées sur un support physique.

Exemple : Un Fichier du personnel, le fichier d’une bibliothèque, le fichier des commandes

Un fichier informatique comme un fichier manuel est composé de fiches. Chaque fiche apporte les mêmes
informations sur un élément de ce fichier (une personne, un livre, une commande), toutes ces informations
étant situées et présentées de manière identique pour toutes les fiches du fichier considéré.

Pour un fichier informatique, une fiche s’appellera également ENREGISTREMENT ou ARTICLE.

Remarque :
Les fichiers sont stockés sur mémoire secondaire (MS).

Pourquoi sur MS et pas sur la mémoire centrale ?

 La mémoire centrale (MC) est limitée en taille, chère, et volatile (perd son contenu quand on coupe
le courant.).

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

 Les MS (disques, disquettes, bandes, ...) sont peu coûteuses, non volatiles et de grande capacité.
Mais elles ne sont pas accessibles par le processeur .Il faut transférer l’information de la MS vers la
MC pour pouvoir la traiter.

L’Enregistrement
Chaque enregistrement ou article d’un fichier aura la même description, des différentes informations,
ZONES ou CHAMPS composant cet enregistrement seront toujours situées au même endroit dans
l’enregistrement avec la même typologie.

Par exemple :
Le fichier du personnel est composé d’enregistrements (articles, fiches), chaque enregistrement donne
des informations sur UN EMPLOYÉ.
UN EMPLOYÉ = UN ENREGISTREMENT
Numéro d’identification
Nom
Prénom
Date de Naissance
Adresse
Nombre d’enfants
Profession

Ces différentes zones sont des données, donc nous allons devoir attribuer à chacune des données
présentes dans l’enregistrement :
- un nom, un type (une longueur).
E_Num_Ident Texte (5)
E_Nom_Employé Texte (25)
E-Prénom_Employé Texte (25)
E_Date_Naiss_Employé Numérique (8)
E_Adresse_Employé Texte (40)
E_Nb_Enfants_Employé Numérique (2)
E_Profession_Employé Numérique (5)

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Utilisation d’un fichier :


Taux d’activités : Les activités d’un fichier sont mesurées par le nombre d’opération effectuées sur le
fichier pendant une période donnée :

Le volume de fichier : le volume d’un fichier est égal à la somme de la longueur de ses enregistrements.

La longueur des enregistrements : la longueur d’un enregistrement est égale à la somme de la longueur de
chaque champ (Nombre des Caractères).

Accroissement d’un fichier : il désigné le nombre de enregistrement crée par rapport celui a le nombres
d’enregistrement supprimé,

Typologie des fichiers On distingue 7 types de fichiers :


• Les fichiers permanents : Ils contiennent les infos de base des programmes. Leur durée de vie est longue.
Ils devront faire l'objet de mesures de sécurités importantes telles que des sauvegardes régulières et le
contrôle de leur intégrité lors des mises à jour EX : Fichier Etudiants, Clients …..
• Les fichiers mouvements : ils ont une durée de vie limitée, ils servent à mettre à jour les fichiers
permanents. Leurs enregistrements contiennent des codes de mise à jour (création, suppression)
• Les fichiers de manœuvre : durée de vie très courte, le temps d'un traitement particulier, ils servent de
stockage temporaire.
• Les fichiers archives : ils servent à garder l'image des fichiers permanents qui ne sont plus utilisés
pendant une durée déterminée.
• Les fichiers intermédiaires : contient des résultats d’un traitement donné pour être utilisés soit
durant le même traitement, soit par d’autres traitements ultérieurs. Il permet l’échange de données
entre programmes, contrairement au fichier de manœuvre qui ne communique ses données qu’au
même traitement qui l’a généré. En outre la durée de vie d’un fichier intermédiaire n’est pas limitée
par celle du traitement l’ayant créé, afin de permettre aux autres traitements de l’utiliser.
• Les fichiers archives ou historiques : permet de garder la trace des traitements réalisés au cours
d’une période donnée. La différence entre un fichier archive et un fichier historique réside
essentiellement dans la périodicité : un fichier historique est périodique : à la fin de chaque semaine,
chaque mois ou semestre, …etc.
• Les tables : une table est un ensemble d’enregistrements comprenant un argument et une ou
4

plusieurs valeurs. Généralement, l’accès se fait par l’argument et on sort par sa valeur
Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Chapitre 2 : Traitement sur les fichiers.

Principaux traitements sur les fichiers


Pour un Algorithme donné (un programme)
Certains fichiers sont en ENTREE
==> on doit traiter l’information contenue dans ces fichiers.
D’autres fichiers sont en SORTIE
==> restitution et stockage de l’information crée.
Le type de schéma de la Figure 1 s’appelle un Diagramme de
Traitement, il symbolise :
- Le fichier en ENTREE F_PERSONNEL
- Le programme PROG1 qui traitera ces fichiers.
- Le fichier en SORTIE F_PERSONNEL_BDE
Les instructions liées aux Fichiers :

Ouverture d’un Fichier


Tout fichier devra être OUVERT :
- S’il s’agit d’un fichier en ENTREE ==> Ouverture en Entrée
Ouvrir en Entrée F_PERSONNEL
- S’il s’agit d’un fichier en SORTIE ==> Ouverture en Sortie
Ouvrir en Sortie F_PERSONNEL_BDE

Fermeture d’un Fichier


Tout fichier OUVERT devra être naturellement FERME :
Fermer F_PERSONNEL, F_PERSONNEL_BDE

Lecture d’un Fichier en Entrée

Lire F_PERSONNEL
Syntaxiquement dans notre pseudo-langage, « Lire F_PERSONNEL » signifie lire UN
ENREGISTREMENT à partir du support externe
5
Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Écriture de l’enregistrement d’un Fichier

Écrire S_Employé
Syntaxiquement dans notre pseudo-langage, « Écrire S-Employé » signifie écrire UN
ENREGISTREMENT sur le support externe

Utilisation en PASCAL
Les principales opérations permettant de traiter un fichier en PASCAL sont les suivantes :

- RESET() : Ouvre un fichier


- REWRITE() : Crée un fichier
- CLOSE() : Ferme un fichier
- SEEK() : Se positionne à un endroit précis du fichier
- READ() : Lit un enregistrement.
- ECRIRE() : Ecrit un enregistrement

Opérations sur les fichiers


1. Opérations concernant tous les articles du fichier
a. Définition d’un fichier : Définir la structure type des articles du fichier, c.-à-d. choisir quelles sont les
informations contenues à l’intérieurs de chaque article.
b. Création d’un fichier : Stocker les informations conformément à la structure de l’article.
c. Destruction d’un fichier : C’est l’opération inverse de la création. Quand un fichier est détruit, il n’est
plus possible d’accéder à l’un quelconque de ses articles.
d. Tri (classement) d’un fichier : Cette opération consiste à classer tous les articles d’un fichier suivant les
valeurs croissantes ou décroissantes d’une ou plusieurs informations qui figurent dans les articles de ce
fichier.
e. Eclatement de fichiers : Cette opération permet d’obtenir plusieurs fichiers à partir d’un fichier initial.
f. Réunion de fichiers : Cette opération permet d’obtenir un fichier à partir de plusieurs fichiers.

2. Opérations ne concernant que certains articles du fichier


a. Consultation d’un fichier : C’est la lecture de certains de ces articles.
b. Adjonction d’articles : Cette consiste à ajouter des articles à un fichier.
c. Suppression d’articles : Cette opération consiste à supprimer des articles à un fichier.
d. Modification d’articles (mise à jour stricte) : Cette opération consiste à modifier le contenu des articles
d’un fichier.
6
Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Chapitre 3 : supports de mémorisation.

Les Différents supports de mémorisation.


Mémoire cache :
. Utiliser par le processeur pour stocker ses données et ses instructions
· très rapide et de petite taille.
Mémoire principale :
. Espace de travail de la machine. Toutes données ou tout programme doit être chargé en mémoire centrale
avant d’être traité par le processeur.
Mémoires à accès séquentiel (bandes magnétiques).
· Utilisées principalement pour les archivages et les sauvegardes;
· Accès très lent car il est séquentiel;
. Très fiables.
Mémoire à accès direct (disques, MC) :
· support utilisé pour le stockage des BD;
· les données peuvent être lues dans un ordre quelconque;
· elle résiste aux pannes de système (sauf au "crash disk");

Disque magnétique : est un disque recouvert d'une couche magnétique où sont enregistrées des données.
le disque constitue une mémoire pouvant atteindre de très grandes capacités de stockage de données
sonores ou visuelles. Les disques sont généralement scellés dans des boîtiers en métal ou en plastique
(souvent, un disque et son boîtier sont appelés « disque dur »).

Présentation du disque dur magnétique:


Un disque dur se compose de plusieurs plateaux tournant autour d’un axe à environ 7 200 tours/minute. On
peut stocker de l'information sur les deux faces d'un plateau. Les têtes de lecture / écriture d'informations

Les pistes (tracks)


Tout d'abord chaque plateau est composé de pistes où sont stockées les données. Ces pistes sont en fait des
cercles concentriques elles sont numérotées
en partant de l'extérieur (piste 0) vers
l'intérieur (piste n).
Les secteurs et les blocs (clusters)
Chaque piste est divisée en petites sections
formant des arcs de cercles qu'on appelle des
secteurs, et Un Bloc (cluster) reprend
plusieurs secteurs.
7
Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Format des enregistrements

1. Enregistrement non bloqués la gestion des données définit 3 formats pour les enregistrements logiques :

- Format Fixe : Tous les enregistrements logiques ont le même nombre fixe de caractères (ou même
longueur en octets). il n'y a pas de compteurs.

Format Variable: Les enregistrements logiques ont un nombre variable de caractères (ou une
longueur différente).

- Format Indéfini : Les enregistrements logiques ont un nombre variable, de caractères qui n'est pas
défini.

2. Enregistrements bloqué : L'enregistrement physique (ou bloc) est constitué de plusieurs enregistrements
logiques, On définit alors 3 autres formats :

-Format Fixe Bloqué: Plusieurs enregistrements logiques de longueur fixe sont placés sur le support
de façon Adjacent et forment un seul enregistrement physique. Tous les enregistrements physiques
ont alors la même longueur.

- Format Variable Bloqué: Plusieurs enregistrements logiques de longueur variable sont placés sur le
support et forment 1 seul enregistrement physique.

- Format Indéfini Bloqué: Les enregistrements logiques de forme Indéfini peuvent être groupés, mais
la longueur de l'enregistrement étant indéfinie.

Les nouveaux Support


Le disque optique :
1. Le Disque Compact (CD) :est un disque qui permet de stocker des données sous forme
numérique, il créer en 1982 par Philips et Sony, on peut stocker dans un CD jusqu'à 700 Mo
2. Le DVD : Le DVD a été inventé en 1995 par Philips, Sony, Toshiba et Panasonic. Il est présenté
comme une alternative au CD car sa capacité est six fois plus importante ( 4.70 Go).
3. le Blu Ray : il a été mis en développement en 2000 et il a été commercialisé en 2009. Il marque
une importante évolution car sa taille minimum est de 25 Go.
4. Les clés USB : ont été commercialisé à partir de 2000, ce périphérique de stockage se branche
sur tout appareil possédant un port USB, La première clé USB faisait 8 Mo et utilisait l'USB 1.0

5. la bande magnétique : est un support constitué d’une bande en matière plastique recouverte d’un
oxyde magnétique, elle est structurée en bloc à accès séquentiel, c’est-à-dire que les données y sont
simplement placées ou extraites séquentiellement, comprendre à la suite,
dans un ordre préétabli. Elle permet le stockage d’un nombre important
d’informations.
CAPACITE : La bande magnétique a une capacité variable jusqu’à 240GB en
fonction de la longueur et de l’épaisseur de la bande. Bien conservé, le ruban
8

magnétique peut avoir une durée de vie de plus de 40 ans.


Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Chapitre 4 : structure des fichiers.

Structure d’un fichier :


Le fichier logique est la vue de l’utilisateur de l’ensemble des données mémorisées sur le support de masse
Le fichier physique correspond à l’implémentation sur le support de masse de l’unité de conservation
fichier : méthodes d’allocation du support de masse.

Niveau Utilisateur Fichier logique


Le système de gestion de fichiers (SGF)
Permet de stocker, localiser, et récupérer Interface SGF
facilement des données.
Niveau Physique Fichier Physique

Un SGF a pour principal rôle de gérer les fichiers et d’offrir les primitives pour manipuler ces fichiers. Il
effectue généralement les tâches suivantes :

 Fournit une interface conviviale pour manipuler les fichiers (vue fournie à l’utilisateur). Il s’agit de
simplifier la gestion des fichiers pour l’utilisateur
 La gestion de l’organisation des fichiers sur le disque (allocation de l’espace disque aux fichiers)
 La gestion de l’espace libre sur le disque dur ;
 La gestion des fichiers dans un environnement multi-utilisateurs, la donnée d’utilitaires pour le
diagnostic, la récupération en cas d’erreurs, l’organisation des fichiers.
 le partage simultané des fichiers, et assure leur protection contre les pannes.

Exemple :
Fichier logique(Article) Fichier Physique(Enregistrement)

N° inscription TS/1996/01 Etudiant : fiche{


Nom Abedelhamid Num_inscription : Texte (10)
Prénom Akram Nom : Texte (25)
Date naissance 10/07/1996 Prénom : Texte (25)
Adresse Batna Date_Naissance :
JJ_Naiss : Numérique (2)
MM_Naiss : Numérique (2)
AAAA_Naiss : Numériqe (4)
Adresse :
Num_Voie : Numérique (4)
Type_Voie : Texte (6)
Nom_Voie : Texte (25)
9

Code_Postal : Numérique (5)


Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Types d’enregistrements
On distingue trois types d’enregistrements :

Enregistrement de taille fixe : Tous les enregistrements du fichier ont la même taille. Autrement dit, tous
les enregistrements du fichier sont composés des mêmes champs.

Enregistrement de taille variable : Dans ce cas, les enregistrements du fichier n’auront pas tous la même
taille.

Enregistrement de taille indéfinie : La taille d’un enregistrement ne peut pas être déterminée à l’avance.
Exemple : Fichier Word ou Excel.

Protection et sécurité sur les fichiers :

Protection des informations contre des accès non autorisés


Les pertes de données:
- catastrophes: incendie, feu....
- erreurs matérielles et logicielles: panne, bogues.
- erreurs humaines: saisie erronée, mauvais programme, ....
Prévention(Solutions): sauvegarde des fichiers
Les intrus(Les Pirates) :
- indiscrétion.
- contournement des obstacles d'accès par plaisir...
- gain financier: transfert de comptes bancaires.
- espionnage.

10
Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Chapitre 5 : les différentes organisations.

Principales méthode d’organisations :

Comment retrouver à l’intérieur d’un fichier un enregistrement donnée ? Cela dépend de


comment sont organisés les enregistrements les uns par rapport aux autres. C’est ce qu’on
appelle l’organisation du fichier. Il y a plusieurs organisations

Modes d’organisation des fichiers :

1. Organisation séquentielle :
 Les enregistrements du fichier séquentiel sont rangés séquentiellement l’un à la suite de l’autre.
 L’ordre de création (ordre logique) correspond à l’ordre de l’enregistrement (ordre physique)

Opérations sur un fichier organisé en Séquentiel :

a. Création : la création d’un nouveau enregistrement ne peut se fait qu’après le dernier


enregistrement physique sur le support.
d. Modification : il n’est pas possible d’effectuer des modifications sur des fichiers sur
bande sans utiliser une autre bande. Cependant sur disque, il est possible de réécrire
l’enregistrement modifié à sa place.
e. Suppression : pour accéder à des suppressions physiques d’enregistrements, il faut
recopier le fichier sur un autre support en effaçant les enregistrements à supprimer.
2. Organisation partitionnée : il s'agit en fait d'une organisation particulière des fichiers Dans cette
organisation chaque fichier est divisé en sous-fichiers appelés MEMBRES.
3. Organisation Chaînée :
 Un fichier occupe une liste chaînée des blocs sur le disque
 Chaque bloc contient une partie des données et un pointeur sur le bloc suivant

0 Fichier A n-1

4. Organisation séquentielle indexée


 Comme pour l’organisation séquentielle, les articles sont écrits dans l’ordre de leur l’arrivé.
 Seulement, ici, à chaque fois qu’un article est écrit, une clé lui est associée.
 Cette clé, ainsi que l’adresse relative de l’article dans le fichier sont inscrites dans une table
appelé Table d’index.
11
Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

Organisation Séquentielle indexée : (ISAM)

C’est une organisation d’IBM pour les systèmes d’exploitation DOS et OS-VS. Un fichier séquentiel indexé
ISAM (Indexed Sequential Acces Method) est un fichier trié, d’index trié non dense, composé d’une zone de
débordement et d’une zone index
Un fichier ISAM comporte trois zones logiques :
• une zone primaire où l’on écrit les articles à la première écriture ;
• une zone de débordement où l’on transfère les articles lors des additions au fichier ;
• une zone d’index où l’on écrit les index.( index de pistes, index de cylindre).

5 Organisation Séquentielle indexée: (VSAM) :

Les fichiers VSAM (Virtual Sequential Acces Method,) sont des fichiers triés d’index trié non dense dont
l’ensemble fichier + index est organisé sous forme d’un B- arbre. B- arbre Clé 1

Remarque :
Clé 2 Clé 3
Un fichier indexé simple est un fichier non trié, d’index trié dense organisé sous forme d’un B-Arbre.
Dense = Nbre clé de l’index / Nbre d’articles
Clé : C’est le numéro d’ordre dans le fichier.

Principe :
Le fichier est divisé en aires.…
 une aire = ensemble de piste d’un même cylindre ou de
cylindres contigües ou une aire = ensemble d’intervalles.…
 intervalle = partie de piste ou plusieurs pistes consécutives
lues en une seule E/S.…
 Lorsqu’un intervalle est saturé, il est éclaté en 2 intervalles.
 Lorsqu’une aire est saturée, elle est éclatée en 2 aires.
12

Ainsi, le fichier se réorganise de lui-même


Page

Prof : Ghennai Youcef 2018/2019


INSFP HAMLA Spécialité : Informatique / Bases De Données Niveau : 5

5. Organisations Adressées
 L’ordre des enregistrements logiques (en fonction de la clé de chaque enregistrement) est sans
rapport avec l’ordre de stockage sur les supports
 Les enregistrements sont stockés sur le support en fonction d’un lien préalablement établi entre
la clé de l’enregistrement et ‘adresse de stockage de l’enregistrement.
 Adresse absolue :
CLÉ LOGIQUE = ADRESSE PHYSIQUE
 Adressage parallèle :
Correspondance par l’intermédiaire d’une table entre valeurs des clés et les adresses
physiques
 Adresse calculée :
Le lien s’effectue par une formule mathématique aboutissant à une bijection entre la
clé logique et l’adresse physique (algorithme de randomisation).
 Adresse relatif :
Le lien s’effectue par une double opération :
T1 T2
Clé logique
====> Valeur X ====> ADRESSE
T1 donne en général le numéro de piste
T2 le décalage sur la piste.
ª Organisation uniquement réalisable sur les supports adressables.

6. Organisation relative :
 Tous les enregistrements doivent avoir une longueur fixe et ont chacun un numéro relatif (1, 2, 3, …)
appelé clé qui est leur numéro d’ordre dans fichier( L’enregistrement de clé « 25 » est en 25ème position.)
 Le principe est que la clé est un numéro d’enregistrement qui est un nombre entier permettant de
déterminer directement l’adresse relative de l’article par rapport du début du fichier qui le contient.
 Adresse de l’enregistrement N = Adresse Début du fichier + (N - 1) * Longueur de l’enregistrement du
fichier en organisation relative

|‫|ـــــــــ|ـــــــــ|ـــــــــ|ـــــــــ|ـــــــــ|ـــــــــ|ـــــــــ‬
0 1 2 ... i
7. Organisation H-code
 Dite aussi adressage calculée ou adressage dispersé.
 A chaque entrée, est associée une adresse (n° bloc) de rangement calculée en fonction d’une clé.
 La fonction de calcul s’appelle fonction H-code :
h : Entrée ⟼ [0 .. N] / Nombres des blocs
x ⟼ h(x)
 Exemple de fonction h(x) : la somme (module N+1) des valeurs binaires des n premiers octets de la
représentation mémoire de x.
h(“tomate”) = *ascii(‘t’) + ascii (‘o’) + ascii(‘m’)] mod (N+1) = 336 mod (N+1).
 Collision : Quand deux entrées ont le même H-Code. (“ananas” et “tomates”, n=3 , N=8)
 Une bonne fonction H-Code est une fonction qui limite les collisions, i.e. qui répartit bien (disperse)
13

les entrées dans l’espace de stockage. Idéalement injective


Page

Prof : Ghennai Youcef 2018/2019

Vous aimerez peut-être aussi