Académique Documents
Professionnel Documents
Culture Documents
APPLIQUEE A LA GEOLOGIE
DESTINE AUX ETUDIANTS DE TROISIEME BACHELIER GEOLOGIE
ANNEE ACADEMIQUE 2021 - 2022
SOMMAIRE • INTRODUCTION
Il vise à apporter aux étudiants de troisième bachelier en géologie des notions théoriques
et des techniques sur l’utilisation de l’outil informatique et ses applications dans
l’acquisition, le traitement, l’analyse, la modification, l’archivage, l’affichage, la
restitution et voire même l’interprétation des données géologiques.
Il est plus orienté vers l’apprentissage et l’utilisation des logiciels et programmes utilitaires
aux applications géologiques.
Minéraux; roches;
Concepts physiques et
Fossiles (minéralogie,
chimiques
pétrographie;
(géophysique,
pétrologie;
géochimie…)
métallogénie; …)
Introduction de
Moyens d’investigation
mathématiques et
(imageries,
Informatiques
photogéologie,
(modélisation,
télédétection)
simulation…)
@ Au sens le plus large du mot, l’informatique désigne tout ce qui peut être traité
par l’ordinateur (textes, nombres, images, sons, vidéos,…).
@ Ce mot était à l’origine d’un adjectif qui signifiait ‘qui met de l’ordre’, qui arrange.
@L’anglais, plus restrictif, utilise le terme de computer qui peut se traduire par
calculateur, machine à calculer.
Logiciels cartographiques Cartes et images avec dimensions MapInfo, ArcGis, Surfer, GMT, QGIS, etc
spatiales
Tableur Réalisation de tableaux de calculs Excel
(factures, bulletins de salaire, etc.)
Donnée et information :
Donnée et information :
© Dans une base de données gérant les données relatives aux sondages d'un gisement
minier, la teneur en un élément métallique pourrait être représentée par une donnée de type
réel (un nombre entier ou décimal).
© Le programme traitant la donnée dans l’ordinateur ne comprend pas qu'il s'agit d'une teneur. Sa
compréhension se limite à pouvoir effectuer certaines opérations sur le nombre réel telles que le calcul de la
moyenne, de la variance ou de l'écart-type d'un ensemble de teneurs. Une interprétation plus raffinée sera
effectuée habituellement par l’homme.
Donnée et information :
© Shannon et al. (1959) ont proposé une théorie formelle de l'information dans le
Donnée et information :
© Comme le niveau d'interprétation d'une donnée par un programme est très rudimentaire, le
terme Donnée sera habituellement préféré au terme information dans le contexte
informatique. Cependant, les deux termes sont souvent utilisés comme synonymes lorsque
de telles nuances sémantiques deviennent une préoccupation secondaire.
@ Il permet de coder les caractères sur 8 bits, soit 256 caractères possibles.
.
COURS DE IAG 2021 - 2022 25
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
@ Type de données complexe @ Une chaîne de caractères pourra être considérée comme
un type simple ou complexe selon le contexte. Dans les
@ Un type de données complexe est défini en
premières applications des bases de données, les types
composant des types simples ou complexes à
simples étaient limités à des entiers, des réels et des
l'aide de constructeurs de types (enregistrement,
chaînes de caractères d'une taille limitée.
ensemble, tableau, etc.).
@ L'évolution technologique permet de considérer
@ La distinction entre ce qui est simple et ce qui est
aujourd'hui le traitement de données beaucoup plus
complexe est relative au contexte. Il n'y a donc pas de
élaborées et volumineuses telles que les données
notion absolue de simple et complexe.
multimédias.
© Dans le cas où vous optez pour un traitement automatique, il faut avoir une
connaissance des machines de traitement et une connaissance de la
programmation ou des logiciels qui permet le dialogue avec ces machines.
COURS DE IAG 2021 - 2022 29
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
© Valeur (ou état) du caractère décrit: 30 mètres , N20°E, grenue, 3%, saine, altéré, -120
mGal, etc.
© On peut aussi en ajouter une quatrième composante, qui est la composante spatiale.
On peut associer à chaque donnée géologique une composante spatiale liée à sa
localisation définie dans un système des coordonnées de référence (SCR : SIG).
COURS DE IAG 2021 - 2022 32
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
@ Processus de traitement des données : Nature de données géologiques
Les données géologiques peuvent prendre l'une de ces cinq natures :
© La mesure des caractères décrits peut être quantitative : dans ce cas, le caractère prend ses
valeurs dans un ensemble continu et structuré tel que l’ensemble des réels (R) ou des réels
strictement positifs (R + )
Exemple (valeurs numériques): les dosages chimiques ; les mesures physiques, pétrophysiques
(densités, porosité, surface spécifique, paramètres de résistance…) ; les mesures géophysiques ; les
indices de plasticité d'un sol, etc.
COURS DE IAG 2021 - 2022 33
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
© Elle peut être semi-quantitative : Le caractère prend ses valeurs dans un ensemble
non structuré ordinal tel que l’ensemble des modalités ordonnées (échelle ordinale).
Exemple: les classes granulométriques ; les teintes: claire à foncées ; les degrés
d’altération ; estimation modale ;
…
COURS DE IAG 2021 - 2022 34
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
© Elle peut être qualitative (une qualité excluant l’autre possible) : Le caractère prend
ses valeurs dans un ensemble des modalités non ordonnées (échelle nominale).
© Elle peut être dichotomique. Présence ou absence d’un caractère (valeur logique
0 ou 1): dans une roche, l’existence ou non de myrmekite, des phénocristaux de
feldspath potassique, etc. La présence du quartz dans certaine roche exclue celle
de feldspathoïde.
© Quand un objet est décrit par plusieurs caractères à la fois dans un espace
à p dimensions, il peut être ramené à un vecteur d’un espace vectoriel RP.
© Les données d’observation : Elles concernent les notes descriptives, synthétiques sur des objets ou phénomènes.
Exemple : le levé géologique, le logging (description) d'un forage ; la coupe pédologique d'un sol ;
© Les données de déterminations : Elles relèvent du domaine biunivoque de la systématique (systématique animale,
végétale ou minérale, échelle chrono-stratigraphique, classification pétrographique des roches éruptives, sédimentaires,
ou métamorphiques).
© Elles sont les aboutissements de l’élaboration mentale issue des observations. Les
déterminations sont généralement structurées et présentent un ordre assez rigoureux. Ce sont
des mots clés et symboles, des fiches de déterminations, etc.
Le plus souvent les déterminations qualitatives sont complétées par les indications d’ordre quantitatif. C’est ainsi que
classer une roche parmi les granites signifie:
L’opération elle-même est une détermination. L’étape 1 est une indication quantitative et les étapes 2 et 3 sont des
déterminations qualitatives.
COURS DE IAG 2021 - 2022 41
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
@ Processus de traitement des données : Type de données
© Données graphiques et pictorales : Elles concernent les variations dans l’espace ou dans le temps de la valeur
et/ou de la distribution d’une propriété. Il s’agit des documents graphiques, enregistrements graphiques et sorties
instrumentales analogiques.
b. Sur un diagramme:
Soit la variation d’une propriété quantitative (teneur, densité, etc.) à une dimension
(profil), 2D (espace), 3D (volume) peut-être même 4D
@ Le format d’un code définit la longueur de chaque mot et il peut être désigné par K.
Pour qu’un code de puissance M puisse représenter un ensemble informationnel de
puissance m, il faut et il suffit que:
@ M ⩾ m : C’est-à-dire que le nombre des mots de code disponible doit être égal au
moins au nombre d’informations à coder.
COURS DE IAG 2021 - 2022 47
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
@ Processus de traitement des données : Codification des données géologiques
© Code direct : Ensemble informationnel de cardinal m est codé par un alphabet possédant m
caractères ou système physique à m états stables. Il est non utilisé parce qu’étant peu pratique
pour un ensemble informationnel à grand cardinal;
© Code complexe : Les mots codés sont des combinaisons, réalisées suivant des règles propres à chaque
code, de caractères d’un alphabet ou de marques d’un système physique. Les plus courants sont des codes
constitués de mots à longueurs fixes.
© Code complexe :
© Code complexe : Le nombre des codes disponibles M doit être au moins égal au
nombre d’informations m :
© Code commutatif : Lorsque dans un code complexe les caractères sont permutés sans modifier
ou altérer la signification d’un mot, un code est dit commutatif.
Mathématiquement, une telle situation correspond à une combinaison des lettres (ou marques)
prises k à k dans un alphabet (ou un ensemble des digits) de base p:
© Code commutatif :
Pour une roche contenant la biotite désignée par le code A et la muscovite désignée
par le code B, si on ne s’intéresse qu’à leur détermination qualitative (leur présence
dans une roche), AB signifie la même chose que BA (les codes désignent la même
composition minérale d’une roche).
© Code positionnel : Il est aussi appelé code hiérarchique ou articulé. Dans ce code une permutation
de caractères modifie la signification d’un mot. Les codes positionnels sont utilisés pour représenter des
objets ou des concepts hiérarchisés entre eux.
Soit à codifier les ères, les systèmes, périodes et étages en stratigraphie. Au total, nous avons quatre
niveaux et à chaque niveau, nous réservons une position. La longueur du mot codé égal 4.
© Code positionnel :
© En R.D.C : on utilise le code positionnel proposé par Armand François et les géologues du Musée Royal d’Afrique
Centrale (Tervuren) pour la stratigraphie des différents Supergroupes.
© Exemple : Pour le Supergroupe du Katanga ou le Katanguien, le code positionnel est alphanumérique. Il comprend 4
ou 5 codes dont une ou deux lettres suivies de 3 chiffres. La partie alphabétique représente la première lettre ou les
deux premières lettres du Groupe (R pour le groupe du Roan ; Ng pour le groupe de Nguba et Ku pour le Kundelungu).
Les 3 chiffres représentent en ordre le sous-groupe, la formation et la couche.
© Code dérivé : Ces types de codes sont générés à partir des mots utilisés dans le
langage naturel. La première méthode de génération consiste à supprimer dans un
mot en clair les dernières lettres jusqu’à arriver à un mot de longueur déterminée:
© Code dérivé : Cette méthode est inutilisable pour le codage d’un ensemble de mots parmi lesquels certains
ont une racine ou radical commun:
La deuxième méthode est d’une application générale. Elle consiste à supprimer dans le
mot à partir de la deuxième lettre, les lettres les plus fréquentes dans la langue écrite (les
moins significatives) jusqu’à obtenir des mots d’une longueur déterminée.
Sandstone : sndsn ; snds ; gécamines : gcm : (Code à 5 lettres) ; (code à 4 lettres) ; (code à 3 lettres)
COURS DE IAG 2021 - 2022 57
THEORIE DE L’INFORMATION ET DONNEES GEOLOGIQUES
@ Processus de traitement des données : Codification des données
géologiques
@ Les méthodes multivariables vont un peu plus loin et cherchent les relations simultanées entre
plusieurs variables.
@ Ces méthodes ne sont pas le propre des géologues; elles peuvent servir à analyser les données
de toute provenance. Elles ont été développées tout au long du 20ème siècle par des statisticiens et
des chercheurs provenant surtout des domaines divers
COURS DE IAG 2021 - 2022 64
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Peut-on identifier, voir interpréter, des facteurs pouvant expliquer les variations
observées dans les différentes variables (analyse factorielle)?
@ Comment utiliser ces différences pour prédire le groupe auquel appartient une
nouvelle observation?
@ Quelles sont les observations (ou les variables) ayant des ressemblances au niveau
de leur comportement (problème de corrélation géologique)?
© Vers des années 1960 : les sciences de la terre ont subi une profonde évolution
avec la naissance de la théorie de la tectonique des plaques :
© Cette théorie a pris naissance après l'accumulation de nouvelles données dues à de récentes
technologies d'investigation de la croûte terrestre, continentale et océanique.
La géophysique et la géochimie ont été les moteurs de cette théorie et les pourvoyeurs de
données nouvelles, abondantes et précises.
Des navires et des submersibles ont été équipés d'appareils destinés à cartographier les fonds
océaniques, à observer directement la croûte océanique jusqu'alors méconnue, à mesurer le
paléomagnétisme des roches, à pratiquer des forages sous-marins.
COURS DE IAG 2021 - 2022 73
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Géologie et Informatique
© Les outils utiles informatiques (logiciels) utilisés pour les traitements dépendent de
la nature et des types des données géologiques.
© C’est un logiciel qui produit une composition du texte (au sens typographique) à partir des
données textuelles fournies par l’utilisateur. Le rendu est composé en direct lors de la frappe,
c’est ce qu’on appelle un logiciel WYSIWYG (What You See Is What You Get).
©Le Word est un logiciel très familier et presque connu de tout le monde. Nous ne
pouvons pas le présenter dans le cadre de cours.
© Il rivalise avec les logiciels de mise en page grâce à un langage de programmation et à sa grande
flexibilité;
© Sa mise en œuvre est très différente des autres logiciels, ce qui déroute les habitués des traitements de
texte et des logiciels de PAO.
©Sa démarche ressemble à ce qui se passe avec des navigateurs WEB : composition à partir
d’un fichier texte source en HTML.
COURS DE IAG 2021 - 2022 79
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Latex
Le texte peut être généré par un logiciel tiers (insertion dans un flux automatisé).
COURS DE IAG 2021 - 2022 81
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Latex :
Avantages
© Gestion aisée de documents écrits dans des langues et dialectes différents : très utilisé en
linguistique.
© Installation et maintenance peu aisées, mais il y a une nette amélioration : Depuis TeXLive 2009 on peut mettre
à jour les packages par l’utilitaire tlmgr ;
© Non WYSIWYG (What You See Is What You Get) : Le document de départ est loin visuellement du document
final. Les environnements de travail d’aujourd’hui pallient largement à ce problème ;
©Limitations typographiques sur certains points précis (forme des paragraphes. . . ) où la concurrence WYSIWYG
fait largement mieux ( InDesign 2 47 , QuarkXPress 2 48 )
COURS DE IAG 2021 - 2022 85
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Latex : Inconvénients
© TEX fonctionne avec ses propres polices, dans un format très spécifique.
Xetex et luatex remédient à ces problèmes en accédant aux polices installées sur le système d’exploitation hôte
et en accédant à des polices mathématiques nouvelles.
©Le langage de programmation de TEX est différent des langages de programmation usuels : il est difficile à
maîtriser et très déroutant (consulter les forums ou Youtube !).
COURS DE IAG 2021 - 2022 86
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Latex :
Inconvénients
Lua est un mot portugais qui signifie « lune ». Mais Lua est aussi un langage de
programmation qui peut être étendu indépendamment de la plate-forme.
Une raison suffisante pour regarder la lune des langages de script de plus près.
Des logiciels (“moteurs”) tex , pdftex , bibtex , makeindex et des dizaines de milliers
de fichiers regroupés à différents endroits sur la machine (classes, packages, polices...).
Il existe pour ça des distributions prêtes à l’emploi : TeXLive pour Linux, Mac et Windows
; MacTeX 2.18 (TEXLIVE pour Mac), proTeXt 2.24 (TeXLive pour Windows)
COURS DE IAG 2021 - 2022 89
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Latex : Installation
@Il vous faut les deux, car MikTeX est une version du programme LATEX, tandis que Texmaker
est simplement un éditeur contenant plein de fonctions utiles (mais qui sous Linux est livré avec
le programme LATEX. . . )!
des fonctionnalités diverses qui permettent une meilleure productivité : aide à la frappe (auto-complétion), correction
orthographique, aller-retour “source”/“résultat visuel”, interface avec d’autres moteurs. . .
COURS DE IAG 2021 - 2022 91
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Latex : Installation de TEX et son écosystème
TeXShop (Mac ), TeXworks (Linux, Mac, Windows), TeXMaker (Linux, Mac, Windows), emacs ( Linux), ( Aquamacs ( Mac),
TeXnicCenter (Windows), WinEdit (Windows). . .
TeXShop est souvent préféré pour son interface sobre, conviviale et efficace. Son clone multiplateforme TeXworks reprend
tous ces avantages. On peut aussi installer un gestionnaire de bibliographie compatible avec bibtex, un logiciel de gestion
des packages compatible avec tlmgr . . .
@ tlmgr (TEX Live Manager) Cet utilitaire permet de gérer les packages installés sur l’ordinateur et de
les actualiser en les téléchargeant sur le site du CTAN 25 (Comprehensive TEX Archive Network).
@ Il existe des interfaces graphiques pour l’utiliser ( TeX Live Utility . . . ) : La commande la plus utile
qu’il faut invoquer en tant qu’administrateur est tlmgr update –all : elle met à jour tous les packages et
les logiciels.
COURS DE IAG 2021 - 2022 93
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Latex
: Installation de TEX et son écosystème
@ makeindex: Logiciel qui trie les données d’index d’un fichier .idx produit
par LATEX et les met en forme.
@ metapost , asymptote Logiciels de dessin basé sur le même principe que TEX :
document source “texte” avec extension .eps ou .pdf.
.tex Fichier source TEX ou LATEX qui est compilé par le moteur tex.
.log : fichier donnant les détails de ce qui s’est passé lors de la compilation.
.aux : fichier donnant les informations sur le documents, utilisé par une seconde compilation.
@ Fichiers plus fondamentaux où l’utilisateur usuel n’intervient pas : Utilisés par LATEX
@ Fichiers plus fondamentaux où l’utilisateur usuel n’intervient pas : Utilisés par LATEX
.dtx : fichier de distribution des packages (produit les .sty, .def, .pdf. . . ).
.ins : fichier gérant l’installation d’un package par une compilation LATEX.
@ Fichiers plus fondamentaux où l’utilisateur usuel n’intervient pas : Fichiers utilisés par d’autres moteurs
.map : fichier de “mappage” entre les noms des polices ( pdftex , dvips . . . ).
LaTex reconnaît ses commandes du fait que celle-ci commencent par un backslash (\) et
reconnaît certains caractères spéciaux
COURS DE IAG 2021 - 2022 104
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
Édition d’un document
• Un fichier .tex doit contenir :
• le préambule
\documentclass[french, 12pts]{article}
\usepackage{a4wide}
\usepackage{epsfig}
\usepackage{supertabular}
• l’environnement document
\begin{document}
\end{document}
• et du texte entre
\begin{document} et \end{document}
COURS DE IAG 2021 - 2022 105
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
\begin{document}
Voici mon premier document Latex.
\end{document}
• Les options
• ils sont placées entre crochets juste après le nom de la commande
\documentclass[french, 12pts]{report}
• Les packages
• ce sont des fichiers qui portent l’extension .sty
• pour charger un package, on place la commande
\usepackage{nom_package} entre \documentclass et
\begin{document}
COURS DE IAG 2021 - 2022 108
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
\documentclass[french, 12pts]{report}
Structure de document : rapport
Le package label se chargera de faire les traductions
utiles
\usepackage{label} exemple: chapter en chapitre
\usepackage{a4wide}
Le package a4wide permet d’obtenir de grandes
\usepackage{epsfig} marges
\end{document}
La table de matière
\tableofcontents
\chapter*{Introduction} Un chapitre Introduction
Voici l’introduction de mon rapport … non numéroté
…
\chapter*{Introduction}
\chapter
Voici l’introduction de mon rapport \section
\subsection
\part{\’Etude pr\’eliminaire}
\chapter{Premier chapitre} \subsubsection
\section{Introduction}
\paragraph
\subsection{Le probl\`eme}
\subsubsection{Solution} \subparagraph
\section{Conclusion} Commandes de sectionnement
\end{document}
small Exemple
normalsize Exemple
large Exemple
Large Exemple
LARGE
Exemple
huge
Exemple
COURS DE IAG 2021 - 2022 113
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
& Utilisé dans les \&
Accents, caractères spéciaux tableaux
~ Espace entre deux $\sim$
é \’e œ \oe mots
à \`a Œ \OE % Commentaire \%
ê \^e æ \ae
\ Début d’une $\backslash$
ä \¨a å \aa commande
ã \~a ı \i _ Indice en mode \_
î \^{\i} ø \o mathématiques
ç \c{c} Ø \O $ Début ou fin de mode \$
math
{} Délimiteurs \{ et \}
\begin{tabular}{lrc}
Premier mot & Second mot & Troisième mot \\
Première phrase & Seconde phrase & Troisième phrase
\end{tabular}
\begin{tabular}{|c|cc|}
\hline
Premier mot & Second mot & Troisième mot \\ \hline
Première phrase & Seconde phrase & Troisième phrase
\hline
\end{tabular}
Premier mot Second mot Troisième mot
\begin{tabular}{|c|p{4cm}|}
\end{tabular} Colonne d’une largeur de 4cm
COURS DE IAG 2021 - 2022 117
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
Mathématiques
• Pour passer en mode mathématiques :
•$…$
• \[ … \]
• \begin{equation} … \end{equation}
• \begin{displaymath} … \end{displaymath}
• Les symboles :
• lettres grecques
• opérateurs binaires
• symboles de relation
• flèches
• noms de fonctions
• délimiteurs
• etc.
Toujours utiliser les signes de dollar par paires — un pour commencer l’expression mathématiques,
un autre pour la finir.
COURS DE IAG 2021 - 2022 124
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
Récapitulatif de LATEX : commandes & arguments
Commencer par \documentclass : quel type de document ?
Placer les metadonnées (\title et \author) et les packages dans le
préambule.
Placer le contenu entre \begin{document} et \end{document}.
La commande \maketitle crée le titre ; les commandes \section
créent des sections numérotées.
COURS DE IAG 2021 - 2022 125
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
Récapitulatif de LATEX : commandes & arguments
@ Différents tableurs :
Microsoft Excel, de la suite bureautique Microsoft Office.
Sun StarOffice Calc, de la suite StarOffice.
OpenCalc, de la suite OpenOffice.
IBM/Lotus 1-2-3 de la suite SmartSuite.
Corel Quattro Pro de la suite WordPerfect.
KSpread de la suite libre KOffice sous Linux.
COURS DE IAG 2021 - 2022 128
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques :
Tableurs
@ Un tableur peut être vu comme une super calculatrice, mais avec des
fonctionnalités bien supérieures :
@ Un tableur peut être vu comme une super calculatrice, mais avec des fonctionnalités
bien supérieures :
Automatisation : les calculs répétitifs sont obtenus par des copier/coller de formules.
@ Un tableur peut être vu comme une super calculatrice, mais avec des fonctionnalités
bien supérieures :
Le tableur est l'outil tout désigné pour une première interprétation des données issues
de l'expérience scientifique, de l'échantillonnage ou des observations scientifiques.
COURS DE IAG 2021 - 2022 131
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs
@ Bases d’Excel
Il permet de manipuler des « feuilles de calcul » c’est à dire des tableaux de « cellules
» comportant des données et des formules (calculs) sur ces données.
COURS DE IAG 2021 - 2022 132
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs
@ Bases d’Excel
Le résultat de ces formules est aussi affiché pour servir de données à d’autres
formules etc.
Excel est très utilisé en comptabilité mais aussi pour les emplois du temps, les
factures, et en tant que mini SGBD (nous verrons Access plus tard).
COURS DE IAG 2021 - 2022 133
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs
@ Bases d’Excel
Un grand nombre de fonctionnalité de Word (sur la présentation des feuilles de calculs) sont présentes :
copier/couper/coller ;
@ Motivations :
Données textuelles,
Horaires,
Dates, …
COURS DE IAG 2021 - 2022 135
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs
@ Motivations :
@ Motivations :
Tableurs
20
@ Exemple
Temperature moyenne
15
10
0
Janvier Février Mars Avril Mai Juin Juillet Août Septembre Octobre Novembre Décembre
Mois
Tableurs
20
@ Exemple
Temperature moyenne
15
10
0
Janvier Février Mars Avril Mai Juin Juillet Août Septembre Octobre Novembre Décembre
Mois
@ Exemple 21,6 17
21,7 18,7
19,6
@ À l’ouverture d’un classeur, Excel présente une feuille de calcul, ainsi que des
onglets en bas à gauche de l’écran permettant l’accès à d’autres feuilles de calcul.
@ Une barre d’onglets permettant d’accéder aux différentes fonctions du tableur, proposées sous forme d’icônes.
Cette barre d’onglets remplace les menus déroulants des versions antérieures.
@ Une barre de formules donnant la référence ou le nom de la cellule active et indiquant son contenu. La barre de
formules permet ainsi de saisir ou de modifier les nombres, textes et formules à insérer dans les cellules.
COURS DE IAG 2021 - 2022 144
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs : Excel : Interface
@ La feuille de calcul, ensemble de cellules sur lesquelles porteront les opérations. Sur le bas de la feuille de calcul
affichée, des onglets permettent de passer d’une feuille de calcul à une autre. Chaque feuille porte un nom (par défaut
Feuil1, Feuil2, etc.)
@ Des cellules correspondant à l’intersection d’une colonne et d’une ligne, repérées par leurs références (ou adresses)
obtenues en combinant numéro de colonne et numéro de ligne. Ainsi, A1 désigne la cellule se trouvant à l’intersection de la
1re colonne (colonne A) et de la 1re ligne (ligne 1). Les cellules peuvent contenir des nombres, des formules ou du texte, et
peuvent être mises en forme.
COURS DE IAG 2021 - 2022 145
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques :
Tableurs : Excel : Interface
On peut rajouter, supprimer, renommer des feuilles. Pour insérer : menu « insertion »
option « feuille » ou clic droit sur les noms des feuilles puis choisir « insérer »
Avec ce clic droit, on peut aussi « supprimer » une feuille ou la « renommer » pour lui
donner un nom explicite (fortement recommandé)
Avec le clic gauche (qu’on laisse appuyé), on peut aussi modifier l’ordre des
feuilles en modifiant leur ordre (déplacer les feuilles)
Notez que l’on peut se déplacer entre les feuilles avec les flèches sur la
gauche
COURS DE IAG 2021 - 2022 148
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs : Excel :
Entrer les données
@ On peut aussi insérer des données par copier/coller soit dans une seule cellule soit dans
plusieurs cellules si le texte copié comporte plusieurs lignes (touche entrée)
@ On peut aussi insérer une donnée pour une cellule avec la « boîte d’entrée » en dessous des
menus.
COURS DE IAG 2021 - 2022 149
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques :
Tableurs : Excel : Entrer les données
Cellule: une cellule est l’intersection entre une ligne (horizontale) et une
colonne (verticale).
D’un point de vue informatique, une cellule est une variable qui a un nom et
qui contient une valeur.
COURS DE IAG 2021 - 2022 151
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques :
Tableurs : Excel : Entrer les données dans les cellules
Colonne B
Cellule B3
Ligne 3
® Type:
Numérique: nombres, symbole de devise, …
Type alphanumérique
Type numérique
Type formule
façon dont le tableur va afficher la cellule, ex: le nombre de chiffres après la virgule
Il existe un format conditionnel, c-à-d qui dépend de la valeur de la cellule. Ceci permet par exemple de
changer la couleur des cellules d’une colonne dont les valeurs sont négatives.
Format:
Format:
Format alphanumérique:
Format numérique:
Formules :
Des opérateurs
Formules :
Les formules font référence à une autre cellule en utilisant ses coordonnées ou un nom défini par
l’utilisateur.
Référence absolue = utilisation des coordonnées absolues par rapport à l’origine de la feuille :
$lettre_de_colonne$numéro_de_ligne ex: $B$3
COURS DE IAG 2021 - 2022 163
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs : Excel : Entrer les
données
Formules :
Référence relative = utilisation des coordonnées par rapport à la cellule qui contient la formule
(cellule de référence) : la position relative est masquée, on visualise une référence absolue sans le
signe $ , ex: A8.
!!! Attention: lorsqu’on copie une cellule contenant une référence relative, c’est la position relative qui
est copiée.
COURS DE IAG 2021 - 2022 164
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques :
Tableurs : Excel : Entrer les données
Formules :
Exemple:
Produit
Prix HT
Prix TTC
Saisir la bonne formule dans la première case de la colonne Formule avec une adresse absolue et une adresse relative
Puis la recopier vers le bas
COURS DE IAG 2021 - 2022 166
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs : Excel : Entrer les
données
Une autre façon de procéder
(meilleure) serait :
de « nommer » la case qui
contient le taux de TVA
D’utiliser ce nom dans la
formule pour calculer les
TTC
Formules :
Vous pouvez créer une formule simple pour ajouter, soustraire, multiplier ou diviser les
valeurs de votre feuille de calcul. Formules simples commencent toujours par un signe
égal (=), suivi par les constantes qui sont des valeurs numériques et des opérateurs de
calcul
COURS DE IAG 2021 - 2022 169
TRAITEMENT INFORMATISE DES DONNEES GEOLOGIQUES
@ Outils informatiques des traitements des données géologiques : Tableurs : Excel : Entrer les
données
Arithmétiques: ils s’appliquent à des valeurs numériques et retournent des valeurs numériques : +, -,
*, /, ^
Relationnels: ils comparent deux résultats numériques et retournent une valeur logique; exemple:
égalité (=), différence (<>), infériorité stricte (<), supériorité stricte (>), infériorité (<=), supériorité (>=) …
Logiques: ils s’appliquent à des valeurs logiques et retournent des valeurs logiques;
négation NOT(), ET logique AND(), OU logique OR()
Les activités humaines génèrent des données. Il en a toujours été ainsi et, plus
notre civilisation se développe, plus le volume de ces données croît.
De nos jours, les données sont de plus en plus souvent gérées par des moyens
informatiques.
Dans les entreprises, on manipule souvent des données ayant la même structure.
Exemple2 : Liste des sondages de reconnaissance d’un gisement : pour chaque sondage, on
enregistre le nom (code), l’azimut, la profondeur, la localisation, l’inclinaison, la date de début, la
date de fin...
Le tri manuellement : plus le volume des données croît plus la gestion
manuelle devient difficile vue la masse et la complexité des données.
B - L’ère informatique
Dans un sens plus strict, une base de données est un ensemble de données, possédant les
caractéristiques suivantes :
Elles sont gérées par un logiciel appelé système de gestion de bases de données qui en gère
aussi le schéma.
COURS DE IAG 2021 - 2022 185
LES BASES DE DONNEES RELATIONNELLES
Bref : Une base de données BD, (database DB) est un ensemble de données, stocké
avec les caractères suivants :
Exhaustif : la base contient toutes les informations requises pour le service que l'on en
attend ;
Non redondant : la même information n'est présente qu'une seule fois (pas de doublons);
L'avantage majeur de l'utilisation de bases de données est la possibilité de pouvoir être accédées par
plusieurs utilisateurs simultanément.
Il existe des bases de données de toutes tailles, depuis les plus modestes :
une liste des numéros de téléphone utilisée par une seule personne,
la base des données commerciales d'une société à activités multiples, avec des Giga octets de
données.
COURS DE IAG 2021 - 2022 190
LES BASES DE DONNEES RELATIONNELLES
Une base de données relationnelle est une base de données divisée en unités
logiques appelées tables, en relation les unes avec les autres au sein de la base ;
Exhaustivité : la base contient toutes les informations requises pour le service que
l'on en attend ;
Unicité : la même information n'est présente qu'une seule fois (pas de doublons).
COURS DE IAG 2021 - 2022 191
LES BASES DE DONNEES RELATIONNELLES
Remarques :
Ces données doivent pouvoir être utilisées par des utilisateurs différents. Ainsi, la
notion de base de données est généralement couplée à celle de réseau.
Définir des "bases de données", et des relations entre les éléments de chaque
base ;
Pour pallier aux inconvénients des méthodes classiques de gestion de fichiers, les SGBD visent quatre objectifs
:
Ces objectifs exigent une distinction nette entre les
Intégration et corrélation ;
données et les procédures de manipulation de ces
Flexibilité (indépendance) ; données : aux données, on associera une fonction
d'administration des données, aux procédures de
Disponibilité ;
manipulation une fonction de programmation.
Sécurité.
Intégration et corrélation :
Dans les systèmes classiques, chaque application gère ses données dans ses propres fichiers, d’où :
La même donnée peut appartenir à plusieurs applications, induisant une déperdition de stockage ;
Toute modification de cette donnée est à enregistrer plusieurs fois : si cette mise à jour multiple n'est pas effectuée
correctement, les données deviennent incohérentes ;
Le coût de la mise à jour augmente du fait de la multiplication des entrées-sorties physiques.
Intégration et corrélation :
Intégration et corrélation :
Dans l'approche SGBD, un "réservoir" commun (intégration) est constitué, représentant une
modélisation (corrélation) aussi fidèle que possible de l'organisation réelle de l'entreprise :
Toutes les applications puisent dans ce réservoir, les données qui les concernent, évitant ainsi les
duplications ;
Mais le partage des données entre les utilisateurs pose le problème de la synchronisation des
accès concurrents.
Flexibilité ou indépendance
Dans les systèmes classiques, tout changement intervenant dans le stockage des données (support,
méthode d'accès physique) entraîne des modifications lourdes des applications correspondantes.
L'approche SGBD poursuit trois objectifs, pour assurer l’indépendance des données par rapport aux
traitements :
Flexibilité ou indépendance
Indépendance vis-à-vis des stratégies d'accès : l'utilisateur n'a plus à prendre en charge
l'écriture des procédures d'accès aux données. Il n'a donc pas à intégrer les modifications tendant
à optimiser les chemins d'accès (ex: création d'index).
COURS DE IAG 2021 - 2022 202
LES BASES DE DONNEES RELATIONNELLES
Sécurité
Intégrité, ou protection contre l'accès invalide (erreurs ou pannes), et contre l'incohérence des
données vis-à-vis des contraintes de l'entreprise.
Confidentialité, ou protection contre l'accès non autorisé ou la modification illégale des données.
Pour ne pas trop affecter les performances, la sécurité doit également être prise en compte dès la
phase de conception.
Disponibilité :
Le choix d'une approche SGBD ne doit pas se traduire par des temps de traitement plus longs que ceux des
systèmes antérieurs ;
L'aspect performance est donc crucial dans la mise en œuvre d'une base de données. Un tel objectif ne peut
être atteint que si la conception d'une base de données est menée de façon rigoureuse avec un découpage
fonctionnel adéquat. Les règles et contraintes inhérentes sont évoquées lors de l'apprentissage d'une
méthodologie d'analyse (exemple MERISE).
COURS DE IAG 2021 - 2022 204
LES BASES DE DONNEES RELATIONNELLES
L ’utilisation d’un SGBD suppose de comprendre (et donc de savoir utiliser) les fonctionnalités suivantes :
Optimiser les performances, par le réglage de l’organisation physique des données. Cet aspect relève plutôt de
l’administration et ne sera évoqué dans ce cours.
La méthode Merise (créée en France dans les années 1970) : utilise le système dit
d'entités- relations. Il s'agit d'un outil et d'une technique d'analyse permettant de construire
des schémas théoriques de raisonnement sur des applications tournant avec des bases
Méthode de données dite relationnelles (comme celles d'Access).
Merise
Dans ce cours nous ne présenterons qu'une partie de la méthode Merise: la méthode
Merise générale traite de l'intégralité de la conception de la base de données (elle ne
s'intéresse pas uniquement de la partie correspondant au stockage des données, mais
également à leur traitement).
4 phases :
La phase d'analyse qui est la phase essentielle qui consiste à étudier l'existant :
Que manque – t – il ?
COURS DE IAG 2021 - 2022 210
LES BASES DE DONNEES RELATIONNELLES
La phase d'analyse qui est la phase essentielle qui consiste à étudier l'existant :
Qu'est ce qui convient ou ne convient pas aux utilisateurs : interroger les futurs
utilisateurs : Qu'attendent-ils du futur SGBD ? Quelles sont les opérations qu'ils
désirent automatiser ?
Recueillir les informations existantes, étudier les divers liens qui peuvent exister entre
ces informations, mettre en évidence les règles de gestion employées ;
COURS DE IAG 2021 - 2022 211
LES BASES DE DONNEES RELATIONNELLES
La phase conceptuelle qui consiste à représenter l'organisation des données de manière générale. Elle aboutit sur la
création du modèle conceptuel des données (MCD) dans lequel les données sont représentées sous forme d'entités
liées entre elles par des relations.
Une Entité est un élément du problème et elle est définie par un ensemble de propriétés: chacune des propriétés est
l'un des éléments qui caractérise l'entité.
Il faut distinguer une entité et une occurrence d'entité (ou instance).
Une entité correspond au type général d'une donnée (ex : le type « roche ») alors qu'une occurrence d'une entité est
un représentant particulier de cette entité (la roche magmatique).
Après avoir fait une analyse aussi complète que possible du problème à informatiser, la construction du MCD se fait en
quatre étapes :
Construction des entités, choix des propriétés : On commence par donner un nom à chacune des entités et il faut ensuite
rechercher les propriétés de ces entités;
Choix des cardinalités : une fois les relations établies, il convient ensuite de caractériser le nombre de fois ou chacune de
ces relations peut apparaitre réellement. Ceci se fait à l'aide des cardinalités ;
Après avoir fait une analyse aussi complète que possible du problème à informatiser,
la construction du MCD se fait en quatre étapes :
Une société qui vend des produits de forage (couronne, fluide de forage, tiges,
trépan,…) veut informatiser la gestion des commandes de ses clients. Chaque
commande d’un client peut comporter plusieurs produits différents.
Après le repérage des entités, l’on doit donner un nom à chacune des entités et ensuite
rechercher les propriétés (ou attributs) de ces entités.
Une propriété est une donnée élémentaire que l’on perçoit sur une entité. Chacune des
propriétés d’une entité prend une valeur parmi une variété de valeurs possibles (le domaine de
l’attribut).
Une propriété peut être obligatoire ou facultative. On devra garder à l’esprit les points suivants :
COURS DE IAG 2021 - 2022 216
LES BASES DE DONNEES RELATIONNELLES
Toute propriété est élémentaire. Elle n’est pas la composition d’éventuelles propriétés plus petites :
plutôt qu’une propriété unique « adresse », il est préférable d’avoir des propriétés rue, code postal, ville,
pays....
Une propriété ne doit pas être "instable" ou "calculable" : si une propriété peut être obtenue par calcul
à partir d’autres éléments qui vont apparaître dans la base de donnée (notamment d’autres propriétés),
on ne doit pas la considérer : il est inutile d’avoir une propriété montant de la commande si celui-ci peut
être calculé à partir d’autres propriétés.
COURS DE IAG 2021 - 2022 217
LES BASES DE DONNEES RELATIONNELLES
Toute entité doit posséder une propriété particulière appelée sa clé (ou identifiant). Une clé doit
caractériser de manière unique chaque occurrence de l’entité. L’identifiant d’une entité est une
propriété de l’entité telle qu’à chaque valeur de la propriété corresponde une et une seule
occurrence de l’entité.
Par exemple, le nom de famille d’une personne ne peut pas être considéré comme une clé d’une
entité "personne" puisque deux personnes peuvent avoir le même nom de famille.
Le numéro de sécurité sociale est par contre tout à fait acceptable. Il vaut mieux éviter les identifiants trop
longs (on préférera un code de quelques chiffres à un intitulé d’une vingtaine de lettres par exemples).
Une « bonne » clé ne doit pas comprendre un sous-ensemble qui pourrait lui-même être une clé (notion
de minimalité).
si aucune des propriétés "naturelles" ne peut servir de clé, on en rajoute une artificiellement (par exemple
"CodeProduit" ou "IdClient").
Une entité se représente ensuite graphiquement sous la forme d’une boîte dans laquelle on
indique en titre le nom de l’entité suivi de toutes ses propriétés. On indique d’une manière
particulière l’identifiant.
Dans l’exemple de la gestion des commandes de la société, on peut construire les entités
suivantes (les propriétés sont indiquées après le nom de l’entité, l’identifiant est en gras) :
Clients : IdClient, nom, prénom, rue, code postal, ville, pays, tél, email....
Il est également possible de transformer la propriété « ville » de l’entité Clients, en une entité Villes dont
l’identifiant serait le code postal. On aurait dans ce cas quatre entités :
Clients : IdClient, nom, prénom, rue, code postal, pays, tél, email....
Dans la description de la situation à informatiser les relations correspondent souvent aux verbes.
Entité A Entité B
Identifiant A Identifiant B
Propriété 1 Propriété 1
Relation
Propriété 2 Propriété 2
Une relation est en général entre deux entités. Il est possible d’avoir des relations entre plus que deux entités.
Par exemple, une relation Vente entre Acheteur, Vendeur et Lieu pour une base de données de transactions
immobilières. Il est néanmoins souvent possible (et préférable!!!) de se restreindre à des relations entre deux
entités.
Dans le cas ici, la relation Vente pourrait être remplacée par une entité Acte de vente qui est en relation avec
l’acheteur, le vendeur et le lieu. Il est tout à fait possible d’avoir plusieurs relations entre deux entités.
COURS DE IAG 2021 - 2022 224
LES BASES DE DONNEES RELATIONNELLES
Construction des relations
Il est également possible d’avoir une relation dite réflexif, c’est-à-dire entre une entité et elle-même. Par exemple, on peut avoir une
relation Responsable entre une table employée et elle-même.
Dans ce cas, il convient tout de même de remarquer que chacune des "pattes" de la relation a une signification différente. Ici, l’une des
"pattes" signifiera est responsable de et l’autre signifiera a comme responsable.
A comme responsable …
EMPLOYES
IdEmployé
Responsable
Nom
Prénom Est responsable de …
Une relation peut avoir des propriétés. Par exemple, si une relation Comporte lie l’entité Commandes et
l’entité Produit, elle possède certainement la propriété "quantité" (une facture contient un produit x en quantité
y).
D’ailleurs, si une propriété dépend de plus d’une entité (comme c’est le cas ici avec la quantité qui dépend à la
fois de la facture et du produit), c’est certainement qu’elle dépend d’une relation, et non pas d’une entité.
Il faut éviter les relations que l’on peut déduire d’autres relations par transitivité.
Par exemple, dans une base de données gérant une université, si on dispose d’entités étudiant,
formation et cours.
On a les relations fait partie entre formation et cours (un cours fait partie d’une formation) et
inscription entre étudiant et formation.
Il est inutile d’avoir en plus une relation inscription entre étudiant et cours : tout étudiant inscrit à une
formation est systématiquement inscrit à tous les cours qui composent la formation.
Dans l’exemple de la gestion des commandes de la société, on a les relations suivantes. La relation «
commande comporte produits » a une propriété « quantité » qui correspond à la quantité d’un produit qui a été
commandé.
Une fois les relations établies, il convient ensuite de caractériser le nombre de fois où chacune de ces relations peut apparaître
réellement. Ceci se fait à l’aide des cardinalités. Dans une relation classique (i.e. entre deux entités), quatre cardinalités sont à
déterminer.
On a un lien fonctionnel n:1 de A vers B si toute occurrence de A détermine au plus une occurrence de B, et si à toute occurrence
de B, correspond un nombre quelconque d’occurrences de A.
Exemple : Dans une compagnie aérienne, connaissant le numéro d'un vol, on en déduit d'une manière unique la destination, mais
plusieurs vols peuvent avoir la même destination.
COURS DE IAG 2021 - 2022 229
LES BASES DE DONNEES RELATIONNELLES
Choix des cardinalités ou liens fonctionnels
On a un lien hiérarchique 1:n de A vers B si une occurrence de A peut déterminer un nombre quelconque d’occurrences de B et si, à une
occurrence de B, correspond au plus une occurrence de A.
Exemple : Dans une université donnée, un professeur peut dispenser des cours dans plusieurs matières différentes; de la
même façon, une matière peut être dispensée par plusieurs Professeurs.
min A est le nombre minimal de fois où une occurrence de l’entité A participe à une relation du type considéré. Il s’agit en
général de 0 ou 1.
max A est le nombre maximal de fois où une occurrence de l’entité A participe à la relation. Il s’agit en général de 1 ou n
(n pour plusieurs fois, ou un nombre quelconque de fois).
Notons qu’il est souvent difficile de choisir entre une cardinalité de type 0:n et une cardinalité de type 1:n. Dans le
premier cas, la participation à la relation est facultative pour les occurrences de l’entité, alors qu’elle est obligatoire
dans le second cas : toute occurrence de l’entité participe à la relation. Il faut toutefois souligner que ce choix a
souvent peu d’importance.
Pour illustrer la notion de cardinalité, prenons l’exemple d’une base de données destinée à enregistrer les mariages
entre les hommes et les femmes dans des sociétés ayant des régimes matrimoniaux différents. Nous avons deux
entités (les hommes et les femmes) et une relation (« est marié à ») avec une propriété « date du mariage ».
Les cardinalités minimales seront égales à 0 si l’on prend en compte tous les hommes et toutes les femmes (y compris les
célibataires) et à 1 si l’on ne prend en compte que les hommes et les femmes mariés. Les cardinalités maximales seront
différentes selon le régime matrimonial en vigueur :
Remarque : si seule la bigamie était autorisée, la cardinalité maximale pour l’entité Hommes serait 2 (et non pas n).
Autre exemple : la relation réflexive Responsable entre une table employés et elle -même.
Il faut distinguer le cas où un employé ne peut avoir qu’un seul supérieur hiérarchique direct du cas où il peut en avoir plusieurs (par
exemple le technicien informatique du SRI (Service des Ressources Informatiques de l'Unilu) a deux responsables hiérarchiques directs :
le directeur du SRI et le directeur local de la Coopération Universitaire de Développement CUD).
Quelques points particuliers sont à garder à l’esprit lors de la réalisation d’un MCD.
Il ne doit pas y avoir de redondance d’informations : une information quelconque ne doit pas être représentée plus d’une fois dans le
MCD.
Évitez autant que possible les relations entre plus de deux entités. Souvent, il est possible de remplacer la relation par une entité.
Restez dans la mesure du possible avec des cardinalités de valeurs 0, 1 ou n. Il est de toute manière souvent possible de se ramener à
ce cas dans les rares cas où des cardinalités d’un autre type semblent plus naturelles.
COURS DE IAG 2021 - 2022 237
LES BASES DE DONNEES RELATIONNELLES
Dans l’idéal, il faut trouver un bon compromis entre niveau de détail et "taille" de la base de données. Il est toujours
possible de multiplier les entités, mais il vaut mieux le faire que si cela a vraiment du sens et un intérêt dans le problème.
Par exemple, si on a une entité personne, on peut considérer l’adresse comme une entité séparée (reliée à personne
par une relation "habite à") ou comme une propriété de la personne (ce qui est fait usuellement).
En règle générale, il est plus économique de définir l’adresse comme une propriété, mais dans un cas où il est fréquent
que des personnes habitent au même endroit, la règle de non-redondance incite plutôt à utiliser une nouvelle entité.
Le modèle logique de données, ou MLD montre l'organisation des données sous forme de tables et
est très proche de la manière dont les données vont être effectivement organisées dans Access par
exemple. L'étape de transformation du MCD en MLD est assez simple et passe par trois étapes :
Suppression des tables inutiles: il s'agit essentiellement des tables à un seul champ (leur clé) ;
pour une relation de type 1:1 entre une entité A et une entité B se traduit par une importation de la clé primaire
de l'entité B dans la table de A, et on ajoute un lien entre les deux clés;
une relation autre (sans 1:1 se transforme en table dans laquelle on retrouve les clés primaires de A et B.
les tables inutiles sont supprimées : il s'agit essentiellement des tables à un seul champ (leur clé).
COURS DE IAG 2021 - 2022 240
LES BASES DE DONNEES RELATIONNELLES
Modèle logique de données : MLD
Cette transformation est directe : il suffit de recopier les entités. Il s’agit essentiellement d’un changement de vocabulaire :
A noter toutefois qu’il est essentiel qu’il n’y ait pas deux tables qui aient le même nom.
Modèle logique de données : MLD : Transformation des relations du MCD en liens du MLD.
le cas où l’une des branches de la relation a une cardinalité maximale de 1 (1:1 ou 0:1) , la transformation de la relation se fait de la
manière suivante :
On ramène dans la table correspondant à l’entité "du côté du 1:1" (ou du 0:1) la clé primaire de l’autre table ainsi que toutes les
On lie la clé primaire ainsi importée avec la clé primaire de la deuxième table;
Si la relation contenait des propriétés, celle-ci se retrouve également importées du côté du 1:1.
COURS DE IAG 2021 - 2022 242
LES BASES DE DONNEES RELATIONNELLES
A noter que la clé importée (ici Identifiant B qui se retrouve dans table A) ne devient
pas une clé de la table : c’est une propriété comme une autre. Notons aussi que le lien
se fait entre champs (on relie IdentifiantA à IdentifiantB) et non pas, comme dans le
MCD, entre les tables.
le cas où les deux branches de la relation ont une cardinalité maximale de n (1:n ou 0:n) : On crée une nouvelle table correspondant à
la relation. Cette table contient toutes les éventuelles propriétés de la relation.
On intègre à cette table les clés primaires des entités impliquées dans la relation;
On relie les clés primaires des tables avec les clés importées dans la nouvelle table;
On choisit enfin la ou les clés primaires de la nouvelle table. L’idée générale est que chaque occurrence de cette entité doit pouvoir
être identifiée de manière unique par ses clés primaires. Cela revient en général à choisir comme clé primaire l’ensemble des clés
importées des autres tables.
COURS DE IAG 2021 - 2022 244
LES BASES DE DONNEES RELATIONNELLES
Etape finale de la méthode Merise consiste à concevoir le Modèle physique de nos données. Il s'agit ni plus ni moins que d'intégrer le MLD au sein du
SGBD (Access).
Création de la base de données : il s'agit simplement d'ouvrir Access et de choisir Nouvelle base de données;
Création des tables : toutes les tables du MLD doivent être créées. Les données peuvent éventuellement provenir d'un logiciel extérieur (feuille Excel,
document textuel...). Il faut également spécifier le type de donnée que doit contenir chaque champ de la table et préciser quelle est la ou les clé(s) de la
table;
Création des liens : tous les liens qui apparaissent dans le MLD doivent apparaitre dans la base de données.
COURS DE IAG 2021 - 2022 246
LES BASES DE DONNEES RELATIONNELLES
Ce logiciel permet une conception aisée de bases de données de petite taille avec un nombre restreint d'utilisateurs.
Access est basé sur le modèle relationnel et fonctionnent sur le même principe général (comme les autres SGBD):
les informations sont stockées dans des tables qui sont reliées entre elles par des relations;
L'interrogation de la base de données se fait à l'aide de requêtes écrites à l'aide d'un langage : le SQL (Structured Query Language).
de permettre une écriture en mode graphique des tables, de leurs relations et de la plupart des requêtes.
Tables, pour stocker les données ; Pages, pour communiquer avec la BDD via un navigateur
(Internet Explorer uniquement) ;
Requêtes, pour retrouver les données ;
Macros, pour automatiser des opérations répétitives
Formulaires, pour saisir les données ou les visualiser à
effectuées sur la base ;
l'écran ;
Modules, pour rajouter des fonctionnalités grâce à de la
Etats, pour imprimer les données ; programmation en VBA (Visual Basic for Applications).
Soit la table est créée directement dans Access (avec ou sans aide);
Texte Ce champ peut contenir n'importe quel caractère < 256 caractères
alphanumérique (chiffre, lettre, signe de ponctuation). Ce type
de données est utilisé pour le texte, mais aussi pour les
nombres sur lesquels on n'effectue pas de calculs (code postal,
numéro de téléphone
Création de tables sous le SGBD Access :
type de données Numérique Données numériques (non monétaires) susceptibles d'être 1 à 16 octets
utilisées dans des opérations mathématiques
Date/Heure Données de date et/ou d'heure (pour les années comprises 8 octets
entre 100 et 9999)
COURS DE IAG 2021 - 2022 254
LES BASES DE DONNEES RELATIONNELLES
type de données Objet OLE Pour lier un objet extérieur, ou incorporer un objet dans la < 1 Go
base. Souvent utilisé pour les données multimédia. Peut servir
pour tout fichier binaire (document Word, feuille de calcul
Excel, etc.)
Mémo Le champ peut contenir n'importe quel caractère < 65.536 caractères
type de données
Taille du champ ;
Format : définit la manière dont les informations s'affichent. Exemple : le format monétaire affiche deux chiffres après la virgule, puis un espace
et le symbole de l'euro ;
Masque de saisie : guide la saisie des données et exerce un contrôle: le code postal français est composé de cinq chiffres ;
Légende : définit le nom de l'étiquette dans le formulaire associé à la table. Il est préférable d'implémenter cette propriété au niveau du formulaire
lui-même ; d'implémenter cette propriété au niveau du formulaire lui-même ;
Valeur par défaut : valeur qui s'affiche dans le champ avant saisie par l'utilisateur ;
Valide si : condition de validité du champ. Exemple : une notation sur 20 doit être comprise entre 0 et 20 ;
Message si erreur : ce message s'affiche si la condition de validité précédente n'est pas satisfaite ;
Null interdit : le champ correspondant ne peut rester vide lors de la saisie d'un enregistrement ;
Chaîne vide autorisée : le champ peut contenir une chaîne ne comportant aucun caractère ;
Indexé : un fichier index est associé au champ de telle sorte que les recherches d'information s'effectuent plus
rapidement ;
Compression unicode : un octet suffit pour saisir un caractère (pour les alphabets utilisés dans l'Europe de l'ouest et dans
le monde anglophone).
Propriétés de champs
Création et suppression de tables sous le SGBD Access : Création et suppression de tables sous le
sous SQL
SGBD Access : sous SQL
Création de table : clause CREATE TABLE
Création de table : clause CREATE TABLE
Syntaxe:
Exemple :
CREATE TABLE NOM_TABLE (CHAMP1 TYPE DONNEES
[NOTNULL], CHAMP2 TYPE DONNEES [NOT NULL], CREATE TABLE Sondages (DH_ID CHAR (15),
CHAMP3 TYPE DONNEES [NOT NULL], CHAMP4 TYPE Azimuth INTEGER (15);
DONNEES [NOT NULL], CHAMP5 TYPE DONNEES [NOT
NULL]);
COURS DE IAG 2021 - 2022 261
LES BASES DE DONNEES RELATIONNELLES
Pour supprimer la colonne que nous venons de créer, nous utilisons la commande suivante : ALTER TABLE Sondages
DROP DRILL
Pour empêcher un champ de rester vide, nous utilisons la clause NOT NULL :
Pour qu'un champ soit indexé sans doublons, nous utilisons la clause UNIQUE:
CREATE TABLE Sondages (DH_ID CHAR (15) UNIQUE, Azimuth INTEGER (15);
COURS DE IAG 2021 - 2022 263
LES BASES DE DONNEES RELATIONNELLES
Pour poser une clé primaire sur un champ, nous utilisons la clause : PRIMARY KEY:
CREATE TABLE Sondages (DH_ID CHAR (15) PRIMARY KEY, Azimuth INTEGER (15);
CREATE TABLE Sondages (DH_ID CHAR (15), Azimuth INTEGER (15), CONSTRAINT
essai_index PRIMARY KEY (DH_ID, Azimuth)
Avantages :
il accélère les recherches d'information. En effet, l'index est une représentation de la table, triée sur un champ donné. On peut donc lui
appliquer les méthodes connues de recherche rapide sur un ensemble ordonné (c'est le SGBD qui se charge de l'opération, laquelle est
transparente pour l'opérateur) ;
il est de taille très inférieure à celle de la table : on peut le remettre à jour en temps réel à chaque modification de cette dernière ;
il peut servir à empêcher l'opérateur de créer des enregistrements dupliquées en saisissant deux fois, par erreur, les mêmes données.
Inconvénients :
chaque fois que nous demandons au système de créer (et de maintenir) un index, nous augmentons sa charge de
travail, et par conséquent nous le freinons. Ainsi, les opérations de saisie et de maintenance sont ralenties par la
présence d'index, car ces derniers doivent être mis à jour immédiatement ;
un index occupe de la place en mémoire sur le disque. En fait, ce dernier argument a beaucoup perdu de sa valeur
avec le temps, parce que la mémoire de masse des ordinateurs ne cesse de croître rapidement, et qu'elle est
devenue si bon marché (son coût à l'octet est divisé par deux tous les deux ans environ) qu'on la gaspille
allégrement.
COURS DE IAG 2021 - 2022 266
LES BASES DE DONNEES RELATIONNELLES
Création des index
dans la colonne médiane, on écrit les uns sous les autres les noms des champs constitutifs de l'index ; constitutifs de l'index ;
dans la colonne de droite, on précise l'ordre de tri. Par défaut, on conserve "Croissant" ;
on clique sur le nom de l'index puis, dans la moitié inférieure de la boîte, intitulée "Propriétés de l'index", on fixe à "Oui" la
propriété "Unique" si l'on désire interdire les doublons.
N’indexez pas les colonnes qui retournent un pourcentage élevé de lignes de données lorsqu’elles
sont exploitées comme condition de filtrage dans la clause WHERE d’une requête;
N’indexez pas les colonnes dont vous modifiez souvent les entrées.
créer des sources de données pour les formulaires, les états ou même d'autres requêtes (on peut faire une
Types de requêtes:
La requête sélection : permet de sélectionner des enregistrements, de faire des calculs et des regroupements. Elles ressemblent
beaucoup aux filtres, mais permettent, en plus, de travailler sur plusieurs tables simultanément;
La requête d'Analyse croisée : présente ses résultats sous forme de tableau (de type Excel). Utilisée pour comparer des valeurs,
La requête de Création de table crée une table à partir des données qu'elle a extraites dans une ou plusieurs autres tables;
La requête Mise à Jour: modifie le contenu d'un ou plusieurs champs d'une ou plusieurs tables. C'est le moyen le plus efficace pour
Types de requête:
La requête Ajout : ajoute les données qu'elle a extraites à la fin d'une table déjà existante;
La requête Suppression : supprime un ou plusieurs enregistrements dans une ou plusieurs tables.
La requête UNION : combine les résultats de deux ou plusieurs requêtes ou tables indépendantes.
COURS DE IAG 2021 - 2022 275
LES BASES DE DONNEES RELATIONNELLES
Création de requêtes : Access nous propose 5 façons de créer une requête :
Assistant de Requête simple : crée une requête simple sur une ou plusieurs tables, on pourra, dans cette requête simple, faire des
Assistant de Requête d'analyse croisée : aide à la création d'une requête d'analyse croisée ;
Assistant de Requête trouver les doublons : Localise les enregistrements doublons dans une table ou une requête ;
Assistant de Requête de non - correspondance : localise les enregistrements d'une table auxquels ne correspond aucun autre
Types de requête
Création de requêtes
La ligne "Table" sert à sélectionner la table à laquelle appartient le champ sélectionné;
La colonne "Tri" indique de quelle façon vont être triés les champs dans le résultat de la requête : il y
a trois sortes de tri : Croissant (de A à Z), Décroissant (de Z à A) et non trié.
Exécuter la requête
Création de requêtes
Le résultat de la requête s'affiche sous la forme d'une table que l'on
des enregistrements, les modifier, faire des filtres, des tris, etc.
Création de requêtes
Les résultats des requêtes, même s’ils sont présentés sous forme de tables ne sont pas de
Ils ne sont qu'une "vue" faite à partir des tables qui ont servi à faire la requête.
Autrement dit, si vous modifiez quelque chose dans le résultat de la requête, la modification se
Les requêtes d'analyse croisée permettent de répondre à des questions du type "qui à commandé combien de quoi ?".
Elles retournent le résultat sous forme d'un tableau comportant des champs en abscisse et en ordonnée, avec, dans
On transforme la requête de sélection en requête d'analyse croisée en allant dans le menu "Requête" et en choisissant « Analyse croisée » ;
Dans cette ligne, on va indiquer si le champ qu'on a choisi va être l'entête des colonnes, l'entête des lignes ou la valeur contenue dans les cases du
tableau;
L'Opération pour les valeurs des cases dépend de ce qu'on cherche (i.e.: Somme ).
Exécutez la requête avec l 'icône point d'exclamation : la table va être créée avec le résultat de la requête ;
Si vous vous voulez vérifier avant de créer la table quel sera le résultat de la requête, cliquez sur l'icône:
Une fois que le résultat sera conforme à vos attentes, vous pourrez cliquer sur l'icône point d'exclamation.
COURS DE IAG 2021 - 2022 290
LES BASES DE DONNEES RELATIONNELLES
Access nous demande le nom de la table à laquelle il faut ajouter le résultat de la requête ;
Comme précédemment, avec les icônes Affichage et point d'exclamation, vérifiez et validez votre
requête.
COURS DE IAG 2021 - 2022 292
LES BASES DE DONNEES RELATIONNELLES
Attention:
Les enregistrements sont COPIES de la table source vers la table cible et non pas déplacés ;
Les deux tables doivent avoir des noms de champs identiques (et les mêmes types de données), les deux structures ne doivent pas nécessairement être
identiques ;
Si la table source comporte plus de champs que la table cible, les champs supplémentaires sont ignorés ;
Si la table source comporte moins de champs que la table cible, les champs dont les noms sont identiques sont copiés, les autres sont laissés vides ;
Access ne copie QUE les champs que vous avez déclarés dans la requête (d'ou le champ *).
Les requêtes mise à jour permettent de modifier rapidement tous les enregistrements d'une table ou
On crée une requête de sélection, et dans le menu Requête, on clique sur « Requête Mise à
Jour » ;
Un champ "Mise à jour" apparaît dans la requête, c'est là qu'on va indiquer la modification qui va
avoir lieu.
COURS DE IAG 2021 - 2022 295
LES BASES DE DONNEES RELATIONNELLES
Les requêtes suppression vous permettent de supprimer un groupe d'enregistrements qui répondent à un critère donné.
On crée une requête standard, puis dans le menu Requête, on clique sur Requête Suppression;
On exécute la requête ou on vérifie avant que le résultat est conforme à ce que l'on attend.
Attention:
Vérifiez bien le résultat avant d'exécuter la requête, il n'est pas possible de revenir en arrière après avoir effacé des
enregistrements.
COURS DE IAG 2021 - 2022 297
LES BASES DE DONNEES RELATIONNELLES
Il est possible de faire des requêtes qui portent sur plusieurs tables simultanément. Dans ce cas, les requêtes peuvent être
très complexes;
Toutes les tables intervenant dans la requêtes doivent être reliées entre elles, il ne doit pas y avoir de tables isolées, sinon,
Access va essayer de trouver lui -même les relations entre ces tables isolées et parfois le résultat peut être erroné;
Il ne doit pas y avoir de tables n'ayant rien à faire dans la requête, sinon, Access va se baser sur les relations entre ces
tables n'ayant rien à voir avec la choucroute et celles ayant à voir et va donner des résultats erronés.
Access met à notre disposition un très grand nombre de fonctions (pour en avoir la liste complète, consultez l'aide intégrée à Access). Ce sont les mêmes
fonctions que celles qui sont utilisé s dans les contrôles des formulaires (et d’ailleurs dans tous les logiciels de la gamme Microsoft Office) .
Notes:
On peut avoir plusieurs critères de sélection, ces critères étant séparés entre eux par des OU ou des ET.
Si deux critères sont séparés par des ET, on les place sur la même ligne;
Si deux critères sont s éparés par des OU, on les place sur des lignes différentes.
Les critères de chaque requête que nous avons fait étaient indiqués explicitement dans la requête.
Supposons maintenant que nous voulions faire une requête du type : « On cherche les essais géomécaniques qui ont été
On ne connaît pas par avance le nom de la roche, et on ne va pas préparer autant de requêtes qu'il peut y avoir de roches,
la solution la plus simple est alors de demander à l'utilisateur d'entrer le nom de la roche, et de faire la requête en fonction
de ce qu'il a entré.
Après 5 TD : Interrogation
Examen: Examen/10