Vous êtes sur la page 1sur 30

INF2023

2020-2021
Université de
Yaoundé I

INF2023 : Introduction aux Bases


de données
Introduction générale et
définitions
Novembre 2020

Valéry MONTHE
valery.monthe@facsciences-uy1.cm
Bureau R114, Bloc pédagogique 1
Intervenants

• Valéry Monthé (Responsable)


– Bureau : R114, Bloc Pédagogique
– Email: valery.monthe@facsciences-uy1.cm

• Nicolas Nkondock
– Bureau : S208, Département d’Informatique
– Email: nicolas.nkondock@facsciences-uy1.cm

INF2023 || 2020-2021 Introduction Générale 11/11/2020 2


Déroulement du cours
• CM :
– Des séances de 3h
– Lieu : En ligne et en salle de cours
• TD/TP :
– Des séances de 3h
– Lieu : En ligne et en salle de cours
• TPE:
– Lectures
• Outils:
– Supports de cours
– Cahier de cours et TD
– Ordinateurs personnels
INF2023 || 2020-2021 Introduction Générale 11/11/2020 3
Règles du Cours
• Accès:
– Plus d’entrées possibles après 20 min
– Cas des séances en ligne : renseignez vos noms et prénoms
• Discipline:
– Respect, courtoisie, ponctualité et assiduité
– Cours en ligne :
• activer son micro sur autorisation,
• lieu calme, pas de vidéo, etc.
• Mail:
– près de 50 mails reçu par jour
– Objets de vos mails : [INF2023] au début de l’objet
– Exemple : [INF2023] : remise du TP N°1
• Remise de travaux : pénalité de 10% par jour de retard
INF2023 || 2020-2021 Introduction Générale 11/11/2020 4
Evaluations
• Présences : Prise en compte
• TD :
– Contrôle des exercices faits à domicile
– Petites évaluations basées sur des exercices de la fiche de TD
• CC:
– Contrôle continu écrit
• Examen:
– Examen écrit en salle
• TP:
– TP individuels
– Projets en groupes
INF2023 || 2020-2021 Introduction Générale 11/11/2020 5
Objectifs du cours
Apprendre :
1. La conception de bases de données
 Recueil des besoins : Questionnaire ou description informelle du système
 Identification des objets de gestion et modélisation
 Définition du schéma de la base de données
 Normalisation
2. L’utilisation d’un système de gestion de bases de données
 Implémentation des bases de données
 Manipulation des bases de données
o Ecriture des requête dans le langage SQL

INF2023 || 2020-2021 Introduction Générale 11/11/2020 6


Objectifs du cours
• Concepts de base autour des Bases de Données relationnelles
• Modélisation des données : modèle entité association (E/A)
• Normalisation de modèles
• Modèle relationnel et passage de modèle E/A au modèle
relationnel
• Algèbre relationnelle
• Le langage SQL
• Pratique des bases de données
– SGBG
– Création des bases de données
– Manipulation des bases de données
INF2023 || 2020-2021 Introduction Générale 11/11/2020 7
Compétences visées
• La conception et la modélisation des bases de données
• La Maîtrise des principales opérations de l’algèbre
relationnelle

• La Maîtrise des bases du langage SQL


• L’installation d’un SGBD (MySQL, PostgreSQL)
• L’ Implémentation des base de données
• Administration des bases de données

INF2023 || 2020-2021 Introduction Générale 11/11/2020 8


Contenu du Chapitre
1. Limites des systèmes de fichiers
2. Des fichiers au bases de données
3. SGBD : intérêt et fonctions
4. Niveaux d’abstraction des données
5. Processus de construction d’une base de données
6. Utilisateurs d’une base de données

INF2023 || 2020-2021 Introduction Générale 11/11/2020 9


Limites des systèmes de fichiers
Un premier exemple
Produit Quantité Fournisseur Adresse
Livres 200 Ma bourse Tsinga petit couloir
Cahiers 150 Le Génie Mokolo Dubaï
Masque 1540 Le coin santé Jouvance la belle
Vin Blanc 93 Zéro Alcool Rue des princes Essos
CD-Rom 80 Tech+ Château Ngoa Ekelle
Bière 120 Zéro Alcool Rue des princes Essos

 Si on souhaite mettre à jour l’adresse d’un fournisseur, il faut le


faire partout;
 Pour ajouter un fournisseur nouveau, il faut absolument des
valeurs de produit et de quantité;
 La suppression des livres ou masques fait perdre les
informations concernant les fournisseurs de ces produits
INF2023 || 2020-2021 Introduction Générale 11/11/2020 10
Limites des systèmes de fichiers
Un autre exemple
Résultats 2018/2019
Nom Matricule INF111 INF 112 INF113 INF121 ….. INF156
Samuel TSINGA 20U1250 INF125 16 08 10
Didier MOKOLO 20Z2654 INF178 14 16 14
Daniel JOUVANCE 18T2546 INF123 14 03,50 09
Bernard MELEN 18R2587 INF125 08 13,75 05
David ODZA 17F5801 INF118 13 11,25 18
Christophe NGOUSSO 20M0208 INF152 14 09,75 15,50

Résultats 2019/2020
Nom Matricule INF211 INF 212 INF213 INF221 ….. INF256
Samuel TSINGA 20U1250 INF125 16 08 10
Didier MOKOLO 20Z2654 INF178 14 16 14
Daniel JOUVANCE 18T2546 INF123 14 03,50 09
Bernard MELEN 18R2587 INF125 08 13,75 05
David ODZA 17F5801 INF118 13 11,25 18
Christophe NGOUSSO 20M0208 INF152 14 09,75 15,50

 Même données stockées dans plusieurs fichiers


 Gaspillage de l’espace de stockage
INF2023 || 2020-2021 Introduction Générale 11/11/2020 11
Limites des systèmes de fichiers
 Redondance et inconsistance des données
• Informations identiques répliquées dans plusieurs fichiers
• Accroissement inutile de l’espace occupé et des temps d’accès
• Risque d’inconsistance des données si les changements ne s’opèrent pas partout
 Difficultés d’accès au données
• Parcourir plusieurs fichiers pour reconstituer une informations
 Isolement des données
• Les données sont stockées sous différents formats.
 Type caractère dans un fichier et type entier dans un autre
• Grande difficulté d’écrire un programme d’accès général à toute l’information

INF2023 || 2020-2021 Introduction Générale 11/11/2020 12


Limites des systèmes de fichiers
 Difficultés/multiplicité des mises à jour des données
• Parcourir tous les fichiers pour réaliser les mises

 Perte d’information
• A la suite de la suppression d’une données.

 Sécurité
• La sécurité des données et les accès non-autorisés ne sont pas garanties

 Intégrité des données


• Difficulté d’imposer des contraintes. Par exemple : 0< note <=20

INF2023 || 2020-2021 Introduction Générale 11/11/2020 13


Des fichiers aux bases de données
 Solution : une banque de données commune, entièrement centralisée
• => Base de données (BD)

[Source : SGDB1 – IUT de Nice]

• Intégration et partage des données par les programmes


INF2023 || 2020-2021 Introduction Générale 11/11/2020 14
Approche gestion de fichiers
 Fichiers définis pour un ou plusieurs programmes ;
 Les données d'un fichier sont directement associées à un programme
par une description contenue dans le programme lui-même ;

 Aucune indépendance entre programme et données ;


 Toute modification de la structure de données nécessite la réécriture
des programmes.

INF2023 || 2020-2021 Introduction Générale 11/11/2020 15


Approche base de données
 Structuration et description des données sont unifiées et séparées
des programmes d'application ;

 La gestion des données (stockage, modification, recherche) qui est


étroitement dépendante de leur structuration est fournie par le
système de gestion des données ;

 Les applications ne communiquent avec les données qu'au travers


d'une interface de gestion.

 Indépendance entre données et applications (peuvent être


modifiées indépendamment) ;

 Le programmeur d'application (a fortiori l'utilisateur final) n'a pas à


connaître l'organisation physique des données.

INF2023 || 2020-2021 Introduction Générale 11/11/2020 16


Une base de données, c’est quoi?
 Un gros ensemble d’informations structurées et mémorisées
sur un support permanent
 Un gros ensemble de données en interrelations, logiquement
cohérentes, stockées et qui véhiculent une certaine
sémantique.
 Un ensemble de données modélisant les objets d’une partie du
monde réel et servant de support à une application
informatique
 Un ensemble structuré de données enregistrées avec le
minimum de redondance pour satisfaire simultanément
plusieurs utilisateurs.

INF2023 || 2020-2021 Introduction Générale 11/11/2020 17


Pourquoi étudier les BD?
 Avant , portée limitée
• Salariés d’une entreprise, données bancaires, etc…

 Aujourd’hui, un peu partout


• Web : sites marchands, réseaux sociaux, ...
• finance: applications financières, gestion de comptes, …
• économie : e-commerce, services de ventes/achats, ...
• industrie: gestion de centrales nucléaires, chaînes de production, …
• transports: réservation de billets, gestion de trains/avions, ...
• science: données d'expérimentation,...
• services publiques: impôts, police, …

INF2023 || 2020-2021 Introduction Générale 11/11/2020 18


Système de gestion de bases de données
Pour implémenter et gérer les Bases de données on utilise les
SGBD.
 Un système de gestion de bases de données (SGBD) : est un
ensemble de programmes(logiciels) permettant/facilitant la
création et l’utilisation d’une base de données.
Ils sont nombreux :
 PC :
 dBase, FoxPro, Access, Paradox
 Serveur :
 Oracle, SQL Server, MySQL, PostgreSQL, DB2, Sybase, Informix, Ingres

INF2023 || 2020-2021 Introduction Générale 11/11/2020 19


Les fonctions d’un SGBD
Un SGBD assure :
 la description des données : masquer les aspects de stockage
(indépendance logique et physique) ;
 la recherche(trouver) et la mise à jour(insérer, supprimer, modifier)
des données ;
 la sûreté des données : vérifier les droits d'accès des utilisateurs,
crypter les informations sensibles ;
 la sécurité des données : sauvegarder et restaurer les données,
limiter les erreurs de saisie, de manipulation ;
 l'intégrité des données : définir des règles qui maintiennent
l'intégrité des données (contraintes d'intégrité) ;
 la concurrence des accès : détecter et traiter les cas où il y a conflit
d'accès entre plusieurs utilisateurs.
INF2023 || 2020-2021 Introduction Générale 11/11/2020 20
Niveaux d’abstraction des données
Un SGBD assure :
 la description des données : masquer les aspects de stockage (indépendance logique et physique) ;

Vue 1 ou Vue 2 ou Vue 3 ou


sous-schéma 1 sous-schéma 2 sous-schéma 3 Niveau externe

Schéma
conceptuel Niveau logique ou conceptuel

Schéma interne Niveau interne ou physique

INF2023 || 2020-2021 Introduction Générale 11/11/2020 21


Niveaux d’abstraction des données
 Niveau externe
• Décrit la façon dont les données sont perçues par un programme d’application
• Présente les données sous plusieurs vues
• Décrit des contenus spécifiques de la BD qui peuvent être des structures complexes
• La vue permet d’obtenir l’indépendance logique
• La modification du schéma logique n’entraine pas la modification des applications
(mais la modification des vues nécessaire)
• Chaque vue correspond à la perception d’une partie des données (sous-schéma)
• Une vue peut aussi être une synthèse de données à partir des informations
représentées dans la BD

INF2023 || 2020-2021 Introduction Générale 11/11/2020 22


Niveaux d’abstraction des données
 Niveau logique (conceptuel)
• Décrit de façon abstraite mais fidèles la réalité du domaine d'application.
• Contient la description des données et des contraintes d’intégrité
• Le schéma logique découle d’une activité de modélisation
• C’est donc le niveau qui permet de décrire toute la BD :
 Les entités
 Les types de données
 Les relations
 Les contraintes
 Etc.
• Rend transparent la complexité du niveau physique
 Il utilise des structures relativement simple qui sont très complexes au niveau physique

INF2023 || 2020-2021 Introduction Générale 11/11/2020 23


Niveaux d’abstraction des données
 Niveau physique (interne)
• Correspond aux structures de stockage et aux moyens d’accès
• Le schéma physique spécifie comment les données sont enregistrées sur les
mémoires secondaires

INF2023 || 2020-2021 Introduction Générale 11/11/2020 24


Construction d’une base de données
1. Analyse des besoins Problème
du monde
Observer le monde réel réel

2. Identifier les informations pertinentes


Modélisation des données
Formaliser les besoins

3. Implémentation des données et des


procédures d’interrogation et de mise à
jour
BD proprement dite

INF2023 || 2020-2021 Introduction Générale 11/11/2020 25


Construction d’une base de données

[Source : notes de cours de Camelia Constantin]

INF2023 || 2020-2021 Introduction Générale 11/11/2020 26


Construction des BD : Quels outils ?
1. Analyse des besoins
• Discussion « informelle »
• Découle sur une documentation technique
• Enquête/interview, études des procédures de l’entreprise, etc.
2. Modélisation des données
• Identification des objets métiers devant servir à répondre aux besoins
• Traduction des besoins en des concepts de bases : entités métiers et relations
entre elles
• Représentation abstraite et sémi-formelle d’une réponse aux besoins
• Utilisation de méthodes et langages de modélisation
3. Implantation des données (mise en œuvre de la BD)
• Langages compréhensibles par la machine

INF2023 || 2020-2021 Introduction Générale 11/11/2020 27


Utilisateurs d’une Base de données
Administrateur : Gère le système dans son ensemble
• définition du schéma original de la base
• choix des structures de données et des méthodes d'accès au niveau physique
• modifications éventuelles du schéma et de l'organisation en fonction de
l'évolution de la BD
• Gestion des droits d'accès et des privilèges des utilisateurs
• spécification des contraintes d'intégrité
• sauvegardes et restaurations
• programmation (ou acquisition) d'applications

INF2023 || 2020-2021 Introduction Générale 11/11/2020 28


Utilisateurs d’une Base de données
Développeur d’application :
• Construit (avec l’utilisateur) le schéma conceptuel
• Définit et gère le schéma logique et les vues
• Conçoit et implémente des applications qui accèdent à la BD

Utilisateur final :
• Accède à la BD à travers des interfaces des applications
• Des requêtes en langage de manipulation de données (pour les plus experts)

INF2023 || 2020-2021 Introduction Générale 11/11/2020 29


Bibliographie et ressources
Ouvrages recommandés
• G. Gardarin, Bases de Données-Objet et Relationnelle,Eyrolles. 2001
• C.J. Date. Introduction aux Bases de Données. Vuibert Informatique.
2000
• J. Akoka, I. Comyn-Wattiau. Conception des Bases de Données
Relationnelles en Pratique : Concepts, Méthodes et Cas Corrigés.
Vuibert Informatique. 2001
Notes de cours et autres références
• Camelia Constantin, Bases de données, UFR919
• Thierry Lecroq, Base de données, Université de Rouen.
• Concepts et langages des BD relationnelles, IUT de Nice
• Amélie Gheerbrant, Bases de données, Univ Paris Diderot
• Mohamet Chériet, Base de données, ETS

INF2023 || 2020-2021 Introduction Générale 11/11/2020 30