Vous êtes sur la page 1sur 35

Systèmes

d’information
Ecole Nationale Supérieure de
Génie Mathématiques et
Modélisation (ENSGMM)

M. Abel KONNON
Maître de Conférences

Cours de Semestre 9/ Cycle d’ingénieur


E-mail: mkonnon@gmail.com
© 2024
Objectifs d’apprentissage

▪ Objectif général:
La présente UE vise à permettre à l’apprenant d’approfondir ses
connaissances sur les concepts de base de données et d’être initié aux
fouilles de données
▪ Objectifs spécifiques :
A la fin de l’UE, l’apprenant doit être capable de :
− décrire les enjeux des bases de données
− distinguer les différents types de bases de données
− Mettre en œuvre les techniques d’extraction d’information à partir
de grandes masses de données
− choisir la bonne méthode d’analyse de données en fonction des
besoins
− intervenir les différentes étapes de mise en œuvre d’entrepôt de
données

©mkonnon@gmail.com 2
Avant-propos

▪ Attentes:
• modéliser les BD
• comprendre les relations entre les classes de données
• déployer les bases de données
• maitriser les concepts de système d’information
• administrer les BD
• utiliser les BD dynamiques
• appliquer les principes d’entrepôt de données

AABD©mkonnon@gmail.com 3
Avant-propos

▪ Pré-requis:
• Cours d’initiation à l’informatique
• Initiation aux bases de données
• Optimisation et statistique multivariée
• Théorie des graphes

AABD©mkonnon@gmail.com 4
Chapitre 1

Notions fondamentales
I. Généralités sur les données
II. De nouveaux besoins en gestion de données
III. Fondements des systèmes NoSQL
IV. Principaux modèles de BD NoSQL

AABD©mkonnon@gmail.com 5
I-Généralités sur les données

1.1 Définitions des termes clés

Les définitions utilisées dans le présent support de cours


sont tirées de: site officiel du Centre National de
Ressources Textuelles et Lexicales de la France,
(http://www.cnrtl.fr/definition)

et d’autres publications scientifiques accessibles en ligne

AABD©mkonnon@gmail.com 6
I- Généralités sur les données

1.1 Définitions (1)


Donnée:

Ensemble des indications enregistrées en machine pour permettre

l'analyse et/ou la recherche automatique des informations.

CROS-GARDIN, 1964

Illustration: Banque de données; données documentaires, données lexicales.

Donnée = signe + Code

AABD©mkonnon@gmail.com
I- Généralités sur les données

1.1 Définitions (2)

Système:

• Ensemble ou sous-ensemble d'éléments, de symboles définis par des


relations qu'ils entretiennent entre eux
• Ensemble d'éléments organisés destiné à une fonction définie
www.cnrtl.fr

Système = ensemble d’éléments reliés entre eux en interactions


dynamiques et constituant un tout cohérent et fonctionnel compris dans
un ensemble plus grand

AABD©mkonnon@gmail.com
I- Généralités sur les données

1.1 Définitions (3)

Base de données (database en anglais):


Permet de stocker et de retrouver l'intégralité de données brutes ou
d'informations en rapport avec un thème ou une activité ; celles-ci
peuvent être de natures différentes et plus ou moins reliées entre elles.

(en)Colin Ritchie, Database Principles and Design, Cengage Learning EMEA - 2008,
(ISBN 9781844805402)

Base de données = ensemble structuré ou semi–structuré de données


sous-tendu par un modèle

AABD©mkonnon@gmail.com 9
I- Généralités sur les données

1.1 Définitions (4)

SGBD (DBMS):
Système de Gestion de Bases de Données
(Databases Management System)

logiciel permettant de stocker et d’interroger un ensemble de


données à un niveau d'abstraction élevé (modèle logique de
données).

Il est aussi un outil permettant de modéliser et de gérer des


données.

AABD©mkonnon@gmail.com
I- Généralités sur les données

1.2 Différence entre certaines notions

11
I- Généralités sur les données

1.2.1 Base de données vs Système de fichiers

Fichier: une suite de données structurée (souvent sous la forme


d'une liste d'enregistrements suivant un même format), portant un
nom et codé sur un support.

Système de fichiers: une façon de stocker les informations et de les


organiser dans des fichiers sur des mémoires secondaires (matériel
informatique - mémoire de masse : disque dur, disque SSD, CD-
ROM, clé USB, disquette, etc.)

Illustration: système de fichier d’un système d’exploitation


Historique: https://fr.wikipedia.org/wiki/Système_de_fichiers 12
I- Généralités sur les données

1.2.1 Base de données vs Système de fichiers

Une base de données Un système de fichiers


est orientée est une structure
organisation arborescente de
et répertoires constitués de
gestion de données fichiers

Filtres variables en fonction du Chemin d’accès défini


schéma de la BD

13

Programme logicielle
I- Généralités sur données

1.2.2 Base de données vs Banque de données

Une base de données Une banque de données

▪ Structuration et ▪ Structuration non


modèles obligatoires nécessaire
▪ Volume indifférent ▪ Volume important

14
I- Généralités sur les données

1.3 Historique

15
I- Généralités sur les données

1.3 Historique (1)

➢ Jusqu’à 1965 : uniquement des systèmes de fichiers


➢ À partir de 1965 : création d’une notion de « superstructure
unique », hiérarchisée (modèle hiérarchique)

Inconvénient : consommation excessive de temps et d’espace pour


la gestion de l’ensemble.

16
I- Généralités sur les données

1.3 Historique (2)

➢ Vers 1968 : mise en place d’un modèle réseau


➢ 1971: naissance du modèle relationnel sur la base des
recommandations de E. F. Codd (modèle OLAP)

➢ En 1984: 1500 bases de données accessibles au public (160 en


France).
➢ À partir de 1984 : miniaturisation des SGBD relationnels et
Intégration sur les microordinateurs
17
I- Généralités sur les données

1.3 Historique (3)

➢ Vers 1988 : introduction des premières bases de données


orientées objet.
➢ Après 1990 :
• Essai des bases de données déductives
• Création des bases de connaissances
➢ Arrivée du Web (1995):
• Généralisation des SGBD relationnels.
• Notion de SGBD serveur.
• Retour et généralisation des bases documentaires 18
I- Généralités sur les données

1.3 Historique (4)

➢ Vers 1998: adoption à grande échelle d’UML


La modélisation orientée objet intègre le relationnel.
➢ Depuis 2000 : avec le Web 2.0 intégration de toutes les
formes de stockage :
• ontologies (structures hiérarchisées de connaissances),
• bases de données relationnelles (serveurs et autres),
• bases de données objets (pour les applications),
• bases documentaires (le concept de structure est fondamental).
19
I- Généralités sur les données

1.4 Architecture SGBD

20
I- Généralités sur les données

1.4 Architecture ANSI-SPARC d'un SGBD (1975)

• Externe (vues)
• description des entités et
associations vues par un utilisateur Vue Vue Vue
(ou un groupe d’utilisateurs) externe externe externe

• Conceptuel ou logique
• description des entités et conceptuel
associations du monde réel

• Interne ou physique
• implémentation physique des Interne ou physique
entités et associations dans les fichiers

AABD©mkonnon@gmail.com 21
I- Généralités sur les données

1.4 Architecture SGBD: NIVEAU EXTERNE

• Correspond à la vision de l'utilisateur (de l'application) sur


la BD
– Plusieurs applications peuvent exister au-dessus des
mêmes données
– Chacune peut avoir besoin d'une vision différente de la
base de données
• S’appuie sur le modèle conceptuel de données
• Niveau conceptuel des données
– Description générale des données, indépendante d'un
SGBD particulier
– Modèles conceptuels: entité-association, etc
AABD©mkonnon@gmail.com 22
I- Généralités sur les données

1.4 Architecture SGBD: NIVEAU LOGIQUE

Langages offerts par le niveau logique


• Langage de description de données (LDD): schémas de
données utilisées
• Langage de manipulation de données (LMD):
modification des données
• Langage de requêtes (LR): interrogation des données

PS: SGBD relationnel utilise un seul langage pour les trois


besoins: SQL

AABD©mkonnon@gmail.com 23
I- Généralités sur les données

1.4 Architecture SGBD: NIVEAU PHYSIQUE

• Représentation concrète (physique) des données dans une BD


– Stockage sur disque
– Structures d’indexation
• Opérations réalisées par le SGBD sur cette représentation
physique pour implémenter les opérations logiques
– Accès aux données, gestion sur disque des données / des index
– Partage de données et gestion de la concurrence d'accès
– Reprise sur pannes (fiabilité)
– Distribution des données et interopérabilité (accès aux réseaux)

AABD©mkonnon@gmail.com 24
II- Problématique

1.5 Algèbre relationnelle

25
I- Généralités sur les données

1.5 Algèbre relationnelle

Définition:
Ensemble d'opérateurs agissant sur des relations et
produisant des relations

Opérations usuelles:
Sélection, projection, produit cartésien, jointure, différence,
union etc.
Notion de requête:
Requête =composition d'opérateurs algébriques
= expression procédurale
Ex . ∏Proprietaire(σAnnee<1989(VEHICULE))
AABD©mkonnon@gmail.com 26
I- Généralités sur les données

1.5 Algèbre relationnelle : calcul relationnel

Définition
Expression déclarative des requêtes (formules logiques du
premier ordre)

Notion de requête:
Requête = formule logique
Ex. {v.Proprietaire | VEHICULE(v) ∧ v.Annee<1989}

AABD©mkonnon@gmail.com 27
I- Généralités sur les données

1.5 Algèbre relationnelle : langage SQL

Le langage SQL
– est basé sur le calcul relationnel - déclaratif
– assure une expression plus facile à maîtriser que les
formules logiques
– est plus puissant: ajout d'opérations sans équivalent dans
l'algèbre (groupement, agrégation, tri, etc.)

Ex. SELECT v.Proprietaire FROM VEHICULE v WHERE


v.Annee<1989

AABD©mkonnon@gmail.com 28
I- Généralités sur les données

1.5 Le rapport SQL – algèbre relationnelle

• SQL: langage de haut niveau, déclaratif, adapté aux utilisateurs


• Algèbre: langage procédural, adapté à l'exécution par le
système
• Principes :
– les requêtes SQL sont traduites par le système en expression
algébrique (plan d'exécution)
– et ensuite exécutées (après optimisation)

AABD©mkonnon@gmail.com 29
I- Généralités sur les données

1.6 Problématique

30
I- Généralités sur les données: problématique

1.6.1 Intérêt des architecture C/S de 2e génération

• Réduction des transferts réseaux


non nécessité de monter les données dans le client pour les
modifier
appel de services plus compact
• Distribution automatique des applications
développement sur le poste de travail
partitionnement par tirer-déposer (drag & drop)
• Simplification des outils de développement
principe de la fenêtre unique
modélisation uniforme des objets applicatifs
invisibilité du modèle de données à l'extérieur du serveur
31
I- Généralités sur les données: problématique

1.6.1 Intérêt des architecture C/S de 3e génération

• Intégration du Web et du client-serveur


navigateur à présentation standard pour le client
possibilité de petites applications (contrôles) sur le client
très grande portabilité (Intranet, Internet)
• Architecture à 3 strates (3-tiered)
Base de données avec procédures stockées
Services applicatifs partagés et objets métiers (EJB, ActiveX)
Présentation hypertexte multimédia avec contrôles
• Support de l'hypermédia
types de données variées et extensibles (texte, image,vidéo)
hypertexte et navigation entre documents et applications 32
I- Généralités sur les données: problématique

1.6.2 Problématique des BD relationnelles

Quelques insuffisances du modèle relationnel


• La manipulation de structures relationnelles par des langages
objets entraîne une impedance mismatch, c'est à dire un décalage
entre les structures de données pour le stockage et les structures
de données pour le traitement (ce qui implique des conversions
constantes d'un format à l'autre)

• Les types de données disponibles sont limités et non extensibles

• Le SQL doit toujours être combiné à d'autres langages de


programmation pour être effectivement mis en œuvre 33
I- Généralités sur les données: problématique

Évolution des besoins de l'entreprise


Augmentation de productivité, de réactivité

Comment ?
• Augmenter la flexibilité et assurer de faibles coûts?
• Assurer les besoin de décisionnel et transactionnel
− sur de gros volumes?
− et des données complexes?

34
I- Généralités sur les données: problématique

Évolution des technologies


Systèmes ouverts permettant l'usage de standards
Environnements de développement graphiques plus répandus

Comment?
• Assurer l’augmentation de la puissance des serveurs?
• Garantir des transactions (ensembles d’opérations
élémentaires) pour ?
−la gestion de la concurrence,
−l’isolation entre utilisateurs,
−la reprise sur panne 35

Vous aimerez peut-être aussi