Vous êtes sur la page 1sur 24

Bases de Données

Hétérogènes

Didier DONSEZ
Université Joseph Fourier
IMA – IMAG/LSR/ADELE
'LGLHU'RQVH]#LPDJIU

2

Plan

■ Introduction
■ Architecture de SGBD-D Hétérogènes
■ Distribution - Hétérogénéité - Autonomie
■ Problèmes à Résoudre
'LGLHU'RQVH]

3

Rappel

■ BD Distribuée
• une collection de BDs logiquement reliées
et distribuées entre plusieurs sites
■ SGBD Distribué
• gère une BD-D et fournit les mécanismes d'accès
rendant la distribution transparente à l’utilisateur.

Site 1
Site 2

Réseau de
'LGLHU'RQVH]

Communication

Site 4 Site 3

4

Les Besoins des Applications

■ Applications traditionnelles (gestion)


• types de données simples
• données structurées
• accès rapide par ensemble
• partage et sécurité
• ÖBien supporté par les SGBDs relationnels
■ Nouvelles Applications (SID, CAO, IA, Médical, …)
• données complexes
• manipulation complexe
• règles
'LGLHU'RQVH]

• autre : schéma dynamique, multimédia, déclencheur, version


• ÖMal supporté par le relationnel

5

Les Développements Technologiques

■ Amélioration des communications


• Réseaux Locaux plus rapide
FDDI, Fiber Channel, Ethernet 100
• Réseaux longues distances plus rapides, plus surs, plus Etendus
Internet, lignes T1, RNIS, ATM

■ Amélioration des stations de travail


• Meilleur prix/performance
• amélioration des possibilités - station multiprocesseur
'LGLHU'RQVH]

6

Les Ilots d’Information de l’Entreprise

■ Développement des BDs indépendantes


• différentes machines : mainframes, minis, micros, stations de travail
• différents SGBDs : hiérarchique, relationnel, objet
• Besoins spécifiques des départements

■ Conséquences
• Redondance des données et inconsistance
• difficulté de localiser les données “utiles” et de les intégrer rapidement
■ Données “Utiles”
= consistantes, à jour, et facilement accessibles
■ Ö Intégration logique des données
'LGLHU'RQVH]

distribuées et hétérogènes de l’entreprise



7

L’Environnement Futur

• Relationnel ⇒ applications traditionnelles


• Modèles sophistiqués ⇒ applications avancées
• Héritage d’anciens systèmes (legacy systems)
• 45% des SGBDs sur Mainframe sont IMS (hiérarchique)
• De nombreuses applications utilisent encore des SGFs (VSAM)
• Intégration des systèmes "non-gestionnaires" de données
• Traitement de texte, Feuille de calcul, Traitement d’images.
'pFLVLRQQHO
• Utilisation du Web pour simplifier le développement des
applications
'RQQpHV 'RQQpHV 'RQQpHV &RQFHSWLRQ
)RXUQLVVHXU &R€W *HVWLRQ 3URGXFWLRQ
'LGLHU'RQVH]

6*%' 3DFNDJH 6*%' 6*%'


5HODWLRQQHO 6WDWLVWLTXH +LpUDUFKLTXH 2ULHQWp2EMHW

8
La Demande pour l’Interopérabilité entre
SGBDs
■ Conséquence de la Distribution, des Réseaux et des
SGBDs
• 3 développement de BDs indépendantes par différents groupes
d’utilisateurs
• 3 survivance des BDs existantes
• 3 accès aux BDs par différents outils
■ Difficultés
• de connaître l'
utilité et la localisation d’une donnée
• d'
intégrer rapidement des données hétérogènes
• de combiner l'activité d’outils hétérogènes
■ Interopérabilité
• Ö interaction intelligente entre des systèmes hétérogènes
'LGLHU'RQVH]

• ex : SGBD/feuille de calcul
• Ö combinaison des SGBDs, des systèmes répartis,
des traitements de textes, Ö

9

Les Objectifs des SGBDs Interopérables

• Interopérabilité des BDs existantes, distribuées


et hétérogènes au sien d’ un Multi-SGBD

• intégration de types de données conventionnels


ou non-conventionnels comme dans un SGBD-OO

• Interopérabilité avec des applications existantes


• Héritage de l’ existant

• Utilisation des composants logiciels existants


• extensibilité par la définition de méthodes d’ objets
'LGLHU'RQVH]

• Invoquer arbitrairement une application


et créer des combinaisons d’ invocation

10

L’architecture ANSI/SPARC

Utilisateurs

Schéma Vue Vue Vue


Externe Externe Externe Externe

Schéma Vue
Conceptuel Conceptuelle
'LGLHU'RQVH]

Schéma Vue
Interne Interne

11

L’architecture logique d’un SGBD-D

6(  6(  6( P

6&*

6&/  6&/  6&/ Q

6,/  6,/ 6,/Q


'LGLHU'RQVH]

12

L’architecture physique d’un SGBD-D

3URFHVVHXU8WLOLVDWHXU 3URFHVVHXUGH'RQQpHV

6FKpPD 6FKpPD 6FKpPD*OREDO 6FKpPD 6FKpPD


([WHUQH &RQFHSWXHO GH'LVWULEXWLRQ &RQFHSWXHO -RXUQDX[ ,QWHUQH
*OREDO GHV'RQQpHV /RFDO 6\VWqPHV /RFDO

5HTXrWHV

5HSULVHVXU3DQQH
3URFHVVHXU/RFDO
0RQLWHXU*OREDO
2SWLPLVDWLRQ
*OREDOHGHV

3URFHVVHXU
GH5HTXrWHV
G
([pFXWLRQ

G
([pFXWLRQ
8WLOLVDWHXU
,QWHUIDFH
8WLOLVDWHXU

6pPDWLTXH
&RQWU{OH

5HTXrWHV

/RFDOH
5pSRQVHV
'LGLHU'RQVH]

13

L’architecture logique de Multi-SGBD

6(  6(  6( P

6(/  6(/ N 6&* 6(/ Q 6(/ QN

6&/  6&/  6&/ Q

6,/  6,/ 6,/ Q


'LGLHU'RQVH]

14

L’architecture physique d’un Multi-SGBD

8WLOLVDWHXU

&RXFKH0XOWL6*%'

6*%' 6*%'

*HVWLRQGHV ,QWHUIDFH *HVWLRQGHV ,QWHUIDFH


7UDQVDFWLRQV 8WLOLVDWHXU 7UDQVDFWLRQV 8WLOLVDWHXU

2UGRQQDQFHXU 3URFHVVHXUGH 2UGRQQDQFHXU 3URFHVVHXUGH


5HTXrWHV 5HTXrWHV

5HSULVH 2SWLPLVHXU 5HSULVH 2SWLPLVHXU


VXU3DQQH GH5HTXrWHV VXU3DQQH GH5HTXrWHV
'LGLHU'RQVH]

3URFHVVHXU 3URFHVVHXU
G
([pFXWLRQ G
([pFXWLRQ

%DVHGH %DVHGH
'RQQpHV 'RQQpHV

15
L’architecture logique de Multi-SGBD -
sans SCG
6(  6( P

6(/  6(/ N 6(/ Q 6(/

6&/  6&/  6&/ Q

6,/ 6,/ 6,/Q


'LGLHU'RQVH]

16
L’architecture physique d’un Multi-SGBD
sans SCG
8WLOLVDWHXU 8WLOLVDWHXU

0XOWL6*%'  0XOWL6*%' P

3URFHVVHXU 3URFHVVHXU 3URFHVVHXU 3URFHVVHXU


,QWHUIDFH ,QWHUIDFH ,QWHUIDFH ,QWHUIDFH
&RPSRVDQW &RPSRVDQW &RPSRVDQW &RPSRVDQW

6*%'  6*%' Q 6*%' P 6*%' PN


'LGLHU'RQVH]

17

Les Dimensions du problème

■ Distribution
• bien maîtrisé
■ Hétérogénéité
• Plusieurs degrés
■ Autonomie
• Difficile
'LGLHU'RQVH]

18

Les différents degrés d'


Hétérogénéité

■ chaque BD est gérée par le même SGBD sur des


systèmes différents
• ex: ORACLE sur UNIX, VMS, DOS

■ chaque BD est gérée par un SGBD différent mais avec le


même modèle
• ex: ORACLE, DB2, INGRES

■ chaque BD est gérée par un SGBD différent avec un


modèle de données différent
'LGLHU'RQVH]

• ex: DB2 et IMS (problème pratique pour IBM)

■ chaque BD est une source de données structurées ou non



19

Les différentes Formes d’Autonomie

■ Autonomie de Conception
• un SGBD décide d’ une conception reliée ‡ ses propre besoins
• données, représentation, interprétation, implantation, Ö
• appelé Autonomie physique

■ Autonomie de Communication
• un SGBD décide de comment et avec quel autre SGBD il doit
communiquer

■ Autonomie d’Exécution
'LGLHU'RQVH]

• un SGBD peut exécuter des opérations localement de la manière qu’ il veut


• appelé Autonomie de Site

20

Les problèmes à Résoudre

■ Intégration de Bases de Données

■ Calcul des Requêtes

■ Gestion des Transactions


'LGLHU'RQVH]

21

intégration de Bases de données

• c'
est le processus d'
intégration conceptuelle
des informations provenant des différentes bases composantes

6&*

,QWpJUDWLRQ
GHV6FKpPDV ,QWpJUDWHXU
,QWHUPpGLDLUHV

7UDGXFWLRQ
GHV6FKpPDV 7UDGXFWHXU 7UDGXFWHXU 7UDGXFWHXUQ
/RFDX[
'LGLHU'RQVH]

%DVHGH %DVHGH %DVHGH


'RQQpHV 'RQQpHV 'RQQpHV
  Q

22

intégration de schéma

■ Pré-intégration
• identification des éléments reliées
• ex: domaines Equivalents
• spécification des règles de conversion
• ex: 1 pouce = 2,54 cm
• ex: salaire en $ <-> DM <-> £ <-> FF
■ Comparaison
• conflits de nommage
• synonymes, homonymes
• conflits structurels
• types, clés, dépendances
■ Conformité
'LGLHU'RQVH]

• résolution des conflits de noms et structurels


■ Fusion et Restructuration
• fusion des schémas intermédiaires
• fournir le “meilleur” schéma intègre

23

Calcul des requêtes

■ La complexité du calcul des Requêtes est élevée


• variations d'
un SGBD ‡ l'
autre
• pour les possibilités
• pour les coûts
• pour l'
optimisation
• difficulté de déplacer les données entre SGBDs
'LGLHU'RQVH]

24

Gestion de Transactions

• plusieurs transactions ‡ coordonner


• Terminaison des transactions, contrôle de Concurrences
■ Moniteurs Transactionnels
• OSI/TP, X/Open, OMG, ...
• Tuxedo, ...
'LGLHU'RQVH]