Vous êtes sur la page 1sur 2

En informatique, la dduplication (galement appelefactorisation ou stockage d'instance

unique) est une technique de stockage de donnes, consistant factoriser des squences de
donnes identiques afin d'conomiser l'espace utilis.
Chaque fichier est dcoup en une multitude de tronons. chacun de ces tronons est associ
un identifiant unique, ces identifiants tant stocks dans un index. L'objectif de la dduplication
est de ne stocker qu'une seule fois un mme tronon. Aussi, une nouvelle occurrence d'un
tronon dj prsent n'est pas nouveau sauvegarde, mais remplace par un pointeur vers
l'identifiant correspondant.
La dduplication est utilise en particulier sur des solutions du type VTL (Virtual Tape Library) ou
tout autre type de systme de sauvegarde.

Mthodes de dduplication
Dduplication hors ligne
Les donnes sauvegarder sont recopies sur un espace disque tampon, et dans un deuxime
temps une recherche des blocs en double est ralise. Cette mthode ncessite un espace de
stockage important. C'est le principe des solutions Falconstor ou Quantum DXi en firmware 1.x
par exemple.

Dduplication en ligne
Les donnes sauvegarder sont analyses " la vole", et une table d'index des blocs identiques
est gre (solution Data Domain de EMC Corporation ou IBM ProtecTIER)1.

Dduplication la source
Des agents rpartis sur les serveurs sauvegarder analysent les donnes la source (solution
EMC Avamar notamment)1.

Principe
L'index cr lors de la sauvegarde est utilis pour restituer les donnes au bon endroit. Les
fichiers ou les blocs en double dans l'index sont dupliqus au moment de la restauration.
L'exprience montre qu'en pratique le taux de dduplication augmente dans le temps, car en
pratique peu de donnes changent entre deux sauvegardes totales. D'autre part le taux de
rduction obtenu dpend fortement du type de donnes traites 2.

Inconvnients de la dduplication

Risque de perte de donnes car les donnes ne sont pas en double et donc le support
utilis doit tre fiable. La rduction de la taille des sauvegardes est un avantage par rapport
d'autres types de sauvegarde, mais au dtriment de la scurit des donnes. Par
consquent, il est recommand de crer des doubles des supports de stockage.

Perte du format d'origine, ce qui dans certains cas pose des problmes de conformit aux
contraintes lgales (par exemple Ble II). Certaines solutions proposent pour cela de gnrer
les donnes sensibles sur cartouche au format initial, pour s'affranchir d'une ventuelle
dfaillance de la VTL par exemple.

Avantage de la dduplication

L'avantage le plus important est la rduction d'espace occup par les sauvegardes :
selon le cabinet Gartner, cette technologie permet de diviser par 20 voire par 30 les besoins
en espace de stockage3.

Un avantage indirect, consquence du prcdent, est la diminution de la bande passante


ncessaire la sauvegarde dans le cas de la dduplication la source 4.

Vous aimerez peut-être aussi