Vous êtes sur la page 1sur 41

La compression des donnes

But : Rduire le volume de donnes

Les avantages :
Gain en espace de stockage :
- Sur le disque - En mmoire

Gain en temps sur les lectures/critures :

- Moins de donnes lire/crire physiquement sur disque - Compression + criture plus rapide quune criture des donnes brutes - Lecture + dcompression plus rapide quune lecture des donnes brutes

Gain sur les temps de transmission

- Moins de donnes transmettre - Compression + envoi / rception + dcompression plus rapide quune transmission des donnes brutes

Les avantages :
Stockage :
- Une image JPEG se compresse facilement 90% - Un fichier HTML compress en GZIP se comprime facilement 50% de sa taille originale

Les avantages :
Gain en temps sur les lectures/critures :
- Temps pour crire une image de 14Mo: 5s (soit 2,8Mo/s) - Temps pour compresser une image de 14Mo en JPEG: 3,4s, soit 6,5Mo/s, rsultat: 503Ko (soit 4% de loriginal) - Temps pour crire une image JPEG de 503Ko: 0,2s - Temps total compression + criture: 3,6s, soit 1,4s de moins (gain de 24% en temps et 96% en volume stock sur disque).

Les avantages :
Gain sur les temps de transmission
- Temps de transmission 56Kbps/s dun fichier HTML de 30Ko: 5,4s - Temps de compression du fichier HTML au format GZIP : 0,05s (soit 600Ko/s), taille compresse: 15Ko (gain de 50% en volume)

- Temps de transmission de lHTML compress : 2,7s


- Temps total compression/transmission/dcompression : 2,8s, au lieu de 5,4s, soit un gain de prs de 50% en temps.

Les diffrents types de compression :


Les compressions textuelles :
- Les donnes dcompresses sont exactement les mmes que les donnes originales - On peut compresser/dcompresser les donnes autant de fois que lon veut : Exemple: fichiers ZIP

Les compressions destructrices :


- Les donnes dcompresses ne sont pas exactement les mmes que les donnes originales - Les compressions/dcompressions successives dtruisent petit petit les donnes Exemple: images JPEG, vido MPEG, musiques MP3

Principe de la compression textuelle :

Supprimer la notion doctets, voire mme de bits


Rechercher et liminer les rptitions

Principe de la compression textuelle :

- Supprimer la notion doctets ou de bits


Un octet contient 8 bits, mais souvent on ne se sert que de 7 bits voire mme de moins. Exemple: un code barre est compos dune douzaine de chiffres (12 octets en texte ASCII), chaque chiffre a une valeur de 0 . 9, soit moins de 4 bits utiles. En codant chaque chiffre sur 4 bits, on gagne dj 50% en volume (6 octets au lieu de 12)

Principe de la compression textuelle :

- Rechercher les rptitions


Certaines informations sont plus souvent prsente que dautres dans les donnes que lon veut compresser. Exemple: Dans un fichier HTML, on trouvera beaucoup de signes < , / , et > . On va chercher coder les donnes se rptant souvent sur moins de bits, et les donnes moins frquentes sur plus de bits.

Principe de la compression textuelle :

- Supprimer les rptitions


On va chercher largir la rduction des rptitions des groupes doctets plutt que des octets simples.

Exemple: dans un fichier HTML, on trouvera souvent des balises comme <B> </B>, que lon cherchera coder comme en bloc.
Principe utilis par les compressions Lempel-Ziv, zip, gzip

Principe de la compression destructive :

Elles se basent sur la perception que lon a de linformation et vont liminer les informations que nous ne pouvons pas percevoir.
Exemple: avec JPEG, les informations de couleur sont codes avec moins de prcision que les informations de luminosit car loeil humain est moins sensible aux couleurs qu la luminosit

La compression GIF :

Ce nest pas une compression destructrice mais : Elle est limite une palette de 256 couleurs (forme de destruction dinformation pour les images originales contenant plus de 256 couleurs) Inadapte aux images "photographiques"

La compression JPEG :

JPEG = Joint Photographic Expert Group Elle est adapte la compression dimages photographiques , cest dire en ton continus. Le principe : Limage est dcoupe en carrs de 8x8 pixels. Pour chaque carr, une luminosit et une couleur moyenne sont calcules, puis la variation de luminosit et de couleur de chaque pixel est code en zig-zag en partant du coin haut-gauche.

La compression JPEG :

Avantages Pas de notion de palette de couleurs, cest un codage frquentiel (analyse des frquences) Code "progressif" possible (on encode en plusieurs passes, chaque passe tant de plus en plus dtaille) Permet de choisir un rapport compression/qualit

La compression JPEG :

Inconvnients Le dcoupage en carrs de 8x8 pixels fait rapidement apparatre des dfauts la frontire de ces carrs. Inadapt aux images non "photographiques (graphiques)

Pas de gestion de transparence (canal alpha par exemple)

La compression JPEG :

JPEG 2000: lvolution de JPEG Bas sur la compression par ondelettes Plus de dcoupage en 8x8 pixels Meilleure compression et de meilleure qualit

En cours de standardisation
Format "options"

La compression MPEG :

Elle est adapte la compression de squence dimages (films, vido) Le principe : Chaque image est compresse avec un systme proche du JPEG (dcoupage en carrs). A cela sajoute une dtection des mouvement et des parties fixes de limage. Utilise par les DVD, les chanes numriques, certains appareils photo numriques, ou camscopes/magntoscopes numriques.

La compression MPEG :

Comme JPEG, on peut choisir le rapport compression/qualit. Mme genre de dfauts lis au dcoupages des images en blocs de 8x8 pixels.

La compression MP3 :

Elle est adapte la compression de sons de musique. Cest un sous lments de la norme MPEG. Le principe : Loreille humaine ne peroit quenviron 10% de linformation sonore du fait de limitations mcaniques. On parle de compression psycho-acoustique. Les signaux de frquences voisines se masquent, un signal fort masque les signaux proches plus faibles, etc.

La compression MP3 :

L'algorithme de compression repre donc les sons "dominants" et retire toutes les donnes relatives aux sons "domins". Puisque de toutes faons, on ne les aurait pas entendus, cela ne fait gure de diffrence au niveau sonore tout en rduisant notablement la taille du fichier. C'est sur ces principes que reposent de nombreux algorithmes de compression du son tels que le mp3 et ses affilis, (le WMA, le Real Audio, l'Ogg Vorbis, etc.) : ils allgent le fichier de toutes les informations qu'ils estiment superflues avant de le passer par un algorithme de compression classique (type Winzip).

La compression MP3 :
Parce qu'ils retirent de la matire sonore au fichier trait et dgradent ses qualits d'origine, on dit qu'ils oprent une compression "destructive". Evidemment, plus on veut un petit fichier, plus la dgradation du son sera grande. Pour vous en convaincre, examinez les valeurs consignes dans le tableau cidessous et coutez les fichiers joints : ( kbps = kilo bits par seconde )
Compression MP3 Taille du fichier Gain de place Ecouter

Aucune
128 kbps 80 kbps 48 kbps 32 kbps

2413 Ko
220 ko 138 ko 83 ko 55 ko

Aucun
90 % 94 % 96 % 97 %

Les principaux formats de fichiers audio :


Aujourdhui, 98% des fichiers audio sont de lun des 8 principaux formats : WAV, MID, MP3, WMA, AAC, OGG, RA, CDA

Les fichiers audio WAV :


Format audio basique dvelopp par Microsoft :
Encodage et dcodage immdiats, sans compression + Qualit sonore incomparable + Compatible avec tous les lecteurs audio Taille des fichiers trs importante : ne pas utiliser pour la diffusion par Internet !

Les fichiers audio MID :


Format audio particulier ! :
Pas de son , mais une succession de notes (quivalent au son produit par un synthtiseur). Le son est synthtis par lordinateur et dpend de la qualit du matriel audio. + Taille de fichier extrmement rduite Impossibilit de retranscrire la voix dans ce format

Les fichiers audio MP3 :


Le format le plus rpandu actuellement:
Le son est compress avec pertes (qualit sonore plus ou moins bonne selon le dbit). + Compatible avec presque tous les logiciels existants + Idal pour la diffusion libre par Internet Pas de gestion des droits daccs (DRM) Pas de streaming

Les fichiers audio WMA :


Alternative au MP3, plus souple mais moins rpandu :
cre par Microsoft. + De nombreuses dclinaisons (Compress, non compress, avec ou sans DRM, streaming) + Gnralement adapt la diffusion par Internet (selon les dclinaisons) Uniquement Compatible avec les logiciels Microsoft.

Les fichiers audio AAC :


Concurrent direct du WMA :
cre par Apple Sa raison dtre : iPod et iTunes + Son compress mais de trs bonne qualit + Possibilit de DRM : Fairplay Compatible avec trs peu dapplications

Les fichiers audio OGG :


Amlioration du MP3 :
librement exploitable et entirement gratuit. + Bonne compression, trs bonne qualit sonore Compatible avec trs peu dapplications

Les fichiers audio RA :


Pour la diffusion sur le Web :
introduit par RealMedia. Uniquement destin la diffusion par Internet + Bonne possibilit de compression Peu manipulable, peu compatible avec dautres logiciels ( part RealPlayer)

Les fichiers audio CDA :


Uniquement utilis sur les CD Audio :
pour reprsenter les pistes du CD. Les pistes sont en fait au format WAV. + Meilleure qualit possible, aucune compression Exploitable en lecture seulement Ce nest pas un fichier proprement parler. Un logiciel est requis pour extraire le fichier WAV.

En rsum :

Les principaux formats de fichiers vido :


Aujourdhui, la plupart les fichiers vido sont de lun de ces principaux formats : AVI, QuickTime, ASF, RealMedia, MP4, Ogg, 3GP, MPEG2, DIVX, XVID

Les fichiers vido AVI :


le plus rpandu :
Cr par Microsoft pour Windows Peut contenir tout type de fichier audio et vido, mais pas de textes Pas de chapitres (1 seule piste vido) Doublage multilingue (jusqu 99 pistes audio) Format trs rpandu, fonctionne sur tous les lecteurs vido

Les fichiers vido QuickTime :


Le plus souple :
Cr par Apple Peut contenir des pistes audio, vido, et des textes (pour les sous titres) Une piste peut tre galement un stream (diffusion en temps rel par internet) Ncessite le lecteur Quicktime

Les fichiers vido ASF :


Le plus prometteur :
Format rcent dvelopp par Microsoft Supporte tous les formats audio et vido AVI amlior : plusieurs pistes audio, vido et texte Trs utilis pour le streaming par internet Compatible avec les DRM (gestion des droits numrique) Format utilis sur les successeurs du DVD : Blu-Ray et HD-DVD

Les fichiers vido MP4 :

Quicktime amlior, souvent utilis pour les DivX. Trs souple, peut contenir des images.

Les fichiers vido Ogg :

Le conteneur de lOgg Vorbis, totalement libre et gratuit. Peu utilis.

Les fichiers vido 3GP :


Driv du MP4 pour les tlphones mobiles.

En rsum :

Autres fichiers vidos :


MPEG-2 Format le plus rpandu Compression peu performante, adapte aux rsolutions standards mais pas la HD Format du DVD : Compatible avec tous les logiciels et les platines DVD. DivX Format rcent, moins rpandu. Compression trs performante (jusqu 7 fois plus efficace que le MPEG-2 Compatible avec la plupart des logiciels, et les platines DVD rcentes. XviD Format bas sur le DivX, mais non compatible Cr pour des raisons de proprit intellectuelle (format libre) Compatible avec peu de logiciels et trs peu de platines DVD.

Les fichiers vido AVI :


Uniquement utilis sur les CD Audio :
pour reprsenter les pistes du CD. Les pistes sont en fait au format WAV. + Meilleure qualit possible, aucune compression Exploitable en lecture seulement Ce nest pas un fichier proprement parler. Un logiciel est requis pour extraire le fichier WAV.

Vous aimerez peut-être aussi