Vous êtes sur la page 1sur 6

Chapitre 5 : La reprsentation des donnes

PLAN
1 La reprsentation des caractres
1.1 - Le code ASCII
1.2 - Le code ANSI
1.3 - Le code EBCDIC
1.4 - Le code UNICODE
1.5 - Notion de contrle de parit
2 La reprsentation des informations multimdia
2.1 La reprsentation du son
2.2 La reprsentation des images fixes
2.3 La reprsentation des images animes
2.4 La compression des donnes

1 - La reprsentation des caractres


Les informations que doivent traiter les ordinateurs sont composes de nombres, lettres, chiffres ou symboles particuliers. On
doit reprsenter linformation traiter, quelle quelle soit, de manire ce quelle puisse tre utilisable par la machine. Pour
cela, on doit coder ces informations afin, quassimilables par lhomme elles le deviennent par la machine.
Avec un code thorique 1 bit, on pourrait reprsenter 2 tats, nots 0 ou 1, ainsi que nous lavons vu lors de ltude de la
numration binaire, soit 21 combinaisons. Il nous faut donc un code 4 bits pour reprsenter les 10 chiffres (0 9) utiliss dans
le systme dcimal. Si nous voulons reprsenter, en plus des chiffres, les lettres de lalphabet, il faut un code capable de
reprsenter les 26 combinaisons, qui correspondent aux lettres, plus les 10 combinaisons, qui correspondent aux chiffres, soit
36 combinaisons diffrentes, ce qui implique un code compos au minimum de 6 bits. On rencontrera ainsi diffrents codes
permettant la codification dalphabets plus ou moins importants.

1.1 Le code ASCII (American Standard Code of Information Interchange)


Cest le systme de codage quasi universel. Cest un code 7 positions, le 8ime bit tant rserv au bit de parit ce qui fait 2 7
= 128 caractres reprsentables. Ce code comprend :
- les chiffres,
- les majuscules,
- les minuscules,
- quelques symboles usuels en informatique ($,@,*,..),
- des fonctions de commandes (tabulations, Retour chariot, sonnette..),
- des symboles de ponctuations (!,",},...).
Remarques :

Chiffres < Majuscules <Minuscules


C'est l'ordre qui sera respect dans la plupart des utilitaires de tri.
Dans beaucoup de langages de programmation, on peut crire : if a<b pour des caractres, c'est cet ordre qui sera
utilis pour valuer l'expression.

Certains constructeurs, dont IBM suivis par tous les fabricants de compatibles, ont enrichi cette table ASCII en
utilisant le 8ime bit, ce qui double le nombre de caractres reprsentables (256). Les caractres supplmentaires sont
essentiellement :
o les caractres accentus utiliss dans la langue franaise notamment,
o un jeu de caractres utiliss dans quelques langues (,,...),
o quelques symboles mathmatiques (,),
o caractres semi-graphiques qui permettent de raliser des petits dessins gomtriques (cadres, souligns,
etc..).

Le code ASCII 8 bits existe en 2 variantes : le jeu de caractres IBM PC (cest le jeu de caractres standard du DOS)
et le jeu de caractres ISO-ANSI (jeu de caractres international utilis dans Windows). Ces deux jeux diffrent
notamment au niveau des caractres nationaux accentus et des caractres semi-graphiques.

Comment coder la lettre A ? laide du tableau


Dans le tableau, on saperoit que la lettre A se trouve lintersection de la colonne de valeur hexadcimale 4 et de la ligne de
valeur hexadcimale 1. Le code ASCII de la lettre A est donc 41 en hexadcimal (souvent not 41H). Certains logiciels ou
langages peuvent utiliser une codification des caractres ASCII en dcimal et non en hexadcimal.
1

Les caractres ASCII reprsents ou non sur le clavier sobtiennent par ALT + code ASCII.

0000
0001
0010
0011
0100
0101
0110
0111
1000
1001
1010
1011
1100
1101
1110
1111

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

000
0
NUL
SOH
STX
ETX
EOT
ENQ
ACK
BEL
BS
HT
LF
VT
FF
CR
SO
SI

001
1
DLE
DC1
DC2
DC3
DC4
NAK
SYN
ETB
CAN
EM
SUB
ESC
FS
GS
RS
US

010
2
SP
|

#
$
%
&

(
)
*
+
,
.
/

TABLE DES CODES ASCII

1.2 - Code ANSI

011
3
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?

100
4
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O

101
5
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]

110
6
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o

111
7
p
q
r
s
t
u
v
w
x
y
z
{
!
}
~
DEL

NUL
Absence de caractre,blanc,espace
SOH
Start of Heading : dbut en-tte
STX
Start of Text
ETX
End of Text
EOT
End of Transmission
ENQ
Enquiry Demande
ACK
Acknowledge, accus rception
BEL
Bell, sonnette
BS
Backspace marche arrire 1 caractre
HT
Horizontale Tabulation
LF
Line Fed retour la nvelle ligne
VT
Vertical Tabulation
FF
Form Fed, passage page suivante
CR
Carriage Return, retour chariot
SO
Shift Out caractre suivant non std
SI
Shift In retour au caractres std
DLE
DataLink Escape chgmt de signific.
NAK
Negative Acknoledgment
SYN
Synchronous, caractre de synchro.
ETB
End Of Transmission Block
CAN
Cancel annulation de la donne prcdente
SUB
Substitute remplacement
ESC
Escape caractre de ctrl dextension
FS
File Separator
GS
Groupe Separator
RS
Record Separator
US
United Separator
SP
Space Espace
DEL
Delete, suppression
DC1 DC4 : caractres de commandes

Les logiciels sous Windows utilisent la norme ANSI, qui reprend en grande partie le code ASCII, et propose des extensions
diffrentes selon le code de page retenu.
Ainsi, le code page 850 est trs employ en France, alors que le code page 864 dfinit un jeu de caractres arabe .
Lutilisation du code ANSI se fait de la mme manire que pour un code ASCII (intersections colonne-ligne).

1.3 Le code EBCDIC (Exended Binary Coded Decimal Interchange Code)


Code dcimal cod binaire tendu, il est utilis essentiellement par IBM. Cest un code 8 bits.
Ce code peut tre assimil un code 9 bits quand il fait usage dune cl dimparit (bit supplmentaire destin contrler la
validit de loctet associ).
Son utilisation se fait sensiblement de la mme faon que le tableau ASCII, savoir quun caractre est cod par la lecture des
valeurs binaires des intersections ligne/colonne. Ainsi, le caractre A se codera C1 en hexadcimal soit la suite binaire
11000001. Les caractres de commandes ont en principe la mme signification quen ASCII. Ainsi, SP indique lespace, CR le
retour chariot,
2

1.4 Unicode (UNIversal CODE)


Compte-tenu de lextension mondiale de linformatique et de la diversit de plus en plus importante des caractres stocker,
les organismes de normalisation ISO travaillent depuis 1988 la cration dun code universel (UNIversal CODE).
Bas sur les pages ASCII, ce code est utilis sous Windows 95 et Windows NT.
Il se reprsente sous 2 formes : Une forme 31 bits (UCS-4) pour Universal Charactere Set 4 octets.
Et une forme 16 bits (UCS-2) ce qui permet de reprsenter thoriquement 65 535 caractres diffrents.
Ces caractres couvrent la majeure partie des principaux langages crits du monde.

1.5 Notion de contrle de parit


A lintrieur de lordinateur les informations sont sans cesse vhicules , du clavier vers la mmoire, de la mmoire vers le
processeur, de la mmoire vers lcran, lheure actuelle, les ordinateurs sont de plus en plus relis entre eux au travers de
rseaux locaux ou tendus et linformation est donc constamment en circulation.
Il est donc ncessaire dassurer une transmission convenable des informations. Pour cela, on utilise divers moyens allant du
simple contrle de parit jusqu llaboration de codes trs sophistiqus.
Nous allons voir en quoi consiste le contrle de parit.
Pourquoi un bit de contrle de parit ?
Pour dtecter des erreurs de transmissions.
Rq : Un caractre ASCII est sur 7 bits, or un octet contient 8 bits, donc le bit de poids le plus fort est inutilis.
Il va servir au contrle de parit.

Code dit parit ou abusivement parit paire


On complte la chane de n bits de faon ce que la suite de bits transmise comporte un

nombre pair de 1.

Donc le bit de poids le plus fort est mis 1 si le nombre de 1 de loctet est impair, 0 sinon.
Exemple sur 8 bits
0
0
1
1
1
0
0
1
Bit de
parit Il est zro (0) car le nombre de 1 est pair (il y a 4 un)

Code dit imparit ou abusivement parit impaire


On complte la chane de n bits de faon ce que la suite de bits transmise comporte un

nombre impair de 1.

Donc le bit de poids le plus fort est mis 1 si le nombre de 1 de loctet est pair, 0 sinon.
Exemple sur 8 bits
1
Bit de

1
3

parit Il est un (1) car le nombre de 1 est pair (il y a 4 un)


Rq :
Cette mthode trs utilise et gnralement suffisante nest en fait efficace que dans la mesure o il ny a pas derreurs
simultanes sur 2, 4, 6, ou 8 bits, ce qui ne changerait pas la parit. (ex. Si nous mettions la suite binaire 10010000 en parit et
que nous recevions la suite 01010000, il serait impossible de dire sil sagit bien de ce qui a t envoy ou non car, bien que la
suite binaire reue soit diffrente de celle mise, la parit est bien respecte).
Pour accrotre la prcision de la dtection derreurs de transmissions, il existe dautres mthodes plus complexes que nous ne
ferons qunumrer ici : les codes de blocs et les codes cycliques.

2 La reprsentation des informations multimdia


2.1 Reprsentation du son
Comment reprsent un son ? A priori, un son est un signal analogique (cest dire que le signal peut prendre
une infinit de valeur au cours du temps). On mesure intervalle rgulier la valeur de lamplitude dun signal
analogique.
Pour pouvoir stocker ce son dans un ordinateur, il va falloir lchantillonner
Un chantillon sont des mesures intervalles rguliers, de la valeur de lamplitude dun signal analogique

Temps

40

Pour tre cod sous forme numrique, le son doit tout dabord tre chantillonn : la courbe va tre remplace
par des segments de droites, linfinit de valeurs possibles va tre remplac par un ensemble de niveaux.

30
20
10
0

Pendant cette opration, on va forcment perdre de linformation. Afin que cette perte soit le moins sensible
possible, on sattachera choisir une frquence dchantillonnage trs grande (beaucoup de valeurs pour une
courte dure) : il faut que la frquence dchantillonnage soit au moins le double de la plus haute frquence
contenue dans le signal. Pour un CD audio, la frquence dchantillonnage est de 44 100 Hz, cest dire
quune seconde de musique est reprsente par 44 100 valeurs diffrentes !

2.2 Reprsentation par des images fixes

-10
-20

11
10
9
8
7
6
5
4
3
2
1
0
-1
-2
-3
-4
-5
-6
-7
-8
-9

Toute image affiche sur un cran ou sur une imprimante est constitue de pixels (abrviation de Picture Element).
Il existe 2 grands modes de stockage des images : BITMAP et VECTORIEL.
BITMAP
Chaque point de limage est mmoris. Limage devra tre utilise dans la dimension dans laquelle elle a t cr, sinon un
effet descalier sera invitable.

Ces images sont trs gourmandes en mmoire car chaque pixel est cod par un bit dans le cas dune image noir et blanc, par 3
octets dans le cas dune image couleur.
Pour les images en couleurs, chaque octet correspond une des trois couleurs primaires (Rouge, Vert, Bleu). Les 256 valeurs
codables sur un octet correspondent au poids de chacune des couleurs primaires qui compose le point color. Ce systme
donne un total de 16,5 millions de couleurs codables (2553), ce qui est grandement suffisant car lil humain est loin de
pouvoir en discerner autant.

1 point de couleur : F0 A9 4C
Pour une image 640 x 480, si chaque point est cod sur 3 octets, cela donne une image qui va ncessiter 900 KO de mmoire,
cette taille passera plus de 2 MO pour une image 1024 x 768 !
Cest pourquoi, on utilise souvent un autre systme de codage des images bitmaps, le codage laide de la palette de couleur :
On dtermine 256 couleurs importantes dans limage, ces couleurs sont codes sur 3 octets (mais une seule fois), ensuite
chaque pixel est cod sur un octet qui correspond une entre dans la palette des couleurs. De cette faon, on divise peu prs
par trois lencombrement mmoire dune image, mais on perd quelque peu en nuance et en contraste :
4

Exemple :
1 point de couleur : A6
...
A5
A6
A7
...

...
F2 A6 78
19 FE 6A
05 3F 87
...3 octets de couleur

Cest cette technique qui est utilise pour les images bmp.
Lorsquon veut reprsenter une image en mmoire, on est donc en face dun choix : doit on privilgier le nombre de pixels
dune image (640x480 ou 1024x768), cest dire sa dfinition ou au contraire le nombre de couleurs utilises (256 ou 16,5
millions) ? La plupart du temps, un meilleur rsultat sera obtenu en privilgiant le nombre de couleurs.
VECTORIEL
Ce sont les quations mathmatiques des portions de droites et de courbes qui sont mmorises.
Un cercle, par exemple, sera dtermin compltement par les coordonnes du centre et la valeur du rayon avec ventuellement
la couleur du trait et lpaisseur de ce trait.
Lintrt de cette mthode est que lon peut modifier la taille du dessin sans en altrer la dfinition et les proportions. De plus
si le dessin est compos de plusieurs objets, ils pourront tre manipuls sparment.

2.3 Reprsentation des images animes


Un image anime nest autre quune suite dimages fixes se succdant rapidement. Ainsi, au cinma, les images dfilent la
cadence de 25 images par secondes. Un tlviseur affiche cinquante trames par seconde. (Une trame est constitue des lignes
paires ou des lignes impaires de limage, la tlvision utilisant un affichage entrelac.) Le rsultat correspond 25 images par
seconde. Pour afficher des images animes, lordinateur doit tre capable den faire autant. Or chaque image doit tre calcule,
puis transfre dans la mmoire vido. Ces oprations doivent se faire la mme vitesse, soit 1/25 de seconde pour une
animation de haute qualit.
Animations dobjets simples
Entre deux images successives dun film, tous les objets ne sont pas dplacs. Limage du dcor est calcule une fois pour
toutes. Puis limage de lobjet dplacer est superpose au dcor ; La partie masque du dcor est mmorise. Pour limage
suivante, le dcor est reconstitu et lobjet superpos avec un dcalage, dans le sens du dplacement. Les objets ainsi
manipuls sont appels sprites.
Si lobjet lui-mme est anim, il est reprsent par plusieurs sprites qui saffichent tour de rle ; Par exemple, un animal qui
court sera reprsent par 10 20 sprites diffrents reprsentant les diverses attitudes de la marche.
Le scrolling
Parfois, le fond lui-mme doit tre anim. Lanimation la plus courante est un dfilement continu appel scrolling. Dans ce
cas, une image du fond dpassant largement la taille de lcran est place dans la mmoire vido. Un pointeur dsigne la partie
de limage qui apparat lcran . Tout se passe alors comme si le fonc dfilait derrire une fentre. Des objets anims peuvent
tre superpose limage. Pour donner un rsultat plus raliste, on utilise la technique du scrolling diffrentiel. Elle consiste
prsenter le fond sur plusieurs plans dfilant des vitesses diffrentes, pour donner une impression de relief (cas des dessins
anims et jeux video).
Animation par image complte
Il sagit dimages prcalcules, cest le cas des images vido, qui sont filmes par une camra numrique avant dtre stockes
sur disque. Lordinateur na alors qu transfrer des images dans la mmoire vido, au rythme choisi. Lidal est biensr
dafficher des images de la taille de lcran au rythme de 24 par seconde. Cependant, cela nest pas possible cause de la
quantit dinformations traiter. Une image en 640x480 points et 16 millions de couleurs reprsente 900Ko de donnes.
5

Pour 24 images par seconde, cela donne 21 Mo de donnes transmises et traites par seconde. Pour rduire la quantit
dinformations plusieurs solutions sont utilises :
Diminuer la taille de limage en rduisant la fentre daffichage,
Diminuer le nombre de couleurs (256 couleurs est une quantit raisonnable),
Diminuer le nombre dimage la seconde (18 au lieu de 24),
Compresser les donnes et dcompresser pendant le temps de traitement par une carte dextension spciale.
Animation par image de synthse
Il est galement possible de raliser une animation en affichant des images synthtises par lordinateur ; Elles peuvent avoir
t calcules pralablement. On se rapproche alors du cas prcdent. Lordinateur doit calculer les images en temps rel,
mesure quelles sont affiches. Cette mthode est employe dans la plupart des programmes de simulation. Elle ncessite une
puissance de calcul trs leve et des techniques de programmation trs labores.

2.4 La compression des donnes


Les problmes de stockage du son, de limage ou plus gnralement des fichiers binaires posent des problmes de place
mmoire pour le stockage ou la transmission, cest pourquoi avec lre du multimdia les techniques de compression sont
dactualit.
Une photo 24x36 cms, avec une dfinition de lordre de 150 points par mm2 (qualit photo classique) reprsente 13 millions de
points, 3 octets par points on dpasse les 40 MO !
Un document vido cest 25 images par secondes avec en plus du son ! !
On va donc tre oblig dutiliser des techniques de compression, il en existe 2 grandes catgories :

La compression avec perte dinformations : Image et son peuvent se passer dune restitution parfaite car de toute
faon lil ne peroit pas toutes les nuances, loreille nentend pas toutes les frquences. Les taux de compression
peuvent atteindre 100 pour 1 !
Les formats sappelle par exemple JPEG (Joint Photographic Expert Group) pour les images fixes, MPEG (Moving
Picture Expert Group) pour la vido. Pour la vido, les techniques utilises englobent le dcoupage dimages en blocs,
mais aussi la prdiction de mouvements pour dterminer les changements oprer dune image lautre.

La compression sans perte dinformations : Un fichier binaire correspondant un excutable, ou un texte ne peut
se permettre la moindre altration.
Les logiciels de compression sappelle ARJ ou PKZIP (Phil Katz) ou DRIVESPACE intgr MS-DOS. Les
images GIF font galement partie de cette catgorie.
Le principe de la compression sans perte est de reprer les squences rptitives (suite de valeurs identiques trs
frquentes dans les images bitmap par exemple).
Les techniques vont du simple codage de ces squences rptitives sous la forme [valeur-nb doccurrence], des
mthodes plus subtiles qui font intervenir la frquence dapparition de ces valeurs pour dterminer le nombre de bits
qui va servir coder ces diffrentes valeurs (mthode Huffman).