Vous êtes sur la page 1sur 4

Spécialité : BDD (S1) Module : Structure Machine

:CHAPITRE 2 : CODAGE DONNEES NON NUMERIQUES


CODAGE DES CARACTERES

Pour une meilleure exploitation par les ordinateurs, les caractères doivent aussi être
représentés comme les nombres. Généralement, on utilise que des bits pour cette
représentation dans les cases mémoire. Donc, il est associé un code numérique à chaque
caractère. Parmi les systèmes de codage les plus connus, on peut citer :
 BCD (Binary Code Decimal), où un caractère est codé sur 6 bits.
 ASCII (Americain Standard Code for Information Interchange), sur 7 bits;
 EBCDIC (Extended Binary Coded Decimal Internal Code), sur 8 bits;
 UNICODE, sur 32 ;
 Code UTF-8

I_ Le codage BCD (Binary Coded Decimal )


Le code DCB a surtout été utilisé aux débuts des machines à calculer. Le code DCB encode le
nombre à représenter de façon très directe. Le principe consiste à faire des éclatements sur 4
bits et de remplacer chaque chiffre décimal par sa valeur binaire correspondante. Les
combinaisons supérieures à 9 sont interdites. Le tableau suivant, montre le code de DCB.

Exemple:

INSFP MEDEA
Spécialité : BDD (S1) Module : Structure Machine

II_ Le code EBCDIC (Extended Binary Coded Decimal Internal Code)


EBCDIC signifie codage binaire étendu Code d'échange décimal Tous les ordinateurs et
périphériques IBM utilisent ce code. IBM a inventé ce code pour étendre la décimale codée
binaire qui existait à cette époque. C'est un code de 8 bits et peut avoir 256 (2 8=256)
caractères. Ci-dessous, quelques caractères de Code EBCDIC se familiariser avec elle.

Ex

III_ Code ASCII (American Standard Code for Information Interchange)


Le codage le plus utilisé est le ASCII utilisés à l’époque (Années 60) dans l’échange de
données entre terminaux et ordinateurs. La première version de ASCII était sur 7bits pour
représenter les caractères de l'alphabet minuscules et majuscules, les chiffres, ponctuation,…,
et peut coder 27=128 caractères.
Exemple :
• Le code 65 (01000001)2correspond au caractère A
• Le code 97 (01100001) correspond au caractère a
• Le code 58 (00111010 )correspond au caractère :

INSFP MEDEA
Spécialité : BDD (S1) Module : Structure Machine

Le numéro de la colonne donne le symbole hexadécimal de poids fort et le numéro de ligne le


symbole de poids faible.

Par la suite il y a eu une version étendue sur 8 bits ASCII étendu il peut coder 28 =256
caractères, même les caractères accentués é, è, ù, à,…

IV_ Code UNICODE (UNIversal CODE)


L'idée de ce code est au lieu d'utiliser seulement les codes 0 à 7F sur 8 bits, il utilise des codes
bien plus grands qui peuvent aller jusqu'à 32 bits.
L'Unicode permet de représenter tous les caractères spécifiques aux différentes langues.
Unicode définie aussi une correspondance entre symboles et code binaire et les nombres sont
présentés en notation hexadécimal

INSFP MEDEA
Spécialité : BDD (S1) Module : Structure Machine

Exemple:
Le code bin/hexa = 00D2 correspond au caractère Ő (Voir la table UNICODE)
Le code bin/hexa = C3A0 correspond au caractère à (Voir la table UNICODE).

V_ Code UTF-8

L'UTF-8 rassemble le meilleur de deux codes précédents: l'efficacité de l'ASCII et l'étendue de


l'Unicode. D'ailleurs l'UTF-8 a été adopté comme norme pour l'encodage des fichiers XML. La
plupart des navigateurs récents supportent également l'UTF-8 et le détectent automatiquement
dans les pages HTML.

Exercice:
Traduire le message suivant codé en ASCII:
0100 0010 0101 0010 0100 0001 0101 0110 0100 1111 0010 0001

INSFP MEDEA

Vous aimerez peut-être aussi