Vous êtes sur la page 1sur 22

Représentation des caractères

A.Vigier 1
de 0:08 à 1:30

NSI A.VIGIER 2
Signaux d’autrefois

NSI A.VIGIER 3
Signaux d’autrefois

NSI A.VIGIER 4
ASCII

NSI A.VIGIER 5
ASCII

ASCII

(1963)

American Standard Code

for Information Interchange

128 caractères codés sur 7 bits

NSI A.VIGIER 6
ASCII

NSI A.VIGIER 7
Codes Page
Un code Page est un standard en informatique qui vise à
donner un numéro à chaque caractère d'une langue, ou de
quelques langues proches.

Dans les années 80, IBM dresse une liste de tous les codes
pages possible et fait en sorte que ses machines puissent
toutes les manipuler.

NSI A.VIGIER 8
Codes Page
Ce principe est alors standardisé en ISO 8859. Exemples :

● ISO 8859-1, Code Page 1252 langue d'europe


occidentale (Latin-1)
● ISO 8859-5, Code Page 1251 Cyrillique
● ISO 8859-6, Code Page 1256 langue Arabe
● ISO 8859-15, Code Page 923 Latin-9 (avec €)

NSI A.VIGIER 9
Précision :

ISO vient du nom de l’organisme

International Organization for Standardization

NSI A.VIGIER 10
ISO/CEI 8859-1

ISO/CEI 8859-1 (Latin-1)


(1986)

Extension de ASCII

191 caractères codés sur 8 bits

NSI A.VIGIER 11
ISO/CEI 8859-1

ASCII

NSI A.VIGIER 12
ISO/CEI 8859-1

Problèmes non réglés par l’ISO 8859

● Représentation des caractères des langues asiatiques.

● Cohabitation dans un même texte des caractères


cyrilliques et des caractères arabes, par exemple.

⇒ UNICODE

NSI A.VIGIER 13
UCS : Universal Char Set

UTF-8

Universal Character Set Transformation Format - 8 bits

Il existe aussi UTF-16, UTF-32...

NSI A.VIGIER 14
UTF-8
● De U+0000 à U+10FFFF :

1 114 112 points de code.


● Compatible avec le standard ASCII

● Peut utiliser plusieurs octets pour coder un caractère (ex :


“é” sur 2 octets)

NSI A.VIGIER 15
UTF-8
● Si le bit de poids fort est 0, alors il s’agit d’un caractère
ASCII codé sur les 7 bits restants.

NSI A.VIGIER 16
UTF-8
● Sinon, les premiers bits de poids fort de l’octet indiquent
le nombre d’octets utilisés pour coder le caractère, à
l’aide d’une séquence de bits à 1 et se terminant par un
bit à 0.

NSI A.VIGIER 17
UTF-8
● Exemple :

l’octet 110xxxxx

annonce un caractère représenté par 2 octets (2 bits à 1 puis


un 0).

NSI A.VIGIER 18
UTF-8
● Exemple :

11000011 10001000

représente un caractère codé sur 11 bits codants :

11000011 10001000

soit

00011001000
= C8 Caractère U+00C8

NSI A.VIGIER 19
NSI A.VIGIER 20
Affichage

Affichage

L'affichage d'un caractère sur un écran d'ordinateur ou son


impression avec une imprimante nécessite les données
spécifiant le dessin exact du caractère, le glyphe.

Le fichier numérique de caractères contenant la liste des


codes renvoyant à des glyphes est une police de caractères.

NSI A.VIGIER 21
Affichage

NSI A.VIGIER 22

Vous aimerez peut-être aussi