Vous êtes sur la page 1sur 42

Chapitre 2 : Texte et Image

1. Le Texte
Typographie, Dimension, Style
Typographie
- La typographie désigne les différentes méthodes de composition et
d’impression utilisant des caractères et des formes.
- La typographie est à l’origine l’art d’assembler des caractères
mobiles afin de créer des mots et des phrases et de les imprimer.
Dimension : elle définit la taille d’un texte.

Style : permet de spécifier le style du texte (italique, gras, souligné,


etc...)
Numérisation d’un texte
La numérisation d'un texte est sa transformation en une suite de caractères prises dans une liste
de caractères existant dans la langue écrite.
Pour numériser un texte, soit un opérateur humain effectue la saisie du texte, soit on numérise le
document comme une image en appliquant à ce premier ensemble de données un programme de
reconnaissance optique de caractères.
Reconnaissance Optique de Caractères (ROC)
Définition : La reconnaissance optique de caractères, (ROC), est la technique qui
permet de transformer un texte imprimé (analogique) en un fichier
numérique, composé de caractères ASCII, et non plus de pixels (fichier analogique). Il
s’agit donc de la phase complémentaire (mais pas forcément obligatoire) à une
numérisation de document.

→ Le matériel à utiliser est un scanneur . Ce dernier doit ensuite être couplé à un


logiciel de reconnaissance de caractères.
Un système ROC part de l'image numérique réalisée par
un scanner optique d'une page (document imprimé, etc.), ou une caméra
numérique, et produit en sortie un fichier texte en divers formats (texte
simple, formats de traitements de texte, etc...).

→ Certains logiciels tentent de conserver l'enrichissement du texte


(corps, police…) ainsi que la mise en page, voire de rebâtir les tableaux
et d'extraire les images.
• Fonctionnement ROC

Les étapes de traitement ROC :

1. Pré-analyse de l'image : le but est d'améliorer éventuellement la qualité de


l'image. Ceci peut inclure des corrections de contraste, le passage en mode
bicolore (noir et blanc, ou plutôt papier et encre), la détection de contours.

2. Segmentation en lignes et en caractères: vise à isoler dans l'image les lignes de


texte et les caractères à l'intérieur des lignes. Cette phase peut aussi détecter le texte
souligné, les cadres, les images.

3. Reconnaissance proprement dite des caractères : après normalisation, une instance


à reconnaitre est comparée à une bibliothèque de formes connues.
4. Post-traitement utilisant des méthodes linguistiques et contextuelles pour réduire
le nombre d'erreurs de reconnaissance : systèmes à base de règles, ou méthodes
statistiques basées sur des dictionnaires de mots.

5. Génération du format de sortie, avec la mise-en-page pour les meilleurs systèmes.


• Principaux logiciels de reconnaissance optique des caractères :

Logiciels libres :
GOCR (Unix, Windows)
OCRopus (Unix)
Tesseract (Unix, Windows)
Logiciels payants :
Adobe Acrobat Professional (Windows, Mac OS)
BIT-Alpha (Windows)
Neoptec (Windows, Mac OS, Unix)
• Les avantages des ROC

➢ Un gain de temps énorme, pour les traitements d’information, il


suffit de scanner et d’enregistrer le fichier au format souhaité ;
➢ Une réduction des marges d’erreurs, avec la saisie manuelle des
données ;
➢ Un classement plus organisé, facilitant les recherches, vous pouvez
classer chaque fichier converti dans une catégorie spécifique ;
➢ Une gestion plus efficace, pour tous les dossiers essentiels pour
l’activité.
Le code ASCII
Le code ASCII se base sur un tableau contenant les caractères les plus
utilisés en langue anglaise : les lettres de l’alphabet en majuscule (de A à Z)
et en minuscule (de a à z), les dix chiffres arabes (de 0 à 9), des signes de
ponctuation (point, virgule, point-virgule, deux points, points d’exclamation
et d’interrogation, apostrophe ou quote, guillemet ou double quotes,
parenthèses, crochets etc.), quelques symboles et certains caractères spéciaux
invisibles (espace, retour-chariot, tabulation, retour-arrière, etc.)
→ Les codes 0 à 31 ne sont pas des caractères. On les appelle caractères de contrôle car ils
permettent de faire des actions telles que : - retour à la ligne (CR)
- Bip sonore (BEL)
→ Les codes 65 à 90 représentent les majuscules (A→Z)
→ Les codes 97 à 122 représentent les minuscules (a→z)
Le code ASCII
2. L’image
L'image numérique :
composition et caractéristiques
⚫ Image numérique
- Une image numérique est une image acquise, traitée et
stockée en bits.
- Une image numérique est un tableau de pixel : chaque pixel
est codé par un nombre binaire pour un niveau de gris, ou par
trois nombres binaires qui correspond à une nuance de rouge,
de vert et de bleu (codage RVB).
Les images (matricielles) ou bitmap

⚫ Une image matricielle (ou bitmap) est une


image constituée d'un ensemble de points :
les pixels.
⚫ Chaque point porte des informations de
position et de couleur.
⚫ Format d'images bitmap : BMP, PCX,
GIF, JPEG, TIFF.
⚫ Les photos numériques et les images
scannées sont de ce type.
Les images vectorilelles
⚫ Une image vectorielle est une image numérique composée de
plusieurs objets géométriques individuels (droites, polygones, arcs
de cercle). L'image vectorielle est créée à partir d'équations
mathématiques.
⚫ Les avantages d'une image vectorielle : les fichiers qui la
composent sont petits, les redimensionnements sont faciles sans
perte de qualité.
⚫ Les inconvénients : une image vectorielle ne permet de
représenter que des formes simples. Elle n'est pas donc
utilisable pour la photographie notamment pour obtenir
des photos réalistes.
LES PIXELS
⚫ Une image numérique est constituée d’un ensemble de points appelés
pixels (abréviation de PICture Element) pour former une image.
⚫ Le pixel représente ainsi le plus petit élément constitutif d’une image
numérique.
⚫ L’ensemble de ces pixels est contenu
dans un tableau à deux dimensions
constituant l’image :
La définition d’une image
⚫ On appelle définition le nombre de points (pixels) constituant une
image: c’est le nombre de colonnes de l’image que multiplie son
nombre de lignes.
⚫ Une image possédant 10 colonnes et 11 lignes aura une définition de
10 x 11 c’est a dire 110 pixels.
Formule pour le calcul du nombre total des pixels dans une image:
la Définition (Nombre total des pixels) = colonnes x lignes.
⚫ Exemple: 10x11= 110 pixels au total pour l'image ci-dessous.
Les Principaux formats d'affichage
⚫ Pour afficher ces images, des formats d'affichages standards ont été
définis en fonction de l'évolution des capacités matérielles des cartes
graphiques et des écrans. Voici les Principaux formats d'affichage:
Type Définition d'affichage
VGA (Video Graphics Array) 640 × 480

SVGA (Super VGA) 800 × 600

XGA (Extended Graphics Array) 1024 × 768

SXGA (Super XGA) 1280 × 720

HD (High-definition) 1280x720

Full HD 1920x1080

UHDTV1 (Ultra High Definition Television 1) 3840x2160

UHDTV2 (Ultra High Definition Television 2) 7680x4320


La résolution
⚫ La résolution d'une image est le nombre de pixels contenus dans
l'image par unité de longueur.
⚫ Elle s'exprime le plus souvent en ppp (point par pouces) ou en dpi
(dots per inch), parfois en point par cm.
⚫ Rappel : 1 pouce (ou inch) = 2,54 cm.
Formule de calcul de la résolution à partir de la définition et de la
dimension
Résolution = définition (largeur) / dimension (largeur)
⚫ Exemple:
La résolution d'une image de 300 pixels de large mesurant 2 pouces de
côté :
Résolution = 300 / 2 = 150dpi
Quelques exemples de résolutions fréquemment utilisées:

⚫ Ecrans d'ordinateur: 72 dpi .


⚫ fax: en générale en 200 dpi.
⚫ Imprimantes grand public: entre 360 dpi et 1400 dpi .
⚫ Scanners grand public: 300, 600 ou 1200 dpi.
⚫ Matériel d'impression professionnel: aux minimum 4800 dpi
.
Résumé
⚫ Formules :
Définition = résolution x dimension

⚫ Exercice:
Quelle serait la définition en pixel d'une feuille de 8,5 pouces
de largeur et 11 pouces en hauteur scannée à 300dpi?
Réponse:

définition=nb_pixel_largeur*nb_pixel_hauteur

nb_pixel_largeur=300 X 8,5 = 2550 pixels


nb_pixel_hauteur=300 X 11 = 3300 pixels

définition= 2550 X 3300 pixels= 8415000 pixels


CODAGE DES COULEURS
Petit rappel du code binaire, utilisé par l'ordinateur pour enregistrer des
informations.
On sait que:
⚫ 1bit = permet de stocker 2 états; (0 ou 1) = 21
⚫ 2bits = permet de stocker 4 états, = 22
⚫ 4bits = permet de stocker 16 états, = 24
⚫ 8bits = permet de stocker 256 états, = 28 etc...
⚫ Un ensemble de 8bit forment 1 Octet.
⚫ 1024 Octets forment un kilo-octet (Ko).
⚫ 1024 Kilo-Octets forment un Mega-Octet (Mo)...Giga-Octet...Terra-Octet...
LES DIFFERENTS MODES DE
COULEUR
⚫ Mode bitmap (noir et blanc): Avec ce
mode, il est possible d'afficher
uniquement des images en deux
couleurs: noir et blanc. Il utilise une
seule couche.
⚫ Codage en 1 bit par pixel (bpp) : => 21
= 2 possibilités: [0,1]
⚫ => Chaque pixel peut donc avoir 2
couleurs possibles : soit noir soit
blanc
Mode niveau de gris: il permet d'obtenir différentes valeurs de gris, afin
d'afficher des images nuancées. Il utilise qu'une seule couche.
- Codage en 8 bits par pixel (bpp) => 28= 256 possibilités
Chaque pixel peut avoir 256 nuances de gris possibles
- Codage en 16 bits par pixel (bpp) => 216= 65536 possibilités
Chaque pixel peut avoir 65536 nuances de gris possibles
Mode couleurs indexées: permet d'obtenir jusque 256 couleurs fixes,
définies à l'avance dans une palette. Il utilise qu'une seule couche.
8
⚫Codage en 8 bits par pixel (bpp) => 2 = 256 possibilitées

⚫Chaque pixel peut avoir jusque 256 couleurs fixes possibles.


Le Mode RVB
⚫ Afin de créer des images encore plus riches en couleurs (et donc
disposer de plus qu'une palette limitée à 256 couleurs), l'idée de
mélanger des couleurs primaires en « couches » est arrivée.
⚫ Mode couleur RVB: grâce au mélange des 3 couches de couleur, il est
possible de reproduire un plus grand nombre de nuances qu'avec une
palette en mode couleurs indexées.
Le Mode RVB
- Avec un codage en RVB 8 bits PAR COUCHE: Chaque couche utilise 8bit (1 octet), soit 256 nuances
possibles: 8Bits pour le Rouge, 8bit pour le Vert et 8bits pour le Bleu. Donc utilisation de 3 x 8bits = 24 bits
utilisées au total.

=> (28 ou 256) x 256 x 256 = 224 = 16,7milions Chaque pixel peut prendre 16,7Milions de couleurs possibles!

- Avec un codage en RVB 16 bits PAR COUCHE: Chaque couche utilise le double, soit 16bits! (65535
nuances). 3 x 16 = 48bits utilisées au total. => (216 ou 65535) x 65535 x 65535 = 248= 4 milliards 4 milliards de
nuances de couleurs sont possibles!
Calculer le poids d'une image en
octet
⚫ Formule: Calculer le poids d'une image en octet
⚫ Nombre de pixel total X codage couleurs (octet) = Poids (octet)
⚫ Exemple
⚫ quel est le poids d'une image d'une définition de 640 x 480 codée sur
1 bit (noir et blanc)?
Solution :

1.Calculez le nombre total de pixels dans l'image : Nombre de pixels


total = Largeur x Hauteur Nombre de pixels total = 640 x 480 = 307,200
pixels
2.Le codage en 1 bit signifie que chaque pixel est représenté par 1 bit,
ce qui équivaut à 1/8 octet (1 octet = 8 bits).
3.Appliquez la formule pour calculer le poids de l'image : Poids (en
octets) = Nombre de pixels total x Codage des couleurs (en octets) Poids
(en octets) = 307,200 pixels x (1/8) octet/pixel Poids (en octets) = 38,400
octets
Donc, le poids de l'image de 640 x 480 pixels codée en noir et blanc est
de 38,400 octets, ou 37.5 Ko (kilooctets).
Les différents formats d'images
⚫ Joint Photographic Experts Group (.jpeg ou .jpg)
⚫ Portable Network Graphics (.png)
⚫ Graphics Interchange Format (.gif)
⚫ Tagged Image File (.tif)
⚫ Photoshop Document (.psd)
⚫ Portable Document Format (.pdf)
⚫ Encapsulated Postcript (.eps)
⚫ Adobe Illustrator Document (.ai)
⚫ Scalable Vector Graphics (.svg)
JPEG Joint Photographic Experts Group

Propriétés Points forts Points faibles

Le format JPEG est le format - Le format JPEG est - Le format JPEG ne gère pas
le plus populaire. compatible avec presque la transparence.
toutes les applications de
-Le format JPEG est très traitement d’images. - La qualité de l’image se
répandu sur le web et dans le - Le format Jpeg peut être dégrade au fur et à mesure de
monde de la photographie. lu par tous les la compression.
programmes, ordinateurs,
- Il respecte la norme tablettes, etc. - Compression avec perte de
ISO/CEI 10918-1. - Possibilité de régler la donnés
qualité de la compression
de l'image
PNG Portable Network Graphics
Propriétés Points forts Points faibles

- Excellente compression sans -Poids des images parfois


- 16,7Milions de couleurs perte. supérieur au Jpeg
- Format ouvert -Permet la transparence -Transparence des images
- Compression sans perte - Compression sans perte non supportée par les
- Gère la transparence anciens navigateurs
- taille des fichiers raisonnable (Internet Explorer 6)
- Ne permet pas les
animations
- Assez volumineux
GIF Graphics Interchange Format
Propriétés Points forts Points faibles
- Le format GIF permet de gérer - Limité à 256 couleurs :
- 256 couleurs la transparence d'une image. Le format GIF se limite à
- Compression sans perte - Il est léger et donc pratique 256 couleurs. Il doit donc
pour le web. se limiter à l'usage de
- Il offre en plus des possibilités logos simples ou d'icônes.
d'animations.

TIFF Tagged Image File Format

Propriétés Points forts Points faibles


- Ce format est orienté vers - compression sans perte de - Format lourd
les professionnels données.
- 16,7Milions de couleurs - Le format GIF permet de
- Compression sans perte gérer la transparence d'une
image.
TD 1 Technologie multimédia

Exercice 1 :
L’appareil numérique FinePix2400Z (Fujifilm) permet la prise de vue avec trois
résolutions :
a) 640x480 pixels ;
b) 1280x960 pixels ;
c) 1600x1200 pixels.
⚫ Calculez pour chaque type de résolution la taille de l’image non-compressée avec le
codage couleur RVB
Solution exercice 1
Pour calculer la taille de l'image non compressée pour chaque type de résolution avec le codage
couleur RVB (Rouge, Vert, Bleu), vous devez tenir compte de la résolution et de la profondeur
de couleur. La profondeur de couleur RVB est généralement de 24 bits, ce qui signifie 8 bits (1
octet) par composante de couleur (R, V, B). Voici les calculs pour chaque résolution :
a) Résolution 640x480 pixels :
•Nombre total de pixels = 640 pixels (largeur) x 480 pixels (hauteur)
•Profondeur de couleur = 24 bits (3 octets par pixel : RVB)
•Taille de l'image non compressée = Nombre total de pixels x Profondeur de couleur
•Taille de l'image non compressée = 640 x 480 x 24 bits
Pour obtenir la taille en octets, nous divisons par 8 (car 1 octet = 8 bits) :
•Taille de l'image non compressée = (640 x 480 x 24 bits) / 8
b) Résolution 1280x960 pixels :
•Nombre total de pixels = 1280 pixels (largeur) x 960 pixels (hauteur)
•Profondeur de couleur = 24 bits (3 octets par pixel : RVB)
•Taille de l'image non compressée = Nombre total de pixels x Profondeur de couleur
•Taille de l'image non compressée = 1280 x 960 x 24 bits
Pour obtenir la taille en octets, nous divisons par 8 (car 1 octet = 8 bits) :
•Taille de l'image non compressée = (1280 x 960 x 24 bits) / 8
c) Résolution 1600x1200 pixels :
•Nombre total de pixels = 1600 pixels (largeur) x 1200 pixels (hauteur)
•Profondeur de couleur = 24 bits (3 octets par pixel : RVB)
•Taille de l'image non compressée = Nombre total de pixels x Profondeur de couleur
•Taille de l'image non compressée = 1600 x 1200 x 24 bits
Pour obtenir la taille en octets, nous divisons par 8 (car 1 octet = 8 bits) :
•Taille de l'image non compressée = (1600 x 1200 x 24 bits) / 8
Exercice 2
La notice d'un appareil photographique numérique indique une « résolution » du capteur CCD de
3 072 x 2048, soit 6,3 mégapixels (Mpx). Une image est dite de qualité « photo » quand la taille
du pixel est suffisamment petite pour qu'un œil normal n'en perçoive pas les détails. On considère
qu'un œil normal peut percevoir des détails lorsque les rayons lumineux issus de ces détails
arrivent dans l'œil avec un angle supérieur à une minute. En codage normal, un pixel est codé en
RVB 24 bits.
Données :
•1 Mo = 1 024 Ko et 1 Ko = 1 024 octets.
•1 pouce = 2,54 cm.
• 1 minute d'angle = 1/60 °
a.Qu'appelle-t-on une image numérique ?
b. Par abus de langage, les fabricants utilisent le terme « résolution ». Quel est celui qui convient
en réalité ?
c. Le constructeur affiche une « résolution » de 3 072 x 2 048. Que représentent ces valeurs ?
2. a. Combien d'octets sont utilisés pour coder un pixel ?
b. Déterminer la taille d'une image correspondant à la « résolution » indiquée par le fabriquant.
Exprimer le résultat en Mo.
3. Calculer la taille du plus petit détail que l'on peut observer à l'œil nu sur un objet situé à 25 cm
de l'œil.
4.a. Quelle est la résolution minimale d'une image numérique de qualité photo située à une
distance de 25 cm de l'œil? On exprimera la résolution en ppp : pixels par pouce.
b. On souhaite imprimer une photo prise avec cet appareil. Quelle est la taille maximale de
l'impression qui permet d'avoir une qualité photo? On l'exprimera en cm x cm.

Vous aimerez peut-être aussi