Vous êtes sur la page 1sur 17

Performance des Processeurs Page 1 sur 17

Université Libanaise

« Les Processeurs »
Document d’analyse

Performance des Processeurs  Dossier D’analyse Projet «Architecture des ordinateurs»


Performance des Processeurs Page 2 sur 17

A - Objet du document
CPU, GPU, TPU… Le matériel informatique est toujours associé à des
acronymes. Alors, lorsqu’on ne baigne pas dans le milieu, il peut être difficile de
savoir ce que c’est ! Et encore plus d’en connaître les différences. Les CPU,
GPU et TPU sont pourtant des composants essentiels pour les ordinateurs,
tablettes et smart phones. Il est donc important de comprendre de quoi il s’agit.

Préparé par:
 Hassan Bechara

Performance des Processeurs  Dossier D’analyse Projet «Architecture des ordinateurs»


Performance des Processeurs Page 3 sur 17

Sommaire

A - OBJET DU DOCUMENT....................................2
B - INTRODUCTION.........................................................................................................................4
C - OBJECTIFS ...................................................................................................................................4
D- CPU..................................................................................................................................................5
1 - DEFINITION ..................................................................................................................................5
2 - DESCRIPTION ...............................................................................................................................5
3 - PRINCIPE DE FONCTIONNEMENT ...................................................................................................6
4 - INSTRUCTION ...............................................................................................................................6
5 - PERFORMANCE .............................................................................................................................7
E- GPU..................................................................................................................................................7
1 - PRESENTATION DE LA CARTE GRAPHIQUE ....................................................................................7
2 - DEFINITION DE GPU ......................................................................................................................8
3 - FONCTIONNEMENT .......................................................................................................................8
4 - PERFORMANCE .............................................................................................................................9
F - TPU..................................................................................................................................................9
1 - DEFINITION ..................................................................................................................................9
2 - CARACTERISTIQUES .....................................................................................................................9
3 - FONCTIONNEMENT........................................................................................................................9
G - COMPARAISON ENTRE LES DIFFERENTS TYPES : .....................................................10
1 - OBJECTIF/ROLE ..........................................................................................................................10
2 - USAGE .......................................................................................................................................10
3 - CHARGE DU TRAVAIL.................................................................................................................10
4 - ARCHITECTURE ..........................................................................................................................11
5 - CARACTERISTIQUE ....................................................................................................................12
6 - NOMBRE D'OPERATIONS PAR CYCLE...........................................................................................12
7 - PERFORMANCE/WATT ................................................................................................................12
8 - PERFORMANCE SELON CHARGE DE TRAVAIL DE REFERANCE......................................................13
H - CONCLUSION ...........................................................................................................................14

Performance des Processeurs  Dossier D’analyse Projet «Architecture des ordinateurs»


B - Introduction
Une fois de plus, l’architecture des ordinateurs se trouve à une croisée des
chemins. Le progrés nous a donné des machines individuelles aussi puissantes que ce
qui était considéré comme un « superordinateur » il y a seulement quelques années.

CPU, TPU et GPU font partie des composantes informatiques de base. Les
fiches techniques de tous les ordinateurs, tablettes et smart phones les mentionnent
toujours. Alors, quand il est temps de changer de matériel, connaître les différences
entre ces trois acronymes est indispensable. Voyons donc, en détail, ce qu’est un CPU,
un GPU et un TPU.

Ce document propose un sous-titre consacré aux processeurs. Il forme un cours


qui complète les enseignements de système informatique. On y découvre la définition
des différentes types des processeurs.

En plus, ce document présente également un sous-titre sur la performance des


processeurs. On sait que les utilisateurs s’impatientent lorsqu’un service met trop de
temps à réagir. Dans cette partie, on verra la comparaison des performances globales
entre les différentes types de processeurs.

Enfin, ce document se termine par un sous-titre consacré la comparaison entre


les processeurs.

       

C - Objectifs
L’objectif de ce projet est de rassembler:
1) La définition des différents types des processeurs (CPU, GPU et TPU).
2) Leurs performances.
3) La différence (comparaison) entre les différents types.
D - CPU
1. Définition
L’acronyme CPU signifie Central Processing Unit,  (Unité Centrale de
Traitement) . C’est ce que l’on appelle communément le
processeur. Et, pour faire encore plus simple, c’est le cerveau de
l'ordinateur. Le CPU est un élément essentiel du hardware. En
effet, il permet de manipuler des informations numériques,
c'est-à-dire des informations codées sous forme binaire, et
d'exécuter les instructions stockées en mémoire. 
Le CPU est un composant présent, dans de nombreux dispositifs électroniques, qui
exécute les instructions machines des programmes informatiques. Avec la mémoire,
c'est notamment l'un des composants qui existent depuis les premiers ordinateurs et qui
sont présents dans tous les ordinateurs.

2. Description

Le CPU est constitué essentiellement de trois parties :


 L'unité de commande qui
cherche les instructions en mémoire, les décode et coordonne le reste du processeur
pour les exécuter. Une unité de commande élémentaire se compose essentiellement
d'un registre d'instruction et d'une unité "décodeur / séquenceur".
 L’unité Arithmétique et Logique (ALU) exécute les instructions
arithmétiques et logiques demandées par l'unité de commande. Les instructions
peuvent porter sur un ou plusieurs opérandes.
 Les registres sont des cellules mémoire internes au CPU. Ils sont
peu nombreux mais d'accès très rapide. Ils servent à stocker des variables, les résultats
intermédiaires d'opérations (arithmétiques ou logiques) ou encore des informations de
contrôle du processeur.

E - Principe de fonctionnement du CPU


Le processeur CPU est un circuit électronique cadencé au rythme d'une horloge
interne, c'est-à-dire un élément qui envoie des impulsions (que l'on appelle top).
A chaque top d'horloge, le processeur :
- Fetch, recherche de l'instruction dans la
mémoire vive de l'ordinateur. L'emplacement dans la
mémoire est déterminé par le compteur de
programme (PC), qui stocke l'adresse de la
prochaine instruction dans un autre registre du
processeur: le IR (Instruction Register)
- Decode, interprétation de l'instruction
(opération et opérandes) : découpe l'instruction en
plusieurs parties telles qu'elles puissent être
utilisées par d'autres parties du processeur. Souvent,
une partie d'une instruction, appelée  code
d'opération, indique l'opération à effectuer. Les
parties restantes de l'instruction comportent
habituellement les opérandes de l'opération
- Execute, exécution de l'instruction: met en relation différentes parties du
processeur pour réaliser l'opération souhaitée. Par exemple, pour une addition, l'unité
arithmétique et logique (ALU) sera connectée à des entrées et une sortie. Les entrées
contiennent les nombres à additionner et la sortie contient le résultat.
- Writeback, écriture du résultat de l'étape d'exécution en mémoire.

3. Instruction
A chaque top d'horloge, le processeur exécute une instruction.
Les instructions sont stockées dans la mémoire principale comme une chaîne de bits.,
en vue d'être traitée par le processeur. L’instruction est divisée en plusieurs champs,
correspondant à ses différents éléments. L’organisation de ces différents champs est
appelée le format de l’instruction.
Le format d’une instruction doit utiliser deux champs:
- le code opération, représentant l'action que le processeur doit accomplir ;
- le code opérande, définissant les paramètres de l'action. Le code opérande
dépend de l'opération. Il peut s'agir d'une donnée ou bien d'une adresse mémoire.
Les principaux types d’opérandes traités directement par les processeurs sont:
adresses, nombres, caractères et données. Le nombre d’opérandes, ainsi que leur
emplacement, a une très grande importance, à cause de l’influence sur la taille des
instructions et sur la vitesse d’exécution.

4. Performance
Côté performance, la fréquence d'horloge (appelée également cycle,
correspondant au nombre d'impulsions par seconde), s'exprime en Hertz (Hz). Par
exemple, un processeur de 2.4GHz peut traiter 2.4 milliards d’instructions en une
seconde !
L'indicateur appelé CPI (Cycles Par Instruction) permet de représenter le nombre
moyen de cycles d'horloge nécessaire à l'exécution d'une instruction sur un
microprocesseur. La puissance du processeur peut ainsi être caractérisée par le nombre
d'instructions qu'il est capable de traiter par seconde. L'unité utilisée est le MIPS
(Millions d'Instructions Par Seconde) correspondant à la fréquence du processeur que
divise le CPI. 
Un CPU à basse performance sera idéal pour des tâches de traitement de texte. A
l’inverse, un CPU à haute performance est un trou noir à énergie mais il soutient les
activités les plus gourmandes, comme le montage vidéo et les jeux.

E- GPU
1. Présentation de la carte graphique
La carte graphique (en anglais graphic adapter),
parfois appelée carte vidéo ou accélérateur
graphique, est l'élément de l'ordinateur chargé de
convertir les données numériques à afficher en
données graphiques exploitables par un périphérique
d'affichage. Cette carte peut être soit intégrée
directement à la carte-mère ou bien une carte additionnelle. 
Le rôle de la carte graphique était initialement l'envoi de pixels graphique à un
écran, ainsi qu'un ensemble de manipulation graphiques simples :
- déplacement des blocs (curseur de la souris par exemple) ;
- tracé de lignes ;
- tracé de polygones ; ect …
Les cartes graphiques puissantes ont pour rôle également de gérer les affichages 3D
(jeux vidéo). Les principaux constructeurs de cartes graphiques sont Nvidia et ATI.
Une carte graphique est construite autour de deux composants principaux : le
GPU (Graphic Processing Unit), un processeur spécialisé dans le calcul de
graphismes 2D ou 3D, et la mémoire, qui échange des données temporaires avec le
GPU puis stocke et envoie les images finales au moniteur.

2. Définition de GPU
Un processeur graphique, ou GPU (de
l'anglais Graphics Processing Unit), est un circuit
intégré présent la plupart du temps sur une carte
graphique (mais pouvant aussi être intégré sur une carte-
mère ou dans un CPU) et chargé de traiter les images en
fonction de la résolution et de la profondeur de
codage sélectionnée en assurant les fonctions de calcul de l'affichage.
Le GPU est ainsi un processeur spécialisé possédant des instructions évoluées de
traitement de l'image, notamment de la 3D. En raison de la température que peut
atteindre le processeur graphique, il est souvent surmonté d'un radiateur et d'un
ventilateur.

3. Fonctionnement
Il faut d’abord savoir ce que sont
les vertex, ce sont les sommets des
objets en trois dimensions). Le
processeur construit les objets
multidimensionnels.
Pour accélérer le calcul, le
processeur calcule les vertex invisibles
(cachés par d’autres vertex, par les faces
d’un objet ou autre) et les supprime
pour ne pas avoir à les gérer.
Le processeur graphique applique ensuite aux faces des objets les textures puisées
sur le disque dur grâce au Pixel Pipeline. Le moteur graphique envoie ensuite au
processeur des données sur l’éclairage des polygones, que celui-ci se charge de mettre
en œuvre pour éclairer la scène. Ensuite, la puce graphique applique à l’image les
divers filtres (anticrénelage ou filtrage anisotrope), et envoie le résultat à la fenêtre
d’affichage, qui « aplatit » l’image pour l’afficher à l’écran.
4. Performance
Comme tout processeur, il se caractérise avant tout par une fréquence et une
finesse de gravure et bien évidemment une gamme de puces graphiques.
La fréquence, exprimée en MHz ou GHz, indique la vitesse à laquelle le GPU effectue
ses calculs. Mais ce n'est pas un indice suffisant pour connaître les performances d'une
carte graphique. D'autres éléments entrent en ligne de compte, comme le nombre
d'unités de calcul, dédiées aux opérations vectorielles ou scalaires. La comparaison de
deux cartes sur la base de la fréquence n'est pertinente que si elles possèdent
strictement la même architecture.

F- TPU
1. Définition
Un Tensor Processing Unit (TPU, unité de traitement de tenseur) est un circuit
intégré spécifique pour une application (ASIC), développé par Google spécifiquement
pour accélérer les systèmes d'intelligence artificielle par réseaux de neurones.

2. Caractéristiques
Le TPU est un nouveau type de processeur conçu et utilisé par Google pour
optimiser les opérations dédiées à l’apprentissage automatique.
Le TPU de Google annonce avoir conçu un processeur dédié à l’apprentissage
automatique nommé TPU (TensorFlow Processing Unit). Ces TPU sont de petits
modules dédiés aux systèmes d’intelligence artificielle (Machine learning). Cette
technique d’apprentissage qui permet notamment de savoir si une photo contient un
chien ou si deux personnes se font des câlins.

3. Fonctionnement
Les TPU effectuent ce que Google appelle le traitement matriciel. Les processeurs
centraux sont conçus pour le traitement scalaire, c’est-à-dire le traitement d’une seule
opération par instruction. Les processeurs graphiques sont des processeurs vectoriels.
Ils peuvent exécuter plusieurs opérations simultanées, ce qui entraîne la réalisation de
centaines ou de milliers d’opérations au cours d’un même cycle d’horloge. Les TPU
sont conçus pour le traitement matriciel, qui permet d’exécuter des centaines de
milliers d’opérations par cycle d’horloge (soit bien plus d’opérations par cycle que les
processeurs graphiques).

G- Comparaison entre les différents types


Les CPU, TPU et GPU peuvent réaliser le même résultat mais en suivant un
chemin différent et des performances différentes.
On les a comparé en ce qui concerne l’architecture du sous-système de mémoire, la
primitive de calcul, les performances, le but, l’utilisation, les fabricants et d’autres.

1. Objectif/Rôle :
 CPU: Processeur conçu pour résoudre tous les problèmes de calcul de manière
générale. La conception du cache et de la mémoire est conçue pour être optimale pour
tout problème de programmation général.

 GPU: Processeur conçu pour accélérer le rendu des graphiques.

 TPU: Un coprocesseur conçu pour accélérer les tâches d'apprentissage en


profondeur développées à l'aide de TensorFlow (un cadre de programmation) .Les
compilateurs n’ont pas été développés pour TPU, ils pourraient être utilisés pour une
programmation générale; par conséquent, il faut un effort considérable pour faire de la
programmation générale sur TPU

2. Usage:
 CPU: problème de programmation d'usage général
 GPU: rendu graphique, apprentissage et inférence de modèle d'apprentissage
automatique, efficace pour les problèmes de programmation à portée de
parallélisassion, problème de programmation général
 TPU: modèle d'apprentissage machine (uniquement dans le modèle
TensorFlow), formation et déduction

3. Selon le charge de travail:


Sur les charges de travail qui utilisent l'inférence de réseau neuronal, le TPU est 15
à 30 fois plus rapide que les processeurs graphiques et les processeurs contemporains.
De plus, le TPU est beaucoup plus économe en énergie, avec une amélioration de 30 à
80 fois la mesure téra-opérations /Watt.

4. Selon l’architecture:
 CPU:
Les trois composants typiques d’une CPU:
- unité logique arithmétique (ALU), qui effectue des opérations arithmétiques et
logiques.
- Control Unit (CU), qui extrait les instructions de la mémoire, les décode et les
exécute, en appelant l’ALU si nécessaire.
- unité de gestion de la mémoire , qui est disponible dans la plupart des
microprocesseurs haut de gamme pour traduire les adresses logiques en adresses RAM
physiques.

 GPU:
Sur le plan architectural, le processeur est composé de peu de cœurs et de mémoire
cache pouvant gérer plusieurs threads logiciels à la fois. En revanche, un GPU est
composé de centaines de cœurs pouvant gérer des milliers de threads simultanément.
La capacité d'un processeur graphique doté de plus de 100 cœurs à traiter des
milliers de threads peut accélérer de 100% certains logiciels par rapport à un
processeur uniquement.

 TPU:
Le TPU comprend les ressources de calcul suivantes:
- Unité de multiplication de matrice (MXU) : 65 536 unités de multiplication et
d'ajout de 8 bits pour les opérations de matrice
- Tampon unifié (UB) : 24 Mo de SRAM fonctionnant comme des registres
- Unité d'activation (AU) : fonctions d'activation câblées

5. Caractéristiques:
 Petit modèle
CPU  Petits ensembles de données
 Utile pour l’exploration de l’espace de conception
 Modèle de moyenne à grande taille
GPU  Pour le traitement de l’image et des vidéos
 Application sur CUDA ou OpenCL
 Calcul des matrices
TPU  Traitement des vectoriels
 Pas d’opérations personnalisées TensorFlow

6. Nombre d’opérations par cycle:

Type des processeurs Opérations par cycle


CPU Quelques
CPU (extension vectorielle) Dizaines
GPU Des dizaines de milliers
TPU Des centaines de milliers, jusqu’à 128K

7. Performance/Watt:

Lors de l'exécution d’une multiplication de matrice massive, tous les résultats


intermédiaires sont passés directement entre 64 000 ALU sans accès à la mémoire, ce
qui réduit considérablement la consommation d'énergie et augmente le débit.
En conséquence, la conception du processeur matriciel basé sur CISC offre un
rapport performances par watt exceptionnel:
- le TPU offre un rapport 83X supérieur à celui des processeurs modernes et 29
fois supérieur à celui des GPU contemporains.
8. Performances sur six charges de travail de référence:

Tout le monde sait que les utilisateurs s'impatientent lorsqu'un service met trop
de temps à réagir.
Ainsi, pour l'application MLP0, nous limitons la latence de prédiction du 99e
centile à environ 7 ms, pour une expérience utilisateur toujours plus rapide avec les
services Google basés sur le TPU. Vous trouverez ci-dessous une comparaison des
performances globales (prévisions par seconde) entre le TPU et un processeur et un
GPU contemporains sur six applications de réseau neuronal avec une limite de latence.
Dans les cas les plus spectaculaires, le TPU fournit une performance 71X
comparée au CPU de l'application CNN1.

H- Conclusion
CPU / GPU  / TPU
Central / Graphical  / Tensor Processing Units
 
Unités de traitements des microprocesseurs destinés à manipuler des données de plus en plus
massives. Applications à l'intelligence artificielle et à l'apprentissage renforcé.
 
 
CPU – Central Processing Units
 
Cœur des microprocesseurs classiques composés Une CPU comprend principalement une unité
de millions de transistors. arithmétique et logique (ALU) capable de :
Malgré la vitesse de traitement de plus en plus - exécuter des instructions, réalisant des
rapide, ces circuits traitent les données les unes calculs, accédant aux mémoires et contrôlant les
après les autres, en série. entrées et les sorties de données.
 

GPU – Graphical Processing Units

  Application notamment aux jeux vidéo qui  ont


Microprocesseurs dédiés au calcul des images. besoin d'une grande agilité en renouvellement
Capables de traiter un grand nombre de données des images 3D en haute définition.
aboutissant à la génération des pixels d'une image. Le calcul des parties cachées et des textures des
Ce sont des unités de calcul parallèles qui objets réclame une grande capacité de
exécutent des opérations simultanées sur manipulation de matrices de données.
des matrices de données.
 

 
TPU – Tensor Processing Units
 
Un tenseur est une généralisation des
Microprocesseurs spécialement destinés aux
vecteurs  et des matrices
circuits neuronaux utilisés en intelligence
C'est Google qui a annoncé le premier en 2016
artificielle.
le lancement d'un tel processeur dont le
Ces circuits sont composés couches de calcul
développement avait été entamé en 2013.
géantes. Ils exécutent de grandes quantité de
La troisième génération de 2018 offre une
calculs multidimensionnels en parallèle
capacité de calcul proche des 100 téra flops
(convolution de matrices, par exemple).
(1014 opérations flottantes par seconde)
 

Vous aimerez peut-être aussi