Académique Documents
Professionnel Documents
Culture Documents
1/35
Definition :
Les réseaux de neurones convolutifs (CNN) sont des algorithmes
d’intelligence artificielle basés sur des réseaux neuronaux multicouches
qui apprennent des caractéristiques pertinentes à partir d’images, étant
capables d’effectuer plusieurs tâches telles que la classification, la
détection et la segmentation d’objets.
Historique :
Une première idée de convolution a été proposée par Kunihiko
Fukushima en 1980 et s’appelait initialement Neocognitron.
3/35
Historique :
Le concept moderne de réseaux de neurones convolutifs provient des
travaux de Yann LeCun publiés en 1998. LeCun aprésenté un CNN appelé
LeNet pour la reconnaissance de l’écriture manuscrite.
5/35
Historique :
En 2012, Alex Krizhevsky a remporté le ImageNet Large Scale Visual
Recognition Challenge avec un modèle CNN appelé AlexNet. Krizhevsky a
utilisé des GPUpour former l’AlexNet, ce qui a permis une formation plus
rapide des modèles CNN et a lancé une vague d’intérêt et de nouveaux
travaux basés sur les CNN.
6/35
Est meilleur?
7/35
Applications populaires
8/35
Applications populaires
BIOMETRIE
9/35
Applications populaires
Voiture autonome
10/35
Applications populaires
11/35
Applications populaires
12/35
CNN COUCHES :
13/35
Couche convolutive :
Une couche convolutive est composée d’un ensemble de filtres,
également appelés noyaux, qui glissent sur les données d’entrée.
Chaque noyau a une largeur, une hauteur et une largeur ×
poidsélevés utilisés pour extraire les caractéristiques des données
d’entrée.
Dans l’étape d’entraînement, les poids dans le noyau commencent par des
valeurs aléatoires et apprendront en fonction de l’ensemble d’entraînement.
14/35
Chaque filtre de la couche convolutive représente une caractéristique.
15/35
Lorsque le filtre glisse sur l'image et trouve une correspondance...
16/35
L’opération de convolution génère un grand nombre, activant le filtre à
cette caractéristique.
17/35
Lorsque le filtre glisse sur l’image et ne trouve aucune correspondance, le
filtre ne s’active pas.
Le CNN utilise ce processus pour apprendre les meilleurs filtres pour
décrire les objets.
18/35
19/35
ReLu :
20/35
ReLu
21/35
Pooling :
22/35
Mutualisation
23/35
Couche entièrement connectée :
Un CNN est divisé en deux parties: les étapes convolutives et les étapes
denses. Le premier apprend les meilleures caractéristiques à extraire des
images et le second apprend à classer les caractéristiques dans
différentescatégories.
24/35
La couche etierement connectee est un Perceptron multicouche,
Compose de trois types couches : couches d’entree, masquees
et de sortie.
25/35
La couche d’entrée reçoit les fonctionnalités générées par le CNN
La couche cachée est une séquence de neurones avecdes poids
qui seront appris à l’étape de l’entraînement. Un MLP est composé
d’un ou plusieurs calques cachés.
La couche de sortie est également une séquence de neurones.
Cependant, il a une fonction d’activation différente. Habituellement,
la fonction softmax est utilisée pour générer les probabilités de
chaque catégorie dans la portée du problème.
26/35
Chaque neurone est composé de :
Un vecteur d’entrée x 0,x 1,...,xn, qui représente les entités
Un vecteur de poids w 0,w 1,...,wn, qui sera appris dans l’étape
d’entraînement
Le biais
Une fonction d’activation
La sortie
27/35
28/35
Le Perceptron effectue l’opération suivante :
29/35
Sigmoid :
30/35
Softmax :
31/35
Than :
32/35
Afin de former un modèle CNN, un jeu de donnéesd’apprentissage
c’est un ensemble d’images et d’étiquettes (classes, cadres de
sélection, masques).
L’algorithme utilisé pour former un CNN est appelé rétropropagation,
qui utilise la valeur de sortie de la dernière couche pour mesurer une
valeur d’erreur. Cette valeur d’erreur est utilisée pour mettre à jour
leshuit w de chaque neurone de cette couche.
Les nouveaux poids sont utilisés pour mesurer une valeur
d’erreur et mettre à jour les poids des précédents.
L’algorithme répète le processus jusqu’à ce qu’il atteigne la
première couche.
33/35
Entraînement (Training)
34/35
35/35