Académique Documents
Professionnel Documents
Culture Documents
Stéphane Airiau
LAMSADE
a0
0.4
Σ
0.2
−10 −5 5 10
−0.2
−0.4
w
1,j
0.4
0.4
a1 w2,j
Σ
P
0.2
0.2
−10 −5 5 10
−0.2
−0.4
−10 −5 5 10
... −0.2
aj
w i−1,j
−0.4
Σ
0.2
d’activation
−10 −5 5 10
−0.2
des inputs
−0.4
ai Xi
0.4
Σ
0.2
−10 −5 5 10
−0.2
−0.4
wi,j ai
i=0
Σ a0
w
1,j 1
a1 w2,j 0.5
Σ
P −10 −5 5 10
... −0.5
aj
w i−1,j −1
wi ← wi + ∆wi
où ∆wi = η(t − o)xi
η est le taux d’apprentissage
(une petite valeur comme 0.1 est habituellement utilisée)
si les données peuvent être apprises par un perceptron (on dit que
les données sont alors linéairement séparables), ce simple
algorithme converge.
1X
E(→
−
w) = (td − od )2
2
d∈D
où
D est l’ensemble de exemples d’apprentissage
td est la vraie classification de l’instance d
od est la réponse du peceptron pour l’instance d
w[0]
w[1]
w[2]
w[3]
w[4]
1X
!
∂E ∂
= (td − od )2
∂wi ∂wi 2
d∈D
1X ∂
= (t − od )2
2 ∂wi d
d∈D
1X ∂
= 2(td − od ) (t − od )
2 ∂wi d
d∈D
X ∂
= (td − od ) (t − →
−
w ·→
−
x d)
∂wi d
d∈D
∂E X
= (td − od )(−xi,d )
∂wi
d∈D
1X X
E(→
−
w) = (tk,d − ok,d )2
2
d∈D k∈sorties
où
D est l’ensemble de exemples d’apprentissage
tk,d est la vraie classification de l’instance d pour la sortie k
ok,d est la valeur de la sortie k pour l’instance d
fonctions booléennes
fonctions continues (théoriquement : toute fonction continue peut
être approximée avec une erreur arbitraire par un réseau avec deux
niveaux d’unités)
fonctions arbitraires (théoriquement : toute fonction peut être
approximée avec une précision aribitraire par un réseau avec 3
niveaux d’unités)
... ...