Introduction :
Remarque :
Si de plus 𝑓 est convexe alors la condition est aussi suffisante. Si de plus 𝑓 est
strictement convexe alors 𝑥 ∗ est unique.
Page 1
Optimisation sans contraintes (L3 RO)
Méthode de gradient :
Justificatif :
Condition de convergence :
Théorème :
Alors ∇𝑓(𝑥 ) = 𝐴𝑥 + 𝑏
Page 2
Optimisation sans contraintes (L3 RO)
⟺ − 〈𝐴𝑥 𝑘 + 𝑏, 𝐴 (𝑥 𝑘 − 𝜌∇𝑓(𝑥 𝑘 )) + 𝑏〉 = 0
2
⟺ −‖𝐴𝑥 𝑘 + 𝑏‖ + 𝜌〈𝐴𝑥𝑘 + 𝑏, 𝐴(𝐴𝑥 𝑘 + 𝑏)〉 = 0
2
‖𝐴𝑥𝑘 +𝑏‖
⇒ 𝜌𝑘 = 〈 … (∗)
𝐴𝑥𝑘 +𝑏,𝐴(𝐴𝑥𝑘 +𝑏)〉
Donc l’algorithme du gradient à pas optimal dans le cas quadratique est défini
par : 𝑥 𝑘+1 = 𝑥 𝑘 − 𝜌𝑘 (𝐴𝑥 𝑘 + 𝑏) où 𝜌𝑘 est défini par (∗).
Exercice :
1
𝑔(𝜌) = 𝑓 (𝑋 𝑘 − 𝜌∇𝑓(𝑋 𝑘 )) = 𝑓((𝑥𝑘 , 𝑦𝑘 ) − 𝜌 ( 𝑥𝑘 , 𝑦𝑘 ))
2
1 1 1
= (1 − 𝜌)2 𝑥𝑘2 + (1 − 𝜌)2 𝑦𝑘2
4 2 2
1 1
𝑔′ (𝜌) = − (1 − 𝜌) 𝑥𝑘2 − (1 − 𝜌)𝑦𝑘2 = 0
4 2
1 2
𝑥 +𝑦2 𝑥2 2
4 𝑘 𝑘 𝑘 +4𝑦𝑘
𝜌𝑘 = 1 2 = 2( )
𝑥 +𝑦2 𝑥2 2
𝑘 +8𝑦𝑘
8 𝑘 𝑘
1 1
𝑋 𝑘+1 = (𝑥𝑘+1 , 𝑦𝑘+1 ) = (𝑥𝑘 , 𝑦𝑘 ) − 𝜌𝑘 ( 𝑥𝑘 , 𝑦𝑘 ) = ((1 − 𝜌) 𝑥𝑘 , (1 − 𝜌)𝑦𝑘 ) =
2 2
Page 3
Optimisation sans contraintes (L3 RO)
4 1
2/ 𝑋 1 = ( , − )
9 9
2 2
𝑋2 = ( , )
27 27
Remarque :
1
0 0
On peut utiliser la formule (∗) pour calculer 𝜌𝑘 où 𝐴 = ( 2 ) , 𝑏 = ( ) et
0 1 0
𝑐 = 0.
1 2 1
𝐴𝑋 𝑘 + 𝑏 = ( 𝑥𝑘 , 𝑦𝑘 ) et ‖𝐴𝑋 𝑘 + 𝑏‖ = 𝑥𝑘2 + 𝑦𝑘2
2 4
1 1
𝐴(𝐴𝑋 𝑘 + 𝑏) = ( 𝑥𝑘 , 𝑦𝑘 ) et 〈𝐴𝑥 𝑘 + 𝑏, 𝐴(𝐴𝑥 𝑘 + 𝑏)〉 = 𝑥𝑘2 + 𝑦𝑘2 et
4 8
1 2
𝑥 +𝑦𝑘2
4 𝑘
𝜌𝑘 = 1 2 .
𝑥 +𝑦𝑘2
8 𝑘
Définition :
𝑑0 = 𝑒1
𝑑1 = 𝑒2 + 𝛼1,0𝑑0
𝑑2 = 𝑒3 + 𝛼2,0 𝑑0 + 𝛼2,1 𝑑1
Page 4
Optimisation sans contraintes (L3 RO)
Exemple
2 4 0
Soit 𝐴 = (4 10 0)
0 0 1
𝑑0 = 𝑒1
−𝑑𝑡0 𝐴𝑒2 −4
𝑑1 = 𝑒2 + 𝛼1,0𝑑0 tel que 𝑑0𝑡 𝐴𝑑1 = 0 ⟺ 𝛼1,0 = = = −2
𝑑𝑡0 𝐴𝑑0 2
0 1 −2
Donc 𝑑1 = (1) − 2 (0) = ( 1 )
0 0 0
𝑑2 = 𝑒3 + 𝛼2,0 𝑑0 + 𝛼2,1 𝑑1 tel que 𝑑0𝑡 𝐴𝑑2 = 𝑑1𝑡 𝐴𝑑2 = 0
−𝑑𝑡0 𝐴𝑒3
𝑑0𝑡 𝐴𝑑2 = 0 ⟺ 𝛼2,0 = =0
𝑑𝑡0 𝐴𝑑0
−𝑑𝑡1 𝐴𝑒3
𝑑1𝑡 𝐴𝑑2 = 0 ⟺ 𝛼2,1 = = 0 donc 𝑑2 = 𝑒3
𝑑𝑡1 𝐴𝑑1
donc 𝑔′ (𝜌𝑘 ) = 0
⟺ 𝑑𝑘𝑡 ∇𝑓(𝑥 𝑘 + 𝜌𝑘 𝑑𝑘 ) = 0
⟺ 𝑑𝑘𝑡 (𝐴(𝑥𝑘 + 𝜌𝑘 𝑑𝑘 ) + 𝑏) = 0
Page 5
Optimisation sans contraintes (L3 RO)
Exemple :
Solution :
1
𝑓 est une forme quadratique de la forme : 𝑓(𝑥 ) = 𝑥 𝑡 𝐴𝑥 + 𝑏𝑡 𝑥 + 𝑐
2
2 4 0 2
Où 𝐴 = (4 10 0) symétrique définie positive, 𝑏 = (3) et 𝑐 = 0.
0 0 1 0
Les directions conjuguées par rapport à 𝐴 ont été construites dans l’exemple
précédent.
Itération1 :
−𝑑𝑡0 (𝐴(𝑥0 +𝑏) −2
𝑥 1 = 𝑥 0 + 𝜌0 𝑑0 où 𝜌0 = = = −1
𝑑𝑡0 𝐴𝑑0 2
1 −1
1
𝑥 = − (0) = ( 0 )
0 0
0
1)
∇𝑓(𝑥 = (−1) ≠ 0
0
Itération2 :
−𝑑𝑡1 (𝐴(𝑥0 +𝑏) 1
𝑥 2 = 𝑥 1 + 𝜌1 𝑑1 où 𝜌1 = =
𝑑𝑡1 𝐴𝑑1 2
Page 6
Optimisation sans contraintes (L3 RO)
−1 −2 −2
2 1 1
𝑥 = ( 0 )+ ( 1 )= ( )
2 2
0 0 0
0
2)
∇𝑓(𝑥 = (0) donc 𝑥 2 est la solution optimale de (𝑃).
0
Remarque :
Page 7