09 Bfgs

Méthodes Quasi-Newton
Michel Bierlaire
michel.bierlaire@epfl.ch
Laboratoire Transport et Mobilité

EPFL - ENAC - TRANSP-OR
Méthodes Quasi-Newton – p. 1/20

Méthodes quasi-Newton : BFGS
• Matrice hessienne coûteuse

• Adapter les méthodes quasi-Newton pour les équations à
l’optimisation
• Approximer ∇2 f (x
b) en utilisant Broyden
(yk−1 − Hk−1 dk−1 )dTk−1

Hk = Hk−1 + ,
dTk−1 dk−1
avec
dk−1 = xk − xk−1
yk−1 = ∇f (xk ) − ∇f (xk−1 ).

• Hk vérifie l’équation sécante

• Hk n’est pas nécessairement symétrique
• Hk n’est pas nécessairement définie positive
On désire forcer Hk à être symétrique et définie positive
Hk = Lk LTK
Idée : travailler sur Lk plutôt que sur Hk .

Mise à jour de Lk en Ak .

Equation sécante (oublions les indices k ) :
AAT d = y
ou encore
Ax = y
AT d = x
Considérons Ax = y comme équation sécante

Mise à jour de Broyden de L
(y − Lx)xT
A=L+ T
.
x x
(p. 312)

Mise à jour BFGS

Soient une fonction f : Rn → R continument différentiable, et deux itérés
xk−1 et xk , tels que dTk−1 yk−1 > 0, avec dk−1 = xk − xk−1 et yk−1 =
∇f (xk ) − ∇f (xk−1 ).
Soit une matrice symétrique définie positive Hk−1 ∈ Rn×n .
La mise à jour BFGS est définie par
T
yk−1 yk−1 Hk−1 dk−1 dTk−1 Hk−1
Hk = Hk−1 + T − T
.
yk−1 dk−1 dk−1 Hk−1 dk−1

Elle tient son nom des initiales des mathématiciens C. G. Broyden,

R. Fletcher, D. Goldfarb et D. F. Shanno, qui l’ont découverte
indépendamment à la fin des années 60.

Lemme 1 Soit d, y ∈ Rn , d 6= 0. Alors il existe une matrice A ∈ Rn×n non

singulière telle que
AAT d = y
si et seulement si
dT y > 0.
(p. 314)
Cette condition est toujours vérifiée si la seconde condition de Wolfe

est utilisée (p. 315).

• Méthode de Newton avec recherche linéaire

• Remplaçons ∇2 f (xk ) par Hk
• Garantie que Hk est définie positive
• Nécessité de résoudre Hk dk = −∇f (xk )
• On peut calculer Hk−1 analytiquement
Hk−1 =
T T
dk−1 yk−1 −1 d k−1 y dk−1 dT
I − dT y Hk−1 I − dT yk−1 + T
k−1
dk−1 yk−1
k−1 k−1 k−1 k−1

Algorithme : quasi-Newton : BFGS
Objectif
Trouver une approximation d’un minimum local du problème
minn f (x).
x∈R
Input
• La fonction f : Rn → R différentiable;
• Le gradient de la fonction ∇f : Rn → Rn ;
• Une première approximation de la solution x0 ∈ Rn ;

Input (suite)
• Une première approximation de l’inverse du hessien
H0−1 ∈ Rn×n symétrique définie positive. Par défaut,
H0−1 = I .
• La précision demandée ε ∈ R, ε > 0.
Output
Une approximation de la solution x∗ ∈ R

Initialisation
k=0
Itérations
• Calculer dk = −Hk−1 ∇f (xk )
• Déterminer αk en appliquant la recherche linéaire avec
α 0 = 1.
• xk+1 = xk + αk dk .
• k = k + 1.

Itérations (suite)
• Mettre à jour Hk−1
Hk−1 =

d¯k−1 yk−1
T
−1 d¯k−1 y T d¯k−1 d¯T
I − d¯T y Hk−1 I − d¯T yk−1 + d¯T
k−1
yk−1
k−1 k−1 k−1 k−1 k−1
avec d¯k−1 = αk−1 dk−1 = xk − xk−1 et

yk−1 = ∇f (xk ) − ∇f (xk−1 ).
Critère d’arrêt
Si k∇f (xk )k ≤ ε, alors x∗ = xk .

BFGS : exemple
1 2
min f (x1 , x2 ) = x1 + x1 cos x2 ,
2
x2

BFGS : exemple
1 2
min f (x1 , x2 ) = x1 + x1 cos x2 ,
2
x∗2
x̄1
x∗1
x̄0
x∗0
x̄−1
x∗−1
x̄−2
x∗−2
Point de départ x0 = (1 1)T .

BFGS : exemple
x∗ 4
x0 2
0 x2
-2
-4
-6
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x1

BFGS : exemple
x∗ 3.5
2.5 x2
2
1.5
x0
1
0 0.2 0.4 0.6 0.8 1
x1

Méthodes quasi-Newton : SR1
• BFGS : mise à jour de rang 2 (rang de Hk − Hk−1 )

• SR1 : mise à jour de rang 1
Symmetric Rank 1
Hk = Hk−1 + βvv T ,
avec β = 1 ou −1.
(p. 317)

Mise à jour SR1

Soient une fonction f : Rn → R continument différentiable, et deux itérés
xk−1 et xk , tels que dTk−1 yk−1 > 0, avec dk−1 = xk − xk−1 et yk−1 =
∇f (xk ) − ∇f (xk−1 ).
Soit une matrice symétrique définie positive Hk−1 ∈ Rn×n .
La mise à jour SR1 est définie par
(yk−1 − Hk−1 dk−1 )(yk−1 − Hk−1 dk−1 )T

Hk = Hk−1 + .
dTk−1 (yk−1 − Hk−1 dk−1 )
Il s’agit d’une mise à jour symétrique de rang 1, ou Symmetric Rank 1 (SR1)

en anglais.

• Bien définie que si
dTk−1 (yk−1 − Hk−1 dk−1 ) 6= 0
• Pas nécessairement définie positive

• Préférable de l’utiliser avec la région de confiance (voir Chap.
12)

Méthodes quasi-Newton
• BFGS
• SR1
• Autres formules proposées, notamment Davidon, Fletcher,
Powell (DFP)

09 Bfgs

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

09 Bfgs

Transféré par

Droits d'auteur :

Formats disponibles

Méthodes Quasi-Newton

Laboratoire Transport et Mobilité

Méthodes Quasi-Newton – p. 1/20

• Matrice hessienne coûteuse

(yk−1 − Hk−1 dk−1 )dTk−1

Méthodes Quasi-Newton – p. 2/20

• Hk vérifie l’équation sécante

On désire forcer Hk à être symétrique et définie positive

Idée : travailler sur Lk plutôt que sur Hk .

Méthodes Quasi-Newton – p. 3/20

Equation sécante (oublions les indices k ) :

Considérons Ax = y comme équation sécante

Méthodes Quasi-Newton – p. 4/20

Mise à jour BFGS

Méthodes Quasi-Newton – p. 5/20

Elle tient son nom des initiales des mathématiciens C. G. Broyden,

Méthodes Quasi-Newton – p. 6/20

Lemme 1 Soit d, y ∈ Rn , d 6= 0. Alors il existe une matrice A ∈ Rn×n non

Cette condition est toujours vérifiée si la seconde condition de Wolfe

Méthodes Quasi-Newton – p. 7/20

• Méthode de Newton avec recherche linéaire

Méthodes Quasi-Newton – p. 8/20

Méthodes Quasi-Newton – p. 9/20

Méthodes Quasi-Newton – p. 10/20

Méthodes Quasi-Newton – p. 11/20

avec d¯k−1 = αk−1 dk−1 = xk − xk−1 et

Méthodes Quasi-Newton – p. 12/20

Méthodes Quasi-Newton – p. 13/20

Point de départ x0 = (1 1)T .

Méthodes Quasi-Newton – p. 14/20

Méthodes Quasi-Newton – p. 15/20

Méthodes Quasi-Newton – p. 16/20

• BFGS : mise à jour de rang 2 (rang de Hk − Hk−1 )

Méthodes Quasi-Newton – p. 17/20

Mise à jour SR1

(yk−1 − Hk−1 dk−1 )(yk−1 − Hk−1 dk−1 )T

Il s’agit d’une mise à jour symétrique de rang 1, ou Symmetric Rank 1 (SR1)

Méthodes Quasi-Newton – p. 18/20

• Bien définie que si

dTk−1 (yk−1 − Hk−1 dk−1 ) 6= 0

• Pas nécessairement définie positive

Méthodes Quasi-Newton – p. 19/20

Méthodes Quasi-Newton – p. 20/20

Vous aimerez peut-être aussi