Académique Documents
Professionnel Documents
Culture Documents
Master de Mécanique 3M
Rafic YOUNES
Plan
• Méthodes de descente
• Choix de la direction
• Choix du pas : minimisation / Approximation
• Convergence / Critères d’arrêt
• Méthode de Newton
• Résolution d’une équation non linéaire à une inconnue
• Résolution d’un système d’équations à plusieurs inconnues
• Optimisation par la Méthode de Newton
• Minimisation
• Convergence globale
• Méthodes sécantes ou quasi-Newton
• Minimisation à une seule variable
• Minimisation à plusieurs variables
11/12/2005 Rafic Younès 2
Méthodes de descente
• Problème :
min f : IRn → IR
f continûment différentiable
• Idée :
• On démarre d’un point x0
• On génére des vecteurs x1, x2,… tels que
la valeur de f décroit à chaque itération :
f(xk+1) < f(xk) k=1,2,…
Méthodes de descente
f(x)=c1
x3
x4 x1
x2
x0
f(x)=c2 < c1
f(x)=c3 < c2
11/12/2005 Rafic Younès 4
Directions de descente
Directions de descente
• Considérons la demi-droite
xα = x + α d
• Théorème de Taylor (1er ordre)
f(x+s) = f(x) + ∇f(x)Ts + o(¦¦s¦¦)
avec s = xα-x
f(xα)= f(x) + ∇f(x)T(xα-x) + o(¦¦xα-x¦¦)
= f(x) + α ∇f(x)Td + o(α ¦¦d¦¦)
= f(x) + α ∇f(x)Td + o(α)
Directions de descente
Choix de la direction
Attention: il faut
• Méthode de Newton que ∇2f(xk) soit
inversible et
• Dk = (∇2f(xk))-1 déf. pos.
• xk+1 = xk – αk (∇2f(xk))-1 ∇f(xk)
11/12/2005 Rafic Younès 11
Choix de la direction
Règle de minimisation
• Choisir αk qui minimise la fonction le long de
dk, c’est-à-dire tel que
f(xk+αdk)
a0 a0b 0 b0 a0 a 0 b b0
0
a0 0 0 b0
a1 1 1 b1
• Itération 0 : a’0-a0=b0-b’0=ρ(b0-a0)
• Itération 1: a’1-a1=b1-b’1=ρ(b1-a1)
a’1-a0=b’0-a’0= ρ(b’0-a0)
• On montre que
ρ = (3-√5)/2 ≈ 0.382
11/12/2005 Rafic Younès 16
Choix du pas : minimisation
Exemple :
• min g(α)=α4 - 14α3 + 60α2 - 70α
α ∈ [0,2] k a a' b' b k α* g(a' )
k k k k g(b'k)
1 0.0000 0.7639 1.2361 2.0000 1.0000 -24.3607 -18.9582
2 0.0000 0.4721 0.7639 1.2361 0.6180 -21.0985 -24.3607
3 0.4721 0.7639 0.9443 1.2361 0.8541 -24.3607 -23.5925
4 0.4721 0.6525 0.7639 0.9443 0.7082 -23.8374 -24.3607
5 0.6525 0.7639 0.8328 0.9443 0.7984 -24.3607 -24.2879
6 0.6525 0.7214 0.7639 0.8328 0.7426 -24.2579 -24.3607
7 0.7214 0.7639 0.7902 0.8328 0.7771 -24.3607 -24.3669
8 0.7639 0.7902 0.8065 0.8328 0.7984 -24.3669 -24.3495
9 0.7639 0.7802 0.7902 0.8065 0.7852 -24.3696 -24.3669
10 0.7639 0.7740 0.7802 0.7902 0.7771 -24.3681 -24.3696
Choix du pas
Règle de minimisation
§ Méthode de la section d’or
§ Minimisation prend du temps
§ Section d’or nécessite l’unimodalité
§ A-t-on besoin du minimum exact ?
§ Idée : Règle d’approximation
Choisir un pas qui diminue suffisamment
la valeur de la fonction.
α
f(xk)+α∇f(xk)Tdk
• Conditions d’Armijo-Goldstein
f(xk+αkdk) ≤ f(xk)+αkβ1∇f(xk)Tdk
β1 ∈ ]0,1[
11/12/2005 Rafic Younès 21
• Pour k=1,2,…
• Si f(xk+αkdk) ≤ f(xk)+αkβ1∇f(xk)Tdk alors
α*=αk STOP
• αk+1 = λ αk
• Démarche:
• Voyons d’abord ce que sont de « mauvais »
pas.
• Déterminons des règles empêchant les
« mauvais » pas.
• Prenons
• f(x) = x2
• x0 = 0
11/12/2005 Rafic Younès 23
x0
x1
x2
x3
•
x4
x5
x6
x7
Théorème :
• Si (dk) est en relation-gradient avec
(xk)
• Si le pas est choisi
• soit par la règle de minimisation
• soit par la règle d’Armijo-Goldstein
• Alors tous les points limites de (xk)
sont stationnaires.
Vitesse de convergence
Méthode de la plus forte pente
xk+1 = xk – αk ∇f(xk)
• Supposons que
• f(x) = ½ xTQx est quadratique
• Q est définie positive
• f est minimisé par x* = 0
• f(x*)=0
• Donc :
• ∇f(x) = Qx ∇2f(x) = Q
• xk+1 = xk – αk Qx
f ( x, y ) =
1 2 9 2
⋅x + ⋅y
2 2
La direction du
gradient est
perpendiculaire aux
courbes de niveaux
Plan
• Méthodes de descente
• Choix de la direction
• Choix du pas : minimisation / Approximation
• Convergence / Critères d’arrêt
• Méthode de Newton
• Résolution d’une équation non linéaire à une inconnue
• Résolution d’un système d’équations à plusieurs inconnues
• Optimisation par la Méthode de Newton
• Minimisation
• Convergence globale
• Méthodes sécantes ou quasi-Newton
• Minimisation à une seule variable
• Minimisation à plusieurs variables
11/12/2005 Rafic Younès 30
Equation à une inconnue
Problème :
• Soit f:IR→IR continûment dérivable. Trouver x tel que
f(x) = 0.
Exemple :
f(x) = x2 – 3
x0 = 1
∆x
x0
∆y
x1
x1 = x0 + ∆x
f’(x0) = ∆y / ∆x
∆x = ∆y / f’(x0) = - f(x0) / f’(x0)
x1 = x0 - f(x0) / f’(x0)
11/12/2005 Rafic Younès 32
Equation à une inconnue
• Méthode de Newton :
xk+1 = xk – f(xk) / f’(xk)
k x f(x) f'(x) err
0 1.00000000 -2.00000000 2.00000000 0.73205081
1 2.00000000 1.00000000 4.00000000 0.26794919
2 1.75000000 0.06250000 3.50000000 0.01794919
3 1.73214286 0.00031888 3.46428571 0.00009205
4 1.73205081 0.00000001 3.46410162 0.00000000
x* = 1 f1(x)=x2-1 k f2(x)=x2-2x+1
2 0 2
f1 (x*)=2 1.25 1 1.5
f2 (x*)=0 1.025 2 1.25
1.000304878 3 1.125
1.000000046 4 1.0625
1 5 1.03125
Note : Lorsque f est linéaire,
1 6 1.015625
la méthode de Newton pour 1 7 1.0078125
la résolution d’équations 1 8 1.00390625
converge en une seule itération. 1 9 1.001953125
1 10 1.000976563
Notes :
• L est la constante de Lipschitz
• La condition
¦¦∇g(x)-∇g(y)¦¦ ≤ L¦¦x-y¦¦
impose que la fonction « ne soit pas trop non
linéaire »
• La condition
¦¦ (∇g(x)T)-1¦¦ ≤ M
impose que le problème « ne soit pas trop
mal conditionné »
11/12/2005 Rafic Younès 38
Plan
• Méthodes de descente
• Choix de la direction
• Choix du pas : minimisation / Approximation
• Convergence / Critères d’arrêt
• Méthode de Newton
• Résolution d’une équation non linéaire à une inconnue
• Résolution d’un système d’équations à plusieurs inconnues
• Optimisation par la Méthode de Newton
• Minimisation
• Convergence globale
• Méthodes sécantes ou quasi-Newton
• Minimisation à une seule variable
• Minimisation à plusieurs variables
11/12/2005 Rafic Younès 39
f(x)=-x4+12x3-47x2+60x
11/12/2005 Rafic Younès 41
m(x)=x2-20x+48
m(x)=-17x2+160x-375
f(x)=-x4+12x3-47x2+60x
11/12/2005 Rafic Younès 42
Minimisation multi- variables
Convergence globale
Convergence globale
Idée de Cauchy :
• Lorsque le pas de Newton n’est pas
défini, ou ne fait pas diminuer la valeur
de la fonction, préférer la direction de la
plus forte pente.
• A. Cauchy (1847) Analyse mathématique. Méthode générale
pour la résolution des systèmes d équations simultanées.
Comptes Rendus de l’Académie des Sciences de Paris.
• Désavantages de la plus forte pente.
Recherche linéaire
• Newton « pur » :
xk+1 = xk – ∇2f(xk)-1∇f(xk)
• Considérer la direction :
dk = – ∇2f(xk)-1∇f(xk)
• Si ∇2f(xk)-1 n’est pas déf. pos. :
dk = – (∇2f(xk)+λI)-1∇f(xk)
Tel que dk est direction de descente
11/12/2005 Rafic Younès 47
Convergence globale
Recherche linéaire
• Algorithme de descente :
xk+1 = xk + αk dk
• On essaie d’abord αk=1.
• Si cela ne marche pas, on essaie des
pas plus courts.
• Règle d’Armijo-Goldstein
11/12/2005 Rafic Younès 48
Plan
• Méthodes de descente
• Choix de la direction
• Choix du pas : minimisation / Approximation
• Convergence / Critères d’arrêt
• Méthode de Newton
• Résolution d’une équation non linéaire à une inconnue
• Résolution d’un système d’équations à plusieurs inconnues
• Optimisation par la Méthode de Newton
• Minimisation
• Convergence globale
• Méthodes sécantes ou quasi-Newton
• Minimisation à une seule variable
• Minimisation à plusieurs variables
11/12/2005 Rafic Younès 49
Méthodes quasi-Newton
f(xk)+f (xk)(x-xk)
hk
xk xk+hk
f(xk)+ak(x-xk) Question : que se passe-t-il lorsque la dérivée n’est pas disponible ?
ak=(f(xk+hk)-f(xk))/hk Idée : on remplace le modèle linéaire tangent par un modèle linéaire
sécant.
Méthodes quasi-Newton
Notes :
• La méthode fonctionne bien. Le modèle linéaire :
f(xk-1)-f(xk)
• Mk(x)=f(xk) + (x-xk)
xk-1-xk
Vérifie : Mk(xk-1)=f(xk-1) et Mk(xk)=f(xk).
yk – H2idk
• H2i+1 = H2i + d kT
dkTdk
• H2i+2 = ½ (H2i+1 + H2i+1T)
11/12/2005 Rafic Younès 53
Méthodes quasi-Newton
ykykT Hk-1dkdkTHk-1
Hk=Hk-1+ −
ykTdk dkTHk-1dk
Broyden- Fletcher-Goldfarb-Shanno
11/12/2005 Rafic Younès 54
Méthodes quasi-Newton
• Newton : Dk = ∇2f(xk)-1
• Newton pure :
αk = 1 -> pas globalement convergent
Méthodes quasi-Newton
Résumé :
• xk+1 = xk − αkDk∇f(xk)
• Newton : Dk = – (∇2f(xk)+λI)-1
• Newton pure :
αk = 1 -> pas globalement convergent
Résumé :
• xk+1 = xk − αkDk∇f(xk)
• quasi-Newton : Dk = Hk
• H0 arbitraire, symétrique définie positive
ykykT Hk-1dkdkTHk-1
• Hk=Hk-1+ y Td − d TH d
k k k k-1 k
Exemples : quadratique
1 2 9 2
f(x) = x + x
Newton 2 1 2 2