Académique Documents
Professionnel Documents
Culture Documents
Algorithme de
minimisation Joseph Salmon
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 1/14
Plan du cours
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 2/14
La descente de gradient : intuition
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 3/14
La descente de gradient : algorithme
Data: initialisation x0 , nb max. d'itérations T , critère d'arrêt ε, pas α
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T do
xt+1 ← xt − α∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation Critères d'arrêts possibles :
Algorithme du premier ordre I k∇f (xt )k ≤ ε
Choix du pas
Algorithme du second ordre I f (xt+1 ) − f (xt ) ≤ ε
kxt+1 −xt k
I kxt+1 − xt k ≤ ε ou
kxt k ≤ε
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 4/14
La descente de gradient : algorithme
Data: initialisation x0 , nb max. d'itérations T , critère d'arrêt ε, pas α
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T do
xt+1 ← xt − α∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation Critères d'arrêts possibles :
Algorithme du premier ordre I k∇f (xt )k ≤ ε
Choix du pas
Algorithme du second ordre I f (xt+1 ) − f (xt ) ≤ ε
kxt+1 −xt k
I kxt+1 − xt k ≤ ε ou
kxt k ≤ε
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 4/14
La descente de gradient : algorithme
Data: initialisation x0 , nb max. d'itérations T , critère d'arrêt ε, pas α
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T do
xt+1 ← xt − α∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation Critères d'arrêts possibles :
Algorithme du premier ordre I k∇f (xt )k ≤ ε
Choix du pas
Algorithme du second ordre I f (xt+1 ) − f (xt ) ≤ ε
kxt+1 −xt k
I kxt+1 − xt k ≤ ε ou
kxt k ≤ε
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 4/14
La descente de gradient : algorithme
Data: initialisation x0 , nb max. d'itérations T , critère d'arrêt ε, pas α
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T do
xt+1 ← xt − α∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation Critères d'arrêts possibles :
Algorithme du premier ordre I k∇f (xt )k ≤ ε
Choix du pas
Algorithme du second ordre I f (xt+1 ) − f (xt ) ≤ ε
kxt+1 −xt k
I kxt+1 − xt k ≤ ε ou
kxt k ≤ε
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 4/14
La descente de gradient : algorithme
Data: initialisation x0 , nb max. d'itérations T , critère d'arrêt ε, pas α
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T do
xt+1 ← xt − α∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation Critères d'arrêts possibles :
Algorithme du premier ordre I k∇f (xt )k ≤ ε
Choix du pas
Algorithme du second ordre I f (xt+1 ) − f (xt ) ≤ ε
kxt+1 −xt k
I kxt+1 − xt k ≤ ε ou
kxt k ≤ε
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 4/14
La descente de gradient : algorithme
Data: initialisation x0 , nb max. d'itérations T , critère d'arrêt ε, pas α
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T do
xt+1 ← xt − α∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation Critères d'arrêts possibles :
Algorithme du premier ordre I k∇f (xt )k ≤ ε
Choix du pas
Algorithme du second ordre I f (xt+1 ) − f (xt ) ≤ ε
kxt+1 −xt k
I kxt+1 − xt k ≤ ε ou
kxt k ≤ε
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 4/14
Attention au choix du pas (cas 1D)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 5/14
Attention au choix du pas (cas 1D)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 5/14
Attention au choix du pas (cas 1D)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 5/14
Attention au choix du pas (cas 1D)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 5/14
Attention au choix du pas (cas 2D)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 6/14
Recherche linéaire I
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 7/14
Recherche linéaire II
Règle d'Armijo (ou du backtracking géométrique)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Recherche linéaire II
Règle d'Armijo (ou du backtracking géométrique)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Recherche linéaire II
Règle d'Armijo (ou du backtracking géométrique)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Recherche linéaire II
Règle d'Armijo (ou du backtracking géométrique)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Recherche linéaire II
Règle d'Armijo (ou du backtracking géométrique)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Recherche linéaire II
Règle d'Armijo (ou du backtracking géométrique)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Recherche linéaire II
Règle d'Armijo (ou du backtracking géométrique)
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Recherche linéaire III
I s=1
Algorithme de β = 1/2 β = 1/10
minimisation ou
I
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 9/14
Détour par la méthode de Newton
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 10/14
Détour par la méthode de Newton II
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
f (xt )
xt+1 ← xt − f 0 (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 11/14
Détour par la méthode de Newton II
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
f (xt )
xt+1 ← xt − f 0 (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 11/14
Détour par la méthode de Newton II
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
f (xt )
xt+1 ← xt − f 0 (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 11/14
Détour par la méthode de Newton II
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
f (xt )
xt+1 ← xt − f 0 (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 11/14
Détour par la méthode de Newton II
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
f (xt )
xt+1 ← xt − f 0 (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 11/14
Méthode de Newton pour la minimisation
Localement, en un point x0 une fonction deux fois diérentiable
ressemble à :
1
f (x) ≈ f (x∗ ) + h∇f (x∗ ), x − x∗ i + (x − x∗ )> ∇2 f (x∗ )(x − x∗ )
2
Analyse 2: Algorithme pour
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 13/14
Méthode de Newton : algorithme
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
xt+1 ← xt − (∇2 f (xt ))−1 ∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 13/14
Méthode de Newton : algorithme
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
xt+1 ← xt − (∇2 f (xt ))−1 ∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 13/14
Méthode de Newton : algorithme
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
xt+1 ← xt − (∇2 f (xt ))−1 ∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 13/14
Méthode de Newton : algorithme
Data: point initial x0 , nombre max. d'itérations T , critère d'arrêt ε
Result: un point xT proche du minimum de la fonction f
for 1 ≤ t ≤ T − 1 do
xt+1 ← xt − (∇2 f (xt ))−1 ∇f (xt )
STOP si critère d'arrêt inférieur à ε
Analyse 2: Algorithme pour
end
l'optimisation sans contrainte
Algorithme de
minimisation
Algorithme du premier ordre
Choix du pas
Algorithme du second ordre
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 13/14
Références I
Joseph Salmon
Fondamentaux pour le Big Data c Télécom ParisTech 14/14