Vous êtes sur la page 1sur 18

NOTES DU COURS DE MATHS3

CHRISTIAN LONARD

1. Optimisation sous contrainte Nous allons maintenant chercher optimiser une fonction de plusieurs variables f (x1 , . . . , xn ) sous des contraintes. Optimiser, c'est minimiser ou bien maximiser. Un exemple d'un tel problme est celui de trouver dans le plan R2 le point M de la droite (D) d'quation y = 2x 1 qui est le plus proche du point Mo de coordonnes (3, 1). Ce point M s'appelle la projection orthogonale de Mo sur (D). Soient (x, y ) les coordonnes de M, elles sont solution du problme de minimisation suivant minimiser sous la contrainte

f (x, y ) = (x 3)2 + (y + 1)2 h(x, y ) = 2x y 1 = 0


2

x 3 est le carr de la y 1 distance entre M et Mo . Or un point minimise le carr de la distance si et seulement si il minimise la distance. Nous avons dj vu en premire anne qu'une mthode de substitution permet d'obtenir la rponse. En eet, en injectant la contrainte y = 2x 1 dans f (x, y ) il nous reste minimiser x g (x) = f (x, 2x 1) = (x 3)2 + (2x 1 + 1)2 = 5x2 6x + 9 sans contrainte. En annulant la drive : g (x) = 0, on obtient 10x 6 = 0, d'o x = 3/5 et y = 2x 1 = 6/5 1 = 1/5. Soit M = (3/5, 1/5). Les choses se compliquent si on cherche maintenant trouver le point M = (x, y ) du cercle (C ) de centre (1, 5) et de rayon 2 qui est le plus proche de Mo . Cette fois la contrainte M (C ) s'crit (x 1)2 + (y 5)2 = 4 et nous devons rsoudre le problme de minimisation suivant minimiser f (x, y ) = (x 3)2 + (y + 1)2 sous la contrainte h(x, y ) = (x 1)2 + (y 5)2 4 = 0
En eet, f (x, y ) = (x 3)2 + (y + 1)2 = On peut envisager une mthode de substitution, mais elle est moins directe que dans le cas prcdent. Mieux vaudrait avoir notre disposition une mthode gnrale qui
Date : 2004.
1

CHRISTIAN LONARD

pourrait nous permettre de rsoudre des problmes comme celui-ci : f (x, y, z ) = x2 + y 2 + (z 1)2 minimiser h1 (x, y, z ) = (x 1)2 + (y 2)2 + (z + 1)2 25 = 0 sous les contraintes h2 (x, y, z ) = x + y + z 1 = 0 (1.1) o aucune mthode de substitution simple n'est plus envisageable. Il s'agit ici de trouver les points les plus proches du point de coordonnes (0, 0, 1) qui appartiennent au cercle de R3 intersection de la sphre d'quation h1 = 0 : de centre (1, 2, 1) et de rayon 5, avec le plan d'quation h2 = 0. Cette mthode existe et est connue sous le nom de mthode des multiplicateurs de Lagrange. Avant de l'tudier, nous aurons besoin de faire quelques rappels sur les fonctions de plusieurs variables (comme les fonctions f et h que nous venons de croiser) et d'introduire quelques notions lmentaires de gomtrie dans l'espace. 1.1. Rappels sur les fonctions de plusieurs variables. Une fonction de n variables est de la forme

(x1 , . . . , xn ) f (x1 , x2 , . . . , xn ) R
Pour rendre les choses plus lisibles, nous consirrerons avant tout des fonctions de deux ou trois variables f (x, y ) ou f (x, y, z ). La formule de Taylor l'ordre 2 pour les fonctions habituelles d'une seule variable f (x) est

avec limh0

1 f (x + h) = f (x) + f (x)h + f (x)h2 + (h)h2 , x, h R 2 (h) = 0. Elle se gnralise aux fonctions de trois variables sous la forme
(1.2)

f (x + u,y + v, z + w) = f (x, y, z )

f f f (x, y, z )u + (x, y, z )v + (x, y, z )w x y z 2f 2f 2f +1/2 2 (x, y, z )u2 + 2 (x, y, z )v 2 + 2 (x, y, z )w2 x x x 2 2 f f 2f +2 (x, y, z )uv + 2 (x, y, z )uw + 2 (x, y, z )vw xy xz yz + + (u, v, w)[u2 + v 2 + w2 ]
pour (x, y, z ) R3 , (u, v, w) R3 avec lim(u,v,w)0 (u, v, w) = 0.

NOTES DU COURS DE MATHS3

Nous venons d'utiliser les drives partielles

Exemple.

f x (xo , yo , zo ) la drive en x = xo de la fonction x f (x, yo , zo ). Puisque (x, y, z ) f x (x, y, z ) est aussi une fonction de plusieurs variables on peut nouveau considrer f ses drives partielles. Par exemple z x (xo , yo , zo ) est la drive en z = zo de f 2f z x (xo , yo , z ). On la note zx (xo , yo , z ). 3 Avec f (x, y, z ) = 2xy + x2 z 3 y 2 z, nous avons f x (x, y, z ) = 2y + 2xz , 2 2 f f f 2 2 2 2 2 z (x, y, z ) = 3x z y et zx (x, y, z ) = 6xz , xz (x, y, z ) = 6xz . On remarque 2f 2f que zx = xz . En fait, ceci est un phnomne gnral et on peut dmontrer que pour une grande classe de fonctions f (x1 , . . . , xn ), on a

f 2f x , yz , . . .

On rappelle qu'on note

2f 2f = , xi xj xj xi (1, 2). Alors,


3 f x (x, y )

1 i, j n.

(1.3)
2f 2 y (x, y )

Un autre exemple. On considre la fonction f (x, y ) = xy + x3 y 2 en (xo , yo ) =


= y +3x2 y 2 ,
2f 2x et xy (x, y ) = 1 + 6x2 y. En (xo , yo ) = (1, 2), on obtient f x (1, 2) = 10, f 2f 2f 2f y (1, 2) = 3, 2 x (1, 2) = 24, 2 y (1, 2) = 2 et xy (1, 2) = 11. La formule f y (x, y )

= x+2x3 y,

2f 2 x (x, y )

= 6xy 2 ,

de Taylor l'ordre 2 en (1, 2) s'crit donc

1 f (1 + u, 2 + v ) = 2 + 10u 3v + [24u2 + 2v 2 22uv ] + (u, v )(u2 + v 2 ). 2 Il est pratique d'introduire l'criture matricielle suivante f ((1, 2) + (u, v )) =2 + (10, 3) 1 + (u, v ) 2 u v 24 11 11 2 u v + (u, v ) u v
2

De mme, la formule de Taylor (1.2) en dimension 3, s'crit u u 1 f (x + u, y + v, z + w) = f (x, y, z ) + Df (x, y, z ) v + (u, v, w)D2 f (x, y, z ) v 2 w w (1.4) 2 u + (u, v, w) v w

CHRISTIAN LONARD

avec

Df (x, y, z ) =
et

f f f , , x y z
2f xy 2f 2y 2f yz

(x, y, z )
2f xz 2f yz 2f 2z

D2 f (x, y, z ) =

2f 2x 2f xy 2f xz

(x, y, z )

o nous avons utilis l'identit (1.3) pour rendre la matrice D2 f symtrique. Cette formule reste vraie en dimension n et devient u1 . f (x1 + u1 , . . . , xn + un ) = f (x1 , . . . , xn ) + Df (x1 , . . . , xn ) . .

(1.5)

u1 1 . + (u1 , . . . , un )D2 f (x1 , . . . , xn ) . . 2 un 2 u1 . + (u1 , . . . , un ) . . un


avec

un

Df (x1 , . . . , xn ) =
et

f f ,..., x1 xn 2f xi xj

(x1 , . . . , xn )

D2 f (x1 , . . . , xn ) =

(x1 , . . . , xn )
1i,j n

Dnition 1.6. On appelle gradient de f en (x1 , . . . , xn ) la matrice ligne Df (x1 , . . . , xn )

ci-dessus. On appelle hessien ou matrice hessienne de f en (x1 , . . . , xn ) la matrice carre D2 f (x1 , . . . , xn ) ci-dessus.
1 f (x + u) = f (x) + Df (x)u + uT D2 f (x)u + (u) u 2

On peut rcrire la formule de Taylor (1.5) de faon plus compacte, sous la forme
2

(1.7)

NOTES DU COURS DE MATHS3

u1 . T T o u = . . est une matrice colonne et u est sa matrice transpose : u = un (u1 un ). On note en passant que u Rn uT D2 f (x)u R
est l'expression d'une forme quadratique. La formule de Taylor l'ordre 1 est bien sr

f (x + u) = f (x) + Df (x)u + (u) u

(1.8)

o comme d'habitude (u) est une fonction telle que limu0 (u) = 0. Remarquons que les fonctions (u) dans (1.7) et (1.8) ne sont pas les mmes. Nous aurons besoin de la formule drivation d'une fonction compose de la forme t x1 (t) . n R f (x(t)) o t R x(t) = . . R est forme des fonctions coordonnes

xn (t) x1 (t), . . . , xn (t) que nous supposerons drivables en t. On note x1 (t), . . . , xn (t) leurs x1 (t) . n drives ainsi que x (t) = . . R considre comme une matrice colonne.

xn (t) Considrons l'accroissement f (x(t + s)) f (x(t)) lorsque s R est "petit". En notant u = x(t + s) x(t) Rn , la formule de Taylor l'ordre 1 applique toutes les coordonnes de u nous donne u = sx (t) + (s)s et la formule de Taylor l'ordre 1 (1.8) nous permet d'crire f ((x(t + s)) = f (x(t) + u) = f (x(t)) + Df (x(t))u + (u) u = f (x(t)) + sDf (x(t))x (t) + (s)s.
d dt f (x(t))

On en dduit que la drive

de t f (x(t)) satisfait l'identit suivante (1.9)

d f (x(t)) = Df (x(t))x (t). dt

1.2. Un peu de gomtrie dans l'espace : espaces tangents et normaux. De faon pouvoir travailler avec des contraintes comme celles dnies par h1 = h2 = 0 dans (1.1), nous aurons besoin de rudiments de gomtrie dans l'espace. Une surface de R3 est dnie en gnral par une quation du type

h(x, y, z ) = 0.

CHRISTIAN LONARD

xn 1. Il s'agit donc de celle de la sphre de Rn de rayon 1 ; elle est bien de dimension n 1. De tels ensembles de dimension n 1 dans Rn sont appels des hypersurfaces. Revenons dans R3 et considrons un ensemble dni par deux contraintes du style h1 (x, y, z ) = 0 h2 (x, y, z ) = 0

Par exemple x 2y + 6z = 0 est l'quation d'un plan vectoriel (qui passe par l'origine (0,0,0)). C'est le plan orthogonal au vecteur (1, 2 , 6) puisque son quation exprime x prcisment que le produit scalaire (1, 2, 6) y est nul. L'quation x 2y + 6z = z 0 = 33, 2 est celle d'un plan ane (qui ne passe pas l'origine) parallle au prcdent. L'quation x2 + y 2 + z 2 1 = 0 est celle de la sphre centre en l'origine de rayon un ; x2 + y 2 + z 2 9 = 0 est celle de la sphre centre en l'origine de rayon 3 ; x2 + y 2 + z 2 +9 = 0 est l'quation d'un ensemble vide (pourquoi ?). Plus gnralement, ((x xo )/a)2 + ((y yo )/b)2 + ((z zo )/c)2 d2 = 0 est l'quation d'un ellipsode. Attention, une sphre est une surface, il ne faut pas la confondre avec la boule qu'elle dlimite, qui est un volume. Dans R2 , x2 + y 2 1 = 0 est l'quation du cercle unit. Alors que dans R3 , la mme quation x2 + y 2 1 = 0 ne faisant pas apparatre la variable z, est celle du cylindre "vertical" passant par le cercle unit du plan "horizontal" Oxy. De manire gnrale on peut dire qu'une contrainte du type h(x1 , . . . , xn ) = 0 fait passer de la dimension n la dimension n 1. Ainsi x1 + + xn = 0 est l'quation du sous-espace vectoriel de Rn orthogonal au vecteur (1, . . . , 1). C'est donc un espace 2 x1 . 2 vectoriel de dimension n1. L'quation x2 1 + +xn 1 = 0 s'crit aussi . . =

Puisque les deux contraintes doivent tre satisfaites simultanment, cet ensemble est l'intersection des deux surfaces d'quations h1 (x, y, z ) = 0 et h2 (x, y, z ) = 0. Par exemple, les contraintes du problme de minimisation (1.1) se reprsentent gomtriquement comme l'intersection en 3D d'une sphre et d'un plan. En gnral, l'intersection d'un plan et d'une sphre est soit vide, soit un cercle dans l'espace. De faon exceptionnelle, si le plan est tangent la sphre, l'intersection n'est pas vide et se rduit au point de contact. Donc il semble que l'intersection de deux surfaces lorsqu'elle n'est pas vide, soit une courbe de l'espace. C'est eectivement le cas en gnral. L'intersection de deux plans est soit vide (si les plans sont distincts et parallles) soit une droite de l'espace. L'intersection d'un plan et d'un cylindre, ou de deux sphres,

NOTES DU COURS DE MATHS3

si elles ne sont pas vides sont des ellipses dans l'espace. Les droites et les ellipses de l'espace sont des ensembles gomtriques de dimension 1. Deux contraintes font donc perdre en gnral deux dimensions. On passe de 3 3 2 = 1. De manire gnrale on peut dire que 2 contraintes simultanes du type h1 (x1 , . . . , xn ) = 0 et h2 (x1 , . . . , xn ) = 0 font passer de la dimension n la dimension n 2. Couper par une hypersurface (de dimension n 1) fait perdre en gnral une dimension. Donc, m contraintes simultanes du type h1 (x1 , . . . , xn ) = 0 . . (1.10) . hm (x1 , . . . , xn ) = 0 dnissent en gnral un ensemble de dimension n m. Nous avons dj remarqu cela dans le cas des systmes linaires. On appellera tout ensemble de Rn dni par une famille d'quations (1.10) une surface de Rn .

Dnition 1.11. Une courbe paramtre C sur une surface S est un ensemble de points (xt S ; t ]a, b[) paramtr rgulirement par t ]a, b[. Le lieu gomtrique de la courbe C est l'ensemble des points {xt S ; t ]a, b[}.
Illustration graphique

En fait, une courbe paramtre C est une fonction t ]a, b[ xt S.

Dnition 1.12. La vitesse de C l'instant t = t en x = x est


x (t ) = dx (t ) = dt . n . R . dxn dt (t )
dx1 dt (t )

CHRISTIAN LONARD

Attention, la vitesse dpend du paramtrage. Deux paramtrages dirents du mme lieu gomtrique {xt S ; t ]a, b[} donnent en gnral des vitesses direntes. Ainsi (x(t) S ; t ]0, 1[) et (y (t) := x(1 t) S ; t ]0, 1[) correspondent au mme lieu gomtrique mais y (1 t) = x t : les vitesses sont opposes puisque x et y parcourent le mme lieu " l'envers". Considrons le sous-ensemble S de Rn dni par les m contraintes (1.10) que nous crirons rapidement h(x) = 0, en notant f (x ) = f (x1 , . . . , xn ) pour toute fonction h1 (x) . . f de (x1 , . . . , xn ) ainsi que h(x) = Rm avec les fonctions contraintes .

hm (x) hi : Rn R, 1 i m. Soit (xt S ; t ]a, b[) une courbe C paramtre sur S. Puisque pour tout t, h(xt ) = h1 (xt ) = 0 . . 0 , en drivant par rapport t on obtient . hm (xt ) = 0 t = 0 Dh1 (xt )x . . Dh(xt )x t = 0 Rm . Dhm (xt )x t = 0
o l'on a pos

Dh1 (x) . . Dh(x) = = . Dhm (x)

h1 x1 (x) hm x1 (x)

. . .

h1 xn (x) hm xn (x)

. . .

qui est une matrice m n et x t est une matrice colonne. Dans ce qui prcde, nous avons utilis la formule de composition des drives (1.9) : d t pour tout 1 i n. dt hi (xt ) = Dhi (xt )x En t = t en notant x = x(t ), la vitesse v = x (t ) satisfait

Dh(x )v = 0 Rm
o v Rn est un vecteur colonne. Soit : Dhi (x )v = 0 pour tout 1 i m. Ce qui signie que la vitesse v est orthogonale simultanment aux vecteurs Dh1 (x ), . . . , Dhm (x ).

rant tous les paramtrages C S passant en x ) est appel l' espace tangent S en

Dnition 1.13. L'ensemble de toutes les vitesses possibles en x S (en consid-

NOTES DU COURS DE MATHS3

x . On le note T (x ) et on a T (x ) = {v Rn ; Dh(x )v = 0}.


Avec les considrations que nous avons menes plus haut au sujet de la dimension de S, on remarque que si S est de dimension n m, il en est de mme de T (x ) en gnral. En fait, en mathmatiques on dit que, par dnition, la surface S est de dimension n m si la dimension de tous les espaces tangents T (x), x S est la mme et vaut n m. Puisque les T (x) sont des espaces vectoriels, leurs dimensions est celle que nous connaissons : c'est le nombre de vecteurs des bases vectorielles. Exemple. L'ensemble S = {(x, y, z ) R3 ; h1 (x, y, z ) = x = 0, h2 (x, y, z ) = x y = 0}} est clairement l'axe des z puisque x = y = 0. Son espace tangent en tout point est donc lui-mme puisque c'est un espace vectoriel. On a Dh(x, y, z ) = Dh1 (x, y, z ) 1 0 0 = . Donc pour tout x S, T (x ) = {v ; Dh(x )v = Dh2 (x, y, z ) 1 1 0 a=0 0} est l'ensemble des v = (a, b, c) tels que c'est--dire a = b = 0. On ab=0 retrouve l'axe des z.

Dnition 1.14. L' espace normal en x S est l'espace vectoriel orthogonal T (x ).


N (x ) = vect{Dh1 (x ), . . . , Dhm (x )}

On le note N (x ). C'est le sous-espace vectoriel de Rn engendr par Dh1 (x ), . . . , Dhm (x ) :

En eet, nous avons vu par construction que T (x ) est orthogonal tous les vecteurs Dh1 (x ), . . . , Dhm (x ). Si les vecteurs Dh1 (x ), . . . , Dhm (x ) forment une partie libre, alors la dimension N (x ) est m et celle de T (x ) est n m.

Dh1 (x ), . . . , Dhm (x ) forment une partie libre.

Dnition 1.15. On dit que la contrainte h est rgulire en x S si les vecteurs

Si h n'est pas rgulire en x des tas d'ennuis peuvent arriver lors de la rsolution du problme d'optimisation. Nous viterons cette situation dans ce cours d'introduction. Il conviendra donc avant tout de s'assurer de la rgularit de la contrainte aux points "sensibles" (voir les Thormes 1.17 et 1.24 plus bas). 1.3. Les multiplicateurs de Lagrange. Nous considrons le problme d'optimisation suivant

10

CHRISTIAN LONARD

optimiser localement f (x) h1 (x) = 0, . . sous les contraintes , x = (x1 , . . . , xn ) Rn . hm (x) = 0

(1.16)

c'est--dire qu'il y a m contraintes unidimensionnelles dans un espace n dimensions. Ce que nous entendons par optimiser localement, c'est chercher les points x de Rn qui minimisent localement ou maximisent localement f tout en satisfaisant la contrainte h(x ) = 0. h1 . On note h = . . et S la surface des contraintes, d'quation h = 0 :

hm S = {x Rn ; h(x) = 0}.
Soient x un point de S, c'est--dire tel que h(x ) = 0, et C : (t xt ) une courbe paramtre sur S qui passe par x l'instant t = t , c'est--dire telle que : h(xt ) = 0 pour tout t et xt = x . On introduit la fonction t (t) = f (xt ). C'est une fonction habituelle de R dans R. Si x optimise f sur la surface S, alors il optimise a fortiori f sur la courbe C, puisque C est situe sur S. On en dduit que t optimise , c'est--dire que atteint un minimum ou un maximum en t . Or est une fonction habituelle, on doit donc avoir annulation de sa drive en t : (t ) = 0. Compte tenu de formule de drivation d'une fonction compose (1.9), nous avons (t) = Df (xt )x t . par consquent

Df (x )v = 0 avec v = x (t ).
Ce raisonnement tant valable pour toute courbe C sur S passant pas x en t = t , on a Df (x )v = 0, pour tout v T (x ) C'est--dire que tout x optimisant f sous la contrainte h = 0 est tel que

Df (x ) N (x )
o N (x ) est l'espace normal S = {x; h(x) = 0} en x . Puisque N (x ) est l'espace vectoriel engendr par les vecteurs Dh1 (x ), . . . , Dhm (x ), il existe des coecients rels 1 , . . . m tels que

Df (x ) = 1 Dh1 (x ) + + m Dhm (x ).

NOTES DU COURS DE MATHS3


En posant 1 = 1 , . . . m = m , on a montr le rsultat important suivant.

11

Thoreme 1.17 (des multiplicateurs de Lagrange). Soit x un minimiseur local ou un maximiseur local de f Rn R sous la contrainte h(x) = 0, c'est--dire une solution de (1.16). On suppose de plus que la contrainte h est rgulire en x (voir la Dnition 1.15). Alors il existe des rels 1 , . . . m tels que
Df (x ) + 1 Dh1 (x ) + + m Dhm (x ) = 0.

(1.18)

Dnitions 1.19. Un peu de vocabulaire pour tre plus ecace.

Les points x pour lesquels il existe des coecients 1 , . . . m satisfaisant l'identit ci-dessus sont appels des points stationnaires du problme d'optimisation (1.16). Les coecients 1 , . . . m satisfaisant l'identit ci-dessus sont appels les multipli cateurs de Lagrange en x . On note = ( 1 , . . . m ) le vecteur multiplicateur de Lagrange. On introduit la fonction suivante

L(x, ) = f (x) + 1 h1 (x) + + m hm (x),


L'intrt du lagrangien L est le rsultat suivant.

(x, ) Rn Rm

(1.20)

On l'appelle le lagrangien du problme d'optimisation (1.16).

Proposition 1.21. Le point x satisfait h(x ) = 0 et (1.18) si et seulement si


DL(x , ) = 0 Rn

(1.22)

Compte tenu du Thorme 1.17, si x est une solution du problme d'optimisation locale (1.16), alors il existe Rm tel que DL(x , ) = 0.
f L Dmonstration. En eet, x (x , ) = x (x ) + 1 xi h1 (x ) + + m xi hm (x ) i i L pour tout 1 i n et (x , ) = hj (x ) pour tout 1 j m. Donc, l'identit j (1.22) est quivalente Df (x ) + 1 Dh1 (x ) + + m Dhm (x ) = 0 et h(x ) = 0

On a donc transform le problme d'optimisation sous contrainte (1.16) dans Rn en le problme d'optimisation sans contrainte optimiser localementL(x, ),

(x, ) Rn+m

12

CHRISTIAN LONARD

dans Rn+m . En eet, la condition (1.22) n'est autre que la condition ncessaire pour que (x , ) soit un point stationnaire de ce problme d'optimisation libre (sans contrainte). Il apparat que (x , ) est un point stationnaire du lagrangien L si et seulement si x satisfait la contrainte h(x ) = 0, x est un point stationnaire du problme sous contrainte (1.16) et est un vecteur multiplicateur de Lagrange du problme sous contrainte (1.16) en x . 1.4. Conditions du second ordre. Soit (t) une fonction de R dans R. On cherche rsoudre le problme d'optimisation libre suivant optimiser localement (t),

tR

On cherche donc les minimums et maximums locaux de . Pour cela on commence par rsoudre (t) = 0 : on cherche les points stationnaires du problme d'optimisation. On sait grce la formule de Taylor l'ordre 2

(t + s) = (t) + (t)s + (t)s2 /2 + s2 (s)


que (a) si t satisfait (t ) = 0 et (t ) > 0, alors t est un minimum local de (b) si t satisfait (t ) = 0 et (t ) < 0, alors t est un maximum local de (c) si t satisfait (t ) = 0 et (t ) = 0, alors on ne peut pas conclure sans faire une tude plus pousse de au voisinage de t . En qui concerne le dernier point, penser (t) = t4 o en t = 0 : (0) = (0) = 0 et 0 est un minimum (global) (t) = t4 o en t = 0 : (0) = (0) = 0 et 0 est un maximum (global) (t) = t3 o en t = 0 : (0) = (0) = 0 et 0 n'est ni un minimum, ni un maximum, mais un point d'inexion. La condition (t ) = 0 est appele une condition ncessaire du premier ordre (en drivation) pour que t soit un optimiseur local, alors que les conditions (t ) > 0 et (t ) < 0 sont respectivement appeles des conditions susantes du second ordre pour que le point stationnaire t soit un minimum local ou un maximum local. La condition (1.22) est une condition ncessaire de premier ordre pour que x soit un optimiseur local de (1.16). Cherchons maintenant dterminer en fonction des drives secondes de f et de h1 , . . . hm des conditions susantes pour que le point stationnaire x soit un minimum local ou un maximum local. Pour cela, on considre nouveau (t) = f (xt ) o t xt S est une courbe paramtre qui vit sur la surface S d'quation h(x) = 0 et telle que x(t ) = x . Les formules de Taylor l'ordre 2 qui vont nous servir sont

xt+s xt = x ts + x t s2 /2 + (s)s2

NOTES DU COURS DE MATHS3

13

o x t dsigne le vecteur des drives secondes de t xt , c'est--dire l'acclration de la courbe t xt l'instant t, ainsi que

f (xt+s ) = f (xt ) + Df (xt )(xt+s xt ) +

1 (xt+s xt ), D2 f (xt )(xt+s xt ) 2 + (xt+s xt ) (xt+s xt ) 2

o a, b dsigne le produit scalaire. En injectant la premire quation dans la seconde, nous obtenons 1 s2 f (xt+s ) = f (xt ) + Df (xt )[sx t + s2 x t + (s)s2 ] + x t , D2 f (xt )x t + (s)s2 2 2 s2 = f (xt ) + sDf (xt )x t + [Df (xt ) xt + x t , D2 f (xt )x t ] + (s)s2 (1.23) 2 Nous savons que Df (x )x t est li Dh(x )x t par (1.22), mais a n'est pas susant pour conclure. De plus, l'acclration x t apparat, il faut donc trouver un moyen pour l'liminer. La bonne faon de s'en sortir est de remarquer que puisque le courbe t xt est sur S, on a h(xt ) = 0 pour tout t, donc

L(xt , ) = f (xt ) + 1 h1 (xt ) + + m hm (xt ) = f (xt ),


pour tout t et tout . Soient x un point stationnaire et le vecteur multiplicateur de Lagrange qui lui est associ par (1.22). En prenant = dans l'identit f (xt ) = L(xt , ), et en lui appliquant la formule de Taylor (1.23) en t = t , on obtient

f (xt +s ) = =

f (x ) + sDx L(x , )x t + f (x ) +

s2 2 L(x , )x t ] + (s)s2 [Dx L(x , ) xt + x t , D x 2

s2 2 x t , D x L(x , )x t + (s)s2 2 2 o Dx L(x , ) et Dx L(x , ) dsignent le gradient et la matrice hessienne de la fonction x L(x, ) en x = x pour x. Pour la dernire galit, nous avons tir parti de Dx L(x , ) = 0 qui est impliqu par (1.22). Le calcul prcdent est valable pour toute courbe t xt qui passe par x en t = t . Donc la vitesse x t peut prendre toutes les valeurs v dans l'espace tangent T (x ). 2 On en conclut que si pour tout v non nul dans T (x ), v, Dx L(x , )v > 0 alors le point stationnaire x est un minimum. De mme, si pour tout v non nul dans T (x ), 2 v, Dx L(x , )v < 0 alors le point stationnaire x est un maximum. Nous venons de prouver le

du problme (1.16) de vecteur multiplicateur de Lagrange . C'est--dire (1.22) :

Thoreme 1.24 (Condition susante du second ordre). Soit x un point stationnaire

14

CHRISTIAN LONARD

DL(x , ) = 0. On suppose de plus que la contrainte h est rgulire en x (voir la Dnition 1.15). 2 L(x , )v > 0, alors x est un minimi(a) Si pour tout v non nul de T (x ), v, Dx seur local. 2 (b) Si pour tout v non nul de T (x ), v, Dx L(x , )v < 0, alors x est un maximiseur local. 2 (c) S'il existe des v de T (x ) tels que v, Dx L(x , )v > 0 et des v de T (x ) tels 2 que v, Dx L(x , )v < 0, alors x est un point-col.

Exercice. Trouver le point du cercle de R3 d'quation


le plus loign du point de coordonnes (1, 1, 0).

x2 + y 2 + z 2 = 1 qui est x+y+z =0

Solution. Il s'agit dans un premier temps de rsoudre le problme d'optimisation suivant : optimiser localement f (x, y, z ) = (x 1)2 + (y 1)2 + z 2 sous les contraintes x2 + y 2 + z 2 = 1 et x + y + z = 0

(P)

Avant d'oublier, commenons par chercher les points de la surface de contrainte S qui ne sont pas rguliers au sens de la Dnition 1.15, c'est dire les (x, y, z ) tels que h1 (x, y, z ) = x2 + y 2 + z 2 1 = 0 et h2 (x, y, z ) = x + y + z = 0, et tels que les vecteurs Dh1 (x, y, z ) et Dh2 (x, y, z ) ne forment pas une partie libre de R3 . On a Dh1 (x, y, z ) = 2(x, y, z ) et Dh2 (x, y, z ) = (1, 1, 1). Ils sont lis s'ils sont colinaires, c'est--dire lorsque x = y = z. Ce qui avec les contraintes nous donne x=y=z x+y+z =0 . Or, ce systme n'admet pas de solution. Donc tous les points 2 x + y2 + z2 = 1 de la surface de contrainte (le cercle) sont rguliers. Le lagrangien est L(x, y, z, , ) = (x 1)2 + (y 1)2 + z 2 + (x2 + y 2 + z 2 1) + (x + y + z ), avec deux multiplicateurs de Lagrange et puisqu'il y a deux contraintes. Recherchons les points stationnaires et leurs multiplicateurs. Les drives partielles de L sont

NOTES DU COURS DE MATHS3

15

L (x, y, z, , ) x L (x, y, z, , ) y L (x, y, z, , ) z L (x, y, z, , ) L (x, y, z, , )

= = =

2( + 1)x + 2 2( + 1)y + 2 2( + 1)z +

= x2 + y 2 + z 2 1 = x+y+z

de sorte que nous avons rsoudre le systme en (x, y, z, , ) :

x/ + 2 = y/ + 2 = z/ + = x2 + y 2 + z 2 x+y+z
o nous avons pos =
1 2(+1)

0 0 0 1 0

= =

en constatant que 2( + 1) = 0 est exclu du fait des x = (2 ) y = (2 ) qui avec x + y + z = 0 trois premires quations. On a donc z = nous donne 0 = (4 3), soit = 4/3. Par consquent (x, y, z ) = (2/3, 2/3, 4/3). Donc, l'autre contrainte x2 + y 2 + z 2 = 1 impose 1 = 2 (4/9 + 4/9 + 16/9), soit 3 3 2 = 9/24 : { 2 , }. 6 2 6 Les points stationnaires et leurs multiplicateurs de Lagrange sont donc :

(x , y , z ) = (1/ 6, 1/ 6, 2/ 6)

avec avec

(x , y , z ) = (1/ 6, 1/ 6, 2/ 6)

( , ) = ( 6/3 1, 4/3) 3 soit = 2 6 ( , ) = ( 6/3 1, 4/3) 3 soit = 2 6

2 La matrice Dx L qui apparat dans le Thorme 1.24 est ici

16

CHRISTIAN LONARD

2L 2x 2L xy 2L xz

2L xy 2L 2y 2L yz

2L xz 2L (x , y , z , , ) yz 2 L 2z

2( + 1) 0 0 0 2( + 1) 0 = 0 0 2( + 1) 1 0 0 = 1/ 0 1 0 0 0 1

2 La forme quadratique v, Dx L(x , )v du Thorme 1.24 s'crit 1 Q(u, v, w) = (u2 + v 2 + w2 ), (u, v, w) R3 . Elle a donc un signe constant qui est celui de . Il n'est donc calpas utile de culer l'espace tangent dans ce cas. Le point (x , y , z ) = (1/ 6, 1/ 6, 2/ 6) est donc minimiseur local de (P ) puisque 1/ > 0 et le point (x , y , z ) = un (1/ 6, 1/ 6, 2/ 6) est un maximiseur local de (P ) puisque 1/ < 0. La solution que nous cherchons est le maximiseur local (x , y , z ) = (1/ 6, 1/ 6, 2/ 6). En eet, la fonction continue f (x, y, z ) = (x 1)2 +(y 1)2 + z 2 est borne sur le cercle dni par les contraintes. Un unique maximiseur local est de ce fait le maximiseur global. Exercice. Optimiser localement la fonction f (x, y ) = 3x + 5y 1 sous la contrainte xy = 15 (1) l'aide d'une mthode de substitution (2) l'aide de la mthode de Lagrange

Solution. (1) Commenons par la mthode de substitution qui ne pose aucune dicult srieuse. Puisque xy = 15, on a ncessairement x et y non nuls. On peut donc crire y = 15/x et optimiser localement la fonction g (x) = f (x, 15/x) = 3x + 75/x 1. On tudie les variations de g l'aide de sa drive g (x) = 3 75/x2 et on trouve que x = 5 et x = 5 sont respectivement un maximum local et un minimum local 15 15 de g. Par consquent (5, 5 ) = (5, 3) et (5, 5 ) = (5, 3) sont respectivement un maximum local et un minimum local du problme considr. (2) Appliquons maintenant la mthode de Lagrange. Dans cet exercice elle est nettement plus lourde que la mthode de substitution, mais dans les situations plus complexes, c'est la seule qui peut tre envisage. Le but de cet exercice est donc d'appliquer la mthode pour en donner une illustration. Commenons par chercher les points de la surface de contrainte d'quation h(x, y ) = xy 15 = 0 qui ne sont pas rguliers. Ce sont les points (x, y ) tels que h(x, y ) = 0 et

NOTES DU COURS DE MATHS3

17

Dh(x, y ) = (0, 0), car une partie compose d'un unique vecteur est lie si et seulement y=x=0 si ce vecteur est nul. On a Dh(x, y ) = (y, x). Or le sytme n'admet pas xy = 15 de solution. Donc tous les points de la surface de contrainte sont rguliers. Le lagrangien est L(x, y, ) = 3x + 5y 1 + (xy 15) et ses drives partielles L L L et sont x (x, y, ) = 3 + y, y (x, y, ) = 5 + x (x, y, ) = xy 15. Donc x = 5 y = 3 . Ncessairement les points stationnaires sont solution du systme xy = 15 est non nul car on aurait 0 = 0y = 3. On peut donc diviser par pour obtenir x = 5/ ce qui avec xy = 15 implique 15/2 = 15. Par consquent 2 = 1 y = 3/ et les points stationnaires sont (x , y ) = (5, 3) (x , y ) = (5, 3)
avec avec

= 1 = 1

Etudions maintenant la condition susante du second ordre. La matrice des drives 2L 2L 0 2x xy , de sorte secondes par rapport x, y de L est (x, y, ) = 2L 2L 0 xy 2y qu'en les points stationnaires, la forme quadratique associe est

Q (u, v ) = Q(x ,y , ) (u, v ) = 2 uv,

(u, v ) R2

Cette forme quadratique n'est pas de signe constant sur R2 , il convient donc d'tudier son signe en restriction l'espace tangent T = T (x , y ) S = {(x, y ) R2 , xy = 15} au point (x , y ). Cet espace est l'espace orthogonal Dh(x , y ) avec h(x, y ) = xy 15. On a donc,

(u, v ) T (u, v )

h x (x , y ) h y (x , y )

= 0 (u, v )

y x

= 0 y u + x v = 0.

 En (x , y ) = (5, 3) on a Q (u, v ) = 2 uv = 2uv car = 1. Or T a pour quation 3u + 5v = 0. Donc en restriction T , Q (u, v ) = Q (u, 3u/5) = (2)(3u2 /5) = 6u2 /5. Par consquent, pour tout vecteur non nul (u, v ) de T , on a Q (u, v ) > 0. On en dduit, grce au Thorme 1.24(a) que (x , y ) = (5, 3) est un minimiseur local.  En (x , y ) = (5, 3) on a Q (u, v ) = 2 uv = 2uv car = 1. Or T a (aussi) pour quation 3u 5v = 0. Donc en restriction T , Q (u, v ) = Q (u, 3u/5) = 2(3u2 /5) = 6u2 /5. Par consquent, pour tout vecteur non nul (u, v ) de T , on

18

CHRISTIAN LONARD

a Q (u, v ) < 0. On en dduit, grce au Thorme 1.24(b) que (x , y ) = (5, 3) est un maximiseur local.