Vous êtes sur la page 1sur 14

0.1.

THÉORÈME DES ACCROISSEMENTS FINIS 1

0.1 Théorème des accroissements finis


Soient U un ouvert de IR2 et f : (x, y) 7→ f (x, y) une application de classe
C 1 sur U . Soit a = (a 1 , a 2 ) ∈ U et h = (h 1 , h 2 ) ∈ IR2 tels que [a, a + h] ⊂ U . On
peut alors considérer la fonction de variable réelles F : [0, 1] → IR définie
par
F (t ) = f (a + t h)) = f (a 1 + t h 1 , a 2 + t h 2 ), (1)
En appliquant le théorème des accroissements finis classique à la fonction
F , on obtient l’existence d’un nombre réel θ ∈]0, 1[ tel que F (1)−F (0) = F ′ (θ).
D’un autre côté, la formule de dérivation de la composée nous donne
∂f ∂f
F ′ (t ) = (h 1 + h 2 )(a + t h). (2)
∂x ∂y
Nous venons ainsi d’établir le théorème des accroissements finis pour une
fonction numérique de deux variables réelles :

Théorème 0.1.1. Soit U un ouvert de IR2 et f : (x, y) 7→ f (x, y) une applica-


tion de classe C 1 sur U . Soient Soit a = (a1 , a2 ) ∈ U et h = (h1 , h2 ) ∈ IR2 tels
que [a, a + h] ⊂ U . Alors, il existe θ ∈]0, 1[ tel que

∂f ∂f
f (a + h) − f (a) = (h 1 + h 2 )(a + θh).
∂x ∂y

En d’autres termes, on a

Pour a, b ∈ U tels [a, b] ⊂ U , il existe c ∈]a, b[ tel que

f (b) − f (a) = (b − a).(∇ f )(c), le produit scalaire.

Et comme conséquence

Corollaire 0.1.1. Soit U un ouvert de IR2 et f : (x, y) 7→ f (x, y) une applica-


tion de classe C 1 sur U . Supposons qu’il existe k ∈ IR tel que

∥(∇ f )(x, y)∥ ≤ k, ∀(x, y) ∈ U .


2

Alors, pour tous a, b ∈ U

∥ f (b) − f (a)∥ ≤ k∥b − a∥.

0.2 Formule de Taylor-Lagrange à l’ordre 2


On va supposer ici que f : (x, y) 7→ f (x, y) est une application de classe
C sur U . Soit a = (a 1 , a 2 ) ∈ U et h = (h 1 , h 2 ) ∈ IR2 tels que [a, a + h] ⊂ U . On
2

peut alors encore considérer la fonction F : [0, 1] → IR définie par la formule


(1) ; la formule de Taylo-Lagrange appliquée à F nous donne l’existence de
θ ∈]0, 1[ tel que
1
F (1) = F (0) + F ′ (0) + F ′′ (θ).
2
D’un autre côté, en dérivant (2) nous obtenons

∂2 f ∂2 f 2∂ f
2
F ′′ (t ) = (h 12 + 2h h
1 2 + h 2 )(a + t h).
∂x 2 ∂x∂y ∂y 2

Nous venons ainsi d’établir la formule de Taylor-Lagrange pour une fonc-


tion numérique de deux variables réelles :

Théorème 0.2.1. Soit U un ouvert de IR2 et f : (x, y) 7→ f (x, y) une applica-


tion de classe C 2 sur U . Soient Soit a = (a1 , a2 ) ∈ U et h = (h1 , h2 ) ∈ IR2 tels
que [a, a + h] ⊂ U . Alors, il existe θ ∈]0, 1[ tel que
1
f (a + h) − f (a) = h.(∇ f )(a) + h.H f (c)h,
2
où c = a + θh et H f (c désigne la matrice Hessienne de f au point c donnée
par :
∂2 f ∂2 f
 
 ∂x 2 ∂x∂y 
H f (c) := 
 ∂2 f
 (c)
∂2 f 
∂x∂y ∂y 2

En d’autres termes, on a
0.3. FORMULE DE TAYLOR-YOUNG À L’ORDRE 2 3

∂f ∂f 1 ∂2 f ∂2 f ∂2 f
f (a+h) = f (a)+(h 1 +h 2 )(a)+ (h 12 2 +2h 1 h 2 +h 22 2 )(a+θh).
∂x ∂y 2 ∂x ∂x∂y ∂y
(3)

ou encore

Pour a, b ∈ U tels [a, b] ⊂ U , il existe c ∈]a, b[ tel que


1
f (b) − f (a) = (b − a).(∇ f )(a) + (b − a).H f (c)(b − a).
2

0.3 Formule de Taylor-Young à l’ordre 2


Nous nous plaçons toujours dans les mêmes conditions : f : (x, y) 7→
f (x, y) de classe C 2 sur U , Soit a = (a 1 , a 2 ) ∈ U et h = (h 1 , h 2 ) ∈ IR2 tels que
[a, a + h] ⊂ U . On pose :

∂2 f ∂2 f
ε12 (h) = (a + θh) − (a)
∂x∂y ∂x∂y
∂2 f ∂2 f
ε11 (h) = (a + θh) − 2 (a)
∂x∂y ∂x
∂2 f ∂2 f
ε22 (h) = (a + θh) − (a)
∂y 2 ∂y 2

toutes ces fonctions tendent vers 0 lorsque h tend vers 0 (puisque les déri-
vées partielles secondes sont continues). Ce qui nous permet de transfor-
mer la formule (3) en :

1
f (a + h) = f (a) + L(h) + Q(h) + o(∥h∥2 ), (4)
2

∂f ∂f
avec L(h) = (h1 + h 2 )(a) est linéaire en h et Q(h) est la partie quadra-
∂x ∂y
tique donnée par

∂2 f ∂2 f 2∂ f
2
Q(h) := (h 12 + 2h h
1 2 + h 2 )(a) = h.H f (a)h
∂x 2 ∂x∂y ∂y 2
4

et la notation o(∥h∥2 ) désigne une fonction g (h) qui satisfait

g (h)
lim = 0.
h→0 ∥h∥2

0.4 Développement limité à l’ordre 2


Soit f : (x, y) 7→ (x, y) une fonction de classe C 2 sur un ouvert U et
M 0 = (x 0 , y 0 ) un point de U . Nous allons utiliser la formule (4) pour ob-
tenir une approximation de f (x, y) par une fonction polynomiale en deux
variables de degré deux. En effet, avec a = M0 = (x 0 , y 0 ) et h := (x −x 0 , y − y 0 ),
la formule (4) devient

f (x, y) = z 0 + m 1 (x − x 0 ) + m 2 (y − y 0 )

+ α(x − x 0 )2 + 2β(x − x 0 )(y − y 0 ) + γ(y − y 0 )2
¢
(5)
2
+ o(∥(x − x 0 , y − y 0 )∥2 ).

avec
∂f ∂f ∂2 f ∂2 f ∂2 f
z 0 = f (x 0 , y 0 ), m 1 = (x 0 , y 0 ), m 2 = (x 0 , y 0 ), α = 2 (x 0 , y 0 ), β = (x 0 , y 0 ), γ = 2 (x 0 , y 0
∂x ∂y ∂x ∂x∂y ∂y

On dit alors que nous avons obtenu un développement limité à l’ordre


deux de la fonction f au voisinage du point M0 = (x 0 , y 0 ). De manière plus
précise, la fonction polynomiale :

T2 (x, y) = z 0 + m 1 (x − x 0 ) + m 2 (y − y 0 )

+ α(x − x 0 )2 + 2β(x − x 0 )(y − y 0 ) + γ(y − y 0 )2 ,
¢
2
est une approximation polynomiale de la fonction f à l’ordre 2 au voisi-
nage de M0 , i.e.

| f (x, y) − T2 (x, y) |
lim = 0. (6)
(x,y)→(x 0 ,y 0 ) ∥(x − x 0 , y − y 0 )∥2

Exemple 1. Etudier le cas de f (x, y) = exp x 2 y − 3 au voisinage de M0 = (2, 1).


¡ ¢
0.5. APPROXIMATION POLYNOMIALE À L’ORDRE N 5

0.5 Approximation polynomiale à l’ordre n

Supposons que f : (x, y) 7→ (x, y) une fonction de classe C ∞ sur un ouvert


U et M 0 = (x 0 , y 0 ) un point de U . Comme généralisation au cas précédent,
pour chaque entier n , nous pouvons définir une fonction polynomiale de
degré n en deux variables :

n 1 µ ∂ ∂ n

X
Tn (x, y) := (x − x 0 ) + (y − y 0 ) f (x 0 , y 0 ),
k=0 k! ∂x ∂x

que nous appelons le polynome de Taylorà l’ordre n associé à la fonction


f au point (x 0 , y 0 ) ; celui-ci donne une approximation polynomiale locale
de f à l’ordre n . Ceci se traduit par :

f (x, y) = Tn (x, y) + o(∥(x − x 0 , y − y 0 )∥n ),

ou encore

| f (x, y) − Tn (x, y) |
lim = 0. (7)
(x,y)→(x 0 ,y 0 ) ∥(x − x 0 , y − y 0 )∥n

Remarque 1. Il serait intéréssant de considérer des exemples précis, en fai-


sant varier le point M0 et l’ordre n , pour explorer comment varie son dévelop-
pement plolynomiale. Pour un tel projet, on peut aussi par exemple consulter :
https ://www.geogebra.org/m/chMpCQz2
6

F IGURE 1 – Approximation à l’ordre 1

F IGURE 2 – Approximation à l’ordre 2


0.6. FORMULE DE TAYLOR À L’ORDRE N EN P VARIABLES 7

0.6 Formule de Taylor à l’ordre n en p variables


Supposons maintenant que n et p sont deux entiers supérieur à deux et
soit f : IRp → IR de classe C n sur un ouvert U ⊂ IRp . On note les coordonnées
d’un point x ∈ IRp par (x 1 , · · · , x p ).
Théorème 0.6.1 (Taylor-Lagrange). Soit a ∈ U et h ∈ IRp tels que [a, a +h] ∈ U .
Alors, il existe θ ∈]0, 1[ tel que
n−1 ∂ ∂ (k)
µ ¶
1X
f (a + h) − f (a) = h1 + · · · + hp f (a)
k=1 k! ∂x 1 ∂x p
(8)
∂ ∂ (n)
µ ¶
1
+ h1 + · · · + hp f (a + θh).
(n)! ∂x 1 ∂x p

avec la notation :
∂ ∂ (k) ∂k f
µ ¶
X
h1 + · · · + hp f = hi 1 hi 2 · · · hi k .
∂x 1 ∂x p 1≤i 1 ,...,i k ≤p ∂x i 1 · · · ∂x i k

En particulier pour p = 2 on a :
∂ ∂ (k) k ∂k f
µ ¶
X j k− j j
h1 + h2 f = C k h 1 h 2 k− j j .
∂x 1 ∂x 2 j =0 ∂x ∂x 1 2
p
Théorème 0.6.2 (Taylor-Young). Soit a ∈ U et h ∈ IR tels que [a, a + h] ∈ U .
Alors,
n 1 µ ∂ ∂ (k)

X
f (a + h) − f (a) = h1 + · · · + hp f (a)
k=1 k! ∂x 1 ∂x p (9)
n
+ o(∥h∥ ).

En particulier à l’ordre deux, cette formule de Taylor-Young pour f :


p
IR → IR s’écrit encore sous la forme (comme en deux variable) :

1
f (a + h) = f (a) + (∇ f )(a).h + h.H f (a)h + o(∥h∥2 ). (10)
2

Pour une fonction f : (x, y) 7→ f (x, y), nous nous projetons dans ce cha-
pitre d’étudier les extremums locaux de f , i.e. les maximums ou mini-
mums locaux
8

0.7 Extremums locaux


Soit U un ouvert de IRp et f : U → IR une application.

Définition 0.7.1. Soit a ∈ U .


On dit que f admet un maximum local en a s’il existe r > 0 tel que pour
tout point M dans le disque D(a, r ),

f (M ) ≤ f (a).

On dira qu’il s’agit d’un maximum local strict lorsqu’en plus f (M ) ̸= f (a)
pour tout M ̸= a . On dira qu’il s’agit d’un maximum global lorsque
f (M ) ≤ f (a) pour tout M ∈ U .
On dit que f admet un minimum local en a s’il existe r > 0 tel que
f (M ) > f (a) pour tout M ∈ D(a, r ). On dira qu’il s’agit d’un minimum lo-
cal strict lorsqu’en plus f (M ) ≥ f (a) pour tout M ̸= a . On dira qu’il s’agit
d’un minimum global lorsque f (M ) > f (a) pour tout M ∈ U .
On dit que f admet un extremum local en a si elle admet un maximum
local ou un minimum local en a .

Exemple 2.
— f (x, y) = x 2 + y 2 admet un minimum global strict en (0, 0).
0.8. NATURE D’UN POINT CRITIQUE 9

— f (x, y) = −x 2 − y 2 admet un maximum global strict en (0, 0).


— f (x, y) = (x − 1)2 admet un minimum global en (1, 0).
— f (x, y) = −(x + 1)2 admet un maximum global en (−1, 0).
— f (x, y) = x 2 − y 2 n’admet pas d’extremum local en (0, 0). En effet, pour
tout r > 0 on peut considérer les deux points Mr = (0, r2 ) et Nr = ( r2 , 0) ; ils
appartiennent au disque D(O, r ) et qu’en plus f (Mr ) < f (0, 0) < f (Nr ).

Définition 0.7.2 (Points critiques). On suppose que f est différentiable en


a . On dit que a est un point critique de f si les dérivées partielles premières
en a sont nulles (ou encore le gradient ∇ f (a) est nul) .

Proposition 0.7.1. On suppose que f : U → IR est différentiable en a et f admet


un extremum local en a . Alors a est un point critique de f .

Démonstration : Soit h ∈ IRp ∖ {0}. Puisque f est différentiable en a , la fonc-


tion F : t 7→ f (a+t h) est dérivable en 0 et de dérivée d f a (h). D’un autre côté,
supposons que a est un maximum local de f , il existe alors r > 0 tel que
f (x) − f (a) ≤ 0 pour tout x ∈ B (a, r ). Il en résulte que
f (a + t h) − f (a) r
≤ 0 pour tout 0 < t < (11)
t ∥h∥
et
f (a + t h) − f (a) r
≥ 0 pour tout − <t <0 (12)
t ∥h∥
En faisant tendre t vers 0+ dans (11) et vers 0− dans (12), nous obtenons
que d f a (h) ≤ 0 et d f a (h) ≥ 0. Donc d f a (h) = 0. Ce qui montre que d f a = 0.

Remarque 2. La réciproque de la proposition 0.7.1 est fausse en général comme


le montre l’exemple : Pour f (x, y) = x 2 − y 2 , le point (0, 0) est un point critique de
f mais ce n’est pas un extremum local.

0.8 Nature d’un point critique


Nous allons voir que sous certaines conditions supplémentaires sur
les dérivées partielles secondes, on peut savoir si un point critique est un
10

maximum, un minimum ou un extremum local. Il s’agit d’une application


de la formule de Taylor-Young.
• Désormais, nous supposons que f : IRp → IR est une fonction de classe C 2
au voisinage d’un point critique a . La matrice Hessienne de f en a est la
matrice symétrique :
∂2 f ∂2 f
 
(a) . . . (a) 
 ∂x 1 ∂x 1 ∂x 1 ∂x p


 .. .. .. 
H f (a) = 
 . . . 

 ∂ f2
∂2 f
 

(a) . . . (a)
∂x p ∂x 1 ∂x p ∂x p
On désignera par Q : h 7→ Q(h) la forme quadratique associée :

Q(h) = h t H f (a)h =

où h ∈ IRp est identifié avec la matrice colonne de transposé h t = (h1 , . . . , h p ).


La formule de Taylor-Young à l’ordre deux appliquée à f en a s’écrit :
1
f (a + h) − f (a) = Q(h) + ∥h∥2 ε(h) (13)
2
avec ε(h) tend vers 0 lorsque h tend vers 0, et
0.8. NATURE D’UN POINT CRITIQUE 11

Définition 0.8.1. Si A est une matrice symétrique à coefficients réelles et


q(h) = h t Ah est la forme quadratique assiciée. On dira que la forme quadra-
tique q ou que la matrice A est :
— positive si q(h) ≥ 0 pour tout h ∈ IRp .
— négative si q(h) ≤ 0 pour tout h ∈ IRp .
— définie positive si q(h) > 0 pour tout h ∈ IRp ∖ {0}.
— définie négative si q(h) < 0 pour tout h ∈ IRp ∖ {0}.
— changeant de signe s’ils existent h, k ∈ IRp ∖ {0} tels que q(h) > 0 et
q(k) < 0.

Par exemple, sur IR2 :


— q(h1 , h2 ) = (h1 )2 est positve mais elle n’est pas définie positive
(q(0, 1) = 0).
— q(h1 , h2 ) = (h1 )2 − (h2 )2 change de signe (q(1, 0) > 0 et q(0, 1) < 0).

Proposition 0.8.1.
1. Si f admet un minimum local en a , alors q est positive.
2. Si f admet un maximum local en a , alors q est négative.

Démonstration Le 2) découle de 1) en échangeant f en − f , nous allons


plutôt établir 1). Supposons que f admet un minimum local en a , il existe
alors r > 0 tel que f (a + k) − f (a) ≥ 0 pour tout k ∈ B (0, r ). Soit maintenant
h ∈ IRp ∖ {0} ; on a donc
r
f (a + t h) − f (a) ≥ 0 pour tout t ∈ [0, [
∥h∥
Et d’après (13), nous obtenons
r
q(t h) + ∥t h∥2 ε(t h) ≥ 0 pour tout t ∈ [0, [
∥h∥
Et parsuite
r
q(h) + ∥h∥2 ε(t h) ≥ 0 pour tout t ∈ [0, [
∥h∥
En faisant tendre t vert 0+ , on obtient q(h) ≥ 0. Ainsi q est positive.

Corollaire 0.8.1. Si q change de signe, alors le point a n’est pas un extremum


local de f .
12

Remarque 3. Les réciproques du corollaire 0.8.1 et de la proposition 0.8.1 sont


fausses en général : Par exemple la fonction f (x, y) = x 2 − y 4 n’a pas d’extremum
local en (0, 0) (même raisonnement que pour la fonction (x, y) 7→ x 2 − y 2 ) mais
puisque
∂2 f ∂2 f ∂2 f
(0, 0) = 2 et (0, 0) = (0, 0) = 0
∂x 2 ∂y 2 ∂x∂y
on obtient q(h1 , h2 ) = h12 qui est positive.

Proposition 0.8.2.
1. Si q est définie positive, alors f admet un minimum local strict en a .
2. Si q est définie négative, alors f admet un maximum local strict en a .

On va encore utiliser la formule de Taylor-Young mais aussi un résultat


d’algèbre linéaire (selon lequel toute matrice symétrique est diagonali-
sable par une une matrice orthogonale). Rappelons d’abord que :
— la transposée d’une matrice carrée A = (ai j ) ∈ M p (IR) est la matrice
A t = (b i j ) avec b i j = a j i .
— une matrice carrée A ∈ M p (IR) est dite symétrique si A t = A .
— une matrice carrée P ∈ M p (IR) est dite orthogonale si P t = P −1 ; cela
signifie que les vecteurs colonnes de P forment une base orthonor-
mée de l’espace IRp muni de son produit scalaire usuel.
Lemme Si A ∈ M p (IR) est une matrice symétrique, alors il existe une matrice
orthogonale P telle que P AP −1 = P AP t soit une matrice diagonale :
 
λ1 0 ... 0
 ... ... .. 
 0 . 
D =
 
.. .. .. 

 . . . 0 

0 ... 0 λp

Il en résulte que pour tout h ∈ IRp (h étant identifié à la matrice colonne


de transposé h t = (h1 , . . . , h p )) on a

h t Ah = (h ′ )t Dh ′ = λ1 (h 1′ )2 + . . . + λp (h p′ )2
0.8. NATURE D’UN POINT CRITIQUE 13

où h ′ = Ph et (h1′ , . . . , h p′ ) = (h ′ )t .
Démonstration de la proposition 0.8.2 Encore une fois le 2) découle de
1) en échangeant f en − f , nous allons plutôt établir 1). Supposons que
la forme quadratique h 7→ q(h) = h t Hess a ( f )h est définie positive. On ap-
plique le lemme ci-dessus à la matrice A = Hess a ( f ). L’hypothèse q est
définie positive signifie alors que les valeurs propres λ1 , . . . , λp sont stricte-
ment positives ; il en résulte que si l’on désigne par λi la plus petite valeure
propre de Hess a ( f ) on obtient que pour tout h ∈ IRp , on a

q(h) ≥ λ∥h∥2

Et d’après (13), nous obtenons

f (a + h) − f (h) ≥ ∥h∥2 (λi + ε(h))

Et puisque ε(h) tend vers 0 lorsque h tend vers 0, on peut choisir r > 0 tel
que pour tout h ∈ B (0, r ), on a | ε(h) |< λ2i et par suite
λi
f (a + h) − f (h) ≥ ∥h∥2
2
D’où le résultat. □

Corollaire 0.8.2. Soit f : (x, y) 7→ f (x, y) est une fonction de classe C 2 au


voisinage de M0 = (x 0 , y 0 ) un point critique de f . On pose :

∂2 f ∂2 f ∂2 f
r= (M 0 ), s = (M 0 ), t = (M 0 ).
∂x 2 ∂x∂y ∂y 2

1. Si r t − s 2 > 0 et r > 0, alors M0 est un minimum local de f .


2. Si r t − s 2 > 0 et r < 0, alors M0 est un maximum local de f .
3. Si r t − s 2 < 0, alors M0 n’est pas un extremum local de f .

Démonstration L’hypothèse r t − s 2 > 0 et r > 0 signifie que le déterminant


et la trace de la matrice Hessienne en M0 sont strictement positifs, les va-
leurs propres de H f (M0 ) sont alors strictement positifs et par suite la forme
quadratique associée est définie positive. Le résultat découle alors par ap-
plication de 0.8.2. On obtient de même 2) et 3). □
14

Exemple 3. La fonction f (x, y) = x 3 + y 3 + 3x y étant différentiable sur IR2 , donc


tout extremum local (s’il existe) de f doit être un point critique de f . En calculant
les dérivées partielles de f , on trouve que les seules points critiques de f sont
M 0 = (0, 0) et M 1 = (−1, −1). En applicant ensuite le corollaire, on obtient que M 0
n’est pas un extremum local et que M1 est un maximum local.

Vous aimerez peut-être aussi