Calcul diffrentiel
Lide du calcul direntiel est dapprocher au voisinage dun point une fonction f
par une fonction plus simple (ou dapprocher localement le graphe de f par un espace
plus simple).
Une fois les notations assimiles, les mthodes et les rsultats du calcul direntiel
sont naturels : ce sont les mmes que pour ltude des fonctions dune variable relle.
On est ainsi amen
tudier la restriction des fonctions le long dune droite comme, par exemple, pour
dmontrer les formules de Taylor.
gnraliser les outils familiers en dimension 1 comme les changements de variables,
lingalit des accroissements nis, etc.
Ce chapitre prsente les rsultats essentiels qui exploitent ces ides. Nous insistons
sur leur mise en situation, en particulier en optimisation et pour ltude des fonctions
convexes. Nous nous appuyons rgulirement sur le livre de Franois Rouvire [rou]
qui est une excellente rfrence sur le sujet.
Prliminaires
Les dnitions et les rsultats sont valides dans les espaces de Banach rels.
Cependant, la dimension innie amne des problmes qui sont secondaires en cal-
cul direntiel (la dpendance vis--vis de la norme et la non-continuit automatique
des applications linaires). On a alors besoin de rsultats sur les espaces de Banach
comme par exemple le thorme de linverse continue de Banach (voir [br, II.6]).
Comme la plupart des illustrations et des exemples que nous proposons ont pour
cadre la dimension nie, nous avons choisi de ne pas nous attarder sur ces questions.
Dans cette section, E, F et G dsignent des R-espaces vectoriels norms. Sauf men-
tion explicite du contraire, ils sont supposs de dimension nie. La norme est note
| | indpendamment de lespace.
1.1 Diffrentiabilit
Les applications direntiables en un point a sont celles qui peuvent tre appro-
ches au voisinage de a par une application ane. Intuitivement, le graphe de f
ressemble localement un espace ane T
a
.
2 Chapitre 1 Calcul diffrentiel 1.1.1
y =f(x)
a
T
a
x
y
x
0
x
0
y
0
z = f(
(
x,
,
y)
) a =
y
0
T
a
Fig. 1.1 Direntiabilit dune fonction de R dans R et dune
fonction de R
2
dans R
1.1.1 Applications diffrentiables
Diffrentiabilit
Soient | un ouvert de E et f : | F. On dit que f est direntiable en a | sil
existe une application linaire (continue) de E dans F telle que
f(a + h) = f(a) + (h) + o (|h|),
quand h tend vers 0. Cette application est unique (voir [rdo3, 8.1.1.1
]) : on lap-
pelle la direntielle de f en a. On choisit de la noter df(a) (dautres notations
courantes sont f
.
Dautre part, une application f linaire (continue) est direntiable partout, et
elle est sa propre direntielle en tout point :
h E, df(a) h = f(h).
Lapplication direntielle est ainsi lapplication constante df : x f. Une applica-
tion linaire (continue) est donc de classe C
.
Exemple 1.2 Direntielle dun produit . Soit B une application bilinaire
(continue) dun produit EF dans G. Alors B est direntiable en (a, b) EF et
(h, k) E F, dB(a, b) (h, k) = B(a, k) + B(h, b).
En particulier, on peut direntier le produit scalaire dun espace euclidien (voir
lexemple 1.12).
1.1.1 Diffrentiabilit 3
Exemple 1.3 Dans les espaces de matrices. Lanalyse matricielle regorge
dexemples intressants.
Lors de la dmonstration du lemme 1.31 de Morse, on sintresse la direntielle
de lapplication M M
n
(R)
t
MA
0
M o
n
, o A
0
o
n
.
Le calcul de la direntielle de linverse sur GL
n
(R) est fait directement dans
lexercice 16 de [rou] ou via les drives partielles dans lexercice 7 de [gou2, p.309].
La premire mthode prsente lavantage dtre valable en dimension innie et a
fait lobjet de la troisime partie du sujet danalyse de 1999.
la direntielle du dterminant M M
n
(R) det(M) R est un autre exemple
classique. (voir lexercice 25 de [rou] ou lexercice 7 de [gou2, p.309] ainsi quune
application lexercice 1.5).
Exemple 1.4 Sandwich. Soient f : ER et a E.
Considrons deux applications
m: ER et M: ER
direntiables en a avec la mme direntielle
dm(a) = dM(a) en a et vriant
m(a) = f(a) = M(a)
et m(y) f(y) M(y)
pour y proche de a. Alors f est direntiable
en a, avec df(a) = dm(a) = dM(a).
a
f
m
M
Ce rsultat exprime simplement ce qui est vident sur un dessin : une courbe
prise en sandwich entre deux courbes ayant la mme tangente admet cette mme
tangente. Dmontrons ce rsultat. Posons = dm(a) = dM(a) et crivons, pour
tout h susamment petit,
m(a + h) f(a + h) M(a + h).
Do m(a + h) m(a) f(a + h) f(a) M(a + h) M(a)
cest--dire (h) + o (h) f(a + h) f(a) (h) + o (h).
Finalement f(a + h) f(a) = (h) + o (h), ce qui permet de conclure.
Remarque 1.5 Identications. Ajoutons que deux identications sont utilises en
permanence en calcul direntiel : lune concernant la diffrentielle seconde, lautre
les fonctions dune variable relle.
Soit f : EF une application deux fois direntiable en a. Cette hypothse im-
pose f dtre direntiable dans un voisinage de a. Pour tout x dans ce voisi-
nage, df(x) appartient L(E, F), et donc la direntielle au point a de lapplica-
tion x df(x) appartient L(E, L(E, F)). Cet espace est identi avec lespace
L
2
(E, F) des applications bilinaires de E dans F grce lisomorphisme
L(R, F)
F
u u(1),
on identie drive et direntielle. Notez que certains livres (comme [cia]) parlent
dapplications drivables pour dire direntiables , et de drives pour dire
direntielles .
Drives directionnelles
Soit f une application dun ouvert | de E dans F. On dit que f est drivable en
a | selon h E si la fonction partielle t f(a +th) est drivable en 0. Sa drive
est la drive partielle ou la drive directionnelle de f dans la direction h. On la note
f
h
(a) ou
f
x
i
(a) si h = e
i
et (e
1
, . . . , e
n
) une base de E.
Certains ouvrages utilisent dautres notations, comme
h
f(a) ou D
h
f(a).
v
u
x f(x, y
0
)
y f(x
0
, y)
y
z = f(x, y)
x
u =
1
0
f
x
v =
0
1
f
y
Fig. 1.2 Drives directionnelles dune fonction de R
2
dans R
Si f est direntiable en a |, alors les drives directionnelles en a existent et
on a lgalit
f
h
(a) = df(a) h.
La rciproque est fausse : lexistence des drives partielles dans toutes les direc-
tions nimplique pas la direntiabilit. Cest bien naturel puisque la connaissance
du comportement des fonctions partielles (mme dans toutes les directions) ne donne
dinformation sur le comportement de f que sur les droites issues de a. Or, dans la
dnition de la direntielle, h peut tendre vers 0 en tournant autour .
Contre-exemple 1.6 Soit lapplication dnie par f(x, y) = y
2
/x si x ,= 0 et
f(0, y) = y sinon. Elle est drivable en (0, 0) dans toute direction, mais elle nest mme
pas continue. Cet exemple est propos dans [rdo3, 8.1.1.5
] et corrig lexercice 1
de [gou2, p.305]. Lide gomtrique est dapprocher (0, 0) en tournant (le long de la
parabole x = y
2
). On a f(y
2
, y) = 1 et donc f(y
2
, y) ne tend pas f(0, 0) = 0 quand
y tend vers 0. Bref, f nest pas continue en (0, 0) donc pas direntiable en (0, 0).
1.1.1 Diffrentiabilit 5
Remarque 1.7 Ane VS vectoriel. En calcul direntiel, lespace de travail
possde une structure despace vectoriel et donc aussi une structure despace af-
ne. Il nest pas toujours dsirable de distinguer vecteurs et points, mais il est bon
de garder lesprit la cohabitation des deux en calcul direntiel. Par exemple,
pour la drive directionnelle, on drive une fonction en un point dans la direction
dun vecteur.
Gradient
Soient (E, , )) un espace euclidien (ou un espace de Hilbert) et f : ER une
application direntiable en a E. Par dnition, df(a) est une forme linaire (conti-
nue) sur E. Daprs le thorme 3.29, il existe un unique vecteur de E, not f(a),
tel que
df(a) h = f(a), h) pour tout h E.
On lappelle gradient de f en a. Remarquez que le gradient dpend du produit scalaire
choisi sur E.
z = f(x, y
y
x
)
f(a
1
a
1
)
f(a
0
a
0
)
{(x, y) f(x, y =z
0
} , )
(a
1
f(a
1
)) ,
(a
0
f(a
0
)) ,
Fig. 1.3 Gradient dune fonction de R
2
dans R
Si E = R
n
muni de sa structure euclidienne canonique, il y a essentiellement deux
mthodes pour calculer le gradient :
en revenant la dnition,
via les drives partielles
f(a) =
f
x
1
(a), . . . ,
f
x
n
(a)
.
Attention, ce nest pas parce que toutes les drives partielles existent que le
vecteur des drives partielles est gal au gradient. En eet, le gradient nest dni
que pour des applications direntiables. De plus, cette notion ne concerne que les
fonctions valeurs dans R.
Remarque 1.8 Interprtation gomtrique. Gomtriquement, le gradient en a
(suppos non nul) peut sinterprter de trois manires.
f(a) indique la direction de la plus forte pente de f en a (voir [rou, ex.27]).
Le graphe de la fonction f est une hypersurface de ER dont lespace tangent est
lorthogonal de (f(a), 1).
6 Chapitre 1 Calcul diffrentiel 1.1.2
f(a) dirige la normale lhyperplan tangent en a lhypersurface
S = x E, f(x) = f(a).
Si lon trace sur S une courbe drivable qui passe par a en t = 0, son vecteur
tangent
(0) est orthogonal f(a) (pour le voir, driver par rapport t lgalit
f (t) = f(a)).
Le cadre justiant proprement tout ceci est celui des sous-varits (auquel [rou, Ch.5]
est une bonne introduction).
1.1.2 Lemme fondamental de composition
Le lemme technique suivant est extrmement important : il gnralise la formule
de drivation des fonctions composes et il est dusage permanent.
Lemme 1.9 Direntiabilit dune compose. Soient | un ouvert de E, 1 un
ouvert de F et a un point de | tel que f(a) 1. Si f : | F et g : 1 G sont
direntiables respectivement aux points a et f(a), alors g f est direntiable au
point a et
d(g f)(a) = dg (f(a)) df(a) .
Pour dmontrer ce lemme, il sut dcrire le dveloppement limit de g f en a
au premier ordre (voir [rou, Ch.2] pour le schma de la preuve et [rdo3, 8.1.2] pour
les dtails).
Lidentit dEuler donne un exemple dutilisation de ce lemme (voir [rou, ex.20]).
Par ailleurs, en appliquant ce lemme une fonction bijective f et son inverse,
on obtient le rsultat suivant.
Application 1.10 Direntielle de la rciproque. Soit f : | E F une
bijection de | sur f(|). Si f est direntiable en un point a | et si f
1
est
direntiable au point f(a), alors df(a) est un isomorphisme de E sur F et
d(f
1
)(f(a)) = df(a)
1
.
Sous ces hypothses, df(a) ralise donc un isomorphisme entre E et F (qui sont ainsi
de mme dimension).
Linconvnient de cet nonc est quil exige que de f
1
soit direntiable en f(a),
ce qui est dicile vrier. Pour y remdier, on ajoute des proprits f (que f soit
de classe C
1
et de direntielle inversible en a) pour se passer de celles sur f
1
(que
f soit direntiable en f(a)). Cela donne le premier thorme fondamental du calcul
direntiel : le thorme dinversion locale (voir la section suivante).
Ajoutons que si f est simplement un homomorphisme, E et F sont aussi de mme
dimension, mais cest plus dicile prouver (sauf si E = R car on dispose alors dun
argument de connexit, voir lexercice 7 de [gou1, p.46]).
Exemple 1.11 Restriction un segment. Soit f diffrentiable sur un ouvert |
de E. Pour tous a, b | tels que le segment [ a , b ] soit dans |, lapplication
:
[ 0 , 1 ] F
t f(a + t(b a))
est drivable sur [ 0 , 1 ] et
]).
Dailleurs, lingalit en dimension su-
prieure se montre grce lingalit
en une dimension via la fonction de
lexemple 1.11 (voir [rdo3, 8.1.3.1
]).
Nous renvoyons aux intressants com-
mentaires de [rou, chap.3].
f
(x)| | M
d = | f(b)f(a)| D = M| a|
d
b
b
a
D
Remarquons que si f est de classe C
1
, lexistence du majorant M est assure
par la compacit du segment [ a , b ] et la continuit de x df(x). Soulignons quil
faut que | soit convexe pour appliquer lingalit entre deux points quelconques
de |. Ajoutons aussi que la norme de df(x) qui apparat dans lnonc est la norme
dapplication linaire associe aux normes de E et F :
|df(x)| = sup
h=0
|df(x) h|
F
|h|
E
.
Lorsque lingalit des accroissements nis est utilise pour montrer que f est contrac-
tante, le choix des normes est primordial (voir [rou, ex.32]).
8 Chapitre 1 Calcul diffrentiel 1.1.4
Application 1.14 Direntielle nulle. Soit | un ouvert connexe de E; alors
x |, df(x) = 0 f est constante sur |.
Limplication () est toujours vraie. Lhypothse de connexit permet de dmontrer
() en exploitant lquivalence suivante (voir [gou2, I.4.3]) pour un ouvert |
| connexe | connexe par arc | connexe par lignes brises.
Ajoutons que si la direntielle est nulle mais | nest pas connexe, la fonction f est
constante seulement sur chaque composante connexe de |.
Application 1.15 Caractrisation des fonctions C
1
C
1
C
1
. Soient | un ouvert de R
n
et
f : | F une fonction dont les drives partielles existent en tout point de |. On ne
peut pas en dduire que f est direntiable sur | (voir le contre-exemple 1.6). Mais
ds lors que les drives partielles existent et sont continues, alors f est de classe C
1
sur |, et donc notamment direntiable (voir [rou, ex.37]). Comme la rciproque
est vraie, cest ainsi une caractrisation des fonctions C
1
(utilise constamment).
Application 1.16 Thorme de Schwarz. Soit f une application dun ouvert |
de R
n
dans F. Si f est deux fois direntiable au point a | alors, pour 1 i, j n,
on a
d
2
f(a)(e
i
)(e
j
) =
2
f
x
i
x
j
(a) =
2
f
x
j
x
i
(a) = d
2
f(a)(e
j
)(e
i
).
Voir le thorme 6.1 dans [rou]. Le thorme de Schwarz est parfois donn avec
dautres hypothses (voir [gou2, p.302] et lexercice 1 de [gou2, p.305]).
Ce thorme permet didentier la direntielle seconde d
2
f(a) avec une applica-
tion bilinaire symtrique sur E (via le premier isomorphisme de la remarque 1.5).
En particulier, lorsque f est valeurs relles, d
2
f(a) est identie une forme bi-
linaire symtrique et donc aussi une forme quadratique. La matrice reprsentant
cette forme quadratique dans la base canonique est appele la hessienne de f en a.
On la note
Hf(a) =
2
f
x
i
x
j
(a)
i,j
.
Maintenant quon peut intervertir deux drives partielles, on peut faire de mme
pour toute permutation de plusieurs drives partielles (puisque les transpositions
engendrent les permutations). Ainsi, lordre des drivations partielles na pas din-
uence. A priori, il y avait donc n
p
drives partielles p-imes. On sait maintenant
quil ny en a en fait que C
p
n1+p
(voir lexercice 4.1).
Application 1.17 Direntielle dune limite. Il existe un thorme en plu-
sieurs variables analogue au thorme [rdo4, 2.2.3.1
V
f(x) dx =
U
f((y)) [det d(y)[ dy.
La preuve de ce thorme est base sur le
thorme 4.83. Une fois de plus, lide est
dapprocher autour de chaque point y la
transformation par sa direntielle d(y).
Ainsi localement, aecte le volume inni-
tsimal de la mme manire que lapplica-
tion linaire d(y) : en le multipliant par
[det d(y)[. Attention ne pas oublier le
dterminant et la valeur absolue dans la for-
mule de changement de variables.
x
0
f
f
(x
0
)
| det df(x
0
)|
/
/
Signalons aussi que le rsultat est encore vrai sous des hypothses plus faibles
(voir [rud, 7.26]). Nous lnonons ici sous une forme plus pratique, que lon peut
encore simplier en supposant que est un diomorphisme de | sur 1.
On utilise trs souvent des changements de variables pour calculer ou r-exprimer
des intgrales (voir par exemple lexercice 1.4).
Application 1.19 Calcul de loi. En probabilit, ce thorme permet de calculer
la loi dune variable alatoire dnie partir dautres variables alatoires dont on
connat la loi (voir les exemples 8.3 et 8.4 ainsi que lexercice 8.4 de [ouv]).
1.2 Inversion locale et fonctions implicites
Le thorme dinversion locale tablit quune fonction de classe C
1
est localement
un C
1
-diomorphisme ds lors que son premier ordre lest. Le thorme des fonctions
implicites exprime quune courbe dnie implicitement par une quation du type
f(x, y) = 0 peut tre vue localement comme le graphe dune fonction.
Les deux thormes servent crer des fonctions. Comme ce nest pas facile en
gnral, ces thormes apportent un vritable plus. Pensez-y quand vous voyez une
question du genre montrer quil existe f de classe C
1
telle que... .