Vous êtes sur la page 1sur 48

Département de Mathématiques

Licence Sciences Mathématiques et Applications


(SMA)

Calcul diérentiel

Support de cours

Mohamed Tahar Kadaoui ABBASSI

Année Universitaire : 2020-2021


Université Sidi Mohammed Ben Abdellah
Faculté des sciences Dhar El Mahraz
Département de Mathématiques

Sciences Mathématiques et Applications (SMA)

Calcul diérentiel

MOHAMED TAHAR KADAOUI ABBASSI

Année universitaire 2020-2021


Table des matières

1 Espaces vectoriels normés- Rappels et compléments 5


1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Normes et espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Applications linéaires entre espaces vectoriels normés . . . . . . . . . . . . . . . . . . . 6

1.4 Applications multinéaires continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.5 Algèbres normées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 Diérentiabilité  accroissement ni 13


2.1 Fonctions diérentiables  Diérentielle . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2 Les accroissements nis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1
2.3 Fonctions de classe C et diérentielles partielles . . . . . . . . . . . . . . . . . . . . . 20

3 Diérentielles d'ordre supérieur Formules de Taylor 23


3.1 Diérentielle seconde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

n
3.1.1 Cas des fonctions de R dans R . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1.2 Théorème de Schwarz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.1.3 Formule de Taylor à l'ordre 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.2 Extremas d'une fonction réelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3 Diérentielles d'ordres supérieurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.4 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.4.1 Intégration des fonctions à valeurs dans un espace de Banach . . . . . . . . . . 31

3.4.2 Formules de Taylor dans le cas E=R . . . . . . . . . . . . . . . . . . . . . . . 33

3.4.3 Formules de Taylor dans le cas général . . . . . . . . . . . . . . . . . . . . . . . 34

4 Inversion locale  Fonction implicite 37


4.1 Le théorème du point xe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.2 Le théorème d'inversion locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.3 Le théorème des fonctions implicites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3
4 TABLE DES MATIÈRES
Chapitre 1

Espaces vectoriels normés- Rappels et


compléments

Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Normes et espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . 5
1.3 Applications linéaires entre espaces vectoriels normés . . . . . . . . . . 6
1.4 Applications multinéaires continues . . . . . . . . . . . . . . . . . . . . . 9
1.5 Algèbres normées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.1 Introduction
Ce chapitre contient des rappels des notions de base et des résultats fondamentaux sur les espaces
vectoriels normés dont on aura besoin tout le long de ce cours. Les résultats de ce chapitre n'étant
pas un but en soi, on omettra parfois leurs démonstrations qui seront laissées en exercice.

1.2 Normes et espaces vectoriels normés


Dénition 1.2.1. Soit E un espace vectoriel sur K (K = R ou C). Une norme sur E est une
application, qu'on note k k, de E vers R+ , vériant les propriétés suivantes :

1. Pour tout x ∈ E , kxk = 0 =⇒ x = 0,


2. Pour tout (x, λ) ∈ E × K, kλxk = |λ|kxk,
3. Pour tout (x, y) ∈ E × E , kx + yk ≤ kxk + kyk.
On appelle espace vectoriel normé réel (resp. complexe) la donnée d'un espace vectoriel E sur
R (resp. C) et d'une norme kk sur E. On le note (E, k k).

Soit (E, k k) un espace vectoriel normé sur K. On dénit l'application d : E × E → R+ par


d(x, y) = kx − yk, pour tout (x, y) ∈ E × E . Alors il est facile de montrer que

Proposition 1.2.2. d est une distance sur E, appelée : distance induite par la norme.
5
6 CHAPITRE 1. ESPACES VECTORIELS NORMÉS- RAPPELS ET COMPLÉMENTS

Dénition 1.2.3 (espace de Banach). Un espace vectoiel normé (E, k k) sur K est dit espace de
Banach si (E, d) est complet, où d est la norme induite par k k.
Dénition 1.2.4 (normes équivalentes). Deux normes k k1 et k k2 sur un espace vectoriel E sont dites
équivalentes s'il existe deux réels strictement positifs λ1 et λ2 tels que λ1 kxk1 ≤ kxk2 ≤ λ2 kxk1 ,
pour tout x ∈ E.

Proposition 1.2.5. Soient k k et k k deux normes équivalentes sur un espace vectoriel E. Alors
1. elles dénissent la même topologie sur E ;
1 2

2. (E, k k ) est de Banach si et seulement si (E, k k ) est de Banach.


1 2

Exemples 1.2.6. 1. On dénit sur Rn les normes équivalentes suivantes :


pPn
k(x1 , ..., xn )k2 = 2
 i=1 xi ;
Pn
 k(x1 , ..., xn )k1 = i=1 |xi | ;
 k(x1 , ..., xn )k∞ = maxni=1 |xi |.
Alors Rn muni de l'une des normes précédentes est un espace de Banach.

2. Soient X un ensemble non vide et B(X, K) l'ensemble des fonctions bornées sur X à valeurs
dans K. On dénit sur B(X, K) la norme k k∞ par kf k∞ = supx∈X |f (x)|. Alors (B(X, K), k k∞ )
est un espace de Banach.

3. Soient (Ei , k kEi ) des espaces vectoriels normés sur K, i = 1, ..., n, et E = E1 × ... × En . Comme
pour Rn , on peut munir E des trois normes équivalentes suivantes : pour tout (x1 , ..., xn ) ∈ E ,
qP
n
 k(x1 , ..., xn )kE
2 =
2
i=1 kxi kEi ;
Pn
 k(x1 , ..., xn )kE
1 = i=1 kxi kEi ;
 k(x1 , ..., xn )kE n
∞ = maxi=1 kxi kEi .

Si, pour tout i = 1, ..., n, (Ei , k kEi ) est un espace de Banach, alors (E, k kE E
2 ), (E, k k1 ) et (E, k kE
∞)
sont tous des espaces de Banach.

On a les résultats suivants dont les démonstrations seront laissées en TD.

Proposition 1.2.7. 1. Si E est un espace vectoriel de dimension nie sur K, alors toutes les
normes (possibles) sur E sont équivalentes.
2. Tout espace vectoriel normé de dimension nie sur K est de Banach
3. Tout sous-ensemble compact d'un espace vectoriel normé E sur K est un fermé borné de E. La
réciproque est vraie si et seulement si dim E < +∞.
4. La boule fermée unité B̄ (0, 1) d'un espace vectoriel normé E sur K est compacte si et seulement
si dim E < +∞.
E

1.3 Applications linéaires entre espaces vectoriels normés


Soient (E, k kE ) et (F, k kF ) deux espaces vectoriels normés sur K et f :E →F une application
linéaire.

Théorème 1.3.1. Les assertions suivantes sont équivalentes :


1. f est uniformément continue sur E ;
2. f est continue sur E ;
3. f est continue à l'origine de E ;
1.3. APPLICATIONS LINÉAIRES ENTRE ESPACES VECTORIELS NORMÉS 7

4. il existe M > 0 tel que, pour tout x ∈ E, kf (x)k F ≤ M kxkE .


Démonstration. 1. =⇒ 2. et 2. =⇒ 3. sont évidentes.
3. =⇒ 4. f étant continue en 0E , il existe η > 0 tel que si kxkE < η alors kf (x)kF < 1.
:
1 0 η0
Posons M =
η 0 , pour η ∈]0, η[. Cela étant, pour tout x ∈ E \ {0E }, posons y = kxkE x. On a alors
η0
kykE = η 0 < η et par suite kxk E
kf (x)kF = kf (y)kF < 1, i.e. kf (x)kF < kxk
η0
E
≤ M kxkE . L'inégalité
précédente est aussi vraie pour x = 0.

4. =⇒ 1. : pour tous x, y ∈ E , kf (x) − f (y)kF = kf (x − y)kF ≤ M kx − ykE , ce qui implique la


continuité uniforme.

Proposition 1.3.2. Si dim E < +∞ , alors toute application linéaire f : E → F est continue.
Démonstration.
Pn
(e1 , ..., en ) une base de E . Pour tout x = i=1 xi ei ∈ E , on a kf (x)kF ≤
Soit
n
M0 i=1 |xi | = M0 kxkE n
P
1 , où M0 = supi=1 kf (ei )kF > 0. Puisque toutes les normes sur E (de dimen-
E
sion nie) sont équivalentes, alors il existe λ > 0 tel que kxk1 < λkxkE , pour tout x ∈ E , et par
suite kf (x)kF ≤ M kxkE , pour tout x ∈ E , où M = λM0 . On en déduit le résultat en utilisant la
proposition précédente.

Notations 1.3.3. Soient E et F deux espaces vectoriels normés sur K. On note par :

• L(E, F ) : l'espace vectoriel des applications linéaires continues de E vers F ;

• End(E) = L(E, E) ;
• E 0 = L(E, K) le dual topologique de E .

Norme d'une application linéaire continue

Soit f ∈ L(E, F ). On dénit les quantités

kf (x)kF
α = sup kf (x)kF , β= sup , γ = sup kf (x)kF .
kxkE ≤1 x∈E\{0} kxkE kxkE =1

D'après le Théorème 1.3.1, il existeM > 0 tel que kf (x)kF ≤ M kxkE , pour tout x ∈ E . On en déduit
que α, β γ sont nies. De plus, on a α = β = γ , qu'on note par kf k ou |kf |k. En eet, si on
et
kf (y)kF kf (x)kF
suppose que 0 < kykE ≤ 1, alors kf (y)kF ≤
kykE ≤ supx∈E\{0} kxkE  . D'où supkyk ≤1 kf (y)kF ≤
E
kf (x)kF kf (y)kF 1
supx∈E\{0} kxkE , i.e. α ≤ β . Si y ∈ E \ {0}, alors kykE = f kykE y ≤ supkxkE =1 kf (x)kF =
F
kf (y)kF
γ. D'où β = supy∈E\{0} kykE ≤ γ. Il s'ensuit que α ≤ β ≤ γ.
D'autre part, puisque {x ∈ E, kxkE = 1} ⊂ {x ∈ E, kxkE ≤ 1}, alors supkxkE =1 kf (x)kF ≤
supkxkE ≤1 kf (x)kF , i.e. γ ≤ α, d'où le résultat.
Proposition 1.3.4. L'application f → kf k dénit une norme sur L(E, F ).
Démonstration. Exercice.

Théorème 1.3.5. Soient E et F deux espaces vectoriels normés sur K. Si F est un espace de Banach,
alors (L(E, F ), k k) est un espace de Banach.
Démonstration. Soit (fn ) une suite de Cauchy de L(E, F ), i.e.
kfn (x) − fm (x)kF
∀ε > 0, ∃N ∈ N, ∀n, m ≥ N, kfn − fm k = sup < ε.
x∈E\{0} kxkE
8 CHAPITRE 1. ESPACES VECTORIELS NORMÉS- RAPPELS ET COMPLÉMENTS

D'où,

(1.3.1) ∀ε > 0, ∃N ∈ N, ∀n, m ≥ N, ∀x ∈ E, kfn (x) − fm (x)kF ≤ εkxkE .


Pour x∈E xé, on déduit de (1.3.1) que (fn (x)) est une suite de Cauchy dans F , qui est complet,
et par suite il existe f (x) ∈ F tel que fn (x) −→ f (x). On obtient ainsi une application f : E → F ,
n→+∞
x 7→ f (x). On a alors
 f est linéaire : en eet, puisque fn est linéaire, pour tout n, on a fn (αx + βy) = αfn (x) + βfn (y),
pour tous α, β ∈ K, x, y ∈ E et n. Par passage à la limite, quand n −→ +∞, on obtient
f (αx + βy) = αf (x) + βf (y), pour tous α, β ∈ K et x, y ∈ E .
 f est continue : en eet, en faisant tendre m vers l'inni dans (1.3.1), on trouve

(1.3.2) ∀ε > 0, ∃N ∈ N, ∀n ≥ N, ∀x ∈ E, kfn (x) − f (x)kF ≤ εkxkE .


En particulier, pour n=N dans (1.3.2), on a kfN (x) − f (x)kF ≤ εkxkE , pour tout x ∈ E, et
par suite
kf (x)kF ≤ kfN (x)kF + εkxkE ≤ (kfN k + ε)kxkE , ∀x ∈ E.
En utilisant le Théorème 1.3.1 (avec M = kfN k + ε), on déduit que f est continue.
 fn −→ f dans L(E, F ) : en eet, par dénition de la norme sur L(E, F ), (1.3.2) s'écrit
n→+∞

∀ε > 0, ∃N ∈ N, ∀n ≥ N, kfn − f k ≤ ε.

Corollaire 1.3.6. Pour tout espace vectoriel normé E sur K, son dual E est un espace de Banach. 0

Proposition 1.3.7. Soient E, F et G trois espaces vectoriels normés sur K. Si f ∈ L(E, F ) et


g ∈ L(F, G), alors g ◦ f ∈ L(E, G) et kg ◦ f k ≤ kgkkf k.

Démonstration. Il sut de montrer que kg ◦ f k ≤ kgkkf k, la première assertion étant évidente.


Pour tout x∈E tel que kxkE ≤ 1, on a

kg(f (x))kG ≤ kgkkf (x)kF ≤ kgkkf k,


d'où le résultat.

Dénition 1.3.8. Soient E et F deux espaces vectoriels normés sur K et f : E → F. On dit que f
est un isomorphisme (d'e.v.n.) si

(i) f ∈ L(E, F ) ;
(ii) il existe g ∈ L(F, E), tel que f ◦ g = IdF et g ◦ f = IdE .
Théorème 1.3.9 . Soient E et F deux espaces de Banach sur K et f ∈
. Si f est bijective alors f est un isomorphisme.
(Théorème de Banach)
L(E, F )
Dénition 1.3.10. Soient E et F deux espaces vectoriels normés sur K. Une application f : E → F
est dite une isométrie de E sur F si f est une bijection linéaire vériant kf (x)kF = kxkE , pour tout
x ∈ E.

Notons que la condition kf (x)kF = kxkE , pour tout x ∈ E, implique que f est injective.

Proposition 1.3.11. toute isométrie f : E → F est un isomorphisme.


Démonstration. La condition kf (x)kF = kxkE , pour tout x ∈ E , implique, d'après le Théorème
1.3.1, que f est continue, i.e. f ∈ L(E, F ). Les mêmes arguments montrent que f −1 ∈ L(E, F ), et par
suite f est un isomorphisme.

La réciproque de la proposition précédente n'est pas vraie. En eet, il sut de considérer une
homothétie x 7→ λx dans un espace vectoriel normé quelconque, où λ 6= 0, qui est toujours un
isomorphisme, mais n'est une isométrie que si |λ| = 1.
1.4. APPLICATIONS MULTINÉAIRES CONTINUES 9

1.4 Applications multinéaires continues


Dénition 1.4.1. Soient E1 , ...,En , F des espaces vectoriels normés sur K et E = E1 ×...×En , muni de
l'une des trois normes equivalentes de 3. des Exemples 1.2.6. Une application f : E = E1 ×...×En → F
est dite multilinéaire ou n-linéaire (bilinéaire si n = 2) si elle est linéaire par rapport à chacune
des variables.

On note par :

 L(E1 , ..., En ; F ) : l'ensemble des applications multilinéaires continues de E1 × ... × En vers F.


n
 Ln (G, F ) : l'ensemble des applications multilinéaires continues de G vers F , où G est un espace
vectoriel normé.

Théorème 1.4.2. Soient E , ...,E , F des espaces vectoriels normés sur K, E = E × ... × E
et f : E = E × ... × E → F une application multilinéaire. Alors les conditions suivantes sont
1 n 1 n

équivalentes :
1 n

1. f est continue sur E ;


2. f est continue en l'origine de E ;
3. ∃M > 0, kf (x , ..., x )k ≤ M kx k ...kx k , ∀(x , ..., x ) ∈ E.
1 n F 1 E1 n En 1 n

Démonstration. Identique à celle du Théorème 1.3.1.

Comme dans le cas des applications linéaires continues, on peut dénir une norme sur l'ensemble
L(E1 , ..., En ; F ) des applications multilinéaires continues de E1 × ... × En vers F, comme suit : si
f ∈ L(E1 , ..., En ; F ), alors la quantité

kf (x1 , ..., xn )kF


sup
xi ∈Ei \{0} kx1 kE1 ...kxn kEn

est nie et dénit une norme sur L(E1 , ..., En ; F ), qu'on note k k.

Proposition 1.4.3. Soient E , ...,E , F des espaces vectoriels normés sur K et E = E × ... × E .
1 n 1 n

1. Si F est complet alors (L(E , ..., E ; F ), k k) est complet.


1 n

2. Si E , ...,E sont de dimensions nies, alors toute application multilinéaires de E × ... × E


vers F est continue.
1 n 1 n

3. Si f ∈ L(E , ..., E ; F ), alors f n'est pas nécessairement uniformément continue.


1 n

Démonstration. Exercice.

Soit E un espace vectoriel normé sur K. On dénit l'application φ : L(K, E) → E , f 7→ f (1).

Proposition 1.4.4. L'application φ est une isométrie d'espaces vectoriels normés de L(K, E) sur E.
Démonstration. φ est clairement linéaire et bijective avec φ−1 (x) ∈ L(K, E) est déni par
φ−1 (x)(λ) = λx, pour tous λ∈K et x ∈ E. On a aussi, pour tout f ∈ L(K, E),

kf (λ)kE
kf k = sup = kf (1)kE = kφ(f )kE .
λ∈K\{0} |λ|

On en déduit que φ : L(K, E) → E est une isométrie qui permet d'identier les deux espaces.
10 CHAPITRE 1. ESPACES VECTORIELS NORMÉS- RAPPELS ET COMPLÉMENTS

Proposition 1.4.5. Soient E, F et G des espaces vectoriels normés sur K. L'application ϕ : L(E, L(F, G)) →
L(E, F ; G), dénie par ϕ(u)(x, y) = u(x)(y), pour tous u ∈ L(E, L(F, G)) et (x, y) ∈ E × F , est une
isométrie d'espaces vectoriels normés de L(E, L(F, G)) sur L(E, F ; G). Son inverse est l'application
ξ : L(E, F ; G) → L(E, L(F, G)), dénie par (ξ(v)(x))(y) = v(x, y), pour tous v ∈ L(E, F ; G) et
(x, y) ∈ E × F .

Démonstration. On va montrer d'abord que ϕ est bien dénie, i.e. ϕ(u) ∈ L(E, F ; G), pour
tout u ∈ L(E, L(F, G)). En eet, il est facile de vérier que ϕ(u) est bilinéaire. De plus, pour tout
(x, y) ∈ E × F , on a

kϕ(u)(x, y)kG = ku(x)(y)kG ≤ ku(x)kkykF ≤ kukL(E,L(F,G)) kxkE kykF ,

et par suite ϕ est continue, d'après le Théorème 1.4.2, i.e. ϕ(u) ∈ L(E, F ; G) et

(1.4.1) kϕ(u)kL(E,F ;G) ≤ kukL(E,L(F,G)) , pour tout u ∈ L(E, L(F, G)).

De même on montre facilement que si v ∈ L(E, F ; G) alors ξ(v) ∈ L(E, L(F, G)). En eet, pour
tous x, y on a
k(ξ(v)(x))(y)kG ≤ kvkL(E,F ;G) kxkE kykF
donc ξ(v)(x) ∈ L(F, G) et kξ(v)(x)kL(F,G) ≤ kvkL(E,F ;G) kxkE . Ainsi ξ(v) ∈ L(E, L(F, G)) et

(1.4.2) kξ(v)kL(E,L(F,G)) ≤ kvkL(E,F ;G) , pour tout v ∈ L(E, F ; G).

On vérie facilement que ϕ ◦ ξ = id et que ξ ◦ ϕ = id, ce qui prouve que ϕ est bien un isomorphisme
deL(E, L(F, G)) sur L(E, F ; G). Enn, pour montrer que ϕ est une isométrie, il reste à montrer que
kϕ(u)kL(E,F ;G) = kukL(E,L(F,G)) , pour tout u ∈ L(E, L(F, G)). On a déjà l'inégalité (1.4.1) et, pour
montrer l'inégalité inverse, on utilise (1.4.2) :

kukL(E,L(F,G)) = kψ ◦ ϕ(u)kL(E,L(F,G)) ≤ kϕ(u)kL(E,F ;G) .

Remarque .
1.4.6 Par induction sur n, on peut dénir l'application ϕn : L(E1 , L(E2 , ..., L(En , F ))..) →
L(E1 , ..., En ; F ) par ϕn (u)(x1 , ..., xn ) = ϕn−1 (u(x1 ))(x2 , ..., xn ), pour tous u ∈ L(E1 , L(E2 , ..., L(En , F ))..)
et (x1 , ..., xn ) ∈ E1 × ... × En , i.e. explicitement, on a

(1.4.3) ϕn (u)(x1 , ..., xn ) = (...(u(x1 )(x2 ))...)(xn ).

On peut montrer (Exercice) que l'application ϕn est une isométrie.

1.5 Algèbres normées


Dénition 1.5.1. On appelle algèbre normée sur K toute algèbre (A; +; ∗; .) sur K munie d'une
norme k kA telle que
kabkA ≤ kakA kbkA , ∀a, b ∈ A,
i.e., (a, b) ∈ A × A → ab ∈ A est bilinéaire continue de norme ≤ 1. Si A possède un élément unité 1A ,
on suppose de plus que k1A kA = 1.
A est dite algèbre de Banach si (A, k kA ) est complet.
Exemple 1.5.2. Soit E un espace vectoriel normé sur K. Alors A = L(E, E) = End(E), muni de la
loi ◦ et de sa norme, est une algèbre normée unitaire. De plus, si E est de Banach alors A l'est aussi.
1.5. ALGÈBRES NORMÉES 11

Rappels (séries dans un espace vectoriel normé) :

P
Soient E K et (xn ) une suite dans E . On dit que la
un espace vectoriel normé sur série x
Pn≥0 n
converge et a pour somme S si la suite ( nk=0
P
Pxk )n≥0 converge vers S . On dit que la série n≥0 xn
converge absolument si la série numérique n≥0 kxn kE converge.
PSi E est de Banach, alors toute série absolument convergente dans E est convergente. En eet,
n Pn
k k=m xk kE ≤ k=m kxk kE , pour tous n ≥ m ≥ 0.
Lemme 1.5.3. Soit A une algèbre de Banach unitaire. Alors, pour tout a ∈ A, la série P an
est
absolument convergente et sa somme est notée exp(a). n≥0 n!

kakn
Démonstration. Il sut de remarquer que kan kE ≤ kaknE
P
et que n≥0 n!
E
= exp(kakE ).

Lemme 1.5.4. Soient A une algèbre de Banach unitaire et a ∈ A tel que kak ≤1 . Alors 1 − a est
inversible dans A et (1 − a) = P a , où 1 est l'unité de A.
E
−1 n
n≥0

Démonstration. an est absolument n n


P
convergente puisque ka kE ≤ kakE et kakE ≤
P La série n
n≥0 P n
1. Si on pose b= n≥0 a , alors ab = ba = n≥1 a = b − 1. D'où b(1 − a) = (1 − a)b = 1.

Théorème 1.5.5. Soient A une algèbre de Banach unitaire et A l'ensemble des éléments inversibles

de A. Alors
(i) A est un ouvert de A.

(ii) l'application inversion a 7→ a est continue de A sur A .


−1 ∗ ∗

Démonstration.
(i) Soit a0 ∈ A∗ . Il sut de montrer que
1
BA (a0 , ka−1 k
) ⊂ A∗ . En eet, Soit a ∈ A tel que
0 A

ka − a0 kA < ka−1 k . On a donc ka−1


1 −1
0 a − 1kA ≤ ka − a0 kA ka0 kA < 1, d'où, d'après le Lemme
0 A
−1 −1
1.5.4, a0 a = 1 − (1 − a0 a) est inversible, et par suite a est inversible.

(ii) Soient a0 ∈ A et a ∈ BA (a0 ,
1
ka−1
) (⊂ A∗ ). On a
0 kA

a−1 − a−1
0 = (a
−1
a0 − 1)a−1
0 = [(1 − b)
−1
− 1]a−1
0 ,

où b = 1 − a−1
0 a avec kbkA < 1. Utilisant le Lemme 1.5.4, on obtient
X
a−1 − a−1
0 =( bn )a−1
0 ,
n≥1

et par suite
X kbA
ka−1 − a−1
0 kA ≤ ( kbknA )ka−1
0 kA = ka−1 kA .
1 − kbkA 0
n≥1

Or kbkA ≤ ka − a0 kA ka−1
0 kA , alors quand a −→ a0 , on a kbkA −→ 0 et a−1 −→ a−1
0 .

Corollaire 1.5.6. Soit E un espace de Banach sur K. Alors l'ensemble Isom(E, E) = GL(E) des
isomorphismes de E sur E est un ouvert de L(E, E). Si GL(E) est non vide, alors l'application
φ : GL(E) → GL(E), u 7→ u , est continue sur GL(E) (donc un homéomorphisme de GL(E) sur
−1

GL(E)).

Rappelons qu'un homéomorphisme entre deux espaces topologiques est une bijection bicontinue,
i.e. elle est continue et son application inverse est aussi continue.

Démonstration. D'apès le Théorème 1.3.5 et la Proposition 1.3.7, L(E, E) est un espace de


Banach. Utilisant le Théorème 1.5.5, on a le résultat.
12 CHAPITRE 1. ESPACES VECTORIELS NORMÉS- RAPPELS ET COMPLÉMENTS

Proposition 1.5.7. Soient E et F deux espaces de Banach. Alors l'ensemble Isom(E, F ) des isomor-
phismes de E sur F est un ouvert de L(E, F ). Si, de plus, Isom(E, F ) est non vide, alors l'application
ψ : Isom(E, F ) → Isom(F, E), u 7→ u , est un homéomorphisme de Isom(E, F ) sur Isom(F, E).
−1

Démonstration. Si Isom(E, F ) = ∅ alors c'est un ouvert. Sinon, soient w ∈ Isom(E, F ) et


α : L(E, F ) → L(E, E) et β : L(E, E) → L(F, E) les applications linéaires dénies par α(u) = w−1 ◦ u
−1 −1
et β(v) = v ∈ w , pour tous u ∈ L(E, F ) et v ∈ L(E, E). Il est facile de voir que kα(u)k ≤ kw kkuk
−1
et kα(v)k ≤ kw kkvk, de telle sorte que α et β soient continues (Théorème 1.3.1). Il est aussi facile
de vérier que α et β sont des isomorphismes d'espaces vectoriels normés. Puisque α(Isom(E, F )) =
GL(E) et β(GL(E)) = Isom(F, E), alors Isom(E, F ) est un ouvert de L(E, F ) et Isom(F, E) est un
ouvert de L(F, E).

Par ailleurs, l'application ψ peut s'écrire sous la forme ψ = β ◦ φ ◦ α, où φ est l'homéomorphisme


du Corollaire précédent. Ansi, ψ est composée de trois homéomorphismes et est, par conséquent, un
homéomorphisme.
Chapitre 2

Diérentiabilité  accroissement ni

Sommaire
2.1 Fonctions diérentiables  Diérentielle . . . . . . . . . . . . . . . . . . . 13
2.2 Les accroissements nis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Fonctions de classe C 1 et diérentielles partielles . . . . . . . . . . . . . 20

Dans tout le chapitre, on considère (E, k kE ) et (F, k kF ) deux espaces vectoriels normés sur K
(= R ou C) et f une fonction dénie sur un ouvert U de E à valeurs dans F .

2.1 Fonctions diérentiables  Diérentielle


Dénition 2.1.1. Soient f :U →F et x0 ∈ U . On dit que f est diérentiable en x0 s'il existe
L ∈ L(E, F ) telle que

∀ε > 0, ∃η > 0, ∀h ∈ E, khkE < η =⇒ kf (x0 + h) − f (x0 ) − L(h)kF < εkhkE .


De façon équivalente, f est diérentiable en x0 s'il existe L ∈ L(E, F ) telle que

1
(2.1.1) lim (f (x0 + h) − f (x0 ) − L(h)) = 0.
h→0E khkE
On écrira encore f (x0 + h) = f (x0 ) + L(h) + o(h).
Remarque 2.1.2 . Puisque x0 ∈ U qui est ouvert, la fonction h 7→ f (x0 + h) est bien dénie sur un
voisinage de 0, i.e. pour khkE est assez petite.
Proposition 2.1.3. Soient f : U → F et x ∈ U . Si f est diérentiable en x alors l'application L
est unique. Elle est appelée diérentielle de f en x et est notée Df (x ), ou encore df (x ), df
0 0

ou Df .
0 0 0 x0
x0

Démonstration. Soient L1 et L2 dans L(E, F ) telles que

1 1
lim (f (x0 + h) − f (x0 ) − L1 (h)) = lim (f (x0 + h) − f (x0 ) − L2 (h)) = 0.
h→0E khkE h→0 E khkE

Par diérence on a donc lim 1 (L1 (h) − L2 (h)) = 0. Soit x∈E non nul. On a xn := 1
−→
n x n→+∞ 0
h→0E khkE
et donc

1 1 1
0 = lim (L1 (h) − L2 (h)) = lim (L1 (xn ) − L2 (xn )) = (L1 (x) − L2 (x)),
h→0E khkE n→+∞ kxn kE kxkE

13
14 CHAPITRE 2. DIFFÉRENTIABILITÉ  ACCROISSEMENT FINI

i.e. L1 (x) = L2 (x).

Remarque 2.1.4 . La notion de diérentiabilité (et de diérentielle) fait intervenir la notion de limite.
Tout comme pour la continuité, elle dépend donc du choix des normes sur E et sur F. Lorsqu'il
peut y avoir ambiguïté sur le choix de celle(s)-ci on précisera bien pour quelle norme la fonction est
diérentiable.

Dénition 2.1.5. Soit f : U → R. On dit que f est diérentiable sur U si f est diérentiable en
tout x0 ∈ U . On appelle alors diérentielle de f l'application

Df : U → L(E, F )
x 7→ Df (x).

f est diérentiable, la diérentielle Df (x0 ) de f en chaque point x0 ∈ U est une application


Lorsque
linéaire de E dans F (alors que f est dénie sur un ouvert U ⊂ E à valeurs dans F ), et la diérentielle
de f est l'application dénie sur U qui à x0 ∈ U associe Df (x0 ) ∈ L(E, F ). On fera également bien
attention au fait que dans la dénition de diérentiabilité on impose à l'application linéaire L d'être
continue. La raison est simplement qu'on souhaite avoir

Proposition 2.1.6. Soit f : U → F et x ∈U . Si f est diérentiable en x alors f est continue en


.
0 0
x0

Démonstration. Si xn −→ x0 , en écrivant f (xn ) = f (x0 ) + Df (x0 )(xn − x0 ) + o(xn − x0 ), on


n→+∞
a immédiatement f (xn ) −→ f (x0 ) et donc la continuité de f en x0 .
n→+∞

Remarques 2.1.7 . 1. Si on avait f (x0 + h) = f (x0 ) + L(h) + o(h) avec L qui n'est pas continue, en
particulier elle ne serait pas continue en 0 et donc f ne serait pas continue en x0 . Mais, si E
est de dimension nie alors, d'après la Proposition 1.3.2, L est d'oce continue, ce qui simplie
l'étude de la diérentiabilité.

2. Lorsque E = R (resp. Rn ) et F = R, on retrouve évidemment les notions de fonctions dérivables


(resp. diérentiables), telles que vue auparavant. (Dans ces deux cas on est en dimension nie
donc toutes les normes sont équivalentes et toutes les applications linéaires sont continues.)

3. Si E=R et F est un espace vectoriel normé quelconque, alors tout élément L ∈ L(E, F ) est de
la forme x 7→ x` où ` ∈ F . En eet, si on pose L(1) = `, alors L(x) = xL(1) = x`, pour tout
x ∈ R. La fonction f est donc diérentiable en x0 s'il existe ` ∈ F tel que

1 f (x0 + h) − f (x0 )
lim (f (x0 + h) − f (x0 ) − `h) = 0 ⇐⇒ lim =`
h→0 |h| h→0 h

ce qui est précisément la dénition de dérivabilité en x0 , dans le cas où E = F = R. Par


abus de langage, on étendra cette dénition de dérivabilité au cas où F est un espace vectoriel
normé quelconque, en disant que f : R → F est dérivable en
x0 s'il existe ` ∈ F tel que
lim f (x0 +h)−f (x0 )
h = ` 0
, et on note ` = f (x0 ), qu'on appelle f dérivée de
x0 . Ainsi f : R → F en
h→0
est diérentiable en un point x0 ∈ R si et seulement si elle dérivable en x0 . On fera juste
0
attention au fait que ` = f (x0 ) est le vecteur dérivé de f en x0 tandis que Df (x0 ) ∈ L(R, R)
0
est l'application h 7→ hf (x0 ).

4. E = Rn et F = R. La dénition classique de la diérentiabilité dans ce cas est la suivante : f


est diérentiable en a = (a1 , ..., an ) si toutes les dérivées partielles de f au point a existent et si

n
!
1 X ∂f
lim f (a + h) − f (a) − (a)hi = 0.
h→0 khk ∂xi
i=1
2.1. FONCTIONS DIFFÉRENTIABLES  DIFFÉRENTIELLE 15

Si f vérie
Pnla propriété ci-dessus, alors elle est diérentiable au sens de la Dénition 2.1.1, avec
∂f
L(h) := i=1 ∂x i
(a)h i . Inversement, si f est diérentiable au sens de la Dénition 2.1.1, en
prenant h = (0, ..., 0, hi , 0, ..., 0) on en déduit que f admet une dérivée partielle par rapport à la
∂f
i-ème variable en a, avec ∂x i
(a) = Df (a)(ei ), puis que
n
!
1 X ∂f 1
f (a + h) − f (a) − (a)hi = (f (a + h) − f (a) − Df (a)(h)) −→ 0.
khk i=1
∂xi khk h→0

Pn ∂f
En particulier Df (a)(h) = i=1 ∂xi (a)hi .

Dans Rn , le calcul des dérivées partielles nous donne le candidat pour la diérentielle si f est
diérentiable. Pour un espace E général, la Dénition 2.1.1 semble dicile à appliquer puisqu'il faut
trouver une application linéaire continue L qui satisfasse (2.1.1). La notion suivante généralise celle
de dérivée partielle et sera utile dans la pratique pour trouver l'application linéaire L candidate à être
la diérentielle (voir Exemple 2.1.12).

Dénition 2.1.8. Soient f : U → F , x0 ∈ U et v ∈ E . On dit que f est dérivable en x0 dans


la direction v si la fonction d'une variable réelle fv : t 7→ f (x0 + tv), dénie au voisinage de 0, est
dérivable en 0.

Remarque .
E = Rn , F = R et (e1 , ..., en ) désigne la base canonique de Rn , dire que f est
2.1.9 Si
dérivable en x0 dans la direction ei signie que f admet une dérivée partielle par rapport à la i-ème
variable en x0 .

Proposition 2.1.10. Si f : U → F , x ∈ U et f est diérentiable en x , alors f est dérivable en x


dans n'importe quelle direction v et on a f (0) = Df (x )(v).
0 0 0
0
v 0

Démonstration. Puisque f est diérentiable en x0 , pour t assez petit on a

f (x0 + tv) = f (x0 ) + Df (x0 )(tv) + o(tv) = f (x0 ) + tDf (x0 )(v) + o(t)
fv (t)−fv (0)
et donc
t − Df (x0 )(v) = o(1) −→ 0.
t→0

Remarque 2.1.11 . Une fonction peut être dérivable en un point x0 dans toutes les directions sans être
2
diérentiable. Par exemple, Soit
2
f : R → R dénie par f (x, y) = yx si x 6= 0 et f (0, y) = 0. On peut
montrer que f est dérivable en (0, 0) dans toutes les directions mais qu'elle n'y est pas diérentiable
(Exercice).

Dans la pratique, pour voir si une fonction est diérentiable en x0 et calculer Df (x0 ) on pourra
suivre le schéma suivant :

1. Etant donné v ∈ E, montrer que f est dérivable dans la direction v en x0 , i.e. fv0 (0) existe. (Si
f est diérentiable elle doit être dérivable dans toutes les directions.)

2. Montrer que l'application L : v 7→ fv0 (0) est linéaire continue. (Si f est diérentiable on doit
0
avoir fv (0) = Df (x0 )(v)).
3. Montrer que f (x0 + h) − f (x0 ) − L(h) = o(h).

Exemple 2.1.12. Soitf : Mn (R) 3 M 7→ M 2 ∈ Mn (R). On veut montrer que f est diérentiable
sur Mn (R) et calculer Df (M ). On est en dimension nie donc toutes les normes sont équivalentes et
la diérentiabilité de f ne dépendra de la norme choisie. An d'avoir le maximum de propriétés on
munit Mn (R)Pd'une norme d'application linéaire (on parlera aussi de norme matricielle), par exemple
n
kM k = maxj i=1 |mij |, pour M = (mij ) (c'est la norme application linéaire associée à la norme k k1
n
sur R ). L'avantage de choisir une norme de ce type est qu'en plus de l'inégalité triangulaire on a aussi
la propriété de norme d'algèbre : si M, N ∈ Mn (R) on a kM N k ≤ kM k × kN k. Soit M ∈ Mn (R),
pour étudier la diérentiabilité de f en M on va suivre le schéma ci-dessus.
16 CHAPITRE 2. DIFFÉRENTIABILITÉ  ACCROISSEMENT FINI

1. Pour H ∈ Mn (R), on étudie la dérivabilité en t=0 de fH (t) = (M + tH)2 . On a

1 1
(fH (t) − fH (0)) = (M 2 + tM H + tHM + t2 H 2 − M 2) = M H + HM + tH 2 −→ M H + HM.
t t t→0

2. Soit L : Mn (R) → Mn (R) dénie par L(H) = M H + HM . On vérie facilement que L est une
application linéaire. Par ailleurs, Mn (R) est de dimension nie donc L est continue.
3. On regarde si f (M + H) − f (M ) − L(H) = o(H). On a

1 kHk2
k(M + H)2 − M 2 − L(H)k = = kHk −→ 0.
kHk kHk H→0

On voit sur ce dernier calcul l'avantage d'avoir utilisé une norme d'application linéaire. En conclusion,
f est diérentiable en M et Df (M ) : H 7→ M H + HM .

On a bien sûr les propriétés usuelles de somme et de composition pour les fonctions diérentiables
sur des espaces vectoriels normés quelconques.

Proposition 2.1.13. Soient f, g : U → F et x ∈ U . Si f et g sont diérentiables en x alors f + g


aussi et on a D(f + g)(x ) = Df (x ) + Dg(x ).
0 0
0 0 0

Démonstration. Exercice.

Proposition 2.1.14. Soient U ⊂ E , V ⊂ F des ouverts, f : U → F telle que f (U ) ⊂ V , g : V → G


et x ∈ U . Si f est diérentiable en x et g est diérentiable en f (x ), alors la fonction g ◦ f : U → G
est diérentiable en x et on a D(g ◦ f )(x ) = Dg(f (x )) ◦ Df (x ).
0 0 0
0 0 0 0

Démonstration. Les applications linéaires Df (x0 ) : E → F et Dg(f (x0 )) : F → G sont continues


donc l'application linéaire Dg(f (x0 )) ◦ Df (x0 ) : E → G aussi. Il sut donc de montrer que

(g ◦ f )(x0 + h) − (g ◦ f )(x0 ) − (Dg(f (x0 )) ◦ Df (x0 ))(h) = o(h).

Puisque f est diérentiable en x0 on a h0 := f (x0 + h) − f (x0 ) = Df (x0 )(h) + khkε1 (h) avec ε1 (h) → 0
lorsque h → 0. On notera que

(2.1.2) kh0 k ≤ khk(kDf (x0 )k + kε1 (h)k),

et en particulier h0 → 0 lorsque h → 0.
Par ailleurs g est diérentiable en f (x0 ) donc

(g ◦ f )(x0 + h) =g(f (x0 ) + h0 )


=(g ◦ f )(x0 ) + Dg(f (x0 ))(h0 ) + kh0 kε2 (h0 )
=(g ◦ f )(x0 ) + (Dg(f (x0 )) ◦ Df (x0 ))(h) + khkDg(f (x0 ))(ε1 (h)) + kh0 kε2 (h0 ),

où lim h0 → 0ε2 (h0 ) = 0. Il reste donc à montrer que khkDg(f (x0 ))(ε1 (h)) + kh0 kε2 (h0 ) = o(h). On a,
en utilisant (2.1.2)

khkDg(f (x0 ))(ε1 (h)) + kh0 kε2 (h0 )


≤ kDg(f (x0 ))k.kε1 (h)k + (kDf (x0 )k + kε1 (h)k)kε2 (h0 )k.
khk

Puisque ε1 et ε2 tendent vers 0 en 0 et que h0 → 0 lorsque h → 0, le membre de droite tend vers 0


quand h → 0, ce qui prouve le résultat.
2.2. LES ACCROISSEMENTS FINIS 17

On termine cette section avec deux cas particuliers de diérentiabilité, celle des applications li-
néaires et celle de l'application inversion des isomorphismes linéaires.

Proposition 2.1.15. Soit f ∈ L(E, F ), alors f est diérentiable sur E et pour tout x ∈E on a
.
0
Df (x0 ) = f

Démonstration. Puisque f ∈ L(E, F ), il sut de montrer que pour tout x0 on a f (x0 + h) −


f (x0 )−f (h) = o(h) lorsque h → 0. C'est immédiat puisque f est linéaire et f (x0 +h)−f (x0 )−f (h) = 0.

Théorème 2.1.16. Soient E et F deux espaces de Banach tels que l'ensemble Isom(E, F ) des isomor-
phismes est non vide et ψ : Isom(E, F ) → L(E, F ) l'application u 7→ u . Alors ψ est diérentiable
−1

et sa diérentielle est donnée par


(2.1.3) Dψ(u)(h) = −u−1 ◦ h ◦ u−1 , pour tout h ∈ L(E, F ).

Démonstration. Soit u ∈ Isom(E, F ). L : h 7→ −u−1 ◦ h ◦ u−1 est visiblement


L'application
−1 2
linéaire et vérie, d'après la Proposition 1.3.7, kL(h)k ≤ ku k khk, de telle sorte que L soit continue,
−1 −1
i.e. L ∈ L(E, F ). Par ailleurs, pour tout h ∈ B(u; ku k ), on a u + h soit inversible. En eet, on a
u+h = u◦(I +u−1 ◦h), et puisque u est inversible, u+h est aussi inversible si et seulement si I +u−1 ◦h
−1
l'est. D'après le Lemme 1.5.4 c'est le cas dès que ku ◦ hk < 1. Comme ku−1 ◦ hk ≤ ku−1 kkhk, on en
−1 −1
déduit que si khk < ku k alors u + h est inversible. De plus, on a

ϕ(u + h) − ϕ(u) + u−1 ◦ h ◦ u−1 =(u + h)−1 − u−1 + u−1 ◦ h ◦ u−1


=(I + u−1 ◦ h)−1 u−1 − u−1 + u−1 ◦ h ◦ u−1
 
X
=  (−u−1 ◦ h)k  u−1 − u−1 + u−1 ◦ h ◦ u−1
k≥0
X
= (−u−1 ◦ h)k u−1 ,
k≥2

où on a utilisé le Lemme 1.5.4 pour passer de la deuxième à la troisième ligne. Ainsi

X ku−1 k3 khk2
kϕ(u + h) − ϕ(u) + u−1 ◦ h ◦ u−1 k ≤ ku−1 kk+1 khkk = ,
1 − ku−1 kkhk
k≥2

et donc ϕ(u + h) − ϕ(u) + u−1 ◦ h ◦ u−1 = o(h).

En identiant Mn (R) et L(Rn , Rn ) (une matrice A est associée à l'application linéaire dont elle
est la matrice représentative dans la base canonique) et en prenant sur Mn (R) une norme matricielle,
on obtient le corollaire suivant :

Corollaire 2.1.17.L'application f : GL (R) 3 A → A ∈ M (R) est diérentiable et pour tous


−1

A ∈ GL (R) et H ∈ M (R), on a Df (A)(H) = −A HA .


n n
−1 −1
n n

2.2 Les accroissements nis


On rappelle le Théorème des accroissements nis pour les fonctions de R dans R.
Théorème 2.2.1. Soit f : [a, b] → R continue sur [a, b], dérivable sur ]a, b[. Alors il existe c ∈]a, b[
tel que f (b) − f (a) = f (c)(b − a).
0
18 CHAPITRE 2. DIFFÉRENTIABILITÉ  ACCROISSEMENT FINI

L'inégalité des accroissements nis en découle alors directement

Théorème 2.2.2. Soient un intervalle et f : I → R dérivable. Alors pour tous a, b ∈ I on a


.
I
|f (b) − f (a)| ≤ supx∈I |f 0 (x)| × |b − a|

Pour rappel, ces théorèmes sont fondamentaux dans l'étude des fonctions d'une variable. Par
exemple, le fait qu'une fonction dont la dérivée est nulle (resp. positive/négative) sur un intervalle soit
constante (resp. croissante/décroissante) en est une conséquence. Il est donc naturel de se demander ce
que deviennent ces théorèmes pour des fonctions d'un espace vectoriel normé dans un espace vectoriel
normé. On va commencer par le résultat général suivant

Théorème 2.2.3. Soient [a, b] ⊂ R, F un espace vectoriel normé et f : [a, b] → F et g : [a, b] → R


deux applications continues sur [a, b] et diérentiables sur ]a, b[. Si kf (t)k ≤ g (t), pour tout t ∈]a, b[,
0 0

alors kf (b) − f (a)k ≤ g(b) − g(a).


F
F

Démonstration. Remarquons tout d'abord que puisque kf 0 (t)kF ≤ g 0 (t), pour tout t ∈ [a, b],
0
alors g (t) ≥ 0, pour tout t ∈ [a, b], et par suite g est croissante. Soit ε > 0. On dénit le sous-ensemble
de [a, b]

A(ε) := {x ∈ [a, b]| ∀y ∈ [a, x], kf (y) − f (a)kF ≤ g(y) − g(a) + ε(y − a)}.
a ∈ A(ε) et que si x ∈ A(ε) et x̄ ∈ [a, x], alors x̄ ∈ A(ε), ce qui veut dire que A(ε) est un
Il est clair que
intervalle. Soitc = sup A(ε) et on va montrer que c ∈ A(ε). Si c = a alors on n'a rien à démontrer. Par
suite, on va supposer que c 6= a. Si x ∈]a, c[, alors x ∈ A(ε), i.e. kf (x)−f (a)kF ≤ g(x)−g(a)+ε(x−a).
Quand x −→ c, on obtient, par continuité de f et g , l'inégalité kf (c) − f (a)kF ≤ g(c) − g(a) + ε(c − a),
i.e. c ∈ A(ε).

An de compléter la preuve, on va montrer maintenant que c = b. On raisonne par l'absurde. Si


c < b, pour tout h>0 tel que c+h<b on a

f (c + h) − f (c) = f 0 (c)h + o1 (h); g(c + h) − g(c) = g 0 (c)h + o2 (h).

On en déduit, en utilisant l'hypothèse kf 0 (c)kF ≤ g 0 (c), que

kf (c + h) − f (c)kF =kf 0 (c)h + o1 (h)kF ≤ kf 0 (c)kF h + o1 (h) ≤ g 0 (c) + o1 (h)


≤g(c + h) − g(c) − o2 (h) + o1 (h) = g(c + h) − g(c) − o(h).

Il en découle qu'il existe η ∈]0, b − c[ tel que ∀0 ≤ h ≤ η , kf (c + h) − f (c)k ≤ g(c + h) − g(c) + εh. On
en déduit que c + h ∈ A(ε), pour tout 0 ≤ h ≤ η , ce qui centredit le fait que c = sup A(ε). On conclut
que c = b, ce qui achève la démonstration.

Théorème 2.2.4. Soit f : [a, b] → F une fonction diérentiable, alors kf (b)−f (a)k ≤ sup kf 0 (x)kF ×
(b − a) . x∈I

Démonstration. Il sut d'appliquer le Théorème 2.2.3, en considérant la fonction g : [a, b] → R


dénie par g(t) = supx∈I kf 0 (x)kF t.

kDf (x)(h)kF khf 0 (x)kF


Notons que kDf (x)k = suph6=0 |h| = suph6=0 |h| = kf 0 (x)kF .

Corollaire 2.2.5 . Soient U un ouvert de E et f : U → F


diérentiable sur U , alors pour tous a, b ∈ U tels que [a, b] ⊂ U on a
(Inégalité des accroissements nis)

kf (b) − f (a)kF ≤ sup kDf (x)k × kb − akE .


x∈[a,b]
2.2. LES ACCROISSEMENTS FINIS 19

Démonstration. Soit g : [0, 1] → F dénie par g(t) = f ((1 − t)a + tb). La fonction g est diéren-
tiable (dérivable) et Dg(t)(h) = Df ((1 − t)a + tb)(b − a)h. D'où
kDg(t)k = kDf ((1 − t)a + tb)(b − a)k ≤ kDf ((1 − t)a + tb)k × kb − akE ≤ sup kDf (x)k × kb − akE .
x∈[a,b]

D'après le Théorème 2.2.4 on a donc

kf (b) − f (a)kF = kg(1) − g(0)kF ≤ sup kDg(t)k × sup kDf (x)kkb − akE .
t∈[0,1] x∈[a,b]

En appliquant le corollaire à la fonction g(x) := f (x) − Df (a)(x − a), dont la diérentielle est
Dg(x) = Df (x) − Df (a) on obtient

Corollaire 2.2.6. Soit U un ouvert de E et f : U → F diérentiable sur U , alors pour tous a, b ∈ U


tels que [a, b] ⊂ U on a
kf (b) − f (a) − Df (a)(b − a)kF ≤ sup kDf (x) − Df (a)k × kb − akE .
x∈[a,b]

Si la fonction f est à valeurs dans un espace vectoriel normé quelconque, on voit donc que l'inégalité
des accroissements nis est toujours vraie. Par contre le Théorème 2.2.1 ne l'est plus, dans le sens où
il n'existe pas forcément c ∈ [a, b] tel que f (b) − f (a) = Df (c)(b − a). Il reste vrai si f est dénie sur
un espace vectoriel normé et à valeurs réelles.

Proposition 2.2.7. Soient U un ouvert de E et f : U → R diérentiable sur U , alors pour tous


a, b ∈ U tels que [a, b] ⊂ U il existe c ∈]a, b[ tel que f (b) − f (a) = Df (c)(b − a).
Démonstration. Comme dans le corollaire précédent on se ramène en fait aux fonctions de
R dans R. Soit g : [0, 1] → R dénie par g(t) = f ((1 − t)a + tb). La fonction g est dérivable et
g 0 (t) = Df ((1 − t)a + tb)(b − a). D'après le Théorème 2.2.1 il existe s ∈]0, 1[ tel que g(1) − g(0) = g 0 (s),
i.e. f (b) − f (a) = Df (c)(b − a) avec c = (1 − s)a + sb.

Exemple 2.2.8. f : [0, 2π] → C dénie par f (t) = eit . La fonction f est diérentiable et on a
Soit
it
Df (t)(h) = ie h d'où kDf (t)k = 1 pour tout t. On peut vérier qu'on a bien |f (t) − f (s)| ≤ t − s
pour tous 0 ≤ s ≤ t ≤ 2π .

Par contre le théorème 2.2.1 n'est plus vrai ! En eet, f (2π) − f (0) = 0 mais pour tout t ∈ [0, 2π]
on a Df (t)(2π) = 2iπeit 6= 0.

Une conséquence importante de l'inégalité des accroissements nis est la suivante. On rappelle
qu'un ensemble U est convexe si pour tous a, b ∈ U on a [a, b] ⊂ U .
Proposition 2.2.9. Soit U ⊂ E un ouvert convexe et f : U → F diérentiable. Alors Df ≡ 0 si et
seulement si f est constante.
La notation Df ≡ 0 signie que pour tout x∈U on a Df (x) = 0, i.e. Df (x) est l'application
linéaire de E dans F constante égale à 0.

Démonstration. Si f est constante on montre facilement que Df ≡ 0. Réciproquement, soient


a, b ∈ U , on a [a, b] ⊂ U et donc

kf (b) − f (a)kF ≤ sup kDf (x)k × kb − akE = 0.


x∈[a,b]

La fonction f prend alors la même valeur en deux points quelconques de U et elle est, par suite,
constante.
20 CHAPITRE 2. DIFFÉRENTIABILITÉ  ACCROISSEMENT FINI

On rappelle la dénition de maximum/minimum local d'une fonction à valeurs réelles.

Dénition 2.2.10. f : U → R. On dit que f possède un minimum (resp. maximum) local en


Soit
x0 V de x0 tel que pour tout x ∈ V on ait f (x) ≥ f (x0 ) (resp. f (x) ≤ f (x0 )).
s'il existe un voisinage
De façon équivalente, il existe ε > 0 tel que si kx − x0 k < ε alors f (x) ≥ f (x0 ) (resp. f (x) ≤ f (x0 )).
Dans chacun des cas, on dit que f possède un extremum local en x0 .

Proposition 2.2.11. Soit f : U → R. Si f possède un extremum local en x ∈ U alors Df (x ) = 0,


i.e. c'est l'application nulle de E dans R (on dit que x est un point critique de f ).
0 0
0

Démonstration. Soit h ∈ E . La fonction g(t) := f (x0 +th) dénie au voisinage de t = 0 admet un


extremum local en 0 et y est dérivable donc g 0 (0) = 0. Or g 0 (0) = Df (x0 )(h). On a donc Df (x0 )(h) = 0
pour tout h ∈ E, i.e. Df (x0 ) = 0.
Remarque 2.2.12. Si E = Rn alors Df (x0 ) = 0 si et seulement si toutes les dérivées partielles de f
s'annulent en x0 .

2.3 Fonctions de classe C 1 et diérentielles partielles


f est une fonction diérentiable sur un ouvert U , sa diérentielle Df est une application dénie
Si
surU ⊂ E et à valeurs dans L(E, F ). Muni de k k, ce dernier est un espace vectoriel normé, on peut
donc s'intéresser à la continuité (ou à la diérentiabilité de Df , voir Section 3.1).

Dénition 2.3.1. Soit f :U →F une application diérentiable. On dira que f est de classe C 1 si
Df : U → L(E, F ) est continue.

Tout comme pour la continuité et la diérentiabilité, la somme et la composée de fonctions de


classe C1 est aussi de classe C 1.
Exemple 2.3.2. f (M ) = M 2 est diérentiable sur Mn (R)
On continue l'Exemple 2.1.12. La fonction
et sa diérentielle au point M est Df (M ) : H →
7 M H + HM . Soit M ∈ Mn (R) et (Mk )k une suite
de Mn (R) telle que Mk → M dans Mn (R). On a

kDf (Mk ) − Df (M )k = sup k(Df (Mk ) − Df (M ))(H)k


H∈Mn (R),kHk=1

= sup kMk H + HMk − M H − HM k


H∈Mn (R),kHk=1

≤ sup k(Mk − M )Hk + kH(Mk − M )k


H∈Mn (R),kHk=1

≤ sup 2kMk − M kkHk


H∈Mn (R),kHk=1

≤2kMk − M k,
et donc Df (Mk ) → Df (M ), quand k → +∞, dans L(Mn (R)), ce qui prouve que Df est continue en
M. La fonction f est bien de classe C 1 .

Lorsque E1 , ..., En sont des espaces vectoriels normés, U ⊂ E := E1 × ... × En et f :U →F on a


une notion de diérentielle partielle comme on a des dérivées partielles pour les fonctions dénies sur
Rn . Celle-ci jouera un rôle important dans le Théorème des fonctions implicites.

Dénition 2.3.3. Soient U ⊂ E = E1 × ... × En , f : U → F et x = (x1 , ..., xn ) ∈ U . On dit


que f admet une diérentielle partielle en x par rapport à la i-ème variable si l'application
fi (y) := f (x1 , ..., xi−1 , y, xi+1 , ..., xn ) dénie au voisinage de xi ∈ Ei est diérentiable au point xi . On
note Di f (x) = Dfi (xi ) ∈ L(Ei , F ) sa diérentielle et elle est appelée diérentielle partielle de f
en x par rapport à la i-ème variable.
2.3. FONCTIONS DE CLASSE C 1 ET DIFFÉRENTIELLES PARTIELLES 21

Proposition 2.3.4. Soient U ⊂ E = E × ... × E , f : U → F et x = (x , ..., x ) ∈ U . Si f est


diérentiable en x alors f admet une diérentielle partielle en x par rapport à chacune des variables
1 n 1 n

et on a D f (x)(h ) = Df (x)(0, ..., 0, h , 0, ..., 0).


i i i

Démonstration. L'application hi 7→ Df (x)(0, ..., 0, hi , 0, ..., 0) est clairement linéaire continue.


Par ailleurs, en notant h = (0, ..., 0, hi , 0, ..., 0) on a
fi (xi + hi ) − fi (xi ) − Df (x)(0, ..., 0, hi , 0, ..., 0) = f (x + h) − f (x) − Df (x)(h) = o(h) = o(hi ).

Tout comme l'existence de dérivées partielles n'entraine pas la diérentiabilité dans Rn , l'existence
n
de diérentielle partielle par rapport à chacune des variables n'entraine pas la diérentiabilité (R
est le cas particulier où E1 = ... = En = R), i.e. la réciproque de la proposition ci-dessus est fausse.
Cependant, si on suppose qu'en plus les diérentielles partielles sont continues on a alors

Proposition 2.3.5. Si f admet une diérentielle partielle par rapport à chaque variable et si pour
tout i l'application U 3 x 7→ D f (x) ∈ L(E , F ) est continue, alors f est de classe C .
i i
1

Démonstration. On fait la démonstration dans le cas de f : E1 × E2 → F . On commence par


montrer que f est diérentiable. Soientx = (x1 , x2 ) et V1 × V2 un voisinage ouvert convexe de x dans
U , de telle sorte que, pour tout h = (h1 , h2 ) tel que x + h ∈ V1 × V2 , on a [xi , xi + hi ] ⊂ Vi , pour
i = 1, 2. On dénit les fonctions fi : Vi → F dénies par f1 (y1 ) := f (y1 , x2 + h2 ) − D1 f (x)(y1 ) et
f2 (y2 ) := f (x1 , y2 ) − D2 f (x)(y2 ), et on applique ensuite l'inégalité des accroissements nis à f1 entre
x1 et x1 + h1 et à f2 entre x2 et x2 + h2 (ces fonctions sont bien diérentiables et même de classe C 1
et on a aussi [xi , xi + hi ] ⊂ Vi , pour i = 1, 2). On a

Df1 (y1 )(k1 ) = D1 f (y1 , x2 + h2 )(k1 ) − D1 f (x)(k1 ) et Df2 (y2 )(k2 ) = D2 f (x1 , y2 )(k2 ) − D2 f (x)(k2 ),
d'où

kf (x + h) − f (x) − D1 f (x)(h1 ) − D2 f (x)(h2 )k


≤kf (x + h) − f (x1 , x2 + h2 ) − D1 f (x)(h1 )k + kf (x1 , x2 + h2 ) − f (x) − D2 f (x)(h2 )k
≤ sup kD1 f (y1 , x2 + h2 ) − D1 f (x1 , x2 )k.kh1 k
y1 ∈[x1 ,x1 +h1 ]

+ sup kD2 f (x1 , y2 ) − D2 f (x1 , x2 )k × kh2 k.


y2 ∈[x2 ,x2 +h2 ]

Puisque D1 f et D2 f sont continues en x, on en déduit que f (x+h)−f (x)−D1 f (x)(h1 )−D2 f (x)(h2 ) =
o(h). Comme l'application

h = (h1 , h2 ) 7→ D1 f (x)(h1 ) + D2 f (x)(h2 )


est linéaire continue, cela prouve que f est diérentiable en x avec Df (x)(h) = D1 f (x)(h1 ) +
D2 f (x)(h2 ). La continuité de D1 f et D2 f entraine nalement celle de Df .

Proposition 2.3.6. Soit f : E1 × ... × En → F une application n-linéaire continue. Alors f est
diérentiable sur E 1 × ... × En et
n
X
Df (x1 , ..., xn )(h1 , ..., hn ) = f (x1 , ..., xi−1 , hi , xi+1 , ..., xn ).
i=1

En particulier, f admet des diérentielles partielles par rapport à chaque variable et


Di f (x)(hi ) = f (x1 , ..., xi−1 , hi , xi+1 , ..., x) .

Démonstration. Exercice.
22 CHAPITRE 2. DIFFÉRENTIABILITÉ  ACCROISSEMENT FINI
Chapitre 3

Diérentielles d'ordre supérieur


Formules de Taylor

Sommaire
3.1 Diérentielle seconde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1.1 Cas des fonctions de Rn dans R . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1.2 Théorème de Schwarz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.1.3 Formule de Taylor à l'ordre 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.2 Extremas d'une fonction réelle . . . . . . . . . . . . . . . . . . . . . . . . 26


3.3 Diérentielles d'ordres supérieurs . . . . . . . . . . . . . . . . . . . . . . 28
3.4 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.1 Intégration des fonctions à valeurs dans un espace de Banach . . . . . . . . 31

3.4.2 Formules de Taylor dans le cas E=R . . . . . . . . . . . . . . . . . . . . . 33

3.4.3 Formules de Taylor dans le cas général . . . . . . . . . . . . . . . . . . . . . 34

Comme dans le chapitre précédent, dans tout le chapitre, on considère (E, k kE ) et (F, k kF ) deux
espaces vectoriels normés sur K (= R ou C) et f une fonction dénie sur un ouvert U deE à valeurs
dans F.

3.1 Diérentielle seconde


Dénition 3.1.1. Soit f : U → F une application diérentiable. On dira que f est deux fois
diérentiable si Df : U → L(E, F ) est diérentiable. La diérentielle de Df au point x ∈ U est
appelée diérentielle seconde de f au point x, c'est un élément de L(E, L(E, F )) et elle est notée
D2 f (x).

Comme précédemment, la somme et la composée de fonctions deux fois diérentiables est aussi deux
fois diérentiable. Il ne semble pas forcément évident de manipuler un objet tel que la diérentielle
seconde : c'est une application linéaire (continue) dénie sur E mais à valeurs dans l'espace des
applications linéaires (continues) deE dans F . La proposition 1.4.5 permet en fait d'identier cet
espace avec celuiL2 (E, F ) des applications bilinéaires (continues) de E dans F , via l'sométrie ϕ :
L(E, L(E, F )) → L2 (E, F ) dénie par

(3.1.1) (ϕ(u))(x, y) := (u(x))(y), pour tous u ∈ L(E, L(E, F )), (x, y) ∈ E 2 .

23
24 CHAPITRE 3. DIFFÉRENTIELLES D'ORDRE SUPÉRIEUR FORMULES DE TAYLOR

L'isométrie inverse ϕ−1 : L2 (E, F ) → L(E, L(E, F )) est donée par

(ϕ−1 (v)(x))(y) := v(x, y), pour tous v ∈ L2 (E, F ), (x, y) ∈ E 2 .

Selon l'identication (3.1.1), on a D2 f (x)(h, k) ∼


= D2 f (x)(h)(k).

Exemple 3.1.2. f : Mn (R) → R dénie par f (A) = Tr(A3 ). On montre alors


Soit que pour tout A,
2
Df (A) : K →
7 3Tr(A K). Pour calculer la diérentielle seconde de f en A on écrit

(Df (A + tH) − Df (A))(K) =3Tr((A + tH)2 K) − 3Tr(A2 K)


=3tTr(AHK) + 3tTr(HAK) + 3t2 Tr(H 2 K).

et donc lim Df (A+tH)−Df


t
(A)
= L(H), où L(H)(K) = 3Tr(AHK + HAK). On vérie que L est une
t→0
application linéaire de Mn (R) dans L(Mn (R), R). Elle est continue (dimension nie). Finalement,
Df (A + H) − Df (A) − L(H) : K 7→ 3Tr(H 2 K). On a
n
X
|Tr(H 2 K)| = | (H 2 K)ii | ≤ n sup |(H 2 K)ii | ≤ nkH 2 Kk ≤ nkHk2 × kKk,
i
i=1

d'où kDf (A + H) − Df (A) − L(H)k ≤ 3nkHk2 = o(H).


Conclusion : f est deux fois diérentiable et D2 f (A)(H, K) = 3Tr(AHK + HAK).

3.1.1 Cas des fonctions de Rn dans R

Si f : U ⊂ Rn → R est diérentiable, sa diérentielle est

n
X ∂f
Df (x) : (h1 , ..., hn ) 7→ (x)hi .
i=1
∂xi

On montre alors que si f est deux fois diérentiable alors f admet des dérivées partielles secondes
et que pour h = (h1 , ..., hn ) et k = (k1 , ..., kn ), via l'isomorphisme (3.1.1), on a

X ∂2f
D2 f (x)(h, k) = (x)hi kj .
i,j=1,...,n
∂xi ∂xj

 n
∂2f
La matrice Hf (x) := ∂xi ∂xj (x) est la matrice associée à la forme bilinéaire D2 f (x) dans la
i,j=1
base canonique et est appelée matrice hessienne de f au point x, i.e. pour tous h, k ∈ Rn on a
2 t
D f (x)(h, k) = hHf (x)k .
On sait que si f est deux fois diérentiable en x alors

∂2f ∂2f
(x) = (x),
∂xi ∂xj ∂xj ∂xi

c'est le Théorème de Schwarz. Cela se traduit par le fait que la diérentielle seconde de f au point
x est une forme bilinéaire symétrique, ou encore que la matrice Hf (x) est symétrique. C'est en fait
vrai dans un cadre plus général.
3.1. DIFFÉRENTIELLE SECONDE 25

3.1.2 Théorème de Schwarz

Théorème 3.1.3 . Si f : U → F est deux fois diérentiable en x ∈ U alors


, vue comme application bilinéaire, est symétrique, i.e. pour tous h, k ∈ E on a D f (x)(h, k) =
(Théorème de Schwarz)
D2 f (x) 2

D2 f (x)(k, h) .
Démonstration. Pour h, k ∈ E assez petits, on dénit

4(h, k) = f (x + h + k) − f (x + h) − f (x + k) + f (x).
On donne d'abord l'idée de la preuve. On pose, pour y ∈ [0, h], g(y) := f (x + y + k) − f (x + y) de sorte
que 4(h, k) = g(h)−g(0) = Dg(0)(h)+o(h). Par ailleurs, par dénition de g , on a Dg(0)(h) = Df (x+
k)(h) − Df (x)(h) = D2 f (x)(k, h) + reste. D'où 4(h, k) = D2 f (x)(k, h) + reste. En intervertissant les
2
rôles de h et k (4 est symétrique en h, k ) on montre de même que 4(h, k) = D f (x)(h, k) + reste.
Toute la diculté est alors de montrer que les restes se compensent.

Soit donc g comme ci-dessus. En appliquant l'inégalité des accroissements nis (Corollaire 2.2.6),
On a alors

(3.1.2) k4(h, k) − Dg(0)(h)k = kg(h) − g(0) − Dg(0)(h)k ≤ sup kDg(y) − Dg(0)k × khk
y∈[0,h]

Pour tout y ∈ [0, h], on écrit

Dg(y) − D f (x)(k) =Df (x + y + k) − Df (x + y) − D2 f (x)(k)


2

=(Df (x + y + k) − Df (x) − D2 f (x)(y + k)) − (Df (x + y) − Df (x) − D2 f (x)(y)).


Puisque f est deux fois diérentiable en x, pour tout ε > 0, si h et k sont assez petits on a donc pour
tout y ∈ [0, h]
(3.1.3) kDg(y) − D2 f (x)(k)k ≤ ε(ky + kk + kyk) ≤ ε(2kyk + kkk) ≤ ε(2khk + kkk).
En particulier

(3.1.4) kDg(0) − D2 f (x)(k)k ≤ ε(2khk + kkk).


En combinant (3.1.2)(3.1.4) on obtient

k4(h, k) − D2 f (x)(k, h)k ≤k4(h, k) − Dg(0)(h)k + kDg(0)(h) − D2 f (x)(k, h)k


≤ sup kDg(y) − Dg(0)k × khk + kDg(0) − D2 f (x)(k)k × khk
y∈[0,h]

≤(2ε(2khk + kkk))khk + ε(2khk + kkk)khk


≤ε(6khk2 + 3khkkkk)
≤9εk(h, k)k2E×E .
En intervertissant les rôles de h et k on montre de même que pour h, k assez petits on a k4(h, k) −
D2 f (x)(h, k)k ≤ 9εk(h, k)k2E×E et donc
kD2 (f )(x)(h, k) − D2 f (x)(k, h)k ≤ 18εk(h, k)k2E×E .
Puisque D2 f (x) est bilinéaire, l'inégalité ci-dessus est vraie pour tous h, k dans E . Si on note B(h, k) :=
D (f )(x)(h, k) − D2 f (x)(k, h) on obtient ainsi que
2

kBkL2 (E,F ) ≤ 18ε.


En faisant tendre ε vers 0 on conclut que B≡0 et donc que D2 (f )(x)(h, k) = D2 f (x)(k, h).

Exemple 3.1.4. On reprend la fonction f (A) = Tr(A3 ) dénie sur Mn (R). On a montré qu'elle
était deux fois diérentiable et que D2 f (A)(H, K) = 3Tr(AHK + HAK). En utilisant la propriété
Tr(AB) = Tr(BA) on a D2 f (A)(H, K) = 3Tr(KAH + HAK) et on vérie ainsi que D2 f (A) est bien
symétrique.
26 CHAPITRE 3. DIFFÉRENTIELLES D'ORDRE SUPÉRIEUR FORMULES DE TAYLOR

3.1.3 Formule de Taylor à l'ordre 2

Tout comme pour les fonctions d'une variable, on a une formule de Taylor.

Théorème 3.1.5. Si f : U → F est deux fois diérentiable alors


1
f (x + h) = f (x) + Df (x)(h) + D2 f (x)(h, h) + o(khk2 ).
2

Démonstration. R(h) := f (x + h) − f (x) − Df (x)(h) − 21 D2 f (x)(h, h). Cette fonction est


Soit
1 2
bien dénie au voisinage de 0, elle est de classe C et R(0) = 0. Il faut montrer que R(h) = o(khk ),
2
c'est-à-dire que pour tout ε > 0, il existe δ > 0 tel que si khk < δ alors kR(h)k < εkhk .

Soit donc ε > 0. On a

1 1
DR(h)(k) =Df (x + h)(k) − Df (x)(k) − D2 f (x)(h, k) − D2 f (x)(k, h)
2 2
=Df (x + h)(k) − Df (x)(k) − D2 f (x)(h, k),
où on a utilisé le Théorème de Schwarz, autrement dit

DR(h) = Df (x + h) − Df (x) − D2 f (x)(h).


Puisque f est deux fois diérentiable, par dénition, DR(h) = o(khk) c'est-à-dire qu'il existe δ>0
tel que si khk < δ alors kDR(h)k < εkhk. D'après l'inégalité des accroissements nis on a donc, pour
khk < δ ,
kR(h)k = kR(h) − R(0)k ≤ sup kDR(y)k × khk ≤ sup εkyk × khk ≤ εkhk2 .
y∈[0,h] y∈[0,h]

3.2 Extremas d'une fonction réelle


La diérentielle seconde est utile pour étudier les extremas d'une fonction à valeurs réelles. On
rappelle que, pour une fonction f : I → R où I est un intervalle ouvert, si f possède un minimum
(resp. maximum) local en x0 alors f 0 (x0 ) = 0 et f 00 (x0 ) ≥ 0 (resp. f 00 (x0 ) ≤ 0). Réciproquement
0 00 00
si x0 est tel que f (x0 ) = 0 et f (x0 ) > 0 (resp. f (x0 ) < 0), alors f possède un minimum (resp.
maximum) local strict en x0 . Ces résultats découlent de la formule de Taylor à l'ordre 2 : f (x0 + h) =
2
f (x0 ) + hf 0 (x0 ) + h2 f 00 (x0 ) + o(h2 ). En eet, si x0 est un minimum local on sait que f 0 (x0 ) = 0, et
on a donc pour h assez petit

h2 00
0 ≤ f (x0 + h) − f (x0 ) = f (x0 ) + o(h2 ).
2
En divisant par h2 et en faisant tendre h vers 0 on obtient bien f 00 (x0 ) ≥ 0. Réciproquement, si
0 00
f (x0 ) = 0 et f (x0 ) > 0 on a
f 00 (x0 )
 
2
f (x0 + h) − f (x0 ) = h + o(1) ,
2
et il existe h0 > 0 tel que pour |h| < h0 le terme dans la parenthèse est strictement positif ce qui
prouve que f (x0 + h) > f (x0 ) pour h ∈] − h0 , h0 [ et non nul.

Pour une fonction f : U → R, on a vu (voir Proposition 2.2.11) que si f possède un extremum


local en x0 alors Df (x0 ) = 0. On rappelle également la notion de forme bilinéaire (dénie) positive
(resp. négative).
3.2. EXTREMAS D'UNE FONCTION RÉELLE 27

Dénition 3.2.1. Soit L : E × E → R une forme bilinéaire. On dit que L est positive (resp.
négative) si, pour tout h ∈ E , on a L(h, h) ≥ 0 (resp. L(h, h) ≤ 0). Si L(h, h) > 0 (resp. L(h, h) < 0),
pour tout h ∈ E \ {0}, on dit que L est dénie positive (resp. dénie négative).

Remarque 3.2.2 . Si E = R, 2 00 2
on a D f (x)(h, k) = f (x)hk donc D f (x0 ) est (dénie) positive (resp.
négative) si et seulement si f 00 (x0 ) est (strictement) positif (resp. négatif ).

On a alors le résultat suivant dans Rn (et donc dans n'importe quel espace E de dimension nie).

Proposition 3.2.3. Soient U un ouvert de R et f : U → R une fonction deux fois diérentiable.


n

 Si x est un minimum (resp. maximum) local de f alors Df (x ) = 0 et D f (x ) est positive 2

(resp. négative).
0 0 0

 Si x est tel que Df (x ) = 0 et D f (x ) est dénie positive (resp. dénie négative), alors x est
2

un minimum (resp. maximum) local strict de f .


0 0 0 0

Attention, la diérentielle seconde (hessienne) en un point


     x0 peut n'être ni positive
 ni 
négative. Par
 
1 0 t 1 1 t 0 0
exemple la matrice A= vérie A = 1 > 0 tandis que A =
0 −1 0 0 1 1
−1 < 0. Un point critique x0 dont la hessienne n'est ni positive ni négative est appelé point selle ou
point col.
Lemme 3.2.4. Soit A ∈ M (R) une matrice symétrique. A est dénie positive si et seulement si il
existe m > 0 tel que pour tout h ∈ R on ait hAh ≥ m hh = mkhk .
n
n t t 2
2

t
Ce lemme arme que si A est dénie positive non seulement h 7→ hAh > 0 mais qu'il est minoré
par une fonction quadratique (on dit que A est coercive).

Démonstration. On note S = {h ∈ Rn , khk2 = 1} la sphère


 unité Rn
 de  pour la norme k k2 . En
t
hAh t h h
particulier S est compact. Pour tout h 6= 0 on a t hh = khk2 A khk2 et donc

t
   
hAh t h h t
m := inf t hh
= inf A = inf hAh = min t hAh,
h6=0 h6=0 khk2 khk2 h∈S h∈S

t
où, pour la dernière égalité, on a utilisé la compacité de S et la continuité de h 7→ hAh. Comme A
est dénie positive on a donc m > 0.

Démonstration de la Proposition. Etant donné h ∈ E , pour t dans un voisinage de 0, on


dénit gh (t) = f (x0 + th) (gh est une fonction d'une variable). On suppose que x0 est un minimum
00 0
local de f . On en déduit que 0 est un minimum local de gh donc gh (0) ≥ 0. Or gh (t) = Df (x0 + th)(h)
00 2 2 2
donc gh (0) = D f (x0 )(h, h). Pour tout h, on a D f (x0 )(h, h) ≥ 0 et donc D f (x0 ) est positive.

Réciproquement, si Df (x0 ) = 0 et D2 f (x0 ) est dénie positive. Soit m > 0 tel que D2 f (x0 )(h, h) ≥
2
mkhk2 . D'après la formule de Taylor à l'ordre 2, pour tout ε > 0 il existe δ > 0 tel que si khk2 < δ
(on est en dimension nie donc toutes les normes sont équivalentes) alors

1
|f (x0 + h) − f (x0 ) − Df (x0 )(h) − D2 f (x0 )(h, h)| ≤ εkhk22 .
2
En posant R(h) := f (x0 + h) − f (x0 ) − Df (x0 )(h) − 21 D2 f (x0 )(h, h) et en prenant ε= m
4 , on a, pour
khk < δ ,
1
f (x0 + h) =f (x0 ) + Df (x0 )(h) + D2 f (x0 )(h, h) + R(h)
2
1 m m
≥f (x0 ) + mkhk2 − khk22 = f (x0 ) + khk22 ,
2
2 4 4
et donc x0 est bien un minimum local strict.
28 CHAPITRE 3. DIFFÉRENTIELLES D'ORDRE SUPÉRIEUR FORMULES DE TAYLOR

Pour chercher les extremas d'une fonction de n variables il faut donc

1. chercher ses points critiques,

2. en chaque point critique, étudier si sa hessienne (diérentielle seconde) est dénie positive ou
négative.

Pour étudier si la hessienne est positive ou négative on pourra utiliser le résultat suivant

Proposition 3.2.5. Soit A une matrice symétrique. Elle est diagonalisable dans R. De plus, A est
(dénie) positive (resp. négative) si toutes ses valeurs propres sont (strictement) positives (resp. né-
gatives).
En particulier en dimension 2, puisque la somme des valeurs propres est la trace de A et leur
produit le déterminant de A, une matrice symétrique A est dénie positive (resp. négative) si et
seulement si det(A) > 0 et Tr(A) > 0 (resp. Tr(A) < 0).

Exemple 3.2.6. Soit f (x, y) = 2(x − y)2 − x4 − y 4 dénie sur R2 . La fonction f est clairement deux
fois diérentiable. On a

∂f ∂f
(x, y) = 4(x − y) − 4x3 , (x, y) = 4(y − x) − 4y 3 .
∂x ∂x
Si (x, y) est un point critique, en additionant les deux dérivées partielles on en déduit que x3 + y 3 = 0
3
et donc x = −y . Ainsi point critique si et seulement si x = −y et 8x − 4x = 0. On trouve
(x, y) est √ √ √ √
ainsi 3 points critiques : (0, 0), ( 2, − 2) et (− 2, 2).
4 − 12x2
 
−4
On calcule ensuite Hf (x, y) = et on étudie cette dernière en chacun des
−4 4 − 12y 2
points critiques :
√ √ √ √
 
−4 −20
• En ( 2, − 2)
on a Hf ( 2, − 2) = , qui a pour déterminant 384 > 0 et pour
−20 −4
√ √
trace −40 < 0. Elle est donc dénie négative et ( 2, − 2) est un maximum local strict.
√ √ √ √ √ √ √ √
• En (− 2, 2) on a Hf (− 2, 2) = Hf ( 2, − 2), et donc (− 2, 2) est aussi un maximum
local strict.
 
4 −4
• En (0, 0) on a Hf (0, 0) = , qui a pour déterminant 0 et pour trace 8. Elle a donc
−4 4
une valeur propre positive et une valeur propre nulle. Si (0, 0) est un extremum c'est un minimum
local. Or f (0, 0) = 0 et pour tout x f (x, x) = −2x4 < 0 donc (0, 0) ne peut pas être un
on a
minimum, ce n'est donc pas un extremum de f .

Remarque 3.2.7 . On fera bien attention que la Proposition 3.2.3 n'est a priori valable qu'en dimension
nie. En dimension quelconque, seule la première partie est vraie (voir la preuve). Pour la réciproque
il faut des hypothèses un peu plus fortes.

3.3 Diérentielles d'ordres supérieurs


On note Ln (E, F ) l'espace vectoriel normé des applications n-linéaires de En dans F muni de la
norme usuelle :
kf (x1 , ..., xn )kF
kf k = sup ,
(x1 ,...,xn )∈(E\{0})n kx1 kE ...kxn kE
pour tout f ∈ Ln (E, F ).
En utilisant la Remarque 1.4.6, on peut identier L(E, Ln (E, F )) à Ln+1 (E, F ).
3.3. DIFFÉRENTIELLES D'ORDRES SUPÉRIEURS 29

Par récurrence, on dénit les fonctions n fois diérentiables ainsi que la diérentielle d'ordre n que
l'on identie, de la même façon que pour le cas n = 2, à une application n-linéaire continue de E dans
F. Supposons ces notions déjà dénies pour n − 1.

Dénition 3.3.1. On dira que f est n fois diérentiable en x0 ∈ E s'il existe un voisinage ouvert
V de x0 f soit n − 1 fois diérentiable en chaque point de V et si l'application x 7→ Dn−1 f (x)
tel que
n−1
de V dans Ln−1 (E, F ) est diérentiable en x0 . Dans ce cas, la dérivée de D f au point x0 se note
D f (x0 ) et s'appelle dérivée n-ième de f au point x0 . C'est un élément de Ln (E, F ).
n

Dénition 3.3.2. On dit que f : U ⊂ E → F est de classe C n dans U (ou encore que f est n
fois continûment diérentiable dans U ) si f est n fois diérentiable en tout point de U et si
l'application
Dn f : U → Ln (E, F )
est continue.

On convient de poser D0 f = f et de dire que f est de classe C 0 si elle est continue.

Dénition 3.3.3. f est dite de classe C ∞


si elle est de classe C n
pour tout n.
Dénition 3.3.4. Soient E et F deux espaces de Banach, U ∈ E et V ⊂ F deux ouverts et f :
U →V une application. f diéomorphisme si f est bijective et diérentiable et f −1
est dite est
dite C -diéomorphisme, n ∈ N, (resp. C -diéomorphisme) si f
n ∞
aussi diérentiable. f est est
bijective et de classe Cn (resp. C ∞) et f −1 est aussi de classe Cn (resp. C ∞ ).
Théorème 3.3.5. Si f est n fois diérentiable en un point x , alors la dérivée D f (x ) ∈ L (E, F ) n

est une application multilinéaire symétrique E × ... × E → F , i.e. pour tous h , ..., h ∈ E et toute
0 0 n

permutation σ sur {1, ..., n}, on a


1 n

Dn f (x0 )(hσ(1) , ..., hσ(n) ) = Dn f (x0 )(h1 , ..., hn ).

Démonstration. n = 2 n'est autre que le théorème de Schwarz 3.1.3 déjà démontré. On


Le cas
va procéder par récurrence sur n : Soit n ≥ 3 et supposons le théorème démontré pour n − 1. Alors
Dn f est la diérentielle de l'application Dn−1 f : E → Ln−1 (E, F ) qui, par hypothèse, existe dans
n−1
un voisinage V de x0 . Par l'hypothèse de récurrence, D f prend ses valeurs dans le sous-espace de
Ln−1 (E, F ) formé des applications (n − 1)-linéaires symétriques. Donc, pour h1 ∈ E , Dn f (x0 )(h1 ) est
un élément de cet espace, i.e.

Dn f (x0 )(h1 , ..., hn ) := (Dn f (x0 )(h1 ))(h2 , ..., hn )


est une fonction symétrique de h2 , ..., hn , ou en d'autres termes, l'application n-linéaire Dn f (x0 ) :
n
E → F est une fonction symétrique des n − 1 dernières variables. Soit σ une permutation sur
{1, ..., n}. On sait que σ peut s'écrire comme composée d'un nombre ni de transpositions (i j),
i, j ∈ {1, ..., n}. Puisque Dn f (x0 )(h1 , ..., hn ) est une fonction symétrique de h2 , ..., hn , alors elle ne
change pas de valeur si on lui applique nimporte quelle transposition (i j), i, j ∈ {2, ..., n}. Pour
n n
montrer que D f (x0 )(hσ(1) , ..., hσ(n) ) = D f (x0 )(h1 , ..., hn ), pour toute permutation σ sur {1, ..., n},
n
il sut de montrer que D f (x0 )(h1 , ..., hn ) ne change pas de valeur si on lui applique la transposition
(1 2). On sait que Dn f (x0 ) est la diérentielle seconde de Dn−2 f et, par suite, en appliquant le
n−2
théorème de Schwarz 3.1.3 à la fonction D f ; on déduit que (Dn (x0 )(h1 ))(h2 ) ∈ Ln−2 (E, F ) est
symétrique en h1 et h2 , d'où le résultat.

Proposition 3.3.6. Soient E et F deux espaces vectoriels normés et f ∈ L(E, F ). Alors f est de
classe C et D f est nulle, pour tout n ≥ 2.
∞ n

Démonstration. D'après la Proposition 2.1.15, f est diérentiable et Df est constante valant f.


On en déduit que Df est continue, i.e. f est de classe C 1. De plus, Dn f = 0, pour tout n≥2 et, en
particulier, f est de classe C ∞.
30 CHAPITRE 3. DIFFÉRENTIELLES D'ORDRE SUPÉRIEUR FORMULES DE TAYLOR

Proposition 3.3.7. Soient E , E et F trois espaces vectoriels normés. Toute application bilinéaire
continue f : E × E → F est de classe C . Plus précisément, D f est une application constante et
1 2
∞ 2

les diérentielles D f sont donc nulles pour tout n > 2.


1 2
n

Démonstration. En appliquant la Proposition 2.3.6 à l'application bilinéaire f , on déduit que f


est diérentiable et Df (x1 , x2 )(h1 , h2 ) = f (x1 , h2 ) + f (h1 , x2 ), pour tous (x1 , x2 ), (h1 , h2 ) ∈ E1 × E2 .
D'où l'application Df : E1 × E2 → L(E1 , E2 , F ) est linéaire continue. D'après la Proposition 2.1.15,
2
sa diérentielle D f est une constante, dont la valeur est l'élément de L2 (E1 × E2 , F ) qui, à (h1 , h2 ),
(k1 , k2 ) de E1 × E2 , associe f (h1 , k2 ) + f (k1 , h2 ).

Exercice 3.3.8. Montrer que toute application multilinéaire continue est de classe C ∞.
Théorème 3.3.9 . Soient U ⊂ E et V ⊂ F deux ouverts et
et g : V → G deux applications continues.
(dérivées d'une fonction composée)
f :U →V
1. Si f est n fois diérentiable en un point x ∈ U et g est n fois diérentiable au point y := f (x ),
alors h := g ◦ f : U → G est n fois diérentiable au point x .
0 0 0

2. Si f et g sont de classe C , alors h = g ◦ f est aussi de classe C .


0
n n

Démonstration. La première assertion pour n = 1 n'est autre que la Proposition 2.1.14 qui donne
(3.3.1) Dh(x) = Dg(f (x)) ◦ Df (x),

formule qui montre que, si Dg et Df sont continues, alors Dh est continue, d'où la seconde assertion
pour n = 1. On va prouver les deux assertions par récurrence sur n. Les démonstrations des deux
assertions étant les mêmes, on va montrer seulement la seconde assertion. Supposons donc que la
seconde assertion est vrai pour n − 1 (n ≥ 2). On veut montrer que h est de classe C n , ce qui revient
n−1
à montrer que Dh est de classe C . Or, d'après (3.3.1), Dh est composée de deux applications :
Dh = ψ ◦ ϕ, où

 ϕ : U → L(F, G) × L(E, F ), x 7→ (Dg(f (x)), Df (x)) et

 ψ : L(F, G) × L(E, F ) → L(E, G), (u, v) 7→ u ◦ v .


ψ étant bilinéaire continue, elle est de classe C ∞, d'après la Proposition 3.3.7, et donc a fortiori de
n−1
classe C . Quant à ϕ, elle prend ses valeurs dans un espace produit et a pour composantes Dg ◦ f
et Df qui sont toutes les deux de classe C n−1 par hypothèse de récurrence. Ainsi ϕ est aussi de classe
C n−1 . En appliquant un seconde fois l'hypothèse de récurrence, la composée Dh = ψ ◦ ϕ est de classe
C n−1 . On en déduit que h est de classe C n.

Proposition 3.3.10. Soient E est F deux espaces de Banach. Si Isom(E, F ) 6= ∅, alors l'application
ψ : Isom(E, F ) → L(F, E) , dénie par ψ(u) = u , est de classe C .
−1 ∞

Démonstration. D'après le Théorème 2.1.16, ψ est diérentiable et, pour tous u ∈ Isom(E, F )
et h ∈ L(E, F ), on a Dψ(u)(h) = −u−1 ◦ u ◦ u−1 , ce qui implique que l'application Dψ est composée
de trois applications : Dψ = µ ◦ ψ ◦ λ, où

 µ : L(F, E) × L(F, E) → L(L(E, F ), L(F, E)), µ(u, v)(h) = −u ◦ h ◦ v , pour tous (u, v) ∈
L(F, E) × L(F, E), h ∈ L(E, F ) et
 λ : L(F, F ) → L(F, E) × L(F, E), u 7→ (u, u).
Il est facile de vérier que µ est une application bilinéaire et qu'elle vérie kµ(u, v)k ≤ kukkvk,
pour tout (u, v) ∈ L(F, E) × L(F, E). µ est donc continue, d'après le Théorème 1.4.2. D'autre part,
l'application λ est visiblement linéaire et vérie (en considérant par exemple la norme k k∞ sur
L(F, E) × L(F, E)) kλ(u)k = k(u, u)k = kuk. D'où, d'après le Théorème 1.3.1, λ est continue. Enn,
ψ est diérentiable, don continue. On en déduit que Dψ est continue et, par suite, ψ est de classe C 1 .
3.4. FORMULES DE TAYLOR 31

On va montrer, par récurrence sur ψ est de classe C n . Supposons que ψ est de classe C n−1
n, que
n n−1
(n ≥ 2). Pour montrer que ψ est de classe C , il sut de montrer que Dψ est de classe C . Or,
∞ n−1
d'après les propositions 3.3.6 et 3.3.7, λ et µ sont C , donc C . Aussi l'application ψ est de classe
C n−1 , par hypothèse de récurrence, et par suite la composée Dψ = µ ◦ ψ ◦ λ est de classe C n−1 et,
n
par conséquent, ψ est de classe C .

Corollaire 3.3.11. L'application f : GL (R) 3 A → A ∈ M (R) est de classe C .


n
−1
n

Théorème 3.3.12. Soient E et F deux espaces de Banach, U ∈ E et V ⊂ F deux ouverts et


f : U → V un C -diéomorphisme. Si f est de classe C (n ≥ 2) (resp. C ), alors l'homéomorphisme
1 n ∞

réciproque g = f est aussi de classe C (resp., C ), i.e. f est un C -diéomorphisme (resp. C -


−1 n ∞ n ∞

diéomorphisme).
Démonstration. Similaire à celle de la Proposition 3.3.10, en remarquant que Dg est la composée
de trois applications :

 g : V → U,
 Df : U → L(E, F ) et
−1
 l'application Isom(E, F ) → L(F, E), u 7→ u .

3.4 Formules de Taylor


Soient E et F deux espaces vectoriels normés, U un ouvert de E et f :U →F une application.
Dans ce chapitre, on va généraliser, au cas des applications entre espaces vectoriels normés, les formules
connues sous le nom de "formules de Taylor" dans le contexte des applications numériques à valeurs
rélles. On va tout d'abord introduire l'intégration des fonctions à valeurs dans un espace de Banach
et certaines de leurs propriétés élémentaires.

3.4.1 Intégration des fonctions à valeurs dans un espace de Banach

On va tout d'abord reppeler la dénition de l'intégrale de Riemann. Soient [a, b] un intervalle fermé
borné de R et f : [a, b] → R une fonction bornée. On considère une subdivision σ = (a = x0 < x1 <
... < xn = b) de [a, b]. Pour tout i = 1, ..., n, on dénit les quantités

mi = inf f (x) et Mi = sup f (x),


x∈[xi−1 ,xi ] x∈[xi−1 ,xi ]

et aussi les sommes de Darboux inférieure et supérieure


n
X n
X
S− (f, σ) = mi (xi − xi−1 ) et S+ (f, σ) = mi (xi − xi−1 ).
i=1 i=1

On pose alors
I− (f ) = sup S− (f, σ) et I+ (f ) = inf S− (f, σ),
σ σ

où le sup et l'inf sont pris parmi toutes les subdivisions de [a, b]. Ces expressions sont dites, respec-
tivement les intégrales inférieure et supérieure de f . Si ces deux intégrales sont égales, alors on
dit que f est (Riemann-)integrable et on écrit

Z b Z b
f ou f (x)dx
a a
32 CHAPITRE 3. DIFFÉRENTIELLES D'ORDRE SUPÉRIEUR FORMULES DE TAYLOR

pour la valeur commune des intégrales supérieure et inférieure. Cette valeur commune est dite l'inté-
grale (de Riemann) de f .
La dénition de l'intégrale ne peut pas se généraliser directement si on remplace l'ensemble d'arrivée
de la fonction f par un espace vectoriel normé arbitraire E, car il n'existe pas de notion d'inf et de
sup dans de tels espaces. Cependant, si (fn ) est une suite de fonctions à valeurs réelles intégrable
convergeant uniformément vers une fonction à valeurs réelles f, alors f est intégrable et la suite
Rb Rb
( a fn ) converge vers
a
f. C'est cette propriété qui va nous permettre de généraliser l'intégrale.

Soient E un espace de Banach et B([a, b], E) l'ensemble des fonctions bornées dénies sur [a, b] à
valeurs dans E kf k = supx∈[a,b] kf (x)kE . L'espace vectoriel normé B([a, b], E) est
muni de la norme
alors un espace de Banach. On dit que f : [a, b] → E est une fonction en escalier s'il existe une
subdivision σ = (a = x0 < x1 < ... < xn = b) de [a, b] et des éléments c1 , ..., cn ∈ E tels que f = ci
sur l'intervalle ]xi−1 , xi [. L'ensemble des fonctions en escalier sur [a, b], qu'on note E([a, b], E), est un
sous-espace vectoriel de B([a, b], E). L'adhérence R([a, b], E) de E([a, b], E) est aussi un sous-espace
vectoriel de B([a, b], E), et ses éléments sont appelés fonctions réglées. Ainsi une fonction réglée est
limite uniforme d'une suite de fonctions en escalier. On peut caractériser les fonctions réglées par la
propriété suivante :

Proposition 3.4.1. Une fonction bornée f : [a, b] → E est réglée si et seulement si f admet une
limite à gauche en tout point x ∈]a, b] et une limite à droite en tout point x ∈ [a, b[.
Toute fonction réglée est intégrable et, d'après la proposition précedente, les fonctions continues
par morceaux et les fonctions monotonnes sont réglées et donc intégrables. Cependant, il existe des
fonctions intégrables qui ne sont pas nécessairement réglées, comme, par exemple, la fonction f :
[−1, 1] → R dénie par
sin x1 ,

x 6= 0
f (x) =
0, x = 0.

On va maintenant prouver qu'il est possible de dénir l'intégrale d'un fonction réglée à valeurs
dans un espace de banach E. On considère tout d'abord les fonctions en escalier. Si f : [a, b] → E est
une fonction en escalier. Alors il existe une subdivision σ = (a = x0 < x1 < ... < xn = b) de [a, b] et
des éléments c1 , ..., cn de E tels que f = ci sur ]xi , xi−1 [. On dénit l'intégrale de f par
Z b n
X
I(f ) = f= (xi − xi−1 )ci .
a i=1

L'application I : E([a, b], E) → E est linéaire et

n
X
kI(f )kE ≤ (xi − xi−1 )kci kE ≤ (b − a)kf k,
i=1

de telle sorte que I soit aussi continue. Si a < u < b, alors f : [a, u] → E et f : [u, b] → E sont des
fonctions en escalier et
Z b Z u Z b
f= f+ f.
a a u
Pour a ≤ u ≤ v ≤ b, on pose
Z u Z u Z v
f =0 et f =− f.
u v u

Avec ces conventions, pour tous u, v, w ∈ [a, b], on a la relation suivante dite relation de Chasle
Z v Z w Z w
f+ f= f.
u v u
3.4. FORMULES DE TAYLOR 33

Suppososons maintenant que f est une fonction réglée. Alors f est limite uniforme d'un suite de
fonctions en escalier (fn ). Puisque I est linéaire et continue, la suite (I(fn )) est une suite de Cauchy
et par suite possède une limite l, puisque E est un espace de Banach. Si (gn ) est une autre suite de
fonctions en escalier convergeant vers f, alors

kfn − gn k ≤ kfn − f k + kf − gn k,

d'où la suite (fn − gn ) converge vers 0 lorsque n tend vers l'inni. On en déduit que la suite (I(gn ))
possède l comme limite, et par suite on peut dénir sans ambiguité l'intégrale de f par

Z b Z b
I(f ) = f = lim fn ,
a n→+∞ a

où (fn ) est une suite quelconque de fonctions en escalier qui converge uniformément vers f . On utilise
Rb
aussi la notation
a
f (s)ds pour cette intégrale.
Il est facile de voir que l'application I : R([a, b], E) → E est linéaire et que

kI(f )kE ≤ (b − a)kf k,

d'où I est continue sur R([a, b], E).


Fixons maintenant que c ∈ [a, b]. Pour tout x ∈ [a, b], on pose

Z x
F (x) := f.
c

On a alors

Théorème 3.4.2. F est une fonction continue. Si, de plus, f est continue en un point x ∈ [a, b] alors
F est diérentiable en x et F (x) = f (x).
0

Si l'application F est telle que F0 = f, on dit que F est une primitive de f . D'où on a
Corollaire 3.4.3. Si f : [a, b] → E est continue, alors elle admet une primitive.
Si F est une primitive de f et c ∈ E, alors F +c est aussi une primitive de f. Le résultat suivant
montre que ce sont les seules :

Proposition 3.4.4. Si F et G sont des primitives d'une fonction f : [a, b] → E, alors il existe une
constante c ∈ E telle que G = F + c.
On en déduit alors la généralisation suivante du Théorème fondamental de l'analyse :
Z b
G(b) − G(a) = F (b) − F (a) = f.
a

3.4.2 Formules de Taylor dans le cas E=R

On va tout d'abord considérer le cas où E=R :

Proposition 3.4.5. 1. Si v : R ⊃ U → F est n − 1 fois diérentiable, alors


 
d 1 1
(3.4.1) v(t) + (1 − t)v 0 (t) + ... + (1 − t)n v (n) (t) = (1 − t)n v (n+1) (t).
dt n! n!
34 CHAPITRE 3. DIFFÉRENTIELLES D'ORDRE SUPÉRIEUR FORMULES DE TAYLOR

2. Si, de plus, F est un espace de Banach, U ⊃ [0, 1] et l'application v (n+1)


est continue sur U ,
alors
0
(1 − t)n (n+1)
Z
1 1
(3.4.2) v(1) − v(0) − v 0 (0) − v 00 (0) − ... − v (n) (0) = v (t)dt.
2 n! 1 n!

3. S'il existe M > 0 tel que kv (n+1)


(t)k ≤ M , pour tout t ∈ [0, 1], alors
1 1 M
(3.4.3) kv(1) − v(0) − v 0 (0) − v 00 (0) − ... − v (n) (0)k ≤ .
2 n! (n + 1)!

Démonstration. La preuve de la première assertion de la Proposition découle du lemme suivant,


dont la démonstration est laissée en exercice :

Lemme 3.4.6. Soient U un ouvert de R, E, F et G trois espaces vectoriels normés, u : U → E et


v :U →F deux applications n + 1 fois diérentiables et ϕ : E × F → G une application bilinéaire
continue. Alors l'application X n
t 7→ (−1)k ϕ(u(k) (t), v (n−k) (t))

de U dans G a pour dérivée


k=0

t 7→ ϕ(u(t), v (n+1) (t)) + (−1)n ϕ(u(n+1) (t), v(t)).

Ainsi, posant dans le lemme E = R, G = F et ϕ : R × F → F la multiplication d'un vecteur de F


1
par un scalaire de R et considérant u l'application t 7→ n! (1 − t)n , qui est de classe C n avec u(n+1) = 0,
on trouve la formule (3.4.1).

Pour prouver la seconde assertion de la proposition, on considère l'application f :U →F dénie


par
1
f (t) = v(t) + (1 − t)v 0 (t) + ... + (1 − t)n v (n) (t)
n!
(1−t)n (n+1)
qui est n − 1 fois diérentiable et la formule (3.4.1) peut s'écrire sous la forme f 0 (t) = n! v (t).
En intégrant entre 0 et 1, on trouve (3.4.2).

An de démontrer la troisième assertion de la proposition, on va appliquer le Théorème 2.2.3 à la


n+1
fonction f dénie auparavant et à la fonction g : [0.1] → R dénie par g(t) = −M (1−t)
(n+1)! . D'après la
0 (1−t)n (n+1)
relation (3.4.1), on akf (t)kF ≤ n! kv (t)kF , de telle sorte que, d'après l'hypothèse, on obtient
(1−t)n
kf (t)kF ≤ M n! = g 0 (t). Le Théorème 2.2.3 permet de conclure que
0
kf (1) − f (0)kF ≤ g(1) − g(0),
ce qui est exactement la relation désirée.

3.4.3 Formules de Taylor dans le cas général

On va donner les formules de Taylor dans le cas général, i.e. lorsque E et F sont deux espaces
vectoriels normés quelconques :

Théorème 3.4.7 . Soient E et F deux espaces vectoriels


normés tels que F est un espace de Banach, U un ouvert de E et f : U → F une application de classe
(Formule de Taylor avec reste intégral)

Cn+1
. Si le segment [a, a + h] est contenu dans U , alors on a
1 1
f (a + h) =f (a) + Df (a)(h) + D2 f (a)(h, h) + ... + Dn f (a)(h, ..., h)
2 n!
(3.4.4) Z 1
(1 − t)n n+1
+ D f (a + th)(h, ..., h)dt.
0 n!
3.4. FORMULES DE TAYLOR 35

Démonstration. Considérons la fonction v : [0, 1] → F , dénie par v(t) = f (a + th). f étant de


classe C n+1 , v l'est aussi et de plus on montre par récurrence que

(3.4.5) v (n) (t) = Dn f (a + th)(h, ..., h).

Appliquant la seconde assertion de la Proposition 3.4.5 à la fonction v qu'on vient de construire, on


obtient (3.4.4).

Théorème 3.4.8 . Soient E et F deux espaces vectoriels


normés, U un ouvert de E et f : U → F une application n + 1 fois diérentiable. Supposons que
(Formule de Taylor avec reste de Lagrange)

kD f (x)k ≤ M , pour tout x ∈ U . Alors on a


n+1

1 n khkn+1
E
(3.4.6) kf (a + h) − f (a) − Df (a)(h) − ... − D f (a)(h, ..., h)kF ≤ M ,
n! (n + 1)!
pour tous a ∈ U et h tel que [a, a + h] ⊂ U .
Démonstration. En considérant la fonction v dénie dans la démonstration du Théorème 3.4.7,
on a v est n+1 fois diérentiable et, en utilisant (3.4.5) et l'hypothèse de majoration, on a

kv (n+1) (t)kF = kDn+1 f (a + th)(h, ..., h)kF ≤ kDn+1 f (a + th)kkhkn+1


E ≤ M khkn+1
E .

On applique la troisième assertion de la Proposition 3.4.5 pour trouver le résultat.

Si, dans (3.4.6), on fait tendre h vers 0, le second terme est un o(khknE ), et par suite le premier
terme l'est aussi. Quoique ce résultat a été obtenu sous la condition forte que Dn+1 f est bonrnée au
voisinage de a, on peut avoir un résultat similaire sous des conditions plus faibles :

Théorème 3.4.9. Soient E et F deux espaces vectoriels normés, U un ouvert de E et f : U → F


une application n − 1 fois diérentiable sur U et n fois diérentiable en un point a ∈ U . Alors on a
1 n
(3.4.7) kf (a + h) − f (a) − Df (a)(h) − ... − D f (a)(h, ..., h)kF = o(khknE ),
n!
pour tout h tel que [a, a + h] ⊂ U .
Cette formule (3.4.7) exprime seulement une propriété asymptotique, puisqu'elle exprime ce qui
se passe quand h tend vers 0.

Démonstration. Pour n = 1, (3.4.7) n'est autre que la dénition de la diérentiabilité en a. On


va procéder par récurrence sur n, en supposant que (3.4.7) est vraie pour n − 1 (n ≥ 2). Soit V un
voisinage de 0 dans E tel que a + V ⊂ U et considérons la fonction ϕ : V → F dénie par
1 n
(3.4.8) ϕ(h) = f (a + h) − f (a) − Df (a)(h) − ... − D f (a)(h, ..., h).
n!
L'application ϕ est diérentiable et sa diérentielle est donnée par

1
(3.4.9) Dϕ(h) = Df (a + h) − Df (a) − D2 f (a)(h) − ... − Dn f (a)(h, ..., h),
(n − 1)!

où chaque Di f (a) présent dans le terme de droite de la formule s'applique au (i − 1)-uplet (h, ..., h) et
i
la quantité D f (a)(h, ..., h) est considérée comme une application linéaire E → F . En eet, il sut de
i
calculer la diérentielle de l'application gi : E → L(E, F ), h 7→ D f (a)(h, ..., h) (avec le h qui apparaît
i fois). On remarque que gi = D f (a) ◦ λ, 2 ≤ i ≤ n, où λ : E → E i , h 7→ (h, ..., h) qui est linaire.
i

Di f (a) : E i → F étant multilinéaire, on déduit que

Dgi (h)(k) = Di f (a)(k, h, ..., h) + Di f (a)(h, k, h, ..., h) + ... + Di f (a)(h, ..., h, k),
36 CHAPITRE 3. DIFFÉRENTIELLES D'ORDRE SUPÉRIEUR FORMULES DE TAYLOR

pour tous h, k ∈ E . Comme Di f (a) est symétrique, alors

Dgi (h)(k) = iDi f (a)(h, h, ..., k) = i(Di f (a)(h, ..., h))(k).

On en déduit que Dgi (h) = iDi f (a)(h, ..., h), où Di f (a) est considérée ici comme la diérentielle
(i − 1)-ième de l'application Df : U → L(E, F ). En diérentiant (3.4.8), on trouve (3.4.9).

Appliquant l'hypothèse de récurrence à l'application Df , on obtient grâce à (3.4.9),

kDϕ(h)k = o(khkn−1
E .

Autrement dit, pour tout ε > 0, il existe η>0 tel que khkE ≤ η entraine que kDϕ(h)k ≤ εkhkn−1
E .
Utilisant l'inégalité des accroissements nis (Corollaire 2.2.5), on trouve

kϕ(h) − ϕ(0)k ≤ εkhknE ,

pour khkE ≤ η . Puisque ϕ(0) = 0, alors

kϕ(h)k = o(khknE ),

ce qui est justement la relation (3.4.7).


Chapitre 4

Inversion locale  Fonction implicite

Sommaire
4.1 Le théorème du point xe . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2 Le théorème d'inversion locale . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3 Le théorème des fonctions implicites . . . . . . . . . . . . . . . . . . . . . 43

Dans ce chapitre on va s'intéresser à deux théorèmes importants : le Théorème d'inversion locale et


le Théorème des fonctions implicites. On peut résumer grossièrement ces deux théorèmes de la façon
suivante : étant donnés une fonction f :U →F et b ∈ F, peut-on résoudre l'équation f (x) = b ? Pour
comprendre la philosophie de ce que l'on va faire, prenons le cas de la dimension nie et supposons
que f : Rn → Rm est linéaire, autrement dit on cherche à résoudre un système linéaire de m équations
à n inconnus (si A est la matrice de f dans une base choisie, l'équation s'écrit Ax = b). On peut
distinguer 3 cas :

 si m = n, on a autant d'équations que d'inconnus et pourvu que A (et donc f ) soit inversible
on aura alors une unique solution pour tout b donné par x = f −1 (b) (ou encore x = A−1 b).
 si m < n, on a moins d'équations que d'inconnus et on s'attend typiquement à avoir une innité
de solutions. Si on écrit x = (x1 , x2 ) ∈ Rn−m × Rm et A = (A1 , A2 ) où A1 ∈ Mm,n−m (R)
et A2 ∈ Mm (R), pourvu que A2 soit inversible, on pourra exprimer x2 en fonction de x1 :
x2 = A−1
2 (b − A1 x1 ), i.e. on exprime m variables en fonction des n − m autres, pour chaque
n−m
choix des n − m premières variables (ici de x1 ∈ R ) on trouve les valeurs des m autres (ici
m
de x2 ∈ R ).

 si m > n, on a plus d'équations que d'inconnus et dans ce cas on résout en général n d'entre elles
(on se ramène au 1er cas) et on regarde si la solution trouvée est compatible avec les équations
restantes.

On voudrait savoir ce qui reste de cela si f : R n → Rm n'est plus linéaire mais seulement diéren-
tiable. L'idée est alors que pour x proche de x0 on écrira

f (x) = f (x0 ) + Df (x0 )(x − x0 ) + o(x − x0 ) ' f (x0 ) + Df (x0 )(x − x0 ),

c'est-à-dire de se ramener à un système linéaire (et de contrôler les termes de reste, c'est là toute la
diculté !). On ne pourra bien sûr pas résoudre l'équation sur tout U mais seulement au voisinage
d'un point x0 et pourvu que l'on ait une information sur Df (x0 ) :

 si n = m et Df (x0 ) est inversible on pourra trouver une fonction réciproque f −1 au voisinage


de x0 , c'est le Théorème d'inversion locale.

37
38 CHAPITRE 4. INVERSION LOCALE  FONCTION IMPLICITE

 sim < n, on décompose comme ci-dessus x ∈ Rn en (x1 , x2 ) ∈ Rn−m × Rm et on écrit


Df (x)(h1 , h2 ) = D1 f (x)(h1 ) + D2 f (x)(h2 ). Si D2 f (x0 ) est inversible on pourra exprimer x2
en fonction de x1 au voisinage de x0 , c'est le Théorème des fonctions implicites. Par exemple,
2
dans le cas de f : R → R on s'intéresse à des équations du type f (x, y) = 0. Typiquement
l'ensemble des solutions forme une courbe dans le plan et la question est de savoir si on peut
décrire celle-ci comme le graphe d'une fonction y = ϕ(x) ou alors x = ψ(y) (au moins locale-
ment). L'équation f (x, y) = 0 dénit y en fonction dex de façon implicite alors que y = ϕ(x)
est explicite.

4.1 Le théorème du point xe


Chercher la réciproque d'une fonction f revient à résoudre une équation de la forme f (x) = y où y
est donné. On souhaite alors montrer qu'il y a une unique solution (f est bijective) et éventuellement à
trouver celle-ci (trouver f −1 ). Le théorème suivant sera l'outil clé de la preuve du théorème d'inversion
locale :

Théorème 4.1.1 . Soient E un espace de Banach et F ⊂ E un


fermé (non-vide). Soit ϕ : F → E telle que ϕ(F ) ⊂ F et ϕ soit contractante, i.e. il existe k ∈ [0, 1[
(Théorème du point xe de Picard)

tel que pour tous x, y ∈ F on ait


(4.1.1) kϕ(y) − ϕ(x)k ≤ kky − xk.

Alors ϕ admet un unique point xe dans F , i.e. il existe un unique x ∈ F tel que ϕ(x) = x.
Démonstration. Soit x0 ∈ F . On considère la suite (xn )n dénie par la relation de récurrence
xn+1 = ϕ(xn ). L'hypothèse ϕ(F ) ⊂ F assure que cette suite est bien dénie pour tout n. On va
montrer qu'elle converge, sa limite x sera la solution cherchée.

D'après (4.1.1), pour tout n∈N on a

kxn+2 − xn+1 k = kϕ(xn+1 ) − ϕ(xn )k ≤ kkxn+1 − xn k.

On va montrer alors par récurrence que pour tout n∈N on a

(4.1.2) kxn+1 − xn k ≤ k n kx1 − x0 k.

Le résultat étant immédiat pour n = 0, on suppose que kxn+1 − xn k ≤ k n kx1 − x0 k, pour n ∈ N. On


a alors

kxn+2 − xn+1 k ≤ kkxn+1 − xn k ≤ k n+1 kx1 − x0 k.

Comme k ∈ [0, 1[, on déduit de (4.1.2) par comparaion des séries à termes positifs que la série
P P
n kxn+1 − xn k est convergente. La série n (xn+1 − xn ) est ainsi normalement convergente et
donc convergente puisque E est un espace de Banach. Cela signie que la suite de terme général
PN
n=0 (xn+1 − xn ) = xN +1 − x0 converge, autrement dit la suite (xn )n converge. On note x sa limite.
Comme F est un fermé on a bien x ∈ F . Par ailleurs, la propriété (4.1.1) implique que ϕ est continue
et en passant à la limite dans l'égalité xn+1 = ϕ(xn ) on obtient donc x = ϕ(x).

Finalement, si x et y sont deux points xes on a

kx − yk = kϕ(x) − ϕ(y)k ≤ kkx − yk.

Comme k<1 on en déduit que nécessairement x=y ce qui prouve l'unicité.


4.2. LE THÉORÈME D'INVERSION LOCALE 39

Remarques 4.1.2 . 1. Pour montrer que la suite (xn )n converge on est passé par la notion de série
normalement convergente. On peut aussi montrer directement à partir de (4.1.2) que la suite
(xn )n est de Cauchy et donc converge puisque E est un espace de Banach.

2. Dans la preuve, on a construit le point xe comme limite d'une suite dénie par récurrence dont
le point de départ est arbitraire. L'unicité du point xe montre que, quelque soit le choix de
x0 , la suite (xn )n convergera vers celui-ci. Cela donne un algorithme pour trouver des valeurs
approchées de ce dernier. Par ailleurs on a

X X X kx1 − x0 k
kx − xN k = (xn+1 − xn ) ≤ kxn+1 − xn k ≤ k n kx1 − x0 k = k N ,
1−k
n≥N n≥N n≥N

ce qui permet d'estimer l'erreur entre la valeur approchée xN et x.


3. Un moyen pratique pour montrer que ϕ est contractante est de calculer sa diérentielle (dérivée)
et d'utiliser l'inégalité des accroissements nis.

Exemple 4.1.3. SoitE = C 0 ([0, 1]) (l'ensemble des fonctions continues de [0, 1] dans R) muni de la
norme k k∞ . On considère ϕ : E → E dénie par

Z x
1 1
(ϕ(f ))(x) = f (t)dt + cos(f (x)).
2 0 4

On veut montrer que ϕ possède un unique point xe. Soient f, g ∈ E , pour tout x ∈ [0, 1] on a

1 x
Z
1
|(ϕ(f ))(x) − (ϕ(g))(x)| ≤ |f (t) − g(t)|dt + | cos(f (x)) − cos(g(t))|
2 0 4
1 x
Z
1
≤ kf − gk∞ dt + |f (x) − g(t)|
2 0 4
3
≤ kf − gk∞
4
(Pour passer de la première à la deuxième ligne on a utilisé l'inégalité des accroissements nis pour
3
la fonction cos : R → R.) La fonction ϕ 4 . Comme E muni de la
est donc contractante avec k =
norme k k∞ est un espace de Banach, on peut appliquer le théorème du point xe, ce qui prouve que
ϕ possède un unique point xe.

4.2 Le théorème d'inversion locale


Si f :I→R est une fonction continue d'une variable, on sait que f est bijective de I sur f (I) si
et seulement si elle est strictement monotone. Si de plus f est dérivable il sut donc de s'assurer que
f0 > 0 ou bien f 0 < 0. Dans ce cas f −1 est dérivable et on a (f −1 )0 (y) = 1
f 0 (f −1 (y)) .

Supposons maintenant f non seulement dérivable mais de classe C 1 . Si on a f 0 (x) 6= 0, alors comme
f est continue il existe ε > 0 tel que f 0 soit de signe constant sur l'intervalle ]x − ε; x + ε[ (théorème
0

des valeurs intermédiaires). Ainsi f sera bijective de ]x − ε; x + ε[ dans f (]x − ε; x + ε[), on dira que f
−1
est localement inversible au voisinage de x. Par ailleurs la fonction f : f (]x − ε; x + ε[) →]x − ε; x + ε[
1
sera aussi de classe C . C'est ce genre de résultat que l'on va généraliser à des fonctions d'un espace
vectoriel normé dans un espace vectoriel normé.

Dénition 4.2.1. Une application f :E→F est un homéomorphisme si elle est continue, bijective
et si son inverse est continue.
40 CHAPITRE 4. INVERSION LOCALE  FONCTION IMPLICITE

Théorème 4.2.2 . Soient E, F deux espaces de Banach, U ⊂ E un ouvert et


de classe C . Soit x ∈ U tel que Df (x ) soit un homéomorphisme. Alors il existe un
(inversion locale)
1
f : U → F
voisinage de x , un voisinage W de f (x ) et g : W → V de classe C telle que
0 0
1
V ⊂U 0 0

f ◦ g = idW et g ◦ f = idV .
Autrement dit, la fonction f : V → W est un C -diéomorphisme de V dans W . Par ailleurs, pour
1

tout y ∈ W on a Dg(y) = (Df (g(y))) . −1

Remarques . 4.2.3 f C
1. L'hypothèse que soit de classe
1
et pas seulement diérentiable est né-
cessaire. C'est déjà vrai pour les fonctions d'une variable. La fonction f dénie par f (x) =
x
2 + x2 sin( x1 ) si x 6= 0 et f (0) = 0 est dérivable sur R et on a f 0 (0) = 12 6= 0. Cependant
0 1 1 1
f n'est bijective sur aucun voisinage de 0 : sa dérivée f (x) =
2 + 2xsin( x ) − cos( x ) n'est
0 1 1
de signe constant sur aucun voisinage de 0 (pour tout entier n on a f (
2nπ ) = − 2 < 0 et
f 0 ( (2n+1)π
1
)= 3
2 > 0).
2. Si dans le théorème 4.2.2, on suppose que f est non seulement de classe C 1 , mais de classe
C n (n ≥ 2) (resp. de classe C ∞ ), alors f : V → W est un C n -diéomorphisme (resp. C ∞ -
diéomorphisme), d'après le Théomrème 3.3.12.

Avant de démontrer ce théorème, regardons ce qu'il devient en dimension nie, i.e. pour f : Rn →
d n d
R . On a bien sûr R et R qui sont des espaces de Banach. Par ailleurs, si f est diérentiable, pour que
Df (x) : Rn → Rd soit inversible il faut que n = d (théorème du rang) et, si on note Jf (x) sa matrice
dans la base canonique (matrice jacobienne), i.e. si f (x) = (f1 (x), ..., fn (x)) avec x = (x1 , ..., xn ) on a
 
∂fi
Jf (x) = , alors Df (x) est inversible si et seulement det(Jf (x)) 6= 0 (c'est le jacobien
∂xj (x)
1≤i,j≤n
de f au point x). Dans ce cas son inverse est automatiquement continue puisqu'on est en dimension
nie. Autrement dit on a la version suivante du théorème d'inversion locale

Théorème 4.2.4. Soient U ⊂ R un ouvert et f : U → R de classe C . Soit x ∈ U tel que J (x )


n n 1

soit inversible. Alors il existe un voisinage V ⊂ U de x , un voisinage W de f (x ) et g : W → V de


0 f 0

classe C telle que


0 0
1

f ◦ g = id g ◦ f = id . W et V

Autrement dit, la fonction f : V → W est un C -diéomorphisme de V dans W . Par ailleurs, pour


1

tout y ∈ W on a Dg(y) = (Df (g(y))) . −1

Exemple 4.2.5. f : R2 → R2 dénie par f (x, y) = sin( y2 ) + x, sin( x2 ) + y



Soit . La fonction f est
1 2
de classe C et pour tout (x, y) ∈ R on a

1 y
 
1 2 cos( 2 )
Jf (x, y) = 1 x ,
2 cos( 2 ) 1

et donc det(Jf (x, y)) = 1 − 1


4 cos( x2 ) cos( y2 ) 6= 0. La fonction f est donc localement inversible en tout
2
point de R .

Remarque 4.2.6 . Df (x) soit un ho-


Contrairement au cas des fonctions d'une variable, le fait que
méomorphisme pour tout x ∈ U n'implique pas que f est bijective de U sur f (U ). La fonction
f : R2 3 (x, y) 7→ (ex cos(y), x 2 1 2
 e sin(y)) ∈ R est de classe C . Pour tout (x, y) ∈ R on a Jf (x, y) =
x x
e cos(y) −e sin(y) 2x
, et donc Jf (x, y) est inversible puisque det(Jf (x, y)) = e 6= 0. Cependant
ex sin(y) ex cos(y)
f n'est pas injective (elle est 2π -périodique relativement à la variable y ).

Démonstration du Théorème 4.2.2. On note y0 = f (x0 ). On souhaite montrer que si y est proche
de y0 ( y est dans un voisinage W de y0 ) alors il admet un unique antécédent proche de x0 (unique
dans un voisinage V de x0 ). Etant donné x ∈ U, l'application

ϕ : z 7→ f (x) + Df (x0 )(z − x)


4.2. LE THÉORÈME D'INVERSION LOCALE 41

est une approximation de f , au moins si x est proche de x0 (on écrit f (z) ' f (x) + Df (x)(z − x) '
f (x) + Df (x0 )(z − x) où on a utilisé la diérentiabilité de f en x puis la continuité de Df en x0 ). Pour
trouver un antécédent de y par f on va d'abord en chercher un par ϕ. Puisque Df (x0 ) est inversible,
pour tout y ∈ F il existe un unique z ∈ E tel que ϕ(z) = y . On note Gy (x) cet antécédent. On a en
fait

(4.2.1) Gy (x) = x + (Df (x0 ))−1 (y − f (x)).


On remarque alors que y = f (x) si et seulement si Gy (x) = x. Autrement dit, trouver un antécédent
de y par f revient en fait à trouver un point xe de Gy . On va montrer que si y est susament proche
de f (x0 ) l'application Gy sera contractante sur un voisinage fermé bien choisi de x0 et aura donc un
unique point xe dans ce fermé, y aura un unique antécédent par f au voisinage de x0 .

Pour montrer que Gy est contractante il sut de montrer qu'elle est diérentiable et de majorer
la norme de sa diérentielle par k ∈ [0, 1[. La fonction Gy est bien diérentiable pour tout y comme
composée de fonctions diérentiables, et on a

(4.2.2) DGy (x) = I − (Df (x0 ))−1 ◦ Df (x) = (Df (x0 ))−1 ◦ (Df (x0 ) − Df (x)).
Comme Df est continue, il existe ε>0 tel que pour tout x ∈ B̄(x0 , ε) on ait kDf (x) − Df (x0 )k <
1
2k(Df (x0 ))−1 k et donc,
1
∀x ∈ B̄(x0 , ε), ∀y ∈ F, kDGy(x)k < .
2
Pour armer que Gy est contractante sur B̄(x0 , ε) et pouvoir utiliser le théorème du point xe il faut
encore s'assurer que
Gy (B̄(x0 , ε)) ⊂ B̄(x0 , ε).
D'après l'inégalité des accroissements nis, si x ∈ B̄(x0 , ε) on a kGy (x) − Gy (x0 )k < 21 kx − x0 k ≤ ε
2.
Pour s'assurer que Gy (x) ∈ B̄(x0 , ε) il sut (inégalité triangulaire) que

ε
kGy (x0 ) − x0 k < ,
2
c'est-à-dire quek(Df (x0 ))−1 (y − y0 )k < 2ε (cf (4.2.1)). On dénit donc
n  ε o
W := y ∈ F, y − y0 ∈ Df (x0 ) (B(0, ) et V := {x ∈ B(x0 , ε), f (x) ∈ W }.
2
Puisque f
et Df (x0 ) sont continues, V et W sont des ouverts contenant respectivement x0 et y0 , et
pour tout y ∈ W l'application Gy est une contraction de B̄(x0 , ε) dans B(x0 , ε) ⊂ B̄(x0 , ε). D'après
le théorème du point xe, il existe un unique x ∈ B̄(x0 , ε) tel que Gy (x) = x ⇐⇒ y = f (x). Comme
Gy est à valeurs dans B(x0 , ε) on a nécessairement x ∈ B(x0 , ε) et donc x ∈ V . En résumé, pour tout
y ∈ W il existe un unique x = g(y) ∈ V tel que f (x) = y ce qui montre que f est bijective de V dans
W de réciproque g : W → V .
Il faut maintenant montrer que g est de classe C 1 et que Dg(y) = (Df (g(y)))−1 . On montre
d'abord que g est continue. Soient y, y0 ∈ W , on note x = g(y) et x0 = g(y0 ). On a
kx − x0 k =kGy (x) − Gy0 (x0 )k
≤kGy (x) − Gy (x0 )k + kGy (x0 ) − Gy0 (x0 )k
1
≤ kx − x0 k + k(Df (x0 ))−1 (y − y 0 )k
2
1
≤ kx − x0 k + k(Df (x0 ))−1 k × ky − y 0 k.
2
On a donc

(4.2.3) kg(y) − g(y 0 )k = kx − x0 k ≤ 2k(Df (x0 ))−1 k × ky − y 0 k,


42 CHAPITRE 4. INVERSION LOCALE  FONCTION IMPLICITE

ce qui prouve que g est continue.

Pour montrer que g est diérentiable sur W , on va montrer que Df (x) est inversible d'inverse
continue pour tout x ∈ V et que L = (Df (f −1 (y))−1 vérie (2.1.1) pour la fonction g. Soit x∈V et
y = f (x), d'après (4.2.2), on a
Df (x) = Df (x0 ) ◦ (I − DGy ).
Df (x0 ) est inversible d'inverse continue par hyptohèse et I −DGy aussi d'après le Lemme 1.5.4 puisque
kDGy k < 21 < 1 (y ∈ W ). Ainsi Df (x) est inversible et son inverse est continue. Soient maintenant
y ∈ W et k ∈ F tel que y + k ∈ W . On note x = g(y) et h tel que x + h = g(y + k), i.e. f (x + h) = y + k .
On a g(y + k) − g(y) = h et par ailleurs, puisque f est diérentiable

k = f (x + h) − f (x) = Df (x)(h) + khkε(h)


avec lim ε(h) = 0. Donc h = (Df (x))−1 (k) − khk(Df (x))−1 (ε(h)) et ainsi
h→0

g(y + k) − g(y) − (Df (x))−1 (k) = −khk(Df (x))−1 (ε(h)).


On en déduit que

kg(y + k) − g(y) − (Df (x))−1 (k)k ≤ khk × k(Df (x))−1 (ε(h))k


≤ (2k(Df (x0 ))−1 k × kkk) × (k(Df (x))−1 k × kε(g(y + k) − g(y))k),
où on a utilisé (4.2.3) avec y 0 = y + k pour majorer khk en terme de kkk (autrement dit pour
montrer qu'un o(h) est aussi un o(k)). Comme g est continue on lim ε(g(y + k) − g(y)) = 0 et donc
k→0
g(y + k) − g(y) − (Df (x))−1 (k) = o(k) ce qui prouve que g est diérentiable en y avec Dg(y) =
(Df (x))−1 = (Df (f −1 (y)))−1 .
Finalement, comme f −1 = g , Df et L 7→ L−1 sont continues cela prouve que Dg est continue et
1
donc g est de classe C .

Exemple 4.2.7. On va utiliser le théorème d'inversion locale pour résoudre l'équation diérentielle
f 0 (x) + f 2 (x) = g(x) sur [0, 1] avec condition initiale f (0) = 0 où g est une fonction continue donnée
susament petite dans un sens à préciser.

On note E = C01 ([0, 1]) C 1 (si f est solution elle est dérivable
l'ensemble des fonctions f de classe
0 2 1
et donc continue, on a alors f = g − f qui est continue donc f est C ) telles que f (0) = 0. On le
0 0
munit de la norme kf kE = supx∈[0,1] |f (x)| (vérier que c'est bien une norme). Soit F = C ([0, 1])
0 2
muni de la norme k k∞ . On dénit ϕ : E → F par ϕ(f ) = f + f . Résoudre l'équation revient à
trouver f ∈ E tel que ϕ(f ) = g . On peut noter que ϕ(0) = 0, donc on va chercher à appliquer le
théorème d'inversion locale à la fonction ϕ au point 0 ∈ E (g petit signie alors g est dans un voisinage
de 0 ∈ F pour k k∞ ).

On sait que (F, k k∞ ) est un espace de Banach. On peut montrer que (E, k kE ) l'est aussi (en
exercice). Pour pouvoir appliquer le Théorème d'inversion locale il faut montrer que ϕ est de classe
C1 et que Dϕ(0) est un homéomorphisme. On montre que ϕ est diérentiable et que pour tout f ∈ E
on a Dϕ(f )(h)R = h0 + 2f h (pour montrer la continuité de Dϕ(f ) on pourra remarquer que si f ∈ E
x
on a |f (x)| ≤ 0 |f 0 (t)|dt ≤ kf kE et donc kf k∞ ≤ kf kE ). On a alors
kDϕ(f ) − Dϕ(g)k = sup kDϕ(f )(h) − Dϕ(g)(h)k ≤ sup 2kf − gk∞ khk∞ ≤ 2kf − gkE ,
khkE ≤1 khkE ≤1

ce qui prouve que Dϕ est continue et donc ϕ est de classe C 1.


0
Finalement on a
R x : E 3 h 7→ h ∈ F . Tout k ∈ F
Dϕ(0) possède exactement un antécédent par
Dϕ(0), la fonction x 7→ 0 k(t)dt, donc Dϕ(0) est inversible. Par ailleurs on a pour tout k∈F

k(Dϕ(0))−1 (k)kE = k((Dϕ(0))−1 (k))0 k∞ = kkk∞ ,


4.3. LE THÉORÈME DES FONCTIONS IMPLICITES 43

ce qui prouve que (Dϕ(0))−1 est continue (de norme 1) et donc Dϕ(0) est bien un homéomorphisme.

D'après le Théorème d'inversion locale, il existe un voisinage V de 0 dans E et un voisinage W de


0 dans F tels que ϕ:V →W soit bijective, i.e. pour tout g∈W il existe un unique f ∈V tel que
f 0 + f 2 = g.
Il est à noter que cela montre l'existence d'une unique solution f seulement au voisinage de 0 (on
peut en fait montrer qu'il n'y en a pas d'autre du tout).

4.3 Le théorème des fonctions implicites


Considérons une fonction f : U → R où U ⊂ R2 . Etant donné λ ∈ R, on considère l'ensemble
Eλ = {(x, y) ∈ U, f (x, y) = λ}. De façon générique, l'ensemble Eλ est une courbe, appelée courbe
de niveau de la fonction f (pour le niveau λ).
Exemple 4.3.1. Soit f : R2 → R dénie par f (x, y) = x2 + √
y 2 . Si λ < 0 alors Eλ = ∅, E0 = {(0, 0)},
et si λ>0 alors Eλ est le cercle de centre (0, 0) et de rayon λ.

L'objectif ici est de savoir si on peut trouver une fonction d'une variable dont cette courbe (ou au
moins une partie de cette courbe) serait le graphe, i.e. existe-t-il une fonction ϕλ telle que (x, y) ∈ Eλ
si et seulement si y = ϕλ (x) ? Dans le cas de l'exemple précédent, on sait que l'on ne peut pas décrire
λ = 1, les deux points (0, 1) et (0, −1) sont
toute la courbe à l'aide d'une fonction. Si par exemple
ϕ(x) telle que ϕ(0) soit égal à la fois à 1 et à
sur le cercle, mais on ne peut pas trouver de fonction
+ + 2 2
−1. On pourra par contre décrire (par exemple)
√ le demi-cercle C = {(x, y) ∈ R × R , x + y = 1}
comme étant le graphe de la fonction ϕ(x) = 2
1 − x dénie sur l'intervalle [−1, 1].
De façon plus précise, la question que l'on se pose est la suivante : Etant donnés une fonction
f (x, y), un nombre réel λ et un point (x0 , y0 ) tel que f (x0 , y0 ) = λ, peut-on trouver un intervalle
(ouvert) I contenant x0 , un intervalle (ouvert) J contenant y0 et une fonction ϕλ (x) dénie sur I tels
que pour tout (x, y) ∈ I × J on ait f (x, y) = λ si et seulement si y = ϕλ (x) ?
On reprend l'exemple précédent, et on xe λ = R2 > 0 (il n'y a rien à faire sinon). On se donne un
point (x0 , y0 ) sur le cercle de centre (0, 0) et de rayon R, en particulier x0 ∈ [−R, R]. On peut alors
distinguer 3 cas :

1. x0 ∈] − R, R[ et y0 > 0. Le point (x0 , y√0 ) est sur le demi-cercle supérieur. On peut alors choisir
I =] − R, R[, J =]0, +∞[ et ϕλ (x) = R2 − x2 .
2. x0 ∈] − R, R[ et y0 < 0. Le point (x0 , y0 )√est sur le demi-cercle inférieur. On peut alors choisir
I =] − R, R[, J =] − ∞, 0[ et ϕλ (x) = − R2 − x2 .
3. x0 = ±R et alors y0 = 0. On considère par exemple x0 = R. Si I est un intervalle ouvert qui
contient x0 , il existe ε > 0 tel que [R − ε, R] ⊂ I , et de même il existe η > 0 tel que [−η, η] ⊂ J .
p p
Quitte à diminuer un peu ε, les points (R − ε, R 2 − (R − ε)2 ) et (R − ε, − R2 − (R − ε)2 )
p p
sont sur le cercle et les nombres R2 − (R 2 2
p − ε) et − R − (R − ε) sont p
2 dans J . On devrait

alors avoir en même temps ϕλ (R − ε) = R − (R − ε) et ϕλ (R − ε) = − R2 − (R − ε)2 , ce


2 2

qui est impossible.

Quelle diérence y a-t-il entre les points tels que x0 = ±R et les autres ? Graphiquement, celà se voit
très bien : ce sont les points où la courbe possède des tangentes verticales. En termes de la fonction
∂f
f cela se traduit par
∂y (x, y) = 0.
Théorème 4.3.2. Soient E, F, G des espaces de Banach, U ⊂ E × F un ouvert et f : U → G de
classe C . Soit (x , y ) ∈ U tel que D f (x , y ) ∈ L(F, G) soit un homéomorphisme. Alors il existe
1

des voisinages V de x , W de y et une unique application ϕ : V → W de classe C tels que


0 0 2 0 0
1
0 0

∀(x, y) ∈ V × W, f (x, y) = f (x0 , y0 ) ⇐⇒ y = ϕ(x).


44 CHAPITRE 4. INVERSION LOCALE  FONCTION IMPLICITE

De plus, pour tout x ∈ V on a


(4.3.1) Dϕ(x) = −(D2 f (x, ϕ(x)))−1 ◦ D1 f (x, ϕ(x)).

En particulier en x on obtient Dϕ(x ) = −(D f (x , y ))


0 0 2 0 0
−1
.
◦ D1 f (x0 , y0 )

Démonstration. L'idée de la démonstration est d'appliquer le théorème d'inversion locale. Pour


ça on dénit F :U →E×G par F (x, y) = (x, f (x, y)). La fonction F est de classe C1 sur U et on a

(4.3.2) DF (x, y)(h, k) = (h, Df (x, y)(h, k)) = (h, D1 f (x, y)(h) + D2 f (x, y)(k)).

Montrons que DF (x0 , y0 ) est un homéomorphisme. Si (h0 , k0 ) ∈ E × G on a

h0 = h

DF (x0 , y0 )(h, k) = (h0 , k 0 ) ⇐⇒
k 0 = D1 f (x0 , y0 )(h) + D2 f (x0 , y0 )(k)
h = h0

⇐⇒
k = (D2 f (x0 , y0 ))−1 (k 0 − D1 f (x0 , y0 )(h0 )).

DF (x0 , y0 ) est donc inversible et

(DF (x0 , y0 ))−1 (h0 , k 0 ) = (h0 , (D2 f (x0 , y0 ))−1 (k 0 − D1 f (x0 , y0 )(h0 )))

qui est continue par composition d'applications linéaires continues. DF (x0 , y0 ) est donc bien un ho-
méomorphisme.

U1 de (x0 , y0 ) et U2 de F (x0 , y0 ) =
D'après le théorème d'inversion locale il existe des voisinages
(x0 , f (x0 , y0 )) et G : U2 → V 2 C 1 inverse de F . Quitte à diminuer U2 on peut de plus
de classe
−1
supposer que U1 est de la forme U1 = V × W (on remplace U2 par F (U × V ) = G (U × V ) qui est
ouvert puisque G est continue). Si (a, b) ∈ U2 on a

(x, y) = G(a, b) ⇐⇒ (a, b) = F (x, y) = (x, f (x, y)),

autrement dit nécessairement x = a et donc G est de la forme G(a, b) = (a, g(a, b)). Quitte à restreindre
V, pour tout x ∈ V on a (x, f (x0 , y0 )) ∈ U2 donc il existe un unique y = g(x, f (x0 , y0 )) ∈ W
tel que F (x, y) = (x, f (x0 , y0 )) c'est-à-dire f (x, y) = f (x0 , y0 ). On dénit alors ϕ : V → W par
ϕ(x) = g(x, f (x0 , y0 )) qui est bien de classe C 1 .
Il reste à montrer (4.3.1). Pour tout x ∈ V , h(x) = f (x, ϕ(x)) = f (x0 , y0 ), i.e. h est constante, sa
diérentielle est donc nulle. Or, par diérentiation de fonctions composées on a

D1 f (x, ϕ(x)) + D2 f (x, ϕ(x)) ◦ Dϕ(x) = Dh(x) = 0.

D'autre part, d'après le Théorème d'inversion locale on sait que DF (x, y) est inversible sur V ×W et
donc D2 f (x, ϕ(x)) est inversible (cf. (4.3.2)). On en déduit (4.3.1).

Remarque 4.3.3
n
. Si dans le théorème 4.3.2, on suppose que

f est non seulement de classe C 1 , mais
n
de classe C (n ≥ 2) (resp. de classe C ), alors l'application ϕ : V → W est un C -diéomorphisme
(resp. C ∞ -diéomorphisme), d'après le Théorème 3.3.12.

Comme pour l'inversion locale, lorsqu'on est en dimension nie on peut voir ce que devient ce
théorème. On considère donc f : U → Rm avecU ⊂ Rn ' Rn−m × Rm (pour que D2 f (x0 , y0 ) soit
p
inversible il faut que F et G aient même dimension). On notera p = n − m et x = (x1 , ..., xp ) ∈ R et
y = (y1 , ..., ym ) ∈ Rm .
4.3. LE THÉORÈME DES FONCTIONS IMPLICITES 45

Théorème 4.3.4. Soient U ⊂ R p


× Rm un ouvert et f := (f , ..., f : U → Rm de classe C . Soit
1

tel que
1 m)
(a, b) ∈ U  
∂f1 ∂f1

.. ..
∂y1 (a, b) ··· ∂ym (a, b)
 
 
 
∂fm ∂fm
∂y1 (a, b) ··· ∂ym (a, b)

soit inversible. Alors il existe des voisinages V de a et W de b et une unique application ϕ : V → W


de classe C tels que
1

∀(x, y) ∈ V × W, f (x, y) = f (a, b) ⇐⇒ y = ϕ(x).


De plus on a
 −1  ∂f1 ∂f1

∂f1 ∂f1
···
.. .. ..
∂x1 (a, b)
..
∂xp (a, b)
∂y1 (a, b) ··· ∂ym (a, b)
   
Jϕ (a) = − 





.

∂fm ∂fm ∂fm ∂fm
∂y1 (a, b) ··· ∂ym (a, b) ∂x1 (a, b) ··· ∂xp (a, b)

Remarque 4.3.5 . Dans le cas p = m = 1, on retrouve bien l'hypothèse


∂f
∂y (a; b) 6= 0, et on a alors

∂f
(x, ϕ(x))
(4.3.3) ϕ0 (x) = − ∂f
∂x
.
∂y (x, ϕ(x))

En particulier,
∂f
(a, b)
ϕ0 (a) = − ∂f
∂x
.
∂y (a, b)
∂f ∂f
Dans le cas où
∂y (a, b) = 0 mais ∂x (a, b) 6= 0 on peut intervertir les rôles de x et y et exprimer x en
fonction de y au lieu de y en fonction de x.

Exemples 4.3.6. 1. On considère la courbe du plan dénie par l'équation f (x, y) := y 3 − xy − 1 =


0. Le point (0, 1) est sur la courbe. On montre qu'au voisinage de ce point, la courbe est le graphe
d'une fonction y = ϕ(x).
1 ∂f 2 ∂f
La fonction f est bien de classe C . Par ailleurs
∂y (x, y) = 3y − x d'où ∂y (0, 1) = 3 6= 0 et
on peut donc appliquer le Théorème des fonctions implicites et exprimer y en fonction de x au
voisinage de (0, 1).

Le théorème ne donne, par contre, aucune expression de ϕ. En utilisant (4.3.3) la fonction ϕ


vérie

ϕ(x)
(4.3.4) ϕ0 (x) = ⇐⇒ ϕ0 (x)(3ϕ(x)2 − x) − ϕ(x) = 0,
3ϕ(x)2 − x

qui est une équation diérentielle pas plus facile à résoudre que f (x, y) = 0. On peut cependant
utiliser cette dernière pour obtenir un DL de ϕ en 0 à tout ordre. On sait que ϕ est C 1 donc,
en utilisant (4.3.4), ϕ0 aussi donc ϕ est de classe C 2. Par récurrence on en déduit que ϕ est de
classe C∞ et admet donc un DL à tout ordre.

Par ailleurs on a ϕ(0) = 1 par dénition de ϕ et donc ϕ0 (0) = 31 d'après (4.3.4), d'où on obtient
x
ϕ(x) = 1 + 3 + o(x). En dérivant la deuxième expression de (4.3.4) on a

ϕ00 (x) × (3ϕ(x)2 − x) + ϕ0 (x) × (6ϕ(x)ϕ0 (x) − 1) − ϕ0 (x) = 0.

On en déduit que ϕ00 (0) = 0 et donc ϕ(x) = 1 + x3 + o(x2 ). En continuant ainsi on peut calculer
les dérivées successives de ϕ en 0 et ainsi obtenir un DL à tout ordre.
46 CHAPITRE 4. INVERSION LOCALE  FONCTION IMPLICITE

2. On considère l'équation f (x, y, z) = y + (x + y + z)2 + x4 + y 4 + z 4 − 2 = 0. C'est l'équation


3
d'une surface S dans R (si f (x, y, z) = ax + by + cz est linéaire, f (x, y, z) = 0 est l'équation
d'un plan, pas d'une droite). Le point P0 = (x0 , y0 , z0 ) = (0, 0, 1) est sur S . On a une équation et
trois variables, on va chercher à exprimer une variable en fonction des deux autres au voisinage
de ce point. La fonction f est bien de classe C 1, on a

∂f
(x, y, z) = 2(x + y + z) + 4z 3
∂z
∂f
et donc
∂z (0, 0, 1) = 6 6= 0. Il existe donc des voisinages V ⊂ R2 de (0, 0), W ⊂ R de 1 et
ϕ : V → W tels que pour tout (x, y, z) ∈ V × W on ait f (x, y, z) = 0 si et seulement si
z = ϕ(x, y). On a exprimé, au voisinage de P0 , la surface S comme le graphe de la fonction ϕ.
 −1
∂f
On a ϕ(0, 0) = 1 et par ailleurs Dϕ(0, 0) = − (0, 0, 1) D1 f (0, 0, 1), c'est-à-dire
∂z

∂f ∂f
∂ϕ ∂x (0, 0, 1) 1 ∂ϕ ∂y (0, 0, 1) 1
(0, 0) = − ∂f =− et (0, 0) = − ∂f =− .
∂x ∂z (0, 0, 1)
3 ∂y ∂z (0, 0, 1)
2
x y
D'où ϕ(x, y) = 1 − 3 − 2 + o(|x| + |y|) au voisinage de (0, 0).

Vous aimerez peut-être aussi