Vous êtes sur la page 1sur 72

L3 MASS — Calcul diff´erentiel (cours et exercices

)
John BOXALL
(Ann´ee universitaire 2009–2010)
Introduction
(0.1) Ce cours s’articule autour du calcul diff´erentiel et, en particulier, son application au
calcul des extremums d’une fonction, assujettie ou non `a des contraintes. Voici quelques exemples
typiques :
(0.1.1) D´eterminer si oui ou non la fonction la fonction (x, y) →
x
1+x
2
+y
2
a un maximum ou
un minimum sur R
2
et, le cas ´ech´eant, les trouver.
(0.1.2) Quelles sont les valeurs maximales et minimales de la fonction (x, y, z) → x +2y +3z
sur la sph`ere x
2
+y
2
+z
2
= 1 et pour quelles valeurs de (x, y, z) sont-elles atteintes ?
(0.1.3) Parmi les triangles de p´erim`etre donn´ee, lesquels ont la plus grande aire ?
(0.1.4) Soient a, b, α, β quatre r´eels tels que a < b. Pour toute fonction f : [a, b] → R de
classe (
(1)
telle que f(a) = α et f(b) = β on pose L(f) =
_
b
a
_
1 +f

(t)
2
dt. Quelle est la valeur
minimale de L(f) et pour quelles fonctions f est-elle atteinte ? Notons que L(f) est la longueur
de la courbe joignant les points (a, α) et (b, β) et d´efinie par y = f(x). Le probl`eme peut alors
ˆetre reformul´e ainsi : quelle est la courbe la plus courte joignant (a, α) et (b, β) ? Bien que ce
probl`eme soit classiquement pos´e pour les fonctions de classe (
(1)
, nous nous limiterons par souci
de simplicit´e aux fonctions de classe (
(2)
.
(0.2) Nous ´etudierons ensuite quelques ´equations diff´erentielles, et notamment les notions
d’´equilibre et de stabilit´e des solutions. En g´en´eral, on s’int´eresse `a une solution particuli`ere
d’une ´equation diff´erentielle (par exemple une solution constante), dite solution d’´equilibre.
L’´equation est alors dite stable si toutes les autres solutions s’approchent (dans un sens qui doit
ˆetre pr´ecis´e selon le contexte) `a la solution d’´equilibre lorsque t → +∞. Voici quelques exemples,
x

, x

d´esignant les d´eriv´ees successives de x par rapport `a t :
(0.2.1) Soient a, b, c trois r´eels tels que b ,= 0. L’´equation x

(t) + ax

(t) + bx(t) = c a alors
comme solution d’´equilibre la solution constante x
0
(t) =
c
b
. Pour quelle valeurs de a, b, c l’´equation
est-elle stable, c’est-`a-dire on a lim
t→+∞
x(t) =
c
b
pour toute solution x?
(0.2.2) On consid`ere le syst`eme
x

(t) = 1 −x(t)y(t)
y

(t) = x(t).
Quelles sont les solutions constantes de ce syst`eme ? Y-a-t-il stabilit´e locale autour de ces
solutions d’´equilibre ? Notons que chaque solution (x(t), y(t)) param`etre une courbe dans le plan :
il y a stabilit´e locale lorsque toute solution qui se trouve suffisamment proche `a une solution
d’´equilibre lorsque t est assez grand converge vers l’´equilibre lorsque t → +∞.
(0.2.3) Le dernier th`eme est consacr´e `a la d´emonstration de l’existence locale et l’unicit´e de
solutions de syst`emes d’´equations diff´erentielles sous des hypoth`eses convenables. Nous verrons sur
un exemple commment la m´ethode de d´emonstration, dans l’absence de solution exprimable en
1
termes des fonctions famili`eres (puissances, exponentielles, logarithmes, trigonom´etriques) permet
de construire une suite de solution approch´ees.
(0.3) Voici donc le contenu du cours.
— Th`eme 1. Ouverts et ferm´es de R
p
, fonctions continues R
p
→R;
— Th`eme 2. Compacts, connexes par arcs et connexes de R
p
;
— Th`eme 3. D´eriv´ees partielles, formule de Taylor ;
— Th`eme 4. Formes quadratiques, extremums libres ;
— Th`eme 5. Extremums li´es d’une fonction R
p
→R, m´ethode des multiplicateurs de Lagrange ;
— Th`eme 6.
´
Equations diff´erentielles, ´equilibre, stabilit´e ;
— Th`eme 7. Syst`emes d’´equations diff´erentielles ;
— Th`eme 8. Solutions p´eriodiques, cycles limites ;
— Th`eme 9. Calcul des variations ;
— Th`eme 10. Applications aux ´equations diff´erentielles.
Le texte conclut avec un appendice contenant quelques rappels.
Chaque th`eme est suivi par une collection d’exercices. Le num´ero de chaque exercice est pr´ec´ed´e
par une lettre e minuscule ; ainsi (e4.5) d´esigne l’exercice 5 qui se trouve `a la fin du th`eme 4.
Th`eme 1. Ouverts, ferm´es, fonctions continues
(1.1) On note K l’un des corps R et C. Soit E un K-espace vectoriel. On rappelle qu’une
norme sur E est une application [[.[[ : E →R qui v´erifie les propri´et´es
(i ) On a [[x[[ ≥ 0 pour tout x ∈ E,
(ii ) L’´el´ement x de E v´erifie [[x[[ = 0 si et seulement si 0,
(iii ) On a [[x +y[[ ≤ [[x[[ +[[y[[ pour tout x, y ∈ E,
(iv) On a [[λx[[ = [λ[ [[x[[ pour tout λ ∈ K et pour tout x ∈ E.
Un espace vectoriel norm´e est un espace vectoriel muni d’une norme.
(1.1.1) Lorsque K = R, un produit scalaire sur E est une forme bilin´eaire sym´etrique (voir
le paragraphe (A.4) de l’appendice pour plus de rappels) not´ee ¸., .) et v´erifiant
(i ) On a ¸x, x) >≥ 0 pour tout x ∈ E,
(ii ) L’´el´ement x de E v´erifie ¸x, x) = 0 si et seulement si 0.
Lorsque c’est le cas, la fonction x → ¸x, x)
1/2
est une norme, appel´ee norme associ´ee.
(1.1.2) De mˆeme, lorsque K = C, un produit hermitien sur E est une forme R-bilin´eaire
telle que ¸y, x) = ¸x, y) pour tout (x, y) ∈ E
2
et v´erifiant
(i ) ¸ix, y) = i¸x, y) pour tout (x, y) ∈ E
2
,
(ii ) On a ¸x, x) ≥ 0 pour tout x ∈ E,
(iii ) L’´el´ement x de E v´erifie ¸x, x) = 0 si et seulement si 0.
Un K-espace pr´ehilbertien est un K-espace vectoriel muni d’un produit scalaire (lorsque
K = R) ou un produit hermitien (lorsque K = C). Lorsque E est de dimension finie, on parle d’un
espace euclidien (lorsque K = R) ou d’un espace hermitien (lorsque K = C).
(1.1.3) On dit que x et y sont orthogonaux (ou perpendiculaires) si ¸x, y) = 0. L’in´egalit´e
de Cauchy-Schwarz est alors l’in´egalit´e [¸x, y)[ ≤ [[x[[ [[y[[ qui est valable quelque soit (x, y) ∈
2
E
2
. Elle a pour cons´equence l’in´egalit´e triangulaire [[x+y[[ ≤ [[x[[ +[[y[[, qui est encore valable
quelque soit (x, y) ∈ E
2
.
On trouvera au (e1.12) une ´etude des cas d’´egalit´e dans l’in´egalit´e de Cauchy-Schwarz et
l’in´egalit´e triangulaire.
(1.2) Dans ce cours, et au moins jusqu’au th`eme 8, l’exemple au centre de nos pr´eoccupations
est celui du R-espace vectoriel R
p
, p ≥ 1 ´etant un entier. Si x = (x
1
, x
2
, . . . , x
p
) ∈ R
p
et si
a ∈ R, on note ax = (ax
1
, ax
2
, . . . , ax
p
). Si encore y = (y
1
, y
2
, . . . , y
p
) ∈ R
p
, on a x + y =
(x
1
+y
1
, x
2
+y
2
, . . . , x
p
+y
p
). Trois normes interviennent particuli`erement souvent : si x ∈ R
p
, on
pose
[[x[[
1
= [x
1
[ +[x
2
[ + +[x
p
[,
[[x[[
2
= (x
2
1
+x
2
2
+ +x
2
p
)
1/2
,
[[x[[

= max¦[x[
1
, [x[
2
, . . . , [x[
p
¦.
Parmi ces trois normes, seule [[.[[
2
est associ´ee `a un produit scalaire, `a savoir
¸x, y) = x
1
y
1
+x
2
y
2
+ +x
p
y
p
.
(1.3) Soient E un espace vectoriel norm´e et soient x, y ∈ E. Intuitivement, au moins lorsque
E = R
p
et [[.[[ est la norme [[.[[
2
, [[y − x[[ est la distance entre les points d’un espace euclidien
dont les affixes sont x et y. Ainsi, si r ∈ R

+
et si x ∈ E, on appelle sph`ere de centre x et de
rayon r et on note S(x; r) l’ensemble des y ∈ E v´erifiant [[y−x[[ = r. De mˆeme, on appelle boule
ferm´ee de centre x et de rayon r l’ensemble des y ∈ E tels que [[y − x[[ ≤ r : elle est not´ee
K(x; r). Enfin, la boule ouverte de centre x et de rayon r, not´ee B(x; r), est l’ensemble des
y ∈ E v´erifiant [[y −x[[ < r.
Notons que, contrairement `a l’usage g´en´erale, l’usage math´ematique des mots sph`ere et boule
en donnent un sens pr´ecis : une sph`ere est creuse alors qu’une boule est solide. Lorsque p = 2, on
parle respectivement d’un cercle et d’un disque.
(1.3.1) Soit x ∈ E. Un voisinage de x est une partie V de E contenant une boule ouverte
B(x; r) avec r > 0 convenable.
(1.4) Soit U une partie de E. On dit que U est ouverte (ou : un ouvert), si, quelque soit
y ∈ U, il existe r > 0 telle que B(y; r) ⊆ U.
(1.4.1) Pour tout x ∈ E et pour tout r ∈ R

+
, la boule ouverte B(x; r) est un ouvert..
D´emonstration. Soit y ∈ B(x; r). Posons r

= [[y −x[[. Par hypoth`ese, r

< r. Soit z ∈ R
p
tel
que [[z −y[[ < r −r

. Or, on a [[z −x[[ = [[(z −y) + (y −x)[[ ≤ [[z −y[[ +r


_
r −r

_
+r

= r,
d’o` u z ∈ B(x; r). On en tire que la boule B(y, r −r

) est contenue dans B(x; r).
(1.4.2) La partie F de E est dite ferm´ee (ou un ferm´e) si son compl´ementaire F
c
est un
ouvert. (On consultera l’appendice pour la notation concernant les ensembles.)
(1.4.3) Pour tout x ∈ E et pour tout r ∈ R
+
, la boule ferm´ee K(x; r) est un ferm´e.
On v´erifie que K(x; r)
c
est un ouvert par un argument semblable `a la d´emonstration de (1.4.1).
(1.4.4) Proposition. (i ) Toute r´eunion d’ouverts de E est ouverte. Toute intersection d’un
nombre fini d’ouverts de E est ouverte.
(ii ) Toute intersection de ferm´es de E est ferm´ee. Toute r´eunion d’un nombre fini de ferm´es
de E est ferm´ee.
3
La d´emonstration a ´et´e vue en deuxi`eme ann´ee.
(1.5) Notons encore E un K-espace vectoriel norm´e. Soit X une partie de E. Rappelons qu’une
suite (u
n
) `a valeurs dans X est convergente s’il existe ∈ E avec la propri´et´e suivante :
quelque soit ε > 0, on peut trouver N
ε
tel que pour tout n ≥ N
ε
on ait [[u
n
−[[ ≤ ε.
On rappelle que est alors unique, et est appel´e la limite de (u
n
). On dit alors que (u
n
)
converge vers , et on ´ecrit u
n
→ λ lorsque n → +∞ ou encore lim
n→+∞
u
n
= .
On dit que la suite (u
n
) converge dans X si elle converge et sa limite appartient encore `a
X.
Exemple. Prenons p = 1, X =]0, 1]. La suite (
1
n
) converge vers 0 mais, puisque 0 / ∈ X, elle ne
converge pas dans X.
(1.5.1) Th´eor`eme. Soit X une partie de E. Pour que X soit ferm´ee, il faut et il suffit que la
limite de toute suite convergente et `a valeurs dans X appartienne `a E.
`
A nouveau, ce r´esultat a ´et´e vu en deuxi`eme ann´ee.
(1.6) Soit X ⊆ E et soit x ∈ X. On dit que x est un point int´erieur de X s’il existe r ∈ R

+
tel que B(x; r) ⊆ X. L’ensemble des points int´erieurs de X est un ouvert de E contenu dans X,
appel´e l’int´erieur de X et not´e

X. Si U ⊆ X est ouvert, alors tout point de U est un point
int´erieur de X et donc U ⊆

X. On a

X ⊆ X et

X = X si et seulement si X est ouvert.
Exemples. (i ) Soit X = [0, 1[. Alors

X =]0, 1[.
(ii ) Soit X = Q. Si x ∈ X et si r > 0, l’intervalle ]x−r, x+r[ contient toujours un irrationnel.
On en tire que ]x −r, x +r[ n’est pas contenu dans Q quelque soit la valeur de r. Donc x / ∈

Q et

Q = ∅.
(1.6.1) Soit X ⊆ E et soit x ∈ E. On dit que x est un point adh´erent de X si tout voisinage
de x rencontre X. L’ensemble des points adh´erents de X est appel´e l’adh´erence de X et est not´e
X. Alors X est un ferm´e, comme on peut voir en remarquant que tout x / ∈ X poss`ede un voisinage
qui ne rencontre pas X. De mˆeme, si F est un ferm´e contenant X, alors F ⊇ X. On a X ⊆ X et
X = X si et seulement si X est ferm´e.
Le point x est un point adh´erent de X si et seulement s’il existe une suite d’´el´ements de X
convergeant vers x.
D´emonstration. En effet, si x ∈ E et si n ∈ N

, la boule B(x;
1
n
) rencontre E en un point
u
n
. La suite (u
n
) converge alors vers x. R´eciproquement, si (u
n
) est une suite `a valeurs dans E
convergeant vers x et si r > 0, la d´efinition de convergence d’une suite implique que u
n
∈ B(x; r)
pour tout n assez grand.
Exemples. (i ) Si X = [0, 1[, alors X = [0, 1].
(ii ) Soit X = Q. Si x ∈ R, il existe une suite de rationnels convergeant vers x. On en tire que
x ∈ Q. Donc Q = R.
(1.6.2) Soient X, Y deux parties de E telles que X ⊆ Y . On dit que X est dense dans Y si
X ⊇ Y . On dit que X est dense si X = E. D’apr`es l’exemple pr´ec´edent, Q est dense dans R.
(1.6.3) Soit X ⊆ E. La fronti`ere de X est l’ensemble X −

X, not´e Fr(X). Si par exemple X
est une boule (ouverte ou ferm´ee) de centre x et de rayon r, alors X = K(x; r),

X = B(x; r) et
Fr(X) est alors la sph`ere S(x; r).
(1.7) Soient E, F deux K-espaces vectoriels norm´es, soit X une partie de E et soit f : X → F
4
une fonction. Soit x
0
∈ X. On dit que f est continue en x
0
si, quelque soit ε > 0, on peut trouver
δ (d´ependant de ε), tel que pour tout x ∈ X v´erifiant [[x − x
0
[[ ≤ δ, on ait [[f(x) − f(x
0
)[[ ≤ ε.
On dit que f est continue (ou continue sur X) si f est continue en tout point x
0
de X.
(1.7.1) Soient X, Y deux parties de E telles que Y ⊆ X et soit x
0
∈ Y . Si la fonction
f : X →R est continue en x
0
, alors la restriction de f `a Y est continue en x
0
. Rappelons que la
r´eciproque de cet ´enonc´e est fausse : si la restriction de f `a Y est continue en x
0
, on ne peut pas
conclure que f y est continue. Prenons comme exemple le cas o` u E = R, E

= [0, +∞[, x
0
= 0 et
f(x) = 1 si x ∈ E

, f(x) = 0 si x / ∈ E

(faire un croquis).
Soient f, g deux fonctions de X dans R et soit a ∈ R. On note respectivement f + g, f − g,
af, [f[, max(f, g), min(f, g) les fonctions d´efinies par (f + g)(x) = f(x) + g(x), (f − g)(x) =
f(x) −g(x), (af)(x) = a f(x), [f[(x) = [f(x)[, max(f, g)(x) = max
_
f(x), g(x)
_
et min(f, g)(x) =
min
_
f(x), g(x)
_
quelque soit x ∈ X. Si f(x) ,= 0 pour tout x ∈ X, on d´efinit
1
f
par
1
f
(x) =
1
f(x)
.
(1.7.2) Proposition. Soit x
0
∈ X et soient f, g : X →R deux fonctions.
(i ) Si f et g sont continues en x
0
, il en est de mˆeme pour f + g, pour f − g, pour af, pour
fg, pour [f[, pour max(f, g), pour min(f, g) et, le cas ´ech´eant, pour
1
f
.
(ii ) Si f et g sont continues sur E, il en est de mˆeme pour f +g, pour f −g, pour af, pour
fg, pour [f[, pour max(f, g), pour min(f, g) et, le cas ´ech´eant, pour
1
f
.
R´esum´e de la d´emonstration. (i ) Les cas de f +g, de f −g, de af, de fg et de
1
f
sont familiers.
En ce qui concerne [f[, on utilise l’in´egalit´e [[u[ −[v[[ ≤ [u −v[ valable quelque soit les r´eels u et
v. Si ε > 0, et x ∈ E sont tels que [f(x) −f(x
0
)[ ≤ ε, on a certainement [[f(x)[ −[f(x
0
)[[ ≤ ε. En
ce qui concerne les cas de max(f, g) et de min(f, g), on les d´eduit des cas pr´ec´edents en utilisant
les formules
max(u, v) =
u +v +[u −v[
2
, min(u, v) =
u +v −[u −v[
2
,
valables quelque soit les r´eels u et v. La partie (ii ) d´ecoule de la partie (i ) en faisant varier x
0
.
(1.7.3) Proposition. Soient E, F, G trois K-espaces vectoriels norm´es. Soit X ⊆ E, soit
Y ⊆ F et soient f : X → Y , g : Y → G deux fonctions.
(i ) Soit x
0
∈ X. Si f est continue en x
0
et si g est continue en f(x
0
), alors la fonction
compos´ee g ◦ f est continue en x
0
.
(ii ) Si f est continue sur X et si g est continue sur Y , alors g ◦ f est continue sur X.
On sait que les fonctions usuelles (fonctions puissance, exponentielle, polynˆome, logarithmique,
trigonom´etrique et trigonom´etrique r´eciproque) sont continues sur leur domaine de d´efinition. En
outre, les projections π
k
: R
p
→ R d´efinies par π
k
(x
1
, x
2
, . . . , x
p
) = x
k
pour 1 ≤ k ≤ p sont
continues. Cela permet d’´etablir la continuit´e de fonctions num´eriques E →R.
Exemples. (i ) Les fonctions x → [[x[[ et x → sin([[x[[) sont continues sur R
p
. (Ici, si x =
(x
1
, x
2
, . . . , x
p
), alors [[x[[ d´esigne la norme [[x[[
2
=
_
x
2
1
+x
2
2
+ +x
2
p
.) Puisque chacune des
fonctions x → x
k
est continue, et t → t
2
est continue, les fonctions compos´ees x → x
2
k
sont
continues. La somme de fonctions continues ´etant continue, x → x
2
1
+ x
2
2
+ + x
2
p
est continue.
Enfin, la fonction t →

t est continue, et x → [[x[[ est la compos´ee de t →

t avec x →
x
2
1
+x
2
2
+ +x
2
p
. D’o` u la continuit´e de x → [[x[[. Enfin, la fonction x → sin([[x[[) est le compos´e
de la fonction sinus avec la fonction x → [[x[[. La fonction t → sin t ´etant continue, il en de mˆeme
pour la fonction x → sin([[x[[).
(ii ) La fonction (u, v) → min(e
max(u,v)
,
1
v
) est continue sur ¦(u, v) [ R
2
[ v ,= 0¦. En effet,
puisque la fonction (u, v) → min(u, v) est continue, il suffit de v´erifier la continuit´e de chacune
des deux fonctions (u, v) → e
max(u,v)
et de (u, v) →
1
v
. La continuit´e de la premi`ere d´ecoule de
5
la continuit´e de (u, v) → max(u, v) est de la fonction exponentielle et celle de la seconde de la
continuit´e de (u, v) → v ainsi que de t →
1
t
sur R

.
(1.8) Th´eor`eme. Soient E, F deux K-espaces vectoriels norm´es, soit X une partie de E,
soit f : X → F une fonction et soit x
0
∈ E. Pour que f soit continue en x
0
, il faut et il suffit que
pour toute suite (u
n
) `a valeurs dans X telle que u
n
→ x
0
, on ait f(u
n
) → f(x
0
).
La d´emonstration se trouve dans les cours de premi`ere ou de deuxi`eme ann´ee.
(1.8.1) Th´eor`eme. Soient E, F deux K-espaces vectoriels norm´es, soit X une partie de E et
soit f : X → F une fonction.
(i ) On suppose que X soit un ouvert. Pour que f soit continue sur X, il faut et il suffit que,
quelque soit l’ouvert V de F, f
−1
(V ) soit un ouvert de E.
(ii ) On suppose que X soit un ferm´e. Pour que f soit continue sur X, il faut et il suffit que,
quelque soit, le ferm´e W de F, f
−1
(W) soit un ferm´e de E.
`
A nouveau, ce r´esultat a ´et´e vu en deuxi`eme ann´ee. Son utilit´e est qu’il permet de construire
facilement des exemples d’ensembles ouverts et ferm´es.
(1.8.2) Exemples. (i ) V´erifions `a nouveau qu’une boule ferm´ee est effectivement un ferm´e. En
effet, si x ∈ E et si r ∈ R

+
, alors K(x; r) = f
−1
([0, r]), o` u f est la fonction continue y → [[y −x[[.
Notons que [0, r] est bien un ferm´e de R, car son compl´ementaire est ] −∞, 0[∪]r, +∞[ ce qui est
la r´eunion des intervalles ouverts ] −∞, 0[ et ]r, +∞[, donc un ouvert selon (1.4.4) (i ).
(ii ) On voit de mˆeme fa¸con que les sph`eres S(x; r) sont ferm´es, car S(x; r) = f
−1
(¦r¦) et le
singleton ¦r¦ est ferm´e.
(iii ) Posons X = ¦(A, B, C) ∈ R
3
[ B
2
> 4AC¦. Alors X est ouvert, car si f d´esigne la
fonction f(A, B, C) = B
2
−4AC, alors f est continue et X = f
−1
(]0, +∞[). De mˆeme, l’ensemble
¦(A, B, C) ∈ R
3
[ B
2
< 4AC¦ est ouvert et l’ensemble ¦(A, B, C) ∈ R
3
[ B
2
= 4AC¦ est ferm´e.
(iv) Soit X = ¦(x, y, z) ∈ R
3
[ x + y + z ≤ 1 et x
2
+ y
2
+ z
2
= 1¦. Alors X = Y ∩ Z, o` u
Y = ¦(x, y, z) ∈ R
3
[ x +y +z ≤ 1¦ et Z = ¦(x, y, z) ∈ R
3
[ x
2
+y
2
+z
2
= 1¦. Puisque la fonction
f : (x, y, z) → x+y +z est continue et ] −∞, 1] est ferm´e Y = f
−1
(] −∞, 1]) est ferm´e. De mˆeme,
Z est ferm´e. En appliquant (1.4.4) (ii ), on conclut que X est ferm´e.
(1.9) Avertissement. Sauf indication contraire, l’espace vectoriel R
p
est toujours consid´er´e
comme muni de la norme [[.[[
2
. Ainsi, dans ce contexte, [[.[[ d´esigne [[.[[
2
, ¸x, y) d´esigne le produit
scalaire introduit dans le (1.2) et B(x; r), K(x; r) et S(x; r) d´esignent respectivement la boule
ouverte B
2
(x; r), la boule ferm´ee K
2
(x; r) et la sph`ere S
2
(x; r).
EXERCICES
(e1.1) V´erifier que la fonction (x, y) → ¸x, y) introduite dans (1.2) est bien un produit scalaire sur
R
p
.
(e1.2) Soit E un R-espace norm´e.
(i ) Montrer que [ [[x[[ −[[y[[ [ ≤ [[x −y[[ quelque soit x, y ∈ E. (D’abord remplacer x par x −y dans
l’in´egalit´e triangulaire.)
(ii ) Soient x, y ∈ E et soit r ≥ 0. Montrer que si [[y −x[[ ≤ r, alors [[y[[ ≤ [[x[[ +r.
(e1.3) Soit E un R-espace pr´ehilbertien.
(i ) Montrer que si x, y ∈ E sont orthogonaux, alors [[x +y[[
2
= [[x[[
2
+[[y[[
2
.
(ii ) Montrer que pour tout x, y ∈ E, on a ¸x, y) =
1
2
_
[[x +y[[
2
−[[x[[
2
−[[y[[
2
_
.
(e1.4) (i ) Montrer que l’ensemble Z des entiers relatifs est un ferm´e de R.
6
(ii ) Montrer qu’une suite `a valeurs dans Z est convergente si et seulement si elle est stationnaire
(c’est-`a-dire constante `a partir d’un certain rang).
(e1.5) Reprenons l’exemple (1.8.2) (iii ). Que dire de ¦(A, B, C) ∈ R
3
[ B
2
≥ 4AC¦ et de ¦(A, B, C) ∈
R
3
[ B
2
≤ 4AC¦ ?
(e1.6) On note respectivement U et F les parties

n∈Z
B(ne
1
;
1
2
) et

n∈Z
K(ne
1
;
1
2
) de R
p
, o` u e
1
d´esigne le point (1, 0, . . . , 0) de R
p
. (Ici, comme expliqu´e dans le (1.9), B d´esigne B
2
et K d´esigne K
2
.)
(i ) Faire un croquis de U et de F lorsque p = 1 et lorsque p = 2.
(ii ) Montrer que U est ouvert et F est ferm´e, quelque soit la valeur de p.
(e1.7) Soit E un espace vectoriel norm´e et soit X une partie de E. Montrer que E −X = E −

X et
que l’int´erieur de E −X est ´egale `a E −X.
(e1.8) Soit encore E un espace vectoriel norm´e et soient X, Y ⊆ E.
(i ) Montrer que X ∪ Y = X ∪ Y et que X ∩ Y ⊆ X ∩ Y .
(ii ) Trouver un exemple o` u X ∩ Y ,= X ∩ Y .
(e1.9) Soit x = (x
1
, x
2
, . . . , x
p
) ∈ R
p
. On note respectivement B
1
(x; r), B
2
(x; r), B

(x; r) les boules
ouvertes de R
p
pour les normes [[.[[
1
, [[.[[
2
et [[.[[

(voir (1.2)).
(i ) On prend p = 2. Tracer sur le mˆeme croquis les ensembles B
1
((0, 0); 1), B
2
((0, 0); 1), B

((0, 0); 1)
et B
1
((0, 0); 2).
(ii ) Montrer que pour tout pour tout z ∈ R
p
, on a [[z[[

≤ [[z[[
2
≤ [[z[[
1
≤ p[[z[[

.
(iii ) En d´eduire que pour tout x ∈ R
p
et pour tout r > 0, on a B
1
(x; r) ⊆ B
2
(x; r) ⊆ B

(x; r) ⊆
B
1
(x; pr).
(iv) En d´eduire que la propri´et´e d’une partie de R
p
d’ˆetre ouverte (ou ferm´ee) ne d´epend pas de la
norme choisie ([[.[[
1
, [[.[[
2
ou [[.[[

).
(v) Soit (u
n
) une suite `a valeurs dans R
p
et soit λ ∈ R
p
. Montrer que la propri´et´e que (u
n
) converge
vers λ ne d´epend pas de la norme choisie ([[.[[
1
, [[.[[
2
ou [[.[[

).
(e1.10) (i ) Notons (u
n
) =
_
(u
n
)
1
, (u
n
)
2
, . . . , (u
n
)
p
_
une suite `a valeurs dans R
p
et λ = (λ
1
, λ
2
, . . . , λ
p
)
un ´el´ement de R
p
. Montrer que u
n
→ λ si et seulement si pour tout k ∈ ¦1, 2, . . . , p¦ on a (u
n
)
k
→ λ
k
.
(Utiliser (e1.9).)
(ii )
´
Etudier la convergence dans R
2
de la suite de terme g´en´eral
_
1+
1
n
,
sin n
2
n
_
ainsi que celle de terme
g´en´eral (1, (−1)
n
).
(e1.11) Soit (u
n
) une suite `a valeurs dans E. Montrer que si (u
n
) converge vers λ, alors ([[u
n
[[)
converge vers [[λ[[. (Utiliser (e1.2) (ii ).) Donner des exemples o` u (u
n
) n’est pas convergente mais ([[u
n
[[)
converge.
(e1.12) Le but de cet exercice est d’´etudier les cas d’´egalit´e dans l’in´egalit´e de Cauchy-Schwarz et
l’in´egalit´e triangulaire. Pour simplicit´e, on suppose que le corps K soit ´egal `a R. Soit donc E un R-espace
pr´ehilbertien et soient x, y ∈ E. Il est clair que lorsque x = 0, les deux in´egalit´es deviennent des ´egalit´es.
On suppose donc que x ,= 0.
(i ) V´erifier qu’il existe (A, B, C) ∈ R
3
avec A > 0 tel que [[tx + y[[
2
= At
2
+ 2Bt + C quelque soit
t ∈ R. Pr´eciser les valeurs de A, B et de C en termes de x et de y.
(ii ) En utilisant le fait que [[tx + y[[
2
≥ 0 pour tout t ∈ R, montrer que B
2
≤ AC avec ´egalit´e si et
seulement s’il existe t ∈ R tel que tx +y = 0.
(iii ) En d´eduire que [¸x, y)[ ≤ [[x[[ [[y[[ avec ´egalit´e si et seulement si y est un multiple scalaire de x,
et que ¸x, y) = [[x[[ [[y[[ si et seulement si y est un multiple de x par un scalaire positif.
(iv) En d´eveloppant [[x + y[[
2
, retrouver l’in´egalit´e triangulaire et d´emontrer qu’elle devient une
´egalit´e si et seulement si y est un multiple de x par un scalaire positif.
(v) On munit R
2
de la norme [[.[[
1
. V´erifier que si x = (1, 0) et si y = (0, 1) alors [[x + y[[
1
=
[[x[[
1
+[[y[[
1
. Qu’en conclure ?
7
Th`eme 2. Compacit´e, connexit´e par arcs
(2.1) Notons encore K l’un des corps R ou C et E un K-espace vectoriel norm´e. On dit que
la partie X de E est born´ee si ¦[[x[[ [ x ∈ X¦ est une partie born´ee de R. La suite (u
n
) `a valeurs
dans X est dite born´ee si l’ensemble de ses valeurs ¦u
n
[ n ∈ N¦ est une partie born´ee de R.
Rappelons le r´esultat suivant.
(2.1.1) Proposition. Toute suite convergente est born´ee.
(2.2) On dit que la suite (u
n
) `a valeurs dans E v´erifie la propri´et´e de Cauchy (ou est de
Cauchy) si, ´etant donn´ee ε > 0, il existe N
ε
tel que [[u
m
−u
n
[[ ≤ ε quelque soient m, n ≥ N

.
(2.2.1) Th´eor`eme. (i ) Toute suite convergente est de Cauchy.
(ii ) Si E est de dimension finie, alors toute suite de Cauchy est convergente.
`
A nouveau, ce r´esultat fondamental a ´et´e vu en deuxi`eme ann´ee.
(2.3) La partie X de E est dite compacte (ou un compact) si toute suite `a valeurs dans X
poss`ede une suite extraite convergente dans X.
(2.3.1) Th´eor`eme de Bolzano-Weierstrass. (i ) Une partie compacte de E est ferm´e et
born´e.
(ii ) Si E est de dimension finie, alors toute partie ferm´ee et born´ee de E est compacte.
Exemple. Lorsque E est de dimension finie, les boules ferm´ees et les sph`eres sont compactes.
C’est le cas notamment lorsque E = R
p
.
(2.4) Il est important de souligner que l’hypoth`ese que E soit de dimension finie est indispen-
sable dans les parties (ii ) des th´eor`emes (2.2.1) et (2.3.1). Nous revenons sur ce point bri`evement
dans le th`eme 9. En g´en´eral, on appelle espace de Banach (respectivement espace de Hilbert)
un espace vectoriel norm´e (respectivement un espace pr´ehilbertien) o` u toute suite de Cauchy est
convergente. Il existe des espaces de Hilbert et de Banach de dimension infinie. Par contre, dans
un espace vectoriel norm´e de dimension infinie, on peut montrer qu’une boule ferm´ee n’est jamais
compacte.
(2.4.1) Mentionnons bri`evement un exemple simple d’un espace vectoriel norm´e (E, [[.[[) qui
n’est pas un espace de Banach. On prend pour E l’espace vectoriel des suites (u
n
)
n≥1
telles que
u
n
= 0 pour tout indice n `a un nombre fini d’exceptions pr`es. La loi d’addition est donn´ee par :
si (u
n
) et (v
n
) sont deux ´el´ements de E, (u
n
) +(v
n
) est la suite (u
n
+v
n
). L’´el´ement 0 est la suite
dont tous les termes sont nuls et l’oppos´e de la suite (u
n
) est la suite (−u
n
). Enfin, si λ ∈ K et si
(u
n
) ∈ E, on pose λ(u
n
) = (λu
n
).
Munissons E de la norme [[(u
n
)[[ = sup
n
[u
n
[. Nous cherchons une suite d’´el´ements de E qui
v´erifie la propri´et´e de Cauchy mais qui n’est pas convergente. Consid´erons pour cela la suite (u
(1)
n
),
8
(u
(2)
n
), . . ., (u
(k)
n
), . . ., (index´ee par k), o` u u
(k)
n
=
1
n
si n ≤ k et u
(k)
n
= 0 pour tout n > k. Ainsi,
(u
(1)
n
) = (1, 0, 0, 0, . . . , 0, 0, 0, . . . , )
(u
(2)
n
) = (1,
1
2
, 0, 0, . . . , 0, 0, 0, . . . , )
(u
(3)
n
) = (1,
1
2
,
1
3
, 0, . . . , 0, 0, 0, . . . , )
.
.
.
(u
(k)
n
) = (1,
1
2
,
1
3
,
1
4
, . . . ,
1
k
, 0, 0, . . . , )
(u
(k+1)
n
) = (1,
1
2
,
1
3
,
1
4
, . . . ,
1
k
,
1
k+1
, 0, . . . , )
.
.
.
On remarque que si < k, alors
(u
(k)
n
) −(u
()
n
) = (u
(k)
n
−u
()
n
) = (0, 0, 0, 0, . . . ,
1
+1
,
1
+2
, . . . ,
1
k
, 0, 0, . . . , ),
(autrement dit, u
(k)
n
−u
()
n
= 0 si n ≤ ou si n > k et u
(k)
n
−u
()
n
=
1
n
si < n ≤ k). On a alors
[[(u
(k)
n
) −(u
()
n
)[[ =
1
+1
,
ce qui tend vers 0 lorsque tend vers +∞. On voit donc que (u
(k)
n
) est bien une suite de Cauchy.
Si on fixe l’indice n, on voit que u
(k)
n
= 0 si k < n et u
(k)
n
=
1
n
si k ≥ n et donc la suite de r´eels
u
(k)
n
converge vers
1
n
. C¸ a sugg`ere que, lorsque k → +∞, la suite (u
(k)
n
) devrait converger vers la
suite
(∗) (u
n
) = (1,
1
2
,
1
3
, . . . ,
1
n
, . . . , ).
Le probl`eme est que la suite (∗) n’appartient pas `a E, car elle contient une infinit´e de termes
non-nuls. (En fait, tous les termes sont non-nuls). Afin de justifier rigoureusement que (u
(k)
n
) ne
converge vers aucun ´el´ement de E, on raisonne par l’absurde. Supposons donc que (u
(k)
n
) converge
vers une suite (v
n
) appartenant `a E. Choisissons un indice m tel que v
m
= 0. Pour tout k > m,
on a u
(k)
m
=
1
m
. Mais [u
(k)
m
− v
m
[ ≤ max
n
[u
(k)
n
−v
n
[ = [[(u
(k)
n
) − (v
n
)[[ ce qui tend vers 0 lorsque
k → +∞. Puisque u
(k)
m
=
1
m
lorsque k ≥ m et v
m
= 0, on en tire que
1
m
= [u
(k)
m
−v
m
[ → 0 lorsque
k → +∞, ce qui est absurde.
(2.4.2) Remarquons ´egalement que, avec les notations qui viennent d’ˆetre introduites, on a
[[(u
(k)
n
)[[ = 1 quelque soit k et, par cons´equent, tous les membres de la suite (u
(k)
n
) appartiennent
`a la boule unit´e ferm´ee unit´e de E. Mais (u
(k)
n
) ne contient aucune suite extraite convergente.
La d´emonstration est essentiellement la mˆeme que celle du fait que la suite elle-mˆeme n’est pas
convergente. Par cons´equent, la boule ferm´ee unit´e de E n’est pas compacte, ce qui montre que la
conclusion du point (ii ) du th´eor`eme de Bolzano-Weierstrass n’est pas forc´ement vraie si on omet
l’hypoth`ese que E soit de dimension finie.
(2.5) Th´eor`eme. Soit X une partie compacte non-vide de R. Alors X poss`ede un plus grand
´el´ement et un plus petit ´el´ement.
D´emonstration. Consid´erons le cas du plus grand ´el´ement : un raisonnement semblable permet
alors de traiter le cas du plus petit ´el´ement. D’apr`es le th´eor`eme de Bolzano-Weierstrass, X est
born´ee, et poss`ede donc une borne sup´erieure sup X. Il s’agit de montrer que sup X ∈ X (voir
(A.2.2)). Soit alors n ∈ N

. Il existe u
n
∈ X tel que (sup X) −
1
n
≤ u
n
≤ sup X. La suite (u
n
)
9
converge alors vers sup X. Puisque X est ferm´ee, sa limite appartient `a X, et on a donc bien
sup X ∈ X.
(2.6) Th´eor`eme. Soient E, F, deux espaces vectoriels norm´es et soit X une partie de E. Si
f : X →R une fonction continue et si Y ⊆ X est compact alors f(Y ) est compact.
D´emonstration. Soit (α
n
) une suite `a valeurs dans f(Y ). Pour tout n, il existe u
n
∈ Y tel que
f(u
n
) = α
n
. Puisque Y est compact, on peut extraire de (u
n
) une suite convergente (u
n
k
). Notons
λ sa limite : puisque Y est ferm´e on sait que λ ∈ X. Il s’ensuit que f(λ) ∈ f(Y ). Enfin, f ´etant
continue, (α
n
k
) =
_
f(u
n
k
)
_
converge vers f(λ).
(2.6.1) Corollaire. Soit X une partie de E, soit Y ⊆ X un compact et soit f : X → R une
fonction continue. Alors f poss`ede un maximum et un minimum sur Y .
D´emonstration. Dire que f poss`ede un maximum sur Y signifie qu’il existe x ∈ Y tel que
f(y) ≤ f(x) quelque soit y ∈ Y . Autrement dit, qu’il existe x ∈ Y tel que f(x) = sup f(Y ).
D’apr`es le th´eor`eme, on sait que f(Y ) est compact. Il suffit alors d’appliquer le th´eor`eme (2.5).
De mˆeme pour le minimum.
Exemple. Reprenons l’exemple (0.1.2) de l’Introduction. La sph`ere S = ¦(x, y, z) ∈ R
3
[
x
2
+ y
2
+ z
2
= 1¦ ´etant compacte et la fonction f : (x, y, z) → x + 2y + 3z ´etant continue, le
corollaire montre que f a un maximum et un minimum sur S. Par contre, il ne fournit pas de
m´ethode convenable pour trouver les valeurs de (x, y, z) qui r´ealisent le maximum ou le minimum.
Nous d´ecriverons une telle m´ethode dans le th`eme 5.
Le corollaire montre encore que toute fonction continue sur S a un maximum et un minimum
sur S.
(2.7) Soit E un K-espace vectoriel et soit [[.[[ et [[.[[

deux normes sur E. On dit que la norme
[[.[[

domine la norme [[.[[ s’il existe une constante A > 0 telle que [[x[[ ≤ A[[x[[

pour tout x ∈ E.
Deux normes sur le mˆeme espace vectoriel sont dites equivalentes si chacune domine l’autre.
L’´equivalence des normes est une relation d’´equivalence sur l’ensemble des normes sur un espace
vectoriel donn´e.
(2.7.1) Proposition. Si la norme [[.[[

domine la norme [[.[[, alors la fonction x → [[x[[ est
une fonction continue de l’espace norm´e (E, [[.[[

) vers R.
En effet, par hypoth`ese il existe A > 0 tel que [[x[[ ≤ A[[x[[

pour tout x ∈ E. Fixons x
0
∈ E et
montrons la continuit´e en x
0
. Soit ε > 0. On pose δ =
ε
A
. Alors [[x−x
0
[[ ≤ ε d`es que [[x−x
0
[[

≤ δ.
L’exercice (e1.9) montre que, sur R
p
, les normes [[.[[
1
, [[.[[
2
et [[.[[

sont ´equivalentes. C’est
un cas particulier du r´esultat suivant.
(2.7.2) Th´eor`eme. Soit E un K-espace vectoriel de dimension finie. Alors toutes les normes
sur E sont ´equivalentes.
D´emonstration. La d´emonstration peut se faire par r´ecurrence sur la dimension de E. Mais
le th´eor`eme peut ´egalement ˆetre vu comme une application des r´esultats pr´ec´edentes. Puisque
l’´equivalence de normes est une relation d’´equivalence, il suffit de montrer que toute norme sur E
est ´equivalente `a une norme fix´ee. Soit (x
1
, x
2
, . . . , x
n
) une base de E. On note [[.[[
1,E
la norme
d´efinie par [[x[[
1,E
=

n
i=1

i
[, o` u les λ
i
sont les coefficients dans l’´ecriture x =

i
λ
i
x
i
de x dans
la base (x
1
, x
2
, . . . , x
n
). Nous allons montrer que toute norme [[.[[ sur E est ´equivalente `a la norme
[[.[[
1,E
.
Soit donc [[.[[ une norme sur E. Montrons d’abord que [[.[[
1,E
domine [[.[[. Posons pour cela
10
A = max
i
[[x
i
[[
1,E
. Si x =

n
i=1
λ
i
x
i
, alors
[[x[[ = [[
n

i=1
λ
i
x
i
[[ ≤
n

i=1

i
[ [[x
i
[[ ≤ A
n

i=1

i
[ = A[[x[[
1,∞
,
ce qui montre bien que [[.[[
1,∞
domine [[.[[.
Il s’ensuit que x → [[x[[ est une fonction continue de l’espace norm´e (E, [[.[[
1,E
). Puisque E
est de dimension finie, la sph`ere unit´e S de cet espace est compact et, par cons´equent, la fonction
x → [[x[[ a un minimum sur cette sph`ere. Il existe donc B et z ∈ S tel que [[y[[ ≥ [[z[[ = B pour
tout y ∈ S. Puisque z ∈ S, on a z ,= 0 et donc B > 0. Soit enfin x ∈ E, x ,= 0. Alors x/[[x[[
1,E
∈ S
et donc [[x/[[x[[
1,E
[[ ≥ B. Par cons´equent, [[x[[ ≥ B[[x[[
1,E
et donc [[x[[
1,E

1
B
[[x[[, ce qui veut
dire que [[.[[ domine [[.[[
1,∞
.
(2.7.3) L’int´erˆet des normes ´equivalentes r´eside dans le fait que les notions de convergence,
continuit´e, ouvert, ferm´e, compacte, . . ., ne d´ependent pas de la norme `a ´equivalence pr`es. Au-
trement dit, si [[.[[ et [[.[[

sont deux normes ´equivalentes sur E, la suite (u
n
) d’´el´ements de E
converge dans (E, [[.[[) si et seulement si elle converge dans (E, [[.[[

) (et alors les deux limites sont
les mˆemes), elle v´erifie la propri´et´e de Cauchy dans (E, [[.[[) si et seulement si elle la v´erifie dans
(E, [[.[[

), un ensemble de E est un ouvert de (E, [[.[[) si et seulement s’il est un ouvert de (E, [[.[[

),
. . .. En particulier, lorsque E est de dimension finie, on peut parler de convergence, propri´et´e de
Cauchy, . . ., sans avoir besoin de pr´eciser la norme.
(2.8) Soit X une partie de E. On dit que X est connexe par arcs si, ´etant donn´e x, y ∈ X,
il existe une fonction continue φ : [0, 1] → X telle que φ(0) = x et φ(1) = y. Une telle fonction f
s’appelle un arc joignant x `a y.
Intuitivement, X est connexe par arcs si on peut bouger de fa¸con continue entre deux points
de X sans le quitter.
Par exemple, E est connexe par arcs. En effet, si x, y ∈ E l’arc le plus simple joignant x `a y
est sans doute le segment droit, o` u φ(t) = (1 −t)x +ty.
(2.8.1) Soit X ⊆ E et soient x, y et z ∈ E. S’il existe un arc dans X joignant x `a y et un
arc dans X joignant y `a z, alors il existe un arc dans X joignant x `a z. Intuitivement, il suffit
de suivre le premier arc puis le second. Math´ematiquement, on peut exprimer ce fait ainsi : si
φ : [0, 1] → X, θ : [0, 1] → X sont continues et si φ(0) = x, si φ(1) = y, si θ(0) = y et si θ(1) = z,
alors la fonction ψ : [0, 1] → X d´efinie par ψ(x) = φ(2x) si x ∈ [0,
1
2
] et par ψ(x) = θ(2x − 1) si
x ∈ [
1
2
, 1] est continue et v´erifie ψ(0) = x et ψ(1) = y.
Exemples. (i ) On dit que X est ´etoil´e s’il existe x ∈ X tel que, pour tout y ∈ X, le segment
droit joignant x `a y appartienne `a X. D’apr`es ce qui pr´ec`ede, toute partie ´etoil´ee est connexe par
arcs. En particulier, toute boule (ouverte ou ferm´ee) est ´etoil´ee, donc connese par arcs.
(ii ) Si X et Y sont connexes par arcs et si X ∩ Y ,= ∅, alors X ∪ Y est connexe par arcs. En
effet, si par exemple y
1
∈ X et y
2
∈ Y , on construit un arc passant de y
1
`a y
2
en passant d’abord
de y
1
`a un point x ∈ X ∩ Y puis de x `a y
2
.
(iii ) Si X est connexe par arcs, alors tout translat´e ¦x+a [ x ∈ X¦ (o` u a ∈ A) est connexe par
arcs. Si F est un second K-espace vectoriel norm´e, si f : E → F est continu et si X ⊆ E connexe
par arcs, alors f(X) est connexe par arcs. Les d´emonstrations de ces r´esultats sont faciles.
(iv) Une notion voisine `a celle de connexit´e par arcs et celle de connexit´e. Tout connexe par
arcs est connexe mais il existe des connexes qui ne sont pas connexes par arcs. Toutefois, pour
des ouverts d’un espace vectoriel norm´e, les deux notions sont ´equivalentes. Elles sont ´egalement
´equivalentes pour les parties de R; dans ce cas, les connexes par arcs sont les intervalles. On
trouvera des plus amples d´etails dans les cours de topologie destin´es aux ´etudiants en licence de
math´ematiques.
11
(2.9) Un arc polygonal joignant x `a y est un arc γ de la forme suivante : il existe un entier
n ≥ 1 et des points x
r
(0 ≤ r ≤ n) tels que x = x
0
et x
n
= y et γ est obtenu en prenant
successivement les segments droits joignant x
r−1
`a x
r
pour r = 1, 2, . . ., n.
(2.9.1) Proposition Soit U ⊆ E un ouvert et soient x, y ∈ U. S’il existe un arc param´etr´e
dans U joignant x `a y, alors il existe un arc polygonal dans U joignant x `a y.
Pour la d´emonstration, on se reporte `a nouveau au cours de licence de math´ematiques.
(2.10) La partie X de E est dite convexe si, quelque soit x, y ∈ E, le segment droit joignant
x `a y est contenu dans X. Il est clair que tout convexe est connexe par arcs, mais la r´eciproque
est inexacte. L’intersection d’une famille de parties convexes de E est convexe. Si X est convexe,
alors tout translat´e de X, ¦x + a [ x ∈ X¦ (o` u a ∈ A) est convexe. Si F est un second K-espace
vectoriel norm´e, si φ : E → F est lin´eaire et si X est un convexe de E, alors φ(X) est convexe.
`
A
nouveau, les d´emonstrations de ces r´esultats sont faciles.
(2.10.1) Toute boule (ouverte ou ferm´ee) est convexe, donc connexe par arcs.
D´emonstration. Quitte `a effectuer une translation, il suffit de consid´erer le cas d’une boule
centr´ee `a l’origine. Soient x, y ∈ E et soit r > 0 tel que [[x[[ < r, [[y[[ < r. Si t ∈ [0, 1], alors
1 −t ∈ [0, 1] et [[(1 −t)x +ty[[ ≤ [[(1 −t)x[[ +[[ty[[ ≤ (1 −t)[[x[[ +t[[y[[ ≤ (1 −t)r +tr = r. Le
r´esultat en d´ecoule aussitˆot.
On remarquera que la d´efinition de partie convexe de E ne fait pas intervenir la norme de E,
mais seulement la structure d’espace vectoriel. Le fait qu’une boule soit nec´essairement convexe est
donc tout `a fait remarquable. R´eciproquement, on peut utiliser des ensembles convexes convenables
sur un espace vectoriel pour construire des normes (voir (e2.11)).
(2.10.2) Soit X ⊆ E un convexe et soit f : X → R une application. On dit que f est
convexe (respectivement concave) si, quelque soient x, y ∈ X et quelque soit t ∈ [0, 1], on a
f((1 −t)x +ty) ≤ (1 −t)f(x) +tf(y) (respectivement f((1 −t)x +ty) ≥ (1 −t)f(x) +tf(y)).
EXERCICES
(e2.1) Soit (u
n
) =
_
(u
n
)
1
, (u
n
)
2
, . . . , (u
n
)
p
_
une suite `a valeurs dans R
p
. Montrer que (u
n
) est de
Cauchy si et seulement si chacune des suites r´eelles (u
n
)
k
, 1 ≤ k ≤ p est de Cauchy. (S’inspirer de
(e1.10).) En d´eduire le th´eor`eme (2.2.1) `a partir du cas p = 1.
(e2.2) Soit X = ¦(x, y) ∈ R
2
[ x ≤ y ≤ 2x¦. Faire un croquis de X. Montrer que X est ferm´e. X
est-il compact ? connexe par arcs ?
(e2.3) Posons X = ¦(x, y) ∈ R
2
[ [x[ + 2[y[ < 1¦. Faire un croquis de X. Montrer que X est born´e.
X est-il compact ? connexe par arcs ?
(e2.4) Soit X l’ensemble

n∈Z
K
2
((n, 0),
1
2
) dans R
2
. Croquis !
(i ) Montrer que X est connexe par arcs.
(ii ) X est-il compact ?
(e2.5) Soit X une partie finie de E. Montrer que X est compacte. Donner une condition nec´essaire
et suffisante pour que X soit convexe.
(e2.6) Quels sont les intervalles compacts dans R?
(e2.7) Soit I ⊆ R un intervalle et soit f : I → R une fonction continue. Utiliser les r´esultats sur la
connexit´e de ce th`eme ainsi que l’exercice pr´ec´edent pour d´emontrer les deux r´esulats suivants, vus en
1`ere ann´ee :
12
(i ) (Th´eor`eme des valeurs interm´ediaires). f(I) est un intervalle.
(ii ) Si I est un intervalle ferm´e et born´e, alors f(I) est un intervalle ferm´e est born´e.
(e2.8) Soit f : R
2
→R
3
la fonction d´efinie par f(x, y) = (cos x, sinxcos y, sinxsiny).
(i ) Expliquer pourquoi f est continue.
(ii ) Montrer que f(R
2
) = S((0, 0, 0), 1), la sph`ere de centre l’origine et de rayon 1.
(iii ) En d´eduire que S((0, 0, 0), 1) est connexe par arcs.
(e2.9) Soit X une partie non-vide de E. Pour tout x ∈ E, on pose d(x, X) = inf¦[[y −x[[ [ y ∈ X¦.
Ainsi, x → d(x, X) est une fonction E →R, appel´ee souvent la distance de x `a X.
(i ) Montrer que d(x, X) = 0 si et seulement si x ∈ X.
(ii ) Montrer que pour tout x, x

∈ E, on a [d(x, X) −d(x

, X)[ ≤ [[x −x

[[. (Montrer d’abord que si
y ∈ X, alors d(x, X) ≤ [[x −y[[ ≤ [[x −x

[[ +[[x

−y[[.) En d´eduire que x → d(x, X) est continue.
(iii ) Soit K un compact de E. Montrer que x → d(x, X) a un minimum et un maximum sur K.
(iv) On suppose X compact. Montrer que ¦x ∈ E [ d(x, X) ≤ r¦ est ferm´e et born´e quelque soit
r ≥ 0. En d´eduire que, lorsque E est de dimension finie, ¦x ∈ E [ d(x, X) ≤ r¦ est compact.
Si Y est une seconde partie de E, on pose d(X, Y ) = inf¦[[y −x[[ [ x ∈ X, y ∈ Y ¦.
(v) Montrer que si K est compact, si Y est ferm´e et si K ∩ Y = ∅, alors d(K, Y ) > 0.
(vi ) Donner un exemple de deux ferm´es A et B de R
2
tels que A∩ B = ∅ et d(A, B) = 0.
(e2.10) (i ) Soit (K
n
) une suite de compacts non-vides dans E telle que K
n
⊇ K
n+1
pour tout n.
Montrer que

n∈N
K
n
est non-vide. (Consid´erer une suite (u
n
) avec u
n
∈ K
n
pour tout n.)
(ii ) Donner un exemple d’une suite (F
n
) de ferm´es non-vides de R telle que F
n
⊇ F
n+1
pour tout n
mais

n∈N
F
n
= ∅.
(e2.11) Soit E un R-espace vectoriel et soit X une partie de E v´erifiant les propri´et´es suivantes.
(a) X est convexe,
(b) si x ∈ X, alors −x ∈ X,
(c) si x ∈ E, alors il existe λ > 0 tel que λx ∈ X,
(d) si x ∈ E −¦0¦, alors il existe µ > 0 tel que µx / ∈ X.
(i ) Montrer que 0 ∈ X et que, si x ,= 0, l’ensemble ¦λ ∈ R
+
[ λx ∈ X¦ est un intervalle qui est de
l’une des formes [0, t] ou [0, t[, o` u t > 0.
On pose [[x[[ = 0 lorsque x = 0 et [[x[[ = 1/t lorsque x ,= 0, t ´etant comme dans la question (i ).
(ii ) Montrer que [[.[[ est une norme sur E.
(iii ) Montrer que B(0; 1) ⊆ X ⊆ K(0; 1).
(e2.12) On reprend l’espace E introduit au (2.4.1). On note encore [[.[[ la norme sur E d´efinie au
(2.4.1) et [[.[[

la norme d´efinie par [[(u
n
)[[

=

n≥1
[u
n
[.
(i ) Justifier en d´etail que [[.[[

est bien une norme.
(ii ) Montrer que [[.[[

domine [[.[[ mais que [[.[[ ne domine pas [[.[[

. (On pourra consid´erer les ´el´ements
(v
(k)
n
) (o` u k = 1, 2, . . .) de E d´efinis par v
(k)
n
= 1 si n ≤ k et v
(k)
n
= 0 si n > k.)
La question (ii ) montre que, sur un espace vectoriel de dimension infinie, il peut exister des normes
qui ne sont pas ´equivalentes.
Th`eme 3. D´eriv´ees partielles, formule de Taylor
(3.1) Soit E un R-espace vectoriel norm´e. On appelle domaine de E toute partie ouverte
connexe par arcs de E.
(3.1.1) Fixons un entier p ≥ 1. On note (e
1
, e
2
, . . . , e
p
) la base standard de R
p
: par d´efinition,
e
k
est l’´el´ement (0, 0, . . . , 0, 1, 0, . . . , 0) de R
p
, la k-i`eme coordonn´ee ´etant ´egale `a 1 et toutes les
autres coordonn´ees ´etant nulles.
13
Soit Ω un domaine dans R
p
et soit f : Ω →R une fonction. Soit a ∈ Ω et soit k ∈ ¦1, 2, . . . , p¦.
La k-i`eme d´eriv´ee partielle de f en a est, par d´efinition, la limite
(*) lim
t→0
f(a +te
k
) −f(a)
t
,
si cette limite existe. Lorsque c’est le cas, on la note f

k
(a) ou
∂f
∂x
k
(a), si la variable est d´esign´ee
par x = (x
1
, x
2
, . . . , x
p
).
Notons que, puisque Ω est ouvert, a+te
k
appartient bien `a Ω lorsque [t[ est suffisamment petit.
Si E ⊆ Ω et si f

k
(a) existe pour tout a ∈ E, on obtient ainsi une fonction E → R qui est encore
not´ee f

k
ou
∂f
∂x
k
. Si toutes les d´eriv´ees partielles f

1
, f

2
, . . ., f

p
existent sur E, on appelle gradient
de f et on note grad(f) ou f

la fonction E →R
p
d´efinie par f

(x) =
_
f

1
(x), f

2
(x), . . . , f

p
(x)
_
.
Si a = (a
1
, a
2
, . . . , a
p
), l’existence de la limite (∗) ´equivaut `a la d´erivabilit´e en a
k
de la fonction
d’une seule variable t d´efinie par t → f(a
0
, a
1
, . . . , a
k−1
, t, a
k+1
, . . . , a
p
). Si par exemple p = 2,
Ω = R
2
et f(x, y) = e
xsin y
, on trouve
f

1
(x, y) =
∂f
∂x
= (sin y) e
xsin y
, f

2
(x, y) =
∂f
∂y
= x(cos y) e
xsin y
.
Il s’ensuit que f

(x, y) =
_
(sin y) e
xsin y
, x(cos y) e
xsin y
_
.
(3.1.2) Notons que si la k-i`eme d´eriv´ee partielle de f existe en a, alors
f(a +t
k
e
k
) = f(a) +t
k
f

k
(a) +[t
k
[ε(t
k
),
o` u ε(t
k
) → 0 lorsque t
k
→ 0.
(3.1.3) Soit v ∈ R
p
−¦0¦. La d´eriv´ee directionnelle de f en a dans la direction v est, par
d´efinition, la limite
lim
t→0
f(a +tv) −f(a)
t
,
si cette limite existe. En particulier, la k-i`eme d´eriv´ee partielle est ´egale `a la d´eriv´ee directionnelle
dans la direction e
k
.
(3.2) On dit que f est de classe (
(1)
sur Ω si, pour tout k ∈ ¦1, 2, . . . , p¦, f

k
existe et est
continue sur Ω.
(3.2.1) Th´eor`eme. Soit f de classe (
(1)
sur Ω. Alors pour tout h = (h
1
, h
2
, . . . , h
p
) ∈ R
p
avec
[[h[[ suffisamment petit, on a
f
_
a +h
1
e
1
+h
2
e
2
+ +h
p
e
p
_
= f(a) +¸h, f

(a)) +ε(h)[[h[[,
o` u ε(h) → 0 lorsque h → 0.
Pour tout v ∈ R
p
− ¦0¦, la d´eriv´ee directionnelle de f en a dans la direction de v existe et
vaut ¸v, f

(a)).
Le produit scalaire ¸., .) est celui d´efini au (1.2).
(3.2.2) D´emonstration de (3.2.1). Limitons-nous au cas p = 2, le cas g´en´eral se traitant de la
mˆeme mani`ere. On ´ecrit alors
f(a +h
1
e
1
+h
2
e
2
) −f(a) =
_
f(a +h
1
e
1
+h
2
e
2
) −f(a +h
2
e
2
)
_
+
_
f(a +h
2
e
2
) −f(a)
_
.
14
Ici, f(a +h
2
e
2
) −f(a) = h
2
f

2
(a) +h
2
ε
2
(h
2
) et f(a +h
1
e
1
+h
2
e
2
) −f(a +h
2
e
2
) = h
1
f

1
(a +h
2
e
2
) +
h
1
ε
1
(h
1
) o` u ε
k
(h
k
) → 0 lorsque h
k
→ 0 (k = 1, 2). On peut donc ´ecrire
f(a+h
1
e
1
+h
2
e
2
) =
= f(a) +h
1
f

1
(a) +h
2
f

2
(a) +h
1
_
f

1
(a +h
2
e
2
) −f

1
(a)
_
+h
1
ε
1
(h
1
) +h
2
ε
2
(h
2
)
= f(a) +¸h, f

(a)) +¸h, (f

1
(a +h
2
e
2
) −f

1
(a) +ε
1
(h
1
), ε
2
(h
2
))).
Or,
[¸h, (f

1
(a +h
2
e
2
) −f

1
(a) +ε
1
(h
1
), ε
2
(h
2
)))[ ≤ [[h[[ [[(f

1
(a +h
2
e
2
) −f

1
(a) +ε
1
(h
1
), ε
2
(h
2
))[[
et f

1
(a +h
2
e
2
) −f

1
(a) → 0 lorsque h
2
→ 0 car f est de classe (
(1)
. On en tire que (f

1
(a +h
2
e
2
) −
f

1
(a) +ε
1
(h
1
), ε
2
(h
2
)) → (0, 0) lorsque h → 0.
Si v ∈ R
p
−¦0¦ et si t ∈ R, alors d’apr`es ce qui pr´ec`ede, on a
f(a +tv) = f(a) +¸tv, f

(a)) +ε(tv)[[tv[[ = f(a) +t¸v, f(a)) +
_
ε(tv)[[v[[
_
[t[
d’o` u
f(a +tv) −f(a)
t
= ¸v, f

(a)) +ε(tv)[[v[[
ce qui tend vers ¸v, f

(a)) lorsque t → 0.
(3.3) Soit a ∈ Ω. On dit que la fonction f : Ω → R est diff´erentiable en a, s’il existe une
application lin´eaire L
a
: R
p
→R telle que pour tout h ∈ R
p
dont la norme est suffisament petite,
on ait f(a+h) = f(a) +L
a
(h) +ε(h)[[h[[. Ici comme pr´ec´edemment, on suppose ε(h) → 0 lorsque
h → 0. On montre que si f est diff´erentiable en a, alors l’application L
a
est unique. On l’appelle
alors la diff´erentielle de f en a et on la note df
a
. La fonction f est dite diff´erentiable sur Ω
si elle est diff´erentiable en tout point de Ω.
(3.3.1) Proposition. Toute fonction f sur Ω de classe (
(1)
est diff´erentiable. Si a ∈ Ω, alors
df
a
(h) = ¸h, f

(a)) quelque soit h ∈ R
p
.
D´emonstration. Il suffit d’appliquer (3.2.1).
(3.3.2) Proposition. Soit f : Ω →R de classe (
(1)
. Pour tout a ∈ Ω, on a
df
a
=
p

k=1
f

k
(a)(dx
k
)
a
.
D´emonstration. Soit h ∈ R
p
. On a (dx
k
)
a
(h) = ¸h, e
k
) et f

(a) =

p
k=1
f

k
(a)e
k
. Il suffit de
substituer ces formules dans la proposition pr´ec´edente.
(3.3.3) Soit f de classe (
(1)
sur Ω. On note alors df l’application a → df
a
. Il s’agit d’une
application de Ω dans le R-espace vectoriel L(R
p
, R) des application lin´eaires de R
p
dans R. Avec
cette notation, la proposition pr´ec´edente implique que
df =
p

k=1
f

k
dx
k
.
(3.4) Soit U un ouvert de R et soit γ : U →R
p
une application. Alors γ = (γ
1
, γ
2
, . . . , γ
p
) o` u
chacune des γ
k
est une application de U dans R. Si a ∈ U, on dit que γ est d´erivable en a si
15
chacune des γ
k
l’est. De mˆeme, γ est d´erivable sur U si chacune des γ
k
l’est et de classe (
(1)
si
chacune des γ
k
est continˆ ument d´erivable.
Soit Ω un domaine de R
p
. Supposons que γ prenne ses valeurs dans Ω. Si f : Ω → R
p
est
une application, on a l’application compos´ee f ◦ γ : U →R. Si f et γ sont continues, il en est
de mˆeme pour f ◦ γ. Si f et γ sont de classe (
(1)
, on a la formule pour la d´eriv´ee d’une fonction
compos´ee :
(3.4.1) Proposition. Soient f : Ω → R, γ : U → Ω de classe (
(1)
. Alors pour tout t ∈ E, on
a
(f ◦ γ)

(t) = ¸γ

(t), (f

(γ(t)))).
D´emonstration. Soit u ∈ R suffisament petit pour que t + u ∈ E. Posons alors a = γ(t),
h = φ(t +u) −φ(t), de sorte que φ(t +u) = a +h. On en tire que
f ◦ γ(t +u) = f(a +h) = f(a) +¸h, f

(a)) +ε(h)[[h[[
= f(γ(t)) +¸h, f

(γ(t))) +ε(h)[[h[[.
Dans cette formule, on ´ecrit h = γ(t + u) − γ(t) = uγ

(t) + uη(u), o` u η(u) → 0 lorsque u → 0.
´
Etudions d’abord le terme ¸h, f

(γ(t))). On trouve
¸h, f

(γ(t))) = u¸γ

(t), f

(γ(t))) +u¸η(u), f

(γ(t))).
D’apr`es l’in´egalit´e de Cauchy-Schwarz, [¸η(u), f

(γ(t)))[ ≤ [[η(u)[[ [[f

(γ(t))[[, ce qui tend vers 0
lorsque u → 0. En ce qui concerne le terme ε(h)[[h[[, on a d’abord [[h[[ = [u[ [[γ

(t) +η(u)[[ puis
ε(h)[[h[[ = ε
_
u(γ

(t) +η(u))
_
[u[ [[γ

(t) +η(u)[[.
Ici, [[γ

(t) + η(u)[[ reste born´e lorsque u → 0 et donc ε
_
u(γ

(t) + η(u))
_
→ 0 lorsque u → 0. Au
total, donc, on a
f ◦ γ(t +u) = f(γ(t)) +u¸γ

(t), f

(γ(t))) +θ(u)[u[
o` u θ(u) → 0 lorsque u → 0, ce qui permet de conclure en utilisant (3.2.1).
(3.5) Th´eor`eme des accroissements finis. Soit Ω un domaine de R
p
et soit f : Ω → R
une fonction de classe (
(1)
. Soit a, b ∈ Ω, soit [a, b] le segment droit joignant a `a b et soit
]a, b[= [a, b] −¦a, b¦. On suppose que [a, b] ⊆ Ω. Alors il existe c ∈]a, b[ tel que
f(b) −f(a) = ¸b −a, f

(c)).
Pour la d´emonstration, on r´eduit au cas d’une fonction d’une seule variable, dont nous rappe-
lons d’abord l’´enonc´e :
(3.5.1) Th´eor`eme. Soient u < v deux r´eels et soit φ : [u, v] → R une fonction continue,
d´erivable sur ]u, v[. Alors il existe w ∈]u, v[ tel que φ(v) −φ(u) = (v −u)φ

(w).
D´emonstration de (3.5). On applique ce r´esultat avec φ : [0, 1] → R d´efinie par φ(t) =
f
_
(1 −t)a + tb
_
. Autrement dit, φ = f ◦ γ, o` u γ : [0, 1] → Ω est donn´ee par γ(t) = (1 −t)a + tb.
En appliquant (3.4.1), on trouve
φ

(t) = ¸γ

(t), f

(γ(t))) = ¸b −a, f

(γ(t))).
D’apr`es (3.5.1), il existe w ∈]0, 1[ tel que φ(1) −φ(0) = φ

(w). Si l’on pose c = γ(w), alors c ∈]a, b[
et f(b) −f(a) = ¸b −a, f

(c)) comme voulu.
16
(3.5.2) Corollaire. Soit Ω un domaine et soit f : Ω → R une application de classe (
(1)
. Si
f

= 0, alors f est constante.
D´emonstration. Fixons a ∈ Ω. Il suffit de montrer que f(b) = f(a) quelque soit b ∈ Ω. Or,
d’apr`es (2.9.1), il existe un arc polygonal joignant a `a b. Un tel arc est r´eunion de segments
droits [a, x
1
], [x
1
, x
2
], . . ., [x
n−1
, b], chacun de ces segments ´etant contenu dans Ω. D’apr`es le
th´eor`eme (3.5), il existe c
1
∈]a, x
1
[ tel que f(x
1
) − f(a) = ¸x
1
− a, f

(c
1
)). Puisque f

= 0, on
en tire que f(x
1
) = f(a). En appliquant le th´eor`eme (3.5) de la mˆeme mani`ere sur chacun des
segments [x
1
, x
2
], . . ., [x
n−1
, b], on trouve successivement f(x
2
) = f(x
1
), . . ., f(b) = f(x
n−1
). Donc
f(b) = f(x
n−1
) = = f(x
2
) = f(x
1
) = f(a).
(3.6) Soit Ω un domaine dans R
2
et soit f : Ω → R une application de classe (
(1)
. Le
th´eor`eme des fonctions implicites affirme que si (a, b) ∈ Ω v´erifie f(a, b) = 0 et f

2
(a, b) ,= 0,
alors il existe un intervalle ouvert I contenant a et une application γ : I → R de classe (
(1)
telle
que γ(a) = b et f
_
u, γ(u)
_
= 0 pour tout u ∈ I. Si en outre on suppose I suffisamment petit,
alors γ est uniquement d´etermin´ee par ces conditions. G´eom´etriquement parlant, cela veut dire
que sur un voisinage du point (a, b), l’ensemble des solutions (u, v) de f(u, v) = 0 est repr´esent´e
par la courbe v = γ(u).
En outre, en appliquant (3.4.1) `a la fonction u → f(u, γ(u)) = 0, on trouve f

1
(u, γ(u)) +
γ

(u)f

2
(u, γ(u)) = 0. Par cons´equent, la pente de la tangente de la courbe au point (u, v), o` u
v = γ(u), est γ

(u) = −
f

1
(u,v)
f

2
(u,v)
et le vecteur f

(u, v) est normale `a la courbe.
De la mˆeme fa¸con, si f

1
(a, b) ,= 0, il existe un voisinage de (a, b) sur lequel l’ensemble des
solutions (u, v) de f(u, v) = 0 est une courbe de la forme u = δ(v), δ ´etant une fonction de classe
(
(1)
telle que δ(b) = a.
`
A nouveau, le vecteur f

(u, v) est normale `a la courbe.
On en tire donc que si f : Ω → R est de classe (
(1)
et si f n’a pas de point critique dans
Ω, alors l’ensemble des solutions (u, v) de f(u, v) = 0 est une courbe (ou r´eunion de courbes)
contenue dans Ω (pourvu qu’il soit non-vide). Le vecteur f

(u, v) est toujours normale `a la courbe
au point (u, v).
(3.7) Soit Ω ⊆ R
p
un domaine. Rappelons que toute fonction f : Ω → R
q
s’´ecrit f =
(f
1
, f
2
, . . . , f
q
), o` u les f
k
sont des fonctions de Ω dans R. On dit que f est de classe (
(1)
si
chacune des fonctions f
k
est de classe (
(1)
. Lorsque c’est le cas, il existe pour tout a ∈ Ω une
unique application lin´eaire df
a
: R
p
→R
q
telle que f(a +h) = f(a) +df
a
(h) +ε(h)[[h[[ pour tout
h ∈ R
p
tel que a + h ∈ Ω, et ε(h) → 0 lorsque h → 0.
`
A nouveau, df
a
s’appelle la diff´erentielle
de f en a. On a alors df
a
=
_
(df
1
)
a
, (df
2
)
a
, . . . , (df
q
)
a
_
.
Si Ω

est un domaine de R
q
, si f : Ω → Ω

et g : Ω

→R
r
sont de classe (
(1)
, alors g◦f : Ω →R
r
est de classe (
(1)
et pour tout a ∈ Ω on a d(g ◦ f)
a
= dg
f(a)
◦ df
a
.
(3.7.1) Soit f : Ω →R
q
une fonction de classe (
(1)
et soit a ∈ Ω. La matrice jacobienne de
f en a est par d´efinition la matrice `a q lignes et p colonnes
M
f
(a) =
_
_
_
_
_
_
∂f
1
∂x
1
(a)
∂f
1
∂x
2
(a)
∂f
1
∂x
p
(a)
∂f
2
∂x
1
(a)
∂f
2
∂x
2
(a)
∂f
2
∂x
p
(a)
.
.
.
.
.
.
.
.
.
.
.
.
∂f
q
∂x
1
(a)
∂f
q
∂x
2
(a)
∂f
q
∂x
p
(a)
_
_
_
_
_
_
.
Il s’agit de la matrice de df
a
par rapport aux bases standard de R
p
et de R
q
.
(3.7.2) Lorsque q = p, le jacobien de f en a est par d´efinition le d´eterminant de M
f
(a) : il
est not´e J
f
(a). Notons alors que a → J
f
(a) est une fonction de classe (
(1)
de Ω dans R.
17
Exemple. Soit f : R
2
→ R
2
d´efinie par f(x, y) = (x
2
y, xy
2
). Alors M
f
(x, y) =
_
2xy x
2
y
2
2xy
_
. Il
s’ensuit que J
f
(x, y) = 3x
2
y
2
.
(3.7.3) Proposition. Soit Ω

⊆ R
q
un domaine. Soient f : Ω → Ω

et g : Ω

→ R
r
deux
applications et soit a ∈ Ω.
(i ) Si f est diff´erentiable en a et si g est diff´erentiable en f(a), alors g ◦ f est diff´erentiable
en f(a) et l’on a d(g ◦ f)
a
= dg
f(a)
◦ df
a
. Par cons´equent,
M
g◦f
(a) = M
g
(f(a))M
f
(a).
(ii ) Si f et de classe (
(1)
sur Ω et si g est de classe (
(1)
sur Ω

, alors g ◦ f est de classe (
(1)
sur Ω.
(3.8) Nous allons conclure ce th`eme en ´enon¸cant sans d´emonstration deux r´esultats impor-
tants, dont des cas particuliers ont d´ej`a ´et´e ´evoqu´es.
(3.8.1) Th´eor`eme (de la fonction r´eciproque). Soit Ω ⊆ R
p
un domaine et soit f : Ω →R
p
est
une fonction de classe (
(1)
. Soit a ∈ Ω tel que J
f
(a) ,= 0. Alors il existe un ouvert U ⊆ Ω contenant
a tel que f restreinte `a U est une bijection de U sur son image f(U). En outre l’application
r´eciproque f
−1
: f(U) → U est de classe (
(1)
et l’on a df
−1
f(a)
= (df
a
)
−1
.
On remarque que la diff´erentielle de l’application identique est l’application identique, dont la
matrice jacobienne est la matrice identit´e. En appliquant (3.7.3), on constate ainsi que
M
f
−1(f(a)) = M
f
(a)
−1
.
Exemple. Dans l’exemple de (3.7.2), on a J
f
(a
1
, a
2
) ,= 0 si et seulement si soit a
1
,= 0 soit
a
2
,= 0. Ainsi, le th´eor`eme s’applique au voisinage de tout point de R
2
qui n’est pas situ´e sur l’un
des axes.
(3.9) Soient p ≥ 1, q ≥ 1 deux entiers, soit Ω
1
un domaine de R
p
et soit Ω
2
un domaine de
R
q
. On identifie R
p+q
avec R
p
R
q
, de sorte qu’un point de R
p+q
s’´ecrit (x, y) avec x ∈ R
p
et
y ∈ R
q
. On pose Ω = ¦(x, y) [ x ∈ Ω
1
, y ∈ Ω
2
¦, de sorte que Ω est un domaine de R
p+q
. Soit
f : Ω → R
q
une fonction de classe (
(1)
. Si (a, b) ∈ Ω, on note D
1
f
(a,b)
la diff´erentielle en a de
la fonction x → f(x, b) et D
2
f
(a,b)
la diff´erentielle en b de la fonction y → f(a, y). Les matrices
jacobiennes de D
1
f
(a,b)
et de D
1
f
(a,b)
sont alors respectivement
M
f,1
(a, b) =
_
_
_
_
_
_
∂f
1
∂x
1
(a, b)
∂f
1
∂x
2
(a, b)
∂f
1
∂x
p
(a, b)
∂f
2
∂x
1
(a, b)
∂f
2
∂x
2
(a, b)
∂f
2
∂x
p
(a, b)
.
.
.
.
.
.
.
.
.
.
.
.
∂f
q
∂x
1
(a, b)
∂f
q
∂x
2
(a, b)
∂f
q
∂x
p
(a, b)
_
_
_
_
_
_
.
et
M
f,2
(a, b) =
_
_
_
_
_
_
∂f
1
∂y
1
(a, b)
∂f
1
∂y
2
(a, b)
∂f
1
∂y
q
(a, b)
∂f
2
∂y
1
(a, b)
∂f
2
∂y
2
(a, b)
∂f
2
∂y
q
(a, b)
.
.
.
.
.
.
.
.
.
.
.
.
∂f
q
∂y
1
(a, b)
∂f
q
∂y
2
(a, b)
∂f
q
∂y
q
(a, b)
_
_
_
_
_
_
.
Le r´esultat suivant se r´eduit `a (3.6) lorsque p = q = 1.
18
(3.9.1) Th´eor`eme (des fonctions implicites). Soient p ≥ 1, q ≥ 1 deux entiers. On identifie
R
p+q
avec R
p
R
q
. Soit Ω
1
un domaine de R
p
et soit Ω
2
un domaine de R
q
. On pose Ω = Ω
1

2
:
c’est un domaine de R
p+q
. Soit f : Ω → R
q
une fonction de classe (
(1)
. Soit alors (a, b) ∈ Ω tel
que f(a, b) = 0. On suppose que D
2
f
(a,b)
soit inversible. Alors il existe un voisinage U ⊆ Ω
1
de a
et une unique fonction φ : U → Ω
2
de classe (
(1)
tels que b = φ(a) et f(u, φ(u)) = 0 quelque soit
u ∈ U. En outre, on a dφ
u
= −(D
2
f
(u,φ(u))
)
−1
◦ D
1
f
(u,φ(u))
.
Le lecteur reformulera la derni`ere alin´ea de l’´enonc´e en termes des matrices M
f,1
et M
f,2
. Elle se
d´emontre en remarquant que, puisque u → f(u, φ(u)) est la fonction nulle, sa diff´erentielle encore
est la fonction nulle. Mais la diff´erentielle se calcule `a l’aide de la formule pour la diff´erentielle
d’une fonction compos´ee (3.7.3). On trouve alors que 0 = D
1
f
(u,φ(u))
+D
2
f
(u,φ(u))

u
.
EXERCICES
(e3.1) Soit f : R
p
→ R la fonction d´efinie par f(x) = ¸x, a), o` u a ∈ R
p
est une constante. Calculer
f

. Mˆeme chose lorsque f est la fonction x → [[x[[
2
2
, la fonction x → [[x[[
4
2
, de la fonction x → ¸x, a)
2
, de
la fonction x → e
x,a
et de la fonction x → log(1 +[[x[[
2
2
).
(e3.2) Calculer les d´eriv´ees partielles de la fonction x → [[x[[

, en pr´ecisant les points x ∈ R
p
o` u
elles existent.
(e3.3) Soit f : (R

+
)
3
→R la fonction (x, y, z) → x
y
z
. Calculer
∂f
∂x
,
∂f
∂y
et
∂f
∂z
.
(e3.4) (i ) D´eterminer toutes les fonctions f : R
2
→ R de classe (
(1)
qui v´erifient f

1
(x, y) = x
et f

2
(x, y) = y pour tout (x, y) ∈ R
2
. En d´eduire toutes les fonctions f de classe (
(1)
qui v´erifient
df = xdx +ydy.
(ii ) D´eterminer toutes les fonctions g : R
2
→R de classe (
(1)
qui v´erifient g

1
(x, y) = 3y
2
−y
3
+x
2
et
g

2
(x, y) = 3xy(2 −y). En d´eduire toutes les fonctions g de classe (
(1)
v´erifiant dg = (3y
2
−y
3
+x
2
)dx +
3xy(2 −y)dy.
(iii ) D´eterminer toutes les fonctions f : R
3
→R de classe (
(1)
v´erifiant f

1
(x, y, z) = y, f

2
(x, y, z) = z
et f

3
(x, y, z) = y.
(e3.5) Soient p ≥ 1, r deux entiers. La fonction f : R
p
− ¦0¦ → R est dite homog`ene de degr´e r
lorsque f(λx) = λ
r
f(x) quelque soit λ ∈ R

et quelque soit x ∈ R
p
−¦0¦. Montrer que si f est homog`ene
de degr´e r, alors ¸f

(x), x) = rf(x) quelque soit x ∈ R
p
−¦0¦.
(e3.6) Soit f : R
2
→R la fonction d´efinie par f(x, y) = (x −1)(x + 2)(x
2
+ 1) +y
2
. On consid`ere le
lieu X = ¦(x, y) ∈ R
2
[ f(x, y) = 0¦.
(i ) Montrer que X est compact. (Pour montrer que E est born´e, montrer d’abord que si (a, b) ∈ X,
alors a ∈ [−2, 1].)
(ii ) Calculer f

. Montrer que si (a, b) ∈ X, alors f

(a, b) ,= 0.
(iii ) Soit (a, b) ∈ X avec f

2
(a, b) ,= 0. Quel r´esultat du cours vous permet d’affirmer qu’il existe un
intervalle ouvert I contenant a et une fonction γ : I → R v´erifiant γ(a) = b et f(t, γ(t)) = 0 pour tout
t ∈ I ? On pr´ecisera γ. Calculer γ

(a).
(iv) Soit (a, b) ∈ X avec f

1
(a, b) ,= 0. Expliquer pourquoi il existe un intervalle ouvert J contenant b
et une fonction γ : J → R v´erifiant δ(b) = a et f(δ(u), u) = 0 pour tout u ∈ I ? Existe-t-il une formule
explicite pour δ analogue `a celle de γ dans la question (iii ) ? Calculer δ

(b).
(e3.7) Soit α ∈ R, α ,= 0, et soit f : R
2
→ R la fonction d´efinie par f(x, y) = x
3
+ y
3
− 3αxy, o` u
(x, y) ∈ R
2
. On note X le lieu ¦(a, b) ∈ R
2
[ f(a, b) = 0¦.
(i ) Calculer f

. Montrer que le seul point (a, b) de X o` u f

(a, b) = (0, 0) est l’origine.
(ii ) Trouver les points (a, b) ∈ X tels que f

(a, b) ,= 0 mais soit f

1
(a, b) = 0 soit f

2
(a, b) = 0 (tangente
verticale ou horizontale).
(iii ) Soit (a, b) ∈ X tel que f

2
(a, b) ,= 0. Quel r´esultat du cours vous permet d’affirmer qu’il existe
un intervalle ouvert I contenant a et une fonction γ : I → R v´erifiant γ(a) = b et f(u, γ(u)) = 0 pour
19
tout u ∈ I ? Calculer γ

(a).
(e3.8) (i ) Soient a, b, c trois r´eels. Montrer que si le polynˆome x
3
+ax
2
+bx+c a trois racines r´eelles
deux-`a-deux distinctes distinctes, alors il existe des intervalles ouverts I
a
contenant a, I
b
contenant b et
I
c
contenant c tels que si a

∈ I
a
, b

∈ I
b
et c

∈ I
c
, alors le polynˆome x
3
+ a

x
2
+ b

x + c

a encore trois
racines r´eelles.
(ii ) Montrer que si α < β sont deux r´eels et si ε est suffisament petit, le polynˆome (x−α)(x−β)+εx
3
a trois racines r´eelles.
(e3.9) Soit f : R
2
→R
2
l’application d´efinie par f(u, v) = (e
u
cos v, e
u
sinv). Montrer que J
f
(u, v) ,=
0 quelque soit (u, v) ∈ R
2
mais que f n’est pas une bijection de R
2
sur lui-mˆeme.
Th`eme 4. Formes quadratiques, matrices sym´etriques, d´eriv´ees d’ordre 2,
extremums locaux
(4.1) Notons encore Ω un domaine de R
p
. Soit f : Ω → R une fonction et soient k, ∈
¦1, . . . , , p¦. Supposons que f

k
existe. Si, `a son tour f

k
poss`ede une d´eriv´ee partielle (f

k
)

, on la
note f

,k
(ou

2
f
∂x

∂x
k
). Il s’agit alors de la d´eriv´ee partielle seconde par rapport `a x
k
, x

. Fort
heureusement, il n’est pas en pratique nec´essaire de se souvenir de l’ordre des indices k et , en
raison du r´esultat suivant qui sera admis :
(4.1.1) Th´eor`eme. Soit f : Ω →R une application et soient k, ∈ ¦1, 2, . . . , p¦. On suppose
que f

,k
existe et est continue sur Ω. Alors f

et f

k,
existent et on a f

,k
= f

k,
.
(4.1.2) On dit que f est de classe (
(2)
si toutes les d´eriv´ees partielles secondes f

k,
existent
et sont continues. Soit f = Ω → R de classe (
(2)
et soit a ∈ Ω. On appelle matrice hessienne
de f en a la matrice carr´ee d’ordre p d´efinie par
H
f,a
=
_
_
_
_
f

1,1
(a) f

1,2
(a) f

1,p
(a)
f

2,1
(a) f

2,2
(a) f

2,p
(a)
.
.
.
.
.
.
.
.
.
.
.
.
f

p,1
(a) f

p,2
(a) f

p,p
(a)
_
_
_
_
.
D’apr`es (4.1.1), il s’agit d’une matrice sym´etrique.
Soit H = (H
i,j
) une matrice carr´ee sym´etrique d’ordre p. On note alors q(H, ) sa forme
quadratique associ´ee : celle-ci est d´efinie par la formule q(H, x) =

i,j
x
i
x
j
H
i,j
quelque soit
x = (x
1
, x
2
, . . . , x
p
) ∈ R
p
. (Bien que la formula d´efinissant q(H, x) ait un sens quelque soit la
matrice carr´ee H d’ordre p, nous ne parlerons d’une forme quadratique associ´ee que lorsque H est
sym´etrique.)
(4.2) Th´eor`eme. Soit f : Ω → R une application de classe (
(2)
et soient a, b ∈ Ω tels que
[a, b] ⊆ Ω. Alors il existe c ∈]a, b[ tel que
f(b) −f(a) = ¸b −a, f

(a)) +
1
2
q
_
H
f,c
, b −a
_
.
Ce r´esultat se d´eduit de la formule de Taylor en une variable par un argument semblable `a
celui utilis´e dans la d´emonstration du th´eor`eme (3.5).
20
(4.3) Notons p ≥ 1 un entier. Une forme quadratique en p variables est une fonction
q : R
p
→ R de la forme x →

p
i,j=1
A
ij
x
i
x
j
, o` u A
ij
, 1 ≤ i, j ≤ p sont des r´eels et x =
(x
1
, x
2
, . . . , x
p
). Notons que si l’on pose A

ij
=
A
ij
+A
ji
2
pour tout i, j, alors A

ij
= A

ji
pour tout i,
j et

p
i,j=1
A
ij
x
i
x
j
=

p
i,j=1
A

ij
x
i
x
j
quelque soit x ∈ R
p
. On peut donc supposer que A
ij
= A
ji
pour tout i, j, ce que nous allons faire par la suite.
La matrice A = (A
ij
) est alors sym´etrique : on l’appelle la matrice associ´ee `a q. Si
r´eciproquement A = (A
ij
) est une matrice carr´ee sym´etrique d’ordre p, alors la forme quadra-
tique q(A, ) d´efinie par x →

p
i,j=1
A
ij
x
i
x
j
s’appelle la forme quadratique associ´ee `a A.
(4.3.1) La forme quadratique q (ou la matrice sym´etrique associ´ee) est dite d´efinie positive
(respectivement d´efinie n´egative) si q(x) > 0 (resp. si q(x) < 0) quelque soit x ∈ R
p
− ¦0¦. Elle
est dite positive (respectivement n´egative) si q(x) ≥ 0 (resp. si q(x) ≤ 0) quelque soit x ∈ R
p
.
(4.3.2) S’agissant d’une fonction polynˆome, une forme quadratique q : R
p
→ R est continue.
Si x ∈ R
p
et si λ ∈ R, alors q(λx) = λ
2
q(x). Choisissons une norme sur R
p
et rappelons alors que
S(0; 1) d´esigne la sph`ere de centre 0 = (0, 0, . . . , 0) et de rayon 1 dans R
p
.
(4.3.3) Exemple. Prenons p = 3 et q(x
1
, x
2
, x
3
) = x
2
1
+ x
2
2
− 2x
2
x
3
. La matrice associ´ee est
_
_
1 0 0
0 1 −1
0 −1 0
_
_
. On a q(1, 0, 0) > 0 et q(0, 1, 1) < 0. Par cons´equent, q n’est ni positive ni n´egative.
(4.4) Proposition. Soit q une forme quadratique. Alors
(i ) q poss`ede un minimum m(q) et un maximum M(q) sur S(0; 1).
(ii ) Pour que q soit d´efinie positive (respectivement d´efinie n´egative), il faut et il suffit que
m(q) > 0 (resp. M(q) < 0).
(iii ) Pour que q soit positive (respectivement n´egative), il faut et il suffit que m(q) ≥ 0 (resp.
M(q) ≤ 0).
D´emonstration. (i ) Puisque q est continue et S(0; 1) compacte, c’est une cons´equence de (2.6.1).
(ii ) Supposons q d´efinie positive. Alors q(x) > 0 quelque soit x ∈ S(0; 1). En particulier
m(q) > 0 d’apr`es (i ). Si r´eciproquement m(q) > 0 et si x ∈ R
p
− ¦0¦, alors
x
||x||
∈ S(0; 1) et
q
_
x
||x||
_
≥ m(q) > 0 d’o` u q(x) ≥ [[x[[
2
m(q) > 0 et donc q est d´efinie positive. Le cas o` u q est d´efinie
n´egative ainsi que le (iii ) se d´emontrent d’une fa¸con analogue.
(4.5) Soit Ω un domaine de R
p
, soit a ∈ Ω et soit f : Ω → R une fonction. On dit que f
admet un maximum relatif strict (respectivement un minimum relatif strict) en a s’il existe
un voisinage U de a tel que pour tout x ∈ U − ¦a¦ on ait f(x) < f(a) (resp. f(x) > f(a)). On
dit que f admet un maximum relatif (respectivement un minimum relatif) en a s’il existe un
voisinage U de a tel que pour tout x ∈ U on ait f(x) ≤ f(a) (resp. f(x) ≥ f(a)).
Si f : Ω → R est de classe (
(1)
, on appelle point critique tout a ∈ Ω tel que f

(a) = 0. Une
valeur critique de f est une valeur f(a), a ´etant un point critique.
(4.5.1) Proposition. Soit f : Ω →R de classe (
(1)
et soit a ∈ Ω. Si f a un maximum relatif
ou un minimum relatif en a, alors a est un point critique.
D´emonstration. Consid´erons le cas d’un maximum relatif, le cas d’un minimum relatif ´etant
semblable. Supposons pour une contradiction que f

(a) ,= 0. Alors il existe un indice k tel que
f

k
(a) ,= 0. Supposons par exemple que f

k
(a) > 0. Puisque f

k
est continue, il existe une boule
ouverte B(a; r), o` u r > 0, telle que f

k
(u) > 0 quelque soit u ∈ B(a; r). Soit alors t ∈ R tel que
f(a + te
k
) ∈ B(a; r). D’apr`es le th´eor`eme des accroissements finis (3.5), il existe c ∈ [a, a + te
k
]
tel que f(a +te
k
) = f(a) +¸te
k
, f

(c)). Or, ¸te
k
, f

(c)) = tf

k
(c), d’o` u, en prenant t > 0, on trouve
21
¸te
k
, f

(c)) > 0 puis f(a +te
k
) > f(a), ce qui est le contradiction d´esir´ee.
Rappelons que la r´eciproque de cette proposition n’est pas vraie, mˆeme si p = 1. Par exemple,
la fonction f : t → t
3
sur R v´erifie f

(0) = 0 mais f n’a ni maximum ni minimum relatif en 0.
(4.6) Soit Ω un domaine de R
p
, soit a ∈ Ω et soit f : Ω → R de classe (
(2)
. Rappelons que
H
f,a
d´esigne alors la matrice hessienne de f en a (4.1.2)
(4.6.1) Th´eor`eme. Soit f : Ω →R de classe (
(2)
et soit a ∈ Ω un point critique.
(i ) Si q(H
f,a
, ) est d´efinie positive, alors f a un minumum relatif strict en a.
(ii ) Si q(H
f,a
, ) est d´efinie n´egative, alors f a un maximum relatif strict en a.
`
A nouveau, il n’y a pas de r´esultat analague lorsque q(H
h,a
, ) est seulement suppos´e n´egative
ou positive, comme le montre encore l’exemple de la fonction f(t) = t
3
en 0. Ici, on a f

(0) = 0 et
H
f,0
= 0, mais f n’a ni maximum ni minimum relatif en 0.
En ce qui concerne la d´emonstration, on choisit `a nouveau une boule ouverte B(a; r), r > 0,
contenue dans Ω. La formule de Taylor (4.2) montre que si x ∈ B(a; r)−¦a¦, alors il existe c ∈]a, x[
tel que
f(x) = f(a) +
1
2
q(H
f,c
, x −a).
Pla¸cons-nous dans le cadre du cas (i ). Si l’on peut ´etablir que H
f,c
est d´efinie positive sur un
voisinage U de a, on aura gagn´e car alors q(H
f,c
, x − a) < 0 et donc f(x) < f(a) pour tout
x ∈ U ∩ B(a; r) avec x ,= a. Avant de justifier l’existence de U, une courte digression sur la
topologie des ensembles de matrices sera utile.
(4.7) Si m, n dont deux entiers positifs, on note /
m,n
le R-espace vectoriel des matrices `a
coefficients dans R et `a m lignes et `a n colonnes. On pose /
n
= /
n,n
.
L’espace /
m,n
est de dimension mn. En effet, les matrices E
ij
, 1 ≤ i ≤ m, 1 ≤ j ≤ n, dont
le coefficient `a l’intersection de la i-i`eme ligne et la j-i`eme colonne vaut 1 et les autres coefficients
forment une base. Par cons´equent, /
m,n
est isomorphe `a R
mn
: pour donner un isomorphisme
explicite, il suffit d’envoyer la matrice A = (A
ij
) sur l’´el´ement
(A
11
, A
12
, . . . , A
1n
, A
21
, . . . , A
2n
, . . . , A
m1
, . . . , A
mn
)
de R
mn
. Ainsi, /
m,n
devient un espace vectoriel norm´e (en choisissant par exemple l’une des
normes [[.[[
1
, [[.[[
2
et [[.[[

de (1.2)). De toute fa¸con, /
m,n
´etant de dimension finie, toutes les
normes sont ´equivalentes et les consid´erations qui suivent ne d´ependeront pas de la norme choisie.
(4.8) Limitons-nous `a pr´esent au cas des matrices carr´ees /
n
.
´
Etudions les propri´et´es topo-
logiques de quelques ensembles remarquables de matrices.
(4.8.1) L’ensemble o
n
des matrices sym´etriques est un ferm´e de /
n
.
D´emonstration. En effet, il est d´efini comme ¦A ∈ /
n
[ A
ij
−A
ji
= 0 pour tout i, j¦.
(4.8.2) L’ensemble GL
n
des matrices inversibles de /
n
est un ouvert.
D´emonstration. Le d´eterminant d’une matrice ´etant un polynˆomes en ces coefficients, la fonc-
tion det : /
n
→ R qui associe `a toute matrice son d´eterminant est continue. Donc GL
n
= ¦A ∈
/
n
[ det(A) ,= 0¦ est ouvert.
(4.9) Revenons `a la d´emonstration du th´eor`eme (4.6.1) et notamment `a l’existence d’un voi-
sinage U de a tel que H
f,c
soit d´efinie positive pour tout c ∈ U. Puisque f est de classe (
(2)
,
l’application c → H
f,c
est continue. Il suffit donc de voir que l’ensemble des matrices sym´etriques
d´efinies positives est un ouvert relatif de o
n
. Soit donc A ∈ o
n
d´efinie positive et soit T ∈ o
n
. Il
22
s’agit de v´erifier que si tous les coefficients T
ij
de T sont suffisament petits, alors A+T est d´efinie
positive. Utilisons pour cela la proposition (4.4) (i ). Utilisons la norme [[.[[
1
. Soit m le minimum
de q(A, ) sur S
1
(0; 1), soit x ∈ S
1
(0; 1) et soit ε = max
i,j
[T
ij
[. Alors
q(A +T, x) = q(A, x) +q(T, x) ≥ m−

i,j
[T
ij
[ [x
i
[ [x
j
[ ≥ m−ε[[x[[
2
1
= m−ε.
Il s’ensuit que q(A + T, x) ≥ m − ε pour tout x ∈ S
1
(0; 1) et par cons´equent A + T est d´efinie
positive d`es que ε < m.
(4.10) Pour clore ce th`eme, nous allons passer en revue quelques propri´et´es g´en´erales des
formes quadratiques et notamment ces crit`eres pour qu’une forme soit d´efinie positive, positive,
d´efinie n´egative, ou n´egative. On note /
m,n
(C) l’ensemble des matrices complexes `a m lignes et
n colonnes et l’on pose /
n
(C) = /
n,n
(C). Si A ∈ /
m,n
(C), on note
t
A ∈ /
n,m
(C) la matrice
tranpos´ee : (
t
A)
i,j
= A
j,i
pour tout i, j.
Il convient d’identifier R
n
avec /
n,1
et C
n
avec /
n,1
(C) (matrices `a une colonne).
(4.10.1) Soit A ∈ /
n
(C) et soit λ ∈ C. On appelle espace propre associ´e `a λ le sous-espace
E
λ
(C) = ¦x ∈ C
n
[ Ax = λx¦ de C
n
. On dit que λ est une valeur propre de A si E
λ
(C) ,= ¦0¦.
Les ´el´ements non-nuls de E
λ
(C) sont alors appel´es les vecteurs propres associ´es `a λ. On pose
E
λ
= E
λ
(C) ∩ R
n
.
Le polynˆome caract´eristique de A est, par d´efinition, le polynˆome χ
A
(t) = det(tI
n
− A),
I
n
d´esignant la matrice identit´e d’ordre n. Alors χ
A
est unitaire et de degr´e n. (Certains auteurs
d´efinissent le polynˆome caract´eristique comme ´etant det(A −tI
n
) = (−1)
n
χ
A
(t).) Si A est r´eelle,
alors χ
A
(t) ∈ R[t]. Si λ ∈ C, alors λ est valeur propre de A si et seulement si λI
n
− A n’est pas
inversible, ou encore si et seulement si χ
A
(λ) = 0.
(4.10.2) Proposition. Toutes les valeurs propres d’une matrice sym´etrique r´eelle sont r´eelles.
D´emonstration. Soit donc A une matrice sym´etrique r´eelle et soit λ une valeur propre de A.
On note x ∈ C
n
un vecteur propre associ´e. Alors Ax = λx et donc Ax = λx, o` u x est obtenu
de x en rempla¸cant chaque coefficient de x par son conjugu´e complexe. En prenant la transpos´ee,
on trouve
t
x
t
A =
t
xA = λx car A est sym´etrique. Calculons donc
t
xAx de deux mani`eres. D’une
part,
t
xAx =
t
x(Ax) =
t
xλx = λ
t
xx; de l’autre part,
t
xAx = (
t
xA)x = λ
t
xx. Or, un vecteur
propre ´etant non-nul par d´efinition, on a
t
xx =

n
k=1
[x
k
[
2
,= 0. Par cons´equent, λ = λ et λ est
donc r´eel.
(4.10.3) La matrice U ∈ /
n
est dite orthogonale si
t
UU = I
n
. En particulier, une matrice
orthogonale U est inversible, et alors U
−1
=
t
U et U
t
U = I
n
. La matrice A ∈ /
n
est orthogonale
si et seulement si [[Ax[[
2
= [[x[[
2
quelque soit x ∈ /
n,1
.
Exemples. (i ) Toute matrice orthogonale d’ordre 2 est de l’une des formes
_
cos θ −sin θ
sin θ cos θ
_
,
_
−cos θ sin θ
sin θ cos θ
_
, θ ∈ R.
(ii ) Toute matrice de permuation est orthogonale. (Une matrice de permutation est une
matrice dont chaque ligne et chaque colonne un et un seul coefficient ´egal `a un, tous les autres
coefficients ´etant nuls. Exemple :
_
0 1 0
0 0 1
1 0 0
_
.
On trouvera la d´emonstration du r´esultat suivant dans l’appendice (A.7.5).
(4.10.4) Th´eor`eme. Soit A ∈ /
n
sym´etrique. Soit Λ ∈ /
n
une matrice diagonale dont
les coefficients diagonaux sont les valeurs propres de A, compt´ees avec multiplicit´es en tant que
racines de χ
A
(t).
23
Alors il existe une matrice orthogonale U ∈ /
n
telle que A =
t
UΛU.
Notons que Λ d´epend de l’ordre dans lequel on choisit les racines λ
i
. Or, permuter les λ
i
revient
`a multiplier U par une matrice de permutation.
(4.10.5) Corollaire. Soit A ∈ /
n
sym´etrique. Pour que A soit d´efinie positive (respective-
ment d´efinie n´egative, positive, n´egative), il faut et il suffit que toutes les valeurs propres de A
soient strictement positives (respectivement strictement n´egatives, positives, n´egatives).
D´emonstration. Rappelons que R
n
est identifi´e avec /
1,n
. On a donc q(A, x) =
t
xAx pour
tout x ∈ R
n
. Soit Λ, U comme dans le th´eor`eme (4.10.4). Alors A =
t
UΛU. Soit x ∈ R
n
et soit
y = Ux. Alors
q(A, x) =
t
xAx =
t
x
t
UΛUx =
t
yΛy =
n

k=1
λ
k
y
2
k
,
o` u les λ
k
sont coefficients diagonaux de Λ et y = (y
1
, y
2
, . . . , y
n
). On sait alors que les λ
k
sont les
valeurs propres de A, compt´ees avec multiplicit´es. Il est alors clair que si λ
k
> 0 quelque soit k,
alors q(A, x) > 0 pour tout x ∈ R
n
−¦0¦. Si r´eciproquement q(A, x) > 0 pour tout x ∈ R
n
−¦0¦,
on voit, en prenant x de telle mani`ere que y = e
k
, que q(A, x) = λ
k
> 0. Pareil dans les autres
cas.
(4.10.6) Corollaire. Pour que A soit d´efinie positive (respectivement d´efinie n´egative, posi-
tive, n´egative), il faut et il suffit que toutes les racines du polynˆome caract´eristique soient stricte-
ment positives (respectivement strictement n´egatives, positives, n´egatives).
(4.10.7) Corollaire. Si det A = 0, alors A n’est ni d´efinie positive ni d´efinie n´egative.
(4.11) Ainsi, pour d´eterminer la nature de la forme quadratique q, il suffit de connaˆıtre le
signe des racines du polynˆome caract´eristique de la matrice sym´etrique associ´ee. Notons A ∈ /
n
une matrice sym´etrique et
χ
A
(t) = t
n
+a
n−1
t
n−1
+a
n−2
t
n−2
+ +a
0
=
n

k=1
(t −λ
k
)
le polynˆome caract´eristique de A, le coefficient de t
k
´etant alors not´e a
k
et les racines λ
k
´etant
r´eelles. La proposition suivante, appliqu´ee avec p(t) = χ
A
(t), permet de tester si A est d´efinie
positive, d´efinie n´egative, positive ou n´egative ou si encore A ne poss`ede aucune de ses propri´et´es.
(4.11.1) Proposition. Soit p(t) = t
n
+ a
n−1
t
n−1
+ a
n−2
t
n−2
+ + a
0
un polynˆome unitaire
de degr´e n. On suppose que toutes les racines de p(t) sont r´eelles.
(i ) Une condition n´ecessaire et suffisante pour que toutes les racines de p(t) soit strictement
positives est que (−1)
n−k
a
k
> 0 pour tout k.
(ii ) Une condition n´ecessaire et suffisante pour que toutes les racines de p(t) soit strictement
n´egatives est que a
k
> 0 pour tout k.
(iii ) Une condition n´ecessaire et suffisante pour que toutes les racines de p(t) soit positives ou
nulles est que (−1)
n−k
a
k
≥ 0 pour tout k.
(iv) Une condition n´ecessaire et suffisante pour que toutes les racines de p(t) soit n´egatives
ou nulles est que a
k
≥ 0 pour tout k.
D´emonstration. (i ) Notons λ
k
, (1 ≤ k ≤ n) les racines de p(t). Supposons d’abord que λ
k
> 0
pour tout k. Alors −a
n−1
= λ
1
+ λ
2
+ + λ
n
> 0, a
n−2
=

i<j
λ
i
λ
j
> 0 et, en g´en´eral, si
k ∈ ¦0, 1, . . . , n¦, alors (−1)
n−k
a
k
=

1≤i
1
<i
2
<···<i
k
≤n
λ
i
1
λ
i
2
λ
i
k
> 0.
Supposons r´eciproquement que (−1)
n−k
a
k
> 0 quelque soit k. Il suffit de montrer que si t ≤ 0,
alors p(t) ,= 0. En effet, puisque les racines de p(t) sont toutes r´eelles, on en tirera qu’elles sont
toutes strictement positives.
24
Soit donc t ≤ 0 et soit k ∈ ¦0, 1, . . . , n¦. Si n est pair, alors le signe de t
k
est (−1)
k
= (−1)
n−k
et donc t
k
a le mˆeme signe que a
k
et a
k
t
k
≥ 0. En prenant la somme sur tout k ∈ ¦0, 1, . . . , n¦
et en notant que a
0
> 0, on en tire que p(t) > 0. Si n est impair, un argument semblable montre
que a
k
t
k
≤ 0 pour tout k et, en prenant la somme sur k et en notant que a
0
< 0, on conclut que
p(t) < 0.
Les ´enonc´es (ii ), (iii ), (iv) se d´emontrent de la mˆeme mani`ere.
(4.12) En pratique, le calcul du polynˆome caract´eristique d’une matrice carr´ee d’ordre n
devient lourde si n est grand, sauf dans les cas particuliers. La proposition suivante remplace ce
calcul par celui des d´eterminants de certaines sous-matrices de A.
(4.12.1) Proposition. Soit A ∈ /
n
, A = (A
ij
) une matrice sym´etrique. Pour tout r ∈
¦1, 2, . . . , n¦, on note A
(r)
la matrice sym´etrique (A
ij
), 1 ≤ i, j ≤ r, de /
r
.
(i ) Pour que A soit d´efinie positive, il faut et il suffit que det(A
(r)
) > 0 pour tout r ∈
¦1, 2, . . . , n¦.
(ii ) Pour que A soit d´efinie n´egative, il faut et il suffit que (−1)
r
det(A
(r)
) > 0 pour tout
r ∈ ¦1, 2, . . . , n¦.
La d´emonstration se fait par r´ecurrence sur n; les d´etails sont omis. Remarquons qu’il n’y a
pas de crit`ere analogue pour que A soit positive ou n´egative. Par exemple, la matrice A =
_
0 0
0 1
_
est positive, mais det(A
(1)
) = det(A) = 0. De mˆeme, la matrice −A est n´egative, mais on a encore
det(−A
(1)
) = det(−A) = 0.
(4.13) Voici une seconde m´ethode pour tester si une forme quadratique est d´efinie positive
ou n´egative, qui est en g´en´eral moins lourde lorsque n est grand (au moins pour un ordinateur).
L’id´ee de cette m´ethode, dite la m´ethode de Gauss, est d’´ecrire la forme comme somme de
carr´es de formes lin´eaires mulipli´es par des coefficients r´eels.
(4.13.1) Rappelons que toute forme lin´eaire R
n
→ R s’´ecrit x →

n
k=1
a
k
x
k
= ¸a, x), o` u
a = (a
1
, a
2
, . . . , a
n
) ∈ R
n
et x = (x
1
, x
2
, . . . , x
n
) ∈ R
n
. Si E est un R-espace vectoriel, les formes
lin´eaires sur E constituent ´egalement un R-espace vectoriel que l’on note L(E, R) (voir (A.3)).
On peut ainsi parler de formes lin´eaires lin´eairement ind´ependantes. La famille (
1
,
2
, . . . ,
n
) de
formes lin´eaires est lin´eairement ind´ependante (ou libre) si et seulement si la relation
n

i=1
λ
i

i
(x) = 0, (λ
1
, λ
2
, . . . , λ
n
) ∈ R
n
,
pour tout x ∈ E entraˆıne λ
1
= λ
2
= = λ
n
= 0.
(4.13.2) Notons donc q : R
n
→ R une forme quadratique. Si n = 1, alors il existe λ ∈ R tel
que q(x) = λx
2
= λ(x)
2
quelque soit x ∈ R, o` u est la forme lin´eaire (x) = x.
Supposons donc n ≥ 2. D´egageons les termes de q qui font intervenir x
n
, en ´ecrivant q(x) =
q
0
(x) + (2A
1n
x
1
x
n
+ 2A
2n
x
2
x
n
+ + 2A
n−1,n
x
n−1
x
n
+ A
nn
x
2
n
), o` u q
0
ne fait intervenir que x
1
,
x
2
, . . ., x
n−1
. On veut proc´eder par r´ecurrence sur n : sachant d´ej`a ´ecrire une forme quadratique
en au plus n − 1 variables sous la forme

m
i=1
λ
i

i
(x)
2
avec λ
i
∈ R pour tout i et (
1
,
2
, . . . ,
m
)
une famille libre de formes lin´eaires on souhaite le faire pour q. Si q = q
0
(c’est-`a-dire A
kn
= 0
pour tout k ∈ ¦1, 2, . . . , n¦), il n’y a rien `a faire. Dans le cas contraire, il y a deux possibilit´es `a
consid´erer selon que A
nn
,= 0 ou A
nn
= 0.
Supposons d’abord que A
nn
,= 0. Alors on peut compl´eter le carr´e :
2A
1n
x
1
x
n
+ + 2A
n−1,n
x
n−1
x
n
+A
nn
x
2
n
= A
nn
_
A
1n
A
nn
x
1
+ +
A
n−1,n
A
nn
x
n−1
+x
n
_
2
+q
1
(x),
25
o` u q
1
(x) ne d´epend que de x
k
, avec 1 ≤ k ≤ n−1. Donc q(x) = q
0
(x) +q
1
(x) +A
nn
_
A
1n
A
nn
x
1
+ +
A
n−1,n
A
nn
x
n−1
+x
n
_
2
, o` u q
0
+q
1
ne d´epend que de x
k
avec 1 ≤ k ≤ n −1.
Supposons ensuite que A
nn
= 0. On se ram`ene au cas pr´ec´edent `a l’aide de l’astuce suivante.
Par hypoth`ese, il existe un indice k < n tel que A
kn
,= 0. Effectuons alors le changement de
variable x
k
= x

k
+ x
n
. Avec les variables (x
1
, . . . , x
k−1
, x

k
, x
k+1
, . . . , x
n
), le coefficient de x
2
n
dans
q devient A
kn
, et on peut donc proc´eder comme auparavant.
Cette proc´edure exprime q(x) sous la forme q

(x) + λ
n

n
(x)
2
, o` u la forme quadratique q

ne
d´epend que de x
1
, x
2
, . . ., x
n−1
, λ
n
∈ R et
n
∈ L(R
n
, R) d´epend effectivement de x
n
. (Si q ne
d´epend pas de x
n
, on pose λ
n
= 0 et
n
(x) = x
n
.) Par r´ecurrence, on trouve une expression pour
q(x) sous la forme

m
k=1
λ
k

k
(x)
2
, o` u λ
k
∈ R et
k
∈ L(R
n
, R) est de la forme
k
(x) = ¸a, x) avec
a de la forme (a
1
, . . . , a
k
, 0, . . . , 0) et a
k
,= 0. Par cons´equent, les formes (
k
)
1≤k≤n
forment une
famille libre dans L(R
n
, R). Cela implique que m ≤ n, car L(R
n
, R) est de dimension n.
En pratique, on ne prend pas forc´ement les variables x
k
dans l’ordre : si par exemple A
nn
= 0
mais il existe un indice m tel que A
mm
,= 0, il y a clairement avantage de remplacer x
n
par x
m
dans le raisonnement ci-dessus.
(4.13.3) Proposition. Soit q : R
n
→R une forme quadratique.
(i ) Si q s’´ecrit comme somme de n carr´es de formes lin´eaires lin´eairement ind´ependantes,
alors q est d´efinie positive.
(ii ) Si q s’´ecrit comme moins la somme de n carr´es de formes lin´eaires lin´eairement ind´epen-
dantes, alors q est d´efinie n´egative.
(iii ) Si q s’´ecrit comme somme de carr´es de formes lin´eaires, alors q est positive.
(iv) Si q s’´ecrit comme moins la somme de carr´es de formes lin´eaires, alors q est n´egative.
D´emonstration. (i ) Supposons que q(x) =

n
k=1

k
(x)
2
, avec les formes lin´eaires
k
, 1 ≤ k ≤ n
lin´eairement ind´ependantes. Il est clair que q(x) ≥ 0 pour tout x ∈ R
n
. Si q(x) = 0, alors
k
(x) = 0
pour tout k et, les formes lin´eaires
k
´etant lin´eairement ind´ependantes et en nombre n, on en tire
que x = 0. Les parties (ii ), (iii ) et (iv) se traitent de la mˆeme mani`ere.
Traitons quelques exemples.
(4.14) (i ) q(x
1
, x
2
, x
3
) = x
2
1
+ 2x
1
x
2
+ 2x
2
x
3
. Ici, la forme contient le terme x
2
1
. Compl´etons
donc le carr´e en utilisant x
1
`a la place de x
n
:
q(x
1
, x
2
, x
3
) = (x
1
+x
2
)
2
−x
2
2
+ 2x
2
x
3
= (x
1
+x
2
)
2
= q
0
(x
2
, x
3
),
o` u q
0
(x
2
, x
3
) = −x
2
2
+ 2x
2
x
3
. Ensuite, q
0
(x
2
, x
3
) = −(x
2
−x
3
)
2
+x
2
3
, et donc
q(x
1
, x
2
, x
3
) = (x
1
−x
2
)
2
−(x
2
−x
3
)
2
+x
2
3
.
Ici, le forme prend `a la fois des valeurs positives et des valeurs n´egatives.
(ii ) q(x
1
, x
2
, x
3
) = x
1
x
3
+x
2
x
3
. Il n’y a pas de terme A
kk
x
2
k
.
´
Ecrivons donc x
1
= x

1
+x
3
. Alors
q(x
1
, x
2
, x
3
) = x

1
x
3
+x
2
x
3
+x
2
3
. Ensuite,
q(x
1
, x
2
, x
3
) = (
1
2
x

1
+
1
2
x
2
+x
3
)
2

1
4
x

1
2

1
4
x
2
2

1
2
x

1
x
2
= (
1
2
x

1
+
1
2
x
2
+x
3
)
2

_
1
2
(x

1
+x
2
)
_
2
.
`
A nouveau, q prend `a la fois des valeurs positives et des valeurs n´egatives.
(iii ) On suppose q : R
n
→R d´efinie positive. Si A = (A
ij
) est la matrice sym´etrique associ´ee
`a q, alors A
ii
> 0 pour tout i ∈ ¦1, 2, . . . , n¦. En effet, on a q(e
k
) =
e
k
Ae
k
= A
kk
quelque soit
k ∈ ¦1, 2, . . . , n¦ : si donc il existe un indice k tel que A
kk
≤ 0, alors q(e
k
) ≤ 0.
26
(iv) Soit q(x
1
, x
2
, x
3
) = (x
1
− x
2
)
2
+ (x
2
− x
3
)
2
+ (x
3
− x
1
)
2
. Alors q est positive mais pas
d´efinie positive. En effet, q(x
1
, x
2
, x
3
) ≥ 0 pour tout (x
1
, x
2
, x
3
) ∈ R
3
mais q(x, x, x) = 0 pour
tout x ∈ R. Bien entendu, les formes lin´eaires
1
(x
1
, x
2
, x
3
) = x
1
− x
2
,
2
(x
1
, x
2
, x
3
) = x
2
− x
3
et
3
(x
1
, x
2
, x
3
) = x
3
−x
1
ne sont pas lin´eairement ind´ependantes ; elles sont li´ees par la relation

1
+
2
+
3
= 0.
EXERCICES
(e4.1) (i ) Soit Ω un domaine dans R
p
et soient g
1
, g
2
, . . ., g
p
, p fonctions de classe (
(1)
de Ω dans R.
Montrer que s’il existe f : Ω → R de classe (
(2)
telle que df =

p
k=1
g
k
dx
k
, alors (g
k
)

= (g

)

k
quelque soit les entiers k, ∈ ¦1, 2, . . . , p¦.
(ii ) Existe-t-il une fonction f : R
2
→R de classe (
(2)
v´erifiant df = ydx + dy ?
(e4.2) Soit Ω un domaine de R
p
et soit f : Ω →R de classe (
(2)
. Montrer que si q(H
a
, ) = 0 quelque
soit a ∈ Ω, alors il existe b ∈ R
p
et α ∈ R tels que f(x) = α + ¸b, x) quelque soit x ∈ Ω. (Appliquer la
formule de Taylor (4.2). On pourra se limiter au cas o` u Ω est ´etoil´e.)
(e4.3) Soit f : R
2
→R la fonction f(x, y) = x
4
−2xy +y
2
−2x.
(i ) Calculer f

puis montrer que f a un unique point critique que l’on pr´ecisera.
(ii ) Calculer la matrice hessienne H
f,(x,y)
et v´erifier que le point critique est un minimum relatif
strict.
(iii ) En remarquant que f(x, y) = (y − x)
2
+ (x − 1)
2
(x
2
+ 2x + 2) − 2, montrer que ce minimum
relatif est, en fait, le minimum absolu strict de f sur R
2
.
(e4.4) Soit la fonction f : (R

+
)
2
→R d´efinie par f(x, y) = xy +
1
x
+
8
y
.
(i ) Calculer f

. V´erifier que (1/2, 4) est l’unique point critique de f.
(ii ) V´erifier que (1/2, 4) est un minimum local strict de f.
(iii ) Montrer que (1/2, 4) est, en fait, le minimum absolu strict de f sur (R

+
)
2
. (C’est plus difficile. On
pourra chercher `a montrer directement que f(x, y) −f(1/2, 4) ≥ 0 en s’inspirant de l’exercice pr´ec´edent.
Sinon, on pourra montrer d’abord que pour tout (x, y) ∈ (R

+
)
2
, on a f(x, y) ≥ f(x, 1/x
2
) puis que, si
φ(x) = f(x, 1/x
2
), alors φ atteint son minimum en x = 1/2.)
(e4.5) On note a, b et c trois nombre r´eels v´erifiant abc ,= 0 et f : R
3
→ R la fonction d´efinie par
f(x, y, z) = x
4
+y
4
+z
4
−4(a
3
x +b
3
y +c
3
z).
(i ) D´eterminer les points critiques de f.
(ii ) Montrer que f poss`ede un minimum local en (a, b, c).
(iii ) V´erifier que si u, v ∈ R
2
, alors 2u
2
v
2
≤ u
4
+ v
4
. En d´eduire que si (x, y, z) ∈ R
3
, alors
(x
2
+y
2
+z
2
)
2
≤ 3(x
4
+y
4
+z
4
).
(iv) Utiliser ce qui pr´ec`ede pour montrer que f(x, y, z) → +∞ lorsque x
2
+y
2
+z
2
→ +∞.
(v) En conclure que f prend sa valeur minimale absolue sur R
3
au point (a, b, c).
(e4.6) Soit f : R
2
→R la fonction f(x, y) =
x
1+x
2
+y
2
(voir (0.1.1)).
(i ) Calculer f

. En d´eduire l’ensemble des points critiques de f.
(ii ) Calculer la matrice hessienne H
f,(x,y)
puis d´eterminer si les points critiques sont des extremums
relatifs.
(iii ) Montrer que f(x, y) → 0 lorsque x
2
+ y
2
→ +∞. (Utiliser les coordonn´ees polaires x = r cos θ,
y = r sinθ.)
(iv) Calculer M = sup¦f(x, y) [ (x, y) ∈ R
2
¦ et m = inf¦f(x, y) [ (x, y) ∈ R
2
¦. Existe-t-il (a, b) ∈ R
2
tel que f(a, b) = M ; tel que f(a, b) = m?
(e4.7) D´eterminer si les matrices suivantes sont d´efinies positives, d´efinies n´egatives, positives ou
n´egatives :
27
(i )
_
3 0 0
0 2 0
0 0 −1
_
, (ii )
_
2 0 −1
0 2 −1
−1 −1 2
_
, (iii )
_
_
_
2 1 1 1
1 1 1 1
1 1 1 1
1 1 1 2
_
_
_
.
(e4.8) Utiliser la m´ethode de Gauss (4.13) pour ´ecrire la forme quadratique (x, y, z) → xy +yz +xz
comme combinaison de membres d’une famille libre de formes lin´eaires.
(e4.9) Soient n, N deux entiers positifs et soient a
r
, 1 ≤ r ≤ N, N points de R
n
. Soit f la fonction
R
n
→R d´efinie par x →

N
r=1
[[x −a
r
[[
2
.
Montrer que f a un unique point critique et que ce point critique est un minimum relatif puis qu’il
s’agit du minimum absolu de f sur R
n
.
(e4.10) Soit f : R
n
→R un polynˆome de degr´e 2, c’est-`a-dire une fonction de la forme f = q + +c,
o` u q : R
n
→R est une forme quadratique, : R
n
→R une forme lin´eaire et c ∈ R. On note A la matrice
sym´etrique associ´ee `a q et b l’´el´ement de R
n
tel que (x) = ¸b, x) pour tout x ∈ R
n
.
(i ) Soit x ∈ R
n
. Calculer f

(x) ainsi que la matrice hessienne H
f,x
de f en fonction de A et b.
On suppose d´esormais que q est non-d´eg´en´er´ee, c’est-`a-dire que A est inversible.
(ii ) Montrer que si A est inversible, alors f a un unique point critique x
0
.
(iii ) Montrer que x
0
est un minimum relatif si A est d´efinie positive et un maximum relatif si A est
d´efinie n´egative.
(e4.11) Soient r, n deux entiers tels que 0 ≤ r ≤ n. Montrer que l’ensemble des matrices dans /
n
de rang au plus r est ferm´e. (Rappel : si r < n, une matrice est de rang au plus r si et seulement si le
d´eterminant de tout mineur d’ordre r + 1 est nul.)
Th`eme 5. Extremums li´es d’une fonction R
p
→R, multiplicateurs de Lagrange
(5.1) Soit Ω un domaine dans R
p
, soit f : Ω → R une fonction et soit X ⊆ Ω de classe
(
(1)
. Dans sa forme la plus g´en´erale, le probl`eme d’extremum li´e est le probl`eme de d´eterminer
les valeurs maximales et minimales de f sur X (ou `a d´efaut leurs bornes sup´erieure et inf´erieure).
Typiquement, X est d´ecrit par des conditions de la forme g
1
= g
2
= = g
q
= 0, les fonctions g

(les contraintes) ´etant encore de classe (
(1)
et donc continues, de sorte que X est un ferm´e relatif
de Ω. Nous allons d’abord traiter le cas d’une forme quadratique sur la sph`ere S(0; 1) de centre 0
et de rayon 1. Apr`es, nous d´ecrivons la m´ethode des multiplicateurs de Lagrange qui permet,
au moins en principe, de traiter une large classe de probl`emes.
(5.2) Soit donc A ∈ /
p
une matrice sym´etrique et soit q(A, ) la forme quadratique associ´ee.
Notons S
2
(0; 1) la sph`ere de R
p
pour la norme [[.[[
2
. Rappelons que les valeurs propres de A sont
toutes r´eelles et notons respectivement λ
max
et λ
min
la plus grande et la plus petite parmi elles.
Rappelons que nous identifions R
p
avec l’espace des matrices `a une ligne et p colonnes, de sorte
que si x ∈ R
p
, alors
t
x d´esigne le vecteur colonne transpos´e de x.
(5.2.1) Th´eor`eme. Pour tout x ∈ S
2
(0; 1), on a λ
min
≤ q(A, x) ≤ λ
max
. L’´egalit´e λ
min
=
q(A, x) a lieu si et seulement si x est un vecteur propre associ´e `a λ
min
et l’´egalit´e λ
max
= q(A, x) a
lieu si et seulement si x est un vecteur propre associ´e `a λ
max
. En particulier, les valeurs minimales
et maximales de q(A, ) sur S
2
(0; 1) sont λ
min
et λ
max
.
D´emonstration. Soit Λ une matrice diagonale dont les coefficients diagonaux sont les valeurs
propres de A. On sait (4.10.4) qu’il existe une matrice orthogonale U ∈ /
p
telle que A =
t
UΛU.
On sait que U laisse S
2
(0; 1) stable, c’est-`a-dire Ux ∈ S
2
(0; 1) si x ∈ S
2
(0; 1). Soit donc x ∈ S
1
(0 : 1)
28
et soit (y
1
, y
2
, . . . , y
p
) = y = Ux. Alors
q(A; x) =
t
xAx =
t
x
t
UΛUx =
t
yΛy =
p

k=1
λ
k
y
2
k
.
Ici,

p
k=1
λ
k
y
2
k
≤ λ
max

p
k=1
y
2
k
= λ
max
car y ∈ S
2
(0; 1). Il s’ensuit que q(A; x) ≤ λ
max
quelque
soit x ∈ S
2
(0; 1). On voit de la mˆeme mani`ere que q(A; x) ≥ λ
min
quelque soit x ∈ S
2
(0; 1). D’o` u
l’encadrement λ
min
≤ q(A; x) ≤ λ
max
.
L’´egalit´e q(A, x) = λ
max
´equivaut `a

p
k=1
λ
k
y
2
k
= λ
max
ce qui a lieu si et seulement si y
k
= 0
lorsque λ
k
< λ
max
. Mais si y ∈ R
p
− ¦0¦, alors la condition y
k
= 0 lorsque λ
k
< λ
max
´equivaut
`a Λy = λ
max
y ce qui signifie que x =
t
Uy est vecteur propre de A =
t
UΛU associ´e `a λ
max
. On
raisonne de la mˆeme mani`ere en ce qui concerne λ
min
.
(5.3) Passons donc `a la m´ethode des multiplicateurs de Lagrange, en commen¸cant par le cas
le plus simple, celui o` u Ω est un domaine dans R
2
et la fonction f : Ω → R est assujettie `a une
seule contrainte g = 0, g ´etant une seconde fonction Ω → R. On suppose f et g ce classe (
1
.
Posons X = ¦(x, y) ∈ Ω [ g(x, y) = 0¦. Le probl`eme est de trouver les valeurs maximales et les
minimales de f restreinte `a X. On cherche d’abord un crit`ere pour qu’un point soit un extremum
local.
(5.3.1) Soit (a, b) ∈ X. Supposons d’abord que g

2
(x, y) ,= 0 pour tout (x, y) dans un voisinage
de (a, b). D’apr`es le th´eor`eme des fonctions implicites (voir (3.6)) qu’il existe un intervalle ouvert
I contenant a et un intervalle ouvert J contenant b ainsi qu’une fonction φ : I → J v´erifiant
φ(a) = b et g(x, φ(x)) = 0 pour tout x ∈ I.
Supposons donc que f restreinte `a X ait un extremum local en (a, b). Alors le fonction x →
f(x, φ(x)) a un extremum local en a. Par cons´equent, sa d´eriv´ee s’annule en a. Il s’ensuit que
f

1
(a, b) +f

2
(a, b)φ

(a) = 0. Mais φ

(a) = −
g

1
(a,b)
g

2
(a,b)
. On en tire que le gradient f

(a, b) est un multiple
scalaire de g

(a, b).
Lorsque on suppose que g

1
(a, b) ,= 0, un argument semblable conduit `a la mˆeme conclusion.
Rappelons que g

(a, b) est un vecteur perpendiculaire `a la tangente de la courbe g = 0 en (a, b).
G´eom´etriquement parlant, on conclut que si (a, b) n’est pas un point critique de g et si f a
un extremum local en (a, b) sous la contrainte g = 0, alors f

est un vecteur perpendiculaire `a
tangente de la courbe g = 0 en (a, b).
Par cons´equent, il existe λ ∈ R tel que f

(a, b) + λg

(a, b) = 0. Le r´eel λ est appel´e le multi-
plicateur de Lagrange. On a ainsi trois ´equations
(*) f

1
(a, b) +λg

1
(a, b) = 0, f

2
(a, b) +λg

2
(a, b) = 0, g(a, b) = 0
pour les trois inconnus a, b, λ.
La m´ethode des multiplicateurs de Lagrange est tout simplement une r´einterpr´etation
de ces ´equations. On introduit la fonction de trois variables x, y, z :
H(x, y, z) = f(x, y) +zg(x, y).
Cette fonction permet de re´ecrire les trois ´equations (∗) comme
H

1
(a, b, λ) = 0, H

2
(a, b, λ) = 0, et H

3
(a, b, λ) = 0.
(5.4) En g´en´eral, la m´ethode des multiplicateurs de Lagrange ´etend les consid´erations pr´ec´e-
dentes au cas d’une fonction f : Ω → R d´efinie sur le domaine Ω ⊆ R
p
et soumise a q ≤ p
29
contraintes g
1
= g
2
= = g
q
= 0, o` u les g
k
sont encore des fonctions de Ω dans R.
`
A nouveau, on
suppose f et les fonctions g
k
de classe (
(1)
. Posons X = ¦x ∈ Ω [ g
1
(x) = g
2
(x) = = g
q
(x) = 0¦.
Le point a ∈ Ω est dit r´egulier (pour les fonctions g
1
, g
2
, . . ., g
q
) si (g
1
)

(a), (g
2
)

(a), . . ., (g
q
)

(a)
est une famille libre dans R
p
. Dans le cas contraire, on dit que a est un point critique.
(5.4.1) Th´eor`eme. Soit a un extremum relatif de f restreinte `a X. Si a est un point r´egulier
pour g
1
, g
2
, . . ., g
q
alors f

(a) appartient au sous-espace de R
p
engendr´e par (g
1
)

(a), (g
2
)

(a), . . .,
(g
q
)

(a).
L’interpr´etation g´eom´etrique est la mˆeme que dans le cas p = 2, q = 1 trait´e pr´ec´edemment.
Puisque a est r´egulier, (g
1
)

(a), (g
2
)

(a), . . ., (g
q
)

(a) engendrent l’espace normal `a X en a, c’est
`a dire l’espace orthogonal `a l’espace tangent de X en a. Le th´eor`eme dit donc que si a est un
extremum de f restreinte `a X, alors f

(a) est perpendiculaire `a l’espace tangent de X en a. La
d´emonstration suit la mˆeme d´emarche que celle du cas d’une fonction en deux variables `a une
seule contrainte, en appliquant la forme g´en´erale du th´eor`eme des fonctions implicites (3.9.1).
Nous omettons les d´etails.
(5.4.2) Dans sa formulation g´en´erale, la m´ethode des multiplicateurs de Lagrange est
une description concr`ete de ce th´eor`eme. La conclusion que f

(a) appartient au sous-espace de
R
p
engendr´e par (g
1
)

(a), (g
2
)

(a), . . ., (g
q
)

(a) signifie qu’il existe q r´eels λ
k
, 1 ≤ k ≤ q (appel´es
multiplicateurs de Lagrange) tels que
(**) f

(a) +
q

k=1
λ
k
(g
k
)

(a) = 0.
Il s’agit d’une ´egalit´e dans R
p
, c’est-`a-dire de p ´equations dans R.
`
A celles-ci s’ajoutent les q
´equations
(***) g
1
(a) = g
2
(a) = = g
q
(a) = 0,
ce qui fait p + q ´equations au total pour les p + q inconnus : les p coordonn´ees de a et les
multiplicateurs de Lagrange λ
1
, λ
2
, . . ., λ
q
.
`
A nouveau, on r´einterpr`ete ces ´equations en introduisant la fonction de p +q variables
H(x
1
, x
2
, . . . , x
p
, z
1
, z
2
, . . . , z
q
) = f(x) +
q

k=1
z
k
g
k
(x),
o` u x = (x
1
, x
2
, . . . , x
p
). Les ´equations (∗∗) et (∗∗∗) se r´ecrivent alors
H

k
(a
1
, a
2
, . . . , a
p
, λ
1
, λ
2
, . . . , λ
q
) = 0 pour tout 1 ≤ k ≤ p +q,
o` u l’on a ´ecrit a = (a
1
, a
2
, . . . , a
p
). On appelle les points a ∈ X tels qu’il existe (λ
1
, λ
2
, . . . , λ
q
)
v´erifiant les ´equations de Lagrange les points critiques de f relatifs `a X (ou relatifs aux
contraintes g
1
= g
2
= = g
q
= 0).
(5.5) Ayant trouv´es les points critiques de f relatifs `a l’ensemble X, la question se pose de
savoir s’il s’agit d’un maximum ou un minimum local.
(5.5.1) Reprenons d’abord le cas d´ej`a ´etudi´e (5.3) d’une fonction f de deux variables assujettie
`a une seule contrainte g = 0. Reprenons les notations de (5.3) en supposant, de plus, que f et g
soient de classe (
(2)
. Notons ψ la fonction x → f(x, φ(x)). Il est clair que le point critique (a, b) de
f sous la contrainte g = 0 est un minimum strict local si et seulement si a est un minimum strict
30
local de ψ. Or, une condition famili`ere pour que ψ ait un minimum strict local est que ψ

(a) > 0,
ce qui nous allons traduire en termes de fonctions f et g du probl`eme. On a
ψ

(a) = (ψ

)

(a) = [
d
dx
(f

1
(x, φ(x)) +f

2
(x, φ(x))φ

(x))]
x=a
= f

1,1
(a, φ(a)) + 2f

1,2
(a, φ(a))φ

(a) +f

2,2
(a, φ(a))φ

(a)
2
+f

2
(a, φ(a))φ

(a)
et donc, puisque b = φ(a) :
(1) ψ

(a) = f

1,1
(a, b) + 2f

1,2
(a, b)φ

(a) +f

2,2
(a, b)φ

(a)
2
+f

2
(a, b)φ

(a).
En outre, on sait que φ

(x) = −
g

1
(x,φ(x))
g

2
(x,φ(x))
et donc que 0 = g

1
(x, φ(x))+φ

(x)g

2
(x, φ(x)). En d´erivant
par rapport `a x puis en substituant x = a on trouve
(2) 0 = g

1,1
(a, b) + 2g

1,2
(a, b)φ

(a) +g

2,2
(a, b)φ

(a)
2
+g

2
(a, b)φ

(a).
Or, le multiplicateur de Lagrange λ v´erifie f

2
(a, b) + λg

2
(a, b) = 0. En prenant donc la somme
de l’´equation (1) et de λ fois l’´equation (2) on obtient donc, en ´ecrivant `a nouveau H(x, y, z) =
f(x, y) +zg(x, y) :
ψ

(a) = H

1,1
(a, b, λ) + 2H

1,2
(a, b, λ)φ

(a) +H

2,2
(a, b, λ)φ

(a)
2
Or, on y reconnaˆıt la valeur en (1, φ(a)) de la forme quadratique associ´ee `a la matrice hessienne
de H par rapport aux deux premi`eres variables. Enfin la relation φ

(a) = −
g

1
(a,b)
g

2
(a,b)
permet d’´ecrire :
ψ

(a) =
1
g

2
(a, b)
2
_
H

1,1
(a, b, λ)g

2
(a, b)
2
−2H

1,2
(a, b, λ)g

2
(a, b)g

1
(a, b) +H

2,2
(a, b, λ)g

1
(a, b)
2
_
.
On en conclut que ψ

(a) est du mˆeme signe que H

1,1
(a, b, λ)g

2
(a, b)
2
−2H

1,2
(a, b, λ)g

2
(a, b)g

1
(a, b)+
H

2,2
(a, b, λ)g

1
(a, b)
2
. Dans ce qui pr´ec`ede, nous avons suppos´e que g

2
(a, b) ,= 0. Un argument
semblable en supposant que g

1
(a, b) ,= 0 conduit `a la mˆeme conclusion. Nous avons ainsi d´emontr´e
le r´esultat suivant.
(5.5.2) Proposition. Soit Ω ⊆ R
2
un domaine et soient f et g deux fonctions de classe (
(2)
sur Ω. Soit X = ¦(x, y) ∈ Ω [ g(x, y) = 0¦. Soit (a, b) ∈ X. On suppose que (a, b) soit un
point r´egulier de g mais qu’il s’agit d’un point critique de f relatif `a X. Soit λ le multiplicatuer
de Lagrange associ´e et soit H(x, y, z) la fonction f(x, y) + zg(x, y). Soit q la forme quadratique
associ´ee `a la matrice hessienne de H par rapport aux deux premi`eres variables :
_
H

1,1
(a, b, λ) H

1,2
(a, b, λ)
H

1,2
(a, b, λ) H

2,2
(a, b, λ)
_
.
Si q
_
−g

2
(a, b), g

1
(a, b)
_
> 0, alors la restriction de f `a X a un minimum strict local en (a, b). De
mˆeme, si q
_
−g

2
(a, b), g

1
(a, b)
_
< 0, elle a un maximium strict local en (a, b).
Rappelons que (−g

2
(a, b), g

1
(a, b) est un g´en´erateur de l’espace vectoriel tangent de X en
(a, b). La condition q(−g

2
(a, b), g

1
(a, b) > 0 (ou q(−g

2
(a, b), g

1
(a, b) < 0) est donc ´equivalente `a la
condition que la restriction de q `a l’espace tangent soit d´efinie positive (ou d´efinie n´egative). Cette
interpr´etation sugg`ere la g´en´eralisation correcte de la proposition `a une fonction de p variables
assujettie `a q contraintes.
(5.6) Th´eor`eme. Soit Ω ⊆ R
p
un domaine et soient f, g
k
(1 ≤ k ≤ q) q + 1 fonctions
de classe (
(2)
sur Ω. Soit X = ¦x = (x
1
, x
2
, . . . , x
p
) ∈ Ω [ g
1
(x) = g
2
(x) = = g
q
(x) = 0¦.
31
Soit a = (a
1
, a
2
, . . . , a
p
) ∈ X. On suppose que a soit un point r´egulier de g = (g
1
, g
2
, . . . , g
q
)
mais qu’il s’agit d’un point critique de f relatif `a X. Soit λ = (λ
1
, λ
2
, . . . , λ
q
) le multiplicateur de
Lagrange associ´e et soit H : Ω R
q
la fonction H(x
1
, x
2
, . . . , x
p
, z
1
, . . . , z
q
) = f(x
1
, x
2
, . . . , x
p
) +

q
k=1
z
k
g
k
(x
1
, x
2
, . . . , x
p
). Soit q la forme quadratique associ´ee `a la matrice hessienne de H par
rapport aux p premi`eres variables :
_
_
_
_
H

1,1
(a, λ) H

1,2
(a, λ) H

1,p
(a, λ)
H

2,1
(a, λ) H

2,2
(a, λ) H

2,p
(a, λ)
.
.
.
.
.
.
.
.
.
.
.
.
H

p,1
(a, λ) H

p,2
(a, λ) H

p,p
(a, λ)
_
_
_
_
.
Si la restriction de q `a l’espace vectoriel tangent de X en a est d´efinie positive, alors f restreinte
`a X a un minimum strict local en a. De mˆeme, si la restriction de q `a l’espace vectoriel tangent
de X en a est d´efinie n´egative, alors f restreinte `a X a un maximium strict local en a.
La d´emonstration suit le mˆeme sch´ema que celle de (5.5.2). Nous n’en donnerons pas les
d´etails.
(5.7) Consid´erons `a titre d’exemple le probl`eme de trouver, parmi tous les triangles dans
le plan euclidien d’une aire A donn´ee, ceux qui ont le plus court perim`etre. Dans un rep`ere
orthonorm´e convenable, on peut supposer que les affixes des trois sommets sont (−z, 0), (z, 0),
(x, y), avec z > 0, y > 0 et x ∈ R (croquis !). Alors l’aire du triangle est A := yz et son perim`etre
est f(x, y, z) = 2z +
_
(x −z)
2
+y
2
+
_
(x +z)
2
+y
2
. Il s’agit donc de trouver le maximum de
la fonction f sous la contrainte g = 0, o` u g(x, y, z) = A − yz. On travaille dans le domaine
Ω = ¦(x, y, z) ∈ R
3
[ y > 0, z > 0¦. Tous les points de Ω sont r´eguliers pour g. Soit alors (a, b, c)
un extremum de f restreinte `a X = ¦(x, y, z) ∈ Ω [ g(x, y, z) = 0¦. On a alors les 4 ´equations
f

k
(a, b, c) +λg

k
(a, b, c) = 0, 1 ≤ k ≤ 3, et g(a, b, c) = 0. Explicitement :
a −c
_
(a −c)
2
+b
2
+
a +c
_
(a +c)
2
+b
2
= 0
b
_
(a −c)
2
+b
2
+
b
_
(a +c)
2
+b
2
−λc = 0
2 +
−a +c
_
(a −c)
2
+b
2
+
a +c
_
(a +c)
2
+b
2
−λb = 0
ainsi que la relation A = bc.
En utilisant la premi`ere et la troisi`eme ´equation, on constate que
λb = 2 + 2
a +c
_
(a +c)
2
+b
2
= 2 + 2
−a +c
_
(a −c)
2
+b
2
et donc que
a+c

(a+c)
2
+b
2
=
−a+c

(a−c)
2
+b
2
. Donc ((a − c)
2
+ b
2
)(a + c)
2
= ((a + c)
2
+ b
2
)(a − c)
2
ce qui conduit `a a = 0 puisque (a, b, c) ∈ Ω. En substituant a = 0 dans la seconde ´equation
puis la multipliant par b, on trouve
2b
2

c
2
+b
2
= λA. De mˆeme, 2c +
2c
2

c
2
+b
2
= λA. Il s’ensuit que
2b
2
= 2c

c
2
+b
2
+ 2c
2
, ce qui entraˆıne que b =

3c, c’est-`a-dire que le triangle est ´equilat´eral.
Enfin, comme bc = A, on conclut qu’il y a un unique point critique relatif dans Ω, `a savoir celui
o` u a = 0, b = 3
1/4

A et c =

A/3
1/4
.
On peut ´etablir qu’il s’agit d’un minimum strict local en utilisant le th´eor`eme (5.6). La valeur
de λ se calcule, par exemple, en substituant les valeurs de b et de c dans l’´equation
2b
2

c
2
+b
2
= λA.
32
On en tire que λ = 3
3/4
/

A. Apr`es calcul, on trouve que la matrice hessienne de (5.6) est
H =
_
_
_
_
_
_
_
_
3
5/4
4

A
0
3
1/4
4

A
0
3
1/4
4

A

5 3
3/4
4

A
3
1/4
4

A

5 3
3/4
4

A
3
5/4
4

A
_
_
_
_
_
_
_
_
.
Le plan tangent de g(x, y, z) = 0 au point (0, 3
1/4

A,

A/3
1/4
) est form´e des vecteurs de la forme
(x, y, −

3y) avec (x, y) ∈ R
2
. La restriction `a ce plan de la forme quadratique associ´ee `a H est
(x, y, −

3y) →
3
1/4
4

A
(3x
2
−2

3xy + 40y
2
), ce qui est bien d´efinie positive.
On en conclut que (0, 3
1/4

A,

A/3
1/4
) est bien un minimum strict local de f sur X. Pour
montrer qu’il s’agit bien du minimum absolu de f sur X (s’il en existe), on s’inspire de la m´ethode
sugg´er´ee pour resoudre l’exercice (e4.4). Puisque y > 0 et z > 0, on voit aussitˆot que f(x, y, z) ≥
2z + [x[ + y ≥ [[(x, y, z)[[
1
pour tout (x, y, z) ∈ Ω. Soit r un r´eel avec r > f(0, 3
1/4

A, A/3
1/4
).
Lorsque (x, y, z) ∈ X mais (x, y, z) / ∈ K
1
(0; r), f(x, y, z) > f(0, 3
1/4

A, A/3
1/4
) et le minimum
absolu se situe forc´ement dans X ∩ K
1
(0; r). Puisque f est continu et X ∩ K
1
(0; r) est compact,
f a un minimum sur X ∩ K
1
(0; r), qui sera alors le minimum absolu de f sur X. Le minimum
absolu est donc forc´ement un minimum relatif, donc un point critique relatif. Puisque nous n’avons
trouv´e qu’un seul point critique, celui-ci est bien le minimum absolu. Ceci ach`eve la preuve que,
parmi tous les triangles d’aire donn´ee, les triangles ´equilat´eraux qui a le plus petit p´erim`etre.
EXERCICES
(e5.1) Trouver les valeurs maximales et minimales sur le cercle unit´e de la forme quadratique associ´ee
`a la matrice
_
2 1
1 2
_
.
(e5.2) Trouver les valeurs maximales et minimales sur la sph`ere unit´e de R
3
de la forme quadratique
associ´ee `a la matrice
_
1 4 2
4 1 2
2 2 −2
_
.
(e5.3) D´eterminer les valeurs maximales et minimales de la forme quadratique associ´ee `a la matrice
sym´etrique A ∈ /
p
sur la boule unit´e ferm´ee K
2
(0; 1) de R
p
. Quelles sont les valeurs maximales et
minimales sur S
2
(0; r), sur K
2
(0; r) ? Ici, r > 0.
(e5.4) Calculer le maximum et le minimum de la fonction (x, y, z) → x + 2y + 3z sur la sph`ere
unit´e de R
3
, comme demand´e au (0.1.2). G´en´eraliser : calculer le maximum et le minimum de (x, y, z) →
ux + vy + wz (o` u u, v, w sont des constantes) sur S
2
(0; 1). G´en´eraliser encore : si u ∈ R
p
calculer le
maximum et le minimum de x → ¸u, x) sur la sph`ere S
2
(0; 1) de R
p
.
(e5.5) Soit la fonction f : R
3
→R d´efinie par f(x, y, z) = xy.
(i ) Calculer les valeurs extrˆemes de f sur la sph`ere S
2
(0; 1).
(ii ) Calculer les valeurs extrˆemes de f sur l’ensemble des points (x, y, z) de S
2
(0; 1) qui v´erifient
x +y +z = 1.
(e5.6) Soit a ∈ R
p
− ¦0¦, soit β ∈ R et soit X l’hyperplan ¦x ∈ R
p
[ ¸a, x) = β¦. En utilisant les
multiplicateurs de Lagrange, trouver la distance perpendiculaire d’un point b ∈ R
p
`a X. (Chercher le
minimum de la fonction x → [[x −b[[
2
sur X.)
33
(e5.7) Reprenons les notations du th´eor`eme (5.2.1), dont le pr´esent exercice propose une seconde
d´emonstration utilisant les multiplicateurs de Lagrange. On a alors
f(x) = q(A, x) =

i,j
A
ij
x
i
x
j
pour tout x = (x
1
, x
2
, . . . , x
p
).
(i ) Calculer f

(x).
(ii ) Montrer que si x
0
∈ S
2
(0; 1) est un extremum de q sur S
2
(0; 1), alors x est un vecteur propre de
A. D´eterminer la valeur propre correspondant en fonction de la valeur du multiplicateur de Lagrange.
(iii ) Conclure.
(e5.8) On note p ≥ 2 un entier et (a
1
, a
2
, . . . , a
p
) un ´el´ement de R
p
v´erifiant a
i
> 0 pour tout
i ∈ ¦1, 2, . . . , p¦. On note X l’ensemble des points de la sph`ere S
2
(0; 1) dont toutes les coordonn´ees
x
i
sont positives et X

l’ensemble des points de S
2
(0; 1) dont toutes les coordonn´ees sont strictement
positives.
(i ) Montrer que X est compact.
(ii ) L’ensemble X

est-il compact ? Est-il ouvert ?
On note f la fonction f(x
1
, x
2
, . . . , x
p
) = x
a
1
1
x
a
2
2
x
a
p
p
.
(iii ) Montrer que f atteint un maximum et un minimum sur X.
(iv) Quelle est la valeur minimale de f sur X ? En quels points de X est-elle atteinte ?
(v) En utilisant la m´ethode des multiplicateurs de Lagrange, calculer la valeur maximale de f sur
X

puis sur X.
(e5.9) Quelles sont les triangles de perim`etre donn´e qui ont la plus grande aire ? (Se calquer sur
(5.7).) Cela r´epond `a (0.1.3).
(e5.10) Parmi les triangles inscrits dans un cercle de rayon donn´e, les triangles ´equilat´eraux ont le
plus grand perim`etre.
Th`eme 6.
´
Equations diff´erentielles, ´equilibre, stabilit´e
(6.1) Rappelons qu’une ´equation diff´erentielle est une ´equation de la forme
F(t, x, x

, x

, . . . , x
(n)
) = 0,
o` u n ≥ 1 est un entier, F est une fonction d´efinie sur un domaine de R
n+2
et x est une fonction
n-fois d´erivable de t sur un intervalle I, `a priori inconnue. Ici x

, x

, . . ., x
(n)
d´esignent les d´eriv´ees
successives de x par rapport `a t. L’´equation est d’ordre n si F d´epend effectivement de la derni`ere
variable x
(n)
. Les courbes ¦
_
t, x(t)
_
[ t ∈ I¦, x ´etant une solution de l’´equation s’appellent les
courbes int´egrales de l’´equation. L’objet de ce th`eme est de faire le tour d’un certain nombre
d’´equation diff´erentielles et des propri´et´es de leurs solutions.
Il est souvent impossible de trouver une solution en termes des fonctions ´el´ementaires (puis-
sance, exponentielle, logarithme, fonctios trigonom´etriques). On se contentera alors d’une solution
implicite, de la forme f(x, t) = 0, la fonction f ayant pour domaine de d´efinition un rectangle
I J, J ´etant un second intervalle.
(6.1.1) On s’int´eresse souvent `a des solutions v´erifiant quelques conditions initiales. Les
conditions initiales les plus souvent rencontr´ees imposent les valeurs d’une solution ainsi que de
ses d´eriv´ees en un point de I. Si t
0
∈ I et si (α
0
, α
1
, . . . , α
n−1
) ∈ R
n
, on cherche la ou les solutions
x v´erifiant x(t
0
) = α
0
, x

(t
0
) = α
1
, . . ., x
(n−1)
(t
0
) = α
n−1
. L’int´erˆet des conditions initiales de cette
forme r´eside dans r´esultat g´en´eral suivant.
34
(6.1.2) Th´eor`eme. Soit I un intervalle ouvert et soit Ω un domaine de R
n
. Soit t
0
∈ I,
soit (α
0
, α
1
, . . . , α
n−1
) ∈ Ω et soit f : I Ω → R une fonction de classe (
(1)
. Alors il existe
un intervalle ouvert J ⊆ I contenant t
0
et une unique fonction x : J → Ω v´erifiant x
(n)
(t) =
f
_
t, x(t), x

(t), . . . , x
(n−1)
(t)
_
pour tout t ∈ J et x(t
0
) = α
0
, x

(t
0
) = α
1
, . . ., x
(n−1)
(t
0
) = α
n−1
.
Nous verrons au (7.1.3) que ce r´esultat est une cons´equence du th´eor`eme (7.1.2) qui sera
lui-mˆeme d´emontr´e dans le th´eme 10. Dans cet ´enonc´e, nous avons suppos´e que x
(n)
s’exprime
explicitement en fonction des d´eriv´ees d’ordre inf´erieur. Une version plus g´en´erale du th´eor`eme
concerne les ´equations de la forme F
_
t, x(t), x

(t), . . . x
(n)
(t)
_
= 0. Selon le th´eor`eme des fonctions
implicites (3.9.1), il existe un intervalle ouvert I contenant t
0
ainsi qu’une fonction f de classe (
(1)
tels que x
(n)
(t) = f
_
t, x(t), . . . , x
(n−1)
(t) lorsque F est de classe (
(1)
et sa d´eriv´ee par rapport `a la
derni`ere variable ne s’annule pas en t
0
. Sous ces conditions, on peut appliquer le r´esultat ´enonc´e.
Par contre, il est facile de donner des contrexemples `a l’existence de solutions lorsque la d´eriv´ee
de F par rapport `a la derni`ere variable s’annule (voir l’exercice (e6.1)).
(6.1.3) Exemple. Prenons l’´equation x

+x = 0. On remarque que x
1
(t) = cos t et x
2
(t) = sin t
sont des solutions. Prenons t
0
= 0. Si (α
0
, α
1
) ∈ R
2
, l’unique solution x(t) v´erifiant x(0) = α
0
,
x

(0) = α
1
est x(t) = α
0
cos t +α
1
sin t.
(6.1.4) Bien qu’en principe on s’int´eresse aux solutions r´eelles, il est commode dans certains
cas de faire intervenir des solutions complexes. Rappelons alors la formule d’Euler
e

= cos θ +i sin θ
ainsi que les relations
cos θ =
e

+e
−iθ
2
, sin θ =
e

−e
−iθ
2i
,
valables quelque soit θ ∈ C. On a e
z+w
= e
z
e
w
quelque soit z, w ∈ C et donc
e
β+iγ
= e
β
(cos γ +i sin γ)
quelque soit β, γ ∈ C.
(6.2) Une ´equation diff´erentielle est dite lin´eaire si elle peut s’´ecrire sous la forme
(∗) a
n
(t)x
(n)
(t) +a
n−1
(t)x
(n−1)
(t) + +a
1
(t)x

(t) +a
0
(t)x(t) = b(t),
o` u les a
k
et b sont des fonctions de t d´efinies sur un intervalle I. L’´equation lin´eaire est dite
homog`ene si b = 0, inhomog`ene dans le cas contraire.
(6.2.1) Proposition. (i ) Soient x
1
, x
2
deux solutions d’une ´equation lin´eaire homog`ene et
soient λ
1
, λ
2
∈ R. Alors λ
1
x
1
+ λ
2
x
2
est solution de (∗). Par cons´equent, les solutions d’une
´equation lin´eaire homog`ene forment un R-espace vectoriel.
(ii ) Soit y
0
une solution de (∗). Alors toute autre solution de (∗) est de la forme y
0
+x, o` u x
parcourt l’espace des solutions de l’ ´equation homog`ene associ´ee
a
n
(t)x
(n)
(t) +a
n−1
(t)x
(n−1)
(t) + +a
1
(t)x

(t) +a
0
(t)x(t) = 0.
La d´emonstration est imm´ediate. La proposition montrer que pour r´esoudre (∗), il suffit de
connaˆıtre une solution y
0
(appel´ee solution particuli`ere) et toutes les solutions de l’´equation
homog`ene associ´ee.
35
(6.2.2) Th´eor`eme. On suppose que les fonctions a
k
: I →R soient de classe (
(1)
. Soit t
0
∈ I.
On suppose que a
n
(t
0
) ,= 0.
(i ) Soit (α
0
, α
1
, . . . , α
n−1
) ∈ R
n
. Alors il existe un intervalle ouvert J ⊆ I contenant t
0
et une
unique solution x de (∗) v´erifiant x(t
0
) = α
0
, x

(t
0
) = α
1
, . . ., x
(n−1)
(t
0
) = α
n−1
.
(ii ) Lorsque (∗) est homog`ene, il existe un intervalle ouvert J ⊆ I contenant t
0
tel que l’espace
vectoriel des solutions des fonctions x : J →R v´erifiant (∗) soit de dimension n.
D´emonstration. (i ) est un cas particulier de (6.1.2). En ce qui concerne le (ii ), on sait d’apr`es
le (i ) que, pour tout k ∈ ¦0, 1, . . . , n − 1¦, il existe une unique solution x
k
v´erifiant x
()
k
(t
0
) = 1
lorsque = k et x
()
k
(t
0
) = 0 lorsque ,= k (o` u ∈ ¦0, 1, . . . , n − 1¦). On v´erifie alors que les
fonctions (x
k
)
0≤k≤n−1
forment une famille libre : en effet, si k ∈ ¦0, 1, . . . , n−1¦ alors, en d´erivant
k fois une relation de d´ependance lin´eaire

n−1
r=0
λ
r
x
r
(t) = 0 puis en posant t = t
0
, on trouve que
λ
k
= 0. Par cons´equent, l’espace des solutions est de dimension au moins n. Si x est une solution
et si l’on pose α
k
= x
(k)
(t
0
) (0 ≤ k ≤ n −1), alors les solutions x et α
0
x
0

1
x
1
+ +α
n−1
x
n−1
v´erifient les mˆemes conditions initiales en t
0
. Par cons´equent, elles co¨ıncident et (x
0
, x
1
, . . . , x
n−1
)
est une base de l’espace des solutions.
(6.3) Commen¸cons par le cas des ´equations lin´eaires homog`enes de premier ordre. L’´equation
s’´ecrit alors
a
1
(t)x

(t) +a
0
(t)x(t) = 0.
On dit que l’´equation est exacte si a
0
(t) = a

1
(t) pour tout t ∈ I. Si c’est le cas, l’´equation peut
s’´ecrire (a
1
x)

(t) = 0. On en tire que (a
1
x)(t) est une constante C et que x(t) =
C
a
1
(t)
pourvu que
a
1
ne s’annule pas sur I.
(6.3.1) La m´ethode suivante permet de r´esoudre l’´equation mˆeme lorsque elle n’est pas exacte.
Il faut encore supposer que a
1
ne s’annule pas sur I. Si x est une solution qui ne s’annule pas sur
I alors
x

(t)
x(t)
= −
a
0
(t)
a
1
(t)
.
Il s’ensuit que log [x(t)[ = −
_
a
0
(t)
a
1
(t)
dt puis que [x(t)[ = e

R
a
0
(t)
a
1
(t)
dt
. Ici,
_
a
0
(t)
a
1
(t)
dt est une primitive
de
a
0
a
1
. Puisque x ne s’annule pas sur I et x est continue, on a soit x(t) > 0 pour tout t ∈ I soit
x(t) < 0 pour tout t ∈ I. On en tire que x(t) = ±e

R
a
0
(t)
a
1
(t)
dt
selon le signe de x(t).
Cette pr´esentation a le desavantage de supposer que la solution x ne s’annule pas sur I. En
fait, on peut montrer que toute solution x sauf la solution identiquement nulle ne s’annule pas sur
I. Voir l’exercice (e6.5).
(6.3.2) L’´equation x

(t) −ax(t) = 0, o` u a est une constante, a pour solution toute fonction de
la forme x(t) = Ce
at
, C ´etant une constante. Cet exemple sera g´en´eralis´e au (6.7). Dans ce cas
pr´ecis, il est facile de montrer que toute solution est de cette forme (voir l’exercice (e6.15)). En
g´en´eral, les questions d’existence et d’unicit´e de solutions d’une ´equation diff´erentielle sont assez
complexes (voir le th`eme 10 pour une introduction `a ce sujet).
(6.4) Consid´erons `a pr´esent les ´equations lin´eaires arbitraires de premier ordre. Une telle
´equation s’´ecrit
a
1
(t)x

(t) +a
0
(t)x(t) = b(t).
`
A nouveau, l’´equation est dite exacte si a
0
(t) = a

1
(t) pour tout t ∈ I. Si c’est le cas, alors
l’´equation s’´ecrit (a
1
x)

(t) = b(t), d’o` u (a
1
x)(t) = B(t), o` u B est une primitive de b. Si a
1
ne
s’annule pas sur I, alors la solution est donn´ee par x(t) =
B(t)
a
1
(t)
pour tout t ∈ I.
36
Le cas o` u l’´equation n’est pas exacte est trait´e en cherchant une fonction γ : I →R telle que
l’´equation multipli´ee par γ :
(†) a
1
(t)γ(t)x

(t) +a
0
(t)γ(t)x(t) = γ(t)b(t)
soit exacte. Ce sera le cas s’il existe une fonction δ : I →R telle que (a
1
γ)(t) = δ(t) et (a
0
γ)(t) =
δ

(t) ou encore si (a
1
γ)

(t) = (a
0
γ)(t) pour tout t ∈ I. Il faut alors que γ soit solution de l’´equation
homog`ene
a
1
(t)γ

(t) + (a

1
(t) −a
0
(t))γ(t) = 0.
Ainsi, on peut trouver γ par la m´ethode de (6.3).
(6.4.1) Exemple. Soit `a r´esoudre l’´equation x

(t) −x(t) = t sur R. On cherche une fonction γ
telle que γ(t)x

(t) −γ(t)x(t) = γ(t)t soit exacte. Il faut alors que −γ(t) = γ

(t) ce qui est satisfaite
par γ(t) = e
−t
. L’´equation devient alors e
−t
x

(t) −e
−t
x(t) = e
−t
t ou encore (e
−t
x(t))

= e
−t
t. D’o` u
e
−t
x(t) =
_
e
−t
t dt = −(1+t)e
−t
+C puis x(t) = −(1+t) +Ce
t
, C ´etant une constante arbitraire.
Si t
0
∈ R et si α
0
∈ R, et si l’on cherche la solution v´erifiant x(t
0
) = α
0
, alors α
0
= −(1+t
0
)+Ce
t
0
et il y a un unique choix de C qui donne la solution d´esir´ee.
(6.5) Des manipulations des deux derniers paragraphes, il faut bien entendu retenir la m´ethode
suivie plutˆot que les formules pr´ecises. Il convient ´egalement de retenir les deux points suivants :
(a) la solution fait intervenir une constante arbitraire, qui apparaˆıt par exemple dans le choix
de la primitive B de b (ou de γb lorsque l’´equation initiale n’est pas exacte comme dans la formule
(†)). Ainsi, il convient de parler de la famille des solutions, param´etr´ee par une constante C.
´
Etant donn´e t
0
et α, il y aura un unique choix de C pour que la solution x v´erifie x(t
0
) = α
0
.
(b) la condition que a
1
ne s’annule pas sur I interveint d`es le cas d’une ´equation homog`ene
exacte. En fait, si a
1
s’annule sur I, l’´equation n’admet pas de solution sur I en g´en´eral. Voir par
exemple l’exercice (e6.1)
(6.6) Consid´erons `a pr´esent quelques propri´et´es des solutions d’une ´equation diff´erentielle
d’ordre un, pas forc´ement lin´eaire. Une telle ´equation s’´ecrit donc F(t, x, x

) = 0, mais nous nous
limitons au cas o` u l’´equation peut s’´ecrire sous la forme x

= f(t, x), f ´etant une fonction de
deux variables. Notons que l’´equation lin´eaire d’ordre un s’´ecrit sous cette forme si a
1
ne s’annule
pas sur I, car quitte `a diviser l’´equation par a
1
, on peut supposer a
1
= 1 puis le r´earranger sous
la forme x

= b − a
0
x. Nous admettons qu’une telle ´equation poss`ede une famille de solutions
param´etr´ee par une constante C.
Dans la famille de solutions, certains membres peuvent ˆetre distingu´es par des propri´et´es
sp´eciales. Par exemple, il se peut que l’´equation ait une unique solution constante, appel´ee alors
solution d’´equilibre. On note souvent x
e
une solution d’´equilibre. Une solution d’´equilibre x
´etant par d´efinition une solution constante, c’est-`a dire une solution telle que x

(t) = 0 pour tout
t, les solutions d’´equilibres sont les r´eels x
e
v´erifiant f(t, x
e
) = 0 pour tout t.
On s’int´eresse alors au comportement asymptotique de certains solutions : s’il y a une solution
d’´equilibre, certaines d’autres solutions peuvent converger vers cette solution (lorsque t → +∞
par exemple). La courbe int´egrale approche alors la droite horizontale d’´equation x = x
e
lorsque
t → +∞. Lorsque c’est le cas, on dit que la solution est stable. L’´equation elle-mˆeme est dite
stable lorsque toutes ses solutions sont stables.
(6.6.1)
´
Etudions quelques exemples.
(i ) Prenons l’´equation x

−ax = 0, o` u a est une constante. L’´equation a pour solution g´en´erale
x(t) = Ce
−at
, C ´etant une constante. Si a ,= 0, la seule solution d’´equilibre est x
e
(t) = 0. Lorsque
t → +∞, la solution x(t) tend vers 0 si et seulement si a > 0. Par cons´equent, l’´equation est stable
si et seulement si a > 0. Si a = 0, la solution g´en´erale devient x(t) = C, et il n’y a pas de stabilit´e.
37
(ii ) Soit l’´equation x

= tx
2
sur ]0, +∞[. Une solution d’´equilibre v´erifie tx(t)
2
= 0 pour tout t
et, par cons´equent, la seule solution d’´equilibre est la solution x
e
(t) = 0. Soit t
0
> 0 et soit α
0
∈ R.
Si α
0
= 0, la solution `a condition initiale x(t
0
) = α
0
est la solution identiquement nulle. Si α
0
,= 0,
et si x est la solution `a condition initiale x(t
0
) = α
0
, il existe un intervalle ouvert J ⊆]0, +∞[
contenant t
0
et tel que x(t) ,= 0 pour tout t ∈ J. L’equation devient alors x

(t)/x(t)
2
= t d’o` u, en
int´egrant par rapport `a t, 1/x(t) = C −t
2
/2 avec C ∈ R, d’o` u x(t) = 1/(C −t
2
/2). On remarque
que x(t) est n´egative pour t assez grand, quelque soit la valeur de C. Puisque x(t
0
) = α
0
, on a
C = t
2
0
/2 + 1/α
0
. La fonction x(t) a donc une singularit´e lorsque t =
_
t
2
0
+ 2/α
0
. Le plus grand
intervalle ouvert J ⊆]0, +∞[ contenant t
0
et sur lequel x(t) est d´efini est donc ]0,
_
t
2
0
+ 2/α
0
[
lorsque α
0
> 0 et ]
_
t
2
0
+ 2/α
0
, +∞[ lorsque α
0
< 0. Lorsque α
0
< 0, x(t) → 0 lorsque t → ∞; il
y a donc stabilit´e lorsque t → +∞.
(6.7) Consid´erons d´esormais les ´equations lin´eaires d’ordre quelconque et `a coefficients con-
stants. Expliquons d’abord la m´ethode g´en´erale de solution de l’´equation
(E) a
n
x
(n)
(t) +a
n−1
x
(n−1)
(t) + +a
0
x(t) = 0,
les a
k
´etant des constantes r´eelles et a
n
,= 0. Soit λ un nombre (r´eel ou complexe) tel que la
fonction x(t) = e
λt
soit une solution. Puisque x
(k)
(t) = λ
k
x(t), on constate que λ est racine du
polynˆome caract´eristique
χ
E
(λ) = a
n
λ
n
+a
n−1
λ
n−1
+ +a
0
= 0.
R´eciproquement, si λ est racine du polynˆome caract´eristique χ
E
, la fonction t → e
λt
est solution
de l’´equation diff´erentielle (E).
Si λ = β + iγ est une racine complexe de χ
E
, alors le conjugu´e complexe λ = β − iγ en est
´egalement une, et les fonctions
t →
1
2
_
e
λt
+e
λt
_
= e
βt
cos γt, t →
1
2i
_
e
λt
−e
λt
_
= e
βt
sin γt
sont des solutions r´eelles de (E).
Si χ
E
a toutes ses racines distinctes on obtient ainsi une base de l’espace vectoriel des solutions,
elle est form´ee des fonctions t → e
λt
avec λ parcourant les racines r´eelles de χ
E
et des fonctions
t → e
βt
cos γt et t → e
βt
sin γt pour chaque couple (λ, λ) de racines complexes.
(6.7.1) Lorsque λ est une racine de χ
E
de multiplicit´e m
λ
, un calcul montre que toute fonction
t → P(t)e
λt
avec P un polynˆome de degr´e au plus m
λ
− 1 est solution de (E). Si λ = β + iγ,
λ = β −iγ est un couple de racines complexes conjugu´ees, on obtient les solutions
t → P(t)
1
2
_
e
λt
+e
λt
_
= P(t)e
βt
cos γt, t → P(t)
1
2i
_
e
λt
−e
λt
_
= P(t)e
βt
sin γt
avec P un polynˆome de degr´e au plus m
λ
−1.
Toute solution est une combinaison lin´eaire r´eelle des solutions de cette forme. Plus exacte-
ment, on a le r´esultat suivant.
(6.7.2) Th´eor`eme. On suppose que le polynˆome caract´eristique χ
E
de (E) ait p racines r´eelles
distinctes (λ
k
)
1≤k≤p
et q couples de racines conjugu´ees non-r´eelles distinctes (β

±iγ

)
1≤≤q
. Si l’on
note m
k
la multiplicit´e de λ
k
et n

la multiplicit´e de β

+iγ

, alors toute solution x de l’´equation
(E) s’´ecrit d’une mani`ere unique sous la forme
x(t) = P
1
(t)e
λ
1
t
+ +P
p
(t)e
λ
p
t
+
+Q
1
(t)e
β
1
t
cos γ
1
t +R
1
(t)e
β
1
t
sin γ
1
t + +Q
q
(t)e
β
q
t
cos γ
q
t +R
q
(t)e
β
q
t
sin γ
q
t,
38
o` u P
k
, (1 ≤ k ≤ p), est un polynˆome de degr´e au plus m
k
−1 et Q

et R

, (1 ≤ ≤ q), sont des
polynˆomes de degr´e au plus n

−1.
D´emonstration (esquisse). Comme indiqu´e juste avant l’´enonc´e, x est bien une solution de (E).
On a m
1
+ +m
p
+2n
1
+ +2n
q
= n. Les fonctions de la forme indiqu´ee constituent donc un R-
espace vectoriel de dimension au plus n. Un calcul (que nous omettrons) montre que si une fonction
de la forme indiqu´ee est identiquement nulle, alors P
1
= = P
p
= Q
1
= R
1
= = Q
q
= R
q
= 0.
Par cons´equent, les fonctions consid´er´ees constituent un R-espace vectoriel de dimension n. D’apr`es
(6.2.2) (ii ), les solutions forment un espace vectoriel de dimension n. On en tire qu’il n’y a pas
d’autres solutions.
En pratique, nous n’aurons besoin de ce r´esultat que pour les petites valeurs de n (n ≤ 4
disons).
(6.7.3) Exemples. (i ) Soit ω un r´eel, ω > 0. L’´equation x

+ ω
2
x = 0 a pour polynˆome
caract´eristique λ
2

2
et les deux racines sont iω et −iω. Cela conduit aux solutions t → cos ωt,
t → sin ωt puis `a la solution g´en´erale
x(t) = Acos ωt +Bsin ωt,
A et B ´etant des constantes. Les solutions sont toutes p´eriodiques, de p´eriode

ω
.
(ii ) Consid´erons l’´equation x
(iv)
(t) −2x

(t) + x(t) = 0. Le polynˆome caract´eristique est λ
4


2
+ 1 = (λ
2
− 1)
2
. Les racines 1 et −1 sont chacunes de multiplicit´e 2. Cela conduit aux 4
solutions t → e
t
, t → te
t
, t → e
−t
et t → te
−t
puis `a la solution g´en´erale
x(t) = (A +Bt)e
t
+ (C +Dt)e
−t
,
A, B, C et D ´etant des constantes.
(6.8) Soit l’´equation inhomog`ene
a
n
x
(n)
(t) +a
n−1
x
(n−1)
(t) + +a
0
x(t) = b(t),
o` u les a
k
sont des constantes avec a
n
,= 0 et b est une fonction. Nous savons d´ej`a d´ecrire toutes les
solutions de l’´equation homog`ene associ´ee. Cherchons donc des m´ethodes de trouver une solution
particuli`ere.
(6.8.1) Une m´ethode tr`es utile est celle de dite de la variation de la constante, que nous
allons d´ecrire dans le cas d’une ´equation d’ordre 2. Elle peut ˆetre utilis´ee mˆeme pour les ´equations
dont les coefficients ne sont pas constants. Prenons donc l’´equation
a
2
(t)x

(t) +a
1
(t)x

(t) +a
0
(t)x(t) = b(t)
et cherchons une solution x de la forme uy, y ´etant une solution connue de l’´equation homog`ene
associ´ee. Puisque x = uy, on a x

= u

y +uy

puis x

= u

y + 2u

y

+uy

et donc
a
2
x

+a
1
x

+a
0
x = a
2
(u

y + 2u

y

+uy

) +a
1
(u

y +uy

) +a
0
uy
= (a
2
y

+a
1
y

+a
0
y)u + (2a
2
y

+a
1
y

)u

+a
2
yu

d’o` u
(2a
2
y

+a
1
y

)u

+a
2
yu

= b.
Si l’on pose v = u

, on obtient l’´equation lin´eaire d’ordre un pour v : (2a
2
y

+ a
1
y

)v + a
2
yv

= b
ce qui permet en principe de d´eterminer v = u

puis u.
39
(6.8.2) Exemple. Soit l’´equation x


2
x = sin ωt, o` u ω > 0. On ´ecrit x = uy, o` u y est solution
de y

+ ω
2
y = 0. Alors u

y + 2u

y

= sin ωt.
`
A ce stade, il faut ´effectuer un choix de y. Pronons
y(t) = cos ωt. Alors cos ωt u

− 2ω sin ωt u

= sin ωt. L’´equation devient exacte si on la multiplie
par cos ωt, car (cos ωt)
2
a pour d´eriv´ee −2ω sin ωt cos ωt. Donc (u

(t) cos
2
ωt)

= cos ωt sin ωt et
u

(t) cos
2
ωt = −
cos
2
ωt

+ C puis u

(t) = −
1

+
C
cos
2
ωt
, C ´etant une constante. Ici, on ne cherche
qu’une seule solution particuli`ere u et on peut se permettre de choisir C d’une telle mani`ere que
le calcul devient le plus simple possible. Alors le choix C = 0 s’impose. On trouve alors u = −
1

t
et donc x = uy = −
1

t cos ωt. La solution g´en´erale est alors −
1

t cos ωt +Acos ωt +Bsin ωt.
Remarquons que la solution particuli`ere trouv´ee d´epend du choix fait de la solution y de
l’´equation homog`ene associ´ee. Le lecteur peut refaire le calcul en prenant y(t) = sin ωt `a la place
de cos ωt : il constatera alors que le choix de y n’est pas sans incidence sur la difficult´e du calcul. . ..
(6.8.3) La mˆeme m´ethode s’adapte aux ´equations lin´eaires inhomog`enes d’ordre n quelconque.
On cherche une solution x de la forme uy, y ´etant une solution de l’´equation homog`ene associ´ee.
On trouve que u

v´erifie une ´equation lin´eaire d’ordre n −1. En particulier, en prenant n = 1 on
trouve une seconde m´ethode de solution d’une ´equation inhomog`ene d’ordre un.
(6.9) Les notions d’´equilibre et de stabilit´e s’´etend d’une mani`ere ´evidente aux ´equations
d’ordre sup´erieure. Une solution constante est appel´ee solution d’´equilibre et toute solution conver-
geant vers une solution d’´equilibre s’appelle une solution stable.
Exemples. Reprenons les exemples de (6.7.3). Dans l’exemple (i ), la seule solution constante
est la fonction constante nulle. Si A ,= 0 ou si B ,= 0, la solution g´en´erale x(t) ne tend pas vers 0
lorsque t → +∞ et il n’y a donc pas de stabilit´e.
Dans l’exemple (ii ), la seule solution constante est `a nouveau la solution identiquement nulle.
La solution g´en´erale est stable si et seulement si A = B = 0.
(6.10) Terminons ce th`eme en mentionnant quelques exemples d’´equations diff´erentielles dont
les solutions se pr´esentent sous forme de fonction implicite. Soit d’abord x une fonction de t d´efinie
implicitement par une relation g(t, x) = C, g ´etant de classe (
(1)
sur un domaine de R
2
et C une
constante. Alors g

1
(t, x) +g

2
(t, x)x

(t) = 0 et, r´eciproquement, cette relation entraˆıne g(t, x) = C,
comme on le montre en appliquant (3.5.2). Ainsi, les courbes int´egrales de l’´equation
(*) g

1
(t, x) +g

2
(t, x)x

(t) = 0
sont les courbes g(t, x) = C.
Exemple. L’´equation t +xx

= 0 a pour courbes int´egrales les cercles t
2
+x
2
= C.
(6.10.1) Consid´erons plus g´en´eralement une ´equation de la forme M(t, x) + N(t, x)x

(t) = 0,
o` u M et N sont de classe (
(1)
sur le domaine Ω ⊆ R
2
. L’´equation est dite exacte si la forme
diff´erentielle M(t, x)dt +N(t, x)dx est exacte, c’est-`a-dire s’il existe une fonction g sur Ω telle que
g

1
= M et g

2
= N. Dans ce cas, l’´equation est de la forme (∗). Si c’est le cas, on sait que M

2
= N

1
,
car g

1,2
= g

2,1
d’apr`es (4.1.1).
En g´en´eral, on ne peut pas trouver une fonction γ : Ω → R telle que γ(t, x)M(t, x)dt +
γ(t, x)N(t, x)dx soit exacte. Cela sera la cas toutefois lorsque Ω est simplement connexe, c’est-
`a-dire tout arc dans Ω peut ˆetre d´eform´ee de fa¸con continue en tout autre arc dans Ω. Par exemple
R
2
, un demi-plan ou un disque sont simplement connexes, mais R
2
− ¦(0, 0)¦ ne l’est pas car un
cercle contournant l’origine ne peut pas ˆetre d´eform´ee en un cercle dont l’origine se trouve `a
l’ext´erieur. Nous ne justifierons pas ces affirmations dans ce cours.
(6.10.2) Une ´equation de la forme g(t) + h(x)x

(t) = 0 est dite `a variables s´epar´ees. Les
courbes int´egrales sont de la forme G(t) +H(x) = C, G et H ´etant respectivement des primitives
de g et de h et C ´etant une constante.
40
EXERCICES
(e6.1) Montrer qu’il n’y a aucune fonction d´erivable x : R → R telle que tx

(t) = 1 quelque soit
t ∈ R. R´esoudre l’´equation diff´erentielle tx

(t) = 1 sur un intervalle ouvert ne contenant pas 0.
(e6.2) R´esoudre l’´equation tx

+ x = 1 sur ]0, +∞[ et sur ] − ∞, 0[ par la m´ethode de (6.4). Pour
quelles valeurs de α
0
y-a-t-il une solution sur R qui satisfait x(0) = α
0
?
(e6.3) R´esoudre par la m´ethode de (6.4) l’´equation x

+ 2tx = e
−t
2
sur R. V´erifier que toutes les
solutions tendent vers 0 lorsque t → +∞.
(e6.4) L’´equation de Bernoulli x

+ a
0
x = bx
n
est utilis´ee en ´economie. Ici, a
0
et b sont des
fonctions de t et n ∈ Z. Si n = 1, il s’agit d’une ´equation lin´eaire.
(i ) On suppose n ,= 1. Montrer que si y est la fonction d´efinie par x(t) = y(t)
1
1−n
, alors y v´erifie une
´equation lin´eaire que l’on pr´ecisera.
(ii ) R´esoudre l’´equation x

+x = x
2
. Trouver les solutions d’´equlibre. Y-a-t-il des solutions stables ?
Tracer les courbes int´egrales.
(e6.5) Soit a
1
(t)x

(t) + a
0
(t)x(t) = 0 une ´equation diff´erentielle lin´eaire homog`ene de degr´e un, o` u
a
1
(t) ,= 0 pour tout t ∈ I. Soit A une primitive de
a
0
a
1
: A

(t) =
a
0
(t)
a
1
(t)
quelque soit t ∈ I. Montrer que si
l’on pose γ(t) = e
A(t)
, alors γ(t)x

(t) +γ

(t)x(t) = 0 pour tout t ∈ I. En d´eduire que (γx)

(t) = 0 quelque
soit t ∈ I puis que x(t) =
C
γ(t)
quelque soit la t ∈ I, C ´etant une constante. En d´eduire que si x n’est pas
identiquement nulle, alors x ne s’annule pas sur I. Ce raisonnement justifie le calcul de (6.3.1).
(e6.6) R´esoudre chacune des ´equations diff´erentielles qui suivent. (Des nombres complexes de de-
vraient pas figurer dans la r´eponse finale.)
(i ) x

(t) = 4x(t).
(ii ) x

(t) = 4x

(t).
(iii ) x

(t) −2x

(t) + 5x(t) = 0.
(iv) x

(t) −3x

(t) + 2x(t) = 0.
(e6.7) (i ) D´ecrire la solution g´en´erale sur R de l’´equation x

+2x

+2x = 0. (Des nombres complexes
de devraient pas figurer dans la r´eponse finale.)
(ii ) Trouve la solution g´en´erale de y

+ 2y

+ 2y = 2.
(iii ) R´esoudre l’´equation z

+ 2z

+ 2z = e
t
.
(iv) Dans chacun des cas (i ), (ii ) et (iii ), trouver toutes les solutions qui tendent vers 0 lorsque
t → +∞.
(e6.8) R´esoudre l’´equation x

+ 2x

+ x = e
−t
en utilisant la m´ethode de variation de la constante.
V´erifier que toutes les solutions tendent vers 0 lorsque t → +∞.
(e6.9) Reprendre en utilisant la m´ethode de variation de la constante l’´equation de l’exercice (e6.3).
(e6.10) On consid´ere l’´equation lin´eaire homog`ene `a coefficients constants (E) de (6.7) ainsi que son
polynˆome caract´eristique χ
E
.
(i ) Montrer que (E) a une solution constante non-nulle si et seulement si 0 est une racine de χ
E
.
(ii ) On suppose que 0 ne soit pas racine de χ
E
. Montrer que (E) est stable si et seulement si toutes
les racines de χ
E
sont de partie r´eelle strictement n´egative.
(e6.11) On note I ⊆ R un intervalle ouvert. On consid`ere l’´equation diff´erentielle
(E) t
3
x

(t) −tx

(t) +x(t) = 0,
o` u t ∈ I.
(i ) V´erifier que la fonction x(t) = t est solution de l’´equation (E), quelque soit le choix de l’intervalle
I.
(ii ) On suppose I ne contient pas 0. En cherchant une solution de la forme x(t) = u(t)t o` u la fonction
u est `a d´eterminer, trouver la solution g´en´erale de (E) sur I.
41
(iii ) On suppose que 0 ∈ I. V´erifier alors que si la fonction deux-fois d´erivable x v´erifie (E), alors
x(0) = 0. En d´eduire la solution g´en´erale de (E) sur I.
(e6.12) Trouver toutes les fonctions continues et born´ees f : R → R v´erifiant f

(t) − f(t) = e
−|t|
quelque soit t ,= 0.
(e6.13) On fixe a ∈ R. R´esoudre l’´equation diff´erentielle
x

(t) = e
x(t)
avec la condition initiale x(0) = a. Pr´eciser en fonction de a le plus grand intervalle contenant 0 sur
lequel la solution x est d´efinie.
(e6.14) Trouver les solutions d’´equilibre de l’´equation x

= x
3
− x. R´esoudre l’´equation, en faisant
attention `a l’intervalle d’´etude. (Rappelons que 1/(x
3
−x) = x/(x
2
−1) −1/x pour tout x ∈ R−¦0, ±1¦).
(e6.15) On consid`ere l’´equation diff´erentielle x

(t) = ax(t), a ´etant une constante. Notons x : R →R
une solution.
(i ) Montrer que x poss`ede des d´eriv´ees de tout ordre. (Raisonner par r´ecurrence sur n et utilisant la
formule x
(n)
(t) = lim
h→0
x
(n−1)
(t+h)−x
(n−1)
(t)
h
.)
(ii ) Montrer que x
(n)
(t) = a
n
x(t) pour tout n ∈ N et pour tout t ∈ R.
Soit d´esormais α
0
∈ R et soit x une solution v´erifiant x(0) = α
0
.
(iii ) Soit n ∈ N. Montrer que pour tout t ∈ R on peut ´ecrire
x(t) = α
0
n

k=0
a
k
t
k
k!

0
a
n+1
t
n+1
x(θt)
(n + 1)!
,
o` u θ ∈]0, 1[. (Utiliser la formule de Taylor-Lagrange.)
(iv) En d´eduire que x(t) = α
0
e
at
pour tout t ∈ R.
Th`eme 7. Syst`emes d’´equations diff´erentielles
(7.1) Un syst`eme d’´equations diff´erentielles est une famille d’´equations diff´erentielles
F
1
(t, x
1
, x
2
, . . . , x
p
, x

1
, x

2
. . . , x
(n)
p
) = 0,
F
2
(t, x
1
, x
2
, . . . , x
p
, x

1
, x

2
. . . , x
(n)
p
) = 0,
. . . . . . . . . . . . . . . . .
F
p
(t, x
1
, x
2
, . . . , x
p
, x

1
, x

2
. . . , x
(n)
p
) = 0.
Ici p ≥ 1 est un entier et il y a p ´equations dans les p fonctions x
1
, x
2
, . . ., x
p
de t ainsi que
leur d´eriv´ees x

1
, x

2
, . . ., x
(n)
p
. Ce syst`eme est d’ordre n si les ´equations ne font intervenir que
les d´eriv´ees d’ordre au plus n et la d´eriv´ee d’ordre n d’au moins une des fonctions x
k
apparaˆıt
effectivement dans au moins une des ´equations.
(7.1.1) Dans la suite, nous nous limiterons au cas des syst`emes d’ordre un de la forme
x

1
= f
1
(t, x
1
, . . . , x
p
),
x

2
= f
2
(t, x
1
, . . . , x
p
),
. . . . . . .
x

p
= f
p
(t, x
1
, . . . , x
p
).
(∗)
42
Afin de simplifier l’exposition, nous supposerons que toutes les fonctions f
k
: R
p+1
→ R sont de
classe (
(1)
. Leur domaine de d´efinition est alors de la forme I Ω, I ´etant un intervalle ouvert et
Ω un domaine de R
p
.
Nous allons ´enoncer un th´eor`eme analogue `a (6.1.2) concernant l’existence et d’unicit´e des
solutions d’un tel syst`eme.
(7.1.2) Th´eor`eme. Soit I un intervalle ouvert et soit Ω un domaine dans R
p
. Soit t
0
∈ I et
soit (a
1
, a
2
, . . . , a
p
) ∈ Ω. Soient f
k
(1 ≤ k ≤ p) p fonctions de classe (
(1)
de Ω dans R. Alors il
existe un intervalle ouvert J ⊆ I contenant t
0
et une unique fonction x = (x
1
, x
2
, . . . , x
p
) : J
p
→ Ω
v´erifiant (∗) ainsi que les conditions initiales x
1
(t
0
) = a
1
, x
2
(t
0
) = a
2
, . . ., x
p
(t
0
) = a
p
.
Un r´esultat plus g´en´eral sera d´emontr´e dans le th`eme 10 (th´eor`eme de Cauchy-Lipschitz, le
th´eor`eme (10.4)).
(7.1.3) Le th´eor`eme (6.1.2) se d´eduit de ce r´esultat de la mani`ere suivante.
`
A l’´equation
x
(n)
(t) = f
_
t, x(t), x

(t), . . . , x
(n−1)
(t)
_
de (6.1.2) on associe le syst`eme
x

1
(t) = x
2
(t),
x

2
(t) = x
3
(t),

x

n−1
(t) = x
n
(t)
x

n
(t) = f
_
t, x
1
(t), x
2
(t), . . . , x
n
(t)
_
.
Le th´eor`eme (7.1.2) pr´evoit alors l’existence d’un intervalle ouvert J ⊆ I contenant t
0
ainsi
qu’un unique syst`eme de solutions (x
1
, x
2
, . . . , x
n
) : J
n
→ Ω v´erifiant x
1
(t
0
) = α
0
, x
2
(t
0
) =
α
1
, . . ., x
n
(t
0
) = α
n−1
. On v´erifie aussitˆot que la fonction x(t) = x
1
(t) v´erifie alors x
(n)
(t) =
f
_
t, x(t), x

(t), . . . , x
(n−1)
(t)
_
pour tout t ∈ J ainsi que x(t
0
) = α
0
, x

(t
0
) = α
1
, . . ., x
(n−1)
(t
0
) =
α
n−1
.
(7.2) Le syst`eme (∗) est dit lin´eaire si chacune des fonctions f
k
s’´ecrit

p
=1
a
kl
x

+b
k
, a
kl
et b
k
´etant des fonctions connues de t sur un intervalle I. Ce syst`eme est homog`ene si b
k
= 0
quelque soit k ∈ ¦1, 2, . . . , p¦. On utilise souvent la notation vectorielle
X

(t) = A(t)X(t) +B(t) (ou X

= AX +B)
pour les syst`emes lin´eaires d’ordre un. Ici, A d´esigne la matrice de fonctions (a
kl
)
1≤k,,≤p
, X le
vecteur
t
(x
1
, x
2
, . . . , x
p
), X

le vecteur
t
(x

1
, x

2
, . . . , x

p
) et B le vecteur
t
(b
1
, b
2
, . . . , b
p
).
(7.3) Proposition. Soit X

= AX +B un syst`eme lin´eaire.
(i ) Si B = 0 (c’est-`a-dire si le syst`eme est homog`ene), alors les solutions forment un R-espace
vectoriel.
(ii ) Soit X
0
une solution particuli`ere du syst`eme X

= AX +B. Alors toute solution est de la
forme X
0
+Y avec Y une solution du syst`eme homog`ene associ´ee Y

= AY .
La d´emonstration est imm´ediate.
(7.4) Soit x
(n)
+a
n−1
x
(n−1)
+ +a
0
x = b une ´equation lin´eaire d’ordre n dont le coefficient de
x
(n)
est 1. Si l’on pose x
0
= x, x
1
= x

, . . ., x
n
= x
(n)
, alors l’´equation est ´equivalente au syst`eme
x

0
= x
1
x

1
= x
2

x

n−2
= x
n−1
x

n−1
= −a
0
x
0
−a
1
x
1
−a
2
x
2
− −a
n−1
x
n−1
+b
43
qui se r´esume en notation vectorielle X

= AX +B `a l’aide de la matrice compagnon
A =
_
_
_
_
_
_
0 1 0 0 0
0 0 1 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 0 1
−a
0
−a
1
−a
2
−a
3
−a
n−1
_
_
_
_
_
_
et B d´esigne le vecteur
t
(0, 0, . . . , 0, b). Ainsi la notion de syst`eme diff´erentielle d’ordre un g´en´eralise
celle d’´equation lin´eaire d’ordre n.
(7.4.1)
`
A toute solution X =
t
(x
1
, x
2
, . . . , x
p
) d’un syst`eme diff´erentielle on peut associer la
courbe param´etr´ee t →
_
x
1
(t), x
2
(t), . . . , x
p
(t)
_
dans R
p
, appel´ee courbe int´egrale. Les points
critiques du syst`eme, c’est-`a-dire les solutions X avec X

(t) = 0, sont les solutions constantes
du syst`eme et les courbes int´egrales correspondantes sont alors r´eduites `a des points. Les solutions
X telles que X

(t) = 0 sont appel´ees solutions d’´equilibre. Une solution est dite stable si elle
converge vers une solution d’´equilibre, et le syst`eme est dit stable si toutes les solutions convergent
vers une solution d’´equilibre (lorsque t → +∞ par exemple).
(7.4.2) Proposition. Soit X

= AX +B un syst`eme lin´eaire dont la matrice A est constante
et inversible et B est constant. Alors il y a un unique ´equilibre, `a savoir la solution X = −A
−1
B.
D´emonstration. Il est clair que X = −A
−1
B est effectivement solution du syst`eme. Soit
r´eciproquement X
0
une solution constante. Alors Y
0
= X
0
+ A
−1
B est solution du syst`eme ho-
mog`ene associ´e Y

= AY . Alors Y

0
= 0 et donc AY
0
= 0. Puisque A est inversible, on a bien
Y
0
= 0 et donc X
0
= −A
−1
B.
(7.5) Le cas d’un syst`eme lin´eaire d’ordre 2 est particuli`erement important. Notons alors les
solutions vectorielles par
t
(x, y) plutˆot que par
t
(x
1
, x
2
). Si par exemple on consid`ere le syst`eme
_
x

(t)
y

(t)
_
=
_
0 −ω
ω 0
__
x(t)
y(t)
_
,
o` u ω ,= 0 est une constante, alors les solutions sont de la forme
_
x(t)
y(t)
_
= C
_
cos ωt
sin ωt
_
+D
_
sin ωt
−cos ωt
_
,
C et D ´etant des constantes (voir l’exercice (e7.1)). Ainsi, x(t)
2
+y(t)
2
= C
2
+D
2
et les courbes
int´egrales sont les cercles centr´es `a l’origine et de rayon quelconque. La seule solution d’´equilibre
est la solution x(t) = y(t) = 0 et les autres solutions ne convergent pas vers celle-ci lorsque
t → +∞. Il n’y a donc pas de stabilit´e.
(7.5.1) Consid´erons d´esormais le syst`eme
_
x

(t)
y

(t)
_
=
_
0 −ω
ω 0
__
x(t)
y(t)
_
+
_
1
1
_
,
ou encore ω ,= 0. Remarquons qu’il y a une solution d’´equilibre
_
x(t)
y(t)
_
= −
_
0 −ω
ω 0
_
−1
_
1
1
_
=
_
0 −
1
ω
1
ω
0
__
1
1
_
=
_

1
ω
1
ω
_
.
44
D’apr`es l’exemple pr´ec´edent et la proposition (7.3), la solution g´en´erale est
_
x(t)
y(t)
_
= C
_
cos ωt
sin ωt
_
+D
_
sin ωt
−cos ωt
_
+
_

1
ω
1
ω
_
.
Les courbes int´egrales sont encore des cercles, mais de centre
_

1
ω
,
1
ω
_
.
(7.6) Un syst`eme d’´equations de la forme
x

1
= f
1
(x
1
, x
2
, . . . , x
p
),
x

2
= f
2
(x
1
, x
2
, . . . , x
p
),
. . . . . . . . . .
x

p
= f
2
(x
1
, x
2
, . . . , x
p
),
(o` u la variable t n’apparaˆıt pas explicitement) est appel´e un syst`eme dynamique (ou syst`eme
autonome). Les syst`emes lin´eaires `a coefficients constants sont des syst`emes dynamiques.
`
A
nouveau, on note X =
t
(x
1
, x
2
, . . . , x
p
) un vecteur de solutions. Une solution d’´equilibre
(ou un ´equilibre) est une solution constante. Un ´equilibre v´erifie donc X

(t) = 0, c’est-`a-dire
f
1
(x
1
, x
2
, . . . , x
p
) = f
2
(x
1
, x
2
, . . . , x
p
) = = f
p
(x
1
, x
2
, . . . , x
p
) = 0 et l’on d´etermine les ´equilibres
en resolvant ces ´equations.
Consid´erons par exemple un syst`eme dynamique `a deux ´equations
x

= f(x, y),
y

= g(x, y).
(†)
Si t
0
est tel que x

(t
0
) ,= 0, on a
y

(t
0
)
x

(t
0
)
=
g(x(t
0
), y(t
0
))
f(x(t
0
), y(t
0
))
.
Sur un voisinage de x
0
= x(t
0
), on peut alors ´ecrire y comme fonction de x et la fonction y est
alors solution de l’´equation diff´erentielle
(1) f(x, y)
dy
dx
−g(x, y) = 0.
Ainsi, le syst`eme dynamique (†) permet d’obtenir une solution param´etr´ee de l’´equation (1), ce
qui ´evite les probl`emes rencontr´es dans le th`eme pr´ec´edent au points o` u f(x, y) s’annule. Voir par
exemple l’exercice (e7.8).
(7.7) Un syst`eme lin´eaire X

= AX+B `a coefficients constants dont la matrice A est inversible
a un unique ´equilibre −A
−1
B d’apr`es la proposition (7.4.2).
Le comportement des solutions autour de l’´equilibre peut alors alors ˆetre d´etermin´e en fonction
des valeurs propres du polynˆome caract´eristique de A. Dans ce qui suit, on se limite au cas de
deux ´equations en deux inconnus x, y. La matrice A est alors d’ordre 2.
(a) les racines du polynˆome caract´eristique de A sont r´eelles.
— (i ) si elles sont strictement n´egatives, l’´equation est stable et le point critique est un nœud
stable ;
— (ii ) si elles sont strictement positives, l’´equation est instable car toutes les solutions non-
constantes sont non-born´ees et le point critique est un nœud instable ;
— (iii ) si elles sont de signe contraire, l’´equilibre est un point-selle ou col.
45
nœud stable nœud instable point-selle
Ici, les croquis correspondent au cas o` u les deux racines du polynˆome caract´eristique sont
distinctes. Dans le cas d’une racine double, il n’y a qu’une seule droite passant par le point
critique. Voir aussi l’exercice (e7.7).
(b) les racines du polynˆome caract´eristique de A ne sont pas r´eelles. Il s’agit donc d’un couple
de nombres complexes conjugu´es.
— (i ) si leur partie r´eelle est strictement n´egative, les courbes int´egrales convergent vers le
point d’´equilibre en spiralant autour et l’´equilibre est un foyer stable ;
— (ii ) si leur partie r´eelle est strictement positive, les courbes int´egrales s’´eloignent du point
d’´equilibre en spiralant autour et l’´equilibre est un foyer instable ;
— (iii ) si elles sont imaginaires pures, les courbes int´egrales sont des cercles centr´es sur le
point d’´equilibre. Il s’agit alors d’un centre.
foyer stable foyer instable centre
(7.8) Consid´erons un syst`eme de deux ´equations en deux inconnus x

= f(x, y), y

= g(x, y).
Nous supposons x, y d´efinis sur un intervalle de la forme [t
0
, +∞[. Les ´equilibres sont donc les
solutions constantes x
e
, x
e
v´erifiant f(x
e
, y
e
) = 0 et g(x
e
, y
e
) = 0. On dit que l’´equilibre (x
e
, y
e
)
est stable si ´etant donn´e ε > 0, il existe δ > 0 tel que pour toute solution (x, y) v´erifiant
[[
_
x(t
0
), y(t
0
)
_
− (x
e
, y
e
)[[ ≤ δ, on ait [[
_
x(t), y(t)
_
− (x
e
, y
e
)[[ ≤ ε pour tout t ≥ t
0
. On dit que
(x
e
, y
e
) est asymptotiquement stable s’il existe ε > 0 tel que pour toute solution (x, y) v´erifiant
[[
_
x(t
0
), y(t
0
)
_
−(x
e
, y
e
)[[ ≤ ε, on ait lim
t→+∞
(x(t), y(t)) = (x
e
, y
e
).
Un nœud stable et un foyer stables sont asymptotiquement stables. Un centre est stable mais
pas asymptotiquement stable. Dans tout autre cas, il y a instabilit´e. On pourrait penser qu’un
´equilibre asymptotiquement stable soit n´ecessairement stable. En fait, ce n’est pas le cas, bien
qu’il ne soit pas facile `a en donner des exemples.
(7.8.1) Th´eor`eme (de Hartman-Grobman). Soit x

= f(x, y), y

= g(x, y) un syst`eme dy-
namique avec f, g de classe (
(1)
sur un domaine Ω de R
2
. Soit (x
e
, y
e
) ∈ Ω un ´equilibre. On
suppose que les valeurs propres de la matrice jacobienne J
(f,g)
(x
e
, y
e
) ne soient pas imaginaires
pures ou nulles. Alors l’´equilibre (x
e
, y
e
) du syst`eme de d´epart est de la mˆeme nature (nœud stable,
nœud instable, . . .) que celui du syst`eme lin´earis´e x

= (x − x
e
)f

1
(x
e
, y
e
) + (y − y
e
)f

2
(x
e
, y
e
),
y

= (x −x
e
)g

1
(x
e
, y
e
) + (y −y
e
)g

2
(x
e
, y
e
).
Ce r´esultat sera admis. Remarquons le cas exclu o` u les valeurs propres sont imaginaires pures
ou nulles. Ces cas sont exceptionnels ; si par exemple les valeurs propres sont imaginaires pures
mais non-nulles, l’´equilibre de l’´equation de d´epart pourrait ˆetre un centre ou un foyer stable ou
instable.
46
(7.8.2) Exemple. Soit le syst`eme x

= 2x + y + xy, y

= y + x
2
. Pour trouver les ´equilibres, il
faut r´esoudre les ´equations 2x+y+xy = y+x
2
= 0. Cela donne les trois ´equilibres (x
e
, y
e
) = (0, 0),
(1, −1) et (−2, −4). La matrice jacobienne de (x, y) → 2x +y +xy, (x, y) → y +x
2
est
J
f,g
(x, y) =
_
2 +y 1 +x
2x 1
_
.
On a donc J
f,g
(0, 0) =
_
2 1
0 1
_
dont les racines du polynˆome caract´eristique sont 1 et 2. L’´equilibre
(0, 0) est donc un nœud instable. Ensuite, J
f,g
(1, −1) =
_
1 2
2 1
_
et les racines du polynˆome ca-
ract´eristique t
2
−2t−3 sont r´eelles et de signes oppos´es. L’´equilibre (1, −1) est donc un point-selle.
Enfin, J
f,g
(−2, −4) =
_
−2 −1
−4 1
_
et les racines du polynˆome caract´eristique t
2
+t −6 sont `a nou-
veau r´eelles et de signes oppos´es. D’o` u un second point-selle.
EXERCICES
(e7.1) On reprend le syst`eme lin´eaire de (7.5). V´erifier que x

(t)+ω
2
x(t) = 0 et que y

(t)+ω
2
y(t) = 0.
En d´eduire que toute solution du syst`eme (∗) de (7.5) est de la forme indiqu´ee (∗∗).
(e7.2) R´esoudre le syst`eme
_
x

(t)
y

(t)
_
=
_
1 1
0 1
__
x(t)
y(t)
_
.
(Montrer d’abord que x

− 2x

+ x = 0.) Tracer les courbes int´egrales et discuter de la stabilit´e de la
solution x(t) = y(t) = 0.
(e7.3) Mˆeme chose pour le syst`eme
_
x

(t)
y

(t)
_
=
_
1 −1
1 1
__
x(t)
y(t)
_
.
(Montrer d’abord que x

−2x

+ 2x = 0.)
(e7.4) (i ) G´en´eraliser les trois exercices pr´ec´edents en consid´erant le syst`eme
(*)
_
x

(t)
y

(t)
_
=
_
a b
c d
__
x(t)
y(t)
_
,
o` u a, b, c et d sont des constantes. Montrer que x et y sont solutions de z

−(a +d)z

+ (ad −bc)z = 0.
On note λ
1
, λ
2
les deux racines du polynˆome caract´erique λ
2
− (a + d)λ + (ad − bc) de la matrice
_
a b
c d
_
.
(ii ) On suppose λ
1
,= λ
2
sont r´eels. Montrer que si v
1
et v
2
d´esigne des vecteurs propres de A
correspondant respectivement `a λ
1
et λ
2
. Montrer que
_
x(t)
y(t)
_
= Ae
λ
1
t
v
1
+Be
λ
2
t
v
2
est solution, quelque
soit les constantes A et B.
(iii ) On suppose λ
1
= β + iγ, λ
2
= β − iγ avec γ ,= 0. Soit v un vecteur propre (complexe)
correspondant `a λ
1
. On note ¯ v le vecteur dont les coefficients sont les conjugu´es complexes de v et on
pose '(v) = (v + ¯ v)/2, ·(v) = (v − ¯ v)/2i. Montrer que
_
x(t)
y(t)
_
= e
βt
_
A
_
(cos γt)'(v) −(sinγt)·(v)
_
+B
_
(cos γt)·(v) + (sinγt)'(v)
_
_
47
est une solution (r´eelle), quelque soit les constantes A et B.
(iv) On suppose λ
1
= λ
2
et que l’espace propre associ´e `a λ
1
est de dimension un. Montrer que si v
est un vecteur propre et si w est un vecteur tel que
_
_
a b
c d
_
−λ
1
_
w = v,
alors
_
x(t)
y(t)
_
= (A+Bt)e
λ
1
t
v +Ae
λ
1
t
w est solution quelque soit les constantes A et B.
(v) Que se passe-t-il lorsque λ
1
= λ
2
et A est diagonalisable ?
(vi ) En admettant que l’espace vectoriel des solutions est toujours de dimension deux, montrer que
dans chacun des cas que le syst`eme (∗) n’a que les solutions indiqu´ees.
(e7.5) Soit P(t) = t
2
+at +b, a, b ∈ R un polynˆome unitaire de degr´e 2.
(i ) Montrer que les deux racines de P sont r´eelles et strictement n´egatives si et seulement si a
2
−4b > 0,
a > 0 et b > 0. (Si λ, µ sont les deux racines, penser aux formules λ +µ = −a, λµ = b.)
(ii ) Donner des conditions n´ecessaires et suffisantes sur a et b pour que les deux racines de P soient
r´eelles et strictement positives ; r´eelles et de signes oppos´es ; non-r´eelles et `a partie r´eelle strictement
n´egatives ; non-r´eelles et `a partie r´eelle strictement positive ; imaginaires pures.
(e7.6) R´esoudre le syst`eme
_
x

(t)
y

(t)
_
=
_
1 1
0 1
__
x(t)
y(t)
_
+
_
1
1
_
. Chercher les ´equilibres.
´
Etudier la
stabilit´e.
(e7.7)
´
Etendre les consid´erations de l’exercice (e7.4) aux syst`emes inhomog`enes X

= AX + B, o` u
A =
_
a b
c d
_
, B est un vecteur constant.
(e7.8) Reprenons le syst`eme lin´eaire de (7.5). Comparer ce syst`eme avec l’´equation y
d y
d x
+x = 0 (voir
l’´equation (1) de (7.6)). Dans le premier cas, les courbes int´egrales sont des cercles centr´es `a l’origine.
Que se passe-t-il dans le second cas ?
(e7.9)
´
Etudier les syst`emes dynamiques
(i )
_
x

y

_
=
_
1
2
x
2

1
2
y
1
2

1
2
y
_
,
et
(ii )
_
x

y

_
=
_
1 −e
y
5x −y
_
.
Dans chacun des deux cas, chercher les ´equilibres et d´eterminer leur nature en utiliant le th´eor`eme
de Hartman-Grobman.
(e7.10) On consid`ere le syst`eme lin´eaire d’´equations diff´erentielles
x

(t) = x(t) +y(t)
y

(t) = 2x(t).
(i ) Trouver la solution g´en´erale de ce syst`eme.
(ii ) Trouver l’unique solution (x, y) v´erifiant x(0) = 1, y(0) = 0.
(iii ) D´ecrire l’ensemble des solutions (x, y) v´erifiant x(t) → 0 lorsque t → +∞.
(iv) Calculer lim
t→+∞
y(t) lorsque (x, y) est l’une des solutions v´erifiant la condition de la question
(iii ).
(v) D´eterminer la nature du point d’´equilibre (0, 0) du syst`eme autonome
x

(t) = x(t) +y(t) +x(t)
2
y

(t) = 2x(t) +y(t)
2
.
48
Th`eme 8. Solutions p´eriodiques, cycles limites
(8.1) Dans ce th`eme, nous continuerons l’´etude d’un syst`eme dynamique de 2 ´equations
(*) x

= f(x, y), y

= g(x, y),
o` u x

, y

d´esignent les d´eriv´ees de x et de y par rapport `a t ∈ R. Le th´eor`eme de Hartman-Grobman
donne des renseignements locaux au voisinage d’un ´equilibre. Le th´eor`eme de Cauchy-Lipschitz
(10.4) justifie l’existence de solutions. Ici, nous indiquons comment obtenir des renseignements
globaux sur les solutions, sans que l’on puisse, en g´en´eral, les d´ecrire `a l’aide de formules simples.
(8.2) Proposition. Deux courbes int´egrales distinctes ne se coupent pas.
D´emonstration. En effet, si deux courbes se coupaient en un point (a, b), l’une des courbes C
1
repr´esenterait la solution (x
1
, y
1
) du syst`eme v´erifiant x
1
(t
1
) = a et y
1
(t
1
) = b, alors que l’autre
courbe C
2
repr´esenterait la solution (x
2
, y
2
) du syst`eme v´erifiant x
2
(t
2
) = a et y
2
(t
2
) = b. Posons
u = t +t
1
−t
2
, de sorte que
dx
du
=
dx
dt
et
dy
du
=
dy
dt
. Puisque f et g ne d´ependent pas explicitement de
t, la courbe u → (x
2
(u), y
2
(u)) est ´egalement une courbe int´egrale v´erifiant x
2
(t
1
) = a, y
2
(t
1
) = b.
L’unicit´e de la solution garantie par le th´eor`eme de Cauchy-Lipschitz implique donc que x
2
= x
1
et y
2
= y
1
.
Le mˆeme argument montre ´egalement que la mˆeme courbe int´egrale ne peut pas se couper en
un point. S’il existe t
1
, t
2
, tels que t
1
,= t
2
et x(t
1
) = x(t
2
) et y(t
1
) = y(t
2
), la courbe effectue une
boucle.
Soit I un intervalle, soit E un ensemble et soit f : I → E une application. soit T ∈ R. On
dit que T est une p´eriode de f si f(t + T) = f(t) quelque soit t ∈ I tel que t + T ∈ I. f est dite
p´eriodique lorsque elle poss`ede une p´eriode non-nulle. Il est clair que si T est une p´eriode, alors il
en est de mˆeme pour −T. Par cons´equent, une fonction p´eriodique poss`ede toujours une p´eriode
strictement positive.
(8.2.1) Proposition. Une courbe int´egrale du syst`eme dynamique (∗) qui est ferm´ee en boucle
correspond `a une solution p´eriodique.
D´emonstration. Si t →
_
x(t), y(t)
_
est une solution de p´eriode T > 0, alors
_
x(t+T), y(t+T)
_
=
_
x(t), y(t)
_
pour tout t et donc la courbe est en boucle.
Supposons r´eciproquement que la courbe int´egrale soit une boucle. Si la boucle se r´eduit `a un
seul point, la solution est constante, d’o` u un pont critique. Dans le cas contraire, le th´eor`eme de
Cauchy-Lipschitz montre qu’elle ne passe pas par un point critique. Alors il existe t
0
et T > 0
tels que
_
x(t
0
), y(t
0
)
_
=
_
x(t
0
+T), y(t
0
+T)
_
. A priori, x et y ne sont d´efinies que sur l’intervalle
[t
0
, T] mais, d’apr`es le th´eor`eme de Cauchy-Lipschitz appliqu´e `a t = t
0
puis `a t = t
0
+T, il existe
un intervalle ouvert I contenant [t
0
, t
0
+ T] et une unique solution de (∗) sur I qui co¨ıncide avec
(x, y) sur [t
0
, T]. On suppose l’intervalle I maximal pour cette propri´et´e. D´esignons alors donc
encore cette solution par (x, y). En raison de l’unicit´e de la solution, il existe un intervalle ouvert
J ⊆ I contenant t
0
et une fonction φ : J → I tels que φ(t
0
) = T et
_
x(φ(t)), y(φ(t)
_
=
_
x(t), y(t)
_
pour tout t ∈ J. Mais
x

(t) = f(x(t), y(t) = f
_
x(φ(t)), y(φ(t))
_
= x

(φ(t)) = x

(t)φ

(t)
49
et, par un argument semblable, y

(t) = y

(t)φ

(t). Puisque
_
x(t), y(t)
_
est r´egulier, on en tire que
φ

(t) = 1. Puisque φ(t
0
) = t
0
+ T, on voit que φ(t) = t + T et
_
x(t), y(t)
_
=
_
x(t + T), y(t + T)
_
pour tout t ∈ J.
Remarque. La fonction t →
_
cos t
3
, sin t
3
_
param`etre le cercle de centre (0, 0) et de rayon un
mais n’est pas p´eriodique. On en tire qu’elle ne peut ˆetre solution d’un syst`eme dynamique de la
forme (∗). Cette remarque montre que ce n’est pas seulement l’allure de la courbe qui compte
mais ´egalement le param´etrage utilis´e.
(8.3) Soit (x
0
, y
0
) un point r´egulier du syst`eme (∗), c’est-`a-dire
_
f(x
0
, y
0
), g(x
0
, y
0
)
_
,= (0, 0).
S’il y a une solution (x, y) de (∗) passant par (x
0
, y
0
), alors il existe t
0
tel que x
0
= x(t
0
),
y
0
= y(t
0
) et
_
f(x
0
, y
0
), g(x
0
, y
0
)
_
=
_
x

(t
0
), y

(t
0
)
_
est un vecteur tangent `a la courbe int´egrale
`a (x
0
, y
0
). Autrement dit, on connait la tangente `a la courbe int´egrale au point (x
0
, y
0
) sans
connaˆıtre t
0
. Cela permet souvent de se donner une id´ee de l’allure des courbes int´egrales sans en
connaˆıtre une param´etrisation pr´ecise. Par d´efinition, le champ de vecteur associ´e au syst`eme
est l’application qui associe `a tout point (x, y) du domaine de d´efinition de (f, g) le vecteur
(x

, y

) =
_
f(x, y), g(x, y)
_
.
Il est utile de savoir effectuer un croquis donnant l’allure du champ de vecteur. Pour cela,
on d´etermine les r´egions ou x

> 0, x

< 0, y

> 0, y

< 0 `a l’aide des relations x

= f(x, y),
y

= g(x, y). On note les points critiques (´equilibres). En dehors de ceux-ci, la courbe monte vers
le haut si y

> 0, descend vers le bas si y

< 0, tend vers la droite si x

> 0 et tend vers la gauche
si x

< 0. La tangente est verticale si x

= 0 mais y

,= 0 ; elle est horizontale si y

= 0 mais x

,= 0.
La taille de x

(t) et de y

(t) permet souvent de se donner une id´ee de la rapidit´e du d´eplacement
du point
_
x(t), y(t)
_
en fonction de t. Supposons par exemple que x, y soient de classe (
(2)
. Alors
x

et y

se calculent en fonction de f(x, y), g(x, y) et de ses d´eriv´ees partielles d’ordre un, et sont
donc connues. Mais
x(t +h) = x(t) +hx

(t) +
h
2
2
x

(t +θ
1
h), y(t +h) = y(t) +hy

(t) +
h
2
2
y

(t +θ
2
h)
avec 0 < θ
1
, θ
2
< 1. Si donc x

et y

sont born´ees par M > 0 dans une certaine r´egion, alors
¸
¸
x(t +h) −x(t) −x

(t)h
¸
¸
≤ M
h
2
2
,
¸
¸
y(t +h) −y(t) −y

(t)h
¸
¸
≤ M
h
2
2
dans cette r´egion.
Exemple. Soit le syst`eme x

= 1 −xy, y

= x. La figure repr´esente le champ de vecteur et les
fl`eches indiquent le sens d’augmentation du param`etre t. Il n’y a pas d’´equilibre. La tangente est
verticale sur les deux branches de l’hyperbole ¦(x, y) ∈ R
2
[ xy = 1¦. Elle est horizontale sur l’axe
x = 0. Ces courbes d´ecoupent ´egalement le plan en r´egions suivant le signe de x

et de y

.
50
-5 -2,5 0 2,5 5
-3
-2
-1
1
2
3
L’illustration montre les axes et la courbe y = 1/x o` u le champ est vertical.
(8.4) L’utilisation de coordonn´ees polaires permet parfois de simplifier l’´etude d’un sy-
st`eme. Rappelons que ´etant donn´e (x, y) ,= (0, 0), il existe r > 0 et θ ∈ R tels que x = r cos θ,
y = r sin θ. Ici, r est unique et θ est uniquement d´etermin´e `a un multiple entier de 2π pr`es. Si x,
y sont des fonctions de t, on trouve
(†) x

(t) = r

(t) cos
_
θ(t)
_
−r(t)θ

(t) sin
_
θ(t)
_
, y

(t) = r

(t) sin
_
θ(t)
_
+r(t)θ

(t) cos
_
θ(t)
_
.
En d´erivant x(t)
2
+ y(t)
2
= r(t)
2
, on trouve x(t)x

(t) + y(t)y

(t) = r(t)r

(t). En multipliant le
premier membre de (†) par y(t) = r(t) sin
_
θ(t)
_
, le second par x(t) = cos
_
θ(t)
_
et en soustrayant,
on trouve
(† †) x

(t)y(t) −x(t)y

(t) = −r(t)
2
θ

(t).
(8.4.1) Exemples. (i ) On peut utilser les coordonn´ees polaires pour affiner son id´ee de l’allure
du champ de vecteur. Le signe de la d´eriv´ee r

de r indique si une courbe int´egrale s’approche ou
s’´eloigne de l’origine. Lorsque r ,= 0, r

est du mˆeme signe que rr

. Reprenons alors l’exemple de
(8.3). On a rr

= xx

+yy

= x −x
2
y +xy = x(1 −xy +x). La courbe int´egrale passant par (x, y)
s’´eloigne de l’origine lorsque x et 1−xy +x ont le mˆeme signe et l’approche lorsque les deux signes
sont oppos´es.
(ii ) Soit le syst`eme
(1) x

= x +y −x(x
2
+y
2
), y

= −x +y −y(x
2
+y
2
)
avec t ∈ [0, +∞[. Le seul ´equilibre est (0, 0) ce qui est un foyer instable. Le solutions avec
_
x(0), y(0)
_
proche de l’origine s’en ´eloignent en spiralant autour. Mais, nous allons voir que
les solutions avec
_
x(0), y(0)
_
tr`es ´eloign´e de l’origine s’en approchent en spiralant autour.
Si l’on multiplie le premier membre du syst`eme par x et le second par y on trouve, en prenant
la somme
xx

+yy

= (1 −x
2
−y
2
)(x
2
+y
2
).
Or, x
2
+y
2
= r
2
et xx

+yy

= rr

et donc rr

= (1 −r
2
)r
2
puis
(2) r

= (1 −r
2
)r.
51
On en tire que r

> 0 si r ∈]0, 1[ et r

< 0 si r > 1. Par cons´equent, les courbes int´egrales
s’approchent `a l’origine si r > 1 et s’en ´eloignent si r < 1. Remarquons que r = 1 est l’unique
solution constante de (2).
Afin de trouver une ´equation faisant intervenir θ, on voit, d’apr`es (1), que x

y−xy

= x
2
+y
2
=
r
2
. En appliquant († †), on en d´eduit que
(3) θ

(t) = −1.
Cette ´equation a pour solution θ(t) = θ(0) −t ce qui montre que toute solution spirale autour de
l’origine. En prenant r = 1, on tire que le cercle de centre l’origine et de rayon un est une courbe
int´egrale du syst`eme (1). Mais on peut int´egrer l’´equation (2), en distinguant les cas r ∈]0, 1[ et
r > 1. D’abord dans les deux cas, on a
1
r(1−r
2
)
=
1
r
+
r
1−r
2
et donc
r

r
+
rr

1 −r
2
= 1.
Si 0 < r < 1, on en tire que log r −
1
2
log(1 −r
2
) = t + D, D constante, puis
r

1−r
2
= Ke
t
o` u
K =
r(0)

1−r(0)
2
> 0 est une constante. Il s’ensuit que r =
1

1+K
−1
e
−2t
.
Si r > 1, on a
r

r

rr

r
2
−1
= 1 puis log r −
1
2
log(r
2
− 1) = t + D ce qui conduit `a
r

r
2
−1
= Ke
t
o` u K =
r(0)

r(0)
2
−1
est un constante > 1. On trouve alors r =
1

1−K
−1
e
−2t
.
L’ensemble des solutions peuvent donc ˆetre r´esum´e sous la forme r(t) =
1

1+Ce
−2t
avec C ≥ −1
une constante, On a C ∈] − 1, 0[ lorsque r(0) ∈]0, 1[, C = 0 lorsque r(0) = 1 et C > 0 lorsque
r(0) > 1.
La solution r(t) = 1, θ(t) = θ(0) − t conduit `a la solution p´eriodique x(t) = cos (θ(0) −t),
y(t) = sin (θ(0) −t) du syst`eme (1). On appelle une telle solution p´eriodique (ou plutˆot la courbe
int´egrale correspondante) un cycle limite. Dans le pr´esent cas, il s’agit d’un cycle limite stable,
car les autres solutions non-nulles du syst`eme convergent vers celle-ci lorsque t → +∞.
(8.5) L’´equation de van de Pol
x

−µ(1 −x
2
)x

+x = 0, µ > 0 constante,
est un autre exemple d’une ´equation diff´erentielle poss´edant un cycle limite stable. Notons que
l’´equation lin´earis´ee x

− µx

+ x = 0 n’en poss`ede pas, car µ > 0 par hypoth`ese et `a nouveau
l’unique ´equilibre est x = 0. L’´equation de van der Pol est ´equivalente au syst`eme
x

= y, y

= −x +µ(1 −x
2
)y.
D’apr`es le th´eor`eme de Hartman-Grobman, l’´equilibre (0, 0) est un foyer instable si µ < 2, un
nœud instable si µ ≥ 2.
Cherchons l’allure du champ de vecteur. Si (x, y) est solution du syst`eme, alors (−x, −y) en
est une aussi, et le champ de vecteur est donc sym´etrique par rapport `a l’origine. Les tangentes
sont verticales sur l’axe y = 0 et horizontales sur la courbe y =
x
µ(1−x
2
)
. Ces courbes d´ecoupent
le plan en zones selon le signe de x

et de y

. Il est ´egalement utile de savoir si les courbes
int´egrales s’approchent ou s’´eloignent de l’origine. Pour cela, on utilise les coordonn´ees polaires.
On a rr

= xx

+ yy

= µ(1 − x
2
)y
2
. Puisque µ > 0 et r > 0, le signe de r

est celui de 1 − x
2
.
Ainsi, les courbes int´egrales s’´eloignent de l’origine si [x[ < 1 et s’en approchent si [x[ > 1.
Le croquis indique la situation lorsque µ = 1.
Soit (x, y) une courbe int´egrale dont la position initiale
_
x(0), y(0)
_
est situ´ee dans le disque
centr´e `a l’origine et de rayon un. Dans un premier temps au moins, la courbe tourne autour de
52
l’origine et s’´eloignant, car [x(0)[ < 1. Par contre, si (x, y) est une solution avec
_
x(0), y(0)
_
dans
la zone x < −1 et y >
x
µ(1−x
2
)
en haut `a gauche, alors y(0) > y
0
:=
x(0)
µ(1−x(0)
2
, et
x(t) −x(0) =
_
t
0
x

(u)du =
_
t
0
y(u)du ≥ y
0
_
t
0
du = y
0
t
pourvu que y(u) ≥ y
0
pour tout u ∈ [0, t]. Or, la courbe int´egrale descend d’abord vers la droite,
mais coupe la branche de y =
x
µ(1−x
2
)
`a gauche en haut en un point (x
1
, y
1
) avec y
1
> y
0
car la
fonction x →
x
µ(1−x
2
)
est croissante. Ensuite, le flot remonte jusqu’ a l’intersection avec la branche
de y =
x
µ(1−x
2
)
passant par l’origine. La condition y(u) ≥ y
0
est donc encore v´erifi´ee et la courbe
passe donc forc´ement dans la r´egion en haut `a droite o` u y

< 0 et x > 1. Ici, elle s’approche `a
l’origine en descendant vers le bas. Puis, elle tourne autour de l’origine dans le sens des aiguilles
d’une montre.
Puisqu’une courbe int´egrale ne se coupe pas, elle tourne autour de l’origine en spirale en
l’approchant. Puisque deux courbes int´egrales distinctes ne se coupent pas, les courbes int´egrales
dont le point initial est situ´e dans le disque centr´e `a l’origine et de rayon un sont born´ees par les
courbes s’approchant de l’ext´erieur.
Cette situation sugg`ere l’existence d’une solution p´eriodique. On peut effectivement d´emontrer
que toutes les solutions non-nulles convergent vers un unique cycle limite qui est lui mˆeme une
courbe int´egrale de l’´equation. Pour le faire, on note λ
1
, λ
2
,. . ., la suite des abcisses des points
successives d’intersection avec la partie de l’axe Oy o` u x > 0 d’une solution non-nulle du syst`eme.
On montre que la suite (λ
n
) est croissante ou d´ecroissante, et convergente vers une limite λ qui ne
d´epend pas de la solution choisie. Ensuite, on montre que la solution (x, y) avec x(0) = 0, y(0) = λ
r´epond au probl`eme.
L’illustration montre la courbe y = x/(1 − x
2
) o` u le champ est vertical ainsi que la courbe
int´egrale commen¸cant au point (1, 0).
-2,5 0 2,5 5
-3
-2
-1
1
2
3
EXERCICES
(e8.1) Calculer les d´eriv´ees secondes x

, y

, lorsque x, y v´erifient le syst`eme x

= f(x, y), y

= g(x, y).
On suppose f et g de classe (
(1)
.
53
(e8.2) Chercher l’allure du champ de vecteur du syst`eme de l’exemple (8.4.1) (ii ) (sans utiliser les
solutions indiqu´ees dans le texte !).
(e8.3) Montrer que si x

= f(x, y), y

= g(x, y) est un syst`eme dynamique, et si x = r cos θ, y = r sinθ
sont les coordonn´ees polaires, alors
r

= f(r cos θ, r sinθ) cos θ +g(r cos θ, r sinθ) sinθ, et

= −f(r cos θ, r sinθ) sinθ +g(r cos θ, r sinθ) cos θ.
(e8.4) R´esoudre le syst`eme x

= x(x
2
+ y
2
), y

= y(x
2
+ y
2
) en utilisant les coordonn´ees polaires.
D´ecrire les courbes int´egrales. On remarquera qu’il n’y a pas de solution param´etr´ee par R, ni mˆeme
par un intervalle de la forme [a, +∞[. Ceci justifie la remarque suivant l’´enonc´e du th´eor`eme de Cauchy-
Lipschitz (10.4).
(e8.5) Soit a > 0 une constante. Montrer que le syst`eme
x

= y +
x
_
x
2
+y
2
(x
2
+y
2
−a
2
)
y

= −x +
y
_
x
2
+y
2
(x
2
+y
2
−a
2
)
a une unique solution p´eriodique non-nulle, et que le cycle limite correspondant est instable.
(e8.6) Dans cet exercice, on ´etablit l’existence de solutions p´eriodiques du syst`eme diff´erentiel
x

(t) = x(t)
2
−y(t),
y

(t) = x(t) −y(t)
2
.
(S)
(i ) Montrer que le syst`eme (S) poss`ede deux solutions constantes que l’on pr´ecisera. (On ne demande
pas d’´etude de leur stabilit´e.)
On note r, θ les coordonn´ees polaires, de sorte que x(t) = r(t) cos θ(t) et y(t) = r(t) sinθ(t).
(ii ) Montrer que si t →
_
x(t), y(t)
_
est une solution de (S), alors
r

(t) = r(t)
2
(cos
3
θ(t) −sin
3
θ(t))
et que
θ

(t) = 1 −r(t)(cos θ(t) sinθ(t))(cos θ(t) + sinθ(t))
pourvu que r(t) ,= 0.
(iii ) En d´eduire que si Π d´esigne le demi plan ¦(x, y) ∈ R
2
[ y > x¦, alors r

(t) < 0 lorsque
(x(t), y(t)) ∈ Π.
On note α un r´eel v´erifiant 0 < α < 1 et (x
α
, y
α
) l’unique solution de (S) v´erifiant x(0) = y(0) = α.
On note r
α
et θ
α
les coordonn´ees polaires de (x
α
, y
α
) et C
α
la courbe int´egrale correspondante. Lorsque
t ∈ R, on note C
α
(t) le point de C
α
d’affixe (x
α
(t), y
α
(t)).
(iv) Calculer r
α
(0), θ
α
(0), r

α
(0) et θ

α
(0). En d´eduire qu’il existe T > 0 tel que C
α
(t) ∈ Π pour tout
t ∈]0, T[.
(v) Montrer que θ

α
(t) ≥ 1 − α puis que θ
α
(t) ≥ t(1 − α) + π/4 quelque soit t ∈]0, T[. En d´eduire
qu’il existe t
0
∈]0, π/(1 − α)] tel que θ
α
(t
0
) = 5π/4. (On pourra utiliser sans d´emonstration l’in´egalit´e
cos θ sinθ(cos θ + sinθ) ≤ 1/

2 qui est valable quelque soit θ ∈ R.)
(vi ) Montrer que si t →
_
x(t), y(t)
_
est solution de (S), alors t →
_
y(−t), x(−t)
_
est encore solution de
(S). En d´eduire que les courbes int´egrales de (S) sont sym´etriques par rapport `a la premi`ere bissectrice.
(vii ) En conclure que C
α
tourne en boucle autour de l’origine, puis que la solution t →
_
x
α
(t), y
α
(t)
_
est p´eriodique.
(e8.7) On propose ´etudier le syst`eme x

= y, y

= −x + x
3
. L’´equation d’ordre deux associ´ee x

+
x − x
3
= 0 est un cas particuler de l’´equation de Duffing x

+ ω
2
x + εx
3
= 0. On pose x = r cos θ,
y = r cos θ comme d’habitude.
54
(i ) V´erifier que le syst`eme poss`ede trois points critiques (´equilibres) et d´eterminer leur nature `a l’aide
du th´eor`eme de Hartman-Grobman.
(ii ) V´erifier que si t → (x(t), y(t)) est une solution du syst`eme alors t → (−x(t), −y(t)) en est
´egalement une.
(iii ) Dans le diagramme des phases, comparer lex vecteurs aux points (x, y), (−x, y), (x, −y) et
(−x, −y).
(iv) En d´eduire que toute courbe int´egrale traversant l’axe y = 0 est sym´etrique par rapport `a l’axe
en question et que toute courbe int´egrale traversant l’axe x = 0 est sym´etrique par rapport `a cet axe.
(v)
´
Etudier les signes de x

et de y

selon la position de point (x, y). V´erifier que rr

= x
3
y puis
d´eterminer si la courbe int´egrale passant par (x, y) s’approche ou s’´eloigne de l’origine. Faire un croquis
de l’allure du champ de vecteur.
(vi ) Soit α ∈]0, 1[. V´erifier que la courbe int´egrale passant par (α, 0) d´escend puis tourne `a gauche
puis coupe l’axe x = 0. En utilisant les sym´etries des questions pr´ec´edentes, montrer que le courbe
int´egrale en question effectue une boucle autour de l’origine dans le sens des aiguilles d’une montre.
(vii ) V´erifier que le syst`eme poss`ede ´egalement des courbes int´egrales non-born´ees.
Th`eme 9. Calcul des variations
(9.1) L’objet du calcul des variations est la recherche des extremums d’int´egrales de cer-
taines familles de fonctions assujetties, en g´en´eral `a des contraintes. Un probl`eme simple, auquel
nous avons d´ej` a fait allusion dans l’Introduction (0.1.4) est le suivant. Soient a, b, α, β quatre
r´eels avec a < b et soit Υ l’ensemble des fonctions f : [a, b] →R de classe (
(2)
telles que f(a) = α
et f(b) = β. Pour tout f ∈ Υ, on pose
L(f) =
_
b
a
_
1 +f

(t)
2
dt.
Il est clair que L(f) est un nombre r´eel strictement positif. Le probl`eme est de trouver f
0
∈ Υ tel
que L(f) ≥ L(f
0
) pour tout f ∈ Υ, si une telle fonction existe.
(9.1.1) La pr´emi`ere ´etape dans l’´etude du probl`eme est de chercher des conditions n´ecessaires
sur la fonction f
0
. Soit H le R-espace vectoriel de fonctions h : [a, b] →R de classe (
(2)
de v´erifiant
h(a) = h(b) = 0, de sorte que toute fonction de Υ soit de la forme f
0
+ h avec h ∈ H. Si l’on
suivait `a la lettre l’´etude des extremums d’une fonction `a valeurs r´eelles sur un domaine de R
p
, on
chercherait des « fonctions critiques » f
0
∈ Υ analogues aux points critiques. Mais, en l’absence
d’une d´efinition simple de fonction critique, nous adoptons une autre strat´egie.
Fixons donc h ∈ H et consid´erons la fonction Φ
h
: R →R d´efinie par
Φ
h
(ε) = L(f +εh) =
_
b
a
_
1 + (f

(t) +εh

(t))
2
dt.
On remarque que f
0
+εh ∈ Υ quelque soit la valeur de . Si f
0
est un minimum de L, alors 0 est
un minimum de Φ
h
et, par cons´equent, Φ

h
(0) = 0. Or,
Φ

h
(ε) =
_
b
a
_
f

0
(t) +εh

(t)
_
h

(t)
_
1 + (f

0
(t) +εh

(t))
2
dt,
d’o` u, en particulier,
Φ

h
(0) =
_
b
a
f

0
(t)h

(t)
_
1 +f

0
(t)
2
dt.
55
Puisque f
0
et h sont suppos´ees de classe (
(2)
, on peut int´egrer par parties :
Φ

h
(0) =
_
b
a
f

0
(t)h

(t)
_
1 +f

0
(t)
2
dt =
_
b
a
f

0
(t)h(t)
(1 +f

0
(t)
2
)
3/2
dt.
En faisant varier h ∈ H, on en tire que
_
b
a
f

0
(t)h(t)
(1 +f

0
(t)
2
)
3/2
dt = 0
quelque soit la fonction h ∈ H. D’apr`es le lemme (9.2.1) qui nous allons d´emontrer, on en d´eduit
que
f

0
(t)
(1+f

0
(t)
2
)
3/2
= 0. Cette ´equation entraˆıne que f

0
(t) = 0 et donc qu’il existe des constantes C
et D telles que f
0
(t) = Ct +D. Les valeurs de C et de D sont alors d´etermin´ees par les conditions
f
0
(a) = α et f
0
(b) = β et on trouve au final que f
0
(t) =
β−α
b−a
(t −a) +α.
La fonction f
0
repr´esente le segment droit passant de (a, α) `a (b, β), comme l’intuition sugg`ere.
Si l’on suit la strat´egie d’´etude des extremums des fonctions `a valeurs r´eelles sur un domaine de
R
p
, la prochaine ´etape serait de d´eterminer s’il s’agit d’un minimum local. Il est facile de montrer
que, quelque soit h ∈ H avec h ,= 0, la fonction ε → Φ
h
(ε) a un minimum en ε = 0. Pour cela, il
suffit de constater que Φ

h
(0) > 0, ce qui se fait en d´erivant la formule pour Φ

h
(ε). On trouve
Φ

h
(0) =
_
b
a
h

(t)
2
_
1 + (f

0
(t)
2
_
3/2
dt,
ce qui est strictement positive lorsque h ∈ H et h ,= 0 (voir l’exercice (e9.1)).
(9.1.2) Mais l’argument que nous venons de donner ne suffit pas pour d´emontrer que f
0
est un
minimum local de L, dans le sens qu’il existe un voisinage V de f
0
tel que L(f) > L(f
0
) pour tout
f ∈ V . La difficult´e provient, essentiellement, du fait que l’espace vectoriel H est de dimension
infinie (car il contient, par exemple, la famille libre de fonctions ¦t → (t−a)
r
(b−t) [ r ∈ N¦). Nous
avons d´ej`a fait allusion (2.4) au fait que, dans un espace vectoriel norm´e de dimension infinie, les
boules ferm´ees ne sont pas compactes. Ce r´esultat empˆeche la g´en´eralisation simple du th´eor`eme
(4.6.1) aux espaces de dimension infinie. Nous nous contenterons donc par la suite d’adapter les
arguments de (9.1.1) `a un cadre plus g´en´eral, sans chercher `a approfondir cette difficult´e.
(9.2) Rappelons d’abord pour m´emoire deux r´esultats bien connus utilis´es dans ce raisonne-
ment.
(i ) Si g, h : [a, b] → R sont deux fonctions de classe (
(1)
, on a la formule d’int´egration par
parties
_
b
a
g(t)h

(t)dt = g(b)h(b) −g(a)h(a) −
_
b
a
g

(t)h(t)dt.
(ii ) Si I est un intervalle ouvert et si F : [a, b] I →R est une application de classe (
(1)
, alors
la fonction Φ : I →R d´efinie par Φ(ε) =
_
b
a
F(t, ε)dt est d´erivable et sa d´eriv´ee est
Φ

(ε) =
_
b
a
F

2
(t, ε)dt.
Le lemme qui suit et ses variants sont d’une importance centrale dans le calcul des variations.
(9.2.1) Lemme. Soit f : [a, b] →R continue. On suppose que, pour toute fonction h : [a, b] →
R de classe (
(2)
v´erifiant h(a) = h(b) = 0, on ait
_
b
a
f(t)h(t)dt = 0. Alors f(t) = 0 pour tout
t ∈ [a, b].
56
D´emonstration. Puisque f est continue, il suffit de montrer f(t) = 0 lorsque t ∈]a, b[. Supposons
pour une contradiction qu’il existe t
0
∈]a, b[ tel que f(t
0
) ,= 0. Supposons alors que f(t
0
) > 0,
le cas o` u f(t
0
) < 0 se traite de la mˆeme fa¸con. Soit δ > 0 tel que δ < max(b − t
0
, t
0
− a) et
tel que f(t) ≥
1
2
f(t
0
) quelque soit t ∈ [t
0
− δ, t
0
+ δ]. Soit h
0
: [a, b] → R la fonction d´efinie par
h
0
(t) = (t −t
0
−δ)
4
(t −t
0
+δ)
4
lorsque t ∈ [t
0
−δ, t
0
+δ] et h
0
(t) = 0 ailleurs. Alors h
0
est de classe
(
(2)
et h
0
(a) = h
0
(b) = 0. En outre h
0
(t) ≥ 0 pour tout t et h
0
(t) > 0 lorsque t ∈]t
0
− δ, t
0
+ δ[.
Par cons´equent,
_
b
a
f(t)h
0
(t)dt =
_
t
0

t
0
−δ
f(t)h
0
(t)dt ≥
f(t
0
)
2
_
t
0

t
0
−δ
h
0
(t)dt > 0,
une contradiction.
Remarque. Afin d’effectuer l’int´egration par parties dans (9.1.1), nous avons suppos´e que f
0
soit de classe (
(2)
. Une variante du lemme (9.2.1), appel´e lemme de Du Bois-Reymond permet de
montrer que tout extremum local f
0
de classe (
(1)
est n´ecessairement de classe (
(2)
. Les autres cas
que nous allons ´etudier dans cette th`eme se g´en´eralisent de la mˆeme mani`ere.
(9.3) Le raisonnement utilis´e dans (9.1.1) pour chercher une condition n´ecessaire pour que
f
0
soit un extremum local se g´en´eralise facilement. Supposons par exemple que l’on cherche les
extremums de
L(f) :=
_
b
a
F
_
t, f(t), f

(t)
_
dt,
o` u F est une fonction connue de classe (
(2)
et f parcourt les fonctions [a, b] → R de classe (
(2)
v´erifiant f(a) = α, f(b) = β. Si f
0
est une fonction r´epondant au probl`eme, alors pour toute
fonction h : [a, b] →R de classe (
(2)
telle que h(a) = h(b) = 0, la fonction Φ
h
: R →R d´efinie par
Φ
h
(ε) =
_
b
a
F
_
t, f
0
(t) +εh(t), f

0
(t) +εh

(t)
_
dt
v´erifie Φ

h
(0) = 0, soit
_
b
a
_
F

2
_
t, f
0
(t), f

0
(t)
_
h(t) +F

3
_
t, f
0
(t), f

0
(t)
_
h

(t)
_
dt = 0.
Si l’on suppose que F et f
0
soient de classe (
(2)
, on peut int´egrer par parties le terme
_
b
a
F

3
_
t, f
0
(t), f

0
(t)
_
h

(t)dt
ce qui donne
(∗)
_
b
a
_
F

2
_
t, f
0
(t), f

0
(t)
_

d
dt
F

3
_
t, f
0
(t), f

0
(t)
__
h(t)dt = 0.
Puisque (∗) doit ˆetre valable quelque soit la fonction h, on tire le r´esultat suivant en appliquant
le lemme (9.2.1).
(9.3.1) Th´eor`eme. Si f
0
est un extremum de classe (
(2)
de f → L(f), alors f
0
satisfait `a
l’ ´equation d’Euler
F

2
(t, f
0
, f

0
) −
d
dt
F

3
(t, f
0
, f

0
) = 0.
57
D’apr`es ce qui pr´ec`ede, il s’agit d’une ´equation diff´erentielle d’ordre au plus deux et non-lin´eaire
en g´en´eral.
(9.3.2) On dit que L a un maximum local faible en f
0
si, quelque soit h ∈ H, il existe un
intervalle ouvert I contenant 0 tel que L(f
0
+εh) ≤ L(f
0
) pour tout ε ∈ I. La notion de minimum
local faible est d´efinie de la mˆeme fa¸con. On peut chercher si f
0
correspond `a un maximum ou un
minimum local faible en ´etudiant le signe de Φ

h
(0). Si Φ

h
(0) > 0 quelque soit h ,= 0 il s’agit d’un
minimum et si Φ

h
(0) < 0 quelque soit h ,= 0 il s’agit d’un maximum. Pour en d´eduire un crit`ere
explicite, on calcule
Φ

h
(0) =
=
_
b
a
_
F

2,2
_
t, f
0
(t), f

0
(t)
_
h(t)
2
+ 2F

2,3
_
t, f
0
(t), f

0
(t)
_
h(t)h

(t) +F

3,3
(
_
t, f
0
(t), f

0
(t)
_
h

(t)
2
_
dt,
D’o` u un crit`ere d´ependant de la forme quadratique associ´ee `a la matrice hessienne de F par
rapport aux deuxi`eme et troisi`eme variables :
(9.3.3) Proposition. Soit q
t
la forme quadratique associ´ee `a la matrice
_
F

2,2
(t) F

2,3
(t)
F

2,3
(t) F

3,3
(t)
_
.
Si q
t
est d´efinie positive quelque soit t ∈ [a, b], alors f
0
repr´esente un minimum local faible,
alors que si q
t
est d´efinie n´egative quelque soit t ∈ [a, b], alors f
0
repr´esente un maximum local
faible.
(9.4) Ces consid´erations se g´en´eralisent aux extremums d’int´egrales de la forme
(∗∗) L(f, g) =
_
b
a
F(t, f, f

, g, g

)dt,
o` u les fonctions inconnues f et g v´erifient f(a) = α
1
, f(b) = β
1
, g(a) = α
2
, g(b) = β
2
.
On se donne deux fonctions h, k v´erifiant h(a) = k(a) = h(b) = k(b) = 0 et on consid`ere la
fonction Φ : R
2
→R d´efinie par
Φ(ε
1
, ε
2
) =
_
b
a
F(t, f
0

1
h, f

0

1
h

, g
0

2
k, g

0

2
k

)dt.
Si (f
0
, g
0
) est un extremum de (∗∗), alors les deux d´eriv´ees partielles Φ

1
(0, 0) et Φ

2
(0, 0) s’annulent
quelque soit les fonctions h, k de classe (
(2)
. Or,
Φ

1
(0, 0) =
_
b
a
_
F

2
(t, f
0
, f

0
, g
0
, g

0
)h +F

3
(t, f
0
, f

0
, g
0
, g

0
)h

_
dt et
Φ

2
(0, 0) =
_
b
a
_
F

4
(t, f
0
, f

0
, g
0
, g

0
)k +F

5
(t, f
0
, f

0
, g
0
, g

0
)k

_
dt.
En int´egrant par parties puis en appliquant le lemme (9.2.1) comme auparavant, on d´eduit la
proposition suivante :
(9.4.1) Proposition. Si (f
0
, g
0
) est un extremum de L avec f
0
et g
0
de classe (
(2)
, alors f
0
et
g
0
v´erifient les ´equations d’Euler
F

2
(t, f
0
, f

0
, g
0
, g

0
) −
d
dt
F

3
(t, f
0
, f

0
, g
0
, g

0
) = 0,
F

4
(t, f
0
, f

0
, g
0
, g

0
) −
d
dt
F

5
(t, f
0
, f

0
, g
0
, g

0
) = 0.
58
Ici encore,
d
dt
G d´esigne la d´eriv´ee par rapport `a t de la fonction t → G(t). On trouve donc
d
dt
F

3
(t, f
0
, f

0
, g
0
, g

0
)(t) = F

3,1
(t) +F

3,2
(t)f

0
(t) +F

3,3
(t)f

0
(t) +F

3,4
(t)g

0
(t) +F

3,5
(t)g

0
(t)
pour tout t ∈ [a, b], avec une formule semblable pour
d
dt
F

5
(t, f
0
, f

0
, g
0
, g

0
)(t).
(9.4.2) Le crit`ere pour que f
0
soit un maximum ou un minimum faible se g´en´eralise aussi au
cas de deux fonctions inconnues. On trouve que (f
0
, g
0
) est un minimum si la forme quadratique
associ´ee `a _
Φ

1,1
(0, 0) Φ

1,2
(0, 0)
Φ

2,1
(0, 0) Φ

2,2
(0, 0)
_
est d´efinie positive pour tout (h, k). De mˆeme, il s’agit d’un maximum lorsque la forme quadratique
en question est d´efinie n´egative.
(9.5) Terminons ce th`eme avec un cas d’extremum sous contrainte qui se rencontre souvent
en ´economie (voir l’exercice (e9.8) pour une application). Il s’agit de trouver les extremums de
L(f, g) =
_
b
a
F(t, f, f

, g, g

)dt,
o` u f(a) = α
1
, f(b) = β
1
, g(a) = α
2
, g(b) = β
2
et f et g sont li´ees par une contrainte de la forme
G(t, f, f

, g, g

) = 0.
Pour cela, on se donne `a nouveau deux fonctions h et k telles que h(a) = k(a) = h(b) = k(b) = 0
et on consid`ere la fonction
Φ(ε
1
, ε
2
) =
_
b
a
F(t, f
0

1
h, f
0

1
h

, g
0

2
k, g

0

2
k

)dt.
On trouve alors
Φ

1
(0, 0) + Φ

2
(0, 0) =
_
b
a
_
_
F

2
(t, f
0
, f

0
, g
0
, g

0
) −
d
dt
F

3
(t, f
0
, f

0
, g
0
, g

0
)
_
h+
+
_
F

4
(t, f
0
, f

0
, g
0
, g

0
) −
d
dt
F

5
(t, f
0
, f

0
, g
0
, g

0
)
_
k
_
dt. (1)
On peut interprˆeter cette expression comme la d´eriv´ee directionnelle de L(f, g) en (f
0
, g
0
), dans
la direction (h, k). Lorsque (f
0
, g
0
) est un extremum sans contrainte, elle s’annule quelque soit
le choix des fonctions h, k. En particulier, en consid´erant successivement les cas o` u k = 0 et o` u
h = 0, on retrouve les consid´erations de (9.4). Dans le pr´esent cas, on s’attend `a l’annulation de
(1) uniquement lorsque (h, k) d´efinit un « vecteur tangent » de G(t, f
0
, f

0
, g
0
, g

0
) = 0, c’est-`a-
dire lorsque
_
1, h(t), h

(t), k(t), k

(t)
_
est dans l’espace tangent de G
_
t, f
0
(t), f

0
(t), g
0
(t), g

0
(t)
_
= 0
quelque soit t ∈ [a, b]. Cette condition ´equivaut `a
G

2
_
t, f
0
(t), f

0
(t), g
0
(t), g

0
(t)
_
h(t) +G

3
_
t, f
0
(t), f

0
(t), g
0
(t), g

0
(t)
_
h

(t)+
+G

4
_
t, f
0
(t), f

0
(t), g
0
(t), g

0
(t)
_
k(t) +G

5
_
t, f
0
(t), f

0
(t), g
0
(t), g

0
(t)
_
k

(t) = 0 (2)
quelque soit t ∈ [a, b].
Pr´esent´e ainsi, l’argument n’est pas tout `a fait rigoureux. Pour le justifier en d´etail, on aurait
besoin de d´evelopper le calcul diff´erentiel dans les espaces de fonctions et, plus g´en´eralement, dans
59
les espaces norm´es de dimension infinie. Mais un tel d´eveloppement irait au del`a de ce qu’il serait
raisonnable de faire dans le cadre d’une troisi`eme ann´ee de licence.
(9.5.1) Le cas o` u F(t, f, f

, g, g

) = M(t, f, g) et G(t, f, f

, g, g

) = f

−N(t, f, g), o` u les fonc-
tions M et N ne d´ependent que de t, f et g et non de f

ni de g

, est particuli`erement important
dans les applications au contrˆole optimal. Dans ce cas, (1) et (2) se simplifient respectivement en
(1’) Φ

1
(0, 0) + Φ

2
(0, 0) =
_
b
a
(M

2
(t, f
0
, g
0
)h(t) +M

3
(t, f
0
, g
0
)k(t))dt
et en
(2

) −N

2
(t, f
0
(t), g
0
(t)h(t) +h

(t) −N

3
(t, f
0
(t), g
0
(t))k(t) = 0.
(9.5.2) Th´eor`eme. Soit (f
0
, g
0
) un couple de fonctions tel que N

3
(t, f
0
(t), g
0
(t)) ,= 0 pour tout
t ∈ [a, b] et on pose H(t, f, g, λ) = M(t, f, g) + λ(t)N(t, f, g), o` u la fonction λ est `a d´eterminer.
Si H, λ, f
0
et g
0
v´erifient
H

3
(t, f
0
, g
0
, λ) = 0, H

4
(t, f
0
, g
0
, λ) = f

0
, H

2
(t, f
0
, g
0
, λ) = −λ

,
alors (f
0
, g
0
) est un extremum de M sous la contrainte f

= N.
D´emonstration. D’apr`es (2

), les hypoth`eses permettent d’´ecrire
k(t) =
h

(t) −N

2
(t, f
0
, g
0
)h(t)
N

3
(t, f
0
, g
0
)
.
En substituant dans (1

), on tire que
_
b
a
_
_
M

2
(t, f
0
, g
0
) −
N

2
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
_
h(t) +
M

3
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
h

(t)
_
dt = 0
puis, en int´egrant par parties le terme
_
b
a
M

3
(t,f
0
,g
0
)
N

3
(t,f
0
,g
0
)
dt et en rappelant que h(a) = h(b) = 0, on
conclut que
_
b
a
_
M

2
(t, f
0
, g
0
) −
N

2
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
+
_
(M

3
(
d
dt
N

3
) −N

3
(
d
dt
M

3
)
_
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
2
_
h(t)dt = 0
quelque soit la fonction h de classe (
(2)
telle que h(a) = h(b) = 0. D’apr`es le lemme (9.2.1), on
tire que
(3) M

2
(t, f
0
, g
0
) −
N

2
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
+
_
(M

3
(
d
dt
N

3
) −N

3
(
d
dt
M

3
)
_
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
2
= 0.
Soient donc H, λ v´erifiant les ´equations de l’´enonc´e. Puisque l’on a H

3
(t, f
0
, g
0
, λ) = 0 et
N

3
(t, f
0
, g
0
) ,= 0, on a
λ(t) = −
M

3
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
,
puis, en d´erivant par rapport `a t,
λ

(t) =
_
(M

3
(
d
dt
N

3
) −N

3
(
d
dt
M

3
)
_
(t, f
0
, g
0
)
N

3
(t, f
0
, g
0
)
2
.
60
Puisque H

2
(t, f
0
, g
0
, λ) = −λ

, on a M

2
(t, f
0
, g
0
)+λ(t)N

2
(t, f
0
, g
0
)+λ

(t) = 0. En substituant pour
λ et λ

, on trouve bien l’´equation (3). Enfin, l’hypoth`ese H

4
(t, f
0
, g
0
, λ) = 0 n’est qu’une autre
fa¸con d’exprimer la contrainte f

0
= N(t, f
0
, g
0
).
EXERCICES
(e9.1) Justifier l’affirmation faite `a la fin de (9.1.1) que Φ

h
(0) > 0 quelque soit h ∈ H, h ,= 0.
(e9.2) Trouver les fonctions f
0
: [0, 1] →R de classe (
(2)
et v´erifiant f(0) = 0, f(1) = 1 qui donnent
les valeurs extremales de
_
1
0
_
t
2
+f

(t)
2
)dt. (
´
Ecrire d’abord l’´equation d’Euler (9.3.1).)
(e9.3) Trouver la fonction f
0
: [0, 2] → R de classe (
(2)
v´erifiant f
0
(0) = 0 et f
0
(2) = 8 qui donne la
valeur minimale de
_
2
0
_
tf(t) +f

(t)
2
_
dt.
(e9.4) D´eterminer la valeur minimale de l’int´egrale
_
1
0
e
t
f

(t)
2
dt o` u f parcourt les fonctions de [0, 1]
dans R de classe (
2
v´erifiant f(0) = 0 et f(1) = 1 −e
−1
.
(e9.5) (i ) On consid`ere le cas de (9.3.1) o` u la fonction F ne d´epend explicitement que de f et de f

et non de t. On a donc F

1
= 0.
Montrer que la fonction t →
d
dt
_
F − f

F

3
_
(t) est identiquement nulle sur [a, b]. (Utiliser l’´equation
d’Euler.) En d´eduire que t → (F −f

F

3
)(t) est constante sur [a, b].
(ii ) Application. On suppose que F(x, y) =
_
1 +x
2
y
2
. Trouver l’unique fonction f
0
∈ c qui puisse
ˆetre un extremum de L et qui v´erifie f
0
(−1) = 0 et f
0
(1) = 1.
(e9.6)
´
Etudier les fonctions f
0
: [0, 1] → R

+
v´erifiant f
0
(0) = α > 0 et f
0
(1) = β > 0 donnant les
valeurs extremales de
_
1
0

1+f

(t)
2

f(t)
dt. (Utiliser l’exercice pr´ec´edent pour montrer que f
0
(t)
_
1+f

0
(t)
2
_
est
une constante strictement positive que l’on exprimera en fonction de α et de β. Ensuite chercher une
solution de f
0
(t)
_
1 +f

0
(t)
2
_
= C de la forme f
0
(t) = A+Bcos t.)
(e9.7) Trouver le couple de fonctions (f
0
, g
0
) de classe (
(2)
sur [a, b] et v´erifiant f
0
(a) = α
1
, f
0
(b) = β
1
,
g
0
(a) = α
2
, g
0
(b) = β
2
qui fournit le minimum de
_
b
a
_
f

(t)
2
+g

(t)
2
dt.
(e9.8) Soient T, r, α, β, a, b, ε des r´eels avec T, r, ε, β, et b > 0. On propose `a chercher `a maximiser
_
T
0
e
−rt
_
αf(t) −βf(t)
2
−ag(t) −bg(t)
2
_
dt
lorsque f et g sont li´ees par f

(t) = g(t) − εf(t). En ´economie, c’est le mod`ele d’Eisner-Strotz. On
utilise la m´ethode de (9.5.2).
(i )
´
Ecrire les fonctions M, N, puis H et λ de l’´enonc´e du th´eor`eme (9.5.2) dans le pr´esent cas.
(ii )
´
Ecrire les trois ´equations H

2
= −λ

, H

3
= 0, H

4
= f

0
qui sont v´erifi´ees lorsque (f
0
, g
0
) donne
une valeur extremale de l’int´egrale et H = H(t, f
0
, g
0
, λ).
(iii ) En d´eduire que f
0
et g
0
sont solutions du syst`eme
f

0
(t) = −εf
0
(t) +g
0
(t), g

0
(t) =
β
b
f
0
(t) + (r +ε)g
0
(t) +
(r +ε)a −α
2b
.
(iv) Montrer que (f
0
, g
0
) donne bien un maximum. (La matrice hessienne de M par rapport aux
deux derni`eres variables est
_
−2βe
−rt
0
0 −2be
−rt
_
ce qui est d´efinie n´egative quelque soit la valeur de t.)
61
Th`eme 10. Applications aux ´equations diff´erentielles
(10.1) Dans ce dernier th`eme, nous allons appliquer les notions du th`eme pr´ec´edent `a l’´etude
des questions d’existence et d’unicit´e de solutions d’´equations et de syst`emes diff´erentielles.
(10.1.1) Consid´erons d’abord le cas d’une ´equation de premier ordre de la forme
(∗) x

(t) = F
_
t, x(t)
_
,
avec condition initiale x(t
0
) = a
0
. Ici, on se fixe un intervalle I, t
0
∈ I ainsi que a
0
∈ R et la
solution cherch´ee est une fonction x : I →R. On suppose que F : I R →R est continue et que
x est de classe (
(1)
. Alors
(∗∗) x(t) = a
0
+
_
t
t
0
F
_
u, x(u)
_
du.
R´eciproquement, si l’on d´erive (∗∗), on retrouve (∗) et toute fonction x v´erifiant (∗∗) v´erifie
´egalement x(t
0
) = a
0
. Ainsi, r´esoudre l’´equation diff´erentielle (∗) avec la condition initiale x(t
0
) =
a
0
´equivaut `a r´esoudre l’ ´equation int´egrale (∗∗). Remarquons qu’il suffit de chercher les solutions
continues, car une telle solution sera en fait de classe (
(1)
, car la fonction t → a
0
+
_
t
t
0
F
_
u, x(u)
_
du
est d´erivable et sa d´eriv´ee t → F
_
t, x(t)
_
est continue puisque F et x le sont.
Les ´equations int´egrales offrent plusieurs avantages par rapport aux ´equations diff´erentielles.
Ceci d´ecoule du fait que l’int´egration est une op´eration beaucoup plus « r´eguli`ere » que la d´eri-
vation. Par exemple, toute fonction continue poss`ede une primitive, alors qu’il existe des fonctions
continues sans d´eriv´ee. Et il est plus facile de tirer des renseignements sur une primitive que sur
une d´eriv´ee. Par exemple, si f est une fonction continue sur l’intervalle ferm´e et born´e [a, b], on
sait que
¸
¸
_
b
a
f(t)dt
¸
¸
≤ M(b −a), o` u M = sup
t∈[a,b]
f(t). Par contre, il n’existe aucune borne pour
la d´eriv´ee d’une fonction en termes d’une borne pour la fonction elle-mˆeme (penser `a la fonction
t → sin at o` u a > 0 est une constante).
(10.2) Plus g´en´eralement, soit
x
(n)
= F
_
t, x(t), x

(t), . . . , x
(n−1)
(t)
_
une ´equation diff´erentielle d’ordre n, dont on cherche la solution avec conditions initiales x(t
0
) = a
0
,
x

(t
0
) = a
1
, . . ., x
(n−1)
(t
0
) = a
n−1
. Si l’on pose x
0
= x, x
1
= x

, . . ., x
n−1
= x
(n−1)
, alors l’´equation
devient ´equivalente au syst`eme
x

0
(t) = x
1
(t),
x

1
(t) = x
2
(t),
. . . . . . . . . . . .
x

n−2
(t) = x
n−1
(t),
x

n−1
(t) = F
_
t, x
0
(t), x
1
(t), . . . , x
n−1
(t)
_
,
avec les conditions initiales x
0
(t
0
) = a
0
, x
1
(t
0
) = a
1
, . . ., x
n−1
(t
0
) = a
n−1
. Ainsi, pour traiter les
´equations d’ordre quelconque, il suffit de traiter les syst`emes lin´eaires d’ordre un. Un tel syst`eme
s’´ecrit (avec un d´ecalage d’indice) en notation vectorielle
_
_
_
_
x

1
(t)
x

2
(t)
.
.
.
x

n
(t)
_
_
_
_
=
_
_
_
_
F
1
_
t, x
1
(t), x
2
(t) . . . , x
n
(t)
_
F
2
_
t, x
1
(t), x
2
(t) . . . , x
n
(t)
_
.
.
.
F
n
_
t, x
1
(t), x
2
(t) . . . , x
n
(t)
_
_
_
_
_
,
62
ce que nous abr`egerons en X

(t) = F
_
t, f
1
(t), . . . , f
n
(t)
_
, o` u donc
X =
_
_
_
_
x
1
x
2
.
.
.
x
n
_
_
_
_
et F =
_
_
_
_
F
1
F
2
.
.
.
F
n
_
_
_
_
.
On se fixe alors t
0
∈ I et A =
_
_
_
_
a
1
a
2
.
.
.
a
n
_
_
_
_
∈ /
1,n
(R). On veut montrer l’existence et l’unicit´e d’une
solution X v´erifiant X(t
0
) = A.
(10.2.1) Comme auparavant, le probl`eme ´equivaut `a r´esoudre le syst`eme int´egrale
X(t) = A +
_
t
t
0
F
_
u, X(u)
_
du.
En ce qui concerne l’existence d’une solution, l’id´ee de Poincar´e et de Lipschitz est de consid´erer
une suite de fonctions vectorielles (X
n
), o` u X
0
est `a choisir et
X
n
(t) = A +
_
t
t
0
F
_
u, X
n−1
(u)
_
du
lorsque n ≥ 1. On esp`ere que, avec un choix convenable de X
0
, la suite (X
n
) convergerait vers
une fonction continue X : alors (X
n−1
) convergerait ´egalement vers X et F
_
u, X
n−1
(u)
_
vers
F
_
u, X(u)
_
, d’o` u l’´equation cherch´ee X(t) = A +
_
t
t
0
F
_
u, X(u)
_
du.
(10.3) La r´ealisation de cette strat´egie n´ecessite des hypoth`eses suppl´ementaires sur F. On
note [[ [[ la norme sur /
n,1
(R) d´efinie par [[B[[ =
_
b
2
1
+b
2
2
+ +b
2
n
, o` u B =
t
(b
1
, b
2
, . . . , b
n
).
Soit E une partie de /
n,1
(R). On dit que F est lipschitzienne sur I E s’il existe L > 0 tel
que
[[F(t, X) −F(t, Y )[[ ≤ L[[X −Y [[
quelque soit t ∈ I et X, Y ∈ E.
(10.3.1) Lemme. Soit Ω un domaine convexe de /
n,1
(R). On suppose F de classe (
(1)
sur
I Ω et que les d´eriv´ees partielles de F par rapport aux coordonn´ees de X soient born´ees sur Ω.
Alors F est lipschitzienne sur I Ω.
Ce r´esultat d´ecoule du th´eor`eme des accroissements finis (3.5).
Nous avons d´ej`a fait allusion au r´esultat suivant `a plusieurs reprises.
(10.4) Th´eor`eme (Cauchy-Lipschitz). Soient R > 0, δ > 0 deux constantes. On suppose
F continue et lipschitzienne sur [t
0
− δ, t
0
+ δ] K(A; R), o` u K(A; R) d´esigne la boule ferm´ee
de /
n,1
(R) de centre A et de rayon R. Posons M = sup¦[F(t, X)[ [ (t, X) ∈ [t
0
− δ, t
0
+ δ]
K(A; R)¦ et µ = min(δ,
R
M
). Alors le syst`eme X

(t) = F
_
t, X(t)
_
poss`ede une unique solution X
sur l’intervalle [t
0
−µ, t
0
+µ].
D´emonstration de l’existence d’une solution. Afin de pouvoir contruire la suite (X
n
) il faut
d’abord justifier le fait que si X est une fonction continue de [t
0
−µ, t
0
+µ] `a valeurs dans B(A; R),
alors la fonction t → Y (t) = A +
_
t
t
0
F
_
u, X(u)
_
du sur [t
0
− µ, t
0
+ µ] est encore `a valeurs dans
K(A; R). Or, si [t −t
0
[ ≤ µ, alors
[[Y (t) −A[[ = [[
_
t
t
0
F
_
u, X(u)
_
du[[ ≤
_
t
t
0
[[F
_
u, X(u)
_
[[du ≤ µM ≤
R
M
M = R,
63
d’o` u l’assertion.
La suite (X
n
) est alors bien d´efinie, pourvu que l’on choisit la fonction terme initial X
0
:
[t
0
− µ, t
0
+ µ] → K(A; R). Il suffit de prendre pour X
0
la fonction constante ´egale `a A, ce que
nous ferons par la suite.
Fixons alors une constante L > 0 telle que [[F
_
t, X) − F(t, Y )[[ ≤ L[[X − Y [[ quelque soit
t ∈ [t
0
−µ, t
0
+µ].
(10.4.1) Lemme. Pour tout entier n ≥ 1 et pour tout t ∈ [t
0
−µ, t
0
+µ], on a
[[X
n
(t) −X
n−1
(t)[[ ≤
M
Ln!
(L[t −t
0
[)
n
.
La d´emonstration se fait par r´ecurrence sur n. Supposons d’abord n = 1. Alors
[[X
1
(t) −X
0
(t)[[ = [[X
1
(t) −A[[ =
¸
¸
¸
_
t
t
0
F(u, A)du
¸
¸
¸ ≤
¸
¸
¸
_
t
t
0
[[F(u, A)[[du
¸
¸
¸ ≤ M[t −t
0
[,
est le r´esultat est vrai. Admettons-le au niveau n ≥ 1 et v´erifions-le au niveau n + 1.
[[X
n+1
(t) −X
n
(t)[[ = [[
_
t
t
0
_
F
_
u, X
n
(u)
_
−F
_
u, X
n−1
(u)
_
_
du[[
ce qui est major´e par
¸
¸
¸
_
t
t
0
[[F
_
u, X
n
(u)
_
−F
_
u, X
n−1
(u)
_
[[du
¸
¸
¸ ≤
¸
¸
¸
_
t
t
0
L[[X
n
(u) −X
n−1
(u)[[du
¸
¸
¸.
On peut alors appliquer l’hypoth`ese de r´ecurrence [[X
n
(u) −X
n−1
(u)[[ ≤
M
Ln!
(L[u−t
0
[)
n
et utiliser
la formule [
_
t
t
0
[u −t
0
[
n
du[ = [t −t
0
[
n+1
/(n + 1) pour conclure.
(10.4.2) On tire de ce qui pr´ec`ede que
[[X
n
(t) −X
n−1
(t)[[ ≤
M
Ln!
(Lµ)
n
pour tout t ∈ [t
0
−µ, t
0
+µ]. Par cons´equent, si n > m ≥ 0, on a
(∗∗∗) [[X
n
(t) −X
m
(t)[[ ≤
n

k=m+1
[[X
k
(t) −X
k−1
(t)[[ ≤
M
L
n

k=m+1
(Lµ)
k
k!
La s´erie de terme g´en´eral
(Lµ)
k
k!
´etant convergent, on voit que la suite de fonctions (X
n
) est uni-
form´ement de Cauchy sur [t
0
− µ, t
0
+ µ] et donc uniform´ement convergente vers une fonction
continue X : [t
0
− µ, t
0
+ µ] → K(A; R). Alors la suite des fonctions t → F
_
t, X
n
(t)
_
converge
uniform´ement vers la fonction t → F
_
t, X(t)
_
. Par cons´equent, on peut interchenger l’int´egration
est le passage ` a la limite n → +∞ pour conclure que X(t) = A +
_
t
t
0
F
_
u, X(u)
_
du.
(10.5) On a ainsi d´emontr´e l’existence d’une solution de X(t) = A +
_
t
t
0
F
_
u, X(u)
_
du, au
moins sur un voisinage de t
0
. Nous allons maintenant examiner la question de l’unicit´e. Pour cela
on revient au syst`eme diff´erentielle, en supposant que l’on a deux fonctions vectorielles X, Y
v´erifiant X

(t) = F
_
t, X(t)
_
et Y

(t) = F
_
t, Y (t)
_
ainsi que X(t
0
) = Y (t
0
) = A. Posons
σ(t) = [[X(t) −Y (t)[[
2
.
64
Puisque X(t
0
) = Y (t
0
), on a σ(t
0
) = 0 et il suffit de montrer que σ(t) = 0 quelque soit t ∈
[t
0
−µ, t
0
+µ]. Pour cela, d´erivons σ :
σ

(t) = 2¸X(t) −Y (t), X

(t) −Y

(t)) = 2¸X(t) −Y (t), F
_
t, X(t)
_
−F(t, Y (t)
_
).
En appliquant l’in´egalit´e de Cauchy-Schwarz, on en tire que

(t)[ ≤ 2[[X(t) −Y (t)[[ [[F
_
t, X(t)
_
−F
_
t, Y (t)
_
[[ ≤ 2L[[X(t) −Y (t)[[
2
= 2Lσ(t).
Par cons´equent, puisque L > 0 et σ(t) ≥ 0 :
−2Lσ(t) ≤ σ

(t) ≤ 2Lσ(t)
pour tout t ∈ [t
0
−µ, t
0
+µ]. En multipliant l’in´egalit´e `a droite par e
−2Lt
, on trouve que
_
σ

(t) −
2Lσ(t)
_
e
−2Lt
≤ 0, c’est-`a-dire que
d
dt
_
σ(t)e
−2Lt
_
≤ 0. On en tire que le fonction t → σ(t)e
−2Lt
est
d´ecroissante. Puisque σ(t) ≥ 0 et σ(t
0
) = 0, on en tire que σ(t) = 0 lorsque t ≥ t
0
. De la mˆeme
fa¸con, en multipliant l’in´egalit´e −2Lσ(t) ≤ σ

(t) par e
2Lt
, on voit que
d
dt
_
σ(t)e
2Lt
_
≥ 0 et donc que
la fonction t → σ(t)e
2Lt
est croissante puis que σ(t) = 0 lorsque t ≤ 0. Au total, donc, σ(t) = 0
quelque soit t et donc X(t) = Y (t) quelque soit t.
(10.6) L’int´erˆet de la d´emonstration de l’existence d’une solution que nous venons de donner
n’est pas purmeent th´eorique. La suite (X
n
) permet aussi de trouver des approximations explicites
aux solutions, au moins dans certains cas. En effet, si l’on reprend l’´equation (∗∗∗), on trouve, en
rappelant que X
0
(t) = A, que
[[X
n
(t) −X
m
(t)[[ ≤
M
L
n

k=m+1
(Lµ)
k
k!

M
L

k=m+1
(Lµ)
k
k!
.
En faisant tendre n vers +∞, il vient
(†) [[X(t) −X
m
(t)[[ ≤
M
L

k=m+1
(Lµ)
k
k!
.
Cette majoration nous permet d’estimer l’erreur commise en utilsant X
m
comme approximation
`a la solution exacte X, si l’on connaˆıt les valeurs de L, M et de µ.
En effet, on rappelle que


k=0
(Lµ)
k
k!
= e

quelque soit les valeurs de L, µ ∈ R, et la majoration


k=m+1
(Lµ)
k
k!
n’est que le reste d’ordre m de cette s´erie.
(10.7) Exemple. Soit l’´equation diff´erentielle x

= t
2
+x
2
. On cherche la solution avec condition
initiale x(0) = 0. La d´emonstration de l’existence d’une solution nous am`ene `a consid´erer la suite
de fonctions d´efinie par x
0
(t) = 0 et x
n
(t) =
_
t
0
_
u
2
+x
n−1
(u)
2
_
du. Par calcul, on trouve
x
1
(t) =
_
t
0
_
u
2
+x
0
(u)
2
_
du =
_
t
0
u
2
du =
t
3
3
,
puis
x
2
(t) =
_
t
0
_
u
2
+x
1
(u)
2
_
du =
_
t
0
_
u
2
+
u
6
9
_
du =
t
3
3
+
t
7
63
,
puis
x
3
(t) =
_
t
0
_
u
2
+x
2
(u)
2
_
du =
_
t
0
_
u
2
+
_
u
3
3
+
u
7
63
_
2
_
du =
_
t
0
_
u
2
+
u
6
9
+
2u
10
189
+
u
14
3969
_
du,
65
d’o` u x
3
(t) =
t
3
3
+
t
7
63
+
2t
11
2079
+
t
15
59535
et ainsi de suite.
La fonction F(t, x) = t
2
+x
2
v´erifie [F(t, x) −F(t, y)[ = [x
2
−y
2
[ ≤ ([x[ +[y[)[x −y[ quelque
soit t, x, y ∈ R. Si donc on se donne δ > 0, alors [F(t, x) − F(t, y)[ ≤ 2δ[x − y[ lorsque [x[ ≤ δ,
[y[ ≤ δ. Par cons´equent, F est lipschitzienne sur R [−δ, δ]. Si x : [−1/3, 1/3] → [−1/3, 1/3] est
une fonction continue et si l’on d´efinit y : [−1/3, 1/3] →R par y(t) =
_
t
0
_
u
2
+x(u)
2
_
du alors
y(t) =
t
3
3
+
_
t
0
x(u)
2
du ≤
[t[
3
3
+
[t[
3

1
27
+
1
9

1
3
et donc y envoie l’intervalle [−1/3, 1/3] dans lui-mˆeme.
Puisque x
0
(t) = 0, chacune des fonctions x
n
envoie l’intervalle [−1/3, 1/3] dans lui-mˆeme.
Prenons donc t
0
= 0 et δ =
1
3
dans le th´eor`eme (10.4), dont on reprend les notations. D’apr`es ce
qui pr´ec`ede, on peut prendre R =
1
3
. On a donc M = sup¦t
2
+ x
2
[ [t[ ≤
1
3
, [x[ ≤
1
3
¦ =
2
9
. En
outre [F(t, x) − F(t, y)[ ≤
2
3
[x − y[ lorsque [t[ ≤
1
3
, [x[ ≤
1
3
et [y[ ≤
1
3
, et donc L =
2
3
. Enfin,
µ = min(δ,
R
M
) =
1
3
. En appliquant (†), on conclut que l’´equation x

(t) = t
2
+ x(t)
2
poss`ede une
unique solution sur [−1/3, 1/3] qui v´erifie x(0) = 0, et que pour tout met pour tout t ∈ [−1/3, 1/3],
on a
[x(t) −x
m
(t)[ ≤
1
3

k=m+1
_
2
9
_
k
1
k!
.
Remarquons pour conclure cet exemple que, en fait, la solution x peut s’´ecrire comme s´erie
enti`ere de la forme
x(t) =
t
3
3
+
t
7
63
+
2t
11
2079
+
13t
15
218295
+

k=5
c
k
t
4k−1
,
convergente sur lorsque [t[ ≤
1
3
. (Nous ne d´emontrons pas cette affirmation.) Notons que les
coefficients de t
3
, t
7
et de t
11
co¨ıncident avec ceux de x
3
, mais que ce n’est pas le cas de celui de
t
15
. Pour obtenir le coefficient de t
15
, il faut effectuer une it´eration suppl´ementaire, et calculer x
4
.
EXERCICES
(e10.1) V´erifier que la fonction F(t, x) = t
2
+x
2
n’est pas lipschitzienne sur R
2
.
(e10.2) Calculer une constante L > 0 telle que si F(t, x) = t

x, alors [F(t, x) − F(t, y)[ ≤ L[x − y[
pour tout t ∈ [−1, 1], x ≥ 1, y ≥ 1.
(e10.3) Soit I = [a, b] un intervalle ferm´e et born´e et soient p, q deux fonctions continues de I dans
R. Montrer que la fonction F(t, x) = p(t)x+q(t) est lipschitzienne sur I R. En d´eduire que le th´eor`eme
d’existence locale (10.4) s’applique `a l’´equation lin´eaire x

= px + q quelque soit la condition initiale
x(t
0
) = a
0
, (t
0
∈ I, a
0
∈ R).
(e10.4) G´en´eraliser l’exercice pr´ec´edent aux syst`emes lin´eaires. Soit F(t, X) = PX + Q un syst`eme
de n fonctions I /
n,1
(R) →R, P ´etant une matrice d’ordre n dont les coefficients P
ij
sont des fonctions
continues I →R et Q un vecteur de fonctions continues I →R. Montrer que si I est un intervalle compact
alors F est lipschitzienne et en d´eduire que (10.4) s’applique au syst`eme X

= PX + Q quelque soit la
condition initiale X(t
0
) = A.
En d´eduire l’existence locale et l’unicit´e d’une solution d’une ´equation lin´eaire a
n
x
(n)
+a
n−1
x
(n−1)
+
+a
0
x = b, o` u les fonctions a
k
, 0 ≤ k ≤ n et b sont continues sur I et a
n
(t
0
) ,= 0.
(e10.5) Appliquer la m´ethode de d´emonstration du th´eor`eme (10.4) `a l’´equation x

(t) = x(t) avec
condition initiale x(0) = 1. Calculer les solutions approch´ees x
n
(n ≥ 1). Les comparer avec les sommes
partielles du d´eveloppement en s´erie enti`ere de la solution exacte x(t) = e
t
. Les arguments de ce th`eme
66
permettent-t-ils de montrer que si R > 0, on a x
n
(t) → x(t) uniform´ement sur [−R, R], ou faut-il un
autre argument ?
(e10.6) Soit I un intervalle ferm´e et born´e et soit F : I /
n,1
(R) → R une fonction lipschitzienne
(c’est-`a-dire il existe L > 0 tel que [[F(t, X)−F(t, Y )[[ ≤ L[[X−Y [[ quelque soit t ∈ I, X, Y ∈ /
n,1
(R)).
Montrer que si t
0
∈ I et si A ∈ /
n,1
(R), alors le syst`eme X

= F(t, X) a une solution sur I v´erifiant
X(t
0
) = A. (V´erifier que la suite X
n
comme dans la d´emonstration de (10.4) converge vers une solution.
Ce r´esultat est toutefois moins utile en pratique que (10.4), car l’hypoth`ese que F soit lipschitizienne sur
I /
n,1
(R) est rarement satisfaite. Par exemple, F(t, x) = t
2
+ x
2
n’est pas lipschitzienne sur I R.
L’hypoth`ese est toutefois satisfaite lorsque F(t, X) = PX +Q et P, Q sont constants.)
Appendice A. Quelques rappels
(A.1) Quelques notations ensemblistes. Soit E un ensemble. Si x est un objet, la notation
x ∈ E signifie que x appartient `a E, alors que la notation x / ∈ E a la signification contraire. Si
F et G sont deux parties de E, on note F ∩ G leur intersection, F ∪ G leur r´eunion et F − G
le compl´ementaire de G dans F, c’est-`a-dire les ´el´ements de F n’appartenant pas `a G. Si aucune
confusion n’est `a craindre, on pose F
c
= E −F. L’ensemble vide est d´esign´e par ∅.
(A.1.1) Soient E, F deux ensembles et soit f : E → F une fonction. Si A est une partie de
E, on note f(A) la partie de F compos´ee des ´el´ements de la forme f(x) avec x ∈ A. De mˆeme,
si B est une partie de F, on note f
−1
(B) la partie de E compos´ee des ´el´ements x ∈ E tels que
f(x) ∈ B.
(A.1.2) Une suite `a valeurs dans l’ensemble E est une application de N dans E. Si
u : N → E est une suite, on note le plus souvent u
n
plutˆot que u(n) la valeur de u en n : u
n
s’appelle alors le terme d’ordre n de u. On tol`ere en g´en´eral que u
n
n’ait pas de sens pour quelques
petites valeurs de n (par exemple la suite u
n
=
1
n−1
n’est pas d´efinie lorsque n = 1) : ce qui compte
est que u
n
ait un sens pour tout n assez grand.
Soit u = (u
n
) une suite `a valeurs dans E. Une suite extraite (ou sous-suite) est une suite
obtenue en composant u avec une application strictement croissante N → N. Concr`etement, les
termes d’une suite extraite sont u
n
0
, u
n
1
, u
n
2
, . . .u
n
k
, . . ., o` u l’application N →N est d´esign´ee par
k → n
k
. Si par exemple u
n
=
1
n−1
et n
k
= k
2
, alors u
n
k
=
1
k
2
−1
.
(A.1.3) Soient Λ, E deux ensembles. Une famille de parties de E index´ee par Λ est la
donn´ee, pour tout λ ∈ Λ, d’une partie E
λ
de Λ. Autrement dit, c’est une application de Λ dans
l’ensemble des parties de E. On la note ¦E
λ
[ λ ∈ Λ¦. La r´eunion

λ∈Λ
E
λ
est compos´ee des
´el´ements de E appartenant `a E
λ
pour au moins un indice Λ. De mˆeme, l’intersection

λ∈Λ
E
λ
est compos´ee des ´el´ements de E appartenant `a E
λ
quelque soit l’indice λ.
Exemples. (i ) Prenons E = R, Λ = N

. Si n ∈ N

, on pose E
n
= [−n, n]. Alors

n∈N

E
n
= R
et

n∈N

E
n
= [−1, 1].
(ii ) Prenons E = R, Λ = R

+
. Si λ ∈ R

, on pose E
λ
= [λ, +∞[. Alors

λ∈Λ
E
λ
=]0, +∞[ et

λ∈Λ
E
λ
= ∅.
67
(A.1.4) Les ´egalit´es
_
λ∈Λ
E
c
λ
=
_

λ∈Λ
E
λ
_
c
,

λ∈Λ
E
c
λ
=
_
_
λ∈Λ
E
λ
_
c
sont connues sous le nom des formules de de Morgan.
(A.2) Rappelons bri`evement quelques notions sur les sous-ensembles de R. Soit E une
partie non-vide de R. On dit que E est major´ee s’il existe M ∈ R tel que x ≤ M quelque soit
x ∈ E : tout r´eel M v´erifiant cette propri´et´e s’appelle un majorant de E. De mˆeme, E est dite
minor´ee s’il existe m ∈ R tel que m ≤ x quelque soit x ∈ E et tout r´eel m ayant cette propri´et´s
est appel´e minorant de E. On dit que E est born´ee si elle est `a la fois major´ee et minor´ee.
(A.2.1) Soit E une partie non-vide de R. On suppose E major´ee. Alors l’ensemble des majo-
rants est un intervalle ferm´e de la forme [a, +∞[. Le nombre a est alors le plus petit des majorants,
c’est-`a-dire si M est un r´eel et si M < a, alors il existe x ∈ E v´erifiant M < x. Ce r´eel a s’appelle
la borne sup´erieure ou supremum de E et est not´e sup E. La notation sup E = +∞ signifie que
E n’est pas major´ee.
De la mˆeme fa¸con, si E est minor´ee, l’ensemble des minorants de E est de la forme ] −∞, b]
et b est le plus grand des minorants. Si m ∈ R et si m > b, il existe x ∈ E v´erifiant x > m. On
appelle b la borne inf´erieure (ou infimum) de E et l’on le note inf E. La notation inf E = −∞
signifie que E n’est pas minor´ee.
(A.2.2) Si E est major´ee et si sup E ∈ E, alors sup E est ´egalement le plus grand ´el´ement
(ou maximum) de E. Lorsque c’est le cas, on rencontre parfois la notation max E pour sup E, mais
il est pr´ef´erable de r´eserver max E au cas o` u E est un ensemble fini. De mˆeme, si E est minor´ee et
si inf E ∈ E, alors inf E est le plus petit ´el´ement (ou minimum) de E.
`
A nouveau, on rencontre
parfois la notation min E pour inf E, mais il est pr´ef´erable de r´eserver min E aux ensembles finis.
Exemple. Prenons E = [0, 1[. Soit M ∈ R. Si M ≥ 1, alors x ≤ M quelque soit x ∈ E. Par
contre, si M < 1, E contient un ´el´ement x (`a savoir les nombres appartenant `a l’intervalle ]M, 1[)
tel que M < x. On en tire que l’ensemble des majorants de E est [1, +∞[. Donc sup E = 1.
Puisque sup E / ∈ E, c’est le plus grand ´el´ement de E.
Soit encore m ∈ R. Si m ≤ 0, alors x ≥ m quelque soit x ∈ E. Par contre, si m > 0, alors
E contient un ´el´ement x (`a savoir les nombres appartenant `a l’intervalle [0, m[) v´erifiant x < m.
L’ensemble des minorants est donc ] −∞, 0] et donc inf E = 0. Puisque 0 ∈ E, 0 est le plus petit
´el´ement de E.
(A.3) Notons K l’un des corps R et C. Soit X un ensemble et soit F un K-espace vectoriel. On
note T(X, F) l’ensemble des applications de X vers F. Alors T(X, F) est de fa¸con naturelle un
K espace vectoriel. Explicitement, si f, g ∈ T(X, F) et si λ ∈ K, on d´efinit f + g, λf ∈ T(X, F)
par (f + g)(x) = f(x) + g(x) et (λf)(x) = λ
_
f(x)
_
. Si X est lui-mˆeme un R espace vectoriel,
l’ensemble des applications lin´eaires de X dans F constituent alors un sous-espace de T(X, F),
que l’on notera L(X, F).
(A.3.1) Soit E un K-espace vectoriel. Une forme lin´eaire sur E est un ´el´ement de L(E, K). Si
E est de dimension finie, si (e
1
, e
2
, . . . , e
n
) est une base de E et si i ∈ ¦1, 2, . . . , n¦, alors il existe une
unique forme lin´eaire e

i
sur E v´erifiant e

i
(e
j
) = 1 si j = i et e

i
(e
j
) = 0 si j ,= i pour tout 1 ≤ j ≤ n.
Concr`etement, si x = λ
1
x
1

2
x
2
+ +λ
n
e
n
, on a e

i
(x) = λ
1
e

i
(e
1
)+λ
2
e

i
(e
2
)+ +λ
n
e

i
(e
n
) = λ
i
.
(A.3.2) Si E et F sont deux K-espaces vectoriels de dimension finie m et n, alors L(E, F) est
de dimension mn. En particulier, L(E, K) est de dimension un et (e

1
, e

2
, . . . , e

n
) est une base de
L(E, K).
68
(A.4) Soient E, F, G trois K-espace vectoriels. L’application β : E F → G est dite bi-
lin´eaire si elle v´erifie les propri´et´es suivantes
(i ) Pour tout x ∈ E, l’application de F vers G d´efinie par y → β(x, y) est lin´eaire,
(ii ) Pour tout y ∈ F, l’application de E vers G d´efinie par x → β(x, y) est lin´eaire.
On dit que β est non-d´eg´en´er´ee `a gauche lorsque, ´etant donn´e y ∈ F −¦0¦, il existe x ∈ E
tel que β(x, y) ,= 0. De mˆeme, β est non-d´eg´en´er´ee `a droite lorsque, ´etant donn´e x ∈ E−¦0¦, il
existe y ∈ F tel que β(x, y) ,= 0. On dit que β est sym´etrique lorsque F = E et β(x, y) = β(y, x)
quelque soit x, y ∈ E. Pour une forme sym´etrique, les notions de non-d´eg´en´er´ee `a gauche et de
non-d´eg´en´er´ee `a droite co¨ıncident.
(A.4.1) Lorsque G = K, on parle d’une forme bilin´eaire. Dans ce cours, nous nous limiterons
aux formes bilin´eaires sym´etriques. Le corps K sera presque toujours R. Une forme quadratique
est une application q : E →K de la forme q(x) = β(x, x) lorsque x ∈ E.
(A.4.2) Supposons que E soit de dimension finie n et que (e
1
, e
2
, . . . , e
n
) soit une base de E.
La matrice de β dans la base (e
1
, e
2
, . . . , e
n
) est alors la matrice carr´ee A d’ordre n d´efinie par
A = (A
ij
), o` u A
ij
= β(e
i
, e
j
). Si x =

n
i=1
λ
i
e
i
et y =

n
j=1
µ
j
e
j
, alors β(x, y) =

n
i,j=1
λ
i
µ
j
A
ij
.
La matrice A est sym´etrique si et seulement si β est sym´etrique.
Changer la base (e
1
, e
2
, . . . , e
n
) revient `a remplacer la matrice A par une matrice ´equivalente.
En particulier, le rang de A ne d´epend que de q et non de la base choisie. Rappelons que deux
matrices ´equivalentes ont le mˆeme rang. On appelle ce rang commun le rang de β.
(A.4.3) Consid´erons alors le cas particulier o` u E = R
n
et (e
1
, e
2
, . . . , e
n
) est la base standard.
Comme dans le (4.10), on identifie l’´el´ement x = (x
1
, x
2
, . . . , x
n
) de R
n
avec la matrice `a une
colonne dont les coefficients succesifs sont x
1
, x
2
, . . ., x
n
. Avec cette convention, on a β(x, y) =
t
xAy
quelque soit (x, y) ∈ (R
n
)
2
. Si β (et donc A) est sym´etrique, la forme quadratique associ´ee `a
β est la forme quadratique q associ´ee `a A, c’est-`a-dire q(x) =
t
xAx = β(x, x).
´
Etant donn´ee q,
on peut retrouver β : si A est la matrice associ´ee `a q, alors β est la forme bilin´eaire sym´etrique
β(x, y) =
t
xAy. On a alors
q(x +y) =
t
(x +y)A(x +y) =
t
xAx +
t
xAy +
t
yAx +
t
yAy = q(x) + 2
t
xAy +q(y)
(puisque A est sym´etrique), d’o` u q(x + y) = q(x) + 2β(x, y) + q(y). Il s’ensuit que β(x, y) =
1
2
_
q(x +y) −q(x) −q(y)
_
pour tout x, y ∈ E, ce qui permet de retrouver β en fonction de q sans
l’intervention de la matrice A.
(A.4.4) Ces derni`eres consid´erations se g´en´eralisent aux formes sur les espaces vectoriels E
quelconques. Si β : E E est bilin´eaire sym´etrique, la forme quadratique associ´ee est q(x) =
β(x, x). En d´eveloppant β(x+y, x+y), on retrouve la formule β(x, y) =
1
2
_
q(x+y) −q(x) −q(y)
_
.
(A.4.5) Proposition. Soit β une forme bilin´eaire sym´etrique sur R
n
. Pour que β soit non-
d´eg´en´er´ee, il faut et il suffit que A soit inversible.
D´emonstration. Supposons que A ne soit pas inversible. Il existe alors x ∈ R
n
, x ,= 0 tel
que
t
xA = 0. Alors β(x, y) =
t
xAy = 0 pour tout y ∈ R
n
et β n’est pas non-d´eg´en´er´ee.
R´eciproquement, si β n’est pas non-d´eg´en´er´ee, il existe x ∈ R
n
, x ,= 0 tel que
t
xAy = 0 quelque
soit y ∈ R
n
. En prenant x = e
j
avec j parcourant ¦1, 2, . . . , n¦, on trouve que le syst`eme de n
´equations lin´eaires 0 =
t
xAe
j
=

n
i=1
x
i
A
ij
dans les n inconnus x
1
, x
2
, . . ., x
n
. Puisque x ,= 0, le
syst`eme a une solution non-nulle. Il s’ensuit que A n’est pas inversible.
(A.5) On dit que la forme quadratique q sur R
n
est non-d´eg´en´er´ee si la forme bilin´eaire
associ´ee est non-d´eg´en´er´ee. D’apr`es ce qui pr´ec`ede, q est non-d´eg´en´er´ee si et seulement si la matrice
69
associ´ee A est inversible, ou encore si et seulement si toutes les valeurs propres de A sont non-
nulles. En particulier, il d´ecoule de (4.10.5) que toute forme d´efinie (positive ou n´egative) est
non-d´eg´en´er´ee.
(A.6) Soit q une forme quadratique sur R
n
et soit A la matrice sym´etrique associ´ee. La
signature de q est le couple d’entiers positifs (r, s) o` u r et s d´esignent respectivement le nombre
de valeurs propres strictement positives et le nombre de de valeurs propres strictement n´egatives
de A (compt´ees avec leur multiplicit´e comme racines du polynˆome caract´eristique de A). Le rang
de q est le rang de A, ce qui est encore ´egal au rang de la forme bilin´eaire associ´ee. Le r´esultat
suivant, que nous citons sans d´emonstration, g´en´eralise (4.13.3).
(A.6.1) Th´eor`eme (loi d’inertie de Sylvester). Soit q une forme quadratique sur R
n
. On
suppose que l’on a une ´ecriture de q sous la forme
q(x) =
n

i=1
λ
i

i
(x)
2
(trouv´ee par exemple `a l’aide de la m´ethode de Gauss (4.13)). Ici, (
k
)
1≤k≤n
est une famille de
formes lin´eaires lin´eairement ind´ependantes et (λ
1
, λ
2
, . . . λ
n
) ∈ R
n
.
Alors il y a r coefficients λ
i
strictement positives et s coefficients strictement n´egatives. La
forme q est de rang r +s. En particulier, elle est non-d´eg´en´er´ee si et seulement si r +s = n.
(A.7) Soit E un espace euclidien(1.1.2). Deux ´el´ements x, y ∈ E sont dits orthogonaux (ou
perpendiculaires) si ¸x, y) = 0, orthonorm´es (ou orthonormaux) s’ils sont orthogonaux et, en
outre, [[x[[ = [[y[[ = 1. De mˆeme, une famille T d’´el´ements de E est dite orthogonale lorsque
¸x, y) = 0 pour tout x, y ∈ T tels que y ,= x; elle est dite orthonorm´ee si elle est orthogonale et
si [[x[[ = 1 pour tout x ∈ T. Une famille orthogonale est forc´ement libre. Par cons´equent, toute
famille orthogonale est finie, de cardinale au plus la dimension de E. Le proc´ed´e de Gram-
Schmidt montre que tout espace euclidien poss`ede une base orthonorm´ee.
(A.7.1) Soient E, F deux espaces euclidiens dont les produits scalaires sont not´es respective-
ment ¸., .)
E
et ¸., .)
F
. Une isom´etrie de E dans F est une application lin´eaire φ : E → F telle
que ¸φ(x), φ(y))
F
= ¸x, y)
E
pour tout x, y ∈ E. Une isom´etrie est forc´ement injective. Elle est
donc surjective lorsque E et F ont la mˆeme dimension; on dit alors que φ est une isom´etrie de E
sur F. Une isom´etrie de E est une isom´etrie de E sur lui-mˆeme. Notons que l’existence d’une base
orthonormale montre qu’un espace euclidien de dimension n est isom´etrique `a R
n
muni du produit
scalaire usuel ¸x, y) = x
1
y
1
+x
2
y
2
+ +x
n
y
n
, o` u x = (x
1
, x
2
, . . . , x
n
) et y = (y
1
, y
2
, . . . , y
n
).
(A.7.2) Proposition. Soit E un espace euclidien et soit φ ∈ L(E). Les deux conditions sui-
vantes sont ´equivalentes.
(i ) φ est une isom´etrie.
(ii ) La matrice de φ dans une base orthonorm´ee est une matrice orthogonale (4.10.3).
La d´emonstration est facile. On remarquera une certaine inconsistence dans la terminologie :
il aurait ´et´e plus naturel d’appeler une matrice orthogonale une matrice orthonorm´ee, et utiliser
la terminologie matrice orthogonale dans le sens plus large de la matrice d’une isom´etrie dans une
base orthogonale. Mais l’usage a d´ecid´e autrement.
(A.7.3) Soit φ ∈ L(E). Alors il existe un unique ´el´ement φ

∈ L(E), appel´e l’endomor-
phisme adjoint de φ, et que est caract´eris´e par la propri´et´e ¸x, φ

(y)) = ¸φ(x), y) pour tout
(x, y) ∈ E
2
. Pour construire φ, on se donne une base orthonorm´ee (e
1
, e
2
, . . . , e
n
) de E. Soit
j ∈ ¦1, 2, . . . , n¦. Puisqu’une application lin´eaire est d´etermin´ee par ses valeurs sur une base,
70
φ

(e
j
) est d´etermin´e par les valeurs ¸e
i
, φ

(e
j
)) = ¸φ(e
i
), e
j
) lorsque i parcourt ¦1, 2, . . . , n¦. Si
donc A d´esigne la matrice de φ dans la base orthonorm´ee (e
1
, e
2
, . . . , e
n
), on constate aussitˆot que
la matrice de φ

dans cette mˆeme base est la matrice transpos´ee de A.
L’endomorphisme φ est dit autoadjoint si φ

= φ. D’apr`es ce qui pr´ec`ede, φ est autoadjoint
si et seulement si la matrice de φ dans une base orthonorm´ee est sym´etrique.
(A.7.4) Le fait que les valeurs propres d’une matrice sym´etrique soient r´eelles ainsi que le
th´eor`eme (4.10.4) se traduit donc dans le langage des endomorphismes autoadjoints en l’´enonc´e
suivant.
(A.7.5) Th´eor`eme. Soit E un espace euclidien de dimension n et soit φ un endomorphisme
autoadjoint de E.
(i ) Toutes les racines du polynˆome caract´eristique χ
φ
de φ sont r´eelles.
(ii ) Posons χ
φ
(t) =

n
i=1
(t −λ
i
). Il existe une base orthonorm´ee (e
1
, e
2
, . . . , e
n
) de E telle
que φ(e
i
) = λ
i
e
i
pour tout i ∈ ¦1, 2, . . . , n¦.
D´emonstration. Le (i ) d´ecoule de la proposition (4.10.2). D´emontrons donc le (ii ) en raisonnant
par r´ecurrence sur la dimension n de E. Le polynˆome caract´eristique χ
φ
(t) de φ s’´ecrit donc
sous la forme

n
i=1
(t −λ
i
), o` u les λ
i
sont r´eels. Lorsque n = 1 on a φ(x) = λ
1
x pour tout
x ∈ E. Si x ,= 0 et si e
1
= x/[[x[[, alors (e
1
) est une base orthnorm´ee de E et le r´esultat est
donc vrai. Supposons donc que n ≥ 2. On sait d´ej`a que φ a une valeur propre λ
1
. Soit e
1
un
vecteur propre associ´e tel que [[e
1
[[ = 1 et soit E

= ¦x ∈ E [ ¸e
1
, x) = 0¦. Si x ∈ E

, alors
¸e
1
, φ(x)) = ¸φ(e
1
), x) = ¸λ
1
e
1
, x) = λ
1
¸e
1
, x) = 0, d’o` u φ(x) ∈ E

. Par cons´equent, φ(E

) ⊆ E

.
Or, E

est de dimension n−1 et on v´erifie aussitˆot que la restriction de φ `a E

soit autoadjoint et
que son polynˆome caract´eristique est

n
i=2
(t −λ
i
). On applique alors l’hypoth`ese de r´ecurrence
en affirmant qu’il existe une base orthonorm´ee (e
2
, e
3
, . . . , e
n
) de E

telle que φ(e
i
) = λ
i
e
i
pour
tout i ≥ 2. Puisque ¸e
1
, x) = 0 pour tout x ∈ E

et [[e
1
[[ = 1, on conclut que (e
1
, e
2
, . . . , e
n
) est
une base orthonorm´ee de E.
(A.8) Terminons l’appendice avec quelques rappels sur les d´eterminants et, surtout, sur leur
calcul. Soit A = (A
ij
) une matrice carr´ee d’ordre n. Par d´efinition, le d´eterminant de A est le
scalaire
(∗) det A =

π∈S
n
ε(π)A
1,π(1)
A
2,π(2)
A
n,π(n)
,
o` u la somme parcourt les ´el´ements π du groupe des permutations o
n
de ¦1, 2, . . . , n¦ et ε(π)
d´esigne le signe de la permutation π. Par exemple, si A =
_
a b
c d
_
, alors det A = ad − bc. De
mˆeme, si A =
_
_
a b c
d e f
g h i
_
_
, alors det A = aei + bfg + cdh − afh − bdi − ceg. Les matrices non
carr´ees n’ont pas de d´eterminant.
(A.8.1) Lorsque A est d’ordre n, la formule (∗) contient n! termes et devient lourde `a utiliser
directement lorsque n est grand. Les r`egles suivantes permettent parfois de simplifier le calcul d’un
d´eterminant.
(i ) Si A et B sont deux matrices carr´ees du mˆeme ordre, alors det AB = det Adet B;
(ii ) Si A est inversible, alors det A
−1
= 1/ det A.
(iii ) On a det
t
A = det A,
t
A ´etant la matrice transpos´ee de A;
(iv) Lorsque A est triangulaire, det A est ´egal au produit des coefficients sur le diagonal
principal de A;
71
(v) Pour que det A ,= 0, il faut et il suffit que A soit inversible ;
(vi ) Soit λ un scalaire et soit A

la matrice form´ee en multipliant l’une des colonnes (ou l’une
des lignes) de A par λ. Alors det A

= λdet A.
(vii ) Soit A

une matrice obtenue de A en ajoutant `a l’une des lignes de A un multiple scalaire
d’une autre ligne de A. Alors det A

= det A.
(viii ) Soit A

une matrice obtenue de A en ajoutant `a l’une des colonnes de A un multiple
scalaire d’une autre colonne de A. Alors det A

= det A.
On suppose A carr´ee d’ordre n. Si i, j ∈ ¦1, 2, . . . , n¦ on note B
ij
la matrice obtenue de A en
supprimant la i-i`eme ligne et la j-i`eme colonne. (B
ij
est donc une matrice carr´ee d’ordre n −1.)
(ix) (d´eveloppement de A par rapport `a sa i-i`eme ligne). Si i ∈ ¦1, 2, . . . , n¦, alors det A =

n
j=1
(−1)
i+j−1
A
ij
det B
ij
;
(x) (d´eveloppement de A par rapport `a sa j-i`eme colonne). Si j ∈ ¦1, 2, . . . , n¦, alors det A =

n
i=1
(−1)
i+j−1
A
ij
det B
ij
.
Ces propri´et´es suffiront largement pour le calcul des d´eterminants que nous renconctrons dans
ce cours.
`
A l’exception des propri´et´es (i ) et (v), elles se d´emontrent par des calculs (parfois un
peu p´enible) `a partir de la d´efinition (∗). Les propri´et´es (i ) et (v) sont plus int´eressantes sur le
plan conceptuel et on trouvera leur d´emonstration ainsi que d’autres propri´et´es des d´eterminants
dans les manuels de premi`ere ou deuxi`eme ann´ee de Licence de math´ematiques.
(A.8.2) Rappelons que le polynˆome charact´eristique de la matrice carr´ee A d’ordre n est
le polynˆome det(tI
n
− A), I
n
d´esignant la matrice identit´e. Si P ∈ /
n
est inversible, alors
les propri´et´es (i ) et (ii ) impliquent que det (P
−1
(tI
n
−A)P) = det P
−1
det(tI
n
− A) det P =
det P
−1
det(tI
n
−A) det P = det(tI
n
−A). Autrement dit, deux matrices semblables ont le mˆeme
polynˆome caract´eristque. Par cons´equent, si φ est un endomorphisme d’un espace vectoriel de
dimension finie E, on d´efinit le polynˆome caract´eristique de φ comme ´etant le polynˆome
caract´eristique d’une matrice repr´esentant φ.
EXERCICES
(eA.1) Soit f : R →R

la fonction d´efinie par f(t) =
1
t
2
. Calculer f(R

), f
−1
([
1
2
, 1]), f
−1
(¦0¦).
(eA.2) Soient f : E → F une application.
(i ) Montrer que si A, A

sont deux parties de E, alors f(A ∪ A

) = f(A) ∪ f(A

) et f(A ∩ A

) =
f(A) ∩ f(A

).
(ii ) Montrer que si B, B

sont deux parties de F, alors f
−1
(B ∪B

) = f
−1
(B) ∪f
−1
(B

) et f
−1
(B ∩
B

) ⊆ f
−1
(B) ∩ f
−1
(B

).
(iii ) Montrer que si B est une partie de F, alors E −f
−1
(B) = f
−1
(F −B).
(eA.3) D´etailler les exemples de (A.1.3).
(eA.4) Pour chacun des sous-ensembles de R ci-dessous, d´eterminer s’il est major´e, minor´e, born´e.
D´eterminer, le cas ´ech´eant, supE, inf E et si oui ou non E poss`ede un maximum ou un minimum.
(i ) [0, 1[, (ii ) N, (iii ) ¦
1
2
n
[ n ∈ N¦ = ¦1,
1
2
,
1
2
2
,
1
2
3
, . . .¦, (iv) f(R), f : R → R ´etant la fonction
t →
t
1+t
2
, (v) ¦x ∈ R [ [x −1[ < x¦, (vi )

n∈N
[
1
2
2n+1
,
1
2
2n
].
72