Vous êtes sur la page 1sur 19

FONCTIONS DE PLUSIEURS VARIABLES

PLAN
I : Limites et Continuité
1) Normes
2) Boules, voisinages, ouverts et fermés
3) Limites et continuité
4) Applications partielles
II : Dérivation
1) Dérivées partielles
2) Gradient
3) Dérivées de fonctions composées
4) Extremum
5) Dérivées successives
6) Formes différentielles
7) Fonctions implicites
Annexe 1 : Théorème de Schwarz
Annexe 2 : Fonctions implicites

I : Limites et continuité

1– Normes
La valeur absolue sur ou le module sur permettent de définir des distances sur ces espaces, et
 

de pouvoir parler de limites. Nous souhaitons étendre ces notions à des espaces plus généraux. Soit
E un espace vectoriel sur . 

DEFINITION :
On appelle norme sur E, notée usuellement || || , une application de E dans + telle que :
 

i) ∀ x ∈ E, || x || = 0 ⇔ x = 0
ii) ∀ x ∈ E, ∀ y ∈ E, || x+y || ≤ || x || + || y ||
iii) ∀ x ∈ E, ∀ λ ∈   , || λx || = λ || x ||

La propriété ii) est connue sous le nom d'inégalité triangulaire ou d'inégalité de Schwarz. Voici des
exemples de normes :
❑ dans 2 :
 

||(x, y)||2 = x2 + y2 (norme euclidienne).


Le seul point non évident est le point ii). Il sera démontré plus loin, dans un cas général.

||(x, y)||1 = x + y (norme du chauffeur de taxi new–yorkais. Elle correspond en effet à la


distance parcourue par un taxi dans une ville où les rues sont à angles droits)

||(x, y)||∞ = Max( x , y ) (norme du joueur d'échecs ou, plus classiquement, norme dite
uniforme. Elle permet de dénombrer le nombre de cases à parcourir par un roi du jeu d'échecs pour
atteindre une case)
L'utilisation de l'indice infini provient du fait que l'on peut définir une norme ||(x, y)||α égale à
[ x α + y α]1/α, pour α ≥ 1, et que la norme uniforme s'obtient en prenant la limite de la norme α en
+∞.
3
❑ dans   :
||(x, y, z)||2 = x2 + y2 + z2 (norme euclidienne).

||(x, y, z)||1 = x + y + z

||(x, y, z)||∞ = Max( x , y , z ) (norme uniforme)

n
❑ dans   , posons x = (x1, ..., xn)
n
|| x ||2 = ∑ xi2 (norme euclidienne)
i=1

|| x ||1 = ∑
i=1
xi

|| x ||∞ = Max( xi ) (norme uniforme)

Voici une démonstration générale de la propriété ii) pour la norme euclidienne :


n
Posons <x, y> = ∑ xi yi
i=1

< , > est un produit scalaire lié à la norme par la relation :


|| x ||2 = <x, x>

Prouvons d'abord que :


<x, y> ≤ || x || || y || (Inégalité de Schwarz)
Cette relation est triviale si x ou y est nul. Supposons–les non nuls. Considérons l'application
suivante :
 

t → <x + ty, x + ty> = || x ||2 + 2t<x, y> + t2|| y ||2


Cette application est un binôme du second degré, positif ou nul. Il ne peut donc posséder deux
racines réelles distinctes. Son discriminant est donc négatif ou nul. Donc :
<x, y>2 – || x ||2|| y ||2 ≤ 0

Revenons maintenant à l'inégalité triangulaire :


|| x + y || ≤ || x || + || y || ⇔ || x + y ||2 ≤ [|| x || + || y ||]2
⇔ 2<x, y> ≤ 2 || x || || y ||
or cette dernière inégalité se déduit de l'inégalité de Schwarz

❑ Dans l'espace vectoriel des fonctions continues sur [0,1] :


1
⌠ 2
|| f ||2 =  f (t) dt
⌡0

1

|| f ||1 =  f(t) dt
⌡0

|| f ||∞ = Sup { f(t) / t ∈ [0,1] }


Dans ce chapitre, nous admettrons qu'il s'agit de normes, et nous nous intéresserons dorénavant plus
particulièrement à n.

2– Boules, voisinages, ouverts, fermés


On souhaite généraliser la notion d'intervalle ouvert ou fermé à des espaces de dimension supérieure
à 1. En effet, pour les limites de fonctions de dans intervient souvent la notion de voisinage de

x0, intervalle centré en x0. Dans n, on utilise la notion de boule : la boule ouverte de centre x0 de

rayon R est l'ensemble B(x0, R) = { x | || x – x0 || < R}. Voici ci-dessous la forme des différentes
boules pour diverses normes dans 2 et dans 3.    

❑ Pour la norme euclidienne : en dimension 2, il s'agit évidemment du disque de rayon R et


en dimension 3 de la boule de rayon R

❑ Pour la norme || ||∞, on obtient respectivement :

La longueur des côtés valent 2R

❑ Pour la norme || ||1, on obtient respectivement

Les diagonales ont pour longueur 2R.

On constate que B1(0, R) ⊂ B2(0, R) ⊂ B∞(0, R). Cela résulte des inégalités, qu'on vérifiera aisément
:
|| x ||∞ ≤ || x ||2 ≤ || x ||1
On a par ailleurs, dans n la dernière inégalité || x ||1 ≤ n|| x ||∞. Ces inégalités permettent de poser la
 

définition suivante : une suite de vecteurs de n (xp)p∈ converge vers le vecteur nul si et seulement
 

 

si || xp || converge vers 0. Les inégalités ci-dessus montre qu'il est indifférent de prendre n'importe
quelle norme. Elles sont équivalentes. On notera que cela n'est vraie qu'en dimension finie. Si on
1

prend par exemple les fonctions continues sur [0, 1] avec les normes || f ||1 =  f(t) dt et || f
⌡0
||∞ = Sup { f(t) / t ∈ [0,1] }, on a || f ||1 ≤ || f ||∞. De sorte qu'une suite de fonctions convergeant vers
0 pour la norme || ||∞ converge aussi vers 0 pour la norme || ||1, mais la réciproque est fausse, comme
le montre par exemple la suite de fonctions fp(x) = xp qui tend vers 0 pour || ||1 mais pas pour || f ||∞.
En dimension finie, nous admettrons que toutes les normes sont équivalentes, de sorte que le
problème ci-dessus ne se posera pas.

La notion d'ouvert a pour but de généraliser celle d'intervalle ouvert. U est un ouvert, si :
∀ x ∈ U, ∃ ε > 0, B(x, ε) ⊂ U
F est fermé si son complémentaire est ouvert.

On dira également qu'un point x est adhérent à une partie A si tout voisinage de x intersecte A. Il est
équivalent de dire que x est limite d'une suite de points de A.

Une partie F est fermée si et seulement si tous ses points sont adhérents à F. En effet :
F fermé
⇔ F ouvert
⇔ ∀x∈  F, ∃ ε > 0, B(x, ε) ⊂  F
⇔ ∀x∈  F, x non adhérent à F
⇔ [∀ x, x adhérent à F ⇒ x ∈ F]

De toute suite bornée de 2, on peut extraire une sous–suite convergente (théorème de Bolzno–
 

Weierstrass). Il suffira en effet d'extraire une première sous–suite telle que les abscisse convergent,
puis de cette première sous–suite, on extrait une deuxième sous–suite telle que les ordonnées
convergent également. Ce raisonnement se généralise à tout espace de dimension finie.

3– Limites et continuité
Les définitions de limites et continuité sont semblables à celles des fonctions de dans . La seule
   

différence est qu'on remplace la valeur absolue par une norme. Ainsi, par exemple, f tend vers la
limite (vectorielle) L quand (le vecteur) X tend vers (le vecteur) X0 si :
∀ ε > 0, ∃ α > 0, ∀ X, || X–X0 || < α ⇒ || f(X)–L || < ε
(si f va de n dans p, la norme || X–X0 || désigne évidemment une norme dans n et || f(X)–L ||
     

une norme dans p). f est continue en X0 si lim f(X) = f(X0).


 

X→X0

En dimension finie, toutes les normes sont équivalentes et on peut donc choisir celle qui nous
convient le mieux. Supposons par exemple que nous disposons dans l'espace de départ n de deux  

normes, notées || ||i et || ||k avec les inégalités || ||i ≤ C|| ||k et || ||k ≤ C'|| ||i.
Si on a :
∀ ε > 0, ∃ α > 0, ∀ X, || X–X0 ||i < α ⇒ || f(X)–L || < ε
Alors, a fortiori
∀ ε > 0, ∃ α' > 0, ∀ X, || X–X0 ||k < α' ⇒ || f(X)–L || < ε
Il suffit en effet de prendre α' = α et d'utiliser l'inégalité || ||i ≤ C|| ||k. L'autre inégalité permettra de
C
montrer la réciproque. De même, si c'est dans l'espace d'arrivée p que nous disposons des deux
 

normes || ||i et || ||k avec les mêmes inégalités || ||i ≤ C|| ||k et || ||k ≤ C'|| ||i, alors
∀ ε > 0, ∃ α > 0, ∀ X, || X–X0 || < α ⇒ || f(X)–L ||i < ε
implique
∀ ε' > 0, ∃ α > 0, ∀ X, || X–X0 || < α ⇒ || f(X)–L ||k < ε'
ε'
Il suffit en effet, pour chaque ε' de choisir ε = et d'utiliser || ||k ≤ C'|| ||i, l'autre inégalité
C'
permettant de montrer la réciproque.

Toujours en dimension finie, si l'on note fi la ième composante de f, alors les inégalités suivantes
prouvent l'équivalence entre la continuité de l'application f et celles des applications composantes :
n
∀ X, |fi(X) – fi(X0)| ≤ || f(X) – f(X0)||∞ ≤ ∑ |fi(X) – fi(X0)|
i=1

La première inégalité montre que si f est continue, il en est de même des fi et la deuxième inégalité
montre que, si les fi sont continues, il en est de même de f. Cette constatation est importante, car elle
signifie que, pour étudier une fonction de n dans p, il suffit d'étudier p fonctions de
    dans .
 

2
En outre, les fonctions f de ! !dans " peuvent se représenter graphiquement, ou bien par les
"

représentations des surfaces z = f(x, y) dans 3, ou bien par les lignes de niveaux f(x, y) = Cte dans
# #

le plan. L'utilisation des lignes de niveau dans divers domaines est très fréquente. Citons, entre autres
:
– isobares : lignes de même pression
– isobathes : lignes de même profondeur
– isoclines : lignes de même inclinaison magnétique
– isogones : lignes de même déclinaison magnétique
– isohyètes : lignes de même précipitation moyenne
– isohypses : ligne de même altitude
– isothermes : lignes de même température

EXEMPLE 1 : diverses représentations de la fonction z = x2 + y2


EXEMPLE 2 : représentations de z = x2 – y2

Pratiquement, comment montre-t-on que lim f(X) = 0 ? S'il existe une fonction g de $ $ dans % %

X→0
telle que lim g(r) = 0 et ∀ X, || f (X) || ≤ g(|| X ||) , alors lim f(X) = 0. En effet :
r→0 X→0
∀ ε > 0, ∃ α > 0, || X || < α ⇒ g(|| X ||) < ε ⇒ || f(X) || < ε

xy2
EXEMPLE 1 : f(x, y) = . Si on prend la norme euclidienne, on a f(x, y) ≤ r, où r désigne
x2 + y2
||(x, y)||. La fonction admet donc une limite nulle en 0.

xy 1
EXEMPLE 2 : f(x, y) = 2 2. On note que f(x, 0) = 0 et que f(x, x) = 1 de sorte que, pour ε = , il
x +y 2
n'existe aucun l permettant de vérifier :
1
∃ α > 0, ∀ X, || X–X0 || < α ⇒ f(X) – l <
2
1 1
puisqu'on doit avoir en même temps 0 – l < et 1 – l < .
2 2

La fonction n'admet pas de limite en (0, 0).


Les théorèmes relatifs aux opérations sur les limites restent valables, ces opérations se limitant
essentiellement à la somme des fonctions ou au produit d'une fonction vectorielle par une fonction
scalaire. Les démonstrations sont identiques au cas des fonctions de dans , à la condition de & & ' '

remplacer par || || . Ainsi, la somme de deux fonctions vectorielles continues est continue, le
produit d'une fonction vectorielle continue par une fonction scalaire continue est continue. La
composée de deux fonctions vectorielles continues est continue.

4– Applications partielles
Soit f de n dans p. On prend l'image par f d'un vecteur X de n constitué de n composantes xi.
( ( ) ) * *

On peut considérer les n applications partielles Φi :


→ p
+ +

, ,

x → f(x1,..., xi–1, x, xi+1,..., xn)


Si f est continue, il en est de même de l'application partielle Φi, conséquence évidente des définitions
des limites. Malheureusement, chaque application partielle peut être continue sans que l'application
globale le soit. Il y a donc une différence fondamentale de comportement entre les applications
composantes et les applications partielles.

EXEMPLE :
Soit f : 2 →- - . .

(0, 0) → 0
xy
(x, y) ≠ (0, 0) →
x2+y2
Nous avons déjà vu que cette fonction n'est pas continue en 0. Cependant, les applications partielles
sont identiquement nulles, donc continues.

III : Dérivation

1– Dérivées partielles
Soit f une fonction définie d'un ouvert de n dans , et soit X = (x1, ..., xn) un point de cet ouvert.
/ / 0 0

On appelle dérivée partielle de f en X la dérivée de l'application partielle en xi définie par :


x → f(x1, ..., xi–1, x, xi+1, ..., xn)
On dérive donc f par rapport à la ième composante en considérant les autres composantes comme
∂f
constante. Cette dérivée se note . Si chaque dérivée partielle est continue, on dit que f est de
∂xi
classe C1.

EXEMPLE :
∂f ∂f
f(x, y) = 2x3y2. (x, y) = 6x2y2 et (x, y) = 4x3y
∂x ∂y

L'intérêt des dérivées partielles est qu'elles permettent un développement limité de f au voisinage de
chaque point. Ainsi, avec l'exemple ci–dessus :
f(x+h, y+k) = 2(x+h)3(y+k)2 = 2(x3 + 3x2h + 3xh2 + h3)(y2 + 2yk + k2)
= 2x3y2 + 6x2y2h + 4x3yk + o(||(h, k)||)
∂f ∂f
= f(x, y) + h (x, y) + k (x, y) + o(||(h, k)||)
∂x ∂y
partie linéaire en (h, k) de la variation de f

PROPOSITION :
Soit f de classe C1 sur un ouvert D de 1 1
n
. Alors, pour tout vecteur X de D, et tout vecteur H tel que
X+H appartienne à D, on a :
n
∂f
f(X+H) = f(X) + ∑ hi + o || H ||)
i=1 ∂xi
Cette expression s'appelle développement limité de f à l'ordre 1.

Démonstration :
Elle est faite pour n = 3. On applique trois fois le théorème des accroissements finis pour les
fonctions respectives x → f(x, y+k, z+l), y → f(x, y, z+l), z → f(x, y, z) :
f(x+h, y+k, z+l) – f(x, y, z) = f(x+h, y+k, z+l) – f(x, y+k, z+l)
+ f(x, y+k, z+l) – f(x, y, z+l)
+ f(x, y, z+l) – f(x, y, z)
∂f ∂f ∂f
= h. (x+θ1h, y+k, z+l) + k. (x, y+θ2 k, z+l) + l. (x, y, z+θ3l)
∂x ∂y ∂z
∂f ∂f ∂f
= h[ (x, y, z) + o(1)] + k[ (x, y, z) + o(1)] + l[ (x, y, z) +
∂x ∂x ∂z
o(1)]
où o(1) désigne des fonctions de (h, k, l) qui tendent vers 0 lorsque (h, k, l) tend vers 0. On trouve
bien l'expression annoncée.

∂f ∂f ∂f
La fonction (h, k, l) → h (x, y, z) + k (x, y, z) + l (x, y, z) est une application linéaire appelée
∂x ∂x ∂z
différentielle de f au point(x, y, z) et notée df. Par ailleurs, les trois applications (h, k, l) → h,
(h, k, l) → k et (h, k, l) → l sont notées respectivement dx, dy et dz, de sorte que :
∂f ∂f ∂f
df = dx + dy + dz
∂x ∂x ∂z

En physique, on note souvent de la même façon les fonctions et les valeurs qu'elles prennent (E(x, y)
est moins la fonction qui à (x, y) associe une énergie E(x, y) que cette énergie elle-même). Alors que
le mathématicien considère dx comme la fonction qui à (h, k, l) associe h, variation de x, dx est
considéré par le physicien comme la variation de x elle-même. De même, le mathématicien considère
df comme l'application qui, à une variation de position (h, k, l), associe la partie linéaire de la
variation de f, alors que le physicien considère df comme cette variation elle-même, d'autant plus que
(h, k, l) peuvent être choisis suffisamment petits pour rendre l'erreur o(||(h, k)||) indécelable par les
instruments de mesure.

EXEMPLE :
∂f ∂f
f(x, y) = xy en (1,2). = y.xy–1 = 2. = lnx.xy = 0
∂x ∂y
df = 2dx
ainsi, 1,021.99 ≈ 1,04019... Le calcul au premier ordre donne 1,04
en (2,2), on a df = 4.dx + 4ln2.dy
ainsi, 1,982,02 ≈3,9743... Le calcul au premier ordre donne 3,9754...

2– Gradient
∂f ∂f
La fonction df : (h, k) → h. + k. s'appelle également application linéaire tangente (de même que
∂x ∂y
pour une fonction f de 2 dans , la quantité hf '(x) est une application linéaire, et intervient dans
2 3 3

l'équation de la tangente à la courbe). Considérons une surface z = f(x, y). On appelle plan tangent à
cette surface au point (x0, y0, z0) le plan d'équation :
∂f ∂f
z = z0 + (x–x0) (x0, y0) + (y–y0) (x0, y0)
∂x ∂y
∂f ∂f
On note df(x,y)(h, k) ou df(h, k) la quantité h. + k. (notation différentielle). df(h, k) est la meilleure
∂x ∂y
approximation au premier ordre de la variation de la fonction f. On remarque que df(h, k) est égal au
∂f ∂f ∂f ∂f
produit scalaire (h, k).( , ). Le vecteur ( , ) s'appelle gradient de f au point (x, y).
∂x ∂y ∂x ∂y

On remarquera que, pour un déplacement (h, k) de longueur donnée, la variation (au premier ordre
de f) df est maximale lorsque (h, k) est colinéaire à grad(f), nulle si elle est orthogonale à grad(f).
Cela s'interprète géométriquement par le fait que les lignes de niveaux sont orthogonales au gradient.
La direction du gradient indique la direction suivant laquelle f varie le plus vite, la norme du gradient
mesurant l'intensité de cette variation. Par exemple, si f est l'altitude en un point (x, y), grad(f) est le
vecteur orienté dans la direction de la ligne de plus grande pente, de norme égale à la pente locale.

Cette interprétation est utilisée :


❑ en mécanique : F = –grad(E) où E est l'énergie potentielle. F indique dans quel sens
l'énergie potentielle décroît le plus vite. F est la force dérivant de l'énergie potentielle E.
Par exemple, si E = mgz, alors F = –mg.k. E est l'énergie potentielle de pesanteur.
Voici un autre exemple : La théorie Newtonienne de la gravitation considère que la Terre est
C
soumise à une force centrale dirigée vers le Soleil de la forme F = 2.U où U est un vecteur normé
r
C
dirigé du Soleil vers la Terre, (C < 0) et r = x2+y2+z2 . Soit E = . On a :
r
∂E C ∂r Cx
= – 2. = –
∂x r ∂x r
de même pour les autres dérivées. D'où F = –grad(E)

❑ en électricité : E = –grad(V) où V est le potentiel électrique. E indique dans quel direction


le potentiel décroît le plus vite. E est le champ électrique. Cet exemple est très ressemblant au
précédent, car une particule de charge q placée dans un champ électrique E est soumise à une force
qE, qui dérive donc de l'énergie potentielle qV.
Dans un conducteur en équilibre, celui–ci se trouve à un potentiel constant. Le champ est nul
à l'intérieur du conducteur, et le champ extérieur est orthogonal à la surface.

L'intérêt du potentiel est que sa connaissance suffit pour connaître le champ de vecteurs, et
que les calculs éventuels sur des quantités scalaires est plus facile que les calculs sur des quantités
vectorielles.
Donnons un dernier exemple : on considère la Terre comme un fluide en équilibre hydrostatique de
masse volumique constante (hyptohèses très réductrices !!). Dans ce cas :
grad P = µg
où P est la pression, µ la masse volume et g l'accélération de la pesanteur au point considéré.
L'accélération de la pesanteur indique dans quel sens augmente la pression. Elle est orthogonale aux
lignes isobares et la variation de pression est d'autant plus importante que µ est grand. Ainsi, au
voisinage de la surface terrestre, on a, en fonction de la profondeur z :
dP
= µg ⇒ P = P0 + µgz (avec z orienté vers le bas)
dz
PLus généralement, si R est le rayon de la Terre, x la distance du point considéré au centre et g0
gx
l'accélération à la surface de la Terre, on a g = 0 . En effet, l'accélération gravitionnelle vaut à la
R
GM 4 G
surface g0 = 2 (avec G constante universelle de gravitation, M masse de la Terre), soit πR3µ × 2
R 3 R
4πµGR 4πµGx
ou encore alors qu'à la distance x, on a g = . d'où :
3 3
dP µg x x2 R
= – 0 ⇒ P = P0 – µg0 + µg0
dx R 2R 2
R
Au centre de la Terre, x = 0 et P = P0 + µg0 .
2
Application numérique : R = 6370 km, M = 6 1024 kg, G = 6,67 10–11 N.m2.kg–2
P vaut environ 174 109 Pa. (La valeur trouvée est en fait deux fois plus petite que la valeur
actuellement estimée).
z2
Si on pose x = R – z, on obtient : P0 + µg0(z – )
2R
z2
soit une erreur par rapport à P0 + µgz égale à – µg0 .
2R

3– Dérivées de fonctions composées


a) Considérons d'abord le cas suivant :
4 4

→ n→ 5 5 6 6

t → X(t) → f(X(t)) = g(t)


On suppose que f est C1, de même que chaque composante de X. Alors g est C1 et :
n
∂f
g'(t) = ∑ xi'(t). (X(t))
i=0 ∂xi
La démonstration est donnée pour n = 3.
g(t+h) = f(x(t+h), y(t+h), z(t+h))
= f[x(t)+hx'(t)+o(h), y(t)+hy'(t)+o(h), z(t)+hz'(t)+o(h)]

H K L
= f(x + H, y + K, z + L)
∂f ∂f ∂f
= f(x, y, z) + H + K + L + o(||(H, K, L||)
∂x ∂y ∂z
∂f ∂f ∂f
= g(t) + h[x'(t). + y'(t). + z'(t). ] + o(h)
∂x ∂y ∂z
car || (H,K,L) || = h.O(1) où O(1) est borné. Donc o(||(H,K,L)||) = o(h)
On obtient bien le résultat annoncé.
On définit la dérivée en X selon un vecteur U par la dérivée en 0 de l'application t → f(X+tU). Les
dérivées partielles correspondent aux dérivées selon les vecteurs de la base canonique de n. La 7 7

n
∂f
dérivée de cette fonction vaut : ∑ ui (X)
i=1 ∂xi

b) Cas général :
8 8

p
→ n→
9 9 : :

U → X → f(X) = g(U)
g(u1, ..., up) = f[x1(u1, ..., up), ..., xn(u1, ..., up)]
Si f et chaque xi est C1, alors il en est de même de g, et :
∂g n ∂f ∂xj
=∑
∂ui j=1 ∂xj ∂ui
∂g
En effet, est la dérivée de l'application partielle en ui, et l'on applique le résultat du a) sur la
∂ui
fonction partielle ui → g(u1, ..., up)

EXEMPLE :
(r, θ) → (x, y) → f(x, y) = g(r, θ)
x = r.cosθ
y = r.sinθ
∂g ∂f ∂f
= .cosθ + .sinθ
∂r ∂x ∂y
1 ∂g ∂f ∂f
= – .sinθ + .cosθ
r ∂θ ∂x ∂y

Ce système permet d'en déduire inversement que :


∂f ∂g 1 ∂g
= .cosθ – .sinθ
∂x ∂r r ∂θ
∂f ∂g 1 ∂g
= .sinθ + .cosθ
∂y ∂r r ∂θ

On obtient l'expression du gradient en polaire :


∂g 1 ∂g
grad f = er + . eΘ
∂r r ∂θ

On remarquera que, en physique, les fonctions f et g sont notées de la même façon, la différence des
variables étant précisées par l'utilisation d'unités différentes (ex, mètres et mètres pour (x, y) ; mètres
et radians pour (r, θ)). Ceci apparaît également dans la situation suivante : une quantité – par
exemple l'énergie interne d'un gaz – peut s'exprimer comme fonction de diverses variables, (T,P) ou
∂U ∂U
(T,V). Dans le premier cas, les physiciens sont obligés de noter ( )P et ( )V les dérivées partielles
∂T ∂T
de U par rapport à T respectivement lorsque les variables sont (T,P) et (T,V). Le problème ne se
pose pas en Mathématique, car le mathématicien aurait noté de manière différente les fonctionnelles
∂f ∂g
U = f(T,P) et U = g(T,V). Il écrirait alors simplement ou sans ambiguïté.
∂T ∂T

4– Extremum
f admet un maximum (respectivement minimum) local en X0 s'il existe un voisinage de X0 tel que,
pour tout X de ce voisinage, on ait f(X) inférieur (respectivement supérieur) à f(X0). Si f est de
classe C1, il n'est pas difficile de voir que les dérivées premières sont nulles en X0, car les fonctions
partielles admettent un extremum au même point. La réciproque est fausse (elle l'est déjà pour les
fonctions de dans ) comme le prouve le contre–exemple suivant :
; ; < <

f(x, y) = x2–y2 en (0,0)

5– Dérivées successives
Les dérivées partielles premières sont de nouvelles fonctions de n dans . On peut évidemment = = > >

itérer le procéder et définir des dérivées partielles secondes, et parler de fonctions de classe C2,
lorsque ces dérivées sont continues, et plus généralement de fonctions de classes Ck pour des
fonctions dont les k premières dérivées partielles existent et sont continues.

∂2 f ∂2 f
Pour deux variables x et y, on note 2 (respectivement ) la dérivée seconde obtenue en dérivant
∂x ∂y2
∂2 f
deux fois de suite par rapport à x (respectivement y), la dérivée seconde obtenue en dérivant
∂x∂y
∂2 f
d'abord par rapport à y puis à x, et la dérivée seconde obtenue en dérivant d'abord par rapport à
∂y∂x
x puis à y. Ces deux dernières dérivées peuvent être différentes ; cependant, la plupart du temps, elles
sont égales.

THEOREME DE SCHWARZ :
∂2 f ∂2 f
Soit f de classe C2 sur un ouvert de n
. Alors =
∂y∂x ∂x∂y
? ?

Une démonstration est donnée en annexe 1.


Plus généralement, pour une fonction de classe Ck, l'ordre de dérivation des k permières dérivées est
sans importance.

6– Formes différentielles
n
On appelle forme différentielle sur une quantité notée :
@ @

ω = P1.dx1 + ... + Pn.dxn


n
où les Pi sont des fonctions de A dans . Les premiers exemples de formes différentielle sont
A B B

∂f
évidemment les différentielles df de fonctions f, où Pi = . On se pose alors le problème réciproque.
∂xi
Etant donné une forme différentielle ω, existe–t–il une fonction f telle que ω = df ?

Ce problème peut se poser également sous la forme suivante : étant donné un champ de vecteurs (P1,
P2, ..., Pn), existe-t-il une fonction f telle que grad f = (P1, P2, ..., Pn) ?

Si c'est le cas, on dit que la forme différentielle est exacte, ou que le champ de vecteur dérive d'un
potentiel. Dans le cas où les fonctions Pi sont de classe C1, il est nécessaire, d'après le théorème de
∂Pi ∂Pj 3
Schwarz que = pour tout i différent de j. Pour une forme différentielle de ,
∂xj ∂xi
C C

P dx + Q dy + R dz, cela s'exprime sous la forme suivante :


∂R ∂Q
– =0
∂y ∂z
∂P ∂R
– =0
∂z ∂x
∂Q ∂P
– = 0 (seule relation à utiliser pour la forme P dx + Q dy)
∂x ∂y
∂R ∂Q
 –
∂y ∂z 
 ∂R ∂Q
–  P
s'appelle rotationnel de  Q 
 
Le vecteur
∂y ∂z
R
∂Q ∂P
 –
∂x ∂y 
Nous admettrons que la condition donnée est également suffisante localement sur des boules, ou des
convexes. Sur de tels ouverts, un champ de vecteurs de rotationnel nul dérive d'un potentiel scalaire.
Il est donc possible qu'on ne puisse définir f que localement, et pas globalement.

Lorsqu'une forme différentielle ω n'est pas exacte, on essaie parfois de trouver une fonction g telle
que gω soit exacte. Si on trouve une telle fonction g, on dit que g est un facteur intégrant de ω. Il se
peut qu'aucun facteur intégrant n'existe, ou au contraire qu'il en existe plusieurs. Par exemple, en
thermodynamique, on montre que la variation de quantité de chaleur δQ reçue au cours d'un échange
1
thermique n'est pas une différentielle exacte, que est un facteur intégrant (où T est la température)
T
1
et que .δQ est la différentielle exacte dS de l'entropie S. Ainsi, pour une mole d'un gaz parfait, on a
T
:
δQ = Cv.dT + P.dV
où δQ est la chaleur reçue par une mole de gaz, Cv la capacité (ou chaleur) molaire à volume
constant, P la pression, V le volume, T la température en °K. De PV = RT, on tire :
dV 1
δQ = Cv.dT + RT. qui n'est pas une forme différentielle exacte. est facteur intégrant.
V T
On a :
dT dV
dS = δQ/T = Cv. + R. ⇒ S = Cv .lnT + R.lnV
T V

Les formes différentielles apparaissent également dans le contexte suivant. Supposons qu'un point se
déplace dans l'espace entre les instants t0 et t1, suivant une courbe paramétrée Γ = {(x(t), y(t), z(t)) ,
t0 ≤ t ≤ t1} de classe C1 ou C1 par morceaux, depuis le point M0 = M(t0) et M1 = M(t1) et qu'en
chaque point soit défini une force de composantes (P, Q, R), dépendant de x, y et z. On dispose d'un
champ de forces. Le travail effectué par cette force le long de Γ est donné par l'intégrale suivante
W = ⌠ P dx + Q dy + R dz
⌡Γ
qui par définition, n'est autre que :
⌠ t1
W = P(x(t),y(t),z(t))x'(t) + Q(x(t),y(t),z(t))y'(t) + R(x(t),y(t),z(t))z'(t) dt
⌡t0
La première notation se justifie par le fait que W dépend de Γ mais ne dépend pas du paramétrage
choisi pour le parcourir (Physiquement, un changement de paramétrage correspond au fait de
parcourir Γ avec des vitesses différentes. Le travail W dépend du chemin parcouru mais de la vitesse
à laquelle il est parcouru). On peut noter également :
W=⌠ ⌡Γ ω
où ω est la forme différentielle P dx + Q dy + R dz.


EXEMPLE 1 : Considérons W = y dx – x dy où Γ est le segment joignant le point (0, 1) au point
⌡Γ
(1, 0). Un paramétrage possible est donné par x = t, y = 1 – t, t variant de 0 à 1. D'où W = 1. Par
contre, si on va de (0, 1) à (1, 0) par le segment [(0,1), (0,0)] suivi de [(0,0), (0,1)], on trouvera
W = 0. Autrement dit, W dépend du chemin suivi

EXEMPLE 2 : Considérons W = y dx + x dy où Γ est le segment joignant le point (0, 1) au point
⌡Γ
(1, 0). Reprenons le paramétrage x = t, y = 1 – t, t variant de 0 à 1. D'où W = 0. Si on va de (0, 1) à
(1, 0) par le segment [(0,1), (0,0)] suivi de [(0,0), (0,1)], on a toujours W = 0. Dans le cas présent,
W ne dépend pas du chemin suivi. La différence avec l'exemple 1 est que ydx + xdy est une
différentielle exacte (à savoir celle de xy) alors que ydx – xdy n'est pas exacte.

On appelle une énergie potentielle E dont dérive une force F de composantes (P, Q, R) (ou plus
généralement, potentiel dont dérive un champ de vecteur) une quantité E telle que – grad E = F (La
raison du signe – est que la force indique la direction dans laquelle l'énergie potentielle diminue). Le
travail de cette force est :
W=⌠ ⌠
⌡ΓF.dM = ⌡ΓP dx + Q dy + R dz
∂E ∂E ∂E
= –⌠ dx + dy + dz
⌡Γ ∂x ∂y ∂z
t1 ∂E ∂E ∂E
= –⌠ (x(t),y(t),z(t)) x'(t) + (x(t),y(t),z(t)) y'(t) + (x(t),y(t),z(t)) z'(t) dt
⌡t0 ∂x ∂y ∂z
t1
On reconnaît le dérivée de la fonction composée t → (x, y, z) → E(x, y, z) que nous continuerons à
noter E(t) pour se conformer à l'usage en physique. L'intégrale vaut donc :
⌠ t1
W = –  E'(t) dt = E(t0) – E(t1) = E(M0) – E(M1)
⌡t0

Plusieurs points sont remarquables :


❑ Ce travail ne dépend pas du chemin suivi, mais seulement du point de départ et d'arrivée.
❑ La relation E(M0) = E(M1) + W est une démonstration du principe de conservation de
l'énergie.

Plus généralement, si (P,Q,R) est un champ de vecteurs défini sur un ouvert de 3 et que cet ouvert
D D

contient une courbe Γ, on définit la circulation de ce champ le long de Γ par l'intégrale suivante, dite
intégrale curviligne :
⌠ P dx + Q dy + R dz = ⌠
t1
P(x(t),y(t),z(t))x'(t) + Q(x(t),y(t),z(t))y'(t) + R(x(t),y(t),z(t))z'(t) dt
⌡Γ ⌡t0
où l'application [t0, t1] → 3
E E

t → (x(t), y(t), z(t))


est une représentation paramètrique de Γ. La formule de changement de variables sur les intégrales
permet de montrer que cette définition ne dépend pas de la représentation paramétrique choisie, et
donc ne dépend que de Γ. On a donc montré que si le champ de vecteurs dérive d'un potentiel
scalaire, alors l'intégrale ne dépend que des valeurs de ce potentiel au point initial et final. En
particulier, si la courbe Γ est fermée, l'intégrale est nulle.

Inversement, on prouve que si toute circulation du champ de vecteur ne dépend que des valeurs
initiales et finales par une formule :

⌡[M0,M1]P dx + Q dy + R dz = E(M0) – E(M1)
Alors le champ de vecteurs dérive du potentiel E. Il suffit pour cela de considérer par exemple un
déplacement selon x, alors que y et z restent constant, pour voir que P est la dérivée de –E par
rapport à x. De même pour les autres variables.

7– Fonctions implicites
Soit f une fonction de classe C1 définie dans un ouvert de 2. La relation f(x, y) = 0 met en relation y
F F

et x. y peut parfois être considéré comme fonction de x, ou inversement x peut être considéré comme
fonction de y.

EXEMPLE 1 :
f(x, y) = x2+y2–1 = 0
Pour y > 0, cette équation donne y = 1–x2 .
Pour y < 0, cette équation donne y = – 1–x2
Mais au voisinage de y = 0, on ne peut définir de fonction y de x.

EXEMPLE 2 :
f(x, y) = (x2+y2)2 – (x2–y2) = 0
En polaire, on obtient :
r2 = cos(2θ)
Cette fonction ne permet pas de définir y en fonction de x, pas plus que x en fonction de y au
voisinage de 0.

Dans le premier cas, la raison en est qu'en (1, 0), la tangente à la ligne de niveau est parallèle à Oy, la
raison dans le second cas, est qu'il n'y a pas qu'une seule tangente en (0,0) mais deux. Si on se
souvient que le gradient est orthogonal aux lignes de niveaux, on verra que la tangente en (x0, y0) à
∂f ∂f
une ligne de niveau f(x, y) = 0 est (x – x0) (x0, y0) + (y – y0) (x0, y0) = 0, à condition que l'une des
∂x ∂y
deux dérivées partielles soient non nulles. En outre, la tangente est parallèle à Oy si et seulement si
∂f x2 y2
(x0, y0) = 0. Par exemple, l'ellipse 2 + 2 – 1 = 0 admet pour tangente en (x0, y0) la droite
∂y a b
x y x.x y.y
d'équation (x–x0) 02 + (y–y0) 02 = 0, équation qu'on peut encore écrire 2 0 + 20 – 1 = 0.
a b a b

THEOREME DES FONCTIONS IMPLICITES en dimension 2 :


∂f
Soit f une fonction de classe C1 sur un ouvert de 2
(x0,y0) ≠ 0.
, telle que f(x0,y0) = 0, et que
∂y
G G

Alors il existe un voisinage de (x0, y0) de la forme I × J et une fonction unique Φ définie sur I et
ayant son image dans J, vérifiant, pour tout (x,y) de I × J :
f(x,y) = 0 ⇔ y = Φ(x)
En outre Φ est de classe C1. (Plus généralement, si f est Ck, Φ aussi).

Une démonstration est donnée en annexe 2.

On a donc identiquement f(x, Φ(x)) = 0. Cette relation permet de donner la valeur de Φ'(x) en
fonction des dérivées partielles de f. On dérive la fonction x → f(x, Φ(x)). Cette fonction étant
identiquement nulle, il en est de même de sa dérivée.
∂f ∂f
0 = (x, y) + Φ'(x). (x, y)
∂x ∂y
∂f
(x, y)
∂x
Donc : Φ'(x) = –
∂f
(x, y)
∂y
dΦ ∂f
(On remarquera que s'annule là où s'annule.)
dx ∂x

Si une fonction implicite ne peut pas toujours s'exprimer explicitement, un paramètrage peut parfois
y suppléer.
EXEMPLE :
exp(x+y) + x + 2y – 1 = 0
Le théorème s'applique au voisinage de (0,0). Un paramétrage de la courbe est donnée par :
t
 x = 2t – 1 + e
 t
î y=1–t–e

Dans le cas de trois variables, on aura, de manière analogue :


f(x, y, z) = 0 ⇔ z = Φ(x, y)
On a donc identiquement f(x, y, Φ(x, y)) = 0. Les dérivées de Φ s'obtiennent en dérivant la relation
précédente par rapport à x ou y :
∂f ∂Φ ∂f
0= +
∂x ∂x ∂z
∂f ∂f
0 = + ∂Φ
∂y ∂y ∂z

Si la relation permet de définir z = Φz(x, y), y = Φy(x, z) et x = Φx(y, z), on vérifiera que :
∂Φx ∂Φy∂Φz
=–1
∂y ∂z ∂x
relation que les physiciens noteront plutôt :
∂x ∂y ∂z
( )z ( )x ( )y = – 1
∂y ∂z ∂x
On a par exemple :
∂P
l = T( )V coefficient calorimétrique de dilatation
∂T
∂V
h = –T( )P coefficient calorimétrique de compression
∂T
∂V ∂P ∂V ∂V
⇒ l.( )T = T( )V( )T = – T( )P = h
∂P ∂T ∂P ∂T

Annexe 1 : Théorème de Schwarz


Dans cette annexe, on démontre le théorème de Schwarz. Soit f une fonction de classe C2 sur un
∂2 f ∂2 f
ouvert de 2. Nous voulons montrer que = . Nous considérons la fonction suivante :
∂x∂y ∂y∂x
H H

D(h, k) = f(x+h, y+k) – f(x+h, y) – f(x, y+k) + f(x, y)

i) Considérons Φ1(t)= f(t, y+k) – f(t, y). On a donc :


D(h, k) = Φ1(x+h) – Φ1(x) = hΦ1'(x+θh)
en appliquant le théorème des accroissements finis sur Φ1.
∂f ∂f
⇒ D(h, k) = h[ (x+θh, y+k) – (x+θh, y)]
∂x ∂x
∂f2
= hk (x+θh, y+θ'k)
∂y∂x
∂f
en appliquant le théorème des accroissements finis sur la fonction y → (x+θh, y). On en déduit que
∂x
D(h,k) ∂2f ∂2 f
lim = (x, y), car est continue.
(h,k)→(0,0) hk ∂y∂x ∂y∂x

ii) On peut également considérer Φ2(t) = f(x+h, t) – f(x, t). Par un raisonnement analogue à celui qui
précède, on a :
D(h, k) = Φ2(y+k) – Φ2(y) = kΦ2'(y+τk)
∂f ∂f
= k[ (x+h, y+τk) – (x, y+τk)]
∂y ∂y
∂f2
= kh (x+τ'h, y+τk)
∂x∂y
D(h,k) ∂2f
Donc lim = (x, y)
(h,k)→(0,0) hk ∂x∂y

On en déduit donc l'égalité des deux dérivées partielles.

xy(x2–y2)
Voici un contre–exemple, dans le cas d'une fonction non C2. Soit f(x, y) = en dehors de
x2+y2
(0,0) et f(0,0) = 0
∂f y(x2–y2) 4x2y3
(x, y) = 2 2 + 2 2 2 en dehors de (0,0)
∂x x +y (x +y )
∂f
(0,0) = 0, dérivée en 0 de la fonction x → f(x, 0) = 0
∂x
∂f
⇒ (0, y) = –y pour tout y
∂x
∂2 f
⇒ (0, 0) = –1
∂y∂x

De même :
∂f x(x2–y2) 4x3y2
(x, y) = 2 2 – 2 2 2
∂y x +y (x +y )
∂f
(0, 0) = 0
∂y
∂f
⇒ (x, 0) = x pour tout x
∂y
∂2 f
⇒ (0, 0) = 1
∂x∂y

∂2 f ∂2 f
On remarque donc que (0, 0) ≠ (0, 0)
∂y∂x ∂x∂y

Annexe 2 : Fonctions implicites


Cette annexe a pour but de démontrer le théorème des fonctions implicites. Soit f(x, y) = 0, f de
classe C1 sur un ouvert de 2.
I I

∂f
i) Soit (x0, y0) un point vérifiant f(x0, y0) = 0, et l'on suppose que (x0, y0) est non nul, par
∂y
∂f ∂f
exemple strictement positif. étant continue, on en déduit que est strictement positive sur un
∂y ∂y
voisinage V = [x0–α, x0+α] × [y0–β, y0+β] de (x0, y0). La fonction y → f(x0, y) est strictement
croissante puisque sa dérivée est strictement positive. Comme f(x0, y0) = 0, on en déduit que f(x0, y0–
β) < 0, et que f(x0, y0+β) > 0. f étant continue, on a, sur un voisinage de x0, f(x, y0–β) < 0 et f(x,
y0+β) > 0. ∞ peut être choisi suffisamment petit pour que l'intervalle [x0–α, x0+α] soit contenu dans
le voisinage en question. Pour tout x dans [x0–α, x0+α], on a donc :
f(x, y0–β) < 0
f(x, y0+β) > 0
∂f
(x, y) > 0 pour y ∈ [y0–β, y0+β].
∂y
La fonction y → f(x, y) est donc strictement croissante, et prend des valeurs négatives et positives. Il
existe une valeur unique y = Φ(x) qui annule f. Ainsi est définie Φ.

ii) Φ est continue, car pour tout ε > 0, le raisonnement précédent appliqué en (x0, y0) mais en
utilisant ε au lieu de β, prouve qu'il existe α tel que :
∀ x, x–x0 ⇒ Φ(x)–y0 ≤ ε
puisque Φ(x) est défini dans l'intervalle [y0–ε, y0+ε].
iii) Φ est dérivable. Posons y0 = Φ(x0) et y0+k = Φ(x0+h).
Considérons l'application t → f(x0+th, y0+tk) – f(x0, y0). Cette fonction en nulle pour t = 0 et t = 1. f
étant C1, elle est dérivable. On peut appliquer le théorème de Rolle. Il existe θ élément de ]0,1[ tel
que :
∂f ∂f
h. (x0+θh, y0+θk) + k. (x0+θh, y0+θk) = 0
∂x ∂y
∂f
(x0+θh, y0+θk)
Φ(x0+h)–Φ(x0) k ∂y
⇒ = =–
h h ∂f
(x0+θh, y0+θk)
∂x
Or lorsque h tend vers 0, k tend vers 0 (car Φ est continue), et en prenant la limite dans le membre
de droite, on obtient :
∂f
(x0, y0)
∂y
Φ'(x0) = –
∂f
(x0, y0)
∂x

Vous aimerez peut-être aussi