Vous êtes sur la page 1sur 279

Mathmatiques pour la

Physique.

Bahram Houchmandzadeh
Remerciements :
Je remercie sincrement Youssef Ben Miled et Mathias Legrand pour leur lecture at-
tentive du manuscrit et leur trs (trs) nombreuses corrections et suggestions. Grace
leurs efforts, ce manuscrit a un aspect beaucoup prsentable.

web : http://houchmanddzadeh.net/cours/Math/math.htm
courriel : bahram.houchmandzadeh univ-grenoble-alpes.fr
Premire version : Septembre 2008
Version prsente : June 22, 2016

2
Table des matires
1 Introduction 7

2 lments danalyse fonctionnelle. 9


2.1 Les espaces vectoriels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Lespace vectoriel des fonctions. . . . . . . . . . . . . . . . . . . . . . . 13
2.3 Quelques digressions historiques. . . . . . . . . . . . . . . . . . . . . . 17

3 Les sries de Fourier. 18


3.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.2 Les sries de Fourier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3 Pourquoi les sries de Fourier sont intressantes ? . . . . . . . . . . . . 23
3.4 Un peu de gnralisation. . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Les sries de sinus et de cosinus. . . . . . . . . . . . . . . . . . . . . . . 25
3.6 Vibration dune corde. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.7 Drivation terme terme des sries de Fourier. . . . . . . . . . . . . . . 28
3.8 quation de la chaleur. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4 Les transformations de Fourier. 42


4.1 Entre en matire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2 Les oprations sur les TF. . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3 Transforme de Fourier Rapide. . . . . . . . . . . . . . . . . . . . . . . 45
4.4 Manipulation et utilisation des TF. . . . . . . . . . . . . . . . . . . . . . 45
4.5 Relation entre les sries et les transforms de Fourier. . . . . . . . . . . 50
4.6 Approfondissement : TF plusieurs dimensions. . . . . . . . . . . . . . 50

5 Les distributions. 53
5.1 Ce quil faut savoir. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2 Un peu de dcence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.3 Manipulation et utilisation des distributions. . . . . . . . . . . . . . . . 58
5.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.5 Problmes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

6 Convolution et corrlation. 67
6.1 Les convolutions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2 Auto-corrlation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3
Table des matires

6.3 Approfondissement : Relation entre lquation de diffusion et les convo-


lutions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

7 Les transformes de Laplace. 78


7.1 Entre en matire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7.2 Oprations sur les TL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.3 Dcomposition en fraction simple. . . . . . . . . . . . . . . . . . . . . . 81
7.4 Comportement asymptotique. . . . . . . . . . . . . . . . . . . . . . . . 83
7.5 Produit de Convolution. . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.6 Aperu des quations intgrales. . . . . . . . . . . . . . . . . . . . . . . 86
7.7 Aperu des systmes de contrle asservis (feedback systems). . . . . . . 87
7.8 La physique statistique. . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.9 TL inverse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

8 Les fonctions de Green. 97


8.1 Entre en matire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.2 Le potentiel lectrostatique. . . . . . . . . . . . . . . . . . . . . . . . . 100
8.3 La propagation des ondes . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.4 Propagateur pour lquation de Schrdinger. . . . . . . . . . . . . . . . 103
8.5 Disposer dune base propre. . . . . . . . . . . . . . . . . . . . . . . . . 103

9 Les oprateurs linaires. 104


9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
9.2 Lalgbre des oprateurs. . . . . . . . . . . . . . . . . . . . . . . . . . . 106
9.3 Reprsentation matricielle des oprateurs. . . . . . . . . . . . . . . . . 111
9.4 Valeurs et vecteurs propres. . . . . . . . . . . . . . . . . . . . . . . . . 114
9.5 Disposer dune base propre orthogonale. . . . . . . . . . . . . . . . . . 115
9.6 Oprateurs hermitiens. . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
9.7 Mthodes opratorielles, algbre de Lie. . . . . . . . . . . . . . . . . . . 119

10 Les systmes de Sturm-Liouville. 127


10.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
10.2 Reformulation opratorielle. . . . . . . . . . . . . . . . . . . . . . . . . 131
10.3 Dtour : la mcanique quantique ou pourquoi les valeurs propres ont
pris tant dimportance. . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
10.4 Les systmes de Sturm-Liouville. . . . . . . . . . . . . . . . . . . . . . . 137
10.5 Les solutions polynomiales de Sturm-Liouville. . . . . . . . . . . . . . . 139
10.6 Valeurs et fonctions propres. . . . . . . . . . . . . . . . . . . . . . . . . 142
10.7 La seconde solution : Le Wronskien. . . . . . . . . . . . . . . . . . . . . 143
10.8 Les solutions non-polynomiales. . . . . . . . . . . . . . . . . . . . . . . 144
10.9 Exercices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

4
Table des matires

11 Le calcul variationnel 146


11.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
11.2 Calcul des variations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
11.3 Plusieurs degrs de liberts. . . . . . . . . . . . . . . . . . . . . . . . . 151
11.4 Formulation lagrangienne et quation du mouvement dun champ. . . . 154
11.5 Optimisation sous contraintes. . . . . . . . . . . . . . . . . . . . . . . . 157
11.6 Les conditions aux bords naturelles 1. . . . . . . . . . . . . . . . . . . 163
11.7 Les conditions aux bords naturelles 2. . . . . . . . . . . . . . . . . . . . 165
11.8 Dtour : lments de gomtries non-euclidiennes. . . . . . . . . . . . . 167

12 Calcul des perturbations. 174


12.1 Les perturbations rgulires. . . . . . . . . . . . . . . . . . . . . . . . . 174
12.2 Les perturbations singulires. . . . . . . . . . . . . . . . . . . . . . . . . 178

13 Les oprateurs diffrentiels. 186


13.1 Mtrique et Systme de coordonnes. . . . . . . . . . . . . . . . . . . . 186
13.2 Nabla, div et les autres. . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
13.3 Le gradient. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
13.4 Champ de vecteurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
13.5 Le rotationnel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
13.6 La divergence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
13.7 Le Laplacien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
13.8 Rsumons. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
13.9 Notes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

14 Les tenseurs en physique. 200


14.1 Les tenseurs de rang 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
14.2 Gnralisation des tenseurs. . . . . . . . . . . . . . . . . . . . . . . . . 203
14.3 Les composantes dun tenseur. . . . . . . . . . . . . . . . . . . . . . . . 204
14.4 Changement de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
14.5 Le produit scalaire gnralis, covariant et contravariant, les formes li-
naires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

15 quation drive partielle du premier ordre. 210


15.1 La mthode des caractristiques. . . . . . . . . . . . . . . . . . . . . . . 210
15.2 Interprtation gomtrique. . . . . . . . . . . . . . . . . . . . . . . . . . 212
15.3 Gnralisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

16 Les formes diffrentielles et la drivation extrieure. 217


16.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
16.2 Les 1formes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
16.3 Intgration des 1-formes. . . . . . . . . . . . . . . . . . . . . . . . . . . 219

5
Table des matires

16.4 les nformes et les nvecteurs. . . . . . . . . . . . . . . . . . . . . . . 220


16.5 Lintgration des kformes. . . . . . . . . . . . . . . . . . . . . . . . . 221
16.6 La drivation extrieure. . . . . . . . . . . . . . . . . . . . . . . . . . . 223
16.7 thorme de Stockes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
16.8 Intgration par partie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
16.9 Un peu de gomtrie : vecteurs, 1-formes et leurs associations. . . . . . 230
16.10 Loprateur de Hodge. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
16.11 Quelques applications. . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

17 Thorie des fonctions analytiques. 239


17.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
17.2 Les fonctions complexes. . . . . . . . . . . . . . . . . . . . . . . . . . . 240
17.3 Les fonctions analytiques. . . . . . . . . . . . . . . . . . . . . . . . . . . 240
17.4 Intgration dans le plan complexe. . . . . . . . . . . . . . . . . . . . . . 241
17.5 Consquences du Cauchy-Goursat. . . . . . . . . . . . . . . . . . . . . 244
17.6 Les rsidus et leur application lintgration. . . . . . . . . . . . . . . . 248

18 Les Transformes de Legendre. 256


18.1 Dfinition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
18.2 Application travers la physique. . . . . . . . . . . . . . . . . . . . . . 260

19 Les quations de la physique. 264


19.1 Quest ce quune quation diffrentielle ? . . . . . . . . . . . . . . . . . 264
19.2 quation de Laplace. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
19.3 quation donde et de chaleur. . . . . . . . . . . . . . . . . . . . . . . . 267

20 Quest ce quun nombre ? 270


20.1 Les entiers naturels N. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
20.2 Les ensembles Z et Q. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
20.3 Un peu de topologie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
20.4 Lensemble des nombres rels. . . . . . . . . . . . . . . . . . . . . . . . 273
20.5 Les nombres padiques. . . . . . . . . . . . . . . . . . . . . . . . . . . 276

21 Bibliograhie. 278

6
1 Introduction
Durant les deux premires annes luniversit, on apprend les bases essentielles des
mathmatiques : calcul diffrentiel et intgral, algbre linaire, quations diffrentielles
linaires, etc. Lobjet de ce cours est dutiliser ce corpus pour introduire les mthodes
mathmatiques dites suprieures utilises pour rsoudre les problmes classiques de la
physique.
Les mathmatiques ne sont pas une collection de mthodes juxtaposes et sans re-
lation : il existe des concepts extrmement gnraux qui nous permettent de porter le
mme regard sur des notions a priori disparates. Le concept qui reviendra tout au long
de ce cours est celui de lespace vectoriel. Ainsi, tourner un vecteur du plan dun angle
quelconque ou appliquer un oprateur intgrodiffrentiel une fonction sont fonda-
mentalement la mme chose ; de mme que trouver les valeurs propres dune matrice
ou rsoudre une quation drive partielle linaire. Cest bien pour cela que ltudiant
apprend un tel volume dalgbre linaire dans les cours de mathmatiques lmentaires.
Le plan du cours est le suivant : Aprs une introduction (un rappel) des espaces
vectoriels, nous verrons que les fonctions elles mmes peuvent tre considres comme
des points (des vecteurs) dans un grand espace des fonctions, et que nous pouvons
dfinir des bases orthogonales dans cet espace presque comme on le fait dans lespace
tridimensionnel.
Le chapitre suivant est consacr aux sries de Fourier, le premier exemple pratique
que nous verrons de bases dnombrables dans lespace des fonctions sur un intervalle
fini. Nous verrons entre autre comment cette base nous permet de rsoudre les qua-
tions classique de la physique comme celle de diffusion de la chaleur ou des cordes
vibrantes.
Nous avons souvent affaire des fonctions dfinies sur des intervalles infinis. Les
transformes de Fourier nous permettent de disposer de bases pour lespace de ces
fonctions. Comme souvent cependant, les infinis posent des problmes particuliers et
nous auront allors dfinir les distributions, une gnralisation des fonctions qui intro-
duit en mathmatique le concept de charge (ou force) ponctuelle si cher aux physiciens.
Nous verrons alors le nombre incroyable de problmes que ces nouvelles mthodes nous
permettent daborder : de la rsolution des quations diffrentielles celle dquations
stochastiques (comme le mouvement brownien) en passant par la diffraction par les
cristaux etc.
Le cousin germain des transformes de Fourier est la transforme de Laplace : nous
verrons comment lutiliser pour tous les problmes o les conditions initiales sont im-
portantes.

7
1 Introduction

Finalement, un complment utile tous ces outils est la mthode de Green (ou fonc-
tions de Green) qui nouveau a voir avec la gnralisation des charges ponctuelles :
si on connat leffet dune charge (ou dune force ou ...) ponctuelle, on peut alors facile-
ment calculer leffet dune distribution de charge (de force ...).
Nous allons revenir sur le concept gnral doprateur intgrodiffrentiel. Une rota-
tion ou une homothtie transforment de faon linaire un vecteur dans un autre. Un
oprateur diffrentiel linaire comme (t Dx2 ) fait la mme chose pour les fonc-
tions, considres comme des vecteurs dun grand espace. Nous savons qutudier une
application linaire est toujours beaucoup plus simple dans sa base propre. La mme
chose est vrai pour les vecteurs et valeur propres des oprateurs. Les transformes de
Fourier nous fournissaient une base trs particulire bien adapt certains problmes
de physique, nous verrons dautres bases comme celle des polynmes orthogonaux et
nous gnraliserons le calcul des oprateurs.
Quelques chapitres sont consacrs aux notions plus avances qui devront nanmoins
tre connues des tudiants la fin de leur Master. Nous abordons le calcul des perturba-
tions, outil indispensable ds que nous tentons la rsolution de vrai problmes, cest
dire ceux qui scartent un peu des exemples classiques que nous savons rsoudre.
Par exemple, nous savons rsoudre une quation diffrentielle dune certaine forme, le
calcul de perturbation nous permettra dobtenir une solution approche quand la forme
change lgrement.
Un chapitre est consacr aux calculs des variations qui est une gnralisation des
problmes dextremum lespace des fonctions et des fonctionnelles qui y agissent.
La plupart des problmes de physique sont formule dans ce langage ou gagne tre
formul dans ce langage.
Nous aborderons galement la thorie des formes diffrentielles. Souvent ces objets
sont enseigns dans le cadre de la thorie des tenseurs et vue comme des tenseurs al-
terns. Il est cependant beaucoup plus simple de les aborder directement et en donner
une image gomtrique, surtout que ce sont des objets trs simple manipuler et qui
donnent de la cohrence aux divers oprateurs diffrentiels comme le gradient, rota-
tionnel et divergence. Nous verrons comment certaines lois de la physique comme les
quations de Maxwell acquiert une signification gomtrique intuitive.
La thorie des tenseurs sera galement dans un chapitre. Nous nous contenterons
essentiellement des tenseurs dans un espace euclidien o il ny a pas faire de diffrence
entre les vecteurs et les covecteurs.
Enfin un petit chapitre est consacr aux nombres. Nous les manipulons depuis si
longtemps que nous avons oubli comment on les a construit. Ce chapitre tente de
remdier cet oubli.
Bon, suffisamment digress, voyons du concret.

8
2 lments danalyse fonctionnelle.
Les espaces vectoriels jouent un rle unificateur fondamental en mathmatiques.
Peut-tre cela rappelle au lecteur des souvenirs de matrices, de bases et de ses chan-
gements, ... Nous allons revoir tout cela de faon assez lgre mais surtout applique
lensemble extrmement vaste des fonctions. Nous allons voir que nous pouvons dcrire
les fonctions comme des vecteurs dans des espaces de dimensions infinies, en utilisant
pratiquement les mmes outils que pour des vecteurs trois dimensions. Cela sappelle
analyse fonctionnelle et a t formalis par Hilbert au dbut des annes 1900. Le reste
de ce cours sappuie constamment sur les rsultats de ce chapitre dont la lecture est
indispensable.

2.1 Les espaces vectoriels.


Quest ce quun espace vectoriel ? Nous connaissons dj certains ensemble c-
lbre comme celui des nombres rels R ou complexes C. On les appellera dans la suite
indiffremment lensemble des scalaires S. Un espace vectoriel est un ensemble E o
lopration + a un sens. Pas nimporte quel sens dailleurs, mais ce quon associe ins-
tinctivement 1 cette opration : (i) si a et b appartiennent notre ensemble, alors a + b
aussi ; (ii) a + b = b + a . En plus, multiplier un vecteur par un scalaire a un sens, qui
plus est, lui aussi trs naturel : si s, s1 , s2 S et a, b E, alors : (i) sa E ; (ii)
(s1 + s2 )a = s1 a + s2 a ; (iii) s(a + b) = sa + sb ; (iv) E possde un lment zro, quon
notera 0 2 tel que a+0 = a, a, 0 E. Noublions pas que quand on parle de sa, on parle
bien dun vecteur et non dun scalaire. Lensemble des maisons dune ville par exemple
na pas vraiment une structure despace vectoriel. Par contre, lensemble des vecteurs
dans un plan, lensemble des polynmes, ou lensemble des fonctions dfinies sur [0, 1]
ont une structure despace vectoriel. Lintrt majeur est que tout 3 ce que lon peut af-
firmer pour lun de ces ensembles (en rapport avec son caractre vectoriel) pourra tre
gnralis aux autres.

Bases despace vectoriel. Une base est lensemble de certains lments de notre
espace E qui nous permet de dcrire tout les autres. Pour tre plus rigoureux, supposons
que e1 , e2 , e3 , ..., ei E, soit une base. Dans ce cas, pour nimporte quel lment a de
1. un instinct forg par une douzaine danne dtude.
2. En caractre gras pour ne pas le confondre avec le 0 des scalaires.
3. Bon, il faut, de temps en temps, prendre des prcautions.

9
2 lments danalyse fonctionnelle.

P
E, on peut trouver des scalaires ( des chiffres donc) si tel que a = i si ei . On dit que
a est une combinaison linaire des vecteurs ei . Bien sr, il faut prendre le minimum
de ei qui rende cette description faisable. Pour cela, il suffit dexiger quaucun des ei
ne puisse tre une combinaison linaire des autres (on dit alors que ces vecteurs sont
linairement indpendant). Les scalaire si quon aura trouv pour la description de a
sont alors unique. On les appelle les composantes du vecteur a dans la base {e}.
Le grand intrt des bases est quelles nous permettent de manipuler les vecteurs
comme des collections de chiffres. Pour les vecteurs dans le plan, nous ne sommes pas
oblig de faire des dessins, nous pouvons les reprsenter par des doublets (x1 , x2 ) si
nous nous sommes fixs lavance deux vecteurs de rfrences. A partir du moment o
on peut reprsenter les objets par des chiffres, on peut pratiquement tout faire (hem).
Pour lespace vectoriel des polynmes, les polynmes 1, X, X 2 , ... constituent une
base. Une autre serait {1, (1 X), (1 X)2 , ...}. Bien sr, le choix de la base nest
pas unique. On peut cependant remarquer que lensemble des vecteurs du plan est de
dimension 2 (il suffit de deux vecteurs pour dfinir une base), tandis que lensemble
des polynmes est de dimension infinie. Ce nest pas une trs grande infinie, le nombre
dlments dans la base qui couvre les polynmes est le mme que celui des nombres
dans N. On dit alors que cest une infinie dnombrable 4 .
Quand est il de lespace des fonctions ? A priori, cest un espace dune trs grande
dimension. On verra par la suite que si on se donne quelques restrictions, on peut ga-
lement dfinir une base dnombrable pour cet espace. Cest un des thormes les plus
fascinants danalyse.

Le produit scalaire. On peut enrichir la structure despace vectoriel en rajoutant


dautres opration que le + et le produit par un scalaire. Lopration la plus utile dfi-
nir pour lAnalyse est le produit scalaire (quon appelle galement le produit intrieur).
Le produit scalaire est une opration qui, deux vecteurs, associe un scalaire 5 . Nous
noterons le produit scalaire de deux vecteurs (a, b). En physique, on a plus lhabitude


de le noter par

a . b , en mcanique quantique par ha| bi.
Nous sommes assez habitus depuis les annes du lyce avec ce concept. Un bon
produit scalaire doit avoir ces quelques proprits :
(i) (sa, b) = s(a, b) o s S, et a, b E.
(ii) (a + b, c) = (a, c) + (b, c). o a, b, c E.
(iii) (a, a) R et (a, a) > 0 si a 6= 0 et (a, a) = 0 si a = 0.
Par exemple,P
dans lensemble des vecteurs du plan, on peut dfinir un produit scalaire
par (a, b) = xi yi o xi et yi sont les composantes des deux vecteurs a et b.

4. Cest le plus petit des infinis. Sans rentrer dans les dtails, linfini qui ensuite est vraiment plus grande
que N est celui de R. Lensemble de toutes les fonctions est une infinie encore plus grande.
5. (., .) : E E S.Si lespace vectoriel est associ aux rels (complexes), le scalaire est un rel
(complexe).

10
2 lments danalyse fonctionnelle.

La proprit (iii) est trs intressante. Elle nous permet de dfinir la longueur dun
2
vecteur, quon appelle sa norme et que lon note kak = (a, a). Lintrt de pouvoir
disposer dune norme est immense. On peut par exemple savoir si deux vecteurs a, b
sont proches lun de lautre en regardant la norme de leur diffrence ka bk, ce qui
nous permet son tour de dfinir la notion de limite (souvenez vous, les blabla, blabla
tel que blablabla ...). Cela parat vident si lon parle des vecteurs dun plan, a lest
beaucoup moins quand on discute des espaces vectoriels plus riches comme celui des
fonctions. Est ce que par exemple, on peut dire que la fonction sin(.) et log(.) sont
proches ?
Nous avons besoin aussi de prciser la commutativit. Nous exigeons du produit
scalaire :
(iv) (a, b) = (b, a) si E est associ aux rels ;
(iv) (a, b) = (b, a) si E est associ aux complexes.
Par
P exemple, pour les vecteurs de C2 , on peut dfinir le produit scalaire de a, b par

i xi yi o xi , yi sont les composantes de a et b. Notez bien que lon doit multiplier la
composante de lun par le complexe conjugu de lautre si on veut respecter la proprit
(iii) et disposer dune norme 6 . La proprit (iv) ou (iv), combine la proprit (i) nous
donne :
(i) (a, sb) = s(a, b) si E est associ aux rels ;
(i) (a, sb) = s (a, b) si E est associ aux rels.

Lorthogonalit. Nous nous souvenons que pour les vecteurs dans Rn , deux vec-
teurs (6= 0) sont perpendiculaires (quon note a b ) ssi leur produit scalaire est nul.
Nous acceptons cette dfinitions pour tout espace vectoriel. On appelle une base or-
thogonale une base telle que tout ses lments soit perpendiculaire lun lautre. Nous
avons un avantage fantastique utiliser des bases orthogonales. Dabord, si les vec-
teurs e1 , e2 , ... sont orthogonale les uns aux autres, ils sont linairement indpendant.
Si notre espace vectoriel est de dimension n, il nous suffit donc de trouver n vecteurs
tous les uns aux autres et le tour est jou : nous disposons dune base !
On peut exiger encore plus dune base : quelle soit orthonorme, cest dire que la
norme de tous ses lments soit lunit. Si nous disposons dune base orthonorm, on
peut trouver les composantes dun vecteur quelconque de faonP extrmement simple :
si a est un vecteur et (e1 , ...en ) une base orthonorme, alors a = (a, ei )ei , cest dire
que la composante de a selon ei est (a, ei ). Comme exemple, prenez le cas des vecteurs
dans Rn .

6. Un exemple intressant de produit scalaire qui ne respecte pas (iii) est donn par la relativit restreinte.
On repre un vnement par ses quatre coordonnes spatiotemporelles (x, y, z, t) et le produit scalaire de
deux vnement est dfini par x1 x2 + y1 y2 + z1 z2 t1 t2 . Deux vnement distincts peuvent donc tre
distance nulle lun de lautre.

11
2 lments danalyse fonctionnelle.

Exercices.
2.1 Dmontrer que les deux vecteurs (1, 0) (0, 1) forment une base pour lespace vectoriel C2
associ C. Mme chose pour les deux vecteurs (i, 0) et (0, i).

2.2 Dmontrer que si ka bk = 0, alors a = b.


P
2.3 Dmontrer que pour lespace des matrices nn, ai,j bi,j est un produit scalaire. Ce pro-
duit scalaire est souvent utilis en analyse matricielle numrique pour lvaluation de la stabilit
des mthode itratives.

2.4 Dmontrer que si n vecteurs sont mutuellement orthogonaux, alors ils sont linairement
indpendants.

2.5 Dmontrer que si {e1 , ..., en } est une base orthonorme, alors nimporte quel vecteur a
peut scrire sous la forme
X n
a= (a, ei )ei
i=1

Comment doit on modifier cette formule si la base est simplement orthogonal, mais pas ortho-
norme ?

2.6 En ralit, une norme pour pouvoir lgalement porter ce nom, doit respecter lingalit
triangulaire :
ka + bk kak + kbk
Dmontrez que la norme dfinie par le produit scalaire vrifie cette ingalit. Pour cela il faut
dabord dmontrer lingalit de Cauchy-Schwarz :

|(a, b)|2 k ak.kbk

quon peut assez facilement dmontrer en considrant le produit (a + b, a + b) 0.

2.7 Pouvez vous gnraliser le produit scalaire dans Rn lespace des polynmes ? Et surtout
dmontrer quil respecte toutes les proprits dun produit scalaire ?

2.8 Un oprateur linaire est une fonction linaire de lespace vectoriel dans lui mme : il
prend un vecteur en entre et produit un vecteur en sortie. La linarit veut dire que si L est un
oprateur linaire, a, b deux membres quelconques de lespace vectoriel et , deux scalaires,
alors
L(a + b) = L(a) + L(b)
(Noublions pas que L(a) et L(b) sont des vecteurs au mme titre que a et b). Si on se donne
une base {ei }, loprateur peut tre caractris par son action sur chaque vecteur de la base :
X
L(ej ) = Lij ei
i

Les nombres Lij sont les composantes de lapplication L dans la base des {ei }. En gnral, pour
les reprsenter, on les dispose dans un tableau (appel matrice) o la ime ligne et la jme
colonne contient le nombre Lij .

12
2 lments danalyse fonctionnelle.

Dmontrez que les composantes de deux vecteurs quelconque a et b tel que b = L(a) sont reli
par la relation (noter lordre des sommations)
X
bi = Lij aj
j

2.9 Dmontrer alors que si la base est orthonormale,

Lij = (ei , L(ej ))

En langage claire, pour connatre la composante Lij dune matrice, il faut trouver dabord le
vecteur qui rsulte de lapplication de loprateur au jme vecteur de la basep = L(ej ), et
former le produit scalaire de ce vecteur avec le ime vecteur de la base.

2.10 Soit deux bases {ei } et {fi } et P une application linaire tel que

P (ei ) = fi i = 1, 2, ..., n
1
P (fi ) = ei

P est couramment appel lapplication de passage. Soit A une application linaire quelconque
dont les lments dans la base des {fi } sont donnes par la matrice aij . Soit maintenant lap-
plication linaire P 1 AP . Calculer ses lments de matrice dans la base des {ei }.

2.2 Lespace vectoriel des fonctions.


Manipuler des vecteurs dans lespace Rn cest bien, mais nous nous intressons un
espace beaucoup plus vaste, celui des fonctions. Soit F lensemble des fonctions R R
dfinies sur un intervalle donne I. Les fonctions sont en faite des boites noire qui
prennent des chiffres en entre et produisent des chiffres en sortie. La fonction sin(.) par
exemple, une valeur x I associe le nombre sin x. On peut voir les fonctions comme
des points dans un espace immensment grand o en se baladant, on rencontrerai de
temps en temps des fonctions connues comme log(.), exp(.), exp(2.) et la plupart de
temps des fonctions qui nont pas de nom 7 .

Le produit scalaire. Il est vident que F possde une structure despace vectoriel.
On ne sait pas encore si nous pouvons tendre la notion de base cet espace, mais on
peut parfaitement dfinir des produits scalaires. Le produit scalaire que lon utilisera
abondamment est le suivant :

(f, g) = f (x)g(x)dx
I

7. En faite, si on se baladait dans cet espace de faon alatoire, on ne rencontrerai jamais des fonctions
connues.

13
2 lments danalyse fonctionnelle.

On dmontrera dans un exercice que ce produit scalaire a toute


P les bonnes proprits.
Mais on peut noter que cette dfinition gnralise la somme xi yi du produit scalaire
dans Rn , quand n (souvenez vous de la dfinition de lintgral).
Bien, nous disposons dun produit scalaire, on peut donc dfinir la norme dune fonc-
tion.
kf k = [f (x)]2 dx
2
I
Cette norme, appele L2 , est trs populaire. voyons quelques exemples, pour lintervalle
[0, 2],
2 2
1. kexp(.)k = 0 exp2 (x)dx = (exp 4 1)/2.

2. ksin(.)k =
3. klog(.)k =??? faire en exercice.
4. k1/(.)n k = si n > 1.
On voit ici les premires bizarreries des ces grands espaces ( de dimension infini) appa-
ratre : un lment priori sympathique peut avoir une norme infinie.
Le lecteur a remarqu que jusque l, nous avons utilis une notation particulire pour
distinguer une fonction (un point dans lespace vectoriel des fonctions) de la valeur
que prend cette fonction pour une entre particulire : la premire est note f (.) est la
deuxime f (x). Comme cette notation est quelque peu lourde et que nous esprons que
le lecteur est maintenant habitu cette distinction, nous emploierons partir de main-
tenant indiffremment la notation f (x) pour les deux notions. Le contexte dtermine
si on parle de la fonction ou de sa valeur.
Nous avons mentionn plus haut que disposer dune norme nous permet de savoir
si deux fonctions sont proches ou mme identique si kf gk = 0. Considrons alors
les deux fonctions, dfinies sur [0, 1] : f (x) = 1 et g(x) = 1 si x 6= 0 et g(x) = 0 si
x = 0. Au sens de notre norme L2 , ces deux fonctions sont identiques 8 ! Grossirement
parlant, notre norme est une lunette pas trop prcise et ne distingue pas les diffrences
subtiles entre deux fonctions. Elle ne va retenir que les traits les plus importants 9 . Ainsi,
quand n , la suite des fonctions fn (x) = xn converge vers f (x) = 0 sur linter-
valle [0, 1] au sens L2 , mais ne converge pas au sens des convergences uniformes.
Notons enfin que si nous manipulons lensemble des fonctions qui associent une
valeur relle un nombre complexe, i.e. f : R C, nous devons lgrement modifier la
dfinition du produit scalaire :

(f, g) = f (x)g(x) dx
I
o le symbole dsigne le complexe conjugu.
8. Cest mme pire : Si la fonction g est dfinie par g(x) = 0 si x Q et g(x) = 1 sinon, au sens de
notre norme, elle est identique la fonction f . Bien sr, on aurait besoin de redfinir ce que lon entend par
une intgrale.
9. Il existe bien sr des normes aux pouvoirs de rsolutions beaucoup plus grande, comme celle utilise
pour la convergence uniforme des suites de fonctions.

14
2 lments danalyse fonctionnelle.

Lorthogonalit. La notion dorthogonalit se gnralise immdiatement aux fonc-


tions : f et g (6= 0) sont orthogonales si (f, g) = 0. Ainsi, sur lintervalle [1, 1], les
fonctions 1 et x sont orthogonales. De mme pour les fonction exp(x/2) et exp(x/2)(1
x) sur lintervalle [0, ].
Nous avons vu plus haut que la notion dorthogonalit nous donne un srieux coup
de main pour trouver une base. En particulier, dans un espace de dimension n, il nous
suffit de trouver n vecteurs orthogonaux pour avoir une base. Peut on gnraliser ce
rsultat des espaces de dimension infinie ? la rponse est oui si on prend des prcau-
tions. Les fonctions de normes infinies nous posent de srieux problmes. Nous allons
donc restreindre notre espace de fonctions ennous contentant des fonctions de carr
sommable, cest dire des fonction f tel que I |f (x)|2 dx < . Nous avons alors le
thorme fondamental suivant :
Dans lespace des fonctions de carr sommable, on peut trouver des en-
sembles infini dnombrable de fonctions orthogonaux qui chacun constitue
une base.
Le lecteur peut mditer sur ce thorme : pour lnoncer ( sans le dmontrer ) nous
avons pris de nombreux raccourcies sans mme avoir prcis certains termes, encore
moins leur donner un peu de rigueur et de dcence. Nous allons dans la suite clarifier
un peu mieux les choses, sans les dmontrer. Mais avant cela, voyons le ct trange
de ce thorme.
Comme nous lavons indiqu, linfini dnombrable, celui des nombres entiers, est
le plus petit des infinis. Il a cette particularit que pour un nombre donn, on peut
indiquer celui qui est juste avant et celui qui est juste aprs. Linfini des nombres ra-
tionnels nest pas vraiment plus grand, ni celui des nombres algbriques. Par contre,
linfini des nombre rels est vraiment plus grand. On peut dire grossirement 10 que
R = 2N (bien sr, on parle en faite du cardinal, de la taille, de ces ensembles) : pour
reprsenter un nombre rel, nous avons absolument besoin de N nombre entier. Len-
semble des fonctions est beaucoup, beaucoup plus vaste. Imaginez que pour reprsenter
une seule fonction, nous avons besoin de R nombre rel. Le thorme ci-dessus nous dit
que si la fonction est de carr sommable, nous navons alors besoin pour la reprsenter
que de N nombre rel ! Une exigence a priori anodine, que les fonctions soient de carr
sommable, rduit srieusement la taille de lensemble des fonctions.
Aprs ces digressions philosophiques, un peu de concret. Dabord, quest ce que a
veut dire une base dans ces espaces infinis ? intuitivement, a doit tre la mme chose
que les espaces de dimensions fini : un ensemble dobjet lmentaire qui nous permet
de dcrire tous les autres. Supposons que, dans lespace des fonctions, E = {e1 , e2 , ...}
constitue une base orthonorme. Dans ce cas, une fonction quelconque f doit pouvoir

10. le cardinal de N est not 0 (aleph zro), celui de R 1 si on accepte laxiome de choix. En pensant
aux nombres rels entre 0 et 1 comme une succession (infinie ) de bits 0 et 1 (comme en informatique), la
relation 1 = 20 parat assez raisonnable. Nous devons tous ces rsultats sur les infinis aux travaux de
Georg Kantor, la fin du dix-neuvime sicle.

15
2 lments danalyse fonctionnelle.

scrire, de faon unique,



X
f (x) = fn en (x)
n=1

o les fn sont des scalaires quon appelle les composantes de f sur la base {en }. Elle
sont donnes, comme pour des espaces de dimensions finis, par la projection de f sur
les vecteurs de base en utilisant le produit scalaire :

fn = f (x)en (x)dx
I

Remarquez que fn est bien un nombre, un scalaire. On peut dfinir une suite de fonc-
PN
tions N (x) = i=1 fn en (x). Si lensemble E est bien une base, alors kf N k 0
quand N . Cela veut dire quon peut approximer une fonction par une somme finie
de fonctions de base, et on peut rendre cette approximation aussi bonne quon le sou-
haite en prenant suffisamment de composante. Le lecteur est dj partiellement habitu
cette ide : le dveloppement de Taylor approxime une fonction par la combinaison
des fonctions xn . Lespace des fonctions qui peuvent tre couvert par un dveloppement
de Taylor est cependant beaucoup plus petit que L2 . Les mathmaticiens ont t amen
trouver donc dautres bases. Chaque base est bien adapt aux traitements dun certain
nombres de problmes, essentiellement la rsolution dune certaine classe dquations
diffrentielles. La base la plus populaire, est de loin, est celle propose par monsieur
Fourier, prfet de lIsre en son temps, au tout dbut du XIXme sicle. Ce sera lobjet
du prochain chapitre.

Exercices.
2.11 Donner une dfinition prcise de la convergence dune suite au sens de la norme L2 dans
lespace des fonctions de carr sommable.

2.12 montrer que la fonction f (x) = xn dfinie sur [0, 1] converge vers la fonction g(x) = 0
au sens L2 .

2.13 Dmontrer que la convergence uniforme implique la convergence au sens L2 . Lexemple


prcdent montre bien sr que le contraire nest pas vrai.

2.14 En algbre linaire, les formes bilinaires gnralisent le concept du produit scalaire. On
peut suivre le mme chemin et dfinir le produit scalaire entre deux fonctions par

(f, g) = w(x)f (x)g(x)dx
I

o la fonction w(x)est appel le poids. Dmontrer que cette dfinition possde les proprits
dun produit scalaire. Que doit on imposer la fonction poids ?

16
2 lments danalyse fonctionnelle.

2.15 On appel polynmes orthogonaux des polynmes Pn (x) de degrs n, orthogonaux les
uns aux autres au sens du produit scalaire dfini plus haut. Trouver les trois premiers polynmes
associs au poids w(x) = 1 et lintervalle [1, 1]. On appelle ces polynmes les polynmes de
Legendre.

2.16 Dmontrer que les polynmes de Legendre que vous avez trouv obissent lquation
diffrentielle
(1 x2 )y 00 2xy 0 + n(n + 1)y = 0
En ralit, cest souvent pour cela que lon cherche les polynmes orthogonaux : ils sont solution
dquations diffrentielles intressante pour la physique.

2.17 Mme question que 5 pour le poids w(x) = ex et lintervalle [0, [. Ces polynmes (
de Laguerre) sont associs la solution de lquation de Schrdinger pour latome dhydrogne.

2.18 Lopration D = d/dx est une opration linaire dans lespace des fonctions infiniment
drivable (C ) : (i) elle prend une fonction en entre et donne une fonction en sortie ; (ii) elle
fait cela de faon linaire, i.e. D(f + g) = Df + Dg, o , sont des scalaires et f, g des
fonctions. Supposons que des fonctions orthonormes fn (x) constituant une base obissent
la relation dfn (x)/dx = fn (x) + an fn+1 (x). Pouvez-vous donner la reprsentation matricielle
de D dans la base des fn ?

2.3 Quelques digressions historiques.


Le concept despace vectoriel des fonctions a t propos par Hilbert la fin du dix-
neuvime et dbut du vingtime sicle et a unifi de nombreux champs de recherches en
mathmatique. La rsolution des quations intgrales pouvait par exemple tre ramen
la recherche des valeurs propres de certaines matrices. La rsolution dun systme
dquations diffrentielles de premier ordre pouvait tre donn directement comme
lexponentiel dune matrice, ... Nous npuiserons pas par quelques exemples lapproche
profondment novatrices dHilbert. Ce champ de recherche tait cependant mconnu
des physiciens. Au dbut des annes 1920, Heisenberg et ses collgues ont invent une
mcanique matricielle (qu Einstein qualifia de cabalistique dans une lettre Planck)
pour expliquer les phnomnes observs la petite chelle des atomes et des lectrons.
Quelques annes plus tard, Schrdinger a propos sa clbre quation donde, qui elle
aussi expliquait assez bien les phnomnes observs. Cest Von Neumann qui a d-
montr la fin des annes 1920 que ces deux approches taient fondamentalement les
mmes (voir exercice 8 plus haut) : lquation de Schrdinger utilise un oprateur dans
lespace des fonctions de carr sommable ( qui transforme une fonction en une autre
fonction, comme une matrice qui transforme un vecteur dans un autre vecteur ), donc
associ une matrice infinie. Depuis, les grands succs de la mcanique quantique ont
encourag les physiciens assimiler ces concepts ds leur plus tendre age, ce qui les
aide traiter de nombreux champs de recherches autres que la mcanique quantique
par les mme techniques.

17
3 Les sries de Fourier.
Nous allons dans ce chapitre tudier les Sries de Fourier. On ne peut pas srieuse-
ment toucher un sujet de physique sans utiliser dune manire ou dune autre ces sries
(ou leur gnralisation, les transformes de Fourier). Nous en verrons de nombreux
exemples travers ce cours. Les sries de Fourier ont galement jou un grand rle
dans le dveloppement des mathmatiques. Quand Joseph Fourier prsenta la premire
fois le rsultat de son analyse de lquation de la chaleur lAcadmie des Sciences,
laccueil tait loin dtre enthousiaste et beaucoup, parmi les plus grands ( Laplace et
Lagrange ) sy sont violemment oppos : Comment la somme dune suite de fonctions
toutes continues peut tre gale une fonction discontinue ? Le pragmatisme a fait
avancer lusage des ces suites bizarres jusqu ce que dautres mathmaticiens comme
Lebesgue (pour justifier ces pratiques un peu sales) redfinissent la thorie de la mesure
et fassent faire un bond lanalyse mathmatique. De tout cela, on ne parlera pas ici.
Notre approche sera beaucoup plus pratique : Quest ce quune srie de Fourier, quoi
elle sert, comment on fait pour lobtenir.

3.1 Introduction.
Les premiers travaux sur la dcomposition en srie de Fourier viennent en faite du
grand Lagrange lui mme dans les annes 1780 et son tude de lquation des cordes
vibrantes. Supposons une corde tendu entre 0 et L quon dforme linstant initial
et que lon relche. Soit y(x, t) lcart lquilibre la position x et linstant t. On
dmontre alors que
2y 2
2 y
v =0 (3.1)
t2 x2
o v est un coefficient qui dpend de la densit et de la tension de la ligne. Cher-
chons la solution de cette quation sous la forme y = Ak, cos t. sin kx. En injec-
tant cette forme dans lquation (3.1), on trouve que cette forme ne peut tre une so-
lution que sil existe une relation entre et k : = vk. Ensuite, la fonction y doit
satisfaire les conditions aux bords y(0, t) = y(L, t) = 0. La premire condition est
automatiquement satisfaite. La deuxime condition impose sin kL = 0, cest dire
k = n/L, o n = 0, 1, 2, 3, ....On dduit de tout cela que les fonctions fn (x, t) =
An cos(nvt/L) sin(nx/L) sont solution de notre quation donde avec ses condi-
tions aux bords. On les appelle les modes propres de vibration. Le principe de super-
position nous dit (le dmontrer) que si f et g sont solution, alors f + g lest aussi. La

18
3 Les sries de Fourier.

solution gnrale de lquation donde (3.1) est donc de la forme



X
y= An cos(nvt/L) sin(nx/L)
n=1

Jusque l, nous navons rien dit des coefficients Ak , puisquils ne peuvent pas tre obte-
nus de lquation donde directement. Ils doivent sortir de la condition y(x, 0) = y0 (x),
cest dire de la dformation originale que nous avons imprim notre corde linstant
t = 0. Nous devons donc avoir :

X
y0 (x) = An sin(nx/L)
n=1

Est-il possible de trouver des coefficient An pour satisfaire cette quation ? Nous ver-
rons la rponse plus bas. A priori, trouver la rponse parat assez complique. Notons
que si y0 a une forme simple, on peut trouver une solution. Par exemple, si y0 (x) =
4 sin(11x/L), alors A11 = 4 et tous les autres An sont nul.

3.2 Les sries de Fourier.


Nous allons tudier maintenant de faon approfondie les fonctions sin et cos, puis-
quelles peuvent constituer une base. Plus prcisment,

Thorme. Dans lespace vectoriel L2 [0, L], cest dire celui des fonctions de carr
sommable dfinies sur lintervalle [0, L], les fonctions

1, sin(2x/L), cos(2x/L), ... sin(2nx/L), cos(2nx/L), ...

constituent une base orthogonale.


Nous accepterons ce thorme sans dmonstration 1 , et allons plutt contempler
quelques uns de ses aspects. Dabord, lorthogonalit. Puisque
L
L L
(1, sin n(.) ) = sin(2nx/L)dx = [cos(2nx/L)]0 = 0
0 2n

la fonction 1 est orthogonale tous les sinus et tous les cosinus. Ensuite, comme

2 sin(2nx/L) sin(2mx/L) = cos(2(n m)x/L) cos(2(n + m)x/L)

1. La dmonstration est due Weierstrass dans les annes 1880. Elle ne pose pas de difficult majeure.
Disons que pour quune suite fn de vecteurs orthogonaux constitue une base, il faut que si un lment g
est orthogonal tous les fn , alors g = 0. Cest pour cela par exemple que la suite des sin(.) seul ne peut
constituer une base : on peut trouver toujours des cos(.) qui soit orthogonaux tous les sin(.).

19
3 Les sries de Fourier.

les fonctions sin n(.) et sin m(.) sont orthogonales, sauf si n = m, auquel cas, k sin n(.)k =
k cos n(.)k = L/2.
Ensuite, une fonction f quelconque de L2 [0, L] peut scrire sous la forme

X
f (x) = a0 + an cos(2nx/L) + bn sin(2nx/L)
n=1

et comme notre base est orthogonale, les coefficient an et bn sont donns par le produit
scalaire de f par les lments de la base :
L
a0 = (1/L) f (x)dx (3.2)
0
L
an = (2/L) f (x) cos(2nx/L)dx (3.3)
0
L
bn = (2/L) f (x) sin(2nx/L)dx (3.4)
0

Notons que le coefficient a0 est la moyenne de la fonction f sur lintervalle donne.

Exemple 3.1 Prenons la fonction f (x) = x , x [0, 1].


Le coefficient a0 sobtient facilement en utilisant leq.(3.2) : a0 = 1/2. Pour les autres
coefficients, nous avons besoin dune intgration par partie :
1 1
1 x=1 1 1
bn = 2 x sin(2nx)dx = [x cos(2nx)]x=0 + cos(2nx)dx =
0 n n 0 n
1 1
1 x=1 1
an = 2 x cos(2nx)dx = [x sin(2nx)]x=0 + sin(2nx)dx = 0
0 n n 0
Nous pouvons donc crire

1 X 1
x= sin(2nx) x [0, 1] (3.5)
2 n=1 n

La figure 3.1 montre la fonction x, ainsi que ses approximations successives en prenant
de plus en plus de termes de la srie de Fourier. . Nous pouvons constater plusieurs
choses : (i) videmment, plus on prend de terme, plus lapproximation est bonne , mais
nous avons des oscillations de plus en plus violentes sur les bords, dont lamplitude
dcrot ; (ii) lapproximation prend les mmes valeurs aux deux bords, ce qui nest pas
le cas de la fonction originale ; (iii) cette valeur est 1/2 dans le cas prsent, ce qui est la
moyenne des valeurs que prend la fonction originale aux deux bords.

20
3 Les sries de Fourier.

1
n=0 n=1 n=2
0.5

0
1
n=4 n=8 n=32
0.5

0
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

Figure 3.1 Approximations successive de la fonction x par les sries de Fourier. En


noir, la fonction original, en rouge lapproximation par la srie gom-
trique.

Le point (ii) est d la priodicit de nos fonctions sin et cos : chaque fonction dans la
somme, tant de priode au moins 1, prend obligatoirement la mme valeur sur les deux
bords, donc la somme doit galement prendre la mme valeur sur les deux bords. Le
point (iii) est plus troublant : la fonction originale f (x) = x prend la valeur 0 en x = 0
et 1 en x = 1. La somme par contre, prend la valeur 1/2 sur les deux bords : la somme
ne converge donc pas en tout point vers la fonction originale (adieu la convergence
uniforme ou point par point), mais seulement pour la majorit des points sur lintervalle.
Ils se trouvent que cette majorit est largement suffisante : si on prend une infinit de
terme dans la somme, alors la somme et la fonction originale ne diffrent quen deux
points. Deux compar la taille de R donne tous son sens la notion de majorit. On
dit que la diffrence entre la fonction originale et la srie est de mesure nulle.
Tout ce que nous avons dit ci-dessus se gnralise immdiatement aux intervalles
quelconques [a, b]. Il suffit simplement dans les formules, poser L = ba qui reprsente
comme avant la longueur de lintervalle.

Exemple 3.2 Prenons cette fois la mme fonction f (x) = x, mais sur lintervalle
[1/2, 1/2].
Le mme calcul que prcdemment nous mne

X (1)n 1 1
x= sin(2nx) x [ , ] (3.6)
n=1
n 2 2

21
3 Les sries de Fourier.

Nous voyons que les coefficients dpendent galement de lintervalle sur lequel la fonc-
tion est dfinie.
Notons enfin quen prenant des valeurs de x particulires, nous disposons dun moyen
intressant de trouver la limite de certaines sommes. Dans lquation (3.5) par exemple,
si on pose x = 1/4, nous trouvons que

X (1)n+1 1 1
= 1 + ... =
n=1
2n 1 3 5 4

galit de Parceval. En utilisant la notion dorthogonalit et de produit scalaire, il


est facile de dmontrer que

1 L 1X 2
f (x)2 dx = a20 + (a + b2n ) (3.7)
L 0 2 n=1 n

Cela veut dire quau lieu de calculer explicitement lintgrale du carr de la fonction,
nous pouvons simplement sommer le carr de ses coefficients de Fourier. A priori, la
dmarche parat absurde, puisque pour calculer les coefficient, on a du dj effectuer
des intgrales. Mais nous allons voir dans la suite que dans de nombreuses applications,
notamment celles lies la solution dquation drive partielle, nous calculons direc-
tement les coefficients de Fourier de la fonction recherche. Le cot gauche de lqua-
tion (3.7) dsigne souvent lnergie stock dans un volume, par exemple si f dsigne la
hauteur dune corde tendu ou le champs lectrique. Lgalit de Parceval nous permet
alors daccder cette quantit.

Exercices.
3.1 Dcomposez les fonction f (x) = x2 et f (x) = exp(x) sur lintervalle [0, 1]. Pour ce
ix ix
P que cos(x) = (e + e )/2. Profiter
dernier, si le produit scalaire vous pose problme, noter
de la dcomposition de x2 pour trouver la limite de 1/n2 . Ctait une des fiert dEuler, dans
les annes 1730, que davoir pu dterminer cette somme.

3.2 Soit la fonction palier f sur [0, 1] tel que f (x) = 1/2 si x < 1/2 et f (x) = 1/2 si x
1/2. Trouver sa dcomposition en srie de Fourier.

3.3 Mme question que prcdemment, mais la fonction f est dfinie par f (x) = 0 si x < 1/2
et f (x) = 1 si x 1/2. En comparant ce rsultat au rsultat prcdent, pouvez en tirer des
conclusions gnrales ?

3.4 Dcomposer la fonction triangle, f (x) = 1 2 |x| sur lintervalle [1/2, 1/2].

3.5 Trouver la srie de Fourier de sin(x/2) sur lintervalle [0, 2].

3.6 Dmontrer qu part le coefficient a0 , les deux fonctions f (x) et g(x) = f (x) + C ont les
mmes coefficients de Fourier. Que vaut le coefficient a0 pour ces deux fonctions ?

22
3 Les sries de Fourier.

3.7 Dmontrer que si f (x) est une fonction Lpriodique, sa dcomposition en srie de fou-
rier sur lintervalle [h, L + h] ne dpend pas de h. Help : vous pouvez utiliser la proprit des
L+h 0 L L+h
intgrales h = h+ 0 + L .

3.8 Une fonction paire est tel que f (x) = f (x), cest dire que laxe y constitue un axe
de symtrie. Dmontrer alors que sur un intervalle [L, L], les coefficients bn de la srie de
Fourier sont nuls. On peut gnraliser cette affirmation : si la fonction f , sur lintervalle [0, L], est
symtrique par rapport son milieu, cest dire telle que f (L x) = f (x), alors ses coefficient
de Fourier bn sont nuls ( dmontrer bien sr).

3.9 Que peut on dire des coefficient de Fourier dune fonction impaire ? En vous inspirant des
deux prcdents problmes, que pouvez vous dire des coefficients de Fourier, sur [0, L], dune
fonction telle que f (L x) = C f (x) ?

3.10 Quelle est la condition pour que la fonction x appartiennent L2 [0, 1]. Dmontrer alors
que si elle nappartient pas L2 [0, 1], elle ne peut pas se dcomposer en srie de Fourier. Pouvez
vous gnraliser ce rsultat ?

3.11 Dmontrer lgalit de Parceval.

3.12 Quelle est la reprsentation matricielle de loprateur D = d/dx dans la base de Fou-
rier ? Et celle de D2 = d2 /dx2 ?

3.3 Pourquoi les sries de Fourier sont intressantes ?


La base de Fourier est en fait trs bien adapt pour tudier les phnomnes oscil-
latoires, et ces derniers sont abondants dans la vie de tous les jours : le mouvement
dun camion sur un pont gnre des vibrations dans toute la structure de ce dernier ; le
mouvement des pistons dans le moteur met la voiture en vibration ; une onde lectroma-
gntique provoque loscillation des lectrons la surface du mtal,...Nous ne pourrions
pas traiter ces problmes si nous ne disposions pas de la base de Fourier. Voyons cela
ce plus prs.
Soit une fonction f priodique, de priode L. Cela veut dire que f (x + L) = f (x).
Pour connatre cette fonction, il suffit donc de connatre sa valeur seulement sur un in-
tervalle de longueur L. Or, les fonctions sin(2nx/L) et cos(2nx/L) sont galement
priodiques, et de la mme priode L. Donc, si une somme de ces fonctions gale la
fonction f sur une intervalle de longueur L, elle gale la fonction f partout !
Comme nous le savons, si ces fonctions sont de carr sommable sur une priode,
elle peuvent se dcomposer en srie de Fourier. Reprsenter leurs coefficients de Fou-
rier an et bn en fonction de n est aussi bien que de les reprsenter en fonction de x.
Cette reprsentation est appel le spectre dune fonction, et ses composantes de Fou-
rier les harmoniques. Cest un vocabulaire issue de la musique. La figure 3.2 reprsente
le spectre de la fonction f (x) = x sur [1/2, 1/2]. En ralit, pour des raisons
p que
nous verrons plus tard, on nest mme intress quaux coefficients sn = a2n + b2n

23
3 Les sries de Fourier.

0.2

0.1

0
bn

-0.1

-0.2

-0.3

-0.4
0 5 10 15 20
n

Figure 3.2 Le spectre de la fonction x sur [-1/2,1/2]

et cest ce dernier quon appelle couramment le spectre. Ce qui distingue le Do 240 Hz


du piano de la mme note dune flte nest pas leurs frquence de base, mais lampli-
tude de leurs harmoniques (la forme de leur spectre). On appelle cela le timbre dun
instrument. Loreille une capacit fantastique distinguer les timbres, et les meilleurs
synthtiseur doivent sommer plus dune vingtaine dharmonique pour pouvoir imiter
une note dun vrai instrument.
Loreille humain dailleurs ne fait que dcomposer les sons en leurs harmoniques :
la forme intrieure de loreille fait quune vibration pure (sinusodale) de frquence
donne met une rgion particulire de loreille en oscillation, ce qui stimule les neurones
cet endroit. Chaque harmonique dun son excite donc une rgion diffrente de loreille,
et la carte de ces rgions permet au cerveau de dterminer trs prcisment la nature
du son et distinguer ainsi le piano du violon.
La compression JPEG des photos numriques utilise le principe des transformes de
Fourier : une image est divise en plusieurs rgions et les composantes de Fourier de
chaque sous rgions sont calcules, mais seulement lamplitude des premires harmo-
niques sont conserves, puisque lil humain nest pas sensible aux petits dtails.

Exercices.
Reprsenter le spectre des fonctions dcomposes plus hauts.

3.4 Un peu de gnralisation.


Nous avons manipuler plus des sinus et des cosinus sparment. Mais ces deux fonc-
tions ne sont que des combinaisons dexponentiel darguments imaginaires. Il serait
donc tout aussi logique de choisir comme base les fonctions exp(2inx/L). Cela en plus

24
3 Les sries de Fourier.

nous largit un peu les horizons, puisquon peut alors tudier les fonctions f : R C
(pourvu quelles soient de carr sommable). Noublions pas cependant que le produit
scalaire sobtient dans ce cas un intgrant une fonction qui multiplie le complexe conju-
gu de lautre. Nous avons donc,
+
X
f (x) = cn exp(2inx/L)
n=

Tous ce que nous avons dit plus haut se gnralise aisment.

Exercices.
3.13 En vous inspirant du calcul des coefficient an et bn , expliquer comment on calcule les
coefficients cn .

3.14 Dmontrer que si f (x) R, alors cn = cn .

3.15 Trouver la relation entre an , bn et cn .

3.16 noncer la relation de Parceval avec les coefficients cn .

3.5 Les sries de sinus et de cosinus.


Nous avons vu que sur lintervalle [0, L], les fonctions 1, sin(n2x/L), cos(n2x/L)
(n N) constituent une base orthogonale quon appelle la base de Fourier : ces fonc-
tions sont orthogonales les unes aux autres, et la suite est complte. Cette dernire as-
sertion est quivalente il nexiste pas de fonction, part celle uniformment nulle,
qui soit orthogonale toutes les fonctions de la base de Fourier. Est-il possible de
trouver une autre base sur lintervalle [0, L] seulement compose de fonctions sinus
ou seulement compose de fonction cosinus ? La rponse est oui : la suite des fonc-
tions sin(nx/L) (remarquer la disparition du coefficient 2 dans largument ) gale-
ment constitue une base, de mme que la suite cos(nx/L). Le choix dune base plutt
que dune autre est seulement dict par le problme que nous avons rsoudre, nous
en verrons un exemple plus bas.

Les sries de sinus. Prenons dabord une fonction f (x) dfinit sur [L, L] (un in-
tervalle de longueur 2L donc). Sa srie de Fourier est donne par
X nx nx
f (x) = a0 + an cos + bn sin
n=1
L L

25
3 Les sries de Fourier.

1.5
(a) (b)
1

0.5

-0.5

-1
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7

Figure 3.3 Comparaison des trois premires fonction de la base de fourier (a) et celle
des sinus.

et ses coefficients de Fourier sont


+L
an = (1/L) f (x) cos(nx/L)dx
L
+L
bn = (1/L) f (x) sin(nx/L)dx
L

Supposons maintenant que la fonction f est impaire, cest dire f (x) = f (x). En
crivant les intgrales ci-dessus comme la somme de deux intgrales (de L 0 et de 0
L) il est alors vident que tous les coefficient an sont nuls, et les coefficients bn sont
donnes par
L
bn = (2/L) f (x) sin(nx/L)dx (3.8)
0

Considrons maintenant une fonction f (x) dfinit sur [0, L]. On peut toujours trou-
ver une extension g de f telle que sur lintervalle [0, L] les deux fonctions concident
(g(x) = f (x) ) et que sur lintervalle [L, L], la fonction g est impaire. Il est donc
vident que sur lintervalle [0, L], nous pouvons dvelopper f en srie de sinus seule-
ment X nx
f (x) = bn sin
n=1
L

o les coefficients bn sont donns par la relation (3.8). La figure (3.3) montre les trois
premiers vecteurs de la base de Fourier et de la base des sinus.

Exercice.
3.17 Dvelopper de faon analogue le dveloppement en srie de cosinus pur dune fonction
sur lintervalle [0, L] en considrant les fonction paires sur lintervalle [L, L].

26
3 Les sries de Fourier.

3.18 Dmontrer que les fonction sin(nx/L) sont orthogonales les unes aux autres sur lin-
tervalle [0, L], et que lon ne peut pas trouver une fonction cos(kx) qui soit orthogonale toutes
ces fonctions. Cela pourrait un peu plus nous convaincre de la compltude de cette suite.

3.6 Vibration dune corde.


Les problmes de vibration sont une des raisons du succs de lanalyse de Fourier.
Nous traitons le cas de la corde vibrante, mais beaucoup dautres problmes ondu-
latoires comme le champs lectromagntique ou les ondes lastiques se traitent par
exactement les mmes mthodes. Revenons lquation dune corde vibrante que nous
avons mentionn au dbut de ce chapitre, et traitons le laide de lartillerie que nous
avons dvelopp. Comme nous lavons dit plus haut, nous considrons une corde las-
tique dont (i) les deux extrmits sont fixes aux points x = 0 et x = L ; (ii) est soumise
une tension T ; (iii) a une densit linaire . Si nous reprons la hauteur de la courbe
par y(x), lquation dvolution de y scrit

2y 2y
2
= v2 2 (3.9)
t x
Nous ne justifions pas cette quation. Notons simplement que le membre de droite est
lacclration dun lment infinitsimal de la corde (dans le sens vertical) au point x, et
que le membre de droite est proportionnel la force exerce sur cet lment par ses voi-
sins. Lquation ci-dessus est simplement la relation de la dynamique a = f /m pour un
matriau continu. Le paramtre v a les dimensions dune vitesse. Les seuls paramtres
intrinsques du problme tant la tension et la densit, il nexiste quune seule faon
(dimentionnellement parlant) de former une vitesse et v 2 doit tre proportionnelle
T /. Nous supposons enfin quinitialement, la corde est maintenue dans une certaine
forme (pince par exemple) y0 (x) et quon la relche linstant t = 0.
Nous pouvons chaque instant, reprsenter la fonction y(x; t) laide de sa srie
de Fourier ou de sinus. Pour la reprsenter tous les instants, il suffit donc que les
coefficients de la srie soient fonction du temps :
X nx
y(x; t) = bn (t) sin (3.10)
n=1
L

Notons que nous faisons ici le choix de rechercher la solution sous la forme de fonction
de sinus, puisque chaque terme de la srie respecte les conditions aux bords y(0, t) =
y(L, t) = 0. En injectant (3.10) dans (3.9) est en identifiant terme terme (puisque les
fonctions sont orthogonales), nous trouvons une quation diffrentielle pour lampli-
tude de chaque mode :
00
bn (t) + n2 2 bn (t) = 0

27
3 Les sries de Fourier.

o = v/L. Comme la corde est relch avec une vitesse nulle, nous avons simple-
ment
bn (t) = Bn cos(nt)
o les coefficient Bn sont les coefficient de la srie des sinus de la fonction y0 (x).
Limage est donc la suivante : la dformation initiale est la superposition dun certain
nombre de mode, chacun avec une amplitude bn . Une fois quon relche la corde, lam-
plitude de chaque mode oscillera dans le temps. Remarquez cependant quil ny a pas
de transfert entre les modes : si un mode ntait pas prsent dans la dformation ini-
tiale, il ne sera pas excit par la suite. Chaque mode se comporte comme un oscillateur
indpendant, non coupl aux autres. En langage plus chic, on dira que la base de Fou-
rier est une base propre pour loprateur Laplacien : dans cette base, la reprsentation
matricielle de cet oprateur est diagonale.
Nous avons, lors de cette rsolution, invers lordre des oprations de drivation et
de sommation. Nous savons quil existe des conditions trs contraignantes pour pou-
voir effectuer cette inversion, et elles sont loin dtre runies priori (voir ci-dessous).
Notons enfin que la diffrence entre un clavecin et un piano, qui excitent pratiquement
les mme cordes tendues, est dans la faon de former la dformation initiale, donc de
produire des coefficients Bn diffrents.

3.7 Drivation terme terme des sries de Fourier.


3.7.1 Drivation par rapport la variable principale.
Soit la fonction continue et drivable par morceau f (x) dont la dcomposition de
Fourier est

X
f (x) = a0 + an cos(2nx/L) + bn sin(2nx/L)
n=1

Dans quelles conditions nous pouvons la driver terme terme ? Dcomposons la fonc-
tion f 0 (x) en srie de Fourier :

X
f 0 (x) = 0 + n cos(2nx/L) + n sin(2nx/L)
n=1

Nous avons alors pour le premier terme


L
1 1
0 = f 0 (x)dx = (f (L) f (0))
L 0 L

28
3 Les sries de Fourier.

et pour les termes en cosinus



2 L 0
n = f (x) cos(2nx/L)dx
L 0

2 2n 2 L
= (f (L) f (0)) + f (x) sin(2nx/L)dx
L L L 0
2 2n
= (f (L) f (0)) + bn (3.11)
L L
Finalement, pour les termes en sinus, on trouve, en suivant le mme chemin,
2n
n = an
L
Nous voyons donc que si f (L) = f (0), nous pouvons driver la srie de Fourier terme
terme. Sinon, des termes additionnels apparaissent quand on drive les termes en sinus
dont il faut en tenir compte.
On peut gnraliser ce rsultat aux sries de sinus et de cosinus pures :
1. Si f (x) est continue et drivable par morceau, sa srie de cosinus est drivable
terme terme sans restriction.
2. Si f (x) est continue et drivable par morceau, sa srie de sinus est drivable terme
terme si f (L) = f (0) = 0 ! Sinon, des termes additionnelles apparaissent dans
la srie de sinus de la drive, qui sont de la forme 2( (1)n f (L) f (0) )/L.
Nous voyons maintenant dans quelles conditions nous avons pu driver terme terme
la serie de la corde vibrante. Comme nous avions la condition u(0, t) = u(L, t) = 0,
nous pouvions driver la srie de sinus pour obtenir une srie de cosinus. Nous avons
pu ensuite driver cette dernire encore une fois sans restriction particulire.
Une hrsie saute aux yeux dans lquation (3.11) : la suite n comporte un terme
qui ne dpend pas de n et ne tend pas vers 0. Cela nest pas du plus bel effet pour la
convergence de la srie ! La rponse est dans le coefficient bn , qui doit forcment avoir
un terme en /n pour annuler exactement le terme constant. Cest ce que lon va
voire plus bas dans un cas particulier.
En pratique, au lieu de driver terme terme et prendre en compte les termes addi-
tionnels dus aux conditions au bords, il est prfrable de rgulariser les conditions aux
bords pour ne pas avoir de termes additionnels du tout. Supposons par exemple que les
conditions aux bords soit u(0, t) = a, u(L, t) = b. Il est alors prfrable dutiliser la
fonction
ba
w(x, t) = u(x, t) xa (3.12)
L
Les drives temporelles et les drives secondes spatiales de u et w concident vide-
ment. w(x, t) est satisfait donc la mme quation que u sil sagit dune quation de
chaleur ou de corde vibrante. Par ailleurs, de par sa construction, w(0, t)= w(L, t) = 0.
Nous pouvons donc dabord rechercher w(x, t) et ensuite retrouver u laide de la re-
lation (3.12). Nous verrons un exemple plus bas.

29
3 Les sries de Fourier.

3.7.2 Drivation par rapport une autre variable.


Quen est il pour la drivation par rapport une autre variable ? En crivant

X
u(x, t) = bn (t) sin(nx/L)
n=1

nous avons concentr toute la dpendance temporelle dans lamplitude des harmo-
niques bn (t). Pour avoir le droit de driver par rapport t sous la somme, nous devons
pouvoir crire ( le dmontrer )
L L
u
u(x, t)dx = dx
t 0 0 t

Lchange de lintgrale (sur x) et de la drivation ( par rapport au temps) est permis si


u/t existe sur lintervalle [0, L], est continue et si elle est borne. Nous supposerons
dans la suite que pour les fonctions que nous considrons (qui reprsentent des hauteurs
de cordes, des pressions ou des tempratures) ces conditions sont toujours vrifies.

3.8 quation de la chaleur.


La physique mathmatique possde quelques quations star. Ce sont les quations
donde (rencontres plus haut), lquation de Laplace et lquation de la chaleur. Cette
dernire dcrit les phnomnes de diffusion (de la chaleur, de la concentration, ...) et est
de la forme 2
u 2u
=D 2 (3.13)
t x
o u reprsente la temprature, la concentration, etc... Si x dsigne lespace et t le temps,
nous voyons que D doit avoir la dimension dune longueur au carr par unit de temps
[L2 /T ].
Remarquez la diffrence avec lquation donde (3.9), o la drive par rapport au
temps est de deuxime ordre. Nous voulons traiter le cas dune barre ( comme dhabi-
tude, de longueur L ) dont les extrmits sont maintenues deux tempratures diff-
rentes , disons 0 et T . Nous avons donc les deux conditions aux limites

u(0, t) = 0 (3.14)
u(L, t) = T (3.15)

et nous supposons la condition initiale

u(x, 0) = f (x) (3.16)


2. Voir le chapitre les quations de la physique pour la signification de cette quation.

30
3 Les sries de Fourier.

Voil, le problme est maintenant bien pos. Avant de commencer son traitement total,
voyons voir si il existe une solution stationnaire, cest dire une solution tel que t u =
0. Dans les processus diffusifs, cest la solution qui est atteinte au bout dun temps plus
ou moins long et correspond lquilibre. Il est vident ici que us (x) = T (x/L) satisfait
parfaitement aux quations (3.13-3.15) et est la solution stationnaire recherche. Aprs
quelques lignes de calculs, nous trouvons que sa srie de sinus est donne par

2T X (1)n+1 n
us (x) = sin( x)
n=1 n L

Bon, revenons maintenant la solution gnrale. Nous dcomposons la fonction u en


srie de sinus avec des coefficients dpendant du temps :
X
u(x, t) = bn (t) sin(nx/L) (3.17)

Nous drivons une premire fois par rapport x. Mais attention, la fonction u prend
des valeurs diffrentes sur les deux bords, il faut donc ajouter des termes
2 2T
((1)n u(L, t) u(0, t)) = (1)n
L L
la srie drive :
 
T X n 2T
x u(x, t) = + bn (t)( ) + (1)n cos(nx/L)
L L L
Nous sommes maintenant en prsence dune srie de cosinus, que nous drivons encore
une fois par rapport x
X n 2T

n
x2 u(x, t) = bn (t)( ) + (1)n ( ) sin(nx/L)
L L L
La drivation par rapport au temps nous donne une srie de sinus dont les coefficients
sont b0n (t). En galant terme terme, nous obtenons une quation de premier ordre
pour les coefficients
 n 2 2T n
b0n (t) = D bn (t) D (1)n
L L L
dont la solution est
 2T (1)n+1
bn (t) = Bn exp n2 ( 2 D/L2 )t +

(3.18)
n
Notons dabord que quand t +, les coefficients bn tendent vers les coefficients de
sinus de la solution stationnaire : au bout dun temps assez long, la distribution de tem-
prature dans le barreau devient linaire. Ensuite, les amplitudes des harmoniques sont

31
3 Les sries de Fourier.

t=0.1
t=0

0.5 t

t=0.25

0 t=1

0 0.2 0.4 0.6 0.8 1

Figure 3.4 Solution de lquation de la chaleur par les sries de sinus avec L = 1,
u(0, t) = 0 ; u(1, t) = 1, et condition initiale une fonction pallier. La so-
lution est trace pour 4 temps diffrents. Nous avons reprsent la srie
par simplement ses 64 premires harmoniques. Notez les oscillations arti-
ficielles : les sries de sinus ont du mal reproduire les discontinuits.

de la forme exp(n2 t/ ), o L2 /D. L harmonique dordre n disparat donc sur


une chelle de temps L2 /(n2 D). (i) Plus L est grand, plus le temps de thermalisa-
tion est grand. Si on multiplie par 2 la longueur du barreau, on doit multiplier par 4 le
temps ncessaire la thermalisation 3 ; (ii) Plus le coefficient de diffusion D est grand,
plus la thermalisation est rapide : le cuivre est plus rapide thermaliser que le verre ;
(iii) plus lordre dune harmonique est important, plus il disparat rapidement, et ceci
est proportionnel au carr de lordre. Trs rapidement, il ne restera pratiquement que
lharmonique dordre 1, qui sera le plus lent mourir (voir figure 3.4).
Nous avons russi nous en sortir mme quand la drivation sous la somme posait
problme. Mais tait-il vraiment ncessaire de faire appel une telle artillerie lourde, qui
numriquement nest pas entirement satisfaisant ? Et si au lieu de chercher la fonction
u(x, t) qui satisfait aux quations (3.13-3.16), nous cherchions la fonction

(x, t) = u(x, t) us (x) (3.19)

Cette fonction obit bien sr lquation (3.13). Ces conditions aux limites sont

(0, t) = u(0, t) us (0) = 0 (3.20)


(L, t) = u(L, t) us (L) = T T = 0 (3.21)

La fonction obit donc (contrairement u) des conditions aux limites continues,


et ne pose donc aucun problme lors de ses drivations par rapport x. Sa condition
initiale est donne par
(x, 0) = f (x) us (x)
Les quations pour sont donc maintenant bien poses, et nous pouvons les rsoudre
par la technique habituelle des sries de sinus sans la complications des termes addi-
3. Sachant quun gigot de 1 kg cuit en une heure au four, quel est le temps de cuisson dun gigot de 2 kg ?

32
3 Les sries de Fourier.

0.5

0
0 0.2 0.4 0.6 0.8 1

Figure 3.5 La solution de la mme quation de la chaleur mais o on a cherch


dabord la fonction . Nous navons pris ici que 16 termes harmoniques.
Nous voyons quau temps t = 0, des oscillations artificielles sont tou-
jours prsentes cause de la discontinuit de la condition initiale. Mais
les oscillations artificielles pour des temps ultrieurs de la figure (3.4) ont
disparu, puisquon a rsolu le problme de la discontinuit des conditions
aux limites.

tionnels. Une fois trouve, nous avons videmment trouv u. La figure (3.5) montre
lavantage (entre autre numrique) de cette dernire mthode.

Problmes avancs.
Problme 3.1 Vibration dune corde tendu.
Lexemple de la corde vibrante que nous avons considr plus haut peut tre complt de
bien des faons. Si la corde est soumise un frottement visqueux, il faut ajouter un terme en
y/t (proportionnel la vitesse locale) droite de lquation (3.9). Si la corde est en plus
soumise une force par unit de longueur f (x, t), il faut galement lajouter droite. Rsoudre
lquation de la corde vibrante (i) en prsence dun frottement (ii) en prsence de la force de
gravit f = g (iii) en prsence dune force de rappelle harmonique f = ky. Les conditions
aux bords sont toujours les mmes : corde fixe ses deux extrmits et avec une dformation
initiale y0 (x).

Problme 3.2 Vibration dune barre lastique.


Lquation de vibration dune barre lastique est donne par

2y 4y
=
t2 x4
Discuter les solutions de cette quation. Que pensez vous des conditions initiales ?

Problme 3.3 quation de Schrdinger dans un puits rectangulaire.


Dans un puits de potentiel rectangulaire est trs profond, une dimension, lquation de
Schrdinger scrit :
~2 2
i~ =
t 2m x2

33
3 Les sries de Fourier.

avec les condition aux limites (L, t) = (L, t) = 0 et (x, 0) = f (x). Discuter de la
solution de cette quation en suivant lexemple de la corde vibrante.

Problme 3.4 quation de la Chaleur I.


Soit une barre thermiquement isole, cest dire x u(0, t) = x u(L, 0) = 0. En effet, le flux
de chaleur travers une section est proportionnel la pente de u en cet endroit, et que isole
(pas de flux de chaleur de/vers lextrieur), impose les conditions ci-dessus. En partant dune
distribution de temprature initiale parabolique u(x, 0) = T x(L x)/L2 , rsolvez lquation
de la chaleur. A ton plutt intrt prendre des sries de cosinus ou des sries de sinus ?

Problme 3.5 quation de la chaleur II.


Si une source de chaleur est prsente dans le milieu (sous forme de rsistance lectrique ou
de particule radioactive ...), lquation de la chaleur prend la forme

u 2u
= D 2 + Q(x)
t x
o Q est la quantit de chaleur produite en x. Prenez une source constante localise autour de
L/2, et rsolvez alors lquation de la chaleur.

Problme 3.6 quation de la chaleur III.


Nous nous intressons la distribution de temprature dans une barre dont lun des cots
est maintenu temprature constante et lautre extrmit une temprature qui varie dans le
temps selon une loi connue. Rsolvez

u 2u
=D 2
t x
avec les conditions aux limites u(0, t) = 0 ; u(L, t) = g(t). Nous supposons une condition
initiale homogne u(x, 0) = 0 et bien sr g(0)=0. Notez que vous avez intrt chercher plutt la
fonction (x, t) = u(x, t) g(t)x/L pour rgulariser les conditions aux limites. Si vous naimez
pas cette faon de faire, il faut faire attention aux drivations terme terme (qui donneront, bien
sr, la mme rponse).

Problme 3.7 flambage dune poutre


Posez une rgle la verticale et appuyez avec un doigt dessus : au bout dune certaine pression,
la rgle flchit soudain. On appelle cette transition brusque le flambage. Le flambage est par
exemple la raison principale qui limite la hauteur des immeubles : au del dune certaine taille,
limmeuble flambe sous son propre poids. Nous allons tudier ce phnomne laide des sries
de Sinus.
0. Minimum. Pour une fonction f (z1 , ..., zn ) = a1 z12 + ... + an zn2 , le point z1 = z2 = ... =
zn = 0 est un minimum si ai > 0 i. En mcanique, Un point constitue un quilibre stable si
cest un minimum de lnergie potentielle.
0. Dfinitions. Nous considrons une barre de longueur L qui sous leffet dune force F
flambe. La flche de la barre est repr par la fonction u(x). La barre est contraintes de garder
ses extrmits u = 0. La diffrence entre la longueur de la barre et sa longueur projet L est
note y = L L (Fig. 3.6).

34
3 Les sries de Fourier.

Figure 3.6 Flambage sous leffet dune force.

Soit la fonction u(x) sur lintervalle [0, L] telle que u(0) = u(L) = 0. Nous notons sa d-
composition en srie de sinus par

X
u(x) = bn sin(nx/L)
n=1

1. Parseval. En utilisant lorthogonalit des sinus, dmontrer lgalit de Parseval :


L
X
u(x)2 dx = (L/2) b2n
0 n=1

Obtenez alors
L 2 L 2
u0 (x) dx et u00 (x) dx
0 0
en fonction des harmoniques bn .
2. nergie Potentielle. Lnergie potentielle de la barre scrit
L
2
E= (1/2)B u00 (x) dx F y
0

o B est le module de rigidit de courbure et F la force applique sur la barre son extrmit.
Nous considrons le dbut de linstabilit o la flche est faible (u0 (x)  1). Dans ce cas
L p 
y =LL = 1 + u0 (x)2 1 dx
0
L
= (1/2) u0 (x)2 dx
0

Obtenez alors lnergie potentielle en fonction de lamplitude des harmoniques bn .


3. Instabilit. La position de la barre droite (non flambe) correspond bn = 0 n. A partir
de quelle valeur Fc de la force cette quilibre devient instable ? Quelle est le mode qui devient
instable en premier ? Comment cela correspond votre exprience de pousse sur une rgle ?
4. Hauteur. Discutez comment vous pourriez utiliser ce rsultat pour calculer la hauteur
limite dun btiment.

Problme 3.8 nergie dun corps noir.

35
3 Les sries de Fourier.

Reprenons le cas de la corde vibrante fixe ses deux extrmits. Quelle est son nergie libre
F quand elle est maintenue une temprature T 4 ? Ce problme a jou un rle majeur dans
lvolution de la physique au tournant du XIXme sicle et a donn lieu la premire formulation
de la mcanique quantique.
Avant dattaquer de front ce problme, quelques rappels sur un cas simple. Prenons un os-
cillateur harmonique (une boule au bout dun ressort ) dont lamplitude un instant est x(t).
Lnergie lastique emmagasine dans loscillateur est E(x) = (k/2)x2 . Lnergie libre est une
sorte de moyenne pondre par la temprature de toutes les nergies disponible :
X E(x)/T
Z = eF/T = e (3.22)
{x}

o la somme sentend au sens de toutes les configurations possibles. Comme lamplitude x est
une variable continue, la somme peut tre transforme en intgrale et 5
+
2
ekx /2T dx = C. T /k
p
Z=

Lnergie lastique moyenne de loscillateur est


X
hEi = E(x)eE(x)/T /Z = T /2
{x}

Si la place dun oscillateur, nous avions deux oscillateurs indpendants (non coupls), x1 et x2
de raideur k1 et k2 , lnergie serait

E = (1/2)(k1 x21 + k2 x22 ) (3.23)

et la somme (3.22) pour obtenir lnergie serait cette fois une double intgrale qui se calcule tout
aussi facilement. Un calcul lmentaire nous montre alors que lnergie lastique moyenne est

hEi = hE1 i + hE2 i = T

Pour N oscillateurs, nous aurions hEi = N T /2, ce quon appelle en physique statistique, lqui-
partition.
Revenons notre corde vibrante, dont la hauteur labscisse x est repre par u(x). Lnergie
lastique emmagasin dans la corde, pour une configuration donne u(x) vaut 6
L  2
u
E[u(x)] = k dx (3.24)
0 x

4. Nous mesurons la temprature en chelle dnergie : T = KB , o est la temprature habituelle.


Cela nous vite de trainer la constante de Boltzmann. p
5. Le rsultat sobtient facilement en effectuant le changement de variable x x T /k ; la constante

C est juste une intgrale dfinie qui vaut 2
6. Pour la signification de cette expression, voir les deux chapitres sur le calcul variationnel et le sens des
quations de la physique.

36
3 Les sries de Fourier.

Au lieu de reprsenter la corde par u(x), nous pouvons le reprsenter sur la base de Fourier :
+
X
u(x) = cn exp[(2in/L)x]
n=

et une application simple du thorme de Parceval nous montre que


L  2  2
u X 2n
E= k dx = k |cn |2
0 x n=
L

Remarquez lexpression de droite et comparez le (3.23). Cest comme si nous tions en prsence
de N (N ) oscillateurs harmonique indpendants, loscillateur n, damplitude cn ayant une
constante de ressort k(2n/L)2 . Lnergie moyenne emmagasine dans la corde est
+
X
hEi = T /2
n=

Ae .. Une simple corde temprature non nulle emmagasine une nergie infinie. La raison prin-
cipale pour cette divergence est la forme (3.24) de lnergie de la corde : elle nest valable que
pour des petites dformations de la corde. Les modes grand n (les hautes frquences) imposent
cependant de trs fortes dformations. Il est vident que vous ne pouvez pas plier en 10000 une
corde de 1m. Il doit donc exister une sorte de longueur minimum qui limiterait les hautes fr-
quences, et on parle alors de longueur de cut-off.
Par contre, la forme (3.24) dcrit parfaitement lnergie du champ lectrique (poser E = u)
dans une cavit. Bien sr, il faut prendre un champs lectrique tridimensionnel et prendre en
compte les diverses polarisations ; cela est lgrement plus long calculer mais cest exactement
le mme genre de calcul. Ce problme que lon appelle divergence ultra-violet (pour les hautes
frquence spatiale) a t rsolu par Planck et Einstein en supposant que lnergie dun mode n
ne pouvait pas prendre des valeurs continues mais varie par palier discret. Ceci a t la naissance
de la mcanique quantique.

Problme 3.9 Le mouvement Brownien.


Considrons une particule sur un rseau discret unidimensionnel de pas a, cest dire une
particule qui peut sauter de site en site. Appelons la probabilit de saut par unit de temps
autant vers la gauche que vers la droite. Cela veut dire que la probabilit pour que la particule
saute gauche ou droite pendant un temps infinitsimal dt est dt (et donc, la probabilit de
rester sur place est 1 2dt ). On cherche dterminer P (n, t), la probabilit pour quau temps
t, la particule se trouve sur le site n, sachant qu t = 0, la particule se trouvait n = 0 7 . Pour
que la particule soit en n au temps t + dt, il faut quil ait t en n 1 au temps t, et quil ait
effectu un saut vers n pendant lintervalle dt. Ce phnomne enrichit la probabilit dtre en n.
Par ailleurs, si la particule se trouvait en n au temps t, il a une probabilit de sauter gauche ou

7. Le mouvement de petites graines de poussire dans leau, tudi par Brown la fin du dix-neuvime
sicle, est une version continue de ce mouvement. En 1905, Einstein a donn lexplication de ce mouvement
ratique en supposant la nature molculaire de leau. Cet article est celui le plus cit dans le monde scienti-
fique.

37
3 Les sries de Fourier.

droite pendant lintervalle dt, ce qui appauvrit la probabilit dtre en n. En prenant en compte
ces deux phnomnes, on obtient une quation quon appel matresse :

1 dP (n)
= P (n 1) + P (n + 1) 2P (n) (3.25)
dt
Ceci est en faite une infinit dquations diffrentielles de premier ordre, avec la condition initiale
P (n = 0, t = 0) = 1,P (n 6= 0, t = 0) = 0. La srie de Fourier est devenue une clbrit en
rsolvant en particulier ce genre dquation. La mthode que lon va suivre est une mthode
extrmement gnrale. Supposons que les P (n) sont les coefficients de Fourier dune fonction
(s, t)
+
X
(s, t) = P (n, t) exp(ins) (3.26)
n=

et essayons de voir quelle quation doit obir . Notons tout dabord que est 2-priodique
en s. La fonction est appele la fonction gnratrice des probabilits et caractrise entirement
le processus stochastique. Par exemple, on obtient la moyenne trs facilement :

X
hni = nP (n) = i
s s=0

Question : comment on obtiendrai la variance ?


En multipliant leq(3.25) par exp(ins) et en sommant sur les n, on obtient pour :


= 2(1 cos s)
t
Ce qui nous donne, en intgrant lquation diffrentielle par rapport t :

= A(s) exp[2(1 cos s)t]

Et la condition initiale (s, t = 0) = 1 (pourquoi ?) nous impose A(s) = 1. On connat donc


et on peut par exemple calculer que la variance 2t, qui est un des rsultats important
du mouvement brownien. Mais on peut pousser lanalyse plus loin, et calculer explicitement les
probabilit. Il existe une classe de fonctions quon appelle des fonctions de Bessel dordre n que l
on tudiera plus tard dans de ce cours. Ces fonctions (voir Fig.3.7) sont dfinies par des intgrales
:
1 z cos
In (z) = e cos(n)d
0
Cela nous donne directement les P (n, t) :

P (n, t) = exp(2t)In (2t)

On peut partir de l effectuer une analyse beaucoup plus fine du mouvement Brownien.

Problme 3.10 fluctuation de mort et naissance.


Soit un systme (comme par exemple un ensemble de bactries ) dont la taille varie par palier
discret de faon alatoire. Supposons que la probabilit par unit de temps pour quil passe de la

38
3 Les sries de Fourier.

0.8

0.6 n=0

0.4

0.2 n=1

n=2
n=3
2 4 6 8 10

Figure 3.7 Les fonctions ex In (x) pourn = 0, ..., 3. Pour z  1, In (2z) z n /n!,
et pour z , In (z) ez / 2z.

taille n n 1 soit proportionnelle n (notez la diffrence avec le cas brownien). montrez alors
que la probabilit P (n, t) pour que le systme ait la taille n linstant t obit lquation :

dP (n)/dt = (n 1)P (n 1) + (n + 1)P (n + 1) 2nP (n) (3.27)

Nous supposons qu linstant initial t = 0, le systme a une taille 1 : P (1, 0) = 1, P (n 6=


1, 0) = 0. Ceci constituera
P notre condition initiale. Rsoudre cette quation nest pas priori
facile. Posons u(x, t) = P (n, t)exp(inx), et cherchons si on peut trouver une quation pour
cette fonction. Notons tout de suite que de par sa dfinition, u est 2 priodique. On appelle
u(x, t) la fonction gnratrice. Si on russit trouver u, on voit alors que les P (n, t) sont sim-
plement les coefficients de la transforme de Fourier de cette fonction. Quelle est la condition
initiale pour u, cest dire u(x, 0) =? En multipliant les deux cts de lquation (3.27) par
exp(inx) et en sommant sur n, dmontrez que

u u
= 2(cos x 1)
t x
Dmontrez que la solution de cette dernire (nous verrons plus tard 8 comment rsoudre ces
quations) est donne par :

1 i(1 + 2t) tan x/2


u(x, t) =
1 + i(1 2t) tan x/2
Calculez la moyenne et la variance en fonction du temps. Avec un peu de vigueur en plus, d-
montrez que

P (0, t) = t/(1 + t)
P (n, t) = tn1 /(1 + t)n+1

Discutez ce rsultat.

Problme 3.11 Propagation du son dans un cristal (les phonons).

8. Voir le chapitre sur les quations drives partielles de premier ordre.

39
3 Les sries de Fourier.

Figure 3.8 Une portion du cristal montrant 4 atomes

Mise en place du problme. Nous allons considrer un cristal uni-dimensionnel de maille


lmentaire a. La position dquilibre de latome n est xn = na. Chaque atome ninteragit
quavec avec ses deux plus proches voisins. Nous voulons savoir comment une perturbation des
atomes par rapport leur positions dquilibre se propage dans le cristal. Soit un lcart de
latome n par rapport sa position dquilibre (Fig. 3.8). La force fn+1n exerce par latome
n + 1 sur son voisin n est une fonction de la distance entre les deux : fn+1n = C(un+1 un )
o C est un coefficient qui dpend de la nature de la liaison chimique (grand pour les cristaux
ioniques ou covalents plus petit pour les cristaux molculaires). Soit m la masse dun atome ;
son quation de mouvement ( = F/m) scrit, en considrant les forces exerces par ses deux
voisins,

d 2 un
= (C/m)(un+1 un ) + (C/m)(un un1 ) (3.28)
dt2
(C/m) (2un + un+1 + un1 ) (3.29)

Dornavant, nous poserons 02 = C/m.


Rsolution. Nous considrerons les quantits un (t) comme les coefficients de Fourier dune
fonction caractristique (q, t) o la variable q appartient lintervalle [/a, /a] (la longueur
de lintervalle est donc L = 2/a ). Le paramtre q est souvent appel nombre donde. scrit
donc
X+
(q, t) = un (t) exp (iaqn) (3.30)
n=

1. En multipliant lquation (3.28) pour latome n par exp(iaqn) et en sommant sur toutes
les quations, dmontrer que la fonction obit lquation

2
+ 202 (1 cos(aq)) = 0 (3.31)
t2
[Help : Utilisez et justifiez +
P P+
n= un1 exp(iaqn) = n= un exp (iaq(n 1)) ].
2. Vrifiez que la solution de cette quation diffrentielle linaire homogne de seconde ordre
en t est donne par
(q, t) = A(q) exp(iq t) + B(q) exp(iq t)
o q = 20 sin(aq/2). [Help : arranger dabord lquation (3.31) en exprimant cos(2) en
fonction de sin ]. A(q) et B(q) sont des fonctions du paramtre q, mais pas du paramtre t qui

40
3 Les sries de Fourier.

peuvent tre dtermines laide des conditions initiales, mais nous navons pas besoin de les
expliciter ici.
3. (i) Donnez enfin la forme des un (t). Comme vous pouvez le constater, les un peuvent
tre considrs comme des superpositions dondes planes exp [i(q t qna)]. (ii) La vitesse du
propagation donde est dfinie par vq = dq /dq. Donnez lexpression de vq et tracez la en
fonction de q. Que vaut cette vitesse pour q 0 (grande longueur donde) et q /a ?
4. Gnralisation. Pouvez-vous indiquer, en suivant rapidement le mme chemin que pour
les questions prcdentes, ce qui changerait si un atome interagissait avec ses 4 plus proches
voisins ?
d2 un
= 02 (2un + un+1 + un1 )
dt2
+ 02 (2un + un+2 + un2 )

41
4 Les transformations de Fourier.
4.1 Entre en matire.
Nous avons vu plus haut que si une fonction tait dfinie sur un intervalle fini de
taille L, elle pouvait tre approxime aussi prcisment quon le veuille par les sries
de Fourier exp(2inx/L). On peut, pour clarifier la notation, poser q = 2n/L et
crire pour notre fonction :
X
f (x) = feq exp(iqx) (4.1)
q

o q varierait par pallier discret de 1/L. Notez galement que les coefficients sont don-
ns de faon fort symtrique
L
feq = (1/L) f (x) exp(iqx)dx (4.2)
0

Cest en quelque sorte une formule dinversion que nous devons lorthogonalit. Cela
est fort sympathique, mais si on voulait approcher notre fonction sur toute lintervalle
] , [ ? La rponse simple (simpliste) serait que q deviendrait alors une variable
continue, la somme se transforme en une intgrale, et nous avons :
+
1
f (x) = fe(q) exp(iqx)dq (4.3)
2
et par analogie avec (4.2), on doit avoir

fe(q) = f (x) exp(iqx)dx (4.4)

On appelle les quations (4.3,4.4) des transformations de Fourier : prenez votre fonction,
multipliez par exp(iqx), intgrez sur ] , +[, et hop, cest prt. Notez la beaut
de la symtrie : si fe(q) = TF[f (x)] alors f (x) = (1/2)TF[fe(q)]. Par convention,
on met un petit chapeau sur la TF pour distinguer la fonction originale de la fonction
transforme. La variable q est la variable rciproque de x. Pourquoi ce facteur 2 doit
apparatre dans la TF inverse ? En faite, si nous dfinissions la TF par [multiplier par
exp(2iqx) et intgrer] la TF et son inverse seraient parfaitement symtrique, et cer-
taines personnes prfrent cette dernire dfinition. Cela nous obligerait cependant

42
4 Les transformations de Fourier.

2.0
1.0

0.8 1.5

f(x)

f(q)
0.6 1.0

0.4
0.5

0.2
0.0

0.0

0.5
6 4 2 0 2 4 6 20 10 0 10 20

x q

Figure 4.1 Quelques exemples de fonctions et de leurs transformes de Fourier. En


bleu, la fonction exp(|x|) ; en vert, la fonction (x).

traner des 2 lors des drivations et des changements de variables et nous prfrons
donc la dfinition (4.4).
La signification de la TF est la suivante : une fonction f (x) peut tre considre
comme la superposition doscillations pures exp(iqx), chaque oscillation ayant un poids
f(q). Cette signification, comme nous lavons dit, est juste une gnralisation des sries
de Fourier. La TF est un exemple doprateur linaire, cest dire une boite noire qui
prend une fonction en entre et produit une nouvelle fonction en sortie, et fait cela de
faon linaire, cest dire :

TF[f (x) + g(x)] = TF[f (x)] + TF[g(x)]

Voyons pour linstant quelques exemples (figure 4.1).


Exemple 4.1 f (x) = ek|x|
Il est facile de dmontrer que f(q) = 2k/(k 2 + q 2 ). La formule dinversion est
un peu plus compliqu dmontrer, et ncessite quelques lments de la thorie des
variables complexes.
Exemple 4.2 f (x) = (x)
La fonction (x), appele porte, est dfinie par (x) = 0 si |x| > 1 et (x) = 1
si |x| 1. Sa TF est donne par f(q) = 2 sin(q)/q. Cette fonction joue un rle
important dans la thorie de la diffraction.
Nous navons pas nonc dans quelle condition les TF existent. Une condition suffi-
sante vidente serait que f doit tre sommable. Nous ne rentrons pas plus dans le dtail,
disons simplement quen gnral, les rsultats obtenus sont radicalement aberrants si
on a viol les limites permises.

Exercices.
4.1 Dmontrer la formule donne pour la TF de k exp(k|x|). Que devient cette transforme
si k + ?

43
4 Les transformations de Fourier.

4.2 Calculer la TF de la fonction f (t) = H(t) exp(t). H(t) est appel la fonction dHea-
viside (Physicien anglais de la fin du XIXme). Elle est nulle pour t < 0 et vaut 1 pour t 0.
4.3 Calculer la transforme de Fourier de la fonction a1 (x/a). Que devient cette transfor-
me quand a 0 ?
+
4.4 Sachant que exp(x2 )dx = , calculez la TF de exp(x2 /2). Pour cela, notez
que x2 + 2iqx = (x + iq)2 + q 2 . Le rsultat dintgration reste valable si on parcours un axe
parallle laxe rel.
4.5 Calculez la TF de a1 exp[x2 /2a2 ]. Que devient cette transforme quand a 0 ?
4.6 Calculer la TF dun train donde, f (x) = (x/a) exp(ik0 x). k01 est la priode de londe
et a son extension spatial. Discutez les divers limites.
4.7 La fonction dAiry que lon rencontre souvent dans les problmes du calcul des bandes de
certain semi conducteur est dfinie par une intgrale :

1
exp i(xt + t3 /3) dt

Ai(x) =
2
Dmontrez que sa Transforme de Fourier est donne par
3
Ai(k) = eik /3

[Help : Vous devez connatre les distributions, traits au prochain chapitre. Pour cet exercice, il
peut tre judicieux dchanger lordre dintgration pour le calcul de la TF].

4.2 Les oprations sur les TF.


Si les TF sont si intressante, cest en partie parce quelles nous permettent de ma-
nipuler les quations diffrentielles comme des quations algbriques. Ceci est un peu
lanalogue de linvention des logarithme par monsieur Neper au dbut des annes 1600.
Il est difficile de multiplier deux grands nombres. On prend alors le log de chacun (en
consultant une table), on additionne (au lieu de multiplier) les deux nombres obtenus,
et on prend lantilog du rsultat. Cest presque la mme chose pour les quations diff-
rentielles et les TF : on prend la TF des quations (parfois en consultant une table), on
rsout lquation algbrique correspondante, on prend la TF inverse du rsultat. Pour
cela, nous devons connatre quelques rgles de manipulation des TF, lquivalent des
rgles comme log(ab) = log(a) + log(b) pour les logarithme. Voyons cela de plus prs.

Translation. Si TF[f (x)] = f(q) alors TF[f (x a)] = exp(iqa)f(q)


Translater dans lespace direct revient multiplier par un facteur de phase dans les-
pace rciproque. Le changement de variable x x + a (si on remplace x par x + a )
nous donne la dmonstration :

iqx iqa
f (x a)e dx = e f (x)eiqx dx

44
4 Les transformations de Fourier.

Inversion. Si TF[f (x)] = f(q), alors TF[f (x)] = f(q)

Changement dchelle. Si TF[f (x)] = f(q), alors TF[f (x/a)] = af(qa)


La dilatation dchelle dans lespace direct conduit la contraction dchelle dans
lespace rciproque. Cela se dmontre par le changement de variable x ax, comme
ce que vous avez fait dans les exercices 1 et 3 ci-dessus. Nous avons en ralit suppos
que a > 0. Dans le cas gnral, on doit crire TF[f (x/a)] = |a|f(qa).

Drivation. Si TF[f (x)] = f(q), alors TF[df (x)/dx] = iq f(q).


Driver dans lespace direct revient multiplier par iq dans lespace rciproque. Cest
l le grand avantage qui permet de transformer les quadifs en quation algbrique dans
lespace rciproque. Pour dmontrer cela, il faut simplement effectuer une intgration
par partie, et noter que puisque f est sommable, f (x) 0 quand x .

4.3 Transforme de Fourier Rapide.


Une des raisons qui a grandement popularis les TF est la disponibilit, depuis le
dbut des annes 1960, des algorithmes qui permettent de les calculer efficacement. La
premire tape pour traiter numriquement un signal est de lchantillonner, cest
dire de le mesurer et de lenregistrer tous les pas de temps t. Le son sur un CD est par
exemple chantillonn 48 KHz, cest dire 48000 enregistrement de lamplitude par
seconde. Nous sommes alors en possession de N nombres (qui sont les fn = f (nt) ).
Normalement, si on voulait calculer la TF, on devrait effectuer N 2 oprations (de mul-
tiplications et daddition). Les transforms de Fourier Rapide (ou FFT, pour Fast Fourier
Transform en anglais) neffectuent pour ce calcul que N log N oprations. La diffrence
est norme en temps de calcul. Par exemple, en supposant que notre ordinateur effectue
un milliard doprations par seconde, la TF dune seconde dun CD prendrait environ 2
secondes, tandis que sa TFR ne prendrait que 0.5 ms. Cest cette diffrence qui permet
danalyser le signal en temps rel.

4.4 Manipulation et utilisation des TF.


Filtrage.
Un filtre ne laisse passer que certaines frquences. Par exemple, pour la rception
radio de France Info, on rgle un circuit lectrique pour ne laisser passer que le 105.5
MHz. En optique, on fait souvent un filtrage spatial pour nettoyer un faisceau laser
et enlever les speckles. Le principe est toujours le mme : nous avons un signal x(t) en
entre et un signal y(t) en sortie. Dans le cas dun circuit RLC, ils sont relis par une

45
4 Les transformations de Fourier.

quation diffrentielle
d2 y dy
2
+ + 02 y = x(t)
dt dt
Une habitude veut que la variable rciproque soit note q (ou k) quand la variable directe
est x, et (ou ) quand la variable directe est t. En prenant la TF des deux cts de
lquation, on obtient
x()
y() = (4.5)
( 2 + i + 02 )
Le signal en entre x(t) est la superposition doscillations pures exp(it), chaque
oscillation ayant un poids x(). Lquation (4.5) montre comment le poids de chacune
de ces oscillations est modifi en sortie. Le signal (temporel) en sortie est la superposi-
tion de ces oscillations avec le poids y(). Lamplitude du poids de la frquence en
entre est donc divise par [( 2 02 )2 + 2 2 ]1/2 . Chaque composante de sortie subit
galement un dphasage = arctan[(02 2 )/].
Il existe bien sr autant de filtre que de problme traiter. Les images issues de la
microscopie lectronique sont souvent brouilles par des pixels alatoires. Pour net-
toyer ces images, on filtre les hautes frquences : on prend la TF de limage (cest une
TF deux dimensions) et on coupe les hautes frquences, en multipliant la TF par une
fonction dHeaviside H(q0 q) o q0 est la frquence (spatiale) de coupure. On prend
alors la TF inverse et limage rsultantes a t nettoy du bruit alatoire. Bien sr, dans
lopration, on a aussi perdu peut-tre quelques informations. Lopration peut-tre
rsum comme suit : In (x) = TF-1 [H(q0 q)TF[I(x)] ].

TF de H(t) cos(0 t).


Nous souhaitons calculer la TF de la fonction f (t) = H(t) cos(0 t) o H(t) est
la fonction dHeaviside. Cela parat priori problmatique, la fonction cos(0 t) ne
tendant pas vers zro pour t +. Calculons plutt la TF de la fonction f (t) =
H(t) exp(t) cos(0 t). Pour > 0, cette fonction converge rapidement vers zro et
son intgrale est trs bien dfinie. Donc,

1  (i0 )t 
f () = e + e(+i0 t) eit dt
2 0
+ i
=
( + i)2 + 02

Maintenant, si on prend la limite 0, nous voyons que f (t) f (t) (pas unifor-
mment ), et que la transforme de Fourier tend galement vers une limite bien dfinie.
Nous posons donc :

f() = i 2
0 2

46
4 Les transformations de Fourier.

Bien sr, si on voulait prendre la TF inverse, on aurait nouveau des problmes pour
lintgration autour des singularits = 0 . On sen sort en prenant la valeur prin-
cipale des intgrales. Quelques connaissances de la thorie dintgration dans le plan
complexe nous montre alors quon trouve bien le bon rsultat 1 . Le lecteur peut dmon-
trer, en suivant une dmarche analogue, que
0
TF [H(t) sin(0 t)] =
02 2

Thorie de la diffraction de la lumire et de la formation dimage.


Considrons un rayon de lumire qui se propage dun point A un point B . Si la
phase du champs au point A est exp(i0 t), elle est de exp(i0 t + ) au point B. 0 est
( 2 prs) la frquence de la lumire (de lordre de 1014 s-1 pour la lumire visible) et
est le dphasage d au temps que la lumire met pour aller de A B (distant de l) :
AB l
= 0 t = 2f = 2
c
o est la longueur donde de la lumire (entre 0.3 et 0.8 micron pour la lumire
visible). Le lecteur connat sans doute tout cela depuis le premier cycle universitaire.
Chaque point dun objet recevant une onde lumineuse peut tre considr comme
une source secondaire. Si a exp(i0 t) est le champs qui arrive au point P , le champs
mis est ar exp(i0 t + i). Le coefficient r ( 1) dsigne labsorption de la lumire au
point P . Le coefficient est le dphasage induit au point P si par exemple en ce point,
le matriaux a un indice diffrent de son environnement. Le coefficient complexe T =
r exp(i) est le coefficient de transmission du point P . Un objet est donc caractris
par une fonction complexe f (x) qui est son coefficient de transmission pour chacun de
ses points x.
Considrons maintenant une onde plane arrivant sur un objet (qui pour plus de sim-
plicit, nous considrons unidimensionnel) et un point P linfini dans la direction
(Fig. 4.2(a)). Le champ reu en ce point est la somme des champs secondaire mis par
les divers points de lobjet. Par rapport au rayon OP que lon prend comme rfrence,
le rayon AP aura un dphasage de = 2AA0 / = (2/)x sin(). En appelant
q = (2/) sin(), et en appelant f (x) la fonction de transmission de lobjet, nous
voyons que le champs au point P vaut

f (x) exp(iqx)dx

qui nest rien dautre que la TF de la fonction f .


Mettons maintenant une lentille une distance U en face de lobjet, une image se
formera dans un plan distance V de la lentille (Fig. (b)). Les rayons qui partaient dans
1. Cela est en dehors du champs de ce cours.

47
4 Les transformations de Fourier.

Figure 4.2 Formation dimage vu comme une double transforme de Fourier.

la direction vont maintenant se focaliser dans le plan focal arrire de la lentille (distant
de F ) en un point P dont la coordonne x0 vaut F tan F sin tant que langle
nest pas trop important. Nous en dduisons lintensit du champ g(x0 ) dans le plan
focal arrire de la lentille :
 
2 0 2 0
g(x0 ) = f (x) exp i( )x .x dx = f( x)
F F
Il nest pas trop difficile de dmontrer que limage forme est la TF du plan focal arrire,
nous laissons cela au soin du lecteur. La formation dimage peut donc tre vu comme
une double transformation de Fourier. Cela ouvre de grandes perspectives pour effec-
tuer des oprations de filtrage directement dans le plan focal arrire (pfa) dune lentille.
Voir des objets transparents, comme par exemple des cellules dans leau nest pas pos-
sible en microscopie classique. Zernik, dans les annes 1950, a invent une technique
appele contraste de phase, qui consiste introduire des filtres dans le pfa de lobjectif
et permet la visualisation des objets transparents sous microscope.

nergie inject dans un oscillateur.


Soit une particule dans un puits harmonique (Ep = (1/2)kx2 ) soumis une force
extrieure F (t). Nous dsirons savoir quelle nergie cette force transfert la particule.
L quation du mouvement scrit :
d2 x
+ 02 x = (1/m)F (t) (4.6)
dt2
o 02 = k/m est la frquence propre doscillation de la particule. Nous supposons
quau temps T1 du dbut, loscillateur est au repos. Lnergie totale transfre loscil-
lateur est donc la somme de son nergie cintique et potentielle au bout dun temps T2
(que nous prendront gale + par la suite).

48
4 Les transformations de Fourier.

Notons tout de suite que la gauche de lquation (4.6) peut scrire (d/dti0 )(d/dt+
i0 )x. Comme nous allons voir, cette dcomposition a son utilit. En mcanique quan-
tique, on appellerai lanalogue de ces termes des oprateurs de cration et dannihilation
qui sont frquemment utilis. Par ailleurs, H, Lnergie totale 2 du systme (cintique
+ potentielle ), scrit :
(2/m)H = (dx/dt)2 + 02 x2
= (dx/dt i0 x)(dx/dt + i0 x)
Si on pose z = dx/dt + i0 x, nous aurons alors (2/m)H = zz , et lquation (4.6) se
transforme en
dz/dt i0 z = (1/m)F (t) (4.7)
Lnergie transfre loscillateur est E = H(T2 ) H(T1 ) = H(T2 ). Multiplions
maintenant les deux cots de lquation (4.7 ) ci-dessus par exp(i0 t) et intgrons
entre T1 et T2
T2 T2
i0 t
(dz/dt i0 z)e dt = (1/m) F (t)ei0 t dt
T1 T1

Il nous suffit maintenant deffectuer une intgration par partie du ct gauche de lin-
tgrale et dutiliser le fait que loscillateur est au repos linstant T1 pour trouver que
ce ct vaut z(T2 ) exp(i0 T2 ). Comme en plus loscillateur est au repos avant T1 , on
peut tendre lintgrale . Quand T2 +, le ct droit devient gale la TF de
F value pour la frquence 0 , et nous avons
1
E = F (0 )F (0 )
2m
Pour connatre lnergie totale transfre loscillateur, nous navons pas rsoudre
lquation diffrentielle de second ordre avec second membre, valuer simplement la
TF de la Force applique la frquence propre de loscillateur nous suffit.

Exercices. Vous pouvez donc facilement calculer lnergie transfre dans les cas
suivants :
4.8 F (t) = f0 et/t0 si t 0 ; sinon, F (t) = 0.
4.9 F (t) = f0 (t/t0 )
4.10 F (t) = f0 si t 0 ; sinon, F (t) = 0
4.11 F (t) = f0 cos(1 t)
Dans les cas 4.8 et 4.9, discutez le transfert dnergie en fonction du temps t0 . Pour r-
soudre le cas 4.10 et 4.11, vous aurez besoin des rsultats sur les distributions disponible
dans les prochains chapitres.
2. En mcanique analytique, on appelle Hamiltonien lnergie totale du systme, do le H. Comme le
systme nest pas isol, H nest pas une constante du mouvement : H = H(t)

49
4 Les transformations de Fourier.

4.5 Relation entre les sries et les transforms de


Fourier.
Nous avons indiqu au dbut du chapitre, sans le dmontrer, que lon passe des sries
au transforms de Fourier en laissant la longueur de lintervalle L tendre vers linfini.
Revoyons ce passage avec quelques dtails maintenant. Considrons une fonction f (x)
sur lintervalle [L/2, L/2]. Ses coefficients de Fourier (complexe) sont donns par

1 L/2
cq = f (x)eiqx dx
L L/2

o pour plus de simplicit, nous notons q = 2n/L. Dsignons par I(q) lintgrale
ci-dessus (sans le facteur 1/L donc). Par dfinition, nous avons pour f (x) :
X
f (x) = (1/L)I(q)eiqx
q,2/L

o dans la somme, lindice q varie par pas discret dq = 2/L. Quand L , dq 0


et par dfinition de lintgrale de Riemann, la somme ci-dessus tend vers
+
1
f (x) = I(q)eiqx dq
2

Par ailleurs, il est vident que quand L , I(q) tend vers f(q) donne par lquation
(4.4).

4.6 Approfondissement : TF plusieurs dimensions.


Nous nous occupons dans ce cours essentiellement des fonctions une seule variable
f (x). Ces concepts cependant se gnralisent sans problme plusieurs variable. Si
nous notons les variables de faon vectorielle
x = (x1 , x2 , ..., xd )
alors la TF est dfinie comme

f(k) = f (x)eik.x dx (4.8)
Rd

o k.x = k1 x1 + ...kd xd dsigne le produit scalaire. De mme, la TF inverse est



1
f (x) = f (k)eik.x dk
(2)d Rd
tudions deux cas particuliers que nous rencontrons souvent.

50
4 Les transformations de Fourier.

1.0
0.8
0.6
0.4
0.2

5 10 15 20
-0.2
-0.4

Figure 4.3 La fonction J0 (x)

4.6.1 Symtrie cylindrique.


Dans le premier cas, d = 2 et la fonction est symtrie cylindrique : f (x) = f (r) o
r2 = x21 + x22 . La fonction f (x, y) = 1/(x2 + y 2 ) en est un bon exemple. Il est vident
que dans un tel cas, nous avons intrt utiliser les coordonnes polaire. Dans ce cas,
2

f (k) = f (r)eik.x rdrd
0 0

Le problme consiste calculer le facteur exp(ik.x). La coordonnes dsigne langle


entre le vecteur x et laxe des x. Cependant, si nous tournons laxe des x pour laligner
sur laxe de k, la fonction f (x) ne change pas, puisquelle est de symtrie cylindrique.
Dans ce cas, dsigne langle entre le vecteur x et le vecteur k et
k.x = kr cos
p
o k = k12 + k22
Lintgration sur nous donne
2
eikr cos d = 2J0 (kr)
0

La fonction J0 (z) est appele la fonction de Bessel dordre 0 et apparat en physique


mathmatique de trs nombreuse endroit. Les fonctions de Bessel jouent le rle des
fonctions trigonomtrique en coordonnes polaires. Nous avons donc

f(k) = 2 rf (r)J0 (kr)dr (4.9)
0

Il est vident que la fonction f(k) est galement de symtrie cylindrique et la TF inverse
est
1
f (r) = kf (k)J0 (kr)dk
2 0

51
4 Les transformations de Fourier.

4.6.2 Symtrie sphrique.


tudions maintenant le cas d = 3 o la fonction est symtrie sphrique. En rptant
les arguments ci-dessus pour les coordonnes sphriques, nous aboutissons
2
f(k) = f (r)eik.x r2 sin drdd
0 0 0

Lintgration sur nous donne juste un facteur 2. Par ailleurs,



sin(kr)
eikr cos sin d = 2
0 kr

et donc finalement
4
f(k) = rf (r) sin(kr)dr
k 0
En faisant le mme chemin pour la TF inverse, nous avons

1
f (r) = kf (k) sin(kr)dk
r 0
4.12 Calculer la Transforme de Fourier de

r2
 
1
f (x) = exp
d/2 4

aux dimensions d = 1, 2, 3.

52
5 Les distributions.
5.1 Ce quil faut savoir.
Les transformes de Fourier nous posent quelques problmes quant la dfinition
dune base orthogonale. Nous avons vu que, sur lintervalle ] , +[, la fonction
f (x) peut tre reprsente comme la superposition des fonctions exp(iqx) avec le poids
f(q). Pour en revenir notre image de base dans lespace des fonction, les fonctions
eiq(.) (q R) forment une base, et les coefficients f(q) sont les projections du vecteur
f (.) sur les vecteurs de cette base.
Nous avions aux sections prcdentes bas nos dmonstrations sur le concept dor-
thogonalit. Mais peut on dire que exp(iq1 x) et exp(iq2 x) sont orthogonales ? Le pro-
duit scalaire a t il encore un sens ? En effet, comment dfinir la valeur de
+
exp(iq1 x) exp(iq2 x)dx (5.1)

qui au sens normal de la thorie dintgration, na aucun sens ?


Il faut comprendre Le produit scalaire (5.1) dans le sens suivant dun passage la
limite :
1 +L/2
lim exp(iq1 x) exp(iq2 x)dx (5.2)
L L L/2

Quand q1 6= q2 , lintgrale est au plus de lordre de 1 et le (1/L) fait tout tendre vers
zro. Par contre, si q1 = q2 , lintgrale vaut L et lexpression (5.2) vaut 1. Le produit
scalaire (5.1) est donc de lordre de L ( avec L ) pour q1 = q2 et de lordre de 1
sinon. Nous noterons ce genre dobjet (q1 q2 ) et nous lappellerons le delta de Dirac,
du nom du physicien qui a tabli les rgles de manipulation de ces objets dans son livre
sur la mcanique quantique en 1930.
Pour un physicien, le concept de la fonction est trs intuitif et gnralise le concept
de charge ou de masse ponctuel. Supposez que vous ayez des charges rpartit conti-
nuellement dans lespace avec une densit (x) et que vous voulez calculer la charge
totale contenue dans une sphre de rayon R autour dun point. Rien de plus simple,il
suffit dintgrer la densit autour C = V (x)dx. Supposez maintenant que R 0,
cest dire que vous prenez des sphres de plus en plus petite autour de votre point. Il
est vident quil y aura de moins en mois de charge lintrieur et que C 0. Cest
vrai, sauf si vous avez plac une charge ponctuelle au point considr. Pour une charge

53
5 Les distributions.

ponctuelle Q, quel que soit la taille de la sphre autour, la quantit totale de la charge
lintrieur reste constante. En gros, pour une charge ponctuelle place en x0 , la densit
de charge est nulle partout, sauf en x0 o elle est infinie ! Ce genre de densit infinie
en un point, nulle partout et dont lintgrale est finie est justement un delta de Dirac.
Les mathmaticiens nous excuteraient si on appelait ces objets des fonctions et nous
obligent les nommer des distributions. La proprit du delta de Dirac est la suivante :

(x)dx = 1 I 3 0 (5.3)
I

Du moment que lintervalle I contient 0, lintgrale vaut 1, sinon elle vaut zro. Lob-
jet de ce chapitre est de se familiariser avec les distributions, et en particulier avec la
distribution de Dirac.
On peut voir (x) comme un processus de limite. Prenons le cas de la fonction
1 2
fa (x) = e(x/a)
a
Cest une gaussienne centre sur 0, et son intgrale vaut 1. Quand a 0, elle devient de
plus en plus pique, avec une extension de moins en moins large, mais lintgrale reste
constante. On peut dire la mme chose de la fonction ga (x) = (1/2a)(x/a) ou en
fait de nimporte quelle fonction qui, lors dun processus de passage la limite, rduit
son extension, augmente lamplitude de son pique, et garde son intgrale constante. La
distribution (x) est la limite de ce genre de fonction.
La dfinition (5.3) nous permet quelques gnralisations. Par exemple, on peut dfinir
3(x), la distribution dont lintgrale vaut 3 sur des intervalles contenant 0. On peut
mme dfinir f (x)(x) o on suppose f (x) continue en 0. Lintgrale vaut :
+ +
f (x)(x)dx = lim f (x)(x) = f (0)
0 

Vous pouvez dmontrer cela facilement en utilisant la dfinition de la continuit dune


fonction. Mais intuitivement, cela parat vident : comme (x) est nulle partout sauf en
0, le multiplier par f (x) revient simplement le multiplier par f (0). En fait, on utilise
cela comme la dfinition de la distribution (x) :

f (x)(x)dx = f (0) I 3 0 (5.4)
I

(x)
est une distribution centre sur 0. (x x0 ) est une distribution centre sur x0
et (x x0 )f (x) = f (x0 ). Finalement, les rgles pour manipuler les ne sont pas
vraiment compliques.
Une dernire chose savoir sur (x) est sa transforme de Fourier ( on pose dorna-
vant R =] , +[ :

(q) = (x) exp(iqx)dx = 1
R

54
5 Les distributions.

La TF de (x)est la fonction constante 1. Cela veut dire que (x) est la superposition,
poids gal, de toutes les modulations exp(iqx) ! Cela nest pas vraiment tonnant :
comme (x) varie vraiment trs rapidement, toutes les modulations doivent y tre pr-
sent. Inversement,
1
exp(iqx)dq = (x) (5.5)
2 R
Exercice : Dmontrer
que la fonction dfinie par (5.5) est bien une de Dirac, cest
dire que R (x)f (x) = f (0).

La dimension de la distribution . En mathmatique, nous manipulons essentielle-


ment des chiffres, cest dire des nombre sans dimensions. En physique cependant, les
quantits que nous manipulons reprsentent des grandeurs telles que des longueurs,
nergies, temps, vitesses, etc. Ces grandeurs ont des dimensions. Les physiciens at-
tachent beaucoup dimportance cette question pour plusieurs raisons. Une de ces
raisons est purement gramaticale et permet de vrifier la cohrence des divers tapes
dun calcul. Prenons le cas dune quation diffrentielle du genre d2 y/dt2 + 02 y = f0
et supposons que nous avons trouv y = f0 sin(0 t). Si y reprsente une quantit de
dimension [y], alors [0 ] = T 1 et [f0 ] = [y]T 2 . Ceci est ncessaire si nous voulons
que les deux cots de lquation aient la mme dimension. La dimension du ct gauche
de la solution est [y]. Comme la fonction sin na pas de dimension, le cot droit de la
solution a la dimension de [y]T 2 ! Les deux cots de la solution nont pas la mme
dimension et nous nous sommes manifestement tromp une tape de la rsolution.
Ces vrifications peuvent (et doivent ) tre effectues chaque tape du calcul.
Comme nous manipulerons pas mal les distributions par la suite, nous avons besoin
de connatre leurs dimensions. Les fonctions sin(x) et exp(x) nont pas de dimensions.
Quen est-il de la distribution (x)
? Pour cela, il faut dabord rpondre la question de
la dimension de ydx. Le signe nest quune gnralisation de lopration addition. La
dimension d une pomme + une pomme est toujours une pomme. Le signe d signifie
une trs petite quantit de et la dimension dune trs petite quantit de pomme est
toujours une pomme. Nous en dduisons de tout cela que [ ydx] =[y][x]
Nous pouvons maintenant utiliser la proprit de la distribution : (x)f (x)dx =
f (0). Il est alors ais de voir que [(x)] = [x]1 ! Nous aurions pu bien sr arriver au
mme rsultat en utilisant lexpression par passage la limite (x) = (1/a) exp(x2 /a2 )
quand a 0. Voil, il faut avoir cela en tte chaque fois que lon veut vrifier la co-
hrence des quations qui impliquent des .

5.2 Un peu de dcence.


Du point de vue du mathmaticien, ce que nous avons racont plus haut est, en res-
tant poli, mal propre. Laurent Schwarz, dans les annes 1950, a rendu rigoureux la tho-
rie des distributions. Il est utile de connatre les grandes lignes de sa construction. Il est

55
5 Les distributions.

parti de la constatation que les distributions ne sont utilises en pratique que sous le
signe intgral, comme en (5.4).
Une fonctionnelle est une gnralisation dune fonction. Elle prend une fonction en
entre et produit un scalaire en sortie. Cest une fonction de fonction en quelque sorte.
Notons que la TF nest pas une fonctionnelle, puisquelle produit une fonction en sortie.
Appelons E lespace des fonctions 1 , et F lespace des fonctionnelles linaires (ou dit
plus srieusement, des formes linaires dfinies sur E). Un exemple de fonctionnelle est
Lexp(x2 ) qui prend une fonction en entre, calcul son produit scalaire avec la fonction
exp(x2 ), et produit ce chiffre en sortie :

Lexp(x2 ) [f ] = exp(x2 )f (x)dx
R

Nous pouvons gnraliser cet exemple : chaque fonction g E, nous pouvons associer
une fonctionnelle Lg F tel que

Lg [f ] = f (x)g(x)dx
R

Et nous pouvons dmontrer facilement que ce Lg est bien une fonctionnelle linaire.
Nous pouvons trouver beaucoup dautres fonctionnelles linaires. Par exemple, la fonc-
tionnelle x0 est dfinie par
x0 [f ] = f (x0 )
Voil, le tour est jou. Cette fonctionnelle est bien le delta de Dirac (xx0 ) dfinie plus
haut. Noter bien lopration : on peut identifier une partie de lespace F avec lespace
E via ces Lg que nous avions construit : chaque lment de E nous pouvons faire
correspondre un lment de lespace F. Mais lespace F est plus vaste, et quelques
uns de ses lments supplmentaires constituent les distributions inhabituelles. Cest
un peu comme enrichir lensemble des nombres rationnels Q pour arriver lensemble
des nombres rel R.
On peut dfinir des oprations sur les distributions. Il est toujours plus simple de
partir des distributions du genre Lg dont le sens est familier pour dfinir ensuite les
mmes oprations sur les distributions du genre . Par exemple, que veut dire Lg0 ? En
intgrant par partie, on trouve

0
Lg [f ] =
0 g (x)f (x)dx = g(x)f 0 (x)dx = Lg [f 0 ]
R R

(Noublions pas que comme f et g sont au moins sommable, elle tendent vers zro pour
x ). On peut donc dfinir :

x0 0 [f ] = x0 [f 0 ] = f 0 (x0 )
1. En ralit, lespace des fonctions support born et infiniment drivable, mais nous ne sommes pas
notre premier dlit.

56
5 Les distributions.

ou dans le langage moins lgants des physiciens,



0
(x x0 )f (x)dx = f 0 (x0 )

De mme, nous pouvons dmontrer que pour la fonction dHeaviside H(x), H 0 (x) =
(x). Nous ne continuerons pas plus le dveloppement formel des distributions. Mais
la constructions de Schwarz est extrmement lgante et nous conseillons au lecteur
de voir au moins une fois les bases rigoureuses de cette construction.
Nous voyons cependant que lespace plus large des distributions nous permet de
manipuler aisment des objets qui nous semblaient interdit. Une force ponctuelle a un
sens. Une discontinuit galement. En physique, une fonction ne peut pas tre disconti-
nue. La densit de leau ne saute pas de l v linterface liquidesolide, il existe une
couche dpaisseur petite (trs petite devant les autres chelle de longueur) o la den-
sit varie continuellement dune valeur une autre. La lumire rflchit par un miroir
pntre sur une petite longueur dans le miroir o son intensit dcrot exponentielle-
ment et ainsi de suite. Nous pouvons donc caractriser les discontinuit des fonctions
par des distributions. Soit la fonction f (x) = g(x) + H(x x0 ) , o la fonction g est
une fonction continue et drivable en x0 . La fonction f par contre, saute de la valeur
g(x0 ) x +
0 + g(x0 ) x0 . Au sens des distributions, la driv de f est donne par
f 0 (x) = g 0 (x) + (x x0 ). Imaginez donc f 0 comme une fonction normale, avec une
flche positionne en x0 .

Exercices.
5.1 En utilisant la dfinition (5.4), dmontrer que lexpression (5.1) gale (q1 q2 ).

5.2 Que valent 0 (x) et (x) ?

5.3 Soit une fonction Lpriodique f . Que vaut sa TF (au sens des distributions) ?

5.4 Une peigne de Dirac est dfini par (x) = +


P
n= (x n). Cest comme si nous avions
pos un delta de Dirac sur chaque nombre entier. Quelle est la TF de (x/a) ?

5.5 Dmontrer que (x + a) = (x) + a 0 (x) + (1/2)a2 00 (x) + ... On peut faire un d-
veloppement de Taylor des comme pour les fonctions usuelles. Pour pouvoir dmontrer cette
galit, appliquer les deux cts de lgalit une fonction f

5.6 Dmontrer que (x) = (x) et (ax) = (1/|a|)(x).

5.7 Considrons une fonction g(x) avec un zro simple en x0 : g(x0 ) = 0, g 0 (x0 ) 6= 0. Prenons
un intervalle I = [x0 a, x0 + a] autour de x0 (on peut supposer a aussi petit que lon veut).
En dveloppant g autour de sa racine lordre 1, dmontrez que

1
(g(x))f (x)dx = 0 f (x0 )
I |g (x 0 )|

57
5 Les distributions.

5.8 En supposant que la fonction g(x) na que des racines simples, et en utilisant le rsultat
ci-dessus, dmontrer :
X 1
(g(x)) = 0 (x )|
(x xi )
i
|g i

o les xi sont les racines simples de g(x). Donner lexpression de (x2 a2 ).


5.9 En vous inspirant du rsultat de la question 5, pouvez-vous indiquer pourquoi dans la
question 7, nous pouvions nous restreindre un dveloppement dordre 1 ?

5.3 Manipulation et utilisation des distributions.


Oscillateur soumis une force priodique. Il obit lquation d2 x/dt2 + 02 x =
A exp(i1 t). En prenant la TF des deux cts, nous avons :
2A( 1 )
x() =
02 2

comme x(t) = (1/2) x() exp(it)d, nous trouvons
A exp(i1 t)
x(t) =
02 12
Nous connaissions ce rsultat depuis lexercice sur le filtrage.

Oscillateur amorti soumis une force impulsionnelle. Un oscillateur amorti


soumis une force F (t) obit lquation
d2 y dy
m + + ky = F (t)
dt2 dt
Nous souhaitons connatre la rponse de loscillateur une force impulsionnelle F (t) =
F0 (t). Ceci est lidalisation dun coup de marteau trs bref et trs puissant sur loscil-
lateur. Pour simplifier le problme, nous supposons dans un premier temps que la masse
est ngligeable ( que les forces dinertie sont petites devant les forces de frottement )
et que loscillateur est au repos. En renormalisant nos coefficients, lquation prend la
forme :
dy
+ y = f0 (t) (5.6)
dt
et en prenant la TF des deux cots, nous trouvons que y() = f0 /( + i). Il suffit
maintenant de prendre la TF inverse. Il se trouve que dans ce cas, si lon se souvient de
lexercice (4.1 :4.2), nous pouvons directement crire
y(t) = f0 H(t) exp(t) (5.7)
Ce rsultat est reprsent sur la figure (5.1). Nous suggrons au lecteur de discuter les
limites 0 et .

58
5 Les distributions.

1 1

F(t) y(t)
0.5 0.5

0 0

-2 -1 0 1 2 3 4 -2 -1 0 1 2 3 4
t

Figure 5.1 Reponse dun oscillateur amortie une force impulsionnelle. La distribu-
tion est reprsente par une flche verticale.

quation de la chaleur avec une source ponctuelle. Une goutte dencre extrme-
ment concentre, dpose en un point de lespace va se diluer par diffusion. La mme
chose est valable pour un pulse ponctuel de chaleur. Comme nous lavons vu prc-
demment, les phnomnes de diffusion sont gouverns par lquation de la chaleur :

u 2u
= D 2 + Q(x, t)
t x
o u dsigne la temprature ou la concentration et Q est un terme de source. Dans le
problme qui nous intresse ici, Q(x, t) = Q0 (x)(t). En prenant la TF par rapport
la variable despace x, nous avons :

t u(q, t) + Dq 2 u(q, t) = Q0 (t) (5.8)

Mais cette quation est exactement eq.(5.6), celle quon a crit pour loscillateur amorti.
Cest bien une quation diffrentielle ordinaire par rapport la variable temps, et q
peut tre considre comme une constante : Pour chaque mode q, nous avons une EDO
indpendante. La solution est donc analogue (5.7), et scrit :

u(q, t) = Q0 H(t) exp(Dq 2 t)

Il nous suffit maintenant de prendre la TF inverse pour obtenir la solution dans lespace
direct :
+
1
u(x, t) = u(q, t).eiqx dq
2
x2
 
Q0 1
= exp
2 Dt 4Dt

59
5 Les distributions.

0.8

0.6

0.4

0.2

0
-4 -2 0 2 4
x

Figure 5.2 profil de concentration en fonction de x, diffrent temps t =


0.1, 0.2, 0.5, 1, 2. Ici, D = 1/4. La distribution originale, en (x), est re-
prsent par une flche verticale.

La dernire intgrale sobtient facilement par les techniques que nous avons dj utilis.
Lvolution de u(x) pour diffrente valeur de t est reprsente sur la figure (5.2).
Extension (difficile) : si la source nest pas ponctuelle dans le temps, mais seulement
dans lespace, i.e. Q(x) = Q0 (x), quel est le comportement de la solution ? Help : Es-
sayez comme avant dobtenir une expression pour u(q, t). Cette expression est trop
complique pour inverser, mais t u(q, t) lest beaucoup moins. En changeant alors
lordre des opration TF-1 et t , vous pouvez obtenir une expression pour t u(x, t).
Il vous suffit alors dvaluer

u(x, ) = t u(x, t)dt
0

Il nest pas difficile alors dobtenir le comportement asymptotique de u pour t .

quation donde avec source ponctuelle. Considrons une corde tendue infinie et
au repos linstant initial. A linstant t = 0, on la soumet une force ponctuelle dans
le temps et dans lespace (lidalisation dun marteau de piano tapant sur la corde).
lquation donde scrit
2u 2u
2
v 2 2 = (x)(t)
x x
En suivant la mme dmarche que ci-dessus, on peut obtenir la propagation de londe.
on peut galement montrer que lextension du domaine ou u 6= 0 croit la vitesse v.

Vitesse de phase, vitesse de groupe. Donnons nous un signal u(x, t) qui se pro-
page (Fig.5.3). Comment devrait on dfinir la vitesse du signal ? On pourrait par exemple
reprer le maximum de u et suivre ce point en fonction de temps ; ceci nest pas trs bon

60
5 Les distributions.

Figure 5.3 un signal u(x, t) en fonction de x trois temps t diffrents, se propageant


vers la droite.

cependant, puisque le signal peut se dformer et notre maximum disparatre ou dautres


maxima apparatre. Nous devons dfinir la vitesse en prenant en compte lensemble du
signal. Une bonne dfinition est par exemple de suivre le barycentre du signal, ou mme
mieux, le barycentre du carr du signal pour viter les compensations de signe :

x(t) = xu2 (x, t)dx
I
Notons que dans la plupart des exemples physique, le carr du signal est reli au concept
lnergie.
de
2
Par la suite, sans perte de gnralit, nous supposons notre signal norm :
I
u (x, t)dx = 1. Supposons par exemple que notre signal se propage sans se dformer
u(x, t) = u0 (x ct) et nous avons alors

x(t) = xu0 (x)dx + ct u20 (x)dx
2
I I
= x0 + ct
ce qui correspond bien notre intuition de la vitesse dun signal.
En utilisant la dfinition des TF et de la distribution (x), il est facile de dmontrer
que (cf exercice) :  
u(q, t)
x(t) = i u (q, t)dq (5.9)
I q
o u(q, t) est la TF de u(x, t) par rapport x. Reprenons nouveau notre signal qui
se propage sans se dformer : u(x, t) = u0 (x ct). Par la rgle des manipulation des
TF, nous savons quune translation dans lespace direct revient multiplier par une
exponentielle complexe dans lespace rciproque :
u(q, t) = u0 (q).eiqct
En remplaant dans lexpression (5.9), nous voyons que cela nous donne

x(t) = x0 + ct u0 (q)u0 (q)dq
I
= x0 + ct

61
5 Les distributions.

puisque, par la relation de Parceval, I u0 (q)u0 (q)dq = I u20 (x)dx.
En gnral le facteur qui multiplie le temps dans lexponentiel complexe est appel la
frquence angulaire , qui dans ce cas simple de signal se propageant sans dformation
scrit
= cq
et nous voyons que nous pouvons dfinir la vitesse comme
d
c=
dq
Prenons maintenant le cas plus gnral de signaux se dformant en se propageant. Il
existe un cas trs important appel milieu dispersif, o la dformation du signal prend
une forme simple dans lespace rciproque :
u(q, t) = u0 (q)ei(q)t
cest dire que le mode q est pondr par un facteur de phase (q)t au temps t, avec une
forme (q) quelconque, sans plus ncessairement tre proportionnel au mode q. Dans
le cas dun cristal par exemple, on peut dmontrer (voir le problme correspondant
au chapitre sur les sries de Fourier) que (q) = A sin(q). Nous pouvons nanmoins
calculer la vitesse du barycentre du signal comme avant :
 
d
x(t) = x0 + t u0 (q)u0 (q)dq
I dq
Si (q) varie de faon lente par rapport u0 (q)u0 (q), et que ce dernier possde un pic
troit en q0 , alors une bonne approximation pour la vitesse du barycentre serait

d
c=
dq q=q0
Ceci est ce quon appelle la vitesse du groupe. Lexpression /q, ayant un sens pour les
signaux se propageant sans dformation, sappelle la vitesse de phase.

Bruit de Langevin.(transfrer au chapitre prochain) (Bien expliquer la significa-


tion de <>). Langevin a trouv, vers 1910, une faon extrmement lgante de traiter le
mouvement Brownien, en considrant une particule soumise aux quations classiques
du mouvement et une force alatoire :
d2 x dx
m + = (t)
dt2 dt
est la viscosit et (t) une force alatoire. Nous ne connaissons de cette force que ses
caractristiques stochastiques : La moyenne de
cette force
est nulle, h(t)i = 0 et sa
variance est proportionnelle la temprature : 2 (t) = T . Dautre part, cest un
bruit blanc : si nous connaissons la valeur de cette force un instant, nous ne pouvons
rien dire sur sa valeur quelque temps que ce soit aprs.

62
5 Les distributions.

y y
f f
a a
x x

(a) (b)

Figure 5.4 la flche dun pont sous leffet dune force ponctuelle.

5.4 Exercices .
5.10 Que valent les distributions (x) cos(qx), (x) sin(qx) et 0 (x) sin(qx) ?
5.11 En drivant directement la fonction y(t) = (f0 /0 )H(t) sin(0 t), dmontrer quelle est
la solution de y + 02 y = f0 (t).
5.12 Dmontrer que tH(t) est la primitive de H(t). En utilisant une intgration par partie,
trouver la primitive de tH(t).
5.13 Une particule initialement au repos de masse m soumise une force impulsionnelle
obit lquation my = f0 (t). En intgrant directement et en utilisant les conditions initiales,
trouver la solution. Trouver la mme solution en considrant la particule soumise une force
constante avec une certaine dure f = (f0 /2T )(t/T 1) et faire tendre ensuite la dure vers
zro.
5.14 Intgrer directement lquation dy/dt + y = f0 (t) en utilisant la mthode de la
variation des constantes.
5.15 Llasticit des barres est donne par lquation

Bd4 y/dx4 = F (x)

o F (x) est la densit de force (force par unit de longueur) applique au point x et B une
constante qui donne lamplitude de la rigidit de la barre et quon appelle module de courbure.
Cest par exemple cette quation qui donne la flche dun pont sous leffet dune charge. Nous
souhaitons connatre la flche dun pont de longueur L sous leffet du mouvement dun camion
la position a dessus. Comme les dimensions du camion sont petit par rapport au pont, on le
modlise par une distribution de Dirac. En rsolvant donc lquation y (4) = f0 (x a) trouver
la forme du pont. Nous utiliserons deux formes de conditions aux limites : (i) pont pos sur des
piliers, y(0) = y(L) = 0 ; y(0) = y(L) = 0 (figure 5.4.a ; (ii) pont ancr aux deux bouts
y(0) = y(L) = 0 ; y 0 (0) = y 0 (L) = 0 (figure 5.4.b) . Pour quelle valeur de a la flche est
maximum ?
5.16 Dmontrer que
xu2 (x)dx = u0 (q)u (q)dq
I I
o u(q) est la TF de u(x). Help : crire u0 (q) et u (q) parleurs dfinition des TF, former leurs
produit et intgrer sur q. Il suffira juste de remarquer que I exp(iq(x y))dq = 2(x y).

63
5 Les distributions.

5.5 Problmes.
Problme 5.1 Peigne de Dirac
Il est vident que lexpression
n=+
X
(x) = exp(2inx) (5.10)
n=

na pas de signification au sens des fonctions. Nous allons voir par contre quau sens des distri-
bution, elle est dfinie.
1. Expliquer simplement pourquoi lexpression (5.10) na pas de sens usuel de fonction.
2. A supposer que cette expression ait un sens, quelle
P+est sa priodicit ?
Soit la distribution peigne de Dirac W (x) = n= (x n) o (x) est la delta de
Dirac.
3. Dmontrer que la priode de W (x) est 1. Reprsenter graphiquement W (x).
4. Comme W (x) est de priode 1, la dcomposer en srie de Fourier sur lintervalle [0.5, +0.5],
cest dire trouver les coefficient an et bn tels que sur cet intervalle,

X
W (x) = a0 + an cos(2nx) + bn sin(2nx)
n=1
P+
(x n) = n=+
P
5. En dduire que n= n= exp(2inx).
6. Que pouvez vous dire maintenant de la transforme de Fourier dune peigne de Dirac ?

Problme 5.2 les sommes dAbel, les noyaux de Dirichlet.


0. Introduction. La convergence des sries de Fourier a jou un grand rle dans lavance de
lAnalyse au dbut du XIXme, et certains concepts trs proche des distributions invents pour
cela. Nous allons visiter quelques uns.
soit la fonction 2 priodique f (x), dont la srie de Fourier scrit :

X
f (x) = a0 + (an cos nx + bn sin nx)
n=1

Soit la fonction hN (x) la somme partielle des N premiers termes :


N
X
hN (x) = a0 + (an cos nx + bn sin nx)
n=1

1. Coefficients de Fourier. Dmontrer que


2
an cos nx + bn sin(nx) = (1/) f (y) cos (n(x y)) dy
0

2. Intervalle. Soit une fonction T priodique : g(y + T ) = g(y). Dmontrer alors que
a+T T
g(y)dy = g(y)dy
a 0

64
5 Les distributions.

6
2
5 6
16
4

DN
2

y
4 3 2 1 0 1 2 3 4

Figure 5.5 Le noyau de Dirichlet DN (y) pour plusieurs valeurs de N .

En dduire que
2
an cos nx + bn sin(nx) = (1/) f (x y) cos(ny)dy
0

3. Noyau de Dirichlet. Soit la fonction (appel le noyau de Dirichlet)

DN (y) = 1/2 + (1/) (cos y + cos 2y + ... + cos N y)

(figure 5.5). Dduire alors que


2
hN (x) = f (x y)DN (y)dy
0

En multipliant et divisant DN (y) par sin y/2, dduire

sin ((N + 1/2)y)


DN (y) =
2 sin(y/2)

Pouvez dire vers quoi tend DN (y) quand N [Help : Vers quoi tend hN (x) ?]
4. Les sommes dAbel. Certaines sries divergentes peuvent tre rgularises par la
Pproc-
r n un
P
dure dAbel : au lieu de considrer la srie S = un , on considre la srie S(r) =
o 0 r < 1 ; Une fois lePcalcul fait, on tudie la limite de S(r) pour r 1, quon appelle la
somme dAbel de la srie un .
Sachant la somme dune progression gomtrique

1 + + ... + n = (1 n+1 )/(1 )

dmontrer que
1 1 + 1 1 + ... = 1/2
au sens dAbel.
5. Somme dAbel du noyau de Dirichlet. Reprenons le noyau de Dirichlet pour N

D (y) = 1/2 + cos x + ...

65
5 Les distributions.

notons r (y) sa somme dAbel . En considrant rn cos nx comme la partie relle du nombre
complexe z n , dmontrer que

1 1 r2
r (y) =
2 1 2r cos y + r2

Quelle est la limite de r (y) quand r 1 ? Considrer sparment les deux cas y = 0 et y 6= 0.
Discuter ce rsultat.

66
6 Convolution et corrlation.
Deux concepts abondement utiliss en physique ( et bien dautres endroits ) sont les
convolutions et les corrlations. Les TF nous permettent de calculer ces choses de faon
assez simple.

6.1 Les convolutions.


Le produit de convolution f g de deux fonctions f et g est dfinie par
+
h(x) = (f g)(x) = f (s)g(x s)ds

6.1 dmontrer que le produit est commutatif : f g = g f .

Lendroit o lon rencontre frquemment ce produit est quand on mesure un signal.


Supposons que le signal quon mesure est lintensit lumineuse sur un cran, f (x).
Pour mesurer ce signal, lexprimentateur doit positionner son dtecteur un point x,
et mesurer son intensit. Bien sr, il va effectuer cette mesure en plusieurs points. Le d-
tecteur est cependant un instrument rel, de taille finie, disons 2` (et non infinitsimal).
Quand linstrument est positionne en x, toute la lumire dans lintervalle [x `, x + `]
rentre dans le dtecteur, et lexprimentateur mesure donc en faite la moyenne de lin-
tensit sur une intervalle autour du point x, et non la valeur exacte de lintensit en ce
point. videmment, plus ` est petit, meilleure est la prcision de lappareil. En terme
mathmatique, lexprimentateur enregistre le signal h(x) :
x+`
h(x) = f (s)ds
x`
+
xs
= f (s)( )ds
`
= (f ` )(x)

Ici, l (x) = (x/`) est la fonction de lappareil. Les fonctions dappareil peuvent avoir
des formes plus compliques, comme par exemple une gaussienne. Le facteur limitant
la prcision du signal est le pouvoir de rsolution ` de lappareil qui lisse et rend flou le
signal original. Par exemple, un objectif de microscope est un appareil de mesure dont
le signal mesur est limage forme. Ernst Abbe, physicien de la compagnie Carl Zeiss

67
6 Convolution et corrlation.

1.5 l=0.1
l=0.3
l=0.5
1 l=0.7

0.5

0
-3 -2 -1 0 1 2 3 4

Figure 6.1 La convolution du signal (x) + (x 1) par des gaussiennes Gl de dif-


frente largeur.

dans les annes 1890, a dvelopp la thorie de la formation dimage et dmontr que
le pouvoir de rsolution des objectifs et, au mieux, ` = /2N A, o est la longueur
donde utilise et N A est louverture de lobjectif (le sinus de langle maximum de cap-
ture de la lumire). Les microscopes optiques ne peuvent donc pas voir les chelles
plus petites que 0.2 micron.
6.2 soit le signal f (x) = (x) + (x x0 ), cest dire deux piques de Dirac distant de x0 .
Calculer et tracer le signal mesur si la fonction de lappareil est (i) l ; (ii) Gl = exp(x2 /2`2 ).
Traiter particulirement les cas x0  ` , x0  ` et x0 ` (voir figure 6.1). Pouvez vous
dterminer, pour la Gaussienne, , partir de quelle `, nous ne pouvons plus distinguer deux
piques spares ?

Les transformes de Fourier nous permettent de calculer facilement les produits de


convolution :
TF[f g] = TF[f ].TF[g]
La transforme de Fourier du produit de convolution de deux fonctions est le produit
(normal) de leurs transforme de Fourier. Soit h(x) = (f g)(x), alors
+ +
h(q) = dx eiqx ds f (s)g(x s)

+ +
= ds f (s) dx eiqx g(x s)

+ +
= ds f (s)eiqs dx eiqx g(x)

= f(q)g(q)

Calculer numriquement le produit de convolution dans lespace direct est de lordre de


N 2 , o N est le nombre de points dchantillonnage des fonctions. Par contre, prendre

68
6 Convolution et corrlation.

la TFR, effectuer une multiplication entre les TF et prendre une TFR inverse ne cotera
que N log N oprations.
Un autre endroit o lon rencontre frquemment les convolutions est la thorie des
probabilits et le thorme central limite. Soit deux variables alatoires continues X1 et
X2 indpendantes de densit f (x) et g(x). Cela veut dire que la probabilit pour quune
ralisation de X1 tombe entre x et x+dx est gale f (x)dx : Pr(x < X1 < x+dx) =
f (x)dx. Nous nous demandons maintenant si nous pouvons dterminer la densit de
probabilit h(z) de la variable Z = X1 + X2 .

h(z)dz = Pr(z < X1 + X2 < z + dz)


x1 =+
= Pr(z x1 < X2 < z x1 + dz)Pr(x1 < X1 < x1 + dx1 )
x1 =
+
= dz g(z x1 )f (x1 )dx1

Nous voyons donc que h(z) = (f g)(z).


6.3 Dmontrer que la densit de probabilit de la moyenne de deux variables alatoires est
donne par h(z) = 2(f g)(2z).

6.4 Dmontrer que le produit de convolution de deux gaussiennes de largeur l et p est encore
une gaussienne
x2
 
1 1
p exp 2
2 l2 + p2 2(l + p2 )
pour vraiment apprcier les TF, faire le calcul dabord dans lespace direct, et ensuite laide des
TF. Une gaussienne de largeur l est la fonction
1
exp(x2 /2l2 )
2l
Les rsultats ci-dessus sont important. Supposons que nous ayons deux variables
alatoires gaussienne de largeur l. Leur
moyenne est alors galement une variable ala-
toire gaussienne, mais de largeur l/ 2. Ce rsultat se gnralise
N variables ala-
toires : la moyenne est alors une gaussienne de largeur l/ N . La moyenne de N va-
riables alatoires est galement une variable alatoire, mais qui fluctue N fois moins
que les variables originales. Cest pour cette raison par exemple quun exprimenta-
teur, pour caractriser un phnomne physique, prend plusieurs mesures et calcule leur
moyenne (voir les problmes avancs).

Exercices :
6.5 Calculer (x) = ( )(x), et reprsenter le graphiquement.

6.6 Dmontrer que la distribution est lunit pour la convolution : f = f

69
6 Convolution et corrlation.

6.7 Que vaut f 0 ?

6.8 Dmontrer que la translation Ta [f (x)] = f (x a) est la convolution de (x a) avec la


fonction f .

6.9 Le Graal de lexprimentateur est de dconvoluer son signal, cest dire connaissant le
signal enregistr h(t) = (f A)(t) et la fonction dappareil A(t), dterminer f (t). On pourrait
se dire que pour connatre f (t) il suffit de diviser la TF de h par la TF de A et de prendre la
TF inverse du rsultat. En pratique, ceci nest pas une bonne solution, puisquon ne peut jamais
enregistrer un signal pendant un temps infiniment long. Soit H(t) le signal enregistr de T
+T . Mathmatiquement parlant, H(t) = h(t).(t/T ). Montrer alors que
+1/T
H() = 2T f()A()d
1/T

On voit donc que lintervalle de temps fini mlange les frquences. Que trouve ton la limite
T ?

6.2 Auto-corrlation.
Un outil indispensable en physique est le concept dauto-corrlation. Cela joue un
rle important dans les processus stochastiques, la diffraction, ... Supposons que nous
ayons une fonction x(t). Pour plus de simplicit, nous considrons notre signal de
moyenne nulle, cest dire
t+T
1
lim x(t)dt = 0
T T t

Nous dsirons savoir combien dinformation nous pouvons avoir sur x(t + ) si nous
connaissons le signal en t. Cette quantit est contenu dans la fonction dauto-corrlation
+
G( ) = x (t)x(t + )dt

Le complexe conjugu est ncessaire si lon veut que pour = 0, G( ) soit relle.
Dans beaucoup de cas, le signal est rel et le complexe conjugu dans lespace rel
na pas dimportance. Concrtement, nous prenons notre signal au temps t, nous le
multiplions par le signal au temps t + , nous rptons cette opration pour tous les
temps t et ajoutons le rsultat. Nous donnerons plus loin quelques exemples de la faon
dont cette mesure est utilise pour dterminer les caractristiques de certains systmes

70
6 Convolution et corrlation.

physiques. Que vaut la TF de la fonction dauto-corrlation ?



G() = d dt x (t)x(t + ) exp(i ) (6.1)


= dt x (t) d x(t + ) exp(i ) (6.2)

= dt x (t) exp(+it) d x( ) exp(i ) (6.3)

= x ()x() = |x()|2 (6.4)

Le rsultat est dune grande beaut : la TF de la fonction dauto-corrlation est gale au


module de la TF du signal au carr. Rappelons simplement que pour passer de (6.1)
(6.2), nous avons chang lordre dintgration ; pour passer de (6.2) (6.3) nous avons
effectu le changement de variable t.
La fonction dauto-corrlation reoit des interprtation diffrentes dans diffrents
contextes. Par exemple en probabilits, soit X1 la valeur dune fonction alatoire au
temps t, et X2 la valeur de mme fonction au temps t + . En suivant la discussion sur
les convolutions, on peut alors dmontrer que lautocorrlation G( ) est la densit de
probabilit de la variable alatoire X2 X1 .
En physique de la matire condense, on a coutume dimager autrement la fonc-
tion dauto-correlation. Supposez que vous ayez des particules distribues dans les-
pace. Quelle est la distribution des distances entre les particules ? Prenez nimporte
quelles deux particules i, j et calculer la distance rij entre les deux. Faites maintenant
un histogramme de toutes les distances, et vous avez une fonction dautocorrlation
des concentrations. Nous avions vu, dans le chapitre sur les TF, que le champs E(q)
de lumire diffus dans une direction q est la TF de la fonction de transmission lo-
cal. En utilisant des rayons ou neutron trs petite longueur donde, la fonction de
transmission devient proportionnelle la concentration des molcules qui diffusent ces
longueurs donde efficacement, cest dire : E(q) T F [c(x)]. Or, les plaques photo-
graphiques ou les senseurs de nos camras ne mesurent pas le champ, mais lintensit,
cest dire I(q) = E(q)E (q). Les clichs de diffusion des Rayons sont donc une
mesure directe de la fonction dauto-corrlation des concentrations molculaires.
6.10 le dmontrer.

6.3 Approfondissement : Relation entre lquation de


diffusion et les convolutions.
Montrer que la solution de lquation de la chaleur est juste un lissage (une convo-
lution) de la condition initiale. Introduire la notion de mollifying function et faire le
lien avec la fonction de Green.

71
6 Convolution et corrlation.

10
8
6
4
2
0
0 1 2

Figure 6.2 |x()|2 (eq. 6.7) en fonction de pour 0 = 1 et = 0.1, 0.2, 0.4.

Problmes avancs.
Problme 6.1 Diffusion des corrlations.
Soit une fonction (reprsentant par exemple une concentration ou une probabilit, ...) obis-
sant lquation de diffusion
c 2c
=D 2
t x
Et soit la fonction dauto-corrlation spatiale

G(y; t) = c(x; t)c(x + y; t)dx

Dmontrer que G obit galement une quation de diffusion, mais avec un coefficient de dif-
fusion de 2D. [indication : il suffit dchanger soigneusement les drivations et les intgrations]

Problme 6.2 Ressort soumis au bruit thermique.


(Discuter ergodicit). Supposons une particule dans un puits harmonique, soumis au bruit
thermique. Son quation du mouvement scrit :
d2 x dx
m + + kx = f (t) (6.5)
dt2 dt
m est la masse de la particule, est la force visqueuse et k la constante du ressort. Ceci constitue
une quation diffrentielle stochastique, et le formalisme a t dvelopp par Langevin vers 1910.
La partie gauche de lquation est celle du mouvement classique dune particule attache un
ressort. La partie droite tient compte des chocs alatoires des molcules du fluide qui entourent
la particule et qui font subir cette dernire une force. La fonction est une fonction alatoire,
cest dire quon ne connat pas vraiment la valeur quelle peut prendre, mais seulement la
probabilit quelle prenne une certaine valeur. Cela gnralise le concept de variable alatoire
utilise en calcul des probabilits. f est lamplitude des chocs alatoires et vaut KB T /a, o a
est la taille de la particule.
On suppose que la fonction est de moyenne nulle, cest dire quil y a autant de chance,
en moyenne, que les chocs mnent vers la gauche que vers la droite. De plus, on suppose que la
connaissance de la valeur de (t) ne nous donne aucune information sur (t + ), quelque soit
. On exprime cela par
G( ) = (t)(t + ) = ( ) (6.6)

72
6 Convolution et corrlation.

o bien sr, dsigne le delta de Dirac. Cela nest pas trop dur imaginer : comme (t + ) est
compltement indpendant de (t), il y a autant de chance quil soit de signe contraire que de
mme signe. A la longue, lintgral doit tendre vers 0. Par contre, 2 (t) > 0, son intgrale tend
donc vers linfini (reportez vous notre discussion sur ce genre dobjet au chapitre prcdent).
En prenant la TF de lq.(6.6), on obtient :
() = 1
G() = ()

En notant 02 = k/m et en prenant la TF de lquation (6.5), nous obtenons :



(02 2 + i)x() = (f /m)()

ce qui nous donne, grce la relation (6.6),

2 (f /m)
|x()| = (6.7)
(02 2 )2 + 2 2
Cette fonction prsente un pique 0 , comme on peut le constater sur la figure 6.2.
On peut faire beaucoup de chose partir de l. En physique, on ralise souvent 1 des ressorts
de taille micromtrique pour exercer des forces sur des bactries o des molcules biologiques.
Un problme majeur est celui de calibrer le ressort, cest dire trouver sa constante k. Lqua-
tion (6.7) nous montre quil existe une faon extrmement robuste de trouver cette constante : (i)
enregistrer la position x(t) dune particule au bout de ce ressort au cours du temps (ses fluctua-
tions thermiques) ; (ii) prendre la TF de x(t) ; (iii) lever le module de la TF au carr ; (iv) trouver
pour quelle frquence, cette dernire prsente un maximum : nous avons la frquence propre de
loscillateur.

Problme 6.3 Somme de deux variables alatoires et thorme central limite .


Une variable alatoire X est une fonction qui produit un nombre alatoire chaque ralisa-
tion. On peut se donner limage dun botier lectronique qui affiche un nombre chaque fois
quon appuie sur un bouton (une ralisation). Cest par exemple, le jet dun ds ; ou le temps
entre larriv de deux particules sur notre senseur ; ou la direction prise par une amibe au fond
dune boite de ptri quand on la photographie toute les 30 secondes ; ou le cours de la bourse
chaque seconde ; ...
On caractrise une variable alatoire (que lon suppose continue) par sa densit de probabilit
f (x) : la probabilit dobserver une ralisation de X entre x et x + dx est gale f (x)dx . Cela
veut dire concrtement que si on effectue par exemple 106 ralisations (mesurons larriv dun
million de particule sur notre senseur), une proportion f (x)dx des ralisations tomberont dans
lintervalle [x, x + dx[. Daprs ce que nous venons de dire, f (x) 0 et
+
f (x)dx = 1

Soit maintenant deux variables alatoires indpendantes 2 X et Y de densit de probabilit


f (x) et g(y). Quelle est la densit de la variable Z = X + Y (comme par exemple la somme
1. Par des pinces optiques, magntique, des micropipettes, ...
2. Une ralisation de lune ninflue pas sur le rsultat de la ralisation de lautre.

73
6 Convolution et corrlation.

de deux ds) ? En probabilit, le et dvnements indpendants se traduit par le produit de


chacune des probabilits et le ou par lopration somme des probabilits. Appelons h(z)dz la
probabilit dobserver Z dans lintervalle [z, z + dz[. La probabilit dobserver un tel vnement
gale la probabilit dobserver X dans [x, x + dx[ et Y dans [z x, z (x + dx) + dz[ pour un
x quelconque. Cet vnement a la probabilit

f (x)dx.g(z x)(dz dx) = f (x)g(z x)dxdz + O(dx2 )

pour une valeur x quelconque. Il faut donc ajouter la probabilit pour toutes les valeur possible
de x pour obtenir h(z)dz, ce qui nous donne
+
h(z) = f (x)g(z x)dx

La densit de probabilit de la somme de deux variables alatoires gale le produit de convolution


des densits de chaque variable.
La moyenne dune variable alatoire X de densit de probabilit f (x) est note hXi et est
dfinie par +
hXi = xf (x)dx

De faon gnrale, pour une fonction quelconque V , on dfinit
+
hV (X)i = V (x)f (x)dx

Exercices.
La suite des exercices suivantes vous entrane manipuler les probabilits. Si vous
les suivez dans lordre jusquau bout (bravo), cela vous mnera la dmonstration du
thorme central limite : quelque soit la densit de probabilit de la fonction X (pourvu
probabilit de la moyenne de N de ces
quelle ait une variance finie), la densit de
variables est une gaussienne, de largeur / N , o 2 est la variance de X. Lensemble
de ces exercices constitue un bon cours de probabilit.
6.11 Dmontrer que haXi = a hXi o a est un nombre rel. De faon gnrale, quelle est la
densit de probabilit de Z = aX ?
6.12 Dmontrer que hX + PY i = hXi + hY i. Que vaut la moyenne de la variable Z = (X +
Y )/2 ? Soit ZN = (1/N ) N i=1 Xi o les variables alatoires Xi sont identiques. Que Vaut
hZn i ?
6.13 La variance dune variable est dfinie par V ar(X) = X 2 hXi2 . Que vaut V ar(X +

Y ) ? Et V ar(ZN ) ?
6.14 La fonction caractristique X (t) dune variable alatoire X de densit f (x) est dfinie
par
X (t) = hexp(itX)i
Quelle est la relation entre la densit de X et la fonction X (t) ?

74
6 Convolution et corrlation.

0 00
6.15 Dmontrer que X (0) = 1 ; X (0) = i hXi ; X (0) = X 2 ; gnraliser ce rsultat.

Vous pouvez obtenir ce rsultat par le dveloppement de Taylor de la fonction exponentielle.

6.16 Que valent aX (t) et X+Y (t) ? Que vaut Zn (t) ?

6.17 Dmontrer que de faon gnrale, X (t) a un maximum absolue t = 0.

6.18 On suppose que hXi = 0 et V ar(X) = 2 . Dvelopper Zn (t) lordre 2 en t autour de


son maximum, et dmontrer quelle tend vers exp( 2 t/2 N ). [Help : (1+x/n)n exp(x)].
En dduire la densit de probabilit de Zn . Gnraliser ce rsultat au cas hXi 6= 0.

Problmes.
Problme 6.4 Fluctuation de la courbure des polymres.
Dabord, un peu de gomtrie diffrentielle. Soit une courbe dans le plan. Nous pouvons par
exemple la dcrire par lquation y(x) ou par ses coordonnes paramtrique x(t), y(t). Si nous
appelons lextrmit de la courbe A, la longueur darc partir de A jusqu un point P est dfinie
par tp
s= x2 (t) + y 2 (t)dt
0
Appelons langle (s) langle que fait la tangente la courbe au point P avec laxe y. En faite,
nous pouvons parfaitement dfinir la courbe par la donne de la fonction (s). Par exemple,
= Cte dcrit une droite, = s/R dcrit un cercle de rayon R. Cette description dune courbe
sappelle semi-intrinsque. La courbure de la courbe la position s est donne par = (d/ds)2 .
Nous pouvons galement dcrire une courbe dans le plan par la donne de (s) de faon tota-
lement intrinsque, sans rfrence aucun systme daxe.
Soit maintenant un polymre ( deux dimensions) de longueur L (L lchelle mol-
culaire, comme lADN par exemple) baignant dans un bain temprature T . Lnergie emma-
gasine dans le polymre par unit de longueur dpend de la courbure de sa conformation et
scrit L
E= B2 (s)ds
0
o B est le module de rigidit du polymre. Quelle est la corrlation entre les tangentes la
courbe distantes de ? Plus exactement, dmontrer que

hu(s).u(s + )i = exp(/LP )

o u(s) est le vecteur tangent labscisse curviligne s et Lp = B/KT .


Ceci est loin dtre un calcul anodin : cest comme cela que lon mesure la rigidit des poly-
mres biologiques comme lactine, les microtubules ou lADN.

Problme 6.5 Thorme dchantillonage.


Lchantillonnage consiste a enregistrer un signal f (t) seulement sur un nombre discret de
points fn = f (n ) (Fig. 6.3). Le thorme dchantillonnage de Shannon-Nyquist nous affirme
que nous sommes capable de reconstituer exactement la fonction f (t) partir des fn deux
conditions :

75
6 Convolution et corrlation.

Figure 6.3 Echantillonnage dun signal f (t) intervalle rgulier

1. La fonction originale f (t) ne contient pas de frquences plus lev quune certaine fr-
quence que nous notons 0 . Prcisment, cela veut dire que

f() = 0 si
/ [0 , 0 ]

2. nous avons chantillonn le signal au moins = /0 .


Si ces deux conditions sont ralises, alors nous pouvons reconstituer exactement la fonction
laide seulement des fn de la faon suivante :
+
X
f (t) = fn sinc (0 (t n )) (6.8)
n=

o sinc(u) = (sin u)/u. Ce thorme, nonc vers 1953, joue un rle crucial dans les commu-
nications radio et enregistrement des signaux ; les CD par exemple sont chantillonn 48kHz,
deux fois le seuil de laudition humaine en frquence.
1. Commentaires. Expliquez ce que vous comprenez par la formule (6.8). Aidez-vous dun
graphe.
2. Porte. Soit une fonction f (t) quelconque. Montrez graphiquement les fonctions f (t) et
2f (t)(t/a), o reprsente la fonction porte. Dsignons par la variable conjugue t lors
dune T F . Que valent
TF [(t/a)] et TF1 [(/0 )]
o a et 0 sont des constantes ?
3. Peigne de Dirac. La peigne de Dirac est dfinie par

X
a (t) = (t na)
n=

Soit la distribution X
a (t).f (t) = f (t)(t na)
n

76
6 Convolution et corrlation.

Reprsenter graphiquement la distribution a (t) et la distribution a (t).f (t) o f est une


fonction quelconque. Dmontrer que
X
a (t).f (t) = f (na)(t na)
n

[Help : galit entre distribution].


4. Convolution. Rappeler ce que vaut (f a )(t), le produit de convolution de la fonction
quelconque f (t) avec la distribution de Dirac (ta). Soit maintenant la fonction f (t) support
borne : f (t) = 0 si t
/ [b, b]. Reprsenter graphiquement (f 2a )(t) dans les cas o b > a,
b = a et b < a. En utilisant ces rsultats, reprsenter graphiquement

(2a f )(t)

dans les trois cas prcdent.


5. Linarit. Dmontrer que le produit de convolution est linaire, cest dire

(f + g) h = (f h) + (g h)

6. Rsultat admis. Nous admettons le rsultat suivant : la TF dune peigne de Dirac est une
peigne de Dirac (voir problme 5.1) :

TF[a (t)] = (2/a)2/a ()

De quelle distribution 0 () est elle la TF ?


7. Mise en place. Soit maintenant la fonction support borne f(), nulle en dehors de
lintervalle [0 , 0 ]. En utilisant les rsultats prcdents, argumenter pourquoi
 
f() = 2 f 20 ().(/0 )

Aidez vous dun graphique.


8. TF inverse. En appliquant la TF inverse lquation prcdente, dmontrer que

!
X
f (t) = f (t).(t n/0 ) sinc(0 t)
n=

[Help : TF1 [(f g)()] = 2f (t).g(t) ].


9. Fin. A partir de lquation prcdente, obtenir enfin lquation (6.8) de Nyquist-Shannon.
Note. En gnral, le thorme de Nyquist est nonce laide des frquences et non des fr-
quences angulaires comme nous lavons fait ici. Sachant que = 2, le thorme dchan-
tillonnage est souvent nonc par la formulation < 1/20 .

Problme 6.6 Corrlation dans le mouvement brownien.


Calculer la fonction dautocorrlation pour un mouvement brownien x(t).

77
7 Les transformes de Laplace.
7.1 Entre en matire.
Les mathmaticiens ont invent de nombreux transformation intgrale dune fonc-
tion, parmi lesquels nous avons vu les transformes de Fourier. Une autre transforma-
tion extrmement utilise est celle de Laplace. Les transformes de Laplace sont les
cousins des transformes de Fourier. Leur relation est celle de la fonction exponentielle
et de la fonction sinus ou cosinus. Comme vous vous souvenez, pour prendre la TF, on
multiplie la fonction f (t) par exp(it) et on intgre entre, notez le bien, et +.
Pour les TL, on multiplie la fonction par exp(st) et on intgre entre, cette fois, 0 et
+
f(s) = TL[f (t)] = f (t) exp(st)dt
0
Les conventions veulent que la variable conjugues t sappelle pour les TF et s pour
les TL. La fonction f (t) est appele loriginal, et sa TL son image. Dans la plupart des
livres que vous consulterez, limage est not F (s), mais nous maintenons ici la conven-
tion f(s) ou f(s). Il existe de nombreux avantages et dsavantages utiliser les TL
la place des TF. Dun point de vue pratique, toutes les deux transforment des quations
diffrentielles linaires en des quations algbriques. Mais il est difficile dintgrer les
conditions initiales dans les TF, tandis quelles sintroduisent naturellement dans les
TL, comme nous en verrons des exemples plus bas. Prenons le cas dun signal temporel
x(t). Pour les transformes de Fourier, ce signal a toujours exist (depuis t = )
et existera toujours. Pour les Transforme de Laplace, le signal ne commence son exis-
tence qu un temps fini (t = 0).
Un autre (grand) avantage des TL est que nos exigences sur le comportement de f (t)
quand t sont beaucoup plus lgres : comme la fonction exp(st) dcrot trs
rapidement linfini (pour Re(s) > 0 ), la transforme de Laplace de la plupart des
fonctions usuelles existera. Voyons quelques exemples.
Exemple 7.1 TL[1] = 1/s
Exemple 7.2 TL[exp(at)] = 1/(s + a)

Exemple 7.3 TL[t] = 1/s2 . Pour le dmontrer, il suffit deffectuer une intgration par

78
7 Les transformes de Laplace.

partie :
+ +
1
tet dt = 0+ est dt
0 s 0
1
=
s2
Exemple 7.4 TL[tk ] = k!/sk+1 (dmontrez cette relation par rcurrence.)
Le dsavantage des TL est que nous perdons le concept de bases orthogonales. Nous
avons vu quen tendant un peu notre espace de fonctions lespace des distributions,
nous pouvions considrer les fonctions exp(it) comme une base orthogonale. Rien de
tel nexiste pour les TL et les fonctions exp(st), quoi quon fasse, ne sont pas ortho-
gonales les unes aux autres. Avec la perte dorthogonalit, nous perdons galement la
possibilit dinverser (facilement) une transforme de Laplace et la belle symtrie entre
une fonction et sa transforme.

7.2 Oprations sur les TL.


Les opration sur les TL sont trs similaire, un facteur i prs, aux oprations sur
les TF. Par contre, il faut vraiment bien les matriser, puisque prendre la TL inverse est
souvent une opration complexe (au sens propre) et quon prfre toujours se ramener
des expressions connues.

Changement dchelle. TL[f (t/a)] = af(as) La dmonstration est triviale.

Translation. TL[ exp(at)f (t)] = f(s + a) Multiplier loriginale par une exponen-
tielle revient translater limage. Par exemple, TL[1] = 1/s, donc TL[exp(at)] =
1/(s + a).

Multiplication
par t. Si on drive f(s) par rapport s, nous avons df(s)/ds =
tf (t) exp(st)dt. Donc, TL[tf (t)] = df(s)/ds 1 . Par exemple, comme TL[1] =
1/s, alors TL[t] = 1/s2

Drivation. Elle contient un lment supplmentaire, et cest cela le grand intrt


des TL.

t=
f 0 (t) exp(st)dt = f (t) exp(st)|t=0 + s f (t) exp(st)dt
0 0

1. Vous remarquerez que nous avons souvent t ngligent avec lorthodoxie des convergences et des
drivations sous le signe somme. Mais vous pouvez dmontrer quici au moins, nous navons pas enfreint de
rgles ( dmontrez le).

79
7 Les transformes de Laplace.

Ce qui nous amne


TL[f 0 (t)] = f (0) + sTL[f (t)]
En gnralisant cela, nous voyons que TL[f (t)] = s2 f(s) sf (0) f 0 (0), et ainsi de
suite.

Intgration. Il nest pas difficile, en utilisant la rgle de drivation ci-dessus, de d-


montrer que
t
TL[ f ( )d ] = (1/s)f(s)
0

Exemple 7.5 Rsolvons lquation diffrentielle


x0 (t) + x(t) = t (7.1)
avec la condition initiale x(t = 0) = x0 . Par la mthode classique, on rsout dabord
lquation homogne pour obtenir x = C exp(t), ensuite nous supposons que
C = C(t) et nous obtenons une autre quation diffrentielle pour C(t) ; la rsolution
de cette dernire et finalement lutilisation de la condition initiale nous donne la
solution finale.
Prenons plutt la TL des deux cots de lq.(7.1) :

x0 + (s + )x(s) =
s2
Nous avions dj, lexemple 3 ci-dessus, calcul la TL[t], et nous avons juste utilis
ce rsultat. En gnral, les TL des fonctions les plus connues sont entreposes dans
des tables et on ne fait souvent que les consulter au lieu de recalculer la TL (comme
pour les tables de logarithme). En dcomposant en fraction simple, nous avons
1 11 1 1
= 2 +
s2 (s+ ) s s s+
et la solution de notre quation scrit :
 
1 11 1 1 x0
x(s) = + + (7.2)
s2 s s+ s+
Bon, nous connaissons la TL de la solution, et il faut inverser le processus pour cal-
culer x(t). Or, nous savons que loriginale de 1/s2 est t, loriginale de 1/s est 1 ,
loriginale de 1/(s + ) est exp(t) (souvenez vous de la rgle de translation).
Nous avons donc

x(t) = t 2 (1 et ) + x0 et (7.3)

On peut vrifier, en linjectant directement dans lquation (7.1) que ceci est bien la
solution. Notez avec quelle facilit la condition initiale a t prise en compte dans la
solution.

80
7 Les transformes de Laplace.

f (t) f(s)
f (t/a)
af (as)
exp(at)f (t) f(s + a)
d
tf (t) ds f (s)
f 0 (t)
sf (s) f (0)
f (t) s2 f(s) sf (0) f 0 (0)
f (n) (t) n Pn
s f (s) k=1 snk f (k1) (0)
t 1
0
f ( )d s f (s)

1 1/s
t 1/s2
exp(at) 1/(s + a)
sin(at) ou cos(at) a/(s2 + a2 ) ou s/(s2 + a2 )
sinh(at) ou cosh(at) a/(s2 a2 ) ou s/(s2 a2 )
t cos(at) + (1/a) sin(at) 2a2 /(s2 + a2 )2

1/ t / s

t ( /2)s3/2
1/(t + 1) exp(s)(0, s)

Table 7.1 Rsum des rgles de manipulation des TL et un petit dictionnaire des TL
lmentaires.

Exemple 7.6 Rsoudre x(3) + 3x + 3x + x = 1 avec les conditions initiales nulles (


x(n) dsigne la drive nime de x).
La TL nous donne x(s) = 1/s(s+1)3 = (1/s)1/(s+1)3 1/(s+1)2 1/(s+1).
En se reportant la table (7.1), on trouve immdiatement x(t) = 1 (t2 /2 + t +
1) exp(t).

7.3 Dcomposition en fraction simple.


Comme nous avons utiliser souvent les dcompositions en fraction simple, nous
allons faire un petit dtour pour rappeler les grands principes.

Cas des racines simples. Soit f(s) = p(s)/q(s), o p(s) et q(s) sont des polynmes
et quen plus, q(s) na que des racines simples, cest dire q(s) = (sa1 )(sa2 )...(s
an ). Nous voulons crire f (s) comme
A1 A2 An
f(s) = + + ... +
s a1 s a2 s an

81
7 Les transformes de Laplace.

Soit qi (s) = q(s)/(s ai ). Nous voyons que qi (s) na pas de zro en s = ai . Quand
s ai , le terme dominant dans f (s) est

p(s) 1 p(a) 1
f(s) = . = . + O(1)
qi (s) s ai qi (a) s ai

do on dduit que Ai = p(ai )/qi (ai ). En plus, comme q(ai ) = 0,

q(s) q(ai )
lim qi (s) = lim = q 0 (ai )
sai sai s ai

quand s ai . Nous pouvons donc crire loriginal de f(s)directement comme


X p(an )
f (t) = exp(an t)
n
q 0 (an )

o la sommation est sur les zros de q(s).


Exemple 7.7 f(s) = (3s2 3s+1)/(2s3 +3s2 3s2). Nous avons p(s) = 3s2 3s+1
, q(s) = 2s3 + 3s2 3s 2 et q 0 (s) = 6s2 + 6s 3. Les zro du dnominateur sont
aux s = 1, 2, 1/2. Comme p(1)/q 0 (1) = 1/9, p(2)/q 0 (2) = 19/9 et que
p(1/2)/q 0 (1/2) = 13/18, nous avons
1 1 19 1 1 1
f(s) = +
9s1 9 s + 2 6 s + 1/2

Cas des racines multiples. Soit maintenant f(s) = R(s)/(s a)n o R(s) est un
quotient de polynme qui na pas de ples en a. Nous voulons lcrire sous forme de
A0 A1 An1
f(s) = + + ... + + T (s)
(s a)n (s a)n1 (s a)

o T (s) contient le dveloppement en fractions simples autour des autres ples. Pour

dterminer les coefficients Ai nous avons nouveau calculer le comportement de f (s)
pour s a. Comme R(s) est tout ce qui a de plus rgulier autour de a, nous pouvons
le dvelopper en srie de Taylor autour de ce point :

R(s) = R(a) + R0 (a)(s a) + (1/2)R00 (a)(s a)2 + ...

Ce qui nous donne immdiatement

A0 = R(a)
A1 = R0 (a)
...

82
7 Les transformes de Laplace.

Exemple 7.8 Trouvons loriginale de f(s) = 1/(s2 + a2 )2 . Nous avons

A0 A1 B0 B1
f(s) = 2
+ + 2
+
(s ia) (s ia) (s + ia) (s + ia)

Nous pouvons bien sr tout calculer, mais remarquons simplement que dans lex-
pression de f(s), le changement de s en s laisse ce dernier invariant. Pour avoir
cette mme invariance dans lexpression de f(s) une fois dcompose en fraction
simple, nous devons avoir B0 = A0 et B1 = A1 . Or, daprs ce quon vient de dire,
autour de la racine s = ia, R(s) = 1/(s + ia)2 et
1 1
A0 = = 2

(s + ia)2 s=ia 4a

De mme,
2 1
A1 = 3
=
(s + ia) s=ia 4ia3

Comme loriginale de 1/(s ia)2 est t exp(iat) et que loriginale de 1/(s ia) est
exp(t), en regroupant correctement les termes, on trouve que
1 1
f (t) = t cos(at) + 3 sin(at).
2a2 2a

7.4 Comportement asymptotique.


7.4.1 Comportement pour t +.
Si nous connaissons la transforme de Laplace dune fonction f (t), nous pouvons
parfois trouver des approximations de cette fonction quand t . Par exemple, les
fonctions de Bessel In (t) sont dfinies par

1 t cos
In (t) = e cos(n)d
0


nest pas difficile de dmontrer que la transforme de Laplace de I0 (t) est I0 (s) =
2
et il
1/ s2 1. Cette transformenous permet facilement dapproximer, pour t  1, la
fonction de Bessel par exp(t)/ 2t (figure 7.1). Voyons voir le comment du pourquoi.

Nous nous sommes peu intresss jusque l au domaine dexistence de la Transfor-


me de Laplace. Il est vident que pour que la TL ait un sens, il faut que 0 f (t) exp(st)dt
existe. Pour certaines fonctions comme exp(t2 ), cette condition est toujours ralise.
Pour dautres, comme exp(t2 ), elle ne lest jamais. Enfin, pour la plupart de fonctions
2. en changeant lordre dintgration sur et t, cf exercice 7.8.

83
7 Les transformes de Laplace.

0.4
I0HtL expH-tL
0.3

0.2

1 , H2 tL
0.1

5 10 50 100 500 1000

Figure 7.1 Comparaison des la fonction de Bessel I0 (t) et son approximation assymp-
totique (laxe x est logarithmique)

usuelles 3 , la condition est ralise si Re(s) > s0 , o s0 est un rel. Par exemple, pour
toutes les fonctions polynomiales ou toute puissance positive de t, s0 = 0. Pour la
fonction cosh(t), s0 = 1 4 .
Souvent, nous nous intressons surtout au comportement de f (t) pour t grand :
nous voulons savoir rapidement si notre particule revient une position donne ou si
au contraire, elle part linfini, et si elle part linfini, quelle vitesse elle le fait. Nous
allons voir dans la suite que le comportement de f(s) autour de son ple le plus droite
s0 nous renseigne directement sur le comportement asymptotique de loriginale. Sans
perte de gnralit, nous allons supposer par la suite que Re(s0 ) = 0, puisque si la TL
de la fonction f (t) a un ple en s = a, la fonction exp(at)f (t) a un ple en s = 0. Le
comportement asymptotique de la fonction f (t) sen dduit donc immdiatement.
Revenons maintenant notre fonction f (t). Si I = 0 f (t)dt < +, cest que
f (t) 0 quand t + et nous navons pas trop de questions nous poser pour son
comportement asymptotique. Supposons donc que I nexiste pas, mais que la TL de
f (t) est bien dfinie pour Re(s) > 0. Nous pouvons toujours crire f (t) = g(t) + h(t),
o g(t) contient le terme dominant de f (t) quand t et h(t) tous les autres. Par
exemple, le terme dominant de 1/ t + exp(5t) + 1/(1 + t2 ) est 1/ t. Nous pouvons
formellement crire que h(t) = o(g(t)) 5 . Il est vident que pour s 0, la transforme
de Laplace est domine par la TL de g(t), cest dire h(s) = o(g(s)) quand s 0
(exercice : le dmontrer). Un simple dveloppement autour du ple le plus droite de
la TL nous donne donc directement le comportement asymptotique de loriginale.
Exemple 7.9 f(s) = 1/s(s + a) pour a > 0 a son ple le plus droite s = 0. Autour
de ce point, f(s) = 1/as + O(1). Donc, f (t) 1/a quand t ( loriginal de

3. lire qui ne croissent pas plus vite quune exponentielle


4. Puisque la fonction cosh(t) comporte un terme en et .
5. Cest dire que limt h(t)/g(t) = 0. Les notations O et o sont dues Edmund Landau, math-
maticien du premier tiers du vingtime sicle.

84
7 Les transformes de Laplace.

1/s est bien sr 1). Dans cet exemple, et ceux qui suivent, le lecteur est encourag
calculer loriginale exacte et vrifier le dveloppement asymptotique.
Exemple 7.10 f(s) = 1/s(s a)2 pour a > 0. Le ple le plus droite est en s = a.
f(s) (1/a)(s a)2 quand s a et donc f (t) (t/a) exp(at) quand t .
Remarquer que nous aurions p pousser lapproximation un peu plus loin : f(s)
(1/a)(s a)2 (1/a2 )(s a)1 et donc f (t) (t/a 1/a2 ) exp(at).
Exemple 7.11 f(s) = 1/(s2 + a2 )2 . L, nous avons deux ples de mme partie relle
s = ia, et nous devons tenir compte des deux. Nous laissons le soin au lecteur de
dmontrer que le terme dominant doit tre t cos(at)/2a2 .

Nous avons en fait souvent recours au dveloppement asymptotique parce que nous
ne savons pas calculer exactement loriginale. Prenons lquation x + x = t avec
des conditions initiales nulles. Cest lquation du mouvement dun corps soumis un
frottement visqueux et une force qui grandit comme
la racine du temps. La solution
est facilement trouve en terme de TL : x(s) = ( /2)s5/2 (s + 1)1 . Nous ne savons
pas calculer 6 loriginale de cette fonction. Par contre,
comme il existe un ple zro, le
dveloppement asymptotique scrit x(t) (4/3 )t3/2 (Le dmontrer ; pouvez vous
calculer les deux prochaines corrections ce dveloppement ? ).

7.4.2 Comportement pour t 0.


Nous disposons dun thorme analogue pour trouver le comportement de f (t) au-
tour de t = 0+ si nous disposons de sa transforme de Laplace. Il nest pas difficile de
voir que
f (0) = lim sf(s) (7.4)
s

Ceci dcoule simplement des rgles de TL :



0
TL[f (t)] = est f 0 (t)dt = sf(s) f (0)
0

Or, quand s , lintgrale tend vers zro, do lgalit (7.4). Nous pouvons bien sr
aller plus loin. Le dveloppement de Taylor de f (t) proche de t = 0 scrit

f (t) = f (0) + f 0 (0)t + (1/2)f 00 (0)t2 + ...

et rsulte de la TL inverse du dveloppement asymptotique de sf (s) pour s . (voir


lexercice 7.9).

6. Pas avec notre dictionnaire actuel.

85
7 Les transformes de Laplace.

7.5 Produit de Convolution.


Le produit de convolution de deux fonctions est donn par
t
h(t) = f ( )g(t )d (7.5)
0
On note cela par h(t) = (f ? g)(t). Il est facile de dmontrer, en changeant lordre
dintgration, que
h(s) = f(s).g(s)
La solution de beaucoup dquation diffrentielle se met naturellement sous la forme
(7.5).
Exemple 7.12 la mthode de la variation des constantes. Nous voulons rsoudre
lquation ordinaire coefficient constant avec second membre
x(t) + ax(t) = f (t)
En prenant la TL, nous trouvons que
1 x0
x(s) = f (s) +
s+a s+a
Comme loriginale de 1/s + a est exp(at), en utilisant le rsultat sur les produits
de convolution, nous trouvons
 t 
x(t) = eat x0 + ea f ( )d
0
Ce rsultat est connu sous le nom de la mthode de la variation des constantes et se
gnralise ( laide des dcompositions en fraction simple) aux quations de degrs
quelconques.

7.6 Aperu des quations intgrales.


Il existe une classe dquations intgrales (quon appelle de Voltera) qui scrivent
sous la forme : t
f (t) = f ( )K(, t)d +
0
Dans le cas o le noyau K est symtrique, cest dire quil scrit sous la forme K(t ),
ces quations admettent une solution simple en terme de transformes de Laplace. En
prenant la TL des deux cots, on trouve :

f(s) = f(s)K(s) +
s
cest dire que f(s) = /s(1 K(s)). Cest ensuite un exercice de trouver loriginale
ou en tout cas son dveloppement asymptotique.

86
7 Les transformes de Laplace.

7.7 Aperu des systmes de contrle asservis


(feedback systems).
Quand on conduit une voiture et que lon tourne le volant ou que lon appuie sur la
pdale de frein, on nexerce pas directement une action sur les roues, mais on actionne
des circuits hydrauliques qui sen chargent. Ces circuits sont munis dautomatismes qui
rglent la pression sur les roues exactement comme demande, quelque soit les condi-
tions extrieures. Pour pouvoir effectuer cela, il faut quils soit munis des mcanismes
correcteurs qui constamment comparent la direction ou la pression des roues actuelles
la consigne demande et rduisent lerreur. Si lon regarde autour de nous, des objets
les plus simples comme un rfrigrateur qui maintient sa temprature quand on ouvre
ou ferme sa porte aux objets les plus complexes, comme lABS ou le pilotage dun avion,
nous sommes entour dautomates. En cela bien sr nous ne sommes quentrain dimi-
ter le monde vivant qui a implant ces mcanismes tous les niveaux, de la reproduction
de lADN aux mouvements dune bactrie ou la marche dun bipde.
Il se trouvent que la trs grande majorit des automates est constitu dautomate dont
laction est gouverne par des quations diffrentielles linaires 7 . Loutil primordial
pour tudier et concevoir les automates est la transforme de Laplace. On peut dire
sans exagrer que les automateurs passent la majorit de leur temps dans lespace de
Laplace 8 . Nous allons tudier lexemple fondamental des rgulateurs PID.
Le rgulateur PID est apparu dans les annes 1920 ; les oprations dintgration et de
drivation que nous allons voir taient effectues par des lments mcaniques (ressort,
masse,..) ou lectroniques (circuits RLC).
Supposons que nous voulons maintenir un bain thermique une temprature de
consigne Tc dans une chambre temprature TR . Nous avons de nombreuses sources de
perturbation, comme des courants dair ou une temprature fluctuante dans la chambre 9 .
Notre automate doit maintenir le bain Tc > TR malgr ces perturbations (Figure 7.2).

En labsence de source de chaleur, un bain temprature T > TR perd de la chaleur


et se refroidit :
T
= r(TR T )
t
r est un coefficient qui reflte lchange de la chaleur entre le bain et la chambre et
dpend de lisolation du bain. Nous ne connaissons pas la valeur exacte de r.
Nous pouvons injecter de la puissance P (t) dans le bain laide dun gnrateur
lectrique, auquel cas lvolution de la temprature dans le bain scrit

T
= r(TR T ) + P (t) (7.6)
t
7. Depuis les annes 1990 et la disponibilit des microcontrleur, le paysage a pas mal chang.
8. Comme les cristallographes passent la majorit de leur temps dans lespace de Fourier.
9. La porte !

87
7 Les transformes de Laplace.

Figure 7.2 Schma gnral du dispositif. Le bain doit tre amen et maintenu tem-
prature de consigne Tc , tandis que la temprature de la chambre est TR .
La temprature du bain peut tre augment en faisant passer un courant
lectrique dans une rsistance lintrieur du bain. Un automate mesure
constamment la temprature du bain T laide dune sonde, la compare
la consigne Tc et rgule la tension du gnrateur lectrique.

Le contrleur doit dcider chaque instant t de la puissance injecter P (t) pour at-
teindre la consigne. Nous supposons qu t = 0, T = TR .
La premire ide serait de programmer le contrleur de faon proportionnelle (do
le P du PID) :
P (t) = (Tc T )
plus on est loin de la consigne, plus on injecte de la puissance. Notre quation (7.6)
scrit alors t T = r(TR T ) + (Tc T ) et sa transforme de Laplace nous donne

Tc + rTR
(s + + r)T (s) = + TR
s
Le dveloppement asymptotique pour s 0 finalement nous montre que pour t ,
le bain atteint la temprature
Tc + rTR
Teq = < Tc
+r
Notre dispositif nest pas trs bon, puisque le bain ne peut pas atteindre Tc . Le problme
est que si le bain atteint Tc , le gnrateur cesse dy injecter de la puissance et le bain se
met refroidir. Il nous faut quelque chose qui continue dinjecter de la puissance mme
quand on est Tc .
Lide extrmement lgante tait dapprendre lautomate ses erreurs passes, en y
ajoutant un terme qui somme lhistorique des carts la consigne :
t
P (t) = (Tc T ) + (Tc T )d
0

88
7 Les transformes de Laplace.

Cette fois, la TL de lquation (7.6) nous donne


 
Tc + rTR Tc
s++r+ T (s) = + 2 + TR
s s s

et le dveloppement asymptotique pour s 0 nous montre que pour t , le bain


atteint la temprature
Teq = Tc
et ceci quelque soit TR , r, et . Notre simple automate se dbrouille fort bien. videm-
ment, en ralit, nous devons atteindre la temprature de consigne rapidement et nous
y maintenir de faon stable ; cest pourquoi dans les rgulateur PID, il existe aussi un
terme diffrentielle et que les coefficients et sont ajustable, mais le principe gnral
est l.

7.8 La physique statistique.


En physique statistique, la fonction de partition Z est une sorte de moyenne (pond-
re par = 1/KT ) des nergies que peut atteindre un systme. Si lindice i dnombre
les tats possibles du systme, chacun avec lnergie Ei , alors
X
eF = Z() = eEi
i

La quantit F est appel lnergie libre du systme.


Il arrive souvent que beaucoup dtat ont la mme nergie et dans ce cas, ont peut
les regrouper dans la somme :
X
Z() = eE n(E)
E

o cette fois, nous sommons sur les nergies disponibles au systme ; n(E) dsigne le
nombre dtats ayant lnergie E. Si la diffrence entre les niveaux dnergie est faible
par rapport notre mesure, nous pouvons rcrire la somme ci-dessus sous forme dune
intgrale
Z() = eE f (E)dE (7.7)
0

o f (E)dE est le nombre dtat avec une nergie entre E et E +dE ; toutes les nergies
sont mesures par rapport lnergie minimum du systme E0 que nous choisissons
comme rfrence : E0 = 0.
Ce que nous voyons l est trs simple : la fonction de partition est la transforme de
Laplace de la densit dnergie.

89
7 Les transformes de Laplace.

Exemple 7.13 loscillateur harmonique.


Soit une particule dans un champ quadratique, son nergie tant fonction de sa
distance au centre : E(x) = kx2 . x iciest la variable qui dnombre les tats. Le
nombre dtat entre E et E + dE est 1/ kE. En nous reportant la table des T.L.,
nous trouvons la fonction de partition
r
1/2
Z() =
k
Exemple 7.14 Problme : Transition de phase.
En utilisant la dfinition (7.7), dmontrez que la fonction Z() est forcment conti-
nue.
Par dfinition, une transition de phase (comme la transformation de leau en glace)
est une discontinuit de la fonction de partition (ou de lune de ses drives). Vous
venez de dmontrer que les transitions de phases ne peuvent pas exister. O est ler-
reur ? Ceci tait un problme majeur de la physique statistique jusque dans les annes
1920 et linvention du modle dIsing par le scientifique du mme nom. Ce modle
na reu une solution quen 1944 par Onsanger. Les annes 1970 ont vu apparatre les
thories mathmatiquement sales (dites groupes de renormalisation) pour traiter
les transitions de phases de second ordre. Nous ne disposons ce jour pas de thories
mathmatiques gnrales satisfaisantes pour les transitions de phase.

7.9 TL inverse.
Pour pouvoir effectuer les TL inverses, il faut connatre un minimum de la thorie
dintgration dans le plan complexe. Pour les lecteurs qui en sont familier, mentionnons
la procdure qui est juste une adaptation des TF. Considrons la fonction f (t) telle que
f (t < 0) = 0. Nous pouvons crire la fonction ect f (t) comme la TF inverse de sa TF :
 
ct 1 ct it
e f (t) = e f (t)e dt eit d
2 0

La borne infrieure de la deuxime intgrale commence zro puisque la fonction est


nulle pour t < 0. (i) En multipliant les deux cts par ect ; (ii) en posant s = c + i ; (iii)
en prenant soin dans la deuxime intgrale du changement de variable d = ds/i ; (iv)
et enfin en reconnaissant une TL classique dans lintgrale intrieure, nous aboutissons
c+i
1
f (t) = f(s)est ds
2i ci
lintervalle ]c i, c + i[ dsigne une droite parallle laxe imaginaire et de coor-
donne relle c dans le plan complexe. Il faut choisir c > Re(s0 ), o s0 est le ple le
plus droite de la fonction f(s0 ). Nous dfrons une discussion plus dtaille de cette
procdure jusquau chapitre sur les fonctions complexes.

90
7 Les transformes de Laplace.

Exercices.
7.1 Trouver la TL des fonctions suivantes : sin(at) ; cos(at) ; sinh(at) ; cosh(at) ;
7.2 Trouver, par la mthode de votre choix, loriginal de a2 /(s2 + a2 )2 . Help : Remarquez que
vous pouvez crire cette fonction comme (s2 + a2 )/(s2 + a2 )2 s2 /(s2 + a2 )2 , et que le dernier
terme vaut (1/2)s(d/ds)(1/(s2 + a2 ). Il suffit ensuite dutiliser les rgles de manipulation
des TL pour remonter loriginale.
7.3 Dmontrez que TL[tk ] = k!/sk+1 .
7.4 Trouver la TL du delta de Dirac.
7.5 La TL de la fonction escalier n=0 H(t n) est 1/s(1 es ).
P

7.6 La TL dune fonction aperiodique f (t) (f (t + a) = f (t) ) est f(s)/(1 eas ), o


a
f(s) = 0 f (t) exp(st)dt.
7.7 Reprsentez graphiquement, et trouvezPla TL des fonctions suivantes : (t a)H(t a) ;
H(t) H(t a) ; n
na) ; n
P
n=0 (1) H(t n=0 (1) (t na)H(t na)

7.8 Les fonctions de Bessel jouent un rle trs important en physique mathmatique. Elles
jouent un rle important pour lquation de Laplace en coordonnes cylindriques, analogue
celui des fonctions circulaires une dimension. Lune delle est dfinie par
2
I0 (z) = (1/2) ez cos d
0

Dmontrer que sa T.L. est


1
I0 (s) =
s2 1

Dmontrez que I0 (t) (1/ 2) t exp(t) quand t +. Help : Pour Calculer des R(cos , sin )d,
on a intrt effectuer le changement de variable u = tan(/2)
7.9 Les fonctions de Bessel In (t) obissent lquation diffrentielle
t2 u00 (t) + tu0 (t) (t2 + n2 )u(t) = 0
Dmontrer alors que la TL de la fonction u(t) obit lquation
(s2 1)u00 (s) + 3su0 (s) + (1 n2 )u(s) = 0
Rsoudre cette quation pour n = 1 (lquation se ramne alors une quation de premier
ordre) et dmontrer que sa solution est de la forme
p
u(s) = C0 + C1 / s2 1
Sachant que I1 (0) = 0, I 0 (0) = 1/2 et en utilisant le comportement asymptotique de su(s),
dmontrer que C1 = C0 = 1. Sachant que I00 (t) = I1 (t), dduire galement la TL de la
fonction I0 (t). Enfin, en utilisant la relation de rcurrence
2In0 (t) = In1 (t) + In+1 (t)
Obtenez la forme gnrale des TL des fonction de Bessel I.

91
7 Les transformes de Laplace.

1 6

0.8 5

4
0.6
3
0.4
2
0.2
1

1 2 3 4 5 1 2 3 4

Figure 7.3 Les fonctions erf(t) et exp(t)(0, t)

z 2
7.10 La fonction derreur est dfinie par erf(z) = 2 0 eu du (voir figure 7.3). Elle joue un

rle fondamentale en probabilit. Dmontrer que la TL de exp(t2 ) est ( /2) exp(s2 /4)(1
erf(s/2). En dduire galement la TL de la fonction erf(t).

7.11 La fonction Gamma dEuler est dfinie par () = 0 t1 exp(t)dt. Il nest pas
difficile de dmontrer que ( + 1) = () ( le faire ) et donc que cette fonction est la
gnralisation de la fonction
factorielle n! = (n + 1). La fonction dEuler incomplte est
dfinie par (, z) = z t1 exp(t)dt (voir figure 7.3). Son dveloppement asymptotique
est donn (pour z ) par z 1 exp(z). Tout a pour vous demander de dmontrer que
TL[1/(1 + t)] = exp(s)(0, s). Gnraliser se rsultat aux puissance ngative de (1 + t).
7.12 Trouver le comportement asymptotique de loriginale de la fonction 1/(s2 + a2 )2 . At-
tention : les deux ples sont imaginaires pures et contribuent galement.
7.13 La fonction de Bessel J dordre 0 est dfinie par J0 (z) = I0 (iz),et sa TL est (s2 + 1)1/2
(Pouvez vous
p le dmontrer ?). Dmontrer que son comportement asymptotique est donne par
J0 (z) 2/z cos(z /4).
7.14 Rsoudre x + 2 x = b sin(t) avec des conditions initiales x(0) = x0 et x(0) = v0 .
Notez que cest lquation dun oscillateur harmonique forc sa frquence de rsonance.
7.15 Rsoudre x(3) + 3x + 3x + x = 1 avec les conditions initiales nulles.
7.16 Rsoudre x(4) + 2x + x = sin t avec les conditions initiales nulles.
7.17 Le mouvement dune particule dans un champs magntique peut tre ramen la rso-
lution du systme suivant :
x = y ; y = x
o x, y sont les composantes du vecteur vitesse et une constante proportionnelle au champs
magntique et la charge de la particule. Les conditions initiales sont t = 0 , x = x0 ; y = y0 .
Rsoudre ce systme laide des transformes de Laplace.
7.18 Rsoudre
x x + y + z = 0
x + y y + z = 0
x + y + z z = 0

92
7 Les transformes de Laplace.

x(0) = 1 et y(0) = z(0) = y(0) = z(0) = 0.


avec les conditions initiales
Sol. : x(t) = (2/3) cosh(t 2) + (1/3) cos t ; y(t) = z(t) = (1/3) cosh(t 2) + (1/3) cos t.

7.19 Donner la solution gnrale, sous forme de produit de convolution, de lquation

y 00 + 2ay + b = f (t)

avec les conditions initiales y(0) = y0 ; y 0 (0) = v0 . Considrer les deux cas o a2 b 6= 0 et
a2 b = 0.

Problmes avancs.
Problme 7.1 la propagation des ondes.
Nous nous intressons nouveau la rsolution de lquation des cordes vibrantes. Nous
lavons dj rencontr dans le chapitre sur les distributions, et nous le verrons encore dans la
section consacre aux fonctions de Green. Nous allons ici utiliser les TL pour rsoudre ces qua-
tions, avec des conditions initiales donnes. Nous avons vu que les TL sont trs bon quand il sagit
davoir un dbut des temps.

2u 2
2 u
c = 0 (7.8)
t2 x2
u(x, 0) = f (x) (7.9)
t u(x, 0) = g(x) (7.10)

Nous savons que sa solution est donne par


x+ct
1
u(x, t) = f (x ct) + f (x + ct) + g()d (7.11)
2c xct

Nous allons tablir la mme chose, mais en utilisant de faon combin les TF et les TL, ces
dernires ayant lavantage de grer automatiquement les conditions initiales. Le schma de la
TL TF TL1 TF1
rsolution que nous allons mener est le suivant : u(x, t) u(x, s) u(q, s) u(q, t)
u(x, t). Noter que t [0, +[, donc nous allons effectuer des TL par rapport cette variable.
Par contre, x ] , +[, donc nous allons procder des TF pour cette dernire.
1. En prenant la TL de lquation (7.8) par rapport la variable t, dmontrer que

d2 u(x, s)
c2 + s2 u(x, s) = sf (x) + g(x).
dx2
2. En prenant la TF de cette dernire, dmontrer que

s) = s 1
u(q, f(q) + 2 2 g(q)
c2 q 2 + s2 c q + s2

o f et g sont les TF des fonctions f et g .


3. En prenant la TL inverse, dmontrer quon obtient
sin(ctq)
u(q, t) = f(q) cos(ctq) + g(q) (7.12)
cq

93
7 Les transformes de Laplace.

4. Rsultat intermdiaire. Dmontrer que si la TF de g(x) et g(q), alors


x+a
TF 2 sin(aq)
g()d g(q)
xa q
5. En utilisant le rsultat intermdiaire ci-dessus, et les rgles de translations pour les TF,
prendre la TF inverse de (7.12) pour obtenir lquation dans lespace direct.

Problme 7.2 Diffusion sur rseau.


Nous souhaitons rsoudre un systme infini dquations diffrentielles couples :
dun
= 2un + un+1 + un1 n = ... 2, 1, 0, 1, 2, ... (7.13)
dt
Nous cherchons les fonctions un (t) avec les conditions initiales
u0 (0) = 1
un (0) = 0 n 6= 0
videment, ce nest pas par hasard que nous sommes intresss par ces quations, elles consti-
tuent la version discrte, ou sur rseaux, de lquation de diffusion que nous avons abonde-
ment tudi en cours.
1. Prenez la Transforme de Laplace des quations (7.13), en prenant bien soin de distinguer
le cas n = 0 du cas n 6= 0.
2. Comme vous le voyez, la TL a transform notre systme dquations diffrentielles en un
systme dquations algbriques linaires sur les un (s). Nous chercherons la solution sous la
forme de
un (s) = f (s)|n| g(s) (7.14)
o les fonctions f (s) et g(s) sont dterminer 10 . Quelle est la relation entre un (s) et un (s) ?
En utilisant lexpression (7.14) dans les quations que vous avez obtenu pour le cas n > 0 ,
dmontrez que f (s) doit obir lquation
1
f (s) + =s+2 (7.15)
f (s)
dont une des solutions est
s+2+ s2 + 4s
f (s) = (7.16)
2
Que vaut f (s) + 1/f (s) ?
3. Connaissant f (s), il vous reste maintenant utiliser lquation que vous aviez obtenu pour
le cas n = 0 pour dterminer g(s). Donnez alors lexpression complte de la fonction un (s). Si
nous avions plus de temps, nous aurions tent de dinverser la TL et de montrer la relation qui
existe entre la solution (7.16) et (i) les fonctions de Bessel In (t) ; (ii) la solution de lquation de
diffusion continue t u x2 u = (x)(t). Mais ce sera de la gourmandise. Cest dj pas mal
de connatre les solutions sous forme de leurs TL.
4. Dmontrez que le ple le plus droite des fonctions un (s) est s = 0. Dmontrer alors que

le terme dominant du dveloppement de un (s) au voisinage de s = 0 est 1/ s. En dduire le
dveloppement asymptotique de un (t) quand t +.
10. Ceci est une technique classique de rsolution dont le nom savant est matrice de transfert.

94
7 Les transformes de Laplace.

Problme 7.3 le thorme H.

Introduction. Nous souhaitons dterminer la fonction c(x, t) obissant lquation


1
c(x1 )c(x2 ) (p(x1 + x2 ) x) dx2 dx1 dp
p=0 x1 =0 x2 =0
c(x) = 0 (7.17)
dsigne bien-sr la distribution de Dirac. Cette quation est la base du thorme H tablit
par Boltzmann vers 1870 et forme le cur de la thorie cintique des gaz et de la physique
statistique. Nous allons voir ici quaussi intimidant quelle paraisse priori, cette quation se
traite en faite facilement par les outils que nous avons vus dans notre cours. Du point de vue
de la physique, la variable x dnote lnergie cintique ; c(x) est le nombre de molcules ayant
lnergie x ; comme les molcules ont une nergie cintique positive,
c(x) = 0 si x < 0 (7.18)
p dsigne le taux de distribution dnergie aprs un choc entre deux particules : aprs un choc,
deux molcules dnergie initialement x1 et x2 deviennent dnergie p(x1 + x2 ) et (1 p)(x1 +
x2 ), o p est un nombre alatoire entre 0 et 1. Lquation ci-dessus est une quation de bilan,
mesurant la variation du nombre de molcule nergie x aprs chaque choque. A lquilibre,
c(x) doit rester stable ; cest cette distribution dquilibre que nous souhaitons trouver.
1. Nous pouvons effectuer lintgrale triple ci-dessus dans lordre que nous voulons. Nous
commencerons par intgrer sur x2 . Dmontrer alors que lintgrale triple se transforme en une
intgrale double
1
(1/p) c(x1 )c(x/p x1 )dx1 dp (7.19)
p=0 x1 =0
En utilisant la condition (7.18), montrer que lintgrale double ci-dessus se ramne
1 x/p
(1/p) c(x1 )c(x/p x1 )dx1 dp
p=0 x1 =0

Lintgrale sur x1 commence prendre la tte dun produit de convolution, nous avons intrt
passer en TL.
2. Concentrons nous sur lintgrale sur x1 :
x/p
I1 (x) = c(x1 )c(x/p x1 )dx1
x1 =0

TL TL TL
et passons en Transform de Laplace x , c(x) c(), I1 (x) I1 (). Nous savons,

daprs la rgle des dilatation en TL, que TL[f (x/p)] = pf (p). En utilisant cette relation, et le
rsultat sur les produits de convolution, dmontrer que
I1 () = pc(p)2
Et donc que lquation du bilan (7.17) se met sous la forme
1
c(p)2 dp c() = 0
p=0

95
7 Les transformes de Laplace.

Effectuez un dernier changement de variable vident pour mettre le rsultat sous la forme de

1
c(u)2 du c() = 0 (7.20)
0
3. Vrifier que la fonction
A
c() =
+A
o A est une constante est solution de lquation (7.20) ci-dessus. [ Pour trouver cette solution,
il suffit de remarquer que lquation (7.20) peut se transformer en une quation diffrentielle de
Riccati en drivant
une fois].
4. Soit T = 0 xc(x)dx ; T reprsente lnergie totale du gaz. Dmontrer que

c()
T =
=0

En dduire que A = 1/T . En inversant la TL, dduire que la distribution des nergies dans le
systme ltat stationnaire est
1
c(x) = ex/T
T
5. En ralit, ce que nous venons de trouver nest pas vraiment le thorme H. Nous pouvons
crire la version temporelle de cette quation en calculant c(x, t). Dans ce cas, le membre de
droite de lquation (7.17) nest pas nulle, mais vaut t c(x, t). On peut alors dmontrer que la
quantit
S(t) = c(x, t) log (c(x, t)) dx
0
quon appelle entropie est une fonction croissante du temps : t S 0, lgalit ne se ralisant
qu lquilibre.

Problme 7.4 le modle de Glauber.


Les transitions de phase paraissait hors de port de la physique statistique jusqu ce que Ising
propose son modle de magntisme dans les annes 1920. Il existe de nombreuse faon de r-
soudre ce modle une dimension o paradoxalement, il nexiste pas de transition de phase. Plus
exactement, la transition de magntisation arrive seulement quand la temprature est abaisse
0K. En 1963, Glauber a propos un modle cintique quivalent au modle dIsing une di-
mension.
Considrons une chane de diple magntique, ou spin. Nous supposons que les spins ne
peuvent prendre que deux valeurs, 1, correspondant aux diples pointant vers le haut ou
vers le bas. Quand une majorit de spin pointe dans une direction, le matriaux devient ma-
gntique. Chaque spin ninteragit quavec ses deux plus proches voisins, et tente d saligner sur
eux. Plus exactement, il a une certaine probabilit de saligner sur ces voisins ... Plus tard.aboutir
au rsultat (7.11)

96
8 Les fonctions de Green.
8.1 Entre en matire
Les fonctions de Green constituent une mthode assez gnral de rsolution dqua-
tions diffrentielles, ou de transformation dquations diffrentielles en quations int-
grales. Elles sont extrmement utilises en mcanique quantique, o on les appelle des
propagateurs, et en thorie des processus stochastiques. Nous naborderons ce sujet
que trs lgrement ici, juste pour rappeler les grands principes de la mthode.
Supposons que nous voulons rsoudre lquation diffrentielle

d2 x dx
a +b + cx = f (t) (8.1)
dt2 dt
avec les conditions initiales x(0) = x0 et x0 (0) = x0 . Ceci est par exemple lqua-
tion du mouvement dune particule soumise une force f (t) . a et b et c peuvent tre
fonction du temps. Pour rsoudre cette quation diffrentielle, il nous faut trouver la so-
lution de lquation homogne, et lui ajouter une solution particulire. Nous cherchons
justement une solution particulire.
Supposons que nous savons calculer la rponse de la particule une force impul-
sionnelle (genre de Dirac) applique au temps t0 . Saurions nous calculer la rponse de
la particule une force gnrale f (t) ? La rponse est oui : la force f (t) peut tre vue
comme une superposition dimpulsions appliques diffrent temps. Il suffit donc de
superposer les rponses aux divers impulsions pour obtenir la rponse la force f (t).
Plus exactement, on peut crire

f (t) = f (t0 )(t t0 )dt0 (8.2)
0

ce qui veut dire que la force f (t) est la superposition dimpulsions appliques au temps
t0 , avec le poids f (t0 ). Revenons notre quation diffrentielle, et appelons Gt0 (t) la
rponse limpulsion applique au temps t0 . Comme mettre les indices est un peu lourd
comme notation, nous noterons cette fonction plutt G(t, t0 ). De par sa dfinition, elle
doit satisfaire
d2 G(t, t0 ) dG(t, t0 )
a + b + cG(t, t0 ) = (t t0 )
dt2 dt

97
8 Les fonctions de Green.

Notez que toutes les drivations sont faites par rapport t. Multiplions les deux cts
de lquation par f (t0 ). Comme f (t0 ) ne dpend pas de t, on peut la rentrer lintrieur
de loprateur diffrentiel, et crire :

d2 [f (t0 )G(t, t0 )] d[f (t0 )G(t, t0 )]


a + b + cf (t0 )G(t, t0 ) = (t t0 )f (t0 )
dt2 dt
Intgrons maintenant les deux cots par rapport t0 . Comme la drivation est par rap-
port t, nous pouvons (jetant par dessus bord la dcence et lexigence priori de la
convergence uniforme) changer la drivation et lintgration.

d2 d
a 2 f (t0 )G(t, t0 )dt0 + b f (t0 )G(t, t0 )dt0 + c f (t0 )G(t, t0 )dt0 =
dt 0 dt 0
0

(t t0 )f (t0 )dt0 (8.3)


0

Nous remarquons, daprs (8.2), que le ct droit de lquation ci-dessus est juste f (t).
Appelons
y(t) = f (t0 )G(t, t0 )dt0 (8.4)
0
et nous voyons, daprs (8.3), que y(t) est solution de lquation (8.1) ! Remarquez ll-
gance, nous devons calculer une seule fois la fonction de Green G(t, t0 ) pour une qua-
tion diffrentielle. Ensuite, quelque soit le membre de droite, la solution sobtient par
une simple intgration. La solution gnrale de lquation diffrentielle scrit mainte-
nant
x(t) = C1 x1 (t) + C2 x2 (t) + y(t)
o C1 et C2 sont choisit pour satisfaire les conditions initiales.
Nous avons occult pas mal de point important. Voyons quelques exemples. Soit
lquation
dx/dt + x = f (t)
La fonction de Green est la solution de

dG(t, t0 )/dt + G(t, t0 ) = (t t0 )

Prenons la TF des deux cts de lquation (par rapport t bien sr)


exp(it0 )
G(, t0 ) =
i +
H(t) tant la fonction de Heaviside, nulle pour t < 0 et 1 pour t > 0. Comme vous
vous souvenez, la TF de H(t) exp(t) est justement 1/(i + ). Donc,

G(t, t0 ) = H(t t0 ) exp((t t0 ))

98
8 Les fonctions de Green.

Comme vous le remarquez, G(t, t0 ) = 0 si t0 > t. Cela est normal, puisque G(t, t0 ) est
la rponse, au temps t, une impulsion au temps t0 . Si t0 est plus tard que t, la rponse
est nulle. Prenons maintenant plusieurs formes de f .
Exemple 8.1 f (t) = H(t)t

y(t) = H(t0 )t0 H(t t0 ) exp((t t0 ))dt0
0

= t0 H(t t0 ) exp((t t0 ))dt0
0
t
= t0 exp((t t0 ))dt
0
= (1/2 )(exp(t) 1) + (1/)t

Exemple 8.2 f (t) = H(t) sin(t). En suivant les mme tapes,


t
y(t) = sin(t0 ) exp((t t0 ))dt
0
1  t 
= e + cos(t) + sin(t)
2 + 2
Vous voyez ici comment on rsout une fois lquation diffrentielle pour la fonction
de Green, et qu ensuite, il suffit dappliquer une intgration pour trouver la solution
gnrale.
En langage opratoriel, on crirai une quation diffrentielle comme

L[x] = f

o L est un oprateur diffrentiel (dans lexemple ci-dessus d/dt + ), cest dire qui
transforme une fonction en une autre fonction. La solution de cette quation scrira

x = L1 [f ]

Trouver la fonction de Green revient trouver loprateur L1 et ce nest pas un hasard


donc quil comporte une intgration. Si on sest donn une base, on peut reprsenter L
par une matrice (infinie) et trouver la fonction de Green revient inverser cette matrice.
Nous navons pas fini avec les fonctions de Green. Supposons que notre quation est
un peu plus complique :

d2 x dx
a +b + cx = f (t, x)
dt2 dt

99
8 Les fonctions de Green.

Le membre de droite comporte explicitement un terme en x, comme par exemple t.x1/2


ce qui rend la rsolution de lquation nettement plus ardue par les techniques clas-
siques. Mais cela ne change rien pour les fonctions de green. La solution scrira tou-
jours
x(t) = C1 x1 (t) + C2 x2 (t) + f (t0 , x)G(t, t0 )dt0 (8.5)
0
Nous avons transform une quation diffrentielle en une quation intgrale. A priori,
nous navons pas gagn grand chose, ces dernires tant plus compliques rsoudre
que les premires. Mais souvent, et surtout en mcanique quantique, la forme (8.5) se
traite bien par la technique des perturbations (objet du prochain chapitre), et cest un
grand avantage que de pouvoir en disposer. Nous en verrons des exemples plus bas.

8.2 Le potentiel lectrostatique.


Nous avons peut tre prsent les fonctions de Green comme quelque chose de com-
pliqu, mais le lecteur peut remarquer quil utilise les fonctions de Green depuis quil a
appris llectrostatique. Le potentiel lectrostatique (r) cr par une charge ponctuelle
unit en r0 est
1 1
G(r, r0 ) = (8.6)
40 |r r0 |
Si maintenant nous avons une distribution de charge (r0 ) dans lespace, le potentiel
cre par elle au point r vaut

(r) = G(r, r0 )(r0 )dr0 (8.7)

Nous connaissons cette formule depuis la premire anne de luniversit. Nous savons
par ailleurs que le potentiel obit lquation de Poisson

= /0 (8.8)

Nous oublierons dornavant le facteur 0 pour allger les notations. Il nest pas diffi-
cile, vue les quations (8.6-8.8) de suspecter que G(r, r0 ) est la fonction de Green de
lquation de Poisson, cest dire quelle obit

G(r, r0 ) = (r r0 ) (8.9)

Dmontrons ce rsultat. Jusque l, nous navions manipul que des TF et des distri-
butions une dimension. Leurs gnralisation trois dimensions nest pas vraiment
complique. Par exemple, la TF est dfinie par

f(q) = f (r) exp(iq.r)dr

100
8 Les fonctions de Green.

o q et r sont des vecteurs trois dimension et dr dsigne le volume infinitsimal


dxdydz. En gnral, les vecteurs sont nots par des caractres gras droits, et leurs
normes par le mme symbole mais non gras et en italique. Par exemple, q = |q|. Les
oprations sur les TF se gnralise galement assez facilement. Prenons la TF des deux
cots de (8.9) par rapport r :
0
eiq.r
G(q, r0 ) = (8.10)
q2
puisque le numrateur est la TF de la fonction translate de r0 , et que la TF du La-
placien dune fonction est q 2 fois la TF de la fonction (pouvez vous dmontrez ce
rsultat ? ). Il nous faut maintenant inverser la TF pour retrouver la fonction de Green :
iq(rr0 )
1 e
G(r, r0 ) = dq (8.11)
(2)3 q2
Pour effectuer lintgration, passons aux coordonnes sphriques, o nous prenons
laxe qz parallle (rr0 ). Dans ce cas, q(rr0 ) = q|rr0 | cos et dq = q 2 sin dqdd.
Lintgrale (8.11) scrit alors
2
0 1 0
G(r, r ) = 3
d d dq sin .eiq|rr | cos
(2) 0 0 0
Une premire intgration sur ne mange pas de pain et nous sort un facteur 2. Ensuite,
en posant u = cos , le reste scrit
+1
1 0
G(r, r0 ) = dq eiq|rr |u du
(2)2 0 1
et en intgrant sur u, nous trouvons

0 1 sin q|r r0 |
G(r, r ) = dq
2 2 0 q|r r0 |
0
Un changement de variable q|r r | q nous donne

1 1 sin q
G(r, r0 ) = dq
2 2 |r r0 | 0 q
Nous avons donc bien mis en vidence la dpendance en 1/|r r0 |. Lintgrale main-
tenant nest quune constante que nous pourrions calculer laide de la thorie des
fonctions analytiques et vaut /2. Ce qui nous donne exactement lexpression (8.6).

Problme 8.1 Il nest pas difficile de gnraliser la technique ci-dessus et trouver la fonction
de Green de loprateur 2 , o est un rel. En langage claire, rsolvez
G(r, r0 ) 2 G(r, r0 ) = (r, r0 )
Ceci est extrmement utilis en mcanique quantique. Le lecteur y reconnatra peut tre un
semblant dquation au valeur propre.

101
8 Les fonctions de Green.

8.3 La propagation des ondes


Avant dattaquer le problme de la fonction de Green de la corde vibrante, nous avons
besoin de quelques rsultats intermdiaires. Quelle est par exemple la TF de la fonction
f (t) = H(t) sin(0 t) ? Cette question na pas de sens priori, puisque la fonction sin
nest pas sommable ( et ne tend srement pas vers zro quand t ). Mais nous
pouvons calculer la TF de H(t) exp(t) sin(0 t) et une fois la TF calcule, faire
0. Cela nous donnera, et on laisse au lecteur le soin de le dmontrer, que
0
f() =
2 + 02
Quelle est maintenant la rponse dun oscillateur ( initialement au repos ) une force
impulsionnelle ? Nous devons rsoudre
d2 y
+ 02 y = f0 (t) (8.12)
dt2
En faisant un allerretour dans lespace de Fourier, nous voyons que la solution est
f0
y(t) = H(t) sin(0 t)
0
Nous somme maintenant bien outill pour calculer la rponse dune corde vibrante
(initialement au repos) une force impulsionnelle. Nous notons u(x, t) la hauteur de
la corde labscisse x et au temps t :
2u 2u
2
c2 2 = f0 (x)(t)
t x
En prenant la TF par rapport la variable x, nous trouvons pour u(q, t)

2 u
+ c2 q 2 u = f0 (t)
t2
Mais cela est justement lquation (8.12) que lon vient de rsoudre, et nous avons donc
sin(ct q)
u(q, t) = f0 H(t)
cq
Il nous reste maintenant inverser la TF, ce qui est facile si on se souvient de la TF de
la fonction Porte (x/a) rencontre au chapitre 3 :
f0 x
u(x, t) = H(t)( )
c ct
(Exercice : Est-ce tout cela dimensionnellement correct ?) Cette solution est reprsent
sur la figure 8.1 .

102
8 Les fonctions de Green.

1
2
3
4

Figure 8.1 La solution u(x, t) en fonction de x pour les temps t0 , 2t0 ,...

Il est vident que si au lieu dappliquer la force f0 en x = 0 nous avions appliqu la


force fx0 en x = x0 , la solution, qui est la fonction de Green de la propagation, scrit

fx0 x x0
G(x, t; x0 , 0) = H(t)( )
c ct
Si la corde tait initialement au repos et on y appliquait la force distribue f (x), la
dformation de la corde est donne par
+
x x0
u(x, t) = c1 H(t) f (x0 )( )dx0
ct
x+ct
= c1 H(t) f (x0 )dx0
xct

Linfluence dun vnement en x0 ( linstant t = 0 ) ne peut tre ressenti en x linstant


t que si cet vnement tait lintrieur du cne dinfluence de ce dernier, cest dire
que si x ct < x0 < x + ct. En terme moins mystique, une perturbation se propage
vitesse c.

8.4 Propagateur pour lquation de Schrdinger.


8.5 Disposer dune base propre.

103
9 Les oprateurs linaires.
9.1 Introduction
Une des tches que lon rencontre rgulirement en physique est de rsoudre des
quations diffrentielles linaires. De faon gnrale, nous pouvons reprsenter ces
quations par Ly = f , o y est la fonction inconnue rechercher, f une fonction
connu, et L un oprateur diffrentiel.
 Par exemple, lquation de la chaleur peut scrire
Lu = q(x, t), o L = t Dx2 et q(x, t) est le terme de source. A priori, la recherche
des solutions est du domaine de lanalyse. Nous allons voir cependant que nous pou-
vons ramener la rsolution de ces quations dans le domaine de lalgbre matricielle
des systmes n quations et n inconnus 1 du genre AX = B. Le trs grand avan-
tage est que pour faire de lalgbre, nous navons, en gros, que besoin daddition et
de multiplication 2 . Les transformes de Fourier et de Laplace que nous avons rencon-
trs dans ce cours taient des exemples particuliers doutils bien adapts une certaine
classe dquations qui nous permettaient de ramener lanalyse lalgbre. Nous allons
gnraliser cette approche et voir toute la puissance de feu que cela nous procure.
Depuis le dbut de ce cours, nous insistons fortement sur le concept de vecteur. Au
premier chapitre, nous avons vu que dans un espace vectoriel, nous pouvons dfinir des
bases : cela nous permet de manipuler les vecteurs laide de colonnes (ou de lignes)
de nombres. Nous avons galement vu que si nous disposons dun produit scalaire,
cela facilite grandement la tache de trouver les coefficient dun vecteur dans une base
orthogonale.
Un vecteur peut tre un objet aussi simple quun vecteur usuel du plan euclidien, ou
un objet beaucoup plus complexe tel quune fonction. Prenons le cas dune fonctions f
. Une fonction est une machine qui prend un nombre en entre et produit un nombre
en sortie. Nous pouvons choisir plusieurs reprsentations pour une mme fonction. Par
exemple, si nous choisissons la base de Fourier avec les vecteurs de la base exp(iqx),
f scrira comme une superposition de ces fonctions, chacun avec un poids f(q) (nous
avons absorb ici le facteur 1/2 dans la dfinition de f ) :
+
f (x) = f(q) exp(iqx)dq

Lintgral ici neffectue rien dautre que la superposition des vecteurs de base avec leurs
1. n tant infini en loccurrence, mais ceci ninduit pas de difficults particulires
2. Voir galement le chapitre 19 sur la signification dune quation diffrentielle

104
9 Les oprateurs linaires.

poids correspondants. Il est galement usuel de reprsenter la fonction f par un tableau


qui chaque entre numrique, associe un nombre, et on note cela f (x) (la notation
est un peu confuse). En ralit, cela revient reprsenter une fonction f sur la base des
de Dirac, o chaque valeur f (x) est le poids associ un Dirac centr sur x :
+
f (x) = f (y)(x y)dy

A nouveau, lintgral ne fait rien dautre que de superposer des vecteurs de la base.
Revenons maintenant au concept gnral de vecteur. Soit lespace vectoriel E. Nous
pouvons dfinir des oprations qui transforment un vecteur en un autre, et cela de
faon linaire. Dans lespace des vecteurs du plan euclidien, la rotation ou la projection
sur un axe sont de telles oprations. Par exemple, la rotation de la somme de deux
vecteurs gale la somme de leurs rotations : R(e1 + e2 ) = Re1 + Re2 . Dans lespace
des fonctions infiniment drivables, lopration drivation D est une opration linaire :
x un un autre, et cela de faon linaire. De
elle transforme un vecteur (une fonction)
mme, lopration intgration I[f ] = 0 f (y)dy. De faon gnral, nous appelons, dans
lespace des fonctions, un oprateur linaire comme une machine qui prend en entre
une fonction et produit en sortie une autre fonction, et fait cela de faon linaire :

O[f1 + f2 ] = O[f1 ] + O[f2 ]

o et sont des scalaires et f1 et f2 des fonctions.

Exercices.
9.1 Soit loprateur X qui prend une fonction f en entre et produit la fonction multiplie
par x en sortie : X[f (x)] = xf (x) [exemple : X[sin(x)] = x sin(x)]. Dmontrer que cest un
oprateur linaire.

9.2 Quen est il de loprateur X 2 : X 2 [f (x)] = x2 f (x) ? Soit V (X) un oprateur tel que
V (X)[f (x)] = V (x)f (x). Est ce que ce dernier est linaire ?

9.3 Mme question pour loprateur 1 : 1[f (x)] = f (x). Loprateur 0 est loprateur qui
associe nimporte quelle fonction la fonction 0. Est-il linaire ? De faon gnral, loprateur
associe une fonction f la fonction f ( il faut avouer que la notation est vraiment confuse
entre loprateur et le scalaire ; on sy habitue vite cependant).

9.4 Soit loprateur de translation T [f (x)] = f (x + ) ; dmontrer quil est linaire.

Note sur les notations. Pour manipuler les oprateurs linaires, la coutume est de
laisser tomber les signes du genre () et []. Ainsi, nous crivons Of o mme pire, Of (x)
la place de O[f (x)]. La confusion est gnante quand on crit par exemple, Xf (x) =

105
9 Les oprateurs linaires.

xf (x). X ici est un oprateur, f (x) et xf (x) sont des fonctions 3 ; Xf (x) est la fonction
qui rsulte de lapplication de X f . Pour viter un peu ces confusions, la convention
que nous suivrons dans ce cours et de toujours noter les oprateurs par des lettres
majuscules.

9.2 Lalgbre des oprateurs.


Se donner une algbre est se donner un ensemble E ou lon dfinit les deux oprations
+ et . (produit) entre ses membres, avec toutes les proprits dassociativits usuelles
que vous connaissez : soit a, b, c E, alors

a + b , a.b E
a+b = b+a
a(b + c) = ab + ac ; (a + b)c = ac + bc
(ab)c = a(bc)

Nous devons avoir quelques proprits de plus pour mriter le nom dalgbre. Il faut
quil existe des lments neutre vis vis des deux oprations, quon appelle 0 et 1 :
a + 0 = 0 et a1 = 1a = a. De plus, les inverses des lments vis vis de + et de .
doivent exister : pour chaque lment a, il doit exister un lment unique, quon appelle
a, tel que a + (a) = 0 ; de mme, il doit exister un lment unique quon note 1/a
ou a1 tel que a.(1/a) = (1/a)a = 1 (pour a 6= 0).
Lensemble des nombres (rationnels ou rel), quip de + et de . usuel, constitue une
algbre. Cest un cas un peu particulier, puisquen plus, la multiplication y est com-
mutative (ab = ba). Mais tous les thormes qui ont t dmontrs pour lalgbre des
nombres sans invoquer la commutativit du produit sont valable pour nimporte quelle
autre algbre.
Nous pouvons dfinir une algbre pour les oprateurs linaires. Nous devons dabord
prciser le sens de lgalit entre oprateurs. Nous dirons que O1 = O2 si le rsultat
de lapplication de ces deux oprateurs une fonction est le mme, quelque soit la
fonction 4 : f, O1 f = O2 f .

3. A vrai dire, cest encore pire : f est une fonction, f (x) est un nombre. A nouveau, on a lhabitude de ne
pas toujours distinguer explicitement les deux choses et laisser le boulot au cerveau. Dans ce cas, le cerveau
agit comme un vulgaire compilateur C, testant constamment le type des notations quon utilise.
4. Il est vident que f est une condition trop exigeante et na pas de sens en gnral. Si par exemple,
loprateur contient des drives dordre n, nous devons comprendre f comme : quelque soit f nfois
drivable. A chaque fois, nous supposerons lensemble des fonctions comme compatible avec la dfinition
de loprateur. Nous nentrerons pas plus dans le dtail lors de ce cours, pour ne pas alourdir chaque assertion
par un train de prcautions et de conditions dapplicabilit. Dans la majorit des cas, nous supposons que
nous travaillons avec lensemble des fonctions L2 [, +] au moins deux fois continuement drivable.
Ceci surtout impose nos fonctions quelles et leurs drives 0 quand leur argument .

106
9 Les oprateurs linaires.

Lopration + entre oprateurs hrite directement sa dfinition de lopration +


entre les fonctions 5 : Loprateur O1 + O2 est loprateur qui, appliqu une fonction,
produit la fonction O1 f + O2 f (bien noter que l, laddition est entre deux fonctions).
Lopration . est la combinaison doprateur : O1 O2 est loprateur qui la fonction f ,
associe la fonction O1 [O2 [f ]]. On peut affirmer maintenant que lensemble des opra-
teurs linaires muni de + et de . constitue une algbre. Les oprateurs 0 et 1 sont les
lments neutres de laddition et de la multiplication. Dans la suite de ce cours, len-
semble des fonctions auxquels ces oprateurs sappliquent est lensemble des fonctions
L2 au moins deux fois drivable.
Toutes les notations que nous utilisons dans lalgbre classique peuvent tre uti-
lises pour lalgbre des oprateurs. Par exemple, X 2 est effectivement X.X. Si lon
dsigne par x et y les oprateurs de drivation par rapport x et y, alors x2 y2 =
(x y )(x + y ). Il faut juste faire attention la commutativit : en gnral, deux
oprateurs ne commutent pas : O1 O2 6= O2 O1 . Cela ne veut pas dire que lon ne peut
pas trouver deux oprateurs qui commutent, lexemple prcdent de x et y le montre.
Simplement, il ne faut pas le prsumer lavance.

Exemple 9.1 Dmontrons que DX XD = 1 (bien noter que ceci est une galit
entre oprateurs). Nous avons DX[f (x)] = (d/dx) (xf (x)) = xf 0 (x) + f (x) et
XD[f (x)] = xf 0 (x). Donc (DX XD)[f (x)] = f (x) : Le rsultat dapplication
de DX XD une fonction est le mme que lapplication de loprateur 1, do
lgalit entre les oprateurs.

Dfinition 1 On appelle commutateur de deux oprateurs O1 et O2 , loprateur O1 O2


O2 O1 . Il est usuel de noter ce dernier [O1 , O2 ].
Le commutateur joue un trs grand rle en mcanique quantique. Depuis le livre
de Paul Dirac en 1930, la mcanique quantique est formule travers les relations de
commutations.

Fonctions doprateurs. Beaucoup de fonctions usuellesP n sont dfinies laide de


sries algbriques, comme par exemple, exp(x) = n x /n!. Puisque lon dispose
dune algbre pour les oprateurs linaires, nous pouvons faire de mme et dfinir des
fonctions doprateurs, comme par exemple exp(O) ou log(1+O), qui sont elles mmes
des oprateurs linaire. Par exemple, pour loprateur D et le scalaire ,

X
exp(D) = (1/n!)n Dn
n=0

5. De mme que dans lespace des fonctions, lopration + est hrite de laddition entre les nombres : la
fonction f + g est la fonction qui associe au nombre x le nombre f (x) + g(x).

107
9 Les oprateurs linaires.

et le rsultat de son application une fonction f (x) produit la fonction



X
(1/n!)n f (n) (x) = f (x + )
n=0

Loprateur exp(D) nest donc rien dautre que loprateur de translation T vu plus
haut. Bien sr, ds que lon parle de suites et de sries infinies, nous avons besoin de la
notion de convergence. La convergence dans lespace des oprateurs hrite sa dfinition
de la convergence dans lespace des fonctions : nous dirons que la suite On converge
vers O si la suite des fonctions On f converge vers la fonction Of quelque soit f (cf la
note 4).
Disposer des fonctions doprateurs nous permet de rsoudre symboliquement nombre
dquations drives partielles (EDP). Prenons dabord lquation diffrentielle ordi-
naire
dy/dt = ay (9.1)
avec la condition initiale y(t = 0) = y0 o a et y0 sont des scalaires ne dpendant pas
du temps. La solution bien connue est y(t) = exp(ta)y0 . La valeurs de la fonction un
temps ultrieur t sobtient en appliquant (multipliant) le scalaire exp(ta) la condition
initiale.
Soit maintenant lEDP de premier ordre

t x = 0 (9.2)

o (x, t) est une fonction des deux variables x, t ; la condition initiale tant (x, t =
0) = 0 (x), 0 (x) tant une fonction connue de la variable x. Nous pouvons crire
cette quation sous forme opratorielle

/t = D

o D = /x est un oprateur qui ne dpend pas de t. En sinspirant de lexemple


de lquation (9.1), (voir le problme 9.2 pour un traitement rigoureux ) nous pouvons
donner la solution comme

(x, t) = exp(t.D)0 (x)

Nous savons par ailleurs que loprateur exp(tD) nest rien dautre que loprateur
translation dune quantit t. La solution scrit donc

(x, t) = 0 (x + t)

Ceci est la solution exacte de lEDP (9.2) que nous pouvons obtenir soit par des trans-
formes de Fourier-Laplace , soit par la mthode des caractristiques du chapitre 15.
Ceci nest pas une analogie. Les mme rgles dalgbre (et danalyse) que nous appli-
quons aux fonctions ont t dfinies pour les oprateurs et nous donnent le droit de

108
9 Les oprateurs linaires.

les manipuler symboliquement de la mme faon. Voyons cela dun peu plus prs. La
fonction f (t) = exp(ta) est donne comme la srie
X
exp(ta) = tn an /n!
n=0

sa drive (qui concide avec la drive terme terme de la srie) scrit (en jouant sur
lindice de sommation)
X
f 0 (t) = tn an+1 /n!
n=0
X
= a tn an /n!
n=0
= af (t)
et cest pour cela que cette fonction est la solution gnrale de (9.1). En utilisant les
mmes rgles de manipulation pour lalgbre doprateurs, nous voyons que lopra-
teur exp(tD) possde comme drive par rapport au temps loprateur D exp(tD). La
fonction (x, t) = exp(tD)0 (x) a donc pour drive par rapport au temps la fonction
D exp(tD)0 (x), cest dire D(x, t).
De faon gnrale, nous pouvons avoir des EDP du genre
/t = H
o H est un oprateur spatial ( ne dpendant que de la variable x ) plus compliqu que
le simple oprateur de drivation spatiale D, mais la discussion ci-dessus reste valide
et nous pouvons donner la solution comme
(x, t) = exp(tH)(x, t = 0)
Loprateur exp(tH) nest plus alors une simple translation, mais le principe reste le
mme : la fonction solution un temps ultrieur t est donne par lapplication de lop-
rateur exp(tH) la fonction condition initiale. Loprateur exp(tH) est appel,
juste titre, loprateur de lvolution temporelle. Cette faon de prsenter les choses est
appele, en mcanique quantique linterprtation dHeisenberg (voir plus bas pour une
digression historique). videmment, cette faon de rsoudre lquation ne nous sert
rien si nous ne savons pas calculer exp(tH). Nous verrons plus bas les outils que les
mathmaticiens ont dvelopp pour calculer efficacement ce genre de fonctions dop-
rateurs.

Exercices.
9.5 Identit de Jacobi.
Dmontrer que pour trois oprateurs A, B, C, nous avons
[A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0

109
9 Les oprateurs linaires.

9.6 Dmontrer que D2 + X 2 = (D + X)(D X) + 1 = (D X)(D + X) 1. En dduire


[D X, D + X] et [D2 + X 2 , D X]. [indication : Utiliser la relation [D, X] = 1 ].

9.7 Commutateur des oprateurs. Dmontrer que les oprateurs O et f (O) commutent.
f (x) est une fonction analytique dans le voisinage de x = 0. Mme chose pour g(O) et f (O).
Dmontrer que si A et B commutent, alors f (A) et g(B) commutent.

9.8 Dans lespace des oprateurs linaires sur les fonctions trois variables, nous dfinissons
Lz = Xy Y x ; Lx et Ly sont dfinis cycliquement partir de cette dernire P 2dfinition.
Calculer [L , L ]( , = x, y, z ). Donner la dfinition de L2 et de L2 = L . Calculer
[L2 , L ].

9.9 Oprateur rotation. En utilisant les rgles de drivation en chane, dmontrer que

= Lz

que reprsente alors loprateur exp(Lz ) ? [(r, , ) sont les coordonnes du point en coor-
donnes sphrique]

9.10 Exponentiel dun oprateur. dmontrer que


d
exp(tA) = A exp(tA)
dt
o A est un oprateur linaire. Help : Utiliser le dveloppement de lexponentiel et les rgles
habituelles de la drivation.

9.11 Exponentiel dun oprateur (encore). Dmontrer que exp(P 1 AP ) = P 1 exp(A)P


o A, P sont deux oprateurs linaires.

9.12 Commutation et exponentiel. Soit la matrice


 
0 x
A=
x 0

Calculer A2 . En dduire une expression gnrale pour An selon que n est pair ou impair. D-
montrer alors que  
cos x sin x
exp(A) =
sin x cos x
Help : Dcomposer la somme en termes pairs et impairs, et utiliser le dveloppement en srie
des fonctions sin et cos. Soit maintenant les deux matrices
   
0 x 0 0
C= , D=
0 0 x 0

Dmontrer que C 2 = D2 = 0 et en dduire eC .eD . Que peut ont dire de eC eD et eC+D ? Est
ce que C et D commutent ?

110
9 Les oprateurs linaires.

9.13 expA+B Pour deux oprateurs A et B qui ne commutent pas priori, dmontrer que
t
e(A+B)t = eAt + eA(ts) Be(A+B)s ds
0

Cette relation, appel en mcanique quantique relation de Dyson, est trs utile pour valuer
lexponentiel dun oprateur, si exp(At) est connu et que la matrice de loprateur B est trs
creuse. [indication : Quel est la solution de lquation y 0 ay = f (x) ? Obtenir une quation
analogue pour loprateur exp(A + B)t]. En profiter pour donner lexpression de exp(A + B).

9.14 quation donde. Rsoudre par la mthode des oprateur lquation

2u 2u
2
c2 2 = 0
t x
avec les conditions initiales u(x, 0) = f (x) et t u(x, t)|t=0 = g(x) en lcrivant sous la forme
symbolique 2 u/t2 c2 D2 u = 0 et en vous inspirant de la solution de lquation ordinaire
u00 a2 u = 0.

9.3 Reprsentation matricielle des oprateurs.


Le grand avantage de disposer dune base est de pouvoir manipuler les vecteurs
laide des nombres. Le mme avantage est obtenu pour les oprateurs. Par exemple,
tant donn un vecteur du plan euclidien, nous navons pas nous munir de compas et
de rapporteur pour effectuer une rotation, mais seulement effectuer des additions et
des multiplications sur des colonnes de chiffres. Voyons comment cela fonctionne.
Soit un oprateur linaire R dans un espace E que nous avons quip dune base
{e1 , ...en }. Soit un vecteur v quelconque. Notre but est de pouvoir calculer le rsultat
de lapplication de R v, qui est un autre vecteur de E. Nous pouvons dcomposer v
dans la base donne : X
v= aj ej
j

et comme R est linaire, X


R.v = aj (R.ej )
j

Pour entirement caractriser loprateur R, nous avons simplement besoin de connatre


laction quil effectue sur chaque lment de la base. Par ailleurs, chaque R.ei ( pour
i = 1, ..., n ) est un vecteur de lespace E, et donc dcomposable sur la base {e1 , ...en } :
X
R.ej = rij ei (9.3)
i

111
9 Les oprateurs linaires.

Donc, pour entirement connatre R, il suffit de connatre les n n nombres rij . Nous
pouvons alors connatre le rsultat de lapplication de R nimporte quel vecteurs de
lespace. X
R.v = rij aj ei (9.4)
i,j

Il est habituel de reprsenter la dcomposition de R.ej comme la jime colonne


dun tableau de n lignes et appeler le tableau une matrice.
Exemple 9.2 Rotation dans le plan euclidien.
Caractrisons la rotation de /2 dans la base orthonorme habituelle du plan eu-
clidien (ex , ey ). Nous savons que R.ex = ey = 0ex + 1ey . La premire colonne
de la reprsentation matricielle de R dans cette base sera donc (0, 1). De mme,
R.ey = 1ex + 0ey . La reprsentation de R est donc
 
0 1
R=
1 0

Il est trs important de faire la distinction entre loprateur R et sa reprsentation


matricielle. La reprsentation matricielle est comme une photo de loprateur : elle
dpend de la base choisie, comme la photo dpend du point de vue du photographe
et de lhumeur de la personne qui se fait photographier. Mais la photo nest pas la
personne.
Exemple 9.3 Drivation dans lespace des fonctions.
Choisissons la base de Fourier {eq = exp(iqx)}. La base est bien sr infinie, (et
mme trs infinie !), mais cela na pas dimportance. Nous avons

D.eq = iq eq

La reprsentation matricielle de D dans la base de Fourier ne comporte que des l-


ments diagonaux. Les lments dqq0 de la matrice de D sont donc donns par dqq0 = 0
si q 6= q 0 et par dqq = iq. Le fait que D soit diagonale dans la base de Fourier est
la raison de son utilisation pour la rsolution de lquation donde ou de la chaleur.
Lapplication de D une fonction quelconque donne
+
Df (x) = iq f(q) exp(iqx)dq

ce qui nest rien dautre quune rcriture de lexpression (9.4).


Nous voyons travers ce dernier exemple un fait important. Peu importe que notre
espace soit fini ou infini, partir du moment o nous disposons de bases (finies, infinies
discrtes ou infinies continues ) et que les convergences sont assures, nous pouvons
manipuler les oprateurs linaires comme des matrices.

112
9 Les oprateurs linaires.

Base orthonormale. Nous avons vu au premier chapitre que disposer dun produit
scalaire (., .) et dune base orthonormale facilite normment les choses. Soit {e1 , ...en }
une base orthonormale, P cest dire (ei , ej ) = i,j et soit la dcomposition dun vecteur
quelconque v : v = ai ei . Alors
X
(v, ek ) = ( ai ei , ek )
i
X
= ai (ei , ek )
i
= ak

Le coefficient ak de la dcomposition du vecteur v sur la base {ei } nest rien dautre que
le produit scalaire entre v et ek . Le mme principe nous donne les coefficients rij dun
oprateur dans une base orthonorme. En partant de lexpression (9.3), nous voyons
que
rij = (ei , R.ej )
Pour trouver rij , il suffit dappliquer R ej et ensuite prendre le produit scalaire de ce
dernier avec ei .

Exercices.
9.15 Soit la base de Fourier {1, cos(2nx/L), sin(2nx/L)} pour les fonctions dfinies sur
[0, L]. En ordonnant correctement les lments de la base, donner lexpression de loprateur D
et D2 dans cette base.

9.16 Soit les fonctions dHermite


dn
hn (x) = Cn (1)n exp(x2 /2) exp(x2 ) (9.5)
dxn
Les premires fonctions sont (en multipliant par exp(x2 /2) ) 1, 2x, 4x2 2,... Les coefficients
Cn , que nous nexplicitons pas, assurent que les fonctions sont normes. On peut dmontrer,
avec un peu deffort, que les fonctions hn sont deux deux orthogonales et forment une base.
Dmontrer que pour loprateur

H = D2 + X 2

nous avons Hhn (x) = (2n + 1)hn (x). Donner alors la reprsentation de H dans la base des
hn .

9.17 Oprateur D dans la base des Bessel. Soit les fonctions de Bessel In dfinies par

1 x cos
In (x) = e cos(n)d
0
Dmontrer que
In0 (x) = (1/2) (In1 (x) + In+1 (x))

113
9 Les oprateurs linaires.

Les fonctions exp(x)In (x) (n = 0, 1, ...) forment une base. Donner lexpression de la matrice
de loprateur D dans cette base. Cette matrice joue un rle trs important dans les problmes
de matrices tridiagonales.

9.18 Montrer que si loprateur M commute avec tous les autres oprateurs, alors M = I.
[Help : donnez vous une base quelconque (e1 , ..., en ) et considrer loprateur projection sur
e1 : P1 ej = i,j e1 . En utilisant la commutation de M avec cet oprateur et dautres oprateurs
de projection, dmontrer que la matrice de M dans cette base est diagonale. Ensuite, considrer
un oprateur de permutation cyclique ei = ei+1 et considrer sa permutation avec M : en
dduire que tous les lments diagonaux de M sont alors gaux.]

9.19 Laguerre et autres.

9.4 Valeurs et vecteurs propres.


Quand on travail avec un oprateur linaire et que lon souhaite rsoudre une EDP
qui lui est associ, certaines fonctions (ou vecteur) ont un rle privilgi. On appelle
vecteur propre (eigenvector en anglais) dun oprateur O un vecteur vn 6= 0 tel que

Ovn = n vn

o n est un scalaire qui est appel valeur propre du vecteur vn .


En gomtrie plane, pour loprateur de projection sur laxe x, les deux vecteurs ex
et ey sont des vecteurs propres, avec les valeurs propres 1 et 0. En gomtrie trois
dimensions, les trois vecteurs ex et ey et ez sont des vecteurs propres de la projection
sur laxe x, le premier associ = 1, les deux autres = 0. Dans le plan, Pour
lopration de rotation de , tous les vecteurs du plan sont des vecteurs propres associs
la valeur = 1 (remarquer cependant que R = I). Enfin, la rotation de /2 na
pas de vecteurs propres.
Exemple 9.4 Dans lespace des fonctions, exp(iqx) est vecteur propre de loprateur
D = x avec la valeur propre iq. Les fonctions sin(qx) et cos(qx) sont les vecteurs
propres de loprateur D2 avec = q 2 . Les fonctions dHermite hn (x) que nous
avons rencontr plus haut sont fonctions propres de loprateur D2 + X 2 avec la
valeur propre n = (2n + 1).
Si les vecteurs propres sont suffisamment nombreux pour former une base, on les
appelle une base propre. videmment, la reprsentation dun oprateur dans sa base
propre est diagonale.
Disposer dune base propre acclre (ou rend possible) la solution des problmes.
Prenons le systme deux quations et deux inconnus

2x + 3y = 4
x 2y = 1

114
9 Les oprateurs linaires.

formellement, nous pouvons le reprsenter comme Au = B o A est la matrice


 
2 3
1 2

u = (x, y)T et B = (4, 1)T . A est la reprsentation matricielle dune application li-
naire dans la base e1 = (1, 0)T et e2 = (0, 1)T . La rsolution de ce systme ncessite
quelques oprations dadditions et de combinaisons. Par contre, le systme

2x = 4
3y = 1

se rsout immdiatement comme deux quations indpendantes. Formellement, on pou-


vait lcrire Au = B o cette fois A est la matrice
 
2 0
0 3

dans la base e1 , e2 , la matrice de loprateur A est diagonale, ce qui permet de ramener


la rsolution dun systme de deux quations deux inconnus la rsolution de deux
quations une inconnue. videmment, un systme 2 2 est facile rsoudre, pour
un systme de 4 4 ou 1000 1000, le gain est dj plus apprciable. Dans lespace de
dimension infinie de Hilbert, trouver une base propre est souvent la seule possibilit de
rsoudre un problme, comme nous le verrons plus bas.

9.5 Disposer dune base propre orthogonale.


Le trs grand avantage de disposer dune base propre orthogonale (ou encore mieux,
orthonormale) est de pouvoir rsoudre des quations aux drives partielles. Nous
avons vu une application de cette mthode dans le chapitre sur les sries et transfor-
mes de Fourier. Nous allons voir cela dans des cas plus gnraux.
Supposons que nous voulons rsoudre lquation aux drives partielles

t (x, t) = H(x, t) (9.6)

o lon suppose que loprateur H na que des composantes spatiales. Les conditions
initiales et aux limites de cette quation sont les suivantes :

(x , t) = 0
(x, 0) = g(x)

la fonction tend vers zro pour les grand x ; linstant t = 0, la fonction recher-
che prend la forme de f (x). Supposons que nous connaissons une base orthonormale

115
9 Les oprateurs linaires.

{fn (x)} dans laquelle loprateur H est diagonale 6 :

Hfn (x) = n fn (x)

A chaque instant t, nous pouvons dcomposer la fonction (inconnu) (x, t) sur la base
des {fn } :

X
(x, t) = an (t)fn (t)
i=0

Les an (t) sont les coefficients de cette dcomposition et varient bien sr dun instant
un autre. En utilisant cette dcomposition dans lquation (9.6) nous obtenons 7

X
X
a0n (t)fn (x) = n an (t)fn (x)
i=0 i=0

Comme les fn constituent une base, les coefficients de la dcomposition sont uniques
et
an (t) = an,0 exp(n t)
Il nous reste juste trouver les coefficients an,0 ; ceci sobtient en utilisant la condition
initiale
X
g(x) = an,0 fn (x)
i=0
et donc
an,0 = hfn (x), g(x)i
Rsumons la mthode. On dcompose la condition initiale sur la base des fonctions
propres. Lamplitude de chaque composante an (t) varie exponentiellement avec lexpo-
sant n . Il suffit de recombiner ces composantes un temps ultrieurs t pour recalculer
la fonction en ce temps l :

X
(x, t) = h(x, 0), fn (x)i exp(n t)fn (x) (9.7)
i=0

Cette faon de calculer la fonction est appel en mcanique quantique linterprtation


de Schrdinger 8 .
6. Nous supposons que les fonctions fn sont compatibles avec les conditions aux bords : fn (x
) = 0.
7. Nous supposons que lon peut intervertir les oprations de sommation et de drivation par rapport au
temps.
8. Heisenberg et Schrdinger ont formul ces deux approches dans les annes 1922-28 quand les m-
thodes danalyse fonctionnelle ntaient pas encore popularises chez les physiciens. La contribution de Von
Neumann tait de montrer, en important les concepts dvelopps par Hilbert en mathmatiques, que les deux
approches taient quivalentes. Dirac mis la dernire main ldifice en 1932 en formulant lensemble de
faon extrmement lgante.

116
9 Les oprateurs linaires.

Exemple 9.5 oscillateur harmonique.


En mcanique quantique, lquation dune particule dans un potentiel harmonique
scrit (en choisissant convenablement les units)
2
 

i = 2 + x2
t x
Daprs lexercice 9.16 que nous avons vu sur les fonctions de Hermite, il nest pas
difficile dexpliciter la solution sous la forme de
X
(x, t) = an ei(2n+1)t hn (x)

Comparaison Schrdinger-Heisenberg. Linterprtation de Schrdinger et Hei-


senberg sont bien sr quivalente. Reprenons lquation (9.6) . Dans linterprtation
dHeisenberg, la solution scrit
(x, t) = etH (x, 0) (9.8)
comme nous lavons indiqu, la fonction au temps t sobtient en appliquant lop-
rateur exp(tH) la fonction au temps 0. Dans sa base propre (les fn (x) ci-dessus),
loprateur H est diagonal. En utilisant la dfinition de loprateur
X
exp(tH) = (1/n!)tn H n
n=0

nous voyons que loprateur exp(tH) est galement diagonal dans cette base, et ses l-
ments diagonaux scrivent ( (exp(t1 ), (exp(t2 ), ...(exp(tn ), ...). En notation ma-
tricielle, nous avons
1 0 . .
0 2 0

H= . 0 3 .

. . . .
. .
et t
e 1 0 . .
0 et2 0
tH
t3

e = . 0 e .

. . . .
. .
Si maintenant nous exprimons la fonction (x, 0) dans la mme base
X
(x, 0) = h(x, 0), fn (x)i fn (x)
n

nous voyons que linterprtation dHeisenberg (9.8) exprime exactement la mme chose
que linterprtation de Schrdinger (9.7).

117
9 Les oprateurs linaires.

Fonctions doprateurs. Le paragraphe prcdent nous indique comment calculer


une fonction doprateur, mme quand nous ne connaissons pas la srie de la fonction
. Soit loprateur A, diagonal dans sa base propre (e1 , e2 , ...) et possdant les valeurs
propres (1 , 2 , ...). Loprateur f (A) est dfinie de telle faon que sa reprsentation
dans la mme base soit diagonale, avec les lments (f (1 ), f (2 ), ...).

9.6 Oprateurs hermitiens.


Dans la thorie des oprateurs linaires, une certaine classe doprateurs quon ap-
pelle hermitiens joue un rle fondamental, puisquon peut dmontrer que ces opra-
teurs sont diagonalisables et qui apparaissent trs souvent dans les problmes de phy-
sique.
Nous supposons dornavant que nous disposons dun produit scalaire (., .).On ap-
pelle ladjoint dun oprateur O loprateur O tel que quelque soit les deux vecteurs
u, v
(u, Ov) = (O u, v)
Supposons que le produit scalaire est dfini sur le corps des rels. Alors (u, v) =
(v, u). Si dans une base (que nous prenons orthonormale pour plus de simplicit, mais
sans ncessit aucune) loprateur O est reprsent par la matrice Oij = (ei , Oej ),

on peut dmontrer sans difficult que pour la matrice de ladjoint, Oij = Oji : on
interverti les lignes et les colonnes dune matrice pour obtenir celle de son adjoint. La
matrice rsultante est appel la transpose. Si le produit scalaire est dfini sur le corps

des complexes, alors Oij = Oji .
Un oprateur est dit self-adjoint ou hermitien si O = O.
Exemple 9.6 Dans lespace des fonctions relles ou complexes L2 (qui donc tendent
vers 0 pour x ), loprateur D nest pas hermitien : une intgration par partie
montre que (u, Dv) = (Du, v). Par contre, deux intgrations par partie montrent
que loprateur D2 est hermitien. De mme, loprateur iD est Hermitien pour les
fonctions complexes.
Les oprateurs hermitiens ont quelques proprits remarquables, parmi lesquels les
suivantes que nous demandons au lecteur de dmontrer/dcouvrir travers les exer-
cices.

Exercices.
9.20 Les valeurs propres dun oprateurs hermitiens sont relles : Si Ax = x, A = A , alors
R. [Indication : calculer (x, Ax) et (x, A x)]
9.21 Les vecteurs propres associs deux valeurs propres distinctes sont orthogonales : Si
Ax1 = 1 x1 , Ax2 = 2 x2 , A = A , 1 6= 2 , alors (x1 , x2 ) = 0. [indication : calculer
(x1 , Ax2 ) et (x1 , A x2 ).

118
9 Les oprateurs linaires.

9.22 Dmontrer, dans lespace des fonctions L2 que les valeurs propres de loprateur D2
sont positifs. [indication : il suffit de dmontrer que x, (x, D2 x) 0, ce qui peut sobtenir
en effectuant une intgration par partie. De tels oprateurs sont appels dfini positif.].

9.23 Soit la fonction relle V (x) possdant un minimum absolu E : x R,V (x) E. D-
montrer dabord que loprateur V est hermitien [dfinition : V.f (x) = V (x)f (x)] ; Dmontrer
ensuite que toutes ses valeurs propres sont E. [indication : il suffit de considrer (u, (V E)u)
pour une fonction u quelconque et dmontrer que sa valeur est toujours 0]. En combinant
avec le rsultat de la question prcdente, que pouvez vous dduire pour loprateur

H = D2 + V

9.24 Pour un oprateur hermitien, le minimum de (x, Ax) avec la contrainte (x, x) = 1 est
fournit par le vecteur propre de la matrice associe la plus petite des valeurs propres ; la valeur
propre est juste un multiplicateur de Lagrange (voir le chapitre sur le calcul variationnel pour la
dfinition des multiplicateurs de Lagrange).

9.25 Dans lespace des fonctions L2 trois variables dfinies sur R3 , dmontrer que ladjoint
de loprateur gradient est loprateur (divergence), et vice et versa, tandis que ladjoint du
rotationnel est lui mme.

9.7 Mthodes opratorielles, algbre de Lie.


En algbre classique, pour rsoudre un problme, on essaye de le dcomposer en
termes plus simples. Par exemple, pour rsoudre x2 3x + 2 = 0, on peut remarquer
que lon peut la ramener la forme (x 1)(x 2) = 0 ; on remarque ensuite que pour
que ce produit soit 0, il suffit quun des termes soit nul, et quil suffit donc de rsoudre
les deux quations x 1 = 0 et x 2 = 0 pour avoir les solutions du problme. Or, ces
deux dernires quations sont solubles par des techniques que nous connaissons dj.
Les oprateurs linaires possdent une algbre. On peut se demander si on ne peut
pas entreprendre la mme dmarche pour dcomposer des EDP compliques en sys-
tmes plus simples. La rponse est oui si on fait attention aux conditions aux limites
et si on garde en tte que lalgbre des oprateurs est non commutative. Nous nallons
pas donner ici un expos de ces mthodes, mais prfrerons lillustrer travers deux
exemples. Le problme 9.1 gnralise cette approche toute une classe doprateur
quon appelle supersymtrique.

9.7.1 Loscillateur harmonique en mcanique quantique.


Loprateur H = D2 +V (X) joue un rle trs important en mcanique quantique.
Appelant la fonction damplitude, lquation de Schrdinger est de la forme


i = H
t

119
9 Les oprateurs linaires.

Nous avons vu au 9.6 que H est hermitien et que toutes ses valeurs propres sont
suprieures E0 , la valeur minimum de la fonction V (x). Loprateur D2 joue le rle
de lnergie cintique et loprateur V (x) celui de lnergie potentielle ; loprateur H
est appel Hamiltonien du systme. Nous travaillons dans lespace L2 ] , +[ et
la gestion des conditions aux limites ne pose pas trop de problme ((x ) = 0
). Nous avons vu au 9.5 que rsoudre cette quation revient trouver les valeurs et
vecteurs propres de loprateur H. Prenons le cas particulier du Hamiltonien

H = D2 + X 2

dune particule se trouvant dans un potentiel harmonique. Nous savons que toutes les
valeurs propres sont > 0. Nous avions donn en exemple plus haut les fonctions et
valeurs propres de cet hamiltonien. Nous allons voir que nous pouvons trouver ces
fonctions sans rsoudre aucune quation diffrentielle, un peu comme faire du beurre
avec de leau. Il suffit juste de manipuler lalgbre des oprateurs et surtout de leurs
commutateurs. Lexemple que nous allons suivre est le prototype de ce genre de calcul
et nous le donnons donc avec un peu de dtail.
Comme [D, X] = 1, nous pouvons dcomposer lhamiltonien :

H = (D + X)(D + X) + 1 = (D + X)(D + X) 1

Notons que loprateur X est hermitien X = X et que D = D. Nous pouvons


donc poser

A = D+X

A = D + X

et rcrire H = AA 1= A A + 1. Ce qui implique naturellement que [A, A ] = 2.


Par ailleurs, on peut dmontrer facilement que pour trois oprateurs quelconque,
[F G, F ] = F [F, G] et [F, F G] = F [F, G]. Cette petite gymnastique nous permet dob-
tenir

[H, A ] = [A A + 1, A ]
= [A A, A ]
= 2A (9.9)

Lquation (9.9) est un cas particulier dun oprateur dchelle. Avoir sa disposition
de telles relations est dun trs grand avantage comme nous allons le voir plus bas.

Lemme. Si E est une fonction propre de H associe la valeur propre E, alors


A E est une fonction propre de H associe la valeur propre E + 2.

120
9 Les oprateurs linaires.

Vous voyez ici lavantage : si on connat une valeur propre et une fonction propre,
on peut en trouver beaucoup dautre par lapplication successive de loprateur A . La
dmonstration est immdiate :

HA E = (2A + A H)E
= (E + 2)A E

Nous pouvons effectuer la mme dmarche pour A et dmontrer que HAE = (E


2)AE . Comme nous savons que toutes les valeurs propres sont > 0, il existe donc
forcment une valeur propre minimum que nous appelons  (noter que 0 <  < 2).
Toutes les autres valeurs propres sont donc de la forme (2n + ), avec n N.
Il nous reste maintenant dterminer cette valeur . Appelons 0 la fonction propre
associe . Nous devons alors obligatoirement avoir

A0 = 0 (9.10)

sinon nous aurions des valeurs propres ngatives. De l, nous pouvons naturellement
dduire que
H0 = 0
Et par consquent,  = 1. Les valeurs propres de loprateur H sont donc de la forme
En = 2n + 1. Quand je vous disais quon peut fait du beurre avec de leau !
Noter que la relation (9.10) est juste une quation diffrentielle

d0 /dx + x0 = 0

avec les conditions 0 0 pour x . Cette quation est simple rsoudre

0 (x) = C exp(x2 /2)

Les autres fonctions sobtiennent partir de l (cf lexercice 9.27).

9.7.2 Le moment cintique.


A ajouter.

Exercices.
9.26 Donner les matrices des oprateurs A et A de loscillateur harmonique dans la base des
fonctions propres de H.

9.27 En appliquant de faon rcursive loprateur A 0 , dmontrer que la fonction propre


n est bien de la forme donne par lquation (9.5).

9.28 Guider suffisamment le lecteur pour rsoudre latome dhydrogne.

121
9 Les oprateurs linaires.

Problmes.
Problme 9.1 supersymtrie
Nous souhaitons gnraliser la mthode dveloppe en sous-section 9.7.1 pour le traitement
de loscillateur harmonique toute une classe doprateur quon appelle supersymtrique 9 .
Nous allons illustrer cette mthode travers le calcul des valeurs et fonctions propres de lop-
rateur
Hsec = d2 /dx2 + 2/ cos2 x
Pour cela, nous allons construire un oprateur jumeau dont le calcul des valeurs et fonctions
propres sont plus simple, et ensuite revenir notre objectif initial.
0. Dfinition. Soit loprateur gnrique

H1 = d2 /dx2 + V1 (x)

o V1 (x) Vmin R (cest dire que la fonction V1 (x) possde une borne infrieure). Rappe-
lons que cet oprateur transforme la fonction f L2 en

H1 .f (x) = f 00 (x) + V1 (x)f (x) (9.11)

1. Oprateurs dchange. Dmontrer que

[d/dx, W (x)] = W 0 (x)

o d/dx est loprateur de drivation, W (x) est loprateur de multiplication par la fonction
W (x), [, ] dsigne le commutateur, et lgalit est dans lespace des oprateurs. [Help : nous
avions vu en cours le cas particulier W (x) = x ; appliquer le commutateur une fonction
quelconque f et tudier le rsultat]
Soit maintenant la fonction W (x) tel que

W 0 (x) + W 2 (x) = V1 (x)

Dmontrer alors que loprateur H1 se met sous la forme

H1 = A A

A = d/dx + W (x)
A = d/dx + W (x)

2. Jumeaux. Soit loprateur H2 = AA . Montrer que cet oprateur se met sous la forme

H2 = d2 /dx2 + V2 (x)

o vous prciserez la forme de V2 (x). V1 et V2 sont appels des potentiels jumeaux.


3. Valeurs et fonctions propres. Dmontrer que si n (x) est une fonction propre de H1
associe la valeur propre n , cest dire H1 n (x) = n n (x), alors la fonction n (x) =
9. Un traitement dtaill de cette mthode se trouve dans le livre de Cooper, Khare et Sukhatme, Super-
symmetry in quantum mechanics.

122
9 Les oprateurs linaires.

15

2
f(x)=1/cos x
10

V(x)
5

0
f(x) = -1

-2 -1 0 1 2
x

Figure 9.1 Les fonctions sec2 x et 1

An (x) est une fonction propre de loprateur H2 associe la mme valeur propre. [Help : il
suffit juste de se souvenir des dfinitions de H1 et H2 en terme de A et A . ]
De mme, dmontrer que si n (x) est fonction propre de H2 , cest dire H2 n (x) = n n (x),
alors n (x) = A n (x) est fonction propre de H1 avec la mme valeur propre.
Vous voyez ici apparatre un rsultat trs important : si nous connaissons les valeurs propres
et fonctions propre dun oprateur, nous connaissons immdiatement les valeurs et fonctions
propres de son oprateur jumeau.
4. Construction de W .
Soit 0 (x) la fonction propre fondamentale de H1 , cest dire celle qui est associe la plus
petite valeur propre 0 ; sans perte de gnralit, nous supposons que 0 = 0. Nous allons
considrer cette fonction parce que nous savons (on ne dmontrera pas cela ici) que 0 (x) 6=
0 x, et cela nous facilite un peu la tche par la suite de cette question. Demontrer que nous
pouvons crire W (x)sous la forme de

W (x) = 00 (x)/0 (x)

5. Application : puits de potentiel infini. Soit maintenant lintervalle [/2, /2] et le


potentiel V1 (x) = 1 ; nous allons nous limiter aux fonctions L2 sur cet intervalle qui sannulent
sur les bords (en mcanique quantique, on parle dun puits de potentiel infiniment profond).
Vrifier que les fonctions
n (x) = cos(2n + 1)x
sont bien des fonctions propres de loprateur H1 ; Quelles sont les valeurs propres n associes
ces fonctions ?
6. Potentiel jumeau. Obtenir explicitement le potentiel V2 (x), jumeau du potentiel V1 (x) =
1. En dduire les fonctions et valeurs propres de loprateur H2 .
7. Shift et conclusion. Soit a R et H un oprateur quelconque. Dmontrer que si f (x) est
une fonction propre de H avec la valeur propre , alors elle est galement une fonction propre de
loprateur H + a, mais avec la valeur propre + a. En dduire les fonctions et valeurs propres
de loprateur Hsec , notre objectif initial.

Problme 9.2 Algbre des oprateurs et lopration de drivation.

123
9 Les oprateurs linaires.

Soit un oprateur linaire A dfini dans lespace des fonctions (nous utiliserons un symbole
sur-lign pour dsigner un oprateur) . Un exemple typique est loprateur D = d/dx qui une
fonction f (x) associe la fonction f 0 (x). Nous avons beaucoup tudi lalgbre des oprateurs
en cours. Nous allons retrouver ici quelques rsultats lmentaires. Soit t un scalaire t R.
1. Dmontrer que At = tA [Help : Appliquer les deux oprateurs une fonction quel-
conque].
2. Dmontrer que (tA)n = tn An . [Help : Rappeler ce que veut dire une puissance dun
oprateur].
3. Soit un oprateur Ht dpendant dun paramtre scalaire (comme par exemple loprateur
(tA)n ). Nous dfinissons loprateur drive par rapport t ht de la faon suivante :
1 
ht = lim Ht+ Ht
0 
Dmontrer alors, en utilisant les deux questions prcdentes et vos connaissances de la
drive habituelle, que la drive par rapport t de loprateur (tA)n est loprateur

ntn1 An

4. En dduire que la drive par rapport t de loprateur exp(tA) est loprateur

A exp(tA)

[Help : utiliser la dfinition en terme de srie de loprateur exp(tA) ]


1
5. Faire la mme chose avec loprateur 1 tA [Help : nouveau, il faut utiliser le
dveloppement en srie de cet oprateur].

Problme 9.3 Vibration dune poutre.


Le but de ce problme est de montrer, travers un exemple simple, que les outils quon utilise
en mcanique quantique ont un caractre trs gnral et quil ny a pas mystifier une quation
complexe du genre i~t = H, qui nest rien dautre quune quation relle dordre suprieur.
Nous souhaitons tudier certains aspects dune quation donde se propageant dans une
poutre :
2u 4u
2
+ 2 4 = 0
t x
o est une constante lie llasticit de courbure de la poutre. La fonction u(x, t) est la
flche en un point x un instant t. La poutre est suppose infiniment longue. Pour faire notre
tude, nous utiliserons larsenal des oprateurs linaires sur des fonctions complexes notre
disposition.
1. Passage du rel au complexe. Dsignons par (x, t) la fonction complexe

u 2u
(x, t) = + i 2
t x
Nous noterons dornavant H loprateur

H = 2 /x2 (9.12)

124
9 Les oprateurs linaires.

La fonction peut donc tre crite comme = t u + iHu. Dmontrer que la fonction obit
lquation

iH = 0
t

Notons que la quantit = (u/t) + 2 ( 2 u/x2 )2 est la densit dnergie en un point
2

x un instant t.
2. Quelques rappels et dfinitions. Considrons lensemble de fonctions complexes de
deux variables t, x muni dun produit scalaire (., .). Nous supposerons que le produit scalaire est
une intgrale sur la variable x :

(, ) = (x, t)(x, t)dx

tant donn un oprateur quelconque A, sa valeur moyenne sur une fonction est dfinie par

hAi = (, A)

Nous supposons dornavant que les fonctions qui nous intressent obissent une quation
dvolution

= iH (9.13)
t
o H est un oprateur hermitien qui ne contient que de dpendance en x.
3. Drivation. Dmontrer, en utilisant la linarit du produit scalaire que
   

(, ) = , + ,
t t t

4. volution. Dmontrer que lvolution de hAi, o A est un oprateur quelconque nayant


que de dpendance en x, est donne par

hAi = i h[A, H]i
t
o [A, H] = AH HA.
5. Densit dnergie. Lnergie totale dans la poutre est donne par la quantit E = h1i,
o 1 est loprateur identit. Dmontrer que lnergie est une quantit conserve, cest dire
E/t = 0.
6. Commutateur de X. Soit loprateur P = /x. Dmontrer que

[X, P ] = 1

o X est loprateur de multiplication par x : X = x. En dduire que

[X, P 2 ] = 2P

Il nest pas difficile de voir que loprateur H dfini en (9.12) vaut H = P 2 .


7. Barycentre de lnergie. le barycentre de lnergie est donne par hXi. Dmontrer que
si la fonction est paire, cest dire (x, t) = (x, t), alors
hXi
=0
t

125
9 Les oprateurs linaires.

[Help : Si une fonction est paire, quelle est la nature de sa drive ? Que peut ont dire de lint-
grale des fonctions paires et impaires ?]
8. volution. Nous savons que la solution de lquation (9.13) est donne, operatoriellement,
par
(x, t) = eitH (x, 0)
En dveloppant loprateur exponentiel, dmontrer que si la fonction (x, 0) (la condition ini-
tiale) est paire, alors la fonction aux temps ultrieurs (x, t) reste toujours paire.
Note. Si nous voulions continuer, nous aurions dvelopp une relation entre la vitesse du
barycentre est la chiralit de la fonction

2 dfinie
par I 0 dx ; nous aurions galement tudi
llargissement de londe, donn par X . Il aurait t utile galement de considrer une poutre
finie et voire comment on prend en compte les conditions aux bords.

126
10 Les systmes de Sturm-Liouville.
10.1 Introduction.
Nous allons traiter dans ce chapitre la thorie gnrale 1 des quations diffrentielles
linaires de second ordre de la forme :

Lu = u (10.1)

o u(x) est une fonction au moins deux fois drivable, la fonction et ses drives tant
de carr sommable 2 . est un scalaire que nous appelons valeur propre et L est un
oprateur diffrentiel de second ordre

d2 d
L = (x) 2
+ (x) + (x)
dx dx
Ce genre dquation se rencontre partout en physique et la solution du systme ci-
dessus a occup une grande partie du travail des physiciens-mathmaticiens. Les grandes
familles de fonctions spciales, les Bessel, Legendre, Hermite, Laguerre, les hypergo-
mtriques, ... ont t introduites loccasion de ltude de ce genre dquation. Le but
de ce chapitre est en partie de nous habituer ces fonctions. La thorie gnrale que
nous allons voir dans ce chapitre est une application directe de la thorie des oprateurs
linaires que nous avons rencontr au chapitre prcdent ; nous aurons ainsi loccasion
dapprofondir les concepts que nous avons vus.
Illustrons travers les trois exemples suivants quelques fonctions et quations fon-
damentales de la physique mathmatique.
Exemple 10.1 Nous avons vu que pour trouver u(x, t),solution de lEDP
nu
= Lu (10.2)
tn
o loprateur L ne contient pas de dpendance en t, nous pouvons chercher la so-
lution de lquation aux valeurs propres

Ln = n n
1. Cette thorie a t formule par les deux mathmaticiens franais aux alentour de 1850.
2. Ce genre despace est appel lespace de Sobolev, mathmaticien sovitique du vingtime sicle, pr-
curseur de la thorie des distributions.

127
10 Les systmes de Sturm-Liouville.

o n (x) est fonction de la seule variable x. Si les {n } constituent une base dans
lespace des fonctions appropries, alors la solution gnrale de (10.2) est donne par
X
u(x, t) = fn an (t)n (x)
n

o les coefficients an (t) sont solutions de lquation diffrentielle

dn an
n an = 0
dtn
et les scalaires fn sont donns par les conditions initiales. Si lon veut, cette mthode
est une super mthode de sparation des variables.

Exemple 10.2 Propagation en coordonnes cylindrique et lquation de Bes-


sel.Nous souhaitons rsoudre lquation donde deux dimensions en coordonnes
polaires ( comme par exemple la vibration dune membrane ) :

2u
= c2 u (10.3)
t2
o u = u(r, , t). Si nous savons rsoudre

k (r, ) = k 2 k (r, ) (10.4)

(Question : pourquoi les valeurs propres de loprateur sont relles et ngatives ?)


alors la solution gnrale scrit 3
X
Ak eickt + Ak eickt k (r, )

u(r, , t) =
k

En coordonne cylindrique, lquation (10.4) scrit

2 k 2
2 k k
2
= r 2
+r + r 2 k 2 k (10.5)
r r
Si on regarde de plus prs cette quation, nous voyons quelle a nouveau exactement
la forme (10.2) et nous pouvons appliquer la mme mthode en cherchant la solution
de lquation aux valeurs propres

d2 m d
r2 2
+r + r2 k 2 m = m2 m (10.6)
dr dr

3. Nous utilisons le symbol pour signifier superposition. Si la variable sur laquelle on somme est
discrte ( Z)alors a son sens habituel. Si par contre la variable
de sommation est continue ( R) alors le
symbol doit tre compris formellement comme une intgrale .

128
10 Les systmes de Sturm-Liouville.

o m = m (r) est la fonction propre et m est la valeur propre. La solution de (10.5)


est X
Bm eim + Bm eim m (r)

k (r, ) =
m

Nous remarquons en plus une symtrie remarquable dans la fonction k : k (r, +


2) = k (r, ). Cette symtrie nous impose que m ne peut pas tre quelconque, mais
doit tre entier : m = 0, 1, ... Nous rencontrerons constamment cette symtrie et sa
consquence dans les quations de la physique crites en coordonnes cylindriques
ou sphriques. Nous pouvons encore quelque peu nettoyer lquation (10.6) en posant

m (r) = Jm (x)

o x = kr. Par la rgle des drivations en chane, nous avons d/dr = k(d/dx) et
nous obtenons
00 0
x2 Jm (x) + xJm (x) + (x2 m2 )Jm (x) = 0 (10.7)

Cette quation sappelle lquation de Bessel, les fonctions Jm sont appeles les fonc-
tions de Bessel ; le lecteur notera que cette quation qui joue un rle primordial dans
les quations de propagation en coordonnes cylindriques est de la forme (10.1).
Nous avons beaucoup dtaill les calculs dans cet exemple. Nous pouvons systma-
tiser le travail de la faon suivante : nous cherchons la solution de (10.3) directement
sous la forme
u(r, , t) = (r)f ()a(t)
En remplaant u dans lquation (10.3) et en divisant par u, nous trouvons

a00 1 c2 f 00
c2 ( 00 + 0 /r) 2 =0 (10.8)
a r f

Cette quation est valable pour tous (r, , t). Supposons que nous gardons constante r
et t et que nous varions . Les deux premiers termes de cette quation ne dpendent
pas de et restent inchangs. Pour que lquation soit satisfaite, nous devons avoir
f 00 /f = Cte. La contrainte f ( + 2) = f () nous impose Cte = m2 , m = 0, 1, ...
De la mme manire, si lon fait varier t, les deux derniers termes restent inchangs
et nous devons donc avoir a00 /a = cte ; la solution devant rester borne pour tous les
temps, nous devons avoir cte = k 2 . Lquation (10.8) se transforme alors en

2 1 00
(k/c) + ( + 0 /r) m2 /r2 = 0

en multipliant par et en nettoyant un peu, cette dernire quation se met sous la forme
de lquation de Bessel. La solution gnrale est la superposition de ces solutions.

129
10 Les systmes de Sturm-Liouville.

Exemple 10.3 quation de Laplace en coordonnes sphriques et quation de


Legendre. Nous souhaitons rsoudre, en coordonnes sphrique (r, , ), lquation
de Laplace
u = 0 (10.9)
Posons u(r, , ) = f (r)g()h(). En suivant notre procd, nous aboutissons

d2 h
   
1 d 2 df 1 d dg 1
r + sin() + 2 =0
f (r) dr dr g() sin() d d h() sin () d2
Par des arguments analogues ce que nous avons utiliss prcdemment, nous ob-
tenons
h00 ()
= m2
h()
et  
1 d df
r2 = (10.10)
f (r) dr dr
Il nest pas difficile de vrifier quune fonction f de la forme f (r) = An rn +Bn r(n+1)
est fonction propre, avec la valeur propre = n(n + 1). Ceci nous donne pour la
dernire quation

m2
   
1 d dg
sin() + n(n + 1) g() = 0
sin() d d sin2 ()
Et nous allons quelques peu nettoyer cette dernire quation. Remarquons dabord
que la fonction g() est paire ; nous avons donc besoin de la rsoudre que sur linter-
valle par exemple [0, ]. Posons cos = t ( t [1, 1] ) et g() = P (t). La drivation
en chane nous donne d/d = sin (d/dt) et donc

m2
   
d dP
(1 t2 ) + n(n + 1) P (t) = 0 (10.11)
dt dt 1 t2
Les solutions de cette quation, appeles les fonctions de Legendre associes sont
notes Pnm (t). Pour m = 0, Lquation scrit

(1 t2 )P 00 (t) 2tP 0 (t) + n(n + 1)P (t) = 0

Notons nouveau que cette quation, qui joue un rle primordial dans les quations
impliquant le Laplacien en coordonnes sphriques, est de la forme (10.1). Les solu-
tions de cette quation sont appeles les polynmes de Legendre. Nous verrons que
les solutions pour m 6= 0 sobtiennent partir des m = 0. La partie angulaire de
lquation de Laplace est donne par

Ynm (, ) = eim Pnm (cos )

130
10 Les systmes de Sturm-Liouville.

ces dernires fonctions sont appeles les harmoniques sphriques et jouent le mme
rle que les fonctions sinus et cosinus une dimension. Le lecteur les rencontrera
souvent comme les fonctions propres des deux oprateurs L2 et Lz dans les pro-
blmes symtries sphriques.

10.2 Reformulation opratorielle.


La mthode que nous avons suivi ci-dessus est quelque peu pdestre et nous oblige
par exemple sparer les rles des variables t et x. Ceci est quelque peu artificiel et
nous pouvons nous en dispenser. Ce que nous avons distingu dans les exemples que
nous avons traits plus haut est que lquation drives partielles pouvait se mettre
sous la forme de (L1 + L2 + ...)u = 0 o loprateur Li ne contient que des drivations
sur la variable i 4 .
Prenons lespace des fonctions deux variables (que nous appelons x et y ) pour
illustrer notre propos. Soit un oprateur H dans cet espace que lon peut crire comme
la somme de deux oprateurs, chacun ne contenant quune seule dpendance : H =
Hx +Hy (par exemple, pour le Laplacien en coordonnes cartsiennes nous avons =
2 /x2 + 2 /y 2 ). Supposons que nous souhaitons rsoudre lquation Hu(x, y) = 0
dans le domaine x [a1 , b1 ] et y [a2 , b2 ]. Supposons de plus que dans lespace des
fonctions sur [a2 , b2 ] nous disposons dune base {i (y)}qui de plus est une base propre
de loprateur Hy : Hy i (y) = i i (y). videmment, nous pouvons, pour chaque x,
dcomposer la fonction (inconnue pour linstant) u(x, y) dans cette base :
X
u(x, y) = ci (x)i (y)
i

connatre les coefficients ci (x) est quivalent connatre la fonction u(x, y) 5 . Si nous
remplaons lexpression ci-dessus dans lEDP que nous tentons de rsoudre, nous trou-
vons, en utilisant les proprits de linarit de H,
!
X
Hu = H ci (x)i (y)
i
X
= H (ci (x)i (y))
i
X
= (Hx .ci (x) + i ci (x)) i (y)
i

4. Ceci bien sr nest pas un hasard : on choisit (invente) un systme de coordonnes dans lequel lEDP
peut scrire de cette faon. Cest la raison de la popularit des trois systmes de coordonnes les plus popu-
laires. Le lecteur rencontrera dautres systmes plus exotiques adapts des problmes bien particulier.
5. Souvenez vous, nous appelons cela linterprtation de Schrodinger.

131
10 Les systmes de Sturm-Liouville.

Puisque les i sont linairement indpendantes (elles forment une base), lquation
drives partielles Hu = 0 se transforme en une quation diffrentielle ordinaire (donc
beaucoup plus simple)
Hx .ci (x) + i ci (x) = 0
Les exemples que nous avons vu plus haut avaient lair lgrement plus compliqu que
cela. Les EDPs que nous avons vu avaient plutt la forme

(Hx + f (x)Hy )u(x, y) = 0 (10.12)

Mais ceci nest gure diffrent. En faisant exactement la mme dmarche de dcomposer
u(x, y) sur la base des {i (y)}, nous obtenons pour les coefficients ci (x) lquation
diffrentielle ordinaire
Hx .ci (x) + i f (x)ci (x) = 0
Revoyons nouveau nos exemples.
Dans le cas de la propagation donde en coordonnes polaire, nous pouvons crire
lquation (10.3)sous la forme opratorielle

tt (rr + (1/r)r ) (1/r2 ) u(r, , t) = 0




o nous avons pos c = 1. Nous voyons que cette quation possde la mme structure
que (10.12). Pour la variable [0, 2], les fonctions exp(im) sont des fonctions
propres de loprateur associes la valeur propre m2 (de plus, m Z) . Pour la
variable t ], +[, les fonctions exp(ikt)sont des fonctions propres de loprateur
tt associes la valeur propre k 2 . Si lon cherche la solution gnrale sous la forme
de X
u(r, , t) = Rk,m (r)eim .eikt
k,m

Alors, daprs ce que nous avons dit, la fonction Rk,m (r) doit obir lquation

k 2 (rr + (1/r)r ) + m2 /r2 R(r) = 0




Qui nest rien dautre que lquation de Bessel dj rencontre.


Prenons maintenant le cas de lquation de Laplace en coordonnes sphriques u =
0 qui sous forme opratorielle scrit
 
2 1
rr + r + 2 L2 u = 0
r r

o L2 est loprateur qui contient toutes les drives par rapport aux variables angu-
laires , :
1 1
L2 = sin +
sin sin2

132
10 Les systmes de Sturm-Liouville.

Nous connaissons une base propre 6 de loprateur L2 forme des sphriques harmo-
niques Ynm (, ), associes la valeur propre n(n + 1). Si on cherche la solution sous
forme de X
u(r, , ) = R(r)Ynm (, )
m,n

alors la fonction R(r) doit obir lquation

2 n(n + 1)
R00 (r) + R0 (r) R(r) = 0
r r2

Exercices.

10.1 Dmontrer que la fonction Jm (x) = (1/) 0 cos(x sin m)d est solution de
lquation de Bessel si m Z. Cette fonction est appele la fonction de Bessel (dordre m) de
premire sorte.

10.2 Transforme de Bessel-Fourier. Soit une fonction de deux variables f (x, y) dont la
transforme de Fourier (bidimensionnelle) est

f(u, v) = f (x, y) exp (i (ux + vy)) dxdy

Supposons que f est de symtrie cylindrique, cest dire quon peut lcrire comme f (r) o
x + iy = r exp(i). Dans ce cas, on peut galement choisir les coordonnes polaires dans
lespace rciproque u + iv = q exp(i). Dmontrer alors que f est galement de symtrie
cylindrique :
f(q) = 2 f (r)J0 (qr)rdr
0
Ceci sappelle une transformation de Bessel-Fourier ou Hankel et qui est trs similaire la TF,
puisquon peut dmontrer linversion :

f (r) = 2 f(q)J0 (qr)qdq
0

[Help : pour dmontrer


la formule inverse, nous admettons la relation dorthogonalit des fonc-
tions de Bessel : 0 J (kr)J (k0 r)dr = (k k0 )/k.]

10.3 Dmontrer que pour m entier, Jm (x) = (1)m Jm (x). Cela montre que pour m entier,
les deux fonctions Jm et Jm ne sont pas linairement indpendantes. Lquation de Bessel
tant de second ordre, elle a besoin de deux solutions indpendantes. Lautre solution note
souvent Ym (x) est appel la fonction de Bessel de seconde sorte. [Help : effectuer le changement
de variable ].

6. A vrai dire, nous navons jamais dmontr que ces fonctions constituent une base. La dmonstration
dcoule du fameux thorme dapproximation de Weierstrass (1885). Nous admettons le rsultat. Nous avions
simplement dmontr que les sphriques harmoniques sont les fonctions propres de loprateur L2 .

133
10 Les systmes de Sturm-Liouville.

10.4 En ramenant lquation suivante

x2 u00 + xu0 + x2 m2 u = 0


une quation de Bessel, donner sa solution gnrale. [Help : poser u = x w et choisir en



consquence. Solution : u(x) = J (x)/ x o 2 = m2 + ( 1)2 /4.

10.5 Rsoudre lquation

x2 u00 + xu0 + 2 x2 m2 u = 0


[Help : poser x = y , et choisir pour se ramener une quation de Bessel.Solution : u(x) =


Jm (x )]

10.6 Combiner les deux questions prcdentes pour rsoudre

xu00 + (p + 1)u0 + u/4 = 0



[Solution : u(x) = xp/2 Jp ( x)].

10.7 Polynmes de Legendre associs. Soit la fonction u(x) solution de lquation de Legendre

(1 x2 )u00 2xu0 + n(n + 1)u = 0

Dmontrer alors que la fonction v(x) = (1 x2 )m/2 (dm /dxm )u(x) est solution de lquation
de Legendre associe

m2
 
(1 x2 )v 00 2xv 0 + n(n + 1) v=0
(1 x2 )

Si on sait que le polynme de Legendre Pn est dordre n, que peut on dduire pour Pnm pour
m > n ? Construire explicitement les trois premiers polynmes de Legendre. [Help : Commencer
par dmontrer par rcurrence que

dm (1 x2 )u00 2xu0 + n(n + 1)u =


 

(1 x2 )dm+2 u 2(m + 1)xdm+1 u + [n(n + 1) m(m + 1)] dm u

o dm est loprateur de drivation dordre m.

10.8 Moment cintique. Soit loprateur L2 = L2x + L2y + L2z . Dmontrer que loprateur
laplacien, en coordonnes sphrique, scrit comme

= r2 r r2 r + L2


Rappel : Lz = xy yx et les autres sen dduisent par permutation circulaire des indices
(x, y, z). Nous avions dj vu que Lz = . Dmontrer que les harmoniques sphriques sont
fonctions propres de Lz , donner les valeurs propres associes.

134
10 Les systmes de Sturm-Liouville.

10.9 Donner la solution gnrale de lquation donde en coordonnes sphriques

tt u = u

Help : en notation opratorielle, lquation scrit

tt r2 r r2 r + L2 u = 0
 

Comme nous connaissons les fonctions propres de tt (= exp(kt) ) et de L2 (= Ynm (, ) ), il


suffit de chercher la solution gnrique sous la forme de

u(r, , , t) = R(r)Ynm (, )eikt

o = 1 et |m| < n, et obtenir une quation pour R(r). On devrait obtenir, pour R :
1
R(r) = J0 (n+1/2) (kr)
kr
o 0 = 1. Ces fonctions sont parfois appeles des Bessel sphriques.

10.10 Atome dHydrogne. Rsoudre en coordonnes sphriques lquation de latome


dHydrogne :
it = ( /r)
On suppose > 0 (interaction attractive). Help : En suivant le mme procd que lexercice
prcdent, et en renormalisant convenablement, dmontrer que la partie radiale de obit
lquation
x2 R00 + 2xR0 + (x2 + x n(n + 1))R = 0

o :E est la valeur propre associe la fonction propre exp(iEt) de it ; = / E (on
m
suppose E > 0) ; n(n + 1) est la valeur propre associe la fonction propre Yn (, ). En
posant R(x) = xs ex u(x) et en choisissant s convenablement, on peut obtenir lquation

xu00 + 2(1 + n x)u0 + [ 2(1 + n)]u = 0

Cette quation est connu sous le nom de lquation de Laguerre.

10.11 Legendre. Quelque chose autour de lexpansion


n
1 1 X r0
0
= = Pn (cos )
|x x | r2 + r02 2rr0 cos n=0
r n+1

10.3 Dtour : la mcanique quantique ou pourquoi


les valeurs propres ont pris tant dimportance.
Pouvoir dvelopper les solutions dune EDP comme une somme de fonctions propres
tait une technique rpandue et matrise la fin du XIXme sicle. Les valeurs propres
ont cependant pris une importance extrme avec lavnement de la mcanique quan-
tique (MQ). La MQ ajoutait quelque chose qui paraissait trs trange aux scientifiques

135
10 Les systmes de Sturm-Liouville.

habitus la propagation des ondes 7 . Pour comprendre cette crise psychologique 8 ,


prenons lexemple dune corde vibrante une dimension sur lintervalle [0, L] dont
lquation est donne par
2u 2
2 u
= c
t2 x2
La solution sur la base propre de Fourier, daprs ce que nous avons vu plus haut, est
donne par X
An ein t + Bn ein t eikn x

u(x, t) = (10.13)
n

o kn = (2/L)n, les exp(ikn x) sont une base propre de loprateur 2 /x2 de valeur
propre kn2 = (2n/L)2 , et n = ckn . Notons que la fonction u(x, t) reprsentant un
dplacement rel, cela nous impose en plus davoir Bn = An .
Lnergie de la corde un instant donn est la somme de son nergie cintique et
potentielle 9 et scrit
L  
K
E(u) = ut ut + ux ux dx (10.14)
0 2 2

o u dsigne u/. Par ailleurs, reprsente la densit de la corde, K sa constante


lastique et c2 = K/. En utilisant la solutions (10.13), on trouve facilement
X
E(u) = (2LK) An An kn2 (10.15)
n

An est lamplitude du mode n, et nous voyons que le rsultat est la somme des ampli-
tudes des modes au carr, pondr par leur valeurs propres.
Nous pouvons construire un appareil pour mesurer lnergie de la corde vibrante de
la faon suivante : une camra prend deux photographies successives de la corde. Par
lanalyse de la forme de la corde sur une des photos, nous pouvons explicitement mesu-
rer point par point ux . Par lanalyse de la hauteur de la corde entre les deux photos suc-

7. De la mme manire que la mcanique Newtonienne ajoutait quelque chose de trs trange la science
du mouvement rpandu en 1680. Notre intuition nous disait que la vitesse dune charrette que lon pousse
dpend de la force quon exerce dessus et quelle sarrte quand nous ne poussons plus. La physique Aristo-
tlicienne postulait donc, en langage moderne, v = C.F . La mcanique Newtonienne a modifi ce postulat
en imposant la proportionnalit non pas entre la vitesse et la force, mais entre lacclration et la force :
a = (1/m)F . Pour interprter les rsultats exprimentaux dans ce cadre, il a fallu supposer lexistence de
forces de raction, de frottement, ... On peut facilement imaginer combien cette mcanique nouvelle paraissait
contre-intuitif et trange aux scientifique de lpoque. Pour nous qui avons assimil cette mcanique depuis
notre enfance, cette mcanique nous parat aller de soi. De la mme manire, la MQ paraissait trange au
dbut du XXme, puisque les scientifiques staient forge une intuition qui allait lencontre des postulats
de la nouvelle mcanique.
8. Parfois appel dualit onde-corpuscule
9. voir les chapitres consacrs, dune part aux quations de la physique, dautre part au calcul variationnel.

136
10 Les systmes de Sturm-Liouville.

cessives, nous pouvons mesurer point par point ut . Ces deux mesures nous permettent
ensuite deffectuer une intgrale point par point et remonter lnergie (10.14) 10 .
Supposez maintenant que vous avez prpar par exemple M = 106 cordes vibrantes
toutes dans le mme tat (identiques). En les mesurant les uns aprs les autres avec lap-
pareil, on doit toujours trouver la mme valeur E. Les premiers chercheurs investiguant
les phnomnes atomiques ont trouv un rsultat diffrent : A chaque mesure, ils trou-
vaient une valeur diffrente, correspondant exactement une des valeurs propres kn .
La mesure de lnergie ne donnait pas la mme valeur, ni mme des valeurs disperses
de faon continue, mais un ensemble discret de valeur. Il savre que quand ont fait cette
mesure un grand nombre de fois, la proportion de fois o lon tombe sur la mme valeur
kn et proportionnelle au coefficient An An . La moyenne sur les M mesures donne en
effet le rsultat attendu E dun systme classique 11 .
Cette observation a t intgre comme un postulat la mcanique quantique 12 , en
sus des quations dvolution de la mcanique quantique (comme par exemple lqua-
tion de Schrdinger). Ce nest que rcemment (les annes 1990) que ce postulat a t
compris comme une consquence du phnomne dinteraction entre un systme ma-
croscopique et microscopique, appel dcohrence.
Dans beaucoup de branche de physique atomique et molculaire, la quantit perti-
nente tant lnergie, les scientifiques ont laborer des rgles de manipulations impli-
quant uniquement la connaissance des valeurs propres, sans mme passer par la case
rsoudre lquation dvolution temporelle. Voil pourquoi les valeurs propres sont
devenues une partie si fondamentale de la culture des physiciens.

10.4 Les systmes de Sturm-Liouville.


Revenons notre propos original sur lquation Lu = u o L est un oprateur diff-
rentiel de second degrs. Nous nous plaons dornavant dans lensemble des fonctions
valeurs complexes. Nous quipons notre espace vectoriel des fonctions dun produit
scalaire, mais nous allons quelque peu largir notre dfinition du produit scalaire :

(f, g) = f (x)g(x)w(x)dx

10. Pour linvestigation des phnomnes lchelle atomique, les scientifiques du dbut de XXme sicle
avaient leur disposition un appareil de mesure base sur la spectroscopie. Ce sont le caractre discret des
raies qui ont commenc poser problme. Notez que le problme dont on parle ici nest pas du tout celui de la
divergence ultra-violette du corps noir. Ce dernier est d a un postulat de la physique statistique qui exige,
dans le cadre de la physique classique, qu lquilibre thermodynamique, on ait 2LKAn An kn 2 = T /2, ce

qui rend la somme (10.15) divergente.


11. La prsentation que je donne est bien sur anachronique. Le concept de dcomposition sur base propre
travers lquation de Schrodinger post-date de quelques 20 annes la dcouverte de la nature discrte des
raies atomiques.
12. Cela sappelle linterprtation de Copenhague (1928) : Une mesure dun observable O projette un tat
quantique mixte sur un des tats propres de cet observable, avec une probabilit donne par la norme au
carr de lamplitude de ce mode propre.

137
10 Les systmes de Sturm-Liouville.

Le lecteur peut vrifier que cette dfinition possde toutes les bonnes proprits que
lon exige dun produit scalaire, si w(x) 0 13 . La fonction w(x) est dite le poids
(weight en anglais).
Dans la trs grande majorit des cas que lon rencontre en physique-mathmatique,
loprateur L est hermitien 14 : (f, Lg) = (Lf, g)Cest dailleurs prcisment ces sys-
tmes o loprateur L est hermitien que nous appelons Sturm-Liouville. Les oprateurs
hermitiens ont des proprits remarquables : ils sont diagonalisables et leurs valeurs
propres sont relles. Ces faits ne sont pas tranger au fait quils apparaissent aussi sou-
vent en physique. Nous avons vu que la forme gnrale de loprateur L est

L = (x)dxx + (x)dx + (x)

o dx et dxx dnotent les drives premire et seconde et , , sont des fonctions


valeurs relles. Comme on exige de L dtre hermitien, cela limite le choix des fonctions
, , . Si on regarde dun peu plus prs, aucune contrainte ne pse sur (x). Si L est
hermitien, il est trivial de dmontrer que L+(x) est galement hermitien. Pour tudier
les contraintes qui psent sur et , nous choisissons donc pour linstant (x) = 0,
cela nous simplifie lcriture. Formons la diffrence I = (Lf, g)(f, Lg). En effectuant
une intgration par partie, nous parvenons facilement

I = [(f 0 g f g 0 )(w)]

+ (f g 0 f 0 g) [(w)0 w] dx

Lhermicit de L nous exige donc que

(w)0 = w (10.16)
0 0
[(f g f g )(w)] = 0 (10.17)

Lquation (10.16) dfinit en fait le poids w que lon doit choisir en fonction de et
. La condition (10.17) nous indique que selon lespace des fonctions que nous avons
choisi, nous devons exiger de w(x) de tendre suffisamment rapidement vers 0 quand
x . Remarquez que w = 0 est solution de lquation (10.16), donc nous pouvons
ventuellement connecter une rgion o w > 0 une rgion o w = 0 et satisfaire ainsi
la condition (10.17). Remarquer quune fois w choisie convenablement, nous pouvons
mettre lquation diffrentielle Lu = u sous la forme de
 
d du
(w) + ( )wu = 0
dx dx

13. Il faut que w(x) > 0 sur un ensemble de mesure non-nulle, par exemple sur un intervalle
14. Nous avons le choix du poids w(x)

138
10 Les systmes de Sturm-Liouville.

Cest sous cette forme que les systmes Sturm-Liouville ont t formuls. Notez que
lquation (10.16) est une quation diffrentielle simple dont la solution est donne par
 
C
w(x) = exp dx (10.18)
(x)

o par nous dnotons une primitive.
10.12 Dmontrer quutiliser un poids w(x) pour le produit vectoriel revient faire un chan-
gement de variable x = (s) dans un produit scalaire avec un poids 1.

10.5 Les solutions polynomiales de Sturm-Liouville.


Nous allons partir de maintenant nous restreindre aux solutions polynomiales des
systmes Sturm-Liouville
LPn = n Pn (10.19)
o Pn (x) est un polynme de degr n. Si nous arrivons trouver de telles solutions
pour un systme donn, nous aurons la garantie que ces fonctions Pn constituent bien
une base de notre espace des fonctions, pourvu que tous les n N soient reprsents 15 .
La recherche des solutions polynomiales impose une forte contrainte pour satisfaire la
condition dhermicit (10.17) : (w) doit tendre trs rapidement vers 0 quand x ,
ou doit tre = 0 en dehors dun certain intervalle ( charge pour nous de connecter
les rgions w = 0 et les rgions w > 0 ). Nous allons voir plusieurs exemples qui
claireront cela.
Comme L ne contient au plus que des drives dordre 2, cela nous impose que les
coefficients , , soient eux mme des polynmes, de degrs 2 pour , 1 pour et
0 pour . (Exercice : le dmontrer en considrant les trois premiers polynmes n =
0, 1, 2). Nous devons donc considrer tous les systmes Sturm-Liouville o 16

(x) = 2 x2 + 1 x1 + 0
(x) = 1 x + 0
(x) = 0

Nous devons donc explorer un espace six dimensions pour puiser toutes les combi-
naisons des coefficients. Pas tout fait en ralit, cela peut tre beaucoup plus simple.
Prenons lquation algbrique lmentaire ax2 + bx + c = 0. Au lieu de rsoudre di-
rectement cette quation, nous pouvons remplacer x par x + x0 et rsoudre

ax2 + (2ax0 + b)x + (ax20 + bx0 + c) = 0


15. Cela sappelle la compltude dont nous avions parl au chapitre sur lanalyse fonctionnelle et qui
dcoule dun thorme dmontr par Weierstrass que nous navons pas donn ici.
16. Vous remarquerez donc que les fonctions de Bessel ne sont pas polynomiales.

139
10 Les systmes de Sturm-Liouville.

pour une valeur arbitraire de x0 . Une fois cette quation rsolue, nous pouvons tou-
jours remplacer x par x x0 pour retrouver la solution de lquation originale. Si nous
choisissons judicieusement x0 = b/2a, lquation se transforme en ax2 + c0 = 0.
Onpeut encore simplifier la forme de cette quation (en remplaant par exemple x par
x/ a ) pour obtenir lquation
x2 + c0 = 0
Si nous savons rsoudre cette dernire nous savons rsoudre lquation gnral de se-
cond degrs : au lieu dexplorer une famille trois paramtres, nous navons qu ex-
plorer une famille un seul paramtre.
Nous avons pu effectuer cette simplification formelle et liminer deux paramtres
parce que nous avions 2 degrs de liberts notre disposition : le choix de lorigine et
de lchelle de laxe x. Dans une quation de type (10.19), nous avons 4 degrs de liber-
ts. Par exemple, au lieu de considrer loprateur L, nous pouvons tudier loprateur
aL, o a est un scalaire. Les fonctions propres de cette nouvelle quation restent inchan-
ges, les valeurs propres deviennent a. Cela nous donnera par exemple la possibilit
de toujours choisir 2 = 1 (quand 6= 0). Nous pouvons galement tudier loprateur
L + a : a nouveau, les fonctions propres restent inchanges, les valeurs propres seront
dplaces de a. Nous utiliserons cela pour toujours choisir 0 = 0. Nous avons gale-
ment toujours la libert de choisir lorigine et lchelle de laxe x. Nous aurons donc au
plus deux paramtres libres.

Exercices.
10.13 Comment se transforme lquation de Jacobi

(1 x2 )u00 + [p q + (p + q + 2)x]u0 = u

avec le changement de variable x 1 2x ?

10.14 Dmontrer que nous ne pouvons pas satisfaire les conditions dhermicit si = 0.

Nous allons maintenant considrer tous les cas possibles.

10.5.1 (x) quadratique.


Comme nous lavons dit, nous utilisons un degrs de libert pour choisir 2 = 1.
Nous pouvons donc crire (x) = (x0 +x)(x1 x) o x0 et x1 sont les deux racines de
(x). Ces deux racines sont soit complexes (et conjugues lune de lautre) soit relles.
Le lecteur peut dmontrer quavec des racines complexes, il nest pas possible de remplir
les conditions dhermicit. Nous utilisons maintenant deux degrs de libert dans le
chois de lorigine de laxe x et son chelle pour choisir x0 = 1 et x1 = 1.
10.15 Trouver le changement de variable y = a(x b) qui transforme effectivement lopra-
teur (x0 + x)(x1 x)(d2 /dx2 ) en oprateur A(1 y 2 )(d2 /dy 2 )

140
10 Les systmes de Sturm-Liouville.

Il nous reste deux paramtres et il est de coutume de les noter 1 = (p + q + 2) et


0 = q p. La dcomposition en fraction simple de / scrit alors

(x) q+1 p+1


=
(x) x+1 1x

ce qui nous amne finalement, daprs lq.(10.18),

w(x) = (1 + x)q (1 x)p

Noublions pas que nous exigeons w 0 trs rapidement quand x . On peut


prendre p, q aussi ngative que lon veut, on ne peut pas satisfaire cette exigence telle
quelle. Par contre, si p, q > 1, nous voyons que w sannule sur les bords. Nous
choisissons donc

w(x) = (1 + x)q (1 x)p si |x|<1


= 0 sinon

Les polynmes associs ce choix des paramtres sont appels des polynmes de Ja-
(p,q)
cobi Jn (x). Certains choix de p, q ont obtenus des noms propres. Par exemple, p =
q = 1/2 nous donne une fonction w(x) = (1 x2 )1/2 et les solutions sappellent
les polynmes de Tchebychev 17 . Pour p = q = 0, nous obtenons les polynmes de
Legendre, avec le poids w(x) = 1.

10.5.2 (x) linaire.


Nous considrons le cas 2 = 0. Cette fois, nous navons quun seul paramtre libre.
Nous choisissons (x) = x ; (x) = x + s + 1.Cela dtermine

w(x) = xs ex

Cela nous convient parfaitement pour x +, mais pas pour x . Cependant,


ont peut remarquer que si s > 1, nous pouvons connecter la fonction ci-dessus pour
x > 0 la fonction w(x) = 0 pour x < 0. Les solutions de ce systme sont appe-
(s)
ls les polynmes de Laguerre associs Ln (x). Pour s = 0 les solutions sappellent
simplement les polynmes de Laguerre et nous les rencontrerons pour la rsolution de
latome dhydrogne.

17. Les polynmes de Tchebychev ont t trouv par lauteur du mme nom ( professeur luniversit
de Saint-Ptersbourg dans les annes 1850-80) loccasion de ltude de la thorie dinterpolation : Soit une
fonction donne sur lintervalle [1, 1]. On cherche un polynme de degrs n Tn (x) qui concide avec f (x)
en n points et qui minimise lcart (maxx[1,1] |f (x) Tn (x)| ) avec ce dernier. Les solutions sont nos
polynmes.

141
10 Les systmes de Sturm-Liouville.

10.5.3 (x) constant.


Nous navons plus de paramtres libres et tous les cas se ramne au choix (x) = 1
(x) = 2x ( le coefficient de x ngatif ne pourra pas satisfaire lhermicit) et nous
obtenons 2
w(x) = ex
Les solutions sont appeles les polynmes dHermite 18 . Nous les rencontrerons trs
frquemment dans les problmes doscillateurs harmoniques.

10.6 Valeurs et fonctions propres.


Les valeurs propres des systmes Sturm-Liouville prennent une forme particulire-
ment simple. Pour les dterminer, il suffit de regrouper, dans un polynme dordre n, le
terme dordre n. Nous trouvons alors que
n = 2 n(n 1) + 1 n = n (2 n + 1 2 )
Pour les Jacobi, lquation diffrentielle est
(1 x2 )u00 ((p + q + 2)x (p q)) u0 + n(n + p + q + 1)u = 0
Pour les Tchebychev, les valeurs propres sont de la forme n = n2 et pour les les
Legendre de la forme n = n(n + 1).
Lquation de Laguerre scrit
xu00 (x (s + 1)) u0 + nu = 0
avec les valeurs propres n = n.
Lquation dHermite est
u00 2xu0 + 2nu = 0
et les valeurs propres sont n = 2n.
Notez que les valeurs propres sont espaces linairement dans les deux derniers cas
et quadratiquement dans le premier.
On peutPcalculer de diffrentes faons les polynmes orthogonaux. On peut poser
n
fn (x) = i=0 ai xi , remplacer lexpression dans lquation diffrentielle du polynme
et dduire les coefficients explicitement. Par exemple,
[n/2]   
X n 2n 2m
Pn (x) = xn2m
m n
i=0
[n/2]
X 1
Hn (x) = (2x)n2m
i=0
m!(n 2m)!
18. Professeur lEcole Polytechnique et lENS dans les annes 1850 1880.

142
10 Les systmes de Sturm-Liouville.

o Pn et Hn sont les polynmes de Legendre et dHermite. De faon plus gnrale, la


formule de Rodrigues donne les solutions polynomiales des systmes Sturm-Liouville :
1 dn
(n w)
fn (x) = Cn
w dxn
Nous omettons la dmonstration de cette formule 19 , mais un des sous produit de cette
dmonstrations nous fournit la norme des polynmes orthogonaux :
+ +
w(x)fn2 (x)dx n
= (1) n!an n (x)w(x)dx

Comme nous lavons souvent indiqu, les polynmes orthogonaux sont dfinis un co-
efficient multiplicatif prs, et on peut utiliser lexpression ci-dessus pour les normaliser.

10.7 La seconde solution : Le Wronskien.


Nous savons quune quation diffrentielle de second ordre homogne possde deux
solutions indpendante. Or, dans ce que nous avons discut plus haut, nous navons
pris en compte quune seule de ces solutions. Cependant, trouver la deuxime solution
nest pas trop compliqu.
Soit lquation diffrentielle

(x)u00 + (x)u0 + (x)u = 0 (10.20)

et notons ses deux solutions indpendante u1 (x) et u2 (x). Supposons que nous connais-
sons u1 (x), nous allons voir que nous pouvons trouver u2 (x). Considrons la fonction
w(x) quon appelle le Wronskien :

w(x) = u1 (x)u02 (x) u2 (x)u01 (x) (10.21)

En drivant une fois la relation ci-dessus, en la multipliant par (x) et en utilisant la


relation (10.20), nous trouvons
w0 = w (10.22)
Ceci est une quation de premier ordre que nous savons (en thorie) rsoudre exacte-
ment. Une fois connue w(x), reconsidrons la relation (10.21). Nous voyons que cest
une quation diffrentielle de premier ordre en u2 (x), puisque nous connaissons u1 (x)
et w(x). Nous pouvons donc trouver u2 (x).

19. Il suffit dabord de dmontrer que fn est un polynme de degrs n et de dmontrer ensuite que fn
et fm sont orthogonale avec le poids w. Comme nous savons que les systmes de polynmes orthogonaux
avec un poids w sont unique ( un coefficient multiplicatif prs, voir un des exercices plus bas) nous tenons
notre dmonstration.

143
10 Les systmes de Sturm-Liouville.

10.8 Les solutions non-polynomiales.


La fonction hypergomtrique, les fonctions de Bessel.

10.9 Exercices.
10.16 Calculer la fonction poids pour les quations suivantes ; mettre ces quations sous forme
SL :
1. quation de Legendre (1 x2 )y 00 2xy 0 + n(n + 1)y = 0
2. quation de Mathieu (1 x2 )y 00 xy 0 + n(n + 1)y = 0
3. quation de Bessel x2 y 00 + xy 0 + (k2 x2 m2 )y = 0
4. quation de Bessel y 00 + (1/x)y 0 + (k2 m2 /x2 )y = 0
5. quation de Bessel modifie : x2 y 00 + xy 0 + (x2 m2 ) = 0
6. quation de Laguerre xy 00 + (1 x)y 0 + ny = 0
7. quation dHermite y 00 2xy 0 + 2ny = 0
8. x3 y 00 + xy 0 + 2y = 0
10.17 Dmontrer que le systme suivant, o tous les coefficients sont rels,

(x2 + 1 x + 0 )y 00 + (1 x + 0 )y 0 y = 0

na pas de solution polynomiale si (x) = x2 + 1 x + 0 a deux racines complexes [Help :


dmontrer dabord que w nest pas suffisamment rapidement dcroissant et ensuite quon ne
peut pas trouver w continue sannulant en deux points, pour pouvoir ensuite le connecter la
solution w = 0. Pour dmontrer
ce dernier point, remarquer que (x) peut se mettre sous la
forme de (x a)2 + b2 et que dx/(x) = (1/b)Arctg (x a) /b].
10.18 Dmontrer que le systme SL

(x)y 00 + (1 x + 0 )y 0 y = 0

na pas de solution polynomiale si 1 x + 0 0.


10.19 Soit {Pn } et {Qn } deux ensembles de polynmes orthogonaux, avec le mme poids
w(x). Dmontrer alors que les deux polynmes sont proportionnel : Pn = an Qn . Autrement dit,
un coefficient multiplicatif prs, les polynmes orthogonaux associs un poids sont uniques.
10.20 Dmontrer que si les polynmes {Pn (x)} sont les fonctions propres dun systme SL
avec le poids w(x), alors les polynmes {Pn0 (x)} sont orthogonaux avec le poids w(x)(x).
10.21 Dduire de la question prcdente que les polynmes ultra sphriques Gm
n (x) sob-
tiennent partir des polynmes de Legendre :
dm
Gm
nm (x) = Pn (x)
dxm
Quelle est la relation entre les ultra sphriques et les fonctions de Legendre associs ?

144
10 Les systmes de Sturm-Liouville.

10.22 Les polynmes de Tchebychev Tn (x) sont des polynmes de Jacobi pour p = q =
1/2. En crivant lorthogonalit des ces fonctions (et en supposant Tn (1) = 1) dduire que
Tn (cos()) = cos n.

10.23 A quelle quation obit la fonction fn (x) = (1/ x)H2n+1 ( x) ? Pouvez vous tablir
une relation entre cette fonction est un polynme de Laguerre associ ?

10.24 Soit lquation aux valeurs propres

v 00 x2 v = v

Daprs ce que nous avons dit, cette quation na pas de solution polynomiale. On peut cepen-
dant la mettre sous une meilleure forme. Poser

v(x) = ef (x) (x)

Et dduire une quation pour la fonction (x). Comment faut-il choisir la fonction f (x) pour
liminer le terme en x2 (x) (attention au signe choisi) ? Que devient alors lquation au va-
leurs propres pour ? Comment les valeurs propres sont distribues ? Utiliser ces rsultats pour
donner la solution complte de lquation de Schrdinger de loscillateur harmonique

2
i = 2 + x2
t x
sur lintervalle x ] , +[

10.25 Quelle est la relation entre la fonction hypergomtrique F (a, b, c; x) solution de

x(1 x)u00 + [c (a + b)x]u0 abu = 0

et les polynmes de Jacobi ?

10.26 Dmontrer que les polynmes orthogonaux obissent la relation de rcurrence

fn+1 (x) = (An + Bn x)fn (x) + Cn fn1 (x)

o vous obtiendrez les coefficients An , Bn , Cn . [Help : Choisir An , Bn pour que = fn+1


(An + Bn x)fn soit un polynme de degrs n 1 et projeter cette diffrence sur la base des fi
pour i n 1. Il faut utiliser le fait que (fk , xl )w = 0 si l < k]

10.27 Soit u = wy, o y est la solution dun systme Sturm-Liouville y 00 + y 0 = y.
Dmontrer que u obit une quation du genre

u00 + Ru = 0

o il faut expliciter la fonction R(x). Cette forme est le point de dpart dune approximation
clbre, appele WKB.

145
11 Le calcul variationnel
11.1 Introduction.
Ds que vous avez vu les bases de lanalyse, vous avez appris rpondre la question
suivante : comment trouver le point x pour lequel la fonction f (x) est maximum (ou
minimum) ? f est une machine qui prend un nombre en entre et produit un nombre en
sortie. La question ci-dessus en ralit est celle de trouver un extremum local : un point
qui produit la sortie la plus grande (ou la plus petite) que tous ses voisins immdiats.
Nous savons que pour un tel point x,

f 0 (x) = 0.

Donnons nous maintenant une fonctionnelle S. Ceci est une machine qui prend une
fonction en entre et produit un nombre en sortie. Par exemple
b
f (x)2 + f 02 (x) dx
 
S(f ) = (11.1)
a

est une fonctionnelle qui prend une fonction, ajoute son carr et le carr de sa drive
et les intgre entre deux bornes pour produire un nombre. Si on entre la fonction sin x
dans cette machine, elle produit le nombre b a. Si on y entre la fonction exp x, elle
produit le nombre 2 exp(2b) 2 exp(2a).
Le calcul variationnel consiste rpondre la question suivante : quelle est la fonc-
tion f qui produit la plus grande sortie S(f ) ? La rponse que nous allons voir par la
suite est que f doit satisfaire une quation diffrentielle qui est relie la forme de la
fonctionnelle S.
Donnons deux exemples avant daller plus loin.
Exemple 11.1 Le Brachistochrone. Lexemple le plus important historiquement est
celui du brachistochrone. Soit un point A(0, 0) situ dans le plan vertical, reli un
point B(x1 , y1 ) par un toboggan dont la forme est donne par la fonction y = f (x).
On laisse un objet glisser sans frottement du point A le long du toboggan. Comment
choisir la forme du toboggan, (la fonction f ), pour que le temps darriv au point B
soit minimum ? Vous voyez quune fois quon se donne un toboggan, cest dire une
fonction, en utilisant quelques notions de mcanique et de conservation dnergie,
on peut calculer le temps de parcours, cest dire un scalaire.
Essayons de mettre
cela en forme. La vitesse de lobjet lordonne y vaut 2gy. Llment darc ds =

146
11 Le calcul variationnel
p p
dx2 + dy 2 = (1 + f 0 (x)2 dx est parcouru en un temps dt = ds/v. Le temps
total du parcours est donc
x1 s
1 + f 0 (x)2
T = dx
0 2gf (x)

Et il faut trouver la fonction f qui minimise cette intgrale 1 . Ce problme avait t


lanc comme un dfi par un des frres Bernoulli vers 1690 ( peine dix ans aprs lin-
vention du calcul diffrentiel) la communaut scientifiques. Tous les grands (New-
ton, Leibnitz, lautre Bernoulli, Hospital, ...) y rpondirent. Euler (~1740) a trouv une
solution gnrale de ce genre de problme et Lagrange (~1780) les a gnralis la
mcanique.
Exemple 11.2 La Mcanique analytique. Prenons une particule de masse m qui
quitte le point x = 0 au temps t = 0 et arrive un autre point x = x1 au temps
t = t1 . Cette particule est soumise un potentiel V (x). Le mouvement de la particule
est donn par la fonction x(t). La fonction x(t) qui minimise
t1
(m/2)x2 (t) V (x(t)) dt
 
S= (11.2)
0

est la trajectoire suivie par la particule. Ceci est une nouvelle formulation de la mca-
nique. Classiquement, nous rsolvons lquation diffrentielle F = ma o la fonction
F (x) = dV /dx et a = d2 x/dt2 pour remonter la trajectoire x(t). Ici, la dmarche
est diffrente : de toute les trajectoires possibles qui relie (0, 0) (t1 , x1 ), la particule
choisit justement celle qui minimise lintgrale (11.2). Comme si un dieu calculait le
cot (quon appelle laction S) de chaque trajectoire et choisissait la meilleure. Bien
sr, cette formulation de la mcanique et la formulation Newtonienne sont quiva-
lente, bien que la formulation lagrangienne soit beaucoup plus profonde et pratique.
Notez que la quantit dans lintgrale nest pas lnergie totale, mais lnergie cin-
tique moins lnergie potentielle. On appelle cette quantit le lagrangien.

11.2 Calcul des variations.


Formulons correctement notre problme (nous nallons pas attaquer le cas le plus
gnral pour linstant). Soit la fonctionnelle
b
S[f ] = L[f (t), f 0 (t), t]dt (11.3)
a

1. A premire vue, il semble quil manque quelque chose cette formulation : lintgrale ne contient pas
de rfrence y1 et nous nexigeons apparemment pas que la particule finisse sa trajectoire lordonn y1 .
Nous y reviendrons plus tard, quand nous aborderons les contraintes.

147
11 Le calcul variationnel

Trouver la fonction f (t), avec les conditions f (a) = y0 et f (b) = y1 pour laquelle
lintgrale est un extremum.
Traditionnellement, la fonction L qui se trouve sous lintgrale est appele le lagran-
gien. Cest une fonction tout ce quil y a de plus normal. Par exemple, L(x, y) = x2 +y 2 .
Comme un instant donn, f (t) et f 0 (t) sont des nombres, il est tout fait lgitime
de calculer L[f (t), f 0 (t)] qui dans ce cas, vaut f (t)2 + f 0 (t)2 comme lexpression que
nous avions crit dans (11.1). En plus, nous avons le droit de prendre les drives par-
tielles de L : par exemple, dans ce cas, L/x = 2x et L/y = 2y. Il est usuel, si
nous avions not L[f (t), f 0 (t)], de noter ces drives partielles par L/f et L/f 0 :
cela veut juste dire drive partielle par rapport au premier ou deuxime argument.
Dans ce cas, nous aurions eu par exemple L/f 0 = 2f 0 (t). Dailleurs, L/f 0 est
ici une fonction de t et on peut par exemple prendre sa drive par rapport au temps :
d[L/f 0 ]/dt = 2f 00 (t). Si au dbut, vous trouvez cette notation abrupte, remplacez f
et f 0 avant les drivations par x et y, et remettez les leur place une fois les oprations
termines. Mais on prend vite lhabitude de ces notations. Notez galement que lon ne
cherche pas nimporte quelle fonction, mais les fonctions qui prennent des valeurs bien
dtermines (y0 et y1 ) aux bords a et b.
Avant daller plus loin, revenons un instant au cas dune fonction f (x) dont ont veut
trouver lextremum. Si nous connaissons la valeur de la fonction au point x, alors son
accroissement quand on se dplace au point x +  est donne par

df = f (x + ) f (x) = A(x) + termes dordres 2 + ...

La premire partie de laccroissement (celle qui est importante quand  est petit) est
linaire en  : si nous avions pris un  deux fois plus grand, nous aurions eu un accrois-
sement deux fois plus grand galement. La fonction A(x) est le coefficient de propor-
tionnalit entre df et  au point x, et nous avons plus lhabitude de la noter par f 0 (x).
Le point x est un extremum si le coefficient de proportionnalit f 0 (x) = 0, cest dire
quen se dplaant autour du point x, laccroissement de f ( lordre 1 en  ) est nulle.
Nous navons qu suivre cette mthodologie pour trouver lextremum de notre fonc-
tionnelle S[f ] : Nous allons ajouter la fonction g(t) la fonction f (t), et calculer lac-
croissement de la fonctionnelle dS = S[f + g] S[f ]. Avec un peu de chance, cette
accroissement comporte un terme linaire en  :

dS = S[f + g] S[f ] = A[f, g]. + termes dordre 2 + ...

o A[f, g] est un coefficient de proportionnalit qui dpend des fonctions f et g. Nous


disons que f est un extremum si A[f, g] = 0 quelque soit g ! Cela est analogue
trouver lextremum dune fonction de plusieurs variables : le point (x , y , z , ...) est
un extremum de la fonction f (x, y, z, ...) si en ce point, quelque soit le dplacement
( par exemple (dx, 0, 0, ...) ou (0, dy, dz, ...) ) la partie linaire de laccroissement est
nulle. Une fonction, comme nous lavons vu au chapitre 1, nest finalement quun point
dans un espace dimension infini ; une fonctionnelle est comme une fonction dune

148
11 Le calcul variationnel

y1
f+g
f

y0

a b

Figure 11.1 Une fonction f et une variation g autour de cette fonction.

infinit de variables. Quelque soit g dans lexpression prcdente veut simplement dire
quelque soit le dplacement dans cet espace.
Il faut prendre une prcaution : nous ne cherchons que des fonctions pour lesquelles
f (a) = y0 et f (b) = y1 . Comme f satisfait dj cette condition, pour que f + g la
fasse galement, nous ne devons considrer que des fonctions g telle que g(a) = g(b) =
0. Les fonctions g ne sont donc pas tout fait quelconque. Nous obtenons :
b
S[f + g] = L[f (t) + g(t) , f 0 (t) + g 0 (t)]dt (11.4)
a
b b
L L 0
= S[f ] +  g(t)dt +  g (t)dt + ...
a f a f 0

o nous avons simplement utilis le fait que L(x + h, y + k) = L(x, y) + (L/x)h +


(L/y)k + ... On peut dj voir la partie linaire apparatre. Nous pouvons mettre la
deuxime intgrale un peu plus en forme en faisant une intgration par partie :
b  b b  
L 0 L d L
g (t)dt = g(t) g(t)dt
a f 0 f 0 a a dt f
0

La premire partie est nulle, puisque la fonction g vaut justement 0 sur les bords. En
remettant ce qui reste dans lexpression (11.4), nous avons :
b   
L d L
dS =  g(t)dt + ...
a f dt f 0

149
11 Le calcul variationnel

Lintgrale est notre facteur de proportionnalit entre dS et . Si la fonction f est un


extremum, alors lintgrale doit tre nulle quelque soit la fonction g. La seule possibilit
est donc que f satisfasse lquation diffrentielle
 
L d L
=0 (11.5)
f dt f 0
qui est appel lquation dEuler-Lagrange. Notez que cette quation est homogne
dimentionnellement. Faisons quelques exercices pour nous fixer les ides.

Identit de Beltrami. valuons lexpression


   
d 0 L 00 L 0 d L L 0 L 00 L
f L = f +f f f
dt f 0 f 0 dt f 0 f f 0 t
   
d L L L
= f0
dt f 0 f t
Si L ne dpend pas explicitement de t, alors L/t = 0 ; par ailleurs, lexpression entre
parenthse nest que lquation dEuler-Lagrange et vaut zro par construction. Nous
en dduisons que si le lagrangien ne dpend pas explicitement du temps, alors
L
f0 L = Cte
f 0
Ceci est appel lidentit de Beltrami. En mcanique, ceci nest rien dautre que la
conservation dnergie (exercice : le dmontrer) ; elle est cependant de porte plus g-
nrale et facilite grandement les calculs dans les problmes o la variable indpendante
nintervient pas explicitement, comme dans le problme du brachistochrone.
Exemple 11.3 Mcanique et loi de Newton. En mcanique analytique dun point
matriel, le lagrangien est L = T V , o T est lnergie cintique est V lnergie
potentiel. Si on se restreint au cas unidimensionnel o une particule est soumis un
potentiel V (x), alors pour la particule de trajectoire x(t),
L(x, x) = (1/2)mx2 V (x).
Le premier terme de lquation dEuler-Lagrange est
L dV
=
x dx
Comme nous lavons mentionn ci-dessus, le seul terme qui dpend de la premire
variable x est V (x). Remplacer mentalement la deuxime variable xpar y dans lex-
pression du lagrangien avant la drivation si cela vous drange. La drivation par
rapport la deuxime variable ( x ) donne
L
= mx
x

150
11 Le calcul variationnel

et la drivation par rapport au temps de cette dernire nous donne


 
d L
= mx
dt x

et lquation dE.L. scrit finalement

mx + dV /dx = 0

Ce qui est bien sr la mme chose que lquation de Newton F = ma.


Allons un peu plus loin dans le traitement de lexemple ci-dessus. Supposons que le
potentiel est constant V (x) = Cte, sest dire que la particule se meut dans une rgion
de lespace o il nest pas soumis une force. On peut galement dire que cette rgion
de lespace possde une symtrie dinvariance par translation : deux particules iden-
tiques places deux endroits diffrents de lespace ragiraient exactement de mme ;
dit encore autrement, nous navons aucune mthode pour dterminer o lon se trouve
dans lespace. Dans ce cas, L/x = 0, et lquation dE.L. scrit
 
d L
=0
dt x

ou encore la quantit p = L/ x = Cte. Or, p nest autre chose que la quantit de


mouvement p = mx. Donc, la symtrie dinvariance par translation dans lespace nous
impose la conservation de la quantit du mouvement. Cest un concept extrmement
profond 2 : chaque symtrie du lagrangien correspond une loi de conservation. La
conservation de lnergie est lie la symtrie de translation dans le temps, la conser-
vation du moment cintique est associ linvariance par rotation autour dun axe et
ainsi de suite. En physique, une thorie nest bien forme que si on peut la formuler sous
forme variationnelle et chercher, par la symtrie sous-jacente du lagrangien, ses lois de
conservation. Plus tard dans ce chapitre, nous verrons les formulations lagrangienne de
llectromagntisme et de la mcanique quantique quand nous verrons comment traiter
les champs.

11.3 Plusieurs degrs de liberts.


Parfois, souvent, le lagrangien dpend de plusieurs fonctions. Par exemple, une parti-
cule dans lespace habituel possde trois degrs de liberts x1 , x2 , x3 etPL = L(x1 , x2 , x3 , x1 , x2 ,
Si les xi sont les coordonnes cartsiennes, nous avons L = (m/2) i x2i V (r). La

2. Ceci sappelle le thorme de Noether, du nom de la mathmaticienne allemande qui la formul vers
1912.

151
11 Le calcul variationnel

dmarche ci-dessus peut-tre rpte mot mot pour dmontrer que nous aurons une
quation dE.L. pour chaque degrs de libert :
 
L d L
=0 (11.6)
xi dt xi

Lapproche lagrangienne ne dpend pas du choix de coordonnes, bien videmment. Il


suffit donc de pouvoir crire lnergie cintique et potentielle pour dduire les quations
du mouvement de faon automatique.
Exemple 11.4 mouvement dans un champ central. Il est facile de passer de lex-
pression de lnergie cintique en coordonnes cartsiennes (on pose m = 1) T =
x2 + y 2 + z 2 aux coordonnes sphriques, T = r2 + r2 2 + r2 sin2 2 . Lnergie
potentiel est V (r), ce qui donne le lagrangien

L = r2 + r2 2 + r2 sin2 2 V (r)

En crivant E.L. pour :

4rr + 2r2 2r2 sin cos 2 = 0 (11.7)

Nous remarquons que nous avons une symtrie : si nous avions choisi nos axes pour
que t = 0, = /2 et = 0 ( ce qui revient choisir le plan xy dfini par le rayon
vecteur de la particule et sa vitesse ), alors (t) = /2 vrifie trivialement lquation
(11.7) : la particule reste dans le plan xy. Le lagrangien scrit plus simplement donc

L = r2 + r2 2 V (r)

Nous remarquons que nintervient pas dans le lagrangien, le moment associ


cette variable se conserve donc :
L
p = = 2r2 = cte

Ceci nest rien dautre que la conservation du moment cintique, comme nous lavions
annonc ci-dessus. Finalement, il faut crire lE.L. pour r et rsoudre les quations
diffrentielles rsultantes. Le lecteur trouvera la solution de ses quations dans les
livres de mcanique.
Exemple 11.5 Pendule paramtrique. Soit un pendule de masse m = 1 restreint
au plan xy (on suppose la gravit selon laxe y) dont la longueur varie de faon
priodique dans le temps : ` = `(t). Quelle est son quation de mouvement ?
Le systme possde un seul degr de libert. Nous choisissons langle que fait
le pendule avec laxe y comme ce degr. Lnergie cintique est donne par T =
(x2 + y 2 )/2. Comme x = ` sin et y = ` cos , T = (`2 + `2 2 )/2. Lnergie

152
11 Le calcul variationnel

potentielle est U = gy = g` cos . Pour le premier terme de lquation E.L., nous


avons
 
d L d h 2 i
= `
dt dt
= `2 + 2``

Comme par ailleurs, L/ = U/ = g` sin , nous trouvons lquation du


mouvement :  

+ 2 `/` + (g/`) sin = 0

Si ` est constante, nous retrouvons lquation classique dun pendule. Si maintenant


` oscille faiblement autour dune position moyenne ` = `0 + `1 sin t, `0  `1 ,
on peut dmontrer quil y a p rsonance si la frquence dexcitation est le double
de la frquence propre = g/`0 ; la phase de loscillateur est alors bloque ( 0
ou ) sur la phase de lexcitation. Ce procd est largement utilis dans les circuits
lectroniques.
Vous avez sans doute remarqu avec quelle facilit lon obtient les quations du mou-
vement. En aucun cas on ne doit chercher les forces de raction des contraintes, comme
dans le cas de la formulation Newtonienne. Il existe une interprtation gomtrique
extrmement profonde de cette approche qui peut-tre trouve dans les livres de m-
canique analytique. Nous ne continuerons pas plus le sujet ici.

Drivation vectorielle.
Nous avons vu ci-dessus comment driver les quations dEuler-Lagrange quand le
lagrangien dpend de plusieurs fonctions x1 , x2 , ...xn dune seule variable t. Trs sou-
vent cependant, les fonctions xi (t) sont les coordonnes dun vecteur et il est vraiment
dommage de devoir dcomposer le vecteur en ses composantes. Ainsi, au lieu dcrire
F = ma, nous sommes amens crire n quations du genre fx = mx, fy = my , ...
Nous pouvons vectoriser les quations E-L pour nous viter cette gymnastique inutile
et donner un sens gomtrique nos quations.
Pour cela, nous devons gnraliser le concept de drivation. Premirement, remar-
quons que le lagrangien est toujours un scalaire. Un lagrangien avec un sens gom-
trique ne doit donc faire intervenir que des oprations sur les vecteurs dont le rsultat
est un scalaire intrinsque, cest dire un scalaire dont le rsultat ne dpend pas du sys-
tme de coordonnes que nous avons choisi. Le meilleurs exemple dune telle opration
est le produit scalaire.
Prenons par exemple, dans lespace trois dimensions, la fonction f (r) = r.r ; si
nous nous sommes quipes de coordonnes cartsiennes, ceci est un raccourci pour
crire
f (x, y, z) = x2 + y 2 + z 2

153
11 Le calcul variationnel

Nous pouvons donc donner un sens des expressions tel que x f . Pouvons nous donner
un sens lexpression f /r ? La rponse est videmment oui si nous nous souvenons
de la dfinition de la drive. Faisons un petit dplacement u autour du point r et me-
surons la partie linaire du changement dans la fonction f
df = f (r + u) f (r)
= (r + u).(r + u) r.r
= 2r.u + O(u2 )
Nous pouvons donc effectivement crire la partie linaire comme
 
f
df = .u
r
o (f /r) reprsente le vecteur 2r. Ceci est lexact quivalent (et la gnralisation)
de la drive de la fonction dune seule variable scalaire f (x) = x2 , o f 0 (x) = 2x. En
analyse vectorielle, la quantit (f /r) est souvent note gradf ou f 3 .
Nous pouvons gnraliser le produit scalaire en utilisant les notations matricielle.
Dans ce cas, le produit scalaire ci-dessus scrit rT r o rT est un vecteur colonne associ
r. De faon encore plus gnrale, nous pouvons avoir des expressions du genre f (r) =
rT Ar o A est une application bilinaire, quon appelle plus communment un tenseur
de rang 2. Il nest pas difficile alors de voir que
df = rT (A + AT ) .u


Si lon note As = (A + AT )/2 la partie symtrique de lapplication A, nous avons


f /r = 2rT As . Cette formulation est dveloppe en dtail dans le chapitre consa-
cr aux tenseurs. Notons simplement que lapplication A peut tre utilise pour grer
simplement les changements de coordonnes. A 2 dimensions, en coordonnes polaires
par exemple, nous avons  
1 0
A=
0 r2
11.1 Soit le lagrangien L = (1/2)mx.x + V (x). Dmontrer que les quations dEuler-
Lagrange scrivent
mx = gradV

11.4 Formulation lagrangienne et quation du


mouvement dun champ.
Le domaine o le calcul variationnel montre toute sa puissance est celui de lobten-
tion dquations dvolution dun champ : la hauteur dune corde vibrante, le champ
3. Voir les chapitres sur les formes diffrentielles et le calcul tensoriel.

154
11 Le calcul variationnel

lectromagntique, le champ des contraintes lastique dans un solide, le champ des am-
plitudes en mcanique quantique. Peu importe le champ, il suffit de pouvoir formuler
un lagrangien, cest dire lnergie cintique moins lnergie potentielle, et le tour est
jou. La diffrence par rapport ce que nous avons dveloppe ci-dessus est minime.
Jusque l, nous avions considr des lagrangiens fonctions de plusieurs xi , chacune
de ces dernires fonction dune variable t. L, nous allons considrer des lagrangiens
fonction de plusieurs i , chacune de ces dernires fonction de plusieurs variables.

Exemple fondamental. Pour fixer les ides, considrons le cas de la corde vibrante
fixe ces deux extrmits (x = 0 et x = L). A chaque instant t, la hauteur de la corde
la position x est donne par (x, t). tant donne la forme de la corde linstant
t0 ((x, t0 ) = y0 (x) ) et t1 ((x, t1 ) = y1 (x) ), quelle est lvolution de la corde qui
minimise laction ? La trajectoire de la corde est alors la surface reliant y0 (x) y1 (x)
dans le temps.
A un instant donne t, lnergie cintique de la corde est donne par la somme de
lnergie cintique de tout ses points matriels,
L
2
T = (/t) dx
0
et son nergie potentielle est lnergie lastique des dformations
L
2
V = k (/x) dx (11.8)
0

o est la densit de la ligne et k sa constante lastique. Notant c2 = k/, laction (le


cot dune trajectoire (x, t) ) est
t1 L h i
2 2
S[] = (/t) c2 (/x) dxdt
t0 0

En considrant une variation g(x, t) autour de la trajectoire (x, t), nous trouvons
qu lordre 1 en , la variation de laction est
t1 L  
g 2 g
S[ + g] S[] =  c dxdt
t0 0 t t x x
En faisant des intgrations par parties, nous trouvons
t1 L  2 2

2
S = c gdxdt
t0 0 t2 x2
S = 0 quelque soit la variation g, que si le terme entre [ ] est nul, cest dire
2 2
2
c =0
t2 x2
qui est bien sr lquation donde bien connue.

155
11 Le calcul variationnel

quation gnrale du mouvement de champ. Nous pouvons maintenant gn-


raliser cette approche par des calculs aussi lmentaires que ceux ci-dessus, ltape la
plus technique tant une intgration par partie. Soit un domaine D dans un espace n
dimensions, o nous cherchons trouver lextremum de la fonctionnelle

S[u] = L(u,1 , ..., u,n , u, x1 , ...xn )dn x
D

o u,i = u/xi . La valeur de la fonction u(x1 , ..., xn ) sur la frontire du domaine D


tant fix. Lquation dEuler-Lagrange pour ce champ est donne par
n  
X L L
=0
i=1
x i u,i u

Remarquez que cette expression est une simple gnralisation dEL une dimension :
lexpression de drivation du moment (d/dx)(L/u0 ) est remplace par la somme de
toutes les drives partielles.

Tenseur nergie-impulsion. Nous pouvons pousser un peu plus loin. Nous avons
vu lgalit de Beltrami pour une fonction dune variable : quand le lagrangien ne d-
pend pas de la variable indpendante
 
d L
y0 0 L = 0
dx y
ou si nous voulions lcrire avec nos notations sophistiques
 
d L
y,x L =0
dx y,x

ou nous avons not y,x = y 0 = dy/dx. Si L reprsente le lagrangien de la mcanique


analytique, le terme entre {} reprsente lHamiltonien, une quantit scalaire. Nous pou-
vons gnraliser ce concept au lagrangien dun champ u(x1 , x2 , ...xn ) qui ne dpend
pas explicitement des variables indpendantes. En notant 4
 
L
Tij = u,i ij L
u,j

nous pouvons obtenir lquivalent de lidentit de Beltrami pour un champ :


n
X Tij
=0
j=1
xj

4. Rappelons que ij = 0 si i 6= j et 1 sinon. Ceci est appel le symbole de Kronecker

156
11 Le calcul variationnel

la quantit T , qui joue le rle de lHamiltonien pour le champ, est souvent appele en
physique le tenseur nergie-impulsion. Le lecteur intress pourra consulter des livres
de gomtrie pour voir la signification gnrale de ce tenseur 5 .

Exercices.
11.2 Pour une corde vibrante dans un champ de gravitation, nous devons ajouter le terme
Vg = I 0 dx lnergie potentielle (11.8) o 0 est le produit de la densit par lacclration
de la gravit. Dduire lquation du mouvement du champ dans ce cas. Mme question si la
corde se trouve dans un potentiel harmonique Vh = I 2 dx.

11.3 Calculer le tenseur nergie-impulsion pour la corde vibrante sans potentiel extrieur. Que
reprsente Ttt ? Que veut dire lidentit de Beltrami dans ce cas ? Que reprsente alors Ttx ?

11.4 Dduire les quations du mouvements dun champ dans un espace ndimensions, o
lexpression de lnergie potentielle (interne) est donne par V = I k()2 dr. Ceci gnralise
lquation de la corde vibrante.

11.5 Dduire lquation du mouvement dun champ dans un espace ndimensions aniso-
trope, o lexpression de lnergie potentielle (interne) est donne par
X

V = aij dr
I i,j x i xj

o pour les coefficients, nous pouvons supposer aij = aji (pourquoi ?). Ce genre dexpression se
rencontre frquemment dans des problmes comme llasticit des cristaux, o les dformations
dans les diffrentes directions ne sont pas quivalentes.

11.5 Optimisation sous contraintes.


11.5.1 Les dplacements compatibles.
Oublions pour linstant le problme de lextremum dune fonctionnelle, et revenons
au problme beaucoup plus simple de lextremum dune fonction de plusieurs variables.
Soit la fonction f (x, y) dont nous cherchons lextremum. Nous savons quau point ex-
tremum, les termes linaires des variations doivent tre nulle
   
f f
df = f (x + h, y + k) f (x, y) = h+ k + O(h2 , k 2 )
x y

et ceci quelque soit h, k : quelque soit la direction que lon prend au point extremum,
le terme linaire de la variation doit tre nulle.
5. Notons quand mme que cela ressemble une expression du genre divT = 0. Classiquement, la
divergence est dfini pour un vecteur et est fortement associe au flux de ce vecteur travers une surface. Il
nest pas trop difficile de donner un sens au concept du flux dun tenseur.

157
11 Le calcul variationnel

4
g(x,y)=0

2
A

0
O

4
4 2 0 2 4

Figure 11.2 La fonction f (x, y) = x2 + y 2 est reprsente par ses courbes de niveau.
Le minimum absolu de cette fonction est le point O = (0, 0). Le point
le plus bas de la fonction qui doit galement appartenir la courbe
g(x, y) = 0 est le point A.

Supposons maintenant que nous ajoutons une contrainte : nous ne cherchons pas
lextremum absolu de f , mais un point x qui satisfasse en plus la contrainte g(x, y) =
0. Par exemple, nous savons que le minimum de la fonction f (x, y) = x2 +y 2 est le point
(0, 0). Mais si nous contraignons notre point se dplacer sur la courbe y = ax + b,
b 6= 0, le point (0, 0) nest pas atteignable. On peut cependant chercher un point qui
minimise f avec la contrainte donne 6 . Dans le cas simple que nous somme en train de
traiter ici, on peut rsoudre une coordonne par rapport lautre et ramener la fonction
une seule variable (degr de libert) : f (x) = x2 +(ax+b)2 et chercher maintenant le
minimum de cette nouvelle fonction (o les contraintes ont t absorbes). En gnral
cependant, la fonction contrainte g(x, y) = 0 est suffisamment complique pour quon
ne puisse pas rsoudre une des coordonnes par rapport aux autres.
Revenons la dfinition gnrale : la variation linaire de la fonction autour du
point extremum (x , y ) doit tre nulle quelque soit le dplacement (h, k) autour de ce
point. En prsence des contraintes, nous relchons cette exigence : il faut que la varia-
tion linaire autour du point (x , y ) soit nulle seulement pour les dplacement (h, k)
compatibles avec les contraintes 7 . Les dplacements compatibles avec la contrainte
g(x, y) = 0 sont donnes par
(g/x)h + (g/y)k = 0
Ceci nous donne une quation supplmentaire considrer avec lquation
df = (f /x)h + (f /y)k = 0
Nous sommes arrivs un systme de deux quations deux inconnus linaires. En
rsolvant k en fonction de h dans la premire quation ; en linjectant dans la deuxime
6. Imaginer que vous marchez en montagne sur un chemin, et vous vous intressez au point le plus bas
sur ce chemin et non pas en gnral.
7. En mcanique, cela est appel la mthode des travaux virtuels

158
11 Le calcul variationnel

quation ; et en exigeant maintenant que df soit nulle quelque soit h, nous obtenons 8

(f /x)(g/y) (f /y)(g/x) = 0 (11.9)

Ceci est une condition supplmentaire sur lextremum de la fonction f .


Exemple 11.6 Trouver lextremum de la fonction f (x, y) = x2 + y 2 avec la contrainte
g(x, y) = ax + y b = 0. En crivant la condition (11.9), nous obtenons

(2x)1 (2y)(a) = 0

ou autrement dit, x + ay = 0. En combinant cette quation avec la contrainte y =


ax + b, nous trouvons les coordonnes du point extremum : x = ab/(1 + a2 ),
y = b/(1 + a2 ).

11.5.2 Les multiplicateurs de Lagrange.


Lagrange a introduit une mthode quivalente ce que nous venons de voir ci-dessus.
Nous voulons optimiser f (x, y) avec la contrainte g(x, y) = 0. Lagrange introduit une
variable supplmentaire, et considre maintenant le problme de loptimisation (libre)
de la fonction F (x, y, ) = f (x, y) g(x, y). Cela nous donne
F f g
= =0 (11.10)
x x x
F f g
= =0 (11.11)
y y y
F
= g(x, y) = 0 (11.12)

Lquation (11.12) nest rien dautre que la contrainte et assure que la solution trouve
est bien conforme. Les deux premires quations (11.10,11.11) ne sont rien dautre que
la condition (11.9) si on y limine .
Exemple 11.7 Minimisons la fonction f (x, y) = x2 + y 2 avec la contrainte g(x, y) =
ax + y b = 0. Nous introduisons la fonction F (x, y) = x2 + y 2 (ax + y b).
Cela nous donne

2x + a = 0
2y = 0
8. On peut galement dire que pour que le systme Ah + Bk = 0, Ch + Dk = 0 ait une solution non
trivial h = k = 0, il faut que le dterminant de la matrice
 
A B
C D
soit nulle.

159
11 Le calcul variationnel

Ce qui bien sr nous donne x + ay = 0. Nous trouvons nouveau le mme point


optimum ; de plus, si on le souhaite, on peut trouver galement = 2y = 2b/(1 +
a2 ).
Le coefficient est appel un multiplicateur de Lagrange. La mthode a une significa-
tion physique profonde : supposons que nous ayons un point matriel dans le potentiel
f (x, y) astreint rester sur la courbe g(x, y). Au point x , le point (qui est stable) est
soumis une force non-nulle de la part du potentiel F = (x f, y f ). Pour quil puisse
rester sur la position x , il faut que la courbe g(x, y) exerce une force de raction sur le
point qui vaut justement (x g,y g). Si on enlevait la contrainte mais quon soumet-
tait le point matriel cette force supplmentaire, il se mettrait exactement la mme
position. 9

11.5.3 Gnralisation des multiplicateurs de Lagrange.


Les multiplicateurs de Lagrange se gnralisent de faon naturelle aux fonctions de
n variables soumis m contraintes. Pour optimiser la fonction f (x1 , ...xn ) soumise
aux contraintes g1 (x1 , ...xn ) = 0,...,gm (x1 , ...xn ) = 0, nous considrons la nouvelle
fonction F de n + m variables

F (x1 , ...xn ; 1 , ...m ) = f (x1 , ...xn ) 1 g1 (x1 , ...xn ) ... m gm (x1 , ...xn )

Nous chercherons lextremum (sans contrainte) de la fonction F .


11.6 Dmontrer le cas gnral, en suivant le chemin dj trac.

La mthode des multiplicateurs de Lagrange se gnralise trs naturellement aux


0

fonctionnelles. Si nous devons trouver le minimum de la fonctionnelle S[y] = I
L(y , y, x)dx
0
avec la contrainte I g(y , y)dx = A, il nous suffit dintroduire la fonctionnelle

S 0 [y; ] = {L(y 0 , y, x) g(y 0 , y)}
I

et de chercher le minimum de cette fonctionnelle par les techniques habituelles du cal-


cul des variations ( expliquer pourquoi nous pouvons omettre la constante A) .
Exemple 11.8 Le problme isoprimtrique.
Trouver la courbe ferme de longueur donne qui maximise sa surface.

9. Cette dualit force-contrainte a jou un grand rle dans le dveloppement de la mcanique, de sa


formulation Newtonienne dans les annes ~1680 lapparition du livre de mcanique analytique par Lagrange
en ~1780. Lagrange tait fier de navoir pas inclus une seule figure dans son livre. En mcanique, la mthode de
Lagrange nous permet de calculer une position dquilibre sans calculer explicitement les forces de ractions.

160
11 Le calcul variationnel

Supposons 10 que nous pouvons reprsenter la courbe par une fonction R(). Nous
cherchons minimiser la fonctionnelle
2
S[R] = (1/2)R2 ()d (11.13)
0

avec la contrainte 2
R()d = L (11.14)
0
Considrons la nouvelle fonctionnelle
2
0
(1/2)R2 () R() d

S [R(); ] =
0

Le terme entre {} (que nous continuons dappeler le lagrangien) ne contient mme


pas de drive de R ; lquation dEuler-Lagrange nous donne directement

R=0

cest dire R = = Cte. Ceci est bien un cercle. Pour trouver , nous utilisons la
contrainte (11.14), qui nous donne = L/2. La courbe qui minimise la surface est
donc un cercle de rayon R = L/2.
Exemple 11.9 distribution dnergie dans un systme isol.
Nous avions dj rencontr ce problme prcdemment sous le nom du thorme
H (voir problme 7.3), nous allons le revisiter sous un autre angle. Soit un systme
isol ayant N particule (N +) et soit c(x) le nombre relatif de particules ayant
une nergie dans lintervalle [x, x + dx[. Comme le systme est isol, le nombre de
particules et lnergie totale sont conservs :

c(x)dx = 1 (11.15)
0

xc(x)dx = T (11.16)
0

o nous appelons T lnergie moyenne par particule : T = E0 /N avec E0 lnergie


totale du systme. Le thorme H de Boltzmann nous apprend que la fonction c(x)
doit tre choisi de faon ce que la quantit

H [c] = c(x). log [c(x)] dx (11.17)
0

10. Ceci est une trs grosse supposition. Le lecteur a intrt a tracer quelques courbes qui ne sont pas
reprsentable par une fonction R() pour se rendre compte de la simplification que nous assumons derrire
cette supposition.

161
11 Le calcul variationnel

soit extremum. La quantit H est souvent appel entropie. Avec les deux contraintes
(11.15,11.16), nous devons donc chercher lextremum de la fonctionnelle

H 0 [c; , ] = c(x). log [c(x)] dx c(x)dx xc(x)dx
0 0 0

Le calcul est assez simple dans ce cas, puisque nous navons pas de driv dans la
fonctionnelle. En cherchant la valeur de la fonctionnelle pour H 0 [c + g; , ] et en
nous contentant dordre 1 en , nous trouvons

H 0 [c + g; , ] = H 0 [c; , ] +  (1 + log c x) g(x)dx
0

la fonction c(x) est un extremum de la fonctionnelle H 0 si les variations linaires


sont nulles g, cest dire si

log c = ( 1) + x

ou autrement dit c(x) = Aex ; lutilisation des deux contraintes nous donne A =
= 1/T . Autrement dit,
c(x) = (1/T )ex/T

11.5.4 Formulation variationnelle des systmes Sturm-Liouville.


Rappelons quun systme Sturm-Liouville est une quation aux valeurs propres

(x)y 00 + (x)y 0 + (x)y = y

Nous avons mentionn (et insist) que si nous trouvons un poids w(x) qui rend lop-
rateur hermitien, alors les solutions des systmes SL minimisent une certaine fonc-
tionnelle. Nous avons vu que si une telle fonction poids existe, alors elle doit obir
lquation (w)0 = w et le systme peut alors scrire sous la forme alternative

d
(wy 0 ) + wy = wy
dx
Remarquer que cette forme ressemble furieusement une quation dEuler-Lagrange.
On peut faire le chemin inverse : minimiser la fonctionnelle

p(x)y 02 + q(x)y 2 dx

S[y] =
I

avec la contrainte
w(x)y 2 dx = 1
I

162
11 Le calcul variationnel

Comme on peut le voir, nous pouvons formellement identifier lquation dEuler-Lagrange


du systme ci-dessus un systme SL en posant p = w, q = w. A regarder de
plus prs, la formulation variationnelle dun systme SL, si on assimile la variable x
au temps, ressemble beaucoup un oscillateur harmonique avec une masse et une
constante de ressort dpendant du temps. Ceci, comme nous lavons mentionn, est
le point de dpart de lapproximation WKB.

11.6 Les conditions aux bords naturelles 1.


Revenons notre formulation initiale de problme dextremum. Nous voulons trou-
ver lextremum de la fonctionnelle
b
S[y] = L(y 0 , y, x)dx
a

avec les conditions aux bords fixe

y(a) = y0 ; y(b) = y1

Pour cela, nous avons crit la variation de S en fonction dune petite perturbation g(x)
pour obtenir
 b b  
L L d L
S = g + gdx (11.18)
y 0 a a y dx y 0
et nous avons cherch dans quelles conditions, S = 0 quelque soit g(x). Nos condi-
tions aux bords nous ont imposes g(a) = g(b) = 0, donc le premier terme est nul ; le
deuxime terme nous donne les quations dE-L.
Ceci dit, nous pouvons relcher nos contraintes, et ne pas exi-
ger que y(a) = y0 , y(b) = y0 . Le problme serait alors : parmi
toutes les courbes entre a et b, trouver celle qui extrmise la
fonctionnelle. Dans ce cas, lannulation de S exige toujours
lannulation de lintgrale, qui nous donnera comme dhabitude
les quation dEuler Lagrange, et lannulation du terme de bord.
Or, cette fois, comme les bords ne sont plus fixe, nous navons
plus g(a) = g(b) = 0, pour annuler les termes de surface, nous Figure 11.3 Bords
devons exiger libres

L
=0
y 0
x=a,b

ce qui nous fournit deux nouvelles conditions en remplacement des conditions y(a) =
y0 , y(b) = y0 . On peut bien sur mixer les conditions : fixer y en un bord et laisser y
varier sur lautre bord.

163
11 Le calcul variationnel

Application I : lasticit des poutres. Pour illustrer ce principe, considrons un


lagrangien qui contient des drives dordre 2 : L = L(y 00 , y 0 , y, x). Dans ce cas, la
variation scrit
b b 
d2 L
 
L d L L 0 L d L
S = g g + g + + gdx
y 0 dx y 00 y 00 a a y dx y 0 dx2 y 00

Pour une poutre lastique soumise une charge f (x) par exemple, lnergie scrit
L  002
E= By f (x)y dx
0

Si la poutre est encastre (a), nous avons les condi-


tions y(0) = y(L) = 0 et y 0 (0) = y 0 (L) = 0.
Dans ce cas, le terme de bord est automatiquement (a)
nulle. Par contre, si la poutre est seulement pos (b), (b)
nous avons seulement y(0) = y(L) = 0. Pour trou-
(c)
ver les deux autres conditions et annuler le terme de
bord, nous devons avoir L/y 00 = 0, cest dire
y 00 (0) = y 00 (L) = 0. Nous laissons au lecteur le soin
Figure 11.4 poutres fixes.
de trouver les conditions aux limites pour le cas (c).

Application II : angle de contact. Mettons un li-


quide en contact avec un support solide. Le liquide monte le long de la paroi solide, et
par rapport ltat de rfrence, lnergie libre du systme scrit :

F = lg (` L) + (sl sg )h

les coefficients lg ,... sont les tensions de surface liquide-gaz, ... ; ` est la lon-
gueur de linterface liquide-solide aprs la monte du liquide, L la longueur
de cette mme interface avant la monte, et nous supposerons ces deux va-
leurs trs grandes ( ). h est la longueur de linterface solide-liquide.
Reprons la courbe du liquide par la fonction y(x).
En mettant le problme sous forme variationnelle,
Sol.
nous avons
Gaz
p 
F [y] = lg 1 + y 2 1 dx + (sl sg )y(0)
0
Liq.
avec la contrainte de la conservation de la masse qui
est
ydx = 0
0

164
11 Le calcul variationnel

Figure 11.5 Le bord droit de la courbe y(x) est libre de se mouvoir le long dune
courbe (x).

Nous sommes en prsence dune optimisation sous contrainte, en prsence de bords


libre : la hauteur du liquide x = 0 et x = nest pas fixe. En ajoutant y(x) une
variation g(x) o g ne sannule pas sur les bords de lintervalle, nous obtenons dune
part une quation dEuler Lagrange comme dhabitude, et dautre part une condition
non-trivial sur le bord x = 0 :
 
L
+ (sl sg ) =0
y x=0

Or,
L lg y
=p = lg cos
y 1 + y 2
o est langle entre la tangente et laxe y. On en dduit langle de contact solide-liquide
sg sl
cos =
lg

La relation ci-dessus est connu sous le nom de la relatons dYoung. Comme la mesure de
langle de contact est facile, on lutilise en gnral pour mesurer les tensions de surface.

11.7 Les conditions aux bords naturelles 2.


Dans le paragraphe prcdent, labscisse x tait fixe sur les deux bords, y ayant la
libert de bouger le long dune droite verticale. Nous pouvons gnraliser encore plus
en relchant cette contrainte et en permettant aux points sur les bords de se mouvoir
le long dune courbe quelconque. Supposons, pour la simplicit, que seulement le bord
droit x = b peut se mouvoir le long dune courbe y = (x). Lexpression (11.18) que
nous avions crit dpend bien sr du bord, et on peut crire la variation caus autour
de y(x) par

165
11 Le calcul variationnel

 b b  
L L d L
S[y, b] S[y + g, b + db] = g + gdx
y 0 a a y dx y 0
b+db
+ L(y 0 , y, x)dx (11.19)
b
 b
L
= g + L(y 0 , y, x)db + {...} (11.20)
y 0 a

Le terme entre crochet nous donne lquation dEuler-Lagrange comme dhabitude sur
lintervalle [a, b]. Occupons nous seulement des termes du bord. Nous devons avoir,
puisque le point du bord se meut le long de la courbe y = (x),

y(b + db) + g(b + db) = (x + db)

Cela nous donne, lordre 0 en db, y(b) = (b) bien sr, et de plus, lordre 1 :

g(b) = (0 (b) y 0 (b)) db

Finalement, la variation de S due au bord scrit


 
L 0 0 0
S = ( (b) y (b)) + L(y , y, x) db
y 0
et la nullit de ce terme nous impose
L L 0
y 0 (b) L= (b)
y 0 y 0
Le lecteur peut noter que le terme de gauche est souvent not H, tandis que L/y 0
est souvent not p. En mcanique analytique, on les appelles lHamiltonien et le mo-
ment. Lquation scrit donc, sur le bord,

H = p0 (b) (11.21)

Rsumons : Si db = 0, nous navons rien faire de plus dans lexpression (11.20), et


nous avons notre condition au bord du paragraphe prcdent p = 0. Si db 6= 0, alors
nous devons utiliser la condition plus gnrale (11.21). En particulier, si 0 (b) = 0 (nous
nadmettons que des dplacements le long de laxe x), alors nous devons avoir

H=0

Exemple 11.10 angle de contact dune goutte pos sur un substrat solide non
plane.
Exemple 11.11 Brachistochrone gnrale.

166
11 Le calcul variationnel

11.8 Dtour : lments de gomtries


non-euclidiennes.
Le cinquime axiome dEuclide est le suivant : dun point en dehors dune droite,
on ne peut tracer quune et une seule droite parallle au premier. Pendant deux mil-
lnaires, les mathmaticiens ont cru que ceci nest pas un axiome, mais un thorme
que lon peut dmontrer partir des quatre premiers axiomes. A partir de 1830, il est
devenu clair que le cinquime mrite le titre daxiome et quon peut tout a fait formuler
dautres gomtries qui acceptent dautres axiomes. Nous allons tudier une version
simplifie de la gomtrie riemannienne. Pour cela, nous devons donner un sens prcis
au mot droite : nous le dfinirons dornavant comme le chemin le plus court entre
deux points ; il est plus habituel alors dappeler cela une godsique. Supposons que
nous avons muni notre espace bidimensionnel dun systme de coordonnes (x1 , x2 ).
La distance entre deux points infiniment voisin est dfinie par
X
ds2 = gij dxi dxj
i,j

o gij = gij (x1 , x2 ) est appel le tenseur mtrique. Par exemple, si nous avons muni
le plan euclidien de coordonnes polaires, ds2 = dr2 + r2 d2 , nous avons (en posant
x1 = r, x2 = ), g11 = 1, g22 = x2 , g12 = g21 = 0.
Nous allons considrer dans la suite le cas trs particulier o g11 = 1, gi6=j = 0
et g22 = g 2 (x), o g est une fonction quelconque 11 . Le primtre dune courbe y(x)
reliant deux points est donne par
2 p
`[y(x)] = 1 + g 2 (x)y 02 dx
1

et il est lmentaire de montrer, daprs les prcdents paragraphes, que lquation


dEuler-Lagrange nous donne immdiatement lquation de la courbe :
p
y 0 = a/g g 2 a2

o a est une constante dintgration. Dans le cas des coordonnes polaire par exemple
o g(x) = x, nous pouvons intgrer lquation ci-dessus 12 et obtenir lquation dune
droite y = + arccos(a/x) o a et sont deux constante dintgration. Pour vous
convaincre que cela est effectivement le cas, Il suffit dinterprter x comme r et y comme
, faire un petit schma et quelques manipulations dangles .

11. Nous noterons par habitude les coordonnes (x, y) sans leur associer lide de coordonnes cart-
siennes
12. il suffit deffectuer le changement de variable u = a/x

167
11 Le calcul variationnel

Prenons le cas plus intressant pour nous de g(x) = sin(x). A nouveau, lintgration
seffectue sans difficult 13 et nous obtenons

y = + arccos (cos cot x)

o et sont deux constantes dintgration. Nous voyons par exemple que pour =
/2, nous avons une famille de droites donnes par y = Cte. Prenons la godsique
y = 0 et considrons le point P = (/2, /2) en dehors de cette droite. Toutes les
droites traversant ce point doivent avoir le paramtre = 0. Il nest pas alors difficile
de voir que toutes ces droites croisent la droite y = 0 au point cot x = 1/ cos .
Nous venons de dmontrer dans ce cas que toutes les droites traversant P croisent
une droite ne contenant pas P ; cela est trs diffrent du cinquime axiome dEuclide.
Le cas que nous venons de traiter correspond la gomtrie sphrique : sur la sphre
unit, la distance entre deux points est donne par ds2 = d2 +sin2 d2 . Mais le point
de vue de Riemann est beaucoup plus fondamental que cela : ce qui caractrise lespace
et qui lui donne sa substance est la donne du tenseur mtrique. Les habitants de la
surface de la sphre unit ne peuvent pas voir quils sont sur une sphre. Ils peuvent
par contre visionner les godsiques (en suivant les trajets des faisceaux de lumire )
et dterminer la nature de leur espace en faisant des mesures par exemple de la somme
des angles dun triangle form par trois godsiques. Cest exactement dans ce cadre
quEinstein a formul sa thorie de la gravit en 1915, o les masses confrent de la
courbure lespace-temps.

A ajouter.
1. Discuter la jauge dans le Lagrangien et ventuellement le thorme de Noether.

Exercices.
11.7 Surface minimum.
Soit deux cercles concentriques de rayon priori diffrents disposs lun au dessus de lautre
une hauteur h. Quelle est la forme de la surface daire minimum qui relie les deux cercles (fig.
11.6a) ?

11.8 Energie de courbure. Comment faut-il crire les quations dEuler-Lagrange si le la-
grangien contient des drives secondes ? Plus spcifiquement, supposer que le lagrangien est
de la forme L = y 00 (x)2 + V (y). Gnraliser ensuite au cas L = L(y 00 , y 0 , y, x).

11.9 Brachistochrone. Nous voulons minimiser


x1 s
1 + y 02
T = dx
0 y

13. Il suffit de poser u = cot x

168
11 Le calcul variationnel

y
r(z)
L
F
a x

(a) (b) (c)

Figure 11.6 (a) : surface minimum entre deux cercle ; (b) flambage dune barre ; (c)
pont suspendu une chanette.

Figure 11.7 Une barre lastique soumise une force F .

En utilisant lidentit de Beltrami, dmontrer que la courbe y(x) doit obir lquation
1
=C
y(1 + y 02 )
o C est une constante. Rsoudre cette quation du premire ordre en dmontrant dabord que
r
y
dx = dy
2a y
o nous avons pos 1/C 2 = 2a ; intgrer cette dernire quation en posant y = a(1 cos ).
[Help : nous devons obtenir lquation du cyclode sous forme paramtrique.]
11.10 lasticit 1-d. Soit une barre dont on repre les points (avant dformation) par la
coordonnes x (figure 11.7). On appuie sur la barre paralllement son axe ; les points de la
barre se dplacent aux coordonnes x0 (Figure 11.7). Nous appelons dplacement u(x) = x0 x
la fonction qui traque cette quantit. Lnergie lastique stocke dans la barre est proportionnelle
au carr du gradient de ce terme :
L
E= (1/2)ku0 (x)2 dx
0
o k est la constante lastique de la barre (quon appelle galement le module dYoung). La force
a effectu le travail W = F u(L). Lnergie totale de la barre scrit donc
L
(1/2)ku0 (x)2 F u0 (x) dx

E=
0

169
11 Le calcul variationnel

Dmontrer alors que u(x) = ax o a est une constante dterminer. Dterminer a en utilisant
les conditions aux bords naturelles (section 11.6). En dduite la loi dlasticit de Hook

F = Ku(L)

Que vaut K ? quelle est sa dpendance en L ?

11.11 Flambage dune poutre. Appuyez sur une rgle tenue verticalement sur une table ;
au del dune certaine force, la rgle flambe (fig.11.6b). Ceci est un problme extrmement im-
portant de la rsistance des matriaux et conditionne la conception des tours pour quelles ne
scroulent pas (en flambant) sous leurs propres poids. Reprons la barre par son cart la droite
y(x). En supposant faible lcart de la barre par rapport la droite, lnergie de courbure de la
barre est donne par sa courbure locale B(y 00 (x) )2 . Nous supposons lextrmit de la courbe
maintenu y = 0, mais pouvant coulisser sur laxe x et soumise une force F . Pour trouver la
configuration qui minimise lnergie, nous devons donc trouver lextremum de la fonctionnelle
a
S[y, a] = B(y 00 (x) )2 dx F (L a)
0

soumis la contrainte a
(1 + (1/2)y 02 dx = L

0
p
Nous avons approxim ici llment de ligne ds = 1 + y 02 par son dveloppement de Taylor,
en supposant les carts la ligne (et leurs drives) faible. Dmontrez alors que pour F > Fc ,
la poutre droite nest plus la solution optimum ; calculer Fc .

11.12 Flambage dune poutre II. Nous pouvons formuler diffremment le problme de flam-
bage, en intgrant directement la contrainte dans le lagrangien. Pour cela il suffit dutiliser un
systme de coordonnes plus adapts que les coordonnes cartsiennes. Reprons un point le
long de la poutre par sa longueur darc partir de lorigine s, et par langle de la tangente la
courbe en ce point avec laxe horizontal (s). Ce nouveau systme de coordonnes est reli aux
coordonnes cartsiennes par la relation

dx = cos ds
dy = sin ds

La courbure en un point est simplement donne par d/ds. Lnergie scrit alors
Ln o
2
S[] = B 0 + F cos ds F L
0

que lon peut traiter par les quation dEL sans contraintes : la longueur darc s gre automa-
tiquement la constance de la longueur totale de la poutre. Les coordonnes semi-intrinsque
(s, ) sont trs utilises en gomtrie diffrentielle. Noter de plus la grande similarit de laction
celle de loscillation dun pendule dans le champs de gravit.

11.13 Angle de contact. Trouver langle de contact dune goutte de liquide dpose sur une
surface solide.

170
11 Le calcul variationnel

11.14 isoprimtrique II. Chercher la courbe sous forme paramtrique x = x(t), y = y(t)
avec la condition supplmentaire x(1) = x(0) et y(1) = y(0). crire au moins les quations
dEuler-Lagrange.

11.15 Isoprimtrique III. Quelle est la courbe de surface donne qui minimise son pri-
mtre ?

11.16 quation de la chanette. Une chane y(x) est suspendu entre deux points distant
de a. La longueur totale de la chane est L. Trouver lquation de la chane. Help : A lvidence,
la chane doit minimiser lnergie
potentielle, avec une contrainte sur sa longueur. Lnergie
potentielle est de la forme yds ; on doit donc trouver le minimum de
a/2 n o
H0 =
p p
y 1 + y 0 (x)2 1 + y 0 (x)2 dx
a/2

o est un multiplicateur de Lagrange. Obtenez galement lquation de la chanette laquelle


on a suspendu un pont (fig.11.6c)

11.17 Trajectoire complexe. Soit une fonction y(x) complexe (R C) dont laction est
dfinie par
0
S[y] = L(y, y 0 , y , y ; x)dx
I
0 0
Comme par exemple L = y y + kyy . Obtenir les quations dEuler-Lagrange de cette fonc-
tion. [Help : il faut dmontrer que lon peut considrer y et y comme deux composantes ind-
pendantes, et obtenir une quation dEL pour chacune].

11.18 quation de Schrdinger. Nous cherchons la fonction complexe (x, t) qui optimise
laction associe au lagrangien suivant

L = i t a(x )(x ) V (x)

Trouver lquation dEuler Lagrange laquelle obit la fonction . Dans la formulation ci-dessus,
et ne jouent pas le mme rle. Pouvez vous donner une version plus symtrique de ce
lagrangien ?

Problmes.

Problme 11.1 Champs lectromagntique dans le vide.


Nous dfinissons un champ A = (A0 , A1 , A2 , A3 ) dans un espace 4 dimensions que lon re-
pre laide des coordonnes x = (x0 , x1 , x2 , x3 ) 14 . Comme nous sommes parfois trop habitu
la sparation en espace (3d) et en temps, nous dissocions parfois les expressions ci-dessus en
donnant des noms diffrents aux diffrents composants : nous notons par exemple A = (, A)
o nous appelons le potentiel et A le potentiel vecteur ; de mme, nous notons x = (t, x) o
le premier composant est appel temps et les trois autres lespace. Les quations dlectroma-
gntisme ont t formul dans le cadre de cette sparation trange et les diffrentes drives du
14. Nous vitons pour linstant les exposants et notons les coordonnes xi au lieu de xi

171
11 Le calcul variationnel

champ ont reu des noms diffrents. Par exemple, on appelle champ lectrique le vecteur 3
dimensions
E = t A
et champ magntique
H=A
Revenons notre formulation gnrale. Le tenseur lectromagntique est dfini par
Ak Ai
Fik =
xi xk
Ce tenseur est bien sr anti-symtrique Fik = Fki .
1. Donner lexpression du tenseur F en fonction des champs Ei et Hk .
2. Dmontrer que pour trois indices i, j, k, la dfinition mme du tenseur F impose
Fij Fjk Fki
+ + =0
xk xi xj
dmontrer que les seules quations non-triviales sont celles o i 6= j 6= l et cela nous
donne 4 quations que nous pouvons regrouper en

E = t H
.H = 0

qui ne sont rien dautre que les deux premires quations de Maxwell.
Dans lespace-temps relativiste, la distance ds entre deux points voisins est donne par
3
X
ds2 = dx20 (dx21 + dx22 + dx23 ) = i dx2i
i=0

o 0 = 1 et i1 = 1. Il existe une diffrence entre une des composantes et les trois autres
quant au signe quil faut utiliser pour llment darc. Cette diffrence apparat obligatoirement
dans toutes les expressions des lois physiques. En particulier, toutes les expressions quadratiques
auront une forme similaire lexpression de llment darc. Par exemple, laction du champs
lectromagntique est donne par lintgrale sur un volume du lagrangien suivant 15 :
3
X
L= i j Fij2
i,j=0

Remarquer la similarit entre cette formulation et la formulation de la thorie de llasticit, o


le champs A reprsente le vecteur dplacement et le tenseur Fij le tenseur dformation. Ceci
nest pas un hasard ; Maxwell lui mme imaginait lther comme un corps lastique et sinspirait
fortement de la thorie de llasticit.
1. Dduire que lon peut mettre le lagrangien sous forme de L = E2 H2
15. Le signe moins na pas de consquence pour nos calculs, mais assure que la solution trouve est un
minimum plutt quun maximum de laction.

172
11 Le calcul variationnel

2. Dduire les quations du champs


3
X Fij
i j =0
j=0
xj

3. Mettre ces quations sous la forme plus usuelle des deux autres quations de Maxwell :

H = t E ; .E = 0

Problme 11.2 Elasticit gnrale.


Voir mon cours sur llasticit.

173
12 Calcul des perturbations.
Le calcul des perturbations nest pas une mthode scientifique utilise dans les hpi-
taux psychiatriques pour valuer les symptmes dun patient. Il existe peu de problmes
exactement solubles en physique et il faut souvent recourir aux techniques dapproxi-
mations. Une des techniques les plus utilises est celle qui porte le nom de ce chapitre.
Lide de base est une gnralisation du dveloppement de Taylor : si nous connaissons
la valeur dune fonction au point x0 , nous pouvons calculer, sous certaines conditions,
la valeur de la fonction au point x0 +  :

f (x0 + ) = f (x0 ) + A1  + A2 2 + ...

Le dveloppement de Taylor nous fournit en plus un moyen de trouver les coefficients


Ai : ce sont, si elles existent, les i-me drives de la fonction f au point x0 , divis par i!
. De plus, si  est petit et que nous ne sommes pas trs exigent quant la prcision, nous
pouvons nous contenter du premier ou des deux premiers termes du dveloppement.
Le calcul des perturbations gnralise cette dmarche au calcul des solutions des qua-
tions diffrentielles, des racines des polynmes, des quations intgrales, des vecteurs
propres des matrices, ... Cest le premier outil utilis par le physicien qui tombe sur
un problme ardu dont la solution nest pas connue : si on connat un problme proche
dont la solution est connue, on peut tenter les perturbations. Mentionnons tout de suite
que cette technique ne marche pas toujours. On tombe parfois (souvent), sur des per-
turbations dites singulires et il faut alors sortir lartillerie lourde. Les perturbations
qui se traitent facilement sont dites rgulires. Nous nous intresserons surtout aux
perturbations rgulires, mais dirons quelques mots sur les perturbations singulires.

12.1 Les perturbations rgulires.


La meilleure faon de shabituer aux calcul des perturbations est travers des exemples.

Les racines dun polynmes. Supposons que nous ne connaissons pas la rsolu-
tions des quations algbriques de second ordre, mais que nous savons rsoudre lqua-
tion x2 x = 0 , dont les racines sont x0 = 0, 1. Nous cherchons la solution de lqua-
tion
x2 x +  = 0 (12.1)

174
12 Calcul des perturbations.

o nous supposons  petit. Cherchons la solution sous forme de


X = x0 + x1 + 2 x2 + ... (12.2)
Nous cherchons la solution sous cette forme puisque nous pensons que comme  est
petit, la nouvelle racine ne doit pas tre trop loin de lancienne, et lcart doit tre jus-
tement fonction de  : pour  = 0, nous devons trouver la solution originale. Nous
connaissons dj x0 , et il nous faut trouver une mthode pour calculer x1 , x2 , ... Injec-
tons maintenant (12.2) dans (12.1) et regroupons les en fonction des puissances d :
(x20 x0 ) + [(2x0 1)x1 + 1]  + (x21 + 2x0 x2 x2 )2 + ... = 0 (12.3)
Le membre de droite de lquation ci-dessus est un polynme en  et il est uniformment
nul. Nous en dduisons donc que tous les coefficients du polynme doivent tre nuls,
cest dire :
x20 x0 = 0 (12.4)
(2x0 1)x1 + 1 = 0 (12.5)
x21 + 2x0 x2 x2 = 0 (12.6)
... = 0
0
Lquation (12.4), donne par le coefficient de  et appel le terme dordre zro, est
notre quation originale non perturbe que nous savons rsoudre. lquation (12.5) nous
donne x1 :
x1 = 1/(1 2x0 )
Comme nous connaissons dj x0 , nous dterminons facilement que x1 = 1 ou 1.
Lquation (12.6) nous dtermine le coefficient x2 :
x21
x2 =
1 2x0
et donc x2 = 1 ou 1. Nous pouvons continuer ainsi (cela dpend de notre patience) et
trouver les coefficient xn . Ce que nous devons remarquer est que : (i) pour dterminer
xk , nous navons que besoin des xk1 , xk2 , ... (ii) lquation qui dtermine xk est
linaire en xk , cest dire ne comporte que des puissances unit de xk . Cest deux
points nous permettent assez aisment de calculer la solution aussi prcisment que
lon souhaite. Nous avons donc, pour les deux racines de lquation (12.1),
X1 = 0 +  + 2 + ... (12.7)
2
X2 = 1   + ... (12.8)
Dans ce cas prcis, nous connaissons la solution exacte

1 1 4
X=
2
Un dveloppement de Taylor de cette dernire nous rassure sur lexactitude des rsul-
tats (12.7,12.8).

175
12 Calcul des perturbations.

Gnralisation. Nous pouvons gnraliser lapproche ci-dessus, sans la formaliser


plus : on cherche la solution dun problme avec perturbation comme un dveloppe-
ment en puissance de la perturbation. Il faut alors que les coefficients de chaque puis-
sance de la perturbation soit nulle. Le mieux reste encore dillustrer cela travers des
exemples.

Recherche des valeurs propres dune matrice symtrique. Supposons que nous
connaissons une valeur et un vecteur propre dune matrices symtrique, cest dire
que nous connaissons un scalaire 0 et un vecteur 0 tel que A0 = 0 . Une matrice
symtrique par dfinition est gale sa transpose AT = A. Nous cherchons la valeur
propre proche de 0 de la matrice A + B. Appelons cette valeur propre . On cherche
donc rsoudre
(A + B) = (12.9)
Procdons comme nous lavons mentionn plus haut. Nous chercherons la solution
sous la forme

= 0 + 1 + ... (12.10)
= 0 + 1 + ... (12.11)

et nous cherchons dterminer 1 , ... et 1 , ... En injectant (12.10-12.11) dans (12.9),


nous avons :

(A + B)(0 + 1 + ...) = (0 + 1 + ...)(0 + 1 + ...)

et en regroupant les termes en puissance de , nous trouvons les quations suivantes :

A0 = 0 0 (12.12)
A1 + B0 = 0 1 + 1 0 (12.13)
... = ...

La premire quation, cest dire les terme dordre 0 en , ne nous rapporte bien sr
rien que ne lon connaisse dj. Dans lquation (12.13), nous avons deux inconnus, le
vecteur 1 et le scalaire 1 dterminer. Prenons le produit scalaire des deux cts par
le vecteur 0 :

(0 , A1 ) + (0 , B0 ) = 0 (0 , 1 ) + 1 (0 , 0 ) (12.14)

Nous avons suppos que A est symtrique. Donc,

(0 , A1 ) = (AT 0 , 1 ) = (A0 , 1 ) = 0 (0 , 1 )

et en injectant ce rsultat dans (12.14), nous aboutissons finalement

1 = (0 , B0 )/(0 , 0 )

176
12 Calcul des perturbations.

Nous connaissons donc la correction dordre 1 la valeur propre.


Si tout cela parat un peu abstrait, cherchons la valeur propre de la matrice
 
1+ 2
2 2 + 3

Cette matrice est la somme dune matrice diagonale A = diag(1, 2) et de la matrice


B tel que Bij = (i + j 1). La matrice B est la perturbation si on suppose   1.
La matrice A possde bien sur les deux valeurs propres 1 et 2 et les vecteurs propres
associs (1, 0) et (0, 1). Cherchons la valeurs propre proche de 1 de la matrice perturbe.
Daprs ce que nous avons dit, nous devons calculer (1, 0)B(1, 0)T :
  
 2 1
(1, 0). =
2 3 0

Comme (1, 0)(1, 0)T = 1, la valeur propre proche de 1, lordre 1 en , scrit

=1+

Le lecteur peut chercher directement la valeur propre de la matrice perturbe et vrifier


le rsultat ci-dessus. Bien sr, quand la matrice est plus grande que 2 2, la recherche
directe peut tre extrmement fastidieuse.

La stabilit dun systme diffrentiel. Nous connaissons parfois un point fixe


dune quation, et nous souhaitons savoir si ce point est stable ou non. Par exemple, le
point le plus bas pour un pendule est un point fixe stable, tandis que le point le plus
haut est un point instable. Intuitivement, pour connatre la stabilit, nous cartons un
peu le systme de son point fixe. Si le systme revient son point de dpart ou reste
proche, lquilibre est stable. Si au contraire, la perturbation tende grandir, le point
est alors instable.
Considrons lquation du mouvement dun pendule amorti


+ + 2 sin = 0 (12.15)

o est langle avec laxe vertical et = 0 correspond au point le plus bas. Il est
vident que les points = 0 et = sont les points fixes de cet quation. Supposons
maintenant que nous partons trs proche du point = 0, cest dire avec la condition
initiale (t = 0) = . Cherchons comme dhabitude la solution sous forme de =
0 + 1 + ... En ralit, comme nous nous intressons qu la stabilit, le terme dordre
1 en  nous suffit. En injectant cette solution dans (12.15) et en dveloppant la fonction
sin, nous trouvons :

1 + 1 + 2 1 = 0

177
12 Calcul des perturbations.

la solution gnrale de cette dernire est de la forme 1 = exp(t) exp(i 0 t) et elle


tend effectivement vers 0 quand t . Le point = 0 est donc un point stable. En
rptant les mme oprations pour le point = , et en noubliant pas que sin(+x) =
sin x, nous aboutissons

1 + 1 2 1 = 0
et cette fois, il est claire que quand t , 1 . Le point = est donc instable.

12.2 Les perturbations singulires.


Nous avons suppos, lors de ltude des perturbations singulires, que la solution
perturbe est proche de celle non perturbe. Cela nest pas toujours le cas et lajout
dun petit terme peut radicalement changer la solution. Prenons le cas de lquation
algbrique
x2 + x 1 = 0 (12.16)
La solution non perturbe, i.e. pour  = 0 vaut x = 1. La solution exacte pour  6= 0
scrit
1 1 + 4
x=
2
et un petit dveloppement nous montre que les racines sont, pour   1, de la forme

x1 = 1
1
x2 =

Nous avons donc lapparition dune nouvelle racine qui est dautant plus grande que la
perturbation est petite. Cela est un phnomne gnrale : chaque fois que la pertur-
bation est sur un terme dordre suprieur, la perturbation est singulire. Il existe parfois
des changements de variable qui rendent la perturbation rgulire. Par exemple, dans
lquation (12.16), en posant x = 1/y, nous avons

y2 y  = 0

qui peut se traiter par la mthode habituelle. Daprs notre traitement de (12.1), ses
solutions sont

y1 = 
y2 = 1+

qui nous redonne bien les racines en x = 1/ et x = 1 .


La mme remarque sapplique aux quations diffrentielles. Lquation

x + x + 1 = 0

178
12 Calcul des perturbations.

est celle dun oscillateur harmonique amortie. Si la masse  est nulle, la solution est
de la forme x = A exp(t). Si la masse est non nulle, la solution, lordre le plus
important en , est de la forme A exp(t) + B exp(t/) et le lecteur peut vrifier
que les deux solutions sont radicalement diffrentes. Remarquons nouveau que nous
pouvons chercher un changement de variable de la forme t = p t0 et x = q y qui
rendrait la perturbation rgulire. Nous en laissons le soin au lecteur intress.
Lennui avec les quations diffrentielles est que les termes les plus inoffensifs peuvent
rendre les perturbations singulires. Considrons lexemple de loscillateur suivant :

x + 2 x + x3 = 0 (12.17)

ceci est lquation dun mobile dans un potentiel en kx2 + k 0 x4 . La solution gnral
de lquation non perturbe est a cos(t + ). Sans perte de gnralit, on supposera
= 0. Nous cherchons alors la solution de lquation perturbe sous forme de x(t) =
a cos(t) + x1 (t) + ... En injectant dans lquation et en collectant les termes dordre
1 en  , nous trouvons que

x1 + 2 x1 = a3 cos3 (t) (12.18)

Or, cos3 (u) = (1/4) cos(3u) + (3/4) cos(u) et donc la solution de (12.20) est donne
par la somme de la solution des deux quations suivante :

x1 + 2 x1 = (a3 /4) cos(3t) (12.19)


x1 + 2 x1 = (3a3 /4) cos(t) (12.20)

La premire quation ne prsente pas de danger : cest lquation dun oscillateur har-
monique de frquence propre force la frquence 3 et possde une solution du
genre cos(3t + ).
Par contre, la deuxime quation (12.20) est celle dun oscillateur harmonique de
frquence propre force justement . Il y a donc rsonance et la solution, qui est
de la forme t cos(t + ), va devenir trs large. Cela viole notre hypothse de dpart
sur les dveloppements en puissance d. Nous avions crit

x(t) = a cos(t) + x1 (t) + ...

en supposant x1 (t) borne, de faon ce que x1 (t) reste toujours petit par rapport
la solution non perturbe a cos(t). Or, nous voyons quau bout dun temps t > 1/,
le soit disant petit terme devient en faite le terme dominant.
Il existe de nombreux types diffrents de perturbations singulires et au moins autant
de faons de les traiter. Lobjet de ce livre ntant pas un cours dtaill sur le calculs
de perturbations, nous nous en tiendrons presque l. Nous trouvons cependant utile
de montrer comment traiter les cas similaires lexemple ci-dessus. La technique est a
appele limination des termes sculaires ou rsonnants.

179
12 Calcul des perturbations.

0.5

-0.5

-1
0 5 10 15 20 235 240 245 250 255

Figure 12.1 sin(t) (en noir) et sin(1.01t) (en rouge) pour les temps courts et longs.

Le traitement des termes sculaires.


La perturbation que nous avons considre plus haut intervient dans pratiquement
tous les problmes doscillations, et cest pourquoi il nous semble important de la traiter.
En regardant de plus prs lquation (12.17), nous voyons quil ny a rien danormal ou
de divergent. Elle dcrit simplement des oscillations au fond dun puits peut tre un
peu plus raide quun puits harmonique et il ny a aucune raison que quelque chose
diverge. Lerreur ne peut venir que de notre traitement. En supposant que la solution
scrit sous la forme a cos(t) + x1 (t), nous avons fait lerreur de penser que le terme
dordre 0 continue prsenter une oscillation frquence . Il ny a aucune raison
pour cela, et la frquence peut galement tre de la forme + 1 + ... La figure (12.1)
montre la diffrence entre sin(t) et sin(1.01t) pour les temps infrieurs vingt et pour
les temps autour de 250. Nous voyons que la diffrence est peine perceptible pour
les temps courts, tandis que les deux fonctions nont plus rien voir aux temps longs.
Ce problme avait t observ dabord en astronomie, o les calculs perturbatifs des
sicles prcdents commenaient scarter des observations (do le terme sculaire).
Lindstedt (vers 1880) a remdi ces carences par sa technique de renormalisation qui
est de chercher la solution sous la forme
x(t) = a cos[( + 1 )t] + x1 (t) (12.21)
En injectant la forme (12.21) dans (12.17) et en collectant les termes dordre 1 en , nous
trouvons cette fois
x1 + 2 x1 2a1 cos[(+1 )t] = (a3 /4) cos[3(+1 )t](3a3 /4) cos[(+1 )t]
Il nous suffit maintenant de choisir
3a2
1 =
8
pour liminer le terme rsonnant. La solution perturbative lordre 1 scrit alors :
3a2 3a2
x(t) = a cos[( +  )t] + A cos[3( +  )t + ]
8 8

180
12 Calcul des perturbations.

o les coefficients a, A, sont dtermins partir des conditions initiales.

Exercices.
Racine des polynmes.
an xn un polynme dont une des racines, x0 est connue, cest dire
P
12.1 Soit P (x) =
P (x0 ) = 0. Soit le polynme P 0 (x) = P (x) + xp . Soit x0 la racine proche de x0 de ce dernier.
Montrer qu lordre 1,
xp0
x0 = x0 P 
nan xn1
0

12.2 Pouvez vous exhiber la correction lordre 2 ?


12.3 Soit lquation
x6 4x5 + 3x4 6x2 + 6x + 1 = 0 (12.22)
4
Nous remarquons quen crivant par exemple le coefficient de x comme 2 +  (o  = 1), la
somme des coefficients de lquation non perturbe vaut 0. x = 1 est donc une solution de
lquation non perturbe (i.e. pour  = 0). Calculez la correction cette racine lordre 1 en 
et comparez la solution exacte x = 1.10565. Et si au lieu du coefficient du x4 , nous avions
choisit un autre terme, quaurait on obtenu ?
12.4 Calculer la correction lordre 2. Pouvez vous alors trouver un critre pour le choix du
coefficient pour que la correction lordre 1 soit la meilleure ?

quation transcendante. Une quation transcendante est une quation qui fait in-
tervenir des fonctions non-algbriques, comme par exemple x sin x = cos x. Il est fr-
quent de rencontrer ces quations en physique.
12.5 x log x = 0 admet une solution pour x = 1. Calculez, lordre 3, la racine proche de
1 de lquation x log x = . Comparez la solution exacte 1.09557 pour  = 0.1. Pouvez-vous
utiliser la mme approche pour trouver la solution proche de 0 ?
12.6 Trouver la racine, proche de , de x sin x = . Comparez, pour  = 0.1, la solution
exacte x = 3.10943.

quation intgrale. Nous avons rencontr les quations intgrales lors de notre dis-
cussion des fonctions de Green. Nous allons tudier ci-dessous un schma itratif de
leurs rsolution. Cependant, ces schmas sont en gnral extrmement fragiles, et il
faut toujours sassurer de leur convergence.
12.7 Une quation intgrale de Fredholm de deuxime espce est de la forme
b
f (x) = g(x) + K(x, x0 )f (x0 )dx0
a

Proposez un schma de rsolution par le calcul des perturbations. Ne vous contentez pas de
lordre 1. Trouvez la perturbation dordre n en gnral.

181
12 Calcul des perturbations.

12.8 Profitez pour exhiber la solution exacte de



f (x) = 1 + e(x+y) f (y)dy
0

En calculant les perturbations tout ordre et en sommant la srie ainsi obtenue.

12.9 Faites la mme chose pour


x
f (x) = 1 + f (y)dy
0

Attention, les bornes de lintgrale dpendent de x. On appelle ces quations Voltera de deuxime
espce.

Stabilit linaire : Croissance des bactries. Lquation de croissance de bact-


ries, connue comme lquation logistique, est la suivante :

dc
= ac bc2 (12.23)
dt
o c(t) est la concentration de bactrie au temps t, a le taux de croissance et b un
coefficient quon appel de saturation. a et b sont des constantes > 0.
12.10 Trouver les deux solutions stationnaires de lquation (12.23).

12.11 En utilisant le calcul des perturbations autour de ces deux solutions, dmontrer quune
est instable, tandis que lautre est stable.

12.12 Sans faire aucun calcul et en vous servant des rsultats ci-dessus : tracer lallure gnrale
de la solution si on utilise la condition initial c(t = 0) =   a/b. Expliquer votre interprtation.

Stabilit linaire : traitement gnral. Soit lquation diffrentielle

dy
= y + f (y) (12.24)
dt
o f est une fonction quelconque. Nous supposons que cette quation possde un point
stationnaire ys tel que
ys = f (ys )
12.13 En considrant les perturbations lordre 1, discuter la stabilit de ce point en fonction
de la valeur de f 0 (ys ).

12.14 Soit les fonction f (y) et y telles que montres dans la figure (12.2). Comme nous
pouvons le voir, lquation diffrentielle (12.24) possde dans ce cas trois solutions stationnaires.
Daprs votre analyse prcdente, lesquelles sont stables et lesquels instables ?

182
12 Calcul des perturbations.

Figure 12.2 Exemple de la fonction f , utilise pour raliser des mmoires biochi-
miques.

Oscillateur de Van der Pol. Van der Pol a propos lquation suivante dans les an-
nes 1920 pour modliser les oscillateurs auto-entretenus comme le battement de cur

x + (x2 1)x + 0 x = 0

Le coefficient du terme x est quivalent un frottement. Nous voyons quil est ngatif si
lamplitude x est petite (< 1), cest dire que le systme reoit de lnergie de lextrieur,
ce qui va lamener augmenter son amplitude. Par contre si lamplitude devient trop
grande (> 1) le frottement devient positif et le systme perd de lnergie vers lextrieur,
ce qui va diminuer son amplitude. Nous voyons que le systme maintient une oscillation
stable quelque soit les conditions de dpart.
12.15 Montrer que le point fixe x = 0 est instable.

12.16 En partant de la solution non perturbe x = a cos 0 t, montrez que les perturbations
rgulires gnrent des termes rsonnants.

12.17 Utilisez la renormalisation de Lindstedt pour liminer les termes rsonnants. Pour cela,
chercher la solution sous forme de

x(t) = a cos t + x1 (t)

o = 0 + 1 . Vous pouvez apercevoir que llimination des termes rsonnants impose une
condition sur lamplitude de loscillation, ce que lon appelle un cycle limite.

cosystme de prdateursproies. Une des interactions fondamentales en colo-


gie est celle des prdateurs et des proies. Le premier modle pour la dynamique de ces
deux populations a t propos par Lotka et Voltera au dbut des annes 1930. Soit P le
nombre des prdateurs et N le nombre des proies dans lcosystme. Lotka et Voltera
ont propos

dN/dt = N N P (12.25)
dP/dt = N P P (12.26)

183
12 Calcul des perturbations.

est le taux de croissance naturel des proies en labsence des prdateurs. La pr-
sence des prdateurs cause galement la disparition des proies, proportionnellement au
nombre de prdateur et de proie, do le terme en N P dans la premire quation,
tant lefficacit de la chasse. Dans lquation qui rgit la dynamique des prdateurs,
nous voyons que la croissance est fonction du nombre de proie disponible, et le terme
est le taux de mort naturel des prdateurs.
12.18 Montrez que ce systme possde un point fixe, cest dire des valeurs N0 , P0 pour
lesquels dN/dt = dP/dt = 0.

12.19 tudiez la solution de ce systme pour les faibles carts au point fixe. Cela veut dire que
nous prenons des conditions initiales du genre N (t = 0) = N0 +  et P (0) = P0 . Cherchez la
solution sous la forme N (t) = N0 + N1 (t) et P (t) = P0 + P1 (t), et en collectant les termes
dordre 1 en , obtenez un systme linaire pour N1 et P1 . Rsolvez ce systme et dduisez
galement la forme du cycle limite, cest dire N1 en fonction de P1 .

12.20 Poussez les calculs lordre 2 en  et tudiez lapparition dharmonique suprieurs.

12.21 Vous pouvez galement remarquer que le cycle limite peut sobtenir en divisant direc-
tement (12.25) par (12.26) et en rsolvant lquation diffrentielle du premier ordre. Comparez le
rsultat de ce calcul au rsultat de la question 12.19.

quation de Riccati. Nous souhaitons rsoudre, par le calcul des perturbation au


premier ordre de , lquation diffrentielle de Riccati,

dv
+ v 2 + 2 + b(t) = 0 (12.27)
dt
Cette quation se rencontre quand nous essayons de rsoudre les quations diffren-
tielles linaire de second ordre coefficients variables comme par exemple lquation
de Mathieu
d2 u
+ 2 +  b(t) u = 0

(12.28)
dt2
que nous avons dj tudi en cours pour le cas particulier de lquation de loscilla-
teur paramtrique. On transforme en gnral lquation (12.28) en lquation (12.27) en
effectuant le changement de fonction u(t) = exp (V (t)) o V 0 (t) = v(t).
12.22 Vrifier que la solution de lquation diffrentielle
du
+ a(t)u = b(t) ; u(0) = u0
dt
est  t 
u(t) = eA(t) u0 + eA( ) b( )d (12.29)
0

o A0 (t) = a(t) et A(0) = 0.

184
12 Calcul des perturbations.

12.23 Vrifier que la lquation diffrentielle


dv
+ v 2 + 2 = 0 ; v(0) = 0 (12.30)
dt
possde la solution
v(t) = tan (t)

12.24 Soit lquation


dv
+ v 2 + 2 + b(t) = 0
dt
En crivant la solution lordre 1 sous la forme de

v(t) = v0 (t) + v1 (t)

o v0 est la solution de lquation (12.30), obtenir lquation diffrentielle qui gouverne v1 (t).
Rsoudre lquation sur v1 , avec la condition initiale v1 (0) = 0, en utilisant le rsultat (12.29).

12.25 Trouver la solution explicite lordre 1 dans le cas b(t) = 2 tan(t).

12.26 Quelle est la limitation du calcul et la limite de validit du calcul lordre 1 dans le cas
gnral ?

Stabilit dinterface. Soit une interface u(x, t) (par exemple entre solide et liquide
lors de la coule continue en mtallurgie) dcrite par lquation

u 2u 4u
= au bu3 + c 2 d 4
t x x
o nous supposons les coefficients a, b, d > 0.
12.27 Discuter la stabilit linaire de la solution u(x, t) = 0 selon que c est positif ou ngatif
et chercher les seuils dinstabilit.

185
13 Les oprateurs diffrentiels.
La plupart des phnomnes physiques sont dcrits par des quations diffrentielles
qui impliquent des oprateurs diffrentielles. On rencontre souvent les gradients, rota-
tionnelles, divergences et laplaciens et le fait que lespace dans lequel vivent les phy-
siciens ait trois dimensions a peut-tre favoris leurs usages au dpend dautres for-
mulations plus symtriques 1 . Fondamentalement, ce sont des oprateurs de drivation
et nous allons nous attacher dans ce chapitre tudier leurs significations et tablir
leurs expressions dans divers systmes de coordonnes.

13.1 Mtrique et Systme de coordonnes.


Nous reprons les points dans lespace laide dun systme de coordonnes. Par
exemple, pour un espace trois dimensions, nous associons un triplet (q1 , q2 , q3 )
chaque point P de lespace. Cet acte fondateur nous permet de ramener la gomtrie,
science des relations entre points de lespace, dans le domaine de lanalyse et y appliquer
toute la puissance de feu dont on y dispose.
Les points de lespace ont une existence propre, indpendamment de la reprsenta-
tion en triplet que lon utilise. Que le triplet quon utilise soit les coordonnes cart-
siennes ou polaires ne change pas le point P ni (soulignons mentalement deux fois ce
ni) la distance de ce point un autre. Si la distance entre deux points est 1 mm, cela ne
doit pas dpendre du systme de coordonnes cartsienne ou polaire que nous avons
choisi. Supposons que nous avons repr un point P par le triplet (q1 , q2 , q3 ) et le point
infinitsimalement voisin P + dP par le triplet (q1 + dq1 , q2 + dq2 , q3 + dq3 ). Notons ds
la distance entre P et P +dP . La relation entre la distance ds et le triplet (dq1 , dq2 , dq3 )
dfinit la mtrique du systme de coordonnes. Nous nous contenterons par la suite de
systmes de coordonnes orthogonales (cartsien, polaire, cylindrique,...) pour lesquels,
de faon gnral, nous avons :
ds2 = h21 dq12 + h22 dq22 + h23 dq32 (13.1)
Les quantits h1 , h2 , h3 dpendent en gnral des coordonnes qi . On les appelle les
lments du tenseur mtrique 2 . Il est vident que si pour un certain dplacement, nous
1. Voir le chapitre sur les formes diffrentielles
2. Dans le cas le plus gnral, llment de distance curviligne scrit
X
ds2 = hi,j dqi dqj
i,j

186
13 Les oprateurs diffrentiels.

avons dq2 = dq3 = 0, alors ds = h1 dq1 tout simplement.

Coordonnes cartsiennes. On le note souvent par le triplet (x, y, z). Cest le plus
simple des systmes, pour lequel h1 = h2 = h3 = 1.

Coordonnes polaires. On le note souvent (r, , z). Comme dans ce systme,

ds2 = dr2 + r2 d2 + dz 2

nous avons h1 = 1, h2 = q1 = r et h3 = 1.

Coordonnes sphriques. On le note souvent (r, , ). Ici

ds2 = dr2 + r2 sin2 d2 + r2 d2

et donc h1 = 1, h2 = q1 sin q3 = r sin , h3 = q1 = r.

Coordonnes semi-paraboliques. On le note souvent (, , z). Ce systme est reli


au cartsien par les relations

x = ; y = ( 2 2 )/2 ; z = z

Dmontrez que les lments du tenseur mtrique sont h1 = h2 = 2 + 2 , h3 = 1.

Coordonnes paraboliques. On le note souvent (, , ), reli au systme cartesien


par
x = sin ; y = cos ; z = (1/2)( 2 2 )
Trouvez les lments du tenseur mtrique.
13.1 En coordonnes cartsienne, la surface qi = Cte est un plan. Donnez des dfinitions
analogues pour les autres systmes de coordonnes.

En ralit, la dmarche est la suivante : une fois que nous avons un systme de coor-
donnes (q1 , q2 , q3 ), cest la donne du tenseur mtrique qui nous indique quel est ce
systme, o mme plus, si lespace est plat ou courb (mais ceci est une autre histoire).

et la matrice H dont les lmnts sont les hi,j sappelle le tenseur mtrique. Dans le cas des coordonnes
curvilignes orthogonales, les lments non-diagonaux sont nulles et ds2 peut scrire sous la forme plus
simple de 13.1.

187
13 Les oprateurs diffrentiels.

13.2 Nabla, div et les autres.


Les oprateurs diffrentielles ont tous un sens gomtrique (disons mme plus, phy-
sique). Ce ne sont pas juste des rgles de drivation du genre 1 E2 2 E1 . Si on connat
ce sens, on peut comprendre le sens profond de lquation qui les contient. Par ricochet,
il devient trs facile de dduire leurs expressions dans nimporte quel systme de coor-
donnes. Cest ce quoi nous allons nous attacher par la suite. Notons quand mme que
ces oprateurs ne sont pas si dissemblable quil ny parat et tous relient, dune faon
ou dune autre, un flux travers un point, un circuit ou une surface ferme une int-
grale. Ds la fin du dix-neuvime sicle, cette similitude a amen E. Cartan inventer
la notion de formes diffrentielles qui unifie tous ces oprateurs, qui ne sont alors que
lexpression dune opration de drivation (quon appelle extrieure). Ces formes dune
lgance extraordinaire font lobjet dun autre chapitre. Ici, nous nous attacherons
une introduction classique de ces oprateurs.

13.3 Le gradient.
Soit la fonction f (P ) qui a chaque point de lespace associe une quantit. Le nom
savant de cela est un champ scalaire. Cela peut tre une densit , un potentiel, ... Nous
sommes intresss par savoir de combien cette fonction change si on passe du point
P au point voisin P + ds. Le gradient est la quantit physique qui nous donne cette
information :
df = f (P + ds) f (P ) = gradf.ds (13.2)
gradf quon note galement f est un vecteur dont le produit scalaire avec le dpla-
cement ds donne la variation de f . Ceci est la dfinition du gradient. f priori dpend
du point P . Notez que jusque l, nous avons exprim la variation indpendamment du
systme de coordonnes choisi pour reprer les points de lespace. Une quantit phy-
sique ne doit jamais dpendre du systme de coordonnes et sa dfinition doit toujours
tre donne de faon intrinsque, indpendemment des coordonnes. Quand en mca-
nique, nous crivons F = md2 r/dt2 , ceci est une relation qui est valable quelque soit
le systme de coordonnes. La mme chose sapplique aux oprateurs diffrentiels que
nous utilisons en physique.
videment, une fois que nous avons exprim les choses de faon intrinsque, il faut
ensuite faire le boulot et calculer la trajectoire, les lignes du champ, les isopotentiels,...Pour
cela, nous devons choisir un systme de coordonnes. Donc, nous avons besoin dex-
primer f dans un systme de coordonne, celui qui convient le mieux au problme
considr. Supposons que le point P est repr par (q1 , q2 , q3 ) et le point voisin par
(q1 + dq1 , q2 , q3 ). Alors df = f (q1 + dq1 , q2 , q3 ) f (q1 , q2 , q3 ) = (f /q1 )dq1 . Le
membre de droite de lquation(13.2) vaut

(f )1 h1 dq1

188
13 Les oprateurs diffrentiels.

o (f )1 est la composante du gradient dans la direction 1. Ceci nous donne (f )1 =


(1/h1 )(f /q1 ). En refaisant la mme opration pour les trois coordonnes, on ob-
tient :  
1 f 1 f 1 f
f = , ,
h1 q1 h2 q2 h3 q3
Exemple 13.1 En coordonnes cartsiennes, nous avons f = (f /x, f /y, f /z).
En coordonnes polaires, f = (f /r, (1/r)f /, f /z).

Exercices.
13.2 Donner lexpression du gradient dans les autres systmes de coordonnes.

13.3 crire lexpression gnral du gradient dans lespace n dimensions.

La seule connaissance du tenseur mtrique nous permet de donner lexpression du


gradient dans le systme de coordonnes en question. Nous allons suivre la mme d-
marche pour tous les autres oprateurs diffrentiels.
Notons galement que la dfinition (13.2) donne la direction selon laquelle le champs
f varie le plus rapidement. A ds fixe, cest la direction donne par f qui donne la
variation la plus importante.
Un corollaire important de cela est que le vecteur gradient est perpendiculaire aux
surfaces de niveau. Une surface de niveau est lensemble des points sur lesquels f est
constante. Si f est une fonction de n variables, f (x1 , ...xn ) = Cte est une (hyper)
surface de dimension n 1. Un dplacement ds perpendiculaire au vecteur gradient
ne change pas ( lordre 1 en ds) la valeur de f ce qui implique que le gradient est
perpendiculaire la surface.

13.4 Champ de vecteurs.


Les quantits que lon utilise en physique ne sont pas toutes scalaires comme la den-
sit ou le potentiel V . Certaines quantits comme le champs lectrique E ou la vitesse
dun flot J sont des quantits vectorielles. Nous supposons ici connu la notion de champ
de vecteur, le lecteur intress par plus de dtails et de rigueur pourrait se reporter au
cours traitant les varits diffrentiables. Pour visualiser un champ de vecteur, il suffit
de choisir un ensemble de points reprsentatifs, souvent rgulirement espacs, et de
montrer par une flche le vecteur associ ces points.
Les lignes de champs sont faciles imaginer. En chaque point P , la tangente la
ligne de champs est donne par le champ en ce point. Les lignes de champs de la figure
13.1a sont des droites passant par lorigine, tandis que les lignes de champs de la figure
13.1b sont des cercles centrs sur lorigine. Le calcul des lignes de champs est lmen-
taire daprs ce que nous venons de dire. Supposons que nous utilisons les coordonnes
(q1 , q2 , q3 ) et chaque point q = (q1 , q2 , q3 ) de lespace nous avons associ le vecteur

189
13 Les oprateurs diffrentiels.

2 2

1 1

0 0

1 1

2 2
2 1 0 1 2 2 1 0 1 2
(a) (b)
Figure 13.1 Reprsentation des champs de vecteurs (fx = x, fy = y) et (fx =
y, fy = x). Une flche en un point reprsente la valeur du vecteur
f en ce point.

(f1 (q), f2 (q), f3 (q)). Soit une ligne de champ que nous paramtrons par la variable
t. Cela veut dire que nous dfinissons la ligne par trois fonctions q1 (t), q2 (t), q3 (t).
Daprs ce que nous venons de dire, nous devons avoir

dqi /dt = fi i = 1, 2, 3

ou encore, en regroupant les trois expressions,

dq1 dq2 dq3


= =
f1 f2 f3
Nous avons crit ces expressions pour un espace trois dimensions, mais cela peut
sappliquer nimporte quelle dimension.
Exemple 13.2 Soit, deux dimensions, f1 = q1 et f2 = q2 . Les quations des lignes
de champs sont dq1 /dt = q1 et dq2 /dt = q2 . La solution est q1 = q2 , o est une
constante. Si (q1 , q2 ) dsigne les coordonnes cartsiennes, alors ceci est une famille
de droite passant par lorigine, cest dire les lignes de champs de la figure 13.1a.

Exemple 13.3 Soit, deux dimensions, f1 = 0 et f2 = q1 . Les quations des lignes


de champs sont dq1 /dt = 0 et dq2 /dt = q1 . La solution est q1 = , q2 = t o
est une constante. Si (q1 , q2 ) dsigne les coordonnes polaires , alors ceci est une
famille de cercles centrs sur lorigine, cest dire les lignes de champs de la figure
13.1b.

190
13 Les oprateurs diffrentiels.

curl f
n
f

C
P

Figure 13.2 Le champ f ,sa projection sur le circuit C entourant le point P , la normale
la surface n et le rotationnel not f ou curl f .

13.5 Le rotationnel.
La distinction entre les figure 13.1a et b saute aux yeux : dans le premier, les lignes
de champs ne se referment pas sur elles mmes, dans le deuxime, toutes les lignes se
referment sur elle mme. Dans le premier, les lignes de champs sont comme provenant
dune source lorigine, dans le deuxime au contraire, aucune source ne saute au yeux
priori. Cest cela que loprateur rotationnel, que lon note rot ou parfois ( ou
curl dans la littrature anglo-saxonne ) mesure localement. Prcisons les choses.
Soit un champ f . Considrons un point P et un circuit infinitsimal C autour
de ce
point. Si la projection des lignes de champ de f sur C se referme, alors IC = C f .ds 6=
0. Le rotationnel est loprateur qui quantifie lamplitude de IC . Il y a cependant un
petit dtail rgler : la direction du circuit C a autant dimportance que sa taille. Soit
An le vecteur porteur du circuit C, A tant laire de la surface enclose par C et n le
vecteur unitaire perpendiculaire C, alors nous dfinissons f telle que

An. f = f .ds (13.3)
C

191
13 Les oprateurs diffrentiels.

lordre 1 en A (voir note 3 ). Si vous naimez pas le travail avec les lments infinit-
simaux (quoiquils aient une existence mathmatiquement lgitime depuis les annes
1960), vous pouvez utilisez la dfinition

1
n. f = lim f .ds (13.4)
A0 A C

o A est la surface entoure par la courbe C.


Comme vous le savez probablement, le rot nest pas un vrai vecteur, mais un pseudo-
vecteur. En faite, on ne peut donner un sens vectoriel au rotationnel que dans lespace
trois dimensions. Nous verrons le sens gnral du rotationnel dans le chapitre consa-
cr soit aux tenseurs, soit aux formes diffrentielles. Nous continuerons de les traiter
classiquement dans ce qui suit.
Une fois que nous avons dfini le rotationnel de faon (eq.13.3), nous pouvons nous
en servir pour lcrire dans nimporte quel systme de coordonnes. Soit le systme
(q1 , q2 , q3 ) et le champs f = (f1 , f2 , f3 ) dfini dans ces coordonnes : fi = fi (q1 , q2 , q3 ).
Considrons un petit circuit autour du point P , dans le plan (q2 , q3 ).
Sur la partie P A, notre intgrale vaut (nous omettons dcrire la variable q1 qui ne

3. Prcisons quelques notions sur les approximations. Supposons que nous pouvons approximer une
fonction autour dun point x par son dveloppement de Taylor :
0 00
= f (x + h) f (x) = f (x)h + (1/2)f (x)h2 + ...
0
Quand on dit qu lordre 1 en h, vaut f (x)h, cela veut dire que
1 0
lim = f (x)
h h0
Concrtement, cela veut dire que nous nous intressons aux trs petits h (infinitsimaux) et le premier terme
de lapproximation est amplement suffisant. De faon plus formelle, nous pouvons crire
0
= f (x)h + o(h)
o o(h) regroupe tous les termes qui sont ngligeable devant h quand h 0 :
1
lim o(h) = 0
h h0
Si nous avons une ide prcise des termes que lon nglige (comme cest le cas ici) on peut crire
0
= f (x)h + O(h2 )
o O(h2 ) veut dire que le plus grand terme que nous avons nglig est au mieux de lordre de h2 :
1
lim O(h2 ) = Cte <
h2 h0
Pour simplifier, par o(h) il faut entendre trs petit devant h et par O(h) de lordre de h. Les symboles o et
O sont appels les symboles de Landau, du nom du mathmaticien allemand Edmund Landau (et non du phy-
sicien sovitique Lev Landau). Ils permettent une grande rigueur et concision dans lcriture des expressions
impliquant des limites.

192
13 Les oprateurs diffrentiels.

3
B

C
2
A

P 1

Figure 13.3 un petit circuit autour du point P = (q2 , q3 ), o A = (q2 + a, q3 ), B =


(q2 + a, q3 + b) et C = (q2 , q3 + b). Noter que le circuit est dans le plan
(q2 , q3 ) et perpendiculaire laxe q1 .

varie pas), lordre 1 en a


f2 (q2 , q3 )h2 (q2 , q3 )a (13.5)
et sur la partie BC
f2 (q2 , q3 + b)h2 (q2 , q3 + b)a
et la somme de ces deux parties nous donne

[h2 f2 ] ab
q3
Par le mme mcanisme, lintgration sur la partie AB et CP nous donne

[h3 f3 ] ab
q2
La partie gauche de leq.(13.3) est par ailleurs, lordre le plus bas en a, b : h2 h3 ab (rot f )1 ,
ce qui nous donne, enfin,
 
1 (h3 f3 ) (h2 f2 )
(rot f )1 = (13.6)
h2 h3 q2 q3
Les autres composantes se trouvent facilement par une permutation circulaire de (1, 2, 3).
Exemple 13.4 En coordonnes polaire (r, , z), h1 = h3 = 1, h2 = r. Nous avons
donc
 
1 fz (rf )
(rot f )r =
r z
 
fr fz
(rot f ) =
z r
 
1 (rf ) fr
(rot f )z =
r r
13.4 Donnez lexpression du rotationnel en coordonnes sphrique et parabolique.

193
13 Les oprateurs diffrentiels.

Gnralisation. Quand on se trouve dans lespace trois dimensions, nous pouvons


caractriser une surface plane par le vecteur orthogonal celle-ci. Dans le cas gnral,
ceci nest pas possible et il faut indexer les composants du rotationnel par deux indices
dsignant le plan qui contient le circuit sur lequel nous avons effectu lintgral. Ainsi,
nous aurions d noter lexpression (13.6) en ralit
(rot f )2,3 = ...
o lindice (2, 3) implique que le circuit C se trouvait dans le plan x2 , x3 . A quatre
dimensions par exemple, le rotationnel contient 6 composantes (et n(n 1)/2 n di-
mensions). Dans lespace-temps par exemple, le rotationnel dun vecteur quon appelle
potentiel vecteur possde 6 composantes : les trois o les circuits contenaient une
dimension temporelle sont appels champ magntique et les trois qui ne contiennent
que des dimensions spatiales sont appel champ lectrique. 4

13.6 La divergence.
Le travail dun comptable est de faire le bilan des sommes dpenses et gagnes par
son entreprise. Cest exactement ce travail queffectue loprateur divergence. Consi-
drons une surface infinitsimal ferme autour du point P : quel est le bilan du flux
dun champs f travers cette surface ? Cest ce bilan que la divergence quantifie. Plus
exactement,
dV div f = f d

La dmarche pour calculer la divergence est similaire ce que nous avons fait pour le
rotationnel. Considrons le flux (sortant) travers la surface ABCD (les normales aux
surfaces sont par convention orientes sortant) :
bch2 (q1 + a, q2 , q3 )h3 (q1 + a, q2 , q3 )f1 (q1 + a, q2 , q3 )
et le flux (entrant) travers la surface P B 0 C 0 D0
bch2 (q1 , q2 , q3 )h3 (q1 , q2 , q3 )f1 (q1 , q2 , q3 )
Le bilan de ces deux termes nous donne
(h2 h3 f1 )
abc
q1
En considrant le flux travers les quatre autres surfaces, et en notant que dV =
h1 h2 h3 abc, on obtient finalement
 
1 (h2 h3 f1 ) (h3 h1 f2 ) (h1 h2 f3 )
div f = + +
h1 h2 h3 q1 q2 q3
4. Le rotationnel dans ce cas est appel tenseur lectromagntique. Nous rfrons le lecteur un livre
avanc en lectromagntisme pour voir cela en dtail.

194
13 Les oprateurs diffrentiels.

Exemple 13.5 En coordonnes polaire (r, , z), h1 = h3 = 1, h2 = r. Nous avons


donc  
1 (rfr ) f (rfz )
div f = + +
r r z
Noter que comme z (rfz ) = rz fz , lexpression ci-dessus peut encore se simplifier
quelques peu.

Exercices.
13.5 Donnez lexpression de la divergence en coordonnes sphrique et parabolique.

13.6 Comment pourrait on gnraliser la divergence pour les espaces n dimensions ?

Prenons le cas dun fluide de densit et de champs de vitesse v. La densit de courant


(le dbit de la masse) vaut en chaque point v.Si le fluide est incompressible (pensez
leau), alors divv = 0. Si au contraire le fluide est compressible, la diffrence entre
le flux entrant et sortant dans un petit volume provoque une accumulation de la masse
en ce point, do le sens de lquation


+ divv = 0
t
Ceci est galement le sens des quations de Maxwell en lectromagntisme, sauf que
l, on ne considre pas le flux dun vecteur mais dun objet un peu plus complexe quon
appelle le tenseur lectromagntique.

13.7 Le Laplacien.
Le laplacien dun champ scalaire est dfini en terme des autres oprateurs que nous
venons de voir :
f = div(gradf )
et daprs ce que nous avons dit, sexprime simplement en coordonnes curviligne
comme
      
1 h2 h3 f h3 h1 f h1 h2 f
f = + +
h1 h2 h3 q1 h1 q1 q2 h2 q2 q3 h3 q3

Exemple 13.6 En coordonnes polaire (r, , z), h1 = h3 = 1, h2 = r. Nous avons


donc
1
r (rr f ) + (1/r)2 f + rz2 f

f =
r
qui prend une forme plus simple si lon fait entrer le facteur (1/r) lintrieur du [ ].

195
13 Les oprateurs diffrentiels.

La signification du laplacien est lcart la moyenne. En un point P , le laplacien


mesure de combien le champ scalaire f est diffrent de la moyenne du champ pris sur
les points voisins. Voyons cela de plus prs. Prenons dabord le cas une dimension et
supposons que nous utilisons les coordonnes cartsiennes. Autour du point P din-
dice x0 , choisissons deux points distants de h est calculons lcart la moyenne dune
fonctions f :
1
= (f (x0 + h) + f (x0 h)) f (x0 )
2
1 1
= (f (x0 + h) f (x0 )) + (f (x0 h) f (x0 ))
2 2
1 00 2 3
= f (x0 )h + O(h )
2
donc, un facteur 1/2 prs (qui dpend de la dimension de lespace), lcart la moyenne
est donne par la drive seconde multiplie par la distance des points de voisinage au
carr h2 . La gnralisation est immdiate. Donnons nous un point P0 et une sphre de
rayon h petit autour de ce point. Calculons la moyenne de lcart entre la valeur de la
fonction au point P de la sphre et le point P0 . Le point P est repr par le vecteur hn,
cest dire que P = P0 + hn

1
= (f (P ) f (P0 )) d


1
= (gradf ) hnd


h
= div (gradf ) dV
V
hV
= div (gradf ) + O(h3 )

La quantit V / = Ch, o C est un facteur gomtrique. A trois dimensions 5 par
exemple, C=1/3. Nous retrouvons donc bien la signification du laplacien de la moyenne.
Par exemple, lquation de la vibration dune membrane lastique, dont la hauteur u
est releve en chaque point est
2u
2 = ku
t
En terme de mcanique du point, lquation ci-dessus est juste la formule m = F : le
terme de gauche est lacclration verticale ; le terme de droite, lcart la moyenne de
chaque point par rapport ses voisins, est la force exerce sur ce point.
Une des quations trs importante de la physique (lectrostatique sans charge) est
celle de Laplace (do le nom de laplacien)
V = 0
5. De faon gnrale, V /S = r/d, o d est la dimension de lespace et r le rayon de la sphre.

196
13 Les oprateurs diffrentiels.

Table 13.1 Les oprateurs differentiels en coordonnes curviligne. Pour les opra-
teurs vectoriels, seul la composante selon q1 est donne, les autres se d-
duisent par permutation circulaire (1, 2, 3).
Expression application
f

(gradf )1 = h11 q f (b) f (a) = C
f.ds
h1
(h f ) (h f )
i
(rot f )1 = h21h3 3 3
q23 2 f .ds = S rotf .dn
 q2 
C

1 (h2 h3 f1 ) (h3 h1 f2 ) (h1 h2 f3 )
div f = h1 h2 h3 q1 + q2 + q3 S
f dn = V divf dV
h   i
f
f = h1 h12 h3 q 1 hh2 h1 3 q1
+ ...

P2 P3
P1 PN1

B
A

Figure 13.4 Dcoupage dun circuit en N intervalles

Cela veut dire quen tout point x, la fonction V (x) est gale la moyenne de son voisi-
nage. Ceci veut dire que soit la fonction est localement linaire autour du point P , soit
que les variations le long dune direction sont compenses par des variations en sens
inverse dans dautres dimension. Prenez par exemple limage dun col en montagne :
dans une direction, on monte, dans lautre direction, on descend. Cela implique donc
quune fonction obissant cette quation ne peut pas avoir dextremum local nul part
lintrieur du domaine o cette quation est valable.

13.8 Rsumons.
Il est temps de mettre toutes ces expression cte cte et voir leur ressemblance.
Remarquez, dans la colonne des applications de la table (13.1), la relation entre la partie
droite et gauche de chaque galit. Dans la partie gauche, nous somme entrain de cal-
culer quelque chose comme le flux dun champ sur une courbe de 0, 1, 2 dimensions.
Dans la partie droite, nous relions ce flux lintgrale dun oprateur diffrentiel de ce
champ sur une surface de 1,2,3 dimensions qui entoure la courbe prcdente. Les trois
relations sappellent formule de Stockes gnralise.
Remarquez que les relations de Stockes sobtiennent directement partir des dfini-
tions. Prenons lexemple du gradient, et donnons nous un circuit C commenant par le
point A et finissant par le point B. Dcoupons ce circuit en N intervalles (bien sr, nous
pensons N trs grand, + ). Sur chaque intervalle, nous pouvons crire, lordre
1 en linverse de longueur des intervalles, et en utilisant la dfinition du gradient :

197
13 Les oprateurs diffrentiels.

f (P1 ) f (A) = f |A .ds1


f (P2 ) f (P1 ) = f |P1 .ds2
...
f (B) f (PN 1 ) = f |PN 1 .dsN

En sommant les deux cts de ces galits et en prenant la limite N , nous obte-
nons la relation de Stockes pour le gradient. La relation de Stockes pour les deux autres
oprateurs sobtient de faon similaire.
Nous reviendrons beaucoup plus tard sur ces notions en leur donnant le caractre
gnral qui leur sied dabord travers le cours sur les formes diffrentielles et ensuite
quand nous aborderons le calcul tensoriel et les varits diffrentielles. Les formes diff-
rentielles sont plus lgants, mais les physiciens sont plus habitus au calcul tensoriel.
Les deux approches sont trs complmentaires, des perspectives diffrentes de la mme
chose. Notons simplement quavec les formes diffrentielles, les relations de Stockes se
notent, de faon trs gnrale,
= d
d
o d est lhyper surface qui entoure lhyper volume , est d est la drive extrieure
de .

Exercices.
13.7 Dmontrer les relations suivantes et surtout, donner leur un sens gomtrique en vous
inspirant des dfinitions
1. rot(gradf ) = 0 (Help : considrer des circuits infinitsimaux sur des surfaces de niveau
entourant un point P ).
2. div(rot f ) = 0
3. div(A B) = (rotA).B + A.(rotB)

13.8 En utilisant les relations locales, dmontrez les formules de Stockes du tableau 13.1.

13.9 Nous avons dfini le Laplacien dun champ scalaire. Le Laplacien dun champ vectoriel
est dfini par
f = grad(divf ) rot(rotf )
Exprimez le Laplacien dans les diffrents systmes de coordonnes. Pouvez vous en donner un
sens gomtrique ?

13.10 Dmontrer les relations de Stockes pour le rotationnel et la divergence.

198
13 Les oprateurs diffrentiels.

13.9 Notes.
Certaines manipulations impliquant les dqi peuvent paratre approximatives et sans
la rigueur ncessaire. Il nen est rien. Reprenons par exemple le calcul du rotationnel
avec autant de prcision que souhaitable.
Quelques points claircir davance. Si nous connaissons la fonction (trs lisse, infi-
niment drivable) f et ses drives au point q = (qi0 ), alors nous pouvons connatre sa
valeur en un point proche, par exemple (q10 + dq1 , q20 , q30 ) :

f (q10 + dq1 , q2 , q3 ) = f (q) + dq1 1 f (q) + (1/2)dq12 12 f (q) + ...

Cest ce que nous appelons le dveloppement de Taylor. Maintenant, si nous connais-


sons la fonction f et ses drives au point q = (qi0 ), alors comment valuer
q10 +a
f (q1 , q2 , q3 )dq1
q10

Rien de plus simple partir du dveloppement de Taylor. Dans lintervalle dintgration,


nous choisissons le paramtrage q1 = q10 + u
q10 +a a
f (q1 , q2 , q3 )dq1 = f (q10 + u, q2 , q3 )du
q10 0
a
f (q0 ) + u1 f (q0 ) + (1/2)u2 12 f (q0 ) + ...
 
=
0
= af (q0 ) + (1/2)a2 1 f (q0 ) + (1/6)a3 12 f (q0 ) + ...

La dernire ligne a t possible parce que les quantits f (q), 1 f (q), ... sont juste des
constantes pour lintgrale en question : lintgration se fait sur u ! Dans lquation13.5,
nous avons simplement crit le premier ordre, le seul qui est pertinent quand on prend
la limite a, b 0. Pour vous en persuader, il suffit de faire le calcul lordre suprieur.

199
14 Les tenseurs en physique.
Le mot tenseur peut voquer des objets avec beaucoup dindices et dexposants du
ml
genre ijk qui multiplient dautres objets de ce genre et o il faut se souvenir que cer-
tains varient de faon contravariant et dautres de faon covariant. En faite, ce sont des
objets trs simples qui gnralisent les matrices. Le lecteur dj familier avec ces der-
nires naura aucun mal manipuler les tenseurs. Comme on va le voir par la suite, les
tenseurs sont partout en physique et donnent beaucoup de sens aux diverses formules.

14.1 Les tenseurs de rang 2.


Prenons dabord le cas dune force applique une masse m. Comme matre Newton
lavait affirm, le vecteur acclration de la particule, a, est reli au vecteur force, F,
par la relation
1
a= F (14.1)
m
Dit en langage de mathmaticien, il existe une application linaire qui, applique au
vecteur F produit le vecteur a. Comme nous lavons mainte fois soulign, linaire veut
dire que (i) si lon double la force, lacclration est double ; (ii) si la force est consid-
re comme la somme de deux autres forces, lacclration produite sera la somme des
acclrations produites par chacune de ces forces. Si on note par A cette application,
nous avons
A(F1 + F2 ) = A(F1 ) + A(F2 ) , R
Cest la dfinition dune application linaire. Comme cest trs simple et trs fonda-
mental, a ne mange pas de pain de le rappeler. En physique, nous avons lhabitude
dappeler cela le principe de superposition.
Notre application linaire dans ce cas tait vraiment triviale : prendre le vecteur F
et le multiplier par un scalaire 1/m. Prenons le cas maintenant dune onde lectro-
magntique qui rentre dans un matriau dilectrique (non mtallique). Localement, le
matriau devient polaris, et le vecteur polarisation P est reli au champs lectrique E
par
P = E (14.2)
La polarisation est bien sr relie linairement au champ lectrique : si on double le
champs, la polarisation est doubl etc. Mais P na aucune raison dtre parallle E !
Le matriau, sil est cristallin, possde des axes privilgis. Il est plus polarisable dans

200
14 Les tenseurs en physique.

certaines directions et la composante de E parallle ces directions est plus amplifie.


Le vecteur polarisation rsultant priori nest donc pas parallle au champ lectrique.
La susceptibilit lectrique (cest son nom) nest donc pas un scalaire, mais un tenseur
(une application linaire) 1 . Quand on veut manipuler et mesurer ces choses, il faut bien
les reprsenter par des nombres. Comme nous lavons dit, nous nous donnons alors une
base, est nous reprsentons un vecteur par ses composantes Ei ou Pi . La reprsentation
de est une matrice, dont les lments sont ij et numriquement, la relation (14.2)
scrit X
Pi = ij Ej (14.3)
j

Lexpression ci-dessus est juste le produit de la matrice par le vecteur P crit de faon
explicite.
Pour le physicien, la susceptibilit est une proprit fondamentale du matriau, au
mme titre que sa masse. De mme, les vecteurs E et P ont une existence propre, ind-
pendemment de comment nous les mesurons. Ceci veut dire que dans diffrentes bases,
les composantes des vecteurs, Ei et Pi auront diffrentes valeurs, mais si on les manipule
correctement, on retrouvera les mme vecteurs originaux. De mme pour les lments
ij : quelque soit la base que nous avons choisi 2 , en suivant la relation (14.3), on doit
toujours retrouver le mme vecteurs polarisation. Cela va de soit si nous savons que ces
nombres ne sont que des reprsentations des vecteurs et applications linaires, et que
nous disposons des mcanismes prcis pour les calculer, une fois donne une base. Cela
allait un peu moins de soi au dbut du vingtime sicle quand lalgbre linaire ntait
pas aussi dmocratis que de nos jours. On prsentait alors un tenseur ij comme une
collection de nombres avec des rgles de transformations prcises lors des changements
de base. Ctait un peu comme faire de larithmtique avec des chiffres latins ( quel est le
rsultat de MCLLXIV+MLCLXII ? ) et malheureusement, cette conception des tenseurs
reste encore vivante de nos jours.
Nous reviendrons plus tard ces rgles de manipulation pratique des chiffres. Pour
linstant nous allons nous habituer un peu plus ces concepts. A propos, le titre de
cette section tait les tenseurs de rang 2. Cest un terme savant pour dsigner les
applications linaires. Un scalaire est un tenseur de rang 0 (zro) et une application
linaire est un tenseur de rang 2 (il faut deux indices pour numrer les lments). A
votre avis, quest ce quun tenseur de rang 1 ?
1. Dans le temps, on faisait beaucoup de distinction entre un scalaire, un vecteur et un tenseur. Bien
sr, on peut voir un scalaire comme une matrice diagonale avec tous ses lments gaux : le produit dune
application identit par un nombre.
2. Par exemple, base 1 : x horizontal et selon le rayon laser qui rentre dans le cristal, z vertical et y
perpendiculaire aux deux autres ; base 2 : x,y,z parallle aux axes principaux du cristal ; base 3 : x dans la
direction de ltoile polaire, y pointant vers le soleil et z vers le centre de la galaxie. Les deux premires
bases sont couramment utilises par lopticien : la premire est le rfrentiel du laboratoire trs naturel
utiliser ; Dans la deuxime, la matrice de la susceptibilit est diagonale (au dit autrement, les axes du cristal
constituent les vecteurs propres de ) et donc les calculs y sont trs simple. La base 3 na jamais t utilis
ma connaissance pour faire de loptique.

201
14 Les tenseurs en physique.

Prenons maintenant un autre exemple, une fonction vectorielle dans lespace R3 ,


u(x, y, z) = (u1 (x, y, z), u2 (x, y, z), u3 (x, y, z) ) 3 . Si nous connaissons la valeur de la
fonction au point (x0 , y0 , z0 ), la valeur de la fonction au point (x0 +dx, y0 +dy, z0 +dz)
est u(x0 , y0 , z0 ) + du, o
du = D.dr (14.4)
la relation ci-dessus nest pas autre chose que du = u0 (x0 )dx pour les fonctions dune
seule variable et le tenseur D gnralise la notion de drive. videment, nous savons
que les composantes de ce tenseur scrivent

ui
Dij =
xj

o nous avons remplac les coordonnes x, y, z par x1 , x2 , x3 ( cela est beaucoup plus
pratique). Remarquez qu priori, nous navons rien fait dautre que dcrire le dvelop-
pement lordre 1 de chaque composante ui et de regrouper le tout sous forme dune
matrice. La relation (14.4) est cependant plus profond et met laccent sur la linarit de
la relation entre dr et du 4 .
Ce que vous devez retenir ce point est que les tenseurs gnralisent la notion de
multiplication des objets de dimension suprieurs 1.

Convention de sommation. Les tenseurs sont devenus populaires partir des an-
nes 1920. Einstein par exemple a formul sa thorie de relativit gnrale en termes
tensoriels. Il a remarqu que quand on crivait des sommes du genre (14.3), lindice sur
lequel on sommait (j dans le cas cit) tait toujours rpt dans deux quantits (ij
et Ej dans ce cas). Du coup, autant laisser tomber le signe somme et accepter que
quand un indice est rpt deux fois, cela veut dire quil faut sommer sur cet indice.
Cette convention est tellement pratique quelle a t adopt partout. La relation (14.3)
scrit, avec notre convention, Pi = ij Ej . Si nous tions dans un espace quatre di-
mensions, la relation ij = ijkl kl (peut importe ce que cela veut dire) est une faon
plus concise dcrire
X4 X 4
ij = ijkl kl
l=1 k=1

Si les composantes dun vecteur x dans la base (e1 , e2 , e3 ) sont x1 , x2 , x3 , nous pou-
vons, en suivant cette convention, crire simplement x = xi ei . Nous suivrons cette
convention dans cette section.

3. par exemple la vitesse dun coulement en chaque point de lespace.


4. Si lon dforme un solide, chacun de ses points est dplac. Nous pouvons dfinir une fonction vec-
torielle u(x, y, z) qui relate le dplacement de chaque point. Le tenseur D que nous avons dfini ci-dessus
(ou plutt sa version symtrise) est appel dans ce cas le tenseur des dformations et constitue le socle de
la thorie dlasticit.

202
14 Les tenseurs en physique.

Note : Faire plusieurs exercices pour bien habituer la convention, surtout en pr-
paration de ce qui suit. Surtout les habituer aux permutations dindice : pji xj et pij xi
cest la mme chose. Donner lquivalent en langage humain du genre sommons sur
le premier indice. Faire vraiment beaucoup dexercice sur lindice muet. Une bonne
partie de la pratique des tenseurs cest seulement cette manipulation dindice.

Exercices.
Les mettre peut tre juste avant les changement de base, ou les distribuer au fur et
mesure.
14.1 Champ lectrique cr par un diple

14.2 nergie dinteraction entre diples

14.3 le tenseur quadripolaire

14.4 lasticit : tenseur de dformation et de contrainte, relation de Hook. Profiter pour ha-
bituer aux changements de variables pour crire ces tenseurs en symtrie sphrique ou cylin-
drique : conteneur prcontraint, les billes dactine, etc.

14.5 tenseur de dformation cre par une force ponctuelle la surface ; par un diple de force ;

14.6 nergie dinteraction entre deux marches la surface dun cristal. Instabilits lastiques

14.7 tenseur hydrodynamique et la viscosit, la landau.

14.8 Le tenseur mtrique. Les oprateurs diffrentiels : grad, curl, div.

14.9 Un peu de gomtrie diffrentielle.

14.10 Le tenseur lectromagntique en relativit, le lien avec le chapitre prcdent.

14.2 Gnralisation des tenseurs.


Les tenseurs de rang 2 que nous avons rencontr plus haut taient des fonctions
linaires dun espace vectoriel E1 dans un autre espace vectoriel E2 : A : E1 E2 .
Un tenseur de rang 3 est une application bilinaire qui prend deux vecteurs en entre et
produit un vecteur en sortie : A : E1 E1 E2 . lapplication A(x, y) est bilinaire,
cest dire linaire pour chacun de ses arguments :

A(x1 + x2 , y) = A(x1 , y) + A(x2 , y)


A(x, y1 + y2 ) = A(x, y1 ) + A(x, y2 )

o , R. A nouveau, pour faire des calculs, nous nous donnons une base, et cette
fois, A doit tre donne par trois indices aijk ( une matrice trois dimensions si vous

203
14 Les tenseurs en physique.

voulez : ligne, colonne, paisseur ). Si z = A(x, y), alors la relation entre leurs compo-
santes est juste une gnralisation des produits matricielles :

zi = aijk xj yk

Reprenons notre exemple de fonction u(x1 , x2 , x3 ) que nous avons rencontr plus
haut.
introduire dj les formes linaires, mais attendre le produit scalaire pour parler de
lespace dual.

14.3 Les composantes dun tenseur.


Les tenseurs de rang 2.
Il nous faut maintenant manipuler pratiquement les tenseurs, cest dire calculer
leurs composantes. Revenons ce que nous savons sur les vecteurs. Pour les manipuler,
nous les reprsentons sous formes dun ensemble de chiffre (souvent sous forme dune
colonne) : nous nous donnons une base {e1 , e2 , ...en }, nous crivons un vecteur x
sous forme de combinaison linaire de ces vecteurs, x = x1 e1 + ...xn en = xi ei et
nous reprsentons le vecteurs par les nombres (x1 , ...xn ).
Pour caractriser une application linaire A (autrement dit, un tenseur de rang 2), il
suffit de connatre laction de cette application sur chaque vecteur de base 5 :

Ae1 = a11 e1 + a21 e2 + ...an1 en (14.5)


Ae2 = a12 e1 + a22 e2 + ...an2 en
...
Aen = a1n e1 + a2n e2 + ...ann en

ou dans notre notation concise tensorielle avec la convention de sommation de lindice


rpt,
Aei = aji ej i = 1, ..., n (14.6)
Notez le sens de la variation des indices : cest la fameuse convention de prsenter
les composantes de Aei comme des vecteurs colonnes et de les aligner ctes ctes
pour former une matrice. Connaissant ces composantes aij , nous pouvons calculer les
composantes de nimporte quel vecteur y = Ax (on ne le prcisera plus, nous suivons

5. Nous considrons seulement le cas o A est une application linaire dun espace vectoriel de dimension
n dans un espace vectoriel de mme dimension. La matrice reprsentant A est alors carre. La gnralisation
au cas les espaces vectoriels de dpart et darriv nont pas la mme dimension est triviale et laiss au soin
du lecteur.

204
14 Les tenseurs en physique.

notre convention de sommation ) :


Ax = A(xi ei )
= xi Aei linrait dune application linaire
= xi aji ej la relation (14.6) ci dessus
La i-me composante du vecteur y est donc donn par
yi = aij xj (14.7)
Ceci est bien sr la rgle selon laquelle il faut multiplier la i-me ligne de la matrice par
le vecteur colonne x lment par lment pour obtenir la i-me composante de y. No-
tez nouveau 6 le sens de la variation de lindice et comparez la relation (14.6) : cette
fois nous sommes en train de sommer sur le deuxime indice tandis que dans la relation
(14.6), nous sommions sur le premier indice. On dit que les composantes dun vecteur
varient de faon contravariante, cest dire dans le sens contraire la variation des vec-
teurs sous leffet dune application linaire. Le mot contraire est mal choisi 7 , puisque
il veut simplement dire quil faut sommer sur lautre indice. Cest malheureusement un
mot consacr quil faut connatre.

Les tenseurs de rang quelconque.


Ce que nous venons de dire se gnralise naturellement aux tenseurs de rang quel-
conque. Prenons le cas dun tenseur A de rang 3, cest dire une fonction bilinaire qui
prend deux vecteurs en entre et produit un vecteur en sortie (A : En En En ,
o En est un espace vectoriel de dimension n). On ne peut plus reprsenter A comme
une matrice, il nous faudrait arranger les termes dans un tableau tri-dimensionnel, peu
pratique crire. Il nous faut nous contenter des coefficients, mais la longue vous le
verrez, ce nest pas moins pratique. Comme nous lavons indiqu plus haut, il nous faut
connatre laction de A sur tous les couples vecteurs de base :
A(ei , ej ) = akij ek i, j = 1, ..., n
connaissant ces coefficients akij , nous pouvons connatre laction de A sur nimporte
quels deux vecteurs x,y :
z = A(x, y)
= A(xi ei , yj ej )
= xi yj A(ei , ej )
= akij xi yj ek
6. Nous avons permuter i et j pour dsigner la ligne de la matrice par i et sa colonne par j. Certaines
habitudes ont la vie dure.
7. Historiquement, lapplication linaire le plus souvent considre tait un changement de base et le mot
contravariant avait plus de sens. Nous verrons cela un peu plus tard.

205
14 Les tenseurs en physique.

Autrement dit,
zk = akij xi yj
Voil, cest ce que nous disions sur la gnralisation naturelle des matrices. Notez la
concision que la convention de sommation de lindice rpt nous procure.

14.4 Changement de base.


Connaissant les composantes dun vecteur ou tenseur dans une base, comment en
dduire ces composantes dans une autre base ? Lexercice nest pas futile, et mrite que
lon y passe un peu de temps pour au moins deux raisons : (i) nous mesurons souvent
les composantes dun tenseur dans une base privilgie o il est diagonal (par ce quil
est beaucoup moins fastidieux de mesurer n coefficients que nk ), mais nous gagnons
notre pain dans la base du laboratoire o nous effectuons nos expriences ; (ii) certaines
thories comme la mcanique classique o la relativit sont fondes sur linvariance de
certaines quantits lors de changements de rfrentiel : il faut donc savoir comment
passer dune base lautre si lon veut comprendre ces thories.

Commenons par le cas dun vecteur. Nous connaissons les composantes dun
vecteur x dans la base {e1 , ..., en } et nous souhaitons obtenir ses composantes dans
la base {f1 , ..., fn }. videment, il existe une application linaire P qui transforme les
vecteurs fi en vecteur ei : P f1 = e1 , P f2 = e2 ,... Par exemple, si nous avons tourn les
axes de la premire base de 45 degrs pour obtenir la deuxime base, lapplication P
est lapplication Rotation de -45 degrs. Notez que cest lapplication qui transforme
la deuxime base en premire ; pour plus de clart, on le note parfois P21 . Pour avoir
la reprsentation matricielle de P dans la base {fi }, il suffit, comme nous lavons dit
plus haut (relation 14.5), dcrire les vecteurs ei comme des combinaisons linaires des
vecteurs fi :
ei = pji fj
Connaissant ces coefficients pij , on obtient directement lexpression de x comme com-
binaison linaire des vecteurs fi :

x = xi e i
= xi pji fi

Si nous dsignons par x0i les composantes du vecteur dans la nouvelle base, nous avons

x0i = pij xj (14.8)

Vous avez peut tre remarqu la beaut de la relation ci-dessus : les composantes du
vecteur x dans la deuxime base {f } sont gaux aux composantes du vecteur P x dans
la premire base {e} ! Revenons lexemple de la base {f } obtenue par une rotation

206
14 Les tenseurs en physique.

de +45 degrs de la base {e} ; les composantes dun vecteur x dans cette nouvelle base
sont gaux aux composantes du ce vecteur, tourn de -45 degrs, dans lancienne base.
En faite, voil lorigine du mot contravariant.

Continuons par un tenseur de rang 2. Nous connaissons les lments aij dun
tenseur A dans une base {e}, et nous souhaitons les exprimer dans la base {f } en nous
aidant de lapplication de passage P = P21 . Cette fois, nous avons galement besoin
de lapplication inverse Q = P 1 :

fi = qji ej

Connatre lapplication A dans la base {f }, cest connatre laction de A sur chaque


vecteur fi . Allons-y :

Afi = Aqji ej
= qji Aej
= qji akj ek
= qji akj plk fl

Ce qui nous donne :


a0li = plk akj qji
Cette dmarche se gnralise immdiatement aux tenseurs de rangs suprieurs. Il ne
faut surtout rien retenir pas cur : si vous avez compris la dmarche, la formule de
transformation sobtient en deux coups de cuillre.
Exercice : dduire lexpression des tenseurs a0ijk et a0ijkl

14.5 Le produit scalaire gnralis, covariant et


contravariant, les formes linaires.
Le lecteur qui a rencontr les tenseurs, surtout dans le contexte de la relativit gn-
rale ou de la gomtrie riemannienne a not que lon fait une distinction trs nette entre
les vecteurs, tenseurs,... covariant et contravariant. Les composantes des uns scrivent
avec des indices en bas, dautre avec des indices en haut et nous manipulons constam-
ij
ment des expressions du genre kl yi xk . Nous crivions jusque l tous les indices en bas,
mais essayons daller plus loin. Une bonne partie du calcul tensoriel consiste pratiquer
la manipulation des indices. Nous allons nous donner une nouvelle rgle de sommation
dont le sens sera prcis plus loin.

207
14 Les tenseurs en physique.

Rgle de sommation. Une expression qui contient des indices rpts reprsente
une somme si un des indices est en haut et lautre en bas.
Cest une rgle grammatical au mme titre que les parenthses : une expression bien
forme contient le mme nombre de parenthses ouvertes que fermes. De mme pour
les indices rpts, lexpression xi yi est correctement form et veut dire x1 y1 + x2 y2 +
x3 y3 + ... Lexpression gij xi y j est bien forme, ainsi que g ij xi yj et gij xj y i . Par contre,
gji xj y i ou gij xi y j sont grammaticalement incorrect, au mme titre que les expressions
du genre (a + b))c + d( ou (a + (b + (c). Par convention, tout ce qui a un indice en bas
est appel covariant ; un indice en haut reprsente une quantit contravariant.
Donnons nous maintenant une base (e1 , e2 , ...) dans un espace vectoriel E. Nim-
porte quel vecteur x scrit comme une combinaison linaire des lments de la base,
ce qui, avec notre nouvelle convention de sommation, donne :

x = xi ei

Si vous vous souvenez, nous avions soulign que les composantes varient dans le sens
contraire des vecteurs lors dun changement de base, cette notation met cela clairement
en vidence.
Nous rentrons maintenant dans le vif du sujet. A lespace E, nous associons un
espace dual E des formes linaires. Cet espace reprsente, si vous voulez, lautre
cot du miroir. Par forme linaire, il faut entendre lespace de toutes les fonctions f
qui prennent un lment de E, produisent un scalaire, et font cela de faon linaire :
f : E R,f (e1 + e2 ) = f (e1 ) + f (e2 ). E ressemble E : cest galement
un espace vectoriel (af + bg, o a, b Ret f, g E a exactement le sens quon lui
donne) et de plus, E a la mme dimension que E. (cf exercice plus bas). E est lespace
des vecteurs contravariants comme nous allons le voir, mais retenez limage du miroir :
quand vous tournez vers la gauche, votre image dans le miroir tourne vers la droite.
Revenons notre espace E. Vous avez vu (cf 2.1) que nous pouvons le munir dun
produit scalaire <, >, cest dire une application bilinaire qui a deux vecteurs de E
associe un scalaire. Si nous nous donnons une base (e1 , e2 , ...) et que nous connaissons
le produit scalaire de chaque couple dentre eux < ei , ej >= gij , alors nous pouvons
crire le produit scalaire de nimporte quels deux vecteurs

hx, yi = gij xi y j

o xi et y j sont les composantes des deux vecteurs. Noublions pas que le produit sca-
laire doit tre dfini positif, cest dire hx, xi > 0 si x 6= 0. Cela impose certaines
contraintes sur les valeurs gij que nous verrons plus tard.
Considrons maintenant lobjet fv = hv, .i, o v E. Ceci est bien une forme
linaire appartenant E , puisque si u E, alors fv (u) = hv, ui R.
Note sur le produit tensoriel de deux espaces vectoriel, tenseur dlasticit qui relie
deux tenseurs,...

208
14 Les tenseurs en physique.

Indice haut, bas, la rduction, monter ou descendre un indice : essentiellement en


relation avec la relativit et le produit scalaire de Minkowski.
espace dual
exercice : dmontrer que E est un espace vectoriel de mme dimension
une base dans lespace dual sans faire rfrence au produit scalaire.
produit scalaire gnralis < x, y >= gij xi y j

209
15 quation drive partielle du
premier ordre.
Le monde des quations drives partielles (EDP) est vaste, et des centaines de
livres, souvent extrmement pdagogiques, leur sont consacres. Les EDP les plus uti-
lises en physique sont de second ordre pour lespace, et de premier ou de second ordre
pour le temps. Ce sont les quations de la chaleur, de Laplace et de Poisson, et lqua-
tion donde. Nous nallons pas traiter ces quations de faon gnrale ; les mthodes
des chapitres prcdents (TF,TL, Green,...) sont les outils de base par lesquels ces EDP
linaires sont abordes.
Les EDP linaires de premier ordre sont par contre exactement soluble par la mthode
des caractristiques, au moins en thorie. Il est utile den donner un bref aperu.

15.1 La mthode des caractristiques.


Nous souhaitons dterminer la fonction (s, t) obissant lquation :

t + P (s)s = Q(s) (15.1)

Nous cherchons la solution sous forme de (s, t) = f (s)g(u(s, t)) o f, g, u sont des
fonctions inconnues dterminer. A priori, nous navons rien gagn dautre que laug-
mentation du nombre de fonctions inconnues. Mais nous gagnons la libert dimposer
des contraintes ces fonctions qui ramnerons le problme des choses plus connues.
Nous avons, pour les drives partielles de :

t = t uf (s)g 0 (u) (15.2)


s = f 0 (s)g(u) + s uf (s)g 0 (u) (15.3)

En insrant (15.2,15.3) dans lquation (15.1), nous avons :

(t u + P (s)s u)f (s)g 0 (u) + (P (s)f 0 (s) Q(s)f (s))g(u) = 0. (15.4)

Une solution vidente de (15.4) est donne par :

P (s)f 0 (s) Q(s)f (s) = 0 (15.5)


t u + P (s)s u = 0 (15.6)

210
15 quation drive partielle du premier ordre.

Lquation (15.5) est une quation diffrentielle linaire homogne de premier ordre en
f et sa solution est donne par f (s) = exp(A(s)), o A0 (s) = Q(s)/P (s).
Lquation (15.6) , qui est une EDP de premier ordre homogne, a comme solution
u(s, t) = exp(W (s) t) o W 0 (s) = 1/P (s). Notons que la fonction g reste indter-
mine. Son choix dpend des conditions initiales imposes au systme.
Exemple 15.1 Nous souhaitons rsoudre une quation de diffusion avec un terme de
drive linaire, appel Ornstein-Uhlenbeck :
t p = x (kxp) + Dx2 p (15.7)
avec la condition initiale (CI)
p(x, 0) = (x x0 ) (15.8)
o est la fonction de Dirac. p(x, t) est une densit de probabilit de prsence
linstant t labscisse x, et la condition initiale veut simplement dire que toute la
probabilit est condense en x0 linstant t = t0 . Soit (s, t) la transforme de
Fourier en x de p(x, t) :
+
(s, t) = eisx p(x, t)dx

lquation (15.7) se transforme alors en


t + kss = Ds2 (15.9)
avec la condition initiale
(s, 0) = eisx0 (15.10)
Lquation (15.9) est une EDP de premier ordre similaire (15.1), avec P (s) = ks
et Q(s) = Ds2 . Nous avons alors A(s) = Ds2 /2k et W (s) = log(s)/k. Les
fonctions f ,u et scrivent :
f (s) = exp(Ds2 /2k) (15.11)
u(s, t) = s exp(kt) (15.12)
(s, t) = exp(Ds2 /2k) g(s exp(kt)) (15.13)
Nous pouvons vrifier par drivation directe que lexpression (15.13) est bien solution
de (15.9). Il nous reste utiliser la CI (15.10) pour trouver g, ce qui donne :
g(s) = exp(Ds2 /2k + iux0 )
et la solution complte scrit :
Ds2
 
(s, t) = exp (1 e2kt ) + isx0 ekt
2k

211
15 quation drive partielle du premier ordre.

La fonction est appel en probabilit la fonction caractristique associ la den-


sit de probabilit p. La moyenne et la variance se calcule aisment si on connat
:


hXi = xp(x)dx = i |s=0
s


2 2
X = x2 p(x)dx = 2 |s=0
s

Exercices.
15.1 Calculer, pour le processus dOrnstein, hX(t)i et V ar(X(t)) = X 2 (t) hX(t)i 2 .

15.2 Croissance exponentielle. Pour une croissance exponentielle, lquation matresse scrit :

t p(n, t) = (n 1)p(n 1, t) np(n, t)

o p(n, t) est la probabilit pour une population davoir la taille n linstant t. En utilisant plutt
la transforme de Laplace X
(s, t) = p(n, t)ens
n

Calculer hn(t)iet V ar(n(t)). La condition initiale est p(n, 0) = n,n0 . Ceci est galement connu
sous le nom de processus de Poisson.

15.3 (Plus ardu).On dmarre avec une population initiale de bactrie n0 , dont les taux de
mort et naissance sont gaux et valent . Calculer hn(t)i et V ar(n(t)).
Nous verrons que lquation matresse dans ce cas scrit :

t p(n, t) = (n 1)p(n 1, t) + (n + 1)p(n + 1, t) 2np(n, t) (15.14)

avec la condition initiale p(n, 0) = n,n0 . p(n, t) est la probabilit pour la population, linstant
t, davoir la taille n.
Pour rsoudre lq.(15.14), vous avez plus intrt utiliser la transforme de Laplace :
X
(s, t) = p(n, t)ens
n

15.2 Interprtation gomtrique.


Nous avons donn la mthode des caractristiques comme une recette. Mais cette
recette dcoule dune interprtation gomtrique trs simple : les drives premires
sont les pentes de la fonction selon les diverses directions. Prenons dabord le cas de
lquation
P (s, t)s + R(s, t)t = 0 (15.15)

212
15 quation drive partielle du premier ordre.

Nous pouvons reprsenter la solution (s, t) comme une surface : (s, t) tant la hau-
teur la position (s, t). Si nous pouvions connatre les courbes de niveau de cette sur-
face, nous aurions dj une trs bonne connaissance de la solution (voir figure 15.1).
Quand on parcours une courbe de niveau, la valeur de la fonction y reste constante.
Supposons maintenant que nous sommes une position (s, t). Comment se dplacer
dune quantit (ds, dt) pour que la valeur de la fonction reste constante ? Quelle doit
tre le rapport entre le dplacement dans la direction ds et le dplacement dans la di-
rection dt pour ne pas changer daltitude ? Noter que se donner une relation entre ds
et dt en tout point dfini une courbe dans le plan (s, t). Par exemple, dy/dx = x/y
dfini lquation dun cercle de centre origine ; le rayon de ce cercle est donn par une
condition initiale.
La variation de en fonction de (ds, dt) est

d = (s )ds + (t )dt

En comparant cette expression (15.15), nous voyons quil suffit de choisir ds propor-
tionnel P (s, t) et dt proportionnel R(s, t) pour que d = 0. Autrement dit, pour
avoir d = 0, il suffit de choisir
ds dt
= (15.16)
P (s, t) R(s, t)

Comme vous le remarquez, lexpression ci-dessus est une quation diffrentielle ordi-
naire donnant la forme de la courbe quon appelle caractristique.
Exemple 15.2 Lquation ts st = 0 : les courbes de niveaux sont donnes par
sds+tdt = 0, autrement dit par s2 +t2 = C. Ce sont des cercles centrs sur lorigine.
Appliquons cela lquation plus simple que nous avions trait au dbut de ce cha-
pitre :
t + P (s)s = 0 (15.17)
Les courbes de niveau sont donnes par

ds dt
=
P (s) 1

En intgrant les deux cts, nous avons donc

W (s) t = C

o W 0 (s) = 1/P (s) et C est une constante dintgration. La fonction u(s, t) = W (s)
t = C nous donne donc les courbes de niveau, et la solution gnrale de lquation
(15.17) est donc de la forme
(s, t) = g (u(s, t))

213
15 quation drive partielle du premier ordre.

La surface (s, t)

0
1
0.8
0.6
1
0.4 0.9
0.2 0.8
0 0.7
0.6
0.2 0.5
0.4
0.6 0.3
0.4
Les courbes de niveau
0.8 0.2
0.1
La condition initiale 1 0

(s, 0) = I(s) s
t

Figure 15.1 Construction dune solution : nous trouvons dabord les courbes de
niveau dans le plan (t, s). Ensuite, en utilisant la condition initiale
(s, 0) = I(s), on prcise la hauteur de la surface de sur chacune
des courbes et on reconstruit la solution (s, t).

La fonction g doit tre trouve en utilisant les conditions aux bords. Ceci est le sens de
la recette de rsolution que nous avions donn au dbut de ce chapitre, dans le cas
simple o le second membre est nul.
Trs bien, nous connaissons les courbes de niveaux. Mais pour vraiment connatre
, il faut connatre la valeur de cette fonction sur chaque courbe. Comment dterminer
cela ? videment, laide des conditions initiales. Si par exemple, on se donne (s, 0) =
I(s), nous connaissons alors la valeur de sur la courbe de niveau qui passe par (s, 0)
(voir figure 15.1). Autrement dit, en transportant les hauteurs (s, 0) le long des courbes
de niveau, on reconstruit la surface (s, t). Ceci est le sens de la dtermination de la
fonction g(u) par les conditions initiales dans la section prcdente. Nous avons donc
la mthode gnrale de la rsolution dune EDP de premier ordre.
Exemple 15.3 quationdonde. Soit lquation cx t = 0, avec la condition
initiale (x, 0) = f (x). Les courbes caractristiques sont dx/c = dt, autrement dit
x = ct + x0 . En inversant cette relation, nous trouvons x0 = x + ct. Nous trouvons
donc que
(x, t) = f (x + ct)
Nous avons appel cette quation quation donde puisque lquation c2 2 /x2
2 /t2 = 0 se factorise en

(cx t )(cx + t ) = 0

Si est solution de cx t = 0 ou de cx + t = 0, alors est solution de


lquation donde.

214
15 quation drive partielle du premier ordre.

15.3 Gnralisation.
A partir de l, nous pouvons gnraliser notre analyse lquation

P (s, t)s + R(s, t)t = Q(s, t, )

avec les conditions initiales (s, 0) = I(s). Les courbes caractristiques donnes par
(15.16) ne sont plus des courbes de niveau, mais la variation de le long des courbes est
donne par une quation diffrentielle ordinaire. Supposons que la solution de ds/P =
dt/R soit donne par s = f (t, s0 ) 1 , cest dire ds/dt = f 0 (t, s0 ) = P/R. Quand on
se dplace le long dune courbe caractristique s = f (t, s0 ), la variation de est

d = dss + dtt
= (P s + Rt )(dt/R)
= (Q/R)dt

Donc, le long de ces courbes, est solution de lquation


d Q(s, t, )
= (15.18)
dt R(s, t)
La stratgie pour trouver la solution est une modification de ce que nous avons dit
prcdemment :
1. Trouver la courbe caractristique s = f (t, s0 ), linverser pour trouver s0 =
g(s, t).
2. Rsoudre lquation diffrentielle ordinaire (15.18) o s = f (t, s0 ) soumise la
condition initiale (0) = I(s0 ), le long dune courbe caractristique.
Exemple 15.4 Nous souhaitons Rsoudre lquation s + P (t)t = Q(t) avec la
condition initiale (s, 0) = I(s). Notez que nous navons pas de dpendance expli-
cite en s dans cette quation.
Les courbes caractristiques sont ds/1 = dt/P (t). Si nous appelons W (t) une
primitive de 1/P (t), ( la fonction W est connue, puisque P lest ) les courbes carac-
tristiques sont donnes par W (t) s = W (0) s0 . Le long de ces courbes, nous
choisissons s comme variable indpendante ( nous avons le choix du paramtrage )
et donc, le long de ces courbes,
d Q(t)
=
dt P (t)
Si nous appelons A(t) une primitive de Q/P , alors la solution gnrale de lquation
ci-dessus est
(t) = C. exp(A(t)).
1. Pour tre plus gnral, nous aurions du crire f (s, t, s0 ) = 0

215
15 quation drive partielle du premier ordre.

Toutes les courbes passant par t (quelque soit leur ordonne s) ont la forme ci-dessus.
Vous pouvez voir cela comme le croisement entre la surface et le plan t. La caract-
ristique passant par le point (s, t) passe par le point (s0 , 0) o s0 = W (t)sW (0).
La solution complte de lquation scrit donc comme

(s, t) = I(W (t) s W (0).) exp(A(t)

Nous laissons au lecteur le soin de revoir la premire section de ce chapitre la


lumire de ces dveloppements.

216
16 Les formes diffrentielles et la
drivation extrieure.
16.1 Introduction.
Lanalyse des fonctions dune seule variable est simple : nous savons prendre la dri-
ve premire, seconde, ... et cela a un sens direct (pente, courbure,...). Quand on aborde
les fonctions de plusieurs variables, les choses commencent se compliquer. Les op-
rateurs diffrentielles prennent alors des noms tranges comme gradient, divergence,
rotationnel,... Et nous dcouvrons quil existe des relations entre ces tres : prendre la
circulation le long dune courbe ferme revient calculer le flux dun rotationnel tra-
vers la surface engendre par cette courbe ; calculer le flux travers une surface ferme
revient prendre lintgrale de la divergence dans le volume,... Si vous tes trs vers
dans la manipulation de ces objets, vous savez peut-tre ce que vaut grad(divf ) par
cur !
Tout cela nest pas trs joli. Dabord, nous avons de la peine distinguer la significa-
tion de tous ces oprateurs et des relations qui existent entre eux ; ensuite, cette analyse
vectorielle ne marche qu trois dimensions 1 ; Enfin, les quations mathmatiques de-
viennent confuses : pourquoi la drive temporelle du champ magntique devrait tre
lie au rotationnel du champ lectrique ? On sent bien quil y a des arguments de go-
mtrie derrire cela, mais quoi exactement ?
A partir du dbut du vingtime sicle, des mathmaticiens comme Poincar et Car-
tan ont ralis que derrire tout ce chaos, il y avait de lordre, exactement comme la
dcouverte de lexistence des atomes a donn un sens la chimie. Les atomes en ques-
tion ici sappellent des formes diffrentielles, et nous allons les tudier plus en dtails.
Disons simplement que toutes ces relations entre oprateurs ne sont en faite que des
gnralisations du Thorme Fondamental de lanalyse :
b
F 0 (x)dx = F (b) F (a)
a

1. Et cela par un malentendu qui fait correspondre un vecteur aux produit vectoriel dans le cas des espaces
trois dimensions.

217
16 Les formes diffrentielles et la drivation extrieure.

16.2 Les 1formes.


Une 1-forme est une application linaire qui agit sur un vecteur et produit un nombre.
Le lecteur est probablement habitu dj ce concept : en notation matricielle, les (vrais)
vecteurs sont reprsents par des colonnes (vecteur colonne) ; ceci dit, nous avons ga-
lement des vecteurs lignes. Ces vecteurs lignes sont ce quon appelle des 1-formes. Lap-
plication dune forme u un vecteur v revient multiplier son vecteur ligne par le
vecteur colonne de v pour produire un nombre.
Bien. Ceci dit, une colonne de nombre est juste une reprsentation dun vecteur, qui
dpend de la base choisie. Les vecteurs sont des objets gomtriques qui ne dpendent
videmment pas de leurs reprsentations 2 . De la mme manire, les 1-formes ne sont
pas des vecteurs lignes qui est juste une faon de les reprsenter par des nombre : Le
scalaire u(v) ne dpend pas de la base que nous avons choisie.
Pour dvelopper notre thorie, cest quand mme pratique de se donner une base.
Prenons, pour simplifier les choses, un espace plat 3 dimensions, o nous nous don-
nons trois vecteurs indpendants ex , ey et ez . Nimporte quel vecteur peut maintenant
tre reprsent par une combinaison du genre v = ax ex + ay ey + az ez o les coeffi-
cients ay sont des nombres.
De la mme faon, nous pouvons nous donner une base dans lespace des formes et
crire une 1-forme comme une combinaisons de ces 1-formes de base. Cest ici que les
mathmaticiens ont introduit une notation qui peut paratre droutant aux physiciens 3 ,
mais qui savre extrmement fconde. Il existe par exemple un (unique) 1-forme x
tel que
x (ex ) = 1 ; x (ey ) = 0 ; x (ez ) = 0
Nous appellerons cette 1-forme dx. Ici, dx na rien dinfinitsimal, sa reprsentation
est le vecteur ligne (1, 0, 0). De la mme faon, nous dfinissons les 1-formes dy et dz.
Ainsi, dy(ax ex + ay ey + az ez ) = ay .
Un exemple de 1-forme est la force f en mcanique 4 . Quand sous laction de cette
force, un point matriel bouge du point P1 au point P2 , le travail (qui un scalaire)
de cette force est f (P1~P2 ), cest dire lapplication de la 1-forme f au vecteur P1~P2 .
Donnons nous par exemple un champ de force constant f = 2dx + 3dy et supposons
que le dplacement 5 P1~P2 = 3ex + 2ey . Alors le travail de cette force est

W = 2dx(3ex + 2ey ) + 3dy(3ex + 2ey ) = 6 + 6 = 12

Gnralisons un peu plus. De la mme faon que nous dfinissions un champ de


vecteur (pensez le champ de dplacement u(x, y, z) des points dun corps matriel sous
2. Cest la diffrence entre une personne et une photo de cette personne.
3. Utiliser ces notations demande un peu de schizophrnie de la part de ltudiant physicien, qui doit
dsapprendre ses propres notations.
4. Oui, la force nest pas un vecteur, mais un 1-forme
5. Oui, le dplacement est un vecteur.

218
16 Les formes diffrentielles et la drivation extrieure.

Figure 16.1 Comment reprsenter les 1-formes ?


6
Dans lespace 2 dimensions, une trs bonne repr-
sentation sont les lignes de flux. Ainsi, laction dune
5 1-forme sur un vecteur est le nombre de ligne que
ce vecteur coupe. Ici, nous lavons ainsi reprsent.
4 Le lecteur est dj familier avec cette reprsentation
comme courbes de niveau pour certaines 1-formes.
3 Pour ces formes l, ceci est une bonne reprsentation
du gradient, comme nous le verrons plus bas. De fa-
2
on gnrale, nous pouvons, dans un espace n di-
mensions, reprsenter les 1-formes par des hyper sur-
1
1 2 3 4 5 6
faces.

laction des forces), nous pouvons dfinir un champ de 1-forme comme par exemple

= f (x, y)dx + g(x, y)dy

Lapplication de cette 1-forme un vecteur P1~P2 produit un scalaire qui dpend non
seulement du vecteur P1~P2 , mais galement de la localisation de ce vecteur dans les-
pace 6 . Si le vecteur est petit, que le point P0 qui dsigne son milieu est de coordonnes
(x0 , y0 ), et que nous pouvons le reprsenter par le vecteur colonne (h, k)T , alors

(P1~P2 ) = f (x0 , y0 )h + g(x0 , y0 )k

A vrai dire, le mot diffrentielle dans forme diffrentielle sous-entend bien que nous
nous adressons quaux petits vecteurs ; laction des formes sur des plus grands objets
sobtient par la sommation de leurs actions sur les petits, ce quon dsigne par intgra-
tion. Nous verrons cela plus bas.

16.3 Intgration des 1-formes.


Nous avons une ide assez claire de ce que veux dire lintgrale dune fonction dune
variable sur un intervalle [a, b]. Nous devons maintenant dfinir exactement ce que lon
entend par lintgration des 1-formes le long dun chemin C reliant deux points A et B.
Gomtriquement, cela est trs simple : Donnons nous
une 1-forme , un chemin C et N + 1 points le long
de la courbe (P0 = A, P1 , ...Pi , ..., PN = B). Nous

6. Il existe une diffrence entre un vecteur abstrait, cest dire un objet appartenant un espace vectoriel,
et un vecteur gomtrique reliant deux points P1 et P2 . Les deux concepts sont fortement connects, mais
diffrents.

219
16 Les formes diffrentielles et la drivation extrieure.

dfinissons
N
X
= lim (Pi Pi+1 )
C N
i=0

En clair, nous appliquons le 1-forme tous les petits vecteurs dont lunion constitue le
chemin. Remarquez que nous avons transfr, pour lintgration ici le poids du petit
des formes aux vecteurs.
Ceci dit, comment faire lintgration concrtement ? Soit la forme = f (x, y)dx +
g(x, y)dy et le chemin C. Nous pouvons donner lquation de la courbe sous forme pa-
ramtrique x = x(t) et y = y(t) pour t [a, b]. Nous avons alors, selon les oprations
classiques de lanalyse 7 , dx = x0 (t)dt et dy = y 0 (t)dt. Nous avons alors
b
f (x, y)dx + g(x, y)dy = {f (x, y)x0 (t) + g(x, y)y 0 (t)} dt
C a

Exemple 16.1 Intgrons la forme = ydx + xdy le long du quart de cercle de rayon
1 parcouru dans le sens positif. Nous pouvons paramtriser le quart de cercle par
x = cos t et y = sin t pour t [0, /2]. Nous avons alors
/2
sin2 (t) + cos2 (t) dt

= = 0
C 0

Lintgration de ydx + xdy le long du mme chemin nous donnerai /2.

En physique, nous ne faisons souvent pas de distinction entre 1-forme et vecteur.



Ainsi, le 1-forme = adx + bdy est souvent remplac par le vecteur f = (a, b)T .
Lintgrale C est crit dans ces notations comme

f .ds
C

o ds est un lment infinitsimal et le point dsigne le produit scalaire.

16.4 les nformes et les nvecteurs.


Dans lespace, nous avons des points, des vecteurs (reliant
deux points proches), et des 1-formes. Nous pouvons mainte-
nant gnraliser ces concepts et construire des objets plus com-
plexes. Par exemple, nous pouvons construire des bi-vecteurs.
De la mme manire quun vecteur ~e peut tre utiliser pour
7. Les formes diffrentielles ne font que gnraliser les concepts danalyse.

220
16 Les formes diffrentielles et la drivation extrieure.

porter un segment de ligne orient, un bi-vecteur ~e1 ~e2 peut


tre utilis pour porter un lment de surface oriente 8 . Ainsi,
nous avons

~e ~e = 0
~e1 ~e2 = ~e2 ~e1

un bi-vecteur a toute les proprits usuelles de distributivit quon attend de lui. Par
exemple, ~e1 (~e2 + ~e3 ) = ~e1 ~e2 + ~e1 ~e3 . Si dans lespace n = 3 des vecteurs, nous
avons pris ~e1 , ~e2 , ~e3 comme lments de la base, Dans lespace des bi-vecteurs, nous
pouvons dfinir ~e1 ~e2 , ~e2 ~e3 , ~e3 ~e1 comme les lments de la base. De faon gnrale,
dans un espace n dimensions, la dimension de lespace des bi-vecteurs est n2 . Un


hasard malheureux (ou heureux, selon les points de vue) fait que si n = 3, lespace des
bi-vecteurs est de dimension 3 galement. Une certaine habitude sest alors instaure
de reprsenter le bi-vecteur par un vecteur (normale la surface), en mettant en garde
lutilisateur que ces vecteurs sont un peu anormaux, quil faut les appeler axial, etc.
Bien, les 2-formes sont de la mme manire une gnralisation des 1-forme. Une 2-
forme sapplique un bi-vecteur pour produire un scalaire de faon bilinaire. Ainsi,
la 2-forme dxdy applique 9 ~e1 ~e2 produit le nombre 1. Une 2-forme constante peut-
tre vue comme un flux ; appliqu une surface, cela produit le flux travers cette
surface.

16.5 Lintgration des kformes.


Tout ce que nous avons dit sur les 1-forme se gnralise aux k-formes. Nous appel-
lerons un ksurface un objet que lon peut paramtrer par k variables. Une courbe par
exemple est une 1-surface, une surface au sens habituel est une 2-surface, un volume
un 3-surface et ainsi de suite. Dans un espace n dimensions, nous pouvons donner un
sens trs prcis lintgration dun kforme sur un ksurface S : nous dcoupons
S en N petits lments ports par des kvecteurs ai et nous dfinissons
N
X
= lim (ai )
D N
i=0

Le calcul effectif se fait par une paramtrisation de D. Par exemple, une 2-formes dans
lespace 3d peut tre reprsente par

= f (x, y, z)dxdy + g(x, y, z)dydz + h(x, y, z)dzdx

8. Lopration est appel produit extrieur.


9. La convention est domettre le entre dx et dy.

221
16 Les formes diffrentielles et la drivation extrieure.

Pour calculer concrtement lintgrale S , on paramtrise la surface par deux va-
riables
x = a(u, v); y = b(u, v); z = c(u, v)
avec (u, v) D R2 . Nous avons alors
a a
dx = du + dv
u v
et llment dxdy par exemple devient
  
a a b b
dxdy = du + dv du + dv
u v u v
Or, comme dudu = dvdv = 0 et dudv = dvdu, nous trouvons simplement
 
a b a b
dxdy = dudv
u v v u
et ainsi pour les autres lments. La parenthse reprsente bien sr ce que nous ap-
pelons un Jacobien, cest dire le dterminant de la matrice des drives. Quand vous
passez des vecteurs e1 , e2 aux vecteurs f1 , f2 par une transformation linaire A, le d-
terminant de A est le scalaire qui relie les surfaces portes par les deux jeux de vecteurs.
Ceci est la dfinition du dterminant, indpendamment de la base choisie pour exprimer
la matrice de A. Le Jacobien apparat ici puisque nous sommes pass des dx,dy,dz aux
du,dv par une transformation linaire donne par la matrice des drives.

Connexion avec lanalyse vectorielle.


En analyse vectorielle classique, nous rencontrons souvent lintgrale dun champ
de vecteur le long dune courbe, de surface, de volume, ... Par exemple, nous savons que
le travail effectu par un champ de force le long dune courbe est appel circulation du
vecteur. Soit le vecteur f = (fx , fy , fz )T . Sa circulation C le long dune courbe C est
dfinie par
C= f .dt
C
o dt est un petit vecteur tangent la courbe au point P , et f .dt reprsente le produit
scalaire entre ces deux vecteurs. En langage de forme diffrentielles, au vecteur f est
associe la 1-forme f = fx dx + fy dy + fz dz et la circulation est simplement

C= f
C

De mme, le flux dun champ de vecteur f travers une surface S est dfinie par

= f .n.dS (16.1)
S

222
16 Les formes diffrentielles et la drivation extrieure.

o dS est un lment infinitsimal de surface, n est le vecteur normal cet lment,


et f .n reprsente le produit scalaire. En langage des formes diffrentielles, au vecteur
f = (fx , fy , fz )T est associe la 2-forme f = fx dydz + fy dzdx + fz dxdy et le flux est
simplement
= f (16.2)
S
La dfinition habituelle du flux en analyse vectorielle est problmatique cause de la
dfinition du vecteur n normal la surface en un point. A trois dimensions, un petit
lment de surface peut ventuellement tre reprsent par un vecteur (quon appelle
alors axial) ; dimension suprieure cependant, un lment de surface ne peut pas tre
reprsente par un vecteur et la dfinition (16.1) nest plus valide. La dfinition (16.2)
en terme de forme diffrentielle reste bien sr toujours valide.

16.6 La drivation extrieure.


Jusque l, les pformes ne nous ont apport rien de nouveau. Leur vrai beaut ap-
parat avec la drivation. Nous allons dabord donner la technique et nous viendrons
ensuite sur le sens.
La drivation extrieur transforme une pforme en une (p + 1)-forme. Le principe
est le suivant : quand on rencontre une expression du genre A(x, y, z, ...)dxdy..., on
prend le diffrentiel de A au sens usuel (A/x)dx + A/y)dy + ... et on multiplie
par llment dxdy... qui tait devant. Si on rencontre des dxdx, et bien cela vaut zro
et on ne sen occupe pas ; enfin, on arrange de faon cohrente les divers dxdz, ... Cela
sera sans doute plus claire travers des exemples. Dans les exemples ci-dessous, nous
prenons un espace trois dimensions.
Exemple 16.2 Soit la 0forme = f (x, y, z). Alors, trivialement,

d = (f /x)dx + (f /y)dy + (f /z)dz

Nous voyons donc que d reprsente ce quen gnral nous appelons un gradient et
notons f . Mais le gradient nest pas un vecteur, cest une 1-forme.
Exemple 16.3 Soit la 1forme = A(x, y, z)dx + B(x, y, z)dy + C(x, y, z)dz. La
drivation de la premire partie nous donne

d[A(x, y, z)dx] = [(A/x)dx + (A/y)dy + (A/z)dz] dx (16.3)


= (A/y)dxdy + (A/z)dzdx (16.4)

Nous somme pass de la premire ligne la seconde en notant que dxdx = 0 et nous
avons rarrang le dydx en dxdy. En continuant lopration sur les deux autres

223
16 Les formes diffrentielles et la drivation extrieure.

parties restantes et en regroupant les termes, nous trouvons finalement

d = [(A/y) + (B/x)] dxdy


+ [(B/z) + (C/y)] dydz
+ [(A/z) (C/x)] dzdx

Vous avez bien sr reconnu ce quen analyse vectorielle nous noterions par une ro-
tationnelle. Il suffit, pour reconnatre les notations habituelles, de remplacer A par
Fx , B par Fy et C par Fz .
Exemple 16.4 Soit la 2forme = A(x, y, z)dxdy+B(x, y, z)dydz+C(x, y, z)dzdx.
Le seul terme non nul de la drivation de la premire partie est le terme (A/z)dzdxdy
que lon rarrange en (A/z)dxdydz en permutant dabord dz et dx, ensuite dz et
dy (1 1 = 1, do le signe positif du rarrangement). En regroupant tout les
termes, nous obtenons

d = [(A/z) + (B/x) + (C/y)] dxdydz

qui, en notations vectorielles, dsignerait une divergence (Remplacer A par Fz , B


par Fx et C par Fy pour les notations habituelles).
Nous voyons donc que les divers oprateurs diffrentiels de lespace trois dimen-
sions ne sont que des formes dguises de la drivation (extrieure) des formes diff-
rentielles. Cest pour cela que le gradient, associ une 1forme, est toujours intgr le
long dune courbe, tandis que la rotationnelle, associe une 2forme, est intgre sur
une surface (on calcule toujours le flux dune rotationnelle travers une surface) ; enfin,
la divergence, associe une 3forme est toujours intgre dans un volume. Noter ga-
lement que les oprateurs diffrentielles habituels ne sont bien dfini que dans lespace
trois dimensions, tandis que la drivation des formes extrieurs se fait indpendam-
ment de la dimension et de faon presque mcanique, sans avoir apprendre par cur
quoique ce soit. Si par ailleurs, vous tes incapable de vous souvenir de la forme des
oprateurs diffrentiels dans dautres systmes de coordonnes, transformez les formes
ci-dessus en coordonnes polaire ou sphrique et drivez les pour vous convaincre de
la simplicit de manipulation des formes (voir les exercices).
Le point le plus fondamental est le corpus gomtrique que les formes nous procurent
et avec lequel nous allons nous familiariser par la suite.
Que signifie gomtriquement la drivation extrieur ? Com-
menons par la drivation dune 1-forme un point P de lespace.
Donnons nous deux petits vecteurs ~a et ~b et faisons un circuits C
autour du point P en suivant alternativement ces deux vecteurs.
Appelons I lintgrale de notre 1-forme le long de ce chemin. Nous
dfinissons alors la 2-formes d comme la 2forme qui, applique

224
16 Les formes diffrentielles et la drivation extrieure.

au bi-vecteur ~a ~b, produirait le mme scalaire I :



def
d(~a ~b) =
C

la limite quand les deux vecteurs 0. La technique que nous avons donne plus haut
calcule explicitement la 2-forme. Voyons cela de plus prs. Prenons pour simplifier la 1-
forme = f (x, y)dx + g(x, y)dy et posons ~a = (2h, 0)T et ~b = (0, 2k)T . Si (x, y) sont
les coordonnes du point P , les coordonnes du milieu du segment P1 P2 par exemple
est (x, y k). Donc,

(P1 P2 ) + (P3 P4 ) = (f (x, y k) f (x, y + k)) (2h)
f
= (4hk)
y
En calculant lapplication de aux deux autres vecteurs restants, nous trouvons fina-
lement que  
g f
= (4hk)
C x y
Ce qui est exactement ce que produit la 2-forme d applique ~a ~b.
Cette construction se gnralise aisment la drivation des nformes. Pour la dri-
vation dune 2-forme par exemples, nous nous donnons trois petits vecteurs autours
dun point P , et calculons la somme I de lapplication de la 2-forme toutes ces sur-
faces (correctement orientes). Il existe une 3-forme qui, applique au tri-vecteur en
question, produit le mme nombre et correspond bien sr notre d.

Lemme de Poincar.
Ce lemme est quelque chose de tellement vident qui na pas mrit le nom de tho-
rme ; ceci dit, nous lutilisons constamment dans divers contexte en lui donnant des
noms diffrents (par exemple les deux premires quations de Maxwell). Le voici :

d(d) = 0

Driver deux fois une kforme produit la (k + 2)forme nulle ! Prenons par exemple
une 0-forme dans lespace 2 dimensions f (x, y) et drivons l deux fois :

f f
df = dx + dy
x y
2f 2f
 
d2 f = + dxdy = 0
yx xy

225
16 Les formes diffrentielles et la drivation extrieure.

Ceci a un caractre trs gnral : quelque soit la forme que vous prenez, en la dri-
vant deux fois, vous tombez sur des expressions ou nous avons des drives secondes
croises qui apparaissent deux fois avec des signes opposes.
Si par ailleurs, le lecteur a bien compris la signification gomtrique de la drivation
extrieure, il naura pas de mal dmontrer le lemme de faon gnrale, sans faire appel
aux coordonnes.
16.1 Dmontrer pourquoi en calcul vectoriel, nous avons les identits
(f ) = 0
div( u) = 0

Changement de variable.
Une des beauts des formes diffrentielles est la facilit quelles ont grer les chan-
gements de variables, de faon presque automatique. Prenons par exemple la forme
= dxdy en coordonnes cartsiennes 2 dimensions qui nous sert mesurer laire
dune courbe ferme. En coordonnes polaire nous avons
x = r cos ; y = r sin
dx = cos dr r sin d ; dy = sin dr + r cos d
et donc = rdrd. Obtenir une forme dans un autre systme de coordonnes et juste
une question de multiplication propre des formes. Cet exemple nous sert galement
illustrer que la drivation extrieure est indpendante du systme de coordonnes
choisi. En systme cartsien, nous avons par exemple = d o = (xdy ydx)/2.
En coordonnes polaires, le mme calcul nous amne
= (1/2)r2 d
et nous voyons bien que d = rdrd. La recette pour effectuer la drivation extrieure
se charge de rendre cette opration libre des coordonnes.
16.2 Dmontrer cela de faon gnrale.

Manipulation des drivations.


La premire chose matriser, comme dans le cas de la drivation usuelle, est la rgle
de la drivation dun produit, qui scrit lgrement diffremment :

d(1 2 ) = (d1 )2 + (1)deg(1 ) 1 (d2 )


o deg mesure la dimensionnalit de notre forme. Le signe est une consquence de la
commutativit des formes :
1 2 = (1)deg(1 ) 2 1

226
16 Les formes diffrentielles et la drivation extrieure.

16.3 Dmontrer, en analyse vectorielle 3 dimensions, que

~ B)
div(A ~ = div(A)
~ B~ A.div(
~ ~
B)

Exemple fondamental : le champ lectromagntique.


Soit la 1-forme A = A0 dt+A1 dx+A2 dy+A3 dz dans lespace quatre dimension.
Nous avons lhabitude dappeler A0 = V le potentiel lectrique et A~ = (A1 , A2 , A3 )T
le potentiel vecteur. Le signe dans la coordonne associe dt est d la signature
de notre espace-temps. Nous pouvons construire la forme dA. La seule complication
est dordonner correctement les choses 4d :

dA = ((x A0 )dx + (y A0 )dy + (z A0 )dz) dt


((t A1 )dx + (t A2 )dy + (t A3 )dz) dt
+ (y A1 + x A2 ) dxdy
+ (z A2 + y A3 ) dydz
+ (z A1 x A3 ) dzdx

Nous avons pris la peine de sparer les diffrentes contributions selon les conventions
usuelles 10 . Par exemple, la 1-forme qui multiplie dt

E = (x A0 + t A1 )dx + (y A0 + t A2 )dy + (z A0 + t A3 )dz

est appel (tri-) vecteur champ lectrique et dfini (en analyse vectoriel) comme

~ =
E
~
V t A

La 2-forme qui reste (tout ce qui ne contient pas dt)

B = (y A1 + x A2 ) dxdy + (z A2 + y A3 ) dydz + (z A1 x A3 ) dzdx

~ nest pas un vrai


est appel tri-vecteur champ magntique. Nous voyons ici pourquoi B
vecteur, puisquen ralit, il est associ une 2-forme :

Bx = z A2 + y A3 ; ...

ou encore, crit dans les notations pdestres :


~ =A
B ~
10. En donnant les indices 0 3 nos coordonnes, nous avons simplement quelque chose du genre
dA = (xi Aj xj Ai ) dxi dxj
o nous nous sommes donnes quelques conventions pour ordonner correctement les paires (i, j) et sommer
les indices rpts.

227
16 Les formes diffrentielles et la drivation extrieure.

Sparer ainsi les coordonnes temporelles et spatiales nous oblige alourdir inutilement
nos notations, et pire, nous aveugler devant des vidences. Par le lemme de Poincar,
nous avons
d2 A = 0
En sparant pniblement les divers coordonnes, nous obtenons ce que lon appelle les
deux premires quations de Maxwell.
Voyons cela de plus prs. Dans la drivation de dA, nous voyons que seul les termes
de la 2-forme B produisent des 3-formes en dxdydz, ce que nous crivons, en notation
vectoriel, par
divB~ =0
En regroupant maintenant les autres termes en par exemple dxdydt, ..., nous trouvons
trois autres identits que lon crit, en notation vectorielle, par
~ = t B
E ~

Un peu plus de travail sur les formes diffrentielles nous montrerai que les deux autres
quations de Maxwell scrivent comme
d(dA) = 0 (J)
o est appel lopration de Hodge (nous verrons le sens gomtrique plus bas) et J
est la 1-forme courant lectrique : J = dt + j1 dx + j2 dy + j3 dz.

16.7 thorme de Stockes.


Le thorme fondamental de lanalyse relie lintgration de la drive dune fonction
aux valeurs de cette fonction aux bords :
b
F 0 (x)dx = F (b) F (a) (16.5)
a

Ceci est en fait une forme particulire du thorme de Stockes. Donnons nous un do-
maine 11 S de dimension p dans un espace de dimension n. Une sphre pleine ( le point
P de coordonnes (x, y, z) appartient la sphre de rayon R centre sur lorigine si
x2 + y 2 + z 2 < R2 ) est par exemple un domaine de dimension trois dans un espace de
dimension 3. La boule (z = 0, x2 +y 2 < R2 ) est un domaine de dimension 2 dans un es-
pace de dimension 3. Notons S la frontire du domaine S. La coque x2 +y 2 +z 2 = R2
du premier exemple et le cercle z = 0, x2 + y 2 = R2 du deuxime exemple sont les
frontires de leurs domaines. Le thorme de Stockes scrit

= d (16.6)
S S

11. Nous avons supposer que le domaine est compact.

228
16 Les formes diffrentielles et la drivation extrieure.

o est une (p 1)-formes. Cest pour cela par exemple que lintgrale dune fonction
(une 1-forme) le long dune courbe ferme est gale lintgrale de la rotationnelle de
cette fonction (la 2forme drive) travers la surface dlimit par cette courbe. En
ralit, cest ce thorme que les physiciens appelle thorme de Stockes

rotf .ds = f .dl (16.7)
S S

Mais nous navons pas nous limiter l. Le flux dun champ de vecteur travers une
surface S (une 2forme ) gale lintgrale de la divergence de ce champ (la 3forme
drive) dans le domaine D dlimit par la surface. En physique, nous crivons cela
comme
f .ds = divf dV (16.8)
S D
Enfin, nous avons appris que si une fonction est le gradient dune autre, alors son int-
grale le long dun chemin reliant les point A et B ne dpend pas du chemin :

gradf.dl = f (B) f (A) (16.9)
C

Comme vous le constatez, ces thormes de grad,rot et div ne sont que des applications
du thorme de Stockes aux 1,2 et 3 formes dans un espace de dimension 3.

Aperu de la dmonstration du thorme de Stockes. La dmonstration suit de


trs prs la dfinition de la drive extrieure.

16.8 Intgration par partie.


Le thorme de Stockes nous donne la possibilit de gnraliser lintgration par
partie
f g 0 dx = [f g]I f 0 gdx
I I
nimporte quelle dimension. Nous savons que

(d1 )2 = d(1 2 ) (1)deg(1 ) 1 (d2 )

Nous en dduisons que



deg (1 )
(d1 )2 = d(1 2 ) (1) 1 (d2 )
S
S S
= 1 2 (1)deg(1 ) 1 (d2 )
S S

229
16 Les formes diffrentielles et la drivation extrieure.

16.9 Un peu de gomtrie : vecteurs, 1-formes et


leurs associations.
Dans lespace n dimensions muni de coordonnes cartsiennes (x1 , x2 , ...xn ), nous
avons vu quau vecteur f = (f 1 , f 2 , ...f n )T nous pouvons associer la 1-forme
f = (f1 , f2 , ...fn )
= f1 dx1 + ...fn dxn
o tout simplement, nous avons f i = fi . Nous avons fait cela de faon intuitive sans
trop nous arrter au dtail. Une fois cette association tablie, nous pouvons tablir las-
sociation entre les kvecteur et les kformes en utilisant simplement les rgles de
manipulation du produit extrieure.
Comment gnraliser cela un systme de coordonnes non-cartsien ? Nous pou-
vons faire cela de faon fastidieuse en passant par un systme cartsien, mais nous
pouvons faire cela de faon beaucoup plus lgante et rapide en comprenant ce que la
gomtrie signifie vraiment.
Exemple 16.5 Soit le vecteur f = (f 1 , f 2 ) = f 1 ux +f 2 uy en coordonnes cartsiens.
En coordonnes polaires (r, ), nous avons
ux = cos ur sin u
uy = sin ur + cos u
et donc
f = (f 1 cos + f 2 sin )ur + (f 1 sin + f 2 cos )u
= f r ur + f u (16.10)
Par exemple, le vecteur xux + yuy scrit rur en coordonnes polaires, tandis que
yux + xuy scrit ru . Pour la 1-forme associe, nous avons en coordonnes car-
tsiennes
f = f1 dx + f2 dy
o f 1 = f1 et f 2 = f2 . Daprs ce que nous savons sur les changement de variable,
nous savons que en coordonnes polaires,
f = (f1 cos + f2 sin ) dr + r(f1 sin + f2 cos )d
= fr dr + f d (16.11)
En comparant les expressions (16.10,16.11), nous avons
fr = fr
f = rf
Noter en particulier que nous avons d(u ) = 1/r.

230
16 Les formes diffrentielles et la drivation extrieure.

Concept de distance. Revenons nos moutons et sur llment le plus important de


la gomtrie : le concept de distance. Un espace gomtrique est dfini par le concept de
distance entre deux points. Une fois donne la distance, tout le reste suit. Prenons main-
tenant des coordonnes gnrales (x1 , x2 , ...xn ) et dfinissions le carr de la distance
entre deux points voisins P = (x1 , x2 , ...xn ) et P 0 = (x1 + h1 , x2 + h2 , ...xn + hn )
par X
d`2 = gij hi hj
i,j

Les coefficients gij forment les lments dun objet quon appelle le tenseur mtrique.
En gnral, nous utilisons des coordonnes orthogonales, o les lments gij sont nuls
si i 6= j. Dans ce cas, nous pouvons poser gii = gi2 et dfinir
X
d`2 = (gi hi )2
i

Concept de vecteur et de produit scalaire. Nous navons encore jamais vraiment


dfini ce quest un vecteur. Dans un espace plat un vecteur 12 est un objet qui relie deux
points P et P 0 et que lon note par exemple par u = P~P 0 . Nous pouvons alternative-
ment crire cette relation comme P 0 = P + u.
Dans un systme de coordonnes (x1 , x2 , ...xn ), nous pouvons nous donner des vec-
teurs de base 13 ~e1 = (1, 0, 0, ...0), ~e2 = (0, 1, 0, ...). Si (a, b, c) sont les coordonnes
du point P , le point P 0 de coordonnes (a + 1, b + 3, c 1) peut scrire comme
P + ~e1 + 3~e2 ~e3 .
Nous pouvons nous donner un produit scalaire entre deux vecteurs partant dun
point P : une application bilinaire, symtrique, dfinie-positive qui deux vecteurs as-
socie un scalaire. Par exemple, dans le systme de coordonnes orthogonales (x1 , x2 , ...xn ),
le produit scalaire entre les deux vecteurs u = (u1 , ..., un ) et (v 1 , ..., v n ) est donne
par
Xn
u.v = gii ui v i
i=1

o les coefficients gii dpendent du point P auxquels les deux vecteurs sont attachs.
Probablement, la chose la plus troublante pour le lecteur qui na pas dj vu un cours
de gomtrie est le fait quun vecteur soit associ un point. Ceci provient du fait que

12. Ceci bien sr est fortement reli au concept de vecteur comme objet appartenant un espace vectoriel,
mais ceci nous entranerai loin du prsent chapitre. Disons que les vecteurs gomtriques reprsentent un
sous ensemble des groupes de transformation des points de lespace, do la notation P~P 0 , qui dsigne la
lapplication qui transforme le point P en point P 0 . Dans un espace plat, nous navons pas nous limiter aux
points voisins pour dfinir un vecteur. Dans un espace non-plat, nous dfinissons les vecteurs en un point
comme les vecteurs de lespace tangent en ce point : imaginer une sphre et le plan tangent cette sphre en
un point. Si tout cela vous parat confus, vous avez raison, cest vraiment trop rapide.
13. Habituellement, ces vecteurs sont nots symboliquement par xi .

231
16 Les formes diffrentielles et la drivation extrieure.

la plupart du temps, un espace plat muni de coordonnes cartsiennes a t utilis 14 o


gii = 1. Nous pouvons alors tablir trs facilement une quivalence entre les vecteurs
associs diffrents points et librer les vecteurs de leurs points dattache. Dans le
cas gnral cependant ceci nest pas le cas.
Si nous avons un produit scalaire entre deux vecteurs, nous nous donnons automa-
tiquement une distance entre deux points :

d(P, P 0 )2 = P~P 0 .P~P 0

et nous voyons donc apparatre le tenseur mtrique gij .


Remarquons tout de suite que la base ~e1 ... est orthogonale, mais pas norme. En effet

~ei .~ei = gii = gi2

Nous pouvons bien sr utiliser des vecteurs ~ui unitaires. Dans le systme de coordon-
nes orthogonales (x1 , x2 , ...xn ), nous avons

~ui = (1/gi )~ei (16.12)

Par exemple, en coordonnes polaire, le vecteur unitaire ~u au point (r, ) scrit (0, 1/r).

Retour sur les formes diffrentielles. Nous pouvons maintenant donner un sens
plus prcis aux formes diffrentielles. Commenons par un 0-forme, cest dire une
fonction f (P ) qui chaque point de lespace, associe un scalaire. Prenons un point
infiniment voisin P 0 = P + v o  est un scalaire et v un vecteur. Nous dfinissons la
1forme df au point P par
1
df (u) = lim (f (P + u) f (P )) (16.13)
0 
Dans le systme de coordonnes (x1 , x2 , ...xn ), soit la fonction f (P ) = xi , cest
dire une fonction qui retourne la i-me coordonnes du point P . Si ~ei est le vecteur
(1,0,...,0), alors videment,
dxi (~ei ) = 1
De mme, si ~ui est le vecteur unitaire dans la direction i, alors dxi (~ui ) = 1/gi daprs
notre relation (16.12).

Association vecteur-forme. Prenons maintenant un vecteur f . Nous souhaitons lui


associer une 1-forme f qui respecte la gomtrie. Cela veut dire que nous voulons avoir

f(f ) = f .f (16.14)

14. quon appelle euclidien

232
16 Les formes diffrentielles et la drivation extrieure.

En gnral, nous travaillons toujours avec une base orthonormale pour reprsenter le
vecteur f (voir lexemple du dbut de cette section). Supposons que dans cette base
orthonormale, nous ayons
f = f 1 ~u1 + ... + f n ~un
alors la simple application de la contrainte (16.14) nous amne

fi = gi f i

de mme, si nous appelons g i = 1/gi , nous avons

f i = g i fi

Dans lexemple du dbut, nous avions trouv la relation entre vecteur et forme en co-
ordonnes par le passage par les coordonnes cartsiennes. Nous aurions pu remarquer
simplement que la distance entre deux points (r, ) et (r + h, + ) et

d`2 = h2 + r2 2

et donc grr = 1, g = r2 , donc fr = gr f r = f r et f = g f = rf .

Application : le gradient. En analyse vectorielle, nous avons un vecteur que nous


appelons gradient. Soit la fonction f (x). Trouver son gradient en coordonnes gnra-
lises.
Nous avons
X f
df = dxi
xi
Le vecteur associ cette 1-forme sappelle le gradient f . Nous avons donc
f
(f )i = g i
xi
Par exemple, en coordonnes polaires, le gradient scrit
f 1 f
f = ur + u
r r

Le rotationnel. Soit le vecteur trois dimensions f (x). Trouver le vecteur rota-


tionnel qui lui est associ.
A ce vecteurs, nous associons la 1-forme

f =
X
gi f i dxi

et donc
3 
(gj f j ) (gi f i )

df =
X
dxi dxj
i=1
xj xi

233
16 Les formes diffrentielles et la drivation extrieure.

o nous avons pos j = i + 1 pour dcrire correctement une permutation circulaire. A


la 2-forme df, nous associons le bi-vecteur
3
(gj f j ) (gi f i )
 
X 1
= ~u1 ~u2
gg
i=1 i j
xj xi

A trois dimensions, au bi-vecteur nous pouvons associer un vecteur axial que nous
appelons rotationnel :

(gj f j ) (gi f i )
 
1
f = ~uk
gi gj xj xi

o k = i + 2(mod)3.

La divergence. Le calcul de la divergence procde de la mme faon. Il faut seule-


ment noter que la divergence est dfinie pour un n 1 forme. En analyse trois di-
mensions, le vecteur f est en fait un bi-vecteur, auquel on doit associer une 2-formes
et prendre la drive extrieure de celle-ci. Soit f = f 1 ~u1 + ...En fait, le premier terme
reprsente en ralit f 1 ~u2 ~u3 auquel est associe
 1 la2 2-forme g1 g2 f 1 dx2 dx3 dont la
1 3
drive extrieure est la 3-forme x1 g1 g2 f dx dx dx . A cette 3-forme est associ
le tri-vecteur
 
1
x1 g1 g2 f 1 + ... ~u1 ~u2 ~u3

divf =
g1 g2 g3
le triple produit vectoriel, au signe prs vaut 1. Le signe dpend de lorientation de les-
pace. Bien sr, un 3-vecteur ne peut pas valoir un scalaire, mais lespace des 3-vecteurs
est de dimensions 1, et nous les associons donc aux scalaires.

16.10 Loprateur de Hodge.


Un oprateur diffrentiel fondamental dont nous navons pas encore parl est le la-
placien. Nous savons quen analyse vectoriel, cet oprateur est reli une drive se-
conde, mais nous ne pouvons videment pas lutiliser tel quel, puisque daprs le lemme
de Poincar, pour une kforme , d(d) = 0. Loprateur de Hodge nous permet de
donner un sens prcis au laplacien pour les k-forme.
Dans lespace n dimension, il existe une nforme fondamentale que nous appelons
volume. Dans un espace plat muni de coordonnes cartsiens xi , la nforme volume
est simplement
= dx1 ...dxn
Insistons nouveau : cette nforme est un objet intrinsque ; dans une autre base,
elle scrirait autrement. Une fois quon la fixe, on fixe en ralit la gomtrie de notre

234
16 Les formes diffrentielles et la drivation extrieure.

espace 15 . En coordonnes orthogonales gnraliss, nous avons

= gdx1 ...dxn

o g est la racine carr du dterminant du tenseur mtrique, autrement dit, dans les
notations de la sous section prcdente,

g = g1 g2 ...gn

Loprateur de Hodge ? associe (de faon unique) une kforme = dx1 ...dxk une
(n k)forme ? telle que
() =
Nous avons pas mal utilis cet oprateur sans lui donner un nom. Prenons lespace
n = 3 muni de coordonnes cartsiens o g = 1. Alors, par exemple,

dx = dydz
dy = dzdx
dz = dxdy

Nous voyons alors que dxi (dxi ) = 1dxdydz pour i = 1, 2, 3. La seule petite com-
plication est de bien grer le signe, cest dire le degrs de permutation que cela nous
impose. Prenons maintenant une fonction f (x, y, z), cest dire une 0forme. Nous
avons alors
f f f
df = dx + dy + dz
x y z
f f f
df = dydz + dzdx + dxdy
x y z
 2
2f 2f

f
d(df ) = + + dxdydz
x2 y 2 z 2

Et nous voyons que d(df ) nous donne bien le laplacien sous forme dune 3-forme.
Comme nous connaissons les changements de variables et les associations forme-vecteur,
nous pouvons crire le laplacien dans nimporte quelle systme de coordonnes.
Nous navons bien sr par nous restreindre aux 0forme et nous pouvons ainsi
gnraliser le laplacien dun champ de kforme. Lexemple fondamental est encore
llectromagntisme, o laction et le lagrangien du champ A sont donns par

S= {dA(dA) + A()} (16.15)
V

15. Se donner la nforme volume ou se donner un produit scalaire sont quivalents

235
16 Les formes diffrentielles et la drivation extrieure.

o est la 1forme dcrivant la distribution des charges (voir ci-dessous). Une variation
sur A nous donne alors simplement
d(A) =
ce qui constitue les deux dernires quations de Maxwell (voir exercice).

16.11 Quelques applications.


16.11.1 quation de conservation.
Vous rencontrez cette quation partout en physique, sous des formes diverses et va-
ries. Elle dit simplement que la variation de quelque chose dans un volume gale
la quantit de ce quelque chose qui entre dans ce volume moins la quantit de ce
quelque chose qui en sort. Le quelque chose peut tre la concentration dune sub-
stance, lnergie emmagasine dans le volume, une probabilit de prsence, ... 16 Les
systmes qui obissent cette loi sont dits conservatif s. La quantit entrante moins la
quantit sortante se dit flux. Notons par le quelque chose et par J son flux. Appli-
que un volume infinitsimal dxdydz, lquation de conservation scrit
/t + divJ = 0 (16.16)
Si nous parlons dun fluide en mouvement, alors (x) est la concentration en un point
de lespace, v(x) la vitesse du fluide et J = (x)v(x). Dans le cas dune substance qui
diffuse, le flux J est proportionnel au gradient de la concentration 17 (la chaleur diffuse
du chaud vers le froid, lencre se dilue dans leau,...) J = Kgrad, ce qui, rinject
dans lquation de conservation, nous donne lquation de diffusion /t = K2 .
En langage des formes, cette quation acquiert une interprtation gomtrique. Pre-
nons dabord le cas de lespace une dimension spatiale et une dimension temporelle,
et considrons un lment infinitsimal dt, dx (les deux cots dun carr dans lespace-
temps, si vous voulez) et la forme = dx Jdt 18 . Lquation de conservation nest
alors rien dautre que
d = 0
A 3+1 dimensions (ou plus si affinit), il faut considrer la forme
= dxdydz (Jx dydz + Jy dzdx + Jz dxdy)dt
Cette forme est analogue ce quen physique nous appelons un quadri-vecteur. Nous
verrons plus bas une application de ce concept au champ lectromagntique.
16. Le quelque chose peut tre largent dune entreprise, et les comptables sont responsable, sur leur denier
personnel, de faire respecter cette loi. Ltudiant en physique perd au plus quelques points lexamen.
17. Cela se dmontre facilement en physique statistique et sappelle la rponse linaire.
18. Le signe - vient de notre convention de compter en ngatif le flux entrant. Cela parat aussi arbitraire
que la charge de llectron. Historiquement, cela vient du fait que la surface est oriente pour que la normale
pointe vers lextrieur.

236
16 Les formes diffrentielles et la drivation extrieure.

1.5

1.0

0.5

-1.5 -1.0 -0.5 0.5 1.0 1.5

-0.5

-1.0

-1.5

Figure 16.2 Une feuille donne par lquation r = 1+(1/2) cos(4)+(1/5) cos(16)

Exercices.
16.4 Primtre et surface. Soit A laire enferme par une courbe C. Dmontrer que nous
avons
A = (1/2) xdy ydx
C
En dduire que laire dune ellipse est ab, o a et b sont les axes majeur et mineur. Comment
cette expression est relie lexpression habituelle
b
A= f (x)dx
a

de la surface entre une courbe et laxe x ?

16.5 Air dune courbe ferme. Nous souhaitons calculer lair enferme par une courbe C
donne en coordonnes polaires par lquation
N
X
r() = an cos(n)
n=0

dont un exemple est donn par la figure 16.2.


2
1. Dmontrer que 0 cos2 (n)d = si n 6= 0 et 2 si n = 0. De mme, dmontrer que
2
0
cos(n) cos(m)d = 0 si m 6= n.
2. Dmontrer que la 2-forme diffrentielle = dxdy drive de la 1-forme = (1/2)(xdy
ydx).
3. Donner lexpression de et en coordonnes polaires.
4. Vrifier quen coordonnes polaires, nous avons bien = d.
5. En utilisant la forme polaire de ces formes, et en utilisant le thorme de Stockes, dmon-
trer que lair enferme par la courbe vaut
N
!
2
X 2
A = a0 + (1/2) an
n=1

237
16 Les formes diffrentielles et la drivation extrieure.

16.6 Volume. Dmontrer que la 3-forme volume dxdydz drive de la 2-forme


1
(xdydz + ydzdx + zdxdy)
3
en dduire le volume dune sphre, dun ellipsode de rvolution et dun ellipsode gnrale.

16.7 Association bi-vecteur, 2-forme. Dans un espace 3 dimensions, donner la relation


entre bi-vecteur et 2-formes en en coordonnes gnralises orthogonale. Utiliser ce rsultat
pour trouver lassociation en coordonns cylindriques et sphriques.

16.8 Oprateurs diffrentielles en analyse vectorielle. Trouver lexpression du laplacien


n = 3 en coordonnes gnralises orthogonales. Utiliser ce rsultat pour trouver ce rsultat
en coordonnes cylindriques et sphriques.

16.9 DAlembertien. Dans lespace-temps (n = 4), la 4-forme volume est donne en coor-
donnes cartsienne par
= dtdxdydz
tant donnes la fonction f (t, x, y, z), donner lexpression de d(df ). Cest ce que lon appelle
couramment le DAlembertien qui gouverne toutes les quations dondes.

16.10 quations de Maxwell. En partant du lagrangien (16.15), faire une variation sur A,
intgrer par partie les formes rsultantes pour dduire les quations du Maxwell en prsence du
champ.

quelques exemples dintgration des formes.


est ce que dw = 0 implique w = d? exemple pratique sur le rot.
quation de maxwell complte
transformation de Lorentz et les quations de Maxwell, la modification du courant,
relativit
dmonstration de stockes pour les deux formes.
loprateur *, le laplacien d(df ), en dduire le laplacien en coordonnes curviligne, le lien
entre la minimisation de df df et d(df ) = 0. ventuellement, si possible, faire le lien avec
le chapitre prcdent et le calcul des surfaces minimales.
Peut tre faire une vague introduction la gomtrie des surfaces et la relation avec les cour-
bures.
Faire le lien avec les tenseurs antisymtriques du prochain chapitre.

238
17 Thorie des fonctions
analytiques.
17.1 Introduction.
De trs bon livres sont consacrs la thorie des fonctions complexes, nous ne don-
nerons ici quun trs bref aperu pour donner le rudiment ncessaire la manipulation
de ces fonctions. Le lecteur intress pourra, (devra) se reporter un livre consacr
ce thme pour goter toute la beaut de ces fonctions.
Dans ce chapitre, nous allons tudier les fonctions dune variable complexe f (z),
en tendant ce que nous savons de la thorie des fonctions relles. Le lecteur est dj
quelque peu habitu cette thorie, puisque lutilisation par exemple de la fonction
exp(z) ne lui pose pas de problme.
Dans ce que nous allons voire, certains aspects des fonctions analytiques peuvent
paratre miraculeux compars ce que nous savons sur les fonctions relles. Avant
daller plus loin, jaimerai relever le caractre miraculeux.
La premire surprise que lon verra plus bas dans les fonctions analytiques est quil
suffit de les connatre dans un petit domaine pour les connatre partout ! Cest comme
si en retrouvant un morceau dune dent dun fossile, on arrivait reconstituer jusqu
la moindre dtail lorganisme entier.
Ceci nest pas du au caractre complexe, mais la dimensionnalit. Prenons une
fonction relle f (x) infiniment drivable au point x0 et dont nous connaissons toutes
les drives. Nous pouvons alors connatre la valeur de la fonction en un point proche
x1 = x0 + h :
X
f (x1 ) = f (n) (x0 )hn /n!
n=0

Lennui est quen gnral, nous ne pouvons pas nous loigner trop du point x0 : pour des
valeurs h un peu trop grand, il se peut trs bien que la srie diverge. Comme exemple,
considrer par exemple la fonction (1 x)1 dont la srie de Taylor pour x0 = 0
diverge pour x 1. Le point x = 1 est une barrire infranchissable sur laxe relle.
Or, pour les fonctions complexes, le point z = 1 est un point que lon peut contourner
, puisque nous avons deux dimensions notre disposition.
La deuxime surprise est la caractre infiniment drivable des fonctions analytiques.
Pour une fonction relle, le fait dtre une fois drivable ne donne pas dobligation

239
17 Thorie des fonctions analytiques.

particulire et la fonction peut ne pas possder de driver seconde. Par contre, pour
les fonctions complexes, le concept de drivation est plus contraignant : la drivabilit
impose des relations entre les composantes tellement fortes que la fonction devient infi-
niment drivable 1 . Cela a galement dautres consquences. Par exemple, une fonction
analytique ne peut pas tre borne dans le plan 2 !

17.2 Les fonctions complexes.


Nous allons dans ce chapitre tudier dun peu plus prs les fonctions complexes f :
C C. Ce sont des machines qui prennent un nombre complexe en entre et en
produisent un nombre complexe en sortie. A priori, nous pouvons voir les fonctions
complexes comme des fonctions de R2 R2 : un nombre complexe z nest quune
collection de deux nombres relles (x, y) quon crit par convention x+iy. Considrons
par exemple la fonction complexe

f (z) = z 2

Si nous crivons z = x + iy, alors z 2 = (x2 y 2 ) + 2ixy et au lieu dtudier la fonction


ci-dessus, nous pouvons tudier les deux fonctions

u(x, y) = x2 y 2
v(x, y) = 2xy

simultanment ou sparment. Mais en faisant cela, nous nous priverions dun rsul-
tat important : nous ne dfinissons pas priori lopration multiplication entre deux
couples de relle. Mais pour lensemble C, lopration multiplication (et bien sr laddi-
tion) a un sens. Nous disons que nous avons muni C dune structure algbrique, et cela
nous permet de faire la mme chose avec les nombres complexes que nous faisons avec
les nombres rels.

17.3 Les fonctions analytiques.


Nous allons aller un peu plus loin et nous restreindre aux fonctions analytiques. Une
fonction f : C C est analytique au point z si dabord f est continue en z et quil
existe une constante A tel que

f (z + h) = f (z) + A.h + O(h2 ) h


1. Parfois, des contraintes apparemment bnignes ne le sont pas tant que cela. Nous avons vu un exemple
avec lespace L2 des fonctions : la simple contrainte dintgrabilit rduit fortement lensemble des fonctions
et permet de disposer dune base dnombrable.
2. moins dtre une constante. Ceci impliquera quun polynme de degr n doit avoir n racines com-
plexes, comme nous le verrons plus bas.

240
17 Thorie des fonctions analytiques.

cest a dire quen gros, les petits dplacements autour du point z provoquent un change-
ment proportionnel aux dplacements dans la fonction f (z). Cela parat une gnralisa-
tion anodine de la drive des fonctions relles, il nen est rien. Le mot proportionnel ici
utilise les multiplications dans C et les consquences sont profondes. Citons quelques
consquences tranges :
1. Une fonction analytique dans un domaine D est infiniment analytiques : toutes
ses drives sont analytiques.
2. Connaissant la fonction dans une petite rgion D, on la connat partout dans le
plan complexe 3
3. Intgrer une fonction analytique sur un contour ferm revient calculer une
quantit reli la fonction en quelques points seulement.
Voyons donc dabord ce que veut dire analytique. Notons z = x+iy et f (z) = u(x, y)+
iv(x, y) (les parties relles et imaginaire de la fonction f ) et h = hx + ihy . Alors, par
dfinition,
u(x + hx , y + hy ) u(x, y) + i (v(x + hx , y + hy ) v(x, y))
A = lim
h0 hx + ihy

Il suffit maintenant de dvelopper les deux fonctions u et v lordre 1 en hx et hy et


considrer les deux cas hx = 0 et hy = 0 pour voir que A est dfini de faon unique si
et seulement si
u v
= (17.1)
x y
u v
= (17.2)
y x
Autrement dit, pour quune fonction complexe soit analytique, ses parties relle et ima-
ginaire doivent tre intimement lies via les relation (17.1,17.2). Notons que cela a pour
consquences que u = v = 0, cest dire que les deux fonctions doivent tre
harmonique.

Exemple : dmontrer que les fonctions f (z) = z, z 2 , exp(z) sont analytique dans le
plan entier, mais que la fonction f (z) = z ne lest nulle part.

17.4 Intgration dans le plan complexe.


La dfinition de lintgrale dans le plan complexe est hrit directement de lintgra-
tion dans R : Soit une courbe C reliant deux point zA et zB . Nous dcoupons la courbe

3. Imaginer reconstituer une voiture, peinture y compris, en observant la trace des pneus.

241
17 Thorie des fonctions analytiques.

en N morceaux, chaque morceaux tant une courbe Ci reliant le point zi au point zi+1
le long de la courbe C. Soit dzi = zi+1 zi . Alors, lintgrale est dfinie par
XN
f (z)dz = f (zi )dzi
C i=1

quand N et max(|dzi |) 0.
Bien sr, il serait extrmement peut pratique dutiliser cette dfinition pour calculer
effectivement une intgrale. Mais une courbe nest quun objet unidimensionnel, nous
pouvons donc ramener le calcul de lintgrale complexe ce que nous savons faire en
rel, via une paramtrisation de la courbe : Donnons nous une variable relle t [a, b]
et une fonction complexe z = z(t) drivable telle que quand t parcourt lintervalle
[a, b], z parcourt la courbe C. Alors,
b
f (z)dz = f (z(t))z 0 (t)dt (17.3)
C a
La thorie dintgration nous assure bien sr que lintgrale ne dpend pas du choix du
paramtre t.
Exemple 17.1 Intgrer 1/z le long du cercle |z| = 1. Nous pouvons paramtrer le
cercle par z = ei , [0, 2], auquel cas z 0 () = iz() et
2
dz/z = id = 2i
|z|=1 0

Le lecteur peut vrifier que lintgrale sur le mme cercle de la fonction f (z) = z n ,
i 2
n 6= 1 n Z donnera zro. Nous aurions aussi pu paramtrer le cercle par z = e
, [0, 2], le lecteur vrifiera que cela ne change rien.
Exemple 17.2 Lintgrale de la fonction 1/z le long du demi-cercle suprieur C1 :
|z| = 1, Im(z) 0 , z0 = 1, z1 = 1 en utilisant la mme paramtrisation vaut

dz/z = i = i
C1 0

tandis que la mme intgrale, mais pris le long du cercle infrieure C2 , nous donne

dz/z = i = i
C2 0

Exemple 17.3 Intgrer la fonction z 2 le long de la droite C1 menant de z0 = 0


z1 = 1 + i. En posant z = (1 + i)t, nous avons
1
2
z dz = (1 + i)2 t2 (1 + i)dt
C1 0
1
(1 + i)3 t3 /3 0 = (1 + i)3 /3

=

242
17 Thorie des fonctions analytiques.

Pour intgrer la mme fonction le long du quart de cercle C2 : |z i| = 1 menant


au mmes points finaux nous pouvons utiliser le paramtrage z = i + exp(i), dz =
i exp(i)d. Nous aurons alors
0
z 2 dz = (i + exp(i)) 2 i exp(i)d
C2 /2

Ce qui en dveloppant les parenthses, nous donne nouveau (1 + i)3 /3. Le lecteur
pourra vrifier que lintgration de la fonction z 2 le long de nimporte quel courbe
simple ayant les mmes points finaux donnera toujours le mme rsultat.
En comparant les exemples 17.2 et 17.3, nous voyons une diffrence fondamentale :
dans le deuxime cas, lintgrale ne dpend pas de la courbe reliant les deux points z0
et z1 , mais seulement de ces deux points. Dans le premier cas au contraire, deux trajets
reliant les deux points finaux donnent des intgrales diffrentes. Ce qui fait la diffrence
entre ces deux cas et le point fondamental de la thorie des fonctions analytiques : Dans
le premier cas, la fonction 1/z nest pas analytique en z = 0 et les deux courbes C1
et C2 sont de part et dautre de la singularit. Dans le deuxime cas, z 2 est analytique
partout, et lintgrale ne dpend pas du trajet. Cela nous mne au :

Thorme fondamental de lintgration (Cauchy-Goursat). Si la fonction f (z)


est analytique dans un domaine D et si la courbe ferme C est lintrieure de ce
domaine, alors
f (z)dz = 0
C

Pour dmontrer la version light de ce thorme, nous supposons que f 0 (z) est conti-
nue dans le domaine D. Dans ce cas, en notant f (z) = u(x, y) + iv(x, y) et dz =
dx + idy, nous avons

f (z)dz = udx vdy + udy + vdx
C C C

Prenons la premire intgrale, et appelons R le domaine enclos par la courbe C. Dans


ce cas, nous pouvons appliquer le thorme de Green (ou de Stockes) connu pour lin-
tgration dans le plan :

u v
udx vdy = ( + )dxdy
C R y x

mais le terme entre parenthse est nul cause de lanalycit de la fonction f . Le mme
raisonnement tient pour le second intgrande, et achve la dmonstration.
Cette dmonstration nest pas trs bonne, puisquelle exige la continuit de f 0 (z)
priori. Ce pr-requis est de trop, ce qui a t dmontr par Goursat vers 1900.

243
17 Thorie des fonctions analytiques.

B
5 6
4
3
2
1
A

Figure 17.1 Intgration dune fonction f (z) entre deux points A et B le long dun
chemin i. Les points singuliers de la fonction sont marqus par les tiges
verticales. Les chemins qui peuvent se dformer les uns dans les autres
sans traverser les tiges donnent la mme valeur pour lintgrale de f (z).
Ici les chemins 1 et 2 ; 3 et 4 ; 5 et 6 sont quivalent.

La consquence direct de ce thorme est que dans un domaine D o f (z) est ana-
lytique, son intgrale entre deux points A et B ne dpend pas du chemin dintgration
, mais seulement des points A et B :

f (z)dz = f (z)dz
C1 C2

C1 et C2 tant deux chemins quelconques reliant A et B. En effet, considrons la courbe


ferme C form de lunion de C1 et de C2 , cest dire de C2 parcouru dans le sens
inverse. Dans ce cas,

f (z) = 0
C

= f (z)dz + f (z)dz
C1 C2
= f (z)dz f (z)dz
C1 C2

Limage quil faut retenir est le plan complexe o les points de singularit pour la fonc-
tion f (z) constituent des tiges verticaux : les chemins dintgration peuvent tre d-
forms souhait sans modifier le rsultat dintgration tant quils ne croisent pas une
tige (figure 17.1).

17.5 Consquences du Cauchy-Goursat.


Le thorme de Cauchy-Goursat a des consquences profondes do coule lessence
de la thorie des fonctions analytiques. Nous numrons les trois plus importantes.

244
17 Thorie des fonctions analytiques.

C
C
.z
D

Figure 17.2 Formule intgrale de Cauchy : les intgrales de la fonction f ()/ z


sur les deux courbes C et C 0 sont gale.

17.5.1 Connatre localement = Connatre globalement.


Ceci est probablement la proprit la plus frappante des fonctions analytiques : connatre
la valeur dune fonction analytique sur une courbe ferme C revient connatre la va-
leur de cette fonction partout lintrieur du domaine enclos par cette courbe. De plus,
la relation entre les valeurs de la fonction sur la courbe et la valeur de la fonction en un
point z lintrieur du domaine est trs simple : la valeur de f en z est la somme des
valeurs que prend f sur la courbe, pondres par les sparations ce point (la courbe
est parcourue dans le sens positif) :

1 f ()
f (z) = d
2i C z

Ceci est connu comme la formule intgrale de Cauchy. Pour le dmontrer, il suffit de
considrer la courbe C et le cercle C 0 de rayon  centr autour du point z (figure 17.2).
Dans le domaine D entre les deux courbes, la fonction f ()/( z) (considre comme
une fonction de ) est analytique ; daprs Cauchy-Goursat donc, son intgrale le long
des deux courbes donne le mme rsultat. Le long de la courbe C 0 , nous pouvons utiliser
le paramtrage = z +  exp(i), ce qui nous donne :
2
f () f (z + ei ) i
d = ie d
C0 z 0 ei
2
f (z) + f 0 (z)ei + O(2 ) d

= i
0

245
17 Thorie des fonctions analytiques.

Nous pouvons choisir le cercle autour de z aussi petite que lon veut. Quand  0, le
2
seul terme qui contribue 4 lintgrale est le premier : if (z) 0 d = 2if (z). Cela
dmontre donc la formule intgrale de Cauchy. Lessentiel est de retenir que nous avons
pu dmontrer ce thorme parce que nous avons pu ramener lintgration le long de C
lintgration le long de C 0 , une consquence directe du Cauchy-Goursat.
Rflchissons un peu sur la formule intgrale. En analyse relle, il ne suffit pas de
connatre la valeur dune fonction en deux points (dimension 0) pour la connatre en
tout point de lintervalle (dimension 1). Dans le plan complexe, il suffit de connatre la
valeur de la fonction analytique le long dune courbe (dimension 1) pour la connatre
partout lintrieur de la courbe(dimension 2). Ce rsultat ne sapplique videmment
pas lensemble des fonctions complexes, seulement aux analytiques.

17.5.2 Les fonctions analytiques sont infiniment lisse.


En analyse relle, disposer dune drive premire ne garantit en rien de pouvoir
disposer des drives dordre suprieure ; il suffit par exemple de considrer la fonc-
tion |x3 | qui possde une drive premire en x = 0, mais pas de drive seconde. Les
fonctions analytiques par contre ont cette proprit fort sympathique dtre infiniment
drivable. Plus exactement, si f () est analytique dans un domaine D, y compris sur sa
frontire C, alors elle possde des drives de toute ordre, qui sont elles mme analy-
tiques. Encore plus fort, nous pouvons les calculer exactement par une formule drive
de la formule intgrale de Cauchy :

(n) n! f ()
f (z) = d (17.4)
2i C ( z)n+1
Nous pouvons voir cela comme une gnralisation de la formule intgrale de Cauchy
qui correspond au cas n = 0. La dmonstration est assez simple ; nous le montrons pour
f 0 (z) qui se gnralise trivialement aux drives suprieures. Prenons deux points z et
z1 assez proche et un circuit C dans le domaine D qui les englobes tous les deux. Nous
avons :

1 f ()
f (z) = d
2i C z

1 f ()
f (z1 ) = d
2i C z1
4. Notons pour le lecteur qui nest pas habitu au symbole O que ce raisonnement est rigoureux. Pour une
fonction analytique, par dfinition nous avons f (z + h) = f (z) + f 0 (z)h + R(z, h)h2 o R(z, h) Cte
quand h 0. Cela veut dire que nous pouvons rendre |R(z, h) Cte| aussi petite que lon veut, pourvu
que lon choisissent |h| assez petit. Ce qui veut dire que nous pouvons toujours trouver une constante C tel
que pour  suffisamment petit,
2
R(z, ei )2 e2i d < C2 (2)



0
Nous laissons au lecteur le soin dhabiller et de finir la dmonstration dans toute sa rigueur.

246
17 Thorie des fonctions analytiques.

En formant maintenant (f (z)f (z1 ))/(zz1 ) ( et en entrant 1/(zz1 ) dans lintgrale


sur ) et en faisant un peu dalgbre, nous obtenons :

f (z) f (z1 ) 1 f ()
= d
z z1 2i C ( z)( z1 )
qui tend bien vers la formule annonce quand z1 z.

17.5.3 Les dveloppements de Laurent.


Les sries de Taylor ont un quivalent autrement puissant pour les fonctions analy-
tiques, appel dveloppement de Laurent. Considrons deux cercles de rayons R1 et R2
(R1 < R2 ) centrs sur un nombre z0 et la fonction f (z) analytique dans la couronne
forme par les deux cercles. Soit C un circuit compris entre les deux cercles. Alors nous
avons
+
X
f (z) = An (z z0 )n (17.5)

o les coefficients An sont donnes par



1 f ()
An = d (17.6)
2i C ( z0 )n+1
De plus, la convergence de la srie (17.5) est uniforme. Comme nous savons par ailleurs
que les drives (et primitives) de toutes ordres existent, nous pouvons les obtenir en
drivant (ou intgrant) terme terme la srie 5 .
Avant de dmontrer ce thorme, faisons quelques commentaires. Premirement,
pour dvelopper une fonction en srie autour dun point, nous navons pas besoin que
cette fonction soit drivable en ce point ; cela rend les dveloppement de Laurent au-
trement plus gnrale que les dveloppement de Taylor.
Ceci dit, si la fonction f (z) est analytique, alors tout les coefficients An pour n < 0
sont nul et on retrouve les dveloppement de Taylor habituel. Pour voir cela, il suffit
de remarquer que les An n < 0 sont des intgrales sur un circuits ferm du produit de
f () par un polynme ( z)m . Ces deux fonctions tant analytiques, lintgrale est
nulle par Cauchy-Goursat. Pour les n 0, nous avons (eq.17.4)
An = (1/n!)f (n) (z0 )
Ce qui nous redonne bien les dveloppement de Taylor habituel.
Pour dmontrer la relation (17.5), nous devons dabord tablir que

1 X
= z n |z| < 1
1 z n=0

5. Elle est pas belle la vie ?

247
17 Thorie des fonctions analytiques.

ce qui se dmontrer trs facilement en remarquant que


N
X 1 z N +1
zn =
n=0
1z

qui converge bien vers 1/(1 z) pour |z| < 1.


Considrons maintenant le domaine D dlimit par les deux courbes et les deux
droites qui les rejoignent (fig.). A lintrieur de ce domaine,

1 f ()
f (z) = d
2i C z

1 f () 1 f ()
= d d
2i C2 z 2i C1 z
Considrons la premire intgrale. Nous pouvons crire
f () f ()
=
z z0 (z z0 )
 n
f () X z z0
=
z0 n=0
z0

puisque |z z0 / z0 | < 1. Cela nous donne donc


 
X 1 f ()
f (z) = n+1
d (z z0 )n
n=0
2i C2 ( z0 )

En faisant la mme chose pour la deuxime intgrale sur C1 , mais en dveloppant en


puissance de ( z0 )/(z z0 ), nous trouvons
1  
X 1 f ()
f (z) = n+1
d (z z0 )n
n=
2i C1 ( z0 )

Mais la fonction f ()/( z0 ) est analytique dans la couronne dlimit par les deux
cercles C1 et C2 , on peut donc ramener lintgration sur ces deux cercles une in-
tgrale sur nimporte quel chemin ferm contenu entre les deux et retrouver ainsi le
dveloppement de Laurent tel quannonc.
Exemple : exp(z), exp(1/z), exp(t(z 1/z)) en Bessel, ... [To complete].

17.6 Les rsidus et leur application lintgration.


Nous avons souvent, en analyse relle, calculer des intgrales du genre

f (x)dx
I

248
17 Thorie des fonctions analytiques.

Nous connaissons quelques mthodes (changement de variable, intgration par partie)


qui avec beaucoup dentranement nous permettent, dans certains cas, de nous en sortir.
Nous allons apprendre ici calculer facilement
quelques cas supplmentaires. La
mthode est la suivante : au lieu de calculer I f (x)dx, nous calculerons C f (z)dz
o C est un circuit ferm dans plan complexe qui contient I. Nous faisons cela quand
lintgrale sur C est facile effectuer (voir plus bas) et quand lintgrale sur la partie
du C qui ne contient pas I est nulle ou trs facile valuer. Voyons cela de plus prs
maintenant.

17.6.1 Les rsidus.


Dans le dveloppement de Laurent et ses coefficients (17.6), il na pas chapp au
lecteur que le coefficient A1 joue un rle particulier, puisque

A1 = (1/2i) f ()d
C

la valeur de
On peut dire linverse que si lon connaissait ce coefficient, on connatrai
lintgrale. Le rle particulier jou par A1 est bien sr li au fait que C z n dz est non
nulle seulement pour n = 1. Le coefficient A1 est appel le rsidu de la fonction f
en z0 et not
A1 = Res[f (z), z0 ]
Il est donc vident que connatre les rsidus dune fonction est une donne prcieuse.
Voyons quelques exemples.
Exemple 17.4 Res(1/z(z + 1), 0). En z = 0, la fonction 1/(z + 1) est analytique et
nous pouvons la dvelopper en srie de Taylor

1/(z + 1) = a0 + a1 z + ...

o a0 = 1/(z + 1)|z=0 = 1. Nous pouvons donc crire


1 1
= (a0 + a1 z + ...)
z(z + 1) z

et donc
Res(1/z(z + 1), 0) = 1

Exemple 17.5 Res(1/z(z +1), 1). En z = 1, la fonction 1/z est analytique et donc

1/z = a0 + a1 (z + 1) + a2 (z + 1)2 + ...

o a0 = 1/z|z=1 = 1. Par consquent, Res(1/z(z + 1), 1) = 1.

249
17 Thorie des fonctions analytiques.

Nous pouvons bien sr systmatiser cet approche. Soit la fonction


N (z)
f (z) =
(z z0 )m
o N (z) est analytique. La fonction possde un ple dordre m en z0 . En dveloppant
N (z) lordre m 1 en z0 , nous voyons que

N (m1) (z0 ) 1
f (z) = ... + + ...
(m 1)! z z0
et donc
Res(N (z)/(z z0 )m , z0 ) = N (m1) (z0 )/(m 1)!
Par exemple,
Res(sin z/z 2 , 0) = 1
On gnralise cela trivialement une fonction rationnelle quelconque
N (z)
f (z) =
D(z)
o N (z) et D(z) sont analytique et D(z) possde un zro dordre m en z = z0 :
D(z) = (D(m) (z0 )/m!)(z z0 )m + .... Nous avons alors
Res(N (z)/D(z), z0 ) = mN (m1) (z0 )/D(m) (z0 )
En particulier, si le zro de D(z) est dordre 1, nous avons simplement Res = N (z0 )/D0 (z0 ).
Exemple 17.6 Calculer les rsidus de (exp kz)/(z 2 + a2 ). Daprs ce que nous avons
dit, elles valent exp(ika)/(2ia).

17.6.2 Application lintgration.


Nous allons considrer plusieurs cas.

Les fonctions trigonomtriques. Nous allons considrer les intgrale du type


2
I= R(sin , cos )d
0
6
Comme par exemple
2
1
I1 = d ; a > 1
0 a + cos
6. Le lecteur se souvient que le changement de variable suggr dans ce cas tait de poser u = tan ou
u = tan(/2) et utiliser ensuite les relations trigonomtriques pour se ramener des choses connues.

250
17 Thorie des fonctions analytiques.

Le passage dans le plan complexe se fait ici assez naturellement, en posant z = exp(i)
et donc d = idz/z. Le contour est le cercle de rayon unit.
Pour lexemple ci-dessus, nous avons

2dz
I1 = i 2
z + 2az + 1
Or, pour les deux racines du dnominateur, nous avons z1 z2 = 1. Appelons z2 la racine
telle que |z2 | > 1. Seule la racine z1 est lintrieur du cercle |z| = 1, et nous devons
donc calculer le rsidu en ce point.
Lintgrande scrit comme
2
f (z) =
(z z1 )(z z2 )

et donc
2 1
Res(f (z), z1 ) = =
(z1 z2 ) a2 1
Finalement, p p
I1 = (i)(2i)/ a2 1 = 2/ a2 1

Les fonctions rationnelles simples. Nous allons considrer des intgrales du type
+
P (x)
I= dx
Q(x)

o P (x) et Q(x) sont des polynmes, Q P + 2 (pour que lintgrale converge en


infini) et Q(x) 6= 0.
Nous allons considrer le circuit ferm C compos du C1 , le demi-cercle suprieur (ou
infrieur) de rayon R et de C2 , lintervalle [R, R], et faire tendre R . Il est facile
de dmontrer que lintgrale sur le demi-cercle tend vers 0. Ceci vient du fait quen
gnral
f (z)dz < M L
D

o L est la longueur de la courbe D et M une borne suprieure de |f (z)|. Or, sur le


demi-cercle, quand R , |P (z)/Q(z)| 1/Rp o p 2, tandis que la longueur du
demi cercle R . Il nest pas difficile de donner une dmonstration plus rigoureuse en
bornant correctement les deux polynmes. Nous avons donc

P (z) P (x)
dz = dx
C Q(z) Q(x)

et lintgrale de gauche se calcule par la mthode des rsidus.

251
17 Thorie des fonctions analytiques.

Exemple 17.7 Calculons


x2
I1 = dx
x4 + 1
4
Les ples de la fonctions z + 1 sont les 4 racines simple de -1. En prenant le cercle
suprieur comme circuit, nous voyons que z1 = exp(i/4) et z2 = exp(3i/4) dans
lintrieur de ce cercle. Par ailleurs, nous savons que

ei/4

P (z)
Res(f (z), z1 ) = 0 =
Q (z) z1 4

De mme,
e3i/4
Res(f (z), z2 ) =
4
Donc,

I1 = 2i (Res(f (z), z1 ) + Res(f (z), z2 ))



= / 2

Produit dexponentiel et de fonctions rationnelles simples. Considrons main-


tenant des intgrales du type
+
P (x)
I(k) = eikx dx
Q(x)

o P et Q sont comme dans le cas prcdent et k R. Supposons que k > 0. Sur le


cercle suprieur, z = zR +izI o zi > 0. Donc, exp(ikz) = exp(kzi ) exp(ikzR ) < 1.
Nous pouvons donc utiliser le mme principe que dans le cas prcdent. Notez que cela
a un fort lien avec les transformes de Fourier.
Nous pouvons mme relaxer un peu les contraintes et exiger simplement Q P +
1, loscillation de lexponentielle assurant la convergence.
Exemple 17.8 Calculons
eikx
I1 = dx
x2 + 1
Pour k > 0, nous choisissons le cercle suprieur et seul le ple +i est dans le cercle.
Or,
ek
Res(f (z), i) =
2i
et donc
I1 = ek

252
17 Thorie des fonctions analytiques.

Pour k < 0, nous choisissons le cercle infrieur. Nous rcuprons un signe -1 en plus
pour cause de modification de sens de parcours, et donc
I1 = ek
Nous pouvons regrouper les deux rsultats en crivant
I1 = e|k|

Exercices.
17.1 Evaluer les intgrales

cot zdz C : |z| = 1
C

3(z + 1)
dz C : |z 1/2| = 2
C z(z 1)3

exp( cosh z)
dz C : |z| = 2
C z2 + 1
17.2 Calculer les intgrales suivantes :

dx dx
2 + a2 )2
; 2 + a2 )(x2 + b2 )
0 (x 0 (x
/2 2
cos kx 4 d
4 + a4
dx ; sin d ;
0 x 0 0 1 + cos2
17.3 Quel contour peut-on utiliser pour calculer

dx
0 x3 + a3
[Help : Nous pouvons constater que (xe2i/3 )3 = x ; un parcours sur arc ouvert 2/3 peut
tre une bonne ide]. Comment gnraliser cette ide pour calculer

dx
0 x5 + a5
17.4 Dmontrer que
cosh ax 1
dx =
0 cosh x 2 cos(a/2)
o |a| <
17.5 Calculez

x cos kx
x2 + 4x + 5

o k R et k > 0. Vous devez faire un peu attention au parcours que vous choisissez, en
noubliant pas que votre fonction doit rapidement tendre vers 0 sur larc que vous avez choisi.

253
17 Thorie des fonctions analytiques.

Figure 17.3 (gauche) Contour ferm C = L1 + CR + L2 pour le problme 17.1 ;


(droite) contour pour le TL inverse du problme 17.2

17.6 Calculez
2
cos2n d
0
o n N. Il va de soi que vous connaissez lexpansion binomial (a + b)n .

Problmes.
Problme 17.1 Intgrale de fonction oscillante.
Nous sommes habitus lintgrale gaussienne
r
tx2
e dx =
0 4t
On rencontre souvent sa version oscillante dans des problmes doptique ou de mcanique quan-
tique :

Fc = cos(tx2 )dx

0

Fs = sin(tx2 )dx
0

ces intgrales sont les limites dune fonction appele Fresnel.


Existence. Indiquez sans trop de dmonstration pourquoi ces intgrales existent.
Contour ferm. Que vaut
2
I= eitz dz
C
o C est larc ferm de rayon R et dangle /4 de la figure (17.3) ?
Arc. Dmontrer que quand R ,

2
eitz dz 0
CR

(nous supposons t > 0) [Help : Nous avons besoin de borner correctement C ; Par ailleurs,

R
sur lintervalle [0, /2], nous savons que sin(u) (2/)u ]

254
17 Thorie des fonctions analytiques.

L2 . Que vaut
2
eitz dz
L2

Quand R ?
Synthse. En synthtisant lensemble des rsultats prcdents, dduire lintgrale sur L1 quand
R et les valeurs de Fc et Fs .

Problme 17.2 Transforme de Laplace inverse.


Nous savons que si
f(s) = TL[f (t)]
alors c+i
1
f (t) = f(s)ets ds
2i ci

o c est un nombre rel quelconque suprieur la partie relle de tous les ples de la fonction
f(s) (figure 17.3).
En utilisant vos connaissances de lintgration dans le plan complexe, et en choisissant sage-
ment vos contours dintgration, calculer alors la transforme de Laplace inverse de la fonction
1
f(s) =
s2 + 2
Help : videmment, il faut fermer le contour de lintgration par un arc de cercle de rayon R
dont la contribution lintgrale est nulle quand R . Argumentez pourquoi il faut choisir
C1 si t < 0 et C2 si t > 0 . [Je ne demande pas une majoration rigoureuse, mais un argument
convaincant].

255
18 Les Transformes de Legendre.
18.1 Dfinition.
Nous avons vu plusieurs faon de reprsenter une fonction, dans lespace direct ou
dans lespace rciproque. Nous avons vu quune transforme (de Fourier, de Laplace, ...)
nous prenait une fonction et en produisait une autre : dans lespace de cette nouvelle
fonction, certains problmes peuvent tre formuls de faon plus simple. Les repr-
sentations que nous avons vu jusque l taient bases sur le concept dintgral, nous
verrons une nouvelle reprsentation base sur la drive.

Une question denveloppe.


Une des reprsentations extrmement utiles a t introduite par Legendre en exploi-
tant lide denveloppe. Donnons nous une famille de droite y = px g(p) comme par
exemple la figure (18.1). Chaque droite p est dfinie par sa pente p et lordonne
lorigine (le croisement avec laxe y), g(p). A vrai dire, pour caractriser la famille de
droite, il nous suffit seulement de nous donner la fonction g(p). Ce que nous voyons
quand on trace une telle famille est lapparition de lenveloppe de la famille f (x), cest
dire une courbe qui est tangente chacune des membres de la famille. videmment,
comme nous allons le voir sous peu, nimporte quelle dpendance g(p) ne peut pas

30
-10 -5 5 10

20
-20

10
-40

-10 -5 5 10
-60
-10

-80
-20

-30 -100

(a) (b)

Figure 18.1 (a) Ensemble de droites dquation px g(p) ; (b) la fonction g(p) =
p2 qui a servi gnrer la famille de droite .

256
18 Les Transformes de Legendre.

p=tan(a)
px
g(p)
a

f(x)

Figure 18.2 Reprsentation graphique dune transformation de Legendre.

gnrer une enveloppe 1 . Mais lide retenir est qu la fonction g(p) nous pouvons
associer la fonction f (x).
Lopration inverse est encore plus facile : si on se donne une fonction f (x), il est
trs facile dobtenir sa famille de droites enveloppes : A chaque point x0 , on calcule la
tangente p = f 0 (x0 ). Lquation de la droite est alors donn par y f (x0 ) = p(x x0 )
ou encore
y = [f (x0 ) px0 ] + px
Remarquer que dans le crochet, p et x0 ne sont pas indpendant : chaque valeur de p
correspond une valeur x0 . Nous posons

g(p) = x0 p f (x0 ),
0
1
o g(p) est fonction de p seulement. Plus exactement, comme x0 = f (p), nous avons
0
 0 
g(p) = pf 1 (p) f f 1 (p)

Cette notation est plus exacte puisque la dpendance est explicitement souligne, mais
elle est plus lourde. On utilise plus volontiers la premire notation, gardant bien en
tte que x0 est une fonction de p. Dailleurs, une fois quune certaine familiarit a t
acquise, lon oublie mme lindice et on crit directement 2 g(p) = px f (x) (Fig.).
Exemple 18.1 Considrons la fonction f (x) = x2 /2. En un point x0 , p = f 0 (x0 ) = x0
o encore x0 = p. La famille des courbes enveloppe est donc donne par g(p) =
p2 p2 /2= p2 /2.

1. Il faut que la fonction soit convexe ou concave, autrement dit que la drive seconde ne change pas de
signe ou encore que la drive premire soit monotone.
2. Voil pourquoi le signe - a t choisi dans la difnition de la droite tangente y = px g(p) plutt
que y = px + g(p). Cela nous permet une symtrie entre la fonction et sa transforme que lon peut crire
f (x) + g(p) = px.

257
18 Les Transformes de Legendre.

Enveloppe denveloppe.
Nous pouvons continuer ce jeux : considrons maintenant la fonction g(p) ; nous
pouvons trouver la famille de droite s : y = sp h(s) dont la fonction g(p) est
lenveloppe. Donnons nous un point p0 , la tangente en ce point est s = g 0 (p0 ) et la
droite possde donc lquation

y = [g(p0 ) sp0 ] + sp

et donc h(s) = sp0 g(p0 ) o s = g 0 (p0 ).


Exemple 18.2 Continuons avec la fonction g(p) = p2 /2. Par dfinition, s = g 0 (p0 ) =
p0 ou encore p0 = s. Nous avons donc h(s) = s2 s2 /2= s2 /2. Ce que nous voyons
ici est que h(s) = f (s), cest dire que lenveloppe de lenveloppe est la fonction
originale !
Nous allons dmontrer cela de faon gnrale, mais le message retenir est que les
fonctions g(p) et f (x) sont duales vis vis de cette transformation quon appelle trans-
formation de Legendre. La transforme de Legendre revient dfinir une fonction non
pas en fonction des valeurs quelle prend en un point x, mais en fonction de sa pente.
Reprenons, en partant de f (x), nous dfinissons

g(p) = px0 f (x0 ) (18.1)


0
p = f (x0 ) (18.2)

Calculons maintenant dg/dp, sachant que les deux variables p et x0 sont reli par la
relation (18.2).
dg/dp = x0 + p.dx0 /dp df (x0 )/dp
Or, df (x0 )/dp = f 0 (x0 ).dx0 /dp= p.dx0 /dp. Nous arrivons cette relation de dualit

dg
= x0
dp

Lquation de la droite tangente g(p) en un point p0 scrit donc

y = x0 p [x0 p0 g(p0 )]

Lexpression entre crocher nest rien dautre que f (x0 )daprs (18.1).

Transforme de Legendre et Minimum.


Il existe une interprtation alternative de la transforme de Legendre, base sur le
concept de minimum, et qui est trs utilise par exemple en thermodynamique.

258
18 Les Transformes de Legendre.

Figure 18.3 Transforme de Legendre vu comme un minimum.

Soit la fonction convexe y = f (x). Pour une pente donne p, donnons nous la droite
y = px, et cherchons la valeur de x qui extrmise la distance entre les deux courbes
(Fig.18.3)
g(x, p) = px f (x)
Il nest pas difficile de voir que lextremum est ralis pour

f 0 (x) = p

et la distance extremum entre les deux courbes est fonction de p seul

g(p) = px f (x)

A vrai dire, ce que nous venons de faire gnralise le concept de minimum dune fonc-
tion (convexe). Son minimum habituel est simplement le point associ la pente nulle.
Avec cette reprsentation, il est coutume dcrire

g(p) = max(px f (x))


x

Recette.
Dornavant, nous allons laisser tomber les x0 et les p0 , la signification tant entendu.
Nous crirons
g(p) = px f (x)
ayant en tte que x est dpendante de p, avec la dpendance f 0 (x) = p. De mme, pour
la transformation inverse, nous crirons

f (x) = px g(p)

ayant en tte que p est une fonction de x


18.1 Montrer que la transforme de Legendre de f (x) = ex est g(p) = p log p p. En
reprenant la Transforme de Legendre, dmontrer quon retrouve la fonction originale. Trouver
la TLg de la fonction f (x) = x2n .

259
18 Les Transformes de Legendre.

Transforme de Legendre plusieurs dimensions.


La gnralisation est triviale. Soit la fonction f (x1 , x2 , ...) ; nous pouvons dfinir
la fonction g(p1 , x2 , x3 , ...), ou la fonction g(p1 , p2 , x3 , ...) par exactement les mmes
procdures.

18.2 Application travers la physique.


Les transformes de Legendre apparaissent un peu partout en physique, chaque
fois que les drives prennent une vie propre. Par exemple, nous pouvons imposer la
valeur dune fonction en un point comme paramtre de contrle, o au contraire, la
valeur de la tangente comme paramtre de contrle.

Laction en mcanique.
En mcanique classique, le lagrangien est dfinie par

L(x, x, t) = (m/2)x2 V (x, t)

Noter que L est considr comme une fonction de deux variables indpendante, x et x.
Nous pouvons prendre la transforme de Legendre du lagrangien par rapport x

H(p, x, t) = px L(x, x, t) = (1/2m)p2 + V (x, t)

o
L
p=
x
Le trs grand avantage de ce passage est que nous passons des quations de second
degrs en x en quation de premier degrs en p. Formellement, on ne change pas grand
chose, une quation de second degrs ou deux quations de premiers degrs priori
ncessitent le mme effort ; mais les quations du premier degrs ont une interprta-
tion gomtrique immdiate en terme de flux et mme si on ne sait pas les rsoudre
exactement, on peut dmontrer beaucoup de choses.
En mcanique relativiste, laction est donn par
b
S= m.ds
a

2 2 2
o ds = dt dx est llment darc entre deux vnements. En notant = dx/dt,
nous avons p
L() = m 1 2
Ce qui nous donne p
p = dL/d = m/ 1 2

260
18 Les Transformes de Legendre.
p
ou encore = p/ p2 + m2 ou finalement
p
H(p) = p2 + m2

Relations que nous voyons plus souvent sous la forme

E 2 p2 = m2

Les potentiels thermodynamiques.


Prenons dabord un exemple simple. Supposons que lon connaisse lnergie libre
dun systme F (V, T, ...) pour toute temprature et volume fixe (penser : gaz parfait
dans un cylindre volume fixe). Nous allons mettre en contact notre systme avec un
rservoir de pression (une force constante par unit de surface) et laisser libre le volume
(penser : piston capable de se mouvoir dans le cylindre pour ). Lnergie libre de notre
systme est maintenant G(V, T, p, ...) = F (V, T, ...) + pV .
F ()est toujours notre nergie libre volume fixe, pV le travail effectu par le chan-
gement de volume. Le principe du minimum en thermodynamique nous affirme que le
volume V va varier (penser : le gaz se dtend ou se compresse) jusqu atteindre une
valeur dquilibre V telle que lnergie libre soit minimum. Dans ce cas, V est une
fonction de p,T,... est lnergie libre vaut

G(T, p, ...) = F (V , T, ...) + pV

o V est tel que p = F/V |V =V .


Nous voyons donc que G(T, p, ...) est la transforme de Legendre de lnergie libre
F (V, T, ...) par rapport la variable V . On appelle dailleurs G enthalpie libre pour bien
marquer cette distinction. Vous avez remarqu que les conventions de signe en ther-
modynamique ont induit quelques changement de signe par rapport nos dfinitions
davant, mais cela ne change pas les concepts.
De faon gnrale, considrons lnergie libre dun systme F (T, X1 , X2 , ...Xn ) o
les Xi sont des paramtres extensifs. La variable conjugue au paramtre extensif Xi
est xi = F/Xi .
Si maintenant nous mettons notre systme en contact avec un rservoir de Xi xi
fixe, la quantit extensive X_i va voluer pour minimiser la quantit = F (T, X1 , X2 , ...Xn )+
xi Xi o xi Xi est le travail effectu par le changement de Xi . Le nouveau potentiel
thermodynamique dpend du paramtre intensif xi et non du paramtre extensif Xi .
Nous pouvons ainsi passer dun potentiel thermodynamique un autre en prenant des
transforme de Legendre successif. Le choix du potentiel thermodynamique adquat
pour un problme se fait en fonction des paramtres (intensif ou extensif) que lexpri-
mentateur peut contrler. Les dlices des dfinitions de la thermodynamique font que
le signe de la variable conjugue xi nest pas toujours - la drive partielle , mais parfois
+ . Il faut prendre cela en compte lors des passages entre les potentiels.

261
18 Les Transformes de Legendre.

Optique gomtrique et caustiques.


Quand on regarde la surface de la mer par une belle journe, on distingue des en-
droits sur la mer fortement clairs : la surface ntant pas plane, certaines directions
concentrent la lumire. De faon gnrale, considrons une courbe que lon prsente
comme linterface dune surface rflchissante. Quand on claire cette courbe par une
lumire parallle, lenveloppe des rayons rflchis forme une nouvelle courbe quon
appelle une caustique. Cette courbe nest rien dautre que la transforme de Legendre
de la courbe rflchissante.

La forme des cristaux et les volutes.


Certaines classe dquations diffrentielles.
Des quations diffrentielles o la drive apparat sous une forme plus complique
que la fonction peuvent avoir une solution simple en transforme de Legendre. Consi-
drons par exemple lequation pour y(x)

y = xy 0 + f (y 0 )

Il est vident que si lon passe de (x, y) (p, z) o la fonction z(p) est la transforme de
Legendre de y(x), nous avons par dfinition des transforme de legendre y xy 0 = z
et donc
z(p) = f (p)
Il suffit donc simplement dinverser la transforme pour trouver la fonction y(x).
Exemple 18.3 Rsoudre y = xy 0 y 02 /2. Nous avons immdiatement z(p) = p2 /2,et
donc y(x) = x2 /2

Un peu plus sur les enveloppes.


Notre faon de calculer les enveloppes tait lgrement limit, et par exemple ne
nous permet pas de calculer de quelle famille un cercle est lenveloppe. Cela vient de
notre dfinition dune droite par lquation y = px g. Gnralisons un peu lquation
dune famille de droite, paramtr par une variable t :

t : u(t)x + v(t)y + w(t) = 0

o nous supposons que u(t) et v(t) ne sannule pas ensemble. Lenveloppe de ces droites
peut galement tre paramtr par la mme variable t et nous le reprsentons donc par
(x(t), y(t)). Lquation denveloppe scrit donc

u(t)x(t) + v(t)y(t) + w(t) = 0 (18.3)


0 0
u(t)x (t) + v(t)y (t) = 0 (18.4)

262
18 Les Transformes de Legendre.

En diffrentiant (18.3) et en y retranchant (18.4), nous obtenons deux nouvelles qua-


tions :

u0 (t)x(t) + v 0 (t)y(t) + w0 (t) = 0


u(t)x(t) + v(t)y(t) + w(t) = 0

Ce qui nous donne directement lquation de lenveloppe :

vw0 v 0 w
x(t) =
uv 0 u0 v
vw0 v 0 w
y(t) =
uv 0 u0 v

Exercices.
18.2 Parabole.
Soit une ligne D et un point F en dehors de cette ligne. Soit la famille de ligne bissectrice du
segment joignant F un point de D. Quelle est lenveloppe de ces lignes ? [Rponse : parabole
de foyer F et de directrice D. Pour voir cela, choisir D comme laxe des x, et F = (0, a) sur
laxe y. Lquation des droites bissectrices est donne par y = px (1/2)ap2 o p est la pente
de la bissectrice. Comme g(p) = (1/2)ap2 , la transforme de Legendre, f (x) = (1/2a)x2 est
lenveloppe].

18.3 Arc minimum.Trouver la courbe y(x) entre deux points x0 et x1 de longueur darc
minimum tel que y 0 (x0 ) = p0 et y 0 (x1 ) = p1 et p0 p1 < 0.

263
19 Les quations de la physique.
Nous avons, de nombreuses occasions, rencontr les diverses quations de la phy-
sique. Nous voudrions donner ici une drivation simple et intuitive de ces quations.
Comme nous le verrons, pour tablir ces quations, nous discrtisons le systme et fai-
sons ensuite un passage la limite. La mthode plus rigoureuse ( et riche et lgante
et ... ) daborder ces sujets est le calcul variationnel (voir le chapitre correspondant) .
La mthode utilise dans ce chapitre est celle qui avait t utilise par Euler lui-mme
dans les annes 1740 pour fonder le calcul des variations. Cette vue consiste regar-
der les quations diffrentielles comme des quations aux diffrences, avec un pas x
qui peut tre rendu aussi petit que lon souhaite. Cette vue a quelque peu disparu des
mathmatiques au dbut du XIXme sicle quand Cauchy &Co ont donn de la rigueur
aux mathmatiques, mais a donn trs naturellement lieu au dveloppement des calculs
matriciels et la formalisation des espaces vectoriels un sicle plus tard par Hilbert &Co.
Avec larrive des ordinateurs et la rsolution numrique des quations, cette approche
redevient tout fait naturelle. Regardons quelques cas particuliers.

19.1 Quest ce quune quation diffrentielle ?


Prenons la plus simple des quations diffrentielles

y 0 = f (x) (19.1)

sur lintervalle [0, 1]. Dcoupons cet intervalle en N morceau de largeur x dont les
bords sont x0 = 0, x1 = 1/N, x2 = 2/N, ...xN = 1. Nous cherchons dterminer les
N + 1 valeurs y0 = y(x0 ), y1 = y(x1 ),...yN = y(xN ). Nous pouvons approximer le
terme y 0 au point xi par

y 0 (xi ) = y(xi+1 ) y(xi ) /x




Lquation (19.1) se transforme alors en un systme dquations algbriques :

y1 y0 = x.f (x0 )
y2 y1 = x.f (x1 )
... ...
yN yN 1 = x.f (xN 1 )

264
19 Les quations de la physique.

y
y y
d

Y
k

x L x x

(a) (b) (c)

Figure 19.1 Vue discrte dune corde vibrante.

Si vous regardez bien, nous avons N + 1 inconnus, mais seulement N quations ! Le


systme est sous dtermin et na pas de solution unique. Pour que le systme ait le
mme nombre dquations que dinconnus, il faut ajouter une quation supplmentaire,
par exemple y0 = a. Cest cela que nous appelons la condition initiale. Nous avons
lhabitude de penser aux quations diffrentielles comme la donne de deux choses
diffrentes : une quation de la forme (19.1) et des conditions initiales. En ralit, ces
deux choses sont indissociables. Nous pouvons maintenant reprsenter cela sous forme
matricielle

1 0 ... 0 y1 a + x.f (x0 )
1 1 0 .. 0 y2 f (x1 )


0 1 1 .. 0 . =
.

... . .
0 ... 1 1 yN f (xN )

ou de faon plus succincte Ay = f . Nous avons maintenant un systme de N qua-


tions et N inconnus quilibr. A partir de l, nous pouvons utiliser toute la puissance
des techniques doprateurs linaires pour rsoudre le problme diffrentielle. Vous
voyez galement les diffrentes gnralisations possibles. Si par exemple, nous avons
une quation de seconde ordre, nous nobtiendrons alors que N 1 quations pour
N + 1 inconnus et nous devons la supplmenter par deux quations aux bords, et ainsi
de suite pour des quations dordre plus levs. De la mme manire, lapproche se g-
nralise ltude des quations aux drives partielles. Les techniques de rsolution
numrique dquations diffrentielles ne font que reprendre ces schmas.

19.2 quation de Laplace.


Considrons un ensemble de N boules de masse m relies par des ressorts de raideur
k. Chaque boule est assujettie se mouvoir sur une ligne verticale, et les lignes sont
espaces de d (figure 19.1.a ). Lnergie potentielle totale du systme est par consquent :

265
19 Les quations de la physique.

X1
U (..., yn1 , yn , yn+1 , ...) = k(yn+1 yn )2 (19.2)
n
2

o yn est lordonne de la n-ime boule ( et xn = nd son abscisse ). Pour quelles valeurs


des yk le potentiel est minimum ? Comme U est une fonction de N variables, pour tre
extremum, il faut que sa drive par rapport chaque variable soit nulle. Considrons
la n-ime boule. Dans lexpression de lnergie sous la somme, il y a seulement deux
termes qui contienne la coordonne de yn qui sont (yn yn1 )2 et (yn+1 yn )2 . La
minimisation de U par rapport yn donne donc :
U
= k(2yn yn1 yn+1 ) = 0 (19.3)
yn
Cette dernire relation indique simplement que la force exerce sur la n-ime boule
doit tre nulle : en effet, la force nest que le gradient ( un signe prs) du potentiel.
Lextremum du potentiel correspond une position dquilibre o les forces exerces
sannulent. Faisons maintenant d 0 et N + pour retrouver le continuum.
La variable x = nd devient continue, de mme que la fonction y(x). Comme yn =
y(xn ) = y(nd), nous avons, par un simple dveloppement de Taylor,

1 d2 y

dy
yn+1 = yn + d+ d2
dx x=xn 2 dx2 x=xn
1 d2 y

dy
yn1 = yn d + d2
dx 2 dx2
x=xn x=xn

Lquation (19.3) se transforme donc en une quation diffrentielle d2 y/dx2 = 0. A


plusieurs dimensions, en appliquant la mme dmarche, on aboutit lquation

y = 0 (19.4)

o loprateur dsigne le laplacien. Lquation (19.4) est appele justement lquation


de Laplace 1 et comme nous le voyons, est le rsultat de la minimisation dune certaine
nergie. Cest exactement cette approche quEuler a utilis pour dvelopper le calcul
variationnel et qui a donn lieu aux quations dEuler-Lagrange.
Que vaut la constante de raideur k ? Elle doit probablement dpendre de notre d-
coupage discret, i.e. de lespacement d entre les lments discrets que nous avons uti-
lis pour modliser le continuum. Mais comment ? La rgle fondamentale est que les
valeurs que lon peut mesurer (physiquement) ne doivent pas dpendre de notre d-
coupage. Prenons maintenant une ligne de longueur L que lon dcoupe en N morceau
1. Grand mathmaticien franais de la fin dix-huitime et dbut dix-neuvime sicle. Trs clbre pour
son livre de mcanique cleste, les fondements de la thorie des probabilits (qui lont amen inventer les
transformes de Laplace), la thorie molculaire de la capilarit (quand les molcules nexistaient pas !), ...
Ses collgues et contemporins sont Lagrange, Fourier, Poisson et Cauchy. Que du beau monde.

266
19 Les quations de la physique.

espacs de d = L/N . Nous maintenons un cot (disons x = 0 ) y = 0, et lautre cot


(x = L) y = Y (fig. 19.1.b). Comme (yn+1 yn ) = (Y /L)d, Selon lexpression (19.2),
lnergie potentielle totale est donne par
X
U= k(Y /L)2 d2 = (Y /L)2 N kd2 = (Y /L)2 Lkd = (Y 2 /L)kd
n

Si maintenant nous avions fait un autre dcoupage en prenant N 0 boules relies par
des ressorts de constante k 0 et un espacement d0 (fig. 19.1.c), nous aurions trouv pour
lnergie U = (Y 2 /L)k 0 d0 . Comme U ne doit pas dpendre de notre dcoupage, kd
doit tre constante :
K
k= (19.5)
d
La constante de ressort microscopique (rsultat de notre dcoupage discret ) k est reli
une constante physique du systme K, ( qui dnote lamplitude de la rigidit du systme
par rapport un phnomne physique), par la relation (19.5). Comme (yn+1 yn ) =
y 0 (x).d + O(d2 ), lexpression de lnergie potentielle devient
XK
U = (1/2) y 0 (nd)2 d2
d
= (1/2) Ky 0 (x)2 dx quand d 0

Pour un champ lectrique par exemple, lnergie est donne par (/2)|E|2 d = (/2)|V |2 d
V est le potentiel lectrostatique et loprateur gradient () gnralise la drive plu-
sieurs dimensions. Ici, le rle de la constante de rigidit du systme (vis vis du champs
lectrique ) est jou par la constante de permabilit lectrique . En lasticit, la va-
riable du champ est appel dplacement, et la rigidit du systme est donne par le mo-
dule dYoung 2 . Dans le cas des gaz, nous somme en prsence dun champ de pression
et K est linverse du coefficient de compressibilit.

19.3 quation donde et de chaleur.


Nous nous sommes proccup dans la prcdente section de phnomnes statiques.
Essayons maintenant de formuler la dynamique. Revenons notre exemple du figure
(19.1.a) et supposons que chaque boule a une masse m. Nous pouvons maintenant crire
la relation fondamentale de la dynamique F = ma pour chaque boule. Lacclration
de la n-ime boule est donne par d2 yn /dt2 . La force sur la n-ime boule tant gale au

2. Maxwell, le fondateur de la thorie lectromagntique dans les annes 1860, considrait les phno-
mnes lectromagntiques comme des dformations lastiques dune substance hypothtique appele ther
et sest beaucoup inspir des travaux sur llasticit pour formuler sa thorie.

267
19 Les quations de la physique.

gradient du potentiel, i.e. Fn = U/yn , nous avons, en suivant ce que nous avons
dit plus haut,
d2 yn
m 2 = k(2yn yn+1 yn1 ) (19.6)
dt
Comment m dpend de notre dcoupage ? La rponse est plus simple cette fois. Si
nous dsignons par la densit (linaire une dimension), nous avons m = d. Nous
avons galement, comme indiqu plus haut, k = K/d et (2yn yn+1 yn1 )
( 2 y/x2 )d2 . Quand d 0, lquation (19.6) devient

2y (K/d) 2 y 2
= d
t2 d x2
K 2y
= (19.7)
x2
Cest ce quon appelle lquation donde. Elle se gnralise de la mme manire plu-
sieurs dimensions ( loprateur gnralise la drive seconde). La constante K/ pos-
sde la dimension dune vitesse au carr (pourquoi ?) et dsigne, comme nous lavons
vu, la vitesse de propagation des ondes.
Question : quest ce qui joue le rle de la densit pour les phnomnes lectriques ?
Nous pouvons maintenant aborder plusieurs gnralisations. Si les boules baignent
en plus dans un liquide , il faut tenir compte de la force de dissipation visqueuse qui est
proportionnelle (et oppose) la vitesse, et donc dyn /dt. Lquation donde devient
alors, lors de la passage la limite d 0,

2y y 2y
+ = K
t2 t x2
En lectromagntisme, dnote le coefficient dabsorption dun matriau (linverse
de sa transparence). Nous voyons que si la masse des boules (la force inertielle) peut-
tre nglige par rapport aux autres forces de frottement et applique par les voisins
(penser aux boules baignant dans du miel), nous pouvons ngliger la drive dordre 2
par rapport au temps et crire
y 2y
=D 2
t x
qui nest rien dautre que lquation de la chaleur. Il est peut-tre difficile pour le lecteur
de penser au champ de temprature comme des boules qui se meuvent dans du miel 3 .
Nous le rfrons la thorie de la rponse linaire en physique statistique pour une
drivation de lquation de la chaleur qui ait une plus grande ralit physique.
Revenons encore une fois notre image de boules de la figure (19.1.a) . Et imaginons
quen plus dtre relies par un ressort de raideur k les uns aux autres, elles sont en
3. Mme si la conception de la chaleur comme un fluide de calorique tait populaire jusquau dbut du
XIXme sicle.

268
19 Les quations de la physique.

plus relies laxe x par un ressort de constante V d (nous normalisons tout de suite la
raideur par lespacement, en laissant le soin au lecteur de dmontrer que cela effective-
ment est la bonne forme). Nous navons aucune obligation penser que V doit tre une
constante. A certain endroit le long de laxe x, elle peut tre forte, dautres endroit,
faible. Nous notons donc Vn la constante du ressort qui relie la n-ime boule laxe x.
Lexpression de lnergie potentielle totale est donc
X1K
U= (yn+1 yn )2 + d.Vn yn2
n
2 d

Il ne sera alors pas difficile pour le lecteur de dmontrer que lquation donde scrit

2y 2
2 y
= c V (x).y
t2 x2
et lexpression de lnergie ( potentielle ) est de la forme

(K/2)|y|2 + (1/2)V (x)y 2 dx

forme couramment utilise dans la thorie du ferromagntisme.


le cas de lquation de Schrdinger comme deux quations couples, et le rapproche-
ment avec particules dans champs magntique ou les quations de second degrs ;
Traitement du processus dissipatif en dveloppant le BABA de la rponse linaire en
phys stat. le cas de lquation de la chaleur, indication (par potentiel chimique) pourquoi
a se gnralise la diffusion de concentration etc.

269
20 Quest ce quun nombre ?
Nous avons vu tout au long de ce cours divers outils de mathmatiques trs utiliss
en physique. Ces outils concernaient la manipulation des fonctions dans le but trs
alimentaire de rsoudre des quations issue de la physique. Les fonctions elles mmes
taient dfinies comme des botes noires transformant un nombre en un autre. Nous
nous sommes jamais demand ce quest un nombre, nous avons pris cela comme une
donne dont la signification est priori connue.
Nous allons dans ce chapitre revenir un peu sur ce concept et voir la construction
des nombres rels. Nous verrons galement que ce nest pas la seule faon de construire
un ensemble complet de nombre, et dautres ensembles qui dfient notre intuition de
proche et de loin sont galement constructible. Ce chapitre na pas dautre but que
dveiller la curiosit du lecteur.
Le plan gnral que lon va suivre est de dabord construire les nombres entiers,
ensuite les nombres rationnels. Nous munirons alors notre ensemble dune topologie
et construirons soit lensemble des nombres rels, soit celui des nombres p-adiques.
Munir un ensemble dune topologie est un terme pour effrayer ltudiant. En lan-
gage profane, cela veut simplement dire que lon va dfinir les distances, la notion dtre
proche. La topologie habituelle que lon dfinie, et laquelle nous sommes habitus de-
puis notre tendre enfance nous dit par exemple que 4.3 et plus proche de 4.2 que 5. Tant
que nous construisons lensemble des nombres rationnels, nous navons pas besoin de
ce concept, celui davant et aprs nous suffira.

20.1 Les entiers naturels N.


Dedekind, grand mathmaticien de la fin du dix-neuvime sicle disait : Dieu inventa
les nombres entiers ; tous le reste est invention humaine. La construction moderne des
nombres entiers est due Peano et ses cinq principes. De faon intuitif, on peut dire que
cest le plus simple ensemble ou chaque lment (except le premier quon appelle 0)
possde un lment juste avant et un lment juste aprs, et cela de faon non-cyclique.
Bon, bien sr, comme nous sommes en train de faire des mathmatiques, nous devons
dfinir exactement ce que ces termes veulent dire. Voil les axiomes de Peano.
1. 0 N 1
1. Grand dbat philosophique pour savoir si il faut commencer par 0 ou par 1. Cette question na pas
de sens tant que lon a pas dfini lopration addition et son lment neutre. Tout ce que lon veut ici est de
dfinir un premier lment.

270
20 Quest ce quun nombre ?

2. Chaque nombre naturel x possde un autre lment x0 = s(x) N appel son


successeur (voil pour le juste aprs).
3. 0 nest le successeur daucun nombre (cela nous enlve le danger des cycles).
4. Si s(x) = s(y) alors x = y (cela nous enlve le problme de plusieurs nombre
ayant le mme successeur).
5. Axiome dinduction. Soit Q une proprit telle que
Q est valable pour 0
Si Q est valable pour x, alors Q est valable pour s(x)
Alors Q est valable pour tous les nombres entiers (cela entre autre nous enlve le
problme davoir plusieurs premier lment)
Nous avons insist sur cette construction pour souligner que tout ce dont on a besoin
cette tape est le concept davant et daprs.
Comme nous ne voulons pas crire un texte trs rigoureux, nous allons aller un peu
plus vite partir de l. On peut commencer par donner des noms aux divers lments.
Par exemple, le successeur de 0 sera appel un (et not 1), le successeur de 1 deux (2) et
ainsi de suite. On peut donc noter N = {0, 1, 2, ...}. Ensuite, nous allons munir notre
ensemble de lopration +. Cest une application qui deux nombres entiers associe un
troisime, et cela en gnralisant le concept de successeur : x + 0 = x et x + s(y) =
s(x + y) . Par exemple, et x + 1 = s(x) 2 . Lopration + a bien sr toutes les bonnes
proprits dassociativit, commutativit, etc. dont nous sommes habitu (exercices :
les dmontrer). Nous laissons au lecteur le soin den donner une dfinition rigoureuse.
Tant que nous y sommes, nous pouvons galement dfinir lopration (multipli-
cation) comme une autre application qui a chaque deux nombres entiers associe un
troisime : x 0 = 0 ; x s(y) = x y + x. Bien sr, cest la multiplication habituelle
et on aurait t plus claire si on avait not x (y + 1) = x y + x. Par exemple,
x 1 = x.
Enfin, a ne mange pas de pain de dfinir rigoureusement les relations de comparai-
son < et >, nouveau en suivant la piste des successeurs.
Nous suggrons au lecteur de faire ces constructions en dtails et de faon rigoureuse,
cest un exercice trs intressant.
Nous disposons donc maintenant dun ensemble N, muni des deux oprations + et
. En langage chique, nous dirrions que (N, +, ) est un anneau commutatif.

20.2 Les ensembles Z et Q.


A partir de l, nous allons commencer largir notre ensemble N .
Dabord, nous pouvons dfinir lopration soustraction comme linverse de lad-
dition : si xy = z alors cest que y+z = x (exercice : donner une dfinition rigoureuse
de la soustraction). Mais cela nous pose un problme. N est ferm pour laddition, cest
2. Notez comment loperation +1 devient alors le synonyme de lopration successeur.

271
20 Quest ce quun nombre ?

dire que laddition de nimporte quel deux nombres est encore dans N. Cela est loin
dtre le cas pour la soustraction. Il suffit dexaminer 0 1 : si 0 1 = z N, alors
z + 1 = 0, ce qui contredit violemment un des axiomes de Peano. Qu cela ne tienne :
nous allons dfinir un ensemble Z qui contient N et qui est ferm pour la soustraction,
Z = {..., 2, 1, 0, 1, 2, ...} .
Nous pouvons galement dfinir lopration de division /comme linverse de la
multiplication : si x/y = z alors cest que x = yz. Le mme problme se pose : en
gnral, pour un couple quelconque, x/y na pas de sens dans N ou Z . A nouveau, on
peut agrandir notre ensemble et dfinir lensemble des nombres rationnels Q qui est
ferm pour lopration de division. Notez que nous avons pas vraiment dfinit comment
on agrandit nos ensembles, cela alourdirait trop ce texte 3 .
Lensemble Q est trs riche. Concrtement les humains nen sortent jamais pour
faire leurs calculs. Le trait principal de cet ensemble est quentre nimporte quel deux
nombres rationnels, on peut en trouver dautres. Ceci dit, comme le lecteur le sait, len-
semble Q reste dnombrable, et mme sil est ferm pour la division, il nest pas alg-
briquement ferm. Par cela nous voulons dire que les racines de tous les polynmes (
de coefficients entiers ) ne se trouvent pas dans Q. Par exemple, il est trivial de montrer
que la racine de x2 2 = 0 (qui reprsente lhypotnuse dun triangle rectangle de cot
unit) nest pas rationnelle.
Il suffit de suivre la mme dmarche et construire lensemble des nombre p algbrique

A, la fermeture algbrique de Q, et qui contient tous ces nombres du genre 2 + 3 + 17 253.
A ton puis tous les nombres ou existe til des nombres non-algbriques quon appelle
transcendants ? Est ce que par exemple, le primtre dun cercle de diamtre unit ,
ou le nombre e sont algbriques ? La rponse ces questions nest venu qu la fin du
dix-neuvime sicle.

20.3 Un peu de topologie.


Nous navons pas encore introduit le concept de distance entre deux nombres. La
distance entre deux nombres est une application qui prend deux nombres en entre et
produit un nombre en sortie. On peut la dfinir sur nimporte quel corps k 4 5 (dont
par exemple le corps des rationnels). Nous demandons cette application davoir un

3. Voyons rapidement la construction des rationnels. Considrons lensemble A = N N, cest dire


lensemble de toutes les pairs (x, y) o x et y sont des entiers naturels. Nous dfinissons une relation dqui-
valence (x, y) = (x0 , y 0 ) si xy 0 = x0 y . Nous dfinissons lopration +dans A par (a, b) + (c, d) =
(ad + bc, bd) et lopration par (a, b) (c, d) = (ac, bd). Lensemble A partitionn par la relation
dquivalence ci-dessus et muni des deux oprations + et peut tre identifi au corps des rationnels Q. Un
exercice intressant serait de suivre les mmes lignes pour construire les entiers relatifs partir des entiers
naturels.
4. Rappelons quun corps est un ensemble, muni des deux oprations + et et ferm vis vis delles.
5. Bien sr, pour dfinir une norme, nous navons pas ncessairement besoin dun corps. Nous avons vu
ds le dbut de ce livre comment en dfinir une pour lespace vectoriel des fonctions de carr sommable.

272
20 Quest ce quun nombre ?

minimum de proprits : Pour tous a, b, c k,


1. d(a, b) 0 et d(a, b) = 0 si et seulement si a = b.
2. d(a, b) = d(b, a).
3. d(a, b) d(a, c) + d(b, c) (lingalit du triangle).
Ce nest pas beaucoup demander, mais partir du moment o nous disposons dune
mtrique, nous pouvons faire une quantit phnomnale de choses. Essentiellement,
cest ltape o lon passe de lalgbre lanalyse, o on peut commencer dfinir le
concept de continu, de la convergence des suites, ...
Un concept troitement li la notion de distance est celle de la valeur absolue. Sup-
posons que nous disposons dune valeur absolue sur un corps k avec les proprits
suivantes :
p1 : |a| = 0 ssi a = 0.
p2 : |ab| = |a||b|
p3 : |a + b| |a| + |b|
alors nous pouvons facilement dfinir la distance entre deux lments par d(a, b) =
|a b|. Nous laissons au lecteur le soin de dmontrer cela. Lexemple usuel de la valeur
absolue sur Q est |x| = x si x 0 et x sinon. Bien sr, ce nest pas la seule valeur
absolue possible, nous en verrons des exemples plus bas.
Comme nous lavons dit, ds que nous disposons dune distance, nous pouvons d-
finir la convergence des suites. Nous disons que la suite an converge vers la limite a si
tous les lments de la suite, partir dun certain N sont aussi proche de la limite que
nous le souhaitons. Dans lensemble Q, nous crirons par exemple que a est la limite
de an si pour tout  Q, nous pouvons trouver N tel que si n > N alors d(a, an ) < .
Un des problmes de cette dfinition de la convergence est que pour savoir si une
suite converge, nous devons connatre lavance sa limite ! Le grand Cauchy a trouv
comment y remdier : une suite converge si la distance entre deux lments quel-
conques converge vers zro au del dun certain N : si pour tout  Q, nous pouvons
trouver N tel que si n, m > N alors d(am , an ) <  alors la suite est convergente.
Cela nous pose un nouveau problme : la limite dune suite dans un corps k na
aucune raison dappartenir au mme corps. Mais nous pouvons continuer notre pro-
cdure denrichissement et considrer un ensemble qui contient et le corps k et toutes
les limites de toutes les suites convergentes. Nous verrons ci-dessous deux exemples
de fermeture topologique de lensemble Q : lensemble des nombres rels et lensemble
des nombres padiques.

20.4 Lensemble des nombres rels.


Munissons nous de la valeur absolue usuelle, et la distance ( la mtrique) qui en
dcoule. Et considrons les suites convergentes dans Q. Il est vident que beaucoup
(vraiment beaucoup) de ces suites nont pas leurs limites dans Q.

273
20 Quest ce quun nombre ?

Exemple 20.1 Le nombre 1/e, dfini comme la limite de n=0 (1)n /n! nest pas
P
un nombre rationnel. Pour voir cela supposons quil lest et ecrivons le comme p/q.
Nous dcomposons la srie en une somme jusquau terme q et le reste :
q
p X
= (1)n /n! + Rq
q n=0

Comme nous avons affaire une srie alternative convergente, le reste est plus petit
que le dernier terme : |Rq | < 1/q!. Multiplions maintenant les deux cots par q!. Nous
avons gauche un entier, et droite un entier plus un terme plus petit que lunit. Le
cot droit nest donc pas un entier naturel. Notre hypothse de rationnalit de 1/e
est donc fausse.

Nous dfinissons lensemble des nombres rel R comme un ensemble qui contient
lensemble Q et les limites de toutes les suites convergentes dans Q au sens de Cauchy.
Les oprations + et se gnralisent aisement par continuit. Par exemple,pour a, b
R, (mais pas ncessairement rationnel) a + b = lim(an + bn ) o an et bn sont des suites
dans Q convergeant vers a et b.
Nous pouvons pousser un ouf de soulagement, nous sommes au bout de notre che-
min ( part peut-tre une extension triviale C). Mais est ce que ctait vraiment la
peine de faire tout ce parcours ? Est ce que lensemble R est vraiment plus riche que
lensemble des nombres algbriques ? La rponse est videment oui, mais elle est loin
dtre vidente. Jusqu presque la fin du dix-neuvime sicle, la rponse cette ques-
tion ntait pas connue. On a pu dmontrer cette poque avec peine que les nombre e
et ne sont pas algbriques, cest dire que nous ne pouvons pas trouver un polynme
de coefficients entiers dont une des racines soit un de ces nombres. Mais combien y
avait il de ces nombres transcendants ? trs peu, beaucoup ? La rponse, un coup de
matre, est venu de Greg Cantor : les nombres algbriques forment une minorit n-
gligeable compare aux nombres rels. Cette dmonstration a provoqu beaucoup de
dbats furieux lpoque, puisque Cantor ne construisait pas un seul nombre transcen-
dant. Sa dmonstration se fait en deux tapes trs simples : (i) les nombres algbriques
sont dnombrables ; (ii) les nombres rels ne sont pas dnombrable. Voyons cela de plus
prs.

20.4.1 Les nombres algbriques sont dnombrables.


Comme nous lavons dit, les nombres algbriques comprennent les racines de tous les
polynmes. Les nombres rationnels sont videment des nombres algbriques, puisque
p/q est solution de lquation px q = 0.
Considrons maintenant un polynme coefficient entier du genre a0 + a1 x + ... +
an xn (an 6= 0). Nous appellerons hauteur de ce polynme le nombre H = n1+|a0 |+
|a1 | + ...|an |. Il existe un seul polynme de hauteur 1 : x. Pour H = 2, nous avons les

274
20 Quest ce quun nombre ?

polynmes suivants : x2 ; x 1. Pour H = 3, x3 ; 2x2 ; x2 x ; x2 1 ; 2x 1 ; x 2


et ainsi de suite. Le fait intressant est que le nombre de racines de tous les polynmes
dune hauteur H est finie ( Combien y en a t il au plus ?). Nous pouvons donc ranger les
nombres algbriques de faon suivante : On prend dabord toutes les racines associes
la hauteur 1, et on les range dans lordre croissant, en liminant les doublons. On
prend ensuite toutes les racines associes H = 2, on les ranges dans lordre croissant
en liminant les doublons et on continu le procd pour H = 3, H = 4,... Cela nous
donne par A = {0 ; 1, 1 ; 2, 1/2, 1/2, 2 ; ...} et il nest pas difficile de voir que
nous avons ainsi une procdure pour dnombrer les nombres algbriques !

20.4.2 Les nombres rels ne sont pas dnombrables.


Supposons que nous avons russi dnombrer tous les nombres rel entre 0 et 1.
Nous les listons dans lordre croissant en utilisant leur reprsentation dcimale :

r0 = 0.a00 a01 a02 ...


r1 = 0.a10 a11 a12 ...
r2 = 0.a20 a21 a22 ...
...

Soit maintenant le chiffre r construit partir des dcimaux diagonaux : r = 0.a00 a11 a22 ...
et construisons un nombre r0 partir de r en changeant chacun des dcimaux de r dune
faon quelconque. Il est alors facile de voir que r0 ne peut pas tre dans la liste ci-dessus !
(Exercice : le dmontrer).

20.4.3 Au del des nombres rels : les hyper-rels.


Si on voulait donner une image de nos nombres, les rationnels seraient des points iso-
ls dans un espace et les rels rempliraient le vide quil y a entre. Peut on encore inventer
des nombres qui se mettraient entre les nombres rels ? Avant le dix-neuvime sicle, les
mathmaticiens avaient lhabitude de manipuler ce genre de nombres quils appelaient
des infiniment petits. Ces nombres cependant provoquaient pas mal de contradictions et
ont t vite chasss du monde. Dans les annes 1960, Abraham Robinson russi de les
rintroduire de faon rigoureuse par une mthode pas trop loin de ce que nous avons vu
pour la construction des nombres rels. Un infiniment petit est par exemple un nombre
 tel que 0 <  < 1/n quelque soit n N. Dans lensemble des nombres hyper-rel,
chaque rel classique est entour dun nuage de nombre distance infiniment petit.
Concrtement, lintroduction de ces nombres napporte pas de nouvelles mthodes
et nous ne dvelopperons pas ce concept plus ici. Nous suggrons au lecteur intress
de se diriger vers des livres plus spcialiss sur ces nombres et lanalyse non-standard.

275
20 Quest ce quun nombre ?

20.5 Les nombres padiques.


Nous allons voir dans cette section des nombres tranges, trs diffrents de ce que
nous connaissions jusque l. La notion de proche et de loin est compltement dissocie
de la notion davant et aprs, contrairement la distance usuelle que nous avons utili-
se pour construire R partir de Q. Il existe dautres valeurs absolues, et la topologie
quelles dfinissent est radicalement diffrente. Rappelons que la valeur absolue doit
avoir les trois proprits mentionnes la section 20.3. Si la valeur absolue a en plus la
proprit suivante :
p4 : |x + y| max{|x|, |y|}
nous lappelons non-archimdienne. Notons que la proprit 4 implique la proprit 3,
puisque max{|x|, |y|} |x| + |y|.
Commenons par les nombres entiers. Donnons nous un nombre premier p. Nim-
porte quel entier n peut scrire de faon unique sous la forme

n = pvp (n) n0

o p . n0 ( p ne divise pas n0 ). Par exemple, si nous avons choisi le nombre premier 5,


nous avons

2 = 50 2
5 = 51 1
6 = 50 6
150 = 52 6

et nous avons donc v5 (2) = v5 (6) = 0 ; v5 (5) = 1 ; v5 (150) = 2. vp (n) est appel la
valuation padique du nombre n, et dsigne la multiplicit du facteur premier p pour
former le nombre n. Par convention, vp (0) = : on peut diviser 0 par p ; le rsultat
tant 0, on peut encore multiplier 0 par p et cela peut continuer infiniment.
On peut tendre de faon vidente la valuation padique aux nombres rationnels :
vp (a/b) = vp (a) vp (b)
Et ce nest pas difficile de voir que
1. vp (xy) = vp (x) + vp (y)
2. vp (x + y) min{vp (x), vp (y)}
Si lon compare les proprits de vp une valeur absolue, nous voyons que vp agit un
peu comme un logarithme. Nous pouvons donc dfinir la valeur absolue padique dun
nombre x par
|x|p = pvp (x)
et pour revenir lexemple des nombres prcdents, |2|5 = |6|5 = 1 ; |5|5 = |10|5 =
1/5 ; |150|5 = 1/25. En utilisant notre convention, nous avons en plus |0|5 = 0.

276
20 Quest ce quun nombre ?

Nous devons remarquer plusieurs chose ce niveau : (i) la valeur absolue padique
dun nombre est infrieure ou gale 1 ; (ii) plus un nombre est divisible par p, plus sa
valeur absolue est proche de 0. Nous laissons au lecteur le soin de dmontrer que cette
valeur absolue en est vraiment une, et quen plus, elle est non archimdienne. Nous
pouvons en plus dmontrer que si x 6= y, alors |x + y|p = max{|x|p , |yp |}.
Super, nous disposons dune valeur absolue sur Q, nous pouvons donc dfinir une
distance : d(x, y) = |x y|p . Par exemple, pour la distance 5-adique, d(5, 6) = 1 ;
d(5, 10) = 1/5 ; d(5, 30) = 1/125. Notons que cette mtrique a la proprit suivante :
d(x, y) max{d(x, z), d(y, z)}x, y, z Q. Cette ingalit est appel lingalit ul-
tramtrique.
Notons combien cette distance est diffrente de la distance habituelle. Prenons par
exemple trois points quelconques mais distinct x, y, z. Alors deux des distances sont
gales ! Ceci dcoule du fait que (x y) + (y z) = (x z). Si |x y| =
6 |y z|, alors
|x z| est gale au plus grand dentre eux.
Comme nous disposons dune distance, nous pouvons dfinir les suites et leur conver-
gences, et fermer Q pour obtenir lensemble Qp . Nous pouvons dvelopper lanalyse
exactement comme nous avons fait avec les nombres rels, dfinir les fonctions, leurs
drives et intgrales, ... Nous ne dveloppons pas plus cela ici, notons simplement
quelques faits inhabituels de ces ensembles :
Pour quune suite an converge, il suffit que |an+1 an | 0 (cest beaucoup plus
simple que le critre
P de Cauchy).
Pour que la srie an converge, il suffit que |an |p 0
Si un point appartient une boule (ouverte ou ferme), il en est le centre,
...

277
21 Bibliograhie.
Ce cours est un rsum rapide de ce que ltudiant en physique devrait savoir. Ce
cours est une introduction qui devrait permettre ltudiant dattaquer les divers sujets
en consultant des livres plus avancs. Ci-dessous, je liste ple-mle quelques livres que
jai eu entre les mains et que jai trouv particulirement intressant pour des tudiants
de niveau L3-M2.

Jean Bass, Cours de Mathmatiques. Cest un cours extrmement complet, en plu-


sieurs volumes, allant des mathmatiques lmentaires aux sujets les plus avances.

Nino Boccara, Analyse fonctionnelle. Le livre le plus lgant que lauteur connaisse
sur le sujet.

Franois Rodier, Distributions et Transformation de Fourier. Lauteur y dve-


loppe les rsultats essentiels de lanalyse fonctionnelle et de la thorie de la mesure
avant dexposer les distributions et les TF, avec un regard de physicien tourn vers
lexprience.

F.W. Byron & R.W. Fuller, Mathematics of classical and quantum physics. Le
livre que chaque tudiant de physique devrait avoir lu.

Ondelettes et Analyse de Fourier. La premire partie de ce livre expose le dvelop-


pement de la thorie de la mesure et des sries de Fourier tout au long du dix neuvime
et du vingtime sicle.

J.G.Simmonds & J.E. Mann, A first look at Perturbation Theory. Un aperu des
divers aspects du calcul de perturbations. Le lecteur plus assoiff se rapportera au livre
de Nayfeh, Perturbation Theory.

C. Lanczos, Linear Differential operators. Lanczos, part avoir t un trs grand


scientifique, a crit des livres dune rare profondeur. Son livre de mcanique analytique
est un pur bijou. Le livre mentionn ici traite avec une trs grande rigueur et lgance
des oprateurs linaires.

278
21 Bibliograhie.

H. M. Edwards, Advanced Calculus : A Differential Forms Approach. Un trs


beau livre sur les formes diffrentielles, crit il y a une quarantaine danne et nayant
rien perdu de sa beaut. La plupart des livres sur les formes diffrentielles sont rser-
vs aux tudiants avancs de mathmatiques, o lexpos est noy sous des tonnes de
thorme-dmonstration. Edwards fait jaillir toute la beaut de ces objets mathma-
tiques. Pour une lecture plus avanc mais toujours aussi lgant, le lecteur pourra se
rapporter au livre dArnold : mathmatiques de la mcanique classique.

S.L. Sobolev, Partial differential equations of mathematical physics. Un grand


tour des EDP de la physique, crit par un des grands chercheurs du domaine qui sait
galement tre trs pdagogue.

David M. Bressoud : A Radical Approach to Lebesgues Theory of Integration.


Nous navons pas abord lintgrale de Lebesgue dans ce cours. Il est rare pour un
physicien davoir besoin dautres choses que des intgrales de Riemann ( lexception
de la thorie des quations diffrentielles stochastiques). Cependant, pour ltudiant
ayant des penchants pour les belles mathmatiques, ce livre est un must.

Doran and Lasenby : geometric algebra for physicists. Les tenseurs (en ma-
jorit) et les formes diffrentielles (en minorit) sont les deux langues principales de
la physique. Il existe une troisime langue, dveloppe depuis le milieu du XIXme
sicle (algbre de Grassman) que nous appelons de nos jours lalgbre gomtrique.
Les concepts de nvecteurs et nformes sont gnraliss (on peut faire des mlanges)
et la drivation extrieure et intrieure sont unifies. Si vous avez aim les formes diff-
rentielles, vous allez adorer ce thme, expos trs clairement par les auteurs ci-dessus.

Autres. Beaucoup de thmes indispensables ont t ngligs dans ce manuscrit. La


thorie des fonctions holomorphes et lanalyse complexe sont trs bien trait chez Bass
ou Byron et Fuller, nous suggrons galement le livre dAlbowitz, complex variables.

279

Vous aimerez peut-être aussi