Méthodes Classiques de Physique Théorique - Cours Et Problèmes Résolus - PDF Ver

Richard Kerner
Méthodes classiques
de physique théorique
Cours et problèmes résolus
Méthodes classiques de
physique théorique
Cours et problèmes résolus
Richard Kerner
Collection Références sciences
dirigée par Paul de Laboulaye

paul.delaboulaye@edltions-ellipses.fr
Retrouvez tous les livres de la colleotion et des extraits sur wvm .editions-^lllpsesJr
IS B N 9 7 8 -2 -3 4 0 0 -0 0 0 6 -3
©Ellipses Édition Marketing S.A., 2014
32, rue Bargue 75740 Paris cedex 15
Le Code de la propriété intellectuelle n’autorisant, aux termes de l’article L. 122-5.2° et
3°a), d’une part, que les « copies ou reproductions strictement réservées à l’usage privé
du copiste et non destinées à une utilisation collective », et d’autre part, que les analyses
et les courtes citations dans un but d’exemple et d’illustration, « toute représentation ou
reproduction intégrale ou partielle faite sans le consentement de l’auteur ou de ses ayants
droit ou ayants cause est illicite » (art. L. 122-4).
Cette représentation ou reproduction, par quelque procédé que ce soit constituerait une
contrefaçon sanctionnée par les articles L. 335-2 et suivants du Code de la propriété
intellectuelle.
www.editions-ellipses.fr
Je dédie ce livre à mes collaborateurs et complices :
Claire Bousquet, Christian Carimalo et Philippe Sindzingre
Préface
Les mathématiques jouent un rôle important dans de nombreuses disci

plines. Dans la plupart des sciences de la nature, leur rôle est essentielle
ment instrumental et se réduit souvent à n’être qu’un simple outil au ser
vice d ’une modélisation des phénomènes. En physique elles ont un rôle fort
différent. Le statut privilégié de la physique provient de ce que les lois et
les concepts peuvent être formulés dans un langage mathématique précis. Les
mathématiques servent de principe organisateur et de cadre aux théories phy
siques et en retour ces dernières sont souvent une source d’inspiration pour
les mathématiciens. De ce fait la physique et les mathématiques entretiennent
des liens très étroits.
L’enseignement universitaire ne met que très rarement en relief les liens
qui existent entre ces deux disciplines. Ceci est d’autant plus regrettable que
ces liens n’ont cessé de s’approfondir au cours des dernières décennies, révélant
ainsi l’unité profonde du processus de création scientifique. De ce point de vue
l’ouvrage de Richard Kerner Méthodes classiques de physique théorique ar
rive fort à propos. Ce n’est pas un nouvel ouvrage de mathématiques pour
la physique - il en existe d ’excellents - mais un ouvrage d’initiation à la
physique théorique dont l’ambition est de faire découvrir aux élèves de li
cence certains aspects de sa démarche et de ses méthodes. Nourri par une
longue expérience de recherche et d ’enseignement, l’ouvrage met l’accent sur
les méthodes géométriques en physique. C’est là un choix tout à fait judi
cieux car les approches géométriques imprègnent toutes les grandes théories
physiques actuelles.
L’auteur part de la mécanique classique en exposant de façon claire et pro
gressive ses différentes formulations : formulation newtonienne, lagrangienne et
hamiltonienne. Le chapitre consacré aux principes variationnels fait ressortir
la puissance de cette approche et son caractère universel. Il montre comment
le calcul variationnel trouve aussi des applications remarquables en optique et
dans l’étude des mouvements géodésiques.
L’auteur quitte ensuite la mécanique classique pour aborder son terrain
de prédilection qui est la géométrie différentielle et la théorie des groupes. Le
11 PREFACE
lecteur pourra se familiariser avec la notion de tenseur qui est omniprésente en

théorie classique des champs et aussi découvrir quelques éléments de géométrie
différentielle en partant de la géométrie des surfaces plongées. La notion de
dérivée de Lie exposée d ’une façon particulièrement claire et concise est illustrée
sur plusieurs exemples. Tous ces outils ne seront pas assimilés en vain : ils
préparent le lecteur curieux à se plonger dans la relativité générale, théorie
géométrique par excellence. De la géométrie différentielle des surfaces plongées
à la relativité générale il n’y a qu’un pas qu’un étudiant motivé pourra franchir
aisément.
Un autre thème central de la physique théorique moderne est la théorie
des groupes. Après avoir donné un aperçu de quelques groupes finis qui in
terviennent en cristallographie, l’auteur introduit la notion de groupe de Lie.
Ces objets, dotés d’une structure de groupe et de variété différentiable, per
mettent de décrire de façon précise comment agissent les symétries. L’étude
des invariants d ’un groupe de transformation combinée avec l’idée du principe
d ’inertie débouche sur la classification des différentes cinématiques, relativistes
et galiléennes. Bien que l’auteur n’aborde pas la physique quantique, le lec
teur pourra trouver ici et là des indications sur le rôle joué par la théorie des
représentations.
Dans un texte écrit dans un style clair, direct et expurgé de tout forma
lisme inutile, l’auteur fait partager au lecteur son intérêt pour les approches
géométriques. Chaque chapitre est accompagné d ’une série d ’exercices corrigés
permettant de vérifier que les concepts ont bien été assimilés. Ce livre original
qui n’a pas d’équivalent en langue française est à recommander chaleureuse
ment aux élèves de L3 et de M l intéressés par la physique fondamentale.
Alain Comtet
Professeur à l’Université Pierre et Marie Curie
Avant-propos
Dans le cursus obligatoire de L2 et L3 de physique, les mathématiques

occupent la place qui leur est due ; néanmoins le contenu standard laisse des
chapitres entiers totalement inexplorés. Depuis l’introduction de l’enseigne
ment de l’informatique et de nombreux cours de programmation sur ordina
teur, l’enseignement obligatoire en mathématique a du être allégé. Presque
tous les cours annuels sont devenus semestriels. Suite à ces bouleversements,
les étudiants souhaitant continuer les études de physique, surtout en physique
théorique et fondamentale, ont été dépourvus d ’outils mathématiques indis
pensables à une bonne assimilation de la relativité, la mécanique quantique ou
la théorie des champs, classiques et quantiques.
On peut dire sans exagération que la physique en particulier et la science
moderne en général prend ses sources dans la mécanique. Ce sont les problèmes
de statique et d’équilibre qui ont incité les compagnons maçons, puis archi
tectes, à étudier les rapports entre la géométrie et les forces agissant sur
les objets matériels ; les rapports entre les forces et mouvements des objets
sont restés plus obscurs jusqu’à l’avènement de la science moderne dont les
méthodes ont été forgées par Galileo Galilei. Parallèlement, le développement
de l’astronomie et l’introduction du système héliocentrique de Copernic ont
conduit Kepler à l’énoncé de ses trois lois de mouvement des planètes. Et ce
fut au tour d’Isaac Newton de comprendre la loi de la gravitation universelle
et de transformer la mécanique et la physique en véritables sciences modernes.
Mais la mécanique n ’a pu se développer sans outils mathématiques permet
tant une description détaillée et adéquate des positions, mouvements et tra
jectoires de corps matériels. La mécanique céleste a énormément influencé le
développement de la géométrie en deux et trois dimensions. Les calculs de plus
en plus précis ont demandé l’introduction de méthodes mathématiques permet
tant de traiter de situations de plus en plus compliquées. Les problèmes liés aux
mouvements contraints sur les surfaces de forme arbitraire, ainsi que l’élasticité
et déformation des corps étendus ont créé le besoin d’outils géométriques
plus sophistiqués connus depuis sous le nom de la géométrie différentielle.
IV AVANT-PROPOS
Les prémices de cette nouvelle branche des mathématiques ont été intro
duits par la cartographie et la géodésie; les premiers travaux généralisant
de manière exacte la géométrie des surfaces arbitraires ont été le mérite du
grand mathématicien allemand C.F. Gauss.
En même temps, les mathématiciens et les physiciens trouvaient une nou
velle expression de plusieurs lois de la nature, qui avaient pour trait commun
la propriété de rendre un des paramètres essentiels du problème minimal ou
maximal. On a découvert que les positions d’équilibre d ’un système mécanique
correspondaient à un minimum du potentiel. Grâce au principe de d ’Alem
bert généralisé aux mouvements arbitraires, y compris les mouvements avec
contraintes, on a pu étendre ce principe de minimum aux systèmes dyna
miques en mouvement. Ces travaux ont conduit à l’apparition d ’une nouvelle
technique, appelée calcul variationnel.
Parallèlement, une nouvelle branche des mathématiques s’est développée :
le calcul tensoriel. L’utilisation des coordonnées curvilignes et des repères lo
caux non-cartésiens a créé le besoin de pouvoir décrire les phénomènes phy
siques de manière commune indépendante de coordonnées choisies. Heureuse
ment, la nouvelle formulation de la mécanique introduite par J.L. Lagrange a
pu servir d’exemple : les équations d ’Euler et de Lagrange gardent leur forme
quelque soit le choix des coordonnées. Cela s’appelle la covariance, et le cal
cul tensoriel en est l’expression, car il permet de formuler les équations et
de les transformer d ’un système des coordonnées à un autre tout en gardant
leur forme. Cette approche a permis une meilleure compréhension du rôle
des transformations de Galilée, puis de Lorentz, et finalement, l’avénement
de la Relativité Générale d ’Einstein. Dans cette dernière théorie, confirmée
par de nouvelles observations et expériences de plus en plus fines, les forces
de gravitation sont traitées de la même manière que les forces d ’inertie, et
tout mouvement sous l’effet de ces forces suit une ligne géodésique dans une
géométrie non-Euclidienne. La déformation de l’espace (et du temps) est alors
due à la présence des corps massifs.
L’approche lagrangienne n ’a pas eue le dernier mot en mécanique analy
tique. En remplaçant les vitésses généralisées par les impulsions généralisées,
le mathématicien Irlandais W.R. Hamilton a reformulé le principe variation
nel de Lagrange en introduisant l’espace des phases (coordonnées généralisées
-f- impulsions généralisées), et par conséquent, remplacer N équations de La
grange de second ordre par 2N équations de premier ordre, plus facilement
intégrables. Ces équations portent le nom de Hamilton ; on les appelle quel
quefois les équations canoniques de Hamilton. Elles restent invariantes sous
l’effet des transformations canoniques, mélangeant les coordonnées et impul
sions généralisées.
Les équations de Lagrange et de Hamilton pouvant être formulées dans
AVANT-PROPOS
n’importe quel système de coordonnées curvilignes, ont stimulé l’intérêt pour

la géométrie différentielle. Cette branche des mathématiques a été développée
tout d’abord en Allemagne par K.F. Gauss, puis par son élève B. Riemann,
et parallèlement par N. Lobatchevski en Russie. Gauss a élaboré les méthodes
permettant d ’évaluer les aires des surfaces ayant une forme arbitraire, et
de calculer les flux de divers champs vectoriels à travers les surfaces ou
vertes ou fermées. Riemann et Lobatchevski ont introduit les géométries non-
euclidiennes, reproduisant les relations géométriques caractéristiques pour une
sphère ou un hyperboloide. Mais l’essor principal de la géométrie différentielle
est dû à l’introduction du calcul tensoriel par l’école italienne représentée par
les mathématiciens Ricci et Levi-Cività, et des formes extérieures dues à Grass-
mann en Allemagne et Elle Cartan en France.
L’étude des transformations de coordonnées a conduit le mathématicien
norvégien S. Lie à une analyse approfondie des groupes de transformation.
En introduisant la notion d’un groupe continu (appelé désormais groupe de
Lie, il a créé un outil remarquable permettant de décrire le rôle des symétries
en physique. Cette théorie est fondamentale pour la description des interac
tions entre champs et particules élémentaires. On peut dire sans exagération
que les symétries des interactions fondamentales impriment leur marque sur
les propriétés de covariance des équations régissant le comportement de corps
macroscopiques et qu’en fin de compte, ce sont ces symétries que l’on retrouve
ensuite sous la forme du groupe de Lorentz permettant de lier les valeurs du
champ électromagnétique mesurées par des observateurs galiléens distincts.
Les représentations des groupes à l’aide de matrices ont permis de comprendre
la nature de certains champs qui se transforment de manière très particulière :
les spineurs. Ces derniers sont nécessaires pour décrire les propriétés physiques
des particules élémentaires telles que l’électron, le proton ou le neutron, ap
pelées aussi les fermions.
Les équations différentielles étudiées en physique sont souvent non-linéaires.
Il n ’existe pas de méthode universelle pour traiter les systèmes d ’équations
non-linéaires ; ce que nous pouvons faire, c’est de trouver des méthodes d ’ap
proximation, à commencer par l’approximation linéaire, et de les affiner par
la suite. Une autre possibilité d ’aborder les problèmes non-linéaires consiste
en l’analyse qualitative des solutions. Les méthodes géométriques remplacent
alors les méthodes analytiques. Les isoclines, courbes sur lesquelles la dérivée
a la même valeur, permettent d ’établir le portrait de phase d ’un système
différentiel, dans le plan de la variable x et de sa dérivée y = x. Les courbes
fermées dans l’espace des phases (x,y) représentent alors les mouvements
périodiques du système. Cette approche a été développée par H. Poincaré,
B. Van der Pol et N.N. Bogolyubov. Une classe importante d’équations non-
linéaires décrivant la dynamique des populations, mais utilisées aussi en phy
VI AVANT-PROPOS
sique et en chimie, a été introduite par V. Volterra. Les problèmes non-linéaires

et les méthodes d ’approximation ainsi que l’analyse qualitative sont l’objet du
dernier chapitre de ce livre.
Quelques mots à propos de notations utilisées dans ce livre : les vecteurs
euclidiens en trois dimensions sont représentés par des caractères gras. Les
exemples les plus importants sont précédés d ’un signe spécial, un trèfle ou un
pique. Des problèmes sont proposés en fln de chaque chapitre, les solutions
se trouvent groupées en fln du livre. Certaines questions, ainsi que quelques
problèmes, sont marqués par une étoile; leur solution est laissée au lecteur.
Avant de les consulter les solutions, essayez de résoudre les problèmes proposés
sans aide, et vériflez ensuite les résultats obtenus.
Dans notre exposition, nous avons essayé de ne laisser aucune afliirmation,
aucun théorème sans exemple concret illustrant le procédé. Car selon l’adage
latin, “Verba docent, exempla trahunt” , ce qui veut dire en français, “Les mots
enseignent, les exemples entraînent”
Remerciements
Ce livre est basé sur les polycopiés des cours dispensés à l’Université Pierre et
Marie Curie pendant les années 2002-2012, pour les étudiants de la deuxième
et troisième année de Licence de Physique. Le cours de L2 était consacré à
la mécanique analytique, y compris les méthodes lagrangiennes et hamilto
niennes ; le cours de L3 s’adressait aux étudiants souhaitant continuer leurs
études dans les domaines plutôt théoriques, nécessitant une connaissance ap
profondie des méthodes mathématiques.
Les deux cours ont été accompagnés de travaux dirigés, dispensés par mon
collaborateur et complice Christian Carimalo, Maître de Conférences à l’Uni
versité Pierre et Marie Curie. Le présent livre lui doit beaucoup, car il a conçu
plusieurs problèmes originaux qui apparaissent en fln de chaque chapitre. Il
a également produit plusieurs flgures et dessins. Son aide constante et ses
conseils m’ont permis d’en améliorer tant la présentation que le contenu. C’est
donc en premier lieu que je lui adresse ma gratitude et les remerciements les
plus sincères.
Je remercie mon collègue et ami Alain Comtet d ’avoir attentivement lu
le manuscrit et y apporter pluseurs corrections et suggestions qui ont permis
d ’en améliorer la qualité d ’exposition.
Je remercie aussi Oscar Laurent pour son aide précieuse dans la relecture
et la compilation du manuscrit.
Table des matières
Mécanique du point matériel 1

1.1 Introduction...................................................................................... 1
1.2 Mouvement d’un point. Trièdre deP r e n e t ................................... 2
1.3 Vitesse et accélération en repèremobile.......................................... 6
1.4 Changements de re p è re s ................................................................. 14
1.5 Dynamique new tonienne................................................................. 16
1.6 Lois de co n serv atio n ....................................................................... 25
1.7 Problèm es......................................................................................... 45
Mécanique lagrangienne 49
2.1 Principe de d ’Alembert ................................................................. 49
2.2 Equations de L agrange.................................................................... 67
2.3 Invariance des équations de Lagrange........................................... 71
2.4 Constantes du m ouvem ent............................................................. 75
2.5 Problèm es......................................................................................... 80
Calcul variationnel 85
3.1 Introduction...................................................................................... 85
3.2 Exemples de fonctionnelles.............................................................. 91
3.3 Classes des fonctionnelles, théorème p rin c ip a l............................ 93
3.4 Les équations d ’Euler-Lagrange.................................................... 97
3.5 G énéralisations................................................................................... 106
3.6 Extrémum conditionnel ....................................................................113
3.7 Symétries et lois de c o n serv atio n .................................................... 117
3.8 Problèm es............................................................................................ 121
Formalisme hamiltonien 127

4.1 Introduction......................................................................................... 127
4.2 Principe variationnel. Equationsde H a m ilto n ................................ 131
4.3 Crochets de P o is s o n ..........................................................................133
4.4 Transformations canoniques..............................................................136
vni TABLE DES MATIERES
4.5 Fonctionnelle de Jaoobi. L’analogie o p t i q u e ...............................143

4.6 L’équation de H am ilton-Jacobi.................................................... 146
4.7 Problèm es.........................................................................................154
Tenseurs et spineurs 161

5.1 Préam bule............................................................................................ 161
5.2 Repère lo c a l.........................................................................................162
5.3 Transformations de coordonnées. Covariance..................................165
5.4 Produit tensoriel d’espaces vectoriels.............................................. 170
5.5 Tenseurs covariants et contravariants ...........................................174
5.6 Symétries. Opérations sur les te n s e u r s ...........................................178
5.7 Espace-temps. Tenseurs en 4 dim ensions........................................ 185
5.8 S pineurs...................................................................... 194
5.9 Problèm es............................................................................................201
Géométrie différentielle 207

6.1 Coordonnées curvilignes et repère lo c a l...........................................207
6.2 Plongements. Géométrie des surfaces................................................210
6.3 Champs vectoriels, dérivée de Lie......................................................218
6.4 Les isom étries......................................................................................224
6.5 Connexion. Dérivée covariante.......................................................... 227
6.6 Aires et volumes. Formes ex térieu res..............................................235
6.7 Intégration des p-formes. Théorème de S to k es...............................241
6.8 Problèm es............................................................................................249
Théorie des groupes 255

7.1 Symétries et lois de c o n serv atio n ....................................................255
7.2 Symétriess discrètes, groupes cristallins ........................................265
7.3 Symétries cristallines......................................................................... 267
7.4 Groupes de L i e ...................................................................................270
7.5 Champs invariants, l’algèbre de L i e .................................................275
7.6 Groupes de rotations en 2 et 3 dim ensions.....................................280
7.7 Angles d ’E u l e r ...................................................................................282
7.8 Espace-temps et groupe de L o ren tz .................................................287
7.9 Groupe de Lorentz et algèbre de Clifford........................................297
7.10 Problèm es............................................................................................301
8 Problèmes non-linéaires 307

8.1 Préam bule............................................................................................307
8.2 Méthode des approximations successives........................................308
8.3 Méthode des isoclines ...................................................................... 311
8.4 Points singuliers. L in é a risa tio n ....................................................... 317
TABLE DES MATIERES IX
8.5 Résonances. Méthode de Poincaré.................................................... 320

8.6 Méthode stroboscopique................................................................... 324
8.7 Phénomènes quasi-périodiques.......................................................... 327
8.8 Problèm es............................................................................................ 335
Solutions des problèmes 339

Mécanique classique du point m a té rie l.................................................... 339
Mécanique lagrangienne.............................................................................351
Calcul variationnel......................................................................................366
Formalisme ham ilto n ien .............................................................................382
Calcul ten so riel............................................................................................ 398
Géométrie différentielle .............................................................................408
Théorie des g r o u p e s ...................................................................................421
Problèmes n on-linéaires.............................................................................428
Bibliographie 435
Index 436
Chapitre 1
Mécanique du point matériel
1.1 Introduction
Les objets dont nous nous servons dans la vie courante présentent les ca-
ractéris-tiques de corps solides en tridimensionnels, de tailles non négligeables.
Nous commencerons néanmoins nos rappels de mécanique par la cinématique
d ’un point matériel. On considère comme point matériel tout objet suffisam
ment petit et rigide, dont les dimensions peuvent être négligées en comparaison
des distances parcourues.
A cet égard, rappelons qu’en mécanique céleste, la Terre et d ’autres planètes

du système solaire peuvent être traitées comme des points matériels, tant les
distances parcourues sont énormes par rapport aux dimensions propres de ces
objets. Par exemple, le diamètre de la Terre étant égal à 12 800 km environ
et sa distance moyenne du Soleil étant de 150000000 km, le rapport entre
ces deux grandeurs est 8,6 x 10“ ®. Imaginons deux joueurs de tennis séparés
par une distance de 20 mètres au maximum. En gardant la même échelle,
et en comparant chacun des deux joueurs au Soleil et la balle à la Terre, la
balle devrait mesurer 20 x 8,6 x 10“ ®mètres, soit à peine deux millimètres de
diamètre, ce qui, en pratique, la rendrait semblable à un point matériel, du
point de vue des joueurs, bien entendu.
La validité de l’approximation du point matériel dépend donc de la situation

considérée et du problème à résoudre ; en fin de compte, c’est le bon sens qui
décide de l’opportunité d ’une telle description.
2 CHAPITRE 1. MÉCANIQUE DU POINT MATERIEL
1.2 Mouvement d’un point. Trièdre de Frenet

Commençons donc par l’analyse d ’un mouvement arbitraire d ’un point matériel
dont la position dans l’espace est repérée par ses coordonnées cartésiennes ^
r(i) = x{t) i + y{t)j + z{t) k ( 1. 1)
où les trois vecteurs i, j, k forment un repère orthonormé, d ’orientation directe,

immobile par rapport à l’observateur. Il va de soi que les fonctions x{t), y{t)
et z{t) sont au moins deux fois différentiables et régulières (entre autres, elles
n’admettent pas de valeurs multiples pour une valeur de t donnée, etc). L’en
semble des points r(i) pour toutes les valeurs t du temps pendant lequel nous
observons le mouvement forme la trajectoire du point matériel (figure 1.1).
F ig u r e 1.1 - Trajectoire d’un point matériel. Le vecteur vitesse évolue avec le temps.
Le vecteur vitesse du point matériel est défini comme la dérivée première du

vecteur position r(i) par rapport au temps t. L’ensemble des trois dérivées
premières des coordonnées cartésiennes se projettera alors sur les trois axes
du repère immobile comme suit
dr dx, dy. dz. ................... ..
où nous avons introduit la notation “point” pour représenter la dérivation

temporelle : x = dx/dt, etc. Il est souvent utile d’introduire la représentation
graphique de l’évolution temporelle du vecteur vitesse au cours de mouvement
du point matériel. Cette visualisation s’appelle Vhodographe et se représente
1. Attention à la notation ; désormais, les lettres écrites en caractères gras correspondent
aux vecteurs en trois dimensions.
1.2. MOUVEMENT D’UN POINT. TIUEDRE DE FRENET 3
par une courbe dans l’espace des vitesses, que l’on obtient en reportant les
vecteurs vitesse v(i) à partir de l’origine (figure 1.2).
F ig u r e 1.2 - L’hodographe.
L ’accélération est la dérivée de la vitesse par rapport au temps, ou encore la

dérivée seconde de la position r par rapport au temps :
dv (fir .................... ..
La vitesse instantanée est tangente à la trajectoire, tandis que l’accélération

peut avoir aussi une composante perpendiculaire à la trajectoire. Introduisons
la vitesse scalaire, c’est à dire, la valeur absolue de la vitesse :
++ +(f) +(§)
La même expression peut être écrite à l’aide de l’élément de longueur
ds = \Jdx^ + dy^ + dz^

puisque
Idx^ + dy“^ + dz“

^ ds
\d t J \d t J V dt“
^ = dt
^ (1-3)
On peut utiliser l’élément de longueur ds à la place du temps dt pour pa

ramétrer la trajectoire. Le vecteur vitesse v peut alors être écrit comme la
dérivée composée :
dr dr ds dv
V = — = — — = V — = vt, (1.4)
dt ds dt ds
où t est le vecteur tangent à la trajectoire. On prouve facilement que ce vecteur
est unitaire. En effet, le carré de sa norme vaut
CHAPITRE 1. MECANIQUE DU POINT MATERIEL
/d r ^ ^ ( d x \ ‘^ i dx^ + dy'^ + dz“

^ ds^
=1
“ (*j - ( * ) ^ [ n ) + ( * ) " ds^ ds^
Il s’ensuit que la dérivée du vecteur t par rapport à la longueur ds définit un

vecteur qui lui est orthogonal, ou bien est nul. En effet, utilisant la règle de
Leibniz, on obtient
d ,dt
^ t^ = 2 ^ • t = 0, car = 1 = constante (1.5)
ds ds
Le vecteur dt/ds est donc ou bien nul, ou bien orthogonal au vecteur t à tout
instant et partout sur la trajectoire. Supposons qu’il ne soit pas nul. Ce n ’est
pas un vecteur unitaire, mais on peut définir un vecteur unitaire n qui lui est
colinéaire en posant
dt ,. dt 1
p — = n, ou bien — = - n ( 1.6)
ds ds P
Le facteur normalisateur p(s), qui a la dimension d’une longueur, est appelé

rayon de courbure de la trajectoire au point considéré. L’inverse de p, soit 1/p,
s’appelle tout simplement courbure^ cette dénomination correspondant bien à
notre perception intuitive du phénomène. Quand la dérivée dt/ds tend vers
zéro, le vecteur t devient constant le long de la trajectoire qui devient donc
une droite, et la courbure d ’une droite est nulle. On peut aussi dire que le
rayon de courbure de la trajectoire tend alors vers l’infini.
Dans le cas où le rayon de courbure reste constant et que le mouvement est
plan, la trajectoire n ’est autre qu’un cercle. Considérons par exemple le mou
vement circulaire le plus simple, à vitesse scalaire v constante. Soit R le rayon
du cercle, centré en O. Les coordonnées cartésiennes du point mobile seront
alors données par les fonctions trigonométriques bien connues :
x = Rcosu)t, y = iîs in w i
On a donc
dx = —Rw sin <jjt dt, dy = Rw cos out dt
et alors
ds^ = dx^ -|- dy^ — iî^w^(sin^ wi + conduit) dt^ = Rû^dt^

1.2. MOUVEMENT D V N POINT. TRIÈDRE DE FRENET 5
ce qui définit l’élément de longueur du cercle comme ds = Rujdt, la vitesse

scalaire étant constante et égale à v = toR. Calculons le vecteur tangent t :
dx dy
t = = [—sinwi, coswt] (1.7)
ds' ds
qui est bien évidemment unitaire puisque sin^wi + cos^wt = 1. Maintenant,

trouvons la dérivée dt/ds de ce vecteur :
dt -U cos (jjt dt —ujsimotdt

= — [—coswi, —sinwi]
ds Ru>dt ' Rwdt R
En invoquant la définition du vecteur unitaire normal n, on peut identifier
dt 1 1 , . ,
ds P R'- ' ‘
d ’où, dans ce cas précis du mouvement uniforme sur un cercle de rayon R,
p = R, n = I —sinut, —coswi]
D ’une façon générale, à partir des deux vecteurs t et n ainsi définis, unitaires
et mutuellement orthogonaux en tout point de la trajectoire, on constitue
un repère mobile local en leur associant un troisième vecteur défini comme
b = t A n, appelé vecteur bi-normal. Ce vecteur est orthogonal aux deux
vecteurs t et n et lui-même unitaire. Les trois vecteurs ainsi définis forment le
repère de Prenet (ou trièdre de Prenet), représenté sur la figure (1.3).
F ig u r e 1.3 - Trièdre de Frenet. Les trois vecteurs sont : le vecteur tangent t, le

vecteur normal n et le vecteur bi-normal b.
6 CHAPITRE 1. MECANIQUE DU POINT MATERIEL
1.3 Vitesse et accélération en repère mobile.
Le repère de Prenet évolue dans le temps, accompagnant le point matériel

dans son mouvement. Dans un avion en vol, on identifie facilement le vecteur
t au vecteur unitaire colinéaire avec la vitesse instantanée ; le vecteur normal
n est identifié au vecteur perpendiculaire au plan des ailes de l’avion et dirigé
vers le centre de courbure de la trajectoire. Précisons ce qu’on entend ici par
“centre de courbure” . Un morceau infinitésimal de la trajectoire peut toujours
être assimilé à un arc d ’un cercle qui est tangent à la trajectoire en ce point
et coïncidant avec la trajectoire sur ce parcours infinitésimal. Le centre de
courbure de la trajectoire au point considéré est le centre de ce cercle, dont le
rayon détermine le rayon de courbure de la trajectoire en ce point.
Voyons comment le vecteur accélération instantanée se décompose par rapport
au trièdre de Prenet. D’après (1.6) la dérivée du vecteur vitesse ne peut avoir
de composantes que le long de t et de n.
En effet, en dérivant la vitesse v par rapport au temps et en appliquant la
formule de Leibniz, nous trouvons deux termes :
dv dv , dt , dt ds
( 1 .8 )
OÙ l’on a posé ot = dv/dt = v. Compte-tenu de ds/dt = v, et en utilisant la

définition (1.6) du vecteur normal n , on arrive à la formule suivante :
du , d td s .,
a = -rrt + v - r ^ = ut-|---- n = aft-fa„n (1.9)
dt ds dt P
La composante ot est l’accélération tangentielle, c’est-à-dire, la projection

de a selon la direction du vecteur vitesse instantanée v, tandis que est
l’accélération normale, composante de a perpendiculairement à la vitesse ins
tantanée.
La formule (1.6) définissant la dérivée paj rapport à s du vecteur tangent t
suggère qu’il doit y avoir aussi des formules pour les dérivées des deux vecteurs
restants du trièdre de Prenet,
dn db
ds ^ ds
trièdre de Prénet de Prenet le long de la trajectoire, passant du point repéré
par s au point infinitésimalement proche repéré par s + 5s :
1.3. VITESSE ET ACCÉLÉRATION EN REPÈRE MOBILE.
F ig u r e 1.4 - Variation infinitésimale du trièdre de Frenet au cours du mouvement.
De façon évidente, dans le passage de s à s + les vecteurs du trièdre de

Frenet se transformeront selon les formules
= t+ n^n' = n+ ^5 s, b->^b' = b + ^ 5 s (1-10)

as as as
Cependant, les relations d’orthogonalité et l’unitarité de chaque vecteur doivent

rester en vigueur pour les trois nouveaux vecteurs obtenus après ce déplacement.
C’est-àrdire que les six relations
b = tAn, n = bAt, t = nAb; t^ = l , n^ = l , b^ = l (1.11)
doivent être reproduites en s + 5s :
b' = t ' A n ' , n' = b ' A t ' , t' = n 'A b ' ; t'^ = 1 , n'^ = 1 , b'^ = 1 (1.12)
Nous avons déjà vu que
t' = t + ^ 5 s = t + - n 5 s
as P
Pour trouver la dérivée dh/ds, comparons deux définitions du vecteur b ' :
b' = t'A n' = ^ ^ ~ ^^ ^
Comme toujours dans le calcul différentiel, on néglige le terme carré, propor

tionnel à (5s)^, qui est d ’ordre supérieur, ce qui conduit à l’équation
CHAPITRE 1. MÉCANIQUE DU POINT MATERIEL
b' = t'A n'~tA n + f ^ A n + tA ^ ¿s') = b + ^ ¿s (1-13)

\d s as J as
En identifiant les termes proportionnels à 5s on trouve ainsi
dh dt . dn
— = ^ An + t A— (1.14)
ds ds ds
Mais comme dt/ds est colinéaire à n, le premier produit vectoriel est égal à 0.
Il ne reste donc que
Le vecteur b étant unitaire, sa dérivée lui est orthogonale (ou nulle)
^ = 2 b -t= 0
ds ds
D’autre part, le produit vectoriel dans (1.15) est orthogonal au vecteur t, ce

qui finalement ne laisse au vecteur (1.14) qu’une seule composante non nulle,
le long du vecteur normal n. En conclusion, on doit avoir
= —T U (1.16)
ds
Le coefiicient r s’appelle la torsion de la courbe ; le signe “moins” est choisi
par convention, suivant le choix original de Frenet. Le vecteur n étant unitaire
(n^ = 1), sa dérivée lui est orthogonale (ou nulle) et ne peut donc a priori
avoir de composantes que selon t et b. On écrit donc
dti , O,
— = a t + )9b
ds
Faisons le produit vectoriel de cette équation par le vecteur t. Compte-tenu
de (1.11) et du fait que t A t = 0, on trouve
/7n
t A — = t A ( a t - f - ) S b ) = ) d t A b = —/3n (1.17)
ds
Mais nous avons vu plus haut (1.14,1.16) que la même expression donne —r n,
ce qui permet d’identifier le coefficient /3 à r. Il ne reste plus qu’à identifier
la constante a. Pour ce faire, nous pouvons utiliser l’identité n = b A t et la
dériver :
1.3. VITESSE ET ACCELERATION EN REPERE MOBILE.
dn db . , dt
— = — A t + bA —
ds ds ds
Les dérivées de deux vecteurs, b et t étant connues par (1.16, 1.6), on peut
les substituer dans la formule ci-dessus pour obtenir
dn , , 1
— = —r n A t -h b A - n (1.18)
ds P
ce qui donne finalement
dn 1
— = r b ---- 1 (1.19)
ds P
La dérivée par rapport à s de chacun des trois vecteurs de la base de Prenet

apparaît comme une somme se décomposant selon les deux vecteurs restants.
On peut représenter l’action de la dérivation par rapport à s comme une
matrice agissant sur l’ensemble des trois vecteurs (t, n, b) que l’on aligne en
une seule colonne et écrire l’ensemble des équations obtenues sous la forme
0 i 0\
P
( 1. 20)
-i 0
of -r 0/
Puisque chacun des trois vecteurs t, n et b peut être obtenu par le produit
vectoriel des deux autres vecteurs (voir 1.12), on peut aussi représenter l’action
de la dérivation par rapport à s comme celle d ’un opérateur agissant sur la
colonne formée par les trois vecteurs du repère de Prenet, consistant à en
effectuer le produit vectoriel avec un vecteur commun u) :
= Wt t -HWn n -h W6 b (1.21)
comme suit
0 Wfc -W n\ / t '
-uJb 0 wt j j n ( 1.22)
Wn -Mb 0 / \b ,
En comparant les deux formules on constate que
u>t = T , Wn = 0 , u>b = -
P
10 CHAPITRE 1. MÉCANIQUE DU POINT MATÉRIEL
On peut donc dire que pendant le mouvement d ’un point matériel, son trièdre
de Prenet tourne autour du vecteur tangent t et autour de la bi-normale b, le
vecteur de rotation instantanée u> n ’ayant pas de composante le long du vecteur
normal n. C’est une particularité du repère de Prenet : un repère quelconque
pourrait tourner autour de n ’importe quel axe arbitrairement choisi.
Si la torsion r est nulle, la courbe reste dans le plan défini par les deux vecteurs
t et n. Ce plan est fixe, car il est perpendiculaire à la bi-normale b = t A n
qui reste constante au cours du mouvement.
On remarque aussi que la matrice agissant sur le repère est antisymétrique et
qu’elle ne dépend que des deux paramètres p e t r (le rayon de courbure et la
torsion). Notons aussi que l’on peut avoir une courbe avec p 7^ 0 et r = 0,
c’est à dire une trajectoire avec courbure mais sans torsion (trajectoire située
dans un plan), mais on ne peut pas avoir r 7^ 0 avec p~^ = 0 , car pour avoir
un vecteur b non nul il faut déjà que n soit différent de 0.
Remarquons aussi qu’en général, une matrice 3 x 3 antisymétrique dépend de
trois paramètres
0 a P
—a 0 7
-7 -P 0
Le cas du trièdre de Prenet est donc assez particulier.

Envisageons maintenant une rotation arbitraire d’un repère orthonormé dont
les vecteurs de base, notés i, J et k, vérifient les relations constitutives bien
connues
12 = 1 , j2 = l , k 2 = l; i - j = 0 , j - k = 0 , k-i = 0 ,
î Aj = k , j A k = i, kAi=j (1.23)
Supposons que ce repère soit transformé en un autre trièdre othonormé très

proche, i ->• i', j -7 j', k -7 k', avec
i' = i -H 51, j ' = j + 5j , k' = k + 5k (1.24)
où 51, 5j et 5k sont trois vecteurs infinitésimaux. Puisque nous exigeons que

le nouveau repère soit lui aussi orthonormé, on doit avoir
l"* = 1 , j'2 = 1 , k'" = 1

1.3. VITESSE ET ACCELERATION EN REPERE MOBILE. 11
au moins à l’approximation linéaire. En développant ces conditions de normes

unitaires, on obtient les formules suivantes
= i2 + 2i . + 0((Ji)2) = 1 , f = f + 2j-5j + o m ? ) = 1
k'^ = k2 + 2k • 5k + = 1 (1.25)
Les vecteurs i, j et k étant normés à 1, on arrive à la conclusion, en négligeant

les quantités de second ordre, que
i-5i = 0, j-5j = 0, k-5k = 0 (1.26)
Il s’ensuit que 5i, 5j et 5k sont respectivement orthogonaux à i, j, et k, ce qui

veut dire que 5i ne se décompose que selon les vecteurs de base j et k, 5j selon
k et i, et 5k selon i et j. Ces trois petites variations peuvent être paramétrées
au moyen de six composantes :
5i = aj + ;0k, 5j = 7 k + î, 5k = £i + 7/j (1.27)
Pour l’instant nous n ’avons exploité que les trois conditions de normalisation
des vecteurs du nouveau repère. Il reste encore à imposer les trois conditions
d ’orthogonalité, à savoir
i ' Aj ' = k ' , j'Ak' = i', k'A i'=j'

Commençons par le premier produit vectoriel. En l’explicitant, ladite condition
prend la forme suivante
i' A j ' = k' = (i + 5i) A (j + 5j) = k + 5k. (1.28)
Comme dans le cas des conditions de normalisation, nous demandons seule

ment l’égalité ne retenant que les parties linéaires suivant les variations, c’est-
à-dire, en négligeant les expressions quadratiques suivant ces quantités infi
nitésimales. En substituant les expressions (1.27), on obtient
(i -I- 5i) A (j + 5j) = i A j -t- 5i A j -f- i A 5j + O ((5i A 5j)) = k -f- 5k (1.29)
soit
5k = 5iAj + iA5j (1.30)
En substituant dans cette équation les expressions données en (1.27) et en

utilisant les relations bien connues entre les produits vectoriels, on obtient
e î + 7?j = (o:j + / 3 k ) Aj + i A ( 7 k + 0i) = - / 3 i - 7 j (1.31)
soit, par identification,
e = -/5 , 7/ = - 7 (1.32)
La même démarche appliquée à j ' A k' = i' conduit à l’identité
- ^ j - £ k = o:j + ;0k,
ce qui donne une seule relation nouvelle
0 = -a (1.33)
puisque l’égalité e = —0 a déjà été établie. On vérifie facilement que la

troisième équation impliquant le produit vectoriel k' A i' = j' n’apporte rien
de nouveau. On en conclut finalement que la matrice de rotation d ’un repère
orthonormé dépend de trois paramètres, que l’on peut choisir ici comme étant
a, P et 7. Nous pouvons donc écrire
ôi = a j + p k , <Jj = - a i + 7 k , ¿k= -7j-/3i

ou encore, sous forme matricielle.
(Jî \ /0 a ^
<Jj ) = I - a 0 7 (1.34)
M J \-P -7 0
La variation infinitésimale du repère (i, j, k), celui-ci gardant son caractère

orthonormé, est donnée par l’action d ’une matrice antisymétrique, définie par
trois paramètres indépendants. Celle-ci peut être envisagée comme l’action du
produit vectoriel de chacun des trois vecteurs du repère par un unique vecteur
ô(p = S(px i + ô(py j + 5<pz k
En effet, effectuant le produit vectoriel entre ce vecteur et les vecteurs du

repère, on trouve
ô ( p Ai = Sipy j A i + 5(pz k A i = -S(py k -t- Stpz j

S ( p A j - S(fx i A j + k A j = S<px k -5 (p z'i
Ôip A k = ô(px i A k + Scpy j A k = -Stpx j + S(py i
1.3. VITESSE ET ACCELERATION EN REPERE MOBILE. 13
ce que l’on peut encore écrire sous la forme matricielle
0 S(pz 5(fy \ / i
ô(pA -S(pz 0 j (1.35)
ô<Py S(Px 0 / \k
Par comparaison avec (1.34), on a donc
à<Px=l, Stpy = - ^ , 5 (fz = a (1.36)
Sous l’effet de cette rotation infinitésimale, le repère (i, j, k) s’est transformé

en un repère infiniment voisin (i', j', k'), selon une loi impliquant une rotation
infinitésimale autour du vecteur S(p :
= i +ô(pA i = i + 5<pz j —Sify k

j j ' = j +S(pA i= ^ -\-5 (p x k -5 (p z i (1.37)
k - > k ' = k + ô<p A k = k + 5(py i —5(px j
La direction de ce vecteur est celle de l’axe de la rotation en question, dont le

sens est donné par la règle traditionnelle du tournevis ^ ; l’angle de la rotation
est égal à |d¥>|.
Comme dans le cas du repère de Prenet, on peut imaginer que l’origine du
repère soit liée à un point matériel (une masse quasiment ponctuelle), ou bien,
dans le cas d ’un corps solide étendu, liée à l’un de ses points pouvant être son
centre de masse ou bien encore un centre de symétrie. Ledit repère, solidaire du
solide, servira alors à décrire les rotations de celui-ci, le repère transformé au
bout d’un laps de temps infinitésimal St correspondant à la nouvelle orientation
du solide, consécutive à une rotation infinitésimale.
Cependant, pendant ce laps de temps, le solide peut non seulement tourner
autour de son centre de masse, mais aussi avancer dans l’espace. Une petite
translation par rapport à un repère extérieur fixe sera noté 51. Cela complète
la description des petits mouvements possibles d ’un solide dans les trois di
mensions de l’espace physique, constitués de trois rotations infinitésimales
indépendantes, décrites par les composantes du vecteur ô(p, et de trois trans
lations infinitésimales indépendantes, décrites par les composantes du vecteur
51. Ces six paramètres sont associés aux six degrés de liberté du corps solide,
c’est-à-dire, aux six possibilités indépendantes de mouvement de ce corps dans
l’espace.
2. Soit encore, la règle du tire-bouchon de Maxwell.
Cette description nous permettra à présent d ’analyser les mouvements arbi

traires des points matériels, leurs assemblages rigides et les corps solides en
général. Il est très important de disposer d ’une information complète concer
nant non seulement les positions et les vitesses, mais aussi des accélérations,
afin de pouvoir formuler les équations de la mécanique newtonienne reliant
entre elles les mouvements et les forces.
1.4 Changements de repères

Un vecteur r immobile dans le repère (i, j, k) sera vu différemment depuis
le repère tourné (î', j', k'). De même, un vecteur r' immobile dans le repère
(i', j', k') sera vu différemment depuis le repère (i, j, k). Posons
r' = x' i' + y' y + z' k' et r = x i -b y j -H ^ k
Si le vecteur r' reste immobile par rapport au repère TV {O' ;i', j', k'), il
tourne avec ce repère quand il est vu depuis le repère T?. (O ; i, j, k) (à partir
de maintenant, nous considérons que les origines de deux repères, O et O', ne
coïncident pas nécessairement).
Pour comparer les composantes des vecteurs positions tels qu’ils sont simul
tanément mesurés dans les deux repères, il faut projeter r' le long des axes
(i, j, k) de l’ancien repère, c’est à dire, dans r', remplacer les vecteurs
(i', j', k') par leurs expressions obtenues dans (1.37) :
v' = x' )! -\-y'y + z 'k ! =

x' (i + ¿9?* j - àify k) -f- y' (j + S(px k - ô(pz i) -b î :' (k + 5(f>y i - 5ipx j)
soit, en regroupant les termes :
{x' -b 8(f>y z' - 5(pz y') i + (y' + Scpz x' - Stpx z') j + (z' + ô(px y' - Sipy x') j
En identifiant les projections de r' sur (i, j, k) à celles de r, nous pouvons

écrire le résultat sous la forme compacte
r = r' -b <5^ A r' (1.38)
Si l’origine du repère %' se déplace aussi d’un vecteur infinitésimal (51 pendant
la durée 5t, on aura dans ce cas
r = r' -b 51 + d(^ A r' (1.39)

1.4. CHANGEMENTS DE REPERES 15
Considérons maintenant un point mobile dans le repère TZ', donc vu aussi

comme mobile dans le repère IZ. La variation de r pendant 5t sera notée 5r,
et celle de r', vue depuis le repère 1Z', sera notée S'r'. On peut appliquer la
formule (1.39) à la somme r + 5r :
r + <5r = r' H- 5'r' + ¿1 + S(fi A (r' + 6'r')

Négligeant les termes d’ordre deux suivant les quantités infinitésimales, dans le
dernier produit vectoriel nous ne garderons que le produit ScpAr'. Le résultat
est donc
¿r = S'r' + Sl + ô(p A r' (1.40)
En divisant par St, on obtient la relation entre les vitesses du point matériel
telles qu’elles sont mesurées par les observateurs liés aux deux repères respec
tivement :
V = v' -h vtr -f- u; A r' (1.41)
où l’on introduit la vitesse angulaire instantanée
Sip
U = (1.42)
St
La vitesse du point matériel observée dans le repère TZ est égale à la vitesse du
même point par rapport au repère TZ', plus la vitesse de translation du repère
TZ' par rapport à TZ, plus une contribution supplémentaire engendrée par la
rotation u> des axes de TZ' par rapport à ceux de TZ.
La variation dans le temps d ’un vecteur quelconque (sauf le rayon-vecteur
décrivant la position d’un objet) obéit à la relation (1.39), sans la vitesse de
translation :
dX d'X '
_ = _ + „ A X ' (1.43)
En appliquant (1.43) à la vitesse v on obtient la relation entre les accélérations

du même point matériel, vues depuis les deux repères :
d'v' dvtr dw , d'r' . > n

H----- TT- + -TT A r -f- u; A -77- -f w A [v' -|- w A r']
dt dt dt dt dt
d'v' du: d'r'
dt +air + ^ A r ' - f - 2 u ; A ^ + w A ( w A r O (1.44)
soit, en utilisant la notation réservée à l’accélération
a = a' + atr + ^ A r' + 2 u> A ^ + üT A (w A r') (1-45)
L’avant-dernier terme, avec le facteur 2, s’appelle l’accélération de Coriolis,

tandis que le dernier terme porte le nom d’accélération d ’entrainement, ou
quelquefois, d’accélération centripète, car ce vecteur est dirigé vers l’extérieur
à partir de l’axe de rotation défini par la vitesse angulaire w. Deux cas parti
culiers méritent d ’être mentionnés.
4k Dans le cas d’un repère R! qui avance sans tourner par rapport au repère
TZ, on trouve bien évidemment
a = a' -f BLtr
4k Dans le cas d’une rotation pure sans translation, avec une vitesse angulaire
constante a>, on trouve
d !v ^
a = a' -H atr -f- 2 w A —r- + w A (w A r')
dt
1.5 Dynamique newtonienne
La transformation (1.45) de l’accélération d ’un repère mobile à un autre, rap

pelée ici :
a = a' + atr + ^ A r' + 2 w A -Hu; A (u> A r')

CLT> (Jvv
contient une information précieuse qui peut être formulée comme une définition
d ’une catégorie spéciale de repères, dont les représentants s’appelant repères
galiléens, du nom du savant italien Galilée, né à Pise (1571 —1643), qui en a
énoncé le principe. Voici son raisonnement.
Supposons que dans un repère donné TV l’accélération d ’un corps soit nulle :
a' = 0. Quelle est la condition pour qu’elle soit aussi nulle, a = 0, dans un
autre repère 7?.? La réponse n ’est pas difficile, il suflSt de regarder la formule
de transformation de l’accélération (1.45). Puisque le vecteur r' est arbitraire,
la seule façon d ’annuler tous les termes en dehors de a ' est de poser a> = 0,
ce qui entrainera automatiquement du>/dt — 0), et, indépendamment, poser
&tr = 0, soit dvtr/àt = 0, où vtr est la vitesse de translation du repère Rj par
rapport au repère TZ, notée souvent de manière symbolique V{1Z/TZ).
1.5. DYNAMIQUE NEWTONIENNE 17
En conclusion, il faut que le repère VJ avance sans rotation et avec une vitesse
constante V par rapport au repère TZ, auquel cas on aura effectivement
a = a (1.46)
La transformation des coordonnées entre les deux repères est alors appelée
transformation de Galilée.
Pour simplifier, choisissons les axes (i', j', k') du repère TZJ parallèles aux axes
(i, j, k) du repère TZ. En fait, ils seront identiques en tant que vecteurs, seules
les origines des deux repères sont différentes, O' s’éloignant de O au cours du
temps avec la vitesse Y(JZ'/TZ). On aura alors
r' = r —V t, soit
x' = X —V x t , y' = y —Vyt , z' = Z —Vzt (1.47)
Ces formules définissent la transformation de Galilée dans le cas où les axes des
deux repères coïncident ; sinon, il faut superposer une rotation (indépendante
du temps) transformant les axes de façon à les faire coïncider. Nous avons
vu précédem-ment qu’une telle rotation est déterminée par un vecteur w ap
proprié. On constate donc qu’une transformation de Galilée la plus générale
est déterminée par six paramètres indépendants, les trois composantes de la
vitesse relative V et les trois composantes de la rotation u>.
Notons aussi la chose qui paraissait tellement évidente que Galilée ne la men
tionnait même pas dans ses commentaires : le temps t s’écoulait de manière
identique (à part l’origine arbitraire, car on pouvait toujours fixer i = 0 à
un moment opportun, ce qui est équivalent à ajouter ou à retrancher une
constante). Donc, on pouvait inclure la quatrième transformation implicite,
t' = t — to, soit une translation dans le temps. D’ailleurs, les translations
semblables peuvent toujours être effectuées pour les coordonnées spatiales :
X X —xq, y y —yo, z z —zq, mais ce sont des ajustements équivalents
à un autre choix d ’origine de repère, physiquement sans importance. Afin de
ne pas en tenir compte et pouvoir se concentrer sur l’essentiel, on peut ap
pliquer la transformation de Galilée uniquement aux segments infinitésimaux
des coordonnées cartésiennes. Dans ce cas, il convient d ’écrire
A x' = A x - V x A t , Ay' = A y - V y A t , A z' = A z - V z A t , (1.48)
Jusqu’ici, nous ne parlions que de la cinématique qui consiste en l’analyse

détaillée des mouvements et de leur propriétés diverses. La dynamique entre
en scène quand on commence à poser la question sur les causes qui produisent
ces mouvements, que l’on appelle en général les forces, bien que leur nature
peut souvent être assez différente.
Isaac Newton, savant Anglais (1642 —1727 : notez la coïncidence de sa date de
naissance avec la date de la mort de Galilée, à une année près !) a formulé le
principe d’inertie, déjà énoncé par Galilée. Voici l’extrait de l’œuvre maîtresse
de Newton, les ’’Principia mathematica” , en latin :
“ Corpus omne perseverare in statu suo quiescendi vel movendi uniformiter in
directum, nisi quatenus illis a viribus impressis cogitur statum suum mutare”.
Traduit en français, cela veut dire :
Tout corps continue d’être en état de repos ou en mouvement uniforme et
rectiligne, en l’absence de forces appliquées susceptibles de modifier son état”.
Ce constat constitue la premère loi de Newton, appelée aussi principe d’inertie.
Comme c’est souvent le cas, une définition paraissant claire comme de l’eau de
roche est en effet assez ambiguë, car on ne sait pas exactement ce qu’on entend
par “force”. Il s’est avéré par la suite qu’il s’agit d ’un concept compliqué et
plutôt mystérieux. Fort heureusement, dans de nombreuses situations de la vie
courante, on arrive à le définir assez bien et sans ambiguïté.
Afin de pouvoir analyser les forces mécaniques et leurs actions, considérons
un dispositif mécanique capable de modifier l’état d’un corps matériel décrit
par Newton comme “au repos ou bien se mouvant avec une vitesse constante
sans changer de direction” . L’action de ce dispositif se traduira par une modi
fication soit de la valeur absolue de la vitesse du corps sur lequel il agit, soit
de la direction de sa vitesse, soit des deux à la fois. En somme, si dv/dt = 0
avant l’action du dispositif, après, ou du moins pendant l’action immédiate,
on observera dv/dt = a ^ 0.
Supposons maintenant que le dispositif, que l’on peut aussi nommer “l’appa
reil” , ou “la machine” , reste exactement le même, et que l’on applique son
action de la même façon à des corps différents. Pour l’instant ceux-ci seront
assimilés à des points matériels, de dimensions négligeables. On constate que
les accélérations a i, a2, • • •, &n communiquées à ces corps sont différentes,
mais colinéaires. On peut donc trouver N nombres m i, m2, m3, • • • tels que
m i a i = m2 a2 = m3 as = • • • = miv »iv
Avec un autre dispositif agissant de manière semblable sur le même ensemble

de points matériels, on trouve à nouveau des accélérations a 'i, a'2, • • •, a V
colinéaires, et, là aussi, on trouvera un ensemble de nombres m'x, • • •,

tels que
rrii a'i = m 2 sl2 ="I3 »3 ------mjv apf
Cependant, à la suite de nombreuses expériences, on trouve
m[ = m i, m 2 — ^ 2> • • • )
On constate donc que les coefficients mi dépendent uniquement des points

matériels choisis, et non pas du dispositif qui a produit l’eflFet d ’accélération.
Ces coefficients s’appellent les masses des points matériels considérés. Le pro
duit m a de la masse par l’accélération, commun pour le dispositif donné, s’ap
pellera force. Newton avait généralisé ces observations en énonçant la célèbre
loi portant le nom de devæième loi de Newton :
F = ma (1.49)
En même temps, c’est la meilleure façon de définir une force agissant sur le
point matériel dont la masse m est connue. Notons aussi que la force exercée
par un dispositif sur un point matériel de masse fixe ne dépend pas du repère
inertiel choisi, puisque les accélérations observées seront identiques, comme le
stipule la définition (1.46) d ’un repère inertiel .
Dans le cas d ’actions simultanées de plusieurs forces on admettra, conformément
à l’expérience, que
(1.50)
t=l
C’est le principe de superposition linéaire des forces. La masse m est souvent

appelée “masse inertielle” . Elle se manifeste par une résistance à toute va
riation de vitesse d ’un objet massif. On le voit très bien dans un train qui
accélère : si les valises ne sont pas bien attachées, elles ont tendance à tomber
en arrière, comme si une force opposée à l’accélération leur était appliquée.
Cette force s’appelle la force de l’inertie et est égale à —m a.
Cela permet une autre interprétation de la seconde loi de Newton : au lieu
d ’écrire m a = F, on peut faire passer tous les termes d ’un même côté de
l’équation, comme s’il s’agissait de sommer toutes les forces agissant sur le
système :
F + (-m a) = O
et dire que, en toute circonstance, tout se passe comme si on observait l’équilibre

des forces, puisque la somme des forces extérieures et de la force d ’inertie reste
strictement nulle au cours du mouvement.
Les équations de Newton peuvent être généralisées pour englober aussi les cas
de corps de masse variable, comme par exemple les fusées qui perdent une
partie importante de leur masse initiale avant d ’arriver au but. C’est d’ailleurs
cette généralisation qui a été formulée par Newton dans ses “Principia" . Sui
vant Newton, on appelle quantité de mouvement le produit de la masse d ’un
corps par sa vitesse :
P = m v (1.61)
Sous sa forme la plus générale, la deuxième loi de Newton postule que c’est la
dérivée temporelle de la quantité de mouvement d ’un corps qui est égale à la
force agissant sur lui :
(1.62)
Dans le cas d ’une masse m constante
dp d\
et l’équation (1.52) se réduit à la forme précédente de la loi de Newton, comme

dans (1.50). Mais si la masse n ’est pas constante, il faudra appliquer la règle
de Leibniz et inclure dans la formule sa dérivée temporelle :
N
dp d\ dm
(1.53)
i=l
En laissant à gauche uniquement le produit de la masse par l’accélération, on
s’aperçoit que si la dérivée dm /dt est négative, c’est à dire si le corps est en
train de perdre une partie de sa masse au cours du mouvement, ce qui est
le cas d ’une fusée qui décolle, l’accélération observée est proportionnelle non
seulement à la force appliquée, mais aussi à une poussée supplémentaire :
N dm
dv
m
dt i=l
Puisque la force est proportionnelle à une dérivée par rapport au temps, nous
pouvons intégrer les deux cotés de l’équation (1.52) pour obtenir la forme
intégrale de la deuxième loi :
A p = P (Î2) - P (il) = / F (i) dt (1.54)

Jti
les forces appliquées sur le point matériel pouvant dépendre du temps t dans
le cas général. Souvent, les forces sont aussi fonctions de la position :
F = F (r, t)
et dans le cas où le frottement ne peut plus être négligé, elles peuvent dépendre
aussi de la vitesse instantanée du point matériel^. Dans ce cas, on aura
F = F ( r ,v ,i )
On parle souvent d ’un champ de forces quand elles dépendent uniquement de

la position du corps matériel dans l’espace.
Jh E xem ples
a) L’exemple le plus connu d ’une force agissant sur toutes les masses se trou
vant sur Terre est la force de gravitation. Elle est apparemment proportionnelle
à la masse inertielle du corps sur lequel elle s’exerce, indépendamment de sa
forme ou de sa composition chimique. En principe, la substance responsable
de cet effet pourrait avoir une autre nature que la masse inertielle, et mérite
rait le nom de masse gravitationnelle. Ceci dit, grâce aux expériences subtiles
du physicien Hongrois Eotves au début du vingtième siècle, on a pu constater
avec une précision dépassant 10“ ^^ que ces deux masses sont toujours propor
tionnelles, donc égales si l’on choisit une échelle commune pour les deux qui
permet de rendre le coefficient de proportionalité égal à 1.
Le champ des forces de la gravitation terrestre près de la surface de la Terre
se réduit à un vecteur constant dans le temps et dans l’espace :
F = m g, avec g = —gez (1.55)
où ez est le vecteur unitaire ascendant dans le repère local basé sur la surface
de la Terre. L’expérience montre que la valeur de g est proche de 9,81 m sec~^
en moyenne, avec des petites déviations suivant la latitude et la hauteur.
3. C hacun connaît l ’eifet du frottem ent de l’air sur les voitures.

L’équation du mouvement dans le champ gravitationnel terrestre (près de la

surface de la Terre, en fait, quand l’altitude est négligeable par rapport au
rayon de notre planète) est donc
<Pr
m - ^ = m 'g = m g = -m g e z (1.56)
b) La loi de gravitation universelle

La force F 12 avec laquelle un point matériel de masse m 2 placé en O M 2 attire
le point matériel de masse m i se trouvant au point O M 1 est égale, selon cette
loi confirmée expérimentalement, à
Г12 Gmim<2
F i2 = (1.57)
Г12 I I Г12 P
avec r i 2 = M l M 2. La même force, mais de signe opposée, est exercée par mi

sur m2, comme le montre la figure (1.5)
F ig u r e 1.5 - L a fo rce d ’a ttr a c tio n u n iv erselle se lo n N e w to n .
Nous avons assimilé les masses gravitationnelles m[ et m^ aux masses iner-

tielles correspondantes, conformément à l’expérience.
Si plusieurs corps massifs exercent leur influence sur une masse m, on constate
la stricte linéarité entre les forces et les accélérations. Cette remarque, qui
constitue en fait un postulat supplémentaire, a été déjà formulée par New
ton. On constate que si une particule de masse m réagit à quelques forces
indépendantes, F i, F 2, • • •, F n agissant chacune séparément, en développant,
respectivement, les accélérations a i, a2, ...,ajv :
mai = F l, ma2 = F l, ....,талг = FjV)

Si toutes ces forces agissent en même temps, l’expérience montre que le point
matériel subit alors l’accélération qui est la somme des accélérations “par
tielles” provoquées par chacune des forces séparément :
N N
m a = F si F = X ; F i - > a = 5 ; a i . (1.58)
¿=1 i=l
c) Une particule de masse m et porteuse d ’une charge électrique q, dans un

champ électrique (produit par un ensemble de particules chargées immobiles
se trouvant à certaine distance, et en l’absence de champ magnétique) subit
la force
Fei = qE
En l’absence de champ électrique, E = 0 et en présence d ’un champ magnétique

B, la force exercée par le champ magnétique sur la particule chargée sera
Emag = 9 V A B
OÙ V est la vitesse instantanée de la particule. En présence des deux champs
E et B les deux forces s’additionnent (d’après l’expérience), et la force totale
est égale à
F = ç E + g v A B. (1.59)
Cette force porte le nom de force de Lorentz, d ’après le physicien néerlandais

H.A. Lorentz.
d) Force de rappel élastique
Il s’agit de la force exercée par un ressort, allongé ou comprimé selon le cas.
Il faut dire que la loi d ’élasticité n’est linéaire qu’en première approxima
tion, quand les écarts de la position naturelle du ressort sont minimes ; elle
devient non-linéaire avec l’écart grandissant. Voici quelques comportements
types (1.6) :
Dans la mesure où \ l — Iq 1« k , la force de rappel peut être considérée
comme linéaire, avec le coefficient de proportionnalité k appelé raideur du
ressort. L’équation fondamentale de la dynamique s’écrira alors comme suit :
d?r
= F = -fe (r-ro ), (1.60)
F ig u r e 1.6 - Force élastique en fonction de l’écart de la longueur naturelle du ressort.

La loi linéaire n’est plus valable quand les écarts se font plus grands ; le ressort peut
alors soit faiblir, soit au contraire, se raidir avant de rompre. (Sur les diagrammes
sont représentées les valeurs absolues des forces de rappel)
où ro est la position d ’équilibre pour laquelle la force de rappel s’annule,

F = 0. Une description plus réaliste doit tenir compte du phénomène de
frottement qui produit une force supplémentaire s’opposant au mouvement de
la masse m. En approximation linéaire, quand la vitesse du point matériel au
bout du ressort n ’est pas trop élevée, on admet que la force de frottement
est proportionnelle à la vitesse, avec le signe opposé bien évidemment. Le
coefficient / définissant cette loi linéaire s’appelle coefficient de frottement
dynamique. L’équation de la dynamique devient alors
dh dr
(1.61)
F igure 1.7 - Oscillateur harmonique réalisé par un système mécanique.

1.6. LOIS DE CONSERVATION 25
1.6 Lois de conservation

1.6.1 La quantité de mouvement
Nous nous plaçons ici du point de vue d ’un référentiel galiléen. La forme la
plus générale (1.52) de la deuxième loi de Newton montre qu’en l’absence de
force extérieures, la quantité de mouvement observée dans ce référentiel se
conserve au cours du temps.
Fext = 0 -» p = constante (1.62)
Ce résultat peut être généralisé à un système complexe de points matériels

interagissant entre eux mais non soumis à des forces extérieures. En effet, la
troisième loi de Newton stipule qu’une force F ^ b exercée par un corps A sur un
corps B a pour contrepartie une force de réaction F ba qui lui est exactement
opposée, exercée par B sur A :
F ba = —F AB (1.63)
Pour le système comprenant uniquement les deux corps A et B uniquement, les

deux forces F ab et F ba constituent des forces intérieures, dont la résultante
est nulle Définissons la quantité de mouvement totale de ce système comme
la somme vectorielle
P = РЛ + PB (1.64)
où PA et PB sont les quantités de mouvement respectives de A et B. Supposons

qu’aucune force extérieure n ’agisse ni sur A ni sur B. Le système des deux corps
est alors qualifié de système isolé, et l’on a
dpA dpB
= F ba = F ab
dt dt
Par suite
—F ba + F ab = 0 (1.65)
dt
La généralisation à un système comportant un nombre quelconque N de points
matériels est immédiate. La quantité de mouvement totale du système étant
4. Ce qui peu t s ’exprim er en disant que ce systèm e n ’exerce globalem ent aucune action
sur lui-mêm e.
définie par le vecteur qui est la somme de tous les vecteurs de quantité de
mouvement de chacun des points matériels constituant le système :
N
p = E pi
i=l
on a
^ N N
dt = i=l = E
i=l
E (p « + P i< )= o
puisque Fij = —Fji, la dernière somme étant effectuée sur les couples de points.
On peut ainsi énoncer que :
la quantité de mouvement d’un système isolé dans un référentiel galiléen
reste constante au cours du temps,
1.6.2 L’énergie cinétique, l’énergie mécanique
Considérons un point matériel ayant une masse m constante. Dans un référentiel

quelconque, son évolution est régie par la deuxième loi de Newton (1.49), où
F est la résultante des forces s’appliquant sur le point matériel, comprenant
d ’éventuelles forces inertielles et celles dues à des systèmes physiques extérieurs
exerçant une action sur ce point matériel. EflEectuons le produit scalaire des
deux membres de cette équation avec v. Le produit scalaire F • v est la puis
sance instantanée développée par la force F appliquée et l’on a
dv _ d i mv^
m V • = F •V ( 1. 66)
dt d t\ 2
La grandeur
m \“
T = (1.67)
s’appelle l’énergie cinétique du point matériel. La relation (1.66) montre que

4 la dérivée temporelle de l’énergie cinétique est égale à la puissance développée
par la résultante des forces s ’appliquant sur le point matériel.
Intégrons l’équation entre deux dates to et ti
ftl d J' ftl
rtl ftl
/ di — = T l - To = / di F • V = / F dl
Jto Jto J to
où di = vdí est le vecteur déplacement élémentaire du point matériel dans

l’intervalle de temps dt. Le produit scalaire F • dl est le travail élémentaire
développé par la force F lors de ce déplacement. La relation ci-dessus conduit
au théorème de l’énergie cinétique :
la variation d’énergie cinétique d’un point matériel entre deux dates to et ti
est égal au travail développé entre ces deux dates par la résultante des forces
s ’appliquant sur le point matériel.
La force magnétique Fmagn = çv A B agissant sur une particule chargée ne
travaille pas car elle est toujours perpendiculaire au vecteur vitesse de la par
ticule. En revanche, A et B étant les positions de la charge aux dates io et
il respectivement, une force électrique Feiec = çE agissant sur elle fournit le
travail
Weiec = r qE-dl = q E - d l = q {V{A) - V{B))

Jto JA
où V{M) est le potentiel électrique dont dérive le champ E via la relation

E = —g rad V. Du fait de cette relation, le travail fourni par la force électrique
ne dépend finalement pas du chemin reliant A h, B. Une force F est dite dériver
d ’une énergie potentielle s’il existe une fonction U{M), dont les valeurs ne
dépendent que des coordonnées du point d ’application de la force, telle que
Fpot(M) = - g ra d U(M) ( 1. 68)
Par exemple, la force électrique dérive de l’énergie potentielle UaeciM) =

q V (M). Si la résultante des forces s’exerçant sur un point matériel dérive d ’une
énergie potentielle U{M), le théorème de la variation de l’énergie cinétique
prend la forme
Tb - T a = U { B ) - U { A ) , soit Tb + U{B) = Ta VU{A)
et la somme T + U est conservée. Cette somme est appelée énergie mécanique

du point matériel et la fonction U est son énergie potentielle. Si toutes les
forces agissant sur un point matériel dérivent toutes d’énergies potentielles,
son énergie mécanique totale
•Emeca —T -\-U (1.69)
où U prend en compte toutes les énergies potentielles présentes, est une gran
deur conservée.
Une force qui dépend de la vitesse ne peut dériver d’une énergie potentielle.
Mais une force qui ne dépend que des coordonnées peut ne pas dériver d’une
énergie potentielle. Il existe un critère permettant de décider si un champ de
forces F(M ) dérive d’une énergie potentielle. Si la relation (1.68) est vérifiée,
les composantes cartésiennes de la force sont données par
du J, _ du „ _ du
En supposant la fonction U est régulière et deux fois dérivable, on doit donc

avoir l’égalité des dérivées partielles secondes mixtes de U, comme par exemple :
d dU _ d dU _ d“^ u _ d“
û
dy dx dx dy dydx dxdy
ce qui revient à écrire
dFx _ dFy dFy _ dFz dFz _ dFx

dy dx ' dz dy ’ dx dz
égalités que l’on peut récrire sous la forme
. dFg dFy dFx dFz ^ ^ _ dFy dFx

= 0 , Az = = 0
~d7 dz dx dx dy
L’annulation simultanée des trois grandeurs Ax, Ay et Az permet d’affirmer

que F dérive d ’une énergie potentielle, sans même connaître l’expression de
cette dernière.
Pour un champ de vecteurs quelconque W , les trois grandeurs
_ dWy dWx
^ dy dz ' ^ dz dx ' ^ dx dy
sont les trois composantes cartésiennes d ’un champ de vecteurs A, appelé le

rotationnel de W et noté ro tW . Nous admettrons que la condition nécessaire
et suffisante pour que W soit le gradient d ’une fonction est que son rotationnel
soit nul :
W = g ra d if ro tW = 0 (1.70)
Si le rotationnel n ’est pas nul, la fonction H n ’existe pas. Si (1.70) est vérifiée,
l’intégrale
f W • dl = H(B) - H(A)
JC(A.B)
IC(A,B)
effectuée le long d ’une courbe (C7) allant d ’un point A à un point B, étant
égale à H {B) —H {A), est en fait indépendante de la forme de cette courbe. Il
s’ensuit que l’intégrale d’un tel champ de vecteurs le long d ’un contour fermé
est toujours égale à 0 :
/ W • dl = 0
1.6.3 M oments des forces, moment cinétique
Une autre grandeur cinétique de nature vectorielle apparaît lorsqu’on effectue

le produit vectoriel de (1.52) par le rayon vecteur r. En effet, on a
do
r A— = r AF
dt
et
dp d , , dr
Mais puisque
dr
Ap=vAmv=0
dt
il vient finalement
dL
— = r A F , avec L = r Ap (1.71)
dt
La grandeur L = r A p s’appelle le moment cinétique du point matériel, et

r A F est le moment dynamique de la force F, par rapport à l’origine du repère
dans lequel est observé le mouvement. La relation (1.71) est la traduction du
théorème du moment cinétique :
la dérivée temporelle du moment cinétique est égale au moment dynamique
de la résultante des forces agissant sur le point matériel.
En l’absence de force extérieure le moment cinétique est une grandeur conservée
Fext = 0 L = C o n sta n te
Ce résultat peut être généralisé aux systèmes comportant plusieurs points

matériels en interaction. En effet, le moment cinétique d ’un système complexe
est défini par
N
L= ГА: Л Pfc (1.72)
fe=l
et sa dérivée temporelle est
N
= '^ Г к A F к
dt k=l
OÙ Ffc est la résultante des forces agissant sur le kème point matériel. Outre
une éventuelle force extérieure F “ *, cette résultante comprend les forces F ^^
(m 7^ k) qu’exercent les iV —1 autres points matériels sur le kème. On a donc
N
Е ‘'‘ л г г ‘ + 53 i^k ~ AFkn
k=l {k,m) кфт
OÙ l’on a pris en compte le principe de l’action et de la réaction {Fkm = —Fmk)-
Or, dans les cas les plus courants, les forces d ’interaction entre deux points
matériels sont centrales, c’est-àrdire, elles sont dirigées selon la droite joignant
les deux points, comme indiqué à la figure (1.5), et leur intensité ne dépend des
positions de ces deux points que par l’intermédiaire de la distance les séparant.
Cette orientation fait que les produits vectoriels (r^ —Гщ) Л Fkm sont nvls.
On en déduit alors la relation
N
(1.73)
dt = fc=i
^VkAFr
et le théorème :
La dérivée temporelle du moment cinétique d ’un système de points matériels
est égale à la résultante des moments dynamiques des forces extérieures agis
sant sur ce système.
En conséquence, pour un système isolé dans un référentiel galiléen, le moment
cinétique est une grandeur conservée.
1.6.4 Contraintes, potentiel et équilibres
Un point matériel est à l’équilibre dans un référentiel donné si, pour tout
instant, la résultante F des forces qui s’exercent sur lui dans ce référentiel est
nulle, et si, bien sûr, sa vitesse est nulle. Si le référentiel n ’est pas galiléen, des
forces inertielles entrent en jeu dans cette résultante F : dans ce cas, outre
les forces provenant de dispositifs ou de champs extérieurs quelconques, il
faudra aussi comptabiliser les forces d ’inertie. Pour un référentiel galiléen, F
ne comprend que des forces décrivant des interactions du point matériel avec
des systèmes extérieurs. S’il s’agit de forces dérivant d ’une énergie potentielle,
leur annulation équivaut à la condition
F = —g ra d U = 0 (1.74)
qui ludique que le» dérivées partielles ^ et doivent ê t« si-

ax dy oz
multanément nulles. Cela peut arriver en un point particulier ou un ensemble
de points, ou même sur une surface ou dans un certain domaine de l’espace.
Pour autant, cela ne veut pas dire que la fonction U(x, y, z) soit partout une
constante. Donnons quelques exemples de forces dérivant d ’une énergie poten
tielle.
a) Force de p e sa n te u r
A l’échelle de quelques kilomètres au dessus du sol terrestre, échelle très petite

en comparaison du rayon terrestre égal à 6380 km environ, la force de la
pesanteur est dirigée vers le centre de la Terre et s’exprime comme
F = —m g k
où m est la masse de l’objet, g l’accélération de la pesanteur et k le vecteur

unitaire de la verticale locale ascendante. On vérifie sans peine que ro t F =
0 et que cette force dérive bien d’un potentiel U. La force n ’ayant pas de
composantes suivant les axes i et j, le potentiel U ne dépend que de la côte z
de l’objet, et l’on a
= m g donc U = rngz + constante

dz
On note que la force de pesanteur ne s’annule jamais : son potentiel ne présente
donc aucun extrémum.
b) Forces grav itatio n n elles
En réalité, la force gravitationnelle qu’un objet de masse M exerce sur un

autre objet de masse m obéit à la loi de Newton :
^ GmM
F = ------ 5— r (1.75)
où r est la distance séparant les deux objets, r le rayon vecteur joignant le

premier objet (masse M) au second (masse m) et G la constante universelle
de gravitation
Supposons que l’objet de masse M soit la Terre®. A la surface de celle-ci, la
force de gravitation doit s’identifier à —m g k. On obtient ainsi
GMm
où R t = 6400 km est le rayon terrestre. Le produit GM peut alors être

réexprimé comme le produit g et l’on a
2
- Щ'
Z r
Notant que
grad r = -
r
et que, pour toute fonction /( r ) on a
grad / = — grad r = — —
^ dr^ drr
il vient
,1 r
g r a d /p- = - 3rpO
Par conséquent,
5. G = 6,67428(67) 10“ ^^ kg"^

6. La loi (1.75) est valable uniquem ent à Pextérieur de la Terre et en supposant celle-ci
com m e une répartition volum ique de m asses em plissant une boule de rayon R et ayant la
sym étrie sphérique.
et cette force dérive donc du potentiel (à une constante additive près)
rr_ ^ ^
^ ^ 9 r—>y—;---5—---5
T y/x^ + y^ + Z^
qui n ’a ni minimum ni maximum, son gradient tendant vers zéro uniquement

lorsque r 00.
c) Force de ra p p e l d ’u n re sso rt
Dans la limite élastique et dans le cas d ’un mouvement rectiligne selon un axe
x'x, la force de rappel d’un ressort a pour expression
E = - k { x - Î q) i
où k est la raideur du ressort et ¿0 sa longueur au repos. Cette force, orientée

selon l’axe x'x de vecteur unitaire i, et qui ne dépend que de la seule coordonnée
X, dérive d’un potentiel U{x). Celui-ci vérifie
æ
= к {x —£0 )
dx
D ’où, par intégration,
U(x) = ^ ( z - i a f
à une constante additive près. La force s’annule pour x = £q et cette valeur

de la coordonnée représente un point d’équilibre du ressort, qui est d’ailleurs
le seul.
Dans le cas général, un équilibre peut être stable, instable ou métastable, selon
que, au voisinage de la position d ’équilibre, la force est, respectivement, une
force de rappel quelle que soit la direction, une force répulsive quelle que soit la
direction, ou peut changer de nature attractive ou répulsive selon la direction.
Dans les problèmes à une dimension, pour un mouvement astreint à une droite
x'x et résultant de l’action d ’une force F = F{x) i orientée selon cette droite,
cette force dérive toujours d ’un potentiel U{x) car on peut toujours intégrer
la fonction F{x), et l’on a la relation
f(x ) = - f ( x )
montrant que F(x) est l’opposée de la dérivée de U(x). S’il existe un point
d ’équi-libre pour x — xo, la dérivée s’annule pour cette valeur de la coordonnée
(F(a:o) = 0). S’il s’agit d ’un équilibre stable, au voisinage de cet équilibre on
doit avoir F(x) > 0 pour a; < xq et F(x) < 0 pour x > xq. Dans ce voisinage,
la dérivée de U est donc négative pour x < xq et positive pour x > xq, ce qui
indique que l’équilibre correspond à un minimum local de cette fonction. Cette
conclusion prévaut pour tous les potentiels fonctions d ’une seule variable :
pour trouver les points d ’équilibre stables, il faut satisfaire simultanément
deux conditions définissant un minimum local du potentiel U :
cPU
et < 0.
dx^
F ig u r e 1.8 - Potentiel et la force de rappel en fonction de l’écart depuis la position

d’équilibre
On observe un équilibre instable en un point où le potentiel atteint un maxi

mum. Par exemple le potentiel U = —/sx^/2 donnant F = —g ra d U — -\-kx i
a un point d ’équilibre pour x = 0. A partir de ce point, la force est répulsive.
Cette situation est représentée sur la figure (1.9)
F ig u r e 1.9 - La force repulsive en fonction de l’écart depuis la position d’équilibre.

La force F est positive dès que le point matériel s’écarte vers la droite du point
æ = 0, et elle continue à le repousser vers la droite de plus en plus fortement ;
si le point matériel s’écarte vers la gauche, la force le repousse vers la gauche.
Nous concluons donc que le critère pour une position d’équilibre instable est
dU ^ ^ d?U ^
dx~ ' dx2 > 0.
correspondant à un maximum local du potentiel.

Finalement, un point d ’équilibre métastable correspond à la situation où
Il s’agit d’un point d’inflexion de la courbe U{x), comme sur la figure (1.10)
ci-dessous
F ig u r e 1.10 - Point d’inflexion correspondant à un équilibre métastable
La situation est plus compliquée pour des problèmes à plus d ’une dimension.
En une dimension, quand le mouvement est astreint à une droite, il suffit de
connaître la fonction “force” F{x), que l’on peut toujours intégrer pour trouver
le potentiel correspondant, égal à la primitive de F{x) :
U{x) = - r F{x)dx + U{xo), (1.76)

JXQ
puisque, par définition.
PX2 rX2 f]TJ fX2

- / F{x)dx = — dæ = / dU = U{x 2 ) - U{xi). (1.77)
Jxi Jx\ Jx\
En deux ou en trois dimensions la force F ainsi que l’élément d’arc d ’une

courbe dl représentent des vecteurs, et l’intégrale sur un chemin
F-dl
JÎ A
peut dépendre du chemin d ’intégration choisi pour aller du point A au point

B. En voici un exemple :
F igure 1.11 - Ecoulement dans un fleuve
La figure (1.11) ci-dessus représente l’écoulement de l’eau d ’un fleuve, avec des
vitesses différentes selon la profondeur. Tout près du fond, la vitesse est nulle
à cause de la viscosité d ’eau qui adhère au lit du fleuve ; plus on monte vers
la surface, plus la vitesse de l’écoulement grandit.
Pour les besoins de notre exemple il suffira d ’admettre une loi linéaire pour
la variation de la vitesse d ’écoulement vis-à-vis de la profondeur y, et dont la
direction est fixe et colinéaire à l’axe Ox :
V = vi, soit Vx = v, Vy = Vz = 0, v = ay et Vmax = v{h) — ah (1.78)
où la constante a doit être exprimée en sec“ ^. Un petit objet plongé dans la

rivière est emporté par le courant parce qu’il subit une force exercée par l’eau
en mouvement qui l’entoure. Là aussi, la force est due à la viscosité du milieu.
Nous admettrons que cette force exercée sur un petit objet présentant une
aire AA perpendiculaire à l’écoulement est proportionnelle à dxdy et dépend
linéairement de la hauteur y, et toujours dirigée le long de l’axe Ox, soit
F(x,y) = 6yAAi.
où la constante b s’exprime en kg m“ ^ sec“ ^. Considérons un carré ABCD

de coté L, comme indiqué sur la figure 1.12 et effectuons l’intégration de F •dl
le long de ABCD, dans le sens des aiguilles d ’une montre. On a
e fti fU fV pA
/ Fdl= Fxdx+ Fydy+ Fxdx+ Fydy (1.79)
JABCD JA JB JC JD
tt It
C O
F igure 1.12 - Circulation dans un écoulement.
Sur le parcours choisi, dl vaut idx sur le segment AB, d\ = —jdy sur le
segment BC, puis d\ = —idx sur le segment CD et dl = jd y sur le dernier
segment DA. La force F n ’ayant pas de composante selon j, Fy = 0, seules les
intégrales le long les segments AB et CD contribuent au résultat final
pB pD
LABCD
F - d l = / Fx dx+
JA JC
Fxdx (1.80)
Sur la droite CD la valeur de Fx est constante et égale h b h, tandis que sur

la droite AB on a, Fx = b{h + L). Plaçons l’origine du repère en point sur
l’axe Ox en dessous de la droite DA. L’aire A^l étant supposée constante,
nous pouvons la sortir devant les signes d ’intégration, et même l’omettre ici.
On aura alors
ptJ pL
/ Fxdx= b(h +L)dx = bL{h +L) (1.81)
JA JO
tandis que la deuxième contribution vaut
pB pO
I Fxdx= I bhdx = —bhL (1.82)
JA JL
La somme des deux intégrales donne le résultat recherché :
/ F-dl = b(h + L ) - b h L = bL'^ (1.83)

J ABCD
A ------
Cette intégrale correspond au travail efifectué par la force F sur le parcours

fermé ABCD. On constate donc que pour ce type de force, le travail qu’elle
effectue le long d ’un circuit fermé peut être non nul, ce qui prouve qu’elle ne
dérive pas d’un potentiel. Ceci est d ’ailleurs confirmé par le calcul du rotation
nel de F (voir paragraphe 1.7.2) :
dFy _ dFx
= 0- 6= -6 (1.84)
dx dy
Ce rotationnel n ’étant pas nul, la force ne peut dériver d ’un potentiel, et le

résultat de l’intégrale de F • dl sur un contour fermé, appelée circulation du
vecteur F le long de ce contour, peut ne pas être nulle. Dans notre cas elle est
négative, car nous avons choisi le parcours orienté dans le sens des aiguilles
d ’une montre, contrairement à l’orientation positive traditionnelle, de Ox vers
Oy.
Pour cet exemple, une chose importante doit attirer notre attention : le résultat
de la circulation de F obtenu dans (1.83) est proportionnel à soit à l’aire
de la surface du carré ABCD entouré par notre circuit d ’intégration. Ce n’est
pas un hasard : on obtient un résultat semblable en considérant un parcours
circulaire, ou n’importe quel autre parcours fermé. En remplaçant le cercle
par une petite turbine plongée dans le courant, on peut récupérer de l’énergie
grâce au travail effectué par les forces non-potentielles agissant sur les pales
de la turbine.
Considérons un cercle de diamètre L placé au milieu du même coulement,
comme sur le dessin ci-dessous (1.13) :
F igure 1.13 - Parcours circulaire au milieu d ’un écoulement ; une petite tur
bine exploitant l’effet du rotationnel non-nul.
On déplacera l’origine du repère au centre du cercle, dont l’extrémité inférieure

se trouvera à la hauteur h à partir du fond. Sur un point arbitraire M du cercle,
paramétré par l’angle 9 mesuré à partir de l’axe Ox, la valeur de la composante
Fx de la force exercée par le flot est donnée par
Fa, = by{M) = 6 ( /H - 1 + ^ sin0) = 6 (/i + ^ sin0
Sur le cercle paramétré par l’angle 6 comme d ’habitude, on a
æ = ^ cos^, J/ = ^ sin^, I* = ^ cosî + ^ sin ^j
et l’élément de longueur dl s’obtient facilement
dl = dr = —^ sin ^ d^ i + ^ cos 0 d0j
Le produit scalaire F • dl restreint au cercle devient alors

L , bL . ^
F • dl = F j (—^ sin^d^) = —^ sin^ Kh + -^) + Y de
^ Zi
ou encore,
F • dl = —b{h + siïi 9d0 — sin^ 6 dû
Sachant que
p2ti p2TT
/ sin 0 d^ = 0 et / sin^ 6 de — TT
Jo Jo
on arrive au résultat final
L cercle
F • dl = -
7t6L2
(1.85)
qui est encore une fois proportionnel à la constante 6 et à l’aire 7tL^/4 du

disque enfermé par le parcours choisi.
Il n ’est généralement pas facile de représenter sur une feuille de papier un
potentiel V (x, y, z) dépendant de trois variables. En revanche, dans le cas de
deux dimensions, on peut représenter une fonction V(x,y), en utilisant soit la
perspective, soit un graphe plan montrant les niveaux de valeur constante de
V, que l’on appelle des lignes équipotentielles (figure 1.14).
La ressemblance du diagramme montrant les lignes équipotentielles définies
par les égalités V = C'i,C'2,---, Cn = avec une carte géographique
n ’est pas un hasard. Si un point matériel est astreint à rester sur une surface
F ig u r e 1.14 - L es p u its d e p o te n tie l V = V(x, y) e t leu r c a r te so u s form e d e c o u rb es

de n iv ea u .
ou sur une courbe donnée pouvant être considé-rées comme indéformables,

il sera soumis aux forces de réaction exercées par les supports respectifs. Ce
sont ces forces qui maintiennent le point matériel sur la surface (ou sur la
courbe) prescrite. Dans un pareil cas, en l’absence de frottement, tous les
mouvements tangents à la surface (courbe) s’effectuent librement, tandis que
les mouvements orthogonaux à la surface (courbe) sont strictement interdits.
Dans le champ gravitationnel terrestre constant, le potentiel est égal à =
mgz, mais si nous sommes de plus sur une surface d ’équation z = z(Xyy), ce
même potentiel devient fonction de deux variables x et y :
V{x,y) = mgz{x,y),
ce qui est décrit parfaitement par les dessins (1.14). Autrement dit, un point
matériel glissant sans frottement sur une surface dans le champ gravitationnel
se comporte comme un point évoluant en deux dimensions dans un potentiel
dépendant uniquement des deux variables x et y.
Exemple
Considérons un mouvement plan sur un cercle de rayon £. Il peut être réalisé
soit grâce à une corde (ou une tige) raide suspendue en un point, soit grâce
à un cercle solide comportant un sillon dans lequel glisse une petite perle
symbolisant le point matériel (figure 1.15)
Dans le cas d ’un pendule, la force T exercée sur la masse m par la corde
s’appelle tension. Dans le cas d’un rail circulaire, elle s’appelle réaction du
support rigide et sera notée R . Quelle que soit la réalisation, en l’absence de
/\
F ig u r e 1.15 - Mouvement circulaire réalisé comme un pendule ou dans un sillon
sur un support rigide
frottement ces forces seront identiques, T = R.

L’équation du cercle de rayon l centré en O s’écrit
soit f{x, y) = x^ + =Q ( 1. 86)
en ayant choisi O comme centre du système de coordonnées. Puisque /(æ, y) —

0 est une constante, sa différentielle doit aussi être nulle :
(1.87)
On reconnaît ici le produit scalaire entre les deux vecteurs
grad/ = ^ i + ^ j et 5r = i d x + j d y
ce qui conduit à écrire df = g ra d f • 5r. Les déplacements infinitésimaux ¿r

qui vérifient l’équation
df — g ra d f •Sr = 0 ( 1.88)
sont appelés déplacements virtuels compatibles avec la contrainte. De (1.86) on

tire
g ra d / = 2æ i + 2y j
Ce vecteur est colinéaire au rayon vecteur r = æ i + y j . En tout point du cercle

défini par ||r|| = £, le vecteur unitaire n = r / ||r || est orthogonal à ce cercle. Il
s’ensuit que le vecteur 5r compatible avec la contrainte (c’est à dire vérifiant
1.88), étant perpendiculaire à n, est donc lui-même tangent au cercle. Il est
facile de voir que les vecteurs n et t, respectivement vecteur unitaire normal et

vecteur unitaire tangent au cercle, sont donnés par les expressions suivantes :
X. , y . y . , X.
n = - i + - j et t = — 1 + - J (1.89)
r r r r
Remarquons que le choix de t avec le signe contraire serait aussi légitime :
nous avons choisi la direction de t qui respecte l’orientation traditionnelle
du cercle, à savoir, de Ox vers Oy. On vérifie facilement que t • n = 0, et que
n^ = 1, = 1. On peut décomposer la force de gravitation F = m g = —mgj
appliquée à la masse m selon les vecteurs n et t (voir figure 1.16) :
X
F •n = -m g J et F • t = -mg-^ (1.90)
F igure 1.16 - Les forces agissant sur la masse accrochée à un fil rigide
et écrire
îy ÎC
F = -mg j n - m g j t . (1.91)
Les déplacements virtuels s’effectuant uniquement tangentiellement au cercle,

6v doit être en tout point parallèle à t. Seule la composante le long de t
de la force F travaille pendant le déplacement, car sur le cercle 5r • n = 0.
D’après (1.90), cette composante dépend uniquement de la variable a;, que
nous pouvons donc utiliser comme la seule variable indépendante du problème.
Le mouvement étant restreint au cercle, on a j/ = ±mgy/i^ —æ^, le signe
+ correspondant à la moitié supérieure du cercle, et le signe — à sa moitié
inférieure. Dès lors, le potentiel gravitationnel U = m gy doit être envisagé
comme une fonction de la variable x, soit U = ± m g Le cercle étant
centré en O, considérons le mouvement dans la partie inférieure, auquel cas
U = —m gy/i“
^— ou encore U = —mg£ ^ 1 —^
On pourrait choisir x comme seule variable pour décrire le mouvement. Ce

pendant dès que l’on essaye d ’exprimer la vitesse et l’accélération instantanées
à l’aide de x et de ses dérivées, ce choix conduit à des équations trop com
pliquées. En effet, la loi de Newton appliquée au problème :
d?r
m ^ = F H + mg
peut être exprimée à l’aide de la variable x seule. Puisque sur la partie inférieure
du cercle
r = æi-t-2/j = æi —
la vitesse instantanée prend la forme suivante
XX
v = à;i4-ÿj = æi +
et l’expression pour l’accélération a devient encore plus compliquée.

Le problème devient en fait beaucoup plus simple avec la paramétrisation
adaptée à la géométrie du dispositif considéré consistant à définir la position
de la masse m par l’angle в mesuré à partir de la position verticale inférieure
du pendule, comme indiqué sur la figure (1.16). On écrira alors
X = £ sin в, y = —£ cos в
et le potentiel prendra la forme
U = mg y + Uq = —mg £ cos в -I-Uq
où Uq est une constante arbitraire que l’on peut choisir de manière à obtenir
le minimum de U en position inférieure, soit pour в = 0 \ autrement dit, on
veut avoir U(y = —£) = 0, d ’où Uq = mg£, et
U = mg£{l —cos^)
Recalculons alors la vitesse et l’accélération instantanées au moyen de cet

angle. On a
dx dx de , . dy dy de л„ . „
x = ë£ cos e —£è^ sm.e, ÿ = éi sin0 - h ^ c o s e (1.92)

En décomposant les équations de Newton sur les axes i et j, avec la force de la

pesanteur —mg^ et la force de tension T alignée sur la corde tendue, on aura
m x = Tx, m ÿ = Ty —mg (1.93)
Le vecteur unitaire colinéaire à la corde tendue est
n = —sin^ i + COS0 j , donc, T = r (—sin0 i + cos0 j)
Substituant les expressions de æ et de ÿ dans (1.93), on trouve :
m i è cos 6 —m i sin 6 = —T sin 6

m i 6 sin 6 + m i 6^ cos 9 = T cos 0 —mg (1.94)
Nous avons à présent deux équations pour deux fonctions inconnues du temps,
6{t) et T{t). Il est facile de séparer ces deux fonctions : en multipliant la
première équation du système (1.94) par cos 6 et la seconde par sin0 et en
additionnant les résultats, on élimine l’inconnue T pour trouver ^
ml9 = —mg sin 6 (1.95)
puis, en multipliant la première équation par sin^ et la seconde par cos 9 et

en retranchant, on trouve pour T(f) l’expression :
T = mg cos 9 + ml 9^. (1.96)
On obtient ainsi automatiquement T en fonction du temps dès lors que la

solution 9 = 9{t) est connue.
Parmi les solutions de (1.95), il existe deux solutions stationnaires qui sont
des points d’équilibre. En effet, posant 9 = Constante, 0 = 0 et 0 = 0, on est
conduit à sin 0 = 0, est possible si 0 = 0 ou 0 = tt, valeurs de l’angle corres
pondant, respectivement, à la position inférieure du pendule, où le potentiel U
atteint son minimum U = 0 (équilibre stable), et à la position supérieure du
pendule, où le potentiel atteint son maximum U = 2mg (équilibre instable).
Pour trouver les solutions non-stationnaires, il faudra résoudre le système
d ’équations permettant de trouver d’abord la loi horaire 9{t), puis la réaction
du fil T{t) :
7. Ceci revient à projeter la relation fondam entale selon la direction perpendiculaire au
fil du pendule, sur laquelle T a une projection nulle.
1.7. PROBLEMES 45
(9 = - ^y sin 6, T = mg cos 6 -\-ml6^. (1.97)

V
Est-ce une chance d ’avoir réussi à séparer le problème en deux parties, dans
l’ordre, la détermination du mouvement, puis celle de la force de réaction?
Nous verrons bientôt que cette situation peut être généralisée : le principe de
d ’Alembert et les équations de Lagrange qui sont l’objet du Chapitre II de ce
cours, permettront de séparer le mouvement sous contrainte et les réactions
du support durant ce mouvement.
1.7 Problèmes
Problème 1.1 - La poursuite

Un chien poursuit un lièvre en adaptant toujours de façon continue la direc
tion de sa course vers cette “cible mobile”. Trouver la trajectoire du chien en
supposant que le lièvre court à la vitesse constante c = c c y et que la vitesse
scalaire du chien est elle aussi constante et égale à U > c, sachant qu’à la date
i = 0, alors que le lièvre passe au point (6, 0), le chien, qui se trouvait en (0, 0),
commence sa course-poursuite avec la vitesse initiale Ue®.
F ig u r e 1.17 - La trajectoire du chien (P) poursuivant le lièvre (Z)
Problème 1.2 - La cycloide

Trouver l’équation paramétrique de la courbe tracée par un point solidaire
d ’une roue de rayon a qui roule sans glisser le long de l’axe Ox. Trouver sa
vitesse et son accélération en supposant que la roue avance à vitesse constante
V le long de l’axe Ox.
46 CHAPITRE 1. MECANIQUE DU POINT MATÉRIEL
Problème 1.3 - Mouvement hélicoïdal

Un point M décrit une trajectoire selon les équations horaires
x = a cosctii , y = a sinwi , z = but
où a, b et U sont des constantes positives.

a) Quelle est la trajectoire de M ?
b) Déterminer les composantes cylindriques du vecteur unitaire t tangent à la
trajectoire.
c) Déterminer les composantes cylindriques du vecteur unitaire N définissant
la normale principale de la trajectoire. Montrer que le rayon de courbure de
la trajectoire est constant.
Problème 1.4 - La fusée Saturne

Une fusée est lancée verticalement à partir du sol terrestre avec une vitesse
initiale nulle. La propulsion de la fusée est assurée par l’éjection de gaz vers
l’arrière de la fusée, avec, relativement à cette dernière, une vitesse u = —«e*
supposée constante. Ces gaz proviennent de la combustion de carburant dans
le moteur de la fusée. De ce fait, la masse de l’ensemble de la fusée proprement
dite et du combustible propulsif diminue au cours du lancement. Au départ,
sa valeur est mo. A la date t elle est devenue m(i). Le débit de gaz propulsifs
est supposé constant. On a donc
= —p = constante
dut/
On note V la vitesse instantanée de la fusée relativement au référentiel terrestre
assimilable à un référentiel galiléen pendant la durée du lancement. On notera
w la vitesse du gaz s’échappant du moteur de la fusée (verticalement vers le
bas, w = —WBz relativement à la Terre. Le champ de gravitation terrestre
est supposé constant, g = —geg et de module y = 10 m/s^. On négligera les
forces de frottement de l’atmosphère.
a) En faisant le bilan de quantité de mouvement entre les dates t et t+dt, alors
que la masse de gaz ejectée est dm, montrer que la quantité de mouvement p
de la fusée aura varié de
dp = mgdt + dm (w = —v)
b) En prenant m comme variable au lieu de t, montrer que l’altitude z de la

fusée doit vérifier l’équation
1.7. PROBLEMES 47
( fz (w —v)
=- ^ +
dw? mp
c) Intégrer cette équation et déduire z{m) puis z{t)., compte-tenu des condi
tions initiales. A quelle condition la fusée peut-elle décoller ?
d) On donne ci-après les caractéristiques de la fusée Saturne V : masse initiale
mo ^ 2800 tonnes ; le premier étage propulseur contient 2000 tonnes d’ergol,
mélange de kérosène et d’oxygène liquide, dont la combustion délivre une
poussée de 33450 kN, la poussée étant définie comme le produit du débit de
gaz éjectés par la vitesse (relative) d’éjection, soit \u dm/dt\ ; la combustion
du premier étage dure 150 s, après quoi le premier étage est séparé du reste de
la fusée. A l’aide de ces données, évaluer numériquement : la vitesse d ’éjection
des gaz du premier étage de la fusée ; la vitesse de la fusée et son altitude au
moment de la séparation du premier étage.
P ro b lèm e 1.5 - L ’oscillateu r h arm o n iq u e
L’équation différentielle permettant de prédire l’évolution temporelle d’un os
cillateur harmonique non amorti à une dimension s’écrit
d?x , d^x
= — U>Q X
’ °" ^
wo = y/k/m étant sa pulsation propre.

a) Etablir l’intégrale première de l’énergie, notée E.
dx
b) En déduire l’expression de — en fonction de æ, k, m et E.
CuL
c) Montrer alors que la relation entre i et æ peut être exprimée au moyen de
la formule
Im F du
i = ¿0 i
L
U
où to et XQ sont des constantes devant être ajustées aux conditions initiales.

fW
d) Calculer cette intégrale en changeant la variable : u = y — sin (¡>et en
dx
déduire x{t) en supposant que pour i = 0 o n a — = Oe t æ = ico.
(jbü
P ro b lèm e 1.6 - P e n d u le physique
On envisage le mouvement d ’un pendule simple dans un laboratoire terrestre.
On admet que le référentiel du laboratoire peut être considéré comme galilén.
On note O l’extrémité fixe du pendule, Oy la verticale locale descendante pas

sant par O et Ox un axe horizontal. On ne considère que les mouvements
s’effectuant dans le plan xOy. L’extrémité mobile du pendule en laquelle est
attachée une masse ponctuelle m est notée M. La longueur du fil rigide, inex
tensible et sans masse joignant O к M vaut i, et l’on note в l’angle entre ce fil
et la verticale Oy à un instant donné. A la date i = 0, alors que в = 9o < тт,
on lâche la masse m sans vitesse initiale. On néglige tout frottement.
a) Exprimer les composantes radiales et orthoradiales de la vitesse v et de
l’accélération a de M , en fonction de в, de ses dérivées temporelles, et de i.
b) Appliquer la relation fondamentale de la Dynamique à la masse m dans le
référentiel du laboratoire et en déduire l’équation d ’évolution de l’angle 9.
c) Définir l’energie mécanique de la masse m et démontrer la relation
= 2^ (cos 9 —cos 0o)
où g est l’accélération de la pesanteur terrestre.

d) Montrer que le mouvement de la masse m est périodique et que sa période
est donnée par
- 14 /fô
'
d9
,-y ■■ „..... avec Ш=■ \ \ ^
U)Jo ^2(cos 9 —cos 9q) V£
9 9q
e) Faire le changement de variable sin - = sin sin a. et montrer que
A ^
2 /•V2 da
= 0-0 Jo
/ /1 . 2 ^0 ^2
Y 1 — s in ^ — S in a
f) Montrer que pour des petits angles on a approximativement
02
r « то (1 -h ^ ) , avec tq = 2тгJ ^
Pour quelles valeurs de 9o a-t-on r = ro avec une précision moindre que i)

10-2 ?ii) 10-4?
g) Montrer que la connaissance de l’accélération normale ajv de M permet de
déterminer la tension T du fil. En quels points de la trajectoire l’amplitude
de cette tension est-elle maximum ou minimum ?
Chapitre 2
Mécanique lagrangienne
2.1 Principe de d’Alembert
Les mouvements d ’un ou de plusieurs points matériels évoluant dans un es

pace libre de toute entrave correspondent bien aux situations rencontrées en
mécanique céleste, premier champ d ’application de la mécanique et de la grar
vitation newtoniennes. Sur Terre, une telle idéalisation ne s’applique qu’à la
chute libre, et encore, à condition de négliger le frottement de l’air ambiant.
Mais dans la plupart des cas, les objets matériels sont soumis non seulement
aux forces exercées par la gravitation ou un champ électromagnétique, mais
surtout à celles d ’autres objets matériels qui leur imposent des contraintes de
toute sorte, comme le sol, qui supporte tout véhicule, ou les rails, les suspen
sions, les surfaces planes ou courbes sur lesquelles les objets sont contraints de
rester pendant leurs mouvements. Pour maintenir un objet sur une courbe ou
une surface donnée, celles-ci doivent en effet exercer des forces dites réactions,
assurant le maintien de l’objet ^ sur elles.
L’idée principale de d’Alembert peut être présentée comme l’unification du

principe d ’équilibre des forces, servant de base à la statique, avec le prin
cipe dynamique de Newton. En fait, le premier pas décisif a consisté en une
opération qui pouvait sembler sans importance mais permettait d ’exprimer un
peu différemment le principe fondamental de la mécanique newtonienne d ’un
point matériel. Au lieu de dire que “le produit de la masse par l’accélération
est égal à la force agissant sur l’objet” , d ’Alembert a proposé (en 1743) une
interprétation différente du même principe, en l’écrivant, comme en statique.
1. Que, pour commencer, nous assimilons ici à un point matériel.

50 CHAPITRE 2. MÉCANIQUE LAGRANGIENNE
sous forme d ’annulation de la somme des forces. Autrement dit, au lieu d ’écrire
m a = F ( 2 . 1)
il a proposé de remettre tous les termes sur le coté gauche
F + {—m a) = 0 ( 2.2)
ce qui peut être interprété comme “en toute circonstance, la somme des forces
agissant sur un objet massif reste nulle” , à condition d ’inclure la force dite
“d ’inertie” , en l’occurrence le produit de la masse par l’accélération, pris avec
le signe opposé.
Cette force d ’inertie était implicitement présente dans l’énoncé de la troisième
loi de Newton qui stipule que chaque action, représentée par une force, pro
voque une force de réaction égale en module à celle de l’action, mais de sens
opposé. On sait notamment que des forces fictives apparaissent aussi chaque
fois que l’on se place dans un repère accéléré et que, par exemple, les passagers
dans un train qui accélère ont l’impression d’une force, semblable à la gravi
tation, qui les pousse dans la direction opposée à la direction du mouvement
du train.
Cette nouvelle formulation d ’équilibre généralisé permet d’y inclure les forces
résul- tant de contraintes matérialisées par des rails (courbes) ou des surfaces
(comme une chaussée). Un corps astreint à se mouvoir sur un support quel
conque est soumis de la part de celui-ci à une force de réaction ayant deux
composantes : l’une, normale au support, due à sa réaction élastique, l’autre,
tangentielle, due au frottement. Dans la plupart des cas, on cherche à réduire
cette dernière autant que possible. Dans le cas idéal, l’objet matériel glisse
quasiment sans frottement sur le support. C’est cette situation idéale, où tout
frottement entre le point matériel et le support est absent, que nous allons
considérer.
Dans ce cas, la réaction exercée par le support, appelée désormais la contrainte,
lui est strictement orthogonale. S’agissant d ’une surface, soit f{x, y,z) = 0 son
équation implicite. Le vecteur qui lui est normal est donné par le gradient de
la fonction / . En effet, tout déplacement infinitésimal 5*r — [5æ, 6y, 5z] ayant
lieu sur la surface doit vérifier la condition 5f = 0, puisque / garde la même
valeur lorsqu’on reste sur cette surface, soit :
(2.3)
2.1. PRINCIPE DE D’ALEMBERT 51
d ’où Гоп déduit que, g r a d / étant orthogonal à un vecteur quelconque <5*r

situé sur la surface, est donc orthogonale à celle-ci au point considéré. On
constate aussi que les petits déplacements restant tangents à la surface des
contraintes peuvent être paramétrés par deux quantités infinitésimales, ce qui
correspond au fait que la surface elle-même peut être paramétrée par deux
variables seulement.
Dans le cas où le point matériel est contraint à se mouvoir sur une courbe, ses
coordonnées devront vérifier deuæ équations implicites^
fi{ x ,y ,z) = 0 , f 2 {x,y,z) = 0. (2.4)
4» E xem ples
a) Mouvement d’un point matériel astreint à se mouvoir sur une sphère de
rayon R.
On notera que cette situation est équivalente au cas d ’un poids accroché à un
fil tendu, non-élastique, de longueur R. L’équation implicite de la sphère est
/(x , y,z) = + y^ + - R“
^=0
et l’on a
g r a d / = [2x, 2y, 2z]
Ce vecteur est parallèle au rayon-vecteur r, qui lui même est orthogonal à la

sphère d’équation | r |= iî. La force de réaction que la sphère exerce sur le
point matériel est donc alignée sur le rayon-vecteur. Dans le cas d ’un point
accroché à un fil, la réaction est colinéaire au fil, lui même aligné sur r.
b) Considérons à présent un mouvement contraint à s’effectuer sur un cercle
de rayon R, centré en O et se trouvant dans le plan (x, z). Les deux équations
implicites définissant ce support sont :
fi{ x ,y ,z) = 2/ = 0 , f 2 {x,y,z) = x ^ + z ^ - R '^ = 0
La réaction exercée par le cercle se décompose maintenant selon les deux vec
teurs
g ra d /i = [0, 1, 0] et g ra d /2 = [2x, 0, 2z]
2. La courbe pouvant être considérée com m e l’intersection des deux surfaces définies
respectivem ent par l ’une et l ’autre équation.
52 CHAPITRE 2. MECANIQUE LAGRANGIENNE
qui engendrent en tout point du cercle le plan perpendiculaire au cercle. En

tout point du cercle, le seul mouvement possible doit s’effectuer localement
selon la direction tangente au cercle. Il est clair que cette direction peut être
obtenue à partir du produit vectoriel des deux vecteurs (perpendiculaires)
précédents, soit
t ~ g ra d /i A g ra d /2 = [2z, 0, -2x]
Notons aussi que les surfaces ou courbes de contraintes peuvent elles-mêmes

changer leur position avec le temps, ce qui sera exprimé par une dépendance
explicite vis-à-vis de t, par exemple sous la forme /(æ, y, z] t) = 0, équation
qui décrit de manière implicite une surface dont la position dans l’espace et
éventuellement la forme évoluent avec le temps.
Revenons aux équations de Newton revues par d ’Alembert. En projetant la
force et l’accélération sur les axes d ’un repère cartésien,
F= F x 'i + F y j + F ;s k , & = x i + ÿ'^-\-zk
nous pouvons écrire explicitement l’équation (2.1) sous forme de trois équations
indépendantes
mx = Fx, mÿ = Fy , mz = Fz (2.5)
Exprimons maintenant la même chose un peu différemment :
(F —m a) • 5r = 0 (2.6)
OÙ ir = [5x, 5y, Sz] est un vecteur déplacement infinitésimal quelœnque. Ex

plicitant le produit scalaire et tenant compte de ce que Sx, 5y et Sz sont
indépendants, (2.6) équivaut à écrire
{F x —m x )S x = 0 , {F y —m ÿ)S y = 0 , {F z —m z)S z = 0 (2.7)
En admettant que l’équation (2.6) soit vérifiée quel que soit le vecteur infi
nitésimal Sr, on constate que cette équation unique est équivalente aux trois
équations indépendantes (2.5).
En l’absence de frottement, quand le point matériel glisse sur la surface (ou
la courbe) de contraintes, la force qui s’exerce sur lui est strictement per
pendiculaire à la surface. Ceci reste vrai même dans le cas plus général de
contraintes mobiles. Le vecteur g r a d / étant par définition orthogonal à la

surface d ’équation f{x, y, z) = 0, la force de réaction exercée pas la contrainte
doit avoir la forme
R = Ag r a d / ( 2 .8 )
où A = A(i) est une fonction du temps t, qui peut être déterminée une fois
connu le mouvement du point. Les équations du mouvement contraint peuvent
donc s’écrire comme suit :
m r = F + A(i) g r a d / , /(x , y, z,t) = 0 (2.9)
ce qui représente quatre équations pour quatre fonctions inconnues du temps

t, x{t), y{t), z{t) et A(i).
Dans le cas d ’un mouvement restreint à une courbe, donnée implicitement par
deux équations fi(x, y, z,t) = 0 et / 2(æ, y, z, t) = 0, la force de réaction exercée
par la courbe (que l’on peut imaginer comme un fil de fer très mince et très
rigide sur lequel glisse une petite perle) lui est perpendiculaire à tout instant
i, et est donc de la forme
R = Ai(i) g ra d /i + A2(î ) g ra d /2 ( 2 . 10)
Les équations du mouvement sont alors
m f = F + Ai(i) grad/i + A2 (i) grad/2

/ i( x ,2/,z ,i) = 0 , f 2 {x,y,z,t) = 0 (2.11)
constituant cinq équations pour cinq fonctions inconnues, x, y, z, Ai et A2.

Souvent, la connaissance du mouvement présente plus d ’intérêt que celle des
forces de réaction. On peut donc songer à une résolution par étapes : trouver
tout d ’abord les équation horaires du mouvement, c’est-àrdire, déterminer les
fonctions x{t), y(t) et z{t), sans faire intervenir les forces de réaction. Cette
idée a trouvé sa réalisation dans le principe de d ’Alembert que nous pouvons
énoncer comme l’équivalence entre deux systèmes d ’équations : celui avec les
forces de réaction incluses.
(I) : m r = F + A(i) g r a d / , /(x , y, z, t) = 0 ( 2 . 12)
ou bien un système sans forces de réaction apparentes.

(II) : (F - m r) • (5*r = 0 , f{x, y, z,t) = 0 (2.13)
sous réserve que les déplacements ¿*r satisfassent la condition
g r a d / • <J*r = 0
Les déplacements marqués d’une étoile s’appellent des déplacements virtuels,

ce qui signifie “compatibles avec les contraintes”. Géométriquement, la condi
tion est claire : ces déplacements doivent toujours être tangents à la surface
(ou à la courbe) des contraintes.
Le fait que l’hypothèse (I) entraine (II) est évident : il suffit de multiplier
scalairement l’équation (I) par S*r, et si g r a d / • 5*r = 0, c’est à dire si les
déplacements virtuels S*r respectent les contraintes, il ne restera que l’équation
(F —mr) •(5*r = 0 ainsi que l’équation implicite de la contrainte /(æ, y, z, t) =
0, ce qui constitue la formulation (II). Pour établir l’équivalence entre les
postulats (I) et (II), il faut maintenant prouver que (II) entraine (I). Supposons
donc que le postulat (II) soit vérifié. On a donc
(2.14)
Quel que soit le point d’espace (x, y, z) et le moment t choisis, les trois dérivées
partielles ne peuvent pas s’annuler simultanément. Pour fixer les idées, suppo-
df
sons par exemple que l’on ait 77- ^ 0. Dans ce cas, il est possible d ’exprimer
ox
le petit déplacement 5x en fonction de 5y et 5z :
Sx = — (2.15)
dx
Nous pouvons choisir 5y et 5z de façon arbitraire et exprimer la condition

(F —m r) • S*v = 0 uniquement en fonction de ces deux déplacements virtuels
indépendants. Remplaçant Sx par l’expression (2.15), on obtient ainsi
— Sy + — Sz
-(F x mx) Qf ^ + (Fy fnÿ)Sy -f {Fz —mz)Sz = 0 (2.16)
dx
soit, en regroupant tous les termes contenant 5y d’une part et ôz d ’autre part,
Êl
d'il
{F y - mÿ) mx) <5y+ {Fz - mz) - - ^ { F x - mx) 5z = Q (2.17)
dx dx
Les variations 5y et Sz étant arbitraires on est conduit aux deux équations

indépen- dantes
d£
(F y - - ^9y{ F x - mx) = 0, {F z - mz) - -^ {F x - mx) = 0
d f'
dx dx
soit, de manière plus symétrique :
Fy —mÿ _ Fy —mit Fy —m z _ Fy mx
et (2.18)
K
dy dx dz dx
Précisons ici que, pour que les expressions (2.18) aient un sens, on suppose
que si {df /dy) 0, alors F y —mÿ —> 0, et de même que {df /dz) -¥ 0 entraîne
Fz —m z 0. De (2.18) on conclut que le vecteur F —m a doit être colinéaire
à g r a d / et qu’il existe donc un coefficient A tel que
F - m a = —Ag r a d / (2.19)
ce qui conduit aux trois équations indépendantes (I) assorties de la contrainte

f{x, y, Z, t) = 0. La nouvelle fonction du temps A = A(i) qui reste à déterminer
porte le nom de facteur de Lagrange.
Dans le cas d ’une courbe définie par deux équations implicites fi{x, y, i) = 0
et f 2 {x,y,z,t) = 0, l’équivalence est plus compliquée à prouver. Il faut alors
exprimer deux variations, par exemple Sx et 5y en fonction d ’une seule, ôz, ce
qui est toujours possible si dans la matrice rectangulaire
d fi
dx dy dz
( 2 . 20)
df2 df2 df2
V dx dy dz )
il existe au moins un mineur (sous-matrice) 2 x 2 à déterminant non nul, par

exemple^
det dx dy ( 2 . 21)
^ %
\ dx dy J
Si tel n’était pas le cas (pas de mineur non nul), cela voudrait dire que les
deux fonctions / i et /2 ne sont pas indépendantes, et que les surfaces qu’elles
définissent n’ont pas d ’intersection. On peut facilement s’en rendre compte en
considérant deux sphères de rayons différents, centrées en 0, définies par leurs
équations implicites
+ -h - i î f = 0, /2 = -I- - iÏ 2 = 0
Il n’y a aucune intersection, et donc aucune courbe définie, mais aussi la ma
trice (2.20) est composée de deux lignes identiques, et tous ses mineurs ont un
déterminant nul.
La technique qui s’ensuit est la même que dans le cas d’une surface ; il faut
seulement exprimer 5x et 5y en fonction de 5z puis substituer les expressions
obtenues dans (2.13). Voici l’esquisse du procédé : tout d ’abord, à partir de
ôfi = 0 et ¿/2 = 0, on déduit
a /i^ ^dh. d fi.

~ôz
dz
dhr , 9/2 . d f2 .
( 2 . 22)
soit, sous forme matricielle.
{Ë à /Êà
dx dy
(t)=-
dx dy ) ^ dz
Ce système de deux équations linéaires se résout de manière classique; en
voici la solution donnant Sx et Sy en fonction de 5z^ obtenue en appliquant la
matrice inverse^ sur les deux cotés du système (2.23) :
3. On aurait pu faire un autre choix parmi les trois possibles, en prenant com m e deux
variables dépendantes ( y^z) ou encore ( z^x) .
A A .
4. A noter que
( a b\
*
1
= — — r-
f d -h\
yc dJ ad — bc y — c a J
Sx
-è( dy dz dz dy ’ D \ d z dx dx d z )
avec D= (2.24)
dx dy dy dx )
En substituant ces deux expressions 5x et 5y dans (2.13), nous arrivons à une

seule équation indépendante reliant les trois composantes, à la place de deux
équations comme dans (2.18) :
rr,
(ii - rruc) fdfi àh àh df2\ ,
+ {F, - ray) .., fdfi dh dfi df2\
(2.25)
dx dy dy dx
Cette relation montre que F —m a est orthogonal au produit vectoriel g ra d /i A

g ra d /2 et est donc dans le plan qui lui est orthogonal. Ce dernier est engendré
par les deux vecteurs g ra d /i et g r a d /2. U s’ensuit qu’il existe deux fonctions
Al et A2 telles que soient vérifiées les trois équations suivantes :
F ^ - m æ + A i ^ + Ai^ = 0
dx dx
(2.26)
+ H - A .f = 0
équivalentes à
(F - m r + Al g ra d /i + A2 g r a d /2) • <î*r = 0 (2.27)
avec deux conditions supplémentaires
(5*r • g ra d /i = 0 , 5*r • g ra d /2 = 0
La généralisation du principe de d ’Alembert à un système de N points matériels

est assez directe. On envisage les N points évoluant dans l’espace à trois di
mensions comme un seul point fictif dans un espace à 3N dimensions dont les
coordonnées sont (æi, y i,zi -, X2 , 2/2, Z2 ; 0:3, 2/3, ^3 ; • • • ; æjv,2/jv, zn ).
Chaque contrainte empêchant ces points d’évoluer librement dans 3 dimen

sions ou, de manière équivalente, empêchant le “point” unique représentatif
d ’évoluer librement dans les 3N dimensions, est définie par une équation im
plicite
/(æ i, y i,zi, X2 , V2, Xn , VN, i) = 0 (2.28)
S’il existe p contraintes, nous aurons p fonctions de ZN variables (et peut-être

du temps) indépendantes, s’annulant séparément
h{xWyuZuX2,y2,Z2, - • • ^XN^PN^ZN^t) = 0
h { ^ U V U Z i , X 2 , y 2 , Z 2 , - • ’ . XN^yN. ZN' .t ) = D
f p { x u y u Z l , X2, y 2 , Z 2 , - “ '>XN, VN, Zn \ Î) =0
Toutes ces conditions peuvent être résumées en introduisant une notation

abrégée utilisant des indices i,j, k, - -• variant de 1 jusqu’à ZN. Nous définirons
comme suit les coordonnées cartésiennes de notre point fictif en ZN dimen
sions, correspondant aux N points réels en 3 dimensions :
{ x i , X 2, X 3 , X i , X 5 ,XQ, • • • , X 3 N - 2 , X zN - 1 î X z n )
{xi,yi,Zi) (x2,y2,Z2) {Xn ^PN^Zn )
OÙ les trois premières coordonnées cartésiennes sont celles du premier point,

les trois suivantes (4,5,6) celles du deuxième point, etc. Nous utiliserons des
indices grecs a, /0, • • • pour numéroter les contraintes, fa : (/ii /21 • • • >/p)> et
qui varieront donc de 1 jusqu’à p. Les p contraintes peuvent ainsi être écrites
sous la forme très compacte
/a(£Ci,i) = 0, i = l,2 ,---,3 iV ; 0:= l,2 ,- - - ,p (2.29)
Parfois, il est utile d’introduire une notation intermédiaire, avec des indices
A, B ,- •' numérotant les points matériels et leurs rayons-vecteurs respectifs.
Ainsi, le rayon-vecteur en trois dimensions du point numéroté A sera rî =
[x a ,VAi Za ]i et les p contraintes s’écriront maintenant comme suit
f a { r A , t ) = 0 , ; 0!= l,2,---,p
2.1. PRINCIPE DE D ’ALEMBERT 59
Les P équations ci-dessus définissent une hypersurface de contraintes, de dimen

sion 3iV —P, qui peut en général évoluer avec le temps t dans l’espace à 3N
dimensions. Un déplacement virtuel généralisé compatible avec les contraintes
doit vérifier les p équations
N
53 • grad^/a (ra,i) = 0, a = 1,2, • • • ,p (2.30)
A=1
OU
= iæA i+ SpA j + SZA k, et grad^ ^ i+ ^ j+ k
Nous pouvons exprimer la condition de compatibilité des déplacements virtuels

avec les contraintes de façon encore plus simple, à savoir
3N
(2.31)
i=l dxi
Notons que, dans le cas général où les contraintes peuvent varier avec le temps,
la vitesse réelle instantanée
dVN
t di / [ di ’ di ’ ’ dt
n ’est pas tangente à l’hypersurface des contraintes. En effet, en évaluant la

variation totale de chaque fonction de contrainte fa pendant le laps de temps
5t, qui doit rester nulle puisque ayant /« {xf,t) = 0 pour tout t, nous trouvons
3N
(2.32)
3=1
et c’est donc uniquement si d fa /d t — 0 pour tout a que les vitesses réelles Xj

vérifient les mêmes conditions d ’orthogonalité que les déplacements virtuels
S*Xk, soit
3N
j= i •'
A présent, nous pouvons formuler le principe de d ’Alembert pour un système

de N points matériels de masses ruA, A = 1,2, • • •, IV soumis à des contraintes
fixées par p identités implicites
fa{rA,t) = 0, a=l,2,---,p
Ce principe peut être énoncé en trois points :

1) Sous l’effet de contraintes, les points matériels subissent des forces de
réaction A = 1, 2,• • • ,iV, étant la force de réaction agissant sur
la masse niA-
2) Le mouvement réel est régi par les équations de Newton comptabilisant
toutes les forces en jeu :
(Ptb = F b + F ^ \ B = l , 2,---,iV (2.33)

niB
dt“
^
soit, avec la notation généralisée,
rrij X j = Fj + j = 1, 2, • • •, 3iV
avec rrij tels que mi = m 2 = m3 = m i, m4 = ms = me = ^ 2» etc.

3) La somme des travaux virtuels de toutes les forces de réaction effectuées
sur un déplacement virtuel respectant les contraintes est nulle en l’absence
de forces de frottement (on pourrait inclure ces dernières parmi les forces
extérieures, à condition de connaître leur dépendance exacte vis-à-vis de et
de i).
Le troisième postulat ne découle pas logiquement des lois de Newton ; il doit
être soumis à la vérification expérimentale, qui le confirme la plupart de temps.
Le principe de d ’Alembert sert également à la recherche de position d ’équilibre
d ’un système de points matériels. Il suffit de chercher les solutions du système
(2.33) en l’absence de tout mouvement, c’est à dire, en annulant les dérivées
secondes x^ :
N
Z (2.34)
I (F ., + F W ) .i * r x = 0, avec (5*r/i • g ra d ^ fa = 0.
A=1
4k E xem ples
a) Considérons deux points matériels de masses m i et m2 respectivement,
reliés à une barre rigide de masse négligeable et de longueur constante égale
à ê (figure 2.1). S’il n ’y avait pas de contrainte, le système des deux points
matériels aurait eu six degrés de liberté, correspondant aux 6 coordonnées,

totalement indépendantes.
ri = (x i,y i,zi) et r 2 = (x 2 ,y 2 ,Z2 ) soit (œi,a:2,a:3,æ4,a:5,æ6)
Mais la présence de la barre impose le maintien d ’une distance fixe £ entre les
deux masses, quel que soit leur mouvement, et l’on a
( r i - r 2)^ = ^ ^ , soit / ( r i , r 2) = (ri - T2) ^ = 0
F ig u r e 2.1 - Deux masses reliées par une tige rigide
L’expérience montre que la force de réaction exercée par la tige rigide sur les
masses mi et m2 se trouvant à ses extrémités est toujours colinéaire au vecteur
ri —r 2 reliant les deux masses. Les forces agissant sur m i et sur m 2 ont même
module, mais agissent dans des sens opposés :
Selon le principe de d’Alembert, les déplacements virtuels J*ri et S*t2 com

patibles avec la contrainte doivent vérifier la condition
gradi / • (î*ri + grada / • S*r2 = 0
ce qui donne explicitement

2 (ri - T2) • ¿*ri - 2 (ri - ra) • 5*r2 = 2 (ri - r2) • (¿*ri - 5*r2) = 0 (2.35)
La force de la réaction agissant sur la masse mi étant colinéaire au vecteur

reliant les deux masses, nous pouvons l’écrire sous la forme
pW = I î l : i £ 2l et donc =
Le travail de ces deux forces pendant un déplacement virtuel est égal à
f [^^ • S*n + F^^^ • i* r2
conformément à la définition des forces F^^^ et F^^^ cela donne
FÎ^^ • ¿*ri + F^^^ • <5*Г2 = f [^'^ • (5*n - i* r2)
= ~ . (<5*n - 5*Г2) = 0 (2.36)

ri - Г2
en vertu de (2.35).
b) Le principe de d ’Alembert s’applique aussi à des contraintes dépendant du
temps, définies par rapport à des repères non inertiels. Nous le montrerons
dans l’exemple qui suit.
Considérons un cercle métallique réalisé en fil d ’acier rigide et lisse. Ce cercle
indéformable de rayon R tourne autour de son axe vertical avec la vitesse
angulaire constante u> = a>k. Le dispositif se trouvant à la surface de la Terre
est soumis au champ gravitationnel g = —gk.
Une petite perle de masse m peut glisser sans frottement le long du cercle.
Il s’agit de trouver l’équation de mouvement ainsi que les points d’équilibre
(stable ou instable, selon le cas).
Plaçons le centre du cercle au centre du repère 1Z' tournant par rapport au
repère galiléen 1Z{i, j, k) :
i' = i co sw i + j sin w i, j' = — i sincui + j co sw i, j', k' = к
Dans TZ, le cercle tournant est défini par deux équations dépendant explicite
ment du temps t. Mais si l’on se place d ’emblée dans le repère R! tournant
2.1. PRINCIPE DE D ’ALEMBERT 63
F ig u r e 2.2 - Une masse glissant sur un cercle rigide tournant autour de son axe
vertical
avec le cercle, celui-ci sera donné par une seule équation définissant un cercle
de rayon R dans le plan contenant les vecteurs î' et k' = k. Dans TZ', le rayon
vecteur d ’un point quelconque s’exprime comme x 'i' + y 'j' H- z 'k '. Le cercle
se trouvant tout le temps dans le plan y' = 0, un point sur le cercle vu depuis
IZ' n ’aura donc que deux coordonnées non nulles. Le cercle est défini par
+ /2 - R ^ = 0
Pour simplifier la notation, nous allons à partir de maintenant omettre la

notation “prime” des coordonnées dans TZ'. Il doit être bien compris que les
coordonnées envisagées sont donc celles dans le repère mobile. L’équation du
cercle sera ainsi récrite comme /(x , z) = x^ -|- 2:^ — = 0. Le déplacement
virtuel devant se faire le long du cercle, on a :
ce qui donne
2x Sx + 2zSz = 0, soit 2 r • S*r = 0
Cela veut dire que le petit déplacement 5*r doit toujours être orthogonal à r.
Il s’agit bien évidemment de la direction tangente au cercle, le vecteur r étant
normal au cercle d’équation | r |= ü .
Dans le repère tournant on observe une force d ’inertie égale à l’opposé du
produit de la masse m de l’objet par l’accélération. Dans le cas présent, il
n y a ni accélération de translation (car l’origine O du repère, coïncidant

avec le centre du cercle, reste immobile dans le repère galiléen), ni de terme
proportionnel à l’accélération angulaire, car a> = C te. Il ne reste que deux
termes supplémentaires à ajouter à l’accélération mesurée dans IZ' :
a = a' + 2a> A v '+ uj A(a> A r') (2.37)
Les forces agissant sur la masse m dans le repère tournant sont donc ® :
• la force de pesanteur : mg = —mg k
• la force de Coriolis : —2 m A v
• la force “centrifuge” : —m w A ( u > A r )
L’équilibre est atteint quand la somme des travaux virtuels effectués par ces
forces lors d ’un déplacement virtuel compatible avec les contraintes devient
nulle.
Dans le repère tournant, la vitesse v est colinéaire au cercle, tout comme les
déplacements virtuels compatibles 5*r. La force de Coriolis étant perpendi
culaire à la vitesse instantanée v et donc aussi au déplacement 5*r ne peut
fournir de travail lors d’un déplacement virtuel, de sorte que
—2 m ( u> A V ) • <ï*r = 0
Il ne reste donc que deux forces contribuant aux travaux virtuels, la force de
pesanteur et la force centrifuge. Il convient de projeter ces forces sur les axes
du repère mobile. Pour ce qui concerne la force de pesanteur, elle est orientée
dans le sens opposé à k' = k. Trouvons les projections de la force centrifuge.
Sur le cercle on a
r = ü (i sin^ + k co s^), et = iî (i cos^ —k sin^)
Puisque o> = w k, on trouve
w A r = Rio k A (i sin ^ + k cos 9) = Rw sin 0 j

et
io A ( o> A r ) = Ru)^ sin ^ k Aj = —RuP' sin î
La force centrifuge est donc dirigée le long de l’axe Ox de RJ :

5. On supprime maintenant les “primes”.
Fc = mRuP' sin0 i (2.38)
Le principe de d ’Alembert s’écrit donc
(rnRu)^ sin 0 i —mg • (i cos ^ —k sin S6 = 0 (2.39)
Effectuant le produit scalaire et notant que 50 est arbitraire, on aboutit à

l’équation
sin0 (jîoj^ cosO + g^ = 0 (2.40)
Notons qu’il y a deux solutions d’équilibre instables, correspondant à l’annu

lation du facteur sin0, soit pour 0 = 0 ou ^ = tt. Il s’agit des deux positions
extrêmes de la masse m, soit tout en haut du cercle, soit tout en bas, autrement
dit, sur l’axe Oy qui coïncide avec l’axe de rotation du cercle.
Une troisième solution est donnée par l’équation
Rw^ œsO + g = 0
Pour une valeur donnée de la vitesse angulaire u, on trouve cos0 < 0, ce qui
correspond hO > tt/ 2, c’est-à-dire, à une position dans la partie inférieure du
cercle. Quand w oo, on voit que cos^ —> 0 et ^ 7t/ 2. Cette position est
stable.
Mais afin de décider du caractère stable ou instable d ’une position d ’équilibre,
il faut aller plus loin dans l’analyse du mouvement autour de cette position.
La vitesse et l’accélération instantanées dans TV sont données par
v = (i cos 0 —k sin 6)
a = —RO“
^ (i sin0 -t- k cosO) + R6 (i cosO —k sin^) (2.41)
Le mouvement dans R! étant possible uniquement le long du cercle, nous

devons projeter l’équation du mouvement dans ce repère, soit m a = Fc + m g ,
sur le vecteur tangent unitaire t = i cos ^ —k sin 6, ce qui conduit à l’équation
RO = 5 sin 0 + Ru)^ sin 0 cos 0 (2.42)
Si l’on multiplie les deux membres de l’équation (2.42) par 0,

0RO = gé sinO + Riv^ê sin^ cos0
on trouve une égalité entre deux dérivées temporelles
conduisant à l’existence d ’une constante du mouvement :
n ----R^^
—- — I- g cos 0 — sin■ 2ü r. X X
0 — K = Constante. (2.43)
Jt ^
La constante K doit être déterminée par les conditions initiales. A partir de

là, on peut obtenir l’expression de 0 :
R0 = éi\j2K + Rw“
^ sin^ 0 —2g cos0 (2.44)
On peut alors séparer les variables t et 0, et procéder à l’intégration formelle
Rd0
(2.45)
h ‘i ^J2K + RjuP' sin^ 0 —2g œ s0
Une telle intégrale n ’est pas facile à effectuer. En outre, même si l’on pouvait le
faire, le résultat ne donnerait qu’implicitement 0, car il faudrait encore inverser
la fonction obtenue, t{0), pour enfin accéder à l’équation horaire 0{t) qui nous
intéresse vraiment.
Cependant, pour de petits écarts par rapport à une position d ’équilibre 0q, on
peut étudier l’évolution subséquente du point matériel autour de cette position
en linéarisant l’équation de mouvement. Cela consiste à poser 0 = 0q + e en
supposant e “petit” et à effectuer les développements limités
0 = é , cos 0 ~ cos 0Q —£ sin 00 + C?(e^)

sin^ 0 ~ sin^ 00 + £ sin 2^0 + O(e^) (2.46)
en ne prenant en compte que les termes du premier ordre en e. L’équation

(2.42) prendra alors la forme
£ = C{0o) £
2.2. ÉQUATIONS DE LAGRANGE 67
la constante C(0q) résultant de l’application du développement de Taylor de

son membre à droite. Si cette constante est positive., ce qui est le cas pour
^0 = 0 et ^0 = TT, la solution pour s{t) se comporte comme une exponentielle
croissante avec t, ce qui veut dire que le point matériel a tendance à augmenter
son écart, et la position d ’équilibre est instable. Pour la troisième solution non
triviale telle que cosô = — compri se entre 7t/ 2 et tt, on trouve une
constante C négative. La solution e{t) est alors une fonction sinusoïdale de
t. La force résultante agissant sur le point matériel tend donc à faire revenir
celui-ci vers sa position d’équilibre qui est donc stable^.
2.2 Équations de Lagrange
Dans le tout dernier exemple, nous avons pu utiliser un seul paramètre, en

recurrence, l’angle 0, et sa variation SB, pour décrire les déplacements virtuels
compatibles avec la contrainte. Ceci illustre le fait que plus les contraintes sont
nombreuses, plus il devient difficile de continuer à décrire les positions et les
mouvements à l’aide de coordonnées cartésiennes. Par exemple, sur une sphère
de rayon R d ’équation
f{x, y, z) = + y^ + - R^ = 0,
il est préférable d ’introduire l’angle polaire 0 et l’angle azimutal <p via les
relations
æ = iîsin^cosy? , y = iîs in ^ s in y j, z = Rcos6 (2.47)
Les variations des coordonnées x, y, z compatibles avec la contrainte obligeant

le point matériel à rester constamment sur la sphère seront exprimées main
tenant en fonction des deux variations 56 et 5<p seulement :
Sx = R cos 0 cos ip 50 —RsxaB sin ip 5(p

5y = RcosBsiïupSB -h il sin 0 cos
5z = —RsiïiBSB
On vérifie aisément que 5*r est orthogonal au vecteur g r a d / = 2x i+2yj+2z k

normal à la sphère et est donc toujours tangent à la sphère.
6. D ans la réalité, le point m atériel n ’y revient vraim ent que parcequ’il existe toujours
des frottem ents.
Plus généralement, considérons N points matériels soumis à p contraintes indé

pendantes. Les mouvements du système respectant les contraintes, peuvent
être paramétrisés au moyen de {3N —p) paramètres indépendants, que Гоп
appelle “coordonnées généralisées” ou “coordonnées curvilignes” , et que l’on
note 9“ , avec o:, • • • = 1,2, • • •, 3N —p. Le rayon-vecteur en 3N dimensions
sera noté x^. Le déplacement virtuel des N points qui respecte les contraintes
peut être exprimé comme :
5V = V (2.48)
Où=l dq°‘
^ ^
Les coordonnées cartésiennes x* sont des fonctions de coordonnées généralisées

q°‘ et du temps t, qui peuvent être arbitraires, sous réserve qu’elles satisfassent
les conditions usuelles de différentiabilité. Leurs dérivées temporelles doivent
s’exprimer à l’aide des vitesses généralisées qa
dx^
(2.49)
dt a=l dq°‘^
^ ж
Cette expression montre que les vitesses x^ sont donc fonctions non seule
ment des vitesses généralisées qa mais aussi des coordonnées généralisées elles-
mêmes, x^ = x^ t)’ Avant d’aller plus loin, établissons deux identités
importantes :
dx^ _ дx^ d dx^ _ dx'’

(2.50)
dq^ dt d(f‘ dq°‘
^ Preuve :
Puisque x^ = x^ (ç®, t), j = 1,2, • • •, 3N; a = 1,2, • • •, 3AT —p, les dérivées
dx^ dx^
partielles et sont fonctions uniquement des 9“ et de t. La relation
(2.49) montre que les vitesses cartésiennes x^ sont des combinaisons linéaires
des vitesses généralisées 9“ (qui forment un ensemble de ZN —p variables
indépendantes). On en déduit immédiatement le résultat (2.50).
Pour prouver la deuxième identité comparons deux définitions équivalentes
de la dérivée temporelle d’une des dérivées partielles de x^. Prenons d’abord
la dérivée partielle de la vitesse cartésienne x^ par rapport à la coordonnée
généralisée 9“ , en n ’oubliant pas que les vitesses généralisées 9“ sont traitées
comme des variables indépendantes des coordonnées curvilignes 9^. Dérivant
(2.49) par rapport à 9^, on obtient
2.2. EQUATIONS DE LAGRANGE 69
dx^ ^ d'^x^
(2.51)
dq^dt
Effectuons ensuite la dérivée de dx^ /dq^ par rapport à t :
d dx^ _ ^ d^x^ _ d^x^ d^x^

A (2.52)
dti- dq^ “ finOifin0
dq°‘dq^ ^ dtdq^ “ Q^/?Q-,n' ^
dq^dq°‘ dq^dt
la dernière égalité étant obtenue par le fait que les dérivées secondes ne
dépendent pas de l’ordre de la dérivation. En comparant (2.51) et (2.52), on
arrive au résultat escompté (2.50).
Nous pouvons donc exprimer le principe de d ’Alembert à l’aide de déplacements
virtuels paramétrés uniquement par les variations infinitésimales ig “ des co
ordonnées généralisées :
/ . .N . JV 33iV
33JV N -P
-p „ i
Ç (Sæ* = Ê E ( f * - m*®*) ^ < ^ 9 “ = 0 (2.53)
î=i i=i a=l dq°
A ce stade, il est utile d ’introduire une notation spéciale pour les combinaisons
linéaires des composantes F* des forces :
3N
_ y' (2.54)
^
¿=1 dq°‘
que l’on appellera forces généralisées. On pourra alors écrire
3 N -P / 3N
E
a=l \ ¿=1
(2.55)
Les variations virtuelles Sq°‘ étant indépendantes, on en déduit les 3N — p

équations indépendantes :
3N
(2.56)
Î=1
La somme contenant les dérivées secondes x* peut être transformée de la

manière suivante :
y2^ ± (I ^y mгX ,jd dx^

I . y2 . rriiX (2.57)
1=1 ^ \i=i i=l d id ^
soit, en utilisant les deux identités (2.50)
'3N
^ ...dx^ d .id x ^ \ ^ .id ë
( 2 .68)
Or, on a
a lin n ,.,„ " ..d if

a ,. £ ? E ( ^ ‘)^ = £ " ^ * ‘$
^ 1=1 1=1 ^ ^ t=l Î=1 ^
Définissons maintenant l’énerjîe cinétique totale du système des N points par
3JV ,
T = Y .-^ mi (æ*)2 (2.59)
i=l ^
Les identités démontrées ci-dessus permettent alors de réexprimer les ZN —p
équations (2.56) de manière plus compacte comme :
d ÔT dT
(2.60)
dt dq°‘ dq°‘
Ce sont les équations de Lagrange. Ici, l’énergie cinétique T est fonction des
vitesses et des coordonnés généralisées : T = T (g“ , g®). Dans le cas où les
forces Fi dérivent d’un potentiel V({a;*}), c’est-à-dire, si
Fi = -
dx^
il en est de même pour les forces généralisées car (dérivations composées)
3N 3N
- — p. dx^ d v dx^
(2.61)
ce qui permet d’écrire
^ dV
(2.62)
dt dq°‘ ôç“
Puisque les coordonnées œ* ne dépendent que des coordonnées généralisées q°‘

et de i, le potentiel V ne dépend que de ces variables et non des vitesses ç“ .
Par conséquent dV/dq°‘ = 0, d ’où
2.3. INVARIANCE DES EQUATIONS DE LAGRANGE 71
d d{T - V) d{T - V)
= 0 (2.63)
dt dq°‘ dq°‘
La fonction
L (g ^,g ^;t) = T - V (2.64)
porte le nom de fonction de Lagrange du système mécanique, ou tout simple

ment le lagrangien.
Les équations de Lagrange restent valables aussi en l’absence de contraintes si
le nombre de paramètres ç® est égal au nombre de coordonnées cartésiennes x*
initiales. Dans ce cas, on parlera de coordonnées généralisées ou de coordonnées
curvilignes^ dont l’utilisation peut s’avérer plus pratique qu’une description à
l’aide de coordonnées cartésiennes. On aura toujours
d dL dL
= 0 (2.65)
dt dq°^ dq°‘
2.3 Invariance des équations de Lagrange
Avant d ’aller plus en avant dans l’analyse des équations de Lagrange, il est
utile de noter une propriété très importante de ces équations : elles gardent la
même forme quel que soit le système de coordonnées utilisé pour décrire un
système mécanique. Cela permet de choisir le système de coordonnées le plus
approprié, tenant compte d ’éventuelles symétries particulières du dispositif
mécanique considéré, et par là même, simplifier la recherche des solutions. Par
exemple, il est évident que pour un système possédant la symétrie sphérique
on préférera utiliser les coordonnées sphériques (r, 0, (^), plutôt que les coor
données cylindriques (p, (p, z). Dans le cas d ’un système mécanique compliqué,
on pourra ainsi choisir les paramètres de manière adaptée à la situation, pou
vant faire appel à d’autres systèmes de paramétrisation de l’espace à trois
dimensions.
Supposons donc qu’un ensemble des N coordonnées généralisées ç“ décrivant
com-plètement un système mécanique soit remplacé par un autre ensemble
de coordonnées, Q^, a , /?,... = 1 ,2 ,3, ...,iV. Dans ce cas, on pourra écrire
(sauf peut-être pour quelques points singuliers, ce qui peut arriver de temps
en temps avec des transformations impliquant des angles) :
{q°‘) , et inversement g“ = q°‘ (Q^)
Quant aux vitesses généralisées, elles sont fonctions non seulement des “ancien
nes” vitesses, mais aussi des coordonnées du système de départ. Nous avons
en effet
= Zj ^ inversement ?“ = ^
Sauf dans le cas d ’une transformation linéaire avec des coefficients constants,
les dérivées partielles dQ^/dq°‘ et dcf^jdQ^ ne sont pas des constantes, mais
des fonctions des anciennes et des nouvelles coordonnées, respectivement. Nous
écrirons donc, dans le cas général.
= et Q^ = Q ^ { e , q \ a, = l , 2,...iV (2.66)
Comme dans le cas du passage des coordonnées cartésiennes vers les coor
données curvilignes, les relations importantes
dq°‘ _ d q ° ‘ d dq°‘ _ Ôç“

(2.67)
dQP dQ^ dt dQP ~ dQP
restent en vigueur. Voici un exemple convaincant en deux dimensions.

Soient q°‘ les coordonnées cartésiennes (x, y) dans un plan euclidien et soient
les coordonnées polaires (r,<p). Les relations g“ = q°‘(Q^) peuvent être
écrites sous leur forme explicite :
X = r cos ip , y = r sin tp
La matrice jacobienne 2 x 2 des dérivées partielles est facile à calculer :

/ dx dx\
fd q °‘ \ _ dr dp _ /cosy? —rsin y )'\
KdQp) ~ \ sin y? r cos y? /
\d r dp )
Les vitesses généralisées ç“ sont (æ, ÿ), et les sont {r,9). En dérivant
directement les expressions x{r, p) et y (r, y?) on obtient
2.3. INVARIANCE DES EQUATIONS DE LAGRANGE 73
X = r COSif — npsijup, ÿ = r 8iinp + r(pc08(p.
En dérivant ces vitesses par rapport aux vitesses {r,0), on trouve sans peine
dx dx dÿ dÿ
— = cos<p, —r = —rsin iz j, — = sin(p, —r = r c o s w
dr de dr de
c’est-à-dire, les mêmes coefficients que dans la matrice de passage. De même,
en dérivant dx/dr = co8<p par rapport au temps on obtient —(p siny?; mais
en prenant la dérivée de la vitesse æ = r cos tp — r<p 8m(p par rapport à la
coordonnée r on tombe sur —(p sin (p, conformément à la deuxième formule
dans (2.67).
Revenons au cas général pour lequel nous n’avons pas besoin d ’admettre les
coordonnées cartésiennes comme point de départ. Considérons le passage d ’un
système de coordonnées curvilignes q°‘ à un autre, . Supposons que les
équations de Lagrange soient vérifiées relativement aux coordonnées ç“ :
d dL dL ^ „ .r
dtdq^^ aç“ “ ®’
Substituons maintenant les expressions des ç“ et des g® en tant que fonctions

des nouvelles coordonnées et vitesses généralisées, et :
g“ = g“ (Q^), g“ = g“ ( g ^ Q ^ ) , a,P ,.. = 1,2,...,N
Le lagrangien devient alors une fonction des et des :
L = L (g“ , g“ ) = L {q% Q^\ g« (Q^, Q^))
Notons une fois de plus que les coordonnées g“ dépendent uniquement des
nouvelles coordonnées tandis que les vitesses généralisées q°‘ dépendent
à la fois des nouvelles vitesses généralisées et des coordonnées Q^. En
appliquant la dérivation composée, on trouve
dL EN u U U<^‘
dL dQ^ _ r—N \ dL
U1 dQ^
( 2 .68)
fine FinO
W 9q°‘ ~ ^ f\r
dQ^ dq^
où nous avons utilisé la première des deux “formules magiques” , stipulant que
dQ^ dQ^
dq°‘ dq°‘
En dérivant les fonctions par rapport aux coordonnées on doit tenir compte
de la double dépendance, impliquant les nouvelles coordonnées et vitesses :
dL _ A dL dQ^ ^ dL dQ^
(2.69)
dq^ dQ^ dq°‘ dQP dq°‘
Pour former les équations de Lagrange il faut dériver (2.68) par rapport au
temps :
di dL d I N dL dQ^ N d dL r A dL d dQ^
dt ¿ Î dQ0 dq<^ J =Ê
^ \ d t dQP) dq<â 2^ dQ^ dt dq°‘
Ecrivons ensuite les équations de Lagrange dans les anciennes coordonnées ç“

en y insérant les expressions obtenues ci-dessus :
N d dL N dL d
dq°‘ dQ^ dt dq^
^ dL dQ^ ^ dL dQ^ _
(2.70)
dQ0 dq°‘ dQP dq^ ~
Dans la formule (2.70), le deuxième et le quatrième termes s’annulent mutuel

lement en vertu de la seconde “formule magique”
_ dQ^
dt dq^ dq°‘
Rassemblant les deux termes restants, le premier et le troisième, et en mettant

devant le facteur commun dQ^/dq°‘, on aboutit à :
N d dL dL
E
h
(— ]
W ) dt dQP dQ^
= 0 (2.71)
La formule (2.71) peut être interprétée comme l’action d’une matrice (la
matrice jacobienne dQ^fdq^^) sur un vecteur d ’indice a:. On sait que si le
déterminant de la matrice est différent de 0, c’est le vecteur tout entier qui
doit être identiquement nul. C’est le cas ici, ce qui implique la validité de N
équations de Lagrange ayant exactement la même forme que les précédentes,
mais écrites avec les nouvelles coordonnées et vitesses généralisées, Q°‘ et (j“ :
2.4. CONSTANTES DU MOUVEMENT 75
d dL dL ^ , O
dt dQ°‘ dQ°‘ ’ ’ ’
On peut difficilement sous-estimer ce résultat, pourtant assez simple. L’inva

riance des équations de Lagrange permet une simplification radicale de la
recherche des solutions de nombreux problèmes en mécanique. Ce qui de
vient très important, c’est de trouver la paramétrisation la mieux adaptée
à la symétrie du probème considéré. Une fois la paramétrisation optimale
trouvée, les équations de Lagrange permettent la séparation des variables et
l’établissement d ’intégrales premières, permettant ainsi de baisser l’ordre d ’une
partie au moins des équations différentielles à résoudre.
2.4 Constantes du mouvement

Considérons à présent quelques cas particuliers où le lagrangien dépend des
coordonnées et vitesses généralisées ainsi que du temps d’une manière qui
permet de simplifier considérablement la recherche des solutions. Il s’agit
là de ce qu’on appelle la recherche dHntégrales premières. On appelle ainsi
des grandeurs qui restent constantes au cours du mouvement. S’exprimant
généralement comme des combinaisons particulières des coordonnées et des
vitesses, leurs constances fournissent autant de relations entre ces variables, et
par là même, permettent de réduire le nombre d ’équations différentielles du se
cond ordre en les remplaçant par des équations différentielles de premier ordre,
plus faciles à intégrer. Souvent, l’existence de telles quantités conservées est
liée à des symétries particulières du lagrangien considéré. En voici les exemples
les plus connus.
2.4.1 Coordonnées cycliques
On désigne par coordonnée cyclique une coordonnée généralisée qui n’apparaît

pas explicitement dans l’expression du lagrangien. Soit une telle coordonnée,
correspondant à une valeur c bien précise de l’indice. Dans ce cas, on a
dL ^ . d dL dL ^ d dL
Q q c ~ 0 , mais ~ ^ dt 0
ce qui conduit à la constante de mouvement
dL
7- - = Constante
dqP
4» Exemple : mouvement d ’une particule massive de masse m sur une sphère

de rayon R, dans le champ de gravitation terrestre.
Les points de la sphère accessibles à la particule glissant dessus seront pa
ramétrés par les deux angles, polaire 6 et azimutal <p, définis par rapport à
un repère cartésien dont l’origine coïncide avec le centre O de la sphère. Les
coordonnées cartésiennes s’expriment donc comme :
œ = iî sin^ cos (p , y =: R sin6 sm(p , z = R cos 0

et leurs dérivées par rapport au temps t sont
X = RÔcos6cos(p — R(p sin^sin«^

ÿ = Rèœ s6siïi(p + R(p sinOcostp , z = —R 9 sin0
L’énergie cinétique T = m(æ^ + + ¿^)/2, exprimée à l’aide des variables

angulaires et leur dérivées, prend la forme
T = | (i?2ö2 + i?2 sin2ö 02j (2.72)
tandis que l’énergie potentielle est F = m g z = m gR cos 9. La fonction de

Lagrange pour le problème considéré est donc
mR?
L= (é^ -h sin^ 9^ —m gR cos 9 (2.73)
On constate que ce lagrangien ne dépend pas de la coordonnée y?, qui est donc
ici une coordonnée cyclique. D’après l’équation de Lagrange relative à 9?, il en
résulte que
^ = J = mR?<p sin^ 9 (2.74)

0(p
est constante au cours du temps : c’est une intégrale première. Comme on le

vérifie aisément, il s’agit en fait de la composante suivant l’axe Oz du moment
cinétique
J —r /\ m v = r A P
On notera que l’apparition de cette intégrale première est directement liée à

l’existence dans ce problème d’une symétrie cylindrique autour de l’axe Oz,
c’est-àrdire d ’une invariance par rotation autour de cet axe.
2.4.2 L’intégrale de l’énergie
C’est une autre constante de mouvement, apparaissant chaque fois que le la
grangien ne dépend pas explicitement du temps i, qui peut alors être considéré
lui aussi comme une variable cyclique.
Dans le cas général, la dérivée totale du lagrangien par rapport au temps s’écrit
(2 .5 )
Considérons la quantité E définie par

M
dL
E = y q < ^^-L (2.76)
On a
dt I dt 5g“ ^ dt 5g“ j dt ^ ’
Utilisant (2.75) et les équations de Lagrange (2.65), on trouve
dt ^ ^ \ dt ôg“ 5g“ / ,5g“ dt 5g“ dt . d t'
En explicitant donc la différence des termes dans (2.77), on trouve

M d dL dL}
(2.78)
dt ^ l dt dq<^ dq°‘ ] dt dt
Suite à (2.78) on voit bien que, si le lagrangien ne dépend pas explicite

ment du temps, (dL/dt) = 0, la grandeur E, appelée l’énergie totale du
système, est conservée. C’est le cas d ’un système isolé dont le lagrangien ne
doit pas dépendre explicitement du temps puisque, par définition, aucune ac
tion extérieure ne s’exerçant jamais sur lui, les conditions extérieures restent
inchangées au cours du temps : on a ici une invariance par translation tempo
relle du fait que le temps est une variable cyclique.
On notera enfin que si l’énergie cinétique T est une fonction quadratique des
vitesses généralisées, on prouve aisément que L étant égal à T —F , on aura
E = T + V.
Pour clore ce chapitre, montrons comment l’existence d’un nombre suffisant

d ’intégrales premières permet de baisser l’ordre des équations différentielles
à résoudre, permettant ainsi une intégration directe menant aux solutions
implicites des équations de mouvement.
^ Revenons donc au cas d ’une particule de masse m glissant sans frottement
sur une sphère de rayon R, dans un champ gravitationnel constant g = —^k .
Le mouvement est décrit par deux paramètres seulement, les angles d et (p,
auquels correspondent deux équations de Lagrange, lesquelles, rappelons-le,
représentent deux équations différentielles du second ordre.
Puisque les forces sont conservatives (pas de frottement), nous avons à notre
disposition deux intégrales premières : tout d ’abord la composante z du mo
ment cinétique (eq.(2.74))
J = mR^(p sin^ 6 = Constante
et celle de l’énergie totale E :
E =6 ^ + —L = (è^ + ip^ sin^ d) H- mgR œ sô = T + V (2.79)

39 dp 2 V /
Cependant, la première équation de Lagrange relative à la variable 9
^ ~ ^ ('mR^ é) —mR^p^ sin 9 cos 9 -|- mgR sin 0 = 0

dt 39 d9 dt \ / ^ ^
conduit, après simplification par mR?, à une équation différentielle de second

ordre pour la fonction 9{t) :
9= sin0 -b p^ sin0 cos^. (2.80)

R
On peut remplacer dans cette équation la vitesse p en utilisant l’intégrale
première J (eq. (2.74)
J
^ mR? sin^ 9
et obtenir ainsi une équation ne comprenant que la variable 9 et sa dérivée
seconde !
û 9 ’ û , (2.81)
Bien que $ soit une fonction de 0 uniquement (c’est ce qu’on appelle la

séparation des variables), nous ne savons pas intégrer directement une telle
équation sauf dans le cas très particulier du mouvement le long d ’un méridien,
quand (p = 0 et donc J = 0, ce qui ramène l’équation (2.81) à la forme déjà
connue de l’équation du pendule physique traité dans le Chapitre I :
0 = sin0
L’existence de l’intégrale première de l’énergie (2.79) permet de baisser l’ordre

de l’équation différentielle régissant le mouvement. En effet, grâce au fait que
l’expression
mB? ‘O m R “
^ .9.0« „
E- —^ 0^ H— — pr sm^ 9 + mgR cos 9
est une constante, à déterminer par exemple au moyen de conditions initiales,

on peut exprimer :
2E
¿2 = 2— cos 9 ----- — — s—. (2.82)
mR? R m^R^ sin2 9
pour en extraire directement 9 :
(2.83)
dt V R m^R^ sin^^
En séparant les variables, puis en intégrant, on peut alors obtenir une relation
implicite
d9
/ * = / (2.84)
^ ^ - 2 ^ coc9 ^
mR? R m^R^ sin^ 9
Même si cette intégrale pouvait être exprimée en termes de quelques fonctions

élémentaires (ce qui n’est pas le cas, hélas!), on obtiendrait une solution im
plicite, c’est-à-dire, le temps t en fonction de l’angle 9 et non pas la fonction
recherchée 9 = 9(t).
Dans ce qui suit, nous montrerons la solution du problème des deux corps en
théorie newtonienne en utilisant la méthode de Lagrange - une voie royale, en
quelque sorte !
2.5 Problèmes
P ro b lèm e 2.1. - P rin c ip e de d ’A le m b ert.
Deux petites masses assimilables à des points matériels M\ et M2 de masses

m\ et m 2 respectivement sont reliées par un fil souple mais inextensible de
longueur L. L’ensemble est disposé sur une boule solide de centre O et de
rayon iî > L / tt, de telle sorte que le fil de liaison soit tendu en épousant sur
toute sa longueur la forme d ’un arc de grand cercle de la boule, dans un plan
vertical V. Les deux objets étant en équilibre, on note d\ et 02 les angles que
font les vecteurs O M i et O M 2 respectivement avec l’horizontale. Toute cause
de frottement est négligée.
a) A partir du principe des travaux virtuels, trouver la condition d ’équilibre
du système des deux masses sur la boule et l’exprimer à l’aide des angles 9\
et 0 2 -
b) Trouver ensuite 0i en fonction des données m i, m 2, R et L. Etudier les
cas L = 2itR/3, mi = m2, mi = 2m2, mi = 4m2. Que devient la condition
d ’équilibre si l’objet M 2 n’est plus en contact avec la boule (une partie du fil
soutenant M2 étant alors selon la verticale) ?
c) Interpréter le résultat obtenu au point a) en termes de forces. L’équilibre
est-il stable ou instable ?
P ro b lèm e 2 .2. - Le p ro b lèm e d e K e p ler

On étudie par la méthode de Lagrange le mouvement d ’un corps S de masse m
soumis au champ de pesanteur de la Terre. On fera les hypothèses suivantes.
4 Le système Terre-corps peut être considéré comme isolé. Dans cette ap
proximation, le référentiel TZ du centre de masse de ce système est galiléen.
Jlt Le centre de gravité O de la Terre peut être confondu avec le centre de
masse C du système Terre-corps.
^ Le corps S peut être assimilé à un objet ponctuel.
Dans la suite, on étudie le mouvement de S dans le référentiel R. dont l’origine
est en O.
a) Montrer que la trajectoire de S reste dans un plan fixe V contenant O.
b) Compte-tenu de ce résultat, on prendra V pour plan xOy et l’on y définira
la position de S au moyen de ses coordonnées polaires r et (p.
dv diû
Définir pour S la fonction de Lagrange L(r, r,(p,(p ) on r — — , (p = ~ r .
dt dt
2.5. PROBLEMES 81
c) Montrer que <pest une variable cyclique et en déduire que la quantité r“

^(p
reste constante au cours du mouvement. Que représente cette quantité? On
notera J = r‘^(f .
d ) Définir l’énergie mécanique Æ? de 5' et montrer qu’elle reste constante au
cours du mouvement de S.
1 du
e) Exprimer E en fonction de tt = - et u' = — et dériver l’équation
r dip
différentielle de second ordre vérifiée par u, en utilisant le fait que l’énergie
totale E est constante et en dérivant son expression par rapport à la variable
p.
f) En déduire que r(}p) est de la forme
ro
r{(f>) = —
1 + e cos P
vq et e étant deux constantes à déterminer, en fonction de J, E, M et G.
g) Discuter la nature de la trajectoire de S suivant les valeurs de e.
P ro b lèm e 2.3 - M ou v em en ts c o n tra in ts

Dans cet exercice, on étudie le mouvement contraint d ’une bille, assimilée à un
point matériel S de masse m, sur une surface de révolution S, d ’axe (vertical)
Oz. Le mouvement s’effectue sans frottement. La position de S sera repérée
au moyen de ses coordonnées cylindriques r ,p ,z .
a) Définir le lagrangien de S et l’exprimer en fonction de r, r , y> et </?, en
tenant compte de la contrainte z = /( r ) .
b) Montrer que J — r^p est une constante du mouvement.
c) Définir l’énergie E de «S' et montrer qu’il s’agit d ’une constante du mouve
ment.
d) Exprimer r puis en fonction de r, E, C et m. Montrer alors que l’on peut

dr
obtenir sous forme implicite l’équation horaire du mouvement en exprimant t
à l’aide d ’une primitive d’une fonction de r.
e) La surface S est un paraboloïde d’équation z = ar^, a étant une constante
positive. La bille est lancée depuis le point S q { x = ro > 0, 0, zq = ar^) avec
la vitesse vq = vq ey (vo > 0).
f) Montrer que, d ’une façon générale, S évolue entre deux plans Pi et Pq
parallèles à xOp, dont on précisera les positions.
P ro b lèm e 2.4 - M achine d ’A tw ood

On considère le dispositif représenté à la figure 1. Les fils reliant mi au centre
de la deuxième poulie d ’une part et les deux masses m3 et 1714 d ’autre part
sont inextensibles, de longueurs £i et respectivement, et leurs masses sont
négligeables. Les seuls mouvements de cet ensemble, soumis à la seule action
de la pesanteur, ont lieu dans un plan vertical donné et se font sans frottement ;
les fils glissent sur les poulies assimilées à des disques de rayon a et d’épaisseur
suffisante pour supporter les fils.
F ig u re 1
a) Répertorier les contraintes de ce système et en déduire le nombre de ses

degrés de liberté.
b) Définir pour ce système un lagrangien en choisissant les positions des masses
mi et mz comme coordonnées généralisées.
c) Trouver les équations différentielles régissant l’évolution de ces masses et
en déduire leurs accélérations.
P ro b lèm e 2.5 - P e n d u le sim ple relié à u n re sso rt

Une tige rigide de longueur l et de masse négligeable est mobile autour de l’une
de ses extrémités fixée en un point O. A l’autre extrémité M est attachée une
masse m. Cette même masse est reliée par l’intermédiaire d’un ressort de masse
négligeable et de raideur fe à un point fixe P situé sur la même verticale que
celle passant par O, à la distance 21 en dessous de ce point (figure 2). La
longueur au repos d du ressort est telle que H < d < i. Les frottements sont
négligés. On note 6 l’angle que fait O M avec la verticale descendante O P.
2.5. PROBLEMES 83
1°) Définir pour ce système un lagrangien et en déduire l’équation d’évolution

de 9.
2°) Considérer le cas des petits angles.
Figure 2
Problème 2.6 - Le Yoyo

Un yoyo est constitué d’un grand disque de rayon R et d’un petit cylindre
intérieur de rayon r < iï (le moyeu), autour duquel s’enroule un fil d’épaisseur
et de masse négligeables. L’autre extrémité du fil est attachée en un point fixe
O. On admettra que : d’une part, le rayon du moyeu est suffisamment petit
pour que le moment d’inertie du yoyo soit assimilable à celui du disque de
rayon R ; d ’autre part, le fil ainsi que la trajectoire du yoyo restent toujours
verticaux.
Figure 3
A partir du formalisme lagrangien, déterminer la vitesse de descente du yoyo

lorsque celui-ci est abandonné sans vitesse intiale.
P ro b lèm e 2.7 - D eux oscillateu rs couplés

Une masse M est reliée à deux autres masses m par l’intermédiaire de deux
ressorts identiques, sans masse, de raideur k et de longueur au repos comme
indiqué à la figure 3. Les trois masses sont alignées suivant un axe x 'x et les
seuls mouvements envisagés de ces masses s’effectuent sans frottement selon
cet axe. La pesanteur terrestre est ici négligée. Ce système peut constituer un
modèle très simplifié pour décrire les vibrations d ’une molécule triatomique.
On note xi et X3 les abcisses des masses m et X2 celle de la masse M.
m k M
•— 0M5SM®- mmmmi 0 -
F ig u re 4
1°) Exprimer l’énergie potentielle de ce système en fonction des coordonnées

généralisées qi = xi, q2 = X2 —ê et qs = xz —2 £.
a) Déduire des équations de Lagrange l’ensemble des équations d’évolution du
système.
b) On pose — k/m , = k/M . Ecrire les équations sous forme matricielle
Q = AQ où Q= et A une matrice 3x3.
c) Chercher les valeurs propres Ai, A2 et A3 de la matrice A et les vecteurs

propres correspondants ’i'i, '^ 2 et ^ 3.
d) Mettre alors Q sous la forme Q = + tt2’i '2 + ^^3^3 où tti, «2 et «3 sont
des combinaisons de qi, q2 et qs, et déduire les équations différentielles devant
être satisfaites par « 1, U2 et U3.
e) Résoudre ces nouvelles équations, et décrire les modes propres de vibration
obtenus.
Chapitre 3
Calcul variationnel
3.1 Introduction
Dans de nombreux problèmes physiques et mathématiques, on est confronté
à un principe de minimum ou d'extrémum (maximum, point d ’inflexion) ap
pliqué non pas à une fonction, mais à une fonctionnelle. On sait que la re
cherche d’extrémum d ’une fonction d ’une variable consiste à trouver les valeurs
de celle-ci qui annulent la dérivée première de la fonction. La généralisation
implique la notion de dérivée fonctionnelle, que l’on cherchera à annuler. En
guise d ’introduction, mêlant rappel et divertissement, voici quelques exemples
bien connus de recherche d ’extrémum.
3.1.1 Propagation de la lumière
Deux milieux transparents (1) et (2) sont séparés par le plan xOy (figure 4.1).
Dans chacun de ces deux milieux homogènes, la propagation de la lumière
s’eiïectue de façon rectiligne, avec les vitesses de propagation v\ et respec
tivement. Montrons que la loi de la réfraction de la lumière au passage du
milieu (1) vers le milieu (2), peut être déduite en recherchant le chemin le plus
rapide emprunté par la lumière pour passer d’un point A du milieu (1) à un
point B du milieu (2).
L’axe z'Oz du trièdre de référence peut être pris comme étant la normale au
plan de séparation passant par A et orientée depuis le milieu (1) vers le milieu
(2), et le plan xOz comme étant le plan AO B, en choisissant > 0. Un rayon
lumineux arrivant depuis le milieu (1) et passant par A rencontre le plan xOy
en un point C{xc,yc)i puis traverse le milieu (2) en passant par B. Le temps
de parcours entre A et B est
86 CHAPITRE 3. CALCUL VARIATIONNEL
+ * AC ^ C B
tAB = tAC + tCB = ------ 1------ (3.1)
Vi V2
avec
AC — ^XQ + yQ + , CB — (xb —xc)^ + 2/c + (^-2)
Les coordonnées de ^4 et 5 étant données, le minimum de îab est obtenu en

annulant ses dérivées premières par rapport aux coordonnées x c et yc, qui
sont les seuls paramètres libres du problème. On obtient ainsi
dtAB ______ x ç x c - Xb
+ = 0
V i s i t e + Vc + A V2yJ{XB - xc)^ + y l + z%
àtAB _______ yc________ I______________ yc___________
= 0 (3.3)
Vl^X% + yl + z\ V2^{XB-Xcf-\-yl + Z%
F ig u r e 3.1 - Réfraction de la lumière entre deux milieux différents.
De la seconde équation on déduit yc = 0, et que par conséquent le rayon

réfracté est nécessairement dans le plan xOz. La première équation donne
ensuite (en prenant yc = 0)
xc Xb —Xc
(3.4)
n^Jx% -\-z\ V2y/{ xb - x d Ÿ + z%
3.1. INTRODUCTION 87
ce qui implique que x c soit compris entre 0 et x b . Or, d ’après la figure 4.2,
on a
Xc Xc - XB
= sin 0i , = sin 02
\I^C + Â
On sait que les vitesses de propagation vi et V2 sont liées aux indices de

réfraction respectifs ni et n2 des deux milieux (1) et (2) par les relations
V\ = c / n \ et V2 = c /n 2, c étant la vitesse de la lumière dans le vide. L’équation
(3.4) conduit alors au résultat
ni sin 01 = n2 sin 02 (3.5)
qui est la loi bien connue, due à Snell, de la réfraction de la lumière.
3.1.2 Application pratique : l’éclairage d ’une table
Considérons une table ronde de rayon R, et une lampe accrochée au-dessus

du centre de la table, à une hauteur h (figure 4.3). Comment placer la lampe
pour m a x im is e r l’intensité de l’éclairage du bord de la table ?
Il apparaît que, d ’une part, l’intensité de l’éclairage en un point est inversement

proportionnelle au carré de la distance à la source, c’est-à-dire ici à 1/ (h'^+R?) ;
d’autre part, l’éclairement de la surface est proportionnel au cosinus de l’angle
d’incidence 0 de la lumière, égal ici kcos0 = h/Vh^ + R^. Les effets conjugués
de ces deux phénomènes donnent une intensité d ’éclairage du bord de la table

proportionnelle à
h
/(/.) =
(h2 + i?2)3/2
Cette fonction donne a priori la seule dépendance de l’éclairement vis-à-vis de

h. Elle présente un maximum pour
df R? - 2h?
= 0
dh (/i2 -f- iî2)5/2
L’éclairement du bord de la table est donc maximum pour ^
h= (3.6)
3.1.3 Principe de d ’Alembert
Une chaînette est constituée de N barres rigides homogènes (maillons), toutes

identiques, de longueur 2o, de masse m, et reliées entre elles par des liaisons
parfaites. Un bout de la chaînette (première extrémité de la première barre)
est attachée en un point fixe A par une liaison parfaite, tandis que l’autre bout
B (deuxième extrémité de la dernière barre) est soumis à une force horizontale
donnée F = F 6x. La chaînette est placée dans le champ de pesanteur terrestre
g = g ez (figure 4.4). A l’quilibre, elle se trouve en toute évidence dans le plan
xOz.
Selon le principe de d ’Alembert, l’équilibre mécanique d’un système est défini
comme la configuration pour laquelle la somme des travaux virtuels de toutes
les forces agissant sur les différentes parties du système est nulle, le travail
virtuel d ’une force étant celui résultant d ’un déplacement virtuel de son point
d ’application, compte-tenu d ’éventuelles contraintes de liaison. Dans le cas
présent, en plus de la force F appliquée en B, il y a iV forces de pesanteur,
s’appliquant chacune au centre de masse Ck d ’un maillon.
Il est judicieux de paramétriser la forme de la chaînette au moyen des angles
OL\,a2 , - • • ,Oik,’ • • ,OiN que font les maillons avec la verticale descendante (voir
figure 4.4). Ainsi, les coordonnées Xk, Zk du centre Ck du kème maillon sont
1. A vérifier par soi même !

fc-i k -l
Xk = a sin o-fc + ^ 2a sin a j , Zk = aco sak + ' ^ 2a cos a j (3.7)
j=i 3=1
tandis que celles du point B sont
N N
XB = ^ 2 a s in a j , ZB = ' ^ 2 a cos a i (3.8)
j=i j=i
F ig u r e 3.2 —La chaînette pesante soumisa à une force horizontale appliquée à son
extrémité libre
Les déplacements virtuels de la chaînette s’obtiennent en faisant varier les

angles ak indépendamment les uns des autres. Le travail virtuel qui résulte de
leurs variations infinitésimales est donné par
N N
5W = ^ mg ez • SOCk + F • <ÎOB = mg '^ÔZk + FS xb
k -l 1
Posons Suk = —asinakSak. On a
N N k -l N N -1 N N
= [<^ttfc+2^ ÎUj] = Z) S 2= S <^“j[2 (iV -j) + i]
fc=l fc=l j= l 3=1 3=1 k=3+l 3=1
La condition d’équilibre SW = 0 prend alors la forme

N
a ^ {2Fcosafc —mg [2{N —A:) + 1] sin (Xk) Sak = 0 (3.9)
fc=i
Les variations 5ak étant indépendantes, cette condition ne peut être réalisée
que si
2F
tanccfe = pour A: = 1,2, • • •, ^ (3.10)
m g { 2 N - 2 k + l) ’
Ces équations déterminent les orientations des divers maillons à l’équilibre. Il

est intéressant d ’examiner le cas limite d’une chaînette constituée d ’un très
grand nombre de petits maillons (limite continue), la masse totale M = N m
et la longueur totale L = 2aN de la chaînette étant données. Pour iV 1,
soit a «C L, on peut considérer la chaînette comme une courbe continue définie
par l’équation z = f(x ) et identifier la dérivée 2' = f'{x) à tan^S^ = tan(û;fe —
7t/2) = —1 / tano!fc, tanafe étant donné par (3.10) (figure 4.5) :
m = ^ - 1)
Mais la distance, mesurée le long de la chaînette, entre le point d’ancrage O et

le point Ck est ¿k = 2a(A:—l) + a = 2a{k—lf2). On a donc {k —l/2 )/N = ik/L.
Dans la limite continue, cette distance s’exprime comme l’intégrale
£ k = l Vdx^ + dz^ = / V l + 2'^ dx

Jo Jo
On aboutit ainsi à l’équation
D’où, en effectuant une dérivation :

71>r
-V T + 2'2 (3.11)
Mg,
En posant 2' = sinh^, (3.11) donne ij)' = Mg/{FL), soit ip — —æo)>
étant une constante. On en déduit 2' = sin h [^ ^ (æ —æo)], puis, par intégration,
rL
FL , .M g ,
3.2. EXEMPLES DE FONCTIONNELLES 91
zq étant une constante. La chaînette prend donc la forme d ’un cosinus hyper
bolique. La constante zq doit être ajustée à la condition z = 0 pour æ = 0, ce
qui donne
FL , ,Mg ,
= -W g
La constante x q , quant à elle, peut être tout d ’abord ajustée en imposant la

condition Z = z b pour x — x b - Cependant, les coordonnées x b et z b sont liées
par le fait que la longueur de la chaînette est donnée. Nous laissons au lecteur
le soin de démontrer que les constantes xq, xb et zb sont liées par les relations
Xb L .L + z b , 2 . , . 7®B\ L B Mg
7=
3.2 Exemples de fonctionnelles

Nous verrons dans la suite comment les méthodes précédentes se généralisent
à des problèmes impliquant des fonctionnelles. Cette généralisation conduit
à des équations différentielles que doivent vérifier les fonctions qui rendent
extrêmales ces fonctionnelles. Tout d ’abord, voici des exemples de fonction
nelles.
3.2.1 Premier exem ple
Posons-nous le problème de trouver, parmi toutes les courbes joignant deux

points donnés A{xA,yA) et B{xB,yB) d’un plan, celle dont la longueur est la
plus petite.
Soit y = f{x) l’équation d ’une courbe C joignant A et B, et y' = f { x ) sa
dérivée. L’élément de longueur sur cette courbe s’écrit
da = \ J (dæ)2 -|- { d y Y = d x y j l + y'"^
La longueur totale de cette courbe entre A et B, qui est la fonctionnelle à

m in im is e r dans ce problème, s’écrit
L. = r ^ dx (3.12)
JXA
On notera que celle-ci ne dépend pas directement de / mais plutôt de sa
dérivée f .
F igure 3.3 - Une courbe donnée par la fonction y = y{x), sa tangente et sa dériée.
3.2.2 Deuxièm e exem ple : la brachistochrone
Dans un plan vertical zOx, l’axe Ox étant selon l’horizontale et l’axe Oz

selon la verticale descendante, considérons une courbe C d ’équation z — f{x),
joignant l’origine O à un point fixe A{ xa > 0, za > 0). Imaginons que cette
courbe représente une piste qu’une bille de masse m descend sans frottement
sous l’effet de son poids. Cherchons quelle doit être la forme de cette courbe
pour que le temps de parcours de la bille de O en A soit le plus petit (problème
de la “brachistochrone” , résolu en 1696 par J. Bernoulli). Ici, la fonctionnelle
à minimiser est l’intégrale
^ ds
A t= f d t= f —
Jo JO V
où s est l’abcisse curviligne de la bille et v = ds/dt sa vitesse instantannée

linéaire, le long de sa trajectoire, soit encore, puisque ds — dx \ / l + z'^ avec
z' = f ( x ) ,
(3.13)
Jo V
La bille effectuant son mouvement sans frottement son énergie mécanique
^ 2 —mgz
ETH = —V
2. La réaction de la piste est donc perpendiculaire à celle-ci.

3.3. CLASSES DES FONCTIONNELLES, THEOREME PRINCIPAL 93
est conservée. En supposant que la bille parte du point O sans vitesse initiale,
soit V = 0 pour ^ = 0, cette loi de conservation fournit la relation
V = y/2gz
et la fonctionnelle (3.13) à minimiser prend la forme
^ vT+?2
At = / dx (3.14)
3.3 Classes des fonctionnelles, théorème principal
Les fonctionnelles apparaissant dans les exemples précédents sont de nature

locale, c’est-à-dire que, si l’on divise en deux parties ou plus l’intervalle [x a , x b ]
dans lequel varie la variable d ’intégration, la fonctionnelle est simplement la
somme des fonctionnelles définies sur chacune des parties. Cependant, selon le
probème considéré, la fonctionnelle rencontrée n ’a pas toujours cette propriété.
Par exemple, l’abcisse du centre de gravité d ’une chaînette pesante est donnée
par l’expression
ro ____
/ dx X y l + z'
Jg___________
f dx V r+ " ÿ 2
Jg
qui est une fonctionnelle “non locale”.

Dans la suite, nous considérerons uniquement des fonctionnelle de type local
de la forme
pb
J[y]= F { x ,y ,y ')d x (3.15)
JaU,
*/
y étant une fonction de x telle que y{a) = A , y{h) = B, et y' sa dérivée

première.
Certes, cette catégorie de fonctionnelles peut sembler restreinte. Cependant,
elle est suffisamment riche pour recouvrir la plupart des cas intéressants. No
tons que pour ces fonctionnelles locales, Euler utilisait une méthode d’approxi
mation ( “éléments finis”). En effet, pour celles-ci, on peut diviser l’intervalle
[x a , x b ] en iV -H1 morceaux [œfc, æ^+i], avec æo = a et æjv+i = à» et considérer
seulement les points (æo, A), (xi, y{x\)), • • •, (x;v+i, B) de la courbe y = y{x).
Pour N ^ 1, cette courbe peut être approchée par une fonction en escalier
f(x) telle que f{x) = y{xk+i) pour Xk < x < Xk+i (3.4), et la fonctionnelle
(3.15) peut elle-même être approchée par la somme discrète
N +l
Vk Vk-1
J { y u y 2 , '“ ,yN )= X] ^(^k>yk,
Xk 1
) (Xk - X k - l ) (3.16)
fc=l
F ig u r e 3.4 - Une courbe approchée par fonction escalier
Le problème, qui de cette manière devient fini, revient alors à rechercher

l’extrémum de la fonction J{yi,y2, - ‘ • ^yu) des N variables y u y 2 ," • ,yN
(yo = .A et yjv+i = B étant fixées). La solution du problème continu s’ob
tient a priori en prenant la limite N oo.
Dans le cas d ’une fonction d ’une variable, la recherche d ’un extrémum se fait
en annulant la dérivée première, c’est-à-dire, en résolvant l’équation
ax h-*o h
Pour une fonction de plusieurs variables, l’analogue de la dérivée peut être une
dérivée selon une direction donnée :
F* di F(x) = V • g ra d F (x ) = lim (3.17)

h—yO il
où V est un vecteur donné et h un réel que l’on fait tendre vers zéro, ou bien
Hm Î Ï Î - + '*> “
||h||-rt
3.3. CLASSES DES FONCTIONNELLES, THÉORÈME PRINCIPAL 95
où cette fois, h est un vecteur “infinitésimal” dont on fait tendre la norme ||h||
vers zéro.
Pour généraliser ces notions aux fonctionnelles, objets qui dépendent d ’une
fonction, il faut tout d’abord préciser ce que l’on entend par “fonction ten
dant vers une autre fonction”, ou encore ce que représente un “écart” entre
deux fonctions. Ceci conduit à doter l’espace des fonctions dans lequel on re
cherche la solution d ’une norme convenable, par rapport à laquelle la fonction
nelle pourra être considérée au moins comme continue. Plusieurs possibilités
peuvent être envisagées.
1) Espace C®[o, 6], avec la norme
(3.18)
Deux fonctions yi et y 2 seront dites distantes de moins de e si
m a x \ y i { x ) - y 2 {x)\< e (3.19)
a<x<o
Cette norme est peu satisfaisante car elle ne permet pas de distinguer deux
fonctions ayant des dérivées premières très différentes (figure 4.6).
2) Espace Di des fonctions une fois dérivables, muni de la norme
(3.20)
Ici, deux fonctions sont distantes de moins de e si
max |y i( æ ) - y 2 (x)\ < e , et mâx \y[{x) - y ^ ( a ;) | < e (3 .2 1 )

a<x<b a<x<b \ /
2) Espace D„ des fonctions n fois dérivables, muni de la norme
n= E (3.22)
k=0
Soit D l’espace (ou classe) des fonctions envisagé et ||y||£) la norme correspon
dante. Une fonctionnelle J [y] sera dite continue en yo{x)D si pour tout réel
e > 0, il existe un réel ?; > 0 tel que
\J[y] - J[yo]\ < € , si \\y - yoll < T} (3.23)

• A noter qu’une fonctionnelle continue par rapport à la norme de C^ peut ne

pas l’être par rapport à la norme de D\.
Considérons une fonctionnelle (non linéaire en général) J[y\- La variation
àJ = J[y + h]~ J[y] (3.24)
entre deux fonctions y + h e t y où h est une “petite” fonction appartenant à la

même classe que y. Pour les “très petites” fonctions h, c’est-à-dire, telles que
li) < r; où t; est un très petit nombre réel, on peut écrire
AJ{h) = SJ[h] + 0 { \ \ h f )
où C?(||ù|p) -> 0 quand ||/i|| 0. L’existence de cette partie linéaire de la

différence A J définit la différentiabilité de la fonctionnelle J.
Un extrémum de la fonctionnelle J]ff\ est atteint pour une fonction yo si
pour toutes les fonctions y suffisamment voisines de yo, c’est-à-dire, telles que
lll/“ 2/o|| < V>l’expression J[y] —J[yo] garde le même signe. Si cette différence
reste positive, l’extrémum est un minimum ; si elle reste négative, il s’agit d ’un
maximum. Si la différence est nulle, on est en présence d ’un point d’inflexion.
L’extrémum est dit faible s’il n’est atteint que pour des fonctions de classe Di
(avec la norme (3.20)). Il est dit fort si l’extrémum peut être réalisé avec des
fonctions de classe C^ (avec la norme (3.18)). Un extrémum fort est aussi un
extrémum faible, mais la réciproque n’est pas vraie.
T h éo rèm e p rin cip al Pour que la fonctionnelle J [y] ait un extrémum
pour 2/ = yo, il faut que
S J = Q , pour y = yo (3.25)
P reu v e : Pour être plus précis, considérons le cas d ’un minimum. Pour
toutes les fonctions h suffisamment petites (||ù|| < »7 où la norme utilisée est,
selon le cas, celle de (7® ou celle de Di), on doit avoir J[yo + h]~ J[yo\ > 0.
Mais
J[yo + h] —J[yo] — SJ[h\ -hOi (3.26)
avec CK-4 0 quand Üùll 0. Pour ||/i|| suffisamment petit, la différence (3.26)
est donc du signe de 5J[h\. Or, par définition, cette dernière fonctionnelle est
linéaire. On a donc
3.4. LES ÉQUATIONS D ’EULER-LAGRANGE 97
ÔJ[-h] = -5J[h] (3.27)
Il s’ensuit que si 6J[h] ^ 0, l’expression (3.26) pourrait avoir un signe arbi

traire pour h infiniment petite, ce qui contredit la condition de minimum en
yo- La contradiction ne peut être évitée que si 5J[h\ = 0, cqfd.
3.4 Les équations d’Euler-Lagrange

On rencontre ces équations dans le problème classique du calcul variationnel
consistant à rechercher les extrema d ’une fonctionnelle alors que les fonctions
dont elle dépend sont soumises à des conditions aux limites fixes.
Soit F(æ, y, z) une fonction devx fois différentiable par rapport à ses trois ar
guments. Il s’agit de trouver, parmi les fonctions y{x) soumises aux conditions
y{a) = A, y(b) = B, on A et B sont donnés, une fonction yo{x) pour laquelle
la fonctionnelle
fb
J[y]= F { x ,y ,y ')d x
Ja
atteint un extrémum faible.
Pour une fonction h suffisamment petite, on a
rb
A J = f [F{x, y + h,y' + h') - F(x, y, y')] dx =
Ja
/'*' \dF ^ dF ,^,1 ^ ,
= / I h+ h dx -|- o:| (3.28)
J aa [dy ^ dy'
La partie linéaire de l’accroissement de la fonctionnelle est donc
Intégrons par parties le second termme de l’intégrant :
mais, puisque les conditions aux limites sont fixées, la fonction y + h doit aussi
vérifier (y -h h){a) = A et (y -t- h){b) = B, ce qui impose à h{x) de s’annuler
pour a: = a et æ = 6. On obtient donc finalement
Puisque h est arbitraire, (3.29) ne peut être identiquement nulle que si l’expres
sion entre crochets de l’intégrant est nulle partout dans l’intervalle [o, 6]. La
fonction yo réalisant l’éxtrémum de la fonctionnelle doit donc vérifier l’équation
= 0 (3.30)
dy \ d x d y 'J . V=V0
appelée équation d ’Euler-Lagrange. ®Elle conduit généralement à une équation

différentielle du second ordre pour la fonction yo cherchée. La solution générale
d’une équation de ce type dépend de deux constantes. Dans le cas considéré,
ces constantes devront être ajustées en tenant compte des conditions yo{a) = A
et yo{b) = B.
4k On prendra garde au fait que l’extrémum peut être réalisé par une fonction
dont la dérivée seconde n’est pas partout définie dans l’intervalle [o, 6] A
titre d’exemple, soit à trouver la fonction yo minimisant la fonctionnelle
J[y] = y^(l - y'Ÿ dx (3.31)
sous les conditions 2/(—1) = 0 et y(l) = 1. De façon évidente, l’intégrant étant

positif, la fonctionnelle considérée est positive et son minimum minimorum
éventuel ne peut être que zéro. Cet extrémum peut être effectivement atteint
soit pour la fonction partout nulle, soit pour une fonction y vérifiant l’équation
du premier ordre y' = \. Compte-tenu des conditions aux limites, une solution
non nulle partout est donc
yo{x) = 0 pour —1 < a; < 0 , yo{x) = x pour 0 < æ< 1 (3.32)
dont la dérivée seconde n ’est pas définie en æ = 0. L’equation d ’Euler-Lagrange,

quant à elle, conduit à l’équation^
3. Leonhard Euler (1707-1783), un des plus grands m athém aticiens de tou s les tem ps, né
en Suisse, m ort à Saint Petersbourg, où il a passé la plus grande partie de sa vie. Créateur,
avec Bernoulli, du calcul variationnel,
4. E n fait, pour que la solution d ’une équation d ’Euler-Lagrange soit d eux fois
d'^F
différentiable, il faut que yr-p; ^ 0.
oy'^
5. A vérifier.
3/(1 - y 'Ÿ + ¿ [3/^(1 - y')] = o (3.33)
qui est efFectivement vérifiée par la fonction nulle ou par la fonction (3.32), bien
que la dérivée seconde de cette dernière ne soit pas définie partout. Considérant
maintenant des fonctions deux fois dérivable, on trouve que la solution générale
de (3.33) doit satisfaire une relation du type®
y“
^= K + {x- xqŸ (3.34)
où XQ et K sont des constantes. Avec les conditions aux limites précitées, on

trouve æo = —1/4, K = —9/16, soit
ÿ'' = (x + i)^ - ^ = (1 + l ) ( l )
Cette expression n’est positive que pour x < —1 ou x > 1/2. De plus, la
fonction y = y^(x + l)(æ —^) n ’est pas dérivable en x = 1/2. Elle ne peut
donc convenir sur tout l’intervalle [—1,+!]. La solution (3.32) est donc la
seule possible dans ce problème avec ces conditions aux limites. Cet exemple
met en lumière le fait que l’existence d ’une solution et sa forme dépendent des
conditions aux limites. Le lecteur pourra notamment vérifier que la fonction
15 3,2
qui est deux fois dérivable, rend extrémale la fonctionnelle (3.31), moyennant
les conditions y{—l) = 2, y(l) = 1.
3.4.1 Cas particuliers
1) Si F ne dépend pas de y', l’équation d ’Euler-Lagrange se réduit à une

équation algébrique :
dF
^ ( x .,) = 0
2) La fonction F ne dépend pas de y :

6. Les dérivations étant effectuées, l ’équation (3.33) devient 1 — 2/'^ = y t / ', ce qui est
d 1
équivalent à l ’équation ^ (l/2 /O = 1 = 2 L ’intégration est alors im m édiate.
J[y] = f y') dx
Ja
Dans ce cas, on obtient l’équation réduite
dxdy'
qui conduit à Vintégrale première
= constante = C (3.35)
dy'
équation que l’on peut en principe réexprimer sous la forme y^ = Ф(ж, (7). Il
ne reste alors plus qu’une seule intégration à effectuer pour trouver уо(х).
3) La fonction F ne dépend pas de x :
rb
J[y]= JaI F{y>y')dx
On a alors
dF ,dF ,,dF
soit, en utilisant l’équation d ’Euler-Lagrange
dF , d ( d F \ ^ „dF d ( ,d F \ , d („ ,d F \ ^
et
dF
F —у'тг-; = constante = C (3.36)
dy'
ce qui conduit à une équation différentielle du premier ordre pour j/o.

4) Dans certaines situations à deux dimensions, le problème consiste à mini
miser l’intégrale d ’une fonction V{x,y) le long d ’une courbe donnée dans le
plan xOy, courbe dont on a fixé les extrémités (il peut s’agir d’une circulation
ou d’un flux en 2 dimensions). L’intégrale en question est de la forme
3.4. LES EQUATIONS D’EULER-LAGRANGE 101
Î V{x,y) y^l + ÿ'2 dx

Ja
compte-tenu du fait que l’élément de longueur le long de la courbe s’ex

prime comme ds = \ / d ^ = y/dx^ -\-dy'^ = dx y/1 + y''^. Posant F{x, y, y') =
V{x, y) y/1 + y'2, l’équation d ’Euler-Lagrange pour cette fonction donne alors
V{x,y)
dy dx dy' V ^ Qy dx \ / l + y‘/2
dV dV y' dV y‘/2 a
-y -
y"
+ v-
ÿ
dy dx y/l y'2 dy y/l -f y'2 V TTÿ^ (1 H- y'2)3/2
1 __ I_____
= 0
V r + ÿ ^ dy dx l-t-î/'2
La fonction V doit donc satisfaire l’équation aux dérivées partielles
= 0 (3.37)
dy ^ dx 1+ y'2
Un cas particulier intéressant est celui où la fonction V ne dépend pas expli

citement de X. L’équation (3.37) devient alors
dV
(3.38)
1 + y '2
3.4.2 Exemples
Les formules précédentes trouvent des applications dans les problèmes sui
vants.
1) Dans l’espace à trois dimensions, soit une surface S ayant l’axe Ox comme
axe de révolution. L’intersection de S avec le plan xOy est une courbe qui en
définit le profil, et qui représente dans ce même plan le graphe d ’une fonction
y{x). L’intersection de la surface avec des plans parallèles au plan zOx sont
des cercles. Un tel cercle se caractérise par l’abcisse x du plan dans lequel il
se trouve, et par son rayon y{x).
Considérons alors un morceau S de S, tendu entre deux disques {xi,yi =
y{xi)) et {x2 ,y 2 = y{^ 2 )), et cherchons quel doit être le profil y{x) pour que
l’aire de 5 soit minimale. Cette aire est donnée par l’intégrale
i*X2 P^2 !
A = 2 TT y ds = 2 TT y J l + y'^ dx (3.39)
Jxi Jxi
D’après (3.38), le profil y{x) recherché doit satisfaire l’équation
yy" = 1 +
Posons y'{x) = sinh^(æ). Il vient
cosh^
y il)' cosh^ = cosh^ V’ ) soit y=
t//
Dérivant ensuite y, on trouve
, , , , coshV» '4’" . , , , ,//

y = s in h ^ ------- --------= sinhyi , donc ip = 0
La fonction auxiliaire tp est donc de la forme Tp = ——— , où æo est une

O
constante, ce qui donne pour y :
X — Xq
y = C cosh (3.40)
Cette forme peut être également déduite à partir de la formule (3.36) applicable
aux fonctions F ne dépendant pas explicitement de la variable æ, comme c’est
ici le cas. En effet, de (3.36) on déduit
dF !-------- V
^ V r + l ? =
En posant encore y' = sinh ip, on trouve y — C cosh puis en dérivant cette
expression, y' = C ip' sinh^, grandeur qui doit être égale à sinh^». D’où
Tp' = 1/C et Tp = {x —æo)/C, xq étant une constante.
Il est intéressant de mentionner une troisième façon de procéder, consistant
à considérer y comme la variable fondamentale, x comme une fonction de y
asujettie aux conditions x{yi) = x i, x{y 2 ) = æ2 et à réexprimer (3.39) comme
une intégrale sur y :
/•*2 fV2 _____

A = 2 tt yd s = 2TT G{y,x') dy , avec G{y,x') = y v l + ^ (3.41)
Jxi
La fonction G ne dépendant pas de æ, on se trouve ainsi dans un cas d ’appli

cation de (3.35). On en déduit
X' y
.12
= constante = C =
vT+æ 1 + 2/'^
où l’on a tenu compte de la relation x' = 1/y'. Comme précédemment, il suffit

ensuite de poser y' = sinh^/’ pour retrouver (3.40).
L’existence de la solution (3.40) est non triviale et dépend crucialement des
conditions aux limites. En effet, celles-ci conduisent aux relations^
y2 + \Jy2~C ^ yi + ]/':y? C72

X2 —X1 = C ln xo = x i —Cln (3.42)
C
,2/1 + \ / y Î - C ^ ,
lesquelles doivent, en principe, permettre de déterminer les constantes xq et

C adaptées au problème. On peut toujours choisir l’orientation de l’axe de
révolution Ox de telle sorte à avoir 2/2 > 2/i S'Vec X2 > xi (et même, choisir xi =
0). Les valeurs de la fonction hyperbolique cosh étant toujours supérieures à
1, on note que l’on a obligatoirement C < yi. L’intervalle des valeurs possibles
de C est donc ]0,2/i]. Dans cet intervalle, la fonction
y2 + ^ y l - C ' ^
{C) = C\n
,yi + \ / y i - c ^ .
est positive, strictement croissante, nulle pour C* = 0 et atteint donc sa valeur

maximum pour C = y\. Les relations (3.42) ne pourront donc avoir de solution
que si
2/2 + ^ 2/2 ~ y\
X2 - X l < 2/1 In
yi
2) Reprenons le probème de la brachistrochrone (formule (3.14)). Ici encore,

l’intégrant
V l + z'^
E(æ, Z, z') =
7. Les vérifier en utilisant la formule Q = ln (co sh 0 + sin h ^ ).

est indépendant de la variable x et la formule (3.36) peut lui être appliquée.

Comme nous l’avons fait dans l’exemple précédent, on peut également trans
former (3.14) en une intégration sur la variable z, considérant x comme une
fonction de cette variable, soumise aux contraintes æ(0) = 0, x ( z a ) = x a , ce
qui conduit à l’expression
V r+ "ÿ ^
Ai = —^ [ dz G{z,x') , avec G{z,x') = — (3.43)
V^g Jo V
dont l’intégrant G qui présente l’avantage de ne pas dépendre de la fonction

X est un cas d ’application de (3.35). On obtient immédiatement
dG 1
= constante = K =
dx' y/z v T + ÿ ^
où C est une constante positive. Comme on le verra dans la suite, la constante

K a été écrite sous la forme l / \ / ^ pour la commodité. Par ailleurs, elle
a été prise positive, car nous supposons ici que la trajectoire est telle que
x' = 1/z' > 0 (le cas où z' pourrait changer de signe correspondrait à une
piste présentant un creux, c’est-à-dire un maximum pour la fonction z(x),
situation que nous n ’envisageons pas ici pour ne pas alourdir l’exposé). De
cette dernière formule on déduit
z{l+ z'^) = 2C
0 6
Posons alors z' = cot - . Il vient z = 2G sin^ - , soit
Z iU
z = C{1 —cos 6) (3.44)
Dérivant (3.44) par rapport à x, on obtient successivement z' = C& sin0 =

cot ^ /2, soit & = l / ( 2(7 sin^0/ 2) = âB/dx^ donc
g = C(l-C08«)
L’intégration de cette dernière équation donne enfin
X = C {6 —sinO) + Cl (3.45)
où Cl est une nouvelle constante d ’intégration. Les deux relations (3.44) et

(3.45) constituent les équations paramétriques d’une courbe appelée cycloïde.
La première condition z = 0 pour a: = 0 impose, d ’une part, que l’on ait alors
0 = 0. On notera alors que la pente de la courbe à l’origine, où 0 = 0, est
infinie, ce qui est la cause d ’une descente rapide de l’objet. La même condition
conduit d’autre part à Ci = 0.
Trouvons maintenant la loi horaire 0{t). Les composantes cartésiennes de la
vitesse sont
dx de dz ■a
- = C ^ (l-c o « « ) , s =
De la relation on tire
dt dt
(sin^ 0 + (1 - cos 9)“

^) = 2C^ (1 —cos 9) = 2gC(l —cos9)
dt dt
dO rQ~
soit - r = \ 7 ^ i d’o'u, compte-tenu de la condition initiale 0(0) = 0,
dt \ C
m = (3.46)
La durée (minimale) de la descente de l’objet est donc donnée par
OÙ 01 et C doivent être déterminés par les deux conditions supplémentaires
xji = C7(0i —sin0i) , et za = C{\ —cos0i) (3.47)
La détermination de 0i passe par la résolution de l’équation
01- S i n 0i XA
(3.48)
= l-c o a « , =
La fonction <¡>{9) est toujours positive, strictement croissante, ce qui fait que
(3.47) a toujours une solution unique*. A noter cependant que cette solution
8. Le vérifier.
pourrait être supérieure à tt et donc se trouver dans un domaine où z' est

devenu négatif. La constante C se déduit ensuite à partir de l’une des relations
(3.47).
3.5 Généralisations
3.5.1 Fonctionnelles impliquant plusieurs variables
Envisageons tout d ’abord le cas d ’une fonctionnelle d’une fonction /(æ, y),
définie, continue et dérivable dans un domaine D à deux dimensions, qui peut
être dans un plan, ou, plus généralement sur une surface (non nécessairement
plane) dans l’espace à trois dimensions. Ce domaine est délimité par un bord
(souvent noté dD) qui est une courbe fermée que nous noterons 7 . La fonc
tionnelle considérée est de la forme
J[f] J fv) (3.49)
df df
où, pour alléger les notations, nous avons écrit fx = lé-, fv = -rr-Aci encore, le
ox ay
problème variationnel considéré est à limites fixées, ce qui signifie qu’une petite
variation h donnée à la fonction / devra satisfaire la contrainte de s’annuler
sur le bord du domaine
[h{x,y)]^ = 0 (3.50)
Exprimons alors la variation première de la fonctionnelle. Il vient
W = //^ № « . = //^ g ^ ^ A .)
ft, = | . Mais, par exemple,
dF\ (dF \
» iJ \d fx )
d ’où
'ôfV
i— )
\d fj -K , 9 f v j . hdxdy
3.5. GENERALISATIONS 107
dxdy
Le second terme de l’expression ci-dessus se prête à l’utilisation du théorème

de Green :
u{x,y) et v{x,y) étant deux fonctions continues et dérivables dans D. Par

identification, il vient
f f \ d i^ d F \ d f^ ô F dF , dF ,
dxdy = é ~ ^ d x + — dy
J JD \ d x \ d fx ) ^ ^2/ V ^fy dfx dfy J
et la dernière intégrale est nulle, compte-tenu de (3.50). Il reste donc
87= [ [ h dxdy (3.51)

^~JjD\df d x \d fj d y U fy
et cette expression ne peut être nulle quelle que soit h{x, y) que si F satisfait
l’équation d ’Euler-Lagrange
(3.52)
La généralisation au cas de fonctionnelles dépendant d ’une fonction de N

variables (xi,X2, - ' • >^n ) ■
dF ^ d f d F \ _
(3.53)
df ¿ a x , U /x J"
3.5.2 Fonctionnelles dépendant de plusieurs fonctions
La généralisation à ce cas est elle aussi immédiate. Soit une fonctionnelle
= [ F d x id x 2 -•-dxN (3.54)
JD
où la fonction F dépend de M fonctions fm{xi,X2, • ' ‘ î ^ n ) (w = 2, • • • , M)

des N variables Xk {k = 1,2, - • • ,N), de leurs dérivées partielles premières
fmxk variables Xk- Fixant les valeurs prises par les M fonctions fm sur
le bord de D, cette fonctionnelle atteint un extrémum si ces fonctions satisfont
les M équations
(3.55)
obtenues en faisant varier indépendamment ces M fonctions.
3.5.3 Fonctionnelles impliquant des dérivées d ’ordre supérieur
Dans quelques situations physiques ou mécaniques, notamment en théorie de

l’élas-ticité, on rencontre des problèmes variationnels impliquant les fonction
nelles qui dépendent non seulement de la dérivée première de la fonction re
cherchée, mais aussi de sa dérivée seconde. Nous montrerons ici comment ob
tenir les équations différentielles à partir du principe variationnel avec une
telle fonctionnelle, la généralisation aux fonctionnelles dépendant de dérivées
d’ordre quelconque est évidente. Considérons donc la fonctionnelle suivante
rX2
L {fk{x),f'k{x),f"k{x);x)dx (3.56)
Jxi
où L { f , f ' y f : x) est une fonction au moins deux fois différentiable vis-à-

vis de ses arguments comprenant : la fonction / , sa dérivée première / ', sa
dérivée seconde f " et la variable indépendante x. Sous l’effet d ’une variation
infinitésimale de la fonction / , f{x) -> f{x) + Sf{x), la fonctionnelle (3.56)
subit aussi une variation dont la partie linéaire est
<5 ^ L{fk{x), f'k{x)y f'kixy, x) dx = J J + ^

(3.57)
Les variations des dérivées f et f" s’identifient aux dérivées correspondantes
de la variation 5 /, c’est à dire
- dp-
Maintenant il ne reste qu’appliquer la formule de Leibniz : pour la variation

de la dérivée on fait comme avant, en remarquant que
d f'^ d f dx d x \d f'^ ) \d x d f') ^

Nous avons ici une dérivée totale et une expression contenant la variation 5f.
Pour ce qui concerne l’expression contenant 5 f" , il faudra appliquer la formule
de Leibniz deux fois consécutives. Tout d ’abord on constate que
dL dL dSf
df' d f" dx
Là aussi, nous obtenons un premier terme qui est une dérivée totale et un
second terme qui contient la dérivée de la variation Sf. Il faut alors utiliser
une nouvelle fois la formule de Leibniz :
V dx d f" dx J d x \ d x d f" ) ydx^ d f" j
A présent on peut regrouper d ’une part toutes les expressions contenant S f

en facteur, et d’autre part les expressions qui sont des dérivées totales. Les
termes avec 5f contribuent à l’intégrale suivante :
id L d dL ( f dL
/
J xXI ydf d t d f ' ^ dx-^df'
S f dx (3.58)
tandis que les termes contenant les dérivées totales contribuent à l’intégrale :
dx (3.59)
4 dx \ d f ^ ^ ' ' ' dxl df ' ^î )
Le principe variationnel stipule que c’est la variation totale de la fonctionnelle,
soit la somme des deux intégrales (3.58) et (3.59) qui doit s’annuler afin d ’as
surer l’extrémum. La deuxième intégrale s’exprime comme la différence des
valeurs prises par la primitive de l’intégrant aux bornes d ’intégration x = X2
et X = £Ci, soit
dL dL d dL^
[ d f^ ^ ^ d f" ^ ^ ^dxdf""^^^. XI
qui s’annule à condition que les variations S f et S f soient nulles aux extrémités.
Nous voyons donc que dans le cas présent il faut imposer non seulement l’an
nulation de la variation S f de la fonction, mais aussi celle de la variation de
no CHAPITRE 3. CALCUL VARIATIONNEL
la dérivée première ô f . Sous cette condition il ne reste plus qu’à annuler la

première intégrale. Sachant que la variation 5 f est arbitraire, noue concluons
que c’est l’intégrant qui doit être égal à zéro, d ’où léquation d ’Euler-Lagrange
généralisée, comprenant la dérivée seconde (Pjdx^ :
dL d dL (fdL_
(3.60)
df d x d f^ dx^dr~
La généralisation aux fonctionnelles dépendant de dérivées de / d ’ordre encore

plus élevé est à présent assez évidente - on aboutira à une équation avec les
dérivées encore plus élevées, les termes d ’ordres pairs et impairs ayant des
signes opposés.
3.5.4 Application : équations des géodésiques
Nous nous limiterons ici au cas des géodésiques sur une surface dans l’espace
ordinaire à trois dimensions. Etant donnés deux points de la surface, on appelle
ainsi la courbe de plus courte longueur joignant ces deux points.
Sur la surface, les trois coordonnées cartésiennes z sont liées par une
relation de la forme $(æ, y, z') = 0. Nous admettrons qu’à partir de cette rela
tion, il est possible d ’exprimer explicitement l’une des coordonnée en fonction
des deux autres, par exemple : z — f{x, y). Lors d ’un déplacement infinitésimal
{dx, dy, dz) sur la surface, la variation dz n ’est donc pas indépendante de dx
et dy, mais doit être exprimé comme ^
et la longueur infinitésimale ds de ce déplacement comme
,d f
da = J (dx)2 -t- {d y f -H { -^y { d x ) + {d y f + 2 dxdy
dx dy
On peut écrire l’élément ds^ sous la forme générale
= gxx{dxŸ + 2gxydxdy -|- gyy{dyŸ (3.61)
en posant
9. Montrer au passage que ^ = -(^ )/(^ ) , ^

dx ^ d x ” ^ d z ’ ' dy ^ d y ’'^ d z ’
д х Х—-11 J+- ií 'g^ ^J 2 9ху - 9yx - Q^Qy > - 1+ ( (3.62)
Les grandeurs 9 i^j, où les indices i et j représentent x ou y, forment le tenseur

métrique. Ce tenseur définit les distances sur la surface, donc la géométrie
propre de celle-ci
Considérons alors une courbe sur la surface. Elle peut être caractérisée par
des équations paramétriques x(t) et y(t), où t est un paramètre définissant la
position du point sur la courbe. La distance séparant deux points .A et B de
la courbe, mesurée le long de celle-ci, a pour expression
j-------^— : rtB !----- :—r
£r = y ~J y 9ij dx'^dx^ = J y g ijx ^x jd t (3.63)
où l’on a posé x^ = dx4dt et où l’on a utilisé la convention de sommation

d’Einstein pour laquelle la présence d ’un même indice en haut et en bas dans
une expression signifie que l’on effectue une sommation sur cet indice. La dis
tance apparaît ainsi comme une fonctionnelle des fonctions æ*(i), s’exprimant
comme une intégrale sur la variable t de la fonction
F {x\x^) =
Le m inimum de L sera réalisé pour des fonctions x^{t) satisfaisant les équations
d ’Euler-Lagrange
dx^ dt V ^ iv
On a
dF ^ 1 Ô9ij dF _ 9ikX^
dx^ 2 dx’^ ^
La dérivation par rapport à i de la seconde expression peut être menée comme

suit. Comme ds — ^/gmndx’^dx’^ = dt^/gmux'^x^f donc dt/ds = 1/
on a
dF dx‘‘ dt
— 9ik~ir
dt ds — 9ik ds
dx^
10. Les composantes gtj du tenseur dépendent généralement des coordonnées x .
et
d . dF . _ d a d . d F . _ ds d / dæ®\ _ ds dçik dx"® dx^ d?x^

dt dx^ dtds^dx^ dtds y ^ ^ d s j dt dx'^ ds ds + 9ik ds^
D’un autre côté, on a
dF _ 1 dgij ds .i.j _ 1 dçij dx® dx^

dx^ 2dx^ dV ds ~ 2 dx^ ds ds
En réunissant toutes les expressions obtenues, les équations d ’Euler-Lagrange
prennent la forme
d^x® dgik dx®®®dx® _ 1 dgij dx® dx^

^®*^ ds^ ôx”® ds ds 2 ^x*’ ds ds
soit encore
I i dÇik . dgmk _ dgmi\ dx*®® dx®

ds^ 2 V^x*®® 5x* ôx*’ / ds ds
Introduisons les grandeurs
r>i ^ ( ^9km , d9jk\ (3.64)

1 jfe - 9 ^ l -ÏT-7-
dx^ + dx^ dx'^J
appelées symboles de Christoffel, où ^®*®® sont les composantes de l’inverse

du tenseur métrique, telles que 9^^9mk = équations des géodésiques
s’écrivent ainsi
d^x® _i dx-® dx^ -

(3.65)
~ d ^ ^ ^’^ 1 s ~ d s ~ ^
3.5.5 Problèm e avec les bords libres
Un problème plus général consiste à rechercher le minimum d ’une fonctionnelle

telle que (3.15), en n ’imposant plus les valeurs extrêmes de la fonction y.
Autrement dit, on recherche le minimum de la fonctionnelle pour n’importe
quelle courbe entre x = a et x = b. On doit alors abandonner la condition
d’annulation de la variation h{x) aux extrémités de l’intervalle. Pour h(x)
arbitraire, on a
3.6. EXTREMUM CONDITIONNEL 113
dF,
5J[h] = h dx
dy Ja \.dy \d x d y ')
L’annulation de cette variation doit être réalisée quelle que soit la fonction /i,
donc aussi bien pour une fonction h s’annulant aux extrémités, ce qui conduit
imanquablement à l’équation d’Euler-Lagrange (3.30) pour la fonction F. Il
faut ensuite résoudre les équations
'dF 'ÔF
= 0 et = 0 (3.66)
.dy x=b .dy x=a
qui doivent permettrent de fixer les constantes d ’intégration. A titre d ’exemple,

soit à trouver, dans le plan zOx, la brachistochrone passant par 0(0,0) et
arrivant à la droite verticale x = b. D’après (3.44), (3.45) et de la condition
initiale æ(0 ) = 0, z(0) = 0, les coordonnées x{6) et z{6) s’écrivent
x{0) = C (6 —sin 6) , z(0) = 0 (1 —cos 6)
La différence avec le cas précédent est que la constante O doit être maintenant
déterminée par la condition
= 0
dz' X=b V ^ V Î + p 2 x=b
qui implique sin 0 = 0 pour æ = 6. En se limitant aux valeurs de 0 comprises

entre 0 et tt, la solution est donc 0 = ir. Puisque æ(7r) = ttO = f>, on en déduit
immédiatement C = b/
3.6 Extrémum conditionnel
Dans de nombreux problèmes, il s’agit de trouver des fonctions permettant de

réaliser l’extrémum d ’une fonctionnelle tout en étant soumises à une condition
supplémentaire s’exprimant à l’aide d ’une nouvelle fonctionnelle. L’exemple
type est celui du problème isopérimétrique consistant à rechercher dans le
plan quelle forme doit prendre une courbe fermée de longueur donnée afin de
11. C ette portion de cycloïde possède égalem ent Pétonnante propriété d ’être tautochrone :
quel que soit le point de départ de l ’ob jet sur c ette courbe, il atteindra son point le plus bas
{0 = 7t) dans le m êm e tem ps.
maximiser l’aire de la surface qu’elle entoure. La fonctionnelle à maximiser est

de la forme
eb
/ y{x)dx (aire)
Ja
tandis que la condition est
rb
Í ^ 1 + y'2 dx = L (longueur)
Ja
En général, il s’agit donc de trouver un extrémum conditionnel d ’une fonction

nelle telle que (3.15), la fonction y étant assujettie aux conditions aux limites
usuelles y{a) = A, y{b) = B, et à la condition supplémentaire
pb
= / G {y,y\x) dx = L (3.67)
Ja
L étant une constante. Le théorème le plus important relatif à cette situation

est dû à Euler.
T h éo rèm e
Si la fonction y rend extrémale la fonctionnelle J tout en vérifiant les condi
tions précitées et ne correspond pas à un extrémum de la fonctionnelle IC, alors
il existe une constante A, appelée multiplicateur de Lagrange, pour laquelle la
fonction y rend extrémum la fonctionnelle J + \ K.
• D é m o n stratio n
Considérons l’accroissement a i 7;i(a:) -1- a 2 i]2 {x) de la fonction et y{x), ai et
02 étant deux paramètres de valeurs infinitésimales, et r¡i et rj2 deux fonctions
arbitraires s’annulant toutefois pour x = a et x = b. Posons z{x) = y{x) -\-
a\rji{x) + a 2 T]2 {x) et considérons la valeur K[z] de la fonctionnelle /C en y
remplaçant y par z. Cette valeur peut être considérée comme une fonction
K { a i,a 2 ) des deux paramètres ai et 02 :
rb
K { a i,a 2 ) = / G{y + ai 7)1 + 0 2 + «1 Vi + «2 V2 ^) dx
Ja
On trouve assez facilement que
dK
Dk = = / 0{y,y’,x)rikix)dx {k = l,2)
dak ai=0,a2=0 JCL
3.6. EXTREMUM CONDITIONNEL 115
où la fonction
0 {y,y',x) =
. dy dx dy',
n ’est certainement pas nulle puisque, par hypothèse, la fonction y ne réalise

pas un extrémum de IC. De ce fait, on peut toujours trouver une fonction
T]2 telle que la dérivée D 2 ne soit pas nulle. De plus, nous voulons que les
fonctions Z envisagées satisfassent elles aussi la contrainte (3.67), c’est-à-dire,
K { a i,a 2 ) = L. Ceci implique que lorsqu’on fait varier 0:1 et a 2 , au voisinage
de a i = 0 et a 2 = 0, on doit avoir
dK = dai Di -|- dxx2 D2 = 0
ce qui montre que 02 ne peut varier indépendamment de a i. Comme D 2 0

par hypothèse, le rapport
da 2 £ 1
K= (3.68)
da\ ai=0 D2
est une constante bien définie. Considérons maintenant la fonctionnelle J[z].

Compte-tenu de la contrainte, elle doit être considérée comme une fonction
J ( a i) de la seule variable a i. Tenant compte de (3.68), on a
dJ rb rb
= / ^ y ,y ',x )r]i{ x )d x + K / J { y ,y ',x )‘n2 {x)dx
dai Q {j= 0 O, J Ci
avec
H y,y'iX ) = {y,y',x)
_dy dxdy'_
Posons alors
1
A= / $(j/, y', x) T]2{x) dx
I J 2 Ja
il vient
dJ fb
= / m y ,y ',x ) d x + \ü (y ,y ',x )] T]i{x)d.
dai =0 «'O
On exprimera alors que J présente pour y un extrémum conditionnel en an

nulant cette dérivée, pour tout 771, ce qui conduit à l’équation
_d ^
+A = 0 (3.69)
dy dx dy' dy dx dy'.
qui correspond au principe variationnel d’une nouvelle fonctionnelle J + XIC\

d ’où le théorème. Dans le cas de plusieurs contraintes exprimées par un certain
nombre M de fonctionnelles /Ci, /C2, • • • ,ICm ^ il faudra introduire autant de
multiplicateurs de Lagrange Ai, A2, • • •, \ m et considérer la fonctionnelle J +
Ai/Ci H------ 1- Am /Cm -
Un exemple d ’application classique est le problème isopérimétrique.
Dans le plan horizontal xOy, on considère un fil mince déformable mais in
extensible dont les extrémités sont fixées sur l’axe Ox aux points A{a, 0) et
B{b,0) avec 0 < a < 6. La longueur du fil est donnée et égale à L. Quelle
forme donner au fil pour qu’il entoure le maximum de surface?
Nous admettrons que l’on peut représenter la forme du fil par une fonction
y{x), telle que y (a) = y{b) = 0 et supposerons que le fil se trouve tout entier
dans la région j/ > 0 de sorte que y{x) est une fonction positive. Il s’agit de
rendre maximum la fonctionnelle
fb
J[v] = / y{x) dx
Ja
qui représente l’aire en dessous de la courbe y = y{x), avec la condition

}C[y] = J ds = J + dx = constante = L
Formons la fonctionnelle
K = J -HA/C = / H (y,y')dx avec H{y, y') = y + \ ^Jl + y'"^

J Ci
Comme l’intégrant H ne dépend pas de x, la formule (3.36) s’applique, donnant

l’intégrale première
y + X J l + y'"^ - X ^ . . = constante = C = y +
'' vi + y V T+ÿ^
Posons y' = cot 9. On obtient alors y = (7—A sin en admettant que sin 0 > 0.
Dérivant cette expression par rapport à æ, il vient y' = —X9' cosâ = cot9,
3.7. SYMETRIES ET LOIS DE CONSERVATION 117
soit dxfdê = —Asin^, équation dont l’intégration est immédiate et donne

X = xq + X cos 9, xq étant une constante. On aboutit ainsi aux équations
paramétriques d ’un cercle de rayon R = |A|. Le cas sin0 < 0 reviendrait à
changer le signe de A.
Les trois constantes C, xq et A sont à déterminer au moyen des conditions aux
limites et de la contrainte d ’une longueur L du fil donnée. Soit 9a et 9b les
valeurs de 9 pour x = a et x = b, respectivement. Les conditions aux limites
donnent
c
■sin<
y(a) = y{b) = 0 = C - X sin9a = C —X siïi9b , donc sin 9a ■■
X
a = xo + Xcos9a , b = xo + X cos9b
Comme sin 9a = sin 9b et que 6 > o, on a certainement cos 9a = —cos <b. On

en déduit immédiatement que xq = (b + a )/ 2 , puis
b —a
A cos 9b = —X cos 9a = et + c^
On a en fait deux situations possibles, représentées à la figure (4.6). Nous

laissons au lecteur le soin de vérifier que les constantes C et A sont adaptables
à l’une et l’autre situation, que sin0 soit positif ou négatif. Géométriquement,
on a L = 2 iîo: avec sin a = (b —a)/{ 2 R) < 1. On trouve ainsi la relation qui
permet de déterminer le rayon R du cercle à partir des données L, bet a :
sino: b —a
ip{a) =
a
Dans l’intervalle [0, tt] dans lequel on doit rechercher a, la fonction V’(o:) est
positive, strictement décroissante et prend des valeurs inférieures à 1. Comme
{b —a )/L < 1, on a donc toujours une unique solution pour a et donc pour R.
3.7 Symétries et lois de conservation

Un fait important reliant les symétries d ’un problème variationnel aux lois de
conservations de certaines quantités physiques a été remarqué par la mathémati
cienne allemande Emmy Noether en 1918. Le résultat est connu sous le nom
de “Théorème de Noether” , qui s’applique aussi bien à la mécanique clas
sique qu’à la théorie des champs et à la mécanique quantique. Par symétrie
d’un principe variationnel correspondant à un lagrangien donné L, on entend

une transformation des coordonnées ou, plus généralement, des fonctions dont
dépend ce lagrangien, qui laisse ce dernier invariant. On peut citer comme
exemple le lagrangien relatif au problème de Kepler, qui garde sa forme après
une rotation du système des coordonnées autour du centre ; on dit que ce lar
grangien possède la symétrie sphérique. Un autre exemple est fourni par le
lagrangien d ’une molécule diatomique, considérée comme un oscillateur har
monique évoluant en trois dimensions :
(3.70)
Il est clair qu’une translation déplaçant les deux extrémités ri et V2 par le

même vecteur constant b ne change ni les vitesses ni le terme potentiel qui
dépend uniquement de la différence entre les deux rayons-vecteurs. Le lagran
gien (3.70) est donc invariant par rapport aux translations.
Voici l’idée essentielle de ce théorème, illustrée par l’exemple le plus simple qui
soit, la mécanique d’un système à un seul degré de liberté, de lagrangien L =
L{q{t),q{t)). Supposons qu’il existe une transformation continue, paramétrée
par une variable s, transformant la coordonnée généralisée q(t) en qs{t), et la
vitesse généralisée q{t) en qs{t). On dira qu’une telle transformation repésente
une symétrie du lagrangien L si
— L {q s{t),q s {t)) = 0 (3.71)
En fait, on peut inclure le cas où la transformation ne laisse pas le lagran

gien intact, mais conduit à un nouveau lagrangien cî diffère du premier par
l’addition d’une dérivée totale
¿((9s(i),9s(i)) = L{q{t),q{t)) +
dt
ce qui, comme nous le savons déjà, aboutit aux mêmes équations d ’Euler-
Lagrange. Nous nous limiterons au cas le plus simple. Ecrivons les équations
d ’Euler-Lagrange de manière symbolique.
dp dL dL
(3.72)
dt dq ^^dq
où P est l’impulsion généralisée. Le théorème de Noether stipule dans ce cas

que si le lagrangien satisfait la condition d ’invariance (3.71), la quantité
(3.73)
est une constante du mouvement, autrement dit (7 = 0.

Pour le prouver, il suffit d’appliquer la dérivation par rapport au temps :
dC _ dpsjt) dqsjt) , ^^^ddqsit)

dt ds dt ds
dL dqsjt) dL dqs{t)
(3.74)
dqa ds dqs ds
où nous avons utilisé l’équation du mouvement (3.72) ainsi que le fait que
d dqsjt) _ dqsjt)
dt ds ds
Mais la dernière expression (3.74) de dCfdt n’est autre que (3.71), d ’où le
résultat recherché. Il faut souligner que cela ne marche que grâce aux équations
d ’Euler-Lagrange supposées satisfaites au cours du mouvement, et le fait que
le lagrangien choisi ne dépende pas explicitement du temps , dL /dt — 0.
Le théorème de Noether, illustré ici de façon simple, et dont la preuve complète
est beaucoup plus sophistiquée, se généralise facilement au cas de plusieurs
variables. La quantité conservée est alors construite de manière semblable, en
sommant les contributions de toutes les coordonnées :
V „ ^
Une autre généralisation, peut-être encore plus importante, concerne le cas où

les symétries du lagrangien sont plus nombreuses, et peuvent être engendrées
par M paramètres si, S2, ..., s m - Dans ce cas, on aura autant de lois de conser
vation qu’il y a de paramètres indépendants, soit M :
N dq^
c°‘ = Y , Pk dsa ’ a = 1 , 2 , M (3.75)
fe=i
On peut mieux comprendre à présent l’origine des lois de conservation de

l’impulsion et du moment cinétique. Considérons une transformation des co
ordonnées cartésiennes conservant les longueurs et les angles. Nous savons
déjà qu’il s’agit d’isométries, comprenant les trois translations indépendantes

et trois rotations infinitésimales indépendantes :
X —^ 5* —ic* H" "h û* ) î = 1,2,3 (3.76)
Ici, la matrice d’une rotation infinitésimale doit être antisymétrique une

fois l’indice haut baissé :
9 ij(^k = . soit ojij = - ui'P
Conformément à la définition (3.75), en choisissant une translation pure, =

0, il ne reste que trois paramètres indépendants, o*’, qui jouent le rôle des
paramètres si, S2) «3 dans la formule (3.75). Les trois quantités conservées sont
alors
~ rfc dpj (3.77)

C j = pk = P kSj= P j -^ = 0
da^
ce qui conduit à la conservation du vecteur impulsion chaque fois que le la
grangien est invariant par translation.
Une autre loi de conservation importante est obtenue quand la transformation
infinitésimale des coordonnées est une pure rotation, ce qui équivaut à poser
a* = 0 ,
où représente les trois paramètres indépendants d ’une rotation arbitraire.

Il est plus faÆÜe d’appliquer le théorème de Noether en choisissant un seul
paramètre infinitésimal s et un axe de rotation défini son vecteur n. Dans
ce cas, on pourra écrire
= æ* -f s(n A x)* , ou encore 5* = æ* H- sé
L’expression conservée correspondante devient alors
dx^
C? = Pi ^ = Pi e* = P •(n A r) = n •(r A p) (3.78)
On voit que la quantité conservée s’exprime comme le produit scalaire du

vecteur r A p avec le vecteur unitaire n déterminant l’axe de rotation. Celui-ci
pouvant prendre toutes les orientations possibles, le vecteur
M = r AP
3.8. PROBLEMES 121
appelé moment cinétique, est donc une grandeur conservée si le lagrangien

du système est invariant par rotation, ce qui est notamment le cas dans le
problème de Kepler.
Le théorème de Noether s’applique aussi en mécanique des milieux continus
et en théorie des champs. Le lagrangien dépend alors de N fonctions t)
{a = 1,2, ...,iV) dépendant des variables x® (i = 1,2,3) et du temps t, ainsi
que de leurs dérivées partielles Le principe variationnel
conduit alors aux N équations d ’Euler-Lagrange
d dL d dL dL
+ = 0 (3.79)
dt d{dt(p°‘) ' dx'^ d{dk<p°‘) d(p°‘
On peut prouver que, si le lagrangien ne dépend pas explicitement des variables

t, X*, l’équation de continuité est vérifiée par les grandeurs Tq, Tq définies par
En effet, à condition que les équations d ’Euler-Lagrange (3.79) soient satis

faites, on a
dtT^ + dkT^ = 0 (3.80)
On identifie Tq avec la densité d’énergie w et Tq avec la densité d’impulsion

p^. L’équation (3.80) prend alors la forme plus familière d ’une équation de
continuité
dw dp^ dw ^
Dans la suite, nous verrons comment cette équation pourra être interprétée
comme une divergence en quatre dimensions dans l’espace-temps de Min
kowski.
3.8 Problèmes
Problème 3.1 - Beirycentre de trois points
Soit un triangle de sommets A, B et C. Trouver le ou les points M qui rendent
extremum la somme
U{M) = + BM ^ -h CM^
S’agit-il d’un minimum ou d’un maximum? Essayez de donner une construc

tion géométrique représentant le barycentre.
P ro b lèm e 3.2. * - E x tre m u m en a rith m é tiq u e
Un nombre entier N positif peut toujours s’écrire comme la somme de n entiers
positifs Щ, U2 , •••Un. Comment choisir ces entiers et leur nombre n de telle
sorte que leur produit
P = U\U2 •••Un
soit maximum ?
P ro b lèm e 3.3 - Surface de ré v o lu tio n m inim um
On considère une surface S ayant l’axe x'x pour axe de révolution et limitée
par les deux sections droites suivantes : la première est de centre 0 (0 ,0 ,0 ) et
a pour rayon j/ = a ; la seconde est de centre A{h, 0,0) avec h > 0 et a pour
rayon J/ = 6 > O. On se propose de déterminer le profil y = /(æ) de E qui rend
son aire S extremum, sous les conditions /(0 ) = о et f{h) = b.
a) Montrer que l’élément d ’aire de S s’écrit dS = 2iryd£, avec d£ = л/dx'^ + dy“
^.
b) Montrer que l’on peut calculer l’aire iS de S au moyen de l’intégrale
S = 2tt [ dy y y j l + x '“
^
Ja
dx
où æ' = — est la dérivée de æ, considéré ici comme une fonction de y, avec
dy
les conditions aux limites x(a) = 0 et x(b) = h.
c) Montrer alors que S atteint un extremum Sm lorsque x{y) vérifie l’équation
yx'
=K
V TT^
où K est une constante.
1
d) Procéder à l’intégration de cette équation en posant x' = et en
déduire que la forme du profil de S doit être celle d’une chaînette d’équation
f{x) = K cosh(^
Xq étant une constante.

e) Donner les équations permettant de déterminer K et xq.
f) On note Xm{y) = et l’on considère une fonction x{y) infiniment
voisine de Хт{у), soit
x(y) = Xm{y) + € g{y)

3.8. PROBLEMES 123
avec 0 < € 1 et g{a) = g(b) = 0. Soit S{e) l’expression de l’aire de E obtenue

à partir de cette fonction. Développer S { e ) jusqu’au second ordre en e et en
déduire que représente bien un minimum.
P ro b lèm e 3.4 - E q u ilib re d ’u n fil p e sa n t
Un fil mince pesant de longueur donnée i est fait d ’un matériau homogène de
masse volumique ¡i. Ses extrémités sont fixées aux points 0(0 ,0 ,0 ) et A{a, 0, b),
avec O > 0, 6 > 0 et Vô2"+6^ < i. Le fil étant soumis au champ de pesanteur
terrestre, il prend à l’équilibre une forme telle que son centre de gravité G soit
le plus bas possible. On se propose de trouver le profil z(x) correspondant.
a) Montrer que la cote zq de G peut être calculée au moyen de l’intégrale
rb
ZG = J dz Z \fï+ /2
X
dx
on x' = — est la dérivée de x, considéré ici comme une fonction de avec
dz
les conditions aux limites x(0) = 0 et x(b) = a.
b) Montrer que la longueur du fil est donnée par l’intégrale
e 1 + X',/2
c) En appliquant le théorème des extrema liés, montrer que x{z) doit satifaire
l’équation
XJ
(z + A) =K
V l + x'^
où A et i f sont deux constantes.
d ) Effectuer ensuite l’intégration de cette équation en procédant comme dans
l’exercice précédent et donner les équations permettant de déterminer A et K .
P ro b lèm e 3.5 - M in im isatio n de chem in o p tiq u e

Le but du problème est de trouver une loi décrivant la déviation d’un rayon
lumineux par l’atmosphère. Le rayon étudié arrive en un point B dans la
haute atmosphère (pour laquelle l’altitude y sera considérée comme infinie
pour simplifier) sous un angle d ’incidence 9i comme indiqué sur la figure 1. Le
rayon traverse ensuite l’atmosphère et arrive au sol au point A{x = 0, y = 0)
sous un angle d ’incidence Oq par rapport à la verticale locale.
La trajectoire du rayon est contenue dans le plan d ’incidence xAy et est décrite
par une fonction x(y) pour laquelle on posera x'(y) = tan^. La propagation de
ce rayon s’effectue de telle sorte que son chemin optique, défini par l’intégrale
nB
J = n{x,y) ds
JA
soit minimum. Dans cette intégrale, ds = y/dx“ ^ + dy^ et n{x, y) est l’indice de
réfraction de l’air. On supposera que cet indice est une fonction affine de la
densité de l’air p{y), cette densité étant elle-même fonction de y uniquement,
n{x, y) = n{y) = 1 + Cp{y)

C étant une constante. Dans un premier temps, la densité sera prise sous la
forme
p{y) = PO
yd étant une constante positive et po la densité de l’air au niveau du sol.

a) Ecrire le principe variationnel sous la forme
<5 F{x',y)dy'^ = 0
où F est une fonction que l’on explicitera à l’aide des données.

b) En déduire l’existence d ’une constante de la trajectoire, que l’on notera D
et que l’on fixera par la condition æ'(oo) = tandi.
c) Trouver ensuite a:'(0) = tan do et en déduire une relation simple entre
no = n(0), sindo et sindj, dont on donnera une interprétation physique.
d) Un modèle plus simple d ’atmosphère terrestre consiste à supposer que la
densité de l’air varie linéairement de la valeur po au niveau de la mer jusqu’à
la valeur 0 non pas à l’infini, mais à une altitude H :
p(y) = do
(-B
Dire ce qui doit être changé par rapport au cas précédent. Le résultat vous
paraît-il surprenant ?
3.8. PROBLEMES 125
P ro b lèm e 3.6 - G éodésiques s u r u n cône

On considère un cône donné par l’équation en coordonnées cylindriques
(p,(p,z) :
Z = h —Pp, ^ > 0 .
a) Ecrire le carré de l’élément de longueur ds^ = dx^ + + dz“

^ restreint à
la surface du cône, sur laquelle on a
x = pcos(p y = psincp, z = h —^p.
b) En choisissant peiip comme coordonnées curvilignes sur la surface du cône,

formuler le principe variationnel conduisant à la définition du chemin le plus
court entre deux points sur la surface conique.
c) En supposant que la courbe cherchée est donnée sous la forme p = p(<^),
écrire l’équation d ’Euler-Lagrange vérifiée par cette fonction afin de satisfaire
au principe variationnel formulé ci-dessus.
d) La variable (p n’apparaissant pas explicitement dans le principe variationnel,
écrire l’intégrale première correspondante sous forme de constante. En déduire
l’équation différentielle de premier ordre vérifiée par p{<p).
e) Intégrer et trouver la solution complète joignant deux points définis par
p i,p \ et p2 ,<P2 - On rappelle que
I —
du
uyu^ —1
. 1
= Arccos—.
U
f) En découpant le cône le long d’une droite passant par son sommet, dans le
plan vertical, on peut l’étaler sur un plan sans modifier les distances entre les
points appartenant à sa surface. Dans ce cas, on peut introduire un nouveau
paramétrage.
U = y r + ÿ p cos ^ , v= sin ^
Trouvez l’espression du carré de l’élément de longueur ds^ sur le cône exprimé

à l’aide des différentielles du et dv.
g) Trouvez la métrique induite ppp, Qp^ = g^p, g^^p sur le cône en fonction des
variables internes p et ip, ainsi que son matrice inverse. Trouvez les symboles
de Christoffel
_ 1
• jk ~ — dmgik)
et écrivez les deux équations de la géodésique sur le cône.
P ro b lèm e 3.7 - G éodésiques s u r une sp h ère

Dans ce problème il s’agit de trouver les géodésiques sur une sphère par
deux méthodes différentes :
• Calcul direct, avec la métrique induite sur la sphère, ses symboles de
Christoffel et l’équation explicite,
• En traitant le problème comme variation avec contrainte (extrémum lié),
avec l’équation implicite de la sphère servant de contrainte dans un problème
variattionnel formulé en trois dimensions Euclidiennes.
Bien évidemment, les deux méthodes conduisent au même résultat.
L’équation implicite d ’une sphère de rayon R, centrée à l’origine du système
des coordonnées cartésiennes s’écrit comme suit :
x^ + y^ + z^ = R^.
La sphère peut être paramétrisée avec deux angles, 0 < ^ < 7 r , 0<y><27r:
æ = iîsin 0 cosi^, y = iîsin0sin(^, z = Roos 6 .
a) Trouvez l’expression du carré de l’élément de longueur ds^ = dx'^+dy'^+dz'^

restreint à la surface de la sphère, en fonction des différentielles dd et dtp et R
uniquement. En déduire le tenseur métrique induit sur la sphère et donner ses
composantes explicitement, g$e, 9e<p = Qipei 9<р<р-
b) Calculez les symboles de Christoffel et écrivez deux équations différentielles
provenant de l’équation des géodésiques, correspondant aux variables в et ip.
c) Trouver la solution sous forme implicite qui donne в = ${p) en effectuant
le changement de la coordonnée
cosO
U =
sin 0 ’
L’équation différentielle vérifiée par la fonction u{p) peut être résolue facile
ment.
d) Trouver ce résultat en utilisant l’équation de la sphère comme contrainte
définissant l’extrémum conditionnel, et en utilisant le principe variattionnel
modifié :
ds — 0.
Chapitre 4
Formalisme hamiltonien
4.1 Introduction
4.1.1 Préambule
Le formalisme lagrangien permet la description du mouvement des systèmes
mécaniques complexes avec un libre choix de paramétrisation. Les équations
de Lagrange gardent leur forme lors du passage d ’un système des coordonnées
généralisées à un autre. Cette propriété de covariance facilite énormément la
mise en équations des systèmes décrits par les paramètres le mieux adaptés,
tenant compte de la symétrie du problème et des contraintes imposées. Il suffit
de connaître la forme de l’énergie cinétique du système ainsi que l’expression
de son énergie potentielle : la différence fournit la fonction de Lagrange du
système, dont on dérive les équations à partir du principe variationnel mini
misant l’action
S = j L {q\q^,t)dt.
Mais les N équations différentielles qui en résultent sont du deuxième ordre, et

le plus souvent ne se prêtent pas à une intégration facile. En outre, la fonction
de Lagrange ne représente aucune quantité physique mesurable, contrairement
à l’énergie qui est conservée dans les systèmes isolés sans frottement.
Le cas d ’oscillateur harmonique fournit un bon exemple montrant comment
on peut remplacer un système de N équations différentielles du second ordre
pax 2N équations du premier ordre. Dans le cas d ’une dimension, il suffit d ’in
troduire une variable auxiliaire : la vitesse, en posant y = x, ce qui permettra
d ’écrire deux équations du premier ordre remplaçant l’équation d’oscillateur
harmonique :
(Px 0 dx dy 0
-d P = -^ = T t= -^
128 CHAPITRE 4. FORMALISME HAMILTONIEN
On peut donc remplacer les N équations de Lagrange par 2 N équations du

premier ordre, en introduisant les variables auxiliaires appelées “impulsions
généralisées” , et qui ne sont autres que les dérivées partielles de la fonction
de Lagrange par rapport aux vitesses généralisées. Parallèlement, la fonction
de Lagrange est remplacée par la fonction correspondant à l’énergie totale du
système, exprimée en tant que fonction de vitesses et d ’impulsions généralisées,
et c’est cette nouvelle fonction qui sert à définir un nouveau prioncipe varia
tionnel aboutissant au système des 2N équations différentielles de premier
ordre.
Ce système particulier possède de nouvelles qualités, dont la plus impor
tante est la possibilité d’introduire de nouvelles transformations non seulement
entre coordonnées généralisées, comme cela était déjà possible en formalisme
lagrangien, mais entre coordonnées et impulsions généralisées. Ces transforma
tions préservent la forme du système d ’équations dites équations de Hamilton,
permettant ainsi de simplifier des problèmes autrement impossibles à traiter
par méthodes lagrangiennes.
Les coordonnées et des impulsions généralisées constituent l’éspace des
phases du système. Les 2N équations différentielles de premier ordre portent le
nom d ’équations canoniques de Hamilton, et les transformations généralisées
qui conservent la forme des équations de Hamilton s’appellent transformations
canoniques.
Le formalisme Hamiltonien joue un rôle très important en mécanique quan
tique.
4.1.2 Impulsions généralisées. Espace des phases

Nous avons vu dans le chapitre consacré au formalisme lagrangien l’appa
rition d ’une constante de mouvement importante, appelée énergie totale pour
systèmes conservatifs dont le lagrangien ne dépendait pas explicitement du
temps t. Cette constante était obtenue par la formule
(4.1)
Bien que la fonction de Lagrange L ait la même dimension physique que

l’énergie E, elle n ’est pas directement mesurable ; en revanche, il est possible
de faire un bilan d ’énergie qui est une donnée physique bien observable (on
peut s’en apercevoir en consultant votre facture EDF, par exemple !)
Il est donc tout à fait naturel d ’essayer de trouver une formulation du
principe variationnel basée non pas sur la fonction de Lagrange, mais sur
l’énergie. Une telle formulation a été introduite par le mathématician Irlandais
William Rowan Hamilton (1805 —1865).
Le premier pas dans le passage du formalisme lagrangien au formalisme

Hamiltonien consiste en l’introduction de nouvelles variables, dites impulsions
généralisées, notées pk, qui devront remplacer les vitesses généralisées g*. Leur
définition est inspirée par la forme de la constante d’énergie (4.1) :
dL
Pk = (4.2)
dq^ '
(Ici, nous introduisons la convention selon laquelle les quantités obtenues par
dérivation d ’une fonction par rapport aux variables avec indice haut affichent
le même indice bas, et vice versa.)
Les impulsions généralisées s’obtiennent donc à partir du lagrangien, et
deviennent fonctions des vitesses et coordonnées généralisées :pk =Pk (çN Q^)-
Toutefois, si nous voulons remplacer l’ensemble des coordonnées et vitesses
par l’ensemble des coordonnées et impulsions généralisées, il nous faudra pou
voir exprimer les vitesses g*’ comme fonctions des pk- D’après le théorème de
fonctions inverses, ceci est possible à condition que la matrice Jacobienne faite
de dérivées partielles des pk par rapport aux vitesses g* soit non nulle :
^ d^L '
d e .( |f ) = d e t ^0.
dq^dq^
En supposant que c’est le cas (sauf peut-être dans quelques points singuliers),
nous aurons la possibilité d’exprimer les vitesses généralisées comme fonctions
des Pk et g*. En voici l’exemple - pas trop original, car évoquant toujours
les coordonnées sphériques. Le lagrangien d ’une masse ponctuelle m dans le
champ d ’un astre central de masse M est bien connu ; le voici en coordonnées
cartésiennes :
, ^ m f .n ,9 .9\ GM m
En coordonnées sphériques (r, 9, <p) il devient :

GM m
L = T - V = ^ {f-\-r'^è'^ + r'^sin^0<p'^) +
Dans le système cartésien la correspondance entre les impulsions et les vitesses

est très simple : nous voyons immédiatement que
Px = m x, py = m ÿ, pz = m z, et inversement, x = Px
— , y = Pv
-^ , z —Pz
—.
m m m
En coordonnées sphériques les relations sont beaucoup moins évidentes :
Pr = m r , pe = 6, p ^ = sin ^ 9 ip,
et inversement,
r=— e= ÿ,=
m' mr"^ ’ mr"^ sin^ 9
Effectivement, ces expressions perdent leur sens quand r = 0 ou quand

sinô = 0; mais on peut ne pas s’en soucier quand on décrit un mouvement
d’un satellite qui se trouve dans le plan équatorial (ou sin0 1), et très loin
de r = 0 (centre de la Terre).
L’ensemble des coordonnées et d ’impulsions généralisées, que l’on appelle

parfois variables canoniques, forme l’espace des phases dont la dimension est
2N, N étant le nombre de degrés de liberté du système. Il est à noter que
ces variables contiennent plus d ’information que les variables utilisées dans le
formalisme de Lagrange.
L’ensemble de coordonnées et vitesses généralisées (g*, contenait l’infor
mation concernant uniquement les aspects cinématiques du système mécanique
considéré, sans rapport quelconque avec les forces et les masses impliquées ; les
impulsions généralisées dérivant du lagrangien spécifique au système portent
une information dynamique.
L’énergie totale du système est égale à la somme de l’énergie cinétique et
de l’énergie potentielle : E = T + V , et représente une quantité conservée dans
le cas où la fonction de Lagrange L ne dépend pas de temps explicitement,
dL /dt = 0. Introduisons la fonction d’Hamilton, ou l’hamiltonien, en formant
l’expression suivante :
(4.3)
où toutes les vitesses généralisées sont exprimées en fonctions des coor

données et d ’impulsions généralisées. On vérifie aisément que H = T + V dans
le cas ou L ne dépend pas explicitement de t.
On peut donc inverser cette relation en exprimant le lagrangien L comme
somme des produits d ’impulsions généralisées par les vitesses généralisées cor
respondantes, moins la fonction de Hamilton, le tout exprimé uniquement en
fonction des pi et des q^, et insérer cette nouvelle fonction dans le principe
variationnel. Les variations iç* et Spk seront désormais traitées commme étant
totalement indépendantes.
4.2. PRINCIPE VARIATIONNEL. ÉQUATIONS DE HAMILTON 131
4.2 Principe variationnel. Équations de Hamilton

Muni de la nouvelle fonction H définie dans l’espace des phases nous pou
vons reformuler le principe variationnel de Lagrange de la manière suivante :
ft 2 pt2 N
6 Ldt = 5 Pi qHPjy - H{pj, t) dt = 0 (4.4)
Ju Jti U=1
En effectuant la variation indépendante des pi et g*’ et en ne gardant que la

partie linéaire on obtient :
rt2 N
dH dH
dt = 0. (4.5)
Jtl
Nos variables indépendantes étant à présent ç* et pk, nous devons exprimer

toutes les variations infinitésimales par l’ensemble des variations 5(f et 5 pk.
Dans l’expression (4.5) il faut donc transformer le terme contenant la variation
de la vitesse 5q'’. En utilisant la formule de Leibniz, on peut remplacer sous le
signe “somme” les termes Pkàq^ par la difféence de deux termes,
PkH ’" = ^ {Pk^q^) - ( ^ P k ^ Sq'^ = ^ iPkSq'^) - Pk àq’^-
Le principe variationnel peut être écrit à présent comme suit
dH
dt + (Pk^q'‘)dt = 0-
(4.6)
La dernière intégration est égale à la différence entre les valeurs aux bords de
la primitive de la dérivée totale qui se trouve sous le signe d ’intégrale, à savoir
/Ju‘2 ^ ^
{pkSq'^) dt = Pk(t2 ) 5q'‘{t2) - Pkih) Sç^{ti).
Comme d ’habitude, nous imposons l’annulation des variations aux bords du

segment d ’intégration, en ti et en t 2 , car nous voulons comparer entre eux
des parcours voisins commençant et terminant au même endroit. En revanche,
aucune condition n ’est nécessaire concernant les variations ôpk. On a donc
= 0 et ôq^{t2 ) = 0.
Par conséquent, le dernier terme dans (4.6) peut être considéré comme identi
quement nul. Dans l’intégrale restante il convient de regrouper les termes avec
les variations indépendantes Sq^ d ’un coté, et 5pk de l’autre :

N
d t = 0. (4.7)
Puisque les variations et Spk peuvent être considérées comme indépendantes,

chaque terme de la somme sous l’intégrale doit s’annuler séparément, ce qui
résulté en un ensemble de 2N équations :
ÈÛ. = = M. (4.8)
dt dt Ö9» •
Ce sont les équations canoniques de Hamilton. Nous avons donc 2N équations

différentielles du premier ordre pour les 2N fonctions ç*(i) et P k { t) à déterminer
à la place des N équations du second ordre en formalisme lagrangien, pour
déterminer les N fonctions q*(i). On peut vérifier leur validité sur quelques
exemples bien connus. Considérons l’oscillateur harmonique avec un degré de
liberté ( la généralisation aux plusieurs degrés de liberté est dans ce cas assez
évidente). La fonction de Lagrange du système est alors
™2
, X .Î.2
X , ^X2
k-T- = m —— k —
2 2 2
On trouve immédiatement l’impulsion généralisée

dL
donc x = — ,
m
ce qui permet d ’éliminer x en faveur de px dans l’expression de la fonction de
Hamilton :
H{px,x) = x ^ - L { x , x ) = - ^ + ’^ . (4.9)
On constate que cet hamiltonien ne dépend pas de t explicitement, comme le

lagrangien dont il dérive, et qu’il est égal à la somme de l’énergie cinétique et de
l’énergie potentielle, définissant donc l’énergie totale. Puisque dtH = 0, cette
quantité est conservée au cours du mouvement. Les équations de Hamilton
prennent la forme suivante :
dx dH Px dpx dH ,
(4.10)
dt dpx m'
On voit que la première équation du système (4.10) correspond à la définition
de l’impulsion généralisée, tandis que la seconde est l’équation dynamique de
l’oscillateur harmonique, m x = —kx.
4.3. CROCHETS DE POISSON 133
Un exemple un peu moins simpliste est fourni par le problème de Kepler.

Le lagrangien d’un point matériel de masse m gravitant autour d’un astre
central dont la masse M est très grande comparée à m, soit m /M ^ 0, prend
alors la forme bien connue
m r GM m
L= sin^ 6 —
Les impulsions généralisées sont donc

9L ,
P r ^ -Q T ^ m r , =
dL 2A 2 • 2 /) •
mrê, p^ = — = m r^sm êif, (4.11)
L’Hamiltonien s’obtient en appliquant la formule (4.3) :
I yj I GM m
H = r gjj^2 Q
2m J .2 J .2
Comme dans le formalisme lagrangien, les coordonnées cycliques (dont l’hamil

tonien ne dépend pas explicitement) produisent les constantes de mouvement.
Ici l’hamiltonien ne dépend pas de l’angle azimutal (p, par conséquent nous
obtenons une constante de mouvement
dp^ dH _ 2 • 2a ^ J.
—— = —^ = 0 Pu> = rnr sm 6 = Const.
dt 0 (p ^
Parmi les cinq équations canoniques restantes, trois (celles qui contiennent les
dérivées partielles par rapport aux impulsions généralisées) coïncident avec
les définitions de ces impulsions les exprimant comme fonctions des vitesses
généralisées et les coordonnées, tandis que deux restantes constituent de vraies
équations dynamiques :
dpr dH - J L P% GM m
+
dt dr mr^ mr^ sin^ 6
dpg _ dH _ cos^
(4.12)
dt d6 mr^ sin^ 0 '
4.3 Crochets de Poisson

Les équations canoniques de Hamilton (4.8) permettent d ’exprimer de
manière aussi élégante qu’inattendue la dérivée totale par rapport au temps
d ’une fonction arbitraire dépendant des variables canoniques ; une dépendance
explicite de temps n’est pas exclue. Soit donc / = f(pi, g*', t) ; on a, bien
évidemment,
dt dt dq^ dt dpi d t' '

où l’on sous-entend la sommation par rapport à l’indice i de 1 à N, selon

la convention d’Einstein. Maintenant substituons les expressions des dérivées
temporelles des impulsions et des coordonnées généralisées à partir des équa
tions canoniques (4.8) ; on obtient alors
d f dH d lO H
(4.14)
dt dt dq^ dpi dpi dq^ ’
ce qui peut être écrit de manière compacte en utilisant un nouveau symbole,
introduit par D. Poisson, appelé crochet de Poisson :
fX (4.15)
avec la définition suivante du crochet de Poisson de deux fonctions dépendant

de l’ensemble des variables (q*,Pfc,i) :
= §fi§§i - (4.16)
De manière évidente, le crochet de Poisson est antisymétrique dans ses deux

arguments :
= (4.17)
Une autre importante propriété des crochets de Poisson est l’identité de Jacobi
vérifiée par trois fonctions arbitraires définies sur l’espace des phases : en
formant le crochet de Poisson de / avec g et ensuite le crochet de la nouvelle
fonction ainsi obtenue avec la troisième fonction h et en prenant la somme des
trois permutations cycliques on obtient toujours zéro ;
{/. {g, h}} + {g, {h, /}} + {h, {/, = 0. (4.18)
La preuve de l’identité (4.18) se fait par calcul direct, qui prend au moins une
page et ne sera pas montrée ici.
Dans le cas où la fonction de Hamilton H ne dépend pas du temps t
explicitement elle garde une valeur constante au cours du mouvement, car par
définition, si ^ = 0, on aura
f = { » .« } = 0 (4.19)
à cause de l’antisymétrie du crochet de Poisson, puisque dans ce cas précis il

est égal à lui-même avec le signe opposé. Toute fonction ne dépendant expli
citement du temps t verra sa dérivée temporelle exprimée à l’aide de crochet
de Poisson avec la fonction de Hamilton H :
SI = 0. (4.20)
dt
4.3. CROCHETS DE POISSON 135
Le crochet de Poisson induit une dérivation, un opérateur difffentiel linéaire

agissant sur l’algèbre des fonctions définies sur l’espace des phases : on vérifie
sans peine qu’ils vérifient deux postulats caractérisant les dérivations, la dis
tributivité par rapport à la somme et multiplication par des constantes, et la
règle de Leibniz :
[f,agi -h 652} = a + b { /,52}

et {/, g m } = { / , 9i) 92 + 91 { / , 9 2 }- (4.21)
L’algèbre des fonctions différentiables définies sur l’espace des phases, avec une
multiplication ordinaire, est une algèbre commutative,
f{P, 9. i) 9(P> 9, t) = 9{P, 9, t) fip , 9. i)-
L’existence du crochet de Poisson définit une autre structure algébrique sur
le même espace des fonctions, mais qui est non-commutative, car le nouveau
produit
if, 9 ) { / .9} = ~ { 9 ,f}
est anti-symétrique. Il est intéressant de constater que, grâce à l’identité de
Jacobi, le crochet de Poisson avec une fonction choisie / agit comme une
dérivation de l’algèbre de Poisson, car on peut écrire l’identité de Jacobi sous
forme suivante :
{ /,{ 91, 92}} = { { /,9i} ,92} + {9i , { / , 92}}- (4.22)
Enfin, il est intéressant de noter que, quel que soit le choix des coordonnées
et des impulsions généralisées, les crochets de Poisson entre ces variables ca
noniques ont toujours la même forme :
{Pi,Pj} = 0, {9*,9*} = 0, {Pi,9'‘} = Sf- (4.23)
L’identité de Jacobi vérifiée par les crochets de Poisson permet de construire
de nouvelles constantes de mouvement à partir des constantes déjà connues.
En effet, soient f{p, q) et g(p, q) deux constantes de mouvement, ce qui veut
dire que leurs crochets de Poisson avec le hamiltonien H{p,q) sont nuis :
I = I + { ^ ,/ } = Î H , / ) = 0, 1 = 1 + = { H . , } = 0.
Considérons maintenant le crochet de Poisson du hamiltonien H avec le cro
chet de Poisson entre { /,9}, soit {H, { / ,9}}. Grâce à l’identité de Jacobi on
trouve que
{H, {/, 9}} = - { / , {9, if}} - {9, {H, /} } = - { / , 0} - {g, 0} = 0, (4.24)
ce qui prouve que {/, g} est une constante du mouvement.
4.4 Transformations canoniques

Les équations de Hamilton traitent les deux ensembles de paramètres, les
coordonnées q* et les impulsions généralisées sur un pied d ’égalité. Par
conséquent, vient à l’esprit l’idée que le système d ’équations canoniques pour
rait garder sa forme non seulement après un changement des coordonnées
9* - 4 mais aussi après une transformation mélangeant les coordonnées
et les impulsions :
(q\ Pk) iQ^{q\Pk), Pl{{q\Pk)‘ (4.25)

Bien évidemment, il faut vérifier s’il n’y a pas de conditions particulières à im
poser sur une telle transfromation afin que les équations canoniques puissent
garder leur forme intacte. Avant toute chose, nous voudrions que les transfor
mations en question soient inversibles.
Comme on le sait, la condition nécessaire et suffisante est la non-annulation
du déterminant de la matrice Jacobienne ;
/ dQ^ dQi \
S £ (4-26)
\ 3g" dp, /
ce qui assure l’existence de la transformation inverse,
(Q -, P i)-^ m Q ^ ,P i),P k { Q ”^,Pi)).

Les équations canoniques produits à partir de la fonction de Hamilton (appelée
désormais ’’hamiltonien”) résultent du principe variationnel
/■‘2
^ P d - H ( p k ,q n dt = 0. (4.27)
Si un nouveau système d ’équations canoniques reste valable après la transfor

mation (4.25), il doit pouvoir s’écrire de la manière suivante :
dQ^ dH dPk dH
(4.28)
dt dPi' dt
où H est la nouvelle fonction de Hamilton. Rappelons que, dans le cadre de la
mécanique lagrangienne, la nouvelle fonction de Lagrange s’obtient, après la
transformation des coordonnées, par une simple substitution des variables :
¿(Q ^ Q^) = L {q \Q ^), q \Q \ (4.29)

Il s’en suit que, tant que le passage entre les anciennes (pi, q^) et les nouvelles
{Pj, Q^) variables canoniques ne touche que les coordonnées, la nouvelle fonc
tion de Hamilton est obtenue de la même façon, en prenant l’ancienne fonction
4.4. TRANSFORMATIONS CANONIQUES 137
H{pù <l^) et en substituant la dépendancepi(Pj, et q^{Q^). Mais nous pou

vons envosager le cas plus général, quand on a Pi{Pj, Q ^) et q'îPj, Q^)-
La question de l’invariance du système canonique d ’équations de Hamilton
peut être posée ainsi : sous quelles conditions le principe variationnel (4.27) le
nouveau principe variationnel, équivalent au précédent.
\^ W - H { P k ,Q n dt = 0. (4.30)
avec, bien évidemment, les conditions supplémentaires
V ( i i ) = 0, Sq\t2) = 0, ôpkih) = 0, 5pk{t2) = 0,
ainsi que
5 Q % ) = 0, Ô Q % )= 0 , ÔPk{ti) = 0, SPk{t2 ) = 0.
En tenant compte de ces conditions, on peut remplacer les deux principes

variationnels par un seul : afin que les équations canoniques soient vérifiées tant
par les anciennes, que par les nouvelles variables canoniques et les hamiltoniens
ancien et nouveau, il faut et il suffit d ’annuler la différence des deux variations ;
\ ^ ( p iq '- P i Q ') - [ H ( p k ,q n - H { P k ,Q n ^ dt = 0. (4.31)
Démontrons que la condition (4.31) équivaut à l’existence d ’une seule fonction

dépendant de 2N variables canoniques et du temps f, $(Pi,Q*’;<) telle que
N
P a ) - [ H { p k ,q n - H { P k ,Q '^ ) ]
i=l
Remarquons dès maintenant que, puisque les nouvelles variables canoniques
sont fonctions des anciennes variables canoniques, on peut choisir n ’importe
quel ensemble de 2 N variables parmi les 4N variables anciennes et nouvelles :
par exemple, les anciennes et les nouvelles coordonnées généralisées (ç*,i?*’),
ou les anciennes impulsions et les nouvelles coordonnées, (pi, Q*'), ou un autre
choix encore. Sous la forme (4.31) le choix naturel qui s’impose est le mélange
des anciennes et nouvelles coordonnées, (ç*,Q*')-
Mais revenons au raisonnement fondamental. Si notre hypothèse est var
labié, la variation totale de la fonctionnelle définie par l’intégrale (4.32) doit
s’annuler, puisque l’intégrale d ’une différentielle exacte ne dépend que de ses
valeurs aux bords, imposées d ’avance.
On aura donc l’égalité
ft 2 r N ft 2
'/Jtl E W ' - P‘Q*) - «” ) - « ” )1 dt Jtl dt
dt
,¿=1
=r ^ i" = I (§ + H '" = “■
En prenant en compte les conditions aux limites imposées, l’égalité est effec
tivement vérifiée. Ici nous avons choisi les variables nouvelles (Q*,Pfe), mais
le résultat aurait été le même avec un autre choix également. La fonction $
introduite ici s’appelle fonction génératrice de la transformation canonique
considérée.
En multipliant par la différentielle dt, on peut représenter notre condition
(4.33), compte tenu que les bornes de l’intégration sont arbitraires, comme
suit :
N
YîPiàd - PidQ^) - [H{pk, q^) - H{Pk, Q'^)]dt = d#(Q ^ Pk\t). (4.34)
i=l
Nous savons qu’il existe 2N relations bi-univoques entre les AN variables
{q \P o ) ^ { Q '^ . P n ) . {Q ^ ,P n ) -4 { q \ p j) ,
ce qui permet de choisir à volonté le sous-ensemble des 2 N variables qui seront

traitées comme indépendantes, les 2 N variables restantes pouvant être ex
primées comme leurs fonctions. Au vu de l’expression (4.34) ci-dessus, le choix
qui s’impose est l’ensemble des anciennes et nouvelles coordonnées (g*, <3*’)
dont les différentielles figurent explicitement sous la somme.
En choisissant la fonction génératrice en tant qu’une fonction des var
riables (ç*,Q*’), on identifie immédiatement les dérivées partielles de avec
les anciennes et nouvelles impulsions généralisées :
-P u -■57îir=-nfe. et aussi H = H + (4.35)

dt '■
On peut définir une autre fonction génératrice en ajoutant un terme bien
choisi. La fonction génératrice $i(g*, Q*) dépendait uniquement des anciennes
et nouvelles coordonnées. Nous pouvons choisir une autre fonction génératrice,
dépendant des anciennes coordonnées ç* et de nouvelles impulsions P*. Pour
la trouver, définissons $ comme suit :
N
^ = - ' £ P i Q ' + M q \P k \t).
i= l
On aura alors une nouvelle relation :
¿(P idç* - PidQ^) - [H(pk, D - H{Pk, Q n]dt =
N N
= = - X ; dPiQ^ - 5 3 PidQ^ + d ^ 2 {q\ Pk\t), (4.36)
i=l i=l
ce qui conduit à une nouvelle identification
N
Yî-dpiq^ + Q^dPi) - [H(pk, - H{Pk, Q'^)]dt = d ^ 2 (q\ Pk\t), (4.37)
i=l
d ’où
d^2 9^2 ^ • £r ZT . ^ ^ 2
“ Pi) oTT ~ aussi H = H +
dqi dPk ....................... ' d t '
On peut faire encore deux choix différents parmi les anciennes et nouvelles
variables :
N
i=l
conduisant aux relations
i 9^3 9^3
q, - 9Q^ — Pk, et aussi H = H + 9t ’ (4.39)
9pi
et finalement
N N
$ = E Pi9* - E P iQ '+ ^4(pi, Pk-, t).
i=l i=l
conduisant aux relations
.^ = n ^ ^ et aussi H = H + (4.40)
9pi 9t '
On peut remarquer ici que l’ensemble des transformations canoniques forme
un groupe. Par définition, dans un groupe on doit avoir une loi de composition
assotiative, un élément neutre dont la composition avec n’importe quel autre
élément ne le modifie pas, et chaque élément doit avoir un élément inverse, la
composition avec lequel donne comme résultat l’élément neutre (appelé aussi
l’unité du groupe.
En effet, si l’on a deux transformations canoniques engendrées par les fonc
tions génératrices et $ 2>leur superposition est tout simplément la transfor
mation canonique engendrée paj la somme de ces deux fonctions, $3 = $i-l-$2*
L’élément neutre est la transformation identité, qui ne change pas les variables :
( P i = P i, = q^\ Finalement, à chaque transformation canonique engendrée

par sa fonction génératrice $ on peut faire correspondre la transformation
inverse engendrée par la fornction génératrice —
Un autre critère permettant de décider si une transformation est canonique
est basé sur l’invariance des crochets de Poisson. Si la transformation
est canonique, les crochets de Poisson entre deux fonctions définies sur l’espace
des phases gardent leurs valeurs :
{ /,5 } ( p .,) = {Lg}(P,Q), f{P " ,Q ^ ) = fiP iiP m ,Q ^ q H P m ,Q % (4.41)
En particulier, cela veut dire que les crochets de Poisson entre les variables
canoniques elles-mêmes restent inchangés. Autrement dit, on peut prouver
que, pour que le passage de l’ensemble des variables canoniques (pi,q^) vers
un nouvel ensemble {Pj{pi,q'^),Q'^{Pi,^)) soit canonique, c’est à dire garde
les équations canoniques de Hamilton invariantes, il faut et il suffit que les
crochets de Poisson entre les nouvelles variables (Pj,Q ^) calculés avec les
anciennes variables canoniques gardent les mêmes valeurs que les variables
canoniques anciennes, soit
{ P i , P j}(p ,q ) = 0, { P i ,Q ^ } ( p ,q ) — î , {Q ^ ,Q ^ }(p ,q ) — (4.42)
La preuve s’étend sur quelques pages, et nous ne la donnons pas ici.
E xem ple 1 : l’oscillateur harmonique.

Considérons le hamiltonien bien connu de l’oscillateur harmonique en une
dimension. Le lagrangien dépendant de la variable unique x et de la vitesse x
est bien connu :
kx"^
L= T-U= ^
Y
Le hamiltonien s’écrit immédiatement en fonction de l’impulsion généralisée
dL
P - ^ = mx
comme suit :
j_
p^ -h , (4.43)
2m
où nous avons introduit = k/m . La forme du hamiltonien suggère le pas
sage aux variables P{p,x) et Q(p,x) rendant une des variables (choisissons Q,
par exemple) cyclique, c’est-à-dire, n ’apparaissant pas explicitement dans le
nouvel hamiltonien H{P,Q) = H{p{P,x),q{P,x)). La somme des carrés dans

l’expression de H dans (4.10) pourrait donner cet effet si l’on utilisait deux
fonctions trigonométriques, sin Q et cos Q comme suit :
P — f(P ) cos Q, X = sin Q. (4.44)

mu
En effet, en substituant ces expressions dans (4.10), on voit facilement que
2m I
Mais cela ne suffit pas pour rendre cette transformation canonique. Il faut
que les crochets de Poisson soient conservés ; dans ce cas précis, nous devons
vérifier une seule relation, {p, æ}(p_g) = 1. Calculons donc le seul crochet de
Poisson non identiquement nul, à savoir,
, , dp dx dp dx
{P.®}(P,Q) - QpQQ - dQ dP ~
qui doit être égal à 1 pour que la transformation soit effectivement canonique.
Un calcul facile nous montre que (où f = - ^ ) •
^ = /'co8<3. g = X .sm <3 ^ = -/s m Q , ^ = X oosQ,
En insérant ces expressions dans le crochet de Poisson entre p et x on trouve

la condition que la fonction f{P) doit vérifier afin que la transformation soit
canonique :
_ dp dx dp dx ff ,
\P^^HP,Q) QPQQ QQQp = ^— (cos^Q + sin^ Q) = — = 1.
’ mu
Nous devons donc résoudre l’équation différentielle :
— = 1 Æ = 2rnw.
mu aP
L’intégration est immédiate, et donne la solution pour / ( P) :
/( P ) = V2rnwP
A présent nous avons le droit d’utiliser les équations de Hamilton avec les nou
velles variables et le nouveau hamiltonien H = uP . Les équations canoniques
peuvent s’écrire facilement comme suit :
m dP
= u, (4.45)
dt dP dt dQ
d ’où il vient que

Q{t) = iot + S, P = Pq = Constante.
S et Pq étant des constantes d ’intégration, pouvant être fixées par les conditions
initiales. Le fait que la nouvelle impulsion généralisée P reste constante, ne
doit pas surprendre, car le hamiltonien H = u)P doit rester constant en vertu
du théorème qui dit que l’énergie reste constante si le hamiltonien ne dépend
pas explicitement du temps t. Maintenant il est facile de revenir aux anciennes
variables : la solution complète du problème est donc
P = \/2mwPo cos(wi + 5), x = sin(a;t + S).

mu
E xem ple 2 : l’utilisation d ’une transformation canonique pour résoudre

un problème non-linéaire.
Considérons le hamiltonien suivant :
H(p, q) = 2p^ - + q + 2q^.
Les équations de Hamilton qui en résultent sont hautement non-linéaires :
dq dH dp dH „ ,
= 4 p -4 q \ V ,
dt dp
et ont peu de chances d ’être résolues directement. Cherchons un couple des
fonctions P(p, q) et Q{p, q) rendant le même hamiltonien beaucoup plus simple.
Avec un peu de chance et d ’intuituion, on remarque qu’en posant
P = p - q ^ et Q = q + { p - q^Ÿ,
on peut écrire
P (P ,Q ) = P2 + Q.
(La vérification ne prend qu’une minute). A présent, il faut vérifier si cette
transformation est canonique. Dans le cas d’une dimension (un seul couple des
variables canoniques) il suffit de vérifier que le crochet de Poisson antre P et
Q vaut exactement 1. En voici la preuve :
f f - f f = (1) • «")) - (-25) • (2 (P - «“)) = !■

Forts de ce constat, nous pouvons procéder à la solution du système d ’équations
canoniques en nouvelles coordonnées et hamiltonien très simple, H{P,Q) =
P^ -t- Q. Les équations canoniques s’écrivent maintenenat comme suit :
^ = -1 ^ ^ = 2P (4.46)
d t ~ d Q ~ ' d t dP
4.5. FONCTIONNELLE DE JACOBI. L ’ANALOGIE OPTIQUE 143
Ce système s’intégre sans difficulté, pour donnr le résultat escompté :
P(t) = Po - i, Q{t) = Qo + 2 Pot - 1 ^. (4.47)
Comme il se doit, l’expression
H = P“
^ + Q = Pq - 2Pqî + t^ + {Qo + 2P qî - t^) = Pq +Qo = Const.
reste constante pendant le mouvement.
4.5 Fonctionnelle de Jacobi. L’analogie optique

Pour les systèmes conservatifs le principe variationnel peut être simplifié
grâce à l’existence d’un potentiel la conservation de l’énergie. Cette version
particulière du principe variationnel en mécanique est due à Pierre L.M. Mau-
pertuis (1698-1759). On maintient la condition d ’annulation des variations des
coordonnées aux bornes d’intégration, Sq^{ti) = 0, 5q®(Î2) = 0, mais on res
treint les variations par une condition supplémentaire
S T - J 2 Qi^<i. Qi = Qi
1=1 ^
où / est le nombre des degrés de liberté du système, et les Qi sont les forces
généralisées, tandis que a parcourt les valeurs de 1 à 3iV, nombre des coor
données cartésiennes du système de points matériels.
On voit facilement que cela revient à la conservation de l’énergie totale su
système, car cette égalité dit que
5T = -SV, soit 6T + 6 V = 5{T + V) = ôE = 0.
Dans ce cas nous pouvons énoncer le preincipe variationnel suivant (le principe
de Maupertuis) :
5 f ^ T d t = 0, avec 5E = Q et 5q\t{) = 0, 5 q \ t 2 ) = 0. (4.48)

Jti
Dans la plupart des systèmes mécaniques étudiés, on peut constater que
l’énergie cinétique du système est un polynôme quadratique homogène en
dérivées temporelles des coordonnées généralisées, avec coefficients fonctions
des coordonnées :
r= 5 E (4.49)
conduisant aussi à la relation d ’Euler :
dT _
(4.50)
Pour les systèmes non-dissipatifs (en l’absence de frottement) nous avons aussi
l’intégrale première d ’énergie qui reste constante au cours du mouvement :
E = T + V = Const., T = E - V{q^).
En admettant que T ^ 0, à partir de la formule (4.49) écrite un peu autrement :
T { d tŸ = l ¿
j,k=l
on peut exprimer la différentielle dt de la manière suivante
Dj,fc=i 0>jk{q^)<k^
dt = (4.51)
2 {E -V {q )) ■
Supposons à présent que nous sommes intéressés avant tout par la trajectoire,
en laissant pour l’instant de côté la loi horaire du mouvement. On peut par
ramétrer la trajectoire par sa longueur propre s, soit = q^{s). Nous pourrons
alors écrire _______ ____
dt = ds (4.52)
\ 2 {E -V {q ))
L’ensemble de ces relations permet d ’éliminer le temps t du principe variation
nel initial, en formulant le principe suivant à partir du principe de Maupertuis :
5 r 2Tdt = 6 r 2(E - V{q'^)) ^ d s = 0 (4.53)

J ti Jai ds
Nous avons délibérément multiplié l’intégrale par 2 afin de pouvoir simplifier
l’expression finale que l’on obtient en insérant la forme explicite de la dérivée
dt/dsy puisque
dt S jfc i
ds ■'I 2(E-V(q)) ’
On peut donc écrire le principe variationnel (4.53) comme suit :
/
.A dq^ dq^
(4.54)
^
\\ j,k=l
^jk{q^)
ds ds
ds — 0,
4.5. FONCTIONNELLE DE JACOBI. L ’ANALOGIE OPTIQUE 145
avec Sq^{si) = 0, Sq'^{s2 ) = 0.

Sous cette forme, le principe variationnel porte le nom du principe de
Jacobi. Toutes les coordonnées sont ici fonctions de la longueur d ’arc s; le
temps n’apparait pas explicitement. En introduisant la fonction de Jacobi
^ dq^ dq^
J = y / 2 { E- V{ qk) )
on peut écrire les équations d ’Euler-Lagrange résultant du principe variation

nel (4.54) :
dsdq^ dq^ ’ ^ ds '

La solution de ces équations représente la trajectoire du système, 9^(s), pa
ramétrée à l’aide de s. A partir de là, on peut récupérer la loi de mouvement
en intégrant la relation (4.52) :
ojM) g #
-io= r ds, (4.55)
Jso \ 2(E-V(q))
et ensuite, trouver la fonction inverse s = s{t).

Dans le cas d’un point matériel de masse m soumi aux forces dérivant d ’un
potentiel V et une ou deux contraintes, (f degrés de liberté, / = 1,2 ou 3 s’il
n ’y a pas de contraintes) on a
dq^ dq^
A 2^ —ds — a j k - ^ - ^ d t = \ / ^ = y/rnvdt = s/mds,
^ j,k=i ds ds
et le principe variationnel de Jacobi devient
5 Î yjE —Vds = 0, avec ôq'°{si) = 0, (5ç^(«2) = 0. (4.56)

JSi
Hamilton a noté la ressemblance de ce principe variationnel avec le principe de
Fermât postulant que les rayons lumineux choisissent la trajectoire minimisant
le chemin optique :
s i n d s = 0, (4.57)
JSi
où n(r) représente le coefficient de réfraction du milieu dans lequel se propage
la lumière. Par conséquent, une particule de masse m et l’énergie conservée
E évoluant dans le champ d ’un potentiel V(r) se comporte comme une rayon
lumineux dans un milieu fictif dont l’indice de réfraction est égal à
n(r) = ^ B - V ( r )
Cette analogie optique, permettant d ’identifier les trajectoires d ’une parti

cule avec les rayons perpendiculaires aux fronts d ’ondes a été cruciale dans
l’établissement de mécanique ondulatoire par Erwin Schrödinger en 1926.
4.6 L’équation de Hamilton-Jacobi

Cette équation, basée sur un choix bien particulier de fonction génératrice, est
en quelque sorte le couronnement de la méthode hamiltonienne en mécanique,
qui a par la suite joué un rôle important en physique quantique et en théorie
des champs. L’idée maîtresse est toute simple : pour un système hamiltonien
régi par les équations canoniques
m ^ _ _ d H
dpk' dt ~ dq>^' Â - 1 , ^ . . . , / , (4.58)
dt
on cherchera une transformation canonique
q^ = q^{Q, P, t), Pi = pi{Q, P, t),

après laquelle le nouvel hamiltonien s’annule :
H {Q \P i,t)= Q . (4.59)
Dans ce cas, les nouvelles équations canoniques
dQ^ dH dPjf dH
= 0, = 0, A: = 1 ,2 ,...,/, (4.60)
dt dPk dt dQ^
s’intégrent automatiquement donnant les 2 / constantes :
Q* = CK* = Const., Pk = = Const. (4.61)
Il ne reste alors qu’à effectuer la transformation canonique inverse pour obtenir

les solutions recherchées,
ç* = g*(Q,P,t) = q \ a ^ , S i , t), pj = p j{Q , P ,T ) = p j { a ^ , S i , t). (4.62)
Les 2 / constantes peuvent être fixées à partir de l’ensemble des conditions

initiales à l’instant t = tq.
q\a, S, to) = ?o. P j{oi, S, to) = Pjo-

4.6. L ’EQUATION DE HAMILTON-JACOBI 147
La fonction génératrice d ’une telle transformation canonique sera cherchée

sous la forme S = S(q, P, t), telle que
P i = 9S{q,P ,t)^ ) / 0. (4.63)

dqi ’ - dPl^ ’
Sachant que, conformément à (4.61), les nouvelles coordonnées et impul

sions généralisées Pk sont constantes, on peut remplacer Pk par ces constantes
a* et ydfe pour obtenir les identités caractéristiques pour le choix $ 2(?) -Pj t) de
la fonction, génératrice (4.38) :
BS(q,P,t) ^ aS(q,P ,t) ^ i , « : = l ,2 ..... / .
Pk = (4.64)
dq^ ’ dî
En rappelant que le hamiltonien transformé doit s’annuler :
H{Q, P, t) = H{q,p, t) + = 0, (4.65)
on peut écrire une équation contenant les dérivées partielles de la fonction

génératrice S, dite l’équation de Hamilton-Jacobi, établie par Gustav Jacobi
(1804-1851) :
тг ( r J / , 2 „f 9s ds ds Л I as _ n (4.66)
En principe donc, si l’on trouve la fonction génératrice S solution complète de

l’équation (4.66) ci-dessus, on pourra trouver les / constantes ensuite les
constantes a*, et finalement, par transformation canonique inverse, trouver les
2 / fonctions q*(t) et Pk{t).
Prouvons maintenant que les 2/ fonctions
q^ = q%a,P,t) et Pk == P k { a , ^ ,t)
obtenues à partir de 2 / relations implicites (4.64) vérifient les équations ca
noniques de Hamilton, avec l’ancien hamiltonien dépendant de q,p,t). On
commence la preuve en écrivant encore une fois, mais en spécifiant bien la
dépendance des variables q ,^ et t :
d S { q ,^ ,t)\ dS{q,P,t) ^ ^
H fi
’ dq^ôq- JJ ' dt
Dérivons cette relation par rapport aux variables g* et Pk '•
^ Х ая d'^S d'^S
(4.67)
dq^ “ dpk dq^dq^ dq^dt ’
X dH d'^S ^ n
(4.68)
^ dpk dfiidq'^ d0kdt ~ ’
Ensuite, dérivons par rapport au temps t les deux relations (4.64), en rappelant
que les a* sont des constantes,
dS{q{a,p, i),^ ,i) dS{q{a,^,t),l3,t)

P l{a,0,t) = a =
dq^ d0 i
On aura alors :
(4.69)
dt “ dq^dq^ dt dtdq^ ’
et
da^ _ ^ d^S dq’^ , d'^S „
“ 2-^ (4.70)
dt ~ dq^d/di dt dtdî - 0,
car les a* sont constantes. En additionnant les équations (4.67) et (4.69) et en
remettant tous les termes sur le côté gauche, on obtient
^ y- (4.71)
dt ^ dq^ “ dq^dq^ dt dpk J
En comparant les équations (4.68) et (4.70) on trouve, de manière semblable,
^ d^S (dq^ dH '

0. (4.72)
dq<^ddi \ dt dpk^
(Nous avons utilisé le fait que les dérivées secondes mixtes de S sont égales,
d'^S d^S
d'^S . d'^S
d'^S d'^S
, etc..
dq^ddi " ddidq^ dtdpi ~ dîdt
partout où c’était nécessaire).
En admettant (condition nécessaire également !) que le déterminant de la
matrice Jacobienne est diflférent de 0,
la deuxième identité (4.72) conduit à la conclusion que les / expressions sui

vantes s’annulent :
dq>^ dH
(4.73)
dt dpk
En insérant ces équations dans la première identité (4.71), on obtient les /

équation de Hamilton manquantes :
dpk , дН
(4.74)
dt dqf^ ~ ’
ce qui termine la preuve que la solution sous la forme de fonction génératrice
de l’équation de Hamilton-Jacobi est équivalente à une solution du système
canonique de Hamilton.
Dans les exemples qui suivent, nous montrerons comment on peut intégrer
les équations canoniques à l’aide d’équations de Hamilton-Jacobi. L’intérêt
principal de cette méthode réside dans le fait que la fonction génératrice
cherchée peut être souvent représentée sous forme d ’une somme de termes
dépendant chacun d’une seule coordonnée généralisée, ce qui conduit à la
séparation des variables permettant à la fin de transformer les équations aux
dérivées partielles en équations différentielles ordinaires de premier ordre, que
l’on peut toujours intégrer.
Le cas le plus simple d ’une telle séparation se présente quand nous avons
une ou plusieurs coordonnées cycliques, n ’apparaîssant pas explicitement dans
la fonction hamiltonienne. Déjà, dans un système conservatif, quand Я (д,р, t) =
E = Const., autrement dit, quand dH /dt = 0, on peut poser
S{q,P,t) = S i{ q ,P ) - E t, quand H = T + V = E.
L’équation de Hamilton-Jacobi prend alors une forme simplifiée, avec une

constante de mouvement explicite :
77”( rfi nf dS j.\ _ JP (4.75)
Supposons maintenant que le hamiltonien ne dépend pas explicitement de la

coordonnée q^, 1 < s < f . On peut alors remplacer l’impulsion généralisée
correspondante par une constante, car
dps дН
g =0, ~^Ps = 0a = Const.,
dt dq'
et, puisque ps = dS/dq^, on peut poser,
S(q, 0, t) = S'2 (gS q^,t) -h 0s<f.

Si l’énergie est aussi conservée, on pourra écrire
S(q,0,t) = Sz{q^,q^,..q^~^,q^'''^,q^'^^...,q^,t) + 0aq^ - Et.

(Attention ! dans la formule ci-dessus, il n ’y a pas de sommation par rapport à

s, qui désigne une valeur particulière de l’indice courant dans ç*, correspondant
à l’indice de la coordonnée cyclique).
Ce procédé s’appelle la séparation des variables et permet de réduire le
nombre d’équations différentielles restant à résoudre.
Rappelons encore que la solution cherchée S est en général une fonction
de t et de 2/ variables, dont / coordonnées généralisées ç* et / constantes
I3k provenbant du fait que dans les nouvelles variables toutes les impulsions
généralisées deviennent constantes, Pk = ^k- Pour un système conservatif on
peut écrire H = E = Constante ; dans ce cas, E apparaîtra dans l’équation
de Hamilton-Jacobi et sera liée aux constantes ¡3k par une relation implicite.
En posant S = S q — Et, on réduira la solution du problème aux équations
suivantes :
dSo , k _ ^^0 „ _
= t-p û!0) O: Pi
dE Wdßkk dqi
La première équation donne de manière implicite la dépendance temporelle,
tandis que les équations restantes déterminent la trajectoire.
X Exemples
1). Oscillateur harmonique (encore lui!) :
L’énergie cinétique T et l’énergie potentielle V d ’un oscillateur harmonique
simple, avec un seul degré de liberté x, donnent lieu à un lagrangien simple
m édx\ kx^
L’impulsion généralisée p est alors égale à mx.

La fonction hamiltonienne est alors
L’équation de Hamilton-Jacobi s’écrira donc comme suit :

2
i ( d S y 4- - dS „
2m V 2
Puisque le hamiltonien ne dépend pas explicitement du temps, on peut poser
S = S a ( x ,ß ) -E t,
et l’équation pour S q deviendra
1
+ - = B.
2m \ d x )
où nous avons supposé que S q ne dépend que de la variable x. L’intégration

n ’est pas difficile, car on peut écrire
L’équation définissant le temps s’obtient en dérivant cette expression par rap

port à l’énergie E, ce qui peut être fait sous le signe d ’intégration ;
mdx
^ ^ A r c s iJ ^ x .
et la solution explicite s’obtient en inversant cette fonction,
I2E
~ ]J~j^ sin(u;i + (p),
avec U) = Æ (p = ua^. Dans le cas d ’un oscillateur harmonique en plu

sieurs dimensions (par exemple trois) on arrive à séparer les variables par une
substitution standard
S = - E t + S i { x ^ ) + S 2 { x ‘^ ) + S 3 { x %
menant aux trois intégrales semblables, mais avec des constantes différentes ;
l’énergie totale sera la somme des trois énergies associées à chaqun des degrés
de liberté.
2). Séparation des variables dans le cas d ’un mouvement dans le potentiel
à symétrie sphérique.
Considérons le lagrangien L = T —V d ’une particule de masse m, exprimé
en coordonnées sphériques, dans lesquelles le potentiel d ’une force centrale ne
dépend que de la variable r :
-f- -h sin^ —V {r, t).
La fonction hamiltonienne devient alors

1
H = f.2 J.2 gjjj2 0
+ V{r,t). (4.76)
2m
où les impulsions généralisées s’obtiennent à partir du lagrangien par dérivation

par rapport aux vitesses généralisées correspondantes. L’équation de Hamilton-
Jacobi s’écrit :
J_ 'dSV (jf) (If) fiC

A V (r,t) + ^ = 0. (4.77)
2m sin^ 6
Dans le cas où le potentiel V ne dépend pas de t, nous pouvons procéder à

une séparation des variables, en commençant par l’énergie. Pour ce faire, on
posera
S = Sr{r) + Se{e) + S M - E i - (4-78)
Dans l’équation de Hamilton-Jacobi (4.77) on pourra remplacer les dérivées
partielles par les dérivées ordinaires, et la dérivée de S par rapport au temps
t par l’énergie avec le signe moins ;
I2 / \ 2'
J_
+ + + V(r) - E = Q. (4.79)
2m U r y* sin^ 0
En multipliant le tout par et en regroupant les termes dépendant unique

ment de r d ’un côté, et les termes dépendant uniquement des angles 6 , de
l’autre, on trouve l’équation suivante :
J_
2m
1 dSa
sin^ 6 \ d(f J
Y de J
. (4.80)
Dans l’équation (4.80) ci-dessus, on constate l’égalité entre deux fonctions,

dont la première depend uniquement de r, at la seconde uniquement des angles
{0, (p). Les deux expressions étant égales, il ne peut s’agir que d ’une constante,
que nous noterons /3i. On a maintenant deux équations indépendantes :
= /?i = Constante,
2m
J_ 1 ^dS^Ÿ
+ = -A . (4.81)
2m sinê d(f J ' \ d0 J
En regardant la deuxième équation de (4.81), on s’aperçoit que l’on peut
séparer de la même manière les deux angles. Il suffit pour ce faire de mul
tiplier par sin^ 0 et regrouper les termes, pour arriver à l’équation suivante :
J_ dS,
= )02, (4.82)
2m dip J 2m \ ^
où nous avons introduit une nouvelle constante, ^ 2 - En introduisant trois

constantes : E, et S 21 et en séparant les variables, nous avons réduit le
problème à trois équations de premier ordre, aux dérivées ordinaires, qui se
prêtent à une intégration directe :
1 / dSr
y + + F (r)-E = /3i = Constante,
2 m V dr
sin2 0 (4.83)
Nous pouvons faire un pas supplémentaire sachant que le problème à symétrie

sphérique admet une constante de mouvement vectorielle, le moment cinétique
total J", que l’on peut aligner suivant l’axe Oz. Le mouvement reste plan, avec
в = 7t/ 2. Le hamiltonien réduit s’écrit
2 ,P v
Н = 72Гm- Pr + ~2 + V{r). (4.84)
et l’équation de Hamilton-Jacobi correspondante devient
J_
2m dr J
V
'd S \ ^ . 1
1 1
\d(f^
+ V{r) = E (4.85)
où nous avons déjà séparé le temps t en admettant la conservation de l’énergie.

Puisque la variable y? est cyclique, nous pouvons procéder à une nouvelle sub
stitution,
S = S r { r ) + 0i(p,
ce qui conduira à une seule équation pour Sr{r) :
J_ fd S r\ Pi + V(r) = E, (4.86)
2m V dr )
On peut procéder à l’intégration directe :
S r{r) = j ]J‘m { E - V { r ) ) - Pi^ d r ,

2 (4.87)
et la fonction génératrice indépendante de t (car le terme —E t a donné le

terme E dans nos équations réduites) devient
-II- 2m {E —V (r)) —^ dr -h ^цр.
L’équation
-B
exprime simplément que l’impulsion généralisée reste constante au cours

du mouvement. Les deux équations restantes, déterminant la loi horaire et la
trajectoire respectivement, sont maintenant :
t + ao =
dE -I m dr
y /2 m { E -V { r ))-^
y)
r ____ Pi dr
ai + (p.
' r ^ y /2 m { E -V { r ))-§
On reconnaît facilement les équations obtenues dans la résolution du problème
de Kepler par la méthode lagrangienne. Comme avant, les expressions obtenues
doivent être inversées pour donner le résultat explicite sous forme de r(i) et
(p{t) (le mouvement) et r = r{(p) (la trajectoire). Les constantes ao, a\, E et
Pi sont déterminées par les conditions initiales.
4.7 Problèmes
P ro b lèm e 4.1 - T ran sfo rm atio n canonique - form alism e H am ilto n ien .
On considère le lagrangien suivant :
1 fdqiŸ , 1fdq2Ÿ 1 2 , 2
2 [ dt ) Q1 + Q2
(On a transformé l’expression du lagrangien d ’un oscillateur harmonique en

deux dimensions, en introduisant le paramètre A = u>~^ = y/m/k^ avec m la
masse du point matériel et k la raideur du ressort).
a) Définir les impulsions canoniques pi et p2-
b) Ecrire le hamiltonien, fonction de variables canoniques pi, p 2 , qi, Q2 -
c) Considérons une transformation canonique conduisant à la nouvelle expres
sion du hamiltonien
H = P2
avec les nouvelles variables canoniques Pi, P2, Qi, et Q2 définies comme suit :
Pi = Qi+ P2 = + ^2 +
Q, = i [ A r c t a n ( i) - A r c t a n ( ^ ) ] . Q, = A A rotan(^)
4.7. PROBLEMES 155
En évaluant les crochets de Poisson (par rapport aux anciennes variables) entre
les nouvelles variables canoniques Qi, Pk, i ,j = 1, 2, vérifier qu’il s’agit d ’une
transformation canonique.
d(Arctan x) 1
(On rappelle que
dx 1 + æ' i)-
d) Expliciter les equations de Hamilton avec les nouvelles variables cano

niques; trouver la solution générale en termes de ces variables : Pi{t), Qk{t)
e) En exprimant ces solutions en termes des anciennes variables canoniques
Pli P2 i Qi et Q2 trouver la solution générale du système de départ sous la forme
explicite qi{t) et Pk{t).
P ro b lèm e 4.2 - La force de L orentz

On envisage le principe variationnel pour une particule de charge e placée dans
un champ électromagnétique décrit par le potentiel-vecteur A et le potentiel
scalaire Le lagrangien correspondant s’écrit
r m V^ _ e .
L = — -------e$ + - A
2 c
où m et V sont, respectivement, la masse et la vitesse de la particule, et c la

vitesse de la lumière dans le vide.
a) Ecrire les équations d ’Euler-Lagrange. Identifier les termes en substituant

les composantes du champ électrique E
^ 1 ÔAj
* dxi c dt
et celles du champ magnétique B , données par
ÔAj dAi _ ^
dXi d x , ~ ""
avec i,jfk = l, 2, 3.
b) Définir les impulsions pk dérivant du lagrangien ci-dessus. En déduire la
fonction de Hamilton H correspondante, fonction des coordonnées Xk et des
impulsions Pk.
c) Vérifier que les équations de Hamilton
= -Pi = Xi
dxi dpi
conduisent aux mêmes équations du mouvement.

P ro b lèm e 4.3 - S ystèm es conservatifs - C o n sta n te s de m ouvem ent
On considère le lagrangien d ’une particule de masse m dans un champ de
forces centrales dérivant du potentiel V(r)
L= - V{r)
a) Exprimer le lagrangien au moyen des coordonnées sphériques et leurs vi

tesses. Ecrire les équations d ’Euler-Lagrange correspondantes.
b) Définir les impulsions canoniques. En déduire la fonction de Hamilton puis
les équations canoniques de Hamilton. Trouver les deux constantes du mouve
ment.
c) Le potentiel est le potentiel gravitationnel dû à une masse sphérique placée
au centre du système de coordonnées :
GM m
V(r) = -
Outre le moment cinétique
J = m r A V
on introduit le vecteur de Runge et Lenz
L = V A J -G M m —
r
Vérifier que ce vecteur est une constante vectorielle du mouvement.
P ro b lèm e 4.4 - C ro ch ets de P oisson, id e n tité de Jac o b i

On définit les crochets de Poisson entre deux fonctions / et g dépendant des
2N variables canoniques qi, pk par
N
{ f g} = ÿ (
¿ { \d p id q i dqidpi)
a) Vérifier par un calcul direct l’identité de Jacobi

4.7. PROBLEMES 157
{/, {g, /i}} + {g, {h, /}} + {h, {/, 5}} = 0
b) On introduit un opérateur noté associé à une fonction A(p,q), dont

l’action sur une fonction quelconque F(p, q) est définie par
A a (F) = {A, F}
De l’identité de Jacobi, déduire que l’on a
A{a î >)W = |a ^ ,A b | ( î ')
OÙ [A/i, A b ] = A Â b —A b A^ est le œmmutateur de A a et A b .

3°) Quelles sont les actions sur F{p, q) des opérateurs Ap et Aq ?
P ro b lèm e 4.5 - M o m en t c in étiq u e

On rappelle que les composantes cartésiennes d ’un moment cinétique J sont
données par
J x = ypz - ZPy , J y = ZPx - XPz , J z = xp y - yp x
a) Calculer les crochets {Ji, Xj} et {Ji,Pj} où les indices i et j représentent x, y

ou Z. On démontrera préalablement que l’on a {A, BC} = {^4, B }C + B {A, C}.
b) Plus généralement, calculer les crochets {Ji,F } où F est une fonction des
six variables x,y,z,px,Py,Pz-
Application : calculer les crochets {Ji, Jj}.
c ) . On note Ji = A jj. Montrer que l’on
\Jii Jj\ = ~ Jk
OÙ le triplet ordonné d’indices (i, j, k) est obtenu par permutation circulaire

des indices du triplet (æ, y, z).
d) Revenant au hamiltonien de l’exercice II, calculer les dérivées par rapport
au temps des deux composantes du moment cinétique
Jx = fn {yZ - zÿ) , Jy = m {zx - xz)
en utilisant leurs crochets de Poisson avec H :

e) Prouver à l’aide de l’identité de Jacobi que si Jx et Jy sont des constantes

du mouvement, J* l’est également.
f) Calculer les crochets de Poisson entre les composantes de J et celles de
. r
r , P et —
r
g) . Essayer, juste “pour voir” , de calculer les crochets de Poisson entre les
composantes de J et celles de L ...
P ro b lèm e 4.6 - T ran sfo rm atio n s canoniques

On rappelle l’équivalence entre deux définitions d’une transformation cano
nique :
4k c’est une transformation (p, q) ->• (P, Q) pour laquelle les équations cano
niques gardent la même forme :
dH
— Qi
dQi = - P i , dPi
H étant le hamiltonien transformé ;

4k c’est une transformation qui conserve les crochets de Poisson des variables
canoniques :
{Ph -Pfc} = 0 , {Qi, Qk} = 0 , {Pi, Qk} = Sik

On considère le hamiltonien suivant
i f = Pi + P 2 + y (il - 92^ + y (çi + Q2 Ÿ
où Al et A2 sont deux constantes rélles positives, et la transformation suivante
/ 2Qi , / 2Q2 D / 2Qi D 1 / 2^2 D
/Ai<5 i . n , IMQ 2 . D /AiQi

Pl = y - y - s m P i - l - y - ^ s i n P s , p2 = - y - ^ SinPi’1 + y ^ ^ s i n P 2
a) Vérifier qu’il s’agit bien d ’une transformation canonique en évaluant les

crochets de Poisson entre les variables p, g, les relations canoniques entre les
variables P, Q étant supposées réalisées.
2°) Trouver la nouvelle fonction de Hamilton H dépendant de P, Q. Ecrire les

équations de Hamilton en coordonnées P, Q et intégrer le système.
4.7. PROBLEMES 159
P ro b lèm e 4.5 - O scillateu r h arm o n iq u e à d eu x dim ensions

Le lagrangien d ’un oscillateur harmonique à deux dimensions est donné par
2 2
a) Définir les impulsions généralisées Px et py et le hamiltonien correspondant

en fonction de Px, Py, X et y.
b) Prouver que la transformation
Px = \/2APi cos Qi x = \l^— sm

• Qi
n
№ . ^
Py = V2AP2COSQ2 y = y — sm Q 2
où A = Vkm est bien une transformation canonique.

c) Exprimer le nouveau hamiltonien H {Pi,P 2 ,Q i,Q 2 ) et écrire les équations
canoniques pour les nouvelles variables. Montrer que la combinaison Qi —Q2
est une constante du mouvement.
P ro b lèm e 4.6 - R o ta tio n
1°) Vérifier à l’aide des crochets de Poisson, relativement aux variables x, y, z,
PxtPytPzi qu’une rotation d’angle cp autour de l’axe z'z est une transformation
canonique.
2°) a) Montrer que si l’angle de rotation est infinitésimal (auquel cas cos
sim^ ~ (p), la variation d’une fonction F{x,y,z,px,Py,Pz) consécutive à cette
rotation est donnée par
SF = -ipJ,{F )
b) En appliquant cette dernière relation au hamiltonien d ’un système quel

conque, en déduire que si les angles azimutaux sont des variables cycliques pour
ce système, la composante Jg du moment cinétique total est une constante du
mouvement. A quelle symétrie du système attribuer ce résultat ?
P ro b lèm e 4.7 : R éso lu tio n avec u n e tra n sfo rm a tio n canonique

On considère un système mécanique avec un degré de liberté, dont la fonction
de Hamilton est
H{p,q) = P + 9^. (4.88)
I 696
a). Prouvez en calculant le crochet de Poisson entre les nouvelles variables P

et Q, définies par :
p = - Q ^ q = -4g3
L (4.89)
que le passage de (p, q) vers (P, Q) est une transformation canonique.

b ) . Une transformation canonique peut être définie par sa fonction génératrice.
En choisissant une fonction $ = Q), trouver les dérivées partielles de $
à partir de l’identité
pdq - PdQ - [h (p , q) - H {P, Q)] dt = d ^ q , Q).
Quel est le rapport entre H et H dans ce cas précis ?

c ) . Intégrez les relations ainsi obtenues et déterminez la fonction Q).
d) . A présent on peut écrire les équations canoniques de Hamilton avec la
nouvelle fonction H {P, Q).. Trouvez la solution générale du système canonique
ainsi obtenu, P (i) et Q{t), et démontrez que H reste constante au cours du
mouvement. Retrouver la solution cherchée en termes d’anciennes variables
e ) . La constante H{p,q) = E est par définition positive. Prouver que le mou

vement est circonscrit dans l’espace des phases (p, q) entre les valeurs limites
de P et de g que l’on déterminera.
P ro b lèm e 4.8 - F onctions g é n ératrices

On considère la fonction génératrice d ’une transfrmation canonique :
F{q,P) = q‘ê^ (4.90)
a) Pour définir la transformation canonique qui fait passer des anciennes var
riables (p,q) aux variables nouvelles (P, Q), on utilisera les relations
dF
Q= - ôP’
Trouvez les expressions implicites de Q et de p, puis définisses explicitement

la transformation en spécifiant P(p,q) et Q{p,q).
b) Vérifiez s’il s’agit vraiment d’une transformation canonique en évaluant le
crochet de Poisson {P,Q}(p_g).
c) Trouver la fonction génératrice '9{p, Q) conduisant à la même transformar
tion canonique que la fonction précédente F{q,P),
Chapitre 5
Tenseurs et spineurs
5.1 Préambule
L’avantage que présente le formalisme lagrangien par rapport au forma
lisme “direct” utilisant les équations explicites de la dynamique newtonienne,
c’est que non seulement il peut utiliser n’importe quel système de coordonnées,
mais avant tout, que les équations de la dynamique ont la même forme quel
que soit le système de coordonnées choisi :
d dL dL ^ ^ ^
(5.1)
dtdqi d q i~ ^ '
Suite au changement de coordonnées généralisées q^
on a vu que le nouveau lagrangien
L{Q^,Q'^) = L {q \Q ^),eiQ ^,Q ^)
engendre N équations différentielles qui ont strictement la même forme que

celles engendrées par le lagrangien du départ. En fait, les deux systèmes de
N équations sont liés entre eux par une matrice de passage, que l’on suppose
non-singuière :
d dL dq^ d dL dL
= 0. (5.2)
dtdQ^ dq^ dQÏ _dt dq^ dq^.
On peut dire que l’ensemble d ’équations formant le système lagrangien se
transforme comme un vecteur sous l’effet de changement de coordonnées. A
condition que le déterminant de la matrice de passage soit non-nul, l’égalité
à zéro de ce système d ’équations est maintenue dans tous les systèmes de
coordonnées. Cette propriété s’appelle la covariance^ et constitue l’essence des
nouvelles entités mathématiques généralisant la notion d’un vecteur et d ’espace
162 CHAPITRE 5. TENSEURS ET SPINEURS
vectoriel. Ces entités, appelées tenseurs, ont été introduites par James Clerk
Maxwell. ^
C’est en étudiant les tensions et les déformations dans les milieux conti
nus que Maxwell a dû introduire les objets géométriques tenant compte de
l’action des forces et des moments des forces exercées à travers les bords d’un
volume infinitésimal d ’un milieu élastique. Dans l’approximation linéaire la
force infinitésimale exercée par le milieu élastique sur un cube infinitésimal
est appliquée à travers ses cotés dx A dy, dy A dz, dz A dx„ et leurs trois an
tipodes. En notant ces éléments de surface dS = dS^ e*, le modèle d ’élasticité
de Maxwell préconise la relation
dF^ = aidS'^.
L’entité <t|, s’appelle tenseur des contraintes, La loi de l’élasticité linéaire
permet d ’obtenir le tenseur des déformations mesurant les déformations in
finitésimales du milieu comme fonction linéaire du tenseur des contraintes.
Cependant l’application la plus spectaculaire du concept de tenseur a été
l’unification du champ électrique E et du champ magnétique B en une seule
entité : le tenseur de Maxwell du champ électromagnétique. Cette identification
a constitué un pas important vers l’établissement de la théorie de la relativité.
Les spineurs, une espèce particulière des tenseurs, feront l’objet de la
dernière section de ce chapitre.
5.2 Repère local

Dans l’espace à trois dimensions, considérons donc un point quelconque M
dont la position est définie par son rayon-vecteur O M , celui-ci étant pa
ramétré par des coordonnées curvilignes k — 1,2,3. On peut donner
comme exemple les coordonnées sphériques : dans ce cas, on écrit explici
tement O M (^®) comme suit :
O M = rs in ^ c o s^ i -hr sin^ sinyjj -|-r cos^k (5.3)
Les vecteurs du repère local attaché au point M se trouvant à l’extrémité du

rayon-vecteur O M seront définis par les dérivées partielles du vecteur O M
par rapport aux trois coordonnées curvilignes :
> î — 1,2,3 (5.4)
1. Jam es Clerk M axwell (1831-1879), physicien anglais, à qui Гоп doit la formulation
finale de l’électrodynam ique. Ses contributions dans le dom aine de la m écanique statistique
et de l ’élasticité sont non m oins remarquables.
5.2. REPERE LOCAL 163
Dans les cas ne présentant pas d ’ambiguïté, on remplace les indices numériques
1, 2,3 par les noms plus concrets des coordonnées curvilignes utilisées. Ainsi,
pour les coordonnées sphériques, on utilise traditionnellement les notations
dOM
= 6r = sin 6 cos ^ i + sin 0 sin y?j + cos 9 k
dr
dOM
= e$ = r cos 9 cos (pi + r cos 9 sin9?j —r sin0 k
d9
aoM
e^p = —r sin 0 sin (/?i + r sin ^ cos v?j (5.5)
dip
Il est important de noter que les vecteurs de base du repère local ainsi définis
ne sont pas nécessairement unitaires. Ici, ils sont cependant mutuellement or
thogonaux, mais on peut imaginer des paramétrisation engendrant des repères
locaux dont les vecteurs sont ni normés à 1, ni mutuellement orthogonaux^.
On peut caractériser le passage du repère cartésien (i, j, k) au repère curvi
ligne local (er, e^, e^) par la matrice de passage contenait toutes les dérivées
partielles :
sin 9 cos (p sin 9 sin / \ —rsin^siny» rsin^COSi/? 0
Le déterminant de la matrice de passage dans (5.6) vaut sin0 et est différent
de zéro pour r ^ 0 et sin 0 7^ 0, c’est-àrdire en dehors de l’origine O et de l’axe
Oz. Sous cette condition, la matrice inverse existe, permettant de définir le
passage du repère local au repère cartésien :
/i\ / • û
sm 9 cos ip Zi cos 9û cos i p ----- :—r \\ /C r \
^ ^ rs in ^
. . . 1 . . CO&ip
j sm 0 smw - cospsmw — :—r (5.7)
r ^ r sm 0
w COS0 —- sin^ 0 / \e ^ /
On peut illustrer l’utilité d’un passage au repère local en considérant quelques

champs vectoriels, c’est-à-dire des fonctions à valeurs vectorielles supposées
être définies dans une partie de l’espace ou dans sa totalité. Envisageons le cas
du champ de gravitation terrestre qui est sensiblement uniforme au voisinage
du sol. Son expression g = —^ k , si simple dans le repère cartésien, devient
beaucoup plus compliquée si on la décompose suivant des vecteurs du repère
local défini par les coordonnées sphériques. On aurait alors
2. D onc, prendre garde au fait que les vecteurs (5.4) peuvent avoir une dim ension, contrai
rem ent aux vecteurs de base usuels adim ensionnés !
g = —g cos 6 er + - sin 0
r
Cependant, selon la loi de Newton, ce même champ est, à plus grande échelle,
radial et dirigé vers le centre O de la Terre, son module décroissant propor
tionnellement à Son expression prend une forme particulièrement simple
lorsqu’on l’exprime à l’aide des coordonnées sphériques et projeté sur les axes
du repère sphérique local :
Mt G
g=
où M t est la masse de la Terre et G la constante de gravitation. Par contre,

exprimé en coordonnées cartésiennes et projeté sur les axes du repère cartésien
dont l’origine est au centre de la Terre, il s’écrit de façon plus compliquée
comme suit :
Mt G X Mt G y Mt G Z
g = - (a;2 -f- 1—
* (a;2 -|- -H ^ (æ^ H- y^ +
Nous voyons donc que le choix de tel ou tel système de coordonnées dépend
de la situation physique considérée.
En vue d’une généralisation, nous noterons les trois coordonnées
curvilignes considérées. Le rayon-vecteur d ’un point quelconque, exprimé en
coordonnées cartésiennes.
OM = OM (Î**) = i -HyCi'*) j -H k (5.8)
est donc fonction des trois paramètres = 1,2,3. Ses dérivées partielles
par rapport à ces coordonnées curvilignes définissent, en chaque point de
l’espace^ trois vecteurs du repère local, que nous noterons :
aoM
(5.9)
L’exemple des coordonnées sphériques est particulièrement illustratif, car il

correspond à la définition du repère local le plus naturel utilisé par un voyageur
sur la surface de la Terre. Le vecteur correspond à la direction verticale,
c’est-àrdire opposée au vecteur pointant vers le centre de la Terre ; le vecteur
3. Sauf peut-être pour quelques poin ts singuliers, com m e par exem ple r = 0 ou ^ = 0 ou
TT en coordonnées sphériques.
5.3. TRANSFORMATIONS DE COORDONNÉES. COVARIANCE 165
e$ correspond à la direction vers le Sud géographique, et le vecteur pointe

vers l’Est géographique. Ces vecteurs de base sont mutuellement orthogonaux
en tout point de l’espace, ce qui est facile à vérifier à partir de leurs expressions
(5.5) :
e,* *Gq 0, Q0 *Gfp —0, Gfp *Gj. —0
Mais contrairement aux vecteurs de base cartésiens i, j, k ils ne sont pas

normés : en effet, on a
Gr^ = 1, G 0 - r^, sin^ 0
Pour terminer, calculons aussi les produits vectoriels entre ces vecteurs de
base :
A e^ = sinê,^ , A s in g e r , e ^ A e r = sin ^ e^
Le repère local (e^, e^, g^) est donc orthogonal (partout où il est défini, à
savoir, en dehors des pôles correspondant aux valeurs 0 et tt de l’angle 0 ),
mais pas orthonormé^ car les longueurs de ses vecteurs de base ne sont pas
unitaires.
5.3 Transformations de coordonnées. Covariance
Nous avons défini le repère local engendré par les coordonnées curvilignes
mais rien ne nous empêche de faire un autre choix, en nous servant d’un
autre système de coordonnées que nous appellerons . Nous introduirons des
indices avec “prime” pour pouvoir distinguer à tout moment les deux systèmes
de coordonnées. Les coordonnées définissent un autre repère local, donné
par
(5.10)
drf^' = ©fc'
Tout comme dans le cas des coordonnées cartésiennes, les coordonnées r)^'
peuvent être exprimées en fonction des coordonnées c’est-àrdire, que l’on
peut écrire
ч"' = (f)
Le déterminant de la matrice jacobienne de cette transformation des coor

données sera supposé non nul^,
ce qui permet d ’affirmer l’existence de la transformation inverse
3 a cm a„ k'
r = r ( / ) . avec = (6.11)
où ôj^ est le symbole de Kronecker, égal à 1 quand les indices haut et bas
prennent la même valeur, et zéro si ce n’est pas le cas. On peut utiliser la
notation matricielle pour les matrices jacobiennes de passage en écrivant
d im 1*' dt]P
(5.12)
drf^' 3
Dans cette notation, l’indice en bas est l’indice de colonne, celui en haut in
dique la ligne ; la sommation dans (5.11) correspond à la multiplication usuelle
des matrices. On notera bien que les dérivations partielles par rapport aux co
ordonnées ou variables notées avec un indice haut, correspondent à des
indices en has dans les matrices de passage P~^ ou P, respectivement.
Dans la multiplication matricielle, on somme un indice en bas avec un indice
en haut prenant les mêmes valeurs. Plus explicitement, en trois dimensions,
on a notamment
3 ^ Qçm Qçm 0^2' ^

(5.13)
àr)^' à ii ~ dr)^' 07/2' d-q^' ~
Les indices sommés sont appelés indices muets, car les seuls indices visibles
dans le résultat final sont justement ceux par rapport auxquels on n’a pas
effectué de sommation.
La convention d ’Einstein que nous utiliserons désormais consiste en l’applica
tion d ’une sommation par rapport aux paires d’indices portant le même nom
chaque fois où l’un, appelé indice contravariant, apparaît en haut, et l’autre,
appelé indice covariant, en bas, et en supprimant le symbole S de sommation.
4. Sauf pour quelques points singuliers, qui apparaissent assez souvent.
5.3. TRANSFORMATIONS DE COORDONNEES. COVARIANCE 167
Cela permet d ’écrire plusieurs expressions utiles de manière particulièrement

concise. Prenons l’exemple de la différentielle totale d ’une fonction / = f{x^).
On a
df df
Avec la convention d ’Einstein, la même chose s’écrira désormais
df = ÿ , d a * = a tfd x ^
dx^
Arrêtons-nous un instant pour discuter de l’origine de la notion d ’indice “cova-

riant” ou “contravariant” . Nous avons fait le choix de marquer les coordonnées
locales avec un indice haut, et les dérivées partielles par rapport aux coor
données avec l’indice bas correspondant. Ceci permet d ’utiliser la notation
matricielle et la multiplication des matrices dans la différentielle du rayon-
vecteur OM(^*’) :
dOM = y — di* = ¿ e jd e ‘ = (ei, e j, e ,) ■ i 4 » (5.14)

k=l \d ^ 3
Sous l’effet d ’un changement de coordonnées, la même expression prendra une

forme semblable, mais avec les nouvelles coordonnées :
«ÎOM = è ^ dÇ"* = e... d i» = x ; ^ d / = e,- d , ‘ ' (6.15)

a=l ^
En utilisant la dérivation composée, on trouve la loi de transformation per

mettant d’obtenir les vecteurs de base à partir de la base :
_ ÔOM _ aO M _ X
“ dr)>^' ~ dr]k' ~
Avec la convention d ’Einstein, il suffira d ’écrire cette formule, ainsi que le

passage inverse de vers comme suit :
dî]'k'
Cfc/ = e„ Gt Gjji —
drj’^
d^m
Le fait d’avoir mis em devant la matrice de passage P ^ = correspond au
choix initial stipulant que les indices bas sont les indices de colonne, tandis que
les indices hauts sont ceux des lignes. Nous multiplions donc une matrice-ligne
par une matrice carrée, pour obtenir comme résultat une autre matrice-ligne :
de de de \
de' de' de'
( ei 62 63 ) de de de = ( ey 62' 63' )
de' de' de'
de de de
\ de' de' de' /
Notons toutefois que la convention d ’Einstein nous permet d’écrire ces sommes
dans n’importe quel ordre, en oubliant l’identification par ligne ou par colonne.
L’expression la plus souvent utilisée sera
dÇ
A partir de là, on peut déduire la loi de transformation des composantes d' un

vecteur. Posant X = 6*, on aura
X = X ''6fe = X* ( ^ 6, ' I = Ojf = ejf
d ’où la transformation des composantes de X
xf = (5.16)
et la transformation inverse s’écrit donc
drjy
A présent, on comprend mieux les dénominations de “covariant” et de “contra-

variant” , les indices bas se transformant comme les vecteurs de base, tandis
que les indices hauts se transforment selon la matrice inverse :
„ _ y/ _ yfc
5.3. TRANSFORMATIONS DE COORDONNEES. COVARIANCE 169
Le produit scalaire de deux vecteurs X et Y , noté X • Y , s’exprime de façon

bien connue en coordonnées cartésiennes :
X • Y = (X®i + Xyj + X^k) • (Yî + YVj + Y^k) = + X^YV + X ^Y ^
les produits scalaires entre les vecteurs de la base cartésienne donnant 1 ou

0, selon qu’il s’agit du carré du même vecteur ou du produit scalaire entre
deux vecteurs différents (base orthonormée). Projetés sur la base locale ej,
les vecteurs auront les composantes obtenues selon la formule (5.16), et leur
produit scalaire pourra s’écrire de manière générale®
X • Y = (X*ei) ■(Y^'efc) = X*Y* e* • = Çik X^Y'^ (5.17)
où les grandeurs
9 ik = ei-Bk (5.18)
définissent les composantes gik de la métrique qui sont en général fonctions

des coordonnées locales
En changeant de système de coordonnées curvilignes, , et en utili
sant la loi de transformation des composantes d ’un vecteur en coordonnées
locales (5.16), nous pouvons écrire le même produit scalaire de deux manières
différentes :
X . Y = { X % ) . (Y*=6fe) = X ^Y ’^Qik X'Y^

= (X ^'ef) ■(Y^'ei>) = X^'Y^' gfi> (5.19)
En exprimant les nouvelles composantes X^' et Y^' en fonction des anciennes
yi ^ yk - y iy k _
Xy j ' yy i ' gfl' — X Y gfi> _— X Y gik
on déduit, par identification, la transformation des composantes du tenseur

métrique gik :
d if' d rf dC
Ч>‘ = ~0 ^ 'Щ
9ik к З Г 1' et inversement, gfi> = gik (5.20)
5. R appelons une fois de plus que dans la formule (5.17) on utilise la convention d ’Ein
stein, puisque l ’on effectue la som m ation sur les indices identiques hauts e t bas i et k.
On dit que Çik est un tenseur deux fois covariant, car ses deux indices (bas) se
transforment chacun comme les vecteurs de base ei. Un autre exemple de ten
seur une fois covariant, appelé aussi une 1-forme, est fourni par la différentielle
d’une fonction. Si l’on paramétrise les points de l’espace par des coordonnées
curvilignes / = /(Î*’) étant une fonction des sa différentielle s’écrit®
df = § ^ d ( '^ = {dkf)d^'^
Si l’on passe à de nouvelles coordonnées rf', on aura, en appliquant la règle

de dérivation composée.
soit {dkf) = {di'f) (5.21)
5.4 Produit tensoriel d’espaces vectoriels

On connaît bien le produit cartésien de deux espaces vectoriels E et F '.il s’agit
de l’espace vectoriel formé par les couples de vecteurs dont un appartient à E
et l’autre à F :
{X e E , Y e F ) ^ { X ,Y ) e { E x F )
Si, dans une base e^, • = 1, 2, • • • AT = dim.{E) de E, le vecteur X a les

composantes X*’, et si dans une base fa, a, /0, • • • = 1,2, • • • M = dim(F) de F,
le vecteur Y a des composantes Y°‘, alors le vecteur formé par les composantes
(X*’, y®) peut être considéré comme un vecteur ayant N + M composantes,
appartenant au produit cartésien E x F des deux espaces vectoriels E et F,
avec dim{E x F) = N + M .llv& de soi qu’un tel produit peut être généralisé
au cas de plus de deux espaces. Dans ce qui suit, on s’intéressera surtout aux
produits d ’un espace vectoriel avec lui-même, E x E, E x E x E, etc.
Dans l’expression du produit scalaire de deux vecteurs appartenant au même
espace, X ,Y e E, on rencontre les produits de toutes les composantes, sommés
par rapport aux deux indices, indépendamment :
6. E n utilisant bien entendu la convention de som m ation d ’E instein. E n outre, nous avons
introduit la n otation abrégée pour les dérivées partielles : une dérivation partielle par rapport
à une coordonnée dont l ’indice est haut se traduit par un indice bas derrière le sym bole de
la dérivation partielle.
5.4. PRODUIT TENSORIEL D’ESPACES VECTORIELS 171
{X ,Y )= g ijX ^ Y ^
La loi de transformation de cette expression permet son évaluation dans n ’im

porte quel système de coordonnées :
rTTV
{ X , Y ) - g„ i j vXi Yv i _- g „i j ^ ^ ^ Xv l' ^ ^ , Y’IA
/V
_ v l'y m ' _ - tX^ Y'"’'' (5.22)

~ dr]V d r f’-' ^ - ^Vm'X Y
d’où la loi de transformation des coefficients de la métrique :
dé dé d é d rf
gij et inversement gij = (5.23)
9l'm'
drjfdr]^'^^^ ........ d é d é 9V‘.
Chaque indice de gij se transforme comme les vecteurs de base e* ; c’est pour
quoi on appelle gik un tenseur deux fois covariant.
L’ensemble des produits de toutes les composantes X* et Y^ des deux vecteurs
forme un objet ayant deux indices qui parcourent, indépendamment, les valeurs
de 1 à iV = dim(£?), et qui se transforment selon les matrices inverses. On dira
que cet ensemble définit les composantes d’un tenseur deux fois contravariant.
Les tenseurs deux fois covariants, ainsi que les tenseurs deux fois contrava-
riants forment naturellement des espaces vectoriels de dimension chacun.
En effet, grâce à la linéarité de l’action des matrices de passage, on a, pour
deux tenseurs provenant des produits des composantes des vecteurs X et V
pour le premier, et Z et W pour le second,
Tik ^ x ^y '^, 5** = Z^W’^ a T '^ + dS^'^ = {aT + p S f'‘
où a et ¡3 sont deux nombres réels (ou complexes) arbitraires.

Dans l’espace de tous ces produits, on introduit une base, construite à partir
de la base choisie dans l’espace E. Les éléments de cette base, dont le nombre
est évidemment iV^, sont appelés les produits tensoriels des vecteurs de base
e*; et notés
ei®©*) i,k = 1,2,-■■ ,N (5.24)
Un tenseur deux fois contravariant sera défini par ses composantes relativement
à cette base comme suit ^ :
7. A vec la som m ation sur les indices i et k, selon la convention d ’E instein !
T = r ^ e i ® e k = T '^ ' (5.25)
Il est ici représenté dans deux bases différentes, ce qui permet de déduire
immédiatement la loi de transformation des composantes de ce tenseur lors
d’un changement de coordonnées :
r '* '= et inversement _ (5.26)
L’espace vectoriel de tous les tenseurs deux fois contravariants est appelé pro
duit tensoriel de E par E, noté E<S) E.
Notons que l’application a qui fait correspondre un tenseur deux fois contrar
variant à un couple de deux vecteurs X et F appartenant chacun à l’espace
vectoriel E selon la règle
X = XUi , y = efc -)• a {X ,Y ) = X ® Y
= (X* Bi) (8) (y '' Bk) = X ‘y* ® Bk
n’est pas univoque car il y a une infinité de couples de deux vecteurs conduisant
au même produit tensoriel. Pour s’en convaincre, il suffit de considérer dans
E X E les couples différents (X ,Y ) et (X ,Ÿ ) = {XX, A“ ^y) où A est un réel
quelconque non nul. Il est clair que
X ® ÿ = (AX)®(A"^y) = A - A ~ H ^ ® ^ ) =
Un tenseur obtenu comme produit tensoriel de deux vecteurs est en fait une
classe d ’équivalence par rapport à la relation d’équivalence
(a*6i) ® (b'^Bk) ~ a^b'^ (oj) ® {b'^Bk)
Un tenseur deux fois contravariant pouvant être représenté comme le produit

tensoriel de deux vecteurs est appelé tenseur simple. Mais déjà, une combinai
son linéaire de deux tenseurs simples n ’est pas forcément simple.
Cette observation s’applique aussi, bien entendu, aux produits des tenseurs
covariants (les 1-formes), et tous les tenseurs en général.®
8. D e m êm e que la som m e des produits de deux nombres premiers n ’est pas en général
le produit de deux nom bres premiers.
5.4. PRODUIT TENSORIEL D’ESPACES VECTORIELS 173
A E xem ple 1 - p ro d u it des d e u x v ecteu rs.

Considérons les deux vecteurs (tenseurs une fois contravariants) suivants :
_ fX ^ \ _ /yi'
X
Uv Y
■(S)
et calculons leurs produits tensoriels, dans deux ordres différents : T = X<S)Y
et S = Y 0 X . D’après la définition, on trouve les composantes de ces deux
tenseurs deux fois contravariants :
f jiii _ 2^12 _ X ^ Y ^ y 2 i _X ^ Y ^ j»22__ X ^ Y ^
S^^ = Y ^ X \ S^^ = Y^X^, S^^ = Y^X^, =

Dans ce cas précis, puisque les deux tenseurs sont de même nature (autrement
dit, ils appartiennent au même type d ’espace tensoriel), on peut les comparer
et écrire symboliquement 5'*^ = T^^.
Ce qu’il était possible de faire une fois, peut être fait plusieurs fois, par
itération. On peut ainsi construire le produit tensoriel de trois espaces vec
toriels, E ® E ® E ayant pour base Si ® Cj ® Sk, et les tenseurs trois fois
contravariants correspondants. Un tenseur trois fois contravariant pourra être
donné par ses composantes dans cette base, ou dans n ’importe quelle autre
base, comme suit :
S = et (g) e j <8) ei> g) e f g
avec une loi de transformation évidente liant les nouvelles composantes aux
anciennes
Ci'fk' ^ Ытп (5.27)
On peut prolonger la liste en introduisant autant de produits tensoriels que

l’on veut, ici n fois :
E g E g E g . . . g E = Æ;®”
Nous avons vu que, tandis que les composantes d’un vecteur X* se trans
forment de manière contravariante, les indices bas se transforment de manière
covariante. Pour ces dernières entités, que l’on peut appeler tenseurs une fois
covariants, ou encore les l-formes, il existe un espace vectoriel associé. L’espace
de ces l-formes est particulièrement intéressant, car il coïncide avec l’espace
linéaire engendré en tout point par les différentielles des coordonnées curvi
lignes
5.5 Tenseurs covariants et contravariants

On peut considérer la métrique définie sur un espace linéaire E comme une
application bi-linéaire attribuant un nombre réel à un couple de vecteurs :
g i (X ,Y ) e E X E ^ g{X ,Y ) 6 (5.28)
Cette application est bilinéaire car elle vérifie la distributivité par rapport à
la superposition linéaire des vecteurs, dans chacun de ses deux arguments :
g{aXi + № , Y) = ag{X i, Y) + ^g{X2, Y),

g(X, аУ1 + m ) = a g(X , Yi) + ^g (X , Уз) (5.29)
Les applications linéaires sur un espace vectoriel forment elles-mêmes un es

pace vectoriel, car on peut les superposer linéairement. Cet espace s’appelle
Vespace dual de l’espace vectoriel E, et est noté par un astérisque : E*. Soit
6 E E* une forme linéaire définie sur E :
e(aX + PY) = a e{X ) + P Ô{Y)
En agissant sur un vecteur X E E, elle produit un nombre réel noté 0{X) E R^.
On définit la superposition linéaire des deux formes 6 i et 6 %par le résultat de
son action sur un vecteur quelconque de E :
{ав1 + рв2){Х) = ав1(Х) + рв2{Х) (5.30)
Comme pour les vecteurs dans E, il est utile de créer une base dans l’espace
des 1-formes E*, que l’on notera® *e*^, /e, Z• • • = 1,2,-•-N. Une base ei de
E étant choisie, on appelle base duale de E*, notée *e^, la base particulière
vérifiant la condition
(5.31)
Les 1-formes se transforment comme les composantes des vecteurs, leurs in
dices étant par définition contravariants, impliquant le fait qu’après le passage
vers un autre système des coordonnées la relation (5.31) reste en vigueur :
*e* (ek') = <5|/. En effet, en postulant que
9. La preuve que la dim ension de E* est la m êm e que la dim ension de E fait partie de
l ’algèbre élém entaire.
5.5. TENSEURS COVARIANTS ET CONTRAVARIANTS 175
*e i' = -irrr *ej quandJ e^/ = -9x-^^tj
on aura, par linéarité,
d r f\j,d e drj^ dC‘ l (e

u m) )-- I( ^ Ê ^ \j 5Si ^ -- ôk>
si'
(efcO = ^Q^l
* e ' (^^ e ^ ) = d^l Qfjk'
A partir des 1-formes, on peut produire des formes bi-linéaires agissant sur
des couples des vecteurs de E. Les formes bi-linéaires appartiendront alors
au produit tensoriel de l’espace dual E* par lui même. Soient 6 i et 62 deux
1-formes dans E*. Leur produit tensoriel doit être évalué sur un couple {X, Y)
de vecteurs comme suit :
{01® 62 ) {X ,Y ) = 6 x{X)d2 {Y) (5.32)
La base des 2-formes est donnée par tous les produits tensoriels entre les 1-
formes de la base duale
*e* ®
et engendre l’espace des tenseurs deux fois covariants, de dimension N “ ^. Ainsi,

la métrique g { X , Y ) , qui est une forme bi-linéaire, peut être représentée comme
une 2-forme appartenant à l’espace E* ® E* :
g { X , Y ) = gik ® {X êu Y '^B m ) =
= gik Xl Y ^ *é{ei) *e\em ) = gik Y ^ ôfôi = gik X^ Y>^ (5.33)
Comme dans le cas des tenseurs contravariants, nous pouvons former les pro
duits tensoriels multiples.
E*®E* IE* = (E*)®^
On peut aussi former les produits tensoriels entre un certain nombre des es
paces E et E*, en commençant par le produit E* ® E. Les éléments de ce
produit sont les tenseurs une fois covariants et une fois contravariants, connus
aussi sous le nom de matrices :
M = M^ ® Bk
L’opérateur “identité” , donné par le symbole âj, de Kronecker appartient à

cette espèce.
Soit T et S deux tenseurs, le premier r —fois covariant et s —fois contravariant,
le second p—fois covariant et ç—fois contravariant
T G [(E * )® n ® = x ^ , S e x ^
Dans une base donnée, leurs composantes respectives s’écrivent
rn jlji-.-js „ 0. Çlklk 2 '--kg

^hh.Jp
Le produit tensoriel
T® Se (g) [(E*)®(^+p)]
de ces deux tenseurs est défini au moyen de leurs composantes de la manière

suivante :
(1 09 ^)j^j2 ...jrjr+ l...jr+ p - ^ h - j r ^ j r + l .- j r + g - ■ ^jl:.jr‘^h ...lp
avec is+i = kl, is+ 2 — k 2 ,..- jr+i — ht ir+ 2 = ht etc.

Voici une illustration de la façon dont est fabriqué le produit tensoriel. Prenons
un tenseur covariant de rang deux, de composantes A{j par rapport à un repère
choisi, e*\ et un vecteur, c’est-à-dire un tenseur contravariant de rang un,
de composantes u*’ par rapport au même repère. Nous pouvons former leur
produit tensoriel de deux manières différentes A ® v ou v® A :
A ® v = AijV^ (e** ® e*^ ® Cfc) , v® A = vÂij{ek ® e** ® e*^)
Les composantes Aij peuvent être arrangés dans un tableau N x

L’interprétation du tenseur résultant est une matière de convention. Voici
celle choisie depuis longtemps : on interprète A ® v comme un “tenseur A à
valeurs vectorielles” , ce qui veut dire que chaque composante (un nombre réel)
10. Que nous éviton s d ’appeler “une m atrice” , car ce tableau ne p eu t pas être identifié à
une application linéetire de l’espace vectoriel en lui-m êm e, ce qui est propre à une m atrice
transform ant linéairem ent les vecteurs en d ’autres vecteurs. En fait, le tenseur A p eu t être
interprété com m e une transform ation d ’un élém ent de l ’espace vectoriel E en un élém ent de
l’espace dual E*.
5.5. TENSEURS COVARIANTS ET CONTRAVARIANTS 177
de ce tenseur multiplie le vecteur v tout entier. D’un autre côté, le produit

tensoriel u (8) A est interpreté comme un vecteur à valeurs tensorielles, au
trement dit, chaque composante du vecteur v est multipliée par la “matrice”
représentant le tenseur A.
Jlk Exemple 2 - produit d’un vecteur avec un tenseur.
Nous pouvons illustrer cette convention dans le cas d ’un vecteur et d ’un
tenseur deux fois covariant pour un espace E de dimension 2. Les composantes
du tenseur deux fois covariant seront représentées sous forme d ’un tableau
carré 2 x 2, tandis que le vecteur v sera représenté par une colonne avec deux
lignes :
'^11 >1i 2N
Aij ~ (5.35)
.-^21 .^22 J
Conformément à la convention choisie, les composantes du produit tensoriel
A® V peuvent être arrangées de la façon suivante
/A iiV ^ .4i 2U^\

A nv^ A nv^
{A (g) v) y (5.36)
A^yV^ A22V^
Vi42lU^ A21V^ )
Le produit tensoriel pris dans l’ordre inverse, U(8>j4 est compris comme vecteur
V dont les composantes sont multipliées par le tenseur A ^, représenté ici sous
forme d’une matrice, ce qui donne le résultat suivant
A i2 > /v ^ A ii W^4i 2 \
{v ® A f i j ~ ^21 422 >) vÂî V^422

(5.37)
4 i 2'' vÂn V ^4 i 2
y -421 422 > U 2421 U^422 /
qui est apparemment différent du résultat précédent (5.36). En conclusion, le

produit tensoriel n’est pas commutatif.
^ Exemple 3 - matrices de Pauli.
Un autre exemple est fourni par le produit tensoriel de matrices 2 x 2 . On
définit les trois matrices de Pauli
(5.38)
"‘ “ (l o)> o’ ) ' ‘’= = ( 0 -l)
qui forment une base des matrices complexes 2 x 2, hermitiennes et de trace

nulle, un sous-espace linéaire dans l’espace vectoriel de toutes les matrices
complexes 2x2. Prenons leurs produits tensoriels, de deux manières différentes,

par exemple cri (S> ers et <73 (8) <7i. Conformément à notre interprétation, les
matrices 4 x 4 correspondantes sont :
/0 0 1 0\ 1 0
0 ^
0 0 0 -1 1 0 0 0
<7l (g) <T3 = i=- <T3'S>(Ti = (5.39)
1 0 0 0 0 0 0 -1
Vo -1 0 0y U 0 -1 0 /
5.6 Symétries. Opérations sur les tenseurs

Le produit tensoriel n ’étant pas a p n o n commutatif, il faut bien faire attention
à la position des indices et ne pas les échanger, car un tel changement conduit
généralement à un autre objet. Cette remarque s’applique d ’autant plus au
cas de tenseurs mixtes, avec les indices co- et contra-variajits. Considérons,
par exemple, deux tenseurs de rang trois (c’est-à-dire, avec trois indices), mais
disposés différemment. En les exprimant dans les bases respectives, on voit
clairement que ce sont des tenseurs différents (n’appartenant pas au même
espace) :
W = Wffc I U = U'êi e
Il existe plusieurs opérations importantes sur les tenseurs, pouvant être ex
primées par des opérations sur les indices. Voici quelques exemples importants.
• La contraction est une opération linéaire transformant les tenseurs apparte
nant à l’espace en tenseurs appartenant à l’espace X ^zl- Il suffît de définir
cette opération sur les éléments de base de ces espaces pour généraliser ensuite
à l’espace tensoriel tout entier.
Il faut remarquer que cette opération ne peut être appliquée qu’aux tenseurs
au moins une fois covariants et une fois contravariants, dont les composantes
ont au moins un indice haut et un indice bas. Prenons un élément t = xi® X 2 ®
... ® «r <E»x*^ ® x*^ ® ... ® x*^ de la base de l’espace tensoriel et définissons
l’opération de contraction par
C j{t)= (x*\xj) x i® --- ®Xr <S>x*^ (2) • • • <8i x*^

i i (5.40)
(un nombre) (sans xj) (sans æ**)
Considérons par exemple un tenseur trois fois contravariajit et deux fois co-
variant tjp. La contraction appliquée au second indice contravariant et au
5.6. SYMETRIES. OPERATIONS SUR LES TENSEURS 179
premier indice covariant donnera
N
î(±kil\ _ ±kil _ ±kil __ kl
) ~ 2 ^ Hp ~ Hp ~ ^p
i=l
où nous avons utilisé la convention de sommation d’Einstein dans la dernière

étape du calcul. Le nouveau tenseur obtenu après la contraction appartient
à l’espace tandis que le tenseur tjp appartient à l’espace N^2y
important de souligner la position précise des indices auxquels on applique la
contraction, car les résultats sont en général différents avec des paires d ’indices
différentes.
Dans ce qui suit nous appliquons la convention d ’Einstein dans toutes les
formules, sauf si l’on dit explicitement qu’elle ne s’applique pas..
• La permutation d’indices constitue une autre catégorie d ’opérations linéaires
sur les tenseurs. En fait, on peut définir un nouveau tenseur à partir d ’un
tenseur donné en permutant ses indices. Par exemple,
'P i\i2...ip ~ Tipi2,..ii )
A partir de là, on peut introduire de nouvelles opérations combinant des per

mutations d ’indices avec d ’autres opérations linéaires, dont voici des exemples.
a) Symétrisation par rapport à deux indices covariants ou contravariants.
Pour un tenseur de rang deux, cela donne
% = 5 ( r « + 3)()
et pour un tenseur de rang arbitraire :
) (5.41)
b) Symétrisation de tous les p indices du tenseur de rang p.
Piih-ip ~ ^ Tn{hi2...ip)> (5.42)

n{ii...ip)
OÙ n (ii...ip) symbolise une permutation d ’indices.

Pour symétriser complètement, on doit sommer sur toutes les permuta

tions. Par exemple, dans le cas d ’un tenseur trois fois covariant, cela donne
T%jk — '^ { T ijif -\- T f iij Tjfî -\r Tilçj "H îj'ifc d" '^kji)
c) Antisymétrisation.
La définition de cette opération est similaire, mais dans la somme chaque
permutation se voit affectée de sa parité : ainsi, la somme doit être prise avec
le signe “plus” pour les permutations paires et avec le signe “moins” pour les
permutations impaires. Par exemple, pour le cas du même tenseur trois fois
covariant, l’antisymétrisation est definie comme suit :
^[vl ~ ~ Q C îjk + T k ij + T jk i — T ik j — T jik — T k ji)
On utilise souvent la notation abrégée
S T = symétrique T , A T = antisymetrique T
Les opérations de symétrisation ou d ’antisymétrisation totales (c’est-à-dire,

par rapport à tous les indices) sont des idempotents. Un idempotent est un
opérateur ayant les propriétés d ’une projection^ c’est-à-dire, une opération qui,
appliquée deux fois de suite (ou plus), ne change plus rien, le résultat de la
première application restant inchangé. Notons symboliquement le résultat de la
symétrisation totale d ’un tenseur T par <S(r), et celui de l’antisymétrisation to
tale par A{T). On vérifie alors deux relations importantes, S S = 5 et A A = A
ainsi que .45 = 5.4 = 0. Puisque
on déduit notamment que tout tenseur de rang 2 se décompose en une somme

directe de sa partie totalement symétrique et de sa partie totalement anti
symétrique. Il n ’est pas difficile de trouver la dimension de chacun des sous-
espaces correspondants. Si dimJ5=AT, alors dim£? <S>E = et
N{N + 1) N{N - 1)
dim S{E (S>E) = dim A{E <B)E) =
Il n ’est pas possible de tirer une conclusion semblable pour des tenseurs de rang
supérieur. Par exemple, pour des tenseurs de rang 3, on a dim{E<S>E®E) =
et
N{N + l){N + 2) N{N-l){N-2)

dim5(X ® X ® X ) = dim>!l(X(8)X(g>X) =
6 6
ce qui, dans le cas particulier de la dimension 3 donne respectivement 1 et 10,

laissant ainsi la place à 27 —11 = 16 dimensions pour d ’autres types de ten
seurs. Contrairement au cas précédent, la somme des deux dimensions calculées
plus haut ne donne donc pas la totalité de la dimension du produit tensoriel
des trois espaces. Ceci provient du fait qu’avec trois indices, on peut fabriquer
des tenseurs ayant des formes intermédiaires de symétrie, par exemple deux
indices symétrisés et le troisième antisymétrisé, ou vice versa.
L’antisymétrisation totale d ’un tenseur de rang N pour un espace E de dimen
sion N aboutit toujours à une entité unique appelée tenseur de Levi-Cività,
modulo un facteur qui varie selon le choix du système des coordonnées, mais
dont la symétrie entre les indices reste la même. Ce tenseur, dont il existe deux
versions, covariante et contravariante, est habituellement noté comme suit.
Introduisons-le tout d ’abord en deux dimensions euclidiennes et en coordonnées
cartésiennes :
Sij = —Sji, —> Ê12 = 1, £21 = —1, £ l l = £22 = 0
Dans ce même système de coordonnées, les composantes contravariantes sont

obtenues en faisant monter les indices avec le tenseur métrique contravariant
^km ^gkigm j
Puisque les seules composantes cartésiennes non-nulles de g^'’ sont =

= 1, les composantes de sont identiques à celles de ey. Il n’en est
plus de même en coordonnées curvilignes.
En dimension trois, on a :
,123 = e231
e*“" — = e,312 = 1 , _321 = £ 2 1 3 ^ g l3 2 ^ _ l
toutes les autres composantes étant nulles car elles impliquent au moins deux
indices identiques et, à cause de l’antisymétrie totale, sont de ce fait égales à
leurs opposées. La généralisation à N dimensions est évidente. On posera, en
coordonnées cartésiennes,
— __ç.i2hh'"iN —ç.hW2 -“iN — , , , avec = 1

Autrement dit, seules les composantes ayant tous les N indices différents seront
égales à 1 ou —1 selon que la permutation d ’indices est paire ou impaire par
rapport à l’ordre primaire (123...AT). Toutes les autres composantes où au
moins deux indices sont égaux sont identiquement nulles.
En coordonnées curvilignes arbitraires, le tenseur -iV gardera son ca
ractère totalement antisymétrique, mais sera multiplié par le Jacobien de la
matrice de passage :
d^h Q^3N
(5.43)
Nous ne donnons pas une preuve rigoureuse et générale de cette affirmation,

mais montrerons son bien-fondé avec les coordonnées polaires et les coor
données sphériques. En deux dimensions, on exprime comme d ’habitude les
coordonnées cartésiennes (x, y) en fonction des coordonnées polaires (r, 9?) par
les formules x = r cos y?, y = r sin (p. En appliquant (5.43) avec
Xl = X , X2 = î/ , = r , (i2' _
on obtient
_ _ dx^ dx^ _ dx^ dx^ . dx"^ dxA

Erifi = e\'2' = — £12 + -£21
dx dy dy dx, J ./ J
(5.44)
En coordonnées polaires, cela s’exprime de façon plus familière par une relation
entre les éléments de surface orientés
1 • 1 •
-Sij dx* ® dx^ = - (dx 0 dy —dy<S> dx) =
A
i (dr cos —r sin (pd<p) <S> {dr sin -1- r cos (p)
¿i
—^ (dr sin —r cos pdj^ ® (dr cos ^ H- r sin p)
= \{rd r ® d p - d p ® dr) = \ek'm> (de**' ® d ^ ' ~ d C ' ® d^^') (5.45)
Nous avons mis en évidence les produits tensoriels des différentielles qui,
comme nous le savons, ne sont pas commutatifs, dx*0 dx*’ ^ dx^ ®dx^^ ce qui
permet de distinguer parmi deux orientations possibles de l’élément de surface

soustendu par les éléments infinitésimaux utilisés.
On vérifie que r est bien le Jacobien du passage des coordonnées cartésiennes
aux les coordonnées polaires
/ dx
dr COSip smip
det dx = det ^ = r(cos^ (p + sin^ (p) = r
r s iïu p rcos(p
\d ip
On trouve de la même façon que, lors du passage des coordonnées cartésiennes

(æ, y, z) aux coordonnées sphériques (r, 9, (p), les composantes covariantes Sijk
du tenseur de Levi-Cività se transforment selon la formule
dx^ d x ^ dx^ 2
où nous avons fait la distinction entre le symbole totalement antisymétrique

ayant pour valeurs +1 et —1 indépendamment du système des coordonnées
choisi, et le vrai tenseur antisymétrique qui comprend aussi le déterminant
de la matrice de passage.
Les tenseurs qui doivent être multipliés par le déterminant de la matrice de
passage s’appellent des pseudo-tenseurs.
Il existe une façon simple d’évaluer une Jacobienne sans recourir au calcul
direct du déterminant qui devient laborieux pour des dimensions supérieures
à 4. Considérons la transformation du tenseur métrique lors d’un passage des
coordonnées cartésien-nes (æ^) à des coordonnées curvilignes arbitraires ):
dx'^ d x ^ dx'‘ dx^

~ gî' g ^ f ~ gî' g^j' (5.46)
Nous avons indiqué plusieurs fois que le tenseur gkm n ’est pas une matrice.
Toutefois, il peut être représenté sous forme d ’un tableau carré N x N (en
dimension N) que nous pouvons interpréter comme celui d’une véritable ma
trice carrée N x N. Convenons que le premier indice soit celui des lignes et
que le second soit l’indice des colonnes. Dans la matrice d fX ^ (qui est une
vraie matrice !) l’indice haut m est un indice de ligne, et l’indice bas désigne la
colonne. Nous pouvons donc dire que dans la formule (5.46) on a le produit des
matrices gitm et d fX ^. Par contre, la matrice di/x^ devant la “matrice” gkm
n ’est pas sommée comme il se doit, car l’on somme son indice de ligne к avec
l’indice de ligne de gkm- On peut néanmoins interpréter aussi cette sommation

comme une multiplication de matrices, à condition de dire que l’on multiplie la
matrice gkm à gauche par la matrice transposée de la matrice La formule
peut ainsi s’écrire symboliquement comme
^ / \ fd x ^ \
9km
)\d ^ n
Sachant que det {A'^) = det(>l) et que le déterminant d ’un produit des ma
trices est le produit de leurs déterminants, nous obtenons la formule
det{gi>f) = det • det(gkm) • det = det (5.47)
car det(^fc^) = 1, puisque, dans les coordonnées cartésiennes, la “matrice”

représen-tant le tenseur métrique n ’est autre que la matrice unité. Ainsi,
d e t d ^ r ) = y/det{gk'm') = VQ
et le pseudo-tenseur eiiyk' s’écrit
Si'j'k' ~ y/ç (5.48)
où eiijiy est le symbole totalement antisymétrique en coordonnées cartésiennes.

Il suffit donc de connaître la métrique en coordonnées curvilignes pour trou
ver l’expression d ’une surface ou d ’un volume élémentaire dans n ’importe quel
système de coordonnées curvilignes. Par exemple, il est bien connu qu’en di
mension 2, l’aire d’une surface élémentaire exprimée en coordonnées polaires
est
I dS 1=1 dxdy 1=1 r drdip \
et que l’élément de volume en coordonnées sphériques en 3 dimensions est
I dV 1=1 dxdydz |=| sin Odrddd(p \
On peut introduire la version contravariante de cette entité, le pseudo-tenseur

^ lequel, en dimension 3, est défini comme
(5.49)
Va
5.7. ESPACE-TEMPS. TENSEURS EN 4 DIMENSIONS 185
Il vérifie quelques relations utiles :
e^^'êam = S i 5 i - S i S j t , Sijm = 25^^ , £*^*£^^ = 6 (5.50)
5.7 Espace-temps. Tenseurs en 4 dimensions

Dans la Théorie de la Relativité proposée par Albert Einstein en 1905, on
considère le temps comme une coordonnée supplémentaire. C’est possible grâce
au fait que la vitesse de la lumière c = 299 987 km/sec s’est avérée constante
pour tous les observateurs galiléens, fait prouvé expérimentalement par Mi-
chelson et Morley en 1888 et vérifié maintes fois depuis.
Ainsi, en multipliant le temps par la constante universelle c, on obtient une
coordonnée notée = et dont la dimension est la même que celle des coor
données cartésiennes x, y, z. L’espace quadri-dimensionnel obtenu en associant
les quatre coordonnées = (ct,x,y,z) s’appelle l’espace de Min-
kowski, ou tout simplement l’espace-temps. Ces coordonnées seront notées avec
les indices grecs, p, u ,... — 0, 1, 2,3, l’indice “0” étant réservé à la “coordonnée
temps” et.
La théorie de la Relativité utilise un tenseur métrique spécial, dit tenseur
métrique de Minkowski, lequel, contrairement au tenseur métrique d’un espace
euclidien, n ’est pas défini positif. Cela signifie qu’il existe des (4-)vecteurs non
nuis dont la “longueur” minkowskienne définie avec cette métrique est nulle.
Ceci reflète le fait que la lumière se propage avec la célérité c dans tous les
repères galiléens. En effet, l’expression
ds^ = (?dt^ —dx^ —dy^ —dz^ (5.51)
associée à la propagation d ’un signal lumineux est nulle dans tous les repères
galiléens. Cette expression peut s’écrire sous forme d ’un produit pseudo-scalaire
(on ajoute le préfixe “pseudo” pour souligner qu’il ne s’agit pas d ’un vrai pro
duit scalaire qui, lui, ne saurait être une forme quadratique dégénérée) :
ds"^ = c^dt^ —dx^ —dy^ —dz^ = Çni,dx^dx’' avec

500 = 1 , 9\\ - - 1 , 922 = - 1 , 533 = - 1 , 9 fj,i' - 0 si P ^ U (5.52)
Rappelons que, par définition, le tenseur de Levi-Cività de E ^ , noté e»iî2...iiv^

est un tenseur totalement antisymétrique dans toute permutation d ’indice.
Il en résulte que ses composantes ayant des indices égaux sont nulles et
qu’il ne possède donc qu’une seule composante non nulle indépendante, £^ ^
toutes les autres composantes non nulles se déduisant de cette dernière en la

multipliant par la signature de la permutation, qui vaut +1 si la permutation
est paire et —1 si la permutation est impaire. Nous poserons par convention
= 1 (5.53)
Les composantes du tenseur de Levi-Cività de l’espace de Minkowski seront

notées avec des lettres grecques
avec =l (5.54)
Sous l’effet d’une transformation linéaire donnée par une matrice 4 x 4 , M , on

a la relation
,/M - P ^ M 'i M i M i M i (5.55)
et les composantes se voient en conséquence multipliées par det(M ) (il faut

introduire le facteur —1 si la transformation est une réflexion spatiale - c’est
la caractéristique des pseudo-tenseur^. On définit de même
a 0 yS (5.56)
£jj.up(T — 9 p a 9vP 9(rf 9pS ^
Notons que dans E"^, les valeurs de et Sp^pa (dans les bases standards
de (E^)®^ et de (æ;4*)®4^ ¿g signes opposés.
Avec les deux versions eûXp et du pseudotenseur complètement anti

symétrique, on peut définir une nouvelle opération sur les tenseurs, à savoir,
le passage d’un tenseur donné totalement antisymétrique, covariant ou tota
lement contravariant de rang p < A”, à un autre tenseur, de rang q = N —p,
appelé son tenseur dual. Ses composantes contravariantes sont définies par
ip ip + lip + 2 - .in _JL ^ (5.57)
où Ip I est la valeur absolue du déterminant de la matrice représentant le tenseur

métrique On a de même
'îp+lip+2—in ~ pj i 2..- i p îp + l...i „ 7^^
11. B ien souvent et en particulier dans ce livre, on se lim ite à des cas où ¡pj = 1 et on m et
^/\g\ dans la définition 5.57.
Le tenseur ainsi obtenu est plus exactement un “pseudo-tenseur” , car sa loi

de transformation dans une transformation linéaire fait apparaître un facteur
mutiplicatif supplémentaire, égal au déterminant de la matrice représentant la
transformation
T = (detM) M O ... M \l
H (5.58)
ou égal à detM ^ dans le cas d ’un “pseudo-tenseur” covariant sur tous ses
indices.
On montre qu’inversement, le dual d’un pseudo-tenseur est un “vrai” tenseur.
Un pseudo-tenseur de rang 0 est un pseudo-scalaire. De même, la contraction
d ’un vrai tenseur avec un pseudo-tenseur donne un pseudo-tenseur, celle de
deux pseudo-tenseurs, un vrai tenseur. Le dual du dual est le tenseur lui-même
ou son opposé :
(5.59)
Des identités remarquables lient les composantes des pseudo-tenseurs de l’es

pace de Minkowski, semblables à celles déjà vues en trois dimensions eucli
diennes. Ainsi, pour le tenseur totalement antisymétrique on peut for
mer plusieurs contractions, en soment par rapport à un, deux, trois ou tous les
quatre indices. Voici les résultats de ces contractions : on a, par contraction
avec :
«'•'''’" v . - p v = <s'p. + iV
^ u' PG — - 2! S ï ,n ,l (6.60)
^ ^p'i/pa —
t ^p,upa — -4 ! = -2 4
La généralisation du calcul tensoriel aux quatre dimensions de Tespace-
temps a permis de mieux comprendre les lois de Télectromagnétisme, établies
par M. Faraday et J.C. Maxwell et leur donner une forme identique pour
tous les observateurs galiléens.
12. M ichael Faraday, 1791-1867, physicien et chim iste anglais. D ’une fam ille très m odeste
de Lancashire, à l’âge de 14 ans il est parti pour Londres gagner sa vie travaillant com m e
relieur. P assionné de physique et de chim ie, il devient assistant d ’un chim iste célèbre, H.
Davy, qui lui lègue son laboratoire. E xpérim entateur de génie. Faraday a découvert plusieurs
lois portant son nom , dont la loi d ’induction électrom agnétique.
13. Jam es Clerk M axwell, 1831-1879, physicien écossais, un des plus grands théoriciens de
Les quatre équations de Maxwell constituent une description complète des

rapports existant entre les champs électrique et magnétique d’une part, et
les charges et courants électriques d ’autre part. Elles doivent être complétées
par les équations dynamiques décrivant le comportement d ’une particule ponc
tuelle massive porteuse d ’une charge électrique, sous l’effet du champ électrique
et magnétique. Ces dernières équations connues sous le nom de force de Lorentz
et de la conservation d’énergie :
dp _ d£ _
- ^ = eE-hevA B, = ev-E (5.61)
dt dt
où P est l’impulsion de la particule, £ son énergie, E est le vecteur du champ
électrique, B celui du champ magnétique. On dit que l’impulsion varie dans
le temps sous l’effet de la force de Lorentz, tandis que l’énergie de la particule
ne varie dans le temps que grâce au champs électrique : la force causée par le
champ magnétique est perpendiculaire à la vitesse de la particule, sa puissance
(le produit de la force par la vitesse) est donc nulle. Notons aussi que e étant
la charge électrique de la particule, le produit ev peut être interprété comme
un micro-courant électrque engendré par une particule en mouvement.
Les équations de Maxwell réunissent les lois établies depuis la fin du dix-
huitième siècle par de nombreux savants ; ces lois portent leurs noms, telle la
loi de Coulomb, la loi de Gauss, la loi d ’Ampère, la loi d ’Oersted et la loi de
Biot et de Savart, puis la loi de Faraday. Voici les quatre équations de Maxwell
exprimées dans le système d ’unités MKSA (mètre - Kilogramme - Seconde -
Ampère) :
divE= P
eo
ÔE
divB = 0, ro tB = )Uoj + iJ,oeo— . (5.62)
ai
Multiplions l’équation de Lorentz (5.61) par dt, et remplaçons v par v d t = dx\
en même temps remplaçons la force Fx, par la dérivée temporelle du 3-vecteur
correspondant aux trois dernières composantes de la quadri-impulsion. Atten
tion : c’est ici, en suivant Einstein, nous modifions la mécanique Newtonienne
afin de rendre la nouvelle version compatible avec les transformations de Lo
rentz, tout en supposant que le coté droit de l’équation dynamique, soit la
force électromagnétique, est déjà satisfaisant tel quel. On obtient alors trois
équations reliant les différentielles {spatiales pour l’instant) de l’impulsion rela
tiviste dp(4) avec les différentielles des quatre coordonnées de l’espace-temps :
to u t tem ps. On lui doit les lois d ’élasticité (ainsi que l ’appellation m êm e du “tenseur”), la
form ulation m oderne de physique statistiq u e, e t surtout les fam euses équations de M axwell,
la base de l’électrodynam ique relativiste.
c(P(4) = qE^ dt + -dx^ —-dx^ dx^ + ... + dx“^B^ —dx^ ,
dp^4) = ^ [e ^ dx° - dx^ B^ + ... + dx^ B ^] ,
4P(4) = “ + dx^ B^ —dx^ B^...j,

Il est à noter que nous utilisons ici les composantes des vecteurs en trois
dimensions, E et B avec leurs indices hauts, sans utiliser la convention de
sommation d ’Einstein. Reste à identifier la composante 0 du quadrivecteur
dpf^ dont les trois composantes spatiales viennent d ’être définies.
Mais nous savons que
me
,2
\ / M 77
représente l’énergie de la particule divisée par c ; nous pouvons donc exprimer
la différentielle de cette quantité, dp°, en évaluant la quantité de travail dW
effectué par le champ sur la particule.
Pendant le temps dt la particule effectue le déplacement dx = \d t. Le
travail n ’est effectué que par la force exercée par le champ électrique, car la
force provenant du champ magnétique est perpendiculaire à la vitesse, donc
au déplacement instantané dx également. Le travail infinitésimal effectué par
le champ E sur la particule est en même temps l’augmentation de son énergie.
Cette quantité est donc égale à
dW = g E • dx,
d ’où, en explicitant, on obtient
^ E • dx = I + E^æ^) (5.63)
Ici encore, on n’utilise pas la convention de sommation d’Einstein ; tout est

écrit explicitement, en utilisant les composantes tridimensionnelles avec les
indices hauts.
Nous voyons apparaître une relation linéaire entre deux quadri-vecteurs,
qui peut être mise en forme d ’une matrice 4 x 4 agissant sur le quadri-vecteur
dx^ pour donner le quadri-vecteur dpf^ :
/d p ° \ 0 E^ E2 E3 \ /dæ®\
dp^ - ^ E^ 0 B^ -E 2 daji
(5.64)
dp^ - c E2 -B ^ 0 El dx^
\dp^ J \E ^ -R i 0 / \dx^ /
S’agissant d ’une relation linéaire entre deux 4-vecteurs, c’est-àrdire deux ten
seurs œntravariants de rang 1, la matrice de transformation (appelée parfois
“matrice de passage”) est un tenseur mixte de rang 2, une fois covariant et
une fois contravariant. Nous pourrons donc écrire de manière plus compacte,
en utilisant les indices d ’espace-temps :
dpl^ = ^Ff^^dx‘', (5.65)

c
avec la matrice 4 x 4 définie ci-dessus par la formule (5.64). Rappelions
que, concernant les indices hauts (contravariants) et bas (covariants), nous uti
lisons la convention suivante : dans la matrice l’indice haut correspond au
numéro de la ligne, et l’indice bas numérote les colonnes. Ainsi la contraction
(sommation d ’Einstein) par rapport à l’indice répété /j, dans la formule (5.65)
représente la multiplication classique d ’une matrice et d ’un vecteur-colonne.
En introduisant le tenseur de Maxwell deux fois covariant :
— 9fiX
nous pouvons écrire la même relation sous une forme légèrement différente,
reliant entre eux le vecteur covariant dpfi et le vecteur contravariant dx'' :
dpu, — ~ F[11/ dx (5.66)

c
ou encore, en divisant par ds les deux cotés.
dp^_q dx^_q _ 9 „ .
(6.67)
ds me
Cette équation doit être cohérente avec ce que nous savons de la 4-impulsion,
notamment, que ses quatre composantes sont liées par l’identité = 0,
dont la conséquence est
dp^ -
. En sunstituant l’expression (5.67) dans cette relation, nous obtenons
Ff,^j^p’' = Q. (5.68)
ds me “ me
Pour vérifier qu’il s’agit effectivement d ’une identité, il faut connaître les pro
priétés du tenseur deux fois covariant Il s’avère que ce tenseur est anti
symétrique, ce qui conduit à l’annulation de sa double contraction avec l’ex
pression pt^p'' qui est symétrique par définition, car p^p'' = p'^p^ puisque les
produits des composantes, qui sont des nombres réels, sont commutatifs.
Vérifions quelles sont les composantes du tenseur en tenant compte

du fait que les composantes nont-nulles dui tenseur métrique covariant sont
données par :
900 = 1) 9 n = - 1 , 922 = - 1 933 = - 1 )
nous arrivons sans peine aux expressions suivantes pour les copmposantes du
tenseur :
Fofc = F ^ Ffco = - F ^ (j,A :,.. , = 1 ,2 ,3 ),
F i2 = - B \ F23 = - B \ F31 = -F 2 ,
F2i = B \ Fs2 = B \ Fi3 = B \

Nous avons donc un tenseur de rang 2, deux fois covariant et antisymétrique,
car Fjiv = —Fun- Ce tenseur n’a que six composantes indépendantes, qui cor
respondent bien aux composantes de deux champs, E et B. On peut donc lui
faire correspondre une 2-forme extérieure selon la définition :
F = -F^^dxi^ A d x‘', (5.69)

£i
qui peut être intégrée sur une 2-surface (plongée dans l’espace-temps).
5. Le q u a d ri-p o te n tie l
En électrodynamique classique on pouvait introduire le potentiel scalaire

V et le potentiel-vecteur A, dont les dérivées définissaient les champs E et B :
_ dK dA
B = V A A = ro t A (5.70)
®= a i’
Là aussi, nous aimerions uniformiser les notations afin de pouvoir remplacer
la dérivée temporelle par la dérivée par rapport à la variable = et. Pour y
arriver, il suffit de diviser et de multiplier simultan’ement le dernier terme :
cela donnera
_ , ^. 1 d(cA) 1 dA
c ot c ot
où nous avons introduit le potentiel-vecteur dont la dimension physique a été
modifiée, À = cA.
Cette nouvelle forme du potentiel a la même dimension physique que le po
tentiel scalaire V, et sa dérivée par rapport à la variable (ayant la dimension
d ’une longueur) donne le même résultat quand à sa dimension physique, que
g ra d V . Le rotationnel de A donne alors le champs magnétique renormalisé
précédemment, ro t À = B.
Puisque désormais nous allons nous servir exclusivement de ces champs

et potentiels re-définis, ainsi que des coordonnées uniformes de l’espace-temps
ayant toutes la même dimension physique, nous allons omettre la “tilde” , et
écrire les équations de Maxwell dans le vide adaptées à la Relativité Restreinte
comme suit :
Id B m
divE = 0, r o t E = ou bien r o t E = ~ ^ ^ o '
dx
1 9E ÔE
diuB = 0, r o t B = - - ^ , oubien r o t B = ^ ^ . (5-71)
avec les relations légèrement modifiées entre le potentiel scalaire et le potentiel-
vecteur :
1 r)A
E = -g ra d V - - ^ , B = ro t A. (5.72)
c at
La forme des relations ci-dessus suggère la possibilité d’introduction d ’un
quadri-potentiel, unissant le potentiel scalaire V et le potentiel-vecteur A :
= [F, A] = [a °, a **]
. Selon les règles qui s’appliquent aux tenseurs, nous pouvons produire un
tenseur covariant en baissant l’unique indice contravariant p à l’aide du tenseur
métrique covariant :
Ap = gpÂ^^:^[V, -A ]. (5.73)
Exprimons les composantes covariantes des champs E et B à l’aide des dérivées
de A^p = [Aô, On trouve :
Ek = - d k V - do ( A ^ ) = - d k V - do i - A k ) = do ( A k ) - dk V,
“ 7)^1 l,m=l
^
^klm ^/ diAm
(
4
~ dmAl4 '\ J• (5.74)
Compte tenu du fait que Bk = et A^fc = —A*’, on arrive à la définition

correcte du champ magnétique.
L’ensemble de ces relations peut être résumé enune seule définition du
tenseur de Maxwell relativiste :
Fpv —dpAp dj/Ap, (6.75)
L’antisymétrie de ce tenseur est évidente, Fp„ = —F^p ; mais on peut aller plus
loin encore en identifiant cette expression comme la différentielle extérieure
d’une 1-forme A = A^dæ^ :
F = dA = d (Apdxt*) = i [dpAu - duAp] dx'Âdx'' = ^ Fpu dx^Âdx''. (5.76)

(Nous n ’utilisons pas d’indice (4) pour les composantes spatio-temporelles Af^,
car il n’y a plus d ’ambiguité, il s’agit bel et bien d’un tenseur une fois covariant
de l’espace-temps).
De plus, puisqu’il s’avère que le tenseur de Maxwell est une 2-forme exacte,
c’est-à -dire, différentielle extérieure d ’une 1-forme, sa différentielle extérieure
est forcément nulle :
dF = 0 H- - + duFx^ -t- dxFf,u) dx>^ A dx^ A dx^ = 0. (5.77)
On peut dire sans exagération que l’introduction du tenseur de Maxwell

fut un des plus grands triomphes du calcul tensoriel.
La représentation des transformations de Lorentz en termes des matrices
4 X 4 est censée d’agir sur les quadri-vecteurs de l’espace-temps de Min
kowski. Dans les présentations devenues traditionnelles, on l’applique aux
différentielles cdt,dx,dy,dz des variables cartésiennes spatio-temporelles. Si
l’on tient à la réalité physique, mesurable à travers les observations directes, il
serait plus prudent d ’affirmer que les matrices des transformations de Lorentz
agissent sur les quadri-vecteurs énergie et d ’impulsion, que l’on peut rendre
de même dimension physique grâce à la constante universelle c :
ÏE
Les quatre quantités physiques ont l’avantage de représenter les quantités non
seulement mesurables, mais aussi conservées, car une particule relativiste de
masse m vérifie la relation
2A p/2 ./2
- p 2c2 = = E'^ - p'". (5.78)
les composantes = [E/c, p] et = [E'/c, p'] étant liées par une transfor
mation linéaire de Lorentz :
/ = (5.79)
Un autre quadrivecteur important se transformant avec les matrices de Lorentz
est constitué par la fréquence circulaire et le vecteur d ’onde définissant une
onde lumineuse plane et monochromatique, dont les composantes vérifient
l’équation de d ’Alembert :
1^2/ d'^f d ^f ^2y.

(5.80)
c2 ^¿2 dx^ ap2 dz^ ’
dont une des solutions les plus simples est
/ ( r , t) = f{k^x^) = /(w i - kr) = / ( ^ - c t - k x X - kyV - kgz),

à condition que le quadrivecteur d ’onde soit de type limière, autrement dit,

qu’il vérifie la condition = up' j(? — = 0. La transformation de Lorentz
appliquée au quadrivecteur d ’onde selon la fomule W = k*' décrit parfai
tement l’effet Doppler relativiste, vérifié expérimentalement dans les années
trente du siècle dernier. Les transformations de Lorentz entre le temps et
coordonnées cartésiennes de deux observateurs galiléens sont la conséquence
directe de la définition de ces paramètres à l’aide des horloges atomiques et
rayons de lumière, du fait de l’invariance du produit pseudo-scalaire k^x^^ =
^ - e t - kxX - kyp - kgZ.
Dans ce qui suit, nous appliquerons la matrice de la transformation de Lo
rentz aux coordonnées spatio-temporelles, tout en sachant que ces paramètres
nous sont donnés par des mesures dont l’essence est toujours l’interaction entre
les photons et les électrons. Il n ’est donc pas étonnant que la symétrie fon
damentale à laquelle obéissent ces particules, se reproduise dans les mesures
basées sur leurs interactions fondamentales.
5.8 Spineurs
Il s’avère que les matrices 4 x 4 réelles, ne constituent pas l’unique
représentation des transformations Lorentziennes. Il en existe une autre, dite
représentation spinorielle, agissant dans un espace de deux dimensions
complexes. Pour l’étudier, considérons les quatre matrices 2 x 2 complexes,
la matrice unité et les trois matrices de trace nulle, connus sous le nom de
matrices de Pauli :
-(; :)' - c ;)' - c •.) «■>

Ces quatre matrices sont hermitiennes, puisqu’elles vérifient l’identité cr^ = cr^
-
Définissons une matrice hermitienne X vérifiant X = = X ^ à partir

d ’un quadrivecteur = [x^,x^,x'^,x^] = [ct,x,y,z] :
+ x^ x^^ —ix"^ \ + X —i y \
X = xiâ^ = (5.82)
x^ -h ix"^ £CP' —x^ ) \ x + iy et — Z )
On vérifie sans peine l’hermiticité de cette matrice, puisque X^ = X ^ = X

Inversement, soit M une matrice 2 x 2 hermitienne, vérifiant l’identité
(5.83)
^ = ( : d ) = ( f ! ) = " ’■
Les quatre nombres complexes a, 6, c, d sont soumis aux trois conditions : tout
d’abord a = à et d = d imposent la réalité aux nombres complexes o et d ;
5.8. SPINEURS 195
la troisième condition, b = c (équivalente à c = 6 réduit les deux nombres

complexes 6 et c à un seul nombre complexe indépendant, ce qui équivaut à
deux nombres réels. En somme, la condition (5.83) stipule que toute matrice
2 x 2 hermitienne ne dépend que des q u a t r e paramètres réels. Nous pouvons
donc identifier une telle matrice à un quadrivecteur, en posant
a d 1 b+ c
ct _— x.„0 _
X = X =
2 ’ 2
c —b O a—
U —dU
y = x- = - ^ , Z = x^ = —^ , (5.84)
Et voilà la surprise : le déterminant de la matrice (5.82) engendrée par le

quadri-vecteur est égal au carré Minkowskien de ce vecteur :
' et + Z x —i y 2 j2 2 2 2 U
det = e t —X —y —Z — XfiX*^. (5.85)
x + iy et —Z
On peut aussi définir le produit pseudo-scalaire entre deux quadri-vecteurs
et y'^ à l’aide de la formule un peu plus compliquée, mais impliquant les
déterminants des matrices hermitiennes 2 x 2. En effet, on vérifie que si l’on a
a: = i
V “3)
-I- tx‘^ x^ — x^ J
et y = (
'^ l r —y^)) .
*^3 ‘'o ’
\y^ + W (5.86)
^
alors
- [det(X + y ) - detX - detY] = Xy,y>^. (5.87)
Zi
Il s’ensuit qu’une transformation des matrices conservant l’hermiticité et le
determinant conservera aussi le produit pseudo-scalaire Minkowskien, et sera
à ce titre équivalente à la transformation de Lorentz subie par les quadri-
vecteurs correspondants.
Considérons donc la transformation de similitude à l’aide d ’une matrice
complexe 2 x 2 , notée U :
x ^ x =uxul (5.88)
La nouvelle matrice X est bien hermitienne :
X^ = {UXU^Ÿ = (t7^)^^^(C^)^ = UXU^ = X . (5.89)
Il reste à assurer que le déterminant de la matrice transformée reste inchangé,

autrement dit, à ce que det(X^) = det(X).
Sachant que le déterminant de la matrice transposée reste inchangé, nous
trouvons que la dernière condition peut s’écrire explicitement comme suit :
det(A'^) = det U det X det(17^) = det U det{Ü) det X = det X , (5.90)

il faut donc imposer la condition
det Udet{Ü) =\ det U p = 1, (5.91)
d ’où detl7 = ±1 ; on choisit la solution positive detî7 = 1, ce qui définit

l’ensemble des transformations conservant le déterminant d ’une matrice 2 x 2
hermitienne comme matrices 2 x 2 complexes de déterminant 1. Ce groupe des
transformation s’appelle SL(2, C) (groupe linéaire spécial, en deux dimensions
complexes).
Une matrice 2 x 2 complexe dépend de huit paramètres réels, équivalents à
quatre nombres complexes. La condition (5.91) imposée sur une telle matrice
équivaut à deux conditions réelles (partie réelle du déterminant égale à 1,
partie imaginaire égale à 0), ce qui laisse six paramètres libres, exactement le
même nombre que la dimension du groupe de Lorentz : trois rotations spatiales
indépendantes et trois transformations de Lorentz correspondant à la vitesse
relative entre deux repères galiléens, V.
Cela ne suffit pas pour affirmer qu’il existe une correspondance entre les
transformations de Lorentz agissant dans l’espace réel des quadri-vecteurs et
les matrices complexes agissant sur les vecteurs-colonnes en deux dimensions
complexes. Pour pouvoir affirmer que les matrices du groupe SL ( 2 , C) peuvent
être identifiées avec les transformations de Lorentz, il suffit en principe de
considérer les transformations infinitésimales, proches de l’identité. Ayant à
notre disposition les matrices infinitésimales, appelées souvent les générateurs,
on peut retrouver les matrices des transformations finies à l’aide de l’applica
tion exponentielle.
A = e“ , A“ ^ = e~^. (5.92)
où l’exponentielle d ’une matrice est définie de manière naturelle, généralisant

la notion de l’exponentielle d’un nombre, par son développement de Taylor :
- + 1 1 (5.93)
3!
Une des façons de définir les transformations de Lorentz consiste à imposer

l’invariance de la métrique minkowskienne. sous l’effet de telles transformer
tions :
— dp'o't (5.94)
Puisque les matrices de transformations finies sont des exponentielles des mar
trices iî, appelées générateurs des de Lorentz,
A'^gA = g, ~Â^g = gA e^'^g = ge-^. (5.95)

5.8. SPINEURS 197
nous pouvons, en utilisant le développement (5.93), voir ce que cette invariance

implique si on garde uniquement la partie linéaire du développement, en sup
posant qu’il s’agisse d ’une transformation infinitésimale, proche de l’identité :
= ge~^ ~ f 1 + - I - g = g(l r. + Y
iî fi" + (5.96)
dont la partie linéaire en il donne juste
g = —gil. (5.97)
Définissons un tenseur deux fois covariant u> :
~ gfix (5.98)
L’équation (5.97) implique alors l’antisymétrie du tenseur w
= (giî)^ = ii^g = —gil = —w, (5.99)
autrement dit, on doit avoir
(5.100)
ce qui n’est pas sans rappeler l’antisymétrie de la matrice 3 x 3 définissant les

rotation euclidiennes en trois dimensions - pour la même raison d ’ailleurs, la
conservation de la structure métrique.
On peut donc faire correspondre (mais sans identifier !) une matrice 4 x 4
antisymétrique au tenseur antisymétrique u> :
0 «1 «2 0:3 \
-ai 0 <^3 — <t>2
U) = (5.101)
—0^2 -<l>3 0 (¡>1
\-a ;3 <¡>2 -<î 0 /
et la matrice (la vraie !) ü en inversant la définition (5.98)
/ 0 Oil a2 0:3 \
Q= a = Oil 0 p
-< 3 (¡)2
(5.102)
0:2 <^3 0 -(¡>1
Vas l
- < >2 4>i 0 y
Ecrivons à présent la matrice d ’une transformation de Lorentz générale (in

cluant une transformation de Lorentz impliquant le temps et l’espace ainsi
qu’une rotation euclidienne arbitraire) sous forme d ’une exponentielle :
A= (5.103)
Les deux matrices formant la base linéaire dans l’espace de toutes les matrices
4 x 4 anti-symétriques, K et J , sont définies comme suit :
i 0 0 i 0 0
/°
i 0 0 0 0 0 0 0 0 0
Ki =
0
Vo
0
0
0
0
0 1
0 1
0/
, K2 = i
\0
0
0
0
0
0
0/
J
0 1, Ks =
0 0
0
0
0
0
0/
(5.104)
/0 0 0 0 /0 0 0 0' /0 0 0 0'
0 0 0 0 0 0 0 0 0 0 0 0
Ji = 0 J2 = (5.105)
Ja = 0 0 0 0
0 0 -î ¿ 0 0 0
\0 0 i 0 \ 0 0 0 0/ 0 0 Oy
On notera que les trois matrices K sont anti-hermitiennes, tandis que les trois
matrices J sont hermitiennes :
Kt = -K , J t = J. (5.106)
Les six générateurs forment une algèbre, dite l’algèbre de Lie du groupe
de Lorentz, avec les relations de commutation caractéristant ce groupe.
Voici les relations de commutation, que l’on divise en trois groupes, J{ avec
Ji, Ji avec Kl et Ki avec Ki (où l’on note, pour deux matrices quelconques A
et B : [A, B] = A B - B A)
\Ji, *//] = i
[J i, ÜTi] = i S i l m ^ m i
\Ki, K}\ = —i (5.107)

On identifie facilement les deux groupes de paramètres qui définissent une
transformation de Lorentz arbitraire à l’aide du tenseur antisymétrique
A ~ ^ 0i> —2 (5.108)
Maintenant nous pouvons fabriquer une matrice définissant une transforma

tion de Lorentz en exponentiant la matrice d ’une transformation infinitésimale
correspondant au choix d ’un générateur :
A = exp (5.109)
On identifie le tenseur à valeurs matricielles deux fois contravariant avec les

matrices K et J comme suit :
J ^ = Ki, ik _
J*« =_ Akl Ji. (5.110)
14. La définition rigoureuse d ’un groupe de Lie et de son algèbre de Lie sera donnée et
approfondie dans le Chapitre 7.
5.8. SPINEURS 199
ou plus explicitement,
Kl K2 K z\
°
-K l 0 Jz h
= (6.111)
-K 2 -Js 0 Jl
\-K 3 J2 -Jl 0 /
Les deux cas suivants présentent un intérêt particulier :
a) une rotation en trois dimensions autour de l’axe Ox :
fl 0 0 0 \
0 1 0 0
m = = (5.112)
0 0 cos (j) —sin 0
VO 0 sm(f> co&<j> J
b) une transformation lorentzienne avec la vitesse le long de l’axe Ox :
/cosh(/> sinh0 0 0 \
sin 4> cosh ( ^ 0 0
A(/3) = e
_ _
(5.113)
0 0 1 0
0 0 0 1/
On peut construire les matrices complexes 2 x 2, agissant sur un espace
complexe de deux dimensions, C^, représentant les transformations de Lo-
rentz. Pour atteindre cet objectif, les matrices en question doivent reproduire
les règles de commutation satisfaites par les matrices réelles de dimension 4,
définies par (5.107). Voici la construction, assez surprenante :
Les matrices de Pauli vérifient les relations suivantes :
(Tiaj = S ij 1+ i s i j k <^Ki (5.114)
où 1 siginifie la matrice unité 2 x 2 . Plus explicitement, on a
(7? = 1, i = 1, 2,3; (XiCTj = —djCi si i ^ j. (5.115)
Les relations de commutation entre les matrices cri,
—(TiCTj (TjCi — Sijk^k (5.116)
contiennent le facteur 2, ce qui fait qu’ils ne reproduisent pas les relations

définissant les générateurs des transformations de Lorentz (5.107). Mais il suffit
de les diviser par 2 pour que les nouvelles matrices, égales aux moitiés des
matrices de Pauli, fassent l’affaire : les matrices Tj = ^crj vérifient
(5.117)
A partir de là, on peut fabriquer devx ensembles de six matrices, trois matrices
Ji et trois matrices K j vérifiant les relations constitutives (5.107) : soit
1 *
Ji — nîf ^3 — 2^^’ (5.118)
soit
_ * (5.119)
Ji — 2^*’ ^3 ~ 2^^’
Pour distinguer ces deux représentations, on note la première avec le symbole
(5, 0) et la seconde (0, 5).
Par conséquent, il existe deux espaces linéaires complexes de dimension
deux, dont les éléments s’appellent spineurs de Weyl^^ Puisque les deux en
sembles de matrices (5.118, 5.119) sont des conjugués complexes, on représente
les deux types de spineurs comme vecteurs-colonnes à valeurs complexes :
C:^) (i)' (5.120)
Les spineurs de Weyl se transforment de la même façon sous les rotations ordi
naires en trois dimensions euclidiennes, mais avec un signe opposé sous l’effet
des transformations spatio-temporelles de Lorentz. En exponentiant les trans
formations infinitésimales on obtient l’antion des transformations de Lorentz
arbitraires sur les spineurs de Weyl :
/ = g-|w.<T+|/3.<r
X. (5.121)
avec (3 =
La propriété marquante des spineurs est leur comportement par rapport
aux rotations spatiales. Pour le voir explicitement, considérons une rotation
euclidienne, ce qui correspond à poser, dans les formules (5.121), P = 0. Dans
ce cas, on peut calculer explicitement l’exponentielle de la matrice —5^ • <r :
on obtient
i, 1 1
e = cos -<pl —î n • sin -</>, (5.122)
OÙ 1 est la matrice unité, et 0 = </>n, n étant le vecteur unitaire définissant

Taxe de la rotation euclidienne en question, et (j) la valeur de l’angle de cette
rotation.
15. N ous utilisons les m êm es sym boles que dans le cas des m atrices réelles 2 x 2 sans risque
de confusion, vu le contexte.
16. Hermann W eyl, 1885 — 1955, m athém aticien et physicien théoricien allem and, connu
pour ses contributions m ultiples aux théories de la relativité et m écanique quantique.
5.9. PROBLEMES 201
En posant <j) = 2tt, on trouve, puisque c o s t t = —1 et s I u t t = 0, que sous

l’effet d ’une rotation de 360° les spineurs, au lieu de retrouver leurs valeur
initiale, changent de signe !
Nous discuterons avec plus de détails l’implication de cette propriété sur
la structure du groupe de Lorentz et sur son rapport avec le groupe SL{2, C)
dans le chapitre 7 consacré à la théorie des groupes.
Ajoutons, pour finir, que les tenseurs ont joué un rôle crucial dans la des
cription des milieux continus et, surtout, dans celle de l’électromagnétisme,
tandis que les spineurs ont été introduits pour décrire de manière adéquate le
comportement des électrons, puis d’autres particules élémentaires au compor
tement semblable, appelées fermions.
5.9 Problèm es
P ro b lèm e 5.1 - R e p ré se n ta tio n s d e p ro d u its ten so riels

a) On donne les vecteurs
' l\ Í z \
Vi = , V2 =
Représenter sous forme de vecteurs unicolonnes les produits tensoriels v \ 0 V2 ,

V2 <8> V \, p u is Vi A V2.
b) Représenter sous forme de matrices 2x2 les produits tensoriels
(1 j et 2)
c) Donner une représentation du produit tensoriel
P ro b lèm e 5.2 - T enseur d ’in e rtie

Relativement à un repère cartésien R (0 , x, y, z) on considère un système de
N points matériels Mi dont les masses et coordonnées cartésiennes respectives
sont notées mi, Xi, yi et Zi. Soit A une droite passant par O et dont l’orientation
17. M ais on peut prévoir que to u te com binaison bi-linéaire (quadratique) des spineurs ne
sentira pas cet effet, car ( —1)^ = 1-
est caractérisée par le vecteur unitaire u de composantes ti®, Uy et Uz. On

appelle moment d ’inertie du système par rapport à A la grandeur
I = Y^rni d,
où di est la distance de Mj à A.
a) Exprimer I en fonction des coordonnées cartésiennes des points Mi et des
composantes cartésiennes de u et le mettre sous la forme
k , £ = X, y , Z
k,e
où les quantités Ike sont les composantes du tenseur d’inertie du système.

b) Les N points Mi sont supposés rigidement liés les uns aux autres, formant
ainsi un corps solide S. Celui-ci est mis en mouvement de rotation uniforme
de vitesse angulaire oj autour de A, dans le sens direct par rapport à u.
Montrer que la vitesse de Mj est alors
Vi = wu A O M j
c) Montrer que les composantes du moment cinétique L de 5 par rapport à

O sont données par
Lk = u^, k, i = x , y, Z
i
d) Soit iî'(0 , æ', 2/', z') le repère cartésien qui diffère du précédent par le fait que
ses axes Ox' et Oy! font l’angle d par rapport aux axes Ox et Oy. Exprimer
les composantes du tenseur d ’inertie de S relativement à ce nouveau repère en
fonction de ses composantes dans l’ancien repère et de 4>.
En appliquant directement la formule établie au b), trouver les composantes
du moment cinétique relativement à R' en fonction de ses composantes relati
vement à R.
P ro b lèm e 5.3 - T en seu r des d éfo rm atio n s

Le système S est maintenant globalement au repos dans R, mais il subit des
déformations. On note R» = OMf les vecteurs positions des points Mi avant
déformation et
Vi = R i-f-^(R i)
5.9. PROBLEMES 203
ces vecteurs positions après déformation, où ^(Ri) représente un champ de vec

teur de déplacement. On adm ettra que les points Mj sont suffisamment proches
les uns des autres pour que l’on puisse considérer les écarts = R j —Rj
comme infinitésimaux et écrire par exemple
{‘ (К ,) - i*(R ,) E Д«*■jt
Les quantités T /(R î ) = sont les composantes d’un champ tensoriel

appelé tenseur des déformations. Considérons plus particulièrement quatre
points voisins non alignés M u M 2 , M3 et M4. On écrira pour simplifier
M 1M 2 = a, M 1M 3 = b, M 1M 4 = c.
a) Montrer que le volume V du parallélépipède formé par les trois vecteurs a,

b et c est donné par
y=c-(aAb)
b) Vérifier l’identité
€rst -h -h cV 6 « ] = S? V
€rst étant le tenseur du troisième ordre complètement antisymétrique tel que

ei23 = 1. En déduire que si V est le volume du parallélépipède formé par les
quatre points considérés après déformation, on a
= V (l + divO
Comment interpréter div^ ?

c) Montrer qu’un tenseur quelconque {Tf } peut être décomposé en une somme
de trois termes :
Ti = si + vi^Di
ou :
s{ = \ s > T . T = Y , i t étant la trace du tenseur,
Vi est la partie antisymétrique du tenseur {VJ = —V^^),

' D\ est sa partie symétrique telle que = 0.
d) Trouver le nombre de composantes indépendantes de D\ et de . Montrer

que les peuvent servir à définir un vecteur. Vérifier qu’il s’agit bien d ’un
vecteur en examinant les propriétés de transformation des dans une rotation
autour de l’axe des z.
Que représente {Vf} pour le champ des déformations?
e) On suppose que div^ = 0 et que Montrer que la déformation

correspondante du solide S est localement une rotation.
Problème 5.4”‘ - TVansformations de Lorentz

Soit TV le référentiel en translation à vitesse v = v{'R'/%) = vei par
rapport TZ. Le repère O'x'y'z' de R! a des axes parallèles à Oxyz, Ox coïncidant
avec O'x'. Un évènement de quadrivecteur position x^ dans TZ a dans VJ le
quadrivecteur position [ci', x'] : est lié à a;^ par la transformations
de Lorentz A(u) x'^^' — On notera :
^ V 1
P = - et 7 = --------- (5.123)
F ig u r e 5.1 - Deux repères galiléens en mouvement relatif.
1. Ecrire explicitement la matrice de passage A^^

2. Soit le tenseur du champ électromagnétique et E', B ' les champs
électrique et magnétique dans le référentiel V!.
(a) Ecrire la transformation : F>^'' -> F'^ " en fonction de A^^.
(b) Justifier le fait que les composantes de E ' et B ' parallèles à v sont
inchangées dans la transformation et donner les autres composantes
de E ' et B ' en fonction de celles de E et B.
5.9. PROBLEMES 205
P ro b lèm e 5.5 - T enseur d ’E n erg ie-Im p u lsio n en T h éo rie des C h am p s

En théorie des champs, le Lagrangien dépend de N fonctions x, y, z, ) des
trois coordonnées d’espace x, y, z et du temps t {A = 1, • • •, i\T), ainsi que de
leurs dérivées partielles premières. On utilisera la notation condensée 4>a {x ^)^
où /i = 0, 1, 2,3 avec x^ = x, x^ = y, x^ = z, x^ = et, c étant la vitesse de la
lumière dans le vide, et d/iipA =
Le principe variationnel
Sj J J J L {(pA, d^(pB) d^x = 0

où d'^x = dx^dx^dx^dx^ et où l’intégration est étendue à tout l’espace à quatre
dimensions, conduit aux équations d ’Euler-Lagrange
dL dL
du A = l,---N
d{dfj,ipA) d(pA ’
avec une sommation implicite sur l’indice p. On introduit le tenseur d ’energie-
impulsion
dL _
A d{df,y>A) "
a) Les équations d’Euler-Lagrange étant vérifiées, démontrer la loi de conser

vation
b) Une particule scalaire (spin zéro) neutre (charge électrique nulle) de masse
m et sans interaction (particule libre) est décrite au moyen d’un unique champ
scalaire réel p{x>^) ayant pour Lagrangien
L = ^ d ^ p d^^p -
où dP = da, mais = —di pour i = 1, 2,3 (il s’agit des dérivées partielles par
rapport aux coordonnées covariantes xq = œ» = —x* pour i = 1 , 2 , 3 ) . Le
système d ’unités utilisé ici est tel que c = 1, fi = 1.
c) Ecrire l’équation d ’Euler-Lagrange correspondante.
d) En admettant que l’équation obtenue soit satisfaite par l’onde plane
V>(x^) = exp —i {Et —P • r)

qui sert à décrire une telle particule d ’énergie E et de quantité de mouvement

P, retrouver la célèbre relation liant l’énergie, la quantité de mouvement et la
masse de la particule.
e) Trouver l’expression du tenseur d ’énergie-impulsion associé au champ
et vérifier la loi de conservation correspondante.
P ro b lèm e 5.6 - C h am p électro m ag n étiq u e. T en seu r de M axw ell

Le champ électromagétique, associé au photon, est décrit au moyen d ’un champ
de quadri-vecteurs dont les composantes contravariantes sont telles que
A^ = A q = —V, V étant le potentiel électrique, tandis que les composantes
A^ pour i = 1,2,3 définissent le potentiel vecteur A (noter que Ai = —A*).
On utilise encore le système d ’unités pour lequel c = 1. On admettra que ce
champ vérifie la condition
diÂ^ = 0
appelée jauge de Lorentz.

a) Trouver le tenseur d ’energie-impulsion associé à ce champ et vérifier la loi
de conservation correspondante, le Lagrangien étant
L=- J , avec Fû = dfÂu - duA^
b) Identifier les composantes Too, Tío et Tife, «, A: = 1, 2,3, en les exprimant

en fonction des champs électrique E et magnétique B
Chapitre 6
Géométrie différentielle
6.1 Coordonnées curvilignes et repère local

Les coordonnées cartésiennes sont de loin le plus souvent utilisées pour la
description de positions et de mouvements dans l’espace tri-dimensionnel qui
nous entoure, ou encore dans le plan que représente une feulle de papier blanc,
un tableau noir ou l’écran d’un ordinateur. Pourtant, ces coordonnées cessent
d ’être le mieux adaptées quand il s’agit de donner la position d ’un bateau ou
d ’un avion par rapport au globe terrestre, dont la surface peut être considérée
à grande échelle comme parfaitement sphérique.
Dans tous les exemples de système de coordonnées curvilignes on pourra
constater qu’elles ne peuvent pas représenter la totalité des points de l’espace
Euclidien à trois dimensions sans ambiguité. Souvent, on verra les points ou
les lignes singuliers sur lesquels certaines coordonnées curvilignes n ’auront pas
de valeur précise ou unique.
En dehors de ces singularités, en arrêtant les valeurs des deux parmi les
trois paramètres on obtiendra une ligne, et en fixant la valeur d ’une seule
coordonnée curviligne on définira une surface. L’espace entier pourra donc
être vu comme couvert par trois familles de surfaces, ou par trois familles de
courbes.
Voici une liste de coordonnées curvilignes le plus souvent utilisées en phy
sique mathématique. Dans chaque exemple les trois coordonnées généralisées
sont notées avec les lettres grecques ; on donne leur dépendance des
coordonnées cartésiennes (x,y,z), ainsi que les formules inverses.
4 Coordonnées cartésiennes
X, y, Z le rayon • • vecteur du point M : OM = æi -l - yj-f- zk.

208 CHAPITRE 6. GEOMETRIE DIFFERENTIELLE
On peut aussi écrire, pour uniformiser les notations,
æ= y = z= et inversement, = a:, = y, = z.
Coordonnées cylindriques
{p, Z, (p), X = P cos P, y = psirnp, Z = Z,
avec 0 z = z,
ou encore, avec les coordonnées “algébriques” , ne faisant pas apparaître les

fonctions trigonométriques.
® ^ avec =p, = cosv?, = 2:,
4 ^ Coordonnées sphériques
{r,0 ,(p), -X = r sinOcosp, y = r sindsinp, z = rc o s 6 ,
avec 0 < r < o o , O < 0 < 27T, 0 < ^ < 27t.
et inversement, r = 0 = Arccos , p= A rctan .
On peut aussi utiliser les coordonnées “algébriques” , comme dans l ’exemple

précédent, définies ainsi :
= r, ^2 = cos 0 , ^3 = cos p,
auquel cas
x=î^3y/i-iey,
4 ^ Coordonnées paraboliques
On introduit trois variables, (u, v, p)y avec —00 < u , v < 00 , 0 < y? < 27t.
et l’on pose
u —v
X = V ü ü cos p, y= y/ü Â ) sin p, z=
Pour une valeur de tt ou de u fixée, on a un paraboloide de révolution situé,

suivant le choix du signe des variables u et u, soit avec le sommet tourné vers
le bas, soit vers le haut.
6.1. COORDONNEES CURVILIGNES ET REPERE LOCAL 209
Quelquefois on exprime les mêmes coordonnées à l’aide des coordonnées

sphériques (r, $, (p) :
U = r {I —COS0) = r —Z, U = r (1 + cos^) = r + 2 :, (p.
Coordonnées bi-sphériques
On introduit trois paramètres, 0</ L t< o o , 0 <r] < n , 0 <<p < 27t, avec
lesquels on peut exprimer les coordonnées cartésiennes {x, y, z) comme suit :
sin n cos (p sin 77 sin (p sinh U,

x — a — ;--------- -—, y = a — ;--------- -— , z = a-
cosh/i —cost; cosh/i —cost; ’ cosh /U—cost;
On a aussi
cosh/i + cost;
= ^ x ^ + y'^ + z“
^=
cosh/i —cost; ’
ou encore, en coordonnées “algébriques”,
^ i = c o sh /7 , ^2 = c o st ;, ^s = c o sv p.
^ “ ^2 V^(l ~ ^2)(1 ~ Î 3) ~ 1
æ = o 6 - 7 -----?-) y = o>~----- :----- ' z - a - ------------------
6 -Ç2 il - 6 il - Ù
4 Coordonnées toroidales
Comme dans le cas précédent, les trois paramètres sont de même nature,
0 < p < 00 , 0 < 6 < 2tt, 0 < p < 27t, mais les expressions pour (x, y, z) sont
différentes :
sinh p cos p sinh p sin p sin 6
X — Ci ,
cosh;x —cosO'
^) y —— CL cosh
, p —cos 9^)’ Z CL
cosh/i —cos^
ou encore, avec les coordonnées “algébriques” = cosh/x, ^2 = cos 6, ^3 =

cospy
. JL\/ii “ 1 01 — n JLy^(ii “ 1)(1 ~ il) -y — n JL\ ______

/l “ i l
æ— >0 ______
= noi3-7-----ï“ . 2/ = o _______________
il - i 2 il-i2 ’ ^ ‘" ■ i l - i 2 ‘
En fixant les valeurs des trois coordonnées curvilignes, on définit un point
dans l’espace à trois dimensions (sauf quelques points singuliers, pour lesquels
une ambiguité peut exister, comme par exemple le point r = 0 en coordonnées
sphériques, car dans ce point les valeurs des angles 0 et p n ’ont pas de sens). En
fixant les valeurs des deux coordonnées curvilignes et en laissant la troisième
parcourir son domaine de définition on définit une famille de courbes appelées
lignes de coordonnées. En coordonnées sphériques, si l’on fixe les angles 6 — 6q

et V? = (/?o, on définira une demi droite 0 < r < oo avec l’origine en O allant
vers l’infini dans la direction unique fixée par les angles choisis; si l’on fixe
r = ro et 0 = 00) on obtient un cercle parallèle au plan xOg^ tels les parallèles
sur le globe de rayon ro de latitude 6q ; finalement, en fixant r = ro et (^ =
on définit un demi-cercle, un méridien sur le globe de rayon ro de longitude
<ô-
En fixant la valeur d ’une seule coordonnée curviligne on définit une surface :
l’équation r = ro donne une sphère de rayon ro, centrée à l’origine du système
cartésien des coordonnées. La condition 6 = 6q définit un cône de sommet en
O, dont l’angle au sommet est précisément 0o> tandis que la condition <p = <po
définit un demi-plan comprenant l’axe Oz et passant par la longitude (po. Dans
tous les exemples de système de coordonnées curvilignes on peut introduire
le repère local naturel défini par les dérivées partielles du rayon-vecteur O M
par rapport aux trois coordonnées généralisées. Dans tous les exemples donnés
plus haut les repères locaux
ô(O M ) _
e^, i 1,2,3. ( 6. 1)
sont orthogonaux, mais pas orthonormés, les longueurs des vecteurs de base
Bi n ’étant pas toujours unitaires.
6.2 Plongements. Géométrie des surfaces.

On appelle plongement l’application différentiable d ’une partie ou de la
totalité de la droite réelle ou du plan euclidien dans l’espace euclidien
E® de dimension 3. Cette définition peut être facilement généralisée pour les
espaces de dimension supérieure, notamment l’espace de Minkowski ; cepen
dant, dans ce qui suit, nous nous intéressons presque exclusivement à l’espace
de la géométrie euclidienne habituelle, en trois dimensions.
Les plongements de R^ dans l’espace euclidien de deux ou trois dimension
ont été considérés au chapitre 1, où nous avons discuté les propriétés des
courbes représentant les trajectoires des points matériels. En même temps,
les bases de la géométrie différentielle ont été introduites, avec les notions
de courbure et de torsion d ’une courbe dans ainsi que de sa longueur
naturelle. Mais la véritable géométrie différentielle a vu le jour en début du
dix-neuvième siècle grâce aux travaux du célèbre mathématicien allemand C.F.
Gauss concernant la géométrie interne des surfaces. ^
1. Cari Friedrich G auss (1777-1855), un des plus grands m athém aticiens de tou s les tem ps,
a fait d ’innom brables contributions dans plusieurs dom aines de m athém atiques, ainsi q u ’en
la physique. Il fut appelé de son vivant “le prince des m athém aticiens” .
6.2. PLONGEMENTS. GEOMETRIE DES SURFACES. 211
Considérons une surface S, plongée dans l’espace euclidien à trois dimen

sions, donnée par sa forme explicite, c’est-àr dire, paramétrisée par deux va
riables réelles notées quelquefois (u,v). Les points M de la surface
dont les rayons-vecteurs en coordonnées cartésiennes sont (æ, y, z) deviennent
fonctions des deux paramètres servant de coordonnées “internes” de la surface.
L’application
(«, u) e (æ, y, z) 6 R® (6.2)
est réalisée en spécifiant trois fonctions (x,y,z) des deux variables (u,v).
O M =■x{u ,v)i + y{u, v) j -h z{u, v) k, (6.3)
ce qui peut être exprimé de manière plus formelle en écrivant tout somplement
æ* = a;*(|“), i,j.. = 1,2,3, a ,p ,... = l,2. (6.4)
Les deux vecteurs définis sur la surface S :

aoM dOM
— ©91 — (6.5)
du ’ dv
sont, par définition, tangents à S ; ils ne sont pas forcément mutuellement
orthogonaux.
Le carré de l’élément de longueur d ’une courbe sur la surface S est donné
par la combinaison suivante des produits des différentielles du et dv :
ds^ |e = Edu^ -h 2Fdudv -t- (6.6)
où les coefficients E ,F et G sont donnés par les trois produits scalaires
E = el, F = Bu-By, G = el. (6.7)
Bien évidemment, on peut utiliser la notation plus moderne, en écrivant
ds^^gapded^,
mais nous rendons ici hommage à Gauss qui a introduit l’expression (6.7), avec
les mêmes lettres, en appelant cette expression premère forme quadratique de
la surface S.
La longueur L d ’une courbe appartenant à la surface S, donnée par deux
fonctions d’un paramètre t,u = u't) et u = v{t), s’obtient à partir de l’intégrale
^—j ( 6 . 8)
Pour évaluer l’aire A d ’une partie de la surface, on doit effectuer l’intégrale
A= j J I eu A I dudv. (6.9)
Il existe plusieurs surfaces ayant la même première forme quadratique (au

trement dit, la même métrique induite). On ne peut pas les distinguer “de
l’intérieur” , mais elles peuvent être complètement différentes vues à partir de
trois dimensions, puisque réalisées par plongements différents.
^ E xem ple 1 Un plan, un cylindre, un cône.
Considérons trois surfaces différentes, plongées globalement dans l’espace
euclidien de dimension trois :
- un plan, donné par l’équation z = 0 , avec comme coordonnées internes (æ, y) ;
- un cylindre de rayon R, de l’axe Oz, défini par la relation + y'^ = R?. Sa
surface peut être paramétrisée par l’angle azimutal (p et la coordonnée z :
x = Rcos<p, y — Rsin<p, z = z.
- un cône défini par la relation z = ap = a \Jx^ H- y^, paramétré par l’angle

azimutal p et la variable p, x = pcosp, y = psinp.
La métrique induite sur le plan z = 0 est, bien évidemment, = dx"^ dy"^ -t-
dz“^ = dx'^ + dy“
^, puisque dz = 0. On a donc pxx = L 9 xy = 9 yx = 0 et pyy — 1,
la métrique euclidienne en deux dimensions. Sur la surface du cylindre nous
avons
dx = —R sin p dp, dy = R cos p dp, dz = dz,
d’où ds^ = I^dp^+dz"^. Il suffit d ’introduire à la place de la variable angulaire
p une nouvelle variable ayant la dimension d’une longueur, d^ = Rdp, afin
que la métrique induite sur le cylindre prenne la forme identique que celle du
plan euclidien, ds^ = d^^ -f- dz"^. Finalement, sur la surface du cône, on trouve
la métrique induite en évaluant le carré de 1’él‘ement de longueur en tenant
compte des relations
dx = dpcosp —psinpdp, dy = dpsinp + pcospdp, dz = adp.
On obtient alors, en substituant dans = dx^ + dy^ + dz“

^ l’expression
ds^ = (1 + dp^ -Hp^ dp^.
Introduisons les variables, f = V l + a^p, p = ^ V l + o^ ; on aura alors
ds^ = (1 + dr^ + r^dp"^ .
Il suffit à présent de poser ^ = v T + o ^ rcosp, rj = rsini^ pour

obtenir une nouvelle fois la forme canonique d ’une métrique euclidienne dans
un plan, ds^ = d^^ -|- drf.
Les trois exemples démontrent un fait bien connu de la vie courante : on

peut prendre une feuille de papier et en faire un cylindre ou un cône ( “cornet”)
sans déformer quoi que ce soit, ce qui prouve que la géométrie interne n ’a pas
changé. Mais on ne peut pas, sans déformer la géométrie interne d ’une feuille
plane, en faire une sphère !
Afin de pouvoir distinguer les surfaces dotées de la même géométrie in
terne, mais plongées différemment dans l’espace euclidien à trois dimensions,
Gauss a introduit une autre forme bilinéaire et symétrique, en la nommant
seœnde forme fondamentale d ’une surface (la première forme fondamentale
d ’une surface étant tout simplément sa métrique). Pour tenir compte des par
ticularités des plongements divers, il a fallu construire un objet géométrique
en “sortant” de la surface vers l’espace tri-dimensionnel dans lequel elle a été
plongée. Voici la construction de Gauss :
Soient A et B deux vecteurs tangents à la surface S :
A = A“e«-|-Aê„, B = -f-
ou bien, en utilisant la sommation d ’Einstein et les deux types d’indices,
A = A“ ea, B = 5 ^ 6(9, a , /9 = 1,2 (ou u,v). (6.10)
Les deux vecteurs, bien que tangents à la surface E, peuvent être considérés
comme vecteurs de l’espace euclidien ambiant :
A = A % = A“ 6i, B = B'êk = B ^ ( ^ ) e k . ( 6. 11)
A partir des deux vecteurs tangents on peut fabriquer le vecteur unitaire.
F ig u r e 6.1 - Deux vecteurs tangents à la surface S et le vecteur normal unitaire

définis en même point M de la surface.
normal à la surface S en point M , comme sur la figure (6.1) ci-dessus :

AAB
n= ( 6 . 12)
A HB I sin^'
Effectuons maintenant un déplacement infinitésimal du point M, sans quit

ter la surface S. Le vecteur normal va, lui aussi, subir un changement infi
nitésimal :
OlVt —^ 01S4 "j- dOlSd, n —^ n "t” dïi, (6.13)
Les deux variations infinitésimales s’expriment à l’aide des différentielles des
coordonnées internes de la surface, ;
d O M = ~ d ( ’‘ = e ^ d (‘ , (6.14)
Formons maintenant le produit scalaire de ces deux vecyeurs infinitésimaux :
dO M • dn = 6a — de“ d^^ = -baßdedi^- (6.15)
La forme quadratique baß est apparemment symétrique en ses deux indices ;

on peut donc écrire sa définition sous une forme plus élégante.
1 / dn dn \
(6.16)
- "2 j ■
Toutefois, sous la forme donnée par l’équation (6.16), il n’est pas facile de
saisir le sens géométrique d’une telle expression. Heureusement, il existe une
autre définition de la seconde forme fondamentale, plus élégante et concise.
Les deux vecteurs de base tangente à la surface sont orthogonaux au vecteur
normal n ; on peut donc écrire
n • 6a = 0, a = 1, 2. (6.17)
En dérivant (6.17) par rapport à la variable puis en alternant les indices

a et 13, on obtient tenant compte du fait que d^{n • e«) = 0, les identités
dn dea dn deß
^ • e a + n. • 6/3 -h n ------ ^ (6.18)
d^ß' d^^
ce qui entraine
dn dea dn deß
■6/3 = (6.19)
d^ß’ di^
En substituant (6.19) dans la définition (6.16) on peut élimi,er les dérivées du
vecteur normal n au profit de dérivées des vecteurs tangents e«, pour obtenir
la formule
La symétrie par rapport aux indices (a, P) devient encore plus évidente quand
on se souvient que, par définition,
dsa __ d /5 0 M \ _ d /ô O M \ _ dep
V~âë” y ^ V J ~
ce qui permet de déduire la forme finale de la définition de la seconde forme
fondamentale, connu sous le nom de la formule de Gauss :
ôÔM ÔÔM
boiß — n = nhaß. ( 6 . 21)
Cette formule permet mieux comprendre le sens géométrique de la seconde

forme fondamentale. Il s’agit d ’une généralisation naturelle de la dérivée se
conde d ’une courbe plane : ici, on considère la projection sur le vecteurs normal
à la surface de la dérivée seconde mixte du rayon-vecteur définissant le plon-
gement. Quand la dérivée seconde d’une courbe s’annule, on a à faire à une
droite ; quand la dériée seconde est négative, la courbe est convexe, et là où la
dérivée seconde est positive, la courbe est concave (elle présente un minimum
local). La seconde forme fondamentale permet de définir en tout point de la
surface plongée, sa courbure gaussienne ; ^
_ det(bgß) _ 611622 —f>i2Ù2i

( 6 . 22)
“ d e t(p a ^ )“ E G -F ^ ■
^ La courbure gaussienne K est obtenue comme le rapport du déterminant de

la seconde forme fondamentale et du déterminant de la première forme fonda
mentale. Cette quantité a la dimension cm~^, puisque les entrées de la matrice
baß ont la dimension cm~^, tandis que les composantes de la première forme
fondamentale, E, F et G, sont des nombres purs sans dimension physique.
La courbure gaussienne a une interprétation géométrique. La forme bgß
étant symétrique, elle peut être diagonalisée. Ses vecteurs propres déterminent
les direction dites principales. En un point donné M nous pouvons construire
un plan contenant le vecteur n normal à la surface en M. L’intersection du
plan avec la surface S est une courbe : au voisinage immédiat de M toute
courbe peut être approchée par un cercle d ’un rayon approprié, afin qu’il soit
tangent à la courbe en M.
En faisant tourner le plan autour du vecteur n on passera tantôt par une
direction dans laquelle le rayon du cercle tangent est minimal, ce qui corres
pond à la courbure sectionnelle maximale, tantôt par la direction ou le rayon
2. on a interprété les deux tenseurs covariants, baß et gaß comme matrices 2 x 2
symétriques.
3. on a interprété les deux tenseurs covariants, baß et gaß comme matrices 2 x 2
symétriques.
du cercle tangent est maximal, ce qui correspond à la courbure sectionnelle mi

nimale. Ces directions sont justement les directions principales. La courbure
sectionnelle est tout simplement l’inverse du rayon de courbure en ce point.
X,=//R,
F ig u r e 6.2 - Une courbe plane avec maximum local (à gauche), et courbure sec
tionnelle au voisinage d’un maximum local d’une surface
Sur la figure (6.2) ci-dessous on voit une parabole, avec un endroit de

faible courbure K a = I /R a , et l’endroit où la courbure atteint son maximum,
K B = IfRBf ce qui correspond au rayon de courbure minimal. A droite, on
voit deux courbures sectionnelles d ’une surface coupée par les plans verticaux
contenant la normale n. La courbure gaussienne de la surface en point M
est le produit de deux courbures sectionnelles, minimale (Ki sur la figure) et
maximale {K 2 sur la figure ; on a donc
K = K 1 K 2 = KminKn (6.23)
F ig u r e 6.3 - Trois cas typiques : courbure gaussienne positive (à gauche), nulle (au
centre) et négative (à droite).
La surface S étant supposée orientée., le vecteur n normal à la surface est

dirigé toujours dans le même sens ; dans le cas des surfaces fermées il pointe
vers l’extérieur. La courbure de la surface peut donc être positive ou négative
suivant la convexité par rapport à l’orientation du vecteur n. Par conséquent,

trois situations distinctes peuvent se présenter au voisinage d ’un point de la
surface, comme le montre la figure (6.3) :
• la courbure gaussienne est positive^ K > 0, quand Kmin et Kmax sont
de même signe ;
• La courbure gaussienne est nulle, K = 0, quand une des courbures
principales est égale à 0 ;
• La courbure gaussienne est négative, K <0, quand les deux courbures
sectionnelles Kmin et Kmax sont de signe opposé. ^
4» E xem ple 2 : la courbure gaussienne d’une sphère.
Grâce à la symétrie sphérique, les calculs sont particulièrement simples.
Les points de la sphère de rayon R, centrée en O, sont paramétrisés à l’aide
de deux anfles 0 et :
O M = üsin^cosv? î + ilsin^sin^p j + Rcosd k.
Le vecteur normal à la sphère est en tout point colinéaire avec le rayon-vecteur ;

on a donc
OM
n= = Sin0COS(^ i -h sin 0 s i n j •+• COS0 k.
OM
Les composantes de la première forme fondamentale sont les composantes de

la métrique induite gaß, soit
E = gee = R^, F = ge,p = g,po = 0, G = g^^ = Â^sin^ 6 .
Pour calculer la seconde forme fondamentale baß il fauy d’abord évaluer les
dérivées secondes du rayon-vecteur OM . Les voici :
aÔ M
= —Äsinöcos(p i —iis in ô s in ^ j —Rcos0 k.
de^
a=ôM
= —iîcos^sinv? i + ÄCOS0COS</7 j,
d 0 dg>
aÔ M
= —Ä sinöcosi^ i —Ä sin ö sin ^ j.
4. Maintenant on comprend mieux pourquoi un cône et un cylindre gardent leur géométrie

plane : leur courbure gaussienne est nulle à cause d’une direction formée par une droite, dont
la courbure est nulle.
Les produits scalaires avec le vecteur normal n définissent les composantes de

la seconde forme fondamentale que voici :
dÔM
= n • ÖÖ2 = -R , be^ = n = 0, b,<fi<p n — ^ „ = - i î s i n ^ 9.
dddip d(f^
Il ne reste qu’à diviser le déterminant de baß par le déterminant de Qaß pour
obtenir la couvure gaussienne de la sphère. Comme on pouvait s’y attendre,
nous obtenons
_ det{bgß) _____________ _ _______

Â^sinâ _ __
1
K (6.24)
êt{gaß) gee 9ip<p - 9e^ R ‘^ sin^ 9 RP’‘
La courbure gaussienne de la sphère de rayon R est constante et égale à l’in

verse du carré du rayon, K = R""^ ; les deux courbures sectionnelles, maximale
et minimale, sont égales chacune à R~^.
Pour clore sette section, mentionnons un autre paramètre utile caractérisant
une surface plongée dans l’espace : la courbure moyenne H. Il s’agit de la
moyenne arithmétique entre les courbures sectionnelles maximale et minimale.
Voici la formule définissant la courbure moyenne H :
1 9 n h l - 2ffl2&12 + ^22^22
(6.25)
2 91X922 - 9 i 2 ’
où nous avons utilisé la forme explicite de matrice inverse de gap^ Le signe

“moins” est introduit pour que cette quantité soit positive pour les surfaces
convexes et négative pour les surfaces concaves, par rapport au vecteur normal
n qui, par définition, pointe vers l’extérieur de la surface.
Dans le cas de la sphère de rayon R on obtient bien évidemment H = 1/R,
6.3 Champs vectoriels, dérivée de Lie.

Le plus souvent, c’est une transformation infinitésimale qui nous intéresse.
Un petit mouvement de chaque point de l’espace est déterminé par une di
rection et une valeur absolue, et peut être représentée comme un petit vec
teur défini en chaque point. C’est donc un champ vectoriel, dont les exemples
abondent. Sur la figure ci-dessous on peut voir la carte des vents sur la France
à un moment bien précis ; c’est à partir de ces cartes (et beaucoup d ’autres,
donnant aussi la pression, la température au sol, la densité des nuages, etc.)
que l’on peut analyser le temps et son évolution pour les prochaines heures,
voire jours et semaines.
Un champ vectoriel donné peut être décomposé selon les axes d’un repère
cartésien, mais également selon les axes d ’un repère local provenant d ’un
6.3. CHAMPS VECTORIELS, DERIVEE DE LIE. 219
système des coordonnées curvilignes, par exemple, en coordonnées sphériques :

X = i + X î'j + k= 6;. + X êe +
ou en général, X = X êk. Considérons une fonction scalaire définie dans
l’espace, / = /(^*)- Dans l’exemple illustré par la Figure (6.4) on pourrait
restreindre cette dépendance aux coordonnées sphériques {6 , <p) (longitude et
latitude géographiques) pour paramétrer les ponts sur la carte de France. La
fonction scalaire qui nous intéresse pourrait être la température instantanée
de l’air au dessus du sol, T{9,ip\t).
/ U J *'
/ M U ^ '
I * t
i W i T i / lii; .
■ i M i l ^ i “ *^
^ l I i I i l i i I t ^ ‘
ti i n l iI^ ^
t- • i i i i I ! I I i { ^J ^^^ '
//////////^.
////.'///y////-
f % / / / / / / / / JU i *
fV / / y / / / / / / * ‘ ' • \
/ K / / / / / ■/ / / / < *i v
/ ¿Y < M / / ' ' <O *
/ //♦ ♦ I V V k « ‘ < J V '
•»S N*»»»
ilUW i/
|V / / t ‘ \ \ l »<M
///y-i \ ” w ir n ï
4 : i .i f. •/////
■I i J/
F igure 6 .4 - U n e c a r te d e F ra n ce avec le s d ir e c tio n s e t in te n sité s d e s v e n ts, le 22

ja n v ier 2011 à 13h00. C ’e st u n ch a m p v e c to r ie l e n d e u x d im e n sio n s, p o u v a n t ê tr e
d écrit par les co m p o sa n te s lo c a le s V=
Supposons que la variation temporelle de la température n ’est pas très

rapide ; en revanche, les déplacements d’air chaud ou froid dus au vents peuvent
se produire avec une vitesse considérable ; pour déterminer la distribution des
températures après un temps infinitésimal A i il faut connaître la fonction
T d '' + v'^ Ai, i + Ai) - r Ai, i),
puisque nous pouvons négliger la dépendence explicite en i. On omettra donc

l’argument i de la fonction T, la traitant comme dépendant essentiellement
des En comparant les nouvelles valeurs de T aux anciennes, nous pouvons

trouver la partie linéaire de la différence, comme toujours en calcul différentiel :
f¥T
T Ai) - T ~ ^ Ai + 0((A i)2). (6.26)
Nous allons utiliser une notation plus compacte pour désigner le résultat de
cette dérivation directionnelle : étant donné un champ vectoriel X = X* Cj et
une fonction / = Z(^*'), on notera
C xf = X \^ )^ i= X % f. (6.27)
La nouvelle fonction ainsi obtenue s’appelle dérivée directionnelle de la fonc

tion / le long du champ vectoriel X , ou encore dérivée de Lie par rapport au
champ vectoriel X de la fonction scalaire / .
La dérivation de Lie mérite bien son nom, car elle respecte la règle de
Leibniz : en l’appliquant au produit des deux fonctions /(^ ) et g{^), on trouve
bien
C x { f 9 ) ^ f C x { 9 ) + Cx{f)g. (6.28)
Supposons maintenant qu’un autre champ vectoriel Y est présent à coté du
champ X. On peut imaginer une nuée d ’insectes ou une volée d ’étourneaux, ou
encore une escadre d ’avions, représentés par un champ des vitesses Y évoluant
dans l’air pendant qu’un vent fort continue à souffler ; ce vent est représenté par
le champ des vitesses X. Notre but serait maintenant de comparer le champ
des vitesses Y donné à un instant t avec ce même champ “déplacé” sous l’effet
du vent un instant plus tard, au moment t H- Ai. Il faut donc comparer en
tout point les deux vecteurs, Y(^*’,i) et Y(^*’ -f- X^(^)Af, i -t- Ai). Il y a
là un problème supplémentaire qui apparait clairement quand on représente
ces champs vectoriels avec leurs composantes dans un repère local : la
différence en question, dont nous voudrions identifier la partie linéaire en A i
à une dérivée, s’écrit ainsi :
yi(^fe + X*=(0Ai,i -t- Ai) B iie + X^(OAi) - r ( ^ ^ i) Biie). (6.29)
La difficulté réside dans le fait que pour comparer les composantes de deux
vecteurs, ces vecteurs doivent être projetés sur la même base ; or, ici les vecteurs
de base en -t- X**(^)Ai ne sont pas les mêmes que les vecteurs de base du
point de départ, Donc, notre premier souci devrait être d ’exprimer les
composantes du vecteur déplacé dans le même repère que celles du vecteur
de depart, Y(^*’). Mais nous savons comment se transforment les vecteurs de
base lors d ’un changement de système des coordonnées curvilignes. Il suffit
de traiter les coordonnées “déplacées” comme des coordonnées

nouvelles : posones donc
rf = é'
où nous avons utilisé les indices “primés” afin de distinguer les coordonnées
“nouvelles” des coordonnées “anciennes”
Nous pouvons donc calculer la matrice de passage :
d iè
(6.30)
où est la fonction delta de Kronecker, égale à 1 quand les indices haut et

bas prennent la même valeur, et zéro quand ce n’est pas le cas.
Toutefois, cette matrice n’est pas celle dont nous avons besoin : en fait, on
a bien
= - Stji' efc.
C’est de la deuxième formule que nous avons besoin, puisque nous voulons
exprimer les vecteurs du repère déplacé par les vecteurs de départ ; mais
la matrice calculée dans (6.30) transforme dans le sens inverse. La matrice
permettant de transformer les nouveaux vecteurs de base pour les exprimer
comme combinaisons linéaires des vecteurs de la base de départ est la matrice
inverse de la matrice (6.30) ; bien évidemment, calculer l’inverse de la matrice
3x3 contenant les dérivées partielles des composantes X ^ ajoutées à la matrice
unité n ’est pas une chose facile.
Mais c’est ici que nous pouvons utiliser le fait que ce qui nous intéresse
vraiment est la partie linéaire en petit paramètre Ai, car nous voudrions diviser
la partie linéaire par Ai et passer à la limite A i —> 0, comme cela se fait
toujours dans le calcul différentiel. Il suffit donc d ’utiliser l’approximation
linéaire : dans le cas où la matrice M est égaie à la matrice identité plus une
matrice arbitraire, mais très petite par rapport à 1, on a
P = l + et/, p - ^ c ^ l - e l l .
Nous pourrons donc écrire, en ne gardant que les termes linéaires en A i

considéré comme une quantité infinitésimale, que
, fc'x f .k dX^
= A il efc. (6.31)
Dans ce qui suit, nous pourrons utiliser les indices sans “prime” partout, car
maintenant il n’y aura pas de confusion possible. Donc, voici comment on peut
écrire la différence (6.29), en développant les composantes de Y en série de

Taylor et en utilisant la transformation de la base (6.31). Comme dans le cas
d ’une fonction scalaire, nous supposons que la dépendence explicite en temps
t est tellement lente par rapport aux mouvements réels, que nous pouvons ne
pas en tenir compte ; voici donc le calcul :
yi(^fc + x \ 0 ^ t) B iie + X^'(OAi) - B ii^)

pjiY^ d A. r(e ^ )e i. (6.32)
En ne gardant que les termes linéaires en Ai, et en changeant l’indice de

sommation de j en k dans le dernier terme, nous trouvons :
Y(^fc + X^{i)ù.t) - Y(e*') ^ [x^diY^ - Y^diX^] Bi A t + 0{[AtŸ). (6.33)
L’expression (6.33) aisi obtenue s’appelle la dérivée de Lie du champ vectoriel

Y par rapport au champ vectoriel X, ou le long du champ X ; on la note
comme suit :
X % Y'^ - Y^diX = [CxYŸ Bi (6.34)
On constate immédiatement que par définition,
C x Y = - C y X.
Une autre propriété remarquable de l’opérateur de dérivation de Lie est l’iden

tité de Jacobi, vérifiée par trois champs vectoriels arbitraires X , Y ai Z :
[[X, Y],Z] + [[Y,Z],X] + [[Z,X],y] = 0. (6.35)
On peut écrire la même relation un peu différemment, en prenant en compte

la linéarité et l’antisymétrie du crochet de Lie :
[Z,[X,Y]] = [[Z,X],Y] f [X,[Z,Y]\. (6.36)
ce qui peut s’écrire encore autrement, en explicitant la dérivation de Lie d ’un

champ vectoriel par rapport à un autre :
Cz{[X,Y]) = [CzX,Y] + [X,CzY]. (6.37)
La preuve se fait par calcul direct de ces trois expressions. On peut dire que
la dérivation de Lie des vecteurs vérifie la formule de Leibniz par rapport au
produit antisymétrique défini par le crochet de Lie entre deux vecteurs; la
dérivée de Lie par rapport à Z du crochet de Lie [X, Y] est la somme des
crochets entre CzX et Y, et X avec CzY.
En appliquant £ x à la fonction obtenue par action d ’une 1-forme 6 sur un

champ vectoriel Y on trouve l’expression pour la dérivée de Lie d ’une 1-forme :
CxiOky^) = X % {ekY'‘) = {diOk)Y'^ + OkidiY'^) :
d ’autre part, en postulant la règle de Leibniz pour la dérivée de Lie en général,

on doit avoir :
CxiOky^) = {£xek)Y'^ + Ok{CxY^) = {Cxek)Y^ + Ok{X^diY^ - Y^diX'^y,

en comparant les deux expressions on trouve
CxBk = X^diOk + 6id k X \ (6.38)
En utilisant la même méthode, on peut trouver les expressions explicites pour

les dérivées de Lie de n’importe quel tenseur. Prenons par exemple le tenseur
métrique Çij. Nous savons comment il définit le produit scalaire entre deux
vecteurs dont les composantes, dans le même repère local, sont F® et : on
a (y • Z) = gijY'’ZK Puisque (Y • Z) est une fonction, sa dérivée de Lie de
cette fonction par rapport au champ vectoriel X = X^dk est tout simplément
la dérivée directionnelle le long du champ Z, à savoir
Cx{Y-Z) = X % ( Y - Z ) = {X%gij )Y^Z^+gi j {X%Y^)Z^+gij Y\X%P)
par simple application de la règle de Leibniz. La même règle appliquée à la

dérivation de Lie conduit à l’équation suivante :
Cx{Y • Z) == {Cxg)ijY^Z^ + 9ij{CxYfZ^ + gijY\CxZy). (6.39)
Nous avons dans cette formule une quantité à déterminer, la dérivée de Lie du
tenseur métrique, et deux quantités déjà connues,
{C xY y = X'^dkY^ - Y ’^dkX^, et {C xZ y = X'^ÔkZ^ - Z'^ÔkXK
La comparaison des termes dans les deux formules conduit au résultat re
cherché :
{ C x g ) i j = X '^ d k g ij - g i k d j X ^ - g k A ^ ' ' - (6-40)
On peut établir les formules explicites des dérivées de Lie de n’importe quel
tenseur, covariant, contravariant ou mixte.
Pour terminer, notons encore une propriété remarquable de la dérivée de
Lie. Puisque par définition on a, sur les fonctions,
C x f = X f = X % f,
224 CHAPITRE 6. GÉOMÉTRIE DIFFERENTIELLE
En appliquant la dérivation de Lie par rapport à un autre champ vectoriel

Y et en soustrayant l’expression avec X et y changeant de rôle, on obtient
facilement, en utilisant la définition du crochet de Lie entre deux vecteurs X
et y , que
L xil^Y Î) - L y iC x f) -
[Cx ,C y ] f = [X{Yf) - Y{Xf)] = i[X, Y])f = C[x,Y] /• (6.41)
autrement dit, le commutateur des deux dérivations de Lie par rapport aux
vecteurs X et y est égal à la dérivation de Lie par rapport au champ vectoriel
Z = [X ,y], crochet de Lie des champs X et y .
La formule (6.41) montre cette propriété pour les dérivées de Lie des fonc
tions, mais la formule 6.37) l’étend pour les champs vectoriels. On peut prouver
par la suite que cette propriété reste valable pour la dérivée de Lie en général,
opérant sur les tenseurs de rang et de type arbitraires.
6.4 Les isom étries

La métrique introduite dans l’espace Euclidien à trois dimensions peut être
définie par les produits scalaires entre les vecteurs de base cartésienne,
i . j = j . i = 0, j.k = k j = 0, k.i = i k = 0;
i - i = l, j - j = l, k-k=l. (6.42)
Deux vecteurs arbitraires sont donnés par leurs composantes cartésiennes
X ^ X H + X^j -I- X^k, Y = yî -t- y2j -1- y^k.
et leur produit scalaire X • Y devient, en utilisant (6.42),
XH + X2j -h X^k] • [y H -h y2j -h y^k] = X ^ y i -h X2y2 -h X ^ Y \ (6.43)
ce qui est tout simplement le théorème de Pythagore en trois dimensions. En

utilisant la convention d ’Einstein (sommation sur les indices de même nom
quand un est contravariant (en haut), l’autre covariant (bas)), on peut écrire
la même chose de manière plus générale, valable dans l’espace Euclidien de
dimension arbitraire :
X = X»ei, Y = y*’efe|
Le produit scalaire de ces deux vecteurs est alors calculé en prenant les produits
scalaires entre les vecteurs de base e* et e* :
X . Y = (X* Si) ■(y^ efc) = X ^ Y ^ e i • e^) = gikX^Y^ (6.44)

6.4. LES ISOMETRIES 225
où nous avons introduit le tenseur métrique,
9ik —
Pour donner l’exemple, prenons les coordonnées sphériques et calculons le carré

de l’élément de longueur
I dr p = dr -dr = [erdr + BedO + + e^dif^,
car Br, ев, Bip sont mutuellement orthogonaux. Puisque
= 1, = r^, et e^ = r^sin^0,
L’expression finale est :
I dr |^= dr^ + dd^ + sin^ в d(p^,
ce qui permet d ’identifier les composantes de la métrique :
grr = i, две = g<p = о.

Un champ vectoriel X est appelé champ de Killing de la métrique g%j si la
dérivée de Lie de la métrique par rapport à ce champ est nulle : C x g = 0> ве
qui s’écrit en composantes
{Cxg)jk = x % g jk - дцдкХ^ - gikdjX^ = o. (6.45)
L’ensemble des champs de Killing d’une métrique donnée forme un sous-espace

linéaire dans l’espace de tous les champs vectoriels, car si la derivee de Lie de
Çij s’annule dans la direction X et dans la direction y , il en sera de même par
rapport au champ Z = a X -f PY, a, ¡3 deux réels arbitraires, car
^zg = + ^py)g = « ^ x g + P C,yg (6.46)
Ce qui est plus intéressant encore, c’est que les champs de Killing forment une
sous-algèbre de Lie par rapport au crochet de Lie. Effectivement, en vertu de
l’identité de Jacobi, si X et F sont deux champs de Killing de la métrique g
donnée, et si le champ vectoriel W = [X,Y] est leur commutateur (crochet de
Lie), on aura
Cwg = c,^x,Y\g = [î^x Cy - CYCx]g = c,x{c,Yg) - i^riCxg) = o. (6.47)

Les champs de Killing engendrent des transformations infinitésimales des co

ordonnées appelées isométries, car elles laissent la métrique inchangée (au
premier ordre, bien évidemment) : d’après la définition de la dérivée de Lie,
= à«(i‘ + )) = + < (£M )y + 0(e“).

et puisque (Cx 9 )ij = on voit que, en approximation linéaire, nous pouvons
écrire gij{ï^) = Vérifions qu’il s’agit effectivement des isométries sur
l’exemple de la métrique sur le plan Euclidien. En coordonnées cartésiennes
(æ, y) le tenseur métrique est diagonal, et ses les composantes sont constantes :
9xx = 1) 9yy — 1) 9xy = 9yx = 0. L’équation (6.45) se réduit alors à une
équation différentielle pour le champ inconnu k = x o u y.
{■Cx9)j^ — —9ik^jX^ QjidkX^ — 0. (6.48)
En choisissant les indices j et k tantôt comme xx, comme xy ou encore xy (le
choix yx ne donnera rien de nouveau, car l’espression est symétrique en ces
deux indices) on arrive aux trois équations suivantes pour le champ :
9 ix d xX ^ -{ - 9 x i^ x ^ ^ ~ b) 9 iy ^ v ^ " I" 9 y i^ y ^ ~ 9 ix ^ y ^ " I" 9 y i^ x ^ ^ ~
(on rappelle qu’il faut sommer par rapport à l’indice i qui peut prendre deux
valeurs, i = x ou i = y). Compte tenu du fait que seules composantes dia
gonales de Qij sont non-nulles et valent juste 1, on trouve les trois équations
explicitement :
d x X ^ = 0, d yX V = 0, d x X y + d y X ^ = 0. (6.49)
La solution est immédiate : on constate que X ^ ne dépend que de la variable
y, et X ^ ne dépend que de x, et la dernière équation stipule que
dXV/dx = -d X ^/d y .
Mais si une fonction qui dépend uniquement de x est égale à une fonction qui
dépend uniquement de y, il s’agit tout simplement d ’une constante - disons a.
Dans ce cas on aura comme solution générale,
X ^ = ay + P, X'^ = —ax -|- 7 ,
avec /0 et 7 constantes d ’intégration arbitraires. Nous avons donc trois par
ramètres réels définissant tous les vecteurs de Killing de la métrique Eu
clidienne en deux dimensions. En choisissant une constante parmi les trois
égale à 1 et en annulant les deux autres, on obtient trois champs de Killing
indépendants :
^ (6.50)
dx' dy' ^dx ^dy'
6.5. CONNEXION. DERIVEE COVARIANTE 227
Les deux premiers correspondent aux translations infinitésimales le long de

l’axe X ou y, le troisième champ engendre une rotation infinitésimale du plan
(xy) autour de l’origine. Ces transformations sont les seuls mouvements rigides
du plan Euclidien.
On peut généraliser sans trop d ’effort au cas de trois dimensions Eucli
diennes. Puisque nous pouvons choisir deux autres plans indépendants, yz et
zx, nous aurons encore deux rotations infinitésimales indépendantes, et seule
ment une nouvelle translation le long de l’axe z.
L’ensemble des mouvements rigides en trois dimensions Euclidiennes (les
isométries de la métrique Euclidienne) est constitué de trois translations et
trois rotations indépendantes, dont les générateurs sont :
^ dx’ dy’ dz'

„ d d P « ^
Les isométries peuvent être définies également pour une métrique indéfinie,
ce qui est le cas de l’espace-temps de Minkowski, introduit dans le chapitre
précédent. En notant = r = ci où c est la célérité de la lumière dans le vide,
la métrique minkowskienne admet dix isométries : quatre translations (y com
pris celle dans le temps), trois rotations euclidiennes, et trois transformations
de Lorentz proprement dites, impliquant les couples (r,æ), (r,y) et (t , z ) :
y y y y - —
P ^ ^ P ^ ^
J. d d
^ ^ = ^d -x~ ^d -z'
r 0d d d d d d
L2 = + y
dy
6.5 Connexion. Dérivée covariante

Contrairement aux vecteurs de base Cartésienne, les vecteurs du repère
mobile dépendent du point de l’espace, = efc(^”^). Si un champ vectoriel est
défini par ses projections sur le repère local, en comparant sa valeur en point
avec sa valeur en point voisin infiniment proche, -h il faudra tenir
compte de la variation non seulement des composantes de ce vecteur, mais
également de la variation du repère :
+ d C ) - X(^^) ~ dX = ek) = dX'' dek- (6.53)

On utilise la notation avec un D majuscule pour souligner le fait que l’on

tient compte de la variation de l’ensemble, coordonnées + repère ; on appelle
DX. la différentielle covariante de X. Le premièr terme tient compte de la
variation des composantes X*’ en tant que fonctions de ; le second terme
tient compte de la variation du repère. Nous pouvons les expliciter en effectuant
les dérivations partielles par rapport aux coordonnées :
dek
{ D X f Bk + X''defc = —
d^m ekd
» ^^ + X > ^ ^ • (6.54)
Nous avons délibérément utilisé un indice muet différent dans le second terme
- de toute façon, la sommation se fait de la même manière et donne le même
résultat.
Les dérivées partielles dm^k définissent vecteurs si la dimension de
l’espace est égale à N. Ces vecteurs doivent se décomposer le long les
vecteurs de base locale ; on peut donc écrire
(6.55)
Les N^ coefiicients portent le nom des coefficients de connexion. Il est clair

qu’ils sont symétriques en leurs deux indices bas, F ^ = F^., car
d _ d dO M aÔ M
^rvî
jk P (6.56)
mais on a aussi :
aÔ M aôM a aoM a
(6.57)
a^ja^* a^*=a^j a^* a^j a^*=
En fait, c’est une simple conséquence de la symétrie des dérivées secondes
partielles par rapport à deux variables quelconques.
Les coefficients de connexion ne se transforment pas comme tenseurs une
fois contrar et deux fois co-variants, comme laisseraient supposer leurs indices.
Leur loi de transformation lors d ’un passage d’un système de coordonnées
(^”*) à un autre (t/*’^) n ’est pas homogène. Voici comment on peut définir les
nouveaux coefficients de connexion dans le système de coordonnées . On
utilisera la dérivation composée. La même différentielle D X peut s’écrire en
coordonnées locales ou en coordonnées locales rf' :
D X = [dX'' + Bk = [dX'' + Fj'^/X^'dV'] ej' (6.58)
Les différentielles des composantes du vecteur X \ les d X \ peuvent être ex

primées en fonctions des différentielles des coordonnées d^*” :
f)yk
d X ^ ^ — d r = dmX>^dr-
dc
6.5. CONNEXION. DERIVEE COVARIANTE 229
Cela nous permet d ’introduire une nouvelle quantité, appelée dérivée cova-
riante le long de la coordonnée curviligne généralisant la notion de dérivée
partielle :
D X = [dmX'^ d T + efc = [diX'^ + V f^X ^] dêk = d f e^.

(6.59)
(nous avons changé en route le nom de l’indice muet de sommation, de “m”
en “i” afin de pouvoir sortir la différentielle en facteur commun). Il n’est
pas difficile de trouver la transformation reliant les coefficients de la connexion
dans les deux systèmes de coordonnées. Projetons tout d’abord la définition
des coefficients sur le repère de départ Gm '
Ojiek' — 1 —Tj! y
d rf
où nous avons utilisé le fait que
ei, =
d if
Mais en même temps, on peut écrire la dérivation djiey en utilisant l’expres
sion ci-dessus et en employant la règle de Leibniz :
^ _ d /a r \_ ( \ /'dC ^\
“ drir ~ [drfi'dv'^')
Puisque les vecteurs de base em dépendent explicitement des variables nous

pouvons utiliser la règle de la dérivation composée :
ñ. - — - ^
^ dï]^' dr]j' ’
ce qui conduit à
d e d
drp'dr)^' ^ drjf d e ^ '
En substituant
et en échangeant les indices de sommation l et m, on trouve

cm
dfBk' -=.Jr , k '
ar _ ( dê d e
"r O A/ n nl^mi (6.60)
[drjj'dri'^^ dr}j' Ôrj^
et finalement, en comparant les composantes par rapport à la base em, on

arrive à la loi de transformation des coefficients de la connexion FJJj :
(6.61)
dfji' Qrp' dr}^' dr]j'dri^' ’
On peut se débarasser de la matrice de passage précédant les coeflficients

en agissant à gauche par la matrice inverse et en utilisant le fait que
drf d c
— Sj/ et Sp ri/i^t — rW /,
'drf ~ ~
ce qui donne le résultat final sous sa forme la plus explicite,
. drf dÇ d e I d rf
j'k ' Q jj f Q ^k' ni -I- d r]j'd r]> ^' '
(6.62)
On constate que le premier terme, homogène en coefficients F, correspond

à la loi de transformation d ’un tenseur une fois contravariant et deux fois
covariant ; mais la présence du deuxième terme, contenant les dérivées secondes
des coordonnées, prouve que les coefficients de la connexion ne se transforment
pas comme un tenseur.
Bien évidemment, la formule inverse est aussi valable :
pi _ _/-X —/ ' “T, a e

^ ^ ^ prxj.1.mJ- 7^/// d'^rj’^ '
■L/ii»
-jk - Q^m' Q^k ^n'l> 1- Q^tn' d^Jd^'^' (6.63)
Grâce à cette loi de transformation, la dérivée covariante V jX ^ d ’un vecteur

se transforme comme un tenseur une fois covariant et une fois contravariant :
après un passage du système des coordonnées curvilignes vers un nouveau
système des coordonnées curvilignes rf , on aura
On peut utiliser la même notation V* en l’appliquant aux fonctions : sur

une fonction / = f{^^) l’action de l’opérateur Vj coïncide avec la dérivation
partielle correspondante,
^ i f = dif.
Il est naturel de demander le maintien de la formule de Leibniz pour
l’opération de dérivation covariante. Dans le cas d’un produit de fonction / et
d’un champ vectoriel X la preuve est immédiate : en effet,
V iifX '^) = diifX '^) + f L i f x "^) =

6.5. CONNEXION. DEBIVÉE COVARIANTE 231
= difix'^) + / diX>‘ + / x ^ ) = V if x ’^+ f V iX K

Appliquons le même raisonnement à la fonction qui est le résultat d’action
d ’une 1-forme 9 sur le vecteur X :
ViiûkX'^) = di(9kX'^) = (diÛk)X'^ + 9k(diX'‘),
puisque sur les fonctions Vi = di. Mais en même temps,
ViiOkX'^) = {Vi9k)X'^ + ekiViXi^) = {Vi9k)X>^ + 9kidiX>‘) + TliXK
En comparant ces deux expressions, et en interchangeant les indices de som

mation k et l dans le dernier terme, on arrive à la conclusion, en identifiant
les termes devant que
= di9k + (6.65)
En appliquant une technique de calcul similaire, on peut trouver les expressions

explicites pour les dérivées covariantes d ’un tenseur arbitraire, par exemple,
pour un tenseur deux fois contravariant on a
ViT^^ =
et pour un tenseur deux fois covariant on a
î^kl = diSkl — ~
On voit une règle assez simple : chaque dérivée covariante commence par une
dérivée partielle correspondante, puis chaque indice haut ou bas est sommé
avec un coefficient de connexion exactement comme dans le cas d ’un vecteur
(indices contravariants) ou une 1-forme (indices covariants).
Notons que jusqu’ici nous n ’avons pas utilisé la métrique ; nos coefficients
de la connexion proviennent uniquement de l’utilisation d ’un repère local in
duit par les coordonnées curvilignes. Toutefois, si la structure métrique est
définie, on peut relier les coefficients de la connexion aux dérivées partielles
du tenseur métrique. Supposons donc que les produits scalaires des vecteurs
de base locale ej définissent le tenseur métrique, ainsi que le tenseur inverse,
deux fois contravariant :
• Cfc = çik, avec 5*”” tel que Qik = S^. ( 6 . 66)
En dérivant ces produits scalaires par rapport aux coordonnées et en utili

sant la règle de Leibniz, on trouve
9ik — (®i ’ ®Ai) — {.^j ®i) ■ d" ®fc)’ (6.67)

232 CHAPITRE 6. GEOMETRIE DIFFÉRENTIELLE
Maintenant on peut substituer les définitions des coefficients de la connexion

dans les dérivées partielles des vecteurs de base :
dj 9ik = (Tfi Bm) • + Ci • ( r ^ e„).
En effectuant les produits scalaires des vecteurs de base dans la formule ci-
dessus, nous pouvons écrire
^j9ik ^ji 9tnk "b ^jk 9im.‘ ( 6 . 68)
Nous avons ici un système d ’équations linéaires reliant les coefficients de la

connexion aux dérivées partielles du tenseur métrique ; mais dans cette formule
sont mélangés les divers coefficients Г avec les indices différents. Nous pouvons
séparer les coefficients de la connexion en comparant trois versions de la même
relation (6.68) en prenant trois permutations cycliques des indices covariants
ii,3,k) :
^j9ik — 9tnk + 9irru
î9kj — 9mj + 9kmi
^k9ji ~ 9mi + ^ШЗзгп'
En prenant la somme des deux premières équations et en soustrayant la dernière,
et en utilisant le fait que les coefficients de la connexion sont symétriques dans
leus deux indices bas, c’est-à-dire, que l’on peut poser
рш _pm pm __pm pm _рш
^ ji “ -Lij ) ^ jk ^ kj iAî /ег)
on a la formule intermédiaire, soit
dj9ik + di9kj - dk9ji = 29im Vfj, (6.69)
En montant l’indice bas “г” grâce à la contraction avec le tenseur inverse 9 '^^
et utilisant le fait que
9^^9im —
ainsi que la symétrie du tenseur métrique dans ses deux indices, on arrive au
résultat canonique, qui est
1
9 9^^ {9j9mk + ^k9jm ~ 9m9jk) • (6.70)
Sous cette forme, c’est-àrdire exprimés en fonction des dérivées partielles de

la métrique, les coefficients portent le noms des symboles de Christoffel^
5. Elw in Bruno Christoffel, 1829-1900, m athém aticien allem and, connu pour ses travaux
en géom étrie différentielle, tenseurs, ondes de choc e t géodésie.
6.5. CONNEXION. DÉRIVÉE COVARIANTE 233
et coïncident avec ceux que nous avons déduit dans le chapitre consacré au
calcul variationnel. On rencontre aussi une notation (devenue plutôt rare de
nos jours) avec les crochets :
{$fe} = rj-fc = ^ / {dj9ik + dk9jl - dWjk) •
Il est aussi interessant de remarquer que la même formule (6.70) peut être
déduite à partir de la condition imposée à la métrique, stipulant que celle-ci
soit constante de manière covariante, autrement dit, en imposant la condition
VjQik —0. (6.71)
En effet, conformément à la définition de dérivée covariante d ’un tenseur deux

fois covariant, on aura
'^ i9 jk — ^ i9 jk ~ 9 jm ~ Tÿ- 9mk — 0)
ce qui est équivalent à l’équation (6.70).

La dérivée covariante d ’un vecteur définit un tenseur une fois covariant et
une fois contravariant ; mais ce tenseur contient les composantes du vecteur de
départ ainsi que ses dérivées partielles. Mais, fait extraordinaire, il existe une
combinaison des dérivées covariantes secondes qui fait disparaitre les dérivées
premières et secondes, laissant uniquement les termes linéaires en composantes
du vecteur. On définit donc un opérateur linéaire agissant sur les vecteurs.
Voici comment on y arrive. Il faut former la combinaison antisymétrique des
dérivées secondes comme suit :
(6.72)
avec à droite le tenseur trois fois covariant et une fois contravariant Rj^j ^ ^
appelé tenseur de Riemann, ® qui s’exprime ainsi à l’aide des coefficients de
Christofîel et leurs dérivées partielles :
+ Y^k"p/ _
P
^ ij m jm ^3^ im ^ jm r k -p/
/»■/J. im^
^ jl^ (6.73)
Le caractère tensoriel de l’expression R^j ^ ^ est la conséquence directe de

la définition (6.72), covariante par construction, car ne contenant que les
dérivations covariantes des vecteurs.
Le sens géométrique du tenseur de Riemann peut être bien compris à tra
vers la notion de transport parallèle d’un vecteur le long d ’une courbe. Le
6. Bernhard R iem ann, 1826-1866, m athém aticien allem and, élève de Gauss. U n véritable
génie dont les travaux ont ouvert des pans entiers de m athém atiques m odernes, fondateur
de la géom étrie riem annienne. Plusieurs de ses travaux sont encore d ’actualité.
transport parallèle d ’un vecteur le long d’une courbe est défini comme un
déplacement de ce vecteur tel que l’angle entre ce vecteur et la courbe reste
constant. Dans la figure (6.5) on montre comment, au bout d ’un circuit fermé
sur la surface d’une sphère, le vecteur transporté ne retrouve plus sa direction
initiale.
F i g u r e 6 .5 - L e tr a n sp o r t p a ra llèle d ’u n v e c te u r u le lo n g d ’u n c ir c u it ferm é. Si
le v e cteu r tr a n s p o r té n e c o in c id e p a s a v ec le v e c te u r in itia l ap rès avoir fa it le v o y a g e
circulaire, c e la sig n ifie q u e la g é o m é tr ie n ’e s t p a s e u c lid ie n n e , e t q u e le te n s e u r d e
cou rb u re n ’e s t p a s nul.
Le transport parallèle le long d ’une courbe (pas nécessairement géodésique)

est défini analytiquement de manière suivante. Soit 7 (5) une courbe donnée
par son expression en coordonnées curvilignes = |*’(s). On définit la dérivée
covariante le long de la courbe 7 (5) comme suit :
• pour une fonction /(Î*^) on a
RDsI ds de ^ ’ ds-
Pour un vecteur X = X*’(^*(s)) e* :
D X _ dX>^d^ d&k dÇ
Ds ds d^^ ds
(6.74)
On dira que le vecteur X* est transporté parallèlement le long de la courbe
7 (s) dont le vecteur tangent est si et seulement si l’expression (6.74)
s’annule le long de la courbe. Si le vecteur X est le vecteur tangent à la courbe,
on obtient l’équation d ’une géodésique.
= 0, (6.75)
ds“
^ ds ds
6.6. AIRES ET VOLUMES. FORMES EXTERIEURES 235
obtenue déjà dans le chapitre 3 à partir du principe variationnel minimi

sant la longueur d’un courbe. Ici, on a une définition alternative d ’une ligne
géodésique : c’est la courbe le long de laquelle son vecteur tangent est trans
porté parallèlement.
Considérons deux familles de géodésiques, paramétrisées par s et par r ,
C{s) 6t leurs vecteurs tangents étant respectivement
dÇ
ds ’ * dr
On retrouve une nouvelle fois le tenseur de Riemann en évaluant le commu
tateur des action alternées des opérateurs de dérivation covariante le long les
deux géodésiques voisines, sur un vecteur arbitraire :
Ds D t Dt D s = («-76)
Le tenseur de Riemann apparaît de manière naturelle dans le problème de

déviation géodésique. Etant donnée une courbe géodésique ^*(s), on peut la
déformer en ajoutant partout un vecteur infinitésimal 5^*, pour obtenir une
courbe voisine + La nouvelle courbe n ’est pas forcément une
géodésique si le vecteur 5^^ est une fonction arbitraire de s, mais peut l’être
- du moins en approximation linéaire par rapport à si l’on demande à ce
que la courbe vérifie l’équation des géodésiques. En développant au premier
ordre, on trouve l’équation de la déviation géodésique que doit satisfaire le
vecteur 5^^ :
(6.77)
ds2 ' ^'^ds ds " R iî m +
Ds^ + —0-
Le tenseur de Riemann définit aussi la œurbure sectionnelle de manière sui

vante. Soient et F* deux vecteurs linéairement indépendants. La contrac
tion R^^ définit une matrice qui peut à son tour agir sur un vecteur.
L’expression
X,X* + Yi,Yl‘ - { X ,Y * y '■ ’

s’appelle la courbure sectionnelle relative au plan engendré par les couples
de vecteurs (X, Y"). Cette quantité généralise la courbure gaussienne pour les
dimensions supérieures à 2..
6.6 Aires et volumes. Formes extérieures

La surface d ’un triangle est égale à la moitié du produit de sa base par
son hauteur ; mais elle peut aussi être évaluée comme la moitié du produit des
longueurs des deux de ses côtés et du sinus de l’angle entre ces mêmes côtés.
Dans le cas de deux vecteurs infinitésimaux, dri et dr 2 faisant l’angle a on
aura ^
\d A \= - I dr\ Il d r2 I sina.
F ig u r e 6.6 - Les simplexes de dimension 1, 2 et 3.
F ig u r e 6.7 - Construction de la surface du simplexe en 2 dimensions.
Calculons à présent le volume d ’une pyramide triangulaire construite sur

la base du triangle engendré par dvi et dv2 avec le sommet au dessus de ce
triangle, à la hauteur h, comme sur indiqué sur la Figure (6.9). On sait de la
géométrie élémentaire que ce volume est donné par la formule
F = 1 \d A \h .
La même formule reste valable pour les pyramides obliques. Soit n le vecteur
unitaire perpendiculaire au plan sous-tendu par les deux vecteurs dri et dv2 ,
et dra le troisième vecteur joignant un des sommets de triangle de base (ou
losange, ou n’importe quel polygone servant de base) avec le sommet de la
pyramide, le volume de cette dernière (voir Figure (6.8) ) sera
1
F = - (dra • n) I dA avec dA = | dA | n = - dri A dra,
¿i
où nous avons défini le produit vectoriel du vecteur d ri avec le vecteur dv2 .
Nous obtenons donc le résultat final : le volume du simplexe engendré par les
F ig u r e 6.8 - Une pyramide oblique.
trois vecteurs infinitésimaux dri , dv2 et dra peut s’écrire comme le produit
mixte
^dra • (dri A d r 2).
Le produit vectoriel ^dri A dr2 décrit la surface du triangle servant de base,

tandis que le produit scalaire avec dra correspond à la multiplication de cette
aire par la projection orthogonale du vecteur dra sur le vecteur unitaire normal
à la base (la hauteur). Rappelons la propriété de symétrie cyclique d ’un tel
produit mixte :
dra • (dvi A dr 2 ) = dri • (dr 2 A dra) = dr 2 • (dra A d ri) = —dra • (<¿1*2 A d ri) = etc.
Cette propriété correspond au fait qu’il y a plusieurs possibilités de calculer

le volume du simplexe, en prenant comme base chacun des trois triangles
possibles engendrés par deux vecteurs infinitésimaux parmi les trois, et prendre
comme hautyeur le troisième ; en plus, on a deux orientations possibles pour
chacun des triangles.
Le résultat est donc totalement anti-symétrique :
On généralise toutes ces propriétés en introduisant le produit antisymétrique
entre les 1-formes de base :
F ig u r e 6.9 - Construction du volum e du sim plexe en dim ension 3.

L’élément de surface orienté sera représente comme suit :
= -dS'^^ = i [dx* (g) dx'^ - dx'^ ® dx*' = dx* A dx*. (6.79)
Dans l’espace Euclidien de dimension 3 il y a seulement trois composantes

indépendantes du produit antisymétrique, correspondant aux trois choix d’in
dices différents :
dx^ A dx^, dx^ A dx^, and dx^ A dx^.
C’est pourquoi l’élément de surface en dimension ” orienté vers l’extérieur

de la surface, est souvent confondu avec un petit vecteur normal à la surface,
n, multiplié par la valeur absolue de l’aire sous-tendue par les deux vecteurs
infinitésimaux engendrés par les différentielles dx*.
F igure 6.10 - L’aire et surface élémentaires, avec l’orientation choisie.
L’élément de volume infinitésimal est le produit totalement anti-symétrique

des trois différentielles :
dV = ^ [dx* ® dx^ ® dx*’ -t- dx^ ® dx^ ® dx* -|- dx** <8>dx* (g) dx^
—dx^ ® dx^ (g) dx* —dxP (g) dx* 0 dx* —dx* 0 dx* 0 dx^ ] = dx* A dx^ A dx*
Il est utile de rappeler ici que les éléments d’aire et de volume peuvent en co
ordonnées curvilignes être trouvés en utilisant les déterminants de la métrique
induite ou de la métrique en trois dimensions, comme il a été prouvé dans le
chapitre précédent.
dS = sj\ det(^«^) I de'de^, dV = ^1 detiçij) \ d^^d^'^d^. (6.80)
E xem ple 3 Considérons un tore de rayons b (grand) et o (petit),

dont l’axe de symétrie coïncide avec l’axe Oz. Les points à l’intérieur du tore
peuvent être paramétrisés à l’aide de trois coordonnées curvilignes, p, rj, tp,
avec
0 < p < a , 0 <T] < 2ir, 0 < (p < 2ir.
Nous avons alors, à l’intérieur du tore (y compris sa surface, qui correspond à

la valeur p = a),
X = {b + pcosri) cos(f, y = (b + P cos ri) siü(p, Z = psiïiT}.
Après avoir exprimé les différentielles dx, dy, dz en fonction des différentielles
F ig u r e 6.11 - Le tore de grand rayon 6, petit rayon o, l’axe de symétrie Oz.
dp., d(f, di) on trouve facilement la forme du carré de l’élément de longueur :
ds^ = + dy^ + dz^ = dp^ + p^drf + (6 + p cos r))^d<p^, (6.81)
on a donc Qpp - 1, Çrp, = p^, = (i>+ pcosr))"^, (6.82)

L’élément de volume est obtenu à partir du déterminant de la métrique :
dV = ^J\ deigij \ = p{b + pcosrj). (6.83)
Pour trouver le volume du tore, il faut intégrer de 0 à o par rapport à dp, et

de 0 à 27t par rzpport aux deux angles, ri et (p. On a donc
na p2n /»ZTT
V = dp dip i dri{bp + QOSTi).
JO Jo Jo
Le second terme ne contribue pas au résultat de l’intégration car l’intégrale de
cos ïidî] de 0 à 2TT vaut zéro ; il ne reste donc le premier terme, qui donne
pa p2n pZTT pa
V = dp I dip I drjbp —47t^6 / pdp = 4 ir^b— — {2 nb){'Ka^), (6.84)
Jq Jq Jo Jq 2
résultat assez attendu, car le volume du tore de rayons o et 6 est égal au

volume du cylindre ayant la même section (dont aire est 7ra^) et la hauteur
27t6, la circonférence passant par le centre du tore autour de l’axe Oz.
Passons maintenant à l’étude de la surfaee du tore. La première forme
fondamentale, c’est-à-dire la métrique induite par le plongement, s’obtient
facilement de la métrique (6.82) et posant p = a = Const., dp = 0, ce qui reste

est donc la métrique pap, a, ^ = i], (p.
Qffq — 9 t)<P — Qtpr) — 0) 9<fi<p — “I" O-COSlf)'^, (6.85)
Les deux vecteurs tangents formant une base naturelle sur la surface du tore
sons :
= —asini^cosv? î —osinjysin^ j + acosrj k,
= —(6 + a cos 77) sin ^ i + (6 + a cos 77) cos ^ j. (6.86)
De là on trouve l’élément de surface dS et le vecteur normal n :
dS = e,^ A d^pdr] = a{b + a cos 77) n d<pdr] =
= a{b + a co s7 7 ) [COS 7 7 COS v? i + c o s 7 7 s in y?j + sin77 k] dtpdrj. (6.87)

L’intégration de la valeur absolue de cette expression, a (6 + aco s77) de 0 à 27t
par rapport h (p et r) donne l’aire totale du tore :
n2'n r’ZTT
/•27T pZ27T
iT
/ d(fi dr) a{b + a cos ri) = 27t / dri a{b + a cost ]) = 47râ6, (6.88)
JO Jo JO
car l’intégrale de cos 77^77 de 0 à 27T est nulle.
On voit que l’aire du tore est tout simplément égale à l’aire d ’un rectangle
dont les côtés sont les circonférences du tore, 2Tra et 27t6.
Revenons encore aux formes extérieures. Il est clair que, dans le cas de la
dimension 4, le 4-volume serait égal à la somme de tous les produits tensoriels
entre quatre formes différentielles de base, en prenant en compte toutes les 24
permutations, prises avec le signe plus ou moins, suivant que la permutation est
paire ou impaire, le tout divisé par 4! = 24. Une telle expression fabriquée en
trois dimensions serait automatiquement nulle, car chaque terme contiendrait
forcément deux différentielles identiques, et l’anti-symétrisation conduirait à
leur annulation.
En dimension n la 7i-ème puissance antisymétrisée des différentielles est
la dernière à ne pas s’annuler automatiquement, puisque la multiplication des
71+1 differentielles (ou plus) conduirait à la situation où au moins deux indices
dans chaque terme seraient identiques, apparaissant dans la sommation anti-
symétrisante du produit extérieur deux fois avec les signes opposés, annulant
l’espression finale.
L’espace de. toutes les formes totalement antisymétriques obtenues de cette
manière, appelées désormais formes extérieures, possède la structure naturelle
d ’une algèbre, appelée L ’Algèbre de Grassmann, Cette algèbre est associative
6.7. INTEGRATION DES P-FORMES. THÉORÈME DE STOKES 241
par rapport au produit extérieur, car on peut vérifier en utilisant la définition

de ce produit, que
dæ® A {dx'^ A dæ”®) = (dæ® A dæ*^) A dx®” = dx® A dx*' A dx®” ,
en tenant compte du fait que
dx* A dx^ = ^ [dx* (8 »dx*' —dx^ (8 dx®],
dx®A(dx*’Adx®®‘) = ^[dx®(8 »(dx*’Adx®®®)+dx*(8 i(dx®®®Adx®)+dx®®®(8 >(dx®Adx^)].

O
Cette multiplication est distributive par rapport à la somme entre les formes
de même dimension et à la multiplication par nombres réels : si 6 est une
p-forme, ^ et ^ deux ç-formes quelconques, et a et 6 deux nombres réels, on a
6 A { a ( f + bxll) = a O A(p + b9 A t p , (6.89)
La dimension totale de l’algèbre de Grassmann des formes extérieures en

gendrée dans l’espace de dimension n est égale à 2®®. En dimension 3, par
exemple, nous avons les 0-formes (qui sont tout simplement des nombres de
R^), qui représentent une dimension : puis les trois 1-formes (différentielles)
indépendantes dx, d y and d z ; viennent ensuite les trois 2-formes indépendantes
qui sont d x A d y , d y A d z et d z A d x ; finalement, la seule et unique 3-forme de vo
lume d x A d y A d z . En sommant, nous avons donc l-t-3-f-3+l = 8 = 2^. En Rela
tivité Restreinte on considère le temps comme une dimension supplémentaire,
formant avec les trois dimensions spatiales x , y e t z l ’e s p a c e - t e m p s d e Min
kowski On note x° la coordonnée ‘temps” multipliée par la vitesse de la lumière
c, de sorte que dx® = c d t . Dans cet espace à quatre dimensions la dimension
totale de l’algèbre de Grassmann est 16 : une dimension pour les 0-formes, 4
1-formes indépendantes dx® = edi, dx, d y , d z , puis six 2-formes indépendantes
dx® A dx, dx® A d y , dx® A d z , d x A d y , d y A d z and d z A d x ; ensuite quatre
3-formes indépendantes dx®A dx A dy, d x ^ A d y A d z , d x ^ A d z A d x , d x A d y A d z ,
et une seule 4-forme dx® A dx A dy A d z . La somme donne, comme il se doit,
1-1-4-1-6 + 44-1 = 16.
6.7 Intégration des p-formes. Théorème de Stokes

Nous avons constaté que les opérateurs de dérivations partielles, di, se
transforment exactement de la même manière que les vecteurs de base e^,
tandis que les différentielles des coordonnées curvilignes d^*’ se transforment
comme les composantes des vecteurs, avec la matrice de passage inverse, grâce
à quoi la différentielle d ’une fonction garde son sens intrinsèque :
rdfi t-- f di ifd

f ^r -i f i dk'ff riJ --
dr}
= dyf i ^ d rf = d k 'f ô U r f = d k 'îd r f. (6.90)
La dérivée de la fonction / dans la direction du champ vectoriel X s’écrivant

comme X ^ d kf est semblable à l’action d ’une forme linéaire sur le champ X .
Introduisons la base des 1-formes duale à la base des vecteurs dk en pos
tulant la relation suivante :
d^Hdk) = S l (6.91)
On dira qu’une 1-forme df = d if dÇ^ est évaluée sur un vecteur X — X ^ dk :
df{x) = dif d f (X'“dk) = dif X>‘ d4\dk) = dif x<^ 4 = x^^dkf = x ( /) . (6.92)
En dimension 3 nous identifions les produits extérieurs des différentielles

avec les éléments orientés de longueur, d ’aire et de volume. On utilise souvent
le tenseur totalement antisymétrique eÿfe, z,j,A: = 1,2,3 permettant d ’intro
duire une notation unifiée. Comme nous l’avons déjà remarqué, il s’agit en
réalité d ’un pseudo-tenseur, appelé quelquefois autrement densité tensorielle,
car suite à une transformation des coordonnées cet objet se transforme avec
facteur supplémentaire qui est le déterminant de la matrice Jacobienne de la
transformation.
On écrira alors les trois éléments d’aire élémentaires, engendrés par les
couples des différentielles différents, comme suit (en utilisant la convention de
sommation d’Einstein) :
dEi = ^€ijk dx^ A dx'^, i,j,k = l, 2,3.
et l’élément de volume comme
êijk dx^ A dx^ A dx^.
Les p-formes représentant les éléments infinitésimaux de longueur, d ’aire et de

volume peuvent être intégrées sur les chaînes de dimension correspondante.
Le mot “chaîne” siginifie ici, selon la dimension, une courbe, une surface ou
un volume fini.
Commençons avec les 1-formes qui peuvent être intégrées le long des courbes.
Soit 0 — 6i{x^) dx^ une 1-forme définie dans une portion de l’espace Euclidien,
6.7. INTEGRATION DES P-FORMES. THEOREME DE STOKES 243
et soit 'yAB une courbe orientée joignant deux points A et B, avec A comme
point de départ et B comme point d ’arrivée. Le choix opposé équivaut au
changement d ’orientation, de B vers A.
Supposons cette courbe donnée sous forme paramétrique, æ* = x*(s) ; nous
pouvons toujours choisir comme paramètre la longueur propre de la courbe,
dont le carré de longueur d ’un segment infinitésimal est donné par =
Çikdx'^dx^, avec, en plus, si correspondant au point A et S2 correspondant au
point B. Sur la courbe nous aurons alors l’identité évidente
dæ* = ds, de sorte que d(x^) = 0 (æ*’(s)),

ds
grâce à quoi l ’intégration par rapport à la variable ds peut être bien définie :
f ^= / Oi{x*‘)dx^ = f 6 i{x'^{s))^-ds. (6.93)

J'yAB l'y A B JS i ds
Considérons à présent une fonction /(a:*) définie sur l’espace Euclidien. En
termes d ’algèbre de Grassmann il s’agit d ’une 0-forme. Sa diflfërentielle est
une 1 -forme,
df = ^^dx^ = {dif)dx\ (6.94)
qui peut être intégrée le long de la courbe donnée 'âb ■

rB *2 d f dæ®
I
JA =J/Si dx^ ds
(6.95)
L a même intégrale aurait pu être écrite de manière différente ainsi :

rB
(6.96)
Par conséquent, si l’on intègre une 1-forme qui est une différentielle exacte
d ’une fonction quelconque / , le résultat dépend uniquement des valeurs de
cette fonction aux extrémités de la courbe, et restera le même indépendamment
de la courbe choisie pourvu qu’elle joigne les mêmes points A et B.
Un corollaire bien connu est le constat que le long d ’une courbe fermée
l ’intégrale d ’une différentielle exacte d ’une fonction / arbitraire est toujours
nulle :
df d f dæ®
/
Je /
^ Tdæ® =
Jec dx'’
ds = 0 .
dx^ ds
(6.97)
Le théorème de Stokes est souvent présenté au moyen de gradient d ’une fonc

tion :
grad/ • dl = 0 .
L
Comme nous l ’avons déjà montré, il existe des 1 -formes $ = 6 i{x^)dx^ qui
ne sont pas les différentielles exactes d ’une fonction quelconque; alors leur
intégration le long d ’un contour fermé peut donner un résultat différent de 0 .
Un simple critère permet de décider si une 1-forme est une différentielle to
tale d ’une fonction ou pas. Si di6 j = djOi = 0 , alors, du moins dans un domaine
ouvert de l’espace, il existe une fonction / telle que 6 i = dif. Réciproquement,
si diBj —djdi ^ 0 , alors l ’intégrale de Ojdx^ prise sur un contour fermé peut
être différente de 0 :
dic* .
-ds ^ 0 ,
/cc ds
L ’expression üij = — = didj —djOi, par définition anti-symétrique par rap
port à ses deux indices (ij), définit une 2-forme extérieure iî = ^flijdx^ A dxK
Les 2 -formes peuvent être intégrées sur une surface donnée S . Si la surface
ne circonscrit pas un volume, autrement dit, s’il ne s’agit pas du bord d ’un
volume, alors elle possède elle-même un bord ; en revanche, une surface enfer
mant totalement un volume n ’a pas de bord, comme on peut constater sur la
figure (6 . 10 ).
On utilise le symbole “5 ” pour désigner l’opération de prise de bord d ’un
cycle : une courbe, une surface, un volume... (en dimension 3 on s’arrête là,
mais en dimension 4 ou plus, on pourrait continuer encore). On lira donc
dV = S “la surface S est le bord du volume V, dS = 'y “la courbe 7 est
le bord de la surface 5 , etc. On constate donc que l’opération d a la même
propriété que l’opérateur de différentiation extérieure : c ’est une opération
niloptente, car = 0 , puisque le bord d ’un bord est un ensemble vide.
Soit donc la courbe servant de bord à la surface S notée par C = dE. Dans
ce cas le théorème de Stokes dit que les deux intégrales suivantes donnent le
même résultat
j j Çlijdx^ A dx^ = 9idx^ (6.98)
Dans la notation traditionnelle le même théorème s’écrit comme suit
J y^^(rotB)-dS = (6.99)
Finalement, en définissant la différentielle extérieure d ’une 2-forme comme

une 3-forme, nous obtenons une autre variante bien connue du théorème de
Stokes : soit V un volume et soit S = dV la surface coïncidant avec son bord
bi-dimensionnel. Alors on a :
JJJ îjkdx^ A dxÂ dx^~ j f dv üijdx^ A dxK (6 . 100)
où la 3 -forme est donnée par son expression en coordonnées locales :
^ ijk — 2 [âjfîjfc + d jiïk i -f- dkOij]

L a présentation traditionnelle de ce théorème, due à Gauss et Ostrogradski,

s ’écrit comme suit :
J J J^ divB dV = J J^^B-dS. ( 6 . 10 1 )
On peut généraliser et unifier tous ces résultats en introduisant l’opération

de dérivation extérieure agissant sur l’ensemble des p-formes identifiées avec
les tenseurs p-fois covariants et totalement antisymétriques.
C et opérateur, noté d, doit satisfaire quelques axiomes :
- d est linéaire : d{au + 00 ) = adw + 0 dO,

- d obéit à une loi de Leibniz généralisée :
d{u> A0) = du A0 + (—l)^"a; A d0

où Pu est le degré de la forme extérieure u,
- d est nilpotent : = 0.
Finalement, d appliqué à une p-forme produit une (p+l)-form e, et d agissant

sur une fonction produit sa différentielle ordinaire : df = ^ d x ^ .
Si 0 = Bkdx'^ est une 1 -forme,
dO = diOkdx^ A dx^ + ^(diOk — dk0i)dx'‘ A dx^.

(=0)
Si w est une 2 -forme, nous avons
do; = d{uikdx^ A dx^) = djUikdx^ A dx® A dx^ =
= ^ (djUik + diUkj + dkUji - djUki - dkUij - diUjk) dx® A dx^ A dx*’. (6.102)
Ceci dit, nous venons de présenter une approche axiomatique, en postulant
l’identité d^ = 0 qui doit être vérifiée afin que nos formules soient valables.
En effet, rien qu’en prenant la différentielle d ’une 1-forme, et en appliquant
formellement la formule de Leibniz, on aurait du écrire, pour df = dkf dx*,
d V = d(d/) = [d{dkî)]dx^ + d k f d{dx^) = {Sijkf)dx^ A dx'® + d k f d^x^ = 0.
Le premier terme s ’annule car on somme une expression symétrique en indices

{jk) avec une expression antisymétrique en (j/s), par définition du produit
extérieur ; mais il reste le deuxième terme d^x^ ; par conséquent, afin de justifier
l’égalité d^/ = 0 il faut admettre d ’emblée que d^x** = 0 , autrement dit, cela
reste un postulat ou un axiome, mais pas une propriété qui découle d ’une
définition constructive.
Il existe fort heureusement une autre définition de différentielle extérieure

des p-formes, totalement indépendante des coordonnées, et perm ettant un cal
cul direct - une véritable définition par construction. Cette définition est basée
sur l’utilisation des champs vectoriels et de la dérivée de Lie.
Prenons pour point de départ la relation qui combine la définition de la

dérivée de Lie d ’une fonction et de la 1 -forme engendrée par la différentielle de
la même fonction : soit f{^^) une fonction sur l’espace paramétré par les coor
données curvilignes I*', et soit X = X^di un champ vectoriel exprimé dans le
repère local di, et soit / = f{^^) une fonction différentiable. Sa différentielle df
se décompose dans la base locale des 1 -formes car df = dkf dff^ (partout
on sous-entend la sommation d ’Einstein). Nous écrivons symboliquement :
X f = X \ 0 ^ ^ = C x f^ d f{X ), (6.103)
car
df
df{x) = ^ d e ( x ^ d i) = (X^dkf) d^'îdi) = (X^dkf)sf = X % f.
L ’action de la 1-forme (tf sur un champ vectoriel X coincide avec la dérivée de

Lie de la fonction / par rapport au champ vectoriel X. L ’action de l’opérateur
d sur les fonctions (c’est-à-dire, les 0-formes) est donc claire : appliqué à une
fonction (0-forme) /, l’opérateur d fabrique une 1 -forme df.
Comme nous le savons, on peut introduire les 1-formes plus générales en

multipliant les éléments de la base des 1 -formes par des fonctions quel
conques, pas forcément les dérivées partielles d ’une fonction bien déterminée.
Dans ce cas on aura une 1 -forme arbitraire 6 = 0*(|)d^*. La différentielle
extérieure de cette forme 9, notée dd, est une 2 -forme, définie par son action
sur deux vecteurs arbitraires, X et Y :
de (X, y ) = i [x{e{Y)) - Y(e(x)) - e{[x, y|)| = -dd{Y,X). (6.104)
L ’antisymétrie du résultat par rapport à la permutation (X,Y) (Y,X)

est évidente, compte tenu de l’antisymétrie du crochet de Lie [X, F] de deux
vecteurs, X et Y.
Prouvons maintenant que cette expression s’annule automatiquement si la

1 -forme 0 est une différentielle exacte, 6 = df. Dans ce cas, la définition (6.104)
s’écrira :
1
d(d/) {X, Y) = d^fiX, Y) = ^ [XidfiY)) - Y{df{X)) - df{[X, Y])]. (6.105)
En utilisant l’identification (6.103), on peut remplacer df{X) par Xf , df{Y)

par y / , et d/([X, y ]) par [X,Y]f, ce qui donne le résultat suivant :
rf2/(X, y ) ~ X{Yf ) - Y{Xf) - [X, Y]f = C x C y f - CyCx f - £[x .k ] / = 0
grâce à la propriété (6.37) de la dérivée de Lie.

On peut prouver la validité de la formule (P = 0 pour les formes extérieurs
de degré 2 et plus avec la même formulation symbolique indépendante des
coordonnées locales. L ’opération de dérivation extérieure d peut être étendue
aux formes extérieures. Par exemple, si a> = ujijdx'’ A dx^ est une 2-forme
extérieure (la seule condition étant son antisymétrie, u>ij = —coji), on définira
la 3 forme dw comme suit :
dw{X, Y,Z) = ^ [X (w (y, Z)) + Y(u>(Z, X)) + Z(u;(X, y ) ]
- i [u,(X, [y, Z]) - o;(y, [Z, X]) - u(Z, [X, Y ])],

et ainsi de suite.
(Remarque : nous n’avons écrit ici que les trois permutations cycliques et
divisé le résultat par 3 ; dans plusieurs livres on trouve la définition avec toutes
les 6 permutations des trois arguments (X,Y,Z), les permutations impaires
prises avec le signe —, et le résultat divisé par 6 = 3!. Du fait que la 2-forme
u>ij est anti-symétrique, cela ne fait que compter la même chose deux fois.)
Après cette longue digression sur les propriétés de la différentielle extérieure,
nous pouvons revenir à notre théorème principal, le théorème de Stokes, qui
peut alors être énoncé ainsi :
/ w = / dw,
Jdc Je
une p —forme u intégrée sur un p —bord donne le même résultat que la (p -f
1 ) —forme du) intégrée sur un (p -|-1 ) —volume circonscrit par ce p —bord.
On reconnaît facilement les cas particuliers connus en trois dimensions de
l ’espace Euclidien. Dans le cas d ’intégration de la projection du gradient d ’une
fonction / sur la tangente le long d ’une courbe ouverte, (commençant en point
A et se terminant en point JB) on aboutit au résultat bien connu f{B) —f{A).
On reconnaît également deux théorèmes, connus comme théorème de Green-
Stokes et de Gauss-Ostrogradski :
- L ’intégrale du rotationnel du champ vectoriel X projeté sur une surface

est égal à la circulation de ce champ le long de la courbe (le bord)
enfermant cette surface (Green-Stokes).
- L ’intégrale de la divergence d ’un champ prise sur le volume V est égale

à l’intégrale de la projection de ce champ sur la normale à la surface,
prise sur la surface qui entoure le volume V (Gauss-Ostrogradski).
4> Exemple 4 On peut illustrer le théorème de Gauss avec le calcul du

flux d ’un champ vectoriel à travers la surface d ’un tore - le même que nous
avons étudié dans l ’Exemple 3. Soit X = a^;k un champ vectoriel déflni dans
la portion d ’espace contenant le tore. On se propose de calculer le flux de
ce champ à travers la surface du tore. A cet effet, il faut effectuer l’intégrale
suivante :
fx-dS.
Nous avons déjà les vecteurs tangents définissant le repère local sur la surface
du tore :
= — (6 + acosr?)sin ^ i + (6 + o c o s »7) cosy? j,
= —a s in i 7 co s^ i — osinj^ sin^ j + acosrj k.
de là on tire le produit vectoriel A e^,
A e,, = a (6 + acosT;) [cosi/sin^ i + cosrjcosip j + sinr; k ] .
Multipliée par d(pdr], cette quantité nous donne l’élément de surface infi
nitésimal :
dS = e,^ A erjdipdr) = ndS = a{b + acosi])nd<pdT],
Puisque le champ vectoriel X n ’a qu’une seule composante non-nulle, selon la

direction k, le produit X • dS est facile à trouver, tenant compte du fait que
sur la surface du tore z = asinr] :
X • dS = a (a sin 77) X 0(6 -h a co s 77) sin rjdtpdr] = aa^{b + a co s 77) sin^ 77.
Il ne reste qu’à intégrer cette expression sur la surface du tore, c’est-àrdire, de
0 à 27t par rapport à d</? et de 0 à 27t par rapport à 77 :
/*27t p2ir
al d(fi j 4770^(6 + acos77)sin^77 = 2TT a / dr)o^{b +acosri)sinî]— 2nâa^b,
Jo Jo Jo
sachant que l’intégrale de 0 à 27t de la fonction impaire cosrjsin^r} vaut zéro,
et l’intégrale de 0 à 27t de sin^ 77 vaut tt.
Mais en utilisant le théorème de Gauss sur la divergence, on peut arriver au
même résultat de façon beaucoup plus simple, en notant que la divergence du
champ X est constante : d iv X = dz(az) = a. Sachant que le volume du tore
(évalué dans l’exemple précédent) est égal à 27tô^6 , il suffit de le multiplier
par d iv X = a pour arriver au même résultat.
6.8. PROBLEMES 249
6.8 Problèmes
P r o b lè m e 6 . 1 . - E llip s o ïd e d e r é v o lu tio n , m é tr iq u e in d u ite .
Un ellipsoïde de révolution, représenté sur la figure (6.12), a pour l’axe de

symétrie l ’axe Oz ; son grand demi-axe est égal à c, et son petit demi-axe vaut
a. Les points sur la surface de l’ellipsoide vérifient l’équation
^2 y2 ^2
~2 ~2 ~2 ~
et peuvent être paramétrisés à l ’aide de deux angles, Q et de manière sui
vante :
a; = asin^cosi^, y = asin^sini/?, z = ccos^. (6.106)
F ig u r e 6.12 - Ellipsoïde de révolution, grand axe 2c, petit axe 2a.
a) Définir la métrique induite (la première forme fondamentale). Donner aussi

le tenseur inverse (contra-variant)
b) Trouver les vecteurs tangents formant une base sur la surface de l’ellipsoïde,
6 ô et Former le produit vectoriel e^/\ee et définir l’élément de surface orienté
vers l’extérieur. Trouver l’aire de l’ellipsoïde.
c) Trouver les dérivées secondes partielles a, ß = 0,(p sur la surface
de l’ellipsoïde. Définir (en normalisant le vecteur A ee) le vecteur normal n
sur toute la surface.
d ) Calculer la seconde forme fondamentale baß = n • Trouver son
déterminant et calculer la courbure gaussienne K et la courbure moyenne H.
P r o b lè m e 6 . 2 . - C o u r b u r e g a u ss ie n n e d ’ u n e p s e u d o sp h è r e .
On appelle tractrice une courbe obtenue par glissement d ’un segment de droite
le long d ’un axe, de sorte que l ’une de ses extrém ités (>1 ) reste au contact de
l’axe (Oz), tandis que l’autre (B) reste sur la courbe, le segment AB restant
tout le temps tangent à la courbe qu’il est en train de dessiner (voir figure
(6.13). La tractrice est définie analytiquement à l’aide d ’un seul paramètre.
F ig u r e 6.13 - Une tractrice. En la faisant tourner autour de l’axe vertical z, on

dessine une pseudosphère.
l’angle 6
x = asmO, z = a c o s 0 + a log (6.107)
La surface de révolution autour de l’axe Oz aura donc pour coordonnées
X = asin ^ co syj, 2/ = asin^sin^?, z —acosd + alog tan

œi-
a) Trouver les deux vecteurs du repère mobile, bq et e^p, puis la métrique
induite.
b) Déterminer l’élément de surface dS et le vecteur normal n.
c) Calculer la seconde forme fondamentale bap, puis la courbure gaussienne
de la pseudosphère.
d ) Trouver le tenseur de Riemann, le tenseur de Ricci et la courbure Rieman-
nienne de la pseudosphère.
P r o b lè m e 6.3.* • G é o d é s iq u e s , d é v ia tio n g é o d é siq u e .
Une surface de révolution avec l’axe de symétrie Oz peut être paramétrisée

avec deux variables, p et (p comme suit :
x = pœs(f, y = psimp, z = f{p).

a) Trouver la métrique induite sur la surface en question et ses symboles de
Christoffel.
b) Prouvez que les “méridiens” , c ’est-à-dire les courbes données par l’équation
tp = Constante vérifient automatiquement les équations des géodésiques.
c) Supposons que la courbe x^(s) est une géodésique, c ’est-à-dire, x*’(s) vérifient
le système d ’équations géodésiques
(6.108)
ds 2 ds
6.8. PROBLEMES 251
Considérez le développement en série de Taylor en substituant dans l’équation

(6.108) une courbe légèrement déformée,
æ*(s) = æ*(s) + en*(s).
e étant considéré comme une quantité infinitésimale. N ’oubliez pas qu’il faut
aussi développer en série des puissances de e les coéfficients de la connexion,
+ e n -"W ) = r 5»(x"-) + i n ' a r 5t(x -" W ) + . ..
Ecrire les équations véridiées par la déviation géodésique n^{s) en exigeant

que la nouvelle courbe æ*(s) vérifie les équations géodésiques jusqu’à l’ordre
linéaire en e.
d Appliquer l’équation de la déviation géodésique ainsi obtenue au cas parti
culier des “méridiens” = Const. sur les surfaces de révolution. En donner
une expression générale.
P r o b lè m e 6.4.* - A ir e d ’ u n e s u r fa c e - n e z d ’ a v io n .
Les nez d ’avions de ligne ont souvent la forme d ’un paraboloïde de révolution. ^
Un paraboloïde de rotation, est défini comme une figure géométrique délimitée
par la surface dans l’espace Euclidien tridimensionnel, dont les points (æ, y, z)
sont paramétrés comme suit :
X = pCOSip, y = pSlïiip, z = r^p
où la variable angulaire ^ et 0, varie de 0 à 27t, et p = -H y^. Notre but

est d ’évaluer l’aire de surface d ’un tel paraboloïde.
F i g u r e 6.14 - Un nez d ’avion et le paraboloide de révolution.
7. Leur forme exacte est une courbe algébrique un peu plus com pliquée, toutefois suffi
sam m ent proche d ’un paraboloïde de révolution pour rendre notre problèm e suffisam m ent
réaliste.
a ) On choisit P et <p comme coordonnées curvilignes sur le paraboloïde, avec

0 < P < b, 0< (p < 27T.
Exprimer le vecteur OM = x i+yj+z k astreint à la surface du paraboloïde
en fonction des variables (¡) et ip, les vecteurs de base i, j, k formant une base
Cartésienne.
b) Définir les vecteurs du repère mobile et e,^ c) Calculer toutes les com
posantes du tenseur métrique gij { i , j = p, <p).
d ) Représenter le tenseur gij sous forme d ’une matrice 2 x 2 et calculer son
déterminant que l’on notera det {g) .
e) Définir l’élément de surface du paraboloïde comme
d S = Bp A Bip
et calculer sa valeur absolue | dS |. Comparer avec a valeur de det (g).

f) Trouver la surface du paraboloïde de rotation en intégrant les | d S \ dans
limites appropriées par rapport à <p et p.
Combien pèse le nez d ’avion de ligne fabriqué en tôle de duraluminium
d ’épaisseur 0.5 cm et de masse spécifique 2.8g/cm^, avec L = 3m et b = Im ?
P r o b lè m e 6.5 - A ir e e t v o lu m e d ’ u n e so u c o u p e v o la n te .
L ’espace Euclidien à trois dimensions peut être paramétré par les coor
données paraboliques r), p comme suit :
1
X = cos P, ] sinv?, z= (6.109)
Les domaines de variation des paramétres sont :
0 < I < -f-oo, 0 <r] < + 00, 0 < <p < 27t.
a) Trouvez les trois vecteurs du repère mobile naturel, e^, b.^, b^ h partir de
la paramétrisation du rayon-vecteur OM = æi + 2/j + zk.
b) Exprimez le carré de l’élément de longueur ds^ en fonction de carrés des
différentielles d^, dg, dp et définissez le tenseur métrique pÿ correspondant.
c) Expliquez pourquoi l’expression
y d e t(p y ) d^ A dg A dp
coincide avec l’élément de volume calculé avec la formule directe
dV = Bçd( A Bf)dg A B^.dp

6.8. PROBLEMES 253
d ) On considère la portion d ’espace définie par le domaine de variation des

paramètres suivant :
1 < ^ < 2 , 0 < i7 < 1 , 0 < ¥> < 27t.
Esquissez la forme de l’objet ainsi défini. Quelles sont les valeurs extrêmes
des coordonnées x, y , z l (Conseil : pour répondre à cette question, il convient
d ’abord d ’écrire la formule implicite z = z{x, y) pour une valeur de i] donnée,
en posant r} = b, avec 0 < b < 1 . Démontrez qu’il s’agit d ’une parabole (sauf
le cas limite 6 = 0 qui présente une singularité).
e) Trouvez le volume de cet objet en intégrant l’élément de volume (JV dans

les bornes donn’ees ci-haut :
y = ^ dî] d(p y/detgij.
f ) A présent, on considère le paraboloide de rotation défini par la même pa-

ramétrisation avec la valeur de la variable rj fixée, r¡ = 1. Les deux vecteurs du
repère local sont, par définition, tangents à la surface du paraboloide. Calculez
eç, e^, ainsi que dS = e^d^ A e^d(p
En intégrant | dS \ entre les bornes 0 < ^ < 4 , 0 < <p < 2 ir, trouvez l’aire de
la surface du segment de paraboloide ainsi défini.
P r o b lè m e 6 . 6 * : H y p e r b o lo id e d e r é v o lu tio n .
Considérons un hyperboloïde de rotation, de l’axe de symétrie Oz, donné

par son équation implicite :
f ! 4- ¿ _ f ! - 1
a2 ^ c2 “
C ette forme de surface est souvent utilisée en architecture :
F ig u r e 6.15 - Hyperboloide de rotation ; Cheminées d ’une centrale nucléaire.

a) La surface de l’hyperboloïde peut être paramétrée par deux variables,

0 < H < oo, 0 < 99 < 2 TT de manière suivante :
X= ocosh/i co8 (p, y = ocosh/i sin^?, Z= csinh/i.
Déduire l’expression du carré de l’élément de longueur ds^ restreint à la sur

face de l ’hyperboloïde, en fonction des différentielles dfj, et d(p. Trouver les
composantes du tenseur métrique de l ’hyperboloïde, = g^^ et g,p,p.
b) En tout point M de l ’hyperboloïde on peut définir la base locale de deux
vecteurs.
aoM dOM
©y? —
dfi ’ dtp
Vérifier que les produits scalaires e^, et e^-e,^ donnent bein les composantes
du tenseur métrique trouvé dans la question précédente.
c) Trouver l’expression de l’élément de surface de l’hyperboloïde donnée par
dS = A dpdp.
d) On considère une portion d l’hyperboloïde comprise entre les valeurs de

^ = 0 et Z = i ï . Trouver l’aire totale de cette surface en intégrant
I dS
entre les bornes appropriées.

Remarque : On rappelle que
J \/x^ dæ = ^ x^ -h -b log{x + y/x^ + b^)

Chapitre 7
Théorie des groupes
7.1 Symétries et lois de conservation

L a plus simple façon d ’introduire le lien entre les symétries et les lois de
conservation de certaines quantités physiques consiste en la considération un
peu moins “traditionnelle” de la formule de Taylor. Le développement limité
d ’une fonction réelle / d ’une variable réelle x autour d ’une valeur choisie de
/ ( x + i,) = /(x ) + f t ^ W + ^ ^ M + : ( X) + ... (7.1)

3! dx^
On suppose d ’habitude que h représente une quantité infinitésimale, suffisam
ment petite afin que quelques premiers termes de l’expansion infinie (7.1)
puissent fournir une très bonne approximation de la valeur exacte recherchée
de f{x -h h). Mais rien n’empêche d ’utiliser la même formule en remplaçant
la quantité infinitésimale h par une quantité finie a. Dans ce cas, on parlera
d ’une opération de translation finie permettant de produire la valeur f{x + a)
à partir de la valeur f{x) donnée, en supposant connues toutes les dérivées
d ’ordre quelconque :
.. . ... df . . a?d‘^ f. , a^d^f, .

f{x + a) = f{x) + a— {x) + + - (7-2)
On peut écrire la même formule en utilisant le symbole de l’exponentielle :
d d? ¿3
f{x + a) = e“ dx f{x) = + / (x ). (7.3)
^ ^dx 2 ! dx^ 3! dx^
L ’opérateur défini par cette série infinie, agissant sur les fonctions d ’une va
riable réelle, porte le nom opérateur de translation par o. L ’opérateur de
dérivation est alors appelé le générateur des translations - ici le long de la
256 CHAPITRE 7. THEORIE DES GROUPES
seule variable æ, mais les translations le long de n ’importe quelle autre dimen
sion peuvent être construites de la même manière.
L a même formule s’applique aux fonctions dépendant du temps t ; on par
lera alors d ’une translation temporelle.
On voit apparaître une relation bi-univoque entre la conservation de la
valeur de / sous l ’effet de translation, et l’annulation de la dérivée :
d
f ( x + a) = f { x ) f = 0. (7.4)
dx
Il est clair que les deux constats sont équivalents : on peut dire que la fonction
/ est i n v a r i a n t e s o u s tr a n s l a t i o n s , autrement dit f { x •+• o) = f { x ) , ou bien
que l’opération de dérivation par rapport à x annule la fonction / , puisque
f { x + a ) — f ( x ) = 0 implique d f / d x = 0 et vice versa.
Les opérateurs de translation fournissent l’exemple d ’un g r o u p e - en l’oc
curence, il s ’agit d ’un groupe bien particulier, le groupe des transformations
de la droite réelle à laquelle appartient la variable x . On constate facilement
que ce groupe est a b é lie n , ou c o m m u t a t i f - deux opérations quelconques cor
respondant à une translation par a et par b respectivement donneront le même
résultat quel que soit leur ordre, car /((æ -t- a) -f 6) = f { ( x + b) + a ) . A toute
transformation de translation on peut attribuer la transformation i n v e r s e : si
après la translation par a on effectue la translation par —a , on revient au point
de départ, ce que l ’on peut caractériser comme la translation par o = 0. On
appelle cette transformation qui ne change rien l ' é l é m e n t n e u tr e du groupe.
Les t r a n s f o r m a t i o n s p r o j e c t i v e s de la droite réelle forment un autre groupe,
plus riche, car dépendant de 4 paramètres réels :
a x + b
X€ æ= (7.5)
cx + d
Voyons si l’application consécutive de deux transformations projectives de la
droite est équivalente à une transformation projective. Soit donc
a i x + bi «2 y + &2
y-Tri{x) = -------— , Z = TT2 {y) = ------— 7 -
C\ X -{■ d \ C2 y H- ¿2
deux transformations projectives, notées symboliquement tti et 7T2 . Leur com
binaison 7T2 o Tçi s’obtient en insérant dans la formule pour z l’expression y en
fonction de X, ce qui donne :
o ,ri)(^) = z(x) = + (7.6)

( c 2 a i -t- d 2C i ) x -h (C 2 6 1 + d2d i ) c z x -H dz
ce qui permet d ’écrire
azx-\-bz
2 : = 7T2 o 7 T l(x ) = 7T3(x) =
czx + dz'
où l’on pose
Û3 = 0,20,1 + Ù2 C1 Ù3 = 0,2bi + C3 = C2 O1 + ¿2^1 e t d z — C2&1 + <¿2*^1 •
Deux choses importantes sont à noter :

1) L a loi de compositon n ’est pas œmmutative, car les mêmes deux
opérations effectuées dans l’ordre différent donnent un résultat différent, car
02 O1 + i»2Ci 7^ 01 O2 + biC2 , etc.
2) L a loi de composition (7.6) coincide avec la loi de composition des
matrices 2 x 2 : il suffit d ’identifier les opérations tti et 7T2 définies comme trans
formations projectives de la droite réelle avec les transformations linéaires
d ’un plan paramétré par ses coordonnées cartésiennes (x,y), définies de
manière évidente comme
01 fei \
«) ( = Cl di J \ y J
(7.7)
On peut écrire symboliquement, en notant la m atrice 2 x 2 correspondant à la

transformation projective tti par 1Z{iri) et celle qui correspond à la transfor
mation 7T2 par '72.(712), les transformations linéaires correspondantes de l’espace
vectoriel à deux dimensions :
X X= T2.(7ri)x, X = '72.(7T2)x ,
et l ’on voit que la loi de composition se reproduit avec les matrices '72, car avec
la multiplication matricielle ordinaire correspondant à l’application consécutive
des transformations linéaires on vérifie sans peine que
'72(712) '72(tii) = 72(ti2 oTii). (7.8)
Nous avons obtenu ici ce qu’on appelle une représentation linéaire d ’un groupe.
Il s ’avère que tous les groupes admettent l ’existence des représentations ; qui
plus est, il existe plusieurs représentations différentes, dans des espaces linéaires
de dimensions différentes (mais pas tout à fait arbitraires - cela dépend du
groupe en question !).
Pour qu’un ensemble de transformations d ’un espace quelconque forme un
groupe, il faut qu’il satisfasse trois conditions :
1) Il existe une loi de composition associative : si (f)i et ^ 2 sont des
transformations appartenant à cet ensemble, leur composition (dans n’importe
quel ordre) définit aussi une transformation du même type ; de plus, on doit
avoir
{(¡)l • (¡>2 ) ■4>3 = (f>l- (</>2 • 3)‘
Comme exemple, on peut citer les transformations linéaires d ’un espace vec
toriel : la composition de deux transformations linéaires est aussi une trans
formation linéaire.
2 ) Le groupe doit contenir un élément neutre, dit l’unité du groupe, et en

termes de transformations, la transformation identité I. Cet élément composé
avec n ’importe quel autre ne le modifie pas.
3) Pour chaque élément du groupe des transformations il existe un

élément définissant la transformation inverse : si la transformation <j>change
X en y, soit y = (f>{x), alors il existe dans le groupe la transformation (f>~^ telle
que X =
Dans les cas présentés ci-dessus on identifie facilement ces propriétés. Pour
les translations dans une dimension x -> x+a l’élément neutre est tout simple
ment la translation par 0, car æ-l-O = x, et l’élément inverse à la translation par
a est la translation par —a, car (x -fa ) — a = x - f ( o —a) = æ-|-0 = x. Ce groupe
est bien évidemment commutatif, ou abélien (en l ’honneur du mathématicien
norvégien Niels Abel).
Pour les transformations projectives de la droite réelle il faut ajouter une
condition supplémentaire importante que doivent vérifier les quatre paramètres
0 , 6 , c, d la définissant ; afin d ’assurer les propriétés du groupe, dont l ’existence
d ’une transformation inverse, il faut que le déterminant de la transformer
tion (soit le déterminant de la matrice représentant cette transformation) soit
différent de zéro, soit {ad —bc) 0. L ’élément inverse est alors obtenu comme
l’inverse de la matrice correspondante, et l’élément neutre correspond aux
valeurs des paramètres a = 1 ,6 = 0 , c = 0 , d = 1 , ce qui correspond à la mar
trice unité dans la représentation matricielle de ce groupe, appelé aussi groupe
linéaire dans deux dimensions réelles, noté GL{2, R ).
Pour conclure, énonçons encore une fois les axiomes définissant de manière
la plus abstraite la structure d ’un groupe :
1) Un groupe G est un ensemble d ’éléments muni d ’une opération de

multiplication interne,
{a, b') ^ G X G —y G i a, b Ç G, ab € G.
cette opération est associative :
0 , 6 , c € G —^ {abjc —a{bcj G G>
2) Parmi les éléments d ’un groupe il existe un élément neutre, dit aussi
l’unité,noté e, vérifiant, pour tout autre élément g € G,
e G G,g e G e g - g, ge = g.
3) Pour tout élément g du groupe G il existe un élément inverse de

noté g~^, vérifiant
g~^g = e, gg~^ = e.
On peut d ’ores et déjà préciser quelques faits importants, conséquences di
rectes de cette définition. Tout d ’abord, l’élément neutre est unique : en effet,
supposons qu’il y ait deux éléments vérifiant l’axiome 2 ) ci-dessus, notés e et
ë. Dans ce cas, on aurait immédiatement
eë = e, mais aussi eë = ë, donc ê = e.
Un raisonnement similaire conduit à la conclusion que l’élément inverse est

aussi unique, car s’il y avait deux tels éléments pour l’élement donné a, notés
respectivement a~^ et on aurait aussi : aa~^ = e = aà~^, mais en multi
pliant à gauche par o ” ^ on obtiendrait
a~^[aar^ = oô~^] —>■(a“â)a~^ = (o~ô)ô“ ^ —>• ea~^ = eâ“ ^ -¥ a~^ = â“ ^.
Une observation importante concerne l’inverse d ’un produit : on voit que
g,h E G, (gh) - 1 _ (7.9)
car en effet, grâce à l ’associativité de la multiplication dans G,
(gh){gh)~''- = {gh)(h~^g~''-) = g{hh~^)g~^ = geg~^ = gg~^ = e. (7.10)
Pour l’instant nous n ’avons pas spécifié quel type d ’ensemble représente le
groupe G. C et ensemble peut être dénombrable comme l’ensemble de tous les
nombres entiers N (qui forment d ’ailleurs un groupe avec l’addition comme loi
de composition ; l ’élément neutre est alors 0 , et l’élément inverse du nombre
k est —k). S ’il s’agit d ’un nombre fini d ’éléments, on parlera d ’un groupe fini.
Le nombre d ’éléments dans G est appelé le rang du groupe G.
Mais nous avons vu dans les quelques exemples du début qu’un groupe peut
ressembler à une droite réelle ou au plan euclidien ; dans ce cas, nous parlerons
d ’un groupe continu, et de sa dimension N, égale au nombre de paramètres
nécessaires pour définir un élément bien précis, comme un point dans un espace
R^ de dimension N. La droite réelle munie de l ’addition est un groupe
continu de dimension 1 , avec 0 pour élément neutre et —a l’élément inverse du
nombre réel a. Les réels strictement positifs forment aussi un groupe continu,
avec multiplication comme loi de composition. Dans ce cas l’élément neutre
est 1. En tant qu’ensemble, ce groupe coïncide avec la demi-droite ouverte R ^ .
Le groupe des transformations projectives de la droite est donc un groupe

continu de dimension 4 : Il coïncide avec le groupe linéaire des matrices réelles
2 x 2 avec déterminant différent de 0. Puisque dans l’espace des paramètres
réels (o, b, c, d) une condition a été imposée afin qu’ils définissent un groupe,
à savoir (ad — bc) ^ 0 , l’espace des paramètres n’est pas tout entier, mais
— [ad — 6c = 0]. Il s’agit d ’une hypersurface à trois dimensions qui di
vise l’espace R'^ en deux parties déconnectées, aux déterminants positifs et
négatifs, respectivement. On ne peut pas passer continûment de la partie de
l’espace des paramètres correspondant aux déterminants positifs à la partie
aux déterminants négatifs, car il faudrait alors traverser l’hypersurface inter
dite (exclue de l’espace des paramètres).
Finalement, les groupes de transformations dépendant des fonctions et non

pas seulement d ’un certain nombre de paramètres, comme par exemple l’en
semble de toutes les transformations entre les coordonnées locales dans l’espace
euclidien E^, ou encore l ’ensemble de toutes les transformations canoniques
dans l’espace des phases d ’un système mécanique, forment les groupes infinis.
Quelle que soit la nature d ’un groupe, tous admettent la notion d ’un sous-
groupe. Un sous-groupe H d ’un groupe G est un sous-ensemble de ses éléments,
H C G contenant forcément l’unité e E G, tel que pour deux éléments o, 6
appartenant au sous-groupe H leurs produits ab et ba appartiennent aussi au
même sous-ensemble :
a,b E i f , —^ ab G H et ba G H.
v v II va de soi que tout groupe G contient deux sous-groupes triviaux :

l’élément unité, qui peut être considéré comme groupe avec un élément, qui
est aussi son inverse, car ee = e ; et le groupe G tout entier. Cela ressemble à
une situation observée parmi les nombres entiers : tout entier a deux diviseurs
triviaux, le nombre 1 et lui-même. Les nombres premiers sont ceux qui n ’ont
pas d ’autres diviseurs.
Analysons, en guise d ’exercice, les structures des quelques premiers groupes

finis, suivant leur rang. Dans le cas des groupes finis, il faudra considérer tous
les nombres entiers. Le groupe de rang 1 ne contient qu’un seul élément, qui ne
peut être autre que l’élément neutre e. Il est son propre inverse, car e^ = ee = e.
Le groupe de rang 2 ne peut avoir qu’une seule structure, appelée Z2 . Il
ne contient que deux éléments, dont un est forcément l’élément neutre e, et
l’autre noté a. L a table de multiplication de ce groupe est simple, car nous
savons d ’après les axiomes, que eo = a et ae = a ; il ne reste que a^, qui ne
peut être autre que e, car si a -a = o, on concluerait immédiatement que a —e,
mais on sait que a jí e.
Le groupe fini suivant est de rang 3. Il contient trois éléments, e, a b. Le

produit ab ne peut être ni a, ni b, car ni a, ni b ne sont “neutres” , donc doivent
absolument faire changer un élément en le multipliant, que ce soit à gauche
ou à droite d ’ailleurs. Donc, on ne peut avoir que ab = e mais aussi ba = e. Il
reste à déterminer les carrés et b"^. Il est évident que la seule possibilité qui
nous reste est d ’admettre = b, b^ —a. Effectivement, si = b, on aura en
multipliant à droite par b l’égalité a% = 6^, mais a?b = a{ab) = ae = a, comme
on l’avait supposé. Ce groupe de rang 3 a donc une structure uniaque, appelée
Zs (groupe cyclique Z3 ). On l ’appelle “cyclique” car il peut être engendré par
un seul élément (excepté l’élement neutre e). En effet, en commençant par a
et en prenant son carré on trouve l’élément suivant, a? = b, puis on tombe sur
l ’unité du groupe, = e.
Il y a deux structures possibles pour le groupe de rang 4. L a première

n ’est autre que le groupe cyclique Z4 , obtenu de la même manière que tous
les groupes cycliques : on prend un élément et toutes ses puissances ; arrivant
à la puissance 4 on doit tomber sur l’unité du groupe (l’élément neutre). On
aura donc a, puis = b, puis = c et finalement = e. Il existe aussi une
autre structure, notée V4 , adm ettant deux sous-groupes Z2 .
Les quatre cas les plus simples de groupes finis sont représentés, par leurs
tables de multiplication, ci-dessous :
e a b c e a b c
e a b
e a a b c e a e c b
a b e
a e b c e a b c e a
b e a
C e a b c b a e
Table I : Tables de multiplication des quatre premiers groupes discrets.
On note la propriété la plus importante du tableau de multiplication d ’un

groupe : que ce soit dans une ligne ou dans une colonne, aucun élément ne
peut apparaître deux fois - c ’est la conséquence directe de l ’unicité de l’élément
inverse. D ’autre part, chaque ligne et chaque colonne contient tous les éléments
du groupe. L ’action (à gauche ou à droite) d ’un élément du groupe sur tous les
autres, y compris lui-même, produit de nouveau tous les éléments du groupe,
mais dans ordre différent. Il existe donc une relation bijective entre les éléments
du groupe fini de rang N et les permutations (toutes différentes!) entre N
objets.
Considérons l ’ensemble des N objets différents, que l’on peut distinguer

simplement par les nombres entiers 1 ,2 ,3 , Une permutation conduit à
un autre alignement de ces objets, que l’on peut représenter ainsi :
2 3 ... N\
(7.11)
(m
,p i P2 Pz ••• P n )
Bien évidemment, l ’ensemble des permutations de N objets différents contient
N\ opérations, qui forment un groupe de rang N\ ; le groupe de rang N est
donc un petit sous-groupe du groupe des permutations des N objets, appelé
groupe symétrique Sn . Ce constat - que tout groupe fini est un sous-groupe
d ’un groupe des permutations - est connu sous le nom du théorème de Cayley.
Le théorème de Lagrange montre une relation simple existant entre le rang
d ’un groupe fini et les rangs de ses sous-groupes.
Voici la preuve du théorème de Lagrange :
Soit H c G nn sous-groupe du groupe fini G. Soit n le rang de G, et m le

rang de H. Si l ’élément a appartient à H, en multipliant tous les éléments de
H par a à gauche, on reproduira le sous-groupe H dans sa totalité, puisque
H est un groupe. On peut écrire symboliquement que aH = H (on a le même
résultat en multipliant H par a à droite : Ha —H).
Prenons maintenant un élément b\ du groupe G n ’appartenant pas au sous-

groupe H. En multipliant tous les éléments de H par bi à gauche, on obtient
m éléments différents, dont aucun n’appartient au sous-groupe H, car si cela
arrivait avec un c G i f , autrement dit si bic = d G i f , on pourrait prendre
l’élément c~^ E H {H est un groupe, dont il contient forcément les inverses de
tous ses éléments!), et en multipliant à droite on aurait fabriqué 6i = dc~^.
Mais puisque d et c~^ appartenaient au sous-groupe i f , leur produit devrait y
être aussi, soit on devrait avoir b E H, ce qui est contraire à notre hypothèse
de départ selon laquelle bi n ’était pas dans i f . Notons que l’ensemble biH
contient autant d ’éléments que i f , soit m.
Si l’ensemble i f © biH n ’épuise pas la totalité des éléments du groupe

G, on peut prendre un autre élément, 62, n ’appartenant ni à i f , ni à 61 i f , et
fabriquer un nouvel ensemble de m éléments, b2 H. En procédant de la sorte, on
finira par diviser notre groupe G en une somme d ’ensembles, chacun contenant
exactement m éléments, et décomposer G comme suit :
G — if © 61 i f © b2 H © ... + bii—iH © b/(H. (7.12)
Puisque G contient n éléments, et i f et chacun des ensembles biH contiennent

m éléments, k est forcément égal à n : m. Le rang d ’un sous-groupe d ’un
groupe de rang n est un diviseur entier de n - c ’est le constat du théorème de

Lagrange sur les groupes finis.
Comme corollaire, on peut constater qu’un groupe fini dont le rang est un
nombre premier, n’a pas d ’autres sous-groupes que les sous-groupes triviaux,
son élément neutre e et le groupe tout entier.
Les groupes de permutations, ou groupes symétriques, seront notés Sn.
Ils contiennent toutes les permutations de n objets (y compris l’opération
qui consiste à tout laisser en place, soit l’opération identité, correspondant
à l’unique élément neutre). Le rang (ou tout simplement le nombre total
d ’éléments) du groupe Sn est donc égal à n\. Les permutations cycliques des
n éléments forment un sous-groupe de rang n du groupe Sn, noté Zn-
Le groupe S2 contient seulement deux éléments, l’opération “identité”
qui laisse les deux objets en place, et une permutation qui met l’objet A à
la place de l’objet B et l’objet B à la place de l’objet A, symboliquement
{AB) —> {BA). C ette permutation est cyclique, ce qui veut dire que le groupe
S2 coïncide avec son sous-groupe Z2 .
Il n’en est pas de même dans le cas du groupe Sz comprenant toutes les
permutations des trois objets. Le rang de ce groupe est 3! = 6 , et ses éléments
peuvent être représentés de manière la plus directe comme permutations des
trois lettres. A, B et C. Voici les trois permutations cycliques, qui forment le
sous-groupe Zz du groupe Sz, la première “permutation” laissant les lettres
en place correspond à l’élément neutre du groupe Sz, autrement dit, la trans
formation identité :
(A B C \ ( ABC \ (A B C
(7.13)
\A B C ) ' \BCA)' \C A B ) ■
et les trois permutations non-cycliques :
( ABC \ (A B C \ (A B C \
(7.14)
\ cba) \BAC^7 ’ l АСВГ
Le groupe symétrique Sz contenant l’ensemble des permutations des trois
éléments est un cas un peu spécial dans la série des groupes de permutations
de N éléments, Sn , car c ’est le premier parmi ces groupes qui est non-abélien
(sa table de multiplication n ’est pas symétrique par rapport à la diagonale
principale), mais c ’est aussi le dernier à adm ettre une représentation fidèle
dans le plan complexe C^.
Il contient six éléments, et peut être engendré avec seulement deux éléments,
une permutation cyclique, par exemple {ABC) {BCA), et une permutation
impaire, par exemple {ABC) -> {CBA) ; ensuite, on peut fabriquer tous les
autres éléments en prenant tous les produits et les puissances possibles de ces
deux opérations.
Le rang du groupe S3 étant égal à 6 , donc divisible par 2 et par 3, le groupe

S3 peut contenir plusieurs sous-groupes. En effet, Z3 C S3 est son sous-groupe
abélien de rang 3, aussi chacun des trois idempotents avec l’élément neutre
forme un sous-groupe Z2 .
On peut expliciter la table de multiplication de ce groupe sous forme d ’un
tableau 6 x 6 , en attribuant des symboles différents à chacune des 6 permutar
tions
(ABC\ ( AA B
BC \ , (ABC C '\
(7.15)
\ABC)~^ ' \ BB C
C AA j^^' ^ ’ \[ C
c AABB,j
Le cube de l’élément J est égal à l’unité du groupe, correspondant à la per
mutation triviale, qui laisse les objets sans changer leur ordre.
Les permutations impaires doivent être représentées par les idempotents,
c ’est-àrdire par les transformations dont le carré est l’opération identité. Nous
pouvons attribuer à ces trois idempotents les symboles suivants :
(ABC\ (ABC\ , (ABC\

(7.16)
\CBAj \B A c) [acbj
Le carré de chacun de ces éléments donne l ’unité du groupe, c ’est-àrdire la

transformation identité.
La table de multiplication du groupe S3 s’écrit alors comme suit :
1 J ß - A *
1 1 J ß - A *
J J ß 1 * — A
J2 ß 1 J A * -
— — A * 1 J ß
A A * - ß 1 J
* * — A J ß 1
Table I : La table de multiplication du groupe S3 .

Le groupe symétrique suivant, S4 , contient 24 éléments, au nombre des
permutations entre quatre objets différents. Il n’est donc pas question de re
produire ici sa table de multiplication. Son sous-groupe cyclique le plus simple
est Z4 , et peut être représenté par le nombre imaginaire pur i et ses puissances :
^2 z= —1 ¿3 _ ¿4 „
On peut former de nouveaux groupes à partir des deux groupes finis
donnés, en formant leur produit cartésien.
7.2. SYMETRŒSS DISCRETES, GROUPES CRISTALLINS 265
7.2 Symétriess discrètes, groupes cristallins

Les réalisations les plus simples du groupe Z2 s’obtiennent par actions sur
le plan complexe C^. Nous pouvons notamment introduire trois inversions,
donnant chacune une représentation différente de la permutation non-triviale
de deux éléments. Voici donc ces inversions dans le plan complexe :
i) changement de signe, z —z\
a) conjugaison complexe, z z;
iii) la combinaison des deux, z —> —z.
On ne doit pas oublier la quatrième possibilité, à savoir la représentation
qui attribue la transformation identité aux deux éléments du groupe, y compris
la permutation non-triviale :
iv) la transformation identité, z -¥ z.
L ’action du groupe Z2 peut être réalisée de plusieurs façons sur le plan
euclidien, par exemple :
F i g u r e 7 .1 - In v ersio n R o ta tio n d e 1 8 0 °
Z2 , et la seconde Z^-
Nous pourrons noter la première réalisation
Représentations de S3 comme transformations du plan complexe.
Le groupe symétrique Sz contenant toutes les permutations des trois éléments
présente un intérêt particulier parmi les groupes Sn - H est exceptionnel à deux
titres : c ’est le premier du lot qui n ’est pas abélien (commutatif) ; mais c ’est
aussi le dernier qui admet une représentation fidèle en termes de transforma
tions du plan complexe C^.
Il contient six éléments et peut être engendré avec deux éléments seule
ment, correspondant à une permutation cyclique et une permutation impaire
(non-cyclique), par exemple (abc) (bca) et (06 c) -4 (cba). Tous les autres
éléments peuvent alors être obtenus en prenant les produits et les puissances
de ces deux-là. Les permutations des trois objets peuvent être représentées par
les opérations appropriées sur les nombres complexes, en fournissant ce qu’on
appelle une représentation complexe du groupe S3 . Considérons tout d ’abord
le sous-groupe cyclique Z 3 . Notons la racine cubique non-triviale de l’unité par
j = Le sous-groupe cyclique Zz contient trois éléments correspondant
aux trois permutations cycliques, qui peuvent être représentés par la multipli
cation dans le plan complexe par les nombres j , et —1 (l’identité).
. i ABC\ .2
(7 .1 7 )
[ bcaJ [CABJ^^'
Rappelons encore une fois que les permutations impaires doivent être représen
tées par les idempotents, c’est-à-dire par les opérations dont le carré est égal
à la transformation identité, correspondant dans le groupe à l’élément unité.
Nous pouvons faire le choix que voici :
f ABC\ , f ABC\ , ('ABC\ . ,,

(cfîylj [ a Cb )
Ici le symbole ( z - 4 z ) signifie la conjugaison complexe, c’est-à-dire la réflexion
par rapport à la droite réelle, le chapeau z - > z signifie la réflexion par rapport
à la direction j^, et l’étoile z ^ z* la réflexion par rapport à la droite j. Les
six opérations forment un groupe non-abélien, dont la table de multiplication
coïncide avec le tableau symbolique ci-dessous :
A
A
A
A
A A
Table I : La table de multiplication du groupe symétrique S3
Les six éléments de S3 sont représentés par les opérations de symétrie dans
le plan complexe : la transformation identité et les deux rotations, l’une par
120'’ , l’autre par 240® formant ensemble la représentation du sous-groupe Z3 ,
et les trois réflexions, dans l ’axe Ox, dans l’axe j et dans l ’axe représentant
les trois permutations impaires.
7.3. SYMETRIES CRISTALLINES 267
7.3 Symétries cristallines

Une des propriétés les plus importantes d ’un réseau cristallin en 2 ou en 3
dimensions vient du fait que la condition de périodicité impose des contraintes
très strictes sur les angles que font entre elles les directions caractéristiques le
long desquelles on peut déplacer les cellules élémentaires, pour pouvoir cou
vrir l’espace entier par le réseau périodique en reproduisant le même dessin à
l’infini.
Les angles permis par la condition de périodicité sont : 60°, 90°, et 120°.
Tous les cristaux connus contiennent les plans et les droites dont l’intersection
se fait uniquement sous ces angles-là.
Dans un réseau cristallin on peut toujours définir une cellule élémentaire,
qui est un segment, un polygone ou un polyèdre, suivant la dimension du réseau
considéré ; ce polygone (polyèdre) peut alors être translaté parallèlement, d ’une
distance appropriée, en créant ainsi une cellule voisine qui touche la précédente
par sa face, ne laissant aucun espace vide entre elles. En reproduisant quelques
opérations de ce type, selon les directions dictées par la symétrie de la cellule
élémentaire, on finit par couvrir le plan ou l’espace entièrement, produisant
ainsi un réseau cristallin parfait.
L a restriction concernant les angles pouvant être trouvés dans les réseaux
cristallins vient de l’application simultanée des translations et des rotations,
car on suppose que tout réseau cristallin peut être obtenu par l’application
consécutive de quelques translations et rotations discrètes. Voici la déduction
simple et élégante des valeurs d ’angles admissibles dans les réseaux cristallins :
Considérons deux atomes, A et B, faisant partie du réseau cristallin, en
supposant qu’il s ’agisse de deux voisins immédiats ; on notera d la distance
les séparant. Suite à la symétrie de translation, on doit trouver des atomes
identiques à gauche et à droite, sur la même droite sur laquelle se trouvent les
atomes A et B, placés à distance d les uns des autres. On peut dire que l’on
obtient ainsi le plus simple cristal uni-dimensionnel.
Mais si le cristal a plus d ’une dimension, d ’autres directions doivent exister
le long desquelles on observe la périodicité de la structure, avec une symétrie de
translation. Supposons maintenant que les rotations discrètes font aussi partie
des symétries du cristal. Cela veut dire que, si on tournait le segment AB
autour du point A par certain angle la position nouvelle de son extrém ité
devrait coincider avec un autre atome du réseau, noté B'.
L a même chose doit arriver si l’on tourne le segment AB par l’angle ou
— autour du point B, car les deux extrém ités doivent être équivalentes ; on
doit alors tomber sur un autre atome du réseau, noté A', comme sur le dessin
7.2 ci-dessous.
Les atomes A! et B' se trouvent sur une droite parallèle au segment AB,
ils doivent donc appartenir à l’image de la même droite sur laquelle se trouvait
AB, obtenue par une symétrie de translation discrète.
F i g u r e 7 .2 - L es v o isin s le s p lu s p ro ch es d a n s u n résea u a v ec sy m é tr ie d e r o ta tio n

d ’a n g le $ . O n a rep résen té se u le m e n t le ca s d e l ’a n g le — le c a s $ a u to u r d u p o in t
B e s t a u ssi a d m issib le
Si tel est le cas, la distance entre les atomes A' et B' doit être un multiple
entier de la distance d, ce qui conduit à une relation simple :
I A 'B ' 1= d (l — 2 cos</?) = nd (7.19)
qui admet comme solution pour cos ¡p :
COS(p = - ( 1 — n). (7.20)

Zi
Les seules valeurs possibles de n compatibles avec la condition évidente
I cos^ |< 1 étant
n = 0 , 1 , 2, 3 ,
nous sommes amenés à conclure que les seules valeurs d ’angle p entre les deux
translations discrètes indépendantes sont données par
27T 1 r. o ^
V? = — , m = l , 2 , 3,4 ou 6. (7.21)
m
autrement dit, 120", 90", et 60" (les solutions m = 1 et m = 2 de l’équation
7.21 sont triviales, puisqu’elles coïncident avec l’axe initial sur lequel se trou
vaient les atomes A et B ). On peut refaire la même construction en partant
de la figure planaire obtenue ci-dessus, et en la tournant autour de ses bords
d ’un angle tp, ce qui produirait une structure à trois dimensions. Le résultat
sera identique, conduisant aux mêmes valeurs de l’angle de rotation discrète
P admissible. En conclusion, tout réseau cristallin combinant une symétrie de
translation et une de rotation doit se faire uniquement avec les angles 60", 90",
et 120 ".
7.3. SYMETRIES CRISTALLINES 269
Tout autre angle de rotation combiné avec des translations discrètes condui
rait à un remplissage de l’espace de plus en plus dense et chaotique, tant sur
un plan que daлs l’espace.
Néanmoins, cela n ’exclut pas la possibilité de voir d ’autres angles ap

paraître sans que le réseau soit vraiment désordonné si l’on n ’insiste pas sur
la symétrie de translation. De telles structures, connues sous le nom de quasi-
cristaux, ont été trouvées initialement comme une construction mathématique
par le mathématicien anglais Roger Penrose dans les années 1979. Les angles
caractéristiques rencontrés dans ces pavages sont des multiples de 2 тг/10 , soit
36°, 72° et 108°, l’angle d ’un pentagone parfait. Des quasicristaux réels ont été
produits en 1984 avec des alliages d ’aluminium et manganèse par le chercheur
israélien Dan Shechtman, prix Nobel de chimie en 2011 pour ces travaux.
Un réseau tri-dimensionnel adm ettant une symétrie de translation la plus

générale est engendré par trois translations discrètes le long de trois vecteurs
indépendants a i, аг et аз, de sorte à ce que tous les points occupés par les
atomes puissent être obtenus avec trois nombres entiers relatifs, n i, П2 et П3
selon la formule
R = n ia i -h П2а2 H- пзаз.
Les angles entre les trois vecteurs a», i = 1 , 2 , 3 , ne peuvent prendre que
les valeurs préconisées par la formule (7 .2 1 ).
Voici quelques exemples de pavages du plan avec les polygones réguliers.

On y voit clairement les angles caractéristiques des réseaux cristallins.
F i g u r e 7.3 - Deux pavages réguliers, à symétrie cubique ou hexagonale, suivis

de quatre autres pavages réguliers, moins connus.
E t voici quelques exemples de réseaux cristallins, représentés par ces mailles

élémentaires.
F i g u r e 7.4 - Structure cristalline du diamant et de la wurtzite {SiO^)-
En combinant les rotations discrètes autour des axes indépendants avec

les inversions par rapport aux plans, on peut obtenir les groupes de symétries
cristallines dont le nombre total est 219, et même 230 si l ’on compte séparément
les systèmes qui sont identiques mais de chiralité (orientation) opposée. L a
classification de ces symétries et des groupes finis correspondants a joué un
rôle important en cristallographie moderne, en facilitant la compréhension et
l’analyse des propriétés physiques des cristaux.
7.4 Groupes de Lie

Dans le chapitre consacré à la géométrie différentielle nous avons prouvé
que les isométries du plan euclidien paramétré par les coordonnées (x,?/),
sont engendrées par trois champs vectoriels correspondant aux deux transla
tions infinitésimales et à une rotation rigide autour du centre (0,0). En tant
qu’opérateurs de dérivation, c ’étaient les dérivées de Lie le long des vecteurs
vl ^ v2 ^ v3 ^ 5
Chacun de ces trois champs peut être créé dans le plan euclidien par l’action
d ’un sous-groupe à un paramètre du groupe des isométries ; on peut appeler ce
paramètre i, et le choisir de telle sorte que t = 0 coïncide avec l’élément neutre
(transformation identité) du groupe. Considérons une fonction différentiable
définie sur le plan euclidien, / = f{x,y). Il est clair que les deux translations
infinitésimales se répercutent sur / de la manière suivante :
{rlf){x,y) = f{x + t,y), {Ttf){x,y) = f{x,y + t). (7.22)
En fait, nous avons fabriqué les opérateurs r/ et rf agissant sur les fonctions
de deux variables réelles à partir des opérateurs de translation agissant sur
7.4. GROUPES DE LIE 271
les coordonnées cartésiennes du plan euclidien. A u x transformations du plan

correspondent les transformations des fonctions. Puisque ce sont les transfor
mations infinitésimales qui nous intéressent, on supposera que t est très proche
de 0 ; nos transformations seront donc très proches de la transformation iden
tité, l’élément neutre du groupe. L ’opérateur infinitésimal de rotation rigide
s ’obtient à partir d ’une rotation arbitraire, mais avec un très petit angle, que
l’on peut nommer t aussi. On aura alors
æ' = æ co si H-j/sini, y ' = —x s i n t + yco st,
et nous pourrons décrire l’action induite de cette transformation sur les fonc
tions comme
i'i'tf) = /(® cos Í -f- y sin t, —Xsin Í -I- y cos t). (7.23)
Pour obtenir les champs vectoriels correspondants, il faut comparer les résultats
de chaque transformation avec la fonction d ’origine, point par point, et passer
à la limite en gardant uniquement les expressions qui restent quand t 0,
autrement dit dériver les fonctions r / / , Tff et r«/ par rapport à i au voisinage
de i = 0. Il vient alors facilement que
{ r t f ) { x, y) - f i x , y) ' f { x + t, y ) - f i x , y)'
= lim
-d T t!—
'«
^0 t t—^0 t dx'
ÍTtf)ix,y)-f{x,y) 'fix,y + t ) - f i x , y ) ' df

= lim
t—^0 t t—>^0 t
djnf) {rt f ){x, y) - f { x , y )

lo= lirn
dt i ->0
f { x cos Í + y sin t, —X sin Í + y cos t) — f { x, y)
lim
t —^0
f j x + ty, - t x -f- y) - / (x , y) df df
~ lim
t —^’O t
et nous avons retrouvé les trois champs de vecteurs engendrant les isométries
du plan euclidien. Notons que, dans le dernier passage, nous avons fait une
approximation linéaire sous le signe de la limite, ce qui ne change rien quand
t -> 0 : au voisinage de i = 0 on peut, comme d ’habitude, remplacer c o sí par
1 et s in i par t. L a matrice de transformation infinitésimale agissant sur un
vecteur quelconque peut alors s’écrire comme suit :
ce qui peut être écrit encore plus clairement comme la somme de la matrice
identité et d ’une petite (car t est supposé infinitésimal) déformation propor
tionnelle à une matrice anti-symétrique :
C)-k; :)••(•. ;) C)' 1

(7.25)
En définissant l’exponentielle d’une matrice M comme
exp(M) = 1 + M + + ¿ m 3 + ¿ M ^ -h .... (7.26)

3!' 4!‘
et compte tenu du fait que
2
/ 0 IV /1 0^ i 0 ly i 0 1 \
i -1 o) Vo i j ’ V-1 0/ v-1 o j’
on trouve que
/0 1\ cost sini\
exp
. V-i 0/ J ~ V - i + ë - - i - S + S - / ~ co s*/
Dans le cas le plus général un groupe continu n’est pas nécessairement

identifiable à l’ensemble des transformations d ’un quelconque espace linéaire ;
il peut s ’agir de transformations d ’une sphère, d ’un ellipsoide, d ’un tore, ou en
core d ’espaces complexes de dimension arbitraire, espaces projectifs, etc. Dans
de tels cas il serait plus difficile de trouver les champs vectoriels représentant
les opérations infinitésimales du groupe. Mais quel que soit le groupe continu
choisi, s ’il admet la paramétrisation différentiable par n paramètres réels (on
appelle un tel groupe groupe de Lie), on peut toujours considérer l ’action du
groupe sur lui-même. Or, nous pouvons définir plusieurs actions du groupe sur
lui-même, produisant les actions induites sur les fonctions réelles définies sur
le groupe.
Voici les deux représentations du groupe, obtenues par la multiplication
à gauche ou à droite par un élément choisi. Soit h € G l’élément que nous
voulons représenter ; définissons son action à gauche :
g Ç.G, h —^ Lh{g) (7.27)
On remarque que cet action à gauche est effectivement une représentation du

groupe, puisque pour deux éléments arbitraires, h\ et ha, on aura
Lhi (Lhiig)) = Lhi(h2g) = hi{h2g) = {hih2)g = L /nhaÎP)-

7.4. GROUPES DE LIE 273
On peut définir une autre représentation, notée Rh, agissant par la multiplica
tion à droite, mais dans ce cas, afin de garder la propriété de représentation,
il faudra multiplier à droite par l’inverse de l’élément h :
-1 (7.28)
g E G, h Rhid) •—9^
et l’on vérifie que
Rh, { R h M ) = Rh,{gh2^) = = д{Щ^К^) = 9{hih2)-^ = R h ,h M -
Les deux réalisations de l’action du groupe sur lui-même commutent entre

elles, car quels que soient les deux éléments h\ et h2 , on a, pour tout g E G,
LhiiRhiig)) = Lhiigh2 =
.-U^
hi{gh2 = hgh^ ",
mais aussi
Rh^{Lh,{g)) = Rhiihig) = (/115)^2 ^ ^
d ’où Lh,{Rh2 {g)) = Rh2 {Rhi{g)), soit, g étant arbitraire, Lh^ôRh^ = Rh^^Lh,.
Les deux actions définies par les formules (7.27) et (7.28) ne conservent pas la
structure la plus importante du groupe : sa table de multiplication. Certes, elles
transforment le groupe en lui-même de manière bijective, mais les produits ne
se transforment pas en produits des éléments transformés. En effet,
Lhigm) = h{gxg2 ) = hgig2 ,

mais
{ R h i9 i) ) { L h { 9 2 ) ) = ( h g i ) { h g 2 ) = h g ih g 2 ^ h g m ,
donc
{Lh{9i)){Lh{92)) 7^ Lh{gig2 )-
C ela suggère une nouvelle action du groupe sur lui-même, dite action adjointe :
pour tout g E G, on définit
«4 (5 ) := LhRhig) = RhLh{g) = hgh~^. (7.29)
C ette fois, on a bien la conservation de tous les produits dans G:

o.dh{gi)adh{g2) = {hg\h~^){hg2h~^) = h{gih~^hg2)h~^ = h{gig2)h~^ = adh{gig2)
On peut dire que ad est une transformation de similitude du groupe G , comme

c ’était le cas pour les matrices.
Il est alors intéressant de voir de plus près ce qui se passe au voisinage
immédiat de l’élément neutre e E G. L ’idée de Sophus Lie, mathématicien
norvégien (1842-1899), créateur de la théorie des groupes continus portant
son nom, consistait exactement en cela : puisque tout élément du groupe peut
être déplacé avec son voisinage par l’action adjointe d ’un élément choisi, on
peut analyser toutes les relations importantes au voisinage de l ’élément neutre.
Nous n ’allons pas démontrer ici les théorèmes de Lie les plus importants,
mais nous satisfaire d ’une version simplifiée, basée sur le fait que tous les
groupes de Lie (groupes continus paramétrés par un nombre fini de coor
données locales) admettent une représentation matricielle. Un cas type se
présentait avec le groupe des transformations projectives de la droite réelle
(7.5) : on avait constaté qu’il coïncidait avec le groupe des matrices 2 x 2 non
singulières, noté (t L(2, R ).
Considérons donc tout élément du groupe comme une matrice le représentant,
avec la multiplication matricielle rempla;çant la composition d ’éléments du
groupe, la matrice inverse correspondant à l’élément inverse, et la matrice unité
représentant l’élément neutre. On peut toujours choisir la paramétrisation d ’un
groupe de Lie de façon à ce que l’élément neutre corresponde aux valeurs des
paramètres (0,0, ...0). Dans ce cas, un élément proche de l’unité du groupe
aura pour coordonnées un ensemble de nombres infinitésimaux {ei,e 2 ,
où n est la dimension du groupe étudié.
En tant que matrice, cet élément aura la forme générale l-f-SjA*, la matrice
unité plus n matrices rendues infinitésimales par le fait que les Si le sont. Voici
un exemple illustratif : les matrices de rotation en trois dimensions pouvaient
être paramétrées par trois angles indépendants, correspondant aux rotations
autour de chanun des trois axes cartésiens de l’espace euclidien E^ (7.40). A u
voisinage de la matrice unité (transformation identité) on aura, en linéarisant
selon la règle bien connue pour les très petites valeurs de a, coscc 1 , s in a cü
1 0 0 \ /1 0 0\ /0 0 0'
0 cos a sino:J~j0 1 oJ-|-a:|o 0 1
,0 — sino! cos a / \0 0 1 / \ 0 —1 0 /
Considérons à présent un cas générique, noté 1 +sA. Une question intéressante
peut alors se poser : à quoi ressemble l’action adjointe du groupe sur lui-même
définie plus haut (7.29) si l’on restreint aux éléments très proches de l’élément
neutre ? L a réponse est facile à obtenir en remplaçant dans la formule
g hgh~^
l’élément g par la matrice 1 + eM et l’élément h par la matrice 1 -t- iA , où t est
aussi un paramètre infinitésimal, mais indépendant de e. Dans l’approximation
linéaire, la matrice inverse correspondant hh~^ peut être remplacée par 1 —tA.
L ’expression approchée de l’action adjointe de h appliquée à l’élément g sera
donc
(1 -I- tA){l + eB){l - t A ) c ^ l + et{AB - BA) -h (7.30)

7.5. CHAMPS INVARIANTS, L ’ALGÈBRE DE LIE 275
En dérivant cette expression par rapport à i on trouve le œmmutateur des

matrices A et B :
[A, B] = A B - B A = -[B , A]. (7.31)
On dit que les matrices que l’on ajoute à la matrice unité pour former les
éléments infiniment proches forment l’algèbre de Lie du groupe G. Le com
mutateur des matrices définit la multiplication dans cette algèbre. Ce produit
antisymétrique vérifie aussi l’identité de Jacobi :
[^, [B, C]] -h [B, [C, >1]] + [C, [^, B]] = 0. (7.32)
ce qui peut être vérifié par un simple calcul. La dimension de l’algèbre de Lie
d ’un groupe de Lie est égale à la dimension du groupe. L’exemple du groupe
des rotations et des matrices engendrant les rotations infinitésimales en fournit
un bon exemple (la dimension en question étant égale à trois).
Tout groupe de Lie n ’est pas forcément un groupe des matrices, mais
il peut toujours être représenté par un ensemble des matrices bien adapté,
comme on avait pu constater sur l’exemple des transformation projectives de
la droite réelle, pouvant être représenté par les matrices 2 x 2 non-singulières.
Ce constat est aussi valable pour les algèbres de Lie qui admettent toujours
une représentation matricielle.
7.5 Champs invariants, l’algèbre de Lie

Les transformations infinitésimales peuvent être étendues sur le groupe
tout entier, et non seulement au voisinage de l’élément neutre. On peut ap
pliquer dans un groupe de Lie toute la panoplie de la géométrie différentielle
présentée dans le chapitre précédent. Notamment, on peut introduire les fonc
tions différentiables sur le groupe et les champs vectoriels agissant comme
dérivations de ces fonctions. Afin de mieux comprendre les relations entre
divers notions et mécanismes, nous allons illustrer chaque définition par un
exemple concret. Pour ce faire, par souci de simplicité, il faut choisir un groupe
de Lie de dimension assez petite. Prenons donc le sous-groupe des matrices
triangulaires du groupe GL(2,R ), pouvant être représenté par les matrices
2 x 2 , noté ici par TL{2, R) :
g ( a \ a W ) ^ ( “g “s ) -
La multiplication matricielle conduit à une matrice du même genre, avec un

0 en-dessous de la diagonale. Pour assurer l’existence d ’une matrice inverse, il
faut imposer la condition

7^ 0, ^ 0.
Donc, de l’espace R^ auquel appartenaient a priori les trois paramètres réels
0 ^, 0 ^
et il faut enlever deux plans définis par = 0 et a® = 0. L’espace
des paramètres restant n ’est pas simplement connexe : la composante connexe
de l’unité définie par les valeurs (o^,a^,a^) = (1, 0, 1) est le quart de l’espace
R^ correspondant aux valeurs strictement positives de et a^. Cette com
posante connexe est aussi un sous-groupe de TL{2, R) contenant les matrices
triangulaires au déterminant strictement positif.
La loi de composition provient de la multiplication matricielle :
fa} a} \ (b^ \ a^b'^ + a?b^\
U aV V0 b y ~ \ 0 a3&3 )
L’élément inverse est défini comme d ’habitude.
( “o‘ T )
Il est important de souligner que les matrices fournissent une notation com
mode, mais un groupe de Lie de dimension n peut être défini uniquement par
une loi de composition impliquant n paramètres réels ; la seule chose qui im
porte est ce que cette loi soit différentiable et qu’elle satisfasse aux axiomes
de groupe. Dans le cas considéré ici, il suffit de définir la loi de composition
des trois paramètres de manière directe comme suit : si les “coordonnées” de
l’élément g sont et celles de l’élément h sont {h}, h“^, h^), on déclare
que les paramètres correspondant au produit gh sont donnés par la formule
symbolique
et ceux de l’élement inverse g~^ de g sont donnés symboliquement par
et l’iément neutre est donné par e -> (1,0,1). Sous cette forme abstraite
il est aussi évident que les paramètres g^ et g^ ne peuvent pas prendre la
valeur 0. Nous pouvons introduire les fonctions réelles sur le groupe, les bases
des champs vectoriels définies en tout point par les dérivations partielles dk,
les bases duales des 1-formes da*, etc., en traitant les paramètres a* comme
coordonnées locales.
Néanmoins, pour des raisons de commodité, nous continuerons à nous ser
vir de la notation matricielle.
7.5. CHAMPS INVARIANTS, L ’ALGÈBRE DE LIE 277
Définissons le sous-groupe à un paramètre comme une courbe dans l’espace

du groupe donnée par g(t) = {g^{t),g‘^{t),g^{t)), vérifiant les postulats du
groupe :
9{h)g{t2) = 9{ti + h), 9~^{t) = 9{-t) e = fl'(O).
Bien évidemment, cette courbe doit passer par e, l’élément neutre du groupe,
sinon il ne serait pas possible de parler d ’un groupe ; en outre, un sous-groupe
à un paramètre est toujours abélien (commutatif).
On peut introduire le vecteur tangent à cette courbe comme la dérivation
des fonctions définies sur l’espace du groupe. Si f{g) est une fonction sur le
groupe, elle devient fonction du seul paramètre t si on la restreint à la courbe
g{t). Ensuite, on peut dériver par rapport à t, définissant ainsi un vecteur le
long de la courbe g{t) selon la formule
= (!<(*))■
Au voisinage de l’élément neutre on peut introduire n sous-groupes à un
paramètre, au nombre des coordonnées indépendantes. Dans le cas choisi ici
nous avons trois paramètres seulement, et les trois sous-groupes à un paramètre
sont représentés naturellement par les matrices comme suit :
(1) /l-hi ON (2) /1 n (3) /1 ON
Ces trois sous-groupes engendrent trois vecteurs tangents définis au point e,

l’unité du groupe, qui agissent sur les fonctions selon la formule :
(k)
dfi^Pt) df
( X « /)(e ) = dt = E aoj^) dt
¿=1 .
J t=o
OU n ou s avon s p o se
(fc)
'^t = (o(fe)(i)-a(fc)(i).«(fc)(i))-
Nous avons donc trois vecteurs naturels au point e du groupe, agissant sur les
fonctions comme suit :
№ /) (e)= da^
df
№ / ) (e) =
df
da^
{Xzf){e) =
df
da^
(7.34)
Jusqu’ici, rien de nouveau - ce sont les vecteurs tangents en un point donné de

l’espace, le long des lignes des coordonnées passant par ce point, tout comme
cela avait lieu dans le ceis des coordonnées curvilignes. Mais la structure du
groupe permet de créer les champs vectoriels couvrant le groupe tout entier.
Une telle chose est possible grâce à la structure du groupe, autrement dit la
possibilité de composer les éléments pour en fabriquer d ’autres. En particulier,
le sous-groupe à un paramètre tpt peut agir à droite sur tous les éléments du
groupe :
R<pt(9) = m ^
créant ainsi une congruence de courbes, l’ensemble des courbes distinctes pas
sant par tous les points-éléments du groupe.
Prenons donc un point générique, un élément g quelconque, et multiplions
cet élément à droite par ce qui donnera, dans notre exemple avec trois
sous-groupes à un paramètre indépendants, les trois congruences suivantes :
(1) /p i 'W l-i ON /(l-i)pi g^\

V \ 0 ij V 0 pV »
^ fg ^ g ^ ] f^ -^)-fg^ ~^g^+ g^]

g ^J ( 0 l J - [ 0 p3 j ’
^^(-0 (,0 p v U 1-tJ [o ( I - î)pV -

Nous avons maintenant trois familles de courbes paramétrées par i, dont trois
passent par le point choisi g quand i = 0 ; on pourrait dire que p est devenu
l’image de l’unité du groupe. (Une remarque importante : on ne doit pas
prolonger ces courbes trop loin, car il y a des valeurs de t pour lesquelles
le déterminant de (pt risque de s’annuler. Mais nous nous contentons d ’un
mouvement infinitésimal imposé au groupe, car cela suffit pour engendrer les
vecteurs en tout point du groupe).
Une fonction /(p ) définie sur le groupe devient fonction de t si l’on substitue
les paramètres obtenus par l’action à droite de ipt. On peut donc dériver cette
fonction par rapport à i et évaluer le résultat au point t = 0, définissant aussi
les vecteurs en tout point p du groupe :
( x ^ f) b) = (7.35)
dt Jt=o
En utilisant la dérivation composée, cela donne trois dérivations indépendantes,
que voici :
{X if){g) = - g ^ ^ , (X2/)(p ) = - p ^ ^ , (X 3/)(p) = - p 2 ^ - p 3 ^ .
Les champs vectoriels ainsi obtenus s’appellent champs invariants à gauche.

Ils forment une algèbre de Lie du groupe de Lie donné, de la même dimension
7.5. CHAMPS INVARIANTS, L ’ALGEBRE DE LIE 279
que le groupe de Lie lui-même. Leurs crochets de Lie s’expriment comme leur
combinaisons linéaires. Dans notre exemple, on peut vérifier aisément que :
[X l,X 2 ] = - X 2 , [ X 2, X 3] = -X 2 , [X 3, X i ] = 0. (7.36)
On peut représenter ces trois commutateurs à l’aide des constantes de struc

ture :
[Xi,Xj] = C^jXk.
L’identité de Jacobi vérifiée par trois champs vectoriels arbitraires s’applique
ici également :
[Xi, [X,-, Xfc]] + [X,-, [Xk, Xi]] + [Xk, [Xi, X,]] = 0,
et impose une identité semblable aux constantes de structure, ce qui peut être
déduit en substituant les expressions pour les commutateurs :
/^ m I /^ l /nrm I /OfZ / n f ? n __n
Dans notre exemple les constantes de structure sont comme suit :
Ci 2 = ~C'|i = —1, C23 = —C^2 ~ ~ 1) les autres Cjk = 0.
En introduisant les matrices de manière à ce que le premier

indice bas (entre parenthèses) soit compris comme le numéro de la matrice,
les deux indices restants étant les indices matriciels usuels, on peut réécrire la
relation de Jacobi comme une relation entre matrices :
^(i)m^{j)k ~ ^{z)m^{j)k - îj
autrement dit, symboliquement [C^{^C(j)[ =

Nous avons donc obtenu une représentation matricielle de l’algèbre de
Lie par des matrices de la même dimension que l’algèbre elle-même. Cette
représentation s’appelle représentation adjointe.
Dans l’exemple proposé plus haut, les 3 matrices 3 x 3 obtenues à partir
des constantes de structure sont comme suit :
'0 0 0' '0 0 0 '0 0 0'
C (i) = I 0 -1 0 C(2) = I 1 0 -1 C(3) = I 0 1 0

.0 0 0. .0 0 0 .0 0 0,
et vérifient bien les relations de commutation de l’algèbre de Lie du groupe

TL (2,R ).
7.6 Groupes de rotations en 2 et 3 dimensions

Parmi les exemples cités dans l’introduction il y avait déjà quelques groupes
continus : les translations d’une droite réelle (un groupe à 1 paramètre réel),
les transformations projectives de la droite réelle (groupe à 4 paramètres réels,
identique au groupe des transformations linéaires d’un plan réel (x,y).
Les isométries du plan euclidien (æ, y) sont engendrées par trois transfor
mations élémentaires : deux translations le long des axes Ox et Oy, et une
rotation rigide autour du centre O par un angle (p
(x.y) ~^{x + a,y), (x,y) (x,y + b), (x,y) (æcos(/j-|-2/sin^, —xsini^ + j/cosy’-
(7.37)
Les translations forment un sous-groupe de ce groupe d’isométries, dont

l’élément neutre est, bien évidemment, la transformation identité (x,y)
(æ, y). Le sous-groupe des translations est commutatif (abélien), car (æ + a)-|-
6 = (x -f- à) + U. Le sous-groupe des rotations est aussi commutatif, puisque
deux rotations consécutives par les angles (pi et (p2 sont équivalentes à la
rotation d’angle ps = y>i + = P2 + Cette propriété se reflète dans les
formules trigonométriques bien connues, qui peuvent être représentées sous
forme de multiplication matricielle. En effet, une rotation finie donnée par
les formules (7.37) est une transformation linéaire, on peut donc utiliser la
notation vectorielle, en identifiant le point (x, y) avec le vecteur-colonne ; dans
ce cas, la rotation d’angle p donne :
( x ' \ _ i cos y? sin ^ \ / X \

(7.38)
\ y ' ) ~ V-siny> cosp) \ y )
L’application consécutive de deux rotations quelconques, par les angles

Pi et p 2 respectivement, conduit à l’effet identique à la rotation par l’angle
Pz = Pi + P2,
/ cos Pi sin p \ \ ( cos P 2 sin P 2 \

\ — sin Pi COS Pi ) \ — sin P2 COS P2 )
_ i COS Pl co s P 2 — sin Pi sin P2 COS p i Sin P2 + sin p i COS P2 \

\ — sin Pl co s P 2 — COS Pl sin P 2 ~ sin p i Sin p 2 + COS p i COS p2 )
= fcos (^3 sinps\

V - S i n <^3 c o s p s j ^ ’
où p% = p i - V p 2 t conséquence des formules trigonométriques bien connues :
c o s a c o s ^ — sinasin^d = cos(a -t- 0), coso-sin^S -f- sinacos;0 = sin(o: + 0).

7.6. GROUPES DE ROTATIONS EN 2 ET 3 DIMENSIONS 281
Le groupe des isométries du plan n’est pas commutatif, bien que les deux sous-
groupes le formant le soient. Mais les translations ne commutent pas avec les
rotations, ce qui est facile à vérifier :
{x + a) cos (p + y sintp {x cos -f y sin -Ho.
Les isométries de l’espace euclidien de dimension trois sont faciles à construire

à partir des isométries d ’un plan euclidien. L’espace euclidien de dimension 3,
paramétré par ses coordonnées cartésiennes {x, y, z), contient trois axes Ox, Oy
et Oz le long desquels on peut eflféctuer trois translations indépendantes, et
aussi trois plans indépendants dans lesquels on peut effectuer les rotations
rigides. L’ensemble de ces actions forme un groupe à six paramètres, qui est
le groupe des isométries de l’espace E^.
La représentation la plus simple qui vient à l’esprit consiste en l’utilisation
de la même notation matricielle, avec les opérateurs de rotation agissant sur
un vecteur-colonne. Les trois rotations indépendantes s’eflEectueront alors au
tour des trois axes, Ox, Oy et Oz. En désignant les trois angles de rotation
indépendants par a, /3 et 7 , nous pouvons former les matrices de rotation
autour des axes Ox, Oy et Oz respectivement, selon le même schéma que dans
le cas du plan (xOy), correspondant dans la nouvelle situation à une rotar
tion autour de l’axe Oz. En gardant la même orientation pour les deux plans
supplémentaires, c’est à dire, (yOz) et {zOx), les trois rotations indépendantes
s’écriront maintenant comme suit :
/1 0 0
y' == 0 cos a sin a
z' Vo —sin a cos a
autour de l’axe Ox,
/ cos S 0 —sinjS
y' = 0 1 0
z '/ Vsin^d 0 COSyd
autour de l’axe Oy,
/ COS7 sin7 0
y' = I — sin7 cos 7 0 (7.40)
z 'J V 0 0 1
rotation par l’angle 7 autour de l’axe Oz.
Le groupe des isométries de l’espace euclidien E^ est engendré par six trans
formations élémentaires : les trois translations le long des axes Ox, Oy et Oz,
et les trois rotations autour de ces axes. On constate facilement que les trans
lations forment un sous-groupe abélien (commutatif), tandis que les rotations
forment un sous-groupe non-abélien, car les trois matrices définies ci-dessus

(7.40) ne commutent pas entre elles. Cela peut se voir dès que l’on regarde la
forme des matrices correspondant aux transformations infinitésimales : comme
dans le cas d’une seule rotation en deux dimensions, ces matrices auront la
forme Mi = 1 + e.Ri, i = 1,2,3, e étant un angle infinitésimal de rotation.
Les matrices Ri, dites générateurs des rotations correspondantes, s’obtiennent
à partir des matrices de rotation finies en assimilant cose à 1, et sine à e, et
en prenant la dérivée par rapport à e. Nous avons alors
Ri = R2 = Â3 = (7.41)
Les trois matrices Ri ne commutent pas entre elles ; en formant les commuta
teurs RiRj —RjRi on trouve leurs relations de commutation :
— R2R1 = R3, R 2R '3 ~ R 3 R 2 — H i, R3R1 — R1R3 = i?2) (7.42)
qui sont, en quelque sorte, la “carte de visite” du groupe des rotations ri
gides en trois dimensions, noté 0(3) (appelé aussi groupe orthogonal en trois
dimensions).
En choisissant trois angles infinitésimaux ¿ a i, ¿«2 et ¿0:3, et en formant la
superposition linéaire des trois rotations infinitésimales autour des trois axes
orthogonaux, on obtient la matrice de rotation infinitésimale la plus générale,
qui est anti-symétrique :
3 / ^ *^“ 3 —¿û!2 '

^ R iS a i = I —Sas 0 5ai , , (7.43)
*=i V Sa2 —Sai 0
et que nous avons vue dans le chapitre consacré à la mécanique.
7.7 Angles d’Euler

La façon de paramétrer le sous-groupe des rotations en trois dimensions,
en choisissant les rotations autour des axes cartésiens immobiles, n ’est pas
unique. Pour des raisons de commodité, en mécanique des solides rigides, on
utilise une autre paramétrisation, les angles d ’Euler. En effet, ce choix cor
respond mieux aux mouvements d ’une toupie tournant dans un champ de
gravitation constant. Une toupie (ou un gyroscope) est animée d ’une rotation
rapide autour de son axe de symétrie. En s’écartant de la position strictement
verticale, elle est soumise à un moment des forces qui tend à l’incliner vers
le plan horizontal; on constate alors que, suite à la loi de conservation du
7.7. ANGLES D’EULER 283
moment cinétique, la toupie se met à tourner lentement autour de la direc

tion verticale ; c’est le mouvement de précession. Son axe de symétrie tourne
alors autour de la verticale. Un troisième mouvement est possible, une rotation
supplémentaire autour de l’axe mobile de la toupie : ce mouvement circulaire
porte le nom de nutation.
F ig u r e 7.5 - Rotation propre, précession et nutation.
En mécanique du solide les trois angles correspondant aux rotations men

tionnées ci-dessus s’appellent les angles d ’Euler^ notés a , ¿0,7 . Ils sont représentés
sur la figure qui suit :
F ig u r e 7.6 - Les angles d’Euler
Pour transformer le repère galiléen dans lequel sont immobiles l’observateur

et le plan sur lequel tourne la toupie en un repère tournant solidaire de la
toupie, on doit procéder de manière suivante :
a) Première opération : la tourner par l’angle a les axes i et j autour de
l’axe vertical k du repère immobile, de sorte à ce que l’axe i vienne à coïncider
avec la projection de l’axe de la toupie sur le plan horizontal. La matrice de
rotation correspondante est alors

c o s O!
[j4 i (o:)] = I —sino: (7.44)
0
b) Effectuer une rotation par l’angle /3 autour du nouvel axe x de sorte
à ce que l’axe vertical k s’incline pour coïncider avec l’axe de la toupie. La
matrice correspondante sera alors
/ 1 0 0 \
[A2 {0 )] = j - 0 cos/0 -sin /3 1 , (7.45)
\ 0 siny0 cos/3 /
c) Finalement, tourner la toupie autour de son axe (qui est le nouvel
axe z) d ’angle 7 , rendant compte de la rotation propre de la toupie autour de
son axe. La matrice correspondant à cette opération est :
[^3(7 )] = (7.46)
Le passage du repère immobile vers le rep>ère propre de la toupe se fait par

l’action de ces trois matrices dans l’ordre mentionné ci-dessous :
[ A z m A 2m [ M a ) ] (7.47)
La matrice résultante peut être calculée facilement, mais elle occupe trop de
place et ne tiendrait pas sur une seule page.
7.7.1 Constantes de structure, représentation adjointe

Dans le chapitre traitant de la géométrie diflEërentielle nous avons rencontré
une autre réalisation des isométries infinitésimales, considérées comme des
champs vectoriels engendrant les mouvements infinitésimaux du plan euclidien.
Dans le cas de trois dimensions, on peut introduire trois champs vectoriels,
selon le même schéma :
^d y' ^dz' ^d x '

dont les crochets de Lie vérifient les mêmes relations de commutation que les
matrices Ri :
{ X i,X 2 } = X 3, { X s ,X i} = X2, {X 2 ,X s} = X i.
7.7. ANGLES DÊULER 285
Il est intéressant d ’écrire les trois mêmes champs vectoriels en coordonnées

sphériques { r , 6 , i p ) . Le calcul est fastidieux, mais ne contient rien d ’extraor
dinaire, juste les dérivations composées, exprimant les dérivées cartésiennes,
comme par exemple,
d _ dr d dO d d(p d
dx dx dr ^ d x d O ^ dx dip^ ’
et en remplaçant systématiquement dans les expressions pour X^. On obtient
alors :
d cos 9 cos ip d
sin 6 dip ’
^ d cos 9
6 d
2 Q0 sin 0 sin ^ dip'
y^ = Adip
On peut vérifier que les crochets de Lie gardent la même forme qu’aupara-
vant. On peut résumer les N {N — l)/2 relations de commutation entre les
générateurs d’une algèbre de Lie de dimension IV, notés L\, L ^ ,..., Ljv> à l’aide
des constantes de structure : en utilisant la convention de sommation d ’Ein
stein, on peut écrire de manière concise :
[La, Lt\ = a, 6,... = 1, 2, ...N. (7.48)

Les coefficients s’appellent les constantes de structure de l’algèbre de Lie.
L’identité de Jacobi entre les trois générateurs arbitraires de l’algèbre de Lie,
La,Lb et Le impose aussi des relations entre les constantes de structure. En
utilisant la définition (7.48) et en l’insérant dans l’identité de Jacobi
[Lai [Lbi ■i'c]] + [Lft, [Le, La]] -F [Le, [La, [Lft]] = 0,
on trouve
C î/C 4 + C ?/C 4 + C ? /C i = 0. (7.49)
L’identité de Jacobi exprimée à l’aide des constantes de structure peut être
interprétée comme une identité concernant N matrices définies de la manière
suivante : on fixe le premier indice bas, et on considère les deux indices res
tants, haut et bas, comme indices d ’une matrice N x N, avec les règles de
multiplication matricielle classiques.
Pat = (7.50)
Dans ce cas, on pourra écrire l’identité (7.49) comme suit ;
o i , c L + c i , c L = - o ! , o i ,.
puis, en changeant le signe suite aux permutations d ’indices bas, car par
définition les constantes de structure sont anti-symétriques :
on aura :
/~i9 r< f _ n 9 r< f _ n i n 9
âf^bc ^bfâc ~ 'âb^fc^
ce qui peut être écrit avec la notation matricielle (7.50) comme ceci :
И И - И И = c ijP ii (7.61)
les indices matriciels étant [Cf]^, tandis que / est un indice de sommation
dans tous les cas.
La représentation de l’algèbre de Lie obtenue à l’aide de ses constantes de
structure s’appelle la représentation adjointe de l’algèbre de Lie.
Il existe une autre représentation matricielle, agissant sur un espace com
plexe en deux dimensions, C^. Ce sont les matrices de Pauli, définies comme
suit :
0) ’ 0' ) ’ ‘" * " ( 0

Ce sont les matrices 2 x 2 hermitiennes, sans trace. Le carré de chacune d ’elles
est la matrice unité 2 x 2 ; on vérifie aisément qu’elles anti-commutent entre
elles, c’est à dire que l’on a
СГ1СГ2 -h (T20 -1 = 0, (Г2 СТ3 + 0-ЗСГ2 = 0, <T3Cri -h (71(72 = 0. (7.53)
Les règles de commutation sont les suivantes :
(71(72 —(72(71 = 2i(73, (72(73 —(73(72 = 2i(7l, СГ3 СГ1 —<Tl<73 = 2Î(72. (7.54)
A une constante près, c’est la même structure que pour la représentation

adjointe du groupe des rotations 0(3). En introduisant les trois matrices
Ti, г = 1, 2,3 selon la formule
on trouve facilement que ces nouvelles matrices reproduisent les règles de com
mutation de l’algèbre de Lie du groupe des rotations 0(3) :
[ r i , Г 2] = T 3, [t 2 , Т з ] = n , [t 3 , T l] = T2-
Cette représentation de l’algèbre de Lie du groupe des rotations s’appelle

représentation spinorielle. Elle joue un rôle important en mécanique quantique
relativiste, notamment dans l’équation généralisant l’équation de Schrôdinger
pour l’électron.
7.8. ESPACE-TEMPS ET GROUPE DE LORENTZ 287
7.8 Espace-temps et groupe de Lorentz

La relativité restreinte, énoncée par Einstein en 1905, est la conséquence
directe de la théorie unifiant les phénomènes électriques et magnétiques établie
par Maxwell qui a mis en équations les résultats expérimentaux dus surtout à
Faraday, et développée par Hertz et Lorentz.
Le fait que les équations de l’électrodynamique maxwellienne, contraire
ment aux équations de la mécanique newtonienne, changeaient leur forme avec
le changement de repère galiléen n ’a pas échappé à l’attention de Lorentz et
Poincaré. Ils ont trouvé la forme des transformations linéaires impliquant les
coordonnées x, y, z et le temps t de manière plus compliquée que les transfor
mations galiléennes, formant le groupe de Galilée^ comprenant les translations
et les rotations de l’espace euclidien à trois dimensions ainsi que les transfor
mations impliquant le temps, quand on passe d ’un repère galiléen à un autre,
avec une vitesse relative constante V :
r' = r -t- V i. (7.55)
Les transformations de Lorentz et de Poincaré laissent invariante la forme de
l’opérateur de d ’Alembert
(7.56)
c2 Ôi2 dx^ aj/2 dz^'
Néanmoins, seul Einstein a donné une interprétation physique de ces trans
formations et en a tiré toutes les conséquences, notamment en les appliquant
non seulement au champ électromagnétique mais aussi à la mécanique, en
modifiant la conception newtonienne très profondément.
Le raisonnement d’Einstein prenait pour point de départ les résultats
de Michelson et Morley qui encore en 1881, ont vérifié expérimentalement
l’indépendance de la vitesse de propagation de la lumière au repère inertiel
dans lequel cette vitesse était mesurée. D’ailleurs, les équations de Maxwell
suggèrent fortement qu’il en est ainsi, puisque la constante c qui apparaît dans
ces équations vient de la relation entre les constantes fondamentales eo et Mo»
(les coëfficients de perméabilité électrique et de permittivité magnétique dans
le vide).
Dans sa plus simple expression, la déduction de la formule-clef pour la
transformation du temps t' observé [ou plutôt : devant servir de paramètre
de référence pour tous les phénomènes physiques observés] dans un référentiel
galiléen, est basée sur l’application du théorème de P 3d;hagore. En mesurant
la vitesse de la lumière effectuant un aller-retour AB A (réfléchie par le miroir
B), on constate que
2h
c=
¿tAB
“
f^lBA
VU dans un référentiel immobile

avec la vitesse V > Ù alignée sur l'axe O X
dans le premier cas. Si le temps mesuré dans un repère mobile entre ces deux
mêmes événements (le départ du rayon du point A et son arrivée au même
point après réflexion) est le même (d’après la transformation de Galilée), alors
la vitesse mesurée doit être :
, 2 + v H \b + V H \b r~.------^
c' = - L - ------ ^ = y— ------ âR = , / j : ÿ i ^ = ci l + ^ > c . (7.57)
2ÎAB tA B \
Ce résultat étant en contradiction avec l’expérience, on admettra que t' mesuré

dans le repère mobile n ’est pas égal à t ; par contre, la célérité de la lumière
doit être strictement la même :
= ' donc, cît'AB? = + y '^ if a b Ÿ^ (7.58)
ce qui donne
et flnalement, compte tenu du fait que h = c îa Bî mène à la relation suivante

entre tA B et t ' a b ‘
tAB
(?^\b = - V^) {t'ABŸ -A- t'AB = (7.59)
Puisque le temps se transforme ainsi, il est fort probable que la transforma

tion galiléenne entre les coordonnées x et x’ = x + Vt nécessite une correction
également. La seule chose qui reste invariante au passage est la vitesse de la

lumière.
On supposera donc que la nouvelle transformation des coordonnées entre
deux observateurs galiléens reste linéaire, mais le temps n ’est pas considéré
comme restant le même pour les deux observateurs. Pour simplifier l’ana
lyse considérons deux repères galiléens dont les axes sont parallèles, et dont
la vitesse relative est alignée sur leur axe commun Ox comme sur la figure
ci-dessous. On peut arriver à une telle configuration en appliquant les rota-
F i GURE 7.7 - D e u x rep ères g a lilé e n s, a v ec la v it e s s e r e la tiv e V=
tions appropriées à deux repères galiléens quelconques. On admettra alors, en

imitant en cela le résultat de la transformation galiléenne classique
t' = t, x' = X — Vt, y' = y, z' = Z.,
que dans la nouvelle version on a toujours y' = y, z' = z, auquel cas il suffira
d ’analyser la transformation réduite, entre les paramètres (i, x) et i', æ'.
Puisque la vitesse de la lumière est une constante universelle, commune à
tous les observateurs, nous pouvons rendre désormais nos transformations plus
homogènes, en utilisant la variable et ayant la dimension de longueur comme
la variable æ, à la place du temps t, et et' à la place du temps t'.
Voici donc, sous la forme matricielle, la transformation cherchée :
o=(; ^)( (7.60)

où toutes les entrées sont des nombres sans dimension.

Pour déterminer les quatre coefficients de la matrice 2 x 2
cherchée, on observe tout d ’abord que cette transformation doit laisser in
variante la vitesse de la lumière. Un rayon lumineux vu par le premier ob
servateur, solidaire du le repère 7?., parcourt en un temps infinitésimal dt la
distance donnée par le vecteur infinitésimal [dx,dy,dz], La vitesse observée
étant alors égale à c, on peut écrire
\/d x ^ -h d y ^ -I- d z ^
= c, -> (?dt^ — —dy^ —dz^ = 0. (7.61)
dt
L’observateur lié au repère Rj constatera la même chose, ce qui peut être écrit
ainsi :
(7.62)
dt'
En principe, ce que disent ces deux formules est que l’annulation de la forme
quadratique (non définie positive)
ds^ = —dx^ —dy^ —dz^
dans un repère galiléen entraine l’annulation de la forme semblable évaluée

dans un autre repère galiléen. Einstein a généralisé ce principe en postulant la
stricte égalité de cette expression dans tous les systèmes inertiels :
„/2 —dy'‘
ds^ = dr^ —dx^ —dy^ —dz^ = dr'^ —dx'^ ../2 „/2‘ .
‘ —dz'‘ (7.63)
Le mathématicien Hermann Minkowski a proposé d ’interpréter cette forme

quadratique comme une métrique dans un espace à quatre dimensions, dont la
signature serait (-h, —, —, —). Cette métrique, représentée par un tenseur deux
fois covariant, non-dégénéré mais non défini positif, permet d ’écrire l’élément
remplaçant désormais le carré d’un élément de longueur en notation tensorielle
comme suit :
ds^ = gîpdx^dx", avec /î , v, ... = 0, 1, 2,3, (7.64)
et où l’on pose :
X0 — T
^ =
— et, x^ = X, = y, x^ = Z’,
900 = 1, 511 = 522 = 533 = -1 , 9 û^ = 0 si ^ ^ u. (7.65)

Le nouvel espace ainsi obtenu s’appelle l’espace-temps de Minkowski. En tout
point de cet espace on peut distinguer trois parties séparées par le cône
F ig u r e 7.8 - Le cône de lumière dans l’espace-temps de Minkowski
de lumière, visible sur le dessin ci-dessous : le cône futur, le cône passé, et

l’extérieur du cône.
Nous pouvons donc traiter les transformations préservant le cône de lumière
comme des isométries de l’espace de Minkowski qui préservent le tenseur
métrique minkowskien tout comme les isométries de l’espace euclidien tri
dimensionnel préservaient la métrique Ç ij, (i,j = 1 , 2,3). Il est clair d ’ailleurs
que les isométries de la partie euclidienne de l’espace-temps de Minkowski
font partie des transformations cherchées ; elles ne touchent pas la partie
temporelle, en laissant t ' = t . Les champs vectoriels (champs de Killing) cor
respondants, au nombre de trois, sont déjà connus. Ils vérifient la condition
caractérisant une isométrie,
{^xg)ij = 0,
qui conduit aux six solutions indépendantes, trois translations et trois rota
tions rigides. Les champs engendrant ces dernières étaient, en coordonnées
cartésiennes,
^d z ^d y' ^d x ^dz' ^d y ^d x '

Nous avons introduit une notation modifiée pour numéroter les trois champs
vectoriels, le double indice (12) correspondant à la rotation autour de l’axe
Oz, le (23) autour de l’axe Ox et le (31) autour de l’axe Oy. Par analogie,
en élargissant cette algèbre par les solutions de la condition valable en quatre
dimensions de l’espace-temps.
{CxQ^fiu — "b "b —0) (7.66)
et compte tenu du signe relatif différent entre les coordonnées spatiales et la

coordonnée temporelle r = æ®, on aura trois nouvelles isométries généralisant
les rotations, données par les champs vectoriels
X oi= T dx + xdr, X q2 =Tdy + ydr X q3= TÔz + zdr. (7.67)
plus une translation le long de la coordonnée temporelle r. Nous aurons donc

quatre champs vectoriels engendrant les translations :
dr' d x' dy' dz'
et six “rotations” , dont trois véritables dans le sous-espace euclidien (x,y,z),

et trois “pseudo-rotations” mélangeant t et (æ, y, z). L’algèbre de Lie ainsi ob
tenue s’appelle l’algèbre de Poincaré, du nom du mathématicien français Henri
Poincaré qui était le premier à la reconnaître. La sous-algèbre des six pseudo
rotations s’appelle algèbre de Lorentz, et les trois générateurs impliquant le
temps et les coordonnées spatiales s’appellent rotations de Lorentz.
Comme dans le cas des rotations ordinaires, où l’on identifiait les trois
générateurs des rotations avec un tenseur anti-symétrique, nous pouvons iden
tifier les six générateurs du groupe de Lorentz avec un tenseur anti-symétrique
à quatre dimensions :
Mij — —Mji —Xij^ Mok — ~Mico —Xoki i^j,k... — 1,2,3,
soit = -Mufi, /U, i^,.. = 0, 1, 2,3. (7.68)

Voici les relations de commutation entre les générateurs et P a>véritable
“carte de visite” de l’algèbre de Poincaré-Lorentz :
[PfiiPA — 0) P\] —QfixP'J ~ QuxP/.
l^/iX) Mi/p] — Qfii/Aixp + gxpMp^, Spp^Xu ~ 9 xuAIp,p- (7.69)

L’algèbre de Lorentz (les six opérateurs Mpu seuls) peut être représentée par
des matrices réelles 4x4. Nous les retrouverons comme matrices infinitésimales
au voisinage de l’identité en analysant d ’abord le groupe de Lorentz propre
ment dit.
Afin de simplifier les calculs, considérons la transformation de Lorentz ne
concernant que le temps t et la coordonnée x. Une telle transformation peut
être réduite à une matrice 2 x 2 agissant sur le vecteur colonne contenant les
différentielles dr = cdt et dx :
( d T '\ (a p\ (d r\
\ d x') V7 5) \ dx) ' (7.70)
avec, comme condition,

J \2 = dr^ —dx^.
(dr')^ —{dx')^
Puisque dr' = a dr-{-^ dx et dx' = y dr+5 dx, on peut expliciter en substituant

et en regroupant les termes semblables :
dr^ + 2a0 drdx + 0^dx^ —'y^dr^ —2'y5drdx —S^dx^ = dт^ —dx^. (7.71)
En comparant les termes devant les combinaisons quadratiques des différen
tielles indépendantes, on obtient trois équations, ce qui laisse supposer qu’il
ne restera qu’un seul paramètre libre parmi les quatre.
Voici les trois équations indépendantes :
—7 ^ = 1, = —1, 2 aP —27^ = 0,
la dernière équation venant du fait qu’il n ’y a pas de terme mixte drdx dans
l’expression de droite de (7.71). Quand la somme de deux carrés est égale à 1,
-|- 6^ = 1, la meilleure façon de paramétrer ces deux nombres est de déclarer
que a = cos v? et 6 = sin tp. Ici nous avons les différences de deux carrés égales
à 1 ; on peut donc utiliser les fonctions hyperboliques :
a = cosh^, ;0 = sinh^, 7 = sinhX) <5= coshx,
si l’on tenait compte de deux premières équations ; mais en insérant ces solu
tions dans la troisième, on constate que, puisque
cosh sinh X = sinh ij) cosh x,
on voit que la seule possibilité est de poser x = V’- La matrice de la transfor

mation de Lorentz devient à présent
( d r'\ ( cosh^ sinhV’^ f dT\ ,,r,\

V dx' J \sinh^ cosip J \ dx J ' \ • J
elle dépend donc d’un seul paramètre réel et son déterminant est égal à 1.
Afin de relier cette transformation avec la situation concrète, il convient
d ’exprimer les deux fonctions hyperboliques cosh et sinh par une seule, qui est
la tangente hyperbolique. On écrira alors
tanhy? \
/ cosh^ sinhV»^ _ I \
(7.73)
\ sinhV’ cosV* / 1 \ y/1—tanh^ ip
^ I'
\ / l—tan h^^ /
Il reste à relier la tanh ip au seul paramètre libre définissant le passage du repère

77. au repère TZ', qui est la vitesse relative V. Pour cela, remarquons que la
valeur de ^ = 0 correspond à la matrice unité, soit à la transformation identité.

Considérons donc les transformations de Lorentz très proches de l’identité,
ce qui suppose “ip très petit devant 1 et par conséquent, tanh^* très petite
également. En négligeant les termes carrés, on trouvera une matrice linéarisée,
conduisant à la transformation :
/ cdt' \ _ i 1 f ip\ P cd t\
(7.74)
\ dx' ) \ tanh Ф 1 ) \ dx )
où nous avons mis explicitement r = e t

Comparons ces expressions avec la transformation de Galilée décrivant la
même situation :
x' = X — Vt, t' = t.
La transformation de Lorentz pour des valeurs de tanh tp infinitésimales donne
x' cü X+ ci tanhV’) e t' —et + X tanhV’.
On peut faire coïncider les deux transformations de la coordonnée x en posant
V
tanh'^ = ---- ,
c
Dans ce cas la transformation du temps s’écrira comme suit :
Vx
t' r»2
On peut comprendre alors pourquoi une telle différence entre t et t' est passée
inaperçue : c’est à cause d ’une valeur extrêmement grande de la vitesse de la
lumière c. En effet, même si l’on observait des objets dont la vitesse V attei
gnait 10 km/sec sur des parcours de 100 km (x = 100 km et, par conséquent,
t = 10 secondes), la différence entre t et t' serait égale à
Vx 1 0 x 100 ,,
~ 1,1 X 10 °see.,
(300000)2
bien au-delà des possibilités de détection avant l’avenement des horloges ato
miques (les années 50 du XX siècle).
Voici donc la forme finale de la transformation de Lorentz impliquant seule
ment X et i :
Ê ±t ---Vx
2Г
x' = t•'' = ^ (7.75)
V2
v ^ ’
ou encore, sous la forme matricielle avec la variable “homogène” r ,

( r '\ 1 \ / t \
V (7.76)
1
\x /
On vérifie aisément que la matrice inverse est obtenue en changeant le signe de
la vitesse relative V. Notons qu’il est facile de définir deux autres “rotations
lorentziennes” impliquant les axes y et z. Le résultat complet doit apparaître
sous forme de matrice 4 x 4 , comme ceci :
( c t '\ V /c t\
/. Z, 0 0
V2
X
V2 0 0 (7.77)
izr
0 0 1 0
\z ' ) 0 0 0 1/
\z j
Toutes les transformations de Lorentz peuvent être obtenues par superposi
tion de cette matrice avec les matrices de rotations spatiales selon le schéma
suivant :
A = Ri o B oR2, (7.78)
où Ri et i ?2 sont deux rotations spatiales appropriées, et B est une transfor
mation de Lorentz impliquant une seule variable spatiale, par exemple x, et le
temps t. On peut choisir la transformation de Lorentz B autrement, avec une
vitesse V, quitte à utiliser d’autres rotations iîi et R 2 ; mais le résultat sera
toujours atteint.
En définissant le groupe de Lorentz comme l’ensemble des transforma
tions laissant invariant le carré du quadrivecteur infinitésimal ds^ = —
dx“^ —dy“ ^ — dz^, nous avons considéré seulement les transformations conti
nues, dépendant de manière anal3dique des six paramètres réels (en oubliant
les quatre translations, trois spatiales et une temporelle, qui ne sont que les
choix différents de l’origine du système des coordonnées minkowskiennes). Il
existe toutefois quelques transformations discrètes qui conservent intact le
carré d’un quadri-vecteur, mais pas forcément les produits pseudo-scalaires.
Il s’agit des réflexions spatio-temporelles, que l’on peut (et doit) inclure dans
la définition du groupe de Lorentz. Le groupe élargi de Lorentz, contenant
toutes les symétries discrètes, contient quelques sous-groupes mais aussi les
sous-ensembles ne contenant pas l’unité, qui ne forment donc pas un sous-
groupe. La structure du groupe élargi de Lorentz est représentée sur la figure
(7.9) ci-dessous.
On y voit que le groupe total est composé de quatre morceaux dont seule
ment un est un véritable sous-groupe, car il contient l’élément neutre (la trans
formation identité).
Remarquons que la définition du groupe de Lorentz
— 9pai (7.79)
étant quadratique en composantes A^, ne détermine pas leur signe de manière

unique - pour chaque choix de vérifiant (7.79) on peut inverser le signe de
la matrice, et la nouvelle matrice —A^ vérifiera notre condition (7.79) aussi
bien.
La définition (7.79) implique aussi que le carré du déterminant de la matrice
A^ vaut 1 ; on doit donc avoir
(det A)^ = 1, donc det A = ± 1.
Considérons la composante (00) de (7.79) : nous avons explicitement, en nous

rappelant que gû = diag{+, - , - , - ) ,
( A S ) '- E ( A i ) “ = i. (7.80)
Z=1
ce qui implique que | A§ |> 1, donc soit A§ > 1, soit A§ < 1.
Notons également que le déterminant de A ainsi que le signe de l’élément
matriciel Aq représentent des fonctions continues des éléments matriciels de
A, d’où il vient que l’on ne peut pas joindre de manière continue les matrices
ayant les déterminants -f-l et —1, ou les matrices avec l’élément A§ positif avec
celles dont l’élément A§ est négatif.
Le grand groupe de Lorentz se scinde donc en quatre parties suivant les
signes du déterminant et de leur élément Aq :
4 det A —"b1) Aq > 1,
detA = —1, Aq > 1;

det A = "1-1, Aq ^ 1,
Li detA = —1, Aq < 1. (7.81)
Introduisons les opérateurs d ’inversion suivants :
It : l’inversion du temps ; Je : l’inversion d ’espace ; Jet : l’inversion simul
tanée du temps et de l’espace. L’action de ces opérateurs sur un quadrivecteur
= ctfX^ = X, x^ = y,x^ = z] est comme suit :
(Jta:)“ = -x ^ , {Itx^) = æ**, k = 1, 2,3.

7.9. GROUPE DE LORENTZ ET ALGEBRE DE CLIFFORD 297
(leX)^ = (/e®*) = —x'", k = 1,2,3.

{h tx Y = = {lehxY , M= 0, 1, 2,3.
Trois sous-ensembles du groupe de Lorentz élargi définis dans (7.81) contiennent
chacun exclusivement une inversion particulière le caractérisant ; seul le sous-
ensemble contient l’unité du groupe (transformation identité). Précisément,
contient l’unité, L[_ contient /g, L+ contient /et» et contient /*.
Voici la représentation graphique de la structure du groupe de Lorentz
élargi, avec ses sougroupes : D’après la figure, on voit que le groupe de Lorentz
F ig u r e 7.9 - La structure du groupe de Lorentz comprenant les symétries discrètes.
élargi contient quatre composantes non-connexes. En effet, il est impossible de

passer de manière continue d ’une matrice au déterminant égal à -|-1 à une
matrice dont le déterminant est égal à —1. De même, il est impossible de
joindre de manière continue une matrice dont l’élément A§ est plus grand que
-fl avec une matrice dont l’élément A§ est inférieur à —1. Néanmoins, on peut
définir quatre sous-groupes du groupe de Lorentz élargi, montrés sur la figure
7.9) par les pointillés les entourant :
- On appelle L’I' “groupe de Lorentz orthochrone”
- On appelle L+ “groupe de Lorentz propré’
- On appelle L q “groupe de Lorentz orthochoré’
- On appelle l \. “groupe de Lorentz restreint’.
7.9 Groupe de Lorentz et algèbre de Clifford

Dans le Chapitre 5 nous avons présenté et discuté la représentation spino-
rielle. Nous en donnons un bref rappel :
La représentation du groupe de Lorentz en termes de matrices réelles 4x4,
agissant sur les vaRiables spatio-temporelles paraît la plus naturelle. Mais
on peut chercher d ’autres représentations, en dimensions inférieures, quitte à

utiliser pour cela les nombres complexes. Il se trouve que l’on peut évaluer le
carré minkowskien d ’un quadri-vecteur = [ci, x, y, z] donné par la formule
Xij,x^ = OfiuX^x'^ en calculant le déterminant d ’une matrice complexe 2 x 2
construite comme suit :
7 4 ) , (7.82)
où l’on pose
CTO=
On trouve facilement que det B{x) = cH^ —x^ —y^ —z^. On notera aussi que
la matrice B(x) est une matrice hermitienne, vérifiant B^ = = B. Cette
relation est bi-univoque : toute matrice 2 x 2 hermitienne peut être interprétée
comme un quadri-vecteur minkowskien réel : étant donnée
on pourra lui attribuer le quadri-vecteur dont les composantes seront :

O-f- d 6 1-6
- 6-6 a —d
et = X= y= Z=
2i ’
En transformant par similitude la matrice B en une autre matrice hermitienne

B = UBU~^ à l’aide d ’une matrice de passage U on peut obtenir un autre
quadri-vecteur à condition que la matrice transformée B soit hermitienne elle
aussi. Il faut donc imposer la condition supplémentaire sur la matrice de pas
sage U, à savoir {UBU~^)^ = UBU~^ afin d’assurer B^ = B. Mais dans ce
cas, il faut imposer
Bt = {UBU-'^Ÿ = {U~^)^BÛ^ = {U-'^ŸBU^ = U B U ~\ (7.83)
ce qui conduit à la condition d'unitarité pour les matrices U admissibles :
= U ~\ (7.84)
En explicitant cette condition, on obtient l’égalité suivante entre les deux mar
tric0S *
"’ = ^ " = ( t l) = ^ ( - c ? ) = ' ^ " ‘-

Il suffit de prendre le déterminant des deux matrices pour constater que
1
det = ad —bc = {ad —bc) — 1,
ad —bc
7.9. GROUPE DE LORENTZ ET ALGEBRE DE CLIFFORD 299
donc aussi det U = (ad —bc) = 1. Les matrices complexes de déterminant égal
à 1 forment un groupe, appelé SL{2,C). Il a six paramètres réels, puisque
la condition det Î7 = 1 correspond à (pour les quatre nombres complexes
a, 6, c, d) deux équations rélles, ce qui laisse exactement 8 —2 = 6 paramètres
réels, le même nombre que pour le groupe de Lorentz. De plus, le groupe
SL ( 2 , C) satisfait pratiquement la condition qui définit le groupe de Lorentz :
transformations linéaires laissant invariant le carré Minkowskien d ’un quadri-
vecteur. En effet, si l’on identifie la matrice transformée de B(x) avec B(x) —
B(x), on constate que det (É) — d et(5), d ’où il vient que = x^x^. Mais
le groupe iS'L(2, C) n ’est pas exactement le groupe de Lorentz. Il contient plus
d ’éléments car si la matrice U appartient à ce groupe et peut être identifiée
avec une transformation de Lorentz, il en est de même pour la matrice —U.
On dit que le groupe SL ( 2 , C) est un double revêtement du groupe de Lorentz.
Cette représentation à deux valeurs (chaque élément du groupe de Lo
rentz peut être représenté par une des deux matrices, U ou -U ) s’appelle
représentation spinorielle. Elle a joué un rôle très important en mécanique
quantique relativiste et dans la théorie moderne des champs.
On note chacune de ces représentations differamment : pour celle
avec le signe “4-” , et p (°’2) pour celle avec le signe La première agit sur
les spineurs de Weyl •0“ , la seconde agit sur les spineurs de Weyl conjugués
avec les indices dotés d ’un point.
Les indices a et $ hauts peuvent être abaissés à l’aide des tenseurs inva
riants Ea0 et :
= = (7.86)
ou
£ l l — 0 — £22) £12 — 1 — ~£21- (7.87)
Les (pseudo)tenseurs Sap et £^^ jouent le même rôle dans l’espace des spineurs
que le tenseur métrique dans l’espace-temps minkowskien, dans le sens qu’ils
restent invariants sous l’action du groupe SL{ 2 , C). En fait, le groupe SL{2, C)
peut être défini comme l’ensemble des matrices complexes 2 x 2 laissant inva
riante la forme anti-symétrique £ар'Ф°‘- En effet, si l’on impose l’identité
P' t (7.88)
on trouve, en posant o:' = 1 et ^9' = 2
UlUlen + UlUl,£21 = и1Щ. - иЩ, = £ 1/ 2' = 1, (7.89)
’ ce qui équivaut à la condition det(i7) = 1, relation constitutive définissant

les matrices appartenant au groupe SL(2,C). On vérifie que les trois autres
composantes sont soit identiquement nulles (les composantes symétriques, (11)

et (22)), soit conduisent au même résultat (la composante (21)).
Comme précédemment dans le cas de tenseurs, on peut former les pro
duits tensoriels entre spineurs. Le produit tensoriel des deux spineurs de We^l
de type opposé, c’est-àrdire appartenant aux représentations et
présente un intérêt tout particulier. Considérons le produit tensoriel
Xa0 = '<Pa®Xfi-
L’espace produit de deux espaces spinoriels est de dimension complexe 4, donc
de dimension réelle 8.
En imposant la condition d’hermiticité
on réduit le nombre de paramètres indépendants à 4.

Valgèbre de Cliffordest définie par ses quatre générateurs 7^, = 0,1,2,3 :
7'*7‘^ + 7 V = 2p'^‘' l , (7.90)
où 1 est la matrice unité 4 x 4. On vérifie facilement que les matrices (matrices

de Dirac) ^ définies ci-dessous vérifient les relations constitutives (7.90) :
(7.91)
ï).
où les <r* sont les matrices de Pauli.
Plus explicitement, en notation 4 x 4, on a
/1 0 0 0 \ 0 0 0 1\
0 1 0 0 1 0 0 1 0
/ = 0 0 -1 0 . 7 =
0 -1 0 0
\o 0 0 -V V-1 0 0 0/
0 0 -i\ fl 0 0
^2 _ 0 0 i 0 3 0 -1 0 0
, 7 - (7.92)
0 i 0 0 0 0 -1 0
\-i 0 0 0 / \0 0 0 1/
Les matrices 7^ ont des propriétés remarquables par rapport aux transfor
mations de Lorentz. Les indices hauts 7^ n’ont pas été choisis par hasard : il
1. P aul A.M . Dirac, 1902 — 1984, savant britannique né en Suisse, un des plus grands
physiciens du X X -èm e siècle. Il a établi Téquation relativiste pour Pélectron, portant son
nom. P rix N obel de physique en 1933.
7.10. PROBLEMES 301
s’agit en réalité des indices d ’un quadri-vecteur. En faisant agir une transfor
mation de Lorentz représentée par une matrice 4 x 4 , , on peut obtenir
une combinaison linéaire de matrices 7'' :
7^*' = K ' Y ,
vérifiant les mêmes relations constitutives :
(7.93)
Ceci dit, les nouvelles matrices 7^ n’ont pas du tout la forme “canonique”
(7.92). Il s’avère que cette forme peut être retrouvée grâce à l’action d ’une
autre représentation du groupe de Lorentz, définie comme suit :
S{A) = avec i [7'^7‘' - 7*'7^ ], (7.94)
u>ni/ = — donnant les six paramètres définissant la transformation de Lo

rentz . On peut vérifier alors, par un calcul direct, la propriété de covariance
des matrices 7^ :
S Y ' S-'^ = MÎ; Y - (7.95)
Les matrices Y constituent les générateurs de l’algèbre de Clifford. C’est une
algèbre de dimension 16 ; en voici une base, de 16 éléments indépendants,
sous-tendant l’espace vectoriel complet :
1, 7" , = i |7 ^ 7 ‘' - 7 V J ,
r*" = expcrfiYYY, Y= YYYY-

On compte bien une matrice untié, quatre matrices 7^, six matrices quatre
matrices et une matrice Y> ce qui fait 16 en tout - la dimension complète
de l’espace des matrices réelles 4 x 4. Il existe d ’ailleurs une représentation
particulière, dans laquelle les matrices Y sont réelles.
7.10 Problèmes
Problème 7.1. - Groupes discrets finis
On définit le groupe fini Z5 comme l’ensemble de cinq nombres complexes,
puissances de la racine cinquième de l’unité a = e ~ :
a, a^, a^, a^, a® = 1
l’élément neutre étant bien évidemment 1.

a) Vérifier les axiomes du groupe. Trouver les éléments inverses de chaque

élément du groupe; et faire le tableau de multiplication et démontrer qu’il
s’agit d’un groupe abélien.
b) Existe-t-il des sous-groupes de ce groupe ? Si la réponse est ’’non” , expliquer
pourquoi.
Définissons l’addition “modulo 5” , applicable à tous les nombres entiers natu
rels de N : 0,1,2,3,....
a, 6 G N , O © 6 = (o + 6) modulo 5 (7.96)
ce qui veut dire que les additions se font normalement tant que le résultat est
inférieur à 5, qui est équivalent à 0 :
1+0 = 1, 1+1 = 2; 1+2 = 3, 2+2 = 4, mais 2+3 = 5, 3+3 = 1,4+4 = 3, etc.
c) Prouver que le groupe ainsi défini est isomorphe avec le groupe Z 5 .

Considérons le produit cartésien des groupes Z 2 et Z 3 :
a,b Ç. Z 2 i Oc, S ^ ■^3, (^,<3:) • (b, P) — {(ib,Oi0) G Z 2 x Zz (7.97)
autrement dit, les multiplications se font dans les groupes respectifs.

d) Combien d ’élements a le groupe-produit Z2 x Z3 ? Définir l’unité du groupe
et l’élément inverse.
e) Produire la table de multiplication du groupe-produit Z 2 X Z 3 . Démontrer
qu’il s’agit d’un groupe abélien (commutatif). Quels sont les sous-groupes de ce
groupe. En quoi diffère-t-il du S 3 , groupe des permutations de trois éléments?
P ro b lèm e 7.2. - G ro u p e s d isc re ts infinis
Considérons l’ensemble des nombres entiers Z (positifs, négatifs et 0) muni
d’une loi de composition définie comme suit :
(û,6) G ^ o © 6 = ci + 6 + l. (7.98)
a) Vérifier que cette loi de composition définit bien un groupe : trouver

l’élément neutre et l’inverse. Prouver l’associativité de cette composition.
Considérons une loi de composition définie sur l’ensemble des nombres entiers
à l’exception de —1 :
û, 6 g Z —■(—1), —^ a ^ b —ab + 0 + 6 (7.99)
b) Prouver qu’il s’agit de nouveau d’un groupe. Vérifier l’associativité ; trouver

l’élément neutre et l’inverse; expliquer pourquoi il a fallu exclure —1.
7.10. PROBLEMES 303
P ro b lèm e 7.3.* - Iso m étries, v e cte u rs de K illing

On appelle vecteur de Killing de la métrique gij un champ vectoriel X tel que
^x{g ) = 0
a) En admettant la règle de Leibniz pour les dérivées covariantes Vj, trouver

l’expression de la dérivée covariante d’une 1-forme 6 (tenseur une fois cova-
riant) définie par ses composantes 6 ^ 1 en utilisant la formule
Vi{9mX^) = {Viem )X^ + ÔmVi(X^)
et sachant que
Vi(/) = dif
b) Les symboles de Christoflfel associés à la métrique gij sont donnés par les
formules
1 .
~ iPjÿmk + dkQjm ~ dm,gkj)
Prouver que
^ i 9 jk — digjk gmk ~ gjm — 0

c) Les composantes covariantes du vecteur X sont définies par la relation
Xh = giem^^- La dérivée covariante de Xm est alors
Vi{Xm) = d iX m -r^m X k
Prouver l’équivalence des les conditions Cx{g) = 0 et Vi(Xm) + V,n(-X'i) = 0.
P ro b lèm e 7.4.* - Iso m étries d u p la n euclidien

Dans le plan euclidien paramétré par les coordonnées cartésiennes x et y, le
tenseur métrique prend la forme
9xx — 9yy ~ 1 ) 9xy — 9yx — 0
a) Écrire les équations explicites pour un champ de Killing de cette métrique.

Le faire en deux versions : avec les dérivées de Lie, et avec les dérivées cova
riantes.
b) Trouver la solution générale du système obtenu. Celle-ci dépend de trois
paramètres. En prenant tour à tour l’un des paramètres égal à 1 et les deux
autres égaux à 0, définir trois champs de Killing (isométries) indépendants.
c) Trouver les transformations infinitésimales induites par ces champs vecto

riels. Identifier deux translations, T\ et T2 , et une rotation R 3 .
d) Trouver les commutateurs de Ti, T2 et R 3 entre eux. En déduire que ces
champs engendrent une algèbre de Lie dont on donnera les constantes de struc
ture.
P ro b lèm e 7.5.* - R o ta tio n s en tro is dim ensions. R e p ré se n ta tio n s m a
tricielles
On généralise aisément à trois dimensions les rotations infinitésimales du plan
(æ, y) (que l’on interprète comme des rotations autour de l’axe z'z en plongeant
ce plan dans l’espace euclidien à trois dimensions), en introduisant deux autres
rotations indépendantes autour des axes x'x et j/'j/ respectivement.
a) Expliciter les trois champs vectoriels, notés La = I^dk (o: = 1,2,3) corres
pondant chacun aux rotations autour de l’un des trois axes cartésiens.
b) Calculer tous les commutateurs entre ces champs et trouver les constantes
de structure C j ^ de l’algèbre de Lie ainsi obtenue.
c) Écrire l’identité de Jacobi en termes de constantes de structure. En in
terprétant ces constantes de structure comme des éléments d ’une matrice 3x3,
soit = (R j)^ où k est un indice de ligne et m un indice de colonne, prouver
que les matrices Rj ainsi obtenues fournissent une représentation de l’algèbre
de Lie des rotations :
[R 4 , R j ] = R i R j — R j R i = C ^ j R k
d) Expliquer pourquoi les matrices représentant une algèbre de Lie (avec le

commutateur comme loi de composition) doivent être de trace nulle. Trouver
une autre représentation de l’algèbre de Lie des rotations avec des matrices
2 x 2, notées Oi avec ¿ = 1, 2,3, que l’on supposera en outre vérifier <7? = îto/ 4
où <7o est la matrice unité 2 x 2.
e) Trouver les exponentielles des matrices crj, i = 1,2,3. On rappelle que la
matrice exponentielle d ’une matrice M, e ^ est définie formellement comme
une somme infinie des puissances de la matrice M :
3^ = 1+ M -h | m 2 -h -h + ... (7.100)
P ro b lèm e 7.6 . - S ym étries.

On considère un hyperboloïde unitaire de rotation (a = l,c = 1) donné
par l’équation en coordonnées cartésiennes (æ, y, z) :
X2 +. y2 — Z2 = 11.
7.10. PROBLEMES 305
a) Démontrer par calcul direct que cette équation (donc également la sur
face qu’elle définit) reste invariante par rapport aux trois transformations
indépendantes des coordonnées suivantes :
X X = x œ s h ^ + zsinhip, y ÿ = y, z z = xsinh.'ip + zcoship
x - ^ x = x, y ÿ = ycoshx + zsin h x, z - t z = y sin h x + ^coshx

X X = xcosip + ysiïïip, y ÿ = —xsin(p +ycos(p, Z Z = Z,
définissant un groupe à trois paramètres, ‘ip, x et <p.
b) Écrire ces trois transformations sous forme de matrices agissant sur le
vecteur-colonne :
'x \ /a b c \ / x'
ÿ ) = ( ci e / ) ( y
.z j \g h k ) \z .
Quelles sont les domaines de variation des paramètres x et Pour une
valeur donnée de chacun de ces paramètres, quelle est la valeur définissant la
transformation inverse (donc la matrice inverse correspondante) ? Quelles sont
les valeurs correspondant à l’élément neutre (l’unité du groupe) ?
c) Considérons les trois transformations infinitésimales données par les mêmes
formules, mais en supposant les valeurs infinitésimales 5ip, Sx et S(p, et en ne
gardant que les termes linéaires dans ces expressions. Cela revient à assimiler
les cosinus et les cosinus hyperboliques à 1, et les sinus et sinus hyperboliques
à leur argument, sinh(5'0) ~ Stp, cos(5(p) ~ 1, etc. Écrire les trois transforma
tions sous forme des matrices unité plus une matrice infinitésimale.
Ml = I -|- S'il) jRi, M2 = I -f- Sx R2> —I "HSip i?3.

Trouver les relations de commutation entre ces trois matrices sous la forme
[iîaj Rb] — R(i, a,b,d = 1, 2,3,

et déterminer les constantes de structure (anti-symétriques par définition
en leurs indices bas), = —C^j.
d) Considérons une fonction différentiable de trois variables {x, y, z) ; sous
l’effet d’une transformation infinitésimale on obtient f{x ,ÿ ,z ). On peut alors
définir la dérivée de Lie de cette fonction par rapport au champ vectoriel
engendré par la transformation infinitésimale appliquée ; il y aura trois champs
vectoriels indépendants. Ce sont des opérateurs différentiels ; on peut obtenir
leur forme explicite en calculant
^ ^ ^ y k !) f
dip dx dip dy dip dz dip **
dans le cas de la première transformation, et de manière semblable pour les

deux autres.
Déterminer les crochets de Lie entre ces trois champs vectoriels que l’on
notera X^dk, Y^dk, Z ’^dk-
Problème 7.7. - Algèbre de Lie, constantes de structure
On peut considérer les constantes de structure obtenues dans le problème
précédent comme 3 matrices 3 x 3 définies comme suit :
la /ora r/Of i a /â la /nra
1^ 1J6 “■ l^ 2J6 — L^3j6 — ^(3)6)
en fixant la valeur du premier indice bas et en laissant libres les deux indices
restants.
Déterminer les trois matrices Ci ainsi obtenues. Former les commutateurs
de ces matrices,
[CùCj].
Pour quelle raison ces règles de commutation sont identiques aux règles de com
mutation entre les matrices génératrices des transformations infinitésimales
R i?
Problème 7.8. - Champs vectoriels générateurs

Il est intéressant et instructif de trouver la forme des trois rotations et
des trois translations euclidiennes en coordonnées sphériques. Voici les trois
rotations et les trois translations en coordonnées cartésiennes :
O ^ ^
D « ®
B « ®
Tx = — Tx= — Tx = — (7.101)
d x' ® d x' ^ dx'
Trouver les expressions des ces opérateurs en coordonnées sphériques (r, 0, (p).
Chapitre 8
Problèmes non-linéaires
8.1 Préambule
Les équations différentielles ordinaires (c’est-àrdire concernant les fonctions
d ’une seule variable réelle) linéaires n ’ont pour nous aucun secret, et ceci quel
que soit leur ordre. Il en est de même pour les systèmes d’équations linéaires.
La recherche des solutions se réduit dans ce cas à un simple exercice d ’algèbre
linéaire, consistant en la recherche de racines d ’équations algébriques.
Une équation différentielle linéaire du premier ordre, à coefficients réels,
qui s’écrit
^ + a x{t) = 0
dt
a pour solution la fonction exponentielle x = exp{—at). Une équation linéaire
du second ordre,
d?x , dx
^ + 6^ + a i - 0
peut être transformée en un système de deux équations linéaires du premier
ordre, puis transcrite en introduisant la variable auxiliaire y = dx/dt, et en
utilisant la notation matricielle :
!(:)=(-» -OC)
La solution générale d ’un tel système est une combinaison linéaire de deux ex
ponentielles. Leurs exposants s’obtiennent à partir de l’équation caractéristique
det ( _ a =0 A2-h6A + o = 0. ( 8. 1)
Les racines
—b — —4a . —b -f- y/b“^ —4a
Al = -------- --------- et A2 = -------- ---------
308 CHAPITRE 8. PROBLEMES NON-LINEAIRES
peuvent être réelles (positives, négatives ou nulles) ou encore complexes (au

quel cas A2 est le complexe conjugué de Ai). La solution générale x{t) s’écrit
alors
x{t) = Ae^^^-\-B (8.2)
les constantes A et B devant être fixées par les conditions initiales imposées
sur x(t = 0).
Cette analyse reste valable dans les cas où le système de deux équations du
premier ordre ne dérive pas d ’une seule équation du second ordre ; la matrice
qui apparaît dans (8.1) est alors arbitraire et dépend de quatre paramètres
(a, b, c, d). L’équation caractéristique étant de second degré, on a deux valeurs
propres qui, selon le cas, peuvent être toutes les deux négatives, toutes les
deux positives, de signes opposés, puis une nulle (cas dégénéré), ou encore
deux complexes conjuguées.
Le cas des systèmes non-linéaires ne peut pas être expédié aussi facilement.
En règle générale, ces équations ne peuvent pas être intégrées explicitement.
Mais on peut appliquer des méthodes d ’approximation diverses et adaptées au
caractère du système non-linéaire en question. Dans ce qui suit nous étudierons
quelques-unes de ces méthodes, souvent ingénieuses et efficaces.
8.2 Méthode des approximations successives

Considérons tout d ’abord une équation non-linéaire du premier ordre pour
une fonction inconnue d ’une seule variable réelle. Voici la forme la plus générale
d’une telle équation :
(8.3)
où F(y, x) est une fonction réelle de deux variables réelles, y et x. Afin de fixer
la solution, il faut aussi fixer la condition initiale, en attribuant une valeur à
la fonction cherchée y = y{x) sous la forme y{x = 0 ) = C. On peut choisir la
condition initiale à n’importe quel point de l’axe Ox, par exemple x = b, ce
qui revient à un simple changement de variable x -¥ x —b.
Quoi de plus simple ! - aurait-on tendance de s’exclamer à première vue. Il
suffit d’intégrer les deux cotés ! En effet, on peut écrire symboliquement
f ^ d x = y{x) = C + f F{y{x),x)dx, (8.4)

JXn JXo
Il vient que la condition initiale est bien vérifiée, car l’intégrale entre x et xq
tend vers 0 quand x tend vers xq ; on aura donc y(xo) = C. Mais à part cela,
nous ne pouvons effectuer l’intégration que si nous connaissons la dépendance
explicite y(æ) faisant partie des arguments de l’intégrand F ; autrement dit.
8.2. METHODE DES APPROXIMATIONS SUCCESSIVES 309
pour trouver la forme explicite de la fonction inconnue y(x), il faut la connaître

à l’avance !
Faute de mieux, nous avons alors recours à la m é t h o d e d e s a p p r o x i m a t i o n s
s u c c e s s iv e s . Au voisinage immédiat du point x q , l’erreur commise ne sera pas
trop grande si l’on remplace la fonction y{x) par la fonction constante, partout
égale à la valeur précise que prend la fonction y{x) au point x q , c’est-à-dire
C. Dans ce cas, on peut intégrer la fonction qui ne dépend plus que de x seul
et qui fournira la première approximation yi (x) :
yi{x) = C + f F{C, x)dx (8.5)

J XQ
À partir de là, on utilise la récurrence : la première approximation connue,

nous pouvons l’utiliser pour obtenir la seconde approximation, un peu plus
précise :
î/2(æ) = 2/1(x) = C + f F{yi{x),x)dx, (8.6)
J XQ
et ainsi de suite. Cette méthode s’applique de manière naturelle aux systèmes

d ’équations différentielles, où la fonction y{x) est remplacée par un vecteur et
le coté droit par une fonction vectorielle de même dimension.
4k E xem ple 1 L’équation de l’oscillateur harmonique, qui est du second
ordre, peut être remplacée par un système de deux équations de premier ordre :
d?x , d?x k O
= —k x -r-;r = ------X = —a> X
dt^ dt^ m
en introduisant la variable t = u t cette équation donnera le système :
dx dy
(8.7)
ou encore sous forme matricielle,
è (:)=(-! i) {;)■
( 8.8)
On aurait pu commencer les approximations avec des conditions initiales to

talement arbitraires, mais il est beaucoup plus pratique d’utiliser deux cas
particuliers, dont la solution générale sera une combinaison linéaire :
a) x(0) = xo = 1, 2/(0) = 2/0 = 0, ou bien b) x(0) = xo = 0, y{0 ) = yo = l.

Dans le cas a), la première approximation a la forme suivante :
dont la solution est x\ — l, yi = t . Notons en passant que, les condition ini

tiales étant déjà fixées par la solution d ’ordre zéro, les constantes d ’intégration
sont toujours nulles.
La deuxième approximation vérifie l’équation
dont la solution est

X2 = 1 — 2/2 —T.
2’
En continuant de la sorte, on trouvera
2:3 = 1 - y 2/3 = - r + y , + w = - ^ + -6 -
Petit à petit, on voit se dessiner deux séries infinies convergentes bien connues :
æ(r) = cos T , y{T) = —sin r.
On trouve aussi facilement la solution particulière correspondant aux condi

tions initiales préconisées par le cas b), xq = 0, 2/0 = 1 •
x{t ) = s in r , y{T) = COST.

La solution générale est une combinaison linéaire de ces deux solutions parti
culières, avec les mêmes coefficients que ceux utilisés pour exprimer les condi
tions initiales choisies en termes des constantes de base données par les choix
a) et b).
En revenant aux variables physiques, le temps t et la fréquence circulaire w,
les solutions seront légèrement modifiées ; on peut les écrire sous leur forme ex
plicite en introduisant l’amplitude A et la phase $ (constantes, bien entendu),
et n’utiliser qu’une seule fonction trigonométrique, par exemple le cosinus :
x = A sin(a;i y — Au: cos(wi -|- $). ( 8 . 11)
Il vient immédiatement que les deux fonctions sont liées par une identité tri
gonométrique :
^2 ,,2
y^
= 1, (8 .12)
A^ ^ A^d^
qui représente une ellipse dans le plan (x, 2/), appelé aussi l’espace des phases
du système. Un choix particulier de l’amplitude, dicté par les conditions ini
tiales, fixe une ellipse particulière. L’ensemble de toutes ces ellipses, cou
vrant toutes les conditions initiales, constitue l’ensemble des trajectoires de
8.3. METHODE DES ISOCLINES 311
F ig u r e 8.1 - P o r tr a it d e p h a se d e l ’o sc illa te u r h a rm o n iq u e
phase du système (en l’occurence, de l’oscillateur harmonique). La méthode

des approximations successives peut être appliquée à un système arbitraire
d’équations différentielles, pas forcément linéaires, mais les intégrales aux
quelles on aboutit sont souvent impossibles à effectuer de manière analytique
avec les fonctions élémentaires, comme dans l’exemple de l’oscillateur harmo
nique.
8.3 M éthode des isoclines

L’évolution temporelle de la plupart des systèmes physiques peut être
décrite en termes d’équations différentielles ordinaires du second ordre. L’illus
tration la plus simple est fournie par l’équation de second ordre pour une seule
fonction du temps x{t) :
(Px dx ^
L’équation ci-dessus correspond au cas le plus général ; nous allons considérer

ici surtout des exemples d ’équations autonomes, pour lesquels le coté droit de
(8.13) ne dépend pas du temps explicitement, mais uniquement à travers la
fonction / et sa dérivée première / '.
L’équation du second ordre peut être transformée en un système de deux
équations du premier ordre par une substitution standard :
(8.14)
Dans le cas d ’un système autonome nous pouvons éliminer la dépendance

explicite de t en divisant la seconde équation par la première, ce qui conduit
à une seule équation différentielle décrivant les trajectoires du système dans
son espace des phases (x,y),
¿ = F ( x .,). (8.16)
Le coté droit définit en tout point (x,y = dx/dt) de l’espace des phases la
pente de la trajectoire y{x) passant par ce point. Les pentes définissent un
champ vectoriel dans l’espace des phases. Les lignes joignant les points où la
pente prend toujours la même valeur s’appellent les isoclines (courbes de pente
constante). L’ensemble des isoclines, qui sont en fait des courbes intégrales du
système, forment son portrait de phase.
On peut généraliser notre analyse aux systèmes différentiels du premier
ordre, non nécessairement engendrés par une équation différentielle de second
ordre. On aura alors à étudier, dans le cas le plus complet, le système suivant :
^ = P ( .,y ). = Q{x,y). (8.16)

dt
Les variables ne se séparent pas en général, ce qui rend pratiquement impos
sible l’intégration analytique tout en laissant la possibilité d ’un traitement
numérique, qui n ’est pas notre propos ici. Très souvent toutefois l’information
la plus importante concerne le comportement asymptotique d ’un tel système,
autrement dit, vers quelles fonctions le système tend à converger au bout d ’un
temps suffisamment long. Pour le savoir, il suffit de connaître les trajectoires de
phase, semblables aux hodographes introduits dans le chapitre 1 ; ces trajec
toires peuvent être obtenues en résolvant l’équation différentielle vérifiée par
y en tant que fonction de x.
En effet, il suffit de diviser la seconde équation du système (8.16) par la
première pour obtenir l’équation des trajectoires de phase du système ;
Q{x,y)
(8.17)
dx P {x,y)'
Nous pourrions comprendre les propriétés essentielles d’un système différentiel
de manière qualitative rien qu’en analysant son portrait de phase. Voici com
ment se présente une telle analyse, sur un exemple aussi instructif qu’amusant.
4k E xem ple - L a sectio n d ’or.
Les grecs anciens considéraient le cercle comme étant la figure géométrique
la plus parfaite parmi les courbes fermées, l’ellipse occupant la seconde place
en termes de perfection. Parmi les triangles, la perfection revenait au triangle
équilatéral, le triangle isocèle étant le numéro deux. Parmi les rectangles, le
carré était le plus symétrique, bien évidemment ; et la seconde place ? - pour
les grecs, c’était le rectangle d’or, dont les côtés avaient la propriété suivante :
si les cotés du triangle sont o et 6 > a, en découpant d’un coté le carré a? on

laisserait un rectangle plus petit, dont les cotés seront 6 —a et a. Le rectangle
d ’or est celui pour lequel ce petit rectangle garde les mêmes proportions entre
ses cotés, il doit donc vérifier la condition suivante :
bb Ci • y0 1 9 ^
- = ------ , soit r —ab — = 0. (8 . 18 )
a b- a
Puisque l’échelle ne joue aucun rôle, ce qui nous intéresse est juste le rapport
entre les longueurs des deux cotés, b/a = r. Il vient alors en divisant cette
équation par a^, que r est la solution de l’équation
b O
-X ------- l = r 2 —T —1 = 0 . ( 8 . 19 )
a
L’équation (8.19) admet deux solutions, dont une seulement est positive, et
peut donc représenter la proportion cherchée :
\/5 ± l
n ,2 = — ^
Le rapport entre le grand et le petit coté du rectangle d ’or représenté dans la

figure (8.2) est donc
On trouve ce rectangle “parfait” dans les oeuvres architecturales de l’antiquité.
F igure 8.2 - Le rectangle d’or de cotés a e tb > a
dans les peintures de la Renaissance et, plus près de nous, par exemple dans
les cartes de crédit et autres cartes du même genre.
L’équation (8 .19 ) apparaît dans la série de Fibonacci, ^ supposée décrire
la croissance du nombre de lapins dans un élevage ou encore des branches des
arbres fruitiers. La loi produisant cette série, dite des nombres de Fibonacci,
est toute simple :
On+2 = 0^+1 + On. (8.20)
1. Fibonacci, ou Leonardo de P ise, de son vrai nom Leonado B onacci, (1170-1250),
m athém aticien italien connu pour la diffusion des chiffres hindous et arabes, auteur du livre
’’Liber A baci” {livre de calculs) en 1202.
Pour initier la série, il faut donc donner deux premiers termes, qui sont
ao = 1, ai = 1. Les termes suivants seront alors
a2 = l + l = 2, as = 1 + 2 = 3, 04 = 2 + 3 = 5, puis; 8, 13, 21, 34, etc.
Le rapport entre On+i et o„ tend vers le nombre d ’or r = 1.618....

En effet, la loi récurrente de Fibonacci peut être représentée en notation
matricielle :
C:::)=G
En commençant avec le vecteur ao = 0, ai = 1, on retrouve les vecteurs
successifs produits par l’action de la matrice de (8.21) formés avec les paires
des nombres de Fibonacci. La matrice définie dans (8.21) possède deux vec
teurs propres correspondant aux deux valeurs propres, solutions de l’équation
caractéristique
det ^ - A - 1 = 0, (8.22)
identique à l’équation déterminant la section d’or, ayant les mêmes racines ;
, l + \/5 , , 1-v ^
A i = r = — -— , A2 = 1 - t = — -— .
Les deux vecteurs propres vi et V2 vérifient par définition
M v i = AiVi, et M v2 = A2V2. (8.23)
où M est la matrice de Fibonacci définie dans (8.21). Tout vecteur choisi

comme initial est une combinaison linéaire des deux vecteurs propres de M,
notamment le vecteur définissant la suite de Fibonacci. On remarque que parmi
les deux valeurs propres trouvées, une est positive et plus grande que 1, tandis
que l’autre, A2, est négative et plus petite que 1 : Ai = 1.618..., A2 = —0.618....
C’est pourquoi le vecteur propre vi va être multiplié par r après chaque action
successive de la matrice M , pendant que le vecteur propre v i sera multiplié par
A2, donc divisé par —r (car 1 —r = —r~^). Nous aurons donc la combinaison
linéaire d ’une série géométrique grandissante, se comportant comme et
d ’une série géométrique alternée (dont le rapport est négatif), se comportant
comme (—r ) “ ^ . Au bout d ’un certain nombre d’approximations successives,
la part du premier vecteur propre deviendra prépondérante, et les rapports
consécutifs entre On+i et ün s’approcheront de plus en plus du nombre d ’or
T = 1.618... ; effectivement.
H = 2; I = 1.5; ^ = 1.666; | = 1.60; y = 1.625; ^ = 1.615, etc.

Nous remarquons l’influence de la valeur propre négative, dont la contribution

change de signe chaque fois, tout en décroissant rapidement.
Les valeurs propres Ai et A2 apparaissent comme solutions de l’équation
caractéristique d’une équation différentielle du second ordre, que voici :
(fix dx
(8.24)
duquel on peut passer à un système de deux équations du premier ordre :

dx dy
(8.26)
Si nous nous intéressons aux trajectoires plutôt qu’aux lois horaires explicites,
nous pouvons éliminer la dépendance du temps en divisant la seconde équation
pax la première :
1 = "^-
L’isocline correspondant à la pente nulle est donnée par l’équation y = —æ,
tandis que l’isocline de pente infinie (verticale) coïncide avec l’axe x (quand
y = 0). La direction dans laquelle la trajectoire est suivie dans le temps dépend
des valeurs des dérivées dx/dt et dy/dt en un point appartenant à l’isocline.
La pente de 45°, correspondant à la valeur 1 de la dérivée dy/dx, définit
une autre isocline intéressante. Dans l’exemple considéré ici, cela correspond
à la ligne droite définie comme suit :
^ - 1 i.e. = 1 x+y=y -¥ X = 0, (8.27)

dx ’
c’est-à-dire, l’axe vertical y.
Une autre isocline caractéristique est la ligne le long de laquelle le vecteur
[w> coïncide avec le vecteur tangent à elle-même. Dans ce cas nous devons
trouver une droite, y — A x sur laquelle on aura aussi dy/dx = A. L’équation
(8.26) devient alors
X -H Ax _ 1 + A
^ =A= (8.28)
dx y Ax A
Pour une telle isocline, on doit donc avoir A = (\ + A)/A., d ’où il vient que
A^ = l + A, ce qui coïncide avec l’équation définissant le nombre d ’or.
Il y a donc deux solutions donnant les isoclines le long desquelles la pente
est tangente à l’isocline elle-même :
y = TX et y = — X. (8.29)
T
F i g u r e 8.3 - Les isoclines de l’équation différentielle de Fibonacci et les trajectoires

dans l’espace des phases { x , y ) .
Les isoclines caractéristiques et le champ vectoriel les définissant dans l’espace

des phases, ainsi que les trajectoires (les courbes intégrales de notre équation
différentielle), sont représentées sur la figure (8.3) ci-dessous.
On comprend mieux le caractère asymptotique des solutions de ce système
différentiel en regardant les trajectoires sur la figure (8.3). L’unique p o in t s in
g u lie r (x, y ) = (0, 0) est un co l où se croisent deux trajectoires, convergente et
divergente suivant la direction.
La droite y = r x dans le premier quadrant (a: > 0, y > 0) définit le
comportement asymptotique de toutes les trajectoires qui partent des points
ayant leurs deux coordonnées x e t y positives, ce qui explique la limite du
rapport y : X k l’infini : y : x t.
On peut arriver à la même conclusion encore d’une autre manière. L’équation

(8.26) est homogène, c’est-à-dire indépendante de l’échelle choisie : elle garde
sa forme quand les deux variables x and y sont multipliées par un facteur com
mun. Cela suggère que l’on peut introduire une nouvelle variable “invariante” ,
^ = y/X. En l’utilisant, nous pouvons écrire
(8.30)
X X^
de sorte que
_ 1 dy y dx
(8.31)
dt X dt dt '
Maintenant, en substituant dx/dt = y et dy/dt = x + y, on obtient
Éi r2 (8.32)
dt X x^
Le graphe de la fonction 1 + ^ est représenté sur la figure (8.4) ci-

dessous. Les points singuliers où la dérivée de ^ s’annule sont donnés par
8.4. POINTS SINGULIERS. LINEARISATION 317
F i g u r e 8 .4 - P o in ts sin g u lie r s d e l ’é q u a tio n d ifféren tielle a v ec la se u le v a ria b le
les zéros du coté droit de l’expression (8.32). Leur caractère est déterminé par
la linéarisation de cette expression dans le voisinage immédiat de ces points.
Autour du point ^ = T, posons ^ = r + e{t) où e(i) est une variation
infinitésimale. Alors l’équation 8.32 devient
dp
— = 1 + (r + e) —(r + e)^ = (1 + r —r^) + e —2re — ~ (1 —2r) e. (8.33)
at
La solution de l’équation (8.33) est alors e(y) ~ exp{[l — 2r]i) ->• 0 quand
t oo puisque 1 —2r < 0 ; par conséquent ^ = r est un point singulier
attractif. De manière semblable, si l’on pose ^ = —( 1 / t ) + e au voisinage de
l’autre point singulier, l’équation linéarisée devient
f = l + ( - i + e ) - ( - i + £ ) 2 = ( l - i - ( i ) 2 ) + e + 2 e - e “ =; (l+ ? )e , (8.34)
at T T T T T T
ce qui veut dire que ^ = —1/ r est un point singulier répulsif puisque main
tenant e{t) —> oo quand t -¥ oo k cause du signe positif dans l’exposant de la
solution exponentielle e ~ exp{[l -I- f]i).
8.4 Points singuliers. Linéarisation

Dans la section précédente nous avons vu comment les systèmes de deux
équations différentielles, linéaires et à coefficients constants, engendrent les
équations des isoclines, dont les courbes intégrales dans le plan des variables
(æ, y) constituent le portrait de phase du système.
Les points où la dérivée dy/dx est indéterminée (parce qu’égale au rapport
entre deux zéros) correspondent aux points singuliers du système. Aux points
singuliers les vecteurs directeurs des trajectoires se confondent et on ne peut
plus déterminer leur direction.
La classification des points singuliers résulte du caractère des valeurs propres
de la matrice du système linéarisé au voisinage du point singulier en question.
Ces valeurs propres déterminent à leur tour le comportement des solutions, qui
peut être proportionnel à une fonction exponentielle croissante, décroissante,
ou encore oscillante.
Les deux figures ci-dessous en (8.5), représentent les isoclines autour d ’un
centre, ou point focal, dans deux systèmes de coordonnées, le premier corres
pondant au choix des vecteurs propres comme vecteurs de base, le second est
dans le système où la matrice de l’équation linéarisée n ’est pas diagonale. Un
point focal apparaît quand les deux valeurs propres sont imaginaires pures,
du type +iu et —iu>. On obtient le portrait de phase d’un nœud quand les
F ig u r e 8.5 - Les isoclines.
deux valeurs propres de l’équation caractéristique provenant de la linéarisation

autour du point singulier sont réelles. Dans la figure (8.6) on montre deux
F i g u r e 8 .6 - L es n œ u d s.
représentations d’un tel point singulier, appelé un nœud, tantôt en coordonnées

naturelles du système de départ, tantôt en coordonnées “rectilignes” après la
diagonalisation du système. Ici, les deux valeurs réelles sont négatives, ce qui
correspond à un nœud attractif.
Lorsque les valeurs propres sont complexes (avec deux valeurs complexes
conjuguées), on trouve un point focal. Suivant que la partie réelle est négative
ou positive, les trajectoires vont converger vers le centre, ou diverger à partir
du centre, comme l’on peut voir sur la figure (8.7), où l’image des isoclines
8.4. POINTS SINGULIERS. LINEARISATION 319
F ig u r e 8.7 - Point focal attractif.
F ig u r e 8.8 - Nœud répulsif et point focal répulsif.
F ig u r e 8.9 - Classification des points singuliers d ’une équation de second ordre
précède celles des deux représentations des trajectoires.

Tous les types de points singuliers sont représentés sur la figure (8.9).
8.5 Résonances. Méthode de Poincaré

Les systèmes périodiques, tels l’oscillateur harmonique sans frottement ou
encore le mouvement d’un satellite autour d’un astre central immuable, ne
sont qu’une idéalisation. Dans le monde réel, ces systèmes sont soumis aux
perturbations diverses, dont le point commun est une énergie relativement
petite par rapport à l’énergie totale du système (si tel n ’était pas le cas, le mot
même “perturbation” n ’aurait pas été approprié). De façon plus concrète, le
calcul des perturbations en mécanique s’applique chaque fois où le hamiltonien
du système prend la forme d ’une somme de deux termes, le hamiltonien non-
perturbé Ha(pi,q^) et le terme perturbatif avec eHi est très petit
(en termes d ’énergie) par rapport à H q.
Il paraît raisonnable d ’admettre que les solutions du système perturbé,
posé par le hamiltonien H = Ho + eHi, doivent avoir la forme d’une série (que
l’on espère convergente) de la forme
x{t) = xo(t) + exi{t) + 6^ X 2 { t ) + ....,
où xo(t), l’approximation d ’ordre zéro, est une solution exacte du problème

non-perturbé correspondant à la limite e -> 0.
Une étude systématique des perturbations a été menée par Henri Poin
caré ^ en fin du XlX-ème siècle. Il a rencontré à cette occasion quelques
problèmes spécifiques, notamment l’apparition de termes pouvant compro
mettre la convergence de la série d’approximations, et il a trouvé comment
s’en débarrasser. Nous pourrons suivre son raisonnement sur un exemple rela
tivement simple : l’oscillateur au ressort “mou” , rendant l’équation dynamique
légèrement non lináire.
Considérons l’oscillateur dont le mouvement suivant l’axe Ox est donné
par l’équation de Duffing
d^x ,. _ O,
m -f k{x - ^x^). (8.35)
En introduisant les notations
= u)l, = e.
m
on peut écrire la même équation sous une simple forme
d'^x O O
(8.36)
2. Henri Poincaré, (1854-1912), un des plus grands m athém aticiens français. Ses travaux
en m écanique céleste ont perm is de mener brillam ent les calculs de perturbations. A établi
le groupe de sym étrie des équations de M axwell.
8.5. RESONANCES. METHODE DE POINCARE 321
Dans la limite e = 0 la solution générale est bien connue et peut être écrite
souls la forme
XQ — A cos(woi + </>),
l’amplitude A et la phase $ étant déterminées par les conditions initiales
imposées à la solution, x q { 1 = 0) = j4 c o s $ , x o { t = 0) = —wo-Asin^.
Ajoutons maintenant à cette solution de base une série des perturbations,
en ordre grandissant de puissances du petit paramètre e :
x{t) = A co s ( w qî + </•) + e æ i ( i ) + X2 {t) + .... (8.37)
et insérons cette série dans l’équation (8.36). La partie principale, ne contenant

pas de paramètre e (on peut dire, à l’ordre 0 en e), s’annulera puisque elle
vérifie l’équation d ’oscillateur harmonique non-perturbé, de fréquence wq. Les
termes non-nuls commenceront alors à partir des termes linéaires en e, puis
quadratiques, etc. Voici le résultat de ce développement en série :
e [xi + Wqæi - a:o] + [x2 + Wq^2 - SxqXi ] + [xa + Wq2:3 - x? - 3xqX2] + ...
(8.38)
Nous avons donc une série d ’équations différentielles dont le coté droit repro
duit l’équation de l’oscillateur harmonique de fréquence wo, où seule l’équation
d ’ordre zéro est homogène, les suivantes ayant aussi un terme non-homogène,
jouant le rôle d’une force extérieurs, et construit avec les solutions obtenues
aux l’ordres précédents :
Ordre €° : xq + coq x q = 0, Ordre : Xl + U ^X l= Xo,
Ordre : ^2 + u^q X o = 3 x o X i, (8 .3 9 )
et ainsi de suite. Avec les données initiales fixées, on trouve l’unique solu
tion à l’ordre zéro, xo = A cos(u>ot -|- <f>), que l’on peut insérer dans l’équation
vérifiée par x i. Notons en passant que, les conditions initiales déjà satisfaites,
on cherche la solution xi(i), comme d ’ailleurs toutes les approximations sui
vantes, comme solution particulière de l’équation non-homogène. Au premier
ordre en e nous voulons donc résoudre l’équation suivante :
A3 3A3
Xl + u>
q Xi = A^ cos3(wot + cos(3(woi + <^)) + cos{u>t -h (j)). (8.40)
Et c’est ici que nous rencontrons le premier écueil : la résonance, du fait

d’un terme contenant la fonction trigonométrique de la même fréquence que
la fréquence de base de l’oscillateur harmonique à gauche. Dans notre cas, il
s’agit de la fonction cos(a>ot-f-<^). S’il n ’y avait que le fonction avec la fréquence
triple, cos(3wqî + 3^), la solution particulière avec second membre aurait la
même forme, soit C cos(3wo + ^<j>) Insérée dans le coté gauche, cette fonction
donnerait
—9w2 C cos(3o;ot - 3<^) -Y-uP'C cos(3a»oi —3(/>)
= —8^2 c cos(3woi —3(/>) = — cos(3(wot + 4>))i (8.41)
et la solution unique s’obtient avec C = Â 3

^2 •
Mais quand le terme non-homogène est de même fréquence, la fonction
C'cos(woi + <^) ne peut pas vérifier l’équation avec un second membre différent
de zéro ; on sait bien que dans ce cas, la solution non-triviale est une fonction
trigonométrique de la même fréquence, mais multipliée par t. Dans notre cas
précis, la solution unique de léquation avec second membre
3i4.^ 3./4.^
Xi + J q X\ = co s{u o t + <p) = — co s{u )t -h <f>)
est
®l(^) = Zo----
Uq ^ cos(wo + )-
On appelle une telle solution terme séculaire car elle croît linéairement avec
le temps. Il est évident qu’une telle solution n’est pas acceptable dans le
cas d’un système conservatif, dont l’énergie est strictement conservée. Notre
méthode d’approximations successives doit être modifiée afin d’éliminer les
termes séculatires, qui d ’ailleurs risquent d ’apparaître dans les ordres suivants
d’approximation.
Poincaré a compris en quoi consistait l’erreur : il n’y a pas de raisons de
garder la même fréquence de base, car la perturbation doit l’influencer aussi.
Le développement de la solution en série des puissances x{t) = xo{t) + exi{t) -f-
e^X2 {t) + ... doit être accompagné par le remplacement de la fréquence de
base wo dans la solution cherchée par w, donnée comme développement en
puissances de e :
w = wo + ewi -h e^W2 + ••
Il faut donc développer en série de puissances du petit paramètre e l’équation
que voici :
x + (J^X —ex^ = xq + exi + X2-\-...
-t-[wo + e(2wowi) -t- e^...][æo + exi -h eâ;2 +..] - e[æo + e(3æoa:i) -H..] = 0 (8.42)
En regroupant les termes avec les mêmes puissances de e, on trouve à présent
une nouvelle série d’équations :
ordre e® : xq + ujqXo = 0 (sans changement).

8.5. RESONANCES. METHODE DE POINCARE 323
ordre : x\ + coqxi = Xq + 2woWi xq,
ordre : ¿2 + Wq = 3æoa;i + (u>i + 2wqW2) xq + 2wqwi æi, (8.43)
et ainsi de suite. On voit qu’à tout ordre en e on obtient l’équation de l’os

cillateur harmonique de fréquence wo avec second membre contenant les so
lutions obtenues en approximation précédente : æo(i) pour l’ordre e, xq et xi
pour l’ordre e^, etc. Les nouvelles inconnues, autrement dit les corrections
successives modifiant la fréquence de base, seront fixées grâce aux équations
supplémentaires assurant la suppression des termes de résonnance.
Prenons donc comme solution de base, vérifiant l’équation d’ordre zéro, la
fonction
xo{t) — A cos{u>ot + (l)) — A cos«,
avec une notation abrégée en posant partout u = Mot + </>. La première ap
proximation donnera alors
3j4®
¿éi +U0X1 —A^ cos®U+ 2u)oMi cos u = ^ cos 3« -I- cos u -|- 2uou>iA cos u. (8.44)
4 4
La suppression du terme indésirable se fait en fixant la valeur de u>i :
wi = (8.45)
8mo ’
laissant seule l’équation de l’oscillateur harmonique avec un second membre

de fréquence triple, donc admettant une solution parfaitement bornée,
A^
avec CO= Mo + Mi =Mo —

Le fait que la fréquence modifiée soit inférieure à la fréquence de base
de l’oscillateur non-perturbé est en accord avec l’intuition physique. En effet,
notre équation décrit le comportement de l’oscillateur avec un ressort mou, qui
faiblit avec l’amplitude grandissante. Cependant, la fréquence d ’un oscillateur
mécanique est proportionnelle à la racine carrée du module d’élasticité k;
donc, plus ce module est faible, plus la fréquence diminue.
Nous avons délibérément remplacé coq par co dans l’argument du cosinus,
car la différence ne peut se faire sentir qu’à l’ordre suivant en puissances de e.
Avec les solutions xq et xi trouvées, on pourra attaquer l’approximation
d ’ordre deux en les insérant dans la troisième équation du (8.43).
8.6 Méthode stroboscopique

On a souvent affaire à des systèmes quasi-périodiques, qui reproduisent
leur état initial au bout d ’un temps T qui n ’est pas une constante, mais dont
la variation temporelle est très lente comparée à la vitesse de variation du
système. Les équations différentielles régissant le comportement dynamique
de tels systèmes sont toujours proches de celles d ’un oscillateur harmonique,
ou d’un système d ’oscillateurs harmoniques, modifiées par des termes pouvant
être considérés comme petits par rapport aux amplitudes et fréquences du
système non-perturbé.
X + u)qX = eF{x, x). (8.46)

Cette équation du second ordre est équivalente aux deux équations du premier
ordre :
x = y, ÿ = -U qx + eF{x, x ) . (8.47)
En l’absence de toute perturbation (e = 0) la solution est bien connue ;
X = A œs{u>ot + $), y = —A(jJq sin(a>ot + ^). (8.48)
Les constantes A (amplitude) et $ (phase) sont déterminées à partir des condi

tions initiales. En remplaçant dans le système (8.47) les constantes A et $ par
les fonctions A{t) et $(i), on obtient le système suivant :
dA - . r,
— œ s p - A — sm p = 0,
dut dut
- ^ sin —A ^ CO&S = e F{A cos fi, Awo sin fi) (8.49)
(où nous avons posé fi = ujot + $ pour abréger la notation).

En multipliant la première équation par sin fi et la seconde par cos fi puis en
les additionant on élimine À ; et, en multipliant la première équation par cos fi
et la seconde par sin/3 puis en les soustrayant, on élimine $. Les équations
prennent maintenant une forme plus symétrique :
dA
- 7- = —eF{Acosfi, —AuJosinfi) sin.fi,
dt
^ = —^ e F { A c o s fi,—Awosinfi) cos fi. (8.50)

dit Æ
L’idée maîtresse de la méthode stroboscopique est de prendre les moyennes sur
une période des expressions à droite dans le système (8.50). Les variations de
8.6. METHODE STROBOSCOPIQUE 325
A et de $ étant supposées très lentes, au bout d ’une période le système se

trouvera très près de la condition initiale ; l’effet de la perturbation peut être
alors remplacé par l’effet produit par sa moyenne sur la période. Le système
“moyennisé” est donc comme suit ;
e /-^
= —— / F (A co s0 ,—Aujosin^) SïïiPdt,
dt T Jo
E 1
= ——— / F{AcosP,—Awosia^) cospdt, (8.51)
dt 1 A Jo
En changeant la variable d ’intégration par la substitution u = uot + $ nous
obtenons la forme standardisée de ces équations, bien plus adaptée à l’étude
des systèmes périodiques :
^ ^ Jq” F {A cosu,—A aJqsin u) sin vdu,
W ~ r2n F {A cosu,—Auosinu) cos udu. (8.52)
Pour voir cette méthode “en action” , nous allons l’appliquer à l’équation
différentielle décrivant un oscillateur harmonique soumis à une action extérieure
similaire au frottement négatif. Il s’agit d ’un apport d’énergie auto-modulé,
caractéristique des systèmes électroniques destinés à l’émission d ’ondes radio.
En variables réduites cette équation s’écrit
(Px
+ x = e -1 -h a ( l -I- Aæ - a;2)] ^ (8.53)
dr"^
En insérant la forme spécifique de la fonction F{x, y) dans les équations (8.52),
nous obtenons les deux intégrales suivantes :
^ f [(—1 -h o:(l-h AAcosw —.A^cos^ti))vlsinu] sinti du,

dt 2tt Jo ^ ^
= ~ 2^ j Ai4cosu —A “
^ cos^ u)) A uo sinuj cosu du.
dt
^ ° (8.54)
La seconde intégrale résulte en zéro puisque la fonction intégrée est impaire
entre 0 et 27t ; en revanche, la première intégrale n ’est pas nulle. Voici le résultat
de la “moyennisation stroboscopique” :
^ _ dA_ A A^
a — 1 —a —- (8.55)
dt dt 2 4
Nous voyons donc que la phase $ reste constante, ce qui veut dire qu’elle
peut être annulée par un choix d’origine de la variable i, soit une simple
translation dans le temps. L’amplitude A vérifie une équation différentielle du
premier ordre, non-linéaire, présentant quelques solutions singulières corres
pondant à l’annulation de la dérivée temporelle de A. L’annulation du coté
droit de l’équation définissant la dérivée première de A^ (8.55), produit deux
solutions :
G[A) = à A^ û: — 1
a —1 —a = 0 A = Al = 0, ou A = A2 = 2
a
correspondant aux valeurs stationnaires de A pour lesquelles l’amplitude reste
constante dans le temps.
Pour savoir s’il s’agit d ’un point stable ou instable, il convient de trouver
la valeur que prend la dérivée de la fonction G{A) par rapport à la variable A
au point singulier considéré. Si cette dérivée est positive, le point singulier en
question est répulsif (toute variation de .A à partir de ce point aura la tendance
d’augmenter exponentiellement avec le temps) ; si cette dérivée est négative,
nous avons affaire à un point stable, car toute variation de A à partir de cette
valeur aura la tendance à décroître exponentiellement.
Dans notre exemple, les propriétés de stabilité de nos deux points singuliers
dépendent de manière cruciale de la valeur du paramètre a.
a) a < 1. Dans ce cas, le seul point singulier se trouve en A = 0. La
dérivée de la fonction G{A) en A = 0 vaut (ce —l )/2 < 0, ce point est donc
stable, il s’agit d’un point focal attractif et toutes les trajectoires sont en forme
de spirale pour aboutir en A = 0.
b) o: > 1. Dans ce cas, il existe deux solutions :
= Al = 0, et A = A2 = 2 \l - —
V a
Le point à l’origine est à présent répulsif (instable), car dG/dA = ( a —1)/2 > 0.
En revanche, A = A2 correspond à une valeur de A stable car on a
U=A2= - a -h 1 < 0.
dA
Toutes les trajectoires (en forme de spirales) convergent vers le cercle A = A2
que l’on appelle cycle limite stable. Cette situation est représentée sur la figure
(8.10) ci-dessous.
D’autres situations sont possibles, par exemple un cycle limite répulsif
(donc instable), ou encore un cycle limite semi-stable, attractif du coté extérieur
(valeurs d’amplitude plus grandes que celles du cycle), mais instable vers
l’intérieur (valeurs de l’amplitude plus petites). Ces deux cas sont aussi illustrés
sur la figure (8.10) ci-dessous.
8.7. PHÉNOMÈNES QUASI-PERIODIQUES 327
F ig u r e 8.10 - Cycles limites : stable, répulsif (instable) et semi-stable
8.7 Phénomènes quasi-périodiques

Considérons le système d ’équations dit de Volterra^ régissant les nombres
d ’individus appartenant à deux populations, proies (par exemple des lapins)
et prédateurs (par exemple des renards). Soit Ni{t) le nombre de lapins dans un
écosystème isolé, et soit N 2 {t) le nombre de renards dans le même écosystème
à la date t. Les équations de Volterra sont alors :
dNi dN2
= cciiVi —P1 N 1 N 2 , = —CX2 N 2 + P2 N 1 H21 (8.56)
dt dt
Tous les termes ont une interprétation claire : en l’absence des prédateurs, les
lapins herbivores se multiplient avec un taux constant, proportionnellement
à leur nombre donc exponentiellement, d ’où le terme positif a iN i ; mais leur
nombre diminue en présence des prédateurs proportionnellement au nombre de
ces derniers et au nombre total des lapins, d ’où le terme négatif —P1 N 1 N 2 . Le
nombre de renards qui se nourissent de lapins diminue exponentiellement en
l’absence totale de la proie, d ’où le terme négatif —0:2^2 ; finalement le nombre
de renards augmentera proportionnellement à l’abondance de la proie, d ’où le
terme positif P2 N 1 N 2 .
Malgré la simple apparence de ce système d ’équations, leur solution ana
lytique n ’est pas connue ; il faut nous contenter d’une analyse quantitative.
En multipliant la première équation du système (8.56) par ^ 2 et la seconde
par /3i puis en les additionnant, on obtient :
/3 2 ^ + - a2l3iN2. (8.57)
dt dt
En multipliant la première équation par cxi et en divisant par iVi, et en multi
pliant la seconde équation par a 2 et en la divisant par iV2, puis en additionnant
3. V ito Volterra, (1860-1940), m athém aticien italien connu pour ses travaux sur les
équations intégro-différentielles e t sur la dynam ique des populations.
les résultats, on trouve :
dNi
1
+ = ai^2Ni - a20iN2. (8.58)
°‘^Ni dt ' '~"N2 dt
En comparant (8.57) et (8.58) on obtient
^dNi ^ ^ dN2 ^ I dNi ^ 1 dN2

(8.59)
dt dt dt “ îV2 dt
cette équation peut être intégrée immédiatement :
P2 N 1 + P1 N 2 —0!2 log N 1 - ai log N 2 = 0 = Const. (8.60)
En séparant les variables N 1 et N 2 , on peut écrire la même relation comme

suit :
^ - oc2^02Ni ^ (8.61)
Pour mieux explorer les propriétés de la solution, introduisons les variables

auxiliaires,
X = et y = iVf“2e^2JVi^ Y = CX.
Dérivons X par rapport à son argument N 2 et Y par rapport à N\. On obtient
= {aiN ^^-^ - îN ^^) ^ = (a2N^^~^ - ^2N?^)

dNi
d’où il vient que les zéros de ces deux dérivées correspondent aux valeurs
suivantes de N\ et N 2 :
dX ^ ai
= 0, ^ ATi = (8.62)
dNi P2 ' 1n 2 ~ ^~T i
Pour la fonction X {N 2 ) il s’agit d ’un maximum, tandis que pour la fonction
Y{Ni) il s’agit d ’un minimum. La variation des deux fonctions est montrée
dans la figure (8.11).
Ni • f ®® A T , 0 A i, + «
» " ‘ - s
dY dX
0 + + 0 -
dNi dN^
Y H-ooN^mîny^ -h®® X 0 /^ m a x \0
F ig u r e 8.11 - Le comportement qualitatif des fonctions Y{Ni) et X{N 2 ).

8.7. PHENOMENES QUASI-PERIODIQUES 329
Sur la figure (8.12) nous avons traoé quatre axes représentant quatre va
riables differentes : X, Y, Ni et N 2 . Dans le premier quadrant (X, Y) traçons la
droite y = e x , qui détermine la solution de manière implicite. Dans les qua
drants (N i,Y ) et (X ,N 2 ) on peut représenter les fonctions Y{Ni) et X {N 2 ),
avec un minimum pour Y et un maximum pour X .
En choisissant un point sur la droite Y = C X , on peut trouver les points
sur les courbes X (N 2 ) et Y{N \) qui lui correspondent, par une projection
orthogonale représentée par les droites en pointillé. Remarquons en passant
que chaque point sur la droite Y = C X engendre deux points sur chacune
des courbes dans les quadrants (Y, N 1 ) et (X, N 2 ). En projetant ces points sur
le quatrième quadrant, (N i,N 2 ), on reconstruit petit à petit les trajectoires
dans l’espace des configurations (N i,N 2 ). Les courbes obtenues sont fermées,
ce qui prouve que la dépendance en t des deux fonctions Ni(t) et N 2 (1 ) est
périodique, bien qu’elle ne s’exprime pas à l’aide des fonctions élémentaires
(trigonométriques).
F ig u r e 8.12 - Construction des trajectoires de phase pour le problème de Volterra
F ig u r e 8.13 - Une solution type du système d’équations de Volterra
La figure (8.13) représente l’allure des fonctions Ni(t) et rendant

compte de l’évolution temporelle des deux populations, prédateurs et proies.

Des équations du même type apparaissent également dans des problèmes
liés à la cinétique chimique, quand plusieurs réactions de synthèse peuvent co
exister dans la même solution ; ou encore dans des problèmes d ’agglomération
de molécules ou de nano-structures. Dans ce genre de problèmes, les fonctions
étudiées sont les probabilités de collisions (ou de “rencontres” , tout comme
celles utilisées dans le système de Volterra entre les individus appartenant à
l’une ou l’autre l’espèce). Les coefficients devant les combinaisons quadratiques
peuvent alors dépendre de la température ou d ’autres paramètres caractérisant
les conditions dans lesquelles le processus d ’agglomération a lieu.
Dans le cas le plus simple de deux équations différentielles non-linéaires,
avec deux fonctions inconnues, la linéarisation autour d’une solution singulière
résulte en un système d ’équations différentielles linéaires, la dérivation s’ap
pliquant à un vecteur ayant deux composantes, et étant équivalente à l’ac
tion d ’une matrice constante 2 x 2. Le caractère du point singulier est alors
déterminé par les valeurs propres de la matrice. Nous nous proposons d ’étudier
cette technique sur l’exemple suivant.
^ Exemple : agglomération des polygones dans un plan
Considérons le plan euclidien dans lequel évoluent librement des poly
gones équilatéraux pouvant adapter leur forme en déformant leurs angles (tout
en restant convexes). On suppose que ces polygones ont tendance à se coller
les uns aux autres par leurs côtés, en formant tout d ’abord des doublets, puis
des triplets, et ensuite des structures plus étendues. On peut paver le plan
O
F ig u r e 8.14 - Agglomération de polygones équilatéraux avec 5,6 ou 7 côtés.
avec des hexagones réguliers formant un réseau cristallin à deux dimensions,

mais si l’on remplace un hexagone par un pentagone un défaut angulaire est
créé, car l’angle naturel au sommet d ’un pentagone vaut 37t/5 = 108° et non
pas 120° comme c’est le cas de l’hexagone. Le défaut angulaire total vaut —tt,
puisque la somme des six angles d ’un hexagone vaut 47t, tandis que celle des
angles d’un pentagone vaut 37t. Un heptagone à la place d ’un hexagone crée
un excès angulaire de grandeur égale, car cette fois la somme des angles d ’un
8.7. PHENOMENES QUASI-PERIODIQUES 331
heptagone est 5tt, soit Stt —47t = + 7r.

Un pentagone crée une courbure locale positive, tandis qu’un heptagone
crée une courbure négative ; mais les deux se compensent mutuellement. C’est
pourquoi nous pouvons paver le plan avec pentagones et heptagones réguliers,
pourvu que leur nombre soit égal, et avec un nombre arbitraire d’hexagones,
comme le démontre la figure (8.15) ci-dessous :
F ig u r e 8.15 - Pavage du plan régulier obtenu exclusivement avec des hexagones;

pavage irrégulier obtenu avec trois types de polygones, 5,6 et 7.
La création d’une courbure locale a un coût énergétique certain. L’hy

pothèse physique la plus simple est de supposer que l’énergie nécessaire à
l’insertion d’un “intrus” parmi les hexagones est à peu près la même, qu’il
s’agisse d’un pentagone ou d ’un heptagone.
En supposant que les mouvements des polygones présents dans le plan sont
aléatoires, les probabilités des rencontres binaires doivent être proportionnelles
aux produits de leurs quantités respectives. Soient N 5 , N q et N 7 les nombres
de pentagones, hexagones et heptagones présents sur le domaine borné choisi
du plan ; soit N = N 5 + N q+ N j leur nombre total. La probabilité de rencontrer
un polygone de type k (nombre de côtés = k) sera alors P^ = Nk/N. La somme
des probabilités est normalisée à 1 : P5 + Pq + Pj = 1, il ne reste donc que
deux variables indépendantes, que l’on peut choisir arbitrairement ; choisissons
donc P5 et P 7 , et Pe = 1 ~ P5 —Pr-
Il y a encore une subtilité que nous allons exposer mais ne pas prendre
en compte afin de ne pas alourdir la présentation. En supposant que tous
les cotés des polygones sont de même taille et parfaitement équivalents, il
reste néanmoins que la probabilité de formation d’un doublet composé de
deux pentagones est proportionnelle au produit des nombres de côtés, soit 25,
tandis que la probabilité de collage d ’un pentagone à un hexagone (ou vice
versa) est proportionnelle à 2 x 30, etc.
Dans ce qui suit nous présentons un modèle simplifié, ne tenant compte que
des facteurs 2 provenant de la symétrie d ’échange lorsqu’on considère la ren
contre des deux polygones différents. En revanche, nous tiendrons compte de
l’existence de barrières énergétiques, (interprétées souvent comme une sorte
d ’aiRnité chimique), favorisant la réaction de collage quand la barrière de

potentiel est basse et rendant le collage peu probable lorsqu’elle est haute.
L’influence des barrières énergétiques est prise en compte par les facteurs de
Boltzmann, comprenant aussi la température à laquelle est soumis l’ensemble
des molécules pendant le processus d ’agglomération. Afln de simplifier notre
modèle, nous supposerons que les barrières énergétiques sont proportionnelles
à la courbure locale créée par l’adjonction de tel ou tel polygone : pas de
barrière de potentiel pour la création des couples (6 + 6) ou (5 + 7), un coût
énergétique A E pour la création des couples (5 + 6) ou (7 + 6), et une hauteur
de barrière énergétique double 2AE pour les paires créant une courbure très
concentrée (positive ou négative), dans le cas (5 + 5) ou (7 + 7). Ainsi les
probabilités de création de chacun des doublets sont de la forme :
AK
P 55 P g V -^ , F56 ~ 2Pf,P&e' kT . P57 ~ 2P5P7,
AK 2AE
Pee ~ P q 1 P & î ~ 2 P Q P je Tt . P77 p 2e - ^ . (8.63)
Le facteur 2 apparaît pour les doublets formés par deux polygones différents,
car on doit compter par exemple les couples (5+7) comme les couples (7+5), à
la différence d’une seule apparition quand les deux polygones sont identiques.
En l’absence de barrières énergétiques différentes pour des couples différents,
tous les facteurs de Boltzmann deviennent égaux à 1, et la somme de toutes
les probabilités des doublets est égale à 1, car les probabilités Pfc, (fe = 5 ,6,7)
de départ étaient déjà normalisées :
1 = (P5 + Pe + P7)2 = p2 + 2 P 5 P 6 + P | + 2 P e P r + 2 P 5P 7 + P ^
Mais avec la prise en compte des barrières énergétiques, nous devons normaliser
les expressions (8.63) afin qu’elles puissent représenter les probabilités. Le
facteur normalisant, noté Q, sera donc la somme de toutes les expressions :
O 2AE AK
A E O AE o 2AE
Q = p2e--fc5- + 2P5P6e--ST + 2P5P7 + P | + 2P&P7e~i^ + P ^ e - w (8.64)
et l’on arrive aux probabilités normalisées d ’apparition des doublets

J. O 2AE 2« AK „ 2
P55 = -p^P^^ ) -P56 = -prP^Pee kT , P57 =
Q'
AE _ ^ -n2
P66 = ^ P |, P67 = ^ P e P r e - ^ , P77 = -^Pê-^W, (8.65)
4. Ludwig B oltzm ann, 1844-1906, physicien autrichien, fut le véritable père de la physique
statistique. Défenseur de l’hypothèse atom ique, il est l ’auteur d ’un théorèm e sur l’accroisse
m ent de l’entropie, portant son nom.
8.7. PHENOMENES QUASI-PÉRIODIQUES 333
qui assurent la normalisation
P55 + P56 + P57 + -Рбб + Рб7 + P77 —!•

La distribution de probabilités des polygones au sein des doublets formés par
agglomération n’est pas forcément la même que dans le milieu ambiant, où elle
était donnée par les probabilités P5, Pq et P7 = 1 —P5 —Pç. On peut évaluer
( 1)
les nouvelles distributions, notées P), (fe = 5 ,6,7), en formant les expressions
suivantes :
(1) 1 (1) 1 (1) (1) (1)
i *5 = 2 (2^55 + P56 + P5 7 ) ) Р б = 2 (Рьб + 2 Рбб + Рб?) í Р 7 = 1 - Р 5 —Рб-
Au cours de l’agglomération, due habituellement à une baisse de la température

suffisamment lente si l’on compare sa dérivée temporelle dT/dt à la vitesse des
processus de création des doublets, les deux “populations” des polygones isolés
et des doublets, coëxistent. On peut introduire un paramètre s mesurant la
progression de l’agglomération qui varie de 0 à 1, permettant de définir les
probabilités moyennes évoluant au cours du processus d’agglomération :
( 1)
Pfc(^) ~ (1 ~ Pk S Pk (8 .66)
En dérivant par rapport au paramètre s, on obtient un système d ’équations

différentielles du même type que les équations de Volterra. Afin de simplifier
l’écriture, on a noté A E /k T = a :
Pse-2“ + (1 - P5 - P7)e -“ + P7 - Q
ds Q
dP7
P7C-2“ + (1 _ P5 - P7)e -“ + P5 - Q (8.67)
ds Q l
avec Q donné par (8.64) et Pe = 1 —P5 —P7.
On peut dire qu’il s’agit d ’une approximation linéaire du processus d ’ag
glomération, le “premier pas” , en quelque sorte. Mais déjà à ce stade, les ten
dances principales peuvent être mises en évidence grâce au portrait de phase
du système.
Les points singuliers correspondant aux solutions constantes, où les deux
dérivées s’annulent simultanément, se trouvent aux sommets du simplexe des
probabilités :
A: Pr = l, P5 = 0, Pe = 0; P : Pe = 1 P5 = P7 = 0;
C7 : P5 = 1, P7 = 0, Рб = 0; ( 8. 68)
un autre sur le côté AC
D: P^ = Pt = - (P 6 = 0 ), (8.69)
et le cinquième à l’intérieur du triangle :
1 1 —e‘
El Ps = Pe = Pr = l - P 5 - P e = (8.70)
3-e- «rv’
3 - e -— 3 - e -û ^
Pour déterminer le caractère d ’un point singulier donné, il faut linéariser le
système diflférentiel (8.67) au voisinage de la solution singulière en question.
Prenons comme exemple le point C et posons P5 = 1+e, P7 = rj, Pq = —{e+rj).
Le système linéarisé devient alors
Ü H i ;)(;)• (8.71)
Les valeurs propres sont Ai = 1 et A2 = 2, toutes les deux positives, et les

vecteurs propres correspondants sont [1, —1] et [1, 0] ; le point singulier C est
donc répulsif.
Il est facile de constater, avec la même méthode de linéarisation, que le
point A est aussi répulsif, les points B et D sont attractifs, et le point E à
l’intérieur du triangle est un point en selle (avec une valeur propre positive, et
une autre négative).
F i g u r e 8.16 - Deux portraits de phase du système (8.67), correspondant à deux

valeurs différentes du paramètre a.
Les points singuliers des systèmes à deux dimensions peuvent être dotés
d’un indice caractéristique, appelé aussi Vindice d’Euler. Il est égal au nombre
de tours que fait le vecteur tangent (dans le sens positif, c’est-à-dire contre
le sens des aiguilles d ’une montre) pendant que l’on fait un tour autour du
point singulier. On voit assez facilement que l’indice d ’Euler vaut +1 pour les
8.8. PROBLEMES 335
points focaux, y compris les points focaux attractifs et répulsifs, et —1 pour

un point en col. Euler a prouvé le théorème portant son nom, stipulant que la
somme des indices caractérisant tous les points singuliers d ’un champ vectoriel
sur une surface est égale à un nombre fixe appelé la caractéristique d’Euler-
Poincaré qui ne dépend que de la topologie de la surface et ne change pas avec
les déformations continues.
La caractéristique d’Euler-Poincaré de la sphère vaut 2, celle d ’un tore
vaut 0. C’est pourquoi on peut “peigner” un tore, i.e. créer un champ partout
lisse sans singularités, avec les courbes intégrales parallèles (par exemple, les
“méridiens”), mais on ne peut pas “peigner” une sphère sans y créer deux
points singuliers, ce que nous pouvons constater en regardant les parallèles et
les méridiens sur un globe.
8.8 Problèmes
Problème 8.1. - Approximations successives
Le problème de Kepler a été traité par méthode de Lagrange dans le cha
pitre 2. On pourrait dire que la solution complète a été obtenue, du moins la
trajectoire est connue de façon précise sous forme d ’une conique exprimée sous
la forme r = r{(p). La situation avec la loi horaire est moins brillante : certes
on a une intégrale, mais on ne sait pas l’effectuer analytiquement (il s’agit de
l’intégrale dite elliptique, tabulée, mais sans expression analytique utilisant les
fonctions élémentaires). Mais même en connaissant cette intégrale on est loin
du but, car elle donne la dépendance du temps t en fonction de r, et non r{t)
et ip{t), fonctions directement observables.
Nous pouvons cependant tenter de trouver les fonctions r{t) et (p(t) de
manière explicite, mais approchée (on ne peut pas gagner sur tous les ta
bleaux !) comme nous allons le voir. Voici cette méthode : nous allons partir
d ’une solution explicite bien connue : une orbite circulaire parcourue avec la
vitesse angulaire constante. On posera donc :
r = R = const., if = ait, (8.72)
Pour que ce choix soit une solution, il faut que les fonctions r et ¡p vérifient
les équations d ’Euler-Lagrange obtenues à partir du lagrangien suivant :
mr^ m r‘^(p^ mM G
Les équations de Lagrange correspondant aux variations indépendantes de r

et de q>sont :
d?r (d p
i dip\^ mM G
m + = 0,
di2 ^ ‘^ \ d t
.)(P(p ^ dr d(p
(8.74)
En insérant la solution particulière (8.72) dans les équations du mouvement

(8.74), on trouve que la seconde est vérifiée automatiquement, car ici (^ = 0
et r = 0, tandis que la première équation se réduit à une relation nécessaire
entre R e i (jj :
MG ^ O MG O 47t2
Rw^ p>3 ^ J72 > (8.75)
R?
ce qui donne la troisième loi de Kepler dans le cas particulier d ’une orbite
circulaire : le cube du rayon de l’orbite est proportionnel au carré de la période.
Les préparatifs terminés, nous pouvons commencer la recherche des solu
tions approchées, en posant
r{t) = R + e n r { t ) b r { t ) + ..., (p{t) = ut en^{ t ) - \ - b^{ t ) - \ r ... (8.76)
a ) Développer tous les termes apparaissant dans les équations (8.74) en séries
de puissances du petit paramètre e, et en les multipliant regrouper les termes
en puissances successives ; e° (solution de départ, vérifiée par hypothèse), puis e
et e^. Ne pas oublier de simplifier par m, facteur désormais inutile, et d ’utiliser
l’identité (8.75) pour éliminer MG/R? au profit de
b ) Etablir les équations différentielles pour les corrections du premier ordre,
rir{t) et n^{t). En admettant que tout système linéaire conduit aux solutions
exponentielles de type remplacer les dérivées première et seconde par les
mêmes fonctions multipliées par A ou A^, selon le cas :
Tif. An^, Tif. A Ttf., Ti(p ^ A 7l^p.
Écrire ces équations sous une forme matricielle.
a b
(8.77)
c d) i z ) -
avec les entrées a, b, c, d exprimées en fonction des paramètres de l’orbite non-
perturbée, R et u.
c) Écrire l’équation caractéristique en demandant l’annulation du déterminant
de la matrice ci-dessus, et trouver les valeurs propres A. Trouver ensuite la
solution périodique complète, rir(i) et n<^(i).
d ) Établir le système d’équations vérifiées par le second ordre d ’approximation,
br(t) et 6y>(i), sous la forme matricielle.
fa b \ f Tir \ _ f A \
(8.78)
U d) U J U r
8.8. PROBLEMES 337
où l’opérateur matriciel à gauche contient les dérivations première et seconde

par rapport au temps et les facteurs constants, tandis que le côté droit contient
les expressions quadratiques en fonctions désormais connues, Ur et et leurs
dérivées. Linéariser les expressions quadratiques en les exprimant avec les fonc
tions trigonométriques à la fréquence double 2u. Remplacer les dérivées tem
porelles de br et de b^p selon le schéma :
bf. — bj.y bj. — 4co bf*f b(p — 2cu btp 4uj^bu (8.79)
P ro b lèm e 8.2. - Isoclines, P o in ts singuliers, lin é a risatio n

Considérons l’équation différentielle de second ordre :
(Px ( dx\'^
(8.80)
dt
En posant y = dx/dty éliminer les dérivées temporelles en passant à l’équation
différentielle pour les trajectoires, dy/dx = f{x,y ). Définir les isoclines sur le
plan {x,y) correspondant aux valeurs de la pente y' = 0, 1, 0.5, —1, —0.5.
Trouver la droite le long de laquelle la pente coïncide avec la droite elle-même.
b) Tracer les trajectoires, en précisant le sens du parcours avec le temps.
c) Trouver (de manière graphique) les isoclines et les trajectoires pour les
équations
dy 2 ,2
^ = 2æ^ - y, et
(Attention : ces équations n’admettent pas de solution en termes de fonctions

élémentaires - n ’essayez pas de les intégrer explicitement !)
c) On considère l’équation différentielle “anti-Duffing”
^ - uPx + Px^ = 0. (8.81)
Déterminer les points singuliers de cette équation en précisant leur caractère.

Tracer les trajectoires et la séparatrice.
P ro b lèm e 8.3. - M é th o d e stro b o sco p iq u e

On se propose d ’étudier les solutions approchées de l’équation de Duffing avec
la méthode stroboscopique L’équation de Duffing décrit un oscillateur avec un
ressort “mou” :
(Pr
+ k { x —px^) = 0. (8.82)
a) Déterminer les points singuliers et leur caractère. Dessiner le portrait de

phase dans le plan (x,y = x).
b) En supposant la solution approchée sous la forme
X = A sin{u)t + $), xy = A lü c o s (u )î + $),
utiliser les équations pour les valeurs moyennes de il et $ (l’amplitude et la

phase) données dans (8.50), en effectuant les intégrations correspondantes.
c) Identifier la correction à la fréquence de base ujq = \/k /m en égalant u>i à la
valeur moyenne < d ^ /d t> . Comparer avec le résultat obtenu par la méthode
de Poincaré.
P ro b lèm e 8.4. * - L in éarisatio n a u to u r des p o in ts singuliers

Considérons le système d ’équations décrivant l’évolution des probabilités dans
un processus d’agglomération, (8.67) :
Pê-^ + (1 - Ps - -P7)e-“ + P 7 - Q
ds Q
dPr _ P7
P7e-^“ + (1 - P5 - P7)e-“ + P5 - Q (8.83)
ds Q .*
avec Q = P |e -2 “ + 2P5Pee~°‘ + 2P5P7 + P i + 2P&P7e~°‘ + P ^ e - ^ (8.84)
où Pe = 1 —P5 —P7
a) Prouver que les points
A : P7 = 1, P5 = 0, (P e = 0); P : Pe = 1 (P5 = P7 = 0);
C : P5 = 1, P7 = 0, (Pe = 0); P : P5 = P7 = i (Pe = 0), (8.85)
vérifient bien le système (8.83).

b) Vérifier que le point
1- e - “
E: Ps = Pe = P7 = 1 - P5 - Pe =
3-e-«’ 3-e-“’ 3-e-«
est aussi une solution.
c) Linéarisér le système (8.83) au voisinage immédiat du point singulier E.
Trouver la matrice constante 2 x 2 du système linéarisé, puis ses valeurs propres
et vecteurs propres. Quel est le type du point singulier E ?
Solutions des problèmes
1. Mécanique classique du point matériel

Problème 1.1 - La poursuite - Solution
La trajectoire du lièvre (Z) est la droite verticale a: = a, sa vitesse
constante est V = V e y . La position initiale du chien (P) est a; = 0, j/ = 0
(l’origine du repère), sa vitesse initiale est cBx . D ’après la figure représentant
la poursuite qui s’engage, le vecteur directeur du chien au moment t doit poin
ter vers l’endroit où se trouve le lièvre, c’est à dire, le long de la droite reliant
la position du chien x{t),y{t) à la position du lièvre, qui au moment t est
X = a, y = Vt. Donc, la tangente à la trajectoire du chien au moment t doit
avoir le même angle directeur que cette droite, soit
^ _ V t-y
dx a —X '
(voir la figure (P.l). Pour trouver la trajectoire en intégrant cette équation.
F ig u r e P.l - La trajectoire du chien (P) poursuivant le lièvre (Z)
il nous faudra tout d’abord éliminer la variable t. La vitesse c du chien étant

constante, le chemin parcouru peut être donné de deux manières différentes :
soit comme Vt, soit comme la longeur de l’arc intégrée le long de la trajectoire.
340 SOLUTIONS DES PROBLEMES
avec ds'^ = \ / l + {dy/dx)‘^, ce qui permet d ’établir une nouvelle équation

contenant explicitement le temps t :
En substituant t dans la première équation différentielle, nout trouvons

dy
£ (a -x) = ^ £ ,fT W d x -y .
Nous avons éliminé le temps t, mais notre équation contient la dérivée première
y', la fonction y{x), mais aussi une intégrale définie, ce qui complique la situa
tion. Heureusement, nous pouvons passer à une équation purement différentielle
en dérivant les deux côtés une nouvelle fois par rapport à x, ce qui supprimera
l’intégrale à droite :
y" { a - x ) - y ' = ^ yjl + {d y/d xf - y',
d’où, en remarquant que les deux termes y' se simplifient, il ne reste que
y,.// c 1
/2 V a —x '
À présent nous pouvons remplacer la dérivée première de y en posant y' = g{x),

6t y" = g\x), ce qui permet d’obtenir une équation différentielle du premier
ordre, directement intégrable :
dg dx
soit
y /Î V (X X -f- ^ Oi X
Sachant que
conduisant à une équation algébrique pour g (en substituant C = ln^4, et

ln X + C = ln X -t- ln ^ = ln(^X )) :
Mg + \ / ï + ^ ) = (a - x)~y, soit A +y2 = (o - x)~y - Ag.
En él’evant au carré, nous arrivons à une équation simple donnant g = y' :
+ A"^ g^ = |^(a - x)~y - Ayj = (o —x )~ y —2 A{a —x)~y g -t-

MECANIQUE CLASSIQUE DU POINT MATERIEL 341
d ’ où
dy 1 y, \ —^ A . -X
= v - - ( a - x ) v .
Avant d ’intégrer cette équation nous pouvons fixer la première constante

d ’intégration A, en évoquant la condition initiale imposée à la dérivée première
au moment initial, soit en a; = 0. D’après cette condition, la course commence
quand le lièvre traverse l’axe Ox, d ’où la tangente à la trajectoire du chien
doit être horizontale en i = 0, x = 0 ; nous devons donc poser y'{Q) = 0. Cette
condition conduit à la valeur suivante de la constante A :
dy . - a V A ç_
^ U = o - 0 -> _ = -a v ,
et finalement.
2c
A = a V , -> A = a v.
Pour ne pas trop alourdir nos notations, posons à présent c/V = /3, ce qui
permet d ’écrire, en substituant la valeur obtenue de la constante A, l’équation
différentielle à intégrer comme suit :
g = ^ [a^ (« - x ) - f - a - f (a - a:)^].
En intégrant directement nous trouvons la fonction cherchée y{x) définissant

la trajectoire de la poursuite :
1 a -0
y{x) = + B.
1-0 1+0
La constante d’intégration B est déterminée par la condition initiale 2/(0) = 0.
On trouve
La courbe ainsi obtenue ne peut couper la droite x = a que si la vitesse du

chien est supérieure à celle du lièvre, F > c. La formule diverge quand V = c,
ce qui correspond à l’existence d ’une asymptote verticale. En revanche, dans
le cas y > c, on peut estimer le temps total de la poursuite en intégrant
dt = ds/V, soit
ttotal = ÿ ^ \/ï+ ÿ ^ d x .
Problème 1.2 La cycloide - Solution

L’équation en question s’obtient facilement sous sa forme paramétrique. La
vitesse angulaire de la roue de rayon a qui roule sans glisser le long de l’axe
Ox étant proportionnelle à la vitesse linéique de son centre, l’angle de rotation

o:(i) est donc proportionnel au temps et égal à
V
a(t) = — t — Çlt,
a
ü désignant la vitesse angulaire de la roue, dans notre cas constante. Choisissons
F ig u r e P.2 - U ne cycloide et sa param étrisation détaillée.
la position initiale du point du rebord de la roue à la hauteur maximale, soit les

coordonnées initiales x = 0, y = 2o. Au bout du temps t, ce point se trouvera
en position donnée par les coordonnées suivantes :
X = Vt + a sinUt, y = a + a cos Clt,

fixant ainsi l’équation paramétrique d ’une cycloide. (notez que l’angle a est
compté à partir de la position la plus haute du point M et augmente avec le
sens d ’aiguille d ’une montre, comme indiqué sur la figure).
En dérivant par rapport au temps, on obtient les composantes cartésiennes
de la vitesse instantanée du point M , avec V = iîo, iî = V/a :
dx du
Uj; = - ^ = U ( 1 + COS f i t ) , % ~ s in iîi.
En dérivant une seconde fois, on trouve les composantes de l’accélération ins

tantanée :
O fx i,r% —
_ f y1 , 0_ —_ V ^ COS U2t.
SIU vi 0 /y —
O.
dt^ a ^ dV a
On peut définir aussi la valeur absolue de la vitesse et d ’accélération du point
M, en calculant ds/dt, sachant que ds“ ^ = dx^ -|- dy^. On trouve alors :
^ -h cos iîi)2 -t- sin^ Ot = 2U I cos \•
et finalement, la valeur absolue de l’accélération égale à
|a |= V « Î ^ = ^ -
MECANIQUE CLASSIQUE DU POINT MATERIEL 343
Suggestion. Essayer de refaire le même exercice pour une cycloide généralisée,

décrite par un point M solidaire avec la roue, mais pas nécessairement situé
sur la circonférence. L’équation paramétrique devient alors :
X = Vt + b sin üt, y = a +b cos iîi,

où a est le rayon du cercle, b la distance du point M du centre de la roue ;
en fait, b peut être plus petit ou plus grand que le rayon a (cette dernière
possibilité est réalisée avec les roues des chemins de fer qui ont un rebord plus
grand que le rayon effectif de la roue roulant sur rail).
Problème 1.3 - Trièdre de Prenet - Solution

La trajectoire projetée sur le plan x ,y représente un cercle de rayon o, car
= r^ = a?' cos^ uji+a^ sin^ (jot = a?, la variable cylindrique r =
reste donc constante au cours du mouvement. En revanche, la coordonnée z
augmente linéairement, ce qui produit une courbe hélicoidale de rayon constant
a d’un pas constant - les distances entre les spires successives sont égales à 2 irb.
F ig u r e P.3 - Une courbe hélicoidale.
On trouve facilement le vecteur vitesse en coordonnées cartésiennes en

dérivant par rapport au temps t :
dx dzi dz
Vx = ^ — —OU) sinwi, Vy = — = OU) COSWÎ, Vg = — = bu>.
at at at
Puisque la longueur de l’arc est donnée par ds^ = dx“ ^ + dy“
^ + dz“^, la vitesse
linéique v est alignée sur le vecteur tangent unitaire t, sa valeur absolue étant
V = d s/d t On trouve facilement la valeur absolue de la vitesse :
= vl-\-Vy-\-vl = + b’^J^ = {o? + 6^)
La vitesse est donc constante et égale à
V = u \/o2 + = ou; a/ i + /02^ avec P = - .

^ a
Le vecteur unitaire tangent est donc donné, en coordonnées cartésiennes, par

1
t = - = [—i sin u)t+j cos u)t + )0k]
V ^/T T W
On vérifie aisément que c’est un vecteur unitaire, sa norme vaut 1. Les com
posantes cylindriques correspondent aux trois directions : radiale, (variation
de la coordonnée cylindrique r = x/æ^^+^), orthoradiale (correspondant à
la variation de l’angle azimutal <p = Arctan | ) , et la direction z qui reste la
même que dans le repère cartésien. Nous pouvons calculer directement les deux
composantes cylindriques en utilisant l’expression de æ et de y en fonction du
rayon r et de l’angle (p, en l’occurence étant égal h i p = u t :
X = r cos (f, y —r sm (f,
d ’où
dx dr dip . . ,
cosy? —r — smy? = —OU) smwi.
dt dt dt
dy dr . d(p
— = — s m ip + r - j - cos p = au coswi.
CUC CüC de
En identifiant, on obtient le résultat cherché :
— = 0, r = a = Const. — — U .
dt dt
La vitesse tangente à la courbe hélicoïdale projetée sur le repère mobile cylin

drique a pour composantes
Vr = 0, v^ = a u , Vz = bu, I V 1= u y / a ^ +
Le vecteur unitaire tangent s’obtient en normalisant le vecteur vitesse, ce qui

donne
t = auGip + b u k .
On trouve aussi la relation entre d s , la longueur de l’arc parcouru et le temps
d t : puisque la vitesse reste constante, on a ds = v d t = a u y/ 1 + 0 “
^.
Pour trouver le rayon de courbure, on doit dériver le vecteur tangent uni
taire t par rapport à la longueur d ’arc ds, et identifier le vecteur normal
unitaire :
dt 1
ds P
Nous trouvons alors :
dt 1 dt 1 ua . . 4 . . *1 1
-Î7 = V7 .. A —1 coswi - J smwi = — ^ n.
ds V dt V y/a^ + &2 I J J -I- 62
MECANIQUE CLASSIQUE DU POINT MATÉRIEL 345
Le rayon de courbure est donc constant, égal à + b^- En l’absence de

torsion (6 = 0) on retrouve comme limite un cercle de rayon o.
P ro b lèm e 1.4 Fusée “S a tu rn e ” - S olution
L’équation fondamentale de la mécanique couvre ég lement le cas d ’un
corps de masse variable, m = m{t). En effet, si p = m (i)v , on aura, en
appliquant la règle de Leibniz et en présence d ’une force extérieure F agissant
sur le corps matériel.
dp d(mv) dm dv
= F ^
dt dt
L’accélération est constante, donnée par l’expression suivante :
a — ^ F ^ V
dt m m dt
Si la dérivée de la masse par rapport au temps est positive (si la masse
augmente au cours du mouvement), le corps subit une force supplémentaire
alignée sur la vitesse, qui agit contre le mouvement, similaire à un effet de
frottement linéaire ; en revanche, si la masse est en train de diminuer au cours
du mouvement, cela crée une force alignée sur le vecteur vitesse provoquant
une poussée supplémentaire.
Si la masse infinitésimale quitte la fusée, on doit inclure la quantité de
mouvement —dm w dans le bilan d ’impulsion de la fusée, car la quantité totale
doit rester conservée. On aura donc, dans le bilan total,
dp = p(i + dt) —p(i) = (m + dm) (v + dv) —m v —dm w = F di.
Attention, il y a une subtilité dans la formule ci-dessus : nous avons pris

délibérément la somme m + dm sans décider du signe de l’a différentielle dm.
En calcul différentiel, on écrit par principe d/ = f{ x -|- dx) —f{x) quel que soit
le signe de la dérivée qui en résulte.
En développant et en négligeant le terme d ’ordre 2 dm dv, on obtient (no
tons que dm est considérée comme une quantité positive ou négative, suivant
le cas) :
m dv -H dm v —dm w = Fdi
ce qui donne, après division par dt :
dv „ dm , .
Nous voyons donc apparaître deux termes supplémentaires, le terme —^ v

déjà discuté, et le nouveau terme ^ w qui représente la force de la réaction
des gaz éjectés. En supposant que v est aligné sur l’axe Oz ascendant, et w
sur le même axe mais dans le sens opposé (vers le bas), on voit que, dans le
cas où dm/dt < 0, les deux forces agissent dans la même direction, propulsant
la fusée vers le haut.
L’équation différentielle vérifiée par l’altitude z de la fusée qu’il faudra
résoudre est donc
d'^z 1 dm ,, up
en supposant que tous les vecteurs n’ont qu’une seule composante, le long de
l’axe Oz ; on note aussi que w est négative, et v positive, la différence {w —v)
est toujours négative, correspondant à une vitesse u = —ue^ = (w — v)eg
dirigée toujours vers le bas..
Grâce aux hypothèses faites, cette équation se simplifie encore plus. Tout
d’abord, la perte de masse étant constante dans le temps, on pourra substituer
— —p = Const., P > 0, et donc m(t) =mo —pt.

dt
Nous pouvons donc remplacer la variable t par la variable m dans les dérivées,
car maintenant dm = —pdt :
dz dz d m dz _ d^z _ 2
dt d m dt ^ d m ’ dfi ^ dm?
Une autre bonne nouvelle, c’est que nous pouvons remplacer la différence w —v
par une constante, \w —v \= и = Const. En effet, la vitesse d ’échappent les
gaz w est donnée dans le repère galiléen lié à la Terre, et paraît de moins en
moins importante au fur et à mesure que la fusée avance de plus en plus vite
dans le sens contraire ; en revanche, la différence w — v représente la vitesse
d ’échappenet des gaz par rapport à la fusée elle même, et l’on peut admetre
qu’elle reste constante pendant tout le temps de la combustion.
La nouvelle équation peut être intégrée sans difficulté : puisque
d?z g U dlogm
= —ô+
dm? dm
et étant donné que p et u sont des constantes réeles, la première intégration
donne
dz g U , , _
— = —^ m + - logm + Ci,
dt fr P
et la seconde intégration aboutit à
z(m) = —7TÔ + - (m log m —m) + Cl m + C2.

2(P P
MÉCANIQUE CLASSIQUE DU POINT MATERIEL 347
Les constantes d ’intégration Ci et C2 seront fixées par les conditions initiales

d ’une fusée qui part verticalément en z = 0 avec la masse totale initiale mo et
vitesse initiale nulle, donc wq = u
Nous trouvons alors, en utilisant les conditions initiales ^ ( m o ) = 0 et
z(mo) = 0 les valeurs suivantes des constantes Ci et C2 :
gm o U gml umo
Cl = —ô- + - logmo, C2 = '2p2
P
En substituant dans la solution z{m) obtenue, on trouve, après quelques
opérations algébriques, la forme explicite
U umo
z{m) = (m - mo)^ - ^ (mo - m) - log
(\m- o)J•
Maintenant on peut revenir à la variable temps i, en substituant mo —m = pt,
ce qui donne
'' 2 fl ‘•y m, J
L’expression ^ reste plus petite que 1 jusqu’à la fin du travail du moteur, car
quoi qu’il arrive, m < mo ; nous pouvons donc utiliser le développement du
log(l—æ) en série de Taylor bien connue, log(l+æ) = x+x^/2+ x^/3+æ ‘*/4+....,
ce qui donne, avec x = —{pt/mo), le résultat final ;
gr umo pV ,3+3
pH
--i-t
mo 2mo 3mo
et, enfin, en simplifiant.

up
+ ...
3mn ^4m §
Le premier terme est facile à interpréter : on y voit apparaître deux accéléra
tions agissant dans les sens opposés, la première due à la force de réaction
exercée par le moteur (plus précisément, pas les gaz éjectés) et la force de
gravitation terrestre. La fusée ne peut décoller {z > Q pour i > 0) que si la
force de réaction l’importe sur celle de gravitation.
Les termes supplémentaires, tous croissant avec le temps, proviennent de
l’effet de perte de masse pendant le travail du moteur et deviennent de plus en
plus importants au fur et à mesure que le temps s’écoule, pouvant atteindre
des valeurs trop fortes pour qu’un être humain puisse les supporter. C’est pour
quoi le premier stade de l’accélération ne peut durer que quelques minutes à
peine.
Voici les valeurs numériques relatifs à la fusée “Saturne”
2 000 OOOfcff
= 13 3 3 3 -^ , /9 X U = 33 450 ifciV = 3,345 x 1 0 ^ ^ ^ ^ ,
150 sec sec sec^
3,345x 10^ m
u= 2,516x 10^— = 2 510— ,
1,333 X 104 sec sec'
plus de sept fois la vitesse du son !
La formule pour ^ ( t ) nous donne, pour i = 150 sec, la vitesse atteinte
égale à 1643 m/sec, soit Mach 4.93, très loin encore de la vitesse de satellisation
proche de 8 km/sec. C’est le deuxième étage qui travaille pendant 6 minutes,
qui permet d ’atteindre cette vitesse.
Finalement, l’altitude z(t = 150 s) est de 76 km environ.
P r o b lè m e 1 .5 - P e n d u le p h y s iq u e - S o lu tio n .
L’équation différentielle pour l’angle 6 {t) admet une solution, exprimée impli
citement à l’aide d ’une intégrale. En multipliant par 6 chaque membre de la
première équation de (1.97), on obtient
66 = —U? 6 sin 6 , avec =j
Puisque 66 = \ d{6 '^)/dt, on peut écrire
d 6 2^ / û\
ce qui conduit à l’intégrale première de l’énergie :
fL ( - — COS0 1 = 0 => - — u)^ cos 6 = E = Constante (P.l)

d t\ 2 y 2
Choisissons les conditions initiales au moment i = îq où la masse m se trouve

au point le plus bas du cercle, soit en ^(io) = 0. avec une vitesse angulaire
valant è(to) — ^0 - Dans ce cas, puisque cosô = cosO = 1, on peut écrire
0^ <1 . 00 2
--— cos 0 — -Z
2 2
et à partir de là, sortir la dérivée première de 0 :

MECANIQUE CLASSIQUE DU POINT MATÉRIEL 349
1- - ^ ( 1-COS 0)
Sachant que 1 —cos 0 = 2 sin^ | et en posant ^ = p
on pourra écrire
(P.2)
Les variables sont ainsi séparées, et on pourrait procéder à une intégration

directe, mais avant cela il faut prendre la racine carrée qui peut admettre
deux signes, + ou —, ce qui conduit à une ambiguité. Il faut tout d ’abord
considérer séparément trois cas :
a) Si < 1, k~^ sin^(^/2) pourrait dépasser la valeur 1, rendant P négatif,
ce qui est physiquement impossible. On en conclut que dans ce cas l’angle 0
doit rester dans un domaine [—^max» ^max] limité par une valeur maximale et
une valeur minimale opposées avec sin(0max/2) = k. Le mouvement est alors
oscillatoire, et 9 change de signe après chaque annulation, c’est-à-dire, chaque
fois que sin^(5) atteint la valeur 1.
h) Si k'^ = 1, 0 n ’atteint la valeur 0 que pour sin^(0/2) = 1, soit quand 0 =

180°. On peut démontrer que dans ce cas le temps nécessaire pour atteindre
cette position (le “sommet” du cercle) devient infini.
c) Si > 1, toutes les valeurs de 0 sont admissibles, et le signe de la racine
peut rester constant au cours du mouvement. Il s’agit alors d ’un mouvement
de rotation, passant par le point le plus haut avec une vitesse finie, qui peut
être positive ou négative, selon les conditions initiales.
Le cas a) (d’un mouvement périodique oscillatoire) est le plus intéressant.
Nous pouvons éviter le problème du changement de signe sous la racine en
introduisant une nouvelle variable selon la formule
s in (0 = k sin^
En dérivant par rapport au temps, on trouve
9
cos CO Sip
350 SOLUTIONS DES PROBLÈMES
et nous pouvons exprimer la dérivée (p en fonction de en procédant comme

suit : tout d ’abord, on extrait p? de la formule ci-dessus, (en l’élévant les deux
côtés au carré) :
^ ^ 1 cos^ ( f ) _ 1 ^0 ( l - ^ sin^ ( i ) ) cos^ ( f )

4cos2</?
ce qui donne, compte tenu des identités précédentes.
1 ( l - s m V ) ( l - s m " |) (éo Ÿ , 2 . 2 ,
A présent, puisque k"^ < 1 pour un mouvement oscillatoire, et sin^v^ < 1,

on a la certitude que > 0, et nous pouvons choisir le signe de la racine
arbitrairement, par exemple -f-, pour obtenir finalement l’équation différentielle
recherchée, en introduisant un nouveau paramètre A :
^ = A J l —k^ sin^ P , avec A = ^ (P.3)

dt * 2k
Les variables étant séparées, on peut procéder à l’intégration directe,
dp
Î _ = J L = = = f Xdt = X { t- to )
^ y 1 — sin^ P *'
sinî^
En principe, si l’on touve la loi horaire p{t), on trouvera celle de l’angle 6 en

écrivant 6 (t) = 2 Arcsin (fc smp(t)).
La solution du problème n’est pas encore explicite ; nous n ’avons que sa forme
implicite :
rv du
A( t - t o ) = / = F{k,p). (P.4)
Jo \ / l — sinû
La fonction définie par (P.4) s’appelle l’intégrale elliptique du premier type.
Ses valeurs sont tabulées.
MÉCANIQUE LAGRANGIENNE 351
2. Mécanique lagrangienne
P ro b lèm e 2.1. Le p rin c ip e de d ’A le m b ert - S olution
Comme nous pouvons voir sur la figure (P.4) ci-dessous, les coordonnées
{x, y) des deux masses s’expriment ainsi à l’aide des angles 9i et 62 :
æi = i2sin0i, yi = Rœs$i] X2 = —Rsm02, j/2 = ■Rcos^2- (P-5)

Les vecteurs de base sont : i (le long de l’axe Ox) et j (le long de l’axe vertical
ascendant Oy). L’accélération terrestre est donc g = —
F igure P.4 - Deux poids m i et m 2 liés par un fil de longueur L sur la sphère
de rayon R.
À partir de formules (P.5) on définit les déplacements virtuels compatibles

avec la sphère :
(Jri = (RcosOii —Rsindii) S0i,
ÔT2 = (—i2cOS^2Î —iîsin02j) S0 2 . (P.6)
Les forces extérieures agissant sur les deux masses sont, respectivement.
F l = m ig = -m ig j, F 2 = m2g = - m 2gj, (P.7)
et le principe de l’annulation des travaux virtuels s’écrira
F l • 5ri + F 2 • ÔT2 = m igR sm 0 i S0i -f m2gRsiü02 502 = 0. (P-8)
Les angles 0i et 02 sont liés par le fait que la longueur du fil reliant les deux
masses est constante et égale à L, auquel cas l’arc couvert par le fil sur la
sphère vaut L /R radians, d ’où
«1 + «2 = 4 «2 = I - «1. et » 2 = - S h - (P.9 )
En substituant S02 = S d i dans (P.8) et en simpliiant par gR, nous arrivons

à la condition d ’équilibre :
Wi sin 0 i = m2 sin 6 2 1 (RIO)
(ressemblant étrangement la loi de la refraction de la lumière !)

Il reste à éliminer l’angle 62 afin d ’obtenir la valeur unique de 61 assurant
l’équilibre. En sunstituant, on trouve
L
mi sinî = m 2 sin(— —^1) = m2 s m — cos ( —cos ^ sinî^ , (R ll)
li li
et finalement, en regroupant les termes semblables,
(m \ + ni 2 cos •
I) = m 2 sin — C O S ^ l,
R
(P.12)
et finalement
sin ( i )
tanî = (R13)
( g + “ “© ) '
Avant de passer aux applications numériques, montrons que le même résultat
peut être obtenu en considérant les forces exercées par le fil sur les deux masses.
Ces forces sont par définition colinéaires au fil, donc tangentes à la surface de
la sphère.
Les deux vecteurs tangents, en points {xi,yi) et (x2,j/2) respectivement,
sont données par les expressions de t définies en ces points. Sur la sphère
(plutôt sur le grand cercle se situant dans le plan xOy) l’élément de longueur
de la courbe est égal & ds = RdO. A partir des expressions des coordonnées
trouvées dans (R 5) on a :
d x i . d y i.
ti = = [cosîi —sin 01j].
ds{
’dX2. dy2.
t2 = = [-COS02i-sin02j]) (P.14)
ds ds ^
conformément à l’orientations des angles 6 i et $2 choisie.
Il sufiit de projeter les forces de la pesanteur sur ces vecteurs, et égaler
leurs valeurs absolues :
I-m ig j •ti 1=1 -m 2 g j ■ t2 |, (R15)
ce qui conduit au même résultat, soit l’égalité m isin î = m 2sin02> et) par
conséquent, à la même valeur de la solution d ’équilibre pour 0i
A p p licatio n n u m ériq u e
La longueur du fil imposée étant L = ^ , l’angle de l’arc couvert par le fil
(à condition qu’aucune de ses extrémités ne quitte la sphère) on a forcément
$2 = 27t/ 3 - = 120° - 01. Rappelons aussi que
/ 2 27
7 Tt\ 1 . f2 w \ v3
cos I
Y ) - ~ r “ T ’
e n obtient alors les résultats suivants :
mi = m2 01 = 60°, 02 = 60° ou m i = 2m2, 0i = 30°, 02 = 90°.
Notons que le rapport mi = 2m2 conduit à la situation dans laquelle la masse

mi (plus légère) se trouve sur le plan vertical tangent à la sphère. Dans le cas
où mi > 2m2 l’angle 0i est encore plus petit que 30°, tandis qu’une partie
du fil à laquelle est suspendu le poids m 2 pend verticalement. L’angle 62 ne
varie plus, tandis que sin0i = m2/m i. Dans troisième cas proposé, mi = 4m2,
sin0i = 1/4 = 0.25, et 0i ~ 14°40'.
P ro b lèm e 2.2. Le p ro b lèm e de K ep ler - Solution
C’est le véritable roi des problèmes de la mécanique ! Commençons par le

commencement : l’équation fondamentale de la dynamique dans le cas où l’a
masse de la Terre est supposée infiniment plus grande que la masse du satellite
artificiel, s’écrit comme suit :
(Pr mMGv
^2 J.' (PIS)
Prouvons que le mouvement dans le champ de la force centrale est restraint

à un plan. Multiplions les deux cotés de cette équation vectoriellement par le
rayon-vecteur r :
( (fr\ ( mMG r \ mM G
rA r A r = 0, (P.17)
Notons maintenant que, grâce à la règle de Leibniz, on peut écrire
(Pr d ( dr\ dr dr dPr
car le produit vectoriel d’un vecteur avec lui même est toujours nul. Par
conséquent, on voit que le rayon-vecteur r et le vecteur vitesse v = dr/dt
restent toujours dans le même plan, car leur produit vectoriel est constant
pendant le mouvement dans le champ gravitationnel de la Terre. On a donc
une constante de mouvement vectorielle que l’on nommera J , le moment an

gulaire du satellite par rapport au centre de la Terre :
J = m r Л—, avec — = 0 J = C onst. (P.19)

dt dt
Choisissons donc le repère galiléen centré au centre de la Terre de sorte à ce
que le plan xOy coïncide avec le plan perpendiculaire au vecteur du moment
angulaire J. Le mouvement du satellite restant dans ce plan, sa position peut
être répertoriée par ses coordonnées polaires r et (p,
X = r cos (f, y = r sin (p.
L’énergie cinétique du satellite, assimilé ici à un point matériel de masse m,

s’exprime facilement à l’aide de dérivées temporelles de r et de : puisque
X = rcosip —npsintp et X = rcosip —r(psiïi(p, (P.20)
on trouve
r = f 2( Vi 4- v' W
^ ) = f2(Vr ^ r V ) .
Quand à l’énergie potentielle, elle est donnée par l’expression bien connue
V=_
- mMG , ce qui conduit au lagrangien suivant :
mM G
L = T -y = Ç (r2 -|-rV ) + (P.22)
Les équations d ’Euler-Lagrange pour ce système réduit à présent aux deux

degrés de liberté, avec les coordonnées généralisées r et (p, sont alors :
(P.23)
dt dr dr~^' dtdcp d<p~^'
.. ,o mM G d
mr —mr<p H----- g— = 0, (тг^ф) = 0. (P.24)
dt
La deuxième équation confirme la loi de conservation du moment angulaire -
ici, juste sa valeur absolue, | J |= mr'îp, connue aussi comme la loi des aires
de Kepler, car l’expression r x rd<p, qui est proportionnelle à la différentielle du
temps dt avec la constante de proportionnalité égale à | J | peut être interprétée
comme l’aire du triangle balayé par le satellite pendant le temps dt ; cette aire
reste constante au cours du mouvement, ce qui fait que la vitesse angulaire est
maximale en périgée (r = rmin) et minimale en apogée (r = râx)-
Au lieu d’essayer de résoudre les équations de second ordre (P.24), nous
pouvons nous servir d ’une autre constante de mouvement : l’énergie totale du
MECANIQUE LAGRANGIENNE 355
système. En effet, notre lagrangien ne dépendant pas du temps t explicitement,

la combinaison
est conservée pendant le mouvement. Sa valeur est déterminée par les condi
tions initiales. Nous pouvons donc écrire :
,dL ,dL , Tn / .n 9 .o\ mM G
E (P.25)
La vitesse angulaire (p peut être éliminée grâce à la constante du moment

angulaire :
=
mr 2‘
En substituant dans l’expression pour l’énergie totale, on obtient alors une
relation antre la dérivée première f et la variable r :
m 2 mM G
+ (P.26)
m
En principe, nous pouvons intégrer l’équation différentielle définie implicite

ment par (P.26), en explicitant la dérivée temporelle de r :
dr IW 2MG J2
(P.27)
dt m r
L’intégration est directe, mais elle aboutit à donner le temps t en fonction de
la variable r, en non la dépendance r = r{t) recherchée ; en outre, l’intégrale
élliptique que voici ne s’exprime pas à l’aide des fonctions élémentaires.
dr
t -to = r -r= (P.28)
J to Æ , 2M G
m r n.2r*2
Ses valeurs sont tabulées ; pour inverser la fonction t = t{r) il faut tout un
appareil mathématique spécial introduit F.W. Bessel. ®Connaissant la fonction
r{t), on pourrait l’insérer dans la définition de la constante J et à parti de là,
obtenir par intégration directe la fonction <p = (p{t) :
= J 9 -< P 0 = Í
Jto
dt. (P.29)
5. Pi’iedrich W ilhelm B essel (1784-1846), atronóm e et m athém aticien allem and, premier
à mesurer la distance à une étoile. Il a aussi introduit les fonctions cylindriques portant son
nom.
Un tel procédé ne peut être effectué qu’avec les méthodes numériques.

Cependant, si nous nous intéressons uniquement à la trajectoire sans la loi
horaire, on peut éliminer le temps en ne considérer que la fonction définissant
la courbe r = r{tp). Dans ce cas nous aurons
dr dr dtp dr J
(P.30)
dt dtp dt dtp mr^ '
On peut remplacer r dans la formule (P.26) pour obtenir
/ dr mM G
(P.31)
^~ 2 rri^r^ \dtp J '
Introduisons maintenant la nouvelle variable u = l/r. On a donc :
_ 1
r
du _
dtp
1 dr
r“
^ dtp'
dr
dtp
—r
, du
' dtp
f dr
\dtpJ
'du
V
' \dtpj
(P.32)
ce qui conduit à la nouvelle équation en termes de u et sa dérivée
m ■j2 f d u Y J2 2
E = —mMGu. (P.33)
ou encore
J2 'd u \
2E = + u^ —2mMGu, (P.34)
m ^dtp)
et finalement, la forme la plus élégante :
2Em \2 2m?MG
) J2
•U (P.35)
L’équation (P.35) est non-linéaire, mais nous pouvons en déduire une équation
linéaire parfaitement connue en dérivant les deux côtés par rapport à la var
riable tp. Puisque nous avons une constante à gauche, la dérivation du côté
droit donne zéro :
dudû du 2Mm^G du _
(P.36)
dtpdtp“
^ dtp^ J2 dtp
En factorisant la dérivée première de u présente dans tous les trois termes, on

obtient
du (Pu Mm?G
dtp
= 0. (P.37)
Deux solutions peuvent être envisagées : soit

du „ ,
— = 0, donc U = constante,
d<p
ce qui entraine bien évidemment r = R = constante. Il s’agir d’une orbite
circulaire parcourue avec une vitesse angulaire constants - cas très particulier,
quoique non dépourvu d’intérêt (par exemple, les satellites géostationnaires).
Si U n ’est pas constante, du/dtp ^ 0, et nous pouvons diviser par du/dtp
obtenant ainsi une équation linéaire du second ordre, de surcroît parfaitement
connue - l’oscillateur harmonique avec fréquence égale à 1 :
d?u Mw?G „
(P.38)
Il y a un terme non-homogène constant, mais on peut le résorber en définissant

une variable auxiliaire w = u — ^ ¿ont la dérivée sera la même que celle
de U. La nouvelle variable vérifie l’équation d ’oscillateur harmonique
d?w
+ iü = 0,
dp“
^
dont la solution générale est w = Acos{p—po), les deux constantes arbitraires
devant être fixées par les données initiales. L’angle p peut être défini à partir
d ’un moment approprié, et la constante po peut être résorbée dans la nouvelle
variable p' = p —po', cela revient aussi à redéfinir le moment initial to.
On ne perd donc rien en généralité en remplaçant p —po par p. En retour
nant à la variable ti, on aura donc
, , Mm?G Mm?G ^
u{p) = w-\----- ^2— = — ----- vh co sp (P.39)
J2
et finalement
1
r{p) = Mm^G (P.40)
-j2---- \-hcosp l-f-ecosyj’
où nous avons utilisé la notation standard correspondant à une conique qui
peut être une ellipse, une parabole ou une hyperbole. Les constantes p et e
déterminent entièrement la trajectoire. Plus explicitement, nous avons :
P = M m2G’ e = h M m ^G ’ (P.41)
La constante d’intégration h peut être déterminée en remettant la forme ob

tenue de la fonction r dans l’équation (P.35). Après quelques simplifications,
on arrive à l’identité „ „
(P.42)
2m 2p
d’où l’on tire l’expression de la constante h (en choisissant le signe ’’plus” de

la racine quadratique) :
j2 (P.43)
La formule (P.41) devient plus explicite :
J2 ' J2
P= e = W1 + QiE (P.44)
МтЮ'
La forme générale de la trajectoire (P.40) définit une conique. Il s’agit d ’une
ellipse si e < 0, d ’une parabole si e = 0 et d’une hyperbole si e > 0. Ce qui
correspond aux cas où l’énergie totale est respectivement négative, nulle, ou
positive.
P ro b lèm e 2.3 - M ou v em en ts c o n tra in ts - Solution

On considère une surface de révolution ayant l’axe vertical Oz pour l’axe
de symétrie ; en coordonnées polaires elle est définie par son équation
Z = /( r ) , avec r = + y^.
dans ce cas le carré de l’élément de longueur s’écrit
ds^ = dx^+dy^+dz'^ —dr'^+r^dtp^ + dz^ = dr^ f l + + (P.45)
En supposant que le dispositif est soumis au champs de la gravitation terrestre

g = —gk, l’énergie potentielle de la bille évoluant sur la surface z = /( r ) est
égale à mgz = mgf{r). On trouve donc le lagrangien égal à la différence entre
l’énergie cinétique et l’énergie potentielle, L = T —V :
x^ + y^ + z^ - m g z = ^ + + - m g f{ r ) . (P.46)
La variable cyclique ip n ’apparaît pas explicitement dans L, ce qui engendre

l’existence d ’une constante du mouvement - le moment angulaire :
= т г‘^ф = J = Const/. (P.47)

dtd(p
Le lagrangien ne dépend pas de temps explicitement, le système est donc
conservatif et admet une autre constante du mouvement, l’énergie totale :
m
E = + mgz = Ц (r^(l + + 2^ + mgf{r).
Comme dans le cas précédent, nous pouvons extraire la dérivée dr/dt, et

procéder à l’intégration directe :
(P.48)
($ )' (1 + /'" ) 1
d’où
dt
(P.49)
7 ^ - 2 o ^ r 2 - 77
et finalement
-to= f dr (P.50)
Jri"° V ^ - 2 o p r 2 -
P ro b lèm e 2.4 - M achine d ’A tw ood - Solution
D’après la figure, nous pouvons exprimer les positions des masses m i, m2, m3
et m4 avec deux variables indépendantes, z\ et Z3 (On admet qu’il s’agit chaque
fois de la position du centre de masse de l’objet en question). Pour l’instant,
toutes les disances mesurées à partir du bâti seront prises avec signe “plus” .
F igure P.5 - La machine d ’Atwood.
On trouve alors les distances suivantes :
mi zi, m 2 -» 26 + ¿1 —TTO—zi,
mz —>zz, —¥ 2b + 2l\ —Stto—2z\ + 26 + ¿2—zz.

Les termes constants du type - tto ou 26, etc., ne jouent aucun rôle dans le
calcul des vitesses, ni dans l’énergie potentielle ; ils peuvent donc d’ores et déjà
être supprimés.
Il ne restera alors que :
Zi, Z2 -Zi, Zz et Z4 ^ -2zi - zz-
Les contributions de chaque masse à l’énergie potentielle sont ptoportionnelles
à la masse multipliée par sa cote 2: prise avec le signe moins ; les contributions
à l’énergie cinétique sont égales aux masses multipliées par les carrés de leurs
vitesses et divisées par deux. D’où les expressions :
^ m iif . m 2i| , mzzi , m 4i| _
miZi mzzf mzZÿ m4(zz + 2zi)^

“ “ 2“ + 2 2 2
En regroupant, on trouve l’expression quadratique suivante :
^ ^ (mi + 4m4H-m2)if ^ (mz + rn^g 2m4Zizz,

2 2
tandis que l’énergie potentielle vaut, à une constante près,
V = — m i z i — m2Z2 — m z z z - m.4Z4
qui est égale, après toutes les substitutions

V = (m 2 + rri4- mi)zi + (m4 - 7713)^3 -
Le lagrangien L = T — V conduit à une paire d’équations différentielles cor

respondant aux variables indépendantes choisies, z\ et zs :
(t722 + 2 rri4 —Tni)zi + 2 m4 Zs = {tTIi —m2 —27714);
(7713 + 7714)^3 + 27714^1 = (77I3 —7714). (P-51)
Ces équations linéaires peuvent être représentées sous forme matricielle :
( c d ) ( | ) = (?)-
avec comme entrées :
A = (m 2 + 2m 4 — m i ) , B = 2w 4 C = 2m 4, D = {m z + ?U4),
puis, le vecteur constantdu coté droit ;

a = (mi —m2—2m4), /0= (m3 —m4).
Pour obtenir les solutions explicites 21(i) et 22(i), on doit diagonaliser la ma
trice, mais on peut arriver à séparer les variables 21 et 22 “à la main”, grâce à
la symétrie de la matrice. On arrive alors aux équations suivantes :
_____ (m3 —m4)(mi —m2—4m4)_____ = Ki,
21 =
mim3 -h mim4 + 4m3m4 -t- m2'mz +
_ 2 m 4 (mi —m 2 —2 m 4 ) — (m 3 —m ^){m i -j- 4 m 4 + m 2 ) _

Z3
Ami ~ ( ^ 3 + m 4 ) ( m i -1- 4 m 4 + m 2)
Les solutions (en l’absence des vitesses initiales non-nulles) sont évidentes :
K it“
^
21 = zz =
Suivant le chois des masses m^, ¡i = 1,..4,, les constantes K \ et K 2 peuvent

être positives ou négatives. Notons que, si z\ augmente avec le temps {Ki > 0),
la masse mi est en train de descendre ; idem pour m3.
Problème 2.5 - Pendule relié à un ressort - Solution
D’après la figure, la position de la masse m est déterminée par un seul
paramètre, l’angle 0 : OM —l sin0 i —l cos 6 j.
F igure P.6 - Pendule avec ressort.
On trouve aussi sans peine la longueur du ressort en fonction de l’angle 9
P M = lsm9 i+{2l -lc o s 9 ) k -^| PM |= lV5 - 4cos0.

L’énergie potentielle du ressort est donnée par l’expression
V = ^{\PM \-d)\
V = ^ [ / 2 ( 5 - 4COSÖ) - W 5 - 4 C O S Ö + .
L’énergie cinétique T d’une masse ponctuelle attachée par le fil de longueur l

est égale, comme d’habitude, à
d’où le lagrangien T —V :
k r
T - V = —à ^ - - /2(5 - 4cos^) - /dV 5-4cos^ -t-
Zi ^ ^
(Le dernier terme constant, avec (fi, peut être omis, car il ne contribue pas
aux équations de Lagrange).
Voici l’équation dynamique obtenue à partir du principe variationnel
,2 <fie kfi ^ ^ kld 4sin^
dfi 2 2 2\/5 —4cos^
Pour les petites amplitudes d’oscillation on peut faire l’approximation linéaire
sin0 ~ 6 , cos 9 ~ 1, pour obtenir l’équation linéaire :
„ , kld
= —¡ = - ....... —2fc/2^ sinô ~ —kl{l —d)6 ]
dfi VV 5—Tcosÿ
en divisant par mfi on obtient l’équation d’un oscillateur harmonique ;
9 = —— ( , theta = —¡jfi9.
m \ l /
La fréquence circulaire est donc égale à
Problème 2 .6 - Le Yoyo - Solution

On suppose que les deux disques constituant le Yoyo sont faits du même
bois, de densité surfacique p, ayant la même épaisseur. Le moment d’inertie
d’un disque homogène de masse M et de rayon R est égal à MR?/2.
Le mouvement du yoyo est décrit par un seul paramètre, l’angle de rotation

0, La position du centre de masse est donnée par la valeur de la coordonnée z
égale à tout moment à
z = H-rê.
L’énergie potentielle est donc (M + m)g{H —rd).
F ig u r e P.7 - Le “Yoyo”, avec rayon extérieur R et rayon intérieur r.
Le moment d’inertie d’un disque homogène de masse M et de rayon R est

I = ^MR?. Le moment d’inertie du yoyo est la somme des moments d’inertie
des deux disques le constituant :
MR? + mr2
1=
L’énergie cinétique totale comprend l’énergie cinétique de la rotation et l’énergie

cinétique de la translation :
J. ^ MR^ + m r^^ (M + ro)2^ ,
2 r
Le lagrangien L = T —V conduit à l’équation de Lagrange :
{MI? + (M + 2m)r^)0 = (M + m)gr,
dont la solution est un mouvement avec accélération constante :
(M + m)gr ?
6 = 00 +
MR? + Mr2 + 2mr’2 2
Le centre de masse du yoyo descend comme pendant une chute libre, mais avec
une accélération qui est une fraction de l’accélération de la pesanteur g :
(M + m)gr
z = H -g
MR? + Mr2 + 2mr2 2 '
Problème 2.7 - Deux oscillateurs couplés - Solution

Soient les positions des trois masses, respectivement, données par leurs
abscisses xi, X2 et X3 (en partant de gauche). L’énergie cinétique du système
est alors égale à
m il , ^ ¿2 , _ ”^/■•2 , >2\ , M -2
T — —2 ^ 2 * ~ ~ 2
D’après la figure (P.8) on trouve sans peine l’espression de l’énergie potentielle
des deux ressorts (dont la longueur naturelle est l pour chacun) :
k
V = '■^{x2 - x i - l Ÿ + ^ {xz - X 2 - i f
2 "" ' ' ' 2
Introduisons les variables auxiliaires :
m k M m
F igure p .8 - Trois masses formant un oscillateur à deux degrés de liberté.
9i = æi, Q2 = X2 - 1 , qz = x z - 2 l .
En termes de variables Çi, i = 1,2,3, on obtient l’expression plus symétrique

et compacte du lagrangien :
L = T - V = j ( q f + qfj + y - ^{qz - q i f - ^{qz - q2 ^-
A partir du principe variationnel appliqué à ce lagrangien on obtient trois

équations de mouvement :
<fqi , , . .
m-r:^
di2
- k(q2 - qi) = 0,
d?a
- k{Q2 - q i ) + k{qz - qz) = 0,
d?qi ., \ n
- fc(ç3 - 92) = 0,
En introduisant = k/m et íl!^ = fe/M, nous pouvons écrire la même chose
de manière plus compacte :
d?qi O Q
= -u^qi + u^q2,
<fqi = 2Q^q2 —
diP'
d'‘^Ql 2 I 2
+W^92,
Il convient de représenter ce système d ’équations en notation matricielle :
'q i \ /-(J' o;2 0 \ (q i\
Ç2 = iî2 _2Çf çi2 ç \ (P 53)
,Ç3/ V 0 uP -w ^ / \q z/
Comme d’habitude, nous cherchons des valeurs propres de la matrice (P.53)
en annulant le déterminant de la matrice suivante :
0
A2 + 2fi2 -iî2 1 = 0. (P.54)
-¡JJ-2 A2 + o;2
Voici l’équation caractéristique qui en résulte :
( a2 + u /) [( a^ + w2j (^^2 + 2î 12)] = 0. (P.55)
On trouve les solutions sans peine :
Al,2 = iîW , A3,4 = dti\/2Q.
La solution générale est donc une superposition des solutions de base,
qi{t) = Ai cos{ut + ai) + Bi cos(V2fii + Pi) (P.56)
La matrice qui définit le système d ’équations (P.53) possède trois vecteurs

propres : deux correspondant à la valeur propre double et un correspon
dant à la valeur propre —2iî2,
Trouvons les deux vecteurs propres appartenant à la valeur propre —o;2.
Un tel vecteur propre rj) vérifie l’équation matricielle suivante :
-o;2 w2
iî2 -2fi2 ° \ /^ i\ f i ’l
fi2 V>2 = —U ? ■02 (P.57)
0 ^2 -u;2; \V’3/ VV’3
On trouve, après un peu d ’exercices algébriques, les deux vecteurs suivants :
^ w2N
^>1= | 2 - I , '02 = 1, '03 = 0,
w
^ 1= 0, V’2 = 1, '03 = I 2 - ^
Le troisième vecteur propre correspondant à la valeur propre —2iî^ est donné

par
tpi = 1, ^2 = 0, V’a = - 1 .
Les solutions de base sont donc :
çi(i) = A cos{ujt + a), q2 (t) = ^ cos(wi + a), ^>3 = 0,
9i = 0, Q2 = A cos(a;i + a), qz = ^ j A cos(w< + a),
qi = A cos(V2iî< + P), 92 = 0, 93 = —A cos{V2Clt + P).

A partir de ces solutions il est facile de retrouver les “vraies” solutions; en
termes de déplacements réels Xi{t). Par exemple, dans la troisième solution la
variable 92 = 0 ; mais 92 = *2 - donc, on a X2 = I — constante. La masse
M reste donc immobile au milieu. Les deux masses m oscillent avec la même
fréquence y/2ü, mais dans les sens opposés.
3. Calcul variationnel
Problème 3.1. - Barycentre de trois points - Solution
Soient {xi,yi), i = A ,B ,C , respectivement, les coordonnées cartésiennes de
sommets du triangle ABC, et soient { x m i Vm ) les coordonnées du barycentre
cherché. Il s’agit de trouver l’extrémum de l’expression suivante :
F { x i , Vi, xm , Vm ) = {x \ - xm Ÿ + (yi - Vm Ÿ
+{x 2 - xm Ÿ + (2/2 - Vm Ÿ + (®3 - xm Ÿ + {yz - yhif-

En dérivant F par rapport à xm et yM séparément et en annulant les deux
F i g u r e P .9 - L e b a ry c e n tr e d e tr o is p o in ts (d e m ê m e m a sse ).
CALCUL VARIATIONNEL 367
expressions, on trouve les conditions rendant F extrémale :

dF
= -2(xi - x m ) - 2 { x 2 - x m ) - 2(x3 - x m ) = 0,
dXM
dF
= - 2 ( y i - v m ) - 2 ( 2/2 - 2/ m ) - 2 ( 2/3 - 2/ m ) = 0 ,
dyM
soit deux conditions qui doivent être vérifiées simultanément :
X1 + X2 + X3 - Sxm = 0, 2/1 + 2/2 + 2/3 - 32/Ai = 0.
Il s’agit bien évidemment d’un minimum, car la somme des distances entre le
point M et les trois points A , B e t C peut être rendue aussi grande qu’on veut
en éloignant le point M encore plus.
Problème 3.3 - Surface de révolution minimum - Solution

Soit y{x) la fonction génératrice d ’une surface de révolution, comme indiqué
dans la figure (RIO). Afin de trouver l’aire de la surface de révolution, on peut
la découper en lamelles circulaires de rayon y{x) et de largeur ds. La surface
d’une lamelle est donnée par la formule
2 'ïïyds = 2 TryyJ1 + y'^dx.
F ig u r e P.IO - S u rfa ce d e r é v o lu tio n a u to u r d e l ’a x e Ox.

L’aire totale de la surface est donc donnée par l’intégrale suivante :
S = 2-K j y^Jl + y'^dx. (R58)
puisque ds = + y'^dx.
On peut aussi bien choisir y comme variable indépendante, et x{y) comme
fonction à déterminer ; dans ce cas, on écrira ds = V T + x ^ d y , et la fonction
nelle dont on cherche le minimum s’écrira
27T r yy/l + x'U y. (R59)

Ja
cette forme du principe variationnel est plus pratique dans ce cas précis, car
l’intégrand ne dépend pas de la fonction x{y). Par conséquent, l’équation
d’Euler-Lagrange résultant du principe variationnel, se simplifie et permet
d ’obtenir une intégrale première :
d yx' yx'
= 0, = K = constante. (P.60)
dy VVl + æ 'V ’ V TT^
En élévant au carré, on trouve
2 /2 jj-2 , /2\ > /2

y x = K (1-h o; j = ^ 2 3 :p ,
ce qui conduit à l’équation différentielle du premier ordre :
- = . ^ (P.61)
dy ' '
Les variables se séparent facilement ; nous pouvons donc effectuer l’intégration :
J dx = {x-xo) =j = KArccosh . (P.62)
En inversant la fonction Arccosh, on trouve la solution :

l ' x - æoN
y{x) = K cosh (P.63)
V K )
On fixe les valeurs des constantes K et xq en comparant les valeurs de notre
solution aux deux extrémités imposées y{a) = Ri, y{b) = R 2 .
F ig u r e P. 11 - Surface minimale sous-tendue par deux cercles coaxiaux (une

catenoide).
Le bon sens nous suggère que la solution obtenue comme l’extrémum de la

fonctionnelle (P.59) représente un minimum, car on peut toujours augmenter
la surface étendue entre deux cercles donnés, rien qu’en la déformant ou en
l’étirant. Mais nous devons prouver qu’il s’agit d ’un minimum de manière
rigoureuse, en examinant la seconde variation de la fonctionnelle.
Pour ce faire, considérons la solution obtenue y{x), et ajoutons une fonction
arbitraire multiplée par un paramètre infinitésimal e. Il faudra donc substituer
dans la fonctionnelle la nouvelle fonction x(y) = x{y)+s g{y). On obtient alors,
en gardant uniquement les termes du premier et du second ordre.
S = 2n J dy y \Jl-\-x'‘^ + 2ex' g' +

La dérivée seconde S S /d e ^ définit une intégrale positive, prouvant ainsi qu’il
s’agit du minimum de la fonctionnelle considérée.
P ro b lèm e 3.4 - L a form e d ’une chaîne p e sa n te - Solution
Pour trouver la forme que prend spontanément une chaînette pesante dans un
champ de gravitation homogène d ’accélération g = —^ j, il faut minimiser son
énergie potentielle. Soit // la masse linéique de la chaînette, L sa longueur, et
soient æ = a et æ = è > O les points sur l’axe Ox de vecteur unitaire i auxquels
sont accrochées les deux extrémités de la chaînette.
Admettons que la forme supposée de la chaînette en équilibre est donnée
par la fonction y = y{x). L’énergie potentielle d ’un ségment infinitésimal ds
de la chaînette sera donc égale à dU = ¡igyds. L’énergie potentielle de la
chaînette entière est alors donnée par l’intégrale
f yds= [ y J l + y'^dx, (P.64)

Ja Ja
Le principe variationnel appliqué à la fonctionnelle (P.64) donne un résultat
absurde : en effet, le principe variationnel
5 i yds = [ y + y''^dx = 0
Ja Ja
conduit aux équations d ’Euler-Lagrange :
d y
- \ Z i + y ^ = o.
dx x /T T ÿ ^
Effectuons la dérivation :
y''^ + yy" yy'^ÿ
'V /7— i'2
V H -ÿ ^ (l + y'^)2
après quelques opérations algébriques on arrive à une expression intermédiaire :
y'^ + y'^
= 1 + y '\
1 + 2/'^
et de là, à une contradiction = 1, une expression négative égale à +1. La

raison de cette contradiction est assez évidente : le problème, tel qu’il est posé,
n ’a pas de solution, car la fonctionnelle (P.64) ne peut pas avoir de minimum,
car on peut rendre ctte intégrale inférieure à n’importe quel nombre négatif
en allongeant la chaînette d ’avantage.
Pour que le problème du minimum de l’énergie de la chaînette pesante soit
bien posé, il faut fixer sa longueur L. Cela équivaut à une nouvelle fonction
nelle,
oh oh .----------
f d s = f J l + j / ^ d x = L. (P.66)
Ja Ja
Conformément au théorème de l’extrémum lié, le problème bien posé revient à
résoudre un nouveau principe variationnel, avec le multiplicateur de Lagrange :
ds = 0. (P.66)
L’intégrand F {y, y') = {y + A)-\/l -t- y'^ ne dépend pas explicitement de la

variable x ; le problème admet donc une intégrale première
dF
—F — C = constante
qui, dans le cas précis, est égale à

y+ A
= C, (P.67)
\/r+ F
ce qui permet d’établir une équation différentielle du premier ordre :
dy _ ^/{y + \y - C ■ ^
(P.68)
dx C
qui peut être intégrée directement :
dx __ dy
~ c ~ v {y + ^r-c-^'
Posons U = ; nous aurons alors l’équation
dx d{y + A) du
(P.69)
C ( g y (y+-^))2 _ I C \/u? - l ’
dont la solution est u = coshæ. En effet,

du du du
du = sinh xdx, dx =
sinh U cosh^ X — 1 ~ 1
comme l’équation (P.69) l’exige.

L ’intégration de la relation (P.69) ajoute une nouvelle constante D, pour
donner en définitive :
= cosh soit y{x) = C cosh ^ ~ (P-70)
F ig u r e P. 12 - La forme naturelle d’une chaînette pesante homogène.
Notre solution contient trois constantes arbitraires, C, D, et A, qui doivent

être déterminées en utilisant les conditions aux limites, y{a) = A, y{b) = B
et la condition fixant la longueur de la chaînette,
L = / sjw y'^dx.
JO,
Les trois équations perm ettant de fixer les trois constantes sont alors comme
suit :
A + A = C 7cosh^ ^ + L>j , 5 + A = C7cosh(^^+L>^ ,
Csinh^^^ + L » ^ -C 7 s in h ( ^ ^ + i) ^ = L . (P.71)
L a dernière identité vient du fait que
y' = sinh y dæ =
j ^1+ sinh^ dx = J cosh dx = sinh
A titre d ’exemple, prenons le cas simple où les deux extrémités de la chaînette

sont accrochées au même niveau, y{a) = y{h) = 0. Les trois conditions per
m ettant de fixer les constantes C, D et A deviennent dans ce cas, puisque
A= B = 0 :
A = C cosh -h , A = C co sh -h , J cosh{^) dx = L.
La fonction cosh étant symétrique (coshæ = cosh(—æ)), la seule façon de

satisfaire les deux premières conditions est de faire de la sorte à ce que les
deux arguments soient égaux en valeur absolue, mais de signe opposé :
O ^ (a + 6)
^ + -D = - ( ^ + D ), D= 2C7 ’
ce qui fixe la constante D. Notre solution devient alors
y{x) = C co sh
fixant aussi la relation entre deux constantes restantes, A et C, en utilisant la

condition initiale j/(0) = 0 :
A = C cosh ^ ^ ^ ^ (P.72)
La troisième condition fixant L nous donne, après l’intégration,
i = 2C d n h (^ ), soit s i n h ( ^ ) = i .
A partir de ces deux équations on peut déduire numériquement les constantes

A et C en forction de o, b et L.
Problème 3.5 - Le chemin optique - Solution

Les rayons de lumière pénétrant les couches supérieures de l’atmosphère ter
restre subissent la réfraction optique, traversant systématiquement les couches
d ’air de plus en plus denses, comme on peut le voir dans la figure (P. 13) ci-
dessous. Le dessin gauche représente le rayon de lumière dévié de manière
continue, le dessin de droite représente un modèle simplifié avec les couches
de densité optique constante, mais qui augmente au fur et à mesure que l’on
s’approche du sol.
n,»l
: z ü>L_
F ig u r e P. 13 - Réfraction de la lumière dans l’atmosphère.

Dans le principe variationnel
S J n{x, y)ds = 0
l ’élément de longueur de la courbe pourrait être représenté de deux manières :
soit comme ds = ^/T'+^dx, soit comme ds = V l + x'^dy, suivant le choix
de variable indépendante. En supposant que le dérivée y' = dy/dx n’atteint ni
0, ni l’infini pendant le parcours du rayon lumineux, on peut choisir y comme
variable indépendante et a: = x{y) comme fonction inconnue; nous verrons
tout de suite pourquoi ce choix est plus intéressant.
Puisque la densité de l’air ne dépend que de l’altitude y d ’après les condi
tions du problème, on peut écrire
5 J n{y) \/l -b æ'2 dy = 0
Les équations d ’Euler-Lagrange se réduisent dans ce cas à une loi de conser

vation, car l’intégrand ne dépend pas de la fonction x{y) :
d dF(y,x') dF{y,x') ^ d dF{y,x')

(P.73)
dy dx' dx dy dx'
ce qui produit une constante du mouvement
dF{y,x')
=K = constante. (P.74)
dx'
Dans notre cas précis, compte tenu de la forme imposée de la fonction n(y),
nous obtenons l ’équation que voici :
d(l - Cp{y))Vl + x'^ ^ x' (1 - Cpjy)) _

=K = constante. (P.75)
dy vT + "æ ^
Le sens géométrique de cette constante devient clair si l’on se rappelle que,

d ’après la figure (P.13), x' = tan^. Dans ce cas
x' _ tan^ _ .
\/l -f- æ'2 l-l-tan^^ ’
ce qui conduit à une simple expression
n(y) sin $(y) =K = constante. (P.76)
Il s ’agit tout simplément d ’une version continue de la loi de réfraction de Snell,

connue depuis le XVII-ème siècle : à la frontière plane entre deux milieux dont
les indices de réfraction sont respectivement n i et n 2 , l ’angle d ’incindence ôi

et l’angle de réfraction 6 r sont liés par la relation
n i sin $i = U2 sin 6 r
Cette relation reste valable sur chaque surface de séparation entre deux milieux
d ’indice n différent. C ’est pour quoi, dans le schéma simplifié d ’atmosphère
composée de couches minces, comme sur la figure (P. 13), on peut commencer
avec le premier angle d ’incidence 6 i, puis construire une chaîne d ’équations :
no sin Oi = n i sin $1 , n i sin 0 1 = U2 sin 02) sin $k —nfc+i sin ...etc.,
ce qui est une version discrète du constat que le long de la trajectoire du rayon
lumineux la quantité n{y) sin 6 reste constante.
C ette propriété de la réfraction de la lumière a une conséquence qui peut
sembler paradoxale : quelle que soit la loi n = n{y), l ’angle d ’incidence au
sol d ’un rayon lumineux venant de l’au-delà de l ’atmosphère, où no = 1,
dépend uniquement de la valeur d ’indice de réfraction au sol nô/ et de l’angle
d ’incidence initial Oi avec lequel le rayon a pénétré l’atmosphère, car on a
nsol^sol = no sin Oi = sin0j. (P.77)
En revanche, le point d’impact du rayon lumineux dépend de la loi n = n{y).

On peut utiliser l’intégrale première (P.75) pour essayer d ’intégrer l’équation
différentielle qui en découle :
x'njy) _ „ dx K
(P.78)
dy y/n^ - ■
Le résultat dépendra du choix de la fonction n{y).

P r o b lè m e 3.6. - G é o d é s iq u e s s u r u n c ô n e - S o lu tio n
En coordonnées cylindriques l’équation d ’un cône prend une forme parti

culièrement simple
= - p ~ - Jx^ + y^, o u p = a: (P.79)

a a ^
Le paramètre a, nombre sans dimension, est en fait la tangente de l’angle que
la surface du cône fait avec l’axe Oz.
On trouvera sans peine la métrique induite sur la surface du cône, en tenant
compte de la paramétrisation du rayon-vecteur
O M = æi -h 2/j + ¿;k = p co s^ î H- psin(pj + -k ,

a
d ’où, en choisissant comme paramètres z et (p,
(dOM)^ = ds^ = dp^ + p^dip^ + dz^ = (1 + c?) dz^ + a^z"^ d(p?.
On identifie alors les composantes du tenseur métrique induit :
Qzz = (1 + a ) , Ç(f)z — 9z(p — 0) 9ifi<p ~ (P.80)
de même, les composantes contravariantes sont :
9^^ = ( l + a2) a^z“^'

E t voici les seules symboles de Christoffel non-nuls :
-2 1
r * = ------— ~ r'^ = ^r'^
^ Zip ipz
= - (P.81)
^w 1 + ^2
Les deux équations de géodésiques sont comme suit :
d?z o2 i dtp\'^ „ d?(f dzdip

2
. № V =n ^ Z ds ds
(P.82)
ds^ 1 + a2 \ds) ’ d«2
L a seconde équation peut être obtenue à partir d ’une loi de conservation :
dzd(p 2^^
+ = (P.83)
ds \ ds J ds ds <p
ce qui est équivalent à la seconde équation après division par z.
Nous avons donc une constante sur la trajectoire.
ndip
z — =J= constante.. (P.84)
ds
qui permet d ’éliminer la dérivée de <p de la première équation, qui devient
maintenant :
/fi z (fi fi
On trouve une autre intégrale première en multipliant cette équation par

dz/ds :
dz dfiz ficfi dz \
ds Tds^
~77 j) ~ 1 , ^0 ■jTTîf ~
1 + o2 ds z^
l’équivalent de :
/d zy J2a2
= 0. (P.86)
\ds) 1 + d 2 Z^
Nous avons donc une nouvelle constante :
'dzŸ „2 n
(P.87)
où nous avons posé

L ’équation du premier ordre qui en découle peut être intégrée sans diffi
culté :
B2 dz
^ = ± \ H ^ — ) soit = ds. (P.88)
ds V B2
•Jïr^
Multiplions le numérateur et le dénominateur par z :
zdz zdz _ __ W
2 ^) = ds.
J52
Posons u = z^ ; l’équation à résoudre devient alors comme suit :
hd{z^) du
= ds,
et s ’intégre immédiatement :
H {s -so ) = J z ^ - ^ z= ± h J { s^ + ^ . (P.89)
Notons qu’il est toujours possible de choisir le paramètre s de manière à rendre

«0 = 0, ce qui simplifie l ’écriture. Insérons la solution obtenue dans l’équation
pour la variable <p; on obtient alors
dip _ J J _ ds
(P.90)
Ici aussi, la primitive est bien connue :
J {<p-po) = ^ Arctan (P.91)
d ’où il vient
B
-<ô) = A rctan J s = ^ ta n
On peut supprimer la constante d ’intégration (po en choisissant un pa

ramétrage différent de l’angle ip. En éliminant la variable s, et en utilisant la
relation tanÔ! -H 1 = ^^ 2 ^ , on finit par trouver l ’équation de la géodésique
sur un cône :
z=± (P.92)
H cos ( ^ 99)
avec = 0^/(1 -f a^), les constantes J et H devant être déterminées à partir

des conditions fixant les extrémités de la géodésique recherchée. Elle coïncide
avec une droite une fois le cône découpé le long une des droites génératrices,
et déplié sur une surface planaire.
Le même problème peut être abordé directement en termes d ’un principe
variationnel, en omettant la dépendance explicite du paramètre s. La forme
particulière de l’élément de longueur restreint à la surface du cône donné par
son équation p = az,
ds = ^ ( 1 -t- a?)dz^ A a^z^dip"^
suggère le choix de l’angle <p comme variable indépendante. Nous pouvons

alors écrire :
ds = ^ ( 1 -f a^) + a^z^dtp. (P.93)
suite à quoi, le principe variationnel du chemin le plus court sur la surface du

cône pourra s’écrire comme suit :
(P.94)
et où le tout a été simplifié par le facteur constant -v/T+o^.

L ’unique équation d ’Euler-Lagrange conduisent, après quelques exercices
algébriques, à une relation non-linéaire, difficile à intégrer d ’une façon simple :
z" - - B'^z^ = 0 . (P.95)
Nous pouvons néanmoins utiliser l’intégrale première provenant du fait que

l’intégrand dans (P.94) ne dépend pas de ^p. L a combinaison
(P.96)
est constante sur les trajectoires z = z{(p), solutions de (P.94). On trouve sans
peine :
, dL
L= — \/z'“^-I- B'^z^
^ dz' + 52^2
;г/ 2 _ / 2 _ д 2 ^ 2
= Я<0.
V z'"^+ B^z“^ y/ z'^ + B^z“^
En élevant la dernière égalité au carré on obtient
B‘^z‘^= (^z'^ + 5 2 ^2) ,
d ’où l ’on peut extraire la dérivée première de z :
Ë l
52 > (P.97)
dip
conduisant à l ’intégrale
f ■ j-~ - = b4 dip.
Я2
W
L a primitive de l ’intégraud à gauche est bien connue ; on a donc
^ Arccos = B^{<p - ipo) (P.98)
en accord avec le résultat obtenu précédemment.
Problème 3.7 - Géodésiques sur une sphère - Solution

On peut aborder ce problème de deux façons : soit par la solution directe
des deux équations pour géodésiques avec la métrique induite sur la sphère et
les symboles de Christoffel correspondants, soit en traitant la sphère comme
surface de contrainte dans le problème d ’extrémum lié formulé en trois dimen
sions. Commençons par la méthode directe.
Introduisons les coordonnées angulaires paramétrant la surface de la sphère,
9 et y>, de manière habituelle : tout point de la sphère définie par la relation
X2 +, y 2 +I z'^
2 Д2
peut être répertorié à l’aide deux angles 6 et dits l’angle polaire et angle
azimutal :
X = Rsin 9 cos (f, y —Rsm9smip, ; z = R cos p. (P.99)
On trouve en différentiant et en élévant au carré les différentielles dx, dy et

dzle le carré de l ’élément de longuer sur la sphère qui est donné par
ds^ = da;2 -f dy^ + dz“^ = R^d9^ + R^ sin^ 9 dp^ (P. 100)

Le tenseur métrique sur la sphère et son tenseur inverse (contravariant) sont

alors comme suit :
gee = R^, geip = g ^ = 0, g<fiip = R sin 0 ,

1 ... ... 1
9 ^2> 9 (P .lO l)
R? sin^ 0
Le tenseur métrique est donc diagonal, et les symboles de ChristofFel corres
pondants sont faciles à calculer selon la formule
^jk ~ 2 0 ^^ iîgmj + djgim —dmgij) h j ~ (P.102)
On a :
r^^ = 0, = = r j ^ = - s in 0 c o s 0 ,
pV’ _ 0 p¥> - p¥> _ . ^ r:^^ = 0. (P.103)

^ - U) sm 0
Les deux équations définissant une géodésique prennent alors la forme sui
vante :
dP0 . „ „dipd^p
--sin 0 cos0 - ^ - ^ = O,
d^tp ^ 2 cos0 d0 dp _ Q
(P.104)
ds“^ sin 0 ds ds
La géodésique peut être aussi bien définie par la dépendance explicite 0 =
0{p)isans faire appel à la variable indépendante s. C ’est exactement le même
procédé qui perm ettait d ’éliminer la dépendance temporelle d ’un mouvement
donné quand on s ’intéressait surtout à la forme de la trajectoire. Ici nous
aboutissons aux relations suivantes :
d? 0 _ dH fd p'Ÿ dB(Pp
(P.105)
ds dp ’ ds^ dp"^ \ ds / ^ dp ds“^
En remplaçant la dérivée seconde d'^p/ds'^ par son expression obtenue à partir
de la deuxième équation du (P.104) et en substituant les dérivées par rapport
à s par les dérivées par rapport à p dans l’équation différentielle pour 0 , on
obtient
(f0 2cos^ / d0
sin 0 cos 0 = 0 . (P.106)
dp“^ sm 0
L ’équation (P.106) présente l’annulation du produit des deux facteurs ; deux
solutions sont donc possibles. L a premère est évidente :
dp
— = 0 P = Pq = constante, (P.107)
ds
ce qui définit un méridien (ou sa partie, cela dépend des conditions aux limites)
sur la sphère, autrement dit, le segment d ’un grand cercle.
On pourrait avancer que, compte tenu de la symétrie parfaite de la sphère,
le repère cartésien centré en O peut être choisi de manière arbitraire, et les
angles 6 et if peuvent eux aussi être choisis autrement. D ’où la conclusion
que toutes les géodésiques sur la sphère doivent coïncider avec les segments
des grands cercles. Mais nous pouvons le prouver de manière plus élégante, en
résolvant l’équation, imposée par la deuxième condition :
Se 2cos0 / de _
sin ^ cos ^ = 0. (P.108)
d(p^ sin e V dip)
Compliquée à première vue, cette équation peut être simplifiée grâce à un

changement de variable. Posons cos0/sin^ = u. On aura alors, en calculant
les dérivées composées.
cos e du _ 1 de S u _ 2 cos e de Su
U = siS e (P. 109)
sin ^ ’ dp s iS e d p ' dp^ sin0 dp dp"^'
d ’où
d?e 2 cos e de Su
sin^ e (P.llO )
dp"^ sin0 dp dp"^'
En substituant (P .llO ) dans (P.108), les termes avec la dérivée première de e
s ’annulent mutuellement, et l’on trouve
• 2 fl d?u cose
V sin e cos e = —sin^ e
dp'^ sin e
= 0, ( P .l l l )
ce qui équivaut (sauf le cas singulier sin0 = 0) à l’équation de l’oscillateur

harmonique de fréquence égale à 1 pour la fonction u{p) :
d?u
(P.112)
L a solution générale est donc
/ \ cos^ . , „ .
U(p) = —— T = A cos p + Bsm p. (P. 113)
sm^
En multipliant par sin e on arrive à la relation implicite entre les angles e et

(^, définissant une géodésique :
sinocosv?+ Bsin^siny? - cos^ = 0 (P. 114)

En multipliant cette relation par le rayon du cercle R, on reconnaît l’équation

d ’un plan passant par l’origine des coordonnées, donc par le centre de la
sphère :
A Rsinôœsip + B Rsm 6 sm(p —Rcosd = ax + —z = 0 (P.115)
Les coëfficients a et P étant arbitraires, cela définit un plan arbitraire passant

par le centre de la sphère ; l’intersection entre un tel plan et la sphère définit
un grand cercle. Toutes les géodésiques sur une sphère sont donc des segments
des grands cercles.
Il y a une autre manière de traiter ce problème : avec l’approche utilisant
l ’extrémum lié et un multiplicateur de Lagrange. En trois dimensions eucli
diennes l’équation d ’une géodésique s’obtient à partir du principe variationnel
suivant :
et conduit au système de trois équations indépendantes,
^ = 0 ^ = 0 — = 0 (P.117)
dont la solutions est évidente en termes du trièdre de Prénet

'dx dy dz'
t= = constant, n = 0, b = 0, (P.118)
ds' ds' ds
ce qui correspond à une droite colinéaire avec le vecteur constant t.
Les géodésiques recherchées devant se trouver sur la sphère définie par
l’équation $ (x , j/, z) = x^ + y^ + z^ —R^ = 0, nous pouvons traiter le problème
comme recherche d ’un extrémum lié. Le principe variationnel modifié s’écrira
alors comme suit :
/ m ) H ï ) < î )
ds —0,
(P.119)
où A est le multiplicateur de Lagrange. Les équations différentielles modifiées
deviennent alors :
d?y ¿/2jT
ds2
- 2Xx = 0,
’
^ 2Ay = 0, -^ -\z = 0. (P.120)
on a donc trois équations linéaires de second ordre, identiques. Les solutions

changent de caractère suivant le signe du facteur A. Si A était positif, cela
conduirait aux solutions en forme d ’exponentielles.
x{s) = A e ^ ^ + B e ~ ^ \
idem pour y et z, tendant vers l’infini quand s -» ±oo, ce qui ne devrait jam ais
arriver aux coordonnées restreintes à la surface de la sphère. Il faut donc faire
le choix A < 0, donnant lieu à des solutions oscillatoires et bornées, du type
cosw s et sinw s, avec u> = y/\ 2A |. Dans ce cas la solution complète devient :
X = Al œsus+Bi sin ws, y = A2 cosus+B^ sinc<;s, z —As cosus+Bs sin ws.
Puisque les trois expressions représentent les combinaisons linéaires des deux
fonctions indépendantes, cos los et sinws, on peut trouver trois constantes
rélles a, fi et j rendant nulle la combinaison linéaire ax + fiy + yz —0, ce
qui équivaut à définir un plan passant par l’origine, dont l ’intersection avec la
sphère est la géodésique cherchée.
4. Formalisme hamiltonien
P ro b lèm e 4.1. T ran sfo rm atio n canonique, form alism e h am ilto n ien -
S olution
La) : Les impulsions canoniques sont définies par
dL
Pi =
dqi'
donc dans notre cas,
dqi dq2
dt ’ dt '
(ce qui correspond au choix de masse unitaire, m = 1.
l.b ) : Le hamiltonien est donné par son expression canonique,
„ -9L
H = q i-^ - L
dq
exprimé à l’aide de variables canoniques. On obtient alors :
Pi+P^ +
1 2 ,
qî + qi
2
2A2
l.c) : Les crochets de Poisson entre les nouvelles variables, calculés par rapport
aux anciennes variables selon la formule :
Ë L Ê l-Ë L Ê l
dpi dq^ dq^ dpi
FORMALISME HAMILTONIEN 383
donnent en effet le résultat escompté,
= = {PiiQj} —îji
prouvant ainsi que la transformation proposée
(Pi,qj) {Pk{Phqj),Qm{Pi,qj)
est une transformation canonique.
Le calcul est un peu long, mais n ’utilise que les formules de la dérivation
composée. Voici, en guise d ’exemple, la vérification que {P i, Q i} = 1 :
{P i Qi} =
dqi dp2 dq2 dqi dpi dq2 dp2 ‘
Puisque
_ n f _ n
dp2 ^ dq2
l’expression se réduit à deux termes seulement :
dP\ dQi dP\ dQi
{ P i ,Q i } =
dpi dqi dqi dpi '
on a facilement
tandis que la dérivée de par rapport à qi donne :

1
1 A (A rc ta n ^ ) = i X^ X
' \2r»2
(le deuxième terme dans la définition de Q i ne dépend pas de qi). Après la

simplification, on obtient juste
1 aV5
Maintenant passons au terme avec le signe “moins” :
dq2 dp2
la dérivée de P i par rapport à qi donne juste 2çi ; il reste à dériver Qi par
rapport à p i, ce qui donne :
1 a A rc ta n (^ ) _ ^ (-¿ )
dpi \ 1+ ^ ’
et en fin de compte,
9?
En additionnant les deux termes, on trouve
A^P? 9? ^ + A^pf
= 1.
QÏ + A2p? A2p? + g? A2pf +
Les trois autres crochets de Poisson sont calculés de manière analogue, et

donnent le résultat escompté.
l.d ) : S ’étant assurés que les nouvelles variables ont été obtenues via une
transformation canonique, nous pouvons écrire les équations de Hamilton cor
respondantes :
dQi _ dH
dt dQi ’ dt dPi ’
avec Ê ( P i , Q j ) = P2 . Cela donne :
dQi dH
= 0, donc Qi = B,
dt dPi
dQ2 dH
= 1, donc Q2 = t + T,
dt dP2
dPi dH
= 0, donc Pi = A.
dt dQi
m dH
= 0, donc P2 —E.
dt 9Q2
où A, B, T et E sont des constantes, à déterminer à partir des conditions
initiales.
L a solution en termes de nouvelles variables est donc extrêmement simple.
Notons que P2 = constante exprime la conservation de l’énergie totale du
système, car rien ne dépend de temps t explicitement.
l.e) : Il nous reste à exprimer les mêmes solutions en fonction des variables
d ’origine, (pi,qj)- Commençons par Q2 = t + T\ on peut toujours choisir
l’origine du temps de telle sorte que T = 0, on adm ettra donc Q2 = t. Dans
ce cas,
A A rctan ( =t , -¥ = ta n (|),
\Ap2/ Ap2
soit
^ _ A sin(t/A)
P2 cos(i/A)
Com pte tenu du fait que p2 = dq2 /dt, on trouve que
Q2 = Xa sin(i/A), P2 = a cos(i/A).
avec O une constante à déterminer à partir de conditions initiales. Nous savons

aussi que = B = constante. En remettant la valeur obtenue de Q2 dans
l’expression explicite pour Q i, on obtient
1
Q . = B = -—
2A ( ^ ) ■1 •
L a seule façon d ’éviter la dépendance de Qi du temps t est d ’adm ettre que
Arctan ~ ^ ^ ~
ce qui donnera Qi = K /( 2 X) = B, la nouvelle constante K s’exprimant à

l ’aide de la constante B. On trouve alors
Qi
Xpi
= tan
œ + K,
ce qui conduit à la solution
qi = Xb sin(^ + C), pi = b cos(^ + C),
avec les constantes 6 et C à déterminer à partir des conditions initiales.
Problème 4.2. - Potentiel quartique - Solution

Le hamiltonien de départ étant donné par l’expression
on essaie (avec un peu d ’intuition, car une recette-miracle n ’existe pas, hélas !)
la substitution suivante, qu’il faudra tester avant de décider s’il s’agit d ’une
véritable transformation canonique :
(P.121)
ce qui perm ettra d ’écrire le nouvel hamiltonien sous une forme très simple,
H{P,Q) = Q‘^ - P .
(Nous avons le droit de poser H{P,Q) = H{P(p,q),Q{p,q) en vertu du fait

que notre hamiltonien ne dépend pas explicitement du temps t)
Mais avant d ’aller plus loin, on doit vérifier que la transformation (P.121)
est canonique. Pour ce faire, il faut calculer l’unique crochet de Poisson non-
trivial, celui entre les nouvelles variables P et Q. On trouve sans peine :
W 0}(p.,) = f w « - f ( - ^ ’ ) = 1-
ce qui prouve qu’il s ’agit bel et bien d ’une transformation canonique.

Etant donné que H—H = O, nous pouvons chercher une fonction génératrice
en comparant sa différentielle totale à l ’espression pdq — PdQ. Choisissons la
fonction génératrice du type $ (ç, Q) ; dans ce cas, on doit avoir
pdq - PdQ = d^q, Q) = ^ d q + ^ dQ, (P.122)
ce qui conduit, en identifiant les différentielles indépendantes, aux équations :
„ 4
(P.123)
d ’après (P.122) et la définition de P, L a deuxième équation peut être résolue

en traitant q comme une constante ;
^ = Qq^ + F(qy,
dQ
L a fonction F{q), qui joue le rôle d ’une constante d ’intégration par rapport à
la variable Q, peut être égale à zéro ; en effet, si nous posons #(ç, Q) =
en prenant la dérivée de cette expression par rapport à Q, on trouve
^<5 = ^ .
conformément à la définition (P.121).

Donc, le nouvel hamiltonien H = Q"^—P peut être utilisé pour la résolution
de notre problème.
Les équations canoniques exprimées en termes des nouvelles variables (P, Q)
sont :
ÔH _ ÔH _ dQ
ÔQ ~ dt' d P ~ dt'
ce qui donne
dQ
= -l, = -2Q. (P.124)
dt dt
L ’intégration est immédiate, et donne
Q = Q o-t, P = 2 t- 2 Q o - ^ P = t^ -2Qot + Po. (P.125)
Nous pouvons vérifier en passant que
H = Q ^ - P = t^~ 2Qot + Q l - (¿2 - 2Qot + Po) = Ql~Po
qui est une constante, comme il se doit pour un hamiltonien ne dépendant pas
de temps.
A présent, on peut revenir aux variables canoniques d ’origine, (p,q). Nous
trouvons alors
-^q^ = 2 Q o - P o - t ^ ,
P
Q = {Qo-1) V ’
d ’où il vient que
q = ( 2Q ot-Po-t'^y ,
3
P = 4g^(Qo ~t) = 4(Qo - t) (2Qot - P o ~ t ^ y .
Le mouvement est périodique, car la variable q doit rester réelle, ce qui n’est
possible que si
2Qot - P o - t ^ > 0 .
En i = 0, on a —Po > 0, donc cette constante d ’intégration doit être négative
ou nulle, Po < 0. Dans ce cas on peut écrire
q = 2Qot+ I Po I > 0,
ce qui peut être vérifié pour t compris entre 0 et la valeur tmax = T, racine de
l ’équation
- 2Q oT + I Po 1= 0.
Au-delà de cette valeur, quand q devient formellement négative, pour que le

mouvement puisse continuer, on prendra, pour t > T,
q = [-2Qot- I Po I +t^] ^,
et tout recommence dans le sens contraire.

Puisque nous avons H = E = Constante, et q reste circonscrite par sa
valeur maximale atteinte quand dq/dt = 0, soit quand 2Qo — 2i = 0, donc en
t = Qq, nous avons qâx =| | +Qo- Par conséquent, p doit rester bornée
également afin d ’assurer H —constante.
En outre, à cause de la présence du terme dans le hamiltonien, p

doit tendre vers zfo en même temps que q ; en effet, en substituant, on trouvera
que
p^ = IQHq^ - soit p = ±4.q^{E - q^),
d ’où
Pmax — ^ Q m a x i ^ Qmax)i Pmin — ~ P m a x -
P r o b lè m e 4.3 . - S y s tè m e c o n s e r v a tif - S o lu tio n
Le lagrangien d ’une masse ponctuelle évoluant dans le champ des forces dérivant
du potentiel à symétrie sphérique s’écrit comme suit :
L= ^ -V {r). (P.126)
En coordonnées sphériques, la même fonction devient
2 /Jû \2 / J ,.\ 2
(I) (f) V{r). (P.127)
On trouve facilement les impulsions généralisées en dérivant par rapport aux

dérivées temporelles correspondantes, r, 6 , ¡p :
P r = m r, pd = mr^ 6, Ptp = sin^ 6 <p. (P. 128)
Le hamiltonien, dans le cas du lagrangien ayant la forme T —V, avec T une

forme quadratique en vitesses et V ne dépendant que des coordonnées est,
selon la formule d ’Euler, H = T + V, on &donc, en coordonnées sphériques.
m ( dr\^ 2 id0 \ ‘
" - - 2 U) +’■U) + F ir ) .
Il faut l’exprimer en fonction des impulsions généralisées obtenues ci-dessus ;

voici le résultat :
pI GMm
Pr + ^ + (P.129)
« =? sin^ 0
où nous avons remplacé l ’expression générale d ’u n potentiel y ( r ) par le cas

spécifique du potentiel Newtonien.
Pour vérifier que le vecteur de Runge et Lenz est une constante vectorielle
du mouvement, il est plus pratique de revenir aux coordonnées cartésiennes.
Les expressions vectorielles peuvent être représentées par leurs composantes
cartésiennes. Nous écrirons alors, alternativement, p ou pi, r ou æ*, puis le

hamiltonien aussi de deux façons suivant le cas :
GMm pip'’ GMm

-------- , ou
2 m r 2m %/x^ + y^ + z'^
ainsi que le vecteur du moment cinétique
J = mr A V= r A P, ou eikix^pu
et le vecteur de Runge-Lenz :
_ P . , GMmr , pk - GMmx^
Li — AJ ou 1 %— îkl *Il *
m r m r
Avant d ’attaquer le calcul des crochets de Poisson, rappelons quelques règles
qui permettront de le simplifier : les crochets de Poisson entre deux fonctions
dépendant uniquement des variables pi sont identiquement nuis, comme ceux
entre deux fonctions de coordonnées æ*’. A part celà, on peut utiliser le fait
que le crochet de Poisson est une dérivation qui vérifie la formule de Leibniz :
on pourra donc écrire
{ i i , p A J} = { i î , p } A J + p A { i î , J } , etc.
Nous avons donc

r-TT-r-v P , GMmr^ r ,. P i , P f , , ,1 GMmr.
{H,L} = { H , ^ A 3 ------- } =
m r m m r
Nous savons par ailleurs que le moment cinétique J est une quantité vectorielle
conservée, d ’où { i ï, J } = 0, ce qui laisse deux termes à évaluer.
(P.130)
m r
Le hamiltonien est constitué de deux termes, dont le premier dépend uni
quement de P , et le second est fonction des coordonnées exclusivement. Par
conséquent, on ne retiendra dans les crochets de Poisson que les parties sui
vantes :
P , GMmr p, , GMmr. , p^ GMmr

}
m
En outre, dans les deux crochets on peut simplifier par m (qui apparaît tantôt
dans le numérateur, tantôt dans le dénominateur) ; et ne pas tenir compte du
facteur commun GMm, ce qui permet d ’écrire
(P.131)
C ’est le moment de passer à la notation avec indices : on remplacera p A J

par sa i-ème composante (-ikmPkJm (où l ’on somme sur les indices répétés, k
et m ; de même = PkP^, etc.) L ’expression (P.131), à travers son i-ème
composante, s ’écrira comme suit :
1 1 / 1 I
îk m {P k i “ } J m ~ X { P l P > } = H k m iP k t “ } J m ~ P l { P i }•
r Z r V V
(puisque le crochet { H , p i p ^ } équivaut, par la règle de Leibniz, à 2 p i { H , j / }

En substituant l’expression explicite du moment cinétique, Jm = ^mraX^Pst on
obtient
1 • 1 • 1
îkm^mrs X^Pa i P k , - } ~ P l {p^, X^}--------p/X* “ }•
r r r
On somme de 1 à 3 les indices identiques, ce qui donnera
îkm^mrs ~ {îr^ks îa^kr)\

d ’où le résultat intermédiaire
X iP k {P k , - X k P i{p k , ^ } - P k { p ' ' , X i ) - P k X i { p k ,
(Nous avons changé l ’indice “muet” de sommation dans les deux derniers
termes, en remplaçant p/p* par PkP^)- Le premier terme et le dernier terme
s’en vont ; ce qui reste donc est la somme de deux termes restants :
- X k P i i P k , - } - Pfc { p * , X i ) (P.132)
Le crochet de Poisson entre p** et Xj vaut ; il reste à calculer le crochet

{Pfc.f} :
fjj i \ = V ^(f) _ ^Pk ^(f) _ rm f

^ ¿^dpmdx^ dx^dpm n r^J’
ce qui donne après l’insertion dans (P.132),
k l _ Xkx'^Pi Pi
-X k P i -PkSt-^
= ^ - 7 = 0- (P-133)
ce qui prouve que { if, L } = 0, le vecteur L est donc conservé au cours du

mouvement.
Le sens géométrique du vecteur de Runge et Lenz devient plus clair si nous

remarquons qu’il est identiquement nul pour une orbite circulaire.
En fait, ce vecteur se trouve dans le plan du mouvement, étant perpen
diculaire au vecyeur du moment cinétique J. Pour une orbite elliptique, il
désigne la direction vers le périastre, qui reste constante au cours du mouve
ment Keplerien. L ’avancée du périhélie du Mercure (environ 43” par siècle) a
constitué un test important pour la théorie de relativité générale d ’Einstein,
qui modifie la loi de gravitation de Newton et permet de calculer exactement
ce phénomène.
P r o b lè m e 4.4. - F o rc e d e L o r e n tz - S o lu tio n
Voici le lagrangien servant d ’intégrand du principe variationnel conduisant

à l ’équation du mouvement d ’une particule massive chargée dans un champ
électromagnétique ambiant représenté par le quadri-potentiel [$, A] :
,2
mv“
L= — еФ -f- - A V. (P. 134)
c
Les équations d ’Euler-Lagrange peuvent être écrites en utilisant la notation
vectorielle :
d dL dL e d A . ‘\
OÙ l’on dérive seulement le potentiel-vecteur A par rapport à r, car v est

considéré comme une variable vectorielle indépendante de r. e premier terme
(la dérivée par rapport au temps) est calculé comme suit :
d dL _ dv e dA e dA dæ*
(P.136)
dtdv ^ dt ^ c dt ^ c dx^ dt ’
car le potentiel-vecteur A peut dépendre de t explicitement, mais aussi - et
surtout - à travers les variables æ*, qui sur la trajectoire de la particule de
viennent fonctions de t. L a dérivée du lagrangien par rapport aux coordonnés
sont aussi faciles à calculer :
dL dФ e dAi ^
= —e
dx'^ dx'^ c
où nous avons utilisé la notation avec des composantes. L ’équation (P. 135)
pourra s’écrire alors comme suit, en remettant tous les termes sauf l’accélération
m v à droite :
dvk dФ e dAk e dAi ,• e dAk
dt = '' dx^ c dt +' c dx^ '' - ï fccdx^
î-.
Les deux derniers termes sont identifiés comme produit vectoriel de la vitesse
par le vecteur du champ magnétique B , car
dAi dAk
dx^ dx^
On identifie également les composantes du champs électrique :
1dAk
Ek =
dx^ c dt ’
ce qui permet d ’écrire finalement la forme bien connue de l ’équation de mou
vement d ’une particule chargée soumise à la force de Lorentz :
dmv
eE + -V AB. (P.138)
dt c
Passons à présent au formalisme hamiltonien.

Les impulsions généralisées (dans le système des coordonnées cartésiennes)
s’obtiennent en dérivant cette expression par rapport aux vitesses ; en notation
vectorielle on trouve facilement :
e * 1 / e ^\
P = — = mv + -A - > v = — P ----- A (P.139)
ov c m \ c J
La fonction de Hamilton s’obtient facilement avec la définition :
TT= v • —
H dL T
-----L = m v •V + - ÂK• V — L,
T
ov c
ce qui donne
TT mv‘
H = —- — 1- e$. (P. 140)
Il faut encore l’exprimer en fonction de variables p et r. On obtient alors, en

utilisant (P.139),
(P.141)
Les équations canoniques conduisent au résultat attendu :
dH _ ^ J _
dp dp 2 m
coïncidant avec la définition de l’impulsion canonique (P.139). La seconde
équation canonique est
dp dH
(P. 142)
dt dv ’
pouvant être explicitée comme suit :
d{mv) edA d^ ^ 9 f e .Y
dt
ce qui donne, après avoir reporté sur le côté droit la dérivée dA/dt,
d{mv) _ edA
dt ^ dr c dt ^
En procédant comme pendant l’établissement des équations d ’Euler-Lagrange,
la dernière équation prend la forme suivante :
d(mv) edA e
ce qui est une autre forme de la force de Lorentz (P. 138).
Problème 4.7. - Fonction génératrice - Solution

L a fonction génératrice proposée dépend des variables {q, P) et est donnée par
l’expression
$ ( 9 ,p ) = g V .
On doit définir le passage des coordonnées canoniques anciennes (q,p) aux

coordonnées canoniques nouvelles (Q, P). Pour ce faire, nous devons résoudre
les équations différentielles suivantes :
qui conduisent aux relations implicites
Q= P = 2qe^.
Puisque = p/2q, on trouve facilement, par substitution, les expressions
explicites :
i> = l o g ( | ) , « = f . (P.146)
Maintenant il ne reste qu’à vérifier que la transformation (P.146) est une

transformation canonique, à l’aide du critère de conservation des crochets de
Poisson. Le calcul est aisé :
/pm
f > J (p.9) Q p Qq Qq Q p ’
On trouve sans peine :
^ _ J _ ^ _ 1 ^ _ p dPdQ
dp 2 q P p' dq 2 dp dq 2’
^ ^ /_ p \ 2 . _ _ Jl ^ - 1 dP dQ 1
dq P \ 2 / q^ q^' dp 2 ’ dq dp 2’
394 SOLUTIONS DES PROBLÈMES
ce qui donne
SP n \ =
Qp Qq
^
Qq
^
Qp
- 13 _ VÎA\
2/
- 1
’
la transformation est donc canonique.

Pour trouver la fonction génératrice Ÿ(p, Q) conduisant à la même trans
formation canonique, nous devons résoudre deux équations aux dérivées par
tielles :
(selon le schéma d ’une fonction génératrice appelée $3 dans le chapitre 4). En

explicitant les variables {q, P) en fonction des variables restantes (p, Q), on a :
Les équations à résoudre prennent donc la forme suivante :
(P. 148)
dp p' dQ
On intègre la première équation de (P. 148) par rapport à la variable p, en

traitant Q comme une constante, ce qui donne
^ = - 2 Q log p + F{Q).
Effectivement, en dérivant cette fonction par rapport à la variable p, on arrive

à l’expression correcte q = 2 Q/p. Il reste à trouver la fonction inconnue F{Q)-
On intègre donc la seconde équation du système (P.148), en traitant cette fois
la variable p et ses fonctions comme constantes. Cela donne
d'if dF „ , i P^\
^ = - 2 1 o g p + - = - i> = - l o g ( ^ ^ j ;
mais cela équivaut à
21ogp “ ^ = log j = 2 log p - log Q - log 4,
d ’où on arrive à une équation simple pour la fonction F{Q),

dF
— = log Q -H log 4,
dont la solution est F{Q) = QlogQ —Q + Qlog 4.

En combinant les deux solutions partielles, on obtient le résultat final,
1lo g - ^ - 1;
n p ,Q ) = Q (P.149)
Problème 4.8. - Fonction génératrice à deux dimensions - Solution

On se propose de trouver la solution générale du problème dynamique régi par
le hamiltonien suivant :
P2 - P 1
H(pi,P2 ,qi,q2 ) = lO /-------- X -------- (P-150)
2 VPiqi+P 2 q2
à l ’aide d ’une transformation canonique engendrée par la fonction génératrice
suivante :
^{qi,q2 ,Pi,P 2 ) = 2{qiPi - q2 P2 f - (P.151)
Les équations définissant la transformation canonique avec ce choix de fonction
génératrice ont la forme suivante :
Qi —~ Pk = (P.152)
dqk'
Effectuons les dérivations ci-dessus, pour obtenir les relations implicites liant
entre elles les variables (qi,Pk) et les variables “manquantes” {Qm,Pj)
Qi = —4 qi(giP i — 92p’2)> Q2 = ^q2 {qiPi —92-P2),

Pi = 4 P i(q iP i - 92P 2)) i >2 = -4 P 2 (q iP i - Ç2P 2 )- (P.153)
Théoriquement on devrait trouver, en résolvant ces relations, les expressions
explicites donnant les variables (Pi,Qk) en fonction des {q%iPk)\ mais on
peut utiliser ces relations en les substituant telles quelles dans le hamilto
nien (P.150). Le résultat n ’est pas garanti, mais avec un peu de chance... -
effectivement, ici, ça marche :
P2 - P i = 4(P 2 — P i) ( ç i P i - Ç2P 2 );
P\q\ + P 2?2 = 4 ç iP i - 8 Ç1 Ç2P 1 P 2 + 4 Ç2 P 2 = 4 (91 P i - q2 P2 Ÿ\

en substituant, on trouve lun hamiltonien particulièrement simple ne dépendant
que de Pi et P 2 :
P ( P ,Q ) = P 2 - P i . (P.154)
Les équations canoniques s’intégrent immédiatement :
dPi _ dH_ dP2 _ 9H

dt ÔQi ’ dt dQ2 ~
d ’où l’on tire que Pi = Ai = Const., P2 = A2 = Const. Les impulsions

généralisées Pk sont donc constantes. Les coordonnées généralisées Qi, Q2
vérifient les équations canoniques que voici :
dQi дН dQ2 дН
= - l, = 1, (P. 155)
dt dPi dt dP2
dont les solutions sont
Qi —B i ~ t, Q2 = B2 +1, (P. 156)
avec deux constantes d ’intégration Bi et B2 . Ces solution sont très simples,

mais il nous faut revenir aux variables canoniques de départ, qi,Pk- Étant
donné que les impulsions généralisées pi sont des fonctions linéaires des coor
données il convient donc de commencer par trouver les expressions explicites
des fonctions qi(t) et 92 (0- En remplaçant les impulsions P i et P 2 par les solu
tions constantes Ai et A2 obtenues, on peut éliminer la variable q2 en utilisant
les relations (P. 153) :
4q?Ai-Qi
92 =
4qiA2
puis, en insérant ce résultat dans la deuxième formule, obtenir
4qfAi-Qi 4qfAi - Qi
Q2 = qiAi -
4qiA2 4qi
En remplaçant Qi et Q2 par les solutions Qi = Bi —t et Q2 = B2 + 1 , après

quelques transformations algébriques on arrive à l ’expression
(Bi+tŸ
9i(i) =
4{4A2{B2 -|- t) + Ai{Bi — i)) ’
et finalement
(Bi + t)
q i{ t) =
2 ,/{AA2 {B2 + t) + A i ( B i - t ) y
À partir de là on trouve q2 , puis les impulsions généralisées pi et p2 ; ce n’est

qu’un simple exercice de calcul algébrique.
Problème 4.9. - Rotations en trois dimensions - Solution
Pour prouver que dans le problème de Kepler le vecteur du moment cinétique
M reste constant, il suffit de montrer que son crochet de Poisson avec le hamil
tonien est nul. Com pte tenu de la symétrie sphérique du problème, contentons-
nous d ’une composante, par exemple Mg —xpy — ypx-
Commençons pax le crochet de Poisson entre pz et Mz :
f îi/f 1 \^ ( d p x d M z dpxdMz\ dMz

(P.157)
dx = Py
De la même manière, on trouve
iPy, Mz} = -Px et {pz, Mz} = 0.
À présent, on peut calculer le crochet de Poisson du hamiltonien avec la com

posante Mz- D ’abord, la partie +Pz) •
{Px + Py + P% Mz} = 2px{pxy Mz} + 2py{py, Mz} + 0
= 2pxPy - 2pyPx = 0. (P.158)
Le même résultat est valable pour les deux autres composantes du vecteur M .
Reste à calculer le crochet de Poisson entre Mz et le terme potentiel du

hamiltonien, mMG/r. Nous pouvons prouver un fait plus général, stipulant
que le crochet de Poisson entre M et une fonction arbitraire / (r) ne dépendant
que de la variable r est toujours nul :
{ / ( r ) , M j = | { r , M j = 0, (P.159)
(car le crochet de Poisson agit comme une dérivation sur les fonctions de
variables canoniques). En particulier, en utilisant la formule de Leibniz, nous
avons
{r^>Mz} = 2r {r,Mz}.
Il suffit donc d ’évaluer le crochet de Poisson {r^ ,M г} ; c ’est plus simple que
de calculer {r, Mz} car r contient une racine carrée et les dérivations sont plus
compliquées qu’avec r^. Nous avons donc :
{r^, Mz} = {x^ + y‘^+ z^, xpy - ypx}.

On vérifie facilement que {x^,xpy} = 0 et {y^,ypx} = 0, ce qui ne laisse que
deux termes,
{y^,xpy} - {æ^.ppx} = x{y^,py} - y{x^ ,px}
= —2 xy + 2 yx = 0.
Les calculs avec les composantes Mx et My sont similaires, et conduisent au
même résultat : les trois composantes du vecteur M gardent leurs valeurs au
cours du mouvement d ’une planète autour du Soleil, car
= = 0
Pour finir, vérifions la validité de l’identité de Jacobi sur un exemple concret :

démontrons que
{{Px,Py},Mz} + {{Py,Mz},Px} + {{M^,Px},Py} = 0 (P.160)
La relation (P.160) ci-dessus est vérifiée en effet. Le premier terme s’annule

car il contient le crochet {px,Py}i égal à zéro. Les deux autres crochets doubles
s ’annulent aussi, car {py,Mz} = — px, puis {Px,Px} = 0> finalement, dans le
troisième terme {Mg^px} = — Py, et {py^Py} = 0. L ’identité de Jacobi dans ce
cas précis est vérifiée de manière triviale, car chacun des trois termes s’annule
séparément ; ce n’est pas toujours le cas bien entendu.
5. Calcul tensoriel
P r o b lè m e 5 .1 . P r o d u it te n s o r ie l d e m a tr ic e s - S o lu tio n
a) Voici les produits tensoriels entre deux vecteurs
1
Vi = V2 = 4
représentés sous forme de vecteurs unicolonnes :
/ 3 \ / 3 \
4 6
Ul 0 W2 = , U2 0 Ui =
6 4
V 8/ vsy
Le produit vi 0 V2 peut s’interpreter comme “vecteur v\ dont chaque compo
sante a été multipliée par le vecteur V2 ", et vice-versa. On obtient v\ A V2 par
anti-symétrisation,
0 \
-1
Ui A Ü2 = 2 ^ 1 0 U2 - V2 0 ui]
1
0 y
b ) Représentons sous forme de matrices 2x2 les produits tensoriels d ’un vecteur
covariant (une ligne) avec un vecteur contravariant (une colonne) :
(1 2 ) 0 et 0 ( 1 2)
CALCUL TENSORIEL 399
Dans les deux cas on obtient le même résultat sous forme d ’une matrice :
G î) (P.161)
c) Il s ’agit de donner une représentation du produit tensoriel
Il s ’agit d ’un triple produit tensoriel entre le vecteur de base e i et un autre

vecteur de base, 62 apparaissant deux fois, soit
e i (g) 62 <8»62
C ’est aussi une bonne occasion de tester l’associativité du produit tensoriel.

Quel que soit l’ordre des multiplications, (ei ® 62 ) <
8 >62 ou 61 (g) (02 0 62 ), on
aboutit au même résultat. Pour économiser l’espace, nous le représentons sous
forme d ’une ligne avec le signe de transposition qui en fait une colonne avec
huit entrées :
(0 ,0 ,0 ,1,0 ,0 ,0 , O f .
P r o b lè m e 5.2 - T e n se u r d ’in e r tie - S o lu tio n
Considérons une distribution de masses représentée sur la figure (P. 14)

ci-dessous. C ette distribution peut être continue (comme sur la figure) ou
discrète, avec seulement quelques masses ponctuelles ; cela ne change pas la
construction du tenseur d ’inertie. Sur la figure, G est le centre de gravité de
l’ensemble des masses considéré, M la position d ’une masse ponctuelle m.
Dans le cas d ’un solide, la masse ponctuelle est remplacée par la masse d ’un
volume infinitésimal, dm = pdV.
(H) ' I
m -----
F i g u r e P . 1 4 - C o n str u c tio n d u te n se u r d ’in e r tie

Le moment d ’inertie d ’une masse ponctuelle m située au point M par

rapport à l’axe défini par le vecteur unitaire u est donné par l’expression bien
connue, I = md?, où d est la distance de la masse m de l’axe u. Selon le
dessin, il s ’agit de trouver le carré du vecteur M M ' ; en utilisant le théorème
de Pythagore, on a
(M M ')^ = (G M )^ - (G M ')^ = (G M )^ - ( G M • u)^.
Soient les coordonnées cartésiennes du point M (x, y, z) ; le vecteur unitaire

u sera donné par ses coordonnées cartésiennes u = Uxi + % j + % k , avec
“ !•
Nous trouvons alors
(M M ')^ = X^ +y^ + - {xUx + yUy + ZUz)^ =
{y^ + ul + H- x^) Uy + + y^) - 2xy UxUy - 2yz UyUz - 2zx UzUx.

(P.162)
Nous avons utilisé ici les composantes covariantes du vecteur u, mais en coor
données cartésiennes les composantes contravariantes u* ont la même valeur,
vu que y**’ = 5**’. L ’expression (P.162), multipliée par la masse m, est la contri
bution de cette masse au moment d’inertie en G par rapport à l’axe parallèle
au vecteur unitaire u. C ette expression peut s’écrire sous forme d ’un produit
scalaire entre le vecteur unitaire u et le vecteur du moment cinétique du solide
(ou d ’un ensemble de points matériels), J = lu , où / est le tenseur d’inertie,
dont les composantes sont données par les intégrales (sommes finies dans le
cas d ’une distribution discrète de masses) : ®
Ûx = J P (y^ + z^)dV, îyy = j P (z^ + x'^)dV, îzz = j P + y‘^)dV,
îxy —îyx —~ J pxydV, îyz —îzy ~ ~ J py^dV, îzx —îxz ~ ~ J pzxdV.

Nous pouvons donc écrire :
Jx \ ( Ixy Ixz
Jy -” 1 hx hy Iyz (P.163)
jJ \îzx ^zy îzz
Supposons maintenant que le solide tourne avec la vitesse angulaire u autour
de l’axe parallèle au vecteur u et passant par G. Le vecteur de vitesse angulaire
6. En vérité, il s ’agit d ’une m atrice agissant sur un vecteur, e t non pas d ’un tenseur deux
fois covariante m ais en coordonnées cartésiennes que nous utilisons ici, les com posantes du
tenseur et de la m atrice sont les m êm es).
est alors u> = w u. Le moment cinétique du solide est alors donné par le vecteur
J = Iu>; l’énergie cinétique de rotation est alors
Bain = = iu; •(î)w = io;24n V .
La même expression peut être déduite en sommant les contributions de chaque

masse (ou de chaque élément infinitésimal du solide). L ’énergie cinétique d ’un
point matériel est donnée par la moitié de sa masse multipliée par le carré
de sa vitesse. Dans le cas d ’une rotation pure autour du point G, de vitesse
angulaire u>, la vitesse du point G M = r du solide est égale à v = u> A r, son
énergie cinétique est donc
= ^pdV{io A r)^, (P. 164)
l ’énergie totale du solide étant donnée par l’intégration de cette expression sur
le volume du solide.
Mais le carré d ’un produit vectoriel est égal à l’expression bien connue
impliquant les produits scalaires uniquement :
(w A r)^ = - (w • r )^
ce qui s’écrit de la manière suivante en coordonnées cartésiennes (en utilisant

la convention d ’Einstein) :
(u> A r)^ = UiW^XkX^ —UiXÛkX^ = (SjSj^ — Slâf) (o^co^x^xK (P.165)
Le vecteur u> ne dépend pas de la coordonnée courante æ* par rapport à laquelle

on effectue l ’intégration. C ’est pourquoi l’expression de l ’énergie cinétique du
solide en rotation prend la forme déjà préconisée :
T = i 4 'w V , avec 4 = j p{x^) (ôjSt ~ 4 ^Î) dV. (P. 166)
P r o b lè m e 5 .3 - T e n s e u r d e s d é fo r m a tio n s - S o lu tio n On suppose que

les points d ’un solide sont paramétrés par leurs coordonnées cartésiennes
O M = æ i + y j + Z k.
Considérons une petite déformation définie par le champ vectoriel u (O M ) =

u(x,y,z), sous l’effet de laquelle tous les points vont se déplacer :
OM OM = OM + U, soit æ* i* = x* + u*(æ*^). (P.167)

On constate assez facilement que tout champ vectoriel u n ’engendre pas une
véritable déformation du solide : par exemple un vecteur constant u = C
définit une simple translation dans l ’espace, sans aucune déformation interne ;
le même constat concerne les rotations rigides données par un produit vectoriel
(50M = â(p A O M .
En fait, pour mesurer les effets d ’une déformation réelle du solide, il faut
comparer les distances infinitésimales entre des points voisins du solide. Tant
que toutes les distances à l’intérieur du solide restent les mêmes, la déformation
n’a pas eu lieu.
Nous devons donc considérer le comportement de la différentielle d O M
sous l’effet du mouvement infinitésimal engendré par le champ de déformation
u. On trouve, en développant et en gardant uniquement la partie linéaire de
la différentielle du*, l’expression suivante :
dx* = dæ* + ^ dæ'*, î ,A: = 1,2 ,3 . (P. 168)
/
Evaluons maintenant le carré de l’élément de longueur déformé
dp = guidx^ + ^dx^)(dx^ + ^ d x ^ ) =
dé
giidx^dx^ + gu dx'^dé + ^ d x * d x ”* J + 0{{duf). (P.169)
dx^
où nous avons traité les dérivées partielles du vecteur de déformation dmu'‘
comme quantités infinitésimales, négligeant leurs carrés et gardant uniquement
les parties linéaires.
L ’expression (P.169) peut s’écrire de manière plus élégante et compacte,
en changeant les indices de sommation :
dP = gu ~ gudx^dx^ + gu ^^dx^dx’’ + gu^dx^dx’‘, (P. 170)
équivalent à l’expression avec les indices covariants uniquement,
dp = gu gudx^dx^ + {diUk + dkUi)dx''dx^. (P. 171)
On appelle tenseur de déformation l’expression symétrique
(P. 172)
2 \dx^ dx^ )
Remarquons que dans la situation la plus générale la déformation locale peut
être accompagnée d ’un mouvement rigide infinitésimal. Pour distinguer entre
CALCUL TENSORJEL 403
Ni
F i g u r e P.15 - Un segment infinitésimal Ax = xi —x subissant une déformation

infinitésimale 5u, et le segment déformé, Ay = Ax + Au.
une déformation véritable et une rotation ou translation infinitésimale, considé

rons la figure (P. 15). Sous l’effet d’une petite déformation u(x) le point du
solide représenté par le vecteur x se transforme en point représenté par le vec
teur y = X -I- U. Soit xi = X -t- Ax un point voisin du point x, avec A x un
vecteur infinitésimal. Sous l’effet de la déformation, Ui(xi) = u -1- Au, il va
être transformé en un vecteur
yi = y + Ay = y -h A x -t- <îu,
comme le montre la figure (P. 15).

Puisque Ay = A x -t- iu , nous pouvons comparer les carrés des longueurs
de chaque petit segment, l’original A x et déformé Ay, en traitant i u comme
quantité infinitésimale par rapport à la déformation Ax. Suite à quoi on pourra
négliger le troisième terme du développement, quadratique en A u :
(Ay)2 = (A x )2 -I- 2 A x • (5u -h { S u f ~ (Ax)^ + 2 Ax • Su. (P.173)
Cette idée devient naturelle quand on remarque que, selon la figure (P. 15),
(5u = Ay —Ax, suggérant que 5u est une différence entre deux différentielles,
donc une quantité d ’un ordre plus petit encore.
L’hypothèse importante à ce point du raisonnement est que la déformation
infinitésimale 5u est une fonction vectorielle linéaire du vecteur Ax :
Sui eijAx^.
Par conséquent, nous avons
2Ax(5u = 2eij Ax'’5uK (P.174)

Notons que, si Гоп représente le tenseur ey comme somme de sa partie

symétrique et de sa partie antisymétrique,
Cy — "Г
avec
_1, _ 1, .
(P. 175)
seule la partie symétrique contribuera à l’expression (P. 174) compte tenu de
la symétrie du produit Ax'Âx^ ; la partie WyAæÂa;^ est identiquement nulle.
Le tenseur Wy n ’influence donc pas les propriétés métriques à l’intérieur du
solide ; en revanche, il contribue au déplacement de tous ses points sauf ceux
qui se trouvent sur l’axe de rotation. Introduisons le vecteur de rotation u>en
le définissant à l’aide de ses composantes :
(P. 176)
Dans le cas où la partie symétrique eÿ est nulle il ne reste que la partie

antisymétrique wy, et l’on peut identifier
ôu = u A Ax,
comme indiqué sur la figure (P. 16) (P. 16) :
F ig u r e P. 16 - Une rotation infinitésimale.
Revenons maintenant à une déformation pure, sans rotation rigide ; dans

ce cas on posera Uij = 0, Cÿ = Sij = Sji. Choisissons le vecteur Ax le long
de l’axe Ox, soit Ax = A x ei. Sous l’effet de la déformation suscitée par le
tenseur €ÿ, le segment Aæei est transformé en
A y = [ei (1 + Su + 02 S21 + 63 eai] Ax^

Le carré scalaire de ce vecteur est égal à
Ду 1^— [(1 + ^ll)^ + ^21 + ^3i] (A®^)^- (P. 177)

Si l’on garde uniquement les termes linéaires en tenseur de déformation, traité

comme une quantité infinitésimale, il ne reste que
Ay |~ (1 + £ ii) I Aæ I . (P.178)
La composante e n décrit donc l’allongement relatif d’un segment colinéaire à

l’axe i le long de cet axe ; les composantes £22 et £33 donnent les allongements
relatifs le long des axes j et k respectivement.
Pour constater comment varie un petit volume au cours de la déformation
décrite par le tenseur £y, on prendra le déterminant de la matrice jacobienne :
AV(y)
= det( 5ÿ + Sij) ^ 1+ £11 + £22 + £33- (P.179)
Nous voyons donc que c’est la trace du tenseur des déformations qui détermine
la variation relative du volume infinitésimal.
On peut arriver à la même conclusion en prenant la divergence du champ
Aj/* par rapport aux variables Ax* :
div Ay = £11 + £22 + £33-
P ro b lèm e 5.4 - T enseur d ’énergie-im pulsion - Soiution

Soit S 12 l’action correspondant à l’intégrale de C sur le 4-volume V compris
entre ces deux hyper-surfaces.
fS2
5 i2 = / c x^ ) < fx . (P.180)
Jsl
/Si
Soit ô(p°' la variation des paramètres, nous écrirons que S est stationnaire pour
des 5(p^ qui s’annulent sur S i et S 2 :
= 0, = 0, (P.181)
les surfaces S i, E2 restant fixées pendant la variation.

Nous savons, d ’après le chapitre 3, qu’un tel principe variationnel conduit
aux équations
dC ^ dC d _Q
(P.182)
d(p°' ^ d(p^ dxi^ Q Í ^ ’
qui sont les équations d’Euler-Lagrange du système décrit par des champs
ip°‘{x>^) où la densité de lagrangien C est une fonction des champs, de leurs
dérivées premières et des coordonnées x^.
Montrons maintenant que le tenseur d’énergie-impulsion

N
dL
Aî
du champ (p-’^ est un tenseur à quadri-divergence nulle, = 0, si la densité
lagrangienne L ne dépend pas explicitement de coordonnées autrement
dit, si dfji,L = 0.
La démonstration se fait par un calcul direct :
- a , (s î d
N /
dL dL
d^,5i^L.
A=1
Le dernier terme (avec le signe moins) contient une dérivation de la fonction
L qui dépend de à travers les champs et leurs dérivées partielles du^p’^-
En outre, dfi = du- En effectuant les dérivations composées, il vient
N N
dL
Le dernier terme s’en va avec le premier terme de la formule précédente, ne

laissant que l’expression
N
dL dL
= 0, (P.183)
A=1
^d{dfj,p^) dp^
égale à zéro en vertu d ’équations d ’Euler-Lagrange vérifiées pour toute valeur
d’indice A,
Cette définition générale peut servir dans le cas particulier d ’un seul champ
scalaire, dont la densité lagrangienne s’écrit
i = i _ !2 !„ 2 , (P.184)
dxf^ dx^'
2^ 2
L’équation d ’Euler-Lagrange est alors la fameuse équation de Klein-Gordon :
Sachant que g^^'' est un tenseur constant (en coordonnées cartésiennes!), et

que l’on a
d{dxp)
CALCUL TENSORJEL 407
on trouve
T>i, = dvip ■ 5^L - dx^pdv^p- ^ Si^g^Pdx<pdp(p - ^ ¥’^ . (P.186)

d{d^<p)
Vérifions la loi de conservation stipulant que d^Tif = 0.
dfiT^^ = d^dîp dx<p + di,(pd^dx(p
dudp(p da^p - d^dv<f dx<p + rri^(pdpip.

En arrangeant les termes, on retrouve l’équation de Klein-Gordon (multipliée
par du<p)i qui s’annule en vertu du principe variationnel correspondant au
lagrangien en question. Les trois termes restants,
dx^p - dudpip - d^dîp dx<p
s’annulent aussi ; il sufifit de renommer les indices de sommation pour rendre

ces expressions identiques et constater alors que 1 —^ ^ = 0.
P ro b lèm e 5.5 - T enseur d e M axw ell - S olution
Puisque Fpu est une 2-forme (tenseur 2 fois covariant), nous avons quasi auto
matiquement les lois de transformations accompagnant le passage d ’un repère
galiléen à un autre. Il faut appliquer la matrice de transformation de Lorentz
correspondante, et ce faire pour chacun de des deux indices indépendamment :
Fp'v' — û' Fpi/, (P.187)
de sorte à ce que l’équation pour la force de Lorentz garde la même forme dans
les deux repères. En effet, puisque la dérivée de la 4-impulsion par rapport à
s se transforme comme un 4-vecteur, dppi/ds = dpp/ds, nous avons aussi :
% ' -— 9 J?
—
y
P
„„
ou —Z
-
—
9 ^„ß u P U (P.188)
as me ^ as me
Un exercice utile, quoique laborieux, consiste à traduire les transformations
(P.187) en expressions contenant explicitements les composantes des champs E
et B. Dans le cas d ’une transformation de Lorentz particulière avec la vitesse
relative alignée sur l’axe Oæ, donc n ’impliquant que les variables æ et f tout
en laissant y et z inchangées, on obtient le résultat que voici :
JP ___ JP jp/ ___

Ey V-B
c
J-JX^ 2
72-
1D \ V TP r? V Z?
D/ _ D TDf _ By + -tfx _ B z-
B x' — Bx^ By! — ------ — J B z^ — -------
VTTg y T T ÿ ,2
On aurait pu déduire ces formules à partir de la transformation du quadri-
potentiel Afi : puisu’il s’agit d’une 1-forme, sa loi de transformation est celle
d’un tenseur une fois covariant, soit
Aî — Ajj,.
On peut arriver à l’expression de à partir, de la définition correspondante

du tenseur de Maxwell vu dans le repère %' :
= dîAî - diyiAf^r = d^t (A^, A^) -
" “ d ^ ^ ‘' ( ^ ï ' ^1^) >

ce qui mène, par linéarité et parce que la transformation des coordonnées est
une transformation de Lorentz, à
^ = A-‘
on arrive au résultat sans surprise :
■ F / i 'j / ' = d ^ iA i,! — diîA fjî = A ^ ,A '^ d fiA u — A '^ iA ^ i d „ A fi =
AJ,a ;;, {dÂ, - d,A^) = aj ,a ;;,f ^^. (p .iso)
6. Géométrie différentielle
P ro b lèm e 6.1. E llipsoïde de rév o lu tio n - S olution
La paramétrisation naturelle de l’ellipsoïde de révolution ressemble à celle

d’une sphère :
æ = a s i n0 c o s y = a sin ^ sin ^ , z = ccosO,
soit
O M = asindcosip i + asin^sin«/) j + ccosO k.
On trouve facilement les deux vecteurs de la base mobile, tangents à la surface :
e,^ = —asin^sinyj i + osin^cosy? j,
e^ = a cos ^ cos ^ i + a cos 0 sin y? j —csin 0 k. (P.190)

GEOMETRIE DIFFERENTIELLE 409
F ig u r e P. 1 7 - E llip so ïd e d e r é v o lu tio n , g ra n d a x e 2c, p e tit a x e 2 a .
La première forme fondamentale de Gauss est tout simplément la métrique.

Les composantes du tenseur métrique en coordonnées locales, 6, peuvent être
identifiées en prenant le carré d’un élément de longueur exprimé en fonction
des différentielles d6 et d(p :
dl = dOM = —TT^dUB H— r — dw = dip.

ad d ip ^
D ’où le carré :
(dOM)^ = {eed9+e,pdipŸ = {a^cos^9 + c^sin^6)dô^+a^sin^6 dip^ (P.191)
car on a
= (a^cos^^ + c^sin^0), eg-e^ = 0, e^ = a^sin^0.
donc ggg = sin^ 6 + +a^ cos^ 6, gg^ = g^g = 0, g^^ = (? sin^ 6. (P. 192)
L’élément d ’aire sur la surface de l’ellipsoïde peut s’obtenir de deux manières :
soit directement, comme produit vectoriel des différentielles
egdO A e,pdip
= (ûcsin^ 6 cos^ i + ocsin^ d s i n i p j + a^ sin 6 cos 6 k) d O d p , (P. 193)

l’élément d’aire est alors proportionnel à la valeur absolue de ce vecteur.
I dS 1=1 eg A e^dOdip |= ocsin^ cos^ 9 dOdip, (P.194)

f F i )
soit avec la formule du déterminant de la métrique,
I dS 1= y^[dêtgîj~\dOd(p = ^/gee9 ifiipdôd<p = acsin 0 y 1 — cos^ 6 dêdip.

(P.195)
L’aire de l’ellipsoide est donc égale à l’intégrale suivante :
27rac J ^ — ^1 — u^du, (P. 196)
où nous avons effectué un changement de variable, u = œsû.. Le résultat est

(selon les tables d ’intégrales)
A = 27ro c + 2
A rcsini/l — (P.197)
7^
On peut noter que, dans la limite c a, lorsque l’ellipsoïde tend vers une
sphère de rayon o, l’expression Arcsin e tend vers e, et l’aire A tend vers
l’expression A = 4na^, la formule bien connue d ’aire d’une sphère de rayon a.
Passons maintenant au calcul de la seconde forme fondamentale et de la
courbure gaussienne de l’ellipsoïde de rotation. Voici le vecteur n normal à la
surface :
a
n = sin^cosü? i + sin^sini^ j + - cos^k (P.198)
c
Il nous faut aussi calculer les dérivées secondes du vecteur O M :

dÔM
= —asin^cosyjî —osin^sin(/?j —ccos^k.
de^
= —acos^sin(î + ocos^cos^? j,
dOdip
dÔM
= —a s in ^ c o s ^ i —osin^sinvîj.
dip^
Les produits scalaires avec le vecteur n déterminent la seconde forme fonda
mentale :
-O -o sin ^ 0
■) ^0(p — —d, btp(p —
^ 1 - (l-ÿ )c o s 2 0 COs2 9
(P.199)
On peut donc évaluer la courbure gaussienne
W_%£_ _ (P.200)
2-
9669ifiip 9oip (p. ^ j cos^ ûj
La fonction K ne dépend que de la variable 9, comme cela doit être pour

un solide à symétrie cylindrique, dont aucune propriété ne dépend de l’angle
azimutal ¡p. Le maximum de l’expression (P.200) est atteint pour la valeur
maximale de | œ s0 |, soit aux pôles 9 = 0 (pôle nord sur la figure (P.17)) et
9 = TT (pôle sud). La valeur minimale de K est atteinte lorsque œ s9 = 0, c’est
à dire quand la fonction cos 9 atteint son maximum, soit 9 = 7t/ 2, ce qui est
réalisé sur l’équateur (l’intersection avec le plan (xy)).
On constate aussi facilement que la formule (P.200) tend vers la courbure
scalaire d’une sphère de rayon a = c = R, quand K = 1/iî^.
P ro b lèm e 6.2. C o u rb u re gaussienne d ’une p seu d o -sp h ère - Solution
F ig u r e P. 18 - Une tractrice. En la faisant tourner autour de l’axe vertical z, on

dessine une pseudo-sphère.
La tractrice est définie par la paramétrisation suivante des points de l’es

pace euclidien :
X = a sinucostp, y = a sin u s in ^ , z = acosu + ologtan ,
avec
7T
— <U < -ïï, 0 < U < 27T.
JU
Le rayon-vecteur reliant le centre du système cartésien aux points de la pseudo
sphère est donc
O M = O sin Ucos i -t- Osin Usin 9?j + jôcos « -H a log tan j k. (P.201)
Les vecteurs de la base mobile sont définis sur la surface de la tractrice comme
suit :
_ aoM _ aoM
du ’ dv ’
ce qui donne explicitement :
Bu = a co su c o su i + a co su sin v j + a sinu + -A —') k,

\ sm uj
By = —a sm u sm v i + asinucosvj. (P.202)
À partir de (P.202) on trouve la métrique induite sur la surface, en formant
les produits scalaires :
)COS‘‘U
9uu — . 9 ) Quv — 9vu — — b, 9vv — ©V * ^
sm“*«
(P.203)
Pour trouver la seconde forme fondamentale, nous devons tout d’abord définir
le vecteur n normal à la surface. Puisque
Bu A By — —a^ cos^ Ucos u i— cos^ u sin u j + cos u sin u k.
on a
n = T----------- r = -c o s u c o s u i —cosusm u 1 + sm uk. (P.204)

I eu A e„ I
Ensuite, il faut trouver les dérivées secondes du rayon-vecteur O M :
aÔ M
= —a sm u cos u 1 —o sm u sin
in u j —acosu f l- h ^ k,
au2 V sm'‘u /
aÔ M
= —a sin u cos u 1 —a sin « sin u j
at»2
aôM
= —a co su sin u i-t-o c o su co sv j.
dudv
Les composantes de la seconde forme fondamentale s’obtiennent à partir des
produits scalaires entre les dérivées secondes de O M et le vecteur normal n :
^ aôM cosu ^ aôM ^

Ouu — n • q . ,9 — 0 .. ) Oyy —n - - 5 7 ^ 7 7 — 0 ,
_ i„
du“ ^ sm u dudv
^ aôM
Oyy = II' —^ A = ocosusm u. (P.205)
dv^
Finalement, en appliquant la définition de la courbure gaussienne d ’une sur

face, on obtient
buubvv buvb'i
UV'JVU cos^ U 1
K = (P.206)
9uu9vv 9uv9vu cos^ U '
(nous avons utilisé les composantes symétriques b^v et ainsi que g^v et
Qvu pour la beauté de la formule, tout en sachant que, les deux formes étant
symétriques, on pouvait remplacer les produits buvbvu = b^y et 9uv9vu = 9uv)-
La courbure de la surface de révolution obtenue à partir de la tractrice
tournée autour de l’axe Oz est donc constante et négative. Rappelons-nous
que la courbure gaussienne d ’une sphère de rayon R est constante, positive,
et égale à 1/R^; c’est pourquoi la surface étudiée dans ce problème mérite
pleinement son nom de pseudo-sphère, autrement dit, une surface de courbure
négative constante.
Ayant à notre disposition la première forme fondamentale (tenseur métrique)
définie par (P.203), nous sommes en mesure de calculer les coefficients de la
connexion (symboles de Christoffel), puis le tenseur de Riemann de la surface
étudiée.
Calculons les symboles de Christoffel correspondant à la métrique (P.203)
induite sur la surface de la pseudosphère. Cette métrique est diagonale, grâce
à quoi le tenseur métrique contravariant a pour composantes
gU U ^±_^ gUV^gVU^QQ^ g W ^ J _
9uu 9vv
Nous avons donc
pw _ 1 ^9uu pv __ 1 ^9uu pu _ pu _ 1 ^9uu

ûu ûu ûv
^Quu du ’ ^9vv ‘2‘9uu du
pv __ pv 1 ^9vv pu _ ^ d9vv pv _ 1 d9w

uv ^vu > ^vv 9 vv
^9vv du ^9uu du ’ ^9vv dv
Le tenseur de Riemann à deux dimensions n’a qu’une seule composante
indépendante : on peut s’en convaincre en considérant sa version totalement
covariante, Rijki = 9km ^ propriétés de symétrie remarquables
(en dimension arbitraire) :
^ jk l — Rjikl — Rklij — Îkij (P.207)
La preuve est assez fastidieuse et se fait par calcul direct à partir de la définition
du tenseur de Riemann,
Â m _ Q Y^m Q -pm • p m pA; p m pA;
ij l - j l - O j l II + i i ^7 - i jk ^ il- (P.208)
En deux dimensions il suffit donc d ’évaluer la composante Ruvuv, toutes les

autres pouvant être déduites en utilisant les relations (P.207). Les seules coef
ficients non-nuls de la connexion sont :
p u _______ ^ pu _p u __ c o s u py sinû
(P.209)
““ sin u co stt’ s in « ’ cosu
Calculons maintenant le tenseur de Riemann, qui en dimension 2 n ’a qu’une
seule composante indépendante :
Â U _ Q pW _ Q JMI I P pW _ pW pV
UV V vv UV ' ^ VV v v ^ uv* (P.210)
On remarque que le deuxième terme est identiquement nul car aucune fonction
en présence ne dépend de la variable v ; les autres termes, après la dérivation
et les multiplications, donnent juste
ûu“ u = -s in ^ u .
Le tenseur de Riemann entièrement covariant s’obtient en baissant l’indice

haut U à l’aide de la métrique Çuu -
a" cos"' U
Ruv UV —9uu R UV V 2 = —a cos
^ sin'û
•
U. (P.211)
Le tenseur de Ricci est donné par l’expression Rij = Rikji qui, dans ce
cas, est proportionnelle au tenseur métrique. Nous avons donc :
_ COS^ U
Ruu —9^^ Riv UV — : 2 , Ruv — Rvu — Rvv —9
Rvu vu — SîTl U ,
sin'^ti
(P.212)
et finalement, le scalaire de Riemann, ou la courbure scalaire, est donnée par
la contraction suivante : R = R j, ce qui donne dans le cas étudié
R = 9^‘''R uu + 9''''R vv = - ^ . (P.213)
La courbure riemannienne est donc négative, proportionnelle à la courbure de

Gauss (K= R/2).
La courbure gaussienne R peut aussi être calculée selon la formule
Ruv UV
K =
9uu9w ~ 9uv9vu
conduisant au même résultat.
7. C ette propriété du tenseur de R icci est caractéristique d ’espaces d its homogènes, dont
la sphère et la pseudo-sphère.
Problème 6.3. - Géodésiques, déviation géodésique - Solution

Une surface de révolution autour de l’axe Oz est donnée par sa paramétrisation
en coordonnées cylindriques (p, (p, z) :
a: = pcos(p, y = psin(p, z = f(p).
On trouve facilement l’expression du carré de l’élément de longueur,
ds"^ = (1 + f^)dp^ + dp"^, (P.214)

où l’on a posé f = df/dp. La métrique induite sur une surface de révolution
est donc
9pp “ (1 4" / )) 9pip — 9<pp ~ 0) 9ipip ~ - (P.215)
La métrique (P.215) étant diagonale, il en est de même pour le tenseur métrique
contravariant :
iPP = _________ î _________ aP ^ PP (P.216)
^PP (1 + //2 )’ +
À partir de ces expressions, on construit les deux équations qu’une géodésique

doit vérifier.
d'^P I f f" _____ P_

ds^ il + f ^ ) \ d s j (l + /'2) (t)^
d^(p 2 dp dip _
(P.217)
ds^ ^ P ds ds
La seconde équation du système (P.217) est vérifiée identiquement sur les
“méridiens” pour lesquels v?=constante., car toutes les dérivées de ip sont
nulles. La première équation se réduit alors à :
d?p ff" (P.218)
(i + /'2)
Il n ’est pas évident que cette équation est vérifiée automatiquement sur les
“méridiens” ip =constante. Pour prouver que tel est effectivement le cas, no
tons que le carré de l’élément de longueur se réduit alors à l’expression très
simple :
ds^ = ( l + dp^^
ce qui permet décrire
ou bien (1 + /'^) ( | y = l.
La dérivée de cette expression, identiquement égale à 1 est évidemment nulle.

Dérivons donc par rapport à ds :
Î.
ds
Il suffit de diviser cette équation par 2 ^ (1 + f ^ ) pour retrouver l’équation

géodésique (P.218), qui est donc vérifiée, ce qu’il fallait démontrer.
Considérons maintenant l’équation de la déviation géodésique, en substituant
dans le système (P.217) une courbe légèrement déformée, p{s) = p(s)+en^(s),
(p{s) = (p{s) + en‘^{s). En développant jusqu’aux termes linéaires en e, on
trouve :
d/*” df= dn'^
r} fc (r + 6 n -(s)) ^ r jk { s ) + n - + ..., + ...
et, en admettant que la courbe initiale ^(s) vérifiait l’équation des géodésiques,
il ne restera que l’équation de la déviation géodésique que voici :
^ds2 + n ^ d m JK
T )¿g
k ^ -¿g
j - + 2r!fe—
JK ¿g ^¿g = 0. (P.220)
Problème 6.4. - Nez d’avion - Solution

Nous avons le paraboloïde en coordonnées cylindriques :
L O
Z = 75P^, 0 < p < l , 0 < w < 27T, 0 < 2: < L = 3. (P.221)
0^
Sur la surface du paraboloïde on a
O M = P cos (p i + P sinifi + ^ p ^ k.
0^
les vecteurs du repère mobile sur la surface sont alors :
2L
Bp = dpOM = cos V?i + sin V?j + - ^ p k,
e^ = = —psinv?i + p c o s^ j
Leur produit extérieur est donc

2L 2L
BpAe^ = --p-p^cos(î - -p-p^sinyjj + pk,
d ’où la valeur absolue de l’élément de surface :
/ 4L2
I dS 1=1 e p A e ^ \= p d l + dp d<p. (P.222)
Il ne reste qu’à intégrer cette expression dans les limites données :
C lo C W'>
Cette intégrale élémentaire s’obtient facilement ; il suffit de changer de variable
en posant w = ^ p ^ pour transformer cette intégrale en
V l + w dw = - ^ (l + u;)2 lo^
W
En substituant les valeurs (en mètres) b = Im, L = 3m, on arrive à l’expression
finale :
7t6^
6L2 =û - ‘] '
soit 1.3035 • 10®cm^ = 13.035m^. En multipliant par 0.5cm et par la densité
2.8 g/cm^, on obtient le poids total de la pièce égal à 182.5 kg.
P ro b lèm e 6.5. - Soucoupe v o lan te - S olutio n

On exprime le rayon-vecteur O M d ’un point quelconque M de l’espace
euclidien de dimension 3 à l’aide de coordonnées paraboliques (^, r), p) comme
suit :
O M = æi -Hj/j -f- ¿:k = ^T^cosî -|- ^r]siii<pj -1- ' k.
Les trois vecteurs du repère mobile sont alors :
aoM
= rj cos pi + rj sin pj -H^k,
aO M
= = ^ cos ^ sin p^ —i;k,
dî]
dO M
- = sin pi + ^T] cos pj.
dp
Les composantes du tenseur métrique en coordonnées paraboliques peuvent

être calculées de deux manières : soit comme somme des carrés des différentielles
dæ, dy et dz, exprimées en fonction des différentielles d^, dr) et d<p,
ds^ = dx^ + dy"^ + dz^ = + if)d('^ + + V^)dr)^ + ^^r)‘^d(p^, (P.223)
(nous avons omis les détails du calcul), soit en effectuant les produits entre les
vecteurs de la base mobile gik = • e^, conduisant au même résultat (P.223).
Nous constatons en passant que la métrique obtenue est diagonale.
L’élément de volume cartésien dV = dx A dy A dz peut être transformé en
un élément de volume en coordonnées curvilignes selon la formule bien connue
( d { x ,y ,z )V
dV = dx A dy A dz = det d ^ A d r ] A dip.
Le même résultat peut être calculé à partir des composantes du tenseur

métrique, traitées comme une matrice. On a dans ce cas
h (r a )]= v /i^ -
D’une manière ou d ’une autre, l’élément de volume est donné par :
dV = + 77^) dÂdr) A dp. (P.224)
Avant d ’évaluer le volume de l’objet proposé, trouvons à quoi il ressemble.

Le domaine de variation des paramètres qui le définissent est le suivant :
1 < ^ < 4, 0 < t; < 1, 0 < ^ < 27t.
Prouvons qu’il s’agit d ’une forme circonscrite par les paraboloides de révolution.
En effet, si l’on fixe la variable 77, par exemple 77 = 6, les variables (x, y, z) se
ront douées par les expressions suivantes :
x = b^cosp, y = b^sinp, ^ = ^ (^ ^ -b ^ ),
ce qui conduit à l’équation d ’une paraboloide de révolution.
Chaque valeur particulière du paramètre b définit la surface d’une paraboloide

de révolution ; en variant b, on remplit une portion du volume corconscrit par
la surface.
Le domaine de variation des paramètres proposé définit une figure géométrique

qui ressemble à une soucoupe avec couvercle, une “soucoupe volante” . On
trouve assez facilement les points extrêmes de ce volume :
^hnax = Zn \
~ / max
~ 2,
ce qui correspond au choix = 2, rjmax = 0.
^min — Z ^
~ ' mm
ce qui correspond au choix ^max = 1> “nmax = 1-

On voit encore mieux la forme de l’objet en coordonnées cylindriques,
= z= et tp.
On trouve alors que pmin = 0 pour »7 = 0 et z = Zmax = 2, pmax = 2 pour

^ = 2, 77 = 1, î; = 3/2 = 1.5;
Finalement, quand z = 0, ( | = 1, 77 = 1), on a p = 1.
F ig u r e P.19 - L a s o u c o u p e v o la n te
Maintenant nous pouvons évaluer le volume de la soucoupe volante. L’élément

de volume en coordonnées paraboliques étant donné par l’expression (P.224),
il s’agit d ’effectuer l’intégrale
p2 p1 p2n
V= d^ dr] d(f + if). (P.225)
Ji Jo Jo
L’intégration par rapport à dp produit le facteur 27t ; dans l’intégrale double
par rapport à d^ et drj, on remarque que
^ d ^ = \d { i% 77^77 = ^^(772),
ce qui permet d’introduire de nouvelles variables, u = w = rp, et exprimer

notre intégrale de manière plus simple, n ’oubliant pas de changer les bornes
d ’intégration (car s i^ = l, u = ^^ = l, mais si ^ = 2, = 4, etc) :
fl =f f dw{u + w).
La suite est élémentaire : on peut intégrer tout d ’abord par rapport à la

variable w :
1
^2 Jif du Jof dw (u + w) = ^2 Jif du UW + —
TT
2 y.
/"* r
r d
11
puis
4
■4 r 1 U^ U TT Ott
u + -T d u = '^ —T— h ~ (8 + 2 ) - ( i + i )
n 2 2 2 T'
Et voici comment on peut évaluer la surface d’un segment parabolique de

révolution défini par les variations des coordonnées paraboliques
0<^<4, »7 = 1, 0 < ^ < 27t.
Les valeurs maximale et minimale de z correspondent aux limites de la varier

tion du paramètre et sont donc
Zmax ^rnin--X ( 0 - 1 ) - X-
Pour une valeur fixée de la variable »7 = 1, on a, sur le segment du paraboloide

choisi : ^
x = ^cos(p, y = ^sm ip
Les deux vecteurs tangents à la surface s’obtiennent facilement par dérivation :
eç = cos V? i + sin ^ j + ^ k, e,^ = —^ sin ^ i + ^ cos j.
Leur produit vectoriel donne
e ^ /\e ^ = cos V?i — sin v?j + ^ k,
ce qui détermine l’élément de surface orienté
dS = cos i — sin y?j + ^ k) d^dip,

THEORIE DES GROUPES 421
dont la valeur absolue est
dS \= ^^/ÏT ^d ^d < p . (P.226)
Il ne reste donc qu’à intégrer l’expression (P.226) entre les bornes fixées dans
l’énoncé :
d<p ^ ^ / ï + ë = 27t ld { e )y /ï^ =
7T ^ d u V r+ ü = + ^ |(1 7 )l-2 lj .
P ro b lèm e 6 .6.* - H y p erb o lo ïd e d e rév o lu tio n

Même méthode que pour le problème précédent.
7. Théorie des groupes.

P ro b lèm e 7.1. G ro u p es finis - S olution
a) Le groupe Z5 contient cinq éléments, dont l’élément unité. Il peut être
représenté dans le plan complexe par les puissances de la racine cinquième de
l’unité :
2iri O
_ 6 457 T ,i Q
g -6gi r-i ^ 4A g -Sgt T-Î^ ^ 5K ^ g -I OgtTÎ g o^rr/i 1
0 = 6 5 , 02 = ^3
O _ - ^ 2« ^
La multiplication des nombres complexes étant commutative, le groupe Z 5

est abélien (commutatif). On peut s’en convaincre en contemplant sa table de
multiplication, qui se présente sous la forme d ’une matrice symétrique :
1 a o2 o3 o4
a a? o3 û4 1
o2 o3 1 a
o3 o4 1 a
o4 1 a o2 o3
Table de multiplication du groupe Zs

Le nombre 5 est premier ; en vertu du théorème de Lagrange il ne peut pas
avoir d ’autres sous-groupes que l’unité et lui-même. ; il s’agit donc d’un groupe
simple.
b) Le groupe fini S 5 , contenant toutes les permutations des cinq objets

différents, est de rang 5! = 120. Il contient comme sous-groupe le groupe Z —5]
effectivement, 120 est divisible par 5 (ce qui est une condition nécessaire, mais
pas suffisante pour que Z 5 soit effectivement le sous-groupe de n’importe quel
groupe de rang 120).
Le groupe Z 2 contient deux éléments, l’élément neutre e et un idempotent
a tel que a? = e. Parmi les permutations de cinq objets (ABCDE) toute
permutation entre deux objets parmi les cinq est une transformation idempo-
tente, car en l’appliquant deux fois on revient à l’ordre précédent, par exemple
la permutation entre le troisième et le quatrième objet :
(ABCDE) (ABDCE) {ABCDE)

On peut donc définir dix groupes Z 2 différents, tous sous-groupes de 5s, selon
les choix des deux objets parmi cinq : on sait que le nombre de tels choix est
égal à C | = 5!/2!3! = 10.
Le groupe S^ n ’est pas abélien. Pour s’en convaincre, il n ’est pas nécessaire
d ’examiner son tableau de multiplication (qui serait représenté en tant que
matrice 120 x 120 !). Il suffit de savoir que le groupe Sz est un sous-groupe de
Sz ; et nous avons déjà eu l’occasion de constater que Sz n’est pas abélien.
P ro b lèm e 7.2. G ro u p es d isc re ts - S olution
a) On considère la loi de composition s’appliquant aux nombres entiers
Z, (positifs, négatifs, et zéro), définie comme suit :
(o, 6) G Z X Z —^ o © 6 = o - |- i ) - |- l G Z. (P.227)
Pour prouver qu’il s’agit d ’un groupe, en l’occurence discret (puisque l’en
semble de ses éléments est dénombrable) et infini, il faut vérifier l’associativité,
définir l’unique élément neutre, ainsi que l’inverse de chaque élément.
L’associativité est vérifiée facilement :
(o © 6 )© c = (<x-f-6"l"l)"l“ C-t-l = o-|-à"l"C-|-2,
o © (6 © c) = ii-|-(à~l"C + l ) - |- l = ii-|-6"hc-|-2.
L’élément neutre e doit vérifier la relation o © e = a, pour tout o, ainsi que
e © a = a. On trouve facilement que c’est le nombre —1 qui convient :
o © (—1) = a + (—1) -h 1 = o; idem (—1) © o = (—1) -|- a -f 1 = o.
L’élément inverse doit donc vérifier l’équation :
a © (o“ ^) = o“ ^ © a = e, soit a © æ = a -t- (a” ^) + 1 = —1, (a~^) = —o —2.

(P.228)
Nous avons donc un élément inverse unique pour tout élément a représentant
un nombre entier.
b) Analysons un autre groupe infini dénombrable, défini sur les nombres
réels à l’exception de —1 :
O, * b = (xb P Cl ~\~b.
La loi est associative, car
O %(6 ¡1«c) = Q>(bc "b 6 "h c) + û “h bc b -{• c — cibc H" ab "|~ oc bc -t- o 6 c,
(a*b) *c = {ab + a + b)c + ab + a + b + c = abc + ac + bc + ab + a + b + c,

le résultat est bien le même.
En tant qu’une composition des opérations commutatives, la multiplication
ainsi définie est aussi commutative, et le groupe est abélien. L’élément neutre
est unique : c’est tout simplément 0, car pour tout o € —(—1), on a
0>(=a = 0- o + a + 0 = o. (P.229)
L’élément inverse doit donc vérifier l’équation suivante :

_ —o, -» o ^ =
a*(a ^) = a-a ^ + o + (a ^) = 0, donc ( o + l ) ‘0 - 1^ =
O “b 1
On voit immédiatement pourquoi on ne pouvait pas inclure —1 parmi les
éléments de ce groupe : l’inverse impliquerait la division par 0, non définie.
Problèmes 7.3*, 7.4*, 7.5* :

Ces trois probèmes ont été traités de manière assez détaillée dans le texte du
Chapitre 7.
Problème 7.6 - Symétries - Solution
a) : L’invariance de l’équation + y“^ —z“ ^ = 1 par rapport aux transfor
mations proposées se vérifie par calcul direct ; que la rotation ordinaire dans le
plan Euclidien (la dernière transformation, ne touchant que x et y et laissant
^ sans changement, est un fait bien commu ; pour les rotations hyperboliques
on vérifie aussi aisément, par exemple, pour la première :
-b -b
= {x cosh i p p Z sinh + y^ — { x sinh il) + z cosh

= æ^(cosh^ tj) —sinh^ V’) + 2/^ + ^¡^(sinh^ ip —cosh^ ’ll}) = + y"^ —z"^ = 1,
les termes mixtes avec les produits xz s’annulant mutuellement. La deuxième

transformations conduit au même résultat.
b) Les paramètres des trois transformations varient dans les domaines
suivants :
—oo < +00, —00 < X < +00, 0 < < 27T.
Et voici les matrices correspondant aux trois transformations linéaires :
' cosh 0
0 1
, sinh 0
1 0
0 sinh X
, 0 sinh X cosh X >
cos ip sin 0'
- sin cos ip 0
0 0 1,
Pour obtenir la matrice inverse, on doit inverser le signe du paramètre (dans
les trois cas!), ^ -> —0, x ~Xi ou encore ^p -+ —p. L’élément neutre
(représenté par la matrice unité) s’obtient à chaque fois avec la valeur 0 du
paramètre, soit : ip = 0 dans le premier csis, x = 0 dans le second, et y? = 0
dans le troisième cas.
c) En assimilant cosh 5ip k l , sinh Sip à Sx/j, etc., on trouve l’approximation

linéaire des trois transformations :
1 0 5xj)'
0 1 0
5xj) 0 1 .
1 0 0 '
0 1 <^x
0 5x 1 /
1 > 0
-Ô p 1 0
0 0 1
Les matrices correspondantes peuvent être représentées comme somme de la
matrice unite et des trois matrices Ri, R^ et Rz multipliées par le paramètre
infinitésimal approprié :
1 0 5x1)'
0 1 0 I = - ôx!)
.ôxj} 0 1
1 0 0\ /1 0 0\ /0 0 0
0 0 = 0 1 0 - 5% P 0 -1
,0 ix 1/ \0 0 1 / \0 -1 0
1 5
ce qui définit les trois transformations infinitésimales représentées par les ma
trices appelées générateurs des rotations :
0 0 0 -1 0
° \
R i = 0 0 0 , iÎ2 = P 0 -1 , h Æ3 = 1 0 0
-1 0 0 / \0 -1 0 / Vo 0 0
Et voici leurs règles de commutation :
[i?i, R 2] = — R 3, (-^3) -^2] = ^ 1) [-Ra, -Ri] = R 2-
(Nous avons singularisé le générateur R 3 , le seul correspondant à une rotation

Euclidienne).
Les constantes de structure sont comme suit :
iOf3 _ /Oi3 _ 1 /Ofl _ _ 1 /^2 _ _1
^12 “ ”■ ^21 ~ ^32 —“"^23 “ ^31 ~ ” ^13 ~
les autres composantes étant nulles.
d) Considérons, par exemple, la première des trois transformations infi

nitésimales. La fonction / devient alors :
/(æ, ÿ, z) = f{ x -h zôip, y ,z + xôip),
En dérivant par rapport à V’ on trouve :
dip dx d z'
ce qui permet de définir le premier champ vectoriel en tant qu’un opérateur
de dérivation,
x .( /) = x f a . / = ( . ^ + x | ) / .
Par la même méthode, on trouve
^ 9 d . ^ d d
Les relations de commutations (crochets de Lie) entre les trois champs

vectoriels Xi ainsi obtenus reproduisent les relations de commutations entre
les matrices Ri. On peut le vérifier en appliquant les commutateurs à n ’importe

quelle fonction de trois varables, f{x,y,z)^ par exemple :
[Xi,X2]f = { X i X 2 - X 2 X i ) f = X i { X 2 f ) - X 2 { X i f ) = x ^ - y ^ = - X s f ,
et ainsi de suite.
Problème 7.7. - Algèbre de Lie, constantes de structure - solution
En identifiant les matrices [Cj]^ (ici b est l’indice de colonne, a l’indice de
ligne) avec les constantes de structure, on trouve :
C'i = , C3 =
Bien que différentes de Ri, ces matrices vérifient les mêmes règles de commu
tation en vertu de l’identité de Jacobi,
ci,oi+clfii+ci,ci, =o.
Problème 7.8. - Les générateurs des isométries de E^ - solution
Voici les trois rotations et les trois translations exprimées en coordonnées
sphériques : les rotations d ’abord,
„ . d cosd d
Rx = siïup-— -h cosv? —
o9 sm^ dif'
„ d cosO . d
d<p'
Rz =
dip
et les trois translations :
Tx = sm» cos(p-T- -b - cosOcosé— -------— - — ,

^ dr r ^ de r sine dp'
m . n
Ty = sin^ s m ^ —
• ^ 1 n ■ 1 ^ \ cos P —
+ - C o s 0 s in 0 — -------- —
d ,
dr r de r sme dp
Tz = c o s e ^
r
- Sin^— .
de
Afin d ’obtenir ces expressions, il faut employer la définition de la dérivation
composée et le changement des variables bien connu :
X = r sine cos P , y = r sine sin P , Z= r cos e.

Nous partons de l’observation suivante, provenant de la comparaison de la

même quantité géométrique exprimée dans des coordonnées différentes : si l’on
remplace les coordonnées C P&r les coordonnées tj'^' , en posant on
peut exprimer la différentielle d ’une fonction arbitrarire /(^*) comme suit :
df 5/ y
La matrice de passage du repère cartésien vers le repère local induit par

les coordonnées sphériques est comme suit :
6r \ / sin 0 cos sin 6 sin (p cos 0

1 = I r cos 6 cos (p r cos 9 sin (p —r sin 9 (P.230)
-ifi. , —r sin 0 sin ^ r sin 9 cos ip 0
Le déterminant de cette matrice est bien connu, det (M) = r^sin0. En dehors
de r = 0 et 0 = 0 la matrice inverse existe, permettant de définir le passage
du repère local au repère cartésien :
(/ sin
■ 9û cos (f i1 cos 9û cos ( û ----- — : \1 f ©y. ^
^ r s m9
. . . 1 . . cosyj
j sin 6/sin - cos 0 sin —— : (P.231)
r J r sin 0
UJ t COS0 — sin0
r
0 /
Uy>/
La première matrice transforme les différentielles {dx, dy, dz) en différentielles

(dr, d9, d<p) : c’est donc la matrice inverse qui sert à exprimer les dérivées par
tielles par rapport aux variables cartésiennes (æ, y, z) en fonction de dérivées
partielles par rapport aux coordonnées sphériques (r,9,(p). Chaque ligne de
cette matrice doit être contractée avec le vecteur-colonne (dr,de,d^)^ pour
donner le vecteur-colonne (dx,dy,dz)^, autrement dit.
/9 x \ /sin9cos(p ^cos9cosip ——r ^ \ i ^ r \

rs m ^
. . . 1 . . COS(p
(P.232)
d.'y — sm9sm(p - cos^sm w — :—- de
” ^ r ^ ^ rsin 0
\d j I CO&9 — sin^ 0 / \d<p J
' r
Les générateurs des translations ainsi obtenus, on pourra exprimér les

générateurs des rotations en remplaçant les coordonnées cartésiennes par leurs
expressions en fonction de (r, 9, (p) - il suffit d ’avoir un peu de patience !
8. Problèmes non-linéaires
P ro b lèm e 8.1. - M é th o d e d ’a p p ro x im atio n s successives - S olution
Sachant que l’angle 6 reste égal à tt/ 2 pendant le mouvement d’un satellite
autour d ’un astre central massif (grâce à la conservation du moment angulaire),
le problème de Kepler se réduit aux deux équations, provenant du lagrangien
réduit :
, m f^ mM G
Voici les équations qui résultent du principe variationnel appliqué à ce

lagrangien :
.2 M G „
r - r(p^ H---- 5- = 0,
rîp + 2rr(p = 0. (P.233)

où nous avons simplifié en divisant par m.
Le pas suivant consiste en remplacment des fonctions inconnues r{t) et
<p(t) par leurs développements en puissances du petit paramètre e :
V —R € Tif (i) + &)•(t) + ..., ^ — wf + 6 Ti(p(£) -f" 6^ 6^ + ...
MG MG
+ ...
R?
f — enr + é^hr + ...., (fi = U) + en^ + e‘2i
‘ b^,
idem pour les dérivées secondes.
En regroupant les termes par ordre des puissances du petit paramètre e,
on aboutit aux systèmes suivants :
ordre zéro :
MG - Ru)
^ 2_ n . MG = _ u>2 .
^2 - - = 0, ^3 (P.234)
Cette identité - la troisième loi de Kepler - permet d ’éliminer dans ce qui suit
l’expression encombrante MG/R?.
ordre € :
•• e\MG n __ . _
Ur —2 - ^ Ur —ui Tir —2ita;n,^ = 0,
ce qui peut être simplifié, en utilisant (P.234), pour donner
ür —Зw^nг —2Ru>n,p = 0,
la seconde équation est :

riy, + 2Ru>nr = 0. (P.235)
PROBLEMES NON-LINEAIRES 429
En préconisant les solutions sous forme d ’exponentielles nous pouvons

remplacer les dérivées des fonctions et par les mêmes fonctions multi
pliées par A ou par :
Tlj* \ tIj'J Tij* “ ■A y Tl(p — \Ttfpy Tiyp •—A Tlypy
grâce à quoi le système d ’équations différentielles peut être remplacé par un

système algébrique, écrit sous forme matricielle :
/ A 2 - 3 w 2 _ 2 iîa ;A W n rA _
(P.236)
2RwX R?\^ J \ n ^ ) VO/
Le système (P.236) peur être écrit symboliquement comme M n = 0. Il ne peut

avoir de solutions non-triviales (n ^ 0) que si le déterminant de la matrice M
est nul, d’où l’équation caractéristique
detM = i?2^2 ^^2-|-w2) = 0 , (P.237)
dont les quatre solutions sont
Al,2 = 0, A3,4 = (P.238)
Les deux valeurs propres nulles correspondent à la solution triviale du système

(P.235), ayant la forme non exponentielle, mais polynomiale, en l’occurrence,
at + b. En effet, si nous posons Ur =constante, la seconde équation du (P.235)
se réduira à ri^ = 0, conduisant à n<^ = wi =constante. En reportaat dans la
première équation, compte tenu que rir = 0, on obtient la relation
3n
2Ru>uji = Sco^Tiry soit LOI = (P.239)
2R
Cette solution correspond donc au passage d ’une orbite circulaire, de rayon
R et fréquence circulaire w à une orbite circulaire voisine, de rayon R + Ur et
de fréquence circulaire modifiée w -f- c<;i = w ---- ^ u>. Une telle déformation
aurait pu être prévue sans l’analyse des solutions du système (P.235), puisque
toutes les orbites circulaires doivent vérifier la troisième loi de Kepler. Il suffit
de calculer la différentielle de cette relation :
fM G
■LO‘ 3—^ A R —2loA lo = 0., (P.240)
V R^ • ) -
d ’où, en utilisant la relation de départ M G/R? = on obtient la relation
(P.239), en identifiant = A iî, lo\ = A lo. Restent les solutions non-triviales,
correspondant aux valeurs propres As,4 = ayant la forme A cos{Lot -\- S).
Fixons donc les conditions initiales de façon à ce que le temps soit compté à
partir de la position du satellite la plus proche de l’astre central : cela donne

rir{t) = —norcosuit. La seconde équation du système (P.235) devient alors
= - 2-5 ùr = —2— nor sin wt,

'R"' ~R
permettant l’intégration immédiate, donnant
n«(i) = 2 ^ ^ sinwi. (P.241)

R
La solution complète comprenant la correction du premier ordre est donc
r(i) — R —e nor coswt, ip{t) = wi + e sinwi. (P.242)

R
On constate facilement que les deux corrections qui déforment la trajectoire
circulaire vérifient l’équation d ’une ellipse :
2 R^n}y> _
= 1.
nlr
Le mouvement décrit par (P.242) évoque le modèle géocentrique de Ptolémée®
Avec notre première approximation nous avons construit le premier épicycle.
La seule différence par rapport au modèle de Ptolémée est que l’épicycle obtenu
ici est une petite ellipse, et non pas un cercle, comme chez Ptolémée.
Analysons maintenant les équations corresponant à la dévation d ’ordre e^.
La partie linéaire en seconde variation br,b,p est de la même forme que la
première, avec la même matrice à coëiRcients constants ; mais le système n ’est
pas homogène, car on trouve à droite toutes les combinaisons quadratiques
contenant %, n^, et leurs dérivées premières :
/ - Зa;^ -2RwX \ ( W\ _ ( 2urirn^ + Rn^ - \ /p „

\ 2Ruj\ R?\^ ) \b<p) V —2Rnrn^ — 2wTV»V / \ • )
Après simplification et linéarisation, on obtient le système suivant :
' A 2 - 3 w2 -2 R ujX \ fb,br\ ^% ^(l-3cos2w i)^

(P.244)
2RwX R^X^ \b —6no,,w^ sin 2wi J
8. Claude P tolém ée de T hébaïde, (90-168), UroXefjiaLoa en grec ancien, astronom e,

géographe et m athém aticien greco-égyptien, connu par ses oeuvres m onum entales “M egale
S yntaxis” (”La Grande C om position”), “M egisti S yntaxis” (“La plus grande C om position” ,
traduite en arabe sous le nom “A l M ageste”), où est exposé, entre autres, le fam eux systèm e
ptolém éen décrivant les m ouvem ents des planètes, dans lequel leurs trajectoires étaient
construites com m e superpositions des m ouvem ents circulaires, appelés les épicycles.
On cherche la solution de ce système ayant la forme d ’une superposition

de termes semblables aux fonctions qui apparaissent à droite, c’est-à-dire
constantes et les fonctions sinus et cosinus de l’argument 2iot, le double de
la fréquence de base. L’action de la dérivation sur ces fonctions peut être rem
placée par la multiplication par 2u> (pour la dérivée première) ou 4o;^ (pour la
dérivée seconde). En remplaçant la valeur propre A par ± 2 w on obtient une
matrice non-singulière, admettant la matrice inverse unique. Ce qui permet de
résoudre le système ; voici le résultat :
2 r
br = [3 -1- cos 2u)t] , L _ Ôr —3u)t + ^ cos 2o;i (P.245)
li
La solution contenant les corrections d ’ordre un et deux est donc :
r{t) = R —enor cos u)t -H [3 + cos2u;<],

R
, , fÔr . , , 2’Ôr
(p = iot-\- „ ____
sm wi_-f- e. —3u>t -h ^ sinwi (P.246)
R R? ^ '
On y voit apparaître le second épicycle, une petite ellipse parcourue avec la
vitesse angulaire deux fois plus grande. Le tout fait penser à une série de
Fourier, avec u comme fréquence de base, et ses harmoniques, ajoutées avec les
coëfficients dont la norme décroit comme une série géométrique des puissances
du petit paramètre e. La trajectoire ressemble à une ellipse, d ’excentricité enor-
Problème 8.2. Isoclines, Points singuliers - Solution

a) L’équation de second ordre x = conduit au système de deux
équations du premier ordre :
dx dy 9
(P.247)
-dt=y^ Tt=y-
On notera en passant qu’il y a une infinité de points singuliers dans l’espace
des phases (x, y) - en fait, toute la droite y = 0, car en divisant la seconde
équation par la première, on trouve l’équation des trajectoires ’ ^ = y-
Le système différentiel du premier ordre engendré par l’équation de Dufüng
s’écrit
dx dy Q O^
Il est facile de trouver les points singuliers æ = 0, ÿ = 0 et les isoclines.

L’équation y' — y est simple; sa solution est une exponentielle y =
comme on peut le constater sur la figure. On peut aussi intégrer l’équation de
second ordre x = x^ pour trouver x = x{t) et établir le sens du parcours de la
trajectoire en fonction du temps t.
F i g u r e P .2 0 - A g a u c h e : le s is o c lin e s (d r o ite s h o riz o n ta le s y = C), le ch a m p d e s

d irectio n s e t les c o u rb es in té g r a le s d e l ’é q u a tio n y' = y. K d r o ite : le s iso c lin e s, ch a m p
d e d irectio n s e t q u elq u e s tr a je c to ir e s d e l ’é q u a tio n y' = x^ +y'^.
b) Le système différentiel de premier ordre correspondant àq l’équation

de Duffing s’écrit
dx dy <
> r, %
(P.248)
Il est facile de trouver les points singuliers i = 0 , j/ = 0 et les isoclines.
En divisant la seconde équation par la première, et en égalant le résultat
à une constante, nous obtenons l’équation des isoclines :
dy _ —Lo'^x + I3x^
= C — constante. (P.249)
dx y
Les points singuliers se trouvent en æ = 0 et en x = (notons en passant
que les mêmes points singuliers vont apparaître dans l’équation ”anti-DuiRng”,
avec le signe inverse dans le second membre de l’équation (P.249). L’équation
d’une isocline de pente fixée C est donc
-uP'x + /3x^
y = y(x) = ( P .2 5 0 )
Si dy/dx n’est pas constante, l’équation (P.249) s’intégre sans peine :

U)‘
ydy = {^x^ ■uP‘x)dx = C = const..
~2~ 4'
produisant l’image des trajectoires dans l’espace des phases. Les trajectoires
correspondant à l’équation de Duffing ainsi qu’à l’équation “anti-Duffing” sont
représentées sur la figure ci-dessous : Il reste à déterminer le caractère des
points singuliers. Pour ce faire, il faut linéariser notre système autour de cha
cun de ses points singuliers, en posant x = xq + e{t), y = yo + r){t) et en
traitant les fonctions e{t) et ri(t) comme quantités infinitésimales.
F i g u r e P.21 - Portrait de phase de l’équation de Duffing (à gauche) et de “anti-

Duffing” (à droite). Les points singuliers sont les mêmes, mais leur caractère est
différent.
Le point singulier æ = 0, y = 0 est le plus facile à traiter : il suffit de

négliger le ternie cubique dans l’équation pour dxfdt^ pour que le système
devient linéaire :
o) (;)■
où nous avons traité les deux cas simultanément, “Duffing” et “anti-Duffing” .
L’équation caractéristique correspondante est alors = ±a^^, Л = ou
bien Л = ±w, suivant le cas. Les deux valeurs imaginaires conjuguées, ±«u,
correspondent à un foyer (équation de Duffing, à gauche sur la figure), les
valeurs réelles ±ш sont caractérstiques d’un col (équation dite “anti-Duffing” ,
à droite sur la figure).
La linéarisation autour du chacun des deux points singuliers restants conduit
au même résultat : si l’on pose
x{t) = + e(i), y{t) = r)(t),
le système linéarisé s’écrira, puisque nous avons
(U,’ ) ( ± ; ^ + s(t)) m + O(e’ ),
(P.251)
o) (
le signe “+ ” correspondant à l’équation de Duffing (les deux points étant alors
des cols), le signe correspondant à l’équation “anti-Duffing” , les deux points
devenant alors des foyers.
P ro b lèm e 8.3. M éth o d e stro b o sco p iq u e - Solution

On écrit l’équation de Duffing comme l’équation d ’un oscillateur harmonique
avec une perturbation non-linéaire, portée sur le côté droit :
(fix
+ co‘^x = ^x ^ . (P.252)
dfi
Le paramètre S sera considéré comme étant très petit par rapport aux termes
linéaires en x.
La figure (P.21) (à droite) représente les trajectoires de l’équation de Duf
fing. Tout près de l’origine, c’est-à-dire, pour les valeurs de x proches de 0, le
terme px^ peut être négligé, et les trajectoires de phase ressemblent à celles
d’un oscillateur harmonique ordinaire, avec æ = 0, æ = y = 0 point singulier
focal. Pour les valeurs de x (et de y) plus grandes, les trajectories restent
fermées, leur forme elliptique de plus en plus déformée. Les deux points singu
liers supplémentaires se trouvent à distance égale de l’origine, en (±u;/-v/^,0).
Ce sont des cols, par lesquels passe une séparatrice, en dessous et au dessus
de laquelle les trajectoires correspondent aux mouvements pendant lesquels la
vitesse ne change jamais de signe (voir la figure (P.21).)
Passons à présent à la recherche de solutions approchées.
On admet la solution sous la forme
dx
X = Asin(u;i -f- $), — = y A ijo cos(wî + $).
OjV
Les équations stroboscopiques définissent les valeurs moyennes des dérivées
temporelles de A et de $ :
fT
>= I ^ simw/ cos tôt dt,
dt u T Jo
çT
>= - 0 / sin^wi sinwi dt
< (P.253)
dt Jo
On trouve facilement que À = 0, la première intégrale s’annulant à cause du
fait que l’intégrand est une fonction impaire entre 0 et 27t. La seconde intégrale
donne, après la substitution u = tôt :
2^ . 4 . 3/?A2
< >= - sin tou du = — -— (P.254)
dt 2iru L 8w
On peut identifier cette expression avec une correction (linéaire en petit pa
ramètre /3 !) à la fréquence circulaire de base :
tô = io + etoi = to —
8to
Le fait que la fréquence baisse quand l’amplitude augmente était prévisible en
faisant valoir un argument physique. La fréquence naturelle d’un oscillateur
harmonique est proportionnelle à la racine de la raideur du ressort (to^ = k/m).
L’équation de Duffing correspond au cas d ’un ressort “mou” , dont la raideur
faiblit avec l’élongation, ce qui doit se repercuter sur la fréquence, qui doit
baisser par conséquent.
Bibliographie
1. Walter Appell, Mathématique pour la physique et les physiciens, H h K

éditions, Paris, 2002
2. Claude Aslangul, Des mathématiques pour les sciences. Concepts, métho
des et techniques pour la modélisation, De Boeck, Paris 2012.
3. Claude Aslangul, Des mathématiques pour les sciences, Corrigés détaillés
et commentés des exercices et problèmes. De Boeck, Paris 2013
{De l’algèbre linéaire et l’analyse complexe aux probabilités et systèmes
dynamiques)
4. Murat Boratav, Richard Kerner, Relativité, Ellipses, Paris, 1991.
5. Pierrette Benoist-Guettal, Maurice Courbage, Mathématiques pour la
physique Tome 1 - Intégrale de Lebesgue, fonctions analytiques, espaces normés
Eyrolles, Paris 1992
6. Pierrette Benoist-Guettal, Maurice Courbage, Mathématiques pour la
physique. Tome 2, Séries de Fourier, Transformations de Fourier et de La-
place, Distributions, 2ème édition, Eyrolles, Paris 1995.
7. Pierrette Benoist-Guettal, Maurice Courbage Mathématiques pour la
physique. Tome 3, Eyrolles, Paris 1993.
8. Philip M. Morse, Herman Feshbach, Methods of Theoretical Physics,
Part I and II McGraw-Hill, New York, 1953.
9. E. Madelung, Mathématics for Physicists and Engineers, J. Wiley, 1964
10. Jean-Pierre Ramis, André Warusfel et Alain Connes, Mathématiques
Tout-en-un pour la Licence, Niveau L2 : Cours complets avec applications et
760 exercices corrigés. De Boeck, Paris 2007
10. Landau et Lifshitz, Physique Théorique, volumes 1 à 9, Editions “Mir” ,
Moscou, 1974
Index
accélération magnétique, 23
de Coriolis, 16 vectoriel, 225
normale, 6 champ vectoriel
tangentielle, 6 générateur de rotation, 424
agglomération générateur de translation, 424
de polygones, 331 changement de coordonnées, 167,173,
processus de, 333 427
algèbre changement de repère, 15, 17
de Lorentz, 292 Christoffel
de Clifford, 297 symbole de, 232
de Lie, 286, 292 symboles de, 112, 228, 303
extérieure, 241 Clifford
application algèbre de, 301
exponentielle, 196 commutation
approximation relations de, 198, 199
linéaire, 317 connexion, 228, 232
approximations coefficients de, 229
successives, 314, 335 de Christoffel, 414
approximations successives, 308, 428 coordonnées
associativité, 422 cartésiennes, 164
Atwood curvilignes, 182, 207
machine de, 359 cycliques, 76
cylindriques, 208, 344, 419
barycentre, 366
généralisées, 72
Boltzmann
paraboliques, 208, 252
facteur de, 332
brachistochrone, 92, 104, 113 polaires, 182
sphériques, 163, 164, 208, 210
Cayley courbure
théorème de, 262 gaussienne, 215, 217, 411
champ locale, 332
électrique, 23 principale, 217
de forces, 21 rayon de, 216
de Killing, 226 covariance, 301
INDEX 437
cycle limite, 326 caractéristique de, 335

cycloïde, 105, 342 extrémum
conditionnel, 114, 116
d ’Alembert d ’une fonction, 94
équation de, 193 d ’une fonctionnelle, 96
opérateur de, 287 extrémum lié, 371, 381
principe de, 69, 88, 351
dérivée Fibonacci
covariante, 231 suite de, 313
de Lie, 218 fonction génératrice, 394
différentielle fonctionnelle, 91, 96
totale d ’une fonction, 244 force
Dirac conservative, 78
matrices de, 301 d ’inertie, 63
Duffing de Coriolis, 64
équation de, 320, 337, 431, 432 de gravitation, 22
de Lorentz, 188
Einstein de réaction, 346
convention de, 166, 168, 179, 401 forme
Energie différentielle, 174
cinétique, 26
cinétique de rotation, 400 générateurs
intégrale première de, 79 de transformations de Lorentz, 198
potentielle, 27 géodésique, 111, 379, 415
Equation équation de, 110
caractéristique, 315 Galilée
Equation caractéristique, 307, 429 transformation de, 17, 287
espace Gauss
des phases, 312, 432 forme fondamentale de, 211
dual, 174 seconde forme de, 213
euclidien, 207, 211, 224 seconde forme fondamentale, 214
fonctionnel normé, 95 théorème de, 245, 248
tensoriel, 178 Grassmann
espace des phases, 311 algèbre de, 241
espace-temps, 185 Green
Euler théorème de, 107, 247
angles de, 283 groupe, 256
indice de, 334 SL{2, C), 196
relation de, 144 abélien, 422
Euler-Lagrange cristallin, 265, 268
équations de, 98, 110, 112, 391 cyclique, 263
Euler-Poincaré définition, 258
438 INDEX
de Galilée, 287 Kepler

de Lie, 270 lois de, 354
de Lorentz, 196, 296, 299 problème de, 121, 133, 336, 353,
de Lorentz élargi, 297 429
de matrices, 257 Klein-Gordon
discret, 422 équation de, 406
fini, 260, 421
orthogonal, 282 Lagrange
simple, 421 équations de, 77, 128, 161
symétrique, 263, 264 fonction de, 71
groupe SL{2,C), 200 formalisme de, 351
multiplicateur de, 370
Hamilton théorème de, 421
équations de, 386 lagrangien, 71, 73, 75, 77, 128, 150,
Hamilton-J acobi 161, 354
équation de, 146, 153 symétries de, 118
hamiltonien, 150 Lie
hermiticité, 300 algèbre de, 224, 286
hodographe, 3 crochet de, 222
dérivée de, 220
idempotent, 422 linéarisation, 337
impulsion lois de conservation, 118
canonique, 392 Lorentz
intégrale transformation de, 194, 294
première, 79, 100 transformations de, 295
intégrale permière
du moment cinétique, 354 Mécanique céleste, 1
intégrale première méthode stroboscopique, 324, 326,337
d ’énergie, 348 métrique, 169, 171
intégration induite, 212
des formes extérieures, 243 métrique induite, 212
sur contour, 244 matrice
invariance, 118 d ’inflation, 314
isoclines, 315, 317, 337 de passage, 168, 284
méthode de, 311, 315, 431, 432 de rotation, 120
isométrie, 291 hermitienne, 195
isométries, 426 Jacobienne, 183
jacobienne, 72, 166, 182
Jacobi matrice de passage, 163
fonction de, 145 matrices
identité de, 275,279,286,304, 398, de Dirac, 300
426 de Pauli, 300
INDEX 439
matrices de Pauli, 304 physique, 348

Maxwell permutations, 263, 264
équations de, 187, 188 cycliques, 266
tenseur de, 408 d ’indices, 179
Minkowski idempotentes, 266
espace de, 185 perturbations, 320
métrique de, 290 Poincaré
moment méthode de, 321, 323
d ’inertie, 400 point
moment angulaire, 354 d ’inflexion, 96
moment cinétique, 400 focal, 318
mouvement singulier, 316, 317, 326, 335, 337,
contraint, 358 431, 432
périodique, 349 point singulier, 317, 333
Poisson
nœud crochets de, 389, 396
attractif, 318 portrait de phase, 316, 317
répulsif, 319 potentiel, 39
Newton scalaire, 192
lois de, 18, 25, 164, 345, 353 vecteur, 191
Noether précession, 283
théorème de, 119, 121 principe variationnel, 362
nombre d’or, 313 probabilités
nutation, 283 simplexe de, 333
produit
orientation, 242 scalaire, 169
oscillateur tensoriel, 170, 171, 175, 177, 399
harmonique, 132 produit extérieur, 241
avec couplage, 364 produit tensoriel, 175
oscillateur harmonique, 309, 311 pseudo-tenseur, 187
oscillateurs couplés, 364 pseudosphère, 411
Ostrogradski
théorème de, 244 quadri-potentiel, 192
quadri-vecteur, 407
Pauli quantité de mouvement, 26
matrices de, 178, 194, 300 quasi-périodicité, 327
pavages
irréguliers, 331 réfraction
réguliers, 331 loi de, 86, 352
pendule réseau cristallin, 267
lié au ressort, 361 rayon de courbure, 4
mathématique, 348 repère
440 INDEX
local, 427 de Maxwell, 188, 190, 192, 407

mobile, 6 de Riemann, 233, 413
repère local, 162, 163, 165 des contraintes, 162
représentation des déformations, 162, 403
adjointe, 284 métrique, 169, 184
Riemann simple, 172
tenseur de, 233 symétrique, 180
rotation torsion d ’une courbe, 8
euclidienne, 425 trace, 405
hyperbolique, 423 trajectoire, 339
infinitésimale, 13 circulaire, 430
rigide, 12 transformation
rotation rigide, 271 de Lorentz, 197, 289
rotations canonique, 128, 384
euclidiennes, 227 de Galilée, 288
Runge-Lenz de Lorentz, 193, 194, 200
vecteur de, 391 de similitude, 273
des coordonnées, 166
section d ’or, 313 infinitésimale, 271
sous-groupe, 297 projective, 256, 260, 280
spineurs transport parallèle, 234
de Weyl, 200, 299 travail virtuel, 351
Lorentziens, 297 trièdre de Prénet, 2, 10
Stokes
théorème de, 241, 244, 247 valeur propre, 330, 334
surface variation
de révolution, 101, 253, 367 linéaire, 108
minimale, 368 totale, 109
symétrie vecteur
cristalline, 267 propre, 318
cylindrique, 76 vitesse
discrète, 265 angulaire, 15, 341, 348, 355, 400
et lois de conservation, 255 de satellisation, 348
sphérique, 71 de translation, 15
instantanée, 21, 342
tenseur scalaire, 4
anti-symétrique, 292 Volterra
antisymétrique, 181, 197 équation de, 327, 329
contr avariant, 171
covariant, 171
d ’inertie, 399
de Levi-Cività, 183, 185
Cet ouvrage a été imprimé par CPI Firmin D idot à Mesnil-sur-FEstrée en septembre 2014
D épôt légal : septembre 201 4 - № d ’impression : 123055 - Imprimé en France
Méthodes classiques
de physique théorique
« L'ouvrage de Richard Kerner, Méthodes classiques de physique théorique,
arrive fort à propos. Ce n'est pas un nouvel ouvrage de mathématiques
pour la physique — il en existe d'excellents — mais un ouvrage d'initiation
à ia physique théorique dont l'ambition est de faire découvrir aux éiéves
de licence certains aspects de sa démarche et de ses méthodes. Nourri
par une longue expérience de recherche et d'enseignement, l'ouvrage
met l'accent sur les méthodes géométriques en physique. C'est ià un
choix tout à fait judicieux car les approches géométriques imprègnent
toutes les grandes théories physiques actuelies.
Dans un texte écrit dans un style clair, direct et expurgé de tout for
malisme inutile, l'auteur fait partager au lecteur son intérêt pour ies
approches géométriques. Chaque chapitre est accompagné d'une
série d'exercices corrigés permettant de vérifier que les concepts ont
bien été assimilés. Ce livre original qui n'a pas d'équivalent en langue
française est à recommander chaleureusement aux étudiants de L3 et
de M l intéressés par la physique fondamentale. »
Alain Comtet
Richard Kerner, physicien e t mathématicien, est professeur ém érite à l'université

Pierre-et-Marie-Curie, où il a enseigné à tous les niveaux, en dispensant des cours
couvrant de nombreux domaines de la mécanique, physique e t mathématiques
p o ur physiciens. Il est l'a u te u r de plus de 200 publications scientifiques dans
lesquelles II a souvent employé les m éthodes géom étriques en physique dont II
est un des spécialistes reconnus.
9 782340 000063

Méthodes Classiques de Physique Théorique - Cours Et Problèmes Résolus - PDF Ver

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Méthodes Classiques de Physique Théorique - Cours Et Problèmes Résolus - PDF Ver

Transféré par

Droits d'auteur :

Formats disponibles

Richard Kerner

Cours et problèmes résolus

dirigée par Paul de Laboulaye

Les mathématiques jouent un rôle important dans de nombreuses disci­

lecteur pourra se familiariser avec la notion de tenseur qui est omniprésente en

Dans le cursus obligatoire de L2 et L3 de physique, les mathématiques

n’importe quel système de coordonnées curvilignes, ont stimulé l’intérêt pour

sique et en chimie, a été introduite par V. Volterra. Les problèmes non-linéaires

Mécanique du point matériel 1

Formalisme hamiltonien 127

4.5 Fonctionnelle de Jaoobi. L’analogie o p t i q u e ...............................143

Tenseurs et spineurs 161

Géométrie différentielle 207

Théorie des groupes 255

8 Problèmes non-linéaires 307

8.5 Résonances. Méthode de Poincaré.................................................... 320

Solutions des problèmes 339

Mécanique du point matériel

A cet égard, rappelons qu’en mécanique céleste, la Terre et d ’autres planètes

La validité de l’approximation du point matériel dépend donc de la situation

1.2 Mouvement d’un point. Trièdre de Frenet

r(i) = x{t) i + y{t)j + z{t) k ( 1. 1)

où les trois vecteurs i, j, k forment un repère orthonormé, d ’orientation directe,

Le vecteur vitesse du point matériel est défini comme la dérivée première du

dr dx, dy. dz. ................... ..

où nous avons introduit la notation “point” pour représenter la dérivation

L ’accélération est la dérivée de la vitesse par rapport au temps, ou encore la

La vitesse instantanée est tangente à la trajectoire, tandis que l’accélération

ds = \Jdx^ + dy^ + dz^

Idx^ + dy“^ + dz“

On peut utiliser l’élément de longueur ds à la place du temps dt pour pa­

/d r ^ ^ ( d x \ ‘^ i dx^ + dy'^ + dz“

Il s’ensuit que la dérivée du vecteur t par rapport à la longueur ds définit un

Le facteur normalisateur p(s), qui a la dimension d’une longueur, est appelé

dx = —Rw sin <jjt dt, dy = Rw cos out dt

ds^ = dx^ -|- dy^ — iî^w^(sin^ wi + conduit) dt^ = R^u^dt^

ce qui définit l’élément de longueur du cercle comme ds = Rujdt, la vitesse

qui est bien évidemment unitaire puisque sin^wi + cos^wt = 1. Maintenant,

dt -U cos (jjt dt —ujsimotdt

En invoquant la définition du vecteur unitaire normal n, on peut identifier

d ’où, dans ce cas précis du mouvement uniforme sur un cercle de rayon R,

F ig u r e 1.3 - Trièdre de Frenet. Les trois vecteurs sont : le vecteur tangent t, le

1.3 Vitesse et accélération en repère mobile.

Le repère de Prenet évolue dans le temps, accompagnant le point matériel

OÙ l’on a posé ot = dv/dt = v. Compte-tenu de ds/dt = v, et en utilisant la

La composante ot est l’accélération tangentielle, c’est-à-dire, la projection

F ig u r e 1.4 - Variation infinitésimale du trièdre de Frenet au cours du mouvement.

De façon évidente, dans le passage de s à s + les vecteurs du trièdre de

= t+ n^n' = n+ ^5 s, b->^b' = b + ^ 5 s (1-10)

Cependant, les relations d’orthogonalité et l’unitarité de chaque vecteur doivent

b = tAn, n = bAt, t = nAb; t^ = l , n^ = l , b^ = l (1.11)

doivent être reproduites en s + 5s :

Nous avons déjà vu que

b' = t'A n' = ^ ^ ~ ^^ ^

Comme toujours dans le calcul différentiel, on néglige le terme carré, propor­

b' = t'A n'~tA n + f ^ A n + tA ^ ¿s') = b + ^ ¿s (1-13)

En identifiant les termes proportionnels à 5s on trouve ainsi

Le vecteur b étant unitaire, sa dérivée lui est orthogonale (ou nulle)

D’autre part, le produit vectoriel dans (1.15) est orthogonal au vecteur t, ce

ce qui donne finalement

La dérivée par rapport à s de chacun des trois vecteurs de la base de Prenet

En comparant les deux formules on constate que

Le cas du trièdre de Prenet est donc assez particulier.

Les mathématiques jouent un rôle important dans de nombreuses disci

On peut utiliser l’élément de longueur ds à la place du temps dt pour pa

Comme toujours dans le calcul différentiel, on néglige le terme carré, propor

Comme dans le cas des conditions de normalisation, nous demandons seule

Cette description nous permettra à présent d ’analyser les mouvements arbi

La transformation (1.45) de l’accélération d ’un repère mobile à un autre, rap