Académique Documents
Professionnel Documents
Culture Documents
Thèse
en vue d’obtenir le grade de
DOCTEUR DE L’UNIVERSITE DE LILLE
par
Jean-Pierre LUBET
le 18 décembre 2001
Titre :
Directeur de thèse :
Rudolf BKOUCHE
Professeur émérite à l’Université de Lille I
___________________
Jury
SOMMAIRE
Page
Première partie
la méthode de variation de la constante
Deuxième partie
les solutions singulières des équations aux différences finies
Troisième partie
les équations aux dérivées partielles :
des séries entières aux « opérateurs »
Quatrième partie
l’analogie des puissances et des différences :
vers une élucidation
Annexes ...........................................................................................459
Bibliographie ..................................................................................505
introduction
Rien n’est plus fécond, tous les mathématiciens le savent, que ces obscures
analogies, ces troubles reflets d’une théorie à une autre, ces furtives caresses,
ces brouilleries inexplicables ; rien aussi ne donne plus de plaisir au
chercheur. Un jour vient où l’illusion se dissipe ; le pressentiment se change
en certitude ; les théories jumelles trouvent leur source commune avant de
disparaître. [André Weil, 1960, p. 408]
Le calcul différentiel de Leibniz mise parfois sur une autre analogie : celle qui relie les
différentielles et les différences finies. Elle se manifeste notamment par une notation
identique ; suivant le contexte, l’écriture dx, d 2x, d 3x… pourra désigner tantôt les
différentielles tantôt les différences finies d’ordres successifs. Dans un premier temps,
Lagrange n’est pas insensible à cette analogie. En interprétant les relations de récurrence
comme des équations aux différences finies, il applique les méthodes du calcul différentiel à
l’étude des suites récurrentes. Il ouvre ainsi la voie à des conceptions qu’il devra, plus tard,
dénoncer.
Il sera question ici de ces deux analogies, dans des limites chronologiques qui correspondent
approximativement à la période où a été produite l’œuvre de Lagrange. Elles interviendront à
travers quatre récits distincts, qui développeront chacun leur propre logique. Mais il sera
loisible d’en constater les entrelacs.
Les deux premières parties concernent les équations différentielles ordinaires. Nous verrons
d’abord la résolution par « variation de la constante » passer d’un procédé isolé à une
méthode générale appliquée à des situations diverses. Cette méthode va permettre d’envisager
les solutions singulières sous un point de vue nouveau. Elle fournira une explication aux
paradoxes relevés par Euler dans ce domaine. Puis le transfert de ces résultats vers les
équations aux différences finies sera la source de nouvelles interrogations.
Cette fécondité ne livre pas le principe secret qui est à l’origine de l’analogie. Elle fait au
contraire rebondir les questions. Quelle est la légitimité des pratiques développées en 1772
par Lagrange ? Dans quel système global trouvent-elles leur justification ? Quelles sont les
limites à l’intérieur desquelles peuvent s’instaurer de nouvelles règles ? Quelle est alors la
nature des objets sur lesquels porte le calcul ? Les émules de Lagrange tenteront d’élaborer
des réponses. Nous en rendrons compte principalement dans la quatrième partie.
Lagrange sera présent au début de chacun des quatre récits. Mais il ne sera pas le seul
personnage. Ses idées ont souvent leur source dans des œuvres de Leibniz, Euler ou
d’Alembert. D’autre part, il influence des mathématiciens plus jeunes que lui, comme
Laplace, Poisson, Charles, Biot, Brisson, Arbogast … En retour, ses propres travaux portent la
trace des réflexions de ses cadets. On essaiera de saisir la spécificité de chacun de ces acteurs,
et les actions réciproques qui s’établissent entre leurs travaux. Chemin faisant, on peut espérer
voir se préciser, dans le domaine de l’Analyse, ce que nous appelons l’époque de Lagrange.
La période et les thèmes retenus ont déjà fait l’objet de nombreux travaux historiques. Ceux-ci
ont souvent constitué un guide précieux.
Nous nous sommes attachés à examiner attentivement des écrits qui, dans la bibliographie
existante, n’ont pas été étudiés en détail. Certains sont annonciateurs de développements plus
féconds, c’est le cas pour des travaux de J.-F. Français, de Servois, ou de Poisson. Mais,
l’analogie n’est pas seulement affaire de fulgurances, elle donne lieu à un laborieux
cheminement dont le point d’arrivée n’est pas joué d’avance. À ce titre, l’ « erreur de
Charles » sur les solutions singulières, ou les obscurités d’un mémoire publié par Lorgna en
1788, ont aussi retenu notre attention.
première partie
Le nom de Lagrange est souvent associé à la méthode de variation des constantes. Le contexte
dans lequel on trouve cette association est parfois la théorie générale des équations
différentielles linéaires. Dans d’autres cas, il s’agit plus particulièrement de problèmes de
Mécanique Céleste.
Dans l’Encyclopédie des Sciences Mathématiques pures et appliquées, Vessiot consacre un
chapitre aux équations différentielles linéaires. Étant donnée une équation complète
d ny d n −1 y
(1) + a +...+ an y = X ,
dx n −1
1
dx n
il considère l’équation sans second membre
dny d n −1 y
(2) + a +...+ an y = 0
dx n −1
1
dx n
et il indique que l’on peut passer de l’intégrale générale de l’équation (2) à celle de l’équation
(1) au moyen de n quadratures. Puis il commente : ce résultat a été établi par Lagrange au
moyen de la méthode de variation des constantes [Vessiot, 1910, p. 113].
Dans son Traité de Mécanique Céleste, J. Chazy présente d’abord la théorie de la variation des
constantes appliquée aux systèmes différentiels linéaires quelconques. Puis, cette étude
générale est immédiatement suivie d’un chapitre intitulé Mouvement elliptique troublé et qui
commence ainsi
Le premier écrit de Lagrange sur ces sujets de Mécanique Céleste date de 1765 : il s’agit des
Recherches sur les inégalités des satellites de Jupiter causées par leur attraction mutuelle
[1777 a]. Adressé à l’Académie des Sciences de Paris, ce mémoire a obtenu le prix de
l’Académie pour l’année 1766. C’est dans cette même période qu’a été terminé le mémoire :
Solution de différents problèmes de calcul intégral qui est intégré dans le tome 3 des
Mélanges de Turin. Ce mémoire contient une étude des perturbations de Saturne et de Jupiter,
et il s’ouvre sur une étude générale des équations différentielles linéaires où Lagrange
introduit la notion d’équation adjointe.
Dans l’étude de Vessiot déjà citée, une note d’Eneström mentionne l’usage de la méthode de
variation de la constante avant ces dates et chez d’autres auteurs. En particulier Euler y est cité
pour des calculs inclus dans un mémoire sur le flux et le reflux de la mer [1752/1740], et qui
concernent la résolution d’une équation du type
d 2y
+ ky = f ( x)
dx 2
Eneström renvoie aussi à une lettre de Daniel Bernoulli [1751], mais un examen rapide du
texte oblige à un démenti ; dans le cas d’une équation linéaire complète, Daniel Bernoulli
utilise simplement la superposition de la solution générale de l’équation homogène à une
solution particulière de l’équation complète.
L’étude qui suit a pour objet de répondre à quelques-unes des questions que peut susciter ce
rapide inventaire :
2. Quel est l’arrière-plan des connaissances et des pratiques dans lequel elle vient s’insérer ?
En particulier, de quels procédés dispose-t-on au XVIIIème siècle pour résoudre les équations
linéaires ? Comment sont perçues les propriétés spécifiques des équations à coefficients
constants ?
3. Dans l’histoire des mathématiques, quels rapports se sont établis entre, d’une part, cette
méthode, et d’autre part, le théorème fondamental des équations linéaires qui permet de passer
des solutions de l’équation homogène à celles de l’équation complète ?
Chapitre I
les équations linéaires dans le mémoire Solution de
différents problèmes de calcul intégral [Lagrange, 1766] et
dans la correspondance entre Lagrange et d’Alembert
En 1766, l’Académie de Turin publie le 3ème volume de ses Mélanges. On y trouve un copieux
mémoire dont l’auteur est Lagrange et qui s’intitulé Solution de différents problèmes de calcul
intégral. Au fil des chapitres, sont abordés des sujets dont les enjeux, au cours de cette
période, sont importants : les équations aux dérivées partielles obtenues dans l’étude du
mouvement d’un fluide, des systèmes d’équations différentielles qui commandent les
oscillations de corps en interaction (corde tendue chargée de masses ponctuelles, fil fixe à
l’une de ces extrémités…). Lagrange y reprend aussi le problème des cordes vibrantes sur
lequel il a déjà publié en 1759 et 1762, des travaux approfondis, et qui continue à susciter une
vive controverse. La fin du mémoire est orientée vers la Mécanique Céleste. Un chapitre est
en particulier consacré à l’étude du mouvement de Saturne et de Jupiter : si leur trajectoire
respective est d’abord considérée comme le résultat de la seule présence du Soleil, il faut
ensuite tenir compte des perturbations que crée leur attraction mutuelle.
Certains des résultats obtenus sont communiqués à d’Alembert dès 1765, en particulier
Lagrange indique qu’il peut trouver la solution de l’équation différentielle complète
dy d 2y d 3y
Ly + M + N 2 + P 3 +....=T
dt dt dt
à partir de la solution de l’équation sans second membre
dy d 2y d 3y
Ly + M + N 2 + P 3 +....= 0.
dt dt dt
D’Alembert répond en montrant qu’il a aussi un moyen pour obtenir ce résultat et qu’il lui
suffit, pour cela, de faire une utilisation systématique d’une méthode qu’il a pratiquée dès
1743. Dans les faits, les calculs décrits par d’Alembert correspondent à ce qu’on appelle
aujourd’hui la méthode de « variation de la constante ».
1/ identité fondamentale
∫ L (y, y’,...y ) z dt = M(y, y’,...y(m-1) , z, z’,....z(m-1) ) + ∫ L* (z, z’,...z(m)) y dt
(m)
3/ réciprocité
L (y, y’,...y ) = 0 est l’ « adjointe » de L*(z ,z’,...z(m))=0
(m)
que Lagrange a utilisé dans les Nouvelles recherches sur la nature et la propagation du son :
en 1762 pour étudier l’équation aux dérivées partielles 1
d 2z d 2z
= c .
dt 2 dx 2
Sa proximité avec les méthodes de résolution des équations aux dérivées partielles sera encore
soulignée en 1837, par Liouville
Ce procédé [utilisé par Lagrange en 1766], a beaucoup d’analogie avec celui dont les
géomètres se servent si souvent dans le calcul des équations différentielles partielles ,
lorsqu’ils déterminent les coefficients des divers termes des séries qui représentent, dans
les problèmes physico-mathématiques, l’état initial des températures ou des vitesses de
chaque molécule d’un système matériel donné [J de Liouville, tome II, juillet 1837, p.
245]
1
Voir infra 3ème partie, chapitre I.
Les équations différentielles linéaires qui interviennent dans le mémoire tableau 1-I-b
dMz d 2 Mz d 3 Pz m
(k) (B) L* (z,z’,...z(m)) = 0
Lz − + − ... = 0 ∑ ( −1) ( L z) =0
k
(B) (B) k
dt dt 2 dt 3 k=0
m (D) L (y,y’,...y(m)) = 0
dy d y 2
d y 3 (D) ∑L y
k =0
k
(k )
=0
(D) Ly + M + N 2 + P 3 +....= 0
dt dt dt
d N d2P dP dy
z M − + 2 − ... y + N − + ...
d t d t d t dt
d y
+ ( P − ...) 2 +...
2
(E) M*(z, z’,..z(m-1) ,y, y’,...y(m-1) )
dt
n −1 n − i −1 n − p − i −1
∑ ∑ ∑ (−1) C ji + i L(jj+) p + i +1 y ( p ) z (i )
(E) i+ j = const.
(E)
dz dP
y + (P − ...) + ....
dy i =0 p = 0 j = 0
− N −2
d t dt dt = const.
+ 2 [(P −...) y +...]− ...=const.
d z2
dt
1ère partie 11 chapitre I
2
Le calcul peut s’interpréter à l’aide de la formule d’intégration par parties répétées
n −1
∫ u v (n) dx = ∑(−1)
k =0
k
u (k) v (n – k - 1) + ( - 1 )n ∫ u (n) v dx
En traduisant le calcul de Lagrange au moyen de notations indicielles, on peut prendre pour équation initiale :
m
(A) ∑ L y( ) = T
k=0
k
k
Les intégrations par parties conduisent, après un échange de l’ordre des sommations, à :
m ( k − p − 1)
m−1
m (k)
∑
∑ ( −1) k − p −1
( Lk z )
y ( p)
+ ∫ ∑ ( −1) k
( Lk z ) ydt = ∫ Tzdt
p = 0 k = p +1 k = 0
L’ « adjointe » est l’équation différentielle d’ordre m :
m
(k)
∑ ( −1) ( L z) =0
k
(B) k
k=0
L’équation (C ) est d’ordre m-1 :
m−1 m ( k − p − 1)
(C ) ∑ ∑ ( −1)
k − p −1
( Lk z) y ( p ) + = ∫ Tzdt .
p = 0 k = p +1
Le détail du calcul est repris, pages suivantes dans le tableau relatif à la réciprocité de l’équation et de son
« adjointe ».
M(y,y’,...y(m-1), z, z’,....z(m-1) ) = ∫ T y dt .
*
3/ Toute solution z0 de l’équation L (z0 ,z0’,... , z0(m - 1)) = 0, fournit donc une équation
M(y, y’,...y(m-1) , z0 , z0’,... , z0(m - 1)) = ∫ T y dt ,
qui constitue une intégrale première de l’équation initiale L (y, y’,...y(m))= T.
Puis le processus se poursuit avec l’intervention de valeurs différentes de z
2° si l’on avait deux valeurs différentes de z, lesquelles satisfissent également à
l’équation (B), on aurait, par la substitution successive de ces valeurs dans l’équation (
C ), deux intégrales de l’équation (A), à l’aide desquelles on éliminerait la plus haute
différentielle de y, et l’équation résultante serait l’intégrale seconde de la proposée [...]
3° de même, si l’on avait trois valeurs différentes de z, on trouverait trois équations
intégrales ; d’où éliminant les deux plus hautes différentielles de y, on aurait une
équation qui serait l’intégrale troisième de la proposée, et ainsi de suite, d’où il est aisé
de conclure, qu’en connaissant un nombre de valeurs de z égal à celui de l’exposant de
l’ordre de l’équation (A), on pourra trouver l’intégrale finie et algébrique de cette
même équation [p. 473].
La signification des termes valeurs différentes n’est pas explicitée et Lagrange n’explore pas
les conditions à imposer pour réaliser les éliminations dont il s’agit. Nous verrons que
D’Alembert apportera sur ce point une précision, sans donner encore l’état définitif de la
question 3.
Dans le cas où l’on connaît m valeurs différentes de z , on peut considérer que les m équations
M(y, y’,...y(m-1) , zi , zi’,... , zi(m - 1)) = ∫T zi dt
constituent un système linéaire dont les inconnues sont y, y’,...y(m-1). Sous réserve que les
fonctions zi vérifient la condition qui convient, l’inconnue y pourra être calculée directement
à l’aide des fonctions zi et de leurs dérivées et Lagrange constate effectivement : on pourra
trouver l’intégrale finie et algébrique [de l’équation ( A )].
3
La question repose sur la possibilité de résoudre des systèmes d’équations linéaires dont les inconnues sont des
dérivées de y. Il s’agit d’abord de l’élimination de y(m-1) entre les équations
M(y, y’,...y(m-1) , z0 , z0’,... , z0(m - 1)) = ∫T z dt
0
Un examen attentif des calculs montre que cette élimination est possible pour
z0 z1 ≠ 0
z0' z1'
z0 z1 z2
Elle sera possible si z0' z1' z2' ≠ 0, etc.
z0'' z0'' z0''
dy d y2
d 3y
(1) ∑ (k )
∫ Lk y zdt = ∫T zdt
∫ L z ydt + ∫ M z dt dt + ∫ Nz dt 2 dt.+∫ Pz dt 3 dt..+...=∫T z dt ; k =0
je change les expressions pour chaque terme où k > 0 : utilisation de la formule d’intégration par parties
k −1
∫ u v dt = ∑(−1) p u (p) v (k – p - 1) + (-1)k∫ u (k) v dt
2
dy d y d3y
∫ L z ydt, ∫ M z dt dt ,∫ Nz dt 2 ., ∫ Pz dt 3 ,....,
(k)
(2)
p= 0
dt
[p. 472] (4) ∑ ∑(−1)
dt dt k =1 p = 0 k =0
d 2
N z d 3
Pz
∫
L z − dMz +
dt dt 2 −
dt 3 + ... ydt = ∫T z d t
interversion des sommations selon p et selon k
m −1 m
( k − p − 1) ( p ) m (k )
(5) ∑ ∑
(−1)k − p −1
( Lk z )
y + ∫ ∑(−1) (Lk z ) ydt = ∫Tzdt
k
p = 0 k = p +1 k =0
à suivre
1ère partie 14 chapitre I
∑ ∫(−1) (L z )
(k )
y dt =const .
k
Qu’on multiplie l’équation (B) par ydt, et qu’on en prenne (1*) k =0
k
pour chaque terme tel que k> 0 : utilisation de la formule d’intégration par parties
l’intégrale, en faisant disparaître de dessous le signe ∫ toutes les (réciproque de la formule (2))
k −1
(-1)(k) ∫ u (k) v dt = ∑(−1) u (k - p - 1) v (p) +∫ u v (k) dt
p+k
différences de z, par des intégrations par parties, comme nous (2*) p =0
avec u = Lk z et v = y
l’avons pratiqué sur l’équation (A), on aura, en changeant les k −1
[La relation (3*) est la relation (3) ci-dessus, les termes sous le signe Σ ont changé
y Mz − dNz + d Pz
dt
2
dt dt
( dt
)
dy Nz − dPz +... + d y (Pz −....)+....
2 −... +
dt 2
2 de signe du fait d’une permutation des deux membres : c’est le changement de
signe que Lagrange va signaler.]
Transformation de l’équation (1*) compte tenu de (3*) :
-∫ d 2y d 3y k −1
( ) ( )(k − p −1) ( p )
( )
m m
∑ ∑ ∑
dy
∫ Lk y (k ) zdt = const.
p+k
(Ly + M + N 2 + P 3 +...) zdt.= const. (4*)
−1 Lk z y
+
dt dt dt k =1 p = 0 k =0
interversion de l’ordre des sommations
( p) m
( )
m −1
∑ ∑(−1) (L z )
m
( k − p −1)
[p. 473] p+k
k y + ∑ ∫ Lk y (k ) zdt = const.
p =0 k = p +1 k =0
et en changeant les signes de tous les termes [(-1)p + k et (-1)k – p - 1 sont opposés],
on obtient le résultat de Lagrange analogue à l’équation (5).
m (k − p −1) ( p )
( )
m −1
( ) ( )
m
∑ ∑ ∑ ∫ Lk y (k ) zdt = const.
k − p −1
(5*)
−1 Lk z
y −
p = 0 k = p +1 k =0
1ère partie 15 chapitre I
dt dt
(
dt dt 2
)
dy Nz − dPz +... + d 2 y (Pz −....)+....
2 −... +
- ∫ (Ly + M
dy d 2y d 3y
+ N 2 + P 3 +...) zdt.= const.
dt dt dt
Donc, si l’on fait
dy d 2y d 3y
(D) Ly + M + N 2 + P 3 +....= 0
dt dt dt
et qu’on ordonne l’équation restante par rapport à z, on aura
z M − −... y + N − +...
d N z d 2 Pz dP dy
+
d t d t d t dt
2
+ ( P−...) 2 +...
2
d y
(E) dt
dz dP
y + (P −...)
dy
− n−2 +....
d t dt dt
+ 2 [(P−...) y +...]−...=const.
d z2
dt
La première utilisation du procédé avait conduit à l’identité
(I) ∫L(y, y’,...y(m)) zdt = M(y, y’,...y(m-1) ,z , z’,....z(m-1)) + ∫ L*(z, z’,...z(m))y dt
Mais, une fois le calcul fait, on peut comparer les résultats à ceux qui étaient obtenus dans la
transformation de l’équation initiale (A) et on constate
*
M (z, z’,...z(m-1), y , y’,....y(m-1) ) = - M(y, y’,...y(m-1), z, z’,....z(m-1) )
L**(y, y’,...y(m)) = L(y, y’,...y(m)).
La réciprocité est exprimée ici au moyen du symbolisme en *, Lagrange ne se donne pas ce
type de moyen. Il n’a pas non plus de terme équivalent à « adjointe ». Si l’on cherche dans le
texte l’expression de la réciprocité entre une équation linéaire et son « adjointe, il faut se
référer à deux constats :
*
1. les résultats du calcul effectués à partir de (B) [L (z, z’,...z(m)) = 0] s’expriment à l’aide du
premier membre de (A) [L(y, y’,...y(m)) ] et d’un terme intermédiaire identique à celui qui avait
été obtenu lors du calcul effectué à partir de (A). Mais ce constat ne fait l’objet d’aucun
commentaire explicite.
2. le calcul relatif à (B) étant terminé, Lagrange en tire immédiatement des conséquences dans
des termes analogues à ceux qu’il avait utilisés après le calcul relatif à (A) :
§2: §4:
Conclusion tirée après le calcul relatif à (A) Conclusion tirée après le calcul relatif à (B)
2. Donc : 1° Si on peut trouver une valeur de 4. Donc, si l’on peut trouver une valeur de y,
z, laquelle satisfasse à l’équation ( B ), on qui satisfasse à l’équation (D), on aura
aura tout de suite l’intégrale de l’équation l’intégrale première de l’équation (B) ;
proposée ( A ) en mettant cette valeur dans
(C ) .
2° si l’on avait deux valeurs différentes de z, si l’on a deux valeurs différentes de y, qui
lesquelles satisfissent également l’équation à satisfassent à la même équation (D), on aura
l’équation (B), on aurait, par la substitution l’intégrale seconde de l’équation (B),
successive de ces valeurs dans l’équation
(C ), deux intégrales de l’équation (A), à
l’aide desquelles on éliminerait la plus haute
différentielle de y, et l’équation résultante
serait l’intégrale seconde de la proposée [...]
3° de même, si l’on avait trois valeurs et ainsi de suite ;
différentes de z, on trouverait trois équations
intégrales ; d’où éliminant les deux plus
hautes différentielles de y, on aurait une
équation qui serait l’intégrale troisième de la
proposée, et ainsi de suite. D’où il est aisé de de sorte que, si l’on connaissait un nombre de
conclure, qu’en connaissant un nombre de valeurs de y égal à celui de l’exposant de
valeurs de z égal à celui de l’exposant de l’équation (B), on pourrait trouver (2)4
l’ordre de l’équation (A), on pourra trouver l’intégrale finie et algébrique de cette même
l’intégrale finie et algébrique de cette même équation [p. 474]
équation [p. 472]
tableau 1-I-e
Les calculs eux-mêmes sont peu détaillés. Une interprétation est proposée dans le tableau 1-I-
d . L’identité (I) a été obtenue en appliquant à chaque terme qui compose L(y, y’,...y(m)), la
formule d’intégrations par parties
k −1
(F) ∫ u v (k) dt = ∑(−1) p u (p) v (k – p - 1) + (-1)k∫ u (k) v dt.
p= 0
*
L’identité (I*) est obtenue en appliquant à chaque terme de L (z, z’,...z(m)), la formule
k −1
(-1)(k) ∫ u (k) v dt = ∑(−1) u (k - p - 1) v (p) +∫ u v (k) dt.
p+k
(F*)
p =0
Dans les deux cas, c’est le même choix u = Lk z, v = y qui permet d’interpréter le calcul. À
ce niveau, c’est la réciprocité des deux intégrations par parties successives qui opère. Et, l’on
constate que (F*) se déduit de (F) par la simple transposition de la somme Σ d’un membre
dans l’autre. Ce mécanisme algébrique s’applique à chaque terme qui compose,
*
respectivement, l’ expression de L(y, y’,...y(m)) et celle de L (z, z’,...z(m)). Finalement, c’est
donc la même transposition, appliquée à M(y,y’,...y , z, z’,....z(m-1) ), qui permet de passer de
(m-1)
4
Ce (2) est le numéro du paragraphe cité ci-contre, il renvoie donc à l’argumentation donnée dans le cas
précédent.
(I) à (I*), la réciprocité des intégrations par parties effectuées sur chaque terme se traduit par
une réciprocité globale, et l’on pouvait prévoir que l’identité (I*) serait simplement
(I*) ∫L* (z, z’,...z(m)) ydt = - M(y, y’,...y(m-1), z , z’,....z(m-1)) + ∫L(y ,y’,...y(m))z dt.
Mais Lagrange ne souligne pas cet aspect du problème : la priorité est de montrer que l’on
applique à l’équation (B) le procédé qui avait opéré sur (A), puis de constater l’analogie dans
le résultat de ces deux opérations.
Passage des solutions de l’équation sans second membre aux solutions de l’équation
complète : cas de l’équation linéaire du second ordre [Lagrange, 1766]
dy d2y
Ly + M + N 2 = T
dt dt
Sont supposées connues deux solutions y1 et y2 de l’équation sans second membre :
dy 1 d 2 y1 dy 2 d 2 y2
L y1 + M +N =0 Ly2 + M +N =0
dt dt 2 dt dt 2
Elimination de z’ entre les deux
*
équations
M (z, z’,y1 , y1’) = A
dt
(
z M − dN y 1 + N )
dy 1 dz
−
dt dt
N y1 = A
( )
*
M (z, z’,y2 , y2’) = B dy 2 dz
z M − dN y 2 + N − N y2 =B
Et
dt dt dt
Solution générale (par intégration
Ay2 − By1
algébrique) z =
* dy dy
de l’équation L (z, z’,z’’ ) = 0 N ( y2 1 − y1 2 )
dt dt
Détermination de deux solutions
différentes de l’équation
L*(z, z’,z’’ ) = 0 Ay2
B = 0 donne z1 =
dy dy
N ( y2 1 − y1 2 )
dt dt
− By1
A = 0 donne z2 =
dy dy
N ( y2 1 − y1 2 )
dt dt
( )
Élimination de y’ entre les deux dz 1 dy
y M − dN z 1 + N − N z 1 = ∫Tz 1 dt
dt dt
équations
dt
M ( y ,y’, z1 , z1’) = ∫T z 1 dt
y (M − dN ) z
dz 2 dy
M ( y,y’, z2, z2’) = ∫T z 2 dt +N − N z 2 = ∫T z 2 dt
dt 2
dt dt
où T = 0 [p. 475] ( On notera que cette intégration algébrique dépend cette fois-ci du calcul
des intégrales contenues dans l’expression de z obtenue ci-dessus).
La réduction à m-p du nombre des solutions différentes y de L (y,y’,...y(m)) = 0 ne conduirait
à une intégration algébrique que dans les cas où l’équation différentielle d’ordre p alors
apparue serait elle-même intégrable.
Les conditions sur les valeurs différentes des fonctions z et y qui interviennent dans ces
calculs ne sont toujours pas examinées. Le chapitre se termine par l’exemple d’une équation
(A ) du second ordre :
dy d2y
Ly + M + N 2 = T
dt dt
Si l’on connaît deux solutions différentes y1 et y2 de l’équation sans second membre
dy d 2y
Ly + M + N 2 = 0,
dt dt
la méthode conduit à la solution générale de l’équation complète. Les étapes du calcul sont
décrites dans le tableau 1-I-f.
Dans cette équation les lettres A, B, C... représentent des constantes. La théorie générale
amène à former l’équation adjointe
d ( h + kt ) z d 2 ( h + kt ) 2 z d 3 ( h + kt ) 3 z
(I) Az - B +C -D +...=0 [p. 482]
dt dt 2 dt 3
Celle-ci admet des solutions de la forme z=(h+kt)r, les exposants r doivent vérifier l’équation
algébrique
(L) A-Bk(r+1)+C k2 (r+1)(r+2)-D k3 (r+1)(r+2)(r+3)+... = 0
Suivant en cela les modalités prévues dans la partie générale, Lagrange utilise ces solutions
pour résoudre l’équation initiale (H), et cela passe par la résolution minutieuse d’un système
linéaire d’équations algébriques d’ordre m. La solution générale de (H) est finalement
explicitée à l’aide d’une somme de m termes qui mettent en jeu les m solutions de (L) au sein
de fonctions écrites sous la forme
θ(r) = ( h + kt ) − r −1 ∫ ( h + kt ) r dt .
grand de sorte que kr soit égal à une quantité finie ρ [p. 491]. Les résultats font intervenir des
fonctions eρ t où la constante ρ prend successivement les valeurs données par la résolution
d’une équation algébrique de degré m
P = A-Bρ +Cρ 2 +... = 0.
Finalement, les solutions s’expriment à l’aide des fonctions
θ(ρ) = e − ρ t ∫ Te ρ t dt .
que des sinus, l’équation de la figure initiale de la corde, lorsqu’elle en a une, ne peut être
que de la forme :
πx 2πx 3πx
ϕ(t) = α sin +β sin + γ sin .... [p. 516]
a a a
La restriction apportée par la locution lorsqu’elle en a une, produit un énoncé compatible avec
le point de vue de d’Alembert. Par les moyens propres au mémoire de 1766, Lagrange
retrouve ainsi un résultat établi par Euler en 1753, dans un autre contexte ; il s’agissait alors
de déterminer toutes les fonctions de différences finies nulles, la différence finie de la variable
étant une constante.5
1.6. bilan
Dans l’histoire des mathématiques éditée par Moritz Cantor, G. Wallner termine sa recension
du mémoire de 1766 en énumérant les principaux résultats qui, à ses yeux doivent être portés
au crédit de Lagrange. Il souligne d’abord que des théorèmes généraux obtenus viennent
constituer une véritable théorie des équations différentielles linéaires. Celles-ci sont en effet
considérées indépendamment de leur ordre, et leurs coefficients sont des fonctions
quelconques. Le mémoire fournit un moyen systématique pour passer des solutions de
l’équation sans second membre L(y, y’,...y(m)) = 0 aux solutions de l’équation complète
L(y, y’,...y(m)) = T. La propriété a un intérêt théorique. Ce mémoire marque, de fait,
l’introduction de la notion d’« équation adjointe » dans l’étude des équations différentielles
linéaires. On retiendra que Lagrange ne donne pas de vocabulaire spécifique à cette occasion.
De même la réciprocité entre l’équation et son « adjointe » se trouve dégagée à la faveur d’un
constat réalisé sur un calcul, alors que le mécanisme et les enjeux ne sont pas complètement
explicités. Les très brefs commentaires laissent en particulier de côté, la problématique du
*
facteur intégrant : les fonctions z solutions de l’équation L (z, z’,...z(m)) = 0 sont, de fait, les
fonctions qui font du produit zL(y, y’,...y(m)) une dérivée exacte. Cette problématique sera
développée dans les Leçons sur le calcul des fonctions dont la première édition date de 1806 :
Toute fonction d’une seule variable peut toujours être regardée comme une dérivée
exacte ; car si elle n’a pas naturellement une fonction primitive, on peut toujours en
trouver une par les séries […]
Il n’en est pas de même pour les fonctions de plus d’une variable ; et quoiqu’on puisse
toujours s’assurer, par les règles de la dérivation, si une fonction composée de
différentes fonctions dérivées résulte d’une fonction primitive donnée […], il est
souvent difficile de juger si elle est une dérivée exacte d’une fonction quelconque
inconnue. Cet objet a occupé les Géomètres presque dès la naissance du Calcul
différentiel ; ils ont cherché des caractères généraux pour reconnaître si une fonction
d’un ordre quelconque peut être la dérivée exacte d’une fonction d’un ordre
immédiatement inférieur, ou même d’un ordre inférieur quelconque. […]. [Œuvres X, p.
364]
Lagrange donnera alors une étude complète de ce problème. Décrivons-en la première étape,
elle comprend comme cas particulier, les expressions du type zL(y, y’,...y(m)) présentes dans le
mémoire de 1766. Il s’agit en effet d’une fonction V de différentes variables x, y, z… et de
leurs dérivées, dans laquelle une de ces variables z et ses dérivées z’, z’’, …, ne se trouvent
qu’à la première dimension [p. 365]. Cette fonction V est écrite sous la forme
V = Nz + Pz’ + Qz’’ + Rz’’’ + …
Choisissons N = N1y , P = P1y , Q = Q1y …avec, pour N1, P1, Q1 ….., des fonctions de la
seule variable t, alors le simple échange des lettres y et z fait apparaître l’expression
5
Voir infra chapitre II, § 2.
zL(y, y’,...y(m)) qui fait l’objet des premiers calculs du mémoire de 1766. Par des
transformations équivalentes aux intégrations par parties, Lagrange obtient ensuite l’identité
V = ( N – P’ + Q’’ – R’’’ + …)z
+ (Pz)’ – (Q’z)’ + (R’’z) - …
+ (Qz’)’ – (R’z’)’ + …
+ (Rz’’)’ -…
+…
La condition d’intégrabilité est finalement écrite au moyen d’une équation de même type que
l’équation adjointe
Comme tous les termes de cette formule, à l’exception de ceux de la première ligne qui
se trouvent multipliés par z, sont déjà des fonctions dérivées exactes, il faudra, pour que
la fonction V soit une dérivée exacte, que les termes multipliés par z, savoir :
(N – P’ + Q’’ – R’’’ + …)z
forment ensemble une fonction dérivée exacte.
Or il est facile de se convaincre que cela est impossible tant qu’on n’établit aucune
relation entre z et les autres variables. Donc il faudra que ces termes disparaissent
d’eux-mêmes de l’expression de V, ce qui donnera l’équation de condition
N - P’ + Q’’ – R’’’ + … = 0
laquelle devra par conséquent être identique pour que la fonction V puisse avoir en
général une primitive. [p. 366]
L’argument ultime est celui-ci : (N – P’ + Q’’ – R’’’ + …)z représente une expression de
type z F(x, y , u, v…) où F ne s’exprime qu’à l’aide des fonctions x, y, u, v… et de leurs
dérivées (la fonction z n’intervenant pas). Or on ne peut avoir
z F(x, y , u, v…) = [G(x, y , z, u, v…)]’
que si les fonctions F et G sont identiquement nulles. Car dans tout autre cas, la dérivée
[G(x, y, z, u, v )]’ ferait intervenir les dérivées de z, et pas seulement la fonction z elle-
même. La mention il est facile de se convaincre souligne, dans l’argumentation, un passage
un peu délicat. A contrario, dans le mémoire de 1766, la théorie de l’équation adjointe est
introduite sur la base de calculs que le lecteur a immédiatement sous les yeux.
On peut enfin revenir sur le procédé d’« abaissement » de l’équation L(y, y’,...y(m)) = T, réalisé
*
à partir de solutions de l’équation L (z, z’,...z(m)). Il met en jeu des systèmes d’équations
algébriques linéaires. En étudiant ces systèmes, on pouvait être conduit à préciser les
conditions à imposer aux fonctions z concernées. Avec l’utilisation systématique des termes
solutions différentes, Lagrange passe à côté de ce problème6.
6
Vessiot mentionne O. Hesse [J. reine angew. Math. 54(1857), p. 227] et E.B. Christoffel [J. reine angew.
Math. 55(1858), p. 293] pour la caractérisation des solutions indépendantes à l’aide du wronskien [Vessiot/Molk,
1910, p. 109].
Abandonnons le terrain théorique pour parler des calculs pratiques réalisés sur les différents
cas particuliers. Le recours systématique à l’équation adjointe augmente le volume des
calculs. On le constate sur le schéma qui décrit les étapes du calcul dans le cas de l’équation
du second ordre [tableau 1 - I - f]. Lagrange lui-même note que le calcul peut souvent être
avantageusement raccourci, en n’utilisant que les dernières étapes
Au reste, si l’on ne connaissait pas d’avance les valeurs particulières de y dans le cas
de T = 0, il vaudrait mieux chercher directement les valeurs de z par la résolution de
*
l’équation (B) [L (z, z’,...z(m)) = 0], laquelle n’est guère plus compliquée que l’équation
(D) [L(y, y’,...y(m)) = 0] [p. 475]
De même, Lagrange traite le cas général,
αϕ[t + a(h+kt)] + βϕ[t + b(h+kt)] + γϕ[t + c(h+kt)]+...= T
mais, les exemples traités ensuite relèvent de l’équation
αϕ(t + a) + βϕ(t + b) + γϕ(t + c) +...= T,
celle-ci nécessite seulement le recours à une équation différentielle à coefficients constants ;
la simplicité de cette dernière situation se trouve masquée par l’utilisation préalable de
l’équation
2 3
dy 2 d y 3 d y
(H) Ay + B( h + kt ) + C( h + kt ) + D( h + kt ) +... = T
dt dt 2 dt 3
et par le passage à la limite qu’il faut réaliser pour obtenir les exponentielles qui forment la
solution.
Mais, dès 1765, l’annonce des résultats fondamentaux de ce mémoire dans une lettre de
Lagrange à d’Alembert, va ouvrir, pour les équations linéaires, des perspectives qui ne sont
plus directement liées à la théorie de l’équation adjointe.
2. d’Alembert et la systématisation d’un procédé connu
2.1. la correspondance entre Lagrange et d’Alembert
et les conséquences que vous en tirez m’ont enchanté ; ce que je vous ai envoyé là-
dessus n’est qu’un cas particulier d’une solution générale par laquelle on peut trouver
ϕ(x) dans cette équation
aϕ(t + αy) + bϕ(t + βy) + cϕ(t + γy) +...= X,
X étant une fonction quelconque de x, et y = A + Bx ; et cette solution elle-même n’est
qu’un cas particulier d’une méthode d’intégration dans laquelle je tire la valeur
complète de y de cette équation de degré m,
2
dy d y
Py +Q + R 2 +....= X,
dx dx
(P, Q, ...,X étant des fonctions quelconques de x), en supposant que je connaisse m ou
au moins m-1, valeurs particulières de y dans l’équation
2
dy d y
Py+Q + R 2 +....=0.
dx dx
Ceci fera la matière d’un mémoire que j’insérerai dans le troisième volume de nos
Mélanges. [Oeuvres, vol XIII, pp. 30-31]
La lettre se poursuit notamment avec une offre de publier dans le prochain volume des
Mélanges de Turin, une contribution que d’Alembert accepterait de lui envoyer.
D’Alembert lui répond dans une lettre du 2 mars 1765.
se réduit à
Lm (y, y’,...y(m)) = v Lm (z, z’,...z(m)) .
Et le terme complémentaire z Lm -1( v’, v’’,...v(m) ) est bien ce que l’on obtient, en faisant
« varier la constante v ». Mais ce point de vue et cette terminologie ne sont pas présents dans
le texte de d’Alembert.
Lagrange répond dans une lettre du 20 mars 1765. Il juge la méthode de d’Alembert très
belle. Il souligne que la sienne en est totalement différente. Puis en faisant allusion à
l’utilisation qu’il en fera dans le mémoire pour résoudre l’équation fonctionnelle
aϕ(x + αy) + bϕ(x + βy )+ ... = X,
il indique que sa solution présente l’avantage de donner tout d’un coup la valeur de y,
moyennant quoi l’on peut aussi l’appliquer aux équations infinies [Oeuvres XIII, p. 37]. Sur
les équations fonctionnelles, comme sur les équations différentielles, le mémoire de Lagrange
donnera en effet l’expression complète des solutions à l’aide de formules. Pour le moment,
d’Alembert expose seulement un procédé de calcul, dont l’itération finit par produire la
solution. Mais, il ne donne pas une formule dans laquelle on puisse lire tout d’un coup la
solution.
Cependant, l’échange n’est pas clos. D’Alembert accède à la demande de Lagrange de fournir
une contribution au volume 3 des Mélanges de Turin. Ce sera l’occasion de préciser une
méthode, qu’il reprendra aussi dans des Mémoires à l’Académie des sciences de Paris.
Votre problème sur l’intégration de l’équation Le problème initial Pm peut s’exprimer sous cette forme : résoudre l’équation
(Em) Lm(y, y’,...y(m)) = X
Qdy Rd 2 y Md m y
Py + + + ....+ = X, connaissant m – 1 fonctions s1, s2,...sm - 1 solutions de l’équation
dx dx22 dxm (E*m) Lm (y, y’,...y(m)) = 0.
lorsque l’on a m-1 valeurs de y dans l’équation s1 sera la fonction que d’Alembert note z, on aura y = V s1. Notons V1 la dérivée de V
Py +
Qdy Rd 2 y
+ + ....+
Md m y
= 0,
(1) ∫
y = s1 V 1 dx
dx dx 2 dx m On obtient une identité
m’a paru si beau, que j’en ai cherché une solution que voici. (2) Lm (y, y’,...y(m)) = V Lm (s1 , s1’,...s1(m)) + s1 Lm -1( V1, V1’,...V1(m - 1))
Soit y = Vz, V étant une indéterminée, et z une des valeurs de Mais les fonctions si sont solutions de l’équation (E*m), l’identité (2) indique donc
y qui satisfait à l’équation que l’équation
Qdy (E*m - 1) Lm -1 ( V1, V1’,...V1(m - 1)) = 0
Py + + &c....= X ; admet m – 2 solutions, lesquelles sont obtenues à l’aide de (1) sous la forme
dx
la transformée sera composée s
: ti = d i , pour i = 2, 3…m – 1
Qdz Rd 2 z Md m z dx s1
1/ d’une partie V ( Pz + + 2
+....+ ),
dx dx dxm Le problème Pm est réduit au problème Pm – 1 : résoudre l’équation d’ordre m – 1
où X ne se trouvera point , laquelle sera évidemment = 0, à (Em - 1) Lm -1 ( V1, V1’,...V1(m - 1)) = X
cause de s1
Qdz Rd 2 z Md m z connaissant les m – 2 solutions ti de l’équation sans second membre (E*m - 1)
Pz + + +....+ = 0 , (hyp) La réduction suivante, obtenue en posant V1 = t2 ∫V 2 dx , concerne l’équation
dx dx2 dx m
2/ d’une partie où V ne se trouvera point , et qui ne contenant (Em - 2) Lm -2 ( V2, V2’,...V2(m - 2)) = X
m s1 t2
que dV avec ses différences jusqu’à d V inclusivement,
è
pourra par conséquence être abaissée au (m-1) degré, en L’équation (E*m - 2) associée admet m – 3 solutions :
faisant dV = V’dx ; or puisqu’on a m-1 valeurs de y, on aura t
donc m-1 valeurs de V, en n’y comprenant pas l’unité ; donc ui = d i pour i = 3, 4…m – 1
dx t 2
supposant que z’ soit une de ces valeurs, et faisant
Le problème P1 concerne la résolution d’une équation du premier ordre
V’ = z’∫V’’dx, comme on a fait y = z∫V’dx, on abaissera de
même l’équation en V’, et ainsi de suite, jusqu’à ce qu’on (E1) L1( Vm-1, Vm-1’) = X
arrive à une équation qui sera de cette forme dV’’ &c + s1 t2 u3......
&c
kV’ dx = X, K et X étant des fonctions de x. Or on sait que dont aucune solution n’est connue a priori, mais dont on sait ramener la résolution à
cette équation est intégrable. des quadratures.
1ère partie 28 chapitre I
Les précisions apportées concernent notamment la façon dont évolue le terme d’ordre k – 1
dans l’équation Lk = 0, d’ordre k.
7
Voit infra 2ème partie, chapitre I.
Cette expression sera donnée par Jacobi8. L’écriture des solutions de l’équation générale du
second ordre [tableau I-1-f] est proche de ce type de résultat. Faute de systématiser la
résolution des systèmes linéaires d’équations algébriques, Lagrange ne donne pas à ses
formules la forme précise qui permettrait une généralisation complète.
Mais, plus près de Lagrange, Euler va revenir sur les propriétés de l’adjointe, avec des
énoncés sur lesquels il faut donner quelques précisions.
8
En 1846, cité par Vessiot [1910, p. 122].
9
Hanc ob rationem aequationem ultimo inventam vocabimus aequationem resolventem formae proposita
pz + q dz + rddz + s d 3z + t d 4z = 0
atque hinc patet, quomodo pro quavis aequatione differentiali lineari proposita eius resolventem inveniri
oporteat [1805, p. 344].
10
Quodsi aequationem resolventem tanquam datam spectare velimus, ex ea vicissim ipsa aequatio prior, cuius
est resolvens, exhiberi poterit per sequentes relationes, quibus litterae minusculae, p, q, r, etc, per maiusculas P,
Q, R, etc. determinatur :
[…]
Unde patet litteras minuscules eadem prorsus lege a maiusculis pendere, qua ab illis pendere sunt inventae
[Opera Omnia p. 345].
On peut mettre en évidence la réciprocité des équations Σpi d iz = 0 et Σ(-1)id i(pi z) = 0, a priori et
indépendamment du contexte dans lequel elles ont été obtenues. Convenons de distinguer, dans les notations, la
dérivation qui opère sur la fonction inconnue z, que l’on notera ∆, et la dérivation, notée D, qui opère sur les
fonctions pi . Avec ces notations on a, par exemple, ∆( pi z) = pi ∆z ;
d i(pi z) = (D + ∆)i(pi z).
L’équation initiale et son adjointe s’écrivent respectivement
Σ ∆i( pi z) = 0 et Σ(- D - ∆)i(pi z).
Le passage de la première à la seconde s’effectue donc par la substitution de l’opérateur (D - ∆) à l’opérateur ∆.
Si l’on effectue encore cette substitution dans le premier membre de l’équation adjointe, on obtient
Σ[- D - (-D - ∆)]i(pi z) = Σ ∆i( pi z).
C’est seulment avec Arbogast que l’on verra apparaître ce type de calcul (voir infra 4ème partie).
11
Qualibet igitur huiusmodi aequatio differentialis cum sua resolvente tali reciproci nexu coniugatur, ut si una
fuerit resolvens alterius, vicissim quoque haec resolvens sit illius. Cum igitur huiusmodi binae aequationes tam
insigni vinculo sint inter se connexae, eas inter se conigatas appellemus, ita ut quaelibet aequatio huius indolis
suam habeat coniugatam, atque utraque ope alterius resolvi possit [Ibid.]
désormais à l’aide de la lettre Z, de même que z désigne la fonction inconnue dans l’équation
initiale.
Il termine cette partie générale en indiquant les formules qui conviendraient pour relier deux
équations conjuguées, écrites respectivement sous la forme
pz + q dz + rddz + s d3z + t d4z + v d 5z + etc.= 0
PZ + Q dZ + RddZ + S d 3Z + T d 4Z + V d 5z + etc.= 0.
Il examine les cas particuliers constitués par les équations à coefficients constants, et par les
« équations d’Euler »
pz + q dz + rddz + s d3z + t d4z + v d 5z + etc.= 0.
Enfin, il termine par la résolution d’une équation avec second membre L = T, à l’aide des
solutions de l’équation conjuguée L* = 0.
Euler ne mentionne pas du tout les travaux antérieurs de Lagrange sur le sujet. Et lorsqu’il
met en évidence la réciprocité, il indique
Si une des deux [équations] admet une solution, en même temps, il sera toujours
possible de résoudre l’autre, et en cela consiste cette observation singulière qui m’est
apparue en vérité très digne d’être signalée ; et en effet je ne me souviens pas de l’avoir
vue fait par quelqu’un d’autre 12
Les résultats essentiels figuraient dans le mémoire de Lagrange en 1766, la conduite des
calculs était un peu différente. L’intérêt du mémoire d’Euler réside dans la mise en valeur de
la réciprocité, avec un vocabulaire et des notations spécifiques.
12
Quodsi enim alterutra resolutionem admittat, simul quoque alterius resolutio semper est in potestate, atque in
hoc consistit observatio illa singularis, quae mihi quidem maxime notatu digna videtur ; neque enim memini eam
quoquam alio factam vidisse. [Ibid.]
13
Se trouvent probablement visés, outre les écrits de Lagrange lui-même et de d’Alembert (tome 3 des mélanges
de Turin), le mémoire de Laplace Recherches sur le calcul intégral aux différences infiniment petites et aux
différences finies (tome 4)
dans le cas où l’on ne connaîtrait que n-1 particulières, en intégrant une équation du
premier degré et du premier ordre. Cette proposition, la plus générale qu’on ait sur
l’intégration des équations, est due à M. Lagrange. [1814, p. 329]
Puis, dans la 5ème édition de son traité élémentaire, Lacroix attribuera sans nuance à Libri, une
méthode semblable à celle de d’Alembert. Au cours d’une controverse qui l’opposera à Libri
sur plusieurs points, Liouville fera clairement état des deux méthodes distinctes présentes dès
1765/66 : l’une dans le mémoire Solution de différents problèmes de calcul intégral de
Lagrange, l’autre dans la lettre de d’Alembert du 2 mars 1765. Et à l’article où figure cette
mise au point, Liouville joindra, en note, le texte complet de la lettre de d’Alembert 14 . Libri
se défendra en disant ne pas connaître ce fragment, et en invoquant le point de vue exprimé
par Lacroix lui-même 15. Ces péripéties sont relatées par S. Demidov [1983], dans un article
consacré à l’histoire des équations différentielles linéaires.
14
Journal de Liouville, tome II, juillet 1837, p. 245-247
15
Comptes-rendus de l’Académie des sciences, tome 8, 1839, p. 733
16
Sur ce sujet nous donnons quelques détails dans l’annexe 1-I-A.
17
Nous nommons ainsi cette formule parce qu’elle apparaît pour la première fois dans un mémoire de Brisson
[1808]. Nous étudions ce mémoire au chapitre II de la 3ème partie. Sturm donne une démonstration élémentaire
de la formule et ne se réfère pas à Brisson
chapitre II
les équations différentielles linéaires avant 1766
Pour donner une image complète des découvertes publiées en 1766, il faut les replacer de
façon plus précise dans leur contexte. Avant cette date, des travaux avaient déjà été consacrés
aux équations linéaires. Des résultats avaient été obtenus. Et nous avons même vu que
d’Alembert commençait sa lettre du 2 mars 1765 en évoquant ses propres travaux. Dès 1743,
dans son Traité de dynamique, il résolvait une équation linéaire du second ordre par un
procédé original. Ce procédé était-il déjà une méthode de variation de la constante ? La
réponse à cette question devra être nuancée : les calculs peuvent effectivement s’interpréter en
termes de variation de la constante, mais la présentation qu’en faisait alors d’Alembert, nous
amènera plutôt à parler de « méthode de dédoublement ».
D’autre part, d’Alembert traite parfois les équations différentielles linéaires en les ramenant à
des systèmes linéaires et en effectuant ce qu’on appellerait aujourd’hui une
« diagonalisation ». Dans les Recherches sur différents points importants du système du
monde [1754], « dédoublement » et « diagonalisation » seront présentés comme deux
procédés concurrents.
Nous examinerons ensuite quelques-uns des travaux d’Euler sur les équations linéaires.
m K mK=x
M MQ=y
Q O
Une mise en équation est réalisée dans le cas général, x et y sont des fonctions du temps,
représenté par la variable t. Ces fonctions sont solutions d’un système d’équations
différentielles du second ordre. D’Alembert va en effectuer la résolution dans le cas
particulier où les poids m et M sont égaux, et où les longueurs Cm et mM sont aussi égales.
T étant une constante introduite pour des raisons d’homogénéité, il montre que x et y sont
solutions du système suivant :
2 dt 2
(P) - ddx = (2 x - y) 2
T
2 dt 2
(Q) - ddy = (2 y - 2 x) 2
T
L’auteur va ramener la résolution de ce système différentiel à la résolution d’une équation
concernant une unique fonction inconnue
Pour intégrer ces équations, je multiplie la première par α, et la seconde par ν (α et ν
étant deux nombres indéterminés) et ensuite je les ajoute ensemble ce qui donne
2dt 2
(R ) - dd (αx + ν y) = [(2 α - 2 ν )x + (2ν - α)y]
T2
je fais en sorte que, [(2 α - 2 ν )x + (2ν - α)y] soit un multiple de - αx - ν y), ce qui
donne
2α − 2ν 2ν −α
= ,
α ν
et
α = ±ν 2
Donc
2dt 2
- ddx 2 - ddy = [ (2 2 - 2) . x + (2 - 2 ).y ]. . [p. 99]
T2
L’équation s’écrit aussi
(
- dd (x 2 + y) = 2 − 2 ( 2 x + y ). )
2dt 2
T2
. [p. 99]
Il suffit alors de poser u = x 2 + y, pour obtenir une équation à une seule inconnue
- dd u = u 2 − 2 (2dt 2 18
T2
. )
Une intégrale première peut être rapidement obtenue sous la forme
- (d u) 2 = 2 − 2 (
u 2 dt 2
T2
. )
L’intégration peut se terminer par séparation des variables. D’Alembert considère alors que la
quantité u se trouve construite[p. 100].
De cette étape de calcul, on retiendra qu’une combinaison linéaire des équations (P) et (Q) a
permis de trouver la fonction auxiliaire u = αx + ν y donnée par une équation différentielle.
En utilisant une terminologie anachronique, on peut parler d’une méthode de
« diagonalisation » 19.
18
À cet endroit le calcul de d’Alembert, dans l’édition de 1743 du traité de dynamique, est inexact ; en effet le
texte comporte - dd u = u 2 ( )
2dt 2
T2
; la suite du calcul - en ce qui concerne la relation entre u et t - reste
Il reste à déterminer les fonctions x et y. Compte tenu des valeurs imposées aux constantes α
et ν , y peut s’écrire
y=u-x 2
En reportant cette valeur dans l’équation (P), d’Alembert fait apparaître x comme solution
d’une équation linéaire du second ordre 20
2dt 2
- ddx = [(2 + 2 )x -u ] 2
T
dans laquelle la quantité u est déjà construite [p. 100]
( )
2dt 2
on peut supposer que les deux termes - zdds et 2 + 2 . zs. 2 soient égaux ce qui
T
donne
B 2 dt 2 2 2s 2 dt 2
- ds = (2 + 2 ) . [p. 101]
T2 T2
La relation imposée se traduisait d’abord par l’équation 21:
(
- zdds = 2 + 2 . zs. 2 )
2dt 2
T
d 2 x x −4 2
2
= A , où A est la matrice . Cette matrice se diagonalise sous la forme
dt y y 4 −4
−4 + 2 2 0 2 1
A = PDP-1 avec D = . On peut prendre P-1 = et transformer le
0 −4 − 2 2 2 −1
d 2 −1 x −1
x
système en P = DP . La fonction u employée par d’Alembert est le premier élément de la
dt 2 y y
−1
x 2 x + y
matrice colonne P = .
y 2 x − y
20 2+ 2 u
En utilisant des dérivées et des notations qui s’y rapportent, on peut écrire : x’’ + 2 2
x= 2 .
T T
21
Cette relation est très exactement l’équation « sans second membre » associée à l’équation linéaire
2+ 2
donnée, soit : s’’ +2 s =0
T2
Il faut procéder à une simplification par z, une intégration au moyen du facteur intégrant ds
fait alors apparaître la constante d’intégration B et conduit en effet au résultat donné par
l’auteur 22.
D’Alembert poursuit :
il ne nous reste plus que l’équation :
−2dzds − sddz 2udt 2
=− 2
l T
dont l’intégrale est
s2 dz 2usdt 2
=∫ 2
[p. 101] 23
l T
La suite de l’étude consiste dans la construction de la solution. D’Alembert se donne deux
segments qui représentent le rapport de t et T, et les relations obtenues lui permettent de
décrire des constructions géométriques conduisant aux segments qui représentent, pour un
temps t quelconque, la valeur de u, z, s [p. 102], et donc aussi la valeur de x et de y.
Au total, le calcul porte bien sur une équation différentielle linéaire du second ordre, que l’on
peut écrire avec des notations un peu différentes de celles de d’Alembert
2+ 2 u
x’’ + 2 2
x= 2
T T
En considérant que s est solution de l’équation « sans second membre »
2+ 2
s’’ +2 s=0
T2
zs
la détermination de x sous la forme x = repose ensuite sur la résolution d’une équation du
l
premier ordre dont la fonction inconnue serait z’
s' 2ul
z ''+2 z ' = 2
s sT
Mais on observera sans difficulté que la réécriture des équations qui est ici introduite est le
résultat d’une lecture récurrente, elle procède de la volonté de déceler la présence d’une
méthode générale, associant systématiquement « équation complète » et « équation sans
second membre ». Par ailleurs, d’Alembert ne cherche pas à donner l’expression analytique
des solutions, à propos desquelles il recherche des constructions géométriques. Cette
circonstance donne un caractère peu systématique aux méthodes mises en oeuvres. D’autre
part, le texte du Traité de Dynamique met l’accent sur un autre aspect de la procédure
zs
utilisée : le « dédoublement » de l’inconnue x en x = introduit une marge de manœuvre qui
l
22
C’est une situation rencontrée plus haut, et qui peut se traiter en multipliant les deux membres de l’équation
2+ 2 2 2 + 2 2 B2
du second ordre par s’ pour obtenir : s’s’’ +2 s’s =0 ; l’intégration en s’ +2 s = 2 s’en
T2 T2 T
B2
déduit ( 2 est une constante d’intégration).
T
23 −2 s ' z '− sz '' 2u −2 ss ' z '− s2 z '' 2us
= − 2 donne , en multipliant par s les deux membres , = − 2 , et une
l T l T
2
s z' 2usdt
intégration conduit à : =∫
l T2
permet d’écrire une équation auxiliaire qui sera plus simple à résoudre. Le principe est voisin
de celui que l’on utilise dans la méthode de Cardan pour la résolution de l’équation algébrique
du 3ème degré : l’inconnue x y est « dédoublée » en une somme dont les deux termes u et v
constituent les nouvelles inconnues (x = u + v), la résolution est obtenue en imposant à u et v
la condition supplémentaire qui permettra de simplifier les calculs.
Dans cette phase de généralisation, les calculs complets ne sont pas donnés, et on ne rencontre
plus d’équation linéaire à deux variables (c’est-à-dire à une fonction inconnue). C’est donc
uniquement dans le cas du pendule double que d’Alembert met en œuvre la méthode de
« dédoublement » évoquée ensuite dans la lettre à Lagrange de 1765.
Retenons que cette méthode est utilisée au cours d’une étape de calcul qui concerne des
systèmes différentiels linéaires. D’Alembert fait des observations assez générales sur les
systèmes ainsi rencontrés. Notamment, il met en œuvre des combinaisons linéaires qui
peuvent s’interpréter en terme de « diagonalisation ».
En 1754, il fera une référence explicite aux calculs présents dans le Traité de Dynamique.
Mécanique Céleste. Il partage cette préoccupation avec Clairaut et Euler, dans un climat
parfois passionnel. L’enjeu des travaux de cette période est rien moins que la validation ou la
remise en cause de la théorie newtonienne de la gravitation. Le sort de cette théorie est
évidemment lié à sa capacité à décrire et prévoir les phénomènes. Or, certaines indications
rapides données par Newton lui-même, ou encore les premiers calculs réalisés par ses
successeurs, ne coïncident pas avec les observations astronomiques. Il en est ainsi du
mouvement de l’apogée de la Lune. Les calculs conduisent d’abord à une vitesse moitié de la
vitesse observée. On pense à refaire les calculs en introduisant, dans la loi de l’attraction en
1/r2, un terme correctif. En 1749, Clairaut apporte le dénouement : ce n’était pas la loi de
Newton qui était responsable de cette distorsion, mais les approximations, trop lâches,
réalisées au cours des calculs. C’est dans ce contexte que d’Alembert a composé les
Recherches sur différents points importants du système du monde. Les deux premiers tomes
du Traité sont publiés en 1754, le troisième en 1756. L’œuvre porte sur le mouvement et la
forme de la Terre, deux types de question qui sont concernés par la mise à l’épreuve de la
théorie newtonienne. D’Alembert revient aussi longuement sur le mouvement de la Lune, en
particulier sur le problème des apogées.
C2 d 2 1 1
− 2 2 +
r dθ r r
L
r
T θ
C’est la résolution de cette équation qui conduit à l’équation polaire d’une conique de foyer T.
On peut appliquer ce type de calcul à la détermination de la trajectoire de la Lune L autour de
la terre T. Mais Newton avait déjà constaté que le calcul reposant sur ce seul principe ne
conduisait pas à des résultats conformes aux observations. Il faut tenir compte d’autres forces
qui s’exercent aussi sur la Lune. En particulier, l’action du Soleil ne doit pas être négligée.
π
L
ψ
r
l
T x
z
d t t 0 0 1
24
Le système (S) peut s’écrire à l’aide de matrices : = A + où A = . Cette
dz y y − M −N 2 0
− N −1 0
-
dernière matrice se diagonalise : A = PDP 1 avec D = On peut prendre
0 N −1
−1
1
P-1 = N . L’équation matricielle est donc :
− −1
1
N
−1
−1 − N −1 t + −1 y − M
d −1 t t + y N
= −1
t
+ −1
0 d N = N
P DP P −1
, soit .
dz y y − M dz −1 −1
t − y N −1 t − y + M
N N N
Ce qui est bien la traduction du système (S *).
M −1 dz
dx + N −1 . x dz + =0
(S*) N
M −1 dz
ds − N −1 . s dz − =0
N
Ces équations du premier ordre à coefficients constants sont immédiatement intégrées, sans
explications ; la résolution repose sur l’utilisation du facteur intégrant e N −1 . Par exemple, G
représentant une constante arbitraire, x est donnée par la relation :
x e Nz −1
+
∫ M −1e Nz −1dz
+G = 0 [1754a, p. 25]
N
Finalement, à l’aide d’intégrales, la fonction t est exprimée en fonction de la variable z et des
valeurs initiales δ = t(0) et ε = t’(0). L’expression générale est donnée à l’aide des fonctions
e N z −1 et e− N z −1 [p. 27]. Dans le cas particulier où la fonction M est un cosinus
M = B cos(A+pz),
la solution peut être écrite sous la forme
B(cos. A+ pz) cos.A + pz cos.A − pz
(T) t = δ cosNz + ε sin Nz - + B + .
N 2 − p2 2N N − p N+ p
Des corollaires étudient d’autres cas particuliers : la fonction M peut être une constante
[corollaire IV, p. 28] ou une fonction sinus Bsin (A+pz) [corollaire V, p. 29] ou une
combinaison linéaire de tels sinus et de cosinus
Ces résultats généraux sont obtenus dès le début de la première partie des recherches sur
différents points importants du système du monde. Dans la seconde partie, d’Alembert les
utilise directement et il transforme l’expression de la solution t de l’équation (E), de façon à
ne plus être tributaire des exponentielles imaginaires. Il obtient
ε 1 1
(T*) t = δ cos z + sin z + cos N z ∫M sinNz dz - sin N z ∫M cosNz dz [p. 130]
N N N
( où δ = t(0) et ε = t’(0)).
La mise au point de cette dernière formulation occupe le début du chapitre VII, intitulé : Autre
manière de résoudre l’équation générale du problème des trois corps, avec quelques
conséquences qui en résultent [p. 129]. Ce titre est justifié par une digression qui va former
l’essentiel du chapitre. Elle n’apporte aucun élément nouveau pour la résolution des
problèmes de Mécanique Céleste, objets principaux du Traité. L’objectif est de saisir une
occasion d’exposer une méthode générale.
=0.
Or à cause des deux indéterminées z et s, dont
Supposons maintenant l’une peut être tout ce que l’on voudra, on
peut supposer que les deux termes
2 2
sddq + sN q dz = 0 - zdds et 2(+ )
2 . zs.
2dt 2
T2
soient égaux ce qui donne
ce qui est permis puisqu’on peut prendre q
telle qu’on juge à propos, on aura B 2 dt 2 2s 2 dt 2
2
ddq + N 2 q dz2 = 0, 2
- ds = (2 + 2 ) 2
. [p. 101]
dq T T
et Ndz = -
1−qq
c’est-à-dire que q sera le sinus de l’angle Nz
[p. 130] tableau 1-II-a
Les membres de phrase que nous avons soulignés montrent bien que d’Alembert utilise, dans
les deux cas, la même méthode de « dédoublement » de la fonction inconnue. Les calculs qui
suivent n’ont pas tout à fait la même tonalité dans les deux traités : en 1743, l’équation sans
second membre donnait lieu à une intégrale première que d’Alembert exploitait en termes de
construction, cette fois la solution est donnée explicitement grâce à l’utilisation de la fonction
sinus.
Le calcul se poursuit, et d’Alembert finit par retrouver la formulation (T*) de la solution, telle
qu’il l’a déjà obtenue en transformant les exponentielles imaginaires [p. 131].
1.3. récapitulation
La lecture du traité de dynamique et des recherches sur différents points importants du
système du monde fait apparaître des méthodes générales de résolution des équations linéaires
Ces méthodes se trouvent étroitement imbriquées dans la réalisation des calculs que nous
avons rencontrés.
D’Alembert fait observer que la méthode peut-être étendue à d’autres équations du second
ordre à coefficients constants.
dx – ydt = 0
dy + a x . dt + M dt = 0 ,
Il existe alors deux valeurs opposées de la constante ν qui permettent d’obtenir, par une
combinaison linéaire, une équation
(5) d (x + ν y) + a ν (x + ν y) . dt + νM dt = 0 ,
dont la fonction inconnue est z = x + ν y. Ces valeurs peuvent s’écrire ν 1 = 1 et
−a
ν 2 = - 1 , les deux équations (5) qui leur correspondent sont des équations du premier
−a
ordre que l’on sait résoudre par quadrature. Leurs solutions respective s z1 et z2 dépendent
chacune d’une constante arbitraire, les solutions de (5) sont finalement obtenues à l’aide du
système algébrique formé par les deux intégrales premières
x + ν 1 y = z1
x + ν 2 y = z2 .
Cette méthode peut être utilisée avec une équation du second ordre
ddx + a dxdt + b x dt 2 + M dt 2 = 0,
où a et b sont des coefficients constants.
La méthode est donnée aussi dans les Réflexions sur la cause générales des vents, avec la
mention : je l’expose ici en peu de mots, parce qu’elle peut servir à l’avancement de l’Analyse
[1747, p. 143]. Et, dans les Recherches sur différents points importants du système du monde,
D’Alembert présente cet abaissement par diagonalisation, comme une méthode parallèle au
procédé de « dédoublement ».
∫
B dx − dA
X=e A A , et Xay + ∫CXdx = 0,
ce qui donne y en x par deux quadratures.[article linéaire, 1777]
Mais Montucla donne d’autres détails. Il indique que Jacques Bernoulli a proposé dès 1695 ce
cas d’équation différentielle
yXdx + byn X’dx – ady = 0,
dans laquelle X, X’, sont des fonctions différentes de x et de constantes, et a et b des
constantes[1802, p. 176]. Après avoir expliqué les contributions de Leibniz et de Jacques
Bernoulli à ce problème, Montucla écrit très précisément
Mais Jean Bernoulli est celui qui en a donné la solution la plus instructive et la plus
développée. […] Elle consiste d’abord à supposer l’une des variables y, égale à mz, (m
et z étant deux nouvelles indéterminées). Cette valeur étant substituée dans l’équation
proposée, il en résulte une nouvelle équation à quatre termes dont il égale deux, ce qui
lui est permis à cause de la double indétermination de m et de z. Il en résulte une valeur
de z en x, qui étant substituée dans les termes restants, opère la séparation des
indéterminées, et donne une valeur de m en x ; or l’on avait fait y = mz. Conséquemment
ce procédé donne la valeur de y, égale au produit des deux fonctions de x, trouvées pour
m et z. [p. 176] 24
Limitée, il est vrai, à l’équation du premier ordre, c’est donc bien la méthode « de
dédoublement » qui était ainsi utilisée par Jean Bernoulli. Traitant des problèmes de
Dynamique ou de Mécanique Céleste, d’Alembert fait usage de cette méthode pour des
équations du second ordre à coefficients constants. C’est dans la lettre de 1765 qu’il l’érige en
moyen systématique permettant de traiter des équations linéaires d’ordre quelconque et dont
les coefficients peuvent être variables.
Le cas échéant, il montre qu’il dispose de plusieurs méthodes pour résoudre un même type
d’équations. En particulier, les procédés utilisés pour les systèmes linéaires lui fournissent une
méthode d’abaissement pour le cas d’une équation unique.
24
Mais à la page 184, Montucla attribue la même méthode à Jacques Bernoulli.
Le reste du mémoire ne va concerner que les équations à coefficients constants. Cherchant des
solutions sous la forme epx , Euler montre que le nombre p doit être racine de l’équation
algébrique
(3) 0 = A + B z + C z 2 + D z 3 + …+ N z n
La résolution de l’équation différentielle proposée est donc terminée si l’équation algébrique
obtenue admet n racines réelles distinctes. Pour le cas des racines réelles multiples, puis des
racines imaginaires, l’adaptation de la méthode mérite d’être suivie avec attention
À l’un et l’autre inconvénient nous apporterons un remède si nous considérons plus
attentivement le lien entre l’équation différentielle proposée [(1)] et l’équation
algébrique formée [(3)]. [p. 115]
qx
p
Quand y = e est solution de l’équation différentielle (1), cette solution provient de la
présence du facteur q – pz dans le second membre de (3). À ce facteur, on peut donc associer
l’équation différentielle
pdy
qy - = 0,
dx
qx
p
laquelle fournit précisément la solution y = e . Euler étend cette propriété aux facteurs
présents dans le second membre de (3) et dont le degré serait supérieur à un. En effet
De là on comprend que si on a un diviseur quelconque de l’équation algébrique,
supposons p + qz + rzz, alors l’équation naissant de ce diviseur
qdy rddy
py + + =0
dx dx2
donnera une valeur pour y qui, de même, satisfera à l’équation différentielle proposée.
Et donc, à partir de là, nous pourrons supprimer la difficulté qui a lieu si l’équation a
deux facteurs égaux ou davantage. Soit donc (p – qz)2 un diviseur de l’équation
algébrique et de celui-ci développé, résultera l’équation algébrique
2pqdy qqddy
ppy - + = 0 [p. 116]
dx dx2
qx
p
La résolution complète de cette dernière équation prend appui sur la solution particulière e ,
déjà connue
qx
p
Posons y = e u
et la substitution étant faite nous aurons ddu = 0, et à partir de là u = α + βx. C’est
pourquoi du facteur carré (p – qz)2 naît la valeur suivante
qx
y = e (α + βx) [Ibid.]
p
L’expression obtenue fait intervenir deux constantes arbitraires ; complétant les solutions
obtenues à l’aide des seules racines simples de (3), elle viendra fournir finalement la solution
générale de l’équation (1) proposée.
Le raisonnement sera répété pour un facteur (p – qz)3 , celui-ci sera associé à l’équation
3ppqdy 3pqqddy q 3 d 3 y
0 = p3 y - + − ,
dx dx 2 dx3
qx
laquelle sera résolue en posant y = e u, ce qui donnera d3 u = 0. Les résultats sont donnés
p
ensuite plus rapidement pour le cas d’une racine p/q d’ordre quatre, puis pour une racine
d’ordre k.
La même démarche va présider au traitement des racines imaginaires. Une telle racine se
trouve nécessairement associée à sa conjuguée, et cela justifie la présence dans l’équation
algébrique d’un facteur p - qz + rzz. Son expression est transformée par l’introduction de
p
l’angle ϕ défini par q = 2 p r.cos.A.ϕ puis du coefficient f = . Euler l’écrira finalement
r
p - qz + rzz = ff –2f.cosA.ϕ + rzz. [p. 119]
De ce facteur, naît l’équation différentielle
2f dy rddy
0 = ffy - cosA.ϕ + .
dx dx2
Euler résout cette équation en utilisant un moyen proche de celui qui a été employé pour le
cas des racines multiples. Les solutions seront en effet recherchées sous la forme
p
xcos A .ϕ
y= e r u
La fonction u est alors solution d’une équation
p
ddu + u (sinA.ϕ)2 dx 2 = 0,
r
ce qui permet d’exprimer la forme générale de la fonction u, puis l’expression de y qui s’en
déduit et qui est écrite sous la forme
(4) y = e f x cos A.ϕ (αcosA. fx sinA.ϕ + β sinA. fx sinA.ϕ ) [p. 120]
Le cas des racines imaginaires multiples est aussi étudié en suivant les mêmes principes.
2. Euler tire partie de l’analogie entre les équations différentielles à coefficients constants et
les équations algébriques. L’équation algébrique se « compose » d’équations de degrés
inférieurs, on peut prévoir que l’équation différentielle se « compose » aussi des diverses
équations différentielles correspondantes.
En 1753, paraissent deux mémoires qui font référence à ces résultats.
Dans methodus aequationes differentiales altiorum graduum integrandi ulterius promota,
[1753a] Euler va étudier les équations linéaires à coefficients constants complètes
Bdy Cddy Dd 3 y Ed 4 y
X = Ay + + + 3
+ + etc
dx dx2 dx dx 4
Avant d’en commencer l’étude, il rappelle ce qu’il a déjà obtenu en 1743 et qui concernait
l’équation homogène. Les résultats sont consignés dans un tableau où sont mis en regard les
différents types de facteurs de l’équation algébrique et les parties de l’intégrale qui leur
correspondent, selon la disposition suivante
z–k aekx
(z – k)2 (α + βx) aekx
(z – k )3 (α + βx + γx 2 ) aekx
(z – k)4 (α + βx + γx 2 + δx 3 ) aekx
etc. etc.
[1753a, p. 192]
Nous examinerons ensuite les méthodes qui sont alors mises en oeuvre pour l’équation
complète.
Mais en 1753, Euler publie aussi de serierum determinatione seu nova methodus inveniendi
terminos generales serierum [1753b]. Les résultats concernant les équations homogènes vont
être sollicités pour la résolution d’une équation d’ordre infini.
ez = 1+
z
n
et le problème est donc de factoriser le « polynôme »
P(z) = 1+ - 1.
z
n
Suivant des techniques de calcul qu’il a déjà utilisées dans l’Introductio in analysin
infinitorum 25 , Euler recherche les solutions zk de l’équation
P(z) = 0 .
Une décomposition de P(z) en facteurs linéaires (z – zk) s’en déduit. Mais les racines zk sont
conjuguées deux à deux. En regroupant les facteurs (z – zk) et (z - z k ), il met en évidence des
facteurs du second degré à coefficients réels
4kkππ + 4kkππz + zz.
n
Il suffit de les identifier avec les facteurs du « polynôme caractéristique », qui ont été mis en
évidence dans le mémoire De integratione aequationum differentialium altiorum
graduum.[1743], et qui s’écrivent sous la forme
ff - 2fzcos.φ + zz.
On aura donc
kπ
f = 2kπ et cos.φ = -
n
Euler applique alors très précisément les résultats obtenus en 1743 ; la partie de l’intégrale
afférente à ce facteur est donc donnée par
− 2 kkππ −2 kkππ
αe n sin( 2kπxsin ϕ) +ℑe n cos(2kπxsin ϕ) .
Mais, ici, comme n = ∞, on prendra cos.φ = 0, et sin φ = 1, le terme se réduira donc à
αsin.2kπx + ℑcos.2kπx. [p. 473]
Cependant, dans l’expression de e − 1 en produit, le premier facteur obtenu est z. Dans la
z
25
Voir [Euler 1748, p. 116]
Puis la résolution concerne le cas général, où X n’est pas nécessairement un polynôme. Elle
repose sur la recherche d’un facteur intégrant exprimé par une fonction exponentielle. Elle est
mise en œuvre sur des équations d’ordre croissant. Pour l’équation
Bdy
(6) X = Ay +
dx
Il s’agit de déterminer α pour que l’expression
(7) eαxX dx = A eαxydx + B eαxdy
soit une différentielle. Le dernier terme relève de la différentielle de B eαxy, laquelle s’écrit
(8) d(B eαxy) = αB eαx y dx + B eαxdy
La comparaison des expressions obtenues en (7) et en (8) amène ainsi à choisir
α= A
B
L’intégration de la relation (7) conduit alors à
∫eαxX dx = B eαx y
et
y = α e-αx ∫eαxX dx [p. 194]
A
Pour l’équation du second ordre
Bdy Cddy
(9) X = Ay + + ,
dx dx2
il s’agira d’abord de déterminer α pour que l’intégrale des deux membres de l’équation
Bdy Cddy
(10) eαxXdx = eαx (Ay + + )dx
dx dx2
puisse s’interpréter sous la forme
B'dy
(11) ∫eαxX dx = eαx(A’y + ).
dx
Or la différentiation de cette relation (11) conduit à
B'ddy
(12) eαxX dx = eαx (αA’ y dx + A’dy + + αB’ dy )
dx
Finalement, l’identification de (12) et de (10) impose les relations suivantes
(13) B’ = C, (14) A’ + αB’ = B, (15) αA’ = A
Compte tenu de (13), la relation (14) permet d’écrire A’ à l’aide de α , de B et de C
A’ = B - αC ,
Le report de cette valeur dans (15) montre que α doit être racine de l’équation du second
degré
(16) A - αB + α 2 C = 0.
Pour une valeur de α ainsi choisie, l’équation du second ordre (10) est ramenée à l’équation
du premier ordre (11). Cette dernière équation peut aussi s’écrire
e- αx dx ∫eαxX dx = A’ ydx + B’ y.
Il suffit alors de lui appliquer les calculs réalisés précédemment sur l’équation (6), et de
chercher un nombre β qui permette d’exprimer comme une différentielle, l’expression
e(β - α)x dx ∫eαxX dx = A’ eβx ydx + B’ eβx y.
On trouve
B −α C
β = A' = .
B' C
Les deux nombres successivement obtenus sont liés par la relation
α +β = B .
C
Ce sont donc les deux racines de l’équation algébrique (16). Finalement, à l’aide de ces deux
racines, la solution de l’équation du second ordre (9) est donnée par la relation qu’Euler écrit
∫ e(α - β)x dx ∫eαxX dx = B’ eβx y = C eβx y.
Il faut comprendre que le premier membre contient deux intégrations successives que l’on
peut écrire de façon moins ambiguë
∫ (e(α - β)x ∫eαxX dx )dx.
Une intégration par parties permet d’obtenir une expression symétrique
−α x −β x
Cy= e ∫eαxX dx + e ∫eβxX dx [p. 195]
β −α α −β
D’autre part, Euler considère le polynôme obtenu à partir de l’équation différentielle en
dy 2 d 2y
posant 1 pour y, z pour , z pour [p. 196]
dx dx 2
P = A + Bz + Czz. [p. 196]
Sa factorisation met en jeu les nombres α et β
P = C (z + α ) (z + β ).
De même, Euler va considérer l’équation d’ordre n
Bdy Cddy Dd 3 y ? d ny
(17) X = Ay + + + 3
+....+ [p. 192]
dx dx 2 dx dx n
et lui associer le polynôme
(18) P = A + Bz + Czz + ….+ ∆zn = ∆(z + α ) (z + β ) (z + γ ) (z + δ )…
Il introduit le multiplicateur eα x dx
Bdy Cddy Dd 3y Nd n y
(19) eα x Xdx = eα x dx ( A y + + + + ...+ )
dx dx 2 dx 3 dx n
Il s’agira de déterminer les coefficients A’, B’…pour que les deux membres de (19) soient
intégrables sous la forme
A'dy B'ddy ∆d n y
eα x ( + + ...+ )
dx dx2 dx n
la différentiation de ce produit donne
B 'dy C 'ddy ∆d n −1 y A'dy B'ddy ∆d n y
α eα x (A’ y + + + ...+ )dx + e αx
dx ( + + ...+ ).
dx dx2 dxn −1 dx dx2 dx n
L’identification avec le second membre de l’équation (19) conduit aux égalités
αA’ = A ; αB’ + A’ = B ; αC’ + B’ = C ; ...... αD’ + C’ = N
Les coefficients A’, B’, C’, D’ sont alors interprétés comme les coefficients du polynôme P’
relié à P par la relation P = (z + α) P’.
P’ se factorisera donc sous la forme
P’ = ∆ (z + β )( (z + γ ) (z + δ )…
Le procédé a donc permis l’abaissement de l’équation (18), réduite à l’équation
A'dy B'ddy ∆d n−1 y
e −α x ∫ eα x Xdx = ( + 2
+...+ n−1 ).
dx dx dx
Cette équation est associée au polynôme
P’ = ∆ (z + β )(z + γ ) (z + δ )… = A’ + B’z + C’zz + ….+ ∆zn - 1
L’étape suivante conduira à l’équation écrite avec les notations d’Euler
∆d n −2 y
(20) ∫ e(α - β)x dx ∫eαxX dx = A''dy + B''ddy + ... + .
dx dx 2 dxn −2
Cette équation sera associée au polynôme de degré n - 2
La partie de l’intégrale concernée par α et β était constituée des deux premiers termes de
l’expression (22), sa nouvelle expression sera
e −α x ∫ dx ∫e-αxX dx ,
A1'
le coefficient A1' est donné par
A1' = ddP2 .
2dz z =α
Le cas d’une racine triple est obtenu en introduisant deux quantités évanouissantes ω et Φ,
grâce auxquelles on va pouvoir exprimer les racines β et γ
β =α + ω et γ = α + Φ.
L’écriture de la fonctions eβ x telle qu’elle a été faite en (23) ne suffira plus ; il faudra cette
fois introduire un terme du second ordre, de même pour eγ x . La partie de l’intégrale
correspondant à cette racine triple fera intervenir un coefficient A1'' = d P3
3
. Euler ne
3dz z =α
donne pas les calculs pour des racines multiples d’ordre supérieur à 3, mais les résultats
obtenus se prêtent sans difficulté à une généralisation, et dans la conc lusion du mémoire Euler
pourra donner aussi l’expression de la solution pour le cas d’une racine d’ordre 4. Enfin le cas
des racines imaginaires est traité ; en regroupant les parties de l’intégrale qui correspondent à
deux racines conjuguées, l’auteur parvient à une expression qui ne fait plus apparaître
d’imaginaire.
26
« Quaeratur eiusmodo functio ipsius x, quae sit X, ut facta substitutione y = Xu aequatio prodeat
separabilis. Tum autem oritur
.....................
Quam aequationem separationem admittere evidens est, si fuerit ... » [Euler, Opera omnia, (I) 11, p. 267]
présentés et qui figuraient dans les mémoires publiés en 1743 et 1753. La factorisation du
« polynôme caractéristique » était déjà exploitée avec minutie dans les mémoires précédents.
Elle fait l’objet ici d’une remarque de caractère plus général.
Après ces travaux spécifiquement consacrés aux équations linéaires, nous allons voir un
exemple d’utilisation de ce type d’équation au sein d’un mémoire qui présente un autre
objectif. Un passage de ce mémoire témoigne d’une familiarité avec ce que nous appelons la
méthode de variation de la constante.
27
Quoniam autem hæc æquatio est differentialis secundi gradûs, atque insuper arcus et sinus arcuum continet,
facilè intelligitur ejus integrationem minus esse obviam [p. 301]
28
interim tamen cum alterius variabilis s plus una dimensione nusquam adsit, ea per methodos mihi familiares
tractari poterit. Soleo autem, quoties ejusmodi occurrunt, initio eos terminus in quibus altera variabilis a
omnino non inest, rejicere ; unde hæc consideranda venit æquatio…[p. 301]
29
Cognito autem hoc valore, idonea nascitur substitutio facienda pro æquatione proposita…[p. 302]
3. bilan
Sur les travaux d’Euler en matière d’équations linéaires, les indications qui précèdent ne sont
pas exhaustives. Dans son article sur les recherches d’Euler dans le domaine des équations
différentielles [1968], Simonov souligne la tendance des historiens à minorer les apports
théoriques d’Euler sur les équations différentielles. Pour ce qui concerne les équations
linéaires, il distingue, quant à lui, quatre cycles. D’abord de nombreux travaux donnent la
solution de problèmes linéaires de mécanique et de physique les plus variés [p. 139] ; on les
trouve notamment dans la Mechanica [1736]. Les systèmes d’équations linéaires à
coefficients constants y sont représentés. Avant 1743, un second cycle concerne les équations
linéaires à coefficients variables, puis dans un troisième cycle Simonov regroupe les équations
linéaires à coefficients constants. Enfin, avec le mémoire methodus aequationes differentiales
altiorum graduum integrandi ulterius promota, commence un quatrième cycle , lequel
concerne à nouveau les équations à coefficients variables, et se termine avec les mémoire sur
les équations conjuguées dont nous avons rendu compte.
Les éléments que nous avons examinés ci-dessus, ne donnent pas une vue d’ensemble. En
particulier, ils ne contiennent pas d’indications sur les systèmes d’équations ni sur les travaux
directement liés à la mécanique. Sur cette base, il est donc exclu, par exemple, d’étudier des
questions de priorité entre Euler et d’Alembert. Cependant, les travaux passés en revue
contribuent à dessiner le paysage mathématique aux alentours de 1765-1766, au moment où a
lieu l’échange épistolaire entre Lagrange et d’Alembert sur les questions d’équations
linéaires. Des travaux d’Euler avant cette date, retenons quelques points essentiels.
Dès 1740, le recours à l’équation homogène puis à la variation de la constante est présenté
comme un procédé habituel dans le cas d’une équation d’ordre deux. La variation de la
constante est utilisée pour les équations homogènes à coefficients constants dans le cas où le
polynôme caractéristique a des racines multiples. Elle est présente aussi pour les équations
non homogènes à coefficients variables d’ordre un et d’ordre 2. Vraisemblablement, cette
limitation n’est pas liée à la difficulté d’adapter la méthode au cas d’une équation d’ordre plus
élevé ; par contre, les équations homogènes correspondantes ne sont pas susceptibles d’une
résolution simple, et c’est probablement dans cette direction qu’il faut voir les raisons pour
lesquelles le procédé n’est pas envisagé pour un ordre supérieur à 2 : son intérêt éventuel ne
pourrait tenir qu’à une construction théorique globale concernant les équations linéaires, et il
ne serait pas lié directement à la résolution effective des équations concernées.
Le même type de remarque vaut, si l’on s’intéresse aux prémices de la théorie de
l’ « adjointe ». Euler fait un usage assez fréquent de la méthode du facteur intégrant. Ses
calculs le conduisent de fait à l’utilisation de l’adjointe. Mais, là encore, apparaissent des
limitations. Dans les Institutiones calculi integralis, les équations d’ordre un et deux sont
30
Quibus valoribus substitutis emerget ista æquatio …. , in qua hoc commodè accendit, ut ipsa variabilis u
non insit, sed tantum ejus differentielia [p. 302]
traitées dans le cas de coefficients variables, et les équations d’ordre quelconque ne sont
concernées que pour des coefficients constants. Les limitations semblent bien liées à la
problématique d’un traité de calcul intégral, destiné à fournir des méthodes effectives
d’intégration.
Enfin, dans le cas des coefficients constants, l’analogie entre la composition des opérateurs
différentiels linéaires et le produit des polynômes, est exploitée minutieusement, elle permet
d’obtenir les solutions dans le cas des racines multiples et des racines imaginaires. Mais elle
est aussi exprimée avec beaucoup de généralité pour un polynôme factorisé en P = QR. Si
l’on note l’équation
P( d ).y = X,
dx
le calcul d’Euler revient à la remplacer par le système
R( d ).v = X,
dx
Q( d ).y = v.
dx
Ce système peut lui- même se traduire à l’aide de la composition des opérateurs
[Q( d ).R( d )].y = X.
dx dx
Mais, si cette interprétation donne, en termes actuels, une idée assez nette des calculs d’Euler,
elle reste… une interprétation. De telles écritures supposent le franchissement d’un seuil, elles
interviendront, nous le verrons, chez des auteurs postérieurs Euler.
chapitre 3
La résolution approchée de ce type d’équation recèle une difficulté, qui retentit sur toute la
Mécanique Céleste de l’époque et que nous allons découvrir à travers le calcul de Lagrange.
l’ordinaire des méthodes connues pour la solution des problèmes où l’on néglige de
petites quantités, c’est-à-dire en employant dans chaque correction une valeur de plus
en plus exacte du rayon vecteur ; mais dès la seconde correction cette méthode
introduirait dans la valeur du rayon vecteur des arcs de cercle qui rendraient cette
valeur très fautive. Il faut convenir pourtant que, comme l’orbite de la Lune n’est pas
fort excentrique, et que les forces qui l’altèrent ne sont pas très considérables, on
pourrait se servir de telle méthode qu’on voudrait pour déterminer cette orbite durant
un petit nombre de révolutions ; et qu’en ce cas on parviendrait à déterminer pendant ce
même petit nombre de révolutions la mouvement de l’apogée, tel que la théorie doit le
donner. Mais en suivant cette route, on ne trouverait pas le mouvement de la Lune pour
un nombre de révolutions quelconque, et il serait impossible de s’assurer si le
mouvement de cette planète pendant plusieurs années est tel que l’observent les
astronomes. Il est donc nécessaire d’avoir une méthode qui donne le mouvement de
l’apogée de la Lune pour tant de temps qu’on voudra, et c’est en cela que consiste une
des principales difficultés qu’on rencontre pour intégrer l’équation de l’orbite [1754, p.
XXXV-XXXVI).
D’Alembert met alors en œuvre une parade. À la même époque, d’autres solutions sont
tentées par Clairaut et Euler.
Dans l’équation (A), le coefficient constant L introduisait le terme 2i MLF cosKt dans
K
l’écriture de l’équation (A’) et ce dernier terme était responsable de l’apparition des
puissances de l’arc dans les étapes suivantes.. Cette fois-ci, c’est (L + K2 λ) qui joue le rôle
du coefficient L. Il suffit donc de choisir λ de façon que
L + K2 λ = 0,
et le phénomène ne se renouvellera pas.
quelque avantage sur les méthodes déjà connues, qui mènent à des calculs
impraticables, lorsque le nombre des variables est indéfini ; elle consiste à faire varier
Les constantes arbitraires dans les intégrales approchées, et à faire disparaître par ce
moyen les arcs de cercle lorsque cela est possible. Cette manière de faire ainsi varier
les constantes arbitraires est, si je ne me trompe, absolument nouvelle et d’une grande
fécondité dans l’Analyse ; je vais en donner ici une idée très succincte, me réservant de
la développer avec plus d’étendue dans le Volume suivant [1775, Œuvres, VIII, p. 361]
31
Ici le signe qui suit le t ne doit pas être pris pour un signe de ponctuation : la notation de la nouvelle variable
fait intervenir un accent en position inférieure : t, .
h2 − f 2 αfg
+α cos(2T + α lT) + sin(2T + α lT)
6 3
Laplace reviendra de nombreuses fois sur cette méthode, qu’il applique aussi à des systèmes
d’équations différentielles. On la retrouve notamment dans les Recherches sur le calcul
intégral et sur le système du monde [1776a]. Le Mémoire sur l’intégration des équations
différentielles par approximation, [1780a], en donnera un exposé plus général. Enfin, elle sera
décrite et utilisée dans le traité de Mécanique Céleste [Œuvres tome I, pp. 257-276]. Andoyer
en donne un résumé très accessible dans sa biographie de Laplace. Il prend l’exemple d’une
équation du second ordre
d 2x = P
dt 2
où P est une fonction entière de x et de dx , périodique par rapport à certains arguments
dt
linéaires en t [p. 54]. Il suppose l’intégrale générale obtenue sous la forme d’une série entière
x = X + t Y + t 2Z + …
Les fonctions X, Y, Z… dépendent notamment de deux constantes arbitraires C1 et C2. On
admet qu’un tel développement est unique. Mais, un changement de l’origine des temps
amène, tout en conservant une solution de l’équation, à transformer l’écriture précédente
x’ = X ’ + (t - θ ) Y ’ + (t - θ ) 2Z’ + …
Les fonctions X, Y, Z .. ont été transformées en X ’ , Y ’ , Z’ … en changeant les constantes,
lesquelles deviennent désormais C’1 et C’2. Andoyer souligne que c’est là le point
fondamental, et il poursuit
En déterminant convenablement C’1 , C’2 , θ , on peut rendre identiques les expressions
de x et de x’ ; mais alors x’ sera indépendant de θ et on pourra donner à θ une valeur
absolument quelconque : si l’on fait θ = t, il restera
x = X’
en mettant pour C’1 , C’2 les valeurs correspondantes : si celles si sont périodiques, on
aura réussi de la façon la plus simple à faire disparaître les termes séculaires de
l’expression primitive de x. [p. 55]
La détermination de C’1 , C’2 peut être obtenue en écrivant que l’expression de x’ est
indépendante de θ.
Andoyer note que la mise au point du procédé a été progressive
[Laplace] est revenu bien des fois ensuite sur cette méthode extrêmement remarquable,
pour en mieux dégager les principes, qu’il avait d’abord sentis plutôt que démontrés ; il
semble que Lagrange, à qui il l’avait communiquée, n’en ait pas compris la haute
portée. [p. 54]
Il termine ce passage en commentant le sens que doit revêtir dans ce cas l’expression
variation de la constante
On voit que la méthode revient à faire varier les constantes d’intégration, mais qu’elle
s’appuie sur des principes bien différents que le procédé généralement connu sous le
nom de méthode de variation de la constante [p. 55].
Il reste maintenant à voir comment, dans son acception la plus courante, cette expression
s’applique à des procédés de Mécanique Céleste. Avec le mémoire Solution de différents
problèmes de calcul intégral, Lagrange en fait certainement la première utilisation qui soit
perceptible avec autant de netteté.
(Saturne)
M’
u’ v
(Soleil) S M
u (Jupiter)
Si dans cette dernière équation on annule J’, on obtient évidemment l’équation du mouvement
d’une planète de même masse J que Jupiter et qui serait soumise à la seule action du Soleil. Le
terme complémentaire qui contient J’ en facteur permet de prendre en compte l’action de
Saturne, on obtient ainsi ce que Lagrange appelle le mouvement de Jupiter dérangé par
Saturne.
Lagrange traite le problème dans un système de coordonnées cylindriques (ϕ, r, p) dont le
Soleil est l’origine et dont le plan de l’écliptique est le plan méridien.
M (Jupiter)
(Soleil) r
plan de S
l’écliptique ϕ
x
Dans ces conditions. (ϕ, r, p) représentent les coordonnées de Jupiter. Lagrange écrit les 3
équations :
d 2 r rdϕ 2 r
2
− 2
+ (I + J) 3 + R = 0
dt dt u
d r dϕ
2
( )
+Q= 0
dt 2
d2p p
2
+ (I + J) 3 + P = 0 [Œuvres I, p. 611]
dt u
P, Q, R, sont les trois composantes de la perturbation causée par Saturne, elles dépendent à la
fois des coordonnées (ϕ, r, p) de Jupiter et des coordonnées (ϕ’, r’, p’) de Saturne.
Q R
plan de
S
l’écliptique
p 1
L’introduction des fonctions q = et s= et l’intervention d’une constante
r r
2
r 2 dϕ
C= + 2 ∫ Qr dϕ permettent finalement de ramener le problème de la trajectoire de
2
dt
Jupiter à la résolution du système d’équations :
( )
3
2 −2
2
d s (I + J) 1 + q + U
(1) + s+ =0
dϕ 2
C − 2 ∫ Qr 2 dϕ
dq 2 V
(2) +q+ =0
dϕ 2
C − 2 ∫ Qr 2 dϕ
dans lesquelles les quantités U et V sont exprimées en fonction de P, Q et R, de telle sorte
qu’elles s’annulent si l’on remplace P, Q et R par 0. Lagrange résout d’abord le système
obtenu en faisant ces hypothèses :
( )
3
−
d 2s (I + J ) 1 + q2 2
(1’) +s+ =0
dϕ 2 C
dq 2
(2’) +q = 0
dϕ 2
L’équation (2’) a une solution générale de la forme :
q = ε sin(ϕ-α)
où ε et α sont des constantes arbitraires. Avec cette expression de la fonction q, on constate
I+J
que 1 + q 2 constitue une solution particulière de l’équation (1’), la solution générale de
D
(1’) peut donc s’exprimer avec des constantes arbitraires η et ω, sous la forme :
I+J
s= 1 + q 2 + η cos(ϕ-ω)
D
Lagrange interprète les résultats
La première de ces deux formules nous montre que l’orbite est toute dans un plan fixe
passant par le centre des rayons r, et coupant le plan de manière que ε soit la tangente
de l’inclinaison, et α le lieu du noeud ascendant. 32
32
En complétant l’axe Sx par un axe Sy qui lui soit orthogonal et qui soit situé aussi dans le plan de
l’écliptique, on peut en effet repérer la position de M par les coordonnées cartésiennes : x = rcosϕ , y = rsinϕ ,
p.
l’équation q = ε sin(ϕ-α) se met alors sous la forme de l’équation cartésienne d’un plan p = ycosα- xsinα
plan de l’orbite
M
p
i
r
ligne des doeuds
S α
plan de l’écliptique x
La seconde fait voir que l’orbite est une ellipse dont le foyer est dans le centre des
rayons r....[p. 613] L’équation polaire de la trajectoire de M dans son plan va être obtenue.
Φ
S A x
Lagrange nommeΦ et A les angles dont les projections respectives sont ϕ et α, u désignant le
rayon vecteur SM, et il obtient l’équation :
1
u=
I+J
D
+ ηε cos ϕ − β ( )
I+J
Il souligne que est le paramètre et que l’excentricité est ηε , celle-ci est déterminée en
D
fonction des constantes d’intégration d’abord apparues :
1 + ε 2 cos2 (α − ω )
ηε =η
1+ ε 2
De même l’angle β, angle polaire du périhélie, est déterminé en fonction de ces constantes.
p
L’inclinaison i a pour tangente la pente = q lorsque cette pente est maximale, c’est-à-dire lorsqu’elle est égale
r
à ε . L’interprétation de la seconde équation est moins immédiate.
L’ellipse dont les éléments sont ainsi calculés serait la trajectoire suivie par la planète Jupiter
si, à partir de sa position et de sa vitesse à l’instant initial, elle poursuivait sa course sous
l’action des seules forces dues au Soleil. 33
Le calcul complet peut maintenant intervenir avec la réintroduction des expressions P, Q et R
qui avaient été provisoirement assimilées à 0 . Lagrange annonce ce calcul par ces mots :
Imaginons maintenant que l’effet des forces perturbatrices consiste à faire varier les
quantités ε, α, η et ω en sorte que l’orbite soit représentée par une ellipse qui change
continuellement d’espace et de position [p. 615].
Ce calcul doit aboutir à la détermination des quantités ε, α, η et ω en fonction de ϕ. L’écriture
de q sous la forme q = ε sin(ϕ-α), implique dorénavant
dq dε dα
= ε cos(ϕ − α ) + sin(ϕ − α ) − cos(ϕ − α )
dϕ dϕ dϕ
Avant d’utiliser ce résultat pour modifier en conséquence l’équation (1), Lagrange se sert de la
marge de manœuvre que lui laisse la recherche de deux fonctions ε et α, alors qu’il s’agit de
résoudre une seule équation
or, puisqu’on a deux indéterminées ε et α, dont l’une peut être tout ce que l’on voudra,
nous supposerons
sin(ϕ-α) dε=ε cos(ϕ-α) dα
ce qui donnera
dq
= ε cos(ϕ − α ) . [p. 615]
dϕ
On notera les termes très voisins de ceux que l’on a trouvés sous la plume de d’Alembert dans
des phases de calcul semblables34. Mais la méthode possède ici une spécificité, les constantes
que l’on fait varier ont une signification dans le système mécanique étudié. D’ailleurs,
Lagrange rappelle cette signification pour souligner un avantage immédiat des choix qu’il a
réalisés : la variation instantanée de la latitude35 sera la même que si le plan de l’orbite ne
changeait point de position. [p. 615]
Finalement l’équation (1) se trouve résolue sous la forme q = ε sin(ϕ - α), pourvu que ε et α
soient eux-mêmes liés par deux équations différentielles
ε dα V
+ =0
sin(ϕ − α ) D
− 2 ∫ Qr dϕ
2
1+ ε 2
dε dα
− =0 [p. 615]
ε tan(ϕ − α )
Lagrange souligne que ces équations permettent de connaître le mouvement de la ligne des
nœuds et la variation de l’inclinaison de l’orbite [p. 615]. Intersection du plan de l’écliptique
33
L’ellipse est traditionnellement dite osculatrice, mais son contact avec la trajectoire réelle est d’ordre un
seulement (voir [Pascoli, p. 99])
34 zs
d’Alembert ayant dédoublé l’inconnue en , écrit : or, à cause des deux indéterminées z et s dont l’une peut
l
être tout ce que l’on voudra ... [1743, p. 101] . Voir ci-dessus chapitre II, paragraphe 1.2.3.
35
Il s’agit de la latitude héliocentrique, mesurée ici par arctanq. Il manque le facteur complémentaire donnant la
dq
dérivée par rapport au temps de l’angle ϕ pour que le quotient différentiel = ε cos(ϕ − α ) puisse être
dϕ
interprété comme une variation instantanée.
et du plan de l’orbite, la ligne des nœuds est effectivement donnée par l’angle α. Quant à
l’inclinaison i , elle est donnée pour l’orbite elliptique considérée, par tan i = ε
L’équation (2) est résolue selon le même principe. Si η et ω sont des fonctions de ϕ, la dérivée
de s s’écrit
ds I + J qdq dη dω
= − η sin(ϕ − ω ) + cos(ϕ − α ) + sin(ϕ − ω )
dϕ D dϕ 1 + q 2 dϕ dϕ
Invoquant la manière dont il vient de traiter la latitude q, Lagrange impose alors une égalité
supplémentaire qui va neutraliser les deux derniers termes de l’expression obtenue
cos(ϕ - α) dη = -η sin(ϕ - ω)dω
1
et, il obtient cette fois que la variation instantanée du rayon r = soit la même que si
s
l’ellipse demeurait constante [p. 616].
I+J
Finalement s restera donc déterminée par la relation s = 1 + q 2 + η cos(ϕ-ω), mais les
D
lettres η et ω représenteront des fonctions de ϕ, qui seront solutions d’un système de deux
équations différentielles du premier ordre.
Des équations semblables se trouvent évidemment établies pour la trajectoire de Saturne.
Au système initial, ont été associées de fait les équations linéaires homogènes :
d 2s
+s=0
dϕ 2
dq 2
+q = 0
dϕ 2
Ce sont les quatre constantes apparues dans les solutions générales de ces deux équations qui
ont joué un rôle dans le traitement du problème par Lagrange. Elles ont fait l’objet d’un
changement de point de vue : pour la résolution des équations (1) et (2) complètes elles ont été
considérées comme des fonctions de la variable ϕ. Lagrange ne commente pas la structure
d’un calcul qui a finalement une portée générale ; ces remarques ne concernent que les
éléments spécifiques à la situation mécanique envisagée : telle équation permettra de
déterminer la ligne des nœuds ou l’inclinaison de l’orbite, telle autre permettra d’envisager la
variation de la latitude ou du rayon vecteur sur la trajectoire réelle comme si le mouvement
avait lieu sur l’ellipse osculatrice.
Le mémoire prend ensuite un tour différent, il va s’orienter vers une résolution par
approximation. S’appuyant sur un constat expérimental (les observations nous apprennent
que le mouvement de Jupiter autour du Soleil est à peu près circulaire et uniforme [p. 618]),
Lagrange introduit la distance moyenne de Jupiter au Soleil, soit a, et sa vitesse angulaire
moyenne h. Puis il exprime les coordonnées de Jupiter à l’aide à l’aide de a, de h, et d’un
coefficient très petit désigné par i . Nous avons déjà vu que ce coefficient est introduit dans
des calculs préliminaires du mémoire de 1766, c’est sur sa présence qu’est fondée la recherche
d’une solution approchée.
À la même époque, Lagrange rédige les recherches sur les inégalités des satellites de Jupiter
causées par leur attraction mutuelle. Le mémoire va obtenir le prix de l’Académie de Paris
pour l’année 1766. La même méthode est utilisée pour la mise en équation du mouvement.
satellite
rp
1+ p 2
arctanp
Jupiter ϕ
En particulier, Lagrange note p la latitude d’un satellite par rapport au plan de la trajectoire de
Jupiter et il montre que p vérifie une équation différentielle du second ordre qui dépend de
forces perturbatrices de composantes P, Q, R.
dp
r 3 P − pR + Q
2
d p dϕ
(c) + p+ =0
dϕ 2 c2 + 2 ∫ Qr 3dϕ
Cette équation est d’abord résolue sans tenir compte de ces forces
Supposons pour un moment que les forces perturbatrices P, Q, R soient nulles ; on aura
par l’équation (c )
d2p
+p=0
dϕ 2
dont l’intégrale est, comme on sait,
p = G sinϕ + Hcosϕ,
ou bien
p = λsin(ϕ - ε),
λ et ε étant deux constantes arbitraires. Cette dernière expression de p fait voir que
l’orbite est toute dans un plan fixe, dont la position dépend des quantité λ, ε, qui
expriment, la première, la tangente de l’inclinaison, et la seconde, la longitude du
noeud.
Puis la solution obtenue est utilisée quand interviennent à nouveau les forces perturbatrices
Retenons maintenant cette même expression de p, et supposons, à cause des forces
perturbatrices, λ et ε variables ; on aura
dp = dλ sin(ϕ - ε)+λcos(ϕ - ε)(dϕ - dε).
Or, afin que le corps puisse être regardé comme se mouvant réellement dans le plan
déterminé par λ et ε , il faut que la valeur de dp soit la même que si ces quantités
demeuraient constantes, c’est-à-dire, que
dp = λcos(ϕ - ε)dϕ [1777a, Oeuvres VI, p. 71]
73
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 74 chapitre III
74
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 75 chapitre III
modifiée. Mais les méthodes que Lagrange introduit en 1766 ont une spécificité : non
seulement les éléments de la trajectoire sont considérés comme variables, mais, de plus, ils
s’ajustent exactement aux constantes dont on va provoquer la variation dans les équations
différentielles.
L’appréciation émise par Arthur Berry semble être la plus proche de la réalité
Euler montra comment, lorsque la position de la planète perturbante est connue, le taux
de variation des éléments de l’ellipse variable pouvait être calculé ; quant à déduire de
ces données, les véritables éléments, il accomplit quelques progrès dans ce sens ; mais
il trouva les difficultés mathématiques trop grandes pour être surmontées sauf en
quelques cas simples, et il fut réservé à la nouvelle génération de mathématiciens,
notamment Lagrange, de montrer toute la puissance de la méthode.37
Pour fonder complètement ce jugement, il manque une étude exhaustive des mémoires de
Mécanique Céleste d’Euler.
P
i
A’
Lagrange explique ensuite que ces cinq quantités, jointes à l’époque, permettent de déterminer
à chaque instant la position d’une planète, si l’on ne tient compte que de l’attraction solaire. Si
l’on met en équation le mouvement de la planète dans cette hypothèse, on obtient trois
37
Euler shew further how, when the position of the perturbing planet was know, the corresponding rates of
change of the elements of the varying ellipse could be calculated, and made some progress towards deducing
from these data the actual elements ; but he found the mathematical difficulties too great to be overcome except
in some of the simpler cases, and it was reserved for the next generation of mathematicians, notably Lagrange,
to show the full power of the method. [Berry Arthur, 1898, p. 303-304]
75
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 76 chapitre III
équations du second ordre, lesquelles demandent par conséquent six intégrations [p. 714]. Or,
précisément
Ces intégrations introduisent chacune dans le calcul une constante arbitraire ; de sorte
que la solution du Problème renferme en dernière analyse six constantes arbitraires : ce
sont les éléments mêmes de la planète, ou des fonctions de ces éléments [Ibid.]
Mais, les autres planètes produisent aussi une action sur celle que l’on est en train d’étudier, et
il en résulte des inégalités qu’on nomme perturbations, dont le calcul est long et délicat, et
fait, depuis Newton, l’objet des travaux des Géomètres qui s’occupent de la Théorie du
Système du monde [Ibid.]. Les explications de Lagrange recoupent alors les deux aspects qui
ont été signalés ci-dessus. Il y a d’une part la nécessité de procéder à des approximations, c’est
ce que nous avons vu avec la méthode de Laplace, mais d’autre part les modifications
introduites se traduisent directement par des variations des éléments de la planète. Les termes
supplémentaires qu’il faut alors ajouter aux équations sont petits, et ils provoquent de petites
modifications des constantes arbitraires qui intervenaient dans la première phase du calcul
[ces constantes] se trouvent augmentées d’une petite partie variable due à ces mêmes
termes, dont on ne peut à la vérité trouver la valeur finie et rigoureuse, parce qu’elle
dépend d’une intégration qui est impossible, en général, mais dont on peut avoir, par
des approximations successives, la valeur approximative aussi approchée qu’on
voudra.[p. 715]
Et finalement, les modifications se traduisent sur la trajectoire
Ainsi, les éléments du mouvement elliptique, qui, par l’action du Soleil seul sont
constants, deviennent sujets à de petites variations ; et quoique, à la rigueur, le
mouvement ne soit plus elliptique, on peut néanmoins le regarder comme tel à chaque
instant ; l’ellipse variable devient alors osculatrice de la véritable orbite de la planète,
comme on peut le conclure de la Théorie générale de l’osculation que j’ai exposée
ailleurs et qui est fondée sur la variation des constantes[Ibid.]
Le terme d’osculation ne caractérise pas un contact d’ordre 2, la théorie des enveloppes à
laquelle semble renvoyer Lagrange est contenue notamment dans le mémoire sur différentes
questions d’analyse relatives aux intégrales particulières [1781].
Dans le mémoire publié en 1809, les deux étapes de calcul sont décrites en termes généraux à
l’aide de coordonnées cartésiennes. Il y a d’abord le système obtenu sans les perturbations
(S) d 2x + 1+ m x = 0 , d 2 y 1+ m
+ y = 0 , d 2z + 1+ m z = 0 ,
dt 2 r3 dt 2 r3 dt 2 r3
(la masse du Soleil est prise comme unité et m représente la masse de la planète étudiée). Les
solutions x, y, z sont des fonctions de t et de six constantes a, b, c… elles sont les expressions
elliptiques des coordonnées [p. 722].
Les perturbations se traduisent par la présence de seconds membres qui peuvent s’écrire à
l’aide d’une fonction Ω, laquelle fait intervenir les fonctions x, y, z, mais aussi les
coordonnées des autres planètes.
2
1+ m dΩ d 2 y 1+ m dΩ d 2z + 1+ m z = d Ω .
(S*) d 2x + 3 x = , + y = ,
dt r dx dt 2 r3 dy dt 2 r3 dz
Les calculs ultérieurs vont être structurés par le point de vue suivant
on conservera les expressions elliptiques des coordonnées x, y, z, ainsi que celles de
dx dy dz
leurs différentielles , , , mais en y regardant les constantes a, b, c… comme
dt dt dt
variables, et l’on vérifiera les équations par la variation de ces constantes dans les
différentielles secondes [Ibid.]
76
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 77 chapitre III
Les solutions x(t, a, b, c,..), y(t, a, b, c,..), z(t, a,b, c,..) du système (S) vont être introduites
dans les équations qui forment le système (S*). Lagrange distingue deux parties obtenues en
différentiant ces fonctions : l’une provient de la différentiation par rapport à la première
variable t, elle reste notée à l’aide de la caractéristique d, la seconde est obtenue en passant
par les dérivées partielles par rapport à a, b, c…, elle est notée à l’aide de la caractéristique δ.
Les fonctions a, b, c, … sont alors solutions d’un système formé par 3 couples d’équations tels
que
δ dx d Ω 38
δx = 0 ; = .
dt 2 dx
Dans les calculs systématiques qui suivent, Lagrange met à jour des régularités formelles, qui
se traduisent notamment à l’aide d’expressions qu’il note
(x, a, b) = dx d x - dx d x
2 2
db dt da da dt db
c’est la somme des trois termes obtenus avec les coordonnées x, y et z qui va constituer ce que
l’on nommera le « crochets de Lagrange » relatif aux « constantes » a et b .
Dans le mémoire de 1809, les calculs sont menés à l’aide de ce formalisme ; Lagrange
souligne, le cas échéant, que telle quantité y prend une forme élégante et symétrique [p. 739]
L’un des résultats acquis par ce moyen concerne la stabilité séculaire des grands axes des
orbites des planètes : l’expression de ces grands axes en fonction du temps t ne contient pas de
termes proportionnels à t.
38
La première équation indique que la vitesse est la même dans le système (S) ou dans le système perturbé (S*),
elle peut être imposée grâce à la marge de manœuvre que donne la présence de 6 fonctions a, b, c,… pour un
système (S*) de trois équations. Avec des notations de dérivées partielles que Lagrange n’emploie pas elle se
∂ x ∂a
traduit par Σ = 0 (la somme est étendue aux six éléments).
∂ a ∂t
∂a
∂
∂t ∂ x
La seconde équation est la traduction de (S*), elle peut s’écrire Σ =0.
∂ a ∂t
77
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 78 chapitre III
78
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 79 chapitre III
tableau 1-III-a
quelques méthodes d’étude et de résolution des équations différentielles
linéaires recensées aux alentours de 1770
1. équations à coefficients constants
1.1. Équations homogènes d’ordre quelconque
1.1.1. recherches des solutions sous la forme eλx, résolution de l’équation
caractéristique [Euler, 1743, p. 110]
1.1.2. méthode de variation de la constante dans le cas des racines multiples, méthode
voisine pour les racines imaginaires [Euler 1743, p. 116, 120]
1.2. Équation complète d’ordre quelconque
1.2.1. utilisation d’un facteur intégrant eλx , obtention d’une « équation adjointe »
[Euler 1753a, p. 192]
1.2.2. cas des racines multiples : solutions obtenues par passages à la limite dans le cas
de racines voisines [p. 201]
1.2.3. - l’équation est transformée en un système différentiel d’ordre 1 par
dy d 2y
l’introduction des fonctions inconnues p = ,q= ,… ;
dt dt 2
- la diagonalisation de ce système puis la résolution d’une équation d’ordre un
fournissent une intégrale première de l’équation proposée.
- si l’on utilise m valeurs propres distinctes apparues dans la diagonalisation, on
obtient m intégrales premières. La résolution peut se terminer par la résolution d’un
système algébrique de m équations [d’Alembert, 1754a p. 25-30 ; Lagrange 1759b,
Œuvres I, p. 73 ; 1762a, Œuvres I, p. 162].
1.3. Équations d’ordre 1 ou 2
méthode de variation de la constante [Euler 1740/52, p. 302], d’Alembert [1743, p. 100 ;
1754, p. 130]
1.4. Systèmes d’équations, utilisation de combinaisons linéaires équivalentes à une
diagonalisation [d’Alembert 1743, p. 99 ; Lagrange 1759b, p. 72]
79
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 80 chapitre III
arcs de cercle, Laplace utilise une méthode qu’il nomme variation de la constante [1775, p. 361]
80
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 81 chapitre III
81
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 80 chapitre IV
chapitre IV
la fonction u étant ainsi déterminée, on obtient la destruction des deux termes soulignés ci-
dessous dans l’équation initiale :
udz + zdu + uzXdx = Zdx,
La fonction z est donc déterminée par l’équation
udz = Zdx
Lagrange en donne la solution :
= ∫ e∫ Zdx
Zdx
z= ∫
Xdx
u
Et la solution de l’équation initiale est finalement obtenue sous la forme :
∫ e∫ Zdx
Xdx
y = uz = [p. 24]
e ∫ Xdx
Nous reviendrons plus loin sur ce calcul et sur l’usage que Lagrange en fera pour une étude
des équations aux différences finies. Mais constatons que Lagrange le mène dans des
conditions très semblables à celles que pratiquait d’Alembert. Les conditions spécifiques qui
permettent le succès de la méthode ne sont pas évoquées. La possibilité d’utiliser les mêmes
moyens pour une équation différentielle linéaire d’ordre quelconque n’apparaît pas
explicitement. Lagrange ne fait pas apparaître la constante multiplicative dans la résolution de
l’équation « sans second membre »
dz + zXdx = 0
Les solutions sont recherchées a priori sous la forme y = uz et ce produit uz n’est pas présenté
comme issu de la résolution de l’équation « sans second membre ».
Le rappel de ce type de calcul est ensuite clairement motivé :
en observant le procédé de cette méthode, on verra aisément qu’elle doit pouvoir
s’appliquer encore avec succès aux équations différentielles qui ont la même forme que
la précédente, quoique les différences soient supposées finies . [p. 24]
Cette volonté d’exploiter l’analogie entre les deux types d’équations se manifeste de plusieurs
façons. D’abord les notations retenues pour les différences finies sont presque identiques aux
notations différentielles ; ainsi dy représente désormais la différence finie de la fonction y et
l’équation du premier ordre s’écrit :
(1) dy + M y = N
où M et N sont des fonctions d’une variable quelconque x. Ensuite la marche du calcul va être
fidèlement calquée sur ce que nous avons appelé la méthode de « dédoublement ». En posant
y = uz, Lagrange développe la différence dy en une somme où s’introduit un terme dudz qui
était absent du calcul sur les différentielles
dy = udz + zdu + dudz
L’équation initiale devient donc
(2) udz + zdu + dudz + M uz = N
Lagrange impose à u d’être solution de l’équation sans second membre
Qu’on pose comme ci-dessus les deux termes
du + Mu = 0
savoir
du = − M ;
u
pour résoudre cette équation dans notre cas où la différentielle du n’est pas infiniment
petite, qu’on suppose
u + du = e t + dt et du = e t (edt - 1)
d’où
du = et −1= − M et e t= 1 – M,
dt
et prenant les logarithmes,
dt = l(1-M)
et ensuite intégrant
t = ∫ l(1 - M) [p. 25]
Les propriétés fondamentales du logarithme sont alors invoquées pour transformer cette
somme dans le produit continuel de toutes quantités contenues dans la formule 1 – M
t = ∫ l(1 - M),
puis
u = et = ϖ(1 - M) [Ibid.]
Si u est ainsi choisi la forme (2) de l’équation, se ramène à
udz + dudz = N
ou encore
dz = N .
u + du
et
z= ∫ N .
u + du
Mais ayant trouvé u = ϖ(1 -M ), si l’on exprime par M1 le terme consécutif à M , on
aura
u+du = ϖ(1 –M1 ),
et par conséquent
z= ∫ N
ϖ (1− M 1 )
[p. 26]
Finalement, avec l’introduction d’une constante arbitraire A, la solution y = uz s’écrit
N
(3) y =ϖ(1-M) const .+ ∫
ϖ (1 − M1 )
Les produits consécutifs ϖ(1 -M) et ϖ(1 -M1) s’interprètent à l’aide d’un calcul que l’on
n −1 n
conduirait aujourd’hui avec des notations telles ques u0 ∏ (1 − M k ) et u0 ∏ (1 − M k ) (voir la
k =0 k =0
troisième colonne du tableau 1-IV-a, page suivante)
Les résultats obtenus sont utilisés pour traiter un problème posé initialement en termes de
suite. L’équation est écrite
y1 = Ry + T
où y1 est le terme qui suit y dans la suite y [p. 26].
L’équation est alors ramenée à la forme (1) d’une équation aux différences
dy + (1 – R)y = T
En particulier, si R et T sont constants, la formule (3) conduit à l’expression du « terme
général »
R m −1
ym = ARm + T [p. 27].
R −1
∫ e∫
Zdx
z= ∫
Xdx
N
= Zdx z= ∫
u ϖ (1 − M 1 ) yn = un zn =
∫ Xdx Zdx
∫e y =uz =ϖ(1-M) const .+ ∫
N
n −1
n −1 Np
ϖ (1 − M 1 ) ∏ (1 − M k ) const .+ ∑ p
y = uz =
e∫
(1 − M k )
Xdx
k =0
p=0
∏
k =0
1ère partie 84 chapitre IV
Tirons les conclusions de cette première étape. Guidé par le souci de suivre la marche
observée pour les équations aux différences infiniment petites, Lagrange procède à des détours
que l’on peut juger inutiles ; si l’objectif était seulement d’obtenir l’expression de la solution,
le recours à la fonction exponentielle et à la fonction logarithme ne présenterait guère
d’avantage. Mais il y a clairement le choix de maintenir la meilleure proximité possible entre
le cas des différences finies et celui des différences infiniment petites. Et, passée cette
première étape, l’analogie entre les deux cas sera beaucoup plus facile à manier.
Les résultats sont résumés, et particularisés dans le cas où X est une constante. Si X est nulle,
la relation (5) définit une suite récurrente, dont l’échelle de relation est
-A -B -C -D -E.[p. 35]. L’auteur constate qu’il retrouve une formule connue
ym = Fa1m + Ga2m+ Ha3m + Ia4m + Ka5m,
laquelle se trouve par exemple dans l’Introductio d’Euler.
En terminant, Lagrange insiste sur l’importance qu’il accorde à une méthode qui élargit le
champ du calcul différentiel :
Voilà donc la théorie des suites récurrentes réduite au calcul différentiel, et établie de
cette façon sur des principes directs et naturels, au lieu que jusqu’ici elle n’a été traitée
que par des voies tout à fait indirectes [p. 36]
Il souligne la nouveauté des résultats : les recherches qu’on a faites sur cette matière ont
toujours été bornées au cas de X = 0 [Ibid.].
Et il évoque les applications que peuvent avoir les suites récurrentes : elles sont de la dernière
importance pour la résolution de plusieurs problèmes [qui] conduisent à de telles équations
dont la doctrine des hasards est principalement remplie [p. 36] ; enfin, il annonce qu’il
produira ultérieurement des travaux sur ce thème.
C’est seulement en 1777 que nous verrons réapparaître cette préoccupation dans les écrits de
Lagrange. Entre-temps, Laplace aura poursuivi l’exploration de la voie ainsi ouverte.
d 2T d n −1T
(a) X = T + ω’ dT + ω’’ 2 +……+ ω n - 1
dx dx dx n −1
dy
(B) T=ω +y
dx
Laplace va chercher à se ramener à cette situation même dans le cas où l’équation (A) a des
coefficients variables. Il faudra alors chercher un système de fonctions ω, ω’ ω’’,… ω n – 1 tel
que, en reportant dans (a), l’expression de T donnée par (B), on obtienne une équation d’ordre
n identique à l’équation initiale (A).
Il sera nécessaire de tenir compte des dérivées successives de T
ω 2 + dω
d2y dy dy
+ = dT
dx dx dx dx dx
d3y
dx
( dx
)
ω 3 + 2dω +1 2 + d ω2
d2y
dx
2 dy d 2T
dx dx
=
dx 2
………………………………………………………….
dx dx
Les n – 1 premières équations de ce système permettent de calculer les fonctions ω’ ω’’,…
ωn – 1 en fonction de ω, de ses dérivées jusqu’à l’ordre n –1, et des fonctions H n - 1, H n - 2,
…H’. Le report de ses valeurs dans la dernière équation conduit à une équation différentielle
d’ordre n – 1, dont la fonction inconnue est ω, et que Laplace écrit
(
dx ω
) ( dx ωω
)[ ]( )
0 = ω - H + 1+ dω H' − 1+ 2dω . H'' −... + 1+ 3dω . H'3'' −... − 3d ω
dx ω
2
H''' −...
dx 2 ω 3
(D)
2
dx ω
( dx ω
)
+ d ω2 H'' − 1+ 3dω H'3'' −...
(
+ d ω3 H''' − ....
3
dx ω
)
Cette équation n’est pas linéaire. En théorie, elle peut servir à déterminer la fonction ω. Les
fonctions ω’, ω’’,… ω n – 1 s’en déduiront puisqu’elles ont été exprimées en fonction de ω.
Laplace réécrit d’ailleurs l’équation que nous avons notée (a) et il met en évidence que les
coefficients dépendent en dernier ressort de ω
(E)
dx ω
( dx ω
) ( dx
)
X = T + dT H' − 1+ 2dω H2'' − 1 + 3dω [H'' − ...]−3 d ω2 H'2'' − ...
2
dx ω
d 2T
+ (…)
dx 2
+………….
La propriété visée par Laplace va concerner l’équation (A) d’ordre n : il s’agit de démontrer
que (A) est intégrable pourvu que (A*) le soit. Il va montrer que cette propriété est acquise
dès que la propriété semblable est acquise pour l’équation (E). Or, (E) est d’ordre n-1, il
suffira donc finalement de savoir que la propriété est vraie pour une équation linéaire d’ordre
un.
Soit ω = β une solution particulière de (D). Reportons cette valeur de ω dans l’équation (E),
Convenons de noter (Eβ) l’équation ainsi écrite t soit T une solution de l’équation (Eβ) ainsi
obtenue. Pour les valeurs β et T ainsi choisies, on sait résoudre l’équation linéaire du premier
ordre
dy
(Lβ) β + y = T.
dx
Toute solution y de cette équation sera aussi une solution de (A). En particulier si l’on désigne
par Z la solution complète de (Eβ) , on obtiendra la solution complète de (A) par la formule
∫β
− dx Z dx ∫ dxβ
(G) y= e (C + ∫ e )β
De plus, si Z désigne la solution complète de l’équation homogène (Eβ*) la formule (G)
fournit la solution complète de (A*). Mais la solution complète de l’équation homogène est
une combinaison linéaire de n-1 solutions particulières R, R’,… R n – 2, soit en utilisant des
constantes arbitraires A, A’,… A n – 2
T = AR + A’R’ + A’’R’’ + ..... A n - 2 R n - 2
La formule (G) donne alors
− ∫ dx − ∫ dx − ∫ dx A 'R'dx ∫ dx A n −1 R n −1dx ∫ β
∫β − ∫ dx
dx dx
∫ β e + e ∫ β e + …+ e ∫ β
ARdx
β β β' β' β
(H) y=C e +e e
β β' β
[p. 279]
Il semble bien y avoir ici une confusion. En reportant cette expression de y dans
dy d2y dny
y+H + H’ 2 +……+ H n - 1 ,
dx dx dx n
chacun des termes étant déjà solution de (E), on obtiendra en réalité
dy d2y dny
y+H + H’ 2 +……+ H n - 1 = nX
dx dx dx n
En réalité on peut se passer de cette solution de l’équation. Laplace se sert seulement de
l’expression de la solution de (A*) ; dans l’expression (S), on peut en effet supposer que l’on
a choisi T = T’ = T’’ = T n – 1 =…= 0. On obtient alors la solution de (A*) qui s’écrit
−∫ dx
− ∫ dx − ∫ dx
y = C e β + C’ e β ' + …… C n- 1 e β
n −1
(I)
Aucune question n’est soulevée à propos de l’indépendance des fonctions β, β’, β n – 1 et des
conditions qui pourraient être requises pour que la formule (I) fournisse effectivement la
solution complète de (A*). En comparant les formules (H) et (I), Laplace identifie les termes
de même rang et obtient
β ' − β − ∫ dxβ ' β ' ' − β − ∫ βdx'' β n −1 − β − ∫ βdxn −1
(J) AR = C’ e , A’R’ = C’’ e , ….A n - 2 R n - 2 = C n- 1 e
β' β '' β n −1
Finalement, les solutions particulières R, R’,… R n – 2 de l’équation (Eβ*) s’expriment donc à
l’aide des solutions particulières β, β’, β n - 1 de l’équation (D). Il fait s’intéresser de plus près
à ces dernières solutions.
Supposons que l’équation homogène (A*) soit intégrable. Elle admet donc une solution
complète formée à l’aide de n solutions particulières u, u’, u’’, ….. u n – 1
y = Cu + C’u’ + C’’u ’’+ ….. + C n- 1 u n – 1
Laplace compare cette expression à l’expression (I) de la solution générale, il en déduit que
les fonctions β, β’, β n - 1 sont liées aux fonctions u, u’, ’u ’’ u n – 1par les relations
− ∫ dx − ∫ dx − ∫ dx
u = e β , u’ = e β ' , ….. u n – 1 = e β .
n −1
(K)
Le raisonnement peut alors commencer. Supposons que l’équation homogène (A*) soit
intégrable. On connaît donc les solutions u, u’, u ’’ u n – 1. Les relations (K) permettent d’en
déduire les fonctions β, β’, β n - 1 ; lesquelles sont solutions de l’équation (D). Et surtout, ces
fonctions β, β’, β n - 1, utilisées dans les formules (J), donnent les solutions R, R’,… R n – 2 de
l’équation (Eβ*). Mais cette dernière équation est linéaire et d’ordre n – 1 ; supposons que, de
son intégrale complète, on sache déduire la solution Z de l’équation complète (Eβ). Alors la
formule (G) permet d’exprimer la solution de l’équation complète (A)
donc la difficulté d’intégrer
dy d2y dny
X=y+H + H’ 2 +……+ H n - 1
dx dx dx n
lorsque l’on sait intégrer
dy d2y dny
0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
se réduit à intégrer
H ' 2dβ H' d 2T H ''
X = T + dT −1+ −... + d n −1T H n −1
−.... +……+ (∆)
dx β dx β dx 2 β dx n −1 β
du degré n – 1, et que l’on sait intégrer lorsqu’on suppose X = 0 on fera pareillement ,
et par la même méthode, dépendre la résolution de celle-ci d’une autre de degré n – 2,
et… jusqu’à ce qu’on parvienne à une équation de degré n – n ou purement
algébrique ; d’où il résulte que l’équation
dy d2y dny
X=y+H + H’ 2 +……+ H n - 1
dx dx dx n
est intégrable dans les mêmes cas que celle-ci
dy d2y dny
0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
ce qui est le beau théorème de M. de la Grange. [p. 284]
Démonstration de l’assertion
si l’équation homogène d’ordre n
dy d2y dny
(A*) 0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
est intégrable, alors il en est de même pour l’équation complète
dy d2y dny
(A) X=y+H + H’ 2 +……+ H n - 1
dx dx dx n
Principe général
l’intégration de (A) peut être ramenée à l’intégration successive d’une équation d’ordre n – 1
et d’une équation d’ordre un
d 2T d n −1T
(a) X = T + ω’ dT + ω’’ 2 +……+ ω n - 1
dx dx dx n −1
dy
(B) T=ω +y
dx
Conditions préliminaires résultant du principe général
La fonction ω doit alors vérifier l’équation différentielle non linéaire d’ordre n – 1
( ) ( )[ ] ( )
(D) 0 = ω - H + 1+ dω H' − 1+ 2dω . H'' −... + 1 + 3dω . H'3'' −... −
dx ω dx ωω dx ω
3d 2ω H''' −...
dx2 ω 3
dx 3
3
Les fonctions ω, ω’, ….ω n – 1 s’expriment à l’aide de ω , si bien que les coefficients de (a)
dépendent de ω, l’équation (a) s’écrit
(E)
dx ω dx ω
( ) dx
( ) dx ω
d 2T
X = T + dT H' − 1 + 2dω H2'' − 1 + 3dω [ H'' − ...] − 3 d ω2 H'2'' − ... +
2
dx 2
(…) +...
Démonstration de l’assertion
si l’équation homogène d’ordre n
(B*) 0 = y x + H xy x + 1 + ’H x y x + II + ’’H x y x + III + … + n-1
Hx yx+n
est intégrable, alors il en est de même pour l’équation complète
(B) X x = y x + H xy x + 1 + ’H x y x + II + ’’H x y x + III + … + n-1
Hx yx+n
Principe général
l’intégration de (B) peut être ramenée à l’intégration successive de deux équations d’ordre n –
1
(b) X x = T x + ’β T x + I + ’’β T x + II + …. + n – 1β T x + n – 1
(C ) Tx = ωx yx+1 + yx
Conditions préliminaires résultant du principe général
La fonction ω doit alors vérifier l’équation non linéaire d’ordre n – 1
n −1 x
x 'H x
(E) 0 = 1 - H x + x x + 1 +….± H
ω ωω ω ω ...ω x + n −1
x x +1
Soit (DV) : l’équation (D) dans laquelle on a remplacé la suite ω x par la solution V x
(DV*) l’équation (DV) dans laquelle on a, de plus, remplacé X x par 0.
Les suites ’V, ’’V, …n – 1V permettent d’exprimer n – 1 solutions de (DV*)
∇(−V x −1 ) ∇(−V x −1 ) ∇(−V x −1 )
∇(− x −1
)
∇(− x −1
) ∇(− n −1V x −1 )
R x = , ∇ ’R x = ∇ , ………… n – 1R x. = ∇
'V ''V
∇(−V x −1 ) ∇(−V x −1 ) ∇(−V x −1 )
)[
A−∑ Z x∇ −V x −1 ( )]
1
yx =
∇ −V x −1
(
tableau 1-IV-c
Mais avant cette intervention de Lagrange, Laplace reprendra une partie du mémoire de 1771
dans Les recherches sur l’intégration des équations différentielles aux différences finies et sur
leur usage dans la théorie du hasard, publiées en 1776 par l’Académie des Sciences. Cette
fois, c’est seulement la démonstration relative aux différences finies qui est présente. À
quelques nuances près elle est semblable à celle qui a été publiée en 1771, les notations ont un
caractère plus systématique, (voir le tableau de comparaison 1-IV-d). Mais ce mémoire peut
retenir notre attention pour l’état d’esprit qu’il révèle.
39
Voir à ce sujet Ch. C. Gillispie [1997, p. 7-12 et notes (1) et (2) p. 286 et 287.
La suite va consister à utiliser les solutions de cette équation (C), pour déterminer les
solutions d’une équation analogue mais dans laquelle intervient un second membre Xx
(fonction quelconque de x) :
(D) Ax yx + yx - 1 + Cx yx - 2 + ...+ Nx yx - n =Xx ,
40
Sur les suites récurrentes appliquées à la théorie des hasards[1774a], sur l’intégration des équations
différentiellesaux différences finies et sur leur usage dans la théorie des hasards [1776b].
L’intégrale complète de cette équation va alors être déterminée selon une méthode dont le
principe est immédiatement exprimé
puisque , dans le cas de Xx = 0 , on a
yx = a αx + b βx + c γx +...
pour l’intégrale complète , a, b, c, ... étant des constantes, supposons maintenant que les
quantités a,b,c,.. soient, en général des fonctions de x que nous désignerons par ax , bx ,
cx ,... en sorte que l’intégrale (D) soit
(E) yx = ax αx + bx βx + cx γx +... [p. 156]
Le terme de rang x + 1 doit alors s’écrire
yx + 1 = ax + 1 αx + 1 + bx + 1 βx + 1 + cx + 1 γx + 1 +...
Lagrange le réécrit en désignant par la caractéristique ∆ les différences
finies » (∆ax = ax + 1 - ax )
yx + 1 = ax αx + 1 + bx βx + 1 + cx γx + 1 +...
+ αx + 1 ∆ax +βx + 1 ∆bx + γx + 1 ∆cx +...
Et il impose une condition supplémentaire :
Donc, si je fais
(1) αx + 1 ∆ax +βx + 1 ∆bx + γx + 1 ∆cx +...= 0
j’aurai
yx + 1 = ax αx + 1 + bx βx + 1 + cx γx + 1 +...
comme si les quantités ax , bx , cx n’avaient point varié. [Ibid.]
Dans cette relation, Lagrange fait varier x, en lui substituant x + 1
yx + 2 = ax + 1 αx + 2 + bx + 1 βx + 2 + cx = 1 γx + 2 +...
L’intervention des différences finies permet aussi d’écrire
yx + 2 = ax αx + 2 + bx βx + 2 + cx γx + 2 +...
+ αx + 2 ∆ax + βx + 2 ∆bx + γx + 2 ∆cx +...
Mais en imposant la condition
(2) αx + 2 ∆ax + βx + 2 ∆bx + γx + 2 ∆cx +...= 0
on peut conserver à yx + 2 la forme :
yx + 2 = ax αx + 2 + bx βx + 2 + cx γx + 2 +...
..................................................
De proche en proche, on atteint le terme de rang x + n - 1 , pour lequel la condition
(n-1) α x +n - 1 ∆ax + β x +n - 1 ∆bx + γx +n - 1 ∆cx +...= 0
permet encore d’obtenir
yx + n - 1 = ax αx + n - 1 + bx βx + n - 1 + cx γx + n - 1 +...
Faisant varier x dans cette équation, Lagrange obtient
yx + n = ax + 1 αx + n + bx + 1 βx + n + cx + 1 γx + n +...
soit
yx + n = ax αx + n + b x βx + n + cx γx + n +...
+ α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...
Pour le moment aucune condition n’est imposée aux termes qui viennent d’apparaître et qui
contiennent les différences finies. Mais les expressions obtenues pour yx , yx + 1 ,....yx + n sont
reportées dans l’équation (D) ; et Lagrange pourra disposer d’une dernière relation pour
imposer que cette équation (D) soit vérifiée
comme toutes ces valeurs excepté la dernière, sont les mêmes que si ax , bx , cx
..n’avaient pas varié, et que la dernière ne diffère de ce qu’elle serait dans cette
hypothèse que par les termes
α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...
qui y sont ajoutés ; que d’ailleurs les valeurs de yx , yx + 1 ,.... dans le cas de αx , βx ,
γx ,...constantes , satisfont par l’hypothèse à l’équation (C), quelles que soient les
valeurs de ces constantes ; il s’ensuit que le premier membre de l’équation (D) se
réduira à
Nx ( α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...)
en sorte que l’on aura l’équation
X
(n) α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...= x .
Nx
Les différences finies ∆ax , ∆bx , .....doivent vérifier un système de n équations :
(1) αx + 1 ∆ax + βx + 1 ∆bx + γx + 1 ∆cx +...= 0
(2) αx + 2 ∆ax + βx + 2 ∆bx + γx + 2 ∆cx +...= 0
...........................................................................................
(n-1) α x +n - 1 ∆ax + β x +n - 1 ∆bx + γx +n - 1 ∆cx +...= 0
X
(n) α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...= x .
Nx
Lagrange peut conclure
On a donc ainsi n équations linéaires (1), (2), (3)....(n-1), (n) entre les n quantités
∆ax , ∆bx , ∆cx ..., d’où l’on tirera les valeurs de ces quantités en fonctions de x, que je
désignerai par Px , Qx , Rx .... Donc, passant des différences aux sommes et
désignant celles-ci par la caractéristique Σ, on aura
ax = ΣPx , bx = ΣQx ,cx = Σ Rx ,....,
ce qui, étant substitué dans la formule (E), il viendra
yx = αx ΣPx + βx ΣQx + γx Σ Rx +....,
pour l’intégrale complète de l’équation (D).
Il s’ensuit de là que l’équation
Ax yx + Bx yx + 1 + Cx yx + 2 + ...+ Nx yx + n =Xx ,
est généralement intégrable toutes les fois que l’on connaît n valeurs particulières de yx,
dans le cas Xx = 0. [p. 158].
La résolution de cette équation est donc finalement reliée à la résolution de l’équation « sans
second membre » qui avait d’abord été considérée :
(C ) Ax yx + Bx yx + 1 + Cx yx + 2 + ...+ Nx yx + n = 0
Lagrange retrouve la situation qu’il a explorée, au moyen de l’adjointe, pour le cas des
équations différentielles dans le mémoire Sur la résolution de différents problèmes de calcul
intégral [1766]. Il souligne qu’il s’agit bien d’un Théorème analogue à celui [qu’il a] donné
pour les équations différentielles linéaires dans le tome III des mémoires de Turin. [p. 159 ].
,
y = Ny + P ,
le cas où les coefficients N et P sont constants est traité en détail, il fait l’objet d’une
application au calcul des rentes viagères ;
2. la résolution de l’équation homogène à coefficients constants
, ,, n
Ay + B y + C y + …+ N y = 0 ,
dans le cas où l’« équation caractéristique » a des racines multiples ;
3. la résolution de l’équation complète
, ,, n
Ay + B y + C y + …+ N y = P ,
à partir des solutions de l’équation homogène correspondante (coefficients variables) ;
4. une procédure d’interpolation pour prolonger les solutions yx lorsque x ne prend pas des
valeurs entières.
Le point 3 est certainement le plus fondamental : il présente la méthode de variation des
constantes, comme elle est décrite dans le mémoire de 1777. Mais le manuscrit et le mémoire
restent différents. Les notations adoptées sont très nettement distinctes, et pour des calculs
équivalents, les explications ne sont pas littéralement identiques, même si elles doivent
prendre la même signification. Le point 4 n’est pas du tout représenté dans le mémoire de
1777. Sur le point 2, les méthodes utilisées sont différentes : dans le mémoire, Lagrange traite
le cas des racines doubles par un passage à la limite à partir de deux racines voisines, comme
Euler le pratique dans les Institutiones (voir ci-dessus ch. II, § 2) ; au contraire, dans le
manuscrit, il souhaite éviter un artifice de calcul qu’il juge ingénieux mais insuffisamment
rigoureux [p. 173], et il obtient le résultat par un recours direct à des fonctions dérivées. Enfin,
l’équation d’ordre un ne fait l’objet d’aucune mention particulière dans le mémoire. Dans le
manuscrit, elle est traitée de façon très détaillée. Dans la forme et dans l’esprit, ce passage se
trouve à égale distance des deux mémoires que Laplace a publiés en 1771 et 1776 et qui
traitent la même équation (voir ci-dessus le tableau du § 2.2). Quelle est la situation
chronologique de ce manuscrit par rapport aux mémoires de Laplace ? par rapport au
mémoire que Lagrange a lui-même présenté en 1775 et publié en 1777 ?
Le point 1 a un aspect heuristique : on peut l’imaginer écrit au moment où la lecture du
premier mémoire de Laplace a réveillé des réflexions amorcées dès 1759. Mais d’autre part, le
point 2 semble un perfectionnement qui vient répondre à une exigence que le mémoire de
1777 ne formulait pas. Il est donc difficile de trancher, et on ne peut pas écarter non plus
l’idée que les différents points aient été rédigés à des époques différentes.
En tout état de cause, ce manuscrit, joint aux mémoires publiés en 1759 et 1777, montre que
des calculs équivalents ont été examinés successivement avec des points de vue différents.
et les expressions de yx + j (pour j = 1, 2,...n-1) ont la même forme que et les expressions de d jy (pour j = 0,1,..n-2) ont la même forme que si
si les suites a, b, c...étaient des constantes : les fonctions a, b, c,... étaient des constantes :
yx + j = αx + j ax + βx + j bx + γx + j cx.... d jy = a d jp + b d jq +c d j r +...
1ère partie 100 chapitre IV
dy = a dp + b dq +c dr +....., 0 = p da + q db + r dc +.....,
2 2 2 2
d y = a d p + b d q + c d r +....., 0 = dp da + dq db + dr dc +.....,
d3y = a d 3p + b d 3q + c d 3r +....., 0 = d 2p da+ d 2q db+ d 2r dc +.....,
................................................... ...............................................................
d n - 1y = a d n - 1p + b d n-1 q + c d n - 1 r +..., 0 = d n- 2p da + d n - 2 q db + d n - 2 r dc +...,
d ny
(1) +P=0
dx n
dy d n −1 y
P étant une fonction de x, y, ,..., n −1 [p. 161].
dx dx
Et il va montrer comment tirer parti de la solution générale de cette équation pour en déduire
la solution générale d’équations de la forme
d ny
(2) +P=Π
dx n
dy d n −1 y
où Π est aussi une fonction de x, y, ,..., n −1 .
dx dx
Dans ce but, il considère l’ intégrale complète M = 0 de l’équation (1). M est alors une
fonction de x, y et de n constantes arbitraires a, b, c....De l’équation M = 0, on peut tirer
l’expression de y qui vérifie l’équation (1). Supposons que a, b, c, ... désignent maintenant
des fonctions de x et que M = 0 représente ainsi une intégrale de l’équation (2)
dans cette hypothèse, l’expression de y en x, a, b, c, ... sera la même que dans le cas de
a, b, c.. constantes, mais celles de dy, d 2y, ..., seront différentes [Ibid.]
Lagrange impose alors d’annuler les parties des différentielles dy, d 2y, ..., d n - 1 y, qui
résultent de la variabilité des quantités a,b, c, ..., [p. 162]. Et il pose les n-1 équations de
condition
dy dy dy
da + db + dc+.... = 0
da db dc
d2y d2y d2y
da + db + dc+.... = 0
dxda dxdb dxdc
..................................................................
n −1
d y d n −1y d n −1y
da + db + dc+.... = 0
dx n − 2 da dx n − 2 db dx n − 2 dc
au moyen desquelles les valeurs de ces différentielles seront encore les mêmes que si a, b, c,...
étaient constantes, de sorte qu’en substituant ces valeurs ainsi que celles de y dans la quantité
P, on aura encore la même fonction de a, b, c,… que dans le cas où les quantités, a, b, c, …
seraient constantes [p. 162].
d n −1 y
En particulier, et grâce à ces conditions, la valeur de est la même que dans le cas où a,
dx n −1
d n −1 y
b, c,.. sont constantes. La valeur de d n −1 sera alors composée de deux parties
dx
d n −1 y
1/ une partie Ydx qui est identique à ce que serait d n −1 dans la cas où a, b, c, seraient
dx
constantes, et la quantité Y vérifie l’équation (1)
Y+ P = 0
d n −1 y
2/ une seconde partie qui est égale à la variation de due aux quantités a, b, c;.. »
dx n −1
[p.. 162].
Cette quantité complémentaire est
dx da dx db dx dc
Pour que l’équation (2) soit vérifiée il faudra donc
d ny dny dny
da + db + dc+.... = Πdx
dx n −1da dx n −1db dx n −1dc
Lagrange peut alors conclure
Cette équation étant combinée avec les n - 1 équations de condition trouvées ci-dessus,
on aura, après avoir substitué partout les valeurs de y et de ses différentielles en x, a, b,
c,.. tirées de l’équation finie M = 0, valeurs qui sont les mêmes que dans le cas de a, b,
c, ... constantes, on aura, dis-je, n équations différentielles du premier ordre entre les n
variables a, b, c, ... et la variable x ; si donc on intègre ces équations, on aura les
valeurs de a, b, c, .. e, x, qui étant substituées dans l’équation M = 0 donneront
l’équation proposée [p. 163].
Lagrange reconnaît ensuite que l’intégration des équations en a, b, c,... sera le plus souvent
très difficile, du moins aussi difficile que l’équation proposée
d ny
+ P = Π.
dx n
Le cas d’une équation initiale linéaire fait exception à cette difficulté parce que les équations
différentielles en a, b, c,.. sont alors elles-mêmes linéaires. Et pour finir Lagrange signale un
type d’application de cette méthode qui revêt une grande importance
le grand usage de la méthode précédente est pour intégrer par approximation les
équations dont on connaît déjà l’intégrale complète à peu près, c’est -à-dire en
négligeant des quantités qu’on regarde comme très petites [p. 163].
Les explications qui suivent concernent le passage des solutions de l’équation :
d ny
+P=0
dx n
à celles de :
d ny
+P=Π
dx n
la fonction Π étant supposée très petite vis-à-vis de P [p. 163]. La méthode conduit alors à
des valeurs des différentielles de a, b, c, qui peuvent s’écrire sous la forme
da = AΠdx, db = BΠdx dc = CΠdx,...
où A,B, C... sont des fonctions finies de x, a, b, c... et Π étant une fonction de ces mêmes
quantités, mais très petite par l’hypothèse [p. 164].
da db dc
Et Lagrange en déduit que les dérivées , , ... seront aussi très petites du même
dx dx dx
ordre [p. 163], si bien que la méthode permettra d’approcher de plus en plus des vraies
valeurs de ces quantités [p. 164].
Il est visible au reste que cette méthode, que je ne fais qu’exposer ici en passant, peut
s’appliquer également au cas où l’on aurait plusieurs équations différentielles entre
plusieurs variables dont on connaîtrait les intégrales complètes approchées, c’est-à-
dire en y négligeant des quantités supposées très petites. Elle sera par conséquent fort
utile pour calculer les mouvements des planètes en tant qu’ils sont altérés par leur
action mutuelle, puisqu’en faisant abstraction de cette action la solution complète du
Problème est connue ; il est bon de remarquer que, comme dans ce cas les constantes
a,b, c... représentent les éléments des planètes, notre méthode donnera immédiatement
les variations de ces éléments provenantes de l’action que les planètes exercent les une
sur les autres. J’avais donné un essai de cette méthode dans mes Recherches sur la
théorie de Jupiter et de Saturne [mémoires de Turin, tome III]. Elle est présentée ici
d’une manière plus directe et plus générale ; mais je me propose de la développer
ailleurs avec plus d’étendue, et de l’appliquer à la solution de quelques Problèmes
importants sur le Système du monde [p. 165].
La méthode sera effectivement souvent présente dans ses travaux de Mécanique Céleste. Nous
savons qu’il lui donnera, en 1808, un prolongement où il introduira notamment l’usage des
« crochets de Lagrange ». Il évoquera alors la méthode de variations des constantes arbitraires,
que j’ai employée depuis longtemps [1809a, p. 722]. Et il fera référence au mémoire publié en
1777, dans lequel il l’a exposée de manière générale [Ibid.]
Lagrange n’est pas le premier à se servir de la méthode. Lorsque Euler rédige le mémoire sur
le flux et le reflux de la mer, Lagrange est âgé de 4 ans. Et Euler présente comme une
méthode familière le recours à l’équation homogène associée, puis la variation de la constante
qui apparaît dans la solution obtenue par ce moyen. Dans les mémoires publiés en 1759, 1762
et 1766, Lagrange étudie les équations linéaires par plusieurs autres procédés, pour lesquels il
cite souvent d’Alembert. Lorsque, pour la première fois, il utilise la variation des constantes
en Mécanique Céleste, il introduit le calcul par une locution souvent rencontrée dans les écrits
de d’Alembert. L’utilisation d’une trajectoire elliptique qui subit des déformations n’est pas
non plus une spécificité de Lagrange. Mais il réalise une adéquation complète entre les
éléments de cette trajectoire et les constantes que l’on va faire varier dans les intégrales. Et les
prolongements qu’il donne en 1809 constituent de remarquables progrès théoriques.
Par plusieurs de leurs aspects, les travaux de Lagrange sont étroitement imbriqués dans ceux
de ses contemporains et de ses prédécesseurs immédiats. L’apport propre de Lagrange est de
réinterpréter selon un même modèle des pratiques de calcul éparses. Cet apport se réalise dans
un effort pour s’élever à un niveau de connaissance théorique général.
En 1766, le théorème fondamental est obtenu par l’utilisation de l’équation adjointe. À travers
des calculs assez laborieux, la question de la réciprocité du passage à l’adjointe reste mal
éclaircie. Mais la découverte de propriétés communes aux équations linéaires est une
nouveauté, elle concerne des équations d’ordre quelconque, et elle n’englobe pas seulement le
cas où les coefficients sont constants. Une problématique se trouve posée. D’Alembert peut
intervenir en donnant une portée plus générale à des calculs qu’il pratiquait lui-même depuis
longtemps.