Vous êtes sur la page 1sur 109

N° d’ordre : 3075

UNIVERSITE DES SCIENCES ET TECHNOLOGIES DE LILLE

Thèse
en vue d’obtenir le grade de
DOCTEUR DE L’UNIVERSITE DE LILLE

Spécialité : Histoire des Sciences et des Techniques

présentée et soutenue publiquement

par

Jean-Pierre LUBET

le 18 décembre 2001

Titre :

Quelques aspects de l’analyse à l’époque de Lagrange


- le rôle des analogies -

Directeur de thèse :

Rudolf BKOUCHE
Professeur émérite à l’Université de Lille I
___________________

Jury

Président : Bernard MAITTE, Professeur à l’Université de Lille I


Rapporteurs : Christian GILAIN, Professeur à l’Université Paris VI
Christian HOUZEL, Directeur de recherche au CNRS
Examinateurs : Rudolf BKOUCHE, Professeur émérite à l’Université
de Lille I
Anne DUVAL, Professeur à l’Université de Lille I
Edmond MAZET, Professeur à l’Université de Lille III

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1

SOMMAIRE

Page

INTRODUCTION GENERALE ...........................................3

Première partie
la méthode de variation de la constante

Introduction : le contexte et les modalités d’une découverte ..................................5

Chapitre I : les équations linéaires dans le mémoire Solution de


différents problèmes de calcul intégral [Lagrange, 1766] et dans la
correspondance entre Lagrange et d’Alembert........................................ ..................7
Chapitre II : les équations différentielles linéaires avant 1766 ............ ...............34
Chapitre III : la Mécanique Céleste et le mémoire Solution de
différents problèmes de calcul intégral .................................................. ...............61
Chapitre IV : les équations aux différences finies................................. ................80

Conclusion : un modèle unique pour des pratiques éparses.................................105

Deuxième partie
les solutions singulières des équations aux différences finies

Introduction : un phénomène paradoxal observé dans le passage du


fini à l’infiniment petit..........................................................................................107

Chapitre I : les solutions singulières des équations différentielles à


l’époque de Lagrange ............................................................................. .............110
Chapitre II : les équations aux différences finies et la méthode de
variation de la constante ......................................................................... .............133
Chapitre III : équations différentielles et équations aux différences
finies : la thèse de l’analogie réfutée ................................................... ............

Conclusion : une analogie confrontée aux faits analytiques ..............................

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


2

Troisième partie
les équations aux dérivées partielles :
des séries entières aux « opérateurs »

Introduction : le rôle initial d’Euler et de Lagrange..............................................193

Chapitre I : l’expression des solutions à l’aide des séries .................. ............195


Chapitre II : Brisson et les expressions différentielles........................... ...........236
Chapitre III : la résolution au moyen des intégrales définies ............... ............274

Conclusion : les méthodes symboliques avant l’Analyse de Fourier et


la rigueur de Cauchy ............................................................................................311

Quatrième partie
l’analogie des puissances et des différences :
vers une élucidation

Chapitre I : Prélude ....................................................................... .............315


Chapitre II : le mémoire sur une nouvelle espèce de calcul relatif
à la différentiation et à l’intégration des quantités variables [1774] et
sa place dans l’oeuvre de Lagrange ..................................................... .............326
Chapitre III : Laplace et les analogies : leur mise en oeuvre au
moyen des fonctions génératrices et des intégrales définies ................. .............346
Chapitre IV : le mémoire de Lorgna : une tentative pour justifier un
calcul symbolique .................................................................................. .............370
Chapitre V : Arbogast et la séparation des échelles : la mise en
oeuvre d’un calcul symbolique .............................................................. .............382
Chapitre VI : Français et la séparation des échelles : sa légitimité,
son efficacité ......................................................................................... .............402
Chapitre VII : Servois et les effets d’une sévère abstraction .............. .............413

Conclusion : de l’induction au calcul ...................................................................451

CONCLUSION GENERALE ................................453

Annexes ...........................................................................................459

Bibliographie ..................................................................................505

Table des matières ..........................................................................527

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


introduction générale 3

introduction
Rien n’est plus fécond, tous les mathématiciens le savent, que ces obscures
analogies, ces troubles reflets d’une théorie à une autre, ces furtives caresses,
ces brouilleries inexplicables ; rien aussi ne donne plus de plaisir au
chercheur. Un jour vient où l’illusion se dissipe ; le pressentiment se change
en certitude ; les théories jumelles trouvent leur source commune avant de
disparaître. [André Weil, 1960, p. 408]

La formule de Leibniz pour le développement de la différentielle d’ordre m d’un produit fait


apparaître les mêmes coefficients que la formule du binôme de Newton
m (m −1) m-2 2 m ( m−1)(m − 2 ) m-3 3
(a + b )m = amb0+ mam–1 b1 + a b + a b +…..
2 2.3
m (m −1) m-2 m ( m−1)(m − 2 ) m-3 3
d m(xy) = d m x d 0y+ mx d m–1 x dy + d x d 2y + d d y +….
2 2.3
En 1695, dans une lettre à Jean Bernoulli, Leibniz évoque cet accord entre les coefficients des
deux formules, et il ajoute : je pense qu’il renferme je ne sais quoi de secret. Ailleurs, il
projettera de tirer les conséquences de ce type de propriété, en écrivant qu’il y a en effet bien
des mystères cachés là-dessus.
Cependant, l’exploitation de cette analogie, et sa compréhension profonde, ne vont pas
intervenir rapidement.
Il faudra attendre 1772 pour que Lagrange en fasse le thème principal d’un mémoire sur une
nouvelle espèce de calcul relatif à la différentiation et à l’intégration des quantités variables.
Lagrange l’utilise pour éclairer des résultats anciens, mais il en tire aussi de nouveaux
théorèmes ; dans ce but il met en place des mécanismes qui dérogent aux règles de calcul
habituelles, mais dont il ne fournira jamais une justification complète.

Le calcul différentiel de Leibniz mise parfois sur une autre analogie : celle qui relie les
différentielles et les différences finies. Elle se manifeste notamment par une notation
identique ; suivant le contexte, l’écriture dx, d 2x, d 3x… pourra désigner tantôt les
différentielles tantôt les différences finies d’ordres successifs. Dans un premier temps,
Lagrange n’est pas insensible à cette analogie. En interprétant les relations de récurrence
comme des équations aux différences finies, il applique les méthodes du calcul différentiel à
l’étude des suites récurrentes. Il ouvre ainsi la voie à des conceptions qu’il devra, plus tard,
dénoncer.

Il sera question ici de ces deux analogies, dans des limites chronologiques qui correspondent
approximativement à la période où a été produite l’œuvre de Lagrange. Elles interviendront à
travers quatre récits distincts, qui développeront chacun leur propre logique. Mais il sera
loisible d’en constater les entrelacs.

Les deux premières parties concernent les équations différentielles ordinaires. Nous verrons
d’abord la résolution par « variation de la constante » passer d’un procédé isolé à une
méthode générale appliquée à des situations diverses. Cette méthode va permettre d’envisager
les solutions singulières sous un point de vue nouveau. Elle fournira une explication aux
paradoxes relevés par Euler dans ce domaine. Puis le transfert de ces résultats vers les
équations aux différences finies sera la source de nouvelles interrogations.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


introduction générale 4

En élaborant une théorie de la propagation du son, Lagrange et Euler font apparaître le


recours aux séries comme un moyen de résoudre les équations aux dérivées partielles. Les
travaux qui vont se poursuivre dans cette direction vont conduire aux méthodes symboliques,
l’analogie des puissances et des différentielles va s’avérer une voie féconde vers la résolution
de ces équations. Ce sera l’objet de la troisième partie.

Cette fécondité ne livre pas le principe secret qui est à l’origine de l’analogie. Elle fait au
contraire rebondir les questions. Quelle est la légitimité des pratiques développées en 1772
par Lagrange ? Dans quel système global trouvent-elles leur justification ? Quelles sont les
limites à l’intérieur desquelles peuvent s’instaurer de nouvelles règles ? Quelle est alors la
nature des objets sur lesquels porte le calcul ? Les émules de Lagrange tenteront d’élaborer
des réponses. Nous en rendrons compte principalement dans la quatrième partie.

Lagrange sera présent au début de chacun des quatre récits. Mais il ne sera pas le seul
personnage. Ses idées ont souvent leur source dans des œuvres de Leibniz, Euler ou
d’Alembert. D’autre part, il influence des mathématiciens plus jeunes que lui, comme
Laplace, Poisson, Charles, Biot, Brisson, Arbogast … En retour, ses propres travaux portent la
trace des réflexions de ses cadets. On essaiera de saisir la spécificité de chacun de ces acteurs,
et les actions réciproques qui s’établissent entre leurs travaux. Chemin faisant, on peut espérer
voir se préciser, dans le domaine de l’Analyse, ce que nous appelons l’époque de Lagrange.

La période et les thèmes retenus ont déjà fait l’objet de nombreux travaux historiques. Ceux-ci
ont souvent constitué un guide précieux.

L’article de S. S. Demidov [1983] montre que la méthode de variation de la constante peut


être considérée comme le point de départ de découvertes successives qui établissent une
analogie entre les équations différentielles linéaires et les équations algébriques. Ces
découvertes interviennent à des dates qui débordent la période que nous nous sommes fixée.
Mais elles permettent une mise en perspective, elles constituent une incitation à faire le point
des connaissances acquises au XVIIIème siècle sur les équations différentielles linéaires, elles
conduisent à préciser le contexte dans lequel est apparue la méthode de variation de la
constante.
Une formule analogue à la formule de Taylor donne de cette méthode une interprétation très
algébrique. Elle apparaît pour la première fois en 1804, dans un mémoire de Brisson. L’étude
de Svetlana Petrova [1985] a été une précieuse introduction à la lecture de ce mémoire ;
prolongée par un examen attentif du texte lui-même, elle nous permet de discerner, dans la
pensée de cet auteur, la prégnance de la Théorie des fonctions analytiques.
Jean-Pierre Friedelmeyer [1990] a décrit les multiples facettes de l’œuvre d’Arbogast, son
étude conduit à désigner la séparation des échelles comme un moment essentiel dans
l’histoire du calcul symbolique ; nous avons suivi de près les démonstrations détaillées,
parfois redondantes, qui, dans le Traité des dérivations, précèdent cette pratique. Elles
justifient certaines formules données par Lagrange en 1772 et elles sont une étape dans la
compréhension globale de l’analogie mise à jour par Leibniz.

Nous nous sommes attachés à examiner attentivement des écrits qui, dans la bibliographie
existante, n’ont pas été étudiés en détail. Certains sont annonciateurs de développements plus
féconds, c’est le cas pour des travaux de J.-F. Français, de Servois, ou de Poisson. Mais,
l’analogie n’est pas seulement affaire de fulgurances, elle donne lieu à un laborieux
cheminement dont le point d’arrivée n’est pas joué d’avance. À ce titre, l’ « erreur de
Charles » sur les solutions singulières, ou les obscurités d’un mémoire publié par Lorgna en
1788, ont aussi retenu notre attention.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 5 introduction

première partie

la méthode de variation de la constante

introduction : le contexte et les modalités d’une découverte

Le nom de Lagrange est souvent associé à la méthode de variation des constantes. Le contexte
dans lequel on trouve cette association est parfois la théorie générale des équations
différentielles linéaires. Dans d’autres cas, il s’agit plus particulièrement de problèmes de
Mécanique Céleste.
Dans l’Encyclopédie des Sciences Mathématiques pures et appliquées, Vessiot consacre un
chapitre aux équations différentielles linéaires. Étant donnée une équation complète
d ny d n −1 y
(1) + a +...+ an y = X ,
dx n −1
1
dx n
il considère l’équation sans second membre
dny d n −1 y
(2) + a +...+ an y = 0
dx n −1
1
dx n
et il indique que l’on peut passer de l’intégrale générale de l’équation (2) à celle de l’équation
(1) au moyen de n quadratures. Puis il commente : ce résultat a été établi par Lagrange au
moyen de la méthode de variation des constantes [Vessiot, 1910, p. 113].

Retraçant l’histoire de l’Astronomie, E. Schatzman relie l’intervention de cette méthode dans


l’œuvre de Lagrange, à l’étude des perturbations des planètes

il [Lagrange] étudie les satellites de Jupiter, les variations séculaires et périodiques du


mouvement des planètes, quand interviennent les perturbations, et, pour résoudre ces
problèmes, introduit la méthode, célèbre en mathématiques, de la variation des
constantes arbitraires [Daumas, 1957,p. 759].

Dans son Traité de Mécanique Céleste, J. Chazy présente d’abord la théorie de la variation des
constantes appliquée aux systèmes différentiels linéaires quelconques. Puis, cette étude
générale est immédiatement suivie d’un chapitre intitulé Mouvement elliptique troublé et qui
commence ainsi

appliquons maintenant la méthode de la variation des constantes, qui vient d’être


exposée dans le cas général, aux équations du mouvement elliptique troublé par une
force perturbatrice. Ce cas particulier a été pour Lagrange l’occasion historique de
créer la méthode de la variation des constantes, et conserve une importance actuelle et
fondamentale en Astronomie [1953, p. 203].

Le premier écrit de Lagrange sur ces sujets de Mécanique Céleste date de 1765 : il s’agit des
Recherches sur les inégalités des satellites de Jupiter causées par leur attraction mutuelle
[1777 a]. Adressé à l’Académie des Sciences de Paris, ce mémoire a obtenu le prix de
l’Académie pour l’année 1766. C’est dans cette même période qu’a été terminé le mémoire :
Solution de différents problèmes de calcul intégral qui est intégré dans le tome 3 des

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 6 introduction

Mélanges de Turin. Ce mémoire contient une étude des perturbations de Saturne et de Jupiter,
et il s’ouvre sur une étude générale des équations différentielles linéaires où Lagrange
introduit la notion d’équation adjointe.

Dans l’étude de Vessiot déjà citée, une note d’Eneström mentionne l’usage de la méthode de
variation de la constante avant ces dates et chez d’autres auteurs. En particulier Euler y est cité
pour des calculs inclus dans un mémoire sur le flux et le reflux de la mer [1752/1740], et qui
concernent la résolution d’une équation du type
d 2y
+ ky = f ( x)
dx 2
Eneström renvoie aussi à une lettre de Daniel Bernoulli [1751], mais un examen rapide du
texte oblige à un démenti ; dans le cas d’une équation linéaire complète, Daniel Bernoulli
utilise simplement la superposition de la solution générale de l’équation homogène à une
solution particulière de l’équation complète.

Surtout, S. Demidov a consacré un article à l’histoire des équations différentielles linéaires


jusqu’à la fin du XIXème siècle. Il a montré comment des analogies avec les équations
algébriques ont été successivement mises en évidence à partir de 1830. Cette mise en
perspective éclaire d’un jour tout particulier un échange épistolaire de 1765 entre d’Alembert
et Lagrange : les propriétés des équations adjointes s’y trouvent confrontées à des procédés
plus anciens et relevant de la variation de la constante.

L’étude qui suit a pour objet de répondre à quelques-unes des questions que peut susciter ce
rapide inventaire :

1. L’expression même de variation de la constante renvoie-t-elle toujours, quels que soient le


contexte et l’auteur, à un même procédé ?

2. Quel est l’arrière-plan des connaissances et des pratiques dans lequel elle vient s’insérer ?
En particulier, de quels procédés dispose-t-on au XVIIIème siècle pour résoudre les équations
linéaires ? Comment sont perçues les propriétés spécifiques des équations à coefficients
constants ?

3. Dans l’histoire des mathématiques, quels rapports se sont établis entre, d’une part, cette
méthode, et d’autre part, le théorème fondamental des équations linéaires qui permet de passer
des solutions de l’équation homogène à celles de l’équation complète ?

4. Quels liens la méthode entretient-elle avec la Mécanique Céleste ? Plus généralement, à


quelles problématiques vient-elle répondre ?

5. Qu’en est-il de la « découverte » de la méthode ? Et en particulier, quelle est la spécificité


de Lagrange dans ce domaine ?

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 7 chapitre I

Chapitre I
les équations linéaires dans le mémoire Solution de
différents problèmes de calcul intégral [Lagrange, 1766] et
dans la correspondance entre Lagrange et d’Alembert

En 1766, l’Académie de Turin publie le 3ème volume de ses Mélanges. On y trouve un copieux
mémoire dont l’auteur est Lagrange et qui s’intitulé Solution de différents problèmes de calcul
intégral. Au fil des chapitres, sont abordés des sujets dont les enjeux, au cours de cette
période, sont importants : les équations aux dérivées partielles obtenues dans l’étude du
mouvement d’un fluide, des systèmes d’équations différentielles qui commandent les
oscillations de corps en interaction (corde tendue chargée de masses ponctuelles, fil fixe à
l’une de ces extrémités…). Lagrange y reprend aussi le problème des cordes vibrantes sur
lequel il a déjà publié en 1759 et 1762, des travaux approfondis, et qui continue à susciter une
vive controverse. La fin du mémoire est orientée vers la Mécanique Céleste. Un chapitre est
en particulier consacré à l’étude du mouvement de Saturne et de Jupiter : si leur trajectoire
respective est d’abord considérée comme le résultat de la seule présence du Soleil, il faut
ensuite tenir compte des perturbations que crée leur attraction mutuelle.

Dans l’ensemble du mémoire, de nombreux calculs concernent des équations différentielles


linéaires et des systèmes formés par de telles équations. Le premier chapitre est relativement
bref, mais il étudie ce type d’équations sous la forme la plus générale possible, puis les
méthodes et les résultats mis en évidence dans ce chapitre, sont régulièrement utilisées dans
les chapitres plus spécialisés qui vont suivre. La nouveauté de ces résultats est liée à
l’introduction de la notion d’ « équation adjointe », et à son utilisation systématique.

Certains des résultats obtenus sont communiqués à d’Alembert dès 1765, en particulier
Lagrange indique qu’il peut trouver la solution de l’équation différentielle complète
dy d 2y d 3y
Ly + M + N 2 + P 3 +....=T
dt dt dt
à partir de la solution de l’équation sans second membre
dy d 2y d 3y
Ly + M + N 2 + P 3 +....= 0.
dt dt dt

D’Alembert répond en montrant qu’il a aussi un moyen pour obtenir ce résultat et qu’il lui
suffit, pour cela, de faire une utilisation systématique d’une méthode qu’il a pratiquée dès
1743. Dans les faits, les calculs décrits par d’Alembert correspondent à ce qu’on appelle
aujourd’hui la méthode de « variation de la constante ».

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 8 chapitre I

1. la théorie de l’ « adjointe » dans le mémoire de Lagrange [1766]

schéma de l’utilisation de l’« équation adjointe » dans le mémoire Solution de


différents problèmes de calcul intégral [1766]

1/ identité fondamentale
∫ L (y, y’,...y ) z dt = M(y, y’,...y(m-1) , z, z’,....z(m-1) ) + ∫ L* (z, z’,...z(m)) y dt
(m)

2/ abaissement de L(y, y’,...y(m)) = T


*
si l’on connaît p solutions différentes zj de l’adjointe L (z, z’,...z(m)) = 0, l’élimination des p
(m) (m-1) (m-p+1)
dérivées y , y ,... y entre les équations
M(y, y’,...y(m-1) ,zj , zj’,....zj(m-1) ) = ∫ T zj dt
ramène la résolution de L (y, y’,...y(m)) = T à la résolution d’une équation différentielle
d’ordre m-p.
cas particulier p = m
l’élimination conduit à l’intégrale générale de L (y, y’,...y(m)) = T

3/ réciprocité
L (y, y’,...y ) = 0 est l’ « adjointe » de L*(z ,z’,...z(m))=0
(m)

4/ passage des solutions de l’équation sans second membre L(y, y’,...y(m)) = 0


aux solutions de l’équation complète L(y, y’,...y(m)) = T
La connaissance de m « solutions différentes » yi de l’équation L (y, y’,...y(m)) = 0 conduit à
*
la solution générale de L (z, z’,...z(m)) = 0, laquelle est obtenue par élimination des dérivées
z(k) entre les m équations
M(yi , yi ’,...yi (m-1) , z, z’,....z(m-1) ) = Ki .
En choisissant successivement l’une des m constantes Ki non nulles et toutes les autres nulles,
*
on obtient m solutions différentes de L (z, z’ ,...z(m)) = 0, la résolution de L (y, y’ ,...y(m)) = T
s’en déduit (comme en 2/)
tableau 1-I-a

Le mémoire Solution de différents problèmes de calcul intégral s’ouvre sur un premier


chapitre intitulé
Sur l’intégration de l’équation...
dy d 2y d 3y
(A) Ly + M + N 2 + P 3 +....=T
dt dt dt
Il s’agit donc d’étudier une équation différentielle linéaire d’ordre quelconque, les coefficients
L, M, … sont des fonctions de la variable t. Un premier calcul va introduire l’équation
différentielle « adjointe » de cette équation linéaire. Ce terme sera introduit par Fuchs, en
1873 [p. 487], Lagrange n’utilise aucune terminologie spécifique à la situation étudiée.
L’équation notée (A) est remplacée par une équation obtenue en en multipliant les deux
dy d2y
membres par une fonction de z , puis les intégrales des produits ∫ M z dt , ∫ N z 2 dt ,
dt dt
etc. sont ensuite transformées par des intégrations par parties, le procédé est semblable à celui

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 9 chapitre I

que Lagrange a utilisé dans les Nouvelles recherches sur la nature et la propagation du son :
en 1762 pour étudier l’équation aux dérivées partielles 1
d 2z d 2z
= c .
dt 2 dx 2
Sa proximité avec les méthodes de résolution des équations aux dérivées partielles sera encore
soulignée en 1837, par Liouville
Ce procédé [utilisé par Lagrange en 1766], a beaucoup d’analogie avec celui dont les
géomètres se servent si souvent dans le calcul des équations différentielles partielles ,
lorsqu’ils déterminent les coefficients des divers termes des séries qui représentent, dans
les problèmes physico-mathématiques, l’état initial des températures ou des vitesses de
chaque molécule d’un système matériel donné [J de Liouville, tome II, juillet 1837, p.
245]

1.1. l’intervention de l’ « adjointe » d’une équation différentielle linéaire


Les résultats qui vont être obtenus commandent plusieurs des autres chapitres constituant le
mémoire, mais la présentation très sobre n’insiste pas sur leur importance ; Lagrange décrit
les calculs à effectuer et énonce les propriétés obtenues à mesure qu’elles se présentent
Je multiplie cette équation par z et, z étant une fonction indéterminée, j’en prends
l’intégrale, j’ai
dy d 2y d 3y
∫ L z y dt + ∫ dt ∫ dt 2 ∫ dt 3 dt..+...=∫T z dt ;
M z dt + Nz dt + Pz

je change les expressions


dy d 2y d3y
∫ L z y dt , ∫ dt
M z dt , ∫ dt 2 ∫ dt 3 ,....,
Nz . , Pz
en leurs égales
dMz
M zy − ∫ ,
dt
dy dNz d 2 Nz
Nz − +∫ ydt ,
dt dt dt 2
d 2 y dPz dy d 2 Pz d 2 Pz
dt 2 ∫ dt 2
Pz − + − dt ,
dt 2 dt dt
..................................................................;
j’ai, en ordonnant les termes par rapport à y :
 dNz d 2 Pz 
y Mz − + 
 dt dt 2 
dy  dPz  d 2 y
+  Nz − +... + 2 ( Pz −....)+.... [Œuvres I, p. 472]
dt  dt  dt
 dMz d 2 Nz d 3 Pz 
∫  Lz − dt + dt 2 − dt 3 +... ydt = ∫ Tzdt
*
Si l’on note L(y, y’,...y(m)) le premier membre de l’équation (A) et L (z, z’,...z(m)) le premier
membre de l’équation (B), la première série d’intégrations par parties a mis en évidence un
terme tout intégré M(y, y’,...y(m-1), z, z’,....z(m-1) ) qui assure l’identité :
(I) ∫L (y, y’,...y(m))zdt = M(y, y’,...y(m-1) , z, z’,....z(m-1) ) + ∫L*(z ,z’,...z(m)) y dt

1
Voir infra 3ème partie, chapitre I.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 10 chapitre I

Les équations différentielles linéaires qui interviennent dans le mémoire tableau 1-I-b

Notations de Lagrange Notations indicielles Notations condensées


d 2y m
L (y,y’,...y(m)) = T
∑ L y( ) = T
dy k (A)
(A) Ly + M + N 2 +…. = T (A) k
dt dt k=0

dMz d 2 Mz d 3 Pz m
(k) (B) L* (z,z’,...z(m)) = 0
Lz − + − ... = 0 ∑ ( −1) ( L z) =0
k
(B) (B) k
dt dt 2 dt 3 k=0

(C) M(y,y’,...y(m-1) ,z,z’,....z(m - 1))


y Mz − dNz + 2 −... +
d Pz 2 ( k − p −1)
m −1  m  ( p) = ∫T z dt
 dt dt  (C ) ∑  ∑ (−1)k − p −1
( L z )  y = ∫Tzdt
( )
(C) 
p = 0 k = p +1
k


+... + 2 (Pz −....)+....= ∫Tzdt
2
dy dPz d y
Nz −
dt dt dt

m (D) L (y,y’,...y(m)) = 0
dy d y 2
d y 3 (D) ∑L y
k =0
k
(k )
=0
(D) Ly + M + N 2 + P 3 +....= 0
dt dt dt

 d N d2P   dP dy
z M − + 2 − ...  y +  N − + ... 
 d t d t   d t  dt
d y 
+ ( P − ...) 2 +...
2
(E) M*(z, z’,..z(m-1) ,y, y’,...y(m-1) )
dt   
n −1 n − i −1 n − p − i −1
 
∑ ∑  ∑ (−1) C ji + i L(jj+) p + i +1  y ( p ) z (i )
(E) i+ j = const.
(E)
dz  dP 
 y + (P − ...) + ....
dy i =0  p = 0  j = 0  
−  N −2
d t  dt  dt  = const.
+ 2 [(P −...) y +...]− ...=const.
d z2

dt
1ère partie 11 chapitre I

1.2. l’ « abaissement » d’une équation linéaire d’ordre m au moyen de l’


« adjointe »
C’est l’exploitation de l’identité (I) puis l’utilisation systématique des conséquences qu’elle
entraîne qui vont former la matière du chapitre.
Soit maintenant
dMz d 2 Mz d 3 Pz
(B) Lz − + − ... = 0
dt dt 2 dt 3
et l’équation précédente se réduira à celle-ci
 dNz d 2 Pz  dy  dPz  d 2 y
(C ) y Mz − + −... +  Nz − +... + 2 ( Pz −....)+.... = ∫ Tzdt
 dt dt 2  dt  dt  dt

Si on peut trouver une valeur de z, laquelle satisfasse à l’équation ( B )


*
[L (z, z’,...z(m)) = 0 ], on aura tout de suite l’intégrale de l’équation proposée ( A )
[L(y, y’,...y(m)) = T ] en mettant cette valeur dans ( C ) . [p. 472]2
La signification du mot intégrale est précisée quelques lignes plus bas :
J’entends par intégrale première, ou intégrale simplement, une équation qui est d’un
ordre moins élevé d’une unité que la proposée ; par intégrale seconde, une équation qui
est d’un ordre moins élevé de deux unités, et ainsi de suite...., [p.472]
Résumons en précisant la structure logique qui prend appui sur ce calcul :
1/ Si une fonction y vérifie l’équation L(y, y’,...y(m)) = T , elle vérifie aussi, quel que soit le
choix de la fonction z, l’équation
M(y, y’,...y(m-1) ,z, z’,....z(m-1) ) + ∫L (z, z’,...z(m))y dt = ∫ T y dt ;
*

C’est là une conséquence immédiate de l’identité (I).


*
2/ Si, de plus, la fonction z vérifie l’équation L (z, z’,...z(m)) = 0, les fonctions y et z ainsi
spécifiées vérifient l’équation

2
Le calcul peut s’interpréter à l’aide de la formule d’intégration par parties répétées
n −1
∫ u v (n) dx = ∑(−1)
k =0
k
u (k) v (n – k - 1) + ( - 1 )n ∫ u (n) v dx

En traduisant le calcul de Lagrange au moyen de notations indicielles, on peut prendre pour équation initiale :
m
(A) ∑ L y( ) = T
k=0
k
k

Les intégrations par parties conduisent, après un échange de l’ordre des sommations, à :
 m ( k − p − 1) 
m−1
m (k) 
∑ 
 ∑ ( −1) k − p −1
( Lk z ) 
 y ( p)
+ ∫  ∑ ( −1) k
( Lk z ) ydt = ∫ Tzdt
p = 0  k = p +1  k = 0 
L’ « adjointe » est l’équation différentielle d’ordre m :
m
(k)
∑ ( −1) ( L z) =0
k
(B) k
k=0
L’équation (C ) est d’ordre m-1 :
m−1  m ( k − p − 1) 
(C ) ∑  ∑ ( −1)

k − p −1
( Lk z)  y ( p ) + = ∫ Tzdt .

p = 0  k = p +1 
Le détail du calcul est repris, pages suivantes dans le tableau relatif à la réciprocité de l’équation et de son
« adjointe ».

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 12 chapitre I

M(y,y’,...y(m-1), z, z’,....z(m-1) ) = ∫ T y dt .
*
3/ Toute solution z0 de l’équation L (z0 ,z0’,... , z0(m - 1)) = 0, fournit donc une équation
M(y, y’,...y(m-1) , z0 , z0’,... , z0(m - 1)) = ∫ T y dt ,
qui constitue une intégrale première de l’équation initiale L (y, y’,...y(m))= T.
Puis le processus se poursuit avec l’intervention de valeurs différentes de z
2° si l’on avait deux valeurs différentes de z, lesquelles satisfissent également à
l’équation (B), on aurait, par la substitution successive de ces valeurs dans l’équation (
C ), deux intégrales de l’équation (A), à l’aide desquelles on éliminerait la plus haute
différentielle de y, et l’équation résultante serait l’intégrale seconde de la proposée [...]
3° de même, si l’on avait trois valeurs différentes de z, on trouverait trois équations
intégrales ; d’où éliminant les deux plus hautes différentielles de y, on aurait une
équation qui serait l’intégrale troisième de la proposée, et ainsi de suite, d’où il est aisé
de conclure, qu’en connaissant un nombre de valeurs de z égal à celui de l’exposant de
l’ordre de l’équation (A), on pourra trouver l’intégrale finie et algébrique de cette
même équation [p. 473].
La signification des termes valeurs différentes n’est pas explicitée et Lagrange n’explore pas
les conditions à imposer pour réaliser les éliminations dont il s’agit. Nous verrons que
D’Alembert apportera sur ce point une précision, sans donner encore l’état définitif de la
question 3.
Dans le cas où l’on connaît m valeurs différentes de z , on peut considérer que les m équations
M(y, y’,...y(m-1) , zi , zi’,... , zi(m - 1)) = ∫T zi dt
constituent un système linéaire dont les inconnues sont y, y’,...y(m-1). Sous réserve que les
fonctions zi vérifient la condition qui convient, l’inconnue y pourra être calculée directement
à l’aide des fonctions zi et de leurs dérivées et Lagrange constate effectivement : on pourra
trouver l’intégrale finie et algébrique [de l’équation ( A )].

3
La question repose sur la possibilité de résoudre des systèmes d’équations linéaires dont les inconnues sont des
dérivées de y. Il s’agit d’abord de l’élimination de y(m-1) entre les équations
M(y, y’,...y(m-1) , z0 , z0’,... , z0(m - 1)) = ∫T z dt
0

M(y, y’,...y(m-1) , z1 , z1’,... , z1(m - 1) ) = ∫T z dt


1

Un examen attentif des calculs montre que cette élimination est possible pour
z0 z1 ≠ 0
z0' z1'

L’élimination de y(m-1)et y(m-2) mettra en jeu 3 équations


M(y,y’,...y(m-1) , z0 , z0’,... , z0(m - 1)) = ∫T z dt
0

M(y,y’,...y(m-1) , z1 , z1’,... , z1(m - 1) ) = ∫T z dt


1

M(y,y’,...y(m-1) , z2 , z2’,... , z2(m - 1) ) = ∫T z dt


2

z0 z1 z2
Elle sera possible si z0' z1' z2' ≠ 0, etc.
z0'' z0'' z0''

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 13 chapitre I

Texte de Lagrange Notations indicielles tableau 1-I-c


Détermination de l’ « adjointe » de l’équation (A)
2 m
d 3y

d y
Lk y ( k ) = T
dy
(A) Ly + M + N 2 + P 3 +....=T (A)
dt dt dt k=0
Je multiplie cette équation par z et, z étant une fonction
indéterminée, j’en prends l’intégrale, j’ai m

dy d y2
d 3y
(1) ∑ (k )
∫ Lk y zdt = ∫T zdt
∫ L z ydt + ∫ M z dt dt + ∫ Nz dt 2 dt.+∫ Pz dt 3 dt..+...=∫T z dt ; k =0

je change les expressions pour chaque terme où k > 0 : utilisation de la formule d’intégration par parties
k −1
∫ u v dt = ∑(−1) p u (p) v (k – p - 1) + (-1)k∫ u (k) v dt
2
dy d y d3y
∫ L z ydt, ∫ M z dt dt ,∫ Nz dt 2 ., ∫ Pz dt 3 ,....,
(k)
(2)
p= 0

en leurs égales avec u = Lk z, v=y


M z y − ∫ dMz y dt ,
dt k −1
Lk y z dt = ∑(−1) (Lk z ) y (k− p −1) + (-1)k ∫ L( k z ) y dt
(k ) ( p)

p k
dy dNz d 2 Nz
Nz − y + ∫ 2 ydt , p= 0
dt dt dt
d 2 y dPz dy d 2 Pz d 2 Pz dt , échange des indices p et k - p - 1 dans la sommation, de façon à obtenir une
Pz 2 − + 2 y −∫ 2
dt dt dt dt dt somme suivant les « exposants » croissants de y
..................................................................; k −1

∫ Lk y zdt = ∑(−1) (Lk z ) y + (-1) ∫(Lk z ) y dt


(k ) k − p −1 (k − p −1) ( p ) k k
j’ai, en ordonnant les termes par rapport à y : (3)
p= 0
 dN z d 2 P z 
y M z − + ..... par addition de tous les termes de cette forme et du terme obtenu pour k = 0,
 dt dt 2  transformation de l’équation (A)
dy   2
 k −1 k − p −1 
+  N z − dPz +...+ 2 (P z −...)
d y
(Lk z )(k − p −1) y( p )  + ∫∑(−1)k (Lk z )k =∫Tzdt
m m

dt 
[p. 472] (4) ∑  ∑(−1)
dt  dt k =1  p = 0  k =0
 d 2
N z d 3
Pz 
∫
 L z − dMz +
dt dt 2 −
dt 3 + ...  ydt = ∫T z d t

interversion des sommations selon p et selon k
m −1  m
( k − p − 1)  ( p ) m (k ) 
(5) ∑  ∑
 (−1)k − p −1
( Lk z ) 
 y + ∫ ∑(−1) (Lk z )  ydt = ∫Tzdt
k

p = 0  k = p +1  k =0 
à suivre
1ère partie 14 chapitre I

Détermination de l’ « adjointe » de l’équation (B) tableau 1-I-d


m
dMz d 2 Mz d 3 Pz (k)
∑ ( −1) ( L z) =0
k
16I(B) Lz − + − ... = 0 (B) k
dt dt 2 dt 3 k=0
m

∑ ∫(−1) (L z )
(k )
y dt =const .
k
Qu’on multiplie l’équation (B) par ydt, et qu’on en prenne (1*) k =0
k

pour chaque terme tel que k> 0 : utilisation de la formule d’intégration par parties
l’intégrale, en faisant disparaître de dessous le signe ∫ toutes les (réciproque de la formule (2))
k −1
(-1)(k) ∫ u (k) v dt = ∑(−1) u (k - p - 1) v (p) +∫ u v (k) dt
p+k
différences de z, par des intégrations par parties, comme nous (2*) p =0

avec u = Lk z et v = y
l’avons pratiqué sur l’équation (A), on aura, en changeant les k −1

∫(−1) (Lk z ) ydt ∑(−1) (L z )


(k ) ( k − p −1)
y ( p ) + ∫ Lk z y(k )dt
k p+k
(3*) = k
signes p =0

[La relation (3*) est la relation (3) ci-dessus, les termes sous le signe Σ ont changé

y Mz − dNz + d Pz
 dt
2

dt  dt
( dt
)
 dy Nz − dPz +... + d y (Pz −....)+....
2 −... +
dt 2
2 de signe du fait d’une permutation des deux membres : c’est le changement de
signe que Lagrange va signaler.]
Transformation de l’équation (1*) compte tenu de (3*) :

-∫ d 2y d 3y  k −1
( ) ( )(k − p −1) ( p ) 
( )
m m

∑ ∑ ∑
dy
∫ Lk y (k ) zdt = const.
p+k
(Ly + M + N 2 + P 3 +...) zdt.= const. (4*) 
 −1 Lk z y 
 +
dt dt dt k =1  p = 0  k =0
interversion de l’ordre des sommations
  ( p) m
( )
m −1

∑  ∑(−1) (L z )
m
( k − p −1)
[p. 473] p+k
k  y + ∑ ∫ Lk y (k ) zdt = const.
p =0  k = p +1  k =0

et en changeant les signes de tous les termes [(-1)p + k et (-1)k – p - 1 sont opposés],
on obtient le résultat de Lagrange analogue à l’équation (5).
 m (k − p −1)  ( p )
( )
m −1
( ) ( )
m

∑ ∑ ∑ ∫ Lk y (k ) zdt = const.
k − p −1
(5*) 
 −1 Lk z 
 y −
p = 0  k = p +1  k =0
1ère partie 15 chapitre I

1.3. le problème de la réciprocité entre l’ équation L(y, y’,...y(m)) = 0 et son


« adjointe »L*(y, y’,...y(m)) = 0
Un peu plus loin va intervenir l’équation tirée de (A) en remplaçant le second membre par 0.
Lagrange la notera (D). Lagrange va mettre en évidence la relation de réciprocité qui existe
*
entre (B) [L (z, z’,...z(m)) = 0] et (D) [L(y, y’,...y(m)) = 0]. Le procédé qui a été appliqué à
l’équation initiale (A) [L(y, y’,...y(m)) = T], va être mis en œuvre pour l’équation (B)
Qu’on multiplie l’équation (B) par ydt, et qu’on en prenne l’intégrale, en faisant
disparaître de dessous le signe ∫ toutes les différences de z, par des intégrations par
parties, comme nous l’avons pratiqué sur l’équation (A), on aura, en changeant les
signes
y Mz − dNz + d Pz
 dt
2

dt  dt
(
dt dt 2
)
 dy Nz − dPz +... + d 2 y (Pz −....)+....
2 −... +

- ∫ (Ly + M
dy d 2y d 3y
+ N 2 + P 3 +...) zdt.= const.
dt dt dt
Donc, si l’on fait
dy d 2y d 3y
(D) Ly + M + N 2 + P 3 +....= 0
dt dt dt
et qu’on ordonne l’équation restante par rapport à z, on aura

z M − −... y +  N − +...
d N z d 2 Pz dP dy
+
 d t d t   d t  dt
2

+ ( P−...) 2 +...
2
d y
(E) dt 
dz  dP 
y + (P −...)
dy
−  n−2  +....
d t  dt  dt 
+ 2 [(P−...) y +...]−...=const.
d z2

dt
La première utilisation du procédé avait conduit à l’identité
(I) ∫L(y, y’,...y(m)) zdt = M(y, y’,...y(m-1) ,z , z’,....z(m-1)) + ∫ L*(z, z’,...z(m))y dt

On pouvait prévoir a priori une identité analogue, sous la forme


(I*) ∫L* (z, z’,...z(m)) ydt = M*(z, z’,...z(m-1) ,y , y’,....y(m-1) ) + ∫ L**(y, y’,...y(m))z dt.

Mais, une fois le calcul fait, on peut comparer les résultats à ceux qui étaient obtenus dans la
transformation de l’équation initiale (A) et on constate
*
M (z, z’,...z(m-1), y , y’,....y(m-1) ) = - M(y, y’,...y(m-1), z, z’,....z(m-1) )
L**(y, y’,...y(m)) = L(y, y’,...y(m)).
La réciprocité est exprimée ici au moyen du symbolisme en *, Lagrange ne se donne pas ce
type de moyen. Il n’a pas non plus de terme équivalent à « adjointe ». Si l’on cherche dans le
texte l’expression de la réciprocité entre une équation linéaire et son « adjointe, il faut se
référer à deux constats :
*
1. les résultats du calcul effectués à partir de (B) [L (z, z’,...z(m)) = 0] s’expriment à l’aide du
premier membre de (A) [L(y, y’,...y(m)) ] et d’un terme intermédiaire identique à celui qui avait
été obtenu lors du calcul effectué à partir de (A). Mais ce constat ne fait l’objet d’aucun
commentaire explicite.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 16 chapitre I

2. le calcul relatif à (B) étant terminé, Lagrange en tire immédiatement des conséquences dans
des termes analogues à ceux qu’il avait utilisés après le calcul relatif à (A) :

§2: §4:
Conclusion tirée après le calcul relatif à (A) Conclusion tirée après le calcul relatif à (B)

2. Donc : 1° Si on peut trouver une valeur de 4. Donc, si l’on peut trouver une valeur de y,
z, laquelle satisfasse à l’équation ( B ), on qui satisfasse à l’équation (D), on aura
aura tout de suite l’intégrale de l’équation l’intégrale première de l’équation (B) ;
proposée ( A ) en mettant cette valeur dans
(C ) .
2° si l’on avait deux valeurs différentes de z, si l’on a deux valeurs différentes de y, qui
lesquelles satisfissent également l’équation à satisfassent à la même équation (D), on aura
l’équation (B), on aurait, par la substitution l’intégrale seconde de l’équation (B),
successive de ces valeurs dans l’équation
(C ), deux intégrales de l’équation (A), à
l’aide desquelles on éliminerait la plus haute
différentielle de y, et l’équation résultante
serait l’intégrale seconde de la proposée [...]
3° de même, si l’on avait trois valeurs et ainsi de suite ;
différentes de z, on trouverait trois équations
intégrales ; d’où éliminant les deux plus
hautes différentielles de y, on aurait une
équation qui serait l’intégrale troisième de la
proposée, et ainsi de suite. D’où il est aisé de de sorte que, si l’on connaissait un nombre de
conclure, qu’en connaissant un nombre de valeurs de y égal à celui de l’exposant de
valeurs de z égal à celui de l’exposant de l’équation (B), on pourrait trouver (2)4
l’ordre de l’équation (A), on pourra trouver l’intégrale finie et algébrique de cette même
l’intégrale finie et algébrique de cette même équation [p. 474]
équation [p. 472]
tableau 1-I-e
Les calculs eux-mêmes sont peu détaillés. Une interprétation est proposée dans le tableau 1-I-
d . L’identité (I) a été obtenue en appliquant à chaque terme qui compose L(y, y’,...y(m)), la
formule d’intégrations par parties
k −1
(F) ∫ u v (k) dt = ∑(−1) p u (p) v (k – p - 1) + (-1)k∫ u (k) v dt.
p= 0
*
L’identité (I*) est obtenue en appliquant à chaque terme de L (z, z’,...z(m)), la formule
k −1
(-1)(k) ∫ u (k) v dt = ∑(−1) u (k - p - 1) v (p) +∫ u v (k) dt.
p+k
(F*)
p =0

Dans les deux cas, c’est le même choix u = Lk z, v = y qui permet d’interpréter le calcul. À
ce niveau, c’est la réciprocité des deux intégrations par parties successives qui opère. Et, l’on
constate que (F*) se déduit de (F) par la simple transposition de la somme Σ d’un membre
dans l’autre. Ce mécanisme algébrique s’applique à chaque terme qui compose,
*
respectivement, l’ expression de L(y, y’,...y(m)) et celle de L (z, z’,...z(m)). Finalement, c’est
donc la même transposition, appliquée à M(y,y’,...y , z, z’,....z(m-1) ), qui permet de passer de
(m-1)

4
Ce (2) est le numéro du paragraphe cité ci-contre, il renvoie donc à l’argumentation donnée dans le cas
précédent.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 17 chapitre I

(I) à (I*), la réciprocité des intégrations par parties effectuées sur chaque terme se traduit par
une réciprocité globale, et l’on pouvait prévoir que l’identité (I*) serait simplement
(I*) ∫L* (z, z’,...z(m)) ydt = - M(y, y’,...y(m-1), z , z’,....z(m-1)) + ∫L(y ,y’,...y(m))z dt.
Mais Lagrange ne souligne pas cet aspect du problème : la priorité est de montrer que l’on
applique à l’équation (B) le procédé qui avait opéré sur (A), puis de constater l’analogie dans
le résultat de ces deux opérations.

1.4. le passage des solutions de l’équation sans second membre


[L(y, y’,...y(m)) = 0] aux solutions de l’équation complète [L(y, y’,...y(m)) = T]
Les dernières propriétés mettent en jeu la réciprocité d’une équation linéaire L(y, y’,...y(m))= 0
*
et de son adjointe L (z, z’,...z(m)) = 0, et exigent un détour par la prise en compte des
constantes arbitraires que contiennent les solutions. D’abord le processus d’abaissement décrit
*
plus haut s’applique de la même manière à l’équation adjointe L (z, z’,...z(m)) = 0 : la
connaissance de p valeurs différentes de y , solutions de L (y, y’,...y(m)) = 0, conduit à
*
remplacer L (z, z’,...z(m)) = 0 par une intégrale d’ordre m - p . En particulier, la connaissance
de m valeurs différentes yi conduit à une intégrale finie et algébrique de l’équation
L*(z, z’,...z(m)) = 0 .
Mais la détermination de cette intégrale z résulte de l’élimination de z(m-1) ....z’ entre les m
équations que Lagrange a appelées (E ) et que l’on peut écrire
(m-1)
M(yi , yi ’,...yi ,z, z’,....z(m-1) ) = Ki .

Et l’expression obtenue pour z contiendra donc les m constantes arbitraires Ki . Il y a là un


moyen d’obtenir des valeurs différentes de z
si l’on fait successivement toutes ces constantes moins une, égales à zéro, on aura
autant d’intégrales particulières, et par conséquent autant de valeurs différentes de z
qu’il y a d’unités dans l’exposant de l’ordre de l’équation (B) ; or il est facile de voir
que cette équation est du même ordre que l’équation (A) [...] ; donc on trouvera aussi
l’intégrale finie et algébrique de cette dernière équation [p. 474].
Mais comme cela a été vu plus haut, ces valeurs différentes de z conduisent à leur tour à une
intégrale finie et algébrique de l’équation avec second membre (A).
Dans un paragraphe suivant, Lagrange examine comment la situation serait modifiée par la
seule connaissance de (m - 1) valeurs différentes de y, solutions de L (y,y’,...y(m)) = 0. Le
processus d’élimination conduirait en fin de compte à une équation linéaire entre z et z’

Passage des solutions de l’équation sans second membre aux solutions de l’équation
complète : cas de l’équation linéaire du second ordre [Lagrange, 1766]
dy d2y
Ly + M + N 2 = T
dt dt
Sont supposées connues deux solutions y1 et y2 de l’équation sans second membre :
dy 1 d 2 y1 dy 2 d 2 y2
L y1 + M +N =0 Ly2 + M +N =0
dt dt 2 dt dt 2
Elimination de z’ entre les deux
*
équations
M (z, z’,y1 , y1’) = A

dt
(
z  M − dN y 1 + N )
dy 1  dz

dt  dt
N y1 = A

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 18 chapitre I

( )
*
M (z, z’,y2 , y2’) = B  dy 2  dz
z  M − dN y 2 + N − N y2 =B
Et
 dt dt  dt
Solution générale (par intégration
Ay2 − By1
algébrique) z =
* dy dy
de l’équation L (z, z’,z’’ ) = 0 N ( y2 1 − y1 2 )
dt dt
Détermination de deux solutions
différentes de l’équation
L*(z, z’,z’’ ) = 0 Ay2
B = 0 donne z1 =
dy dy
N ( y2 1 − y1 2 )
dt dt
− By1
A = 0 donne z2 =
dy dy
N ( y2 1 − y1 2 )
dt dt

( )
Élimination de y’ entre les deux  dz 1  dy
y  M − dN z 1 + N − N z 1 = ∫Tz 1 dt
dt  dt
équations
 dt
M ( y ,y’, z1 , z1’) = ∫T z 1 dt
y (M − dN ) z
 dz 2  dy
M ( y,y’, z2, z2’) = ∫T z 2 dt +N − N z 2 = ∫T z 2 dt
 dt 2
dt  dt

Solution générale de l’équation


initiale z2 ∫ T z1 dt − z1 ∫ T z2 dt
y = [p. 476]
L(y, y’,y’’ ) = T  dz1 dz2 
N  z2 − z1 
 dt dt 
Lagrange s’arrête à ce résultat.
Á cause de la réciprocité de l’équation et de son adjointe, les solutions y1 et y2 sont aussi
exprimées par
z2 − z1
,
dz dz dz dz
N (z2 1 − z1 2 ) N (z2 1 − z 1 2 )
dt dt dt dt
Finalement, la solution générale de l’équation complète peut être écrite sous la forme
y = y1 ∫T z1 dt + y2 ∫T z2 dt
Lagrange ne donne pas le résultat sous cette forme. Mais c’est cette formule, mêlant les
solutions de l’équation et celle de son adjointe, qui peut faire l’objet d’une généralisation
simple au cas d’une équation d’ordre quelconque. Jacobi étudiera ce problème [1837] (cité
par Vessiot [1910, p. 122])
tableau 1-I-f
dz
Vz + X = Y
dt
d’où l’on en pourrait tirer :
 Y 
− ∫ dt 
V Y ∫ dt 
z = e X  const .+ ∫ X dt  [p.474]
 X 
 
X, Y, V dépendent de (m - 1) constantes, l’apparition d’une constante supplémentaire dans
cette dernière intégrale permet de reprendre le raisonnement et finalement l’équation( A ) est
encore intégrable algébriquement toutes les fois qu’on aura (m-1) solutions de y dans le cas

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 19 chapitre I

où T = 0 [p. 475] ( On notera que cette intégration algébrique dépend cette fois-ci du calcul
des intégrales contenues dans l’expression de z obtenue ci-dessus).
La réduction à m-p du nombre des solutions différentes y de L (y,y’,...y(m)) = 0 ne conduirait
à une intégration algébrique que dans les cas où l’équation différentielle d’ordre p alors
apparue serait elle-même intégrable.
Les conditions sur les valeurs différentes des fonctions z et y qui interviennent dans ces
calculs ne sont toujours pas examinées. Le chapitre se termine par l’exemple d’une équation
(A ) du second ordre :
dy d2y
Ly + M + N 2 = T
dt dt
Si l’on connaît deux solutions différentes y1 et y2 de l’équation sans second membre
dy d 2y
Ly + M + N 2 = 0,
dt dt
la méthode conduit à la solution générale de l’équation complète. Les étapes du calcul sont
décrites dans le tableau 1-I-f.

1.5. équations linéaires d’ordre infini et équations fonctionnelles


Plusieurs applications vont concerner des équations fonctionnelles, elles seront traitées au
moyen de la formule de Taylor, et leur résolution repose sur l’étude préalable d’un type
d’équation différentielle que nous allons décrire maintenant.

1.5.1. la résolution de l’ équation d’ordre m


2 3
dy 2 d y 3 d y
(H) Ay + B( h + kt ) + C( h + kt ) + D( h + kt ) 3 +... = T
dt dt 2 dt

Dans cette équation les lettres A, B, C... représentent des constantes. La théorie générale
amène à former l’équation adjointe
d ( h + kt ) z d 2 ( h + kt ) 2 z d 3 ( h + kt ) 3 z
(I) Az - B +C -D +...=0 [p. 482]
dt dt 2 dt 3

Celle-ci admet des solutions de la forme z=(h+kt)r, les exposants r doivent vérifier l’équation
algébrique
(L) A-Bk(r+1)+C k2 (r+1)(r+2)-D k3 (r+1)(r+2)(r+3)+... = 0
Suivant en cela les modalités prévues dans la partie générale, Lagrange utilise ces solutions
pour résoudre l’équation initiale (H), et cela passe par la résolution minutieuse d’un système
linéaire d’équations algébriques d’ordre m. La solution générale de (H) est finalement
explicitée à l’aide d’une somme de m termes qui mettent en jeu les m solutions de (L) au sein
de fonctions écrites sous la forme
θ(r) = ( h + kt ) − r −1 ∫ ( h + kt ) r dt .

1.5.2. le cas particulier de l’équation à coefficients constants


dy d2y d 3y
Ay + B + C 2 + D 3 +... = T
dt dt dt
La simple substitution de k = 0 et h = 1 dans les calculs précédents ne permet pas de conclure,
car le premier membre de l’équation algébrique (L) devient alors identiquement égal à A. Un
calcul direct sur ce cas particulier aurait été possible. Mais Lagrange va utiliser un passage à
la limite pour exploiter les résultats antérieurs. Il suppose k infiniment petit et r infiniment

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 20 chapitre I

grand de sorte que kr soit égal à une quantité finie ρ [p. 491]. Les résultats font intervenir des
fonctions eρ t où la constante ρ prend successivement les valeurs données par la résolution
d’une équation algébrique de degré m
P = A-Bρ +Cρ 2 +... = 0.
Finalement, les solutions s’expriment à l’aide des fonctions
θ(ρ) = e − ρ t ∫ Te ρ t dt .

1.5.3. la résolution de l’équation


αϕ[t + a(h+kt)]+ βϕ[t + b(h+kt)]+ γϕ[t + c(h+kt)]+...=T
L’utilisation de la formule de Taylor permet de transformer chaque terme selon le mode
dϕ ( t ) 1 2 2 d ϕ(t)
2
1 3 3 d ϕ(t)
3
ϕ[t + a(h+kt)] = ϕ(t)+ a(h+kt) + a (h+kt) + a (h+kt) +...
dt 2 dt 2 2.3 dt 3
L’équation fonctionnelle se transforme alors en une équation différentielle d’ordre infini
dϕ ( t ) 1 2 2 d ϕ(t)
2
1 3 3 d ϕ(t)
3
ϕ(t)+ a(h+kt) + a (h+kt) + a (h+kt) +... = 0.
dt 2 dt 2 2.3 dt 3
Et, en posant y=ϕ(t), on obtient l ’équation :
(S) (α + β + γ +...)y
dy
+(aα + bβ + cγ +...)(h+kt)
dt
1 d 2y
+ (a2α + b2β + c2γ +...)(h+kt)2
2 dt 2
1 3 d 3y
+ (a α + b3β + c3γ +...)(h+kt)3 3
2.3 dt
+...................................................................= T. [p. 493]
Les résultats obtenus dans les chapitres précédents vont trouver sans difficultés formelles une
adaptation à ce nouveau problème. Les solutions étaient auparavant calculées et exprimées par
des sommes de m termes. Elles sont maintenant données par des sommes de séries. Les
notations utilisées, avec des ordres de dérivation croissants et des points de suspension,
préservaient cette possibilité.
Les résultats sont d’abord appliqués à un problème de mouvement de fluide dans un vase, qui
s’exprime par une équation aux dérivées partielles, les « conditions aux limites » conduisant à
une équation fonctionnelle
Φ(t-x −1 ) ±Φ(t+x −1 ) =H.
Puis Lagrange revient sur le problème des cordes vibrantes, qu’il a déjà étudié dans ses
mémoires de 1759 et 1762.

1.5.4. le problème des cordes vibrantes


La controverse n’est pas close, et l’une des interrogations porte sur la forme des fonctions qui
donnent les solutions de l’équation des cordes vibrantes. Pour certaines conditions initiales,
on est amené à rechercher les fonctions impaires périodiques. D’Alembert conteste que le
problème puisse toujours être traité analytiquement. Lagrange considère l’équation
fonctionnelle
ϕ(t+a) - ϕ(t-a) = 0
où la fonction ϕ est de plus supposée impaire. Les calculs précédents lui permettent d’écrire
la solution générale sous la forme d’une série de fonctions exponentielles, puis, compte tenu
des conditions imposées, de la transformer en une série trigonométrique ne faisant intervenir

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 21 chapitre I

que des sinus, l’équation de la figure initiale de la corde, lorsqu’elle en a une, ne peut être
que de la forme :
πx 2πx 3πx
ϕ(t) = α sin +β sin + γ sin .... [p. 516]
a a a
La restriction apportée par la locution lorsqu’elle en a une, produit un énoncé compatible avec
le point de vue de d’Alembert. Par les moyens propres au mémoire de 1766, Lagrange
retrouve ainsi un résultat établi par Euler en 1753, dans un autre contexte ; il s’agissait alors
de déterminer toutes les fonctions de différences finies nulles, la différence finie de la variable
étant une constante.5

1.6. bilan
Dans l’histoire des mathématiques éditée par Moritz Cantor, G. Wallner termine sa recension
du mémoire de 1766 en énumérant les principaux résultats qui, à ses yeux doivent être portés
au crédit de Lagrange. Il souligne d’abord que des théorèmes généraux obtenus viennent
constituer une véritable théorie des équations différentielles linéaires. Celles-ci sont en effet
considérées indépendamment de leur ordre, et leurs coefficients sont des fonctions
quelconques. Le mémoire fournit un moyen systématique pour passer des solutions de
l’équation sans second membre L(y, y’,...y(m)) = 0 aux solutions de l’équation complète
L(y, y’,...y(m)) = T. La propriété a un intérêt théorique. Ce mémoire marque, de fait,
l’introduction de la notion d’« équation adjointe » dans l’étude des équations différentielles
linéaires. On retiendra que Lagrange ne donne pas de vocabulaire spécifique à cette occasion.
De même la réciprocité entre l’équation et son « adjointe » se trouve dégagée à la faveur d’un
constat réalisé sur un calcul, alors que le mécanisme et les enjeux ne sont pas complètement
explicités. Les très brefs commentaires laissent en particulier de côté, la problématique du
*
facteur intégrant : les fonctions z solutions de l’équation L (z, z’,...z(m)) = 0 sont, de fait, les
fonctions qui font du produit zL(y, y’,...y(m)) une dérivée exacte. Cette problématique sera
développée dans les Leçons sur le calcul des fonctions dont la première édition date de 1806 :
Toute fonction d’une seule variable peut toujours être regardée comme une dérivée
exacte ; car si elle n’a pas naturellement une fonction primitive, on peut toujours en
trouver une par les séries […]
Il n’en est pas de même pour les fonctions de plus d’une variable ; et quoiqu’on puisse
toujours s’assurer, par les règles de la dérivation, si une fonction composée de
différentes fonctions dérivées résulte d’une fonction primitive donnée […], il est
souvent difficile de juger si elle est une dérivée exacte d’une fonction quelconque
inconnue. Cet objet a occupé les Géomètres presque dès la naissance du Calcul
différentiel ; ils ont cherché des caractères généraux pour reconnaître si une fonction
d’un ordre quelconque peut être la dérivée exacte d’une fonction d’un ordre
immédiatement inférieur, ou même d’un ordre inférieur quelconque. […]. [Œuvres X, p.
364]
Lagrange donnera alors une étude complète de ce problème. Décrivons-en la première étape,
elle comprend comme cas particulier, les expressions du type zL(y, y’,...y(m)) présentes dans le
mémoire de 1766. Il s’agit en effet d’une fonction V de différentes variables x, y, z… et de
leurs dérivées, dans laquelle une de ces variables z et ses dérivées z’, z’’, …, ne se trouvent
qu’à la première dimension [p. 365]. Cette fonction V est écrite sous la forme
V = Nz + Pz’ + Qz’’ + Rz’’’ + …
Choisissons N = N1y , P = P1y , Q = Q1y …avec, pour N1, P1, Q1 ….., des fonctions de la
seule variable t, alors le simple échange des lettres y et z fait apparaître l’expression

5
Voir infra chapitre II, § 2.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 22 chapitre I

zL(y, y’,...y(m)) qui fait l’objet des premiers calculs du mémoire de 1766. Par des
transformations équivalentes aux intégrations par parties, Lagrange obtient ensuite l’identité
V = ( N – P’ + Q’’ – R’’’ + …)z
+ (Pz)’ – (Q’z)’ + (R’’z) - …
+ (Qz’)’ – (R’z’)’ + …
+ (Rz’’)’ -…
+…
La condition d’intégrabilité est finalement écrite au moyen d’une équation de même type que
l’équation adjointe
Comme tous les termes de cette formule, à l’exception de ceux de la première ligne qui
se trouvent multipliés par z, sont déjà des fonctions dérivées exactes, il faudra, pour que
la fonction V soit une dérivée exacte, que les termes multipliés par z, savoir :
(N – P’ + Q’’ – R’’’ + …)z
forment ensemble une fonction dérivée exacte.
Or il est facile de se convaincre que cela est impossible tant qu’on n’établit aucune
relation entre z et les autres variables. Donc il faudra que ces termes disparaissent
d’eux-mêmes de l’expression de V, ce qui donnera l’équation de condition
N - P’ + Q’’ – R’’’ + … = 0
laquelle devra par conséquent être identique pour que la fonction V puisse avoir en
général une primitive. [p. 366]
L’argument ultime est celui-ci : (N – P’ + Q’’ – R’’’ + …)z représente une expression de
type z F(x, y , u, v…) où F ne s’exprime qu’à l’aide des fonctions x, y, u, v… et de leurs
dérivées (la fonction z n’intervenant pas). Or on ne peut avoir
z F(x, y , u, v…) = [G(x, y , z, u, v…)]’
que si les fonctions F et G sont identiquement nulles. Car dans tout autre cas, la dérivée
[G(x, y, z, u, v )]’ ferait intervenir les dérivées de z, et pas seulement la fonction z elle-
même. La mention il est facile de se convaincre souligne, dans l’argumentation, un passage
un peu délicat. A contrario, dans le mémoire de 1766, la théorie de l’équation adjointe est
introduite sur la base de calculs que le lecteur a immédiatement sous les yeux.
On peut enfin revenir sur le procédé d’« abaissement » de l’équation L(y, y’,...y(m)) = T, réalisé
*
à partir de solutions de l’équation L (z, z’,...z(m)). Il met en jeu des systèmes d’équations
algébriques linéaires. En étudiant ces systèmes, on pouvait être conduit à préciser les
conditions à imposer aux fonctions z concernées. Avec l’utilisation systématique des termes
solutions différentes, Lagrange passe à côté de ce problème6.

6
Vessiot mentionne O. Hesse [J. reine angew. Math. 54(1857), p. 227] et E.B. Christoffel [J. reine angew.
Math. 55(1858), p. 293] pour la caractérisation des solutions indépendantes à l’aide du wronskien [Vessiot/Molk,
1910, p. 109].

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 23 chapitre I

Abandonnons le terrain théorique pour parler des calculs pratiques réalisés sur les différents
cas particuliers. Le recours systématique à l’équation adjointe augmente le volume des
calculs. On le constate sur le schéma qui décrit les étapes du calcul dans le cas de l’équation
du second ordre [tableau 1 - I - f]. Lagrange lui-même note que le calcul peut souvent être
avantageusement raccourci, en n’utilisant que les dernières étapes
Au reste, si l’on ne connaissait pas d’avance les valeurs particulières de y dans le cas
de T = 0, il vaudrait mieux chercher directement les valeurs de z par la résolution de
*
l’équation (B) [L (z, z’,...z(m)) = 0], laquelle n’est guère plus compliquée que l’équation
(D) [L(y, y’,...y(m)) = 0] [p. 475]
De même, Lagrange traite le cas général,
αϕ[t + a(h+kt)] + βϕ[t + b(h+kt)] + γϕ[t + c(h+kt)]+...= T
mais, les exemples traités ensuite relèvent de l’équation
αϕ(t + a) + βϕ(t + b) + γϕ(t + c) +...= T,
celle-ci nécessite seulement le recours à une équation différentielle à coefficients constants ;
la simplicité de cette dernière situation se trouve masquée par l’utilisation préalable de
l’équation
2 3
dy 2 d y 3 d y
(H) Ay + B( h + kt ) + C( h + kt ) + D( h + kt ) +... = T
dt dt 2 dt 3
et par le passage à la limite qu’il faut réaliser pour obtenir les exponentielles qui forment la
solution.
Mais, dès 1765, l’annonce des résultats fondamentaux de ce mémoire dans une lettre de
Lagrange à d’Alembert, va ouvrir, pour les équations linéaires, des perspectives qui ne sont
plus directement liées à la théorie de l’équation adjointe.
2. d’Alembert et la systématisation d’un procédé connu
2.1. la correspondance entre Lagrange et d’Alembert

2.1.1. la lettre de Lagrange


Lagrange annonce ces résultats à D’Alembert dans une lettre du 26 janvier 1765. La lettre
concerne d’abord le problème des cordes vibrantes et les équations dont il dépend. On sait que
les positions des deux savants restent différentes. D’Alembert maintient que l’on ne peut
soumettre au calcul les cas où la figure initiale de la corde n’est pas donnée par une équation.
Lagrange défend les calculs qu’il a réalisés dans le mémoire de 1762, même si certains
passages de sa lettre témoignent d’un réel embarras. Évidemment, les divergences sur les
modalités du calcul s’effacent si l’on s’en tient à des conditions initiales exprimées
analytiquement : je suis sans doute d’accord avec vous sur les cordes vibrantes quand la
courbe initiale peut être représentée par une équation [Œuvres , XIII, p. 29]. Et c’est à ce
propos que Lagrange fait état du résultat que nous venons de mentionner sur les fonctions
périodiques impaires
Au reste, j’ai trouvé, par une méthode tout à fait directe, que la condition dont nous
parlons ne peut avoir lieu dans une courbe à équation à moins qu’elle ne soit
représentée par
πx 2πx
y = α sin + β sin + etc. [p. 30]
a a
La lettre va comporter d’autres indications sur des équations fonctionnelles qui ont déjà fait
l’objet d’échanges entre les deux hommes. Et c’est à cette occasion que Lagrange va évoquer
ses travaux sur les équations différentielles linéaires

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 24 chapitre I

Votre théorème sur


(1+ h −1) x' + y' −1
(
= 1 − h −1 )
x'− y' −1

et les conséquences que vous en tirez m’ont enchanté ; ce que je vous ai envoyé là-
dessus n’est qu’un cas particulier d’une solution générale par laquelle on peut trouver
ϕ(x) dans cette équation
aϕ(t + αy) + bϕ(t + βy) + cϕ(t + γy) +...= X,
X étant une fonction quelconque de x, et y = A + Bx ; et cette solution elle-même n’est
qu’un cas particulier d’une méthode d’intégration dans laquelle je tire la valeur
complète de y de cette équation de degré m,
2
dy d y
Py +Q + R 2 +....= X,
dx dx
(P, Q, ...,X étant des fonctions quelconques de x), en supposant que je connaisse m ou
au moins m-1, valeurs particulières de y dans l’équation
2
dy d y
Py+Q + R 2 +....=0.
dx dx
Ceci fera la matière d’un mémoire que j’insérerai dans le troisième volume de nos
Mélanges. [Oeuvres, vol XIII, pp. 30-31]
La lettre se poursuit notamment avec une offre de publier dans le prochain volume des
Mélanges de Turin, une contribution que d’Alembert accepterait de lui envoyer.
D’Alembert lui répond dans une lettre du 2 mars 1765.

2.1.2. la réponse de d’Alembert


En ce qui concerne les équations linéaires, d’Alembert se réfère au traité de dynamique, qu’il
a publié en 1743 ; il est en possession d’une méthode lui permettant d’obtenir un résultat
équivalent à celui de Lagrange

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 25 chapitre I

Si l’on pose y = vz , les dérivées successives de y vont s’écrire


J’ai donné, dans la première édition de mon traité de Y’ = vz’ + v’z, y’’ = vz’’ + 2v’z’ +…. , y’’’ = vz’’’ + 3v’z’’ + …
dynamique, une méthode pour intégrer l’équation de façon générale, le développement de y(k) va contenir la dérivée z(k) dans le
seul terme v z(k). Quand on substitue y = vz dans le premier membre de
ddy + My dz2 + P dz2 = 0 , l’équation linéaire
qui me fournit un moyen très simple d’intégrer l’équation (Em) Lm(y, y’,...y(m)) = X,
la collecte des termes qui contiennent les v z(k), donne vLm (z, z’,...z(m)) . En
dy d2y
Py + Q + R 2 +....= X, dehors de ces termes là, la fonction v n’apparaît dans le premier membre de
dx dx
l’équation que par l’intermédiaire de ses dérivées, et l’on obtient une identité
lorsqu’on a m-1 valeurs de y en x dans le cas X = 0. Soit
de la forme
y = vz, z étant une de ces valeurs et v une indéterminée Lm (y, y’,...y(m)) = v Lm (z, z’,...z(m)) + z Lm -1( v’, v’’,...v(m) )
variable ; j’aurai Il reste à poser q = v’ = dv , comme le fait d’Alembert, et l’identité s’écrira
dx
dz d 2z Lm (y, y’,...y ) = v Lm (z, z’,...z(m)) + z Lm -1(q,...q(m - 1))
(m)
Pz + Q + R 2 +....= 0,
dx dx Mais on a supposé z, solution de l’équation sans second membre
et, substituant, il me viendra une équation du degré m qui (E*m) Lm (y, y’,...y(m)) = 0
Une fonction q reliée à une fonction quelconque y par la relation y = z ∫ qdx,
n’aura d’inconnue que v et point de terme où soit v, donc,
donne lieu à l’identité
faisant dv = q , j’aurai une équation du degré m-1 où j’aurai (Im) Lm (y, y’,...y(m)) = z Lm -1(q,...q(m - 1))
dx Et finalement l’équation initiale est ramenée à
y
m-2 valeurs de q dans le cas de X = 0, puisque v ou a m-2
z Lm – 1 (q,...q(m - 1)) = T
dv z
valeurs connues (hyp.) et par conséquent ou q ; donc, en
dx Si l’équation (E*m) admet, en plus de s1 = z, les solutions si (pour i = 2, 3
continuant ainsi, j’arriverai à une équation de cette forme s 
...m – 1), le choix particulier de q = d  i  conduira à y = z ∫ qdx = si. La
dr + Z rdx + ζ dx = 0 dx  s1 
substitution de ses valeurs de q et de y dans l’identité (Im), montre que les
qui est évidemment intégrable. [pp. 33-34]
s 
(m – 2) fonctions d  i  sont solutions de l’équation sans second membre
[Tel qu’il est donné dans le tome XIII des Œuvres de Lagrange, ce passage dx  s1 
contient plusieurs incohérences dans les notations : confusions entre les
lettres x et z, introduction d’une majuscule V à la place de la minuscule v. La
Lm – 1 (q,...q(m - 1)) = 0.
citation donnée ici, rectifie ces erreurs.]
1ère partie 24 chapitre I

La résolution de l’équation initiale est donc ramenée à deux opérations :


1. résoudre la nouvelle équation linéaire complète d’ordre m – 1, connaissant m – 2 des
solutions de l’équation sans second membre qui lui est associée ;
2. terminer la résolution en calculant l’intégrale de la solution q = z’ obtenue, pour exprimer la
solution y = vz de l’équation initialement donnée.
L’itération du procédé permet de « descendre » jusqu’ à une équation
L1(r, r’) = Tm - 1
dont l’ordre est égal à 1 . On se trouve alors ramené à un problème, pour lequel, en 1765, des
procédés de résolution sont connus. Nous reviendrons sur ces procédés par la suite.
Les calculs mis en œuvre ressortissent très exactement à ce que l’on appelle aujourd’hui la
méthode de « variation de la constante ». En particulier, si l’on suppose v constant, l’identité
Lm (y, y’,...y(m)) = v Lm (z, z’,...z(m)) + z Lm -1( v’, v’’,...v(m) )

se réduit à
Lm (y, y’,...y(m)) = v Lm (z, z’,...z(m)) .
Et le terme complémentaire z Lm -1( v’, v’’,...v(m) ) est bien ce que l’on obtient, en faisant
« varier la constante v ». Mais ce point de vue et cette terminologie ne sont pas présents dans
le texte de d’Alembert.
Lagrange répond dans une lettre du 20 mars 1765. Il juge la méthode de d’Alembert très
belle. Il souligne que la sienne en est totalement différente. Puis en faisant allusion à
l’utilisation qu’il en fera dans le mémoire pour résoudre l’équation fonctionnelle
aϕ(x + αy) + bϕ(x + βy )+ ... = X,
il indique que sa solution présente l’avantage de donner tout d’un coup la valeur de y,
moyennant quoi l’on peut aussi l’appliquer aux équations infinies [Oeuvres XIII, p. 37]. Sur
les équations fonctionnelles, comme sur les équations différentielles, le mémoire de Lagrange
donnera en effet l’expression complète des solutions à l’aide de formules. Pour le moment,
d’Alembert expose seulement un procédé de calcul, dont l’itération finit par produire la
solution. Mais, il ne donne pas une formule dans laquelle on puisse lire tout d’un coup la
solution.
Cependant, l’échange n’est pas clos. D’Alembert accède à la demande de Lagrange de fournir
une contribution au volume 3 des Mélanges de Turin. Ce sera l’occasion de préciser une
méthode, qu’il reprendra aussi dans des Mémoires à l’Académie des sciences de Paris.

2.2. les précisions apportées ultérieurement


Le tome 3 des mélanges de Turin va donc contenir à la fois le long mémoire de Lagrange
Solution de différents problèmes de calcul intégral, et un ensemble signé de d’Alembert qui
porte le titre : extrait de différentes lettres de M. d’Alembert à M. de La Grange. Ces Extraits
concernent notamment la Mécanique Céleste et le problème des cordes vibrantes. Mais ils
commencent par un texte sur les équations différentielles linéaires, l’idée fondamentale est
celle qui est exprimée dans la lettre du 2 mars, mais le contenu est plus substantiel.

2.2.1. la contribution au volume 3 des Mélanges de Turin


D’Alembert va s’attacher à donner une description plus précise de sa solution. Il explique sa
méthode avec plus de précision. Il conclut en donnant la solution par le moyen d’une formule.
Lagrange s’est prévalu de produire un résultat dont la forme se présente tout d’un coup à l’œil
du lecteur. La nouvelle version de la lettre de d’Alembert témoigne d’un effort réalisé dans le
même sens.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 27 chapitre I

Votre problème sur l’intégration de l’équation Le problème initial Pm peut s’exprimer sous cette forme : résoudre l’équation
(Em) Lm(y, y’,...y(m)) = X
Qdy Rd 2 y Md m y
Py + + + ....+ = X, connaissant m – 1 fonctions s1, s2,...sm - 1 solutions de l’équation
dx dx22 dxm (E*m) Lm (y, y’,...y(m)) = 0.
lorsque l’on a m-1 valeurs de y dans l’équation s1 sera la fonction que d’Alembert note z, on aura y = V s1. Notons V1 la dérivée de V

Py +
Qdy Rd 2 y
+ + ....+
Md m y
= 0,
(1) ∫
y = s1 V 1 dx
dx dx 2 dx m On obtient une identité
m’a paru si beau, que j’en ai cherché une solution que voici. (2) Lm (y, y’,...y(m)) = V Lm (s1 , s1’,...s1(m)) + s1 Lm -1( V1, V1’,...V1(m - 1))
Soit y = Vz, V étant une indéterminée, et z une des valeurs de Mais les fonctions si sont solutions de l’équation (E*m), l’identité (2) indique donc
y qui satisfait à l’équation que l’équation
Qdy (E*m - 1) Lm -1 ( V1, V1’,...V1(m - 1)) = 0
Py + + &c....= X ; admet m – 2 solutions, lesquelles sont obtenues à l’aide de (1) sous la forme
dx
la transformée sera composée s 
: ti = d  i  , pour i = 2, 3…m – 1
Qdz Rd 2 z Md m z dx  s1 
1/ d’une partie V ( Pz + + 2
+....+ ),
dx dx dxm Le problème Pm est réduit au problème Pm – 1 : résoudre l’équation d’ordre m – 1
où X ne se trouvera point , laquelle sera évidemment = 0, à (Em - 1) Lm -1 ( V1, V1’,...V1(m - 1)) = X
cause de s1
Qdz Rd 2 z Md m z connaissant les m – 2 solutions ti de l’équation sans second membre (E*m - 1)
Pz + + +....+ = 0 , (hyp) La réduction suivante, obtenue en posant V1 = t2 ∫V 2 dx , concerne l’équation
dx dx2 dx m
2/ d’une partie où V ne se trouvera point , et qui ne contenant (Em - 2) Lm -2 ( V2, V2’,...V2(m - 2)) = X
m s1 t2
que dV avec ses différences jusqu’à d V inclusivement,
è
pourra par conséquence être abaissée au (m-1) degré, en L’équation (E*m - 2) associée admet m – 3 solutions :
faisant dV = V’dx ; or puisqu’on a m-1 valeurs de y, on aura t 
donc m-1 valeurs de V, en n’y comprenant pas l’unité ; donc ui = d  i  pour i = 3, 4…m – 1
dx  t 2 
supposant que z’ soit une de ces valeurs, et faisant
Le problème P1 concerne la résolution d’une équation du premier ordre
V’ = z’∫V’’dx, comme on a fait y = z∫V’dx, on abaissera de
même l’équation en V’, et ainsi de suite, jusqu’à ce qu’on (E1) L1( Vm-1, Vm-1’) = X
arrive à une équation qui sera de cette forme dV’’ &c + s1 t2 u3......
&c
kV’ dx = X, K et X étant des fonctions de x. Or on sait que dont aucune solution n’est connue a priori, mais dont on sait ramener la résolution à
cette équation est intégrable. des quadratures.
1ère partie 28 chapitre I

Il est aisé de voir par cet exposé qu’à chaque transformation



Quand on substitue y = s1V = s1 V 1 dx dans (Em) et qu’on développe les dérivées, (par
exemple selon la formule de Leibniz) seuls les termes
il disparaît un des coefficients, savoir, celui de dy pour la m −1
seconde &c, en sorte que dans la dernière transformée il ne M d y et N d
m
y d mV d m −1V
produisent les dérivées et , soit en fonction de V1 :
restera que les deux coefficients de dm y et de dm-1 y ; or si on a d xm d x m −1 d xm d x m −1
une quantité de cette forme
Md my d m −1V1 ds1 d m − 2V1
ωd m −1λ βd mλ = s 1M + m M +…
m −1
+ m
d xm d x m −1 dx d x m − 2
dx dx
et qu’on fasse N d m −1 y d m − 2V1
= s N + ….
d x m −1
1
dλ = ζηdx, d x m−2
on aura dans la transformée (en laissant à part les autres On peut donc prévoir la forme des termes d’ordre m - 1 et m - 2 et l’on obtient
termes) ds 1
m−2
d m −1V1 dx + N ) d V1 + … = X
d m −1η d mλ (Em - 1) M
d x m −1
+ (m M
s1 d x m−2 s1
1/ βζ à la place de β et à la place de
dx m −1 dx m Le même processus a lieu à l’étape suivante, on obtient
dt 2 ds1
βdζ d m −1η ωd m −1λ d m − 2V2 m −3
2/ [ωζ+ ×(m−1) ] m −1 au lieu de (Em - 2) M + [(m – 1)M dx + m M dx + N ] d V2 + … = X
dx dx dx m − 1 d x m−2 t2 s1 d x m−3 s1 t 2
Il est possible de prévoir la forme de l’équation (E1) : parmi les coefficients de l’équation
Nd m −1 y Md m y initiale, seuls M et N sont mis en jeu ; les solutions si de l’équation (E*m), interviennent
Donc si on suppose que m −1
+ m
soient les deux selon un mécanisme complexe, il faut prendre en compte les fonctions successivement
dx dx
derniers termes du premier membre de la proposée, et qu’on définies par
fasse s  t  u 
ti = d  i  , ui = d  i  , vi = d  i  ,…
dx  s1  dx  t2  dx  u3 
y = z ∫ z’dx∫ z’’dx∫ z’’’... ∫ V’’’’ &c.
dx L’expression de la solution de l’équation initiale sera donc obtenue par
il sera aisé de trouver, par la remarque précédente, la forme ∫ ∫ ∫ ∫
y = s1 V 1 dx = s1 [t2 V2 dx ]dx = s1 [t2( u3 V3 dx ) dx]dx ∫ ∫
de la dernière transformée, d’où l’on tirera aisément la valeur
On peut produire un résultat proche de celui de d’Alembert, en convenant de noter z = s1,
de V’’’’&c. . Je ne fais, monsieur, qu’indiquer l’opération, qui
z’ = t2 , z’’ = u3 , z’’’ = v4 ; on obtient finalement….
serait très simple et très courte ; vous suppléerez aisément à ce
que je ne dis pas. ∫ ∫ ∫ ∫ ∫
y = z [z’ (z’’ (z’’’…. (z(m- 2) Vm −1 dx)dx)dx)dx]dx.
[p. 381-382]
1ère partie 29 chapitre I

Les précisions apportées concernent notamment la façon dont évolue le terme d’ordre k – 1
dans l’équation Lk = 0, d’ordre k.

2.2.2. les Recherches sur le calcul intégral [1770 et 1772]


En 1770 et 1772, d’Alembert publie deux mémoires intitulés, l’un et l’autre, Recherches sur
le calcul intégral. Le premier est composé de 48 théorèmes et ne comporte aucune
démonstration. Les premiers énoncés ont trait à l’intégrabilité de certains types de fonctions,
mais la plus grande partie du mémoire se rapporte aux équations différentielles. C’est le
mémoire de 1772 qui donne les démonstrations des théorèmes énumérés dans le premier
mémoire. D’Alembert y ajoute quelques questions nouvelles, notamment il étudie les
solutions singulières des équations différentielles, en reprenant des résultats obtenus par
Euler 7.
Parmi les propositions publiées en 1770, une dizaine concerne les équations différentielles
linéaires. Il y a là un prolongement aux résultats obtenus dans la correspondance avec
Lagrange. D’Alembert envisage différentes hypothèses concernant le nombre des solutions
connues de l’équation L = 0, ou L = T. Et il en tire des conséquences quant à l’intégrale
complète de l’équation L = T. Il montre aussi que l’intégrale complète de l’équation L = T
permet d’accéder à l’intégrale complète de toute équation L = S, obtenue en changeant le
second membre. Retenons les termes dans lesquels il évoque les résultats publiés dans les
Mélanges de Turin
(42) Le théorème que M. de la Grange et moi-même avons démontré dans les mémoires
de Turin, tome III, pages 179 et 381, a besoin de cette restriction que les valeurs de θ
qui satisfont à l’équation précédente, privée de son terme ξdzn, ne soient pas en raison
constante entre elles, c’est-à-dire que ces valeurs particulières ne soient pas Aθ ’,
Bθ ’,C θ ’, comme elles le peuvent être, mais qu’elles soient exprimées par des variables
différentes, représentées par différentes fonctions de z. [1770, p. 584-585]
La restriction est justifiée par un retour à la méthode utilisée dans la correspondance avec
Lagrange et que d’Alembert évoque à l’aide d’une équation d’ordre m = 3. En conformité
avec son texte de 1766, il fait l’hypothèse qu’il connaît m – 1 = 2 solutions. À l’aide de
notations que nous avons déjà utilisées, la démarche était la suivante. Soit l’équation
L3 (y, y’ ,y’’ ,y’’’) = X
On suppose que l’on connaît deux solutions s1 et s2 de l’équation
L3 (y, y’ ,y’’ ,y’’’) = 0.
Si les fonctions y et V sont reliées par y = V s1, on obtient l’identité
L3 (y, y’ ,y’’ ,y’’’) = s1 L2( V’ ,V’’ ,V’’’).
s
Cette identité permet d’établir que la fonction 2 est une solution de l’équation
s1
L2( V’ ,V’’ ,V’’’) = 0.
Mais, si les fonctions s1 et s2 sont en raison constante, la solution ainsi obtenue donne V’ = 0,
et le processus d’abaissement est interrompu. Après ce constat effectué sur l’équation d’ordre
3, d’Alembert énonce la condition nécessaire analogue pour une équation d’ordre quelconque
Sur quoi on observera que toutes les fois qu’on a une valeur θ’ qui satisfait à l’équation
privée de son dernier terme […] [c’est-à-dire l’ « équation sans second membre »], la
quantité Aθ’ y satisfera de même, A étant une constante quelconque ; d’où il s’ensuit
que θ’, Aθ’, Bθ’, n’indiquent réellement qu’une seule et même valeur. Il faut donc non
seulement que la valeur de θ’ soit différente dans les expressions données de θ, mais
que ces valeurs ne soient pas entr’elles en raison constante [1772, p. 96]

7
Voit infra 2ème partie, chapitre I.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 30 chapitre I

En se limitant à la considération de la première étape de l’abaissement, d’Alembert n’obtient


évidemment qu’une condition nécessaire et il ne caractérise pas les systèmes de solutions qui
permettent de résoudre effectivement l’équation complète.

3. bilan et fécondité des découvertes de 1766


3.1. la formulation des solutions
Lagrange a revendiqué pour sa méthode l’avantage de donner d’un seul coup la solution, et de
se prêter ainsi à une extension au cas des équations infinies. Les prolongements que nous
avons donnés aux calculs de d’Alembert (Annexe 1 – I - A) montrent effectivement que son
procédé se prête mal à une généralisation, si l’on a en vue l’écriture explicite des solutions ;
l’un de ses inconvénients est de détruire la symétrie entre les solutions connues si. Mais il faut
relativiser les avantages que donne la solution de Lagrange sur ce point. Certes ses résultats
s’écrivent de façon symétrique comme une somme de n termes. Cependant l’expression
complète de la solution n’est pas obtenue dans le cas général, mais seulement dans le cas
particulier des coefficients constants ou de la forme (h + kt)n. Si les fonctions zk représentent
les solutions de l’adjointe L* = 0, on peut leur associer les solutions de L = 0 qui sont
fournies par des formules utilisant des déterminants
( )
∆ z1 , z2 ,...., zk −1 , zk +1 ,...., zn
yk = (- 1)n + k
( )
∆ z1 , z2 ,..., zn
.

Cette expression sera donnée par Jacobi8. L’écriture des solutions de l’équation générale du
second ordre [tableau I-1-f] est proche de ce type de résultat. Faute de systématiser la
résolution des systèmes linéaires d’équations algébriques, Lagrange ne donne pas à ses
formules la forme précise qui permettrait une généralisation complète.
Mais, plus près de Lagrange, Euler va revenir sur les propriétés de l’adjointe, avec des
énoncés sur lesquels il faut donner quelques précisions.

3.2. Euler et la réciprocité de l’équation l’adjointe


Le mémoire d’Euler a été présenté le 19 mars 1778 à Saint Petersbourg, il a été imprimé en
1805 seulement. Il contient les calculs effectifs sur l’équation d’ordre 4
(E) pz + q dz + rddz + s d 3z + t d 4z = 0.
Il introduit un multiplicateur m et cherche les conditions à vérifier pour que l’équation
m (pz + q dz + rddz + s d 3z + t d 4z ) = 0
soit intégrable. Il trouve que la fonction m doit vérifier l’équation
(E*) mp - dmq + ddmr - d 3ms + d 4mt = 0.
Il appelle équation résolvante, l’équation ainsi obtenue9. Mais, sur cet exemple, il pousse les
calculs plus loin que ne le fait Lagrange. Il suppose l’équation (E*) développée sous la forme
Pm + Q dm + Rddm + S d 3m + T d 4m = 0.
Et il explicite les nouveaux coefficients en fonction de ceux de l’équation initiale
P = p – dq + ddr – d 3s + d 4t
Q = - q + 2dr – 3 dd 2 s + 4 d 3t
(R) R = r – 3 ds + 6 dt
S = - s + 4dt
T = t.

8
En 1846, cité par Vessiot [1910, p. 122].
9
Hanc ob rationem aequationem ultimo inventam vocabimus aequationem resolventem formae proposita
pz + q dz + rddz + s d 3z + t d 4z = 0
atque hinc patet, quomodo pro quavis aequatione differentiali lineari proposita eius resolventem inveniri
oporteat [1805, p. 344].

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 31 chapitre I

Il pose immédiatement le problème de la réciprocité


Et si nous voulions considérer l’équation résolvante comme donnée, la première
équation elle-même, dont elle est la résolvante, pourrait évidemment être produite à
partir d’elle par les relations suivantes par lesquelles les lettres minuscules p, q, r, etc ;
sont déterminées au moyen des majuscules P, Q, R, etc. :
t=T
s = - S + 4dT
r = R – 3 dS + 6 dT
q = - Q + 2dR – 3 dd 2 S + 4 d 3T
p = P – dQ + ddR – d 3S + d 4T
D’où il est évident que les lettres minuscules dépendent des majuscules tout à fait par la
même loi par laquelle celles-ci ont été trouvées dépendre de celle-là10.
La démarche est donc différente de celle de Lagrange. Euler n’applique pas à l’équation (E*),
l’ensemble du processus qui avait conduit de (E) à (E*), il concentre l’attention sur l’équation
et son adjointe, indépendamment de la succession des intégrations par parties qui les relient.
C’est une simple résolution algébrique qui, à partir des relations (R), permet de calculer les
coefficients p, q, r, s, t en fonction des coefficients P, Q, R, S, T. Le résultat obtenu, il peut
conclure
Donc n’importe quelle équation différentielle de cette sorte est conjuguée avec sa
résolvante par un lien réciproque tel que, si l’une est la résolvante de l’autre, en retour
aussi celle-ci est la résolvante de celle-là.
Puis, Euler pose une terminologie adaptée à la situation qu’il vient de mettre en évidence
Étant donné donc que deux équations de cette sorte sont reliées entre elles par un lien si
remarquable, nous les désignerons comme conjuguées entre elles, ainsi n’importe quelle
équation de cette nature aura sa conjuguée et chacune pourra être résolue par le moyen
de l’autre. 11
Un peu plus loin, il finit de systématiser les notations : on passait déjà de l’équation initiale à
sa conjuguée en remplaçant, pour l’écriture des coefficients, les lettres minuscules par les
majuscules correspondantes. Mais le facteur intégrant m est finalement la fonction inconnue
dans l’équation conjuguée de l’équation initiale ; pour l’uniformité, Euler convient de le noter

10
Quodsi aequationem resolventem tanquam datam spectare velimus, ex ea vicissim ipsa aequatio prior, cuius
est resolvens, exhiberi poterit per sequentes relationes, quibus litterae minusculae, p, q, r, etc, per maiusculas P,
Q, R, etc. determinatur :
[…]
Unde patet litteras minuscules eadem prorsus lege a maiusculis pendere, qua ab illis pendere sunt inventae
[Opera Omnia p. 345].
On peut mettre en évidence la réciprocité des équations Σpi d iz = 0 et Σ(-1)id i(pi z) = 0, a priori et
indépendamment du contexte dans lequel elles ont été obtenues. Convenons de distinguer, dans les notations, la
dérivation qui opère sur la fonction inconnue z, que l’on notera ∆, et la dérivation, notée D, qui opère sur les
fonctions pi . Avec ces notations on a, par exemple, ∆( pi z) = pi ∆z ;
d i(pi z) = (D + ∆)i(pi z).
L’équation initiale et son adjointe s’écrivent respectivement
Σ ∆i( pi z) = 0 et Σ(- D - ∆)i(pi z).
Le passage de la première à la seconde s’effectue donc par la substitution de l’opérateur (D - ∆) à l’opérateur ∆.
Si l’on effectue encore cette substitution dans le premier membre de l’équation adjointe, on obtient
Σ[- D - (-D - ∆)]i(pi z) = Σ ∆i( pi z).
C’est seulment avec Arbogast que l’on verra apparaître ce type de calcul (voir infra 4ème partie).
11
Qualibet igitur huiusmodi aequatio differentialis cum sua resolvente tali reciproci nexu coniugatur, ut si una
fuerit resolvens alterius, vicissim quoque haec resolvens sit illius. Cum igitur huiusmodi binae aequationes tam
insigni vinculo sint inter se connexae, eas inter se conigatas appellemus, ita ut quaelibet aequatio huius indolis
suam habeat coniugatam, atque utraque ope alterius resolvi possit [Ibid.]

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 32 chapitre I

désormais à l’aide de la lettre Z, de même que z désigne la fonction inconnue dans l’équation
initiale.
Il termine cette partie générale en indiquant les formules qui conviendraient pour relier deux
équations conjuguées, écrites respectivement sous la forme
pz + q dz + rddz + s d3z + t d4z + v d 5z + etc.= 0
PZ + Q dZ + RddZ + S d 3Z + T d 4Z + V d 5z + etc.= 0.
Il examine les cas particuliers constitués par les équations à coefficients constants, et par les
« équations d’Euler »
pz + q dz + rddz + s d3z + t d4z + v d 5z + etc.= 0.
Enfin, il termine par la résolution d’une équation avec second membre L = T, à l’aide des
solutions de l’équation conjuguée L* = 0.
Euler ne mentionne pas du tout les travaux antérieurs de Lagrange sur le sujet. Et lorsqu’il
met en évidence la réciprocité, il indique
Si une des deux [équations] admet une solution, en même temps, il sera toujours
possible de résoudre l’autre, et en cela consiste cette observation singulière qui m’est
apparue en vérité très digne d’être signalée ; et en effet je ne me souviens pas de l’avoir
vue fait par quelqu’un d’autre 12
Les résultats essentiels figuraient dans le mémoire de Lagrange en 1766, la conduite des
calculs était un peu différente. L’intérêt du mémoire d’Euler réside dans la mise en valeur de
la réciprocité, avec un vocabulaire et des notations spécifiques.

3.3. l’exploitation par Lagrange de la méthode de d’Alembert


Nous avons vu que Lagrange lui-même est revenu sur des questions voisines de celle de
l’adjointe, dans ses Leçons sur le calcul des fonctions. Cependant, ses principaux travaux sur
les équations différentielles linéaires ont pris une autre direction. En 1777, il érige la
« variation de la constante » en méthode systématique. Ses calculs reprennent, de fait, des
propriétés semblables à celles que d’Alembert mettait en œuvre dans sa correspondance.
Mais, nous le verrons, il couvre par sa méthode les équations aux différences finies et des
problèmes importants de Mécanique Céleste. Il met l’accent sur des régularités qui
n’apparaissaient pas dans les calculs de 1766. En terminant son mémoire de 1777, il pourra
surplomber les travaux antérieurs en indiquant que son contenu est beaucoup plus simple que
tout ce que l’on trouve dans les tomes III et IV des mémoires de Turin [1777b, p. 161]13.
Nous avons vu comment d’Alembert [1770] évoquait le volume 3 des Mélanges de Turin, en
rappelant qu’il contenait deux démonstrations du même théorème. Dans le Supplément de
l’Encyclopédie [1777], Condorcet évoque cette double filiation en des termes très voisins
M. d’Alembert et M. de la Grange ont de plus démontré ce théorème intéressant, que la
solution d’une équation linéaire quelconque qui contient un terme sans y, dépend de la
solution d’une équation où tous les termes seraient les mêmes, mais où celui sans y ne
se trouverait pas…[…][p. 749].
Cependant, Lacroix mettra seulement en valeur les travaux de Lagrange
[Nous conclurons donc de ce qui précède, que] si l’on a un nombre n de valeurs
particulières de y, vérifiant l’équation [sans second membre], on en déduira
immédiatement l’expression générale de cette fonction et de celle qui est déterminée
par l’équation [complète], et l’on parviendra encore à déterminer ces expressions,

12
Quodsi enim alterutra resolutionem admittat, simul quoque alterius resolutio semper est in potestate, atque in
hoc consistit observatio illa singularis, quae mihi quidem maxime notatu digna videtur ; neque enim memini eam
quoquam alio factam vidisse. [Ibid.]
13
Se trouvent probablement visés, outre les écrits de Lagrange lui-même et de d’Alembert (tome 3 des mélanges
de Turin), le mémoire de Laplace Recherches sur le calcul intégral aux différences infiniment petites et aux
différences finies (tome 4)

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 33 chapitre I

dans le cas où l’on ne connaîtrait que n-1 particulières, en intégrant une équation du
premier degré et du premier ordre. Cette proposition, la plus générale qu’on ait sur
l’intégration des équations, est due à M. Lagrange. [1814, p. 329]
Puis, dans la 5ème édition de son traité élémentaire, Lacroix attribuera sans nuance à Libri, une
méthode semblable à celle de d’Alembert. Au cours d’une controverse qui l’opposera à Libri
sur plusieurs points, Liouville fera clairement état des deux méthodes distinctes présentes dès
1765/66 : l’une dans le mémoire Solution de différents problèmes de calcul intégral de
Lagrange, l’autre dans la lettre de d’Alembert du 2 mars 1765. Et à l’article où figure cette
mise au point, Liouville joindra, en note, le texte complet de la lettre de d’Alembert 14 . Libri
se défendra en disant ne pas connaître ce fragment, et en invoquant le point de vue exprimé
par Lacroix lui-même 15. Ces péripéties sont relatées par S. Demidov [1983], dans un article
consacré à l’histoire des équations différentielles linéaires.

3.4. l’analogie entre les équations différentielles linéaires et les


équations algébriques 16
Mais au-delà de l’anecdote, S. Demidov montre comment se mettent en place les éléments
d’une théorie des équations différentielles linéaires : en prolongeant et en interprétant les
travaux de Lagrange et d’Alembert, Libri est certainement le premier à percevoir de façon
systématique des analogies entre ces équations d’une part et les équations algébriques d’autre
part. Il est notamment à l’origine du théorème suivant : soient deux équations linéaires sans
second membre Ln + m = 0 et Lm = 0, d’ordre respectif n + m et m ; si toutes les solutions de
Lm = 0 sont aussi solutions de Ln + m = 0, il est possible de déterminer sans intégration une
équation Ln = 0, d’ordre n, dont les solutions soient celles de Ln + m = 0 qui ne satisfont pas à
Lm = 0. Liouville en fournira aussi une démonstration.
Ce type de réflexion est appelé à s’approfondir. Dans le cours d’Analyse de Sturm [1864], un
procédé équivalent à la méthode de variation de la constante est présenté à l’aide d’une
« formule de Brisson »17 analogue, pour les opérateurs différentiels, à la formule de Taylor
pour les polynômes. Dans une note jointe au traité de Sturm, Brassine utilise cette formule
pour démontrer le théorème de Lagrange : si l’on connaît p solutions d’une équation linéaire
d’ordre m, sa résolution complète se ramène à celle d’une équation d’ordre m – p. Puis, pour
chercher les solutions communes à deux équations différentielles linéaires, Brassine donne un
algorithme analogue à celui qui permet la recherche du plus grand commun diviseur de deux
polynômes.
En s’appuyant sur les travaux de Lie, Picard et Vessiot produiront, pour les équations
différentielles linéaires, une théorie analogue à la théorie de Galois des équations algébriques.

14
Journal de Liouville, tome II, juillet 1837, p. 245-247
15
Comptes-rendus de l’Académie des sciences, tome 8, 1839, p. 733
16
Sur ce sujet nous donnons quelques détails dans l’annexe 1-I-A.
17
Nous nommons ainsi cette formule parce qu’elle apparaît pour la première fois dans un mémoire de Brisson
[1808]. Nous étudions ce mémoire au chapitre II de la 3ème partie. Sturm donne une démonstration élémentaire
de la formule et ne se réfère pas à Brisson

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 34 chapitre II

chapitre II
les équations différentielles linéaires avant 1766
Pour donner une image complète des découvertes publiées en 1766, il faut les replacer de
façon plus précise dans leur contexte. Avant cette date, des travaux avaient déjà été consacrés
aux équations linéaires. Des résultats avaient été obtenus. Et nous avons même vu que
d’Alembert commençait sa lettre du 2 mars 1765 en évoquant ses propres travaux. Dès 1743,
dans son Traité de dynamique, il résolvait une équation linéaire du second ordre par un
procédé original. Ce procédé était-il déjà une méthode de variation de la constante ? La
réponse à cette question devra être nuancée : les calculs peuvent effectivement s’interpréter en
termes de variation de la constante, mais la présentation qu’en faisait alors d’Alembert, nous
amènera plutôt à parler de « méthode de dédoublement ».
D’autre part, d’Alembert traite parfois les équations différentielles linéaires en les ramenant à
des systèmes linéaires et en effectuant ce qu’on appellerait aujourd’hui une
« diagonalisation ». Dans les Recherches sur différents points importants du système du
monde [1754], « dédoublement » et « diagonalisation » seront présentés comme deux
procédés concurrents.
Nous examinerons ensuite quelques-uns des travaux d’Euler sur les équations linéaires.

1. quelques aspects du traitement des équations différentielles par


d’Alembert
1.1. la méthode de d’Alembert dans le Traité de Dynamique
Quand le traité de Dynamique est publié, en 1743, d’Alembert est âgé de 26 ans. Il est adjoint
à l’Académie des sciences, dans la section d’Astronomie. Le traité restera une contribution
importante à la formalisation de la Mécanique de Newton. Dans une première partie, l’auteur
énonce trois lois du mouvement, et il s’attache à en déduire des propositions fondamentales.
La deuxième partie commence par l’énoncé de ce qui restera nommé le principe de
d’Alembert et qui fournit le moyen d’utiliser les lois précédentes pour l’étude d’un système de
corps en mouvement. Il s’agit notamment de mettre en évidence les composantes de ces
mouvements qui, imprimées seules aux éléments du système, se seraient mutuellement
détruites et auraient laissé le système au repos [1743, p. 51]. Elle contient ensuite une série de
problèmes destinés à illustrer l’utilisation de ce principe. Les équations différentielles du
second ordre dont il sera question en 1766 concernent les oscillations d’un pendule double.

1.1.1. Le contexte : la résolution d’un système différentiel


L’un des problèmes destiné à illustrer le principe fondamental est en effet énoncé ainsi : un fil
CmM fixé en C, et chargé de deux poids m, M étant infiniment peu éloigné de la verticale CO,
trouver la durée des oscillations de ce fil [p. 95]. La position des points m et M est donnée par
les fonctions x et y de la variable t selon la figure ci-dessous.

m K mK=x

M MQ=y
Q O

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 35 chapitre II

Une mise en équation est réalisée dans le cas général, x et y sont des fonctions du temps,
représenté par la variable t. Ces fonctions sont solutions d’un système d’équations
différentielles du second ordre. D’Alembert va en effectuer la résolution dans le cas
particulier où les poids m et M sont égaux, et où les longueurs Cm et mM sont aussi égales.
T étant une constante introduite pour des raisons d’homogénéité, il montre que x et y sont
solutions du système suivant :
2 dt 2
(P) - ddx = (2 x - y) 2
T
2 dt 2
(Q) - ddy = (2 y - 2 x) 2
T
L’auteur va ramener la résolution de ce système différentiel à la résolution d’une équation
concernant une unique fonction inconnue
Pour intégrer ces équations, je multiplie la première par α, et la seconde par ν (α et ν
étant deux nombres indéterminés) et ensuite je les ajoute ensemble ce qui donne
2dt 2
(R ) - dd (αx + ν y) = [(2 α - 2 ν )x + (2ν - α)y]
T2
je fais en sorte que, [(2 α - 2 ν )x + (2ν - α)y] soit un multiple de - αx - ν y), ce qui
donne
2α − 2ν 2ν −α
= ,
α ν
et
α = ±ν 2
Donc
2dt 2
- ddx 2 - ddy = [ (2 2 - 2) . x + (2 - 2 ).y ]. . [p. 99]
T2
L’équation s’écrit aussi

(
- dd (x 2 + y) = 2 − 2 ( 2 x + y ). )
2dt 2
T2
. [p. 99]

Il suffit alors de poser u = x 2 + y, pour obtenir une équation à une seule inconnue
- dd u = u 2 − 2 (2dt 2 18
T2
. )
Une intégrale première peut être rapidement obtenue sous la forme
- (d u) 2 = 2 − 2 (
u 2 dt 2
T2
. )
L’intégration peut se terminer par séparation des variables. D’Alembert considère alors que la
quantité u se trouve construite[p. 100].
De cette étape de calcul, on retiendra qu’une combinaison linéaire des équations (P) et (Q) a
permis de trouver la fonction auxiliaire u = αx + ν y donnée par une équation différentielle.
En utilisant une terminologie anachronique, on peut parler d’une méthode de
« diagonalisation » 19.

18
À cet endroit le calcul de d’Alembert, dans l’édition de 1743 du traité de dynamique, est inexact ; en effet le

texte comporte - dd u = u 2 ( )
2dt 2
T2
; la suite du calcul - en ce qui concerne la relation entre u et t - reste

entachée de cette erreur.


19
Posons T = 1 pour simplifier. Sous forme matricielle le système s’écrit :

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 36 chapitre II

Il reste à déterminer les fonctions x et y. Compte tenu des valeurs imposées aux constantes α
et ν , y peut s’écrire
y=u-x 2
En reportant cette valeur dans l’équation (P), d’Alembert fait apparaître x comme solution
d’une équation linéaire du second ordre 20
2dt 2
- ddx = [(2 + 2 )x -u ] 2
T
dans laquelle la quantité u est déjà construite [p. 100]

1.1.2. la méthode de « dédoublement »


C’est le traitement réservé à cette dernière équation qui doit retenir notre attention.
D’Alembert poursuit en effet :
zs
je fais x = , z et s étant deux variables indéterminées et j’ai
l
− zdds − 2dzds − sddz
l
= 2+ 2( l T2
)
zs 2 2 2udt 2
dt −
T2
.[p. 100]
L’introduction de la constante l est liée à une exigence d’homogénéité. L’équation à résoudre
contient désormais deux fonctions inconnues. D’Alembert utilise alors la marge de manœuvre
introduite par la présence de ces deux fonctions inconnues
Or à cause des deux indéterminées z et s, dont l’une peut être tout ce que l’on voudra,

( )
2dt 2
on peut supposer que les deux termes - zdds et 2 + 2 . zs. 2 soient égaux ce qui
T
donne
B 2 dt 2 2 2s 2 dt 2
- ds = (2 + 2 ) . [p. 101]
T2 T2
La relation imposée se traduisait d’abord par l’équation 21:

(
- zdds = 2 + 2 . zs. 2 )
2dt 2
T

d 2  x  x  −4 2 
2  
= A  , où A est la matrice   . Cette matrice se diagonalise sous la forme
dt  y  y  4 −4
 −4 + 2 2 0   2 1
A = PDP-1 avec D =   . On peut prendre P-1 =   et transformer le
 0 −4 − 2 2   2 −1
d 2  −1 x  −1  
x
système en  P    = DP   . La fonction u employée par d’Alembert est le premier élément de la
dt 2   y   y

−1  
x  2 x + y
matrice colonne P   =  .
 y  2 x − y

20 2+ 2 u
En utilisant des dérivées et des notations qui s’y rapportent, on peut écrire : x’’ + 2 2
x= 2 .
T T
21
Cette relation est très exactement l’équation « sans second membre » associée à l’équation linéaire
2+ 2
donnée, soit : s’’ +2 s =0
T2

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 37 chapitre II

Il faut procéder à une simplification par z, une intégration au moyen du facteur intégrant ds
fait alors apparaître la constante d’intégration B et conduit en effet au résultat donné par
l’auteur 22.
D’Alembert poursuit :
il ne nous reste plus que l’équation :
−2dzds − sddz 2udt 2
=− 2
l T
dont l’intégrale est
s2 dz 2usdt 2
=∫ 2
[p. 101] 23
l T
La suite de l’étude consiste dans la construction de la solution. D’Alembert se donne deux
segments qui représentent le rapport de t et T, et les relations obtenues lui permettent de
décrire des constructions géométriques conduisant aux segments qui représentent, pour un
temps t quelconque, la valeur de u, z, s [p. 102], et donc aussi la valeur de x et de y.

Au total, le calcul porte bien sur une équation différentielle linéaire du second ordre, que l’on
peut écrire avec des notations un peu différentes de celles de d’Alembert
2+ 2 u
x’’ + 2 2
x= 2
T T
En considérant que s est solution de l’équation « sans second membre »
2+ 2
s’’ +2 s=0
T2
zs
la détermination de x sous la forme x = repose ensuite sur la résolution d’une équation du
l
premier ordre dont la fonction inconnue serait z’
s' 2ul
z ''+2 z ' = 2
s sT
Mais on observera sans difficulté que la réécriture des équations qui est ici introduite est le
résultat d’une lecture récurrente, elle procède de la volonté de déceler la présence d’une
méthode générale, associant systématiquement « équation complète » et « équation sans
second membre ». Par ailleurs, d’Alembert ne cherche pas à donner l’expression analytique
des solutions, à propos desquelles il recherche des constructions géométriques. Cette
circonstance donne un caractère peu systématique aux méthodes mises en oeuvres. D’autre
part, le texte du Traité de Dynamique met l’accent sur un autre aspect de la procédure
zs
utilisée : le « dédoublement » de l’inconnue x en x = introduit une marge de manœuvre qui
l

22
C’est une situation rencontrée plus haut, et qui peut se traiter en multipliant les deux membres de l’équation
2+ 2 2 2 + 2 2 B2
du second ordre par s’ pour obtenir : s’s’’ +2 s’s =0 ; l’intégration en s’ +2 s = 2 s’en
T2 T2 T
B2
déduit ( 2 est une constante d’intégration).
T
23 −2 s ' z '− sz '' 2u −2 ss ' z '− s2 z '' 2us
= − 2 donne , en multipliant par s les deux membres , = − 2 , et une
l T l T
2
s z' 2usdt
intégration conduit à : =∫
l T2

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 38 chapitre II

permet d’écrire une équation auxiliaire qui sera plus simple à résoudre. Le principe est voisin
de celui que l’on utilise dans la méthode de Cardan pour la résolution de l’équation algébrique
du 3ème degré : l’inconnue x y est « dédoublée » en une somme dont les deux termes u et v
constituent les nouvelles inconnues (x = u + v), la résolution est obtenue en imposant à u et v
la condition supplémentaire qui permettra de simplifier les calculs.

1.1.3. des systèmes différentiels linéaires obtenus pour un pendule « multiple »


D’Alembert traite encore de façon assez explicite le cas d’un pendule triple. Ses oscillations
dépendent d’un système de trois équations
2dt 2
(S) - ddx = (5 x – 2 y) .
T2
2dt 2
(T) - ddy = (3 y - 2 x - z) .
T2
2dt 2
(U) - ddz = (z – y) .
T2
Des indications sont données sur les étapes de la résolution. Une première utilisation de
coefficients indéterminés introduit une fonction u = αx + ν y + µ z. La détermination des
coefficients repose sur la résolution d’une équation algébrique de degré 3. Si l’on connaît une
racine de cette équation, les calculs peuvent se poursuivre. La fonction u est solution d’une
équation différentielle d’ordre 2. Cette fonction étant supposée connue, ou au moins
construite, le problème est ramené à un système de deux équations, sur lequel les méthodes
précédentes pourront être utilisées.
La généralisation se poursuit avec l’indication du système dont relèverait un pendule muni de
4 masses, puis d’un nombre n quelconque de masses.
Dans ce dernier cas, l’équation algébrique dont dépendent les coefficients α, ν, µ,… est de
degré n. D’Alembert ne se pose à aucun moment la question de la prise en compte simultanée
de plusieurs racines de cette équation. C’est pourtant là une démarche indispensable pour
obtenir la solution générale du système étudié. Par contre, il s’interroge sur l’existence d’au
moins une racine réelle. Dans le cas où n est impair, la réponse est immédiate. Pour n impair,
l’auteur parviendra à régression à l’ordre n – 1, à l’aide de considérations tirées de l’origine
physique du problème. Il faut enfin noter que c’est la question de la durée des oscillations qui
était posée dans l’énoncé du problème. Sur ce point, il n’y a pas de conclusion véritable. La
résolution des équations du mouvement reste d’ailleurs tributaire de constructions
géométriques.

Dans cette phase de généralisation, les calculs complets ne sont pas donnés, et on ne rencontre
plus d’équation linéaire à deux variables (c’est-à-dire à une fonction inconnue). C’est donc
uniquement dans le cas du pendule double que d’Alembert met en œuvre la méthode de
« dédoublement » évoquée ensuite dans la lettre à Lagrange de 1765.
Retenons que cette méthode est utilisée au cours d’une étape de calcul qui concerne des
systèmes différentiels linéaires. D’Alembert fait des observations assez générales sur les
systèmes ainsi rencontrés. Notamment, il met en œuvre des combinaisons linéaires qui
peuvent s’interpréter en terme de « diagonalisation ».
En 1754, il fera une référence explicite aux calculs présents dans le Traité de Dynamique.

1.2. les Recherches sur différents points importants du système du


monde [1754]
D’Alembert a publié en 1749 des Recherches sur la précession des équinoxes. Pendant la
décennie de 1740 et au début de la suivante, une partie de son activité est orientée vers la

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 39 chapitre II

Mécanique Céleste. Il partage cette préoccupation avec Clairaut et Euler, dans un climat
parfois passionnel. L’enjeu des travaux de cette période est rien moins que la validation ou la
remise en cause de la théorie newtonienne de la gravitation. Le sort de cette théorie est
évidemment lié à sa capacité à décrire et prévoir les phénomènes. Or, certaines indications
rapides données par Newton lui-même, ou encore les premiers calculs réalisés par ses
successeurs, ne coïncident pas avec les observations astronomiques. Il en est ainsi du
mouvement de l’apogée de la Lune. Les calculs conduisent d’abord à une vitesse moitié de la
vitesse observée. On pense à refaire les calculs en introduisant, dans la loi de l’attraction en
1/r2, un terme correctif. En 1749, Clairaut apporte le dénouement : ce n’était pas la loi de
Newton qui était responsable de cette distorsion, mais les approximations, trop lâches,
réalisées au cours des calculs. C’est dans ce contexte que d’Alembert a composé les
Recherches sur différents points importants du système du monde. Les deux premiers tomes
du Traité sont publiés en 1754, le troisième en 1756. L’œuvre porte sur le mouvement et la
forme de la Terre, deux types de question qui sont concernés par la mise à l’épreuve de la
théorie newtonienne. D’Alembert revient aussi longuement sur le mouvement de la Lune, en
particulier sur le problème des apogées.

1.2.1. le contexte général : la théorie de la Lune.


Si l’on considère un point matériel L en mouvement et soumis à l’action d’une force centrale
dirigée vers un point fixe T, on démontre sans peine que la trajectoire de L doit être plane. Si
la position du point L est définie par un système de coordonnées polaires (θ, r), le mouvement
obéit à la loi des aires, laquelle se traduit par l’existence d’une constante C telle que
r2 dθ = C dt. On démontre alors que l’accélération du point L s’écrit

C2  d 2  1 1 
− 2  2   + 
r  dθ r r

L
r

T θ

Si la force centrale est inversement proportionnelle au carré de la distance TL, la trajectoire


du point L sera une courbe intégrale d’une équation différentielle du type
C 2  d 2  1 1  k
− 2  2 +  = 2
r  dθ  r  r  r
ou encore
 d 2  1 
−C 2  2   + 1  = k.
 dθ  r  r 
Après un changement de fonction inconnue y = 1/r , le problème dépend donc de la résolution
d’une équation du second ordre à coefficients constants
y’’ + y = K

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 40 chapitre II

C’est la résolution de cette équation qui conduit à l’équation polaire d’une conique de foyer T.
On peut appliquer ce type de calcul à la détermination de la trajectoire de la Lune L autour de
la terre T. Mais Newton avait déjà constaté que le calcul reposant sur ce seul principe ne
conduisait pas à des résultats conformes aux observations. Il faut tenir compte d’autres forces
qui s’exercent aussi sur la Lune. En particulier, l’action du Soleil ne doit pas être négligée.

Avant de rapporter les travaux en ce domaine, d’Euler, Clairaut et d’Alembert, Montucla


énonce le problème dans toute sa généralité
trois corps, le soleil, la terre et la lune étant lancés dans l’espace avec des vitesses et
des directions données, ainsi que leurs masses, et s’attirant les uns les autre suivant une
loi donnée (on suppose ici celle de l’inverse du quarré de la vitesse), on demande la
courbe que l’un d’eux, par exemple la lune, décrit à l’entour de la terre » [1802, p. 66].
Mais, il en souligne la difficulté : présenté ainsi [le problème] éluderait toutes les ressources
de l’analyse et de la géométrie [Ibid.]. Aussi indique-t-il les limitations que l’on peut
observer pour étudier le problème particulier du mouvement de la Lune, et qui le rendent
moins difficile :
l’un des corps est d’une masse incomparablement plus grande que les deux autres, et à
peu près au repos […] sa distance aux deux autres est si grande qu’elle peut être
considérée comme la même à l’égard de chacun d’eux
enfin
l’orbite de la lune autour de la terre est fort approchante d’une ellipse, en sorte qu’il
s’agit seulement de déterminer les aberrations par rapport à cette orbite [ibid.]
Et Montucla termine cette présentation :
Le problème avec ces limitations, est encore assez difficile pour exiger les ressources
des analystes les plus profonds ; et même à peine ont-ils pu en donner une solution par
approximation [Ibid.]
Sans entrer dans les détails de la mise en équation et des approximations, on ne s’étonnera pas
que celles-ci conduisent à des équations différentielles d’un modèle voisin de l’équation
y’’ + y = K

π
L
ψ
r
l
T x
z

Ainsi d’Alembert étudie le mouvement de la projection l de la Lune sur le plan de l’Ecliptique


terrestre. Le point l est défini par des coordonnées dans lesquelles z est l’angle polaire et x le
rayon vecteur. Il pose u = 1/x , et il est ramené à une équation différentielle
π du
2 Ψ−
dz udz
ddu + udz 2 − × =0 [D’Alembert, 1754a, p. 16]
uugg 1 + 2 π dz
∫ u3 g 2 h 2
(la somme des forces exercées sur la Lune est représentée par ses deux composantes
perpendiculaires Ψ et π ; Ψ est la composante suivant TL ).

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 41 chapitre II

Soit K la valeur de u à l’instant t = 0, d’Alembert pose t = u - K et il se ramène ainsi à une


fonction inconnue qui prend des valeurs petites et qui se prêtera mieux aux calculs
π du
Ψ−
d’approximation. Ces derniers sont fondés sur le développement du terme udz en
π dz
1 + 2∫ 3 2 2
ug h
série trigonométrique. Au total, les calculs vont tourner autour de la résolution d’équations
différentielles de type
(E) ddt + N 2 t dz 2 + M dz 2 = 0
où N est une constante, M et t sont des fonctions de la variable z. Et l’auteur va être amené à
plusieurs reprises à indiquer des modes de résolution de ce type d’équations.

1.2.2. une méthode d’abaissement pour les équations du second ordre.


Dans un premier calcul [1754a, p 25-30], d’Alembert introduit la fonction auxiliaire y définie
par dt = y dz, la résolution de l’équation est alors ramenée à la résolution d’un système
différentiel
dt - y dz = 0
(S)
dy + N 2 t dz + M dz = 0
D’Alembert a recours à la méthode de « diagonalisation » que nous avons déjà vue à l’œuvre
dans le Traité de dynamique, où elle concernait un système d’ordre 2. L’introduction d’un
facteur v pour la première équation, puis l’addition membre à membre des relations ainsi
obtenues, conduit à l’équation différentielle

dt + vdy + dz (N2 v t – y) + Mvdz = 0.


−1
Le choix de N 2 v = -1/v, soit v = ± , conduit à prendre pour inconnues auxiliaires
N
−1 −1
x=t+ y et s = t- y.
N N
Ces fonctions sont alors respectivement solutions des équations 24

d  t  t  0   0 1
24
Le système (S) peut s’écrire à l’aide de matrices :   = A  +   où A =   . Cette
dz  y  y  − M  −N 2 0
 − N −1 0 
-
dernière matrice se diagonalise : A = PDP 1 avec D =  On peut prendre
 0 N −1
 −1 
1 
P-1 =  N . L’équation matricielle est donc :
 − −1 
1 
 N 
 −1 
 −1   − N −1 t + −1 y − M 
d  −1 t       t + y  N 
= −1
t
+ −1
0 d  N  = N 
  
P DP   P    −1 
, soit .
dz   y   y  − M dz  −1   −1 
t − y  N −1 t − y + M
 N    N  N 
Ce qui est bien la traduction du système (S *).

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 42 chapitre II

M −1 dz
dx + N −1 . x dz + =0
(S*) N
M −1 dz
ds − N −1 . s dz − =0
N
Ces équations du premier ordre à coefficients constants sont immédiatement intégrées, sans
explications ; la résolution repose sur l’utilisation du facteur intégrant e N −1 . Par exemple, G
représentant une constante arbitraire, x est donnée par la relation :

x e Nz −1
+
∫ M −1e Nz −1dz
+G = 0 [1754a, p. 25]
N
Finalement, à l’aide d’intégrales, la fonction t est exprimée en fonction de la variable z et des
valeurs initiales δ = t(0) et ε = t’(0). L’expression générale est donnée à l’aide des fonctions
e N z −1 et e− N z −1 [p. 27]. Dans le cas particulier où la fonction M est un cosinus
M = B cos(A+pz),
la solution peut être écrite sous la forme
B(cos. A+ pz)  cos.A + pz cos.A − pz 
(T) t = δ cosNz + ε sin Nz - + B  + .
N 2 − p2 2N  N − p N+ p 
Des corollaires étudient d’autres cas particuliers : la fonction M peut être une constante
[corollaire IV, p. 28] ou une fonction sinus Bsin (A+pz) [corollaire V, p. 29] ou une
combinaison linéaire de tels sinus et de cosinus

M = H + B sin.A + pz + C sin.D + qz + E cos.F + Rz + G sin.L + sz + P sin.Q + kz+ etc.


[cor. VI, p. 29-30].

Le chapitre se termine par une remarque. L’expression de M peut contenir un terme


Scos.A + Nz , faisant intervenir exactement le coefficient N présent dans le premier membre
de l’équation. Dans ce cas, la formule (T) ci-dessus est en défaut, car le choix de p = N annule
le dénominateur. Un retour sur le calcul d’intégration mené avec les exponentielles
imaginaires, permet alors à d’Alembert de prévoir que la solution devra faire intervenir des
termes proportionnels à la variable z. Cette particularité des équations
ddt + N 2 t dz 2 + S (cos.A + Nz) dz 2 = 0,
va constituer un obstacle important à la solution des problèmes de Mécanique Céleste. Nous
aurons l’occasion d’y revenir.

1.2.3. les mêmes questions traitées par « dédoublement »

Ces résultats généraux sont obtenus dès le début de la première partie des recherches sur
différents points importants du système du monde. Dans la seconde partie, d’Alembert les
utilise directement et il transforme l’expression de la solution t de l’équation (E), de façon à
ne plus être tributaire des exponentielles imaginaires. Il obtient
ε 1 1
(T*) t = δ cos z + sin z + cos N z ∫M sinNz dz - sin N z ∫M cosNz dz [p. 130]
N N N
( où δ = t(0) et ε = t’(0)).
La mise au point de cette dernière formulation occupe le début du chapitre VII, intitulé : Autre
manière de résoudre l’équation générale du problème des trois corps, avec quelques
conséquences qui en résultent [p. 129]. Ce titre est justifié par une digression qui va former
l’essentiel du chapitre. Elle n’apporte aucun élément nouveau pour la résolution des
problèmes de Mécanique Céleste, objets principaux du Traité. L’objectif est de saisir une
occasion d’exposer une méthode générale.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 43 chapitre II

D’Alembert revient en effet sur l’équation


(E) ddt + N 2 t dz2 + M dz2 = 0
et sur la solution qu’il vient de donner
On peut arriver à cette dernière expression de la valeur de t par une autre méthode que
j’ai donnée il y a longtemps. Cette méthode se trouve en grande partie dans mon Traité
de Dynamique imprimé en 1743, art. 101, et voici en quoi elle consiste.[p. 130]
Les calculs qui suivent sont alors décrits en termes très voisins de ceux qui avaient été utilisés
en 1743

Texte de 1754 (recherches...) Texte de 1743 (traité de dynamique)


On fera zs
t = sq, je fais x = , z et s étant deux variables
l
s et q étant deux indéterminées, dont on peut indéterminées et j’ai
par conséquent supposer l’une telle qu’on − zdds −2dzds− sddz
voudra, et on aura l
sddq + 2dsdq + qdds + N 2 sq dz2 + Mdz2 ( )
= 2+ 2 zs 22 dt 2 − 2udt2 .
l T T
2

=0.
Or à cause des deux indéterminées z et s, dont
Supposons maintenant l’une peut être tout ce que l’on voudra, on
peut supposer que les deux termes
2 2
sddq + sN q dz = 0 - zdds et 2(+ )
2 . zs.
2dt 2
T2
soient égaux ce qui donne
ce qui est permis puisqu’on peut prendre q
telle qu’on juge à propos, on aura B 2 dt 2 2s 2 dt 2
2
ddq + N 2 q dz2 = 0, 2
- ds = (2 + 2 ) 2
. [p. 101]
dq T T
et Ndz = -
1−qq
c’est-à-dire que q sera le sinus de l’angle Nz
[p. 130] tableau 1-II-a

Les membres de phrase que nous avons soulignés montrent bien que d’Alembert utilise, dans
les deux cas, la même méthode de « dédoublement » de la fonction inconnue. Les calculs qui
suivent n’ont pas tout à fait la même tonalité dans les deux traités : en 1743, l’équation sans
second membre donnait lieu à une intégrale première que d’Alembert exploitait en termes de
construction, cette fois la solution est donnée explicitement grâce à l’utilisation de la fonction
sinus.
Le calcul se poursuit, et d’Alembert finit par retrouver la formulation (T*) de la solution, telle
qu’il l’a déjà obtenue en transformant les exponentielles imaginaires [p. 131].

Enfin il souligne la portée plus générale de cette méthode de « dédoublement » de


l’inconnue . La même démarche s’appliquerait à l’équation différentielle linéaire
ddt - N 2 t dz2 + M dz2 = 0
2
dans laquelle N a le signe - . Des indications sont données, quoique l’équation […] ne soit
d’aucune utilité dans la recherche du mouvement des Planètes [p. 133]. En particulier,
l’auteur souligne que, cette fois, les deux méthodes présentées (abaissement à l’aide d’un
système que l’on diagonalise , ou « dédoublement ») peuvent être utilisées sans aucun recours
aux imaginaires.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 44 chapitre II

Puis un dernier type d’équation est envisagé rapidement


On trouvera aussi facilement par ces mêmes Méthodes l’intégrale de l’équation
ddt ± N 2 dz 2 + R dtdz + M dz 2 = 0 R étant un
coefficient constant quelconque [Ibid.].
Un premier mode de résolution consiste donc à introduire une fonction auxiliaire y, pour
obtenir le système
dt – ydz = 0
dy ± N t dz + R y dz + M dz = 0
2

La multiplication par ν de la seconde équation, puis la somme membre à membre conduisent


à l’équation
dt + νdy ± νN 2 t dz + (νR – 1) ydz + ν M dz = 0.
On pourra y mettre en évidence la fonction inconnue t + νy , pourvu que le coefficient ν
vérifie la relation
±ν N 2 ν R −1
=
1 ν
Le problème est alors bien ramené à celui d’une équation du premier ordre.
La méthode de « dédoublement » consisterait à poser t = sq, l’équation proposée devient
qdds + 2dsdq + sddq + R(qds + sdq) dz ± N 2 sq dz2 + M dz2 = 0
Il reste alors à résoudre successivement une équation linéaire « sans second membre » et une
équation du premier ordre par rapport à la fonction inconnue ds
dz
sddq + ± N 2 sq dz2 + Rsdq dz = 0
et
qdds + 2dsdq + Rqds dz + M dz2 = 0 :
deux équations qui s’intègrent aisément par les méthodes connues [p. 134].

1.3. récapitulation
La lecture du traité de dynamique et des recherches sur différents points importants du
système du monde fait apparaître des méthodes générales de résolution des équations linéaires
Ces méthodes se trouvent étroitement imbriquées dans la réalisation des calculs que nous
avons rencontrés.

1.3.1. la méthode de dédoublement


Il y a d’abord la méthode « de dédoublement ». D’un point de vue récurrent, elle peut être lue
comme un méthode de « variation de la constante » mettant en jeu une équation linéaire
« complète » et l’équation « sans second membre » qui lui est associée. Une fois résolue
l’équation sans second membre, l’équation initiale se trouve abaissée à l’ordre immédiatement
inférieur. Le procédé est appliqué à l’étude du pendule double, pour une équation du second
ordre de type
(E) ddt + N 2 t dz2 + M dz2 = 0
où N 2 est une constante positive, et où M est une fonction de la variable z. Il permet de
ramener la résolution à celle d’une équation
ddt + N 2 t dz2 = 0
suivie de l’intégration d’une équation du premier ordre.
Nous venons de voir que la même méthode permet d’étudier des équations telles que (E),
issues de la Mécanique Céleste. La préoccupation porte surtout sur le cas des fonctions M,
combinaisons linéaires de sinus ou cosinus.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie. 45 chapitre II

D’Alembert fait observer que la méthode peut-être étendue à d’autres équations du second
ordre à coefficients constants.

1.3.2. la diagonalisation des systèmes différentiels


Il y a ensuite une pratique concernant les systèmes différentiels linéaires. On la rencontre à
propos du pendule multiple.
. Pour un système homogène
(1) ddx = (ax + b y + cz) . dt 2
(2) ddy = (a’x + b’ y + c’z) . dt 2
(3) ddz = (a’’x + b’’ y + d’’z) . dt 2 ,
une combinaison à l’aide de coefficients λ, µ, ν, conduit à
dd(λ x + µ y + ν z) = [(λ a + µ a’ + ν a’’)x + (λ b + µ b’ + ν a’’)y + (λ c + µ c’ + ν c’’)z
Les coefficients sont choisis de façon que
λa + µ a'+ν a'' λb + µ b'+ν b'' λc + µ c'+ν c''
= = .
λ µ ν
la résolution de ce système algébrique d’ordre 3 dépend de la résolution d’une équation du
3ème degré en λ , par exemple. Un triplet (λ, µ, ν) étant ainsi obtenu, la fonction
µ
u = (λ x + µ y + ν z) est solution d’une équation homogène du second ordre que l’on sait
intégrer.
u − λx − µ y
Quand u est connue, le report de z = − dans les équations (1) et (2) fournit un
ν
système de deux équations où les fonctions inconnues sont x et y
(1’) ddx = (a1 x + b1 y) . dt 2 + M1 dt 2
(2’) ddy = (a2 x + b2 y) . dt 2 + M2 dt 2
Le procédé peut être répété sur ce système, il conduit à une équation du second ordre non
homogène présentant une seule fonction inconnue. La résolution peut-être terminée par la
méthode de dédoublement qui vient d’être citée.
Nous avons vu que les combinaisons linéaires d’équations peuvent s’interpréter, en termes
modernes, comme des procédés de diagonalisation.
Concernant l’équation algébrique du 3ème degré en λ , d’Alembert se préoccupe, dans le
µ
contexte physique, de la réalité des racines. Mais sa résolution tient compte d’une seule
racine. La question de la solution générale n’est pas reliée à l’utilisation de toutes les racines
de cette équation.
Le nom de d’Alembert restera associé à l’étude des systèmes différentiels linéaires. On en
retrouve la mention sous la plume de Condorcet dans son. mémoire sur les équations
différentielles [1773c, p. 205], puis dans le supplément de l’Encyclopédie [1777, article
linéaire, p. 750]. L’indication sera donnée aussi par Montucla [1802, p. 180], puis par Lacroix
[1814, p. 347].

1.3.3. abaissement d’une équation, par la « diagonalisation » d’un système


Enfin, l’abaissement d’une équation du second ordre peut être réalisé par le procédé de
« diagonalisation » que nous venons de voir. Le début du Traité de Dynamique en offre un
exemple. Soit une équation dans laquelle a est une constante et M une fonction de la
variable t
(4) ddx + a x . dt 2 + M dt 2 = 0 ,
Pour la résoudre, on peut utiliser la fonction auxiliaire y telle que dx = ydt et remplacer
l’équation (4) par le système

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 46 chapitre II

dx – ydt = 0
dy + a x . dt + M dt = 0 ,
Il existe alors deux valeurs opposées de la constante ν qui permettent d’obtenir, par une
combinaison linéaire, une équation
(5) d (x + ν y) + a ν (x + ν y) . dt + νM dt = 0 ,
dont la fonction inconnue est z = x + ν y. Ces valeurs peuvent s’écrire ν 1 = 1 et
−a
ν 2 = - 1 , les deux équations (5) qui leur correspondent sont des équations du premier
−a
ordre que l’on sait résoudre par quadrature. Leurs solutions respective s z1 et z2 dépendent
chacune d’une constante arbitraire, les solutions de (5) sont finalement obtenues à l’aide du
système algébrique formé par les deux intégrales premières
x + ν 1 y = z1
x + ν 2 y = z2 .
Cette méthode peut être utilisée avec une équation du second ordre
ddx + a dxdt + b x dt 2 + M dt 2 = 0,
où a et b sont des coefficients constants.
La méthode est donnée aussi dans les Réflexions sur la cause générales des vents, avec la
mention : je l’expose ici en peu de mots, parce qu’elle peut servir à l’avancement de l’Analyse
[1747, p. 143]. Et, dans les Recherches sur différents points importants du système du monde,
D’Alembert présente cet abaissement par diagonalisation, comme une méthode parallèle au
procédé de « dédoublement ».

1.3.4. l’équation linéaire du premier ordre


Les calculs que nous avons suivis montrent que l’équation linéaire du premier ordre est
traitée, sans explication particulière, au moyen d’un facteur intégrant, selon une pratique qui
semble donc communément établie au mo ment où d’Alembert l’utilise. En suivant
Condorcet, on peut faire remonter cette pratique à Jean Bernoulli, elle ne concerne pas
seulement les équations à coefficients constants

Jean Bernoulli a donné la solution générale de l’équation


Ady + Bydx + Cdx = 0,
A, B, C étant des fonctions de x : en effet, multipliant la proposée par X, et supposant
qu’elle devienne une différentielle exacte, on a
d.(AX) – BXdx = 0,
d’où


B dx − dA
X=e A A , et Xay + ∫CXdx = 0,
ce qui donne y en x par deux quadratures.[article linéaire, 1777]

Mais Montucla donne d’autres détails. Il indique que Jacques Bernoulli a proposé dès 1695 ce
cas d’équation différentielle
yXdx + byn X’dx – ady = 0,
dans laquelle X, X’, sont des fonctions différentes de x et de constantes, et a et b des
constantes[1802, p. 176]. Après avoir expliqué les contributions de Leibniz et de Jacques
Bernoulli à ce problème, Montucla écrit très précisément
Mais Jean Bernoulli est celui qui en a donné la solution la plus instructive et la plus
développée. […] Elle consiste d’abord à supposer l’une des variables y, égale à mz, (m
et z étant deux nouvelles indéterminées). Cette valeur étant substituée dans l’équation

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 47 chapitre II

proposée, il en résulte une nouvelle équation à quatre termes dont il égale deux, ce qui
lui est permis à cause de la double indétermination de m et de z. Il en résulte une valeur
de z en x, qui étant substituée dans les termes restants, opère la séparation des
indéterminées, et donne une valeur de m en x ; or l’on avait fait y = mz. Conséquemment
ce procédé donne la valeur de y, égale au produit des deux fonctions de x, trouvées pour
m et z. [p. 176] 24

Limitée, il est vrai, à l’équation du premier ordre, c’est donc bien la méthode « de
dédoublement » qui était ainsi utilisée par Jean Bernoulli. Traitant des problèmes de
Dynamique ou de Mécanique Céleste, d’Alembert fait usage de cette méthode pour des
équations du second ordre à coefficients constants. C’est dans la lettre de 1765 qu’il l’érige en
moyen systématique permettant de traiter des équations linéaires d’ordre quelconque et dont
les coefficients peuvent être variables.
Le cas échéant, il montre qu’il dispose de plusieurs méthodes pour résoudre un même type
d’équations. En particulier, les procédés utilisés pour les systèmes linéaires lui fournissent une
méthode d’abaissement pour le cas d’une équation unique.

2. les travaux d’Euler


Euler a consacré deux importants mémoires aux équations linéaires à coefficients constants.
On retrouve dans les Institutiones Calculi Integralis, le contenu de ces mémoires. Ce traité
prend en compte d’autres types d’équations linéaires. Mais on trouve aussi de telles équations
dans les travaux très nombreux qu’Euler a consacrés à la Mécanique et à l’Astronomie. Nous
en verrons un exemple avec le mémoire sur le flux et le reflux de la mer[ 1752], qui a obtenu
le prix de l’Académie des Sciences en 1740.

2.1. la résolution de l’équation linéaire homogène et à coefficients


constants
En 1743, Euler publie le mémoire de integratione aequationum differentialium altiorum
graduum. L’objet du mémoire est l’étude de l’équation linéaire
Bdy Cddy Dd 3 y Nd n y
(1) 0 = Ay + + + +…. +
dx dx2 dx3 dx n
Dans une première partie, les coefficients A, B, ..sont considérés comme des fonctions de la
variable x. Cette partie va concerner la forme de la solution générale et le problème des
constantes arbitraires. Le nombre de ces constantes est justifié de façon sommaire et
indépendamment du caractère linéaire des équations : la solution générale est obtenue après n
intégrations successives, chaque intégration fait intervenir une nouvelle constante arbitraire, le
nombre de ces constantes est donc égal à n. Une clause de prudence est introduite : il faut bien
prendre garde à ne pas être trompé par le nombre des diverses lettres, ni à les regarder
comme des quantités différentes qui seraient déterminées les unes par les autres [Opera
Omnia (I), 22, p. 110].
D’autre part, si l’on connaît des solutions p, q, r… , on en déduit immédiatement une solution
qui s’exprime à l’aide des constantes arbitraires α, β, γ, …
(2) y=αp+ β q +γr+…
la connaissances de valeurs particulières p, q, r en nombre n conduit donc à la solution
générale de l’équation proposée. Aucune observation n’est faite sur les caractères requis du
système de solutions p, q, r….utilisé.

24
Mais à la page 184, Montucla attribue la même méthode à Jacques Bernoulli.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 48 chapitre II

Le reste du mémoire ne va concerner que les équations à coefficients constants. Cherchant des
solutions sous la forme epx , Euler montre que le nombre p doit être racine de l’équation
algébrique
(3) 0 = A + B z + C z 2 + D z 3 + …+ N z n
La résolution de l’équation différentielle proposée est donc terminée si l’équation algébrique
obtenue admet n racines réelles distinctes. Pour le cas des racines réelles multiples, puis des
racines imaginaires, l’adaptation de la méthode mérite d’être suivie avec attention
À l’un et l’autre inconvénient nous apporterons un remède si nous considérons plus
attentivement le lien entre l’équation différentielle proposée [(1)] et l’équation
algébrique formée [(3)]. [p. 115]
qx
p
Quand y = e est solution de l’équation différentielle (1), cette solution provient de la
présence du facteur q – pz dans le second membre de (3). À ce facteur, on peut donc associer
l’équation différentielle
pdy
qy - = 0,
dx
qx
p
laquelle fournit précisément la solution y = e . Euler étend cette propriété aux facteurs
présents dans le second membre de (3) et dont le degré serait supérieur à un. En effet
De là on comprend que si on a un diviseur quelconque de l’équation algébrique,
supposons p + qz + rzz, alors l’équation naissant de ce diviseur
qdy rddy
py + + =0
dx dx2
donnera une valeur pour y qui, de même, satisfera à l’équation différentielle proposée.
Et donc, à partir de là, nous pourrons supprimer la difficulté qui a lieu si l’équation a
deux facteurs égaux ou davantage. Soit donc (p – qz)2 un diviseur de l’équation
algébrique et de celui-ci développé, résultera l’équation algébrique
2pqdy qqddy
ppy - + = 0 [p. 116]
dx dx2
qx
p
La résolution complète de cette dernière équation prend appui sur la solution particulière e ,
déjà connue
qx
p
Posons y = e u
et la substitution étant faite nous aurons ddu = 0, et à partir de là u = α + βx. C’est
pourquoi du facteur carré (p – qz)2 naît la valeur suivante
qx

y = e (α + βx) [Ibid.]
p

L’expression obtenue fait intervenir deux constantes arbitraires ; complétant les solutions
obtenues à l’aide des seules racines simples de (3), elle viendra fournir finalement la solution
générale de l’équation (1) proposée.
Le raisonnement sera répété pour un facteur (p – qz)3 , celui-ci sera associé à l’équation
3ppqdy 3pqqddy q 3 d 3 y
0 = p3 y - + − ,
dx dx 2 dx3
qx

laquelle sera résolue en posant y = e u, ce qui donnera d3 u = 0. Les résultats sont donnés
p

ensuite plus rapidement pour le cas d’une racine p/q d’ordre quatre, puis pour une racine
d’ordre k.
La même démarche va présider au traitement des racines imaginaires. Une telle racine se
trouve nécessairement associée à sa conjuguée, et cela justifie la présence dans l’équation

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 49 chapitre II

algébrique d’un facteur p - qz + rzz. Son expression est transformée par l’introduction de
p
l’angle ϕ défini par q = 2 p r.cos.A.ϕ puis du coefficient f = . Euler l’écrira finalement
r
p - qz + rzz = ff –2f.cosA.ϕ + rzz. [p. 119]
De ce facteur, naît l’équation différentielle
2f dy rddy
0 = ffy - cosA.ϕ + .
dx dx2
Euler résout cette équation en utilisant un moyen proche de celui qui a été employé pour le
cas des racines multiples. Les solutions seront en effet recherchées sous la forme
p
xcos A .ϕ
y= e r u
La fonction u est alors solution d’une équation
p
ddu + u (sinA.ϕ)2 dx 2 = 0,
r
ce qui permet d’exprimer la forme générale de la fonction u, puis l’expression de y qui s’en
déduit et qui est écrite sous la forme
(4) y = e f x cos A.ϕ (αcosA. fx sinA.ϕ + β sinA. fx sinA.ϕ ) [p. 120]

Le cas des racines imaginaires multiples est aussi étudié en suivant les mêmes principes.

Retenons deux aspects importants de ce mémoire.


1. Dans le cas particulier des racines réelles multiples, la recherche des solutions (sous la
qx
p
forme y = e u) est menée suivant un calcul exactement équivalent à celui qui relèverait d’un
procédé de « variation de la constante ».

2. Euler tire partie de l’analogie entre les équations différentielles à coefficients constants et
les équations algébriques. L’équation algébrique se « compose » d’équations de degrés
inférieurs, on peut prévoir que l’équation différentielle se « compose » aussi des diverses
équations différentielles correspondantes.
En 1753, paraissent deux mémoires qui font référence à ces résultats.
Dans methodus aequationes differentiales altiorum graduum integrandi ulterius promota,
[1753a] Euler va étudier les équations linéaires à coefficients constants complètes
Bdy Cddy Dd 3 y Ed 4 y
X = Ay + + + 3
+ + etc
dx dx2 dx dx 4
Avant d’en commencer l’étude, il rappelle ce qu’il a déjà obtenu en 1743 et qui concernait
l’équation homogène. Les résultats sont consignés dans un tableau où sont mis en regard les
différents types de facteurs de l’équation algébrique et les parties de l’intégrale qui leur
correspondent, selon la disposition suivante

Factores Partes Integralis

z–k aekx
(z – k)2 (α + βx) aekx

(z – k )3 (α + βx + γx 2 ) aekx

(z – k)4 (α + βx + γx 2 + δx 3 ) aekx
etc. etc.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 50 chapitre II

zz – 2kz cos.Φ + kk α ekxcos.Φ sin.kx sinΦ + A aekxcos.Φ cos.kx sinΦ


(zz – 2kz cos.Φ + kk )2 (α + βx ) ekxcos.Φ sin.kx sinΦ + (A + B x) aekxcos.Φ cos.kx sinΦ
(zz – 2kz cos.Φ + kk )3 (α+βx + γx2 )ekxcos.Φ
sin.kx sinΦ + (A + Bx + Cx 2 )aekxcos. Φ cos.kx sinΦ
(zz – 2kz cos.Φ + kk )4 (α+βx + γx2 + δx2 )ekxcos.Φsin.kx sinΦ
+ (A + Bx + Cx2 )ekxcos.Φ cos.kx sinΦ

[1753a, p. 192]
Nous examinerons ensuite les méthodes qui sont alors mises en oeuvre pour l’équation
complète.
Mais en 1753, Euler publie aussi de serierum determinatione seu nova methodus inveniendi
terminos generales serierum [1753b]. Les résultats concernant les équations homogènes vont
être sollicités pour la résolution d’une équation d’ordre infini.

2.2. une équation différentielle « infinie »


La terminologie utilisée dans le titre concerne ce que nous appellerions aujourd’hui des suites.
Le premier problème conduira en réalité à la caractérisation des fonctions périodiques.
Lorsque la variable x subit un accroissement égal à 1, la valeur y de la fonction devient y’, et
la formule de Taylor s’écrit
dy ddy d 3y d4y
y'= y + + + + + etc.
1. dx 12 . . dx 2 12. .3. dx 3 12 . .3.4. dx 4
Si l’on suppose que la fonction y est périodique, de période 1, on aura y’ = y, et donc
dy ddy d 3y d 4y
0= + + + + etc.
1. dx 1.2.dx 2 1.2.3. dx 3 1.2.3.4.dx 4
Les fonctions 1-périodiques sont donc solutions de cette équation différentielle « de degré
infini ». Euler évoque alors les méthodes qu’il a utilisées pour résoudre des équations linéaires
à coefficients constants [De Integratione aequationum differentialum altiorum graduum,
1743]. Adaptées à cette équation, elles conduisent à une équation algébrique « de degré
infini »
dy 2 ddy
En posant z à la place de , z à la place de 2
, et d’une manière générale, zn à la
dx dx
n
d y
place de , on forme donc l’équation algébrique
dx n
z z2 z3 z4
0= + + + + etc.,[1753b, Opera Omnia (I) 14, p. 471]
1 1 ⋅ 2 1 ⋅ 2 ⋅ 3 1⋅ 2 ⋅ 3 ⋅ 4
Interprétée à l’aide de la fonction exponentielle, l’équation s’écrit aussi
0 = ez − 1.
Comme dans le mémoire de 1743, la résolution passe par une factorisation du second membre
de l’équation algébrique obtenue
Il faut rechercher maintenant toutes les racines de cette équation, dont le nombre est
infini, soit assigner tous les facteurs de la formule ez − 1.[Ibid.]
Le calcul va être mené à bien en utilisant un nombre n infini. On a alors
n

ez =  1+ 
z
 n
et le problème est donc de factoriser le « polynôme »

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 51 chapitre II

P(z) =  1+  - 1.
z
 n
Suivant des techniques de calcul qu’il a déjà utilisées dans l’Introductio in analysin
infinitorum 25 , Euler recherche les solutions zk de l’équation
P(z) = 0 .
Une décomposition de P(z) en facteurs linéaires (z – zk) s’en déduit. Mais les racines zk sont
conjuguées deux à deux. En regroupant les facteurs (z – zk) et (z - z k ), il met en évidence des
facteurs du second degré à coefficients réels
4kkππ + 4kkππz + zz.
n
Il suffit de les identifier avec les facteurs du « polynôme caractéristique », qui ont été mis en
évidence dans le mémoire De integratione aequationum differentialium altiorum
graduum.[1743], et qui s’écrivent sous la forme
ff - 2fzcos.φ + zz.
On aura donc

f = 2kπ et cos.φ = -
n
Euler applique alors très précisément les résultats obtenus en 1743 ; la partie de l’intégrale
afférente à ce facteur est donc donnée par
− 2 kkππ −2 kkππ
αe n sin( 2kπxsin ϕ) +ℑe n cos(2kπxsin ϕ) .
Mais, ici, comme n = ∞, on prendra cos.φ = 0, et sin φ = 1, le terme se réduira donc à
αsin.2kπx + ℑcos.2kπx. [p. 473]
Cependant, dans l’expression de e − 1 en produit, le premier facteur obtenu est z. Dans la
z

solution générale de l’équation différentielle, ce facteur justifie la présence d’une constante C.


La prise en compte de tous les facteurs amène finalement à écrire la fonction y à l’aide d’une
série
y = C + α sin.2πx + ℑ cos.2πx
+ β sin.4πx + B cos.4πx
+ γ sin.6πx + C cos.6πx + etc.
mais cette constante C doit être telle que pour x = 0, on ait y = 1. Euler écrit finalement
y = 1 + α sin.2πx + ℑ (cos.2πx - 1)
+ β sin.4πx + B (cos.4πx - 1)
+ γ sin.6πx + C (cos.6πx - 1) + etc. [Ibid.]
L’équation aux différences finies yx = yx + 1 se trouve ainsi résolue par le biais d’une équation
différentielle linéaire homogène d’ordre infini.

2.3. l’équation linéaire à coefficients constants « complète »


Mais, dans l’autre mémoire publié en 1753, Euler considère une équation d’ordre fini et qui
n’est plus nécessairement homogène. Elle s’écrit
Bdy Cddy Dd 3 y Ed 4 y
(5) X = Ay + + + + + etc. [1753a, p. 192]
dx dx2 dx3 dx 4
Il considère d’abord le cas où la fonction X est un polynôme en x. L’équation complète admet
alors une solution particulière sous la forme d’un polynôme qu’on peut déterminer facilement
par une méthode de coefficients indéterminés.

25
Voir [Euler 1748, p. 116]

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 52 chapitre II

Puis la résolution concerne le cas général, où X n’est pas nécessairement un polynôme. Elle
repose sur la recherche d’un facteur intégrant exprimé par une fonction exponentielle. Elle est
mise en œuvre sur des équations d’ordre croissant. Pour l’équation
Bdy
(6) X = Ay +
dx
Il s’agit de déterminer α pour que l’expression
(7) eαxX dx = A eαxydx + B eαxdy
soit une différentielle. Le dernier terme relève de la différentielle de B eαxy, laquelle s’écrit
(8) d(B eαxy) = αB eαx y dx + B eαxdy
La comparaison des expressions obtenues en (7) et en (8) amène ainsi à choisir
α= A
B
L’intégration de la relation (7) conduit alors à
∫eαxX dx = B eαx y
et
y = α e-αx ∫eαxX dx [p. 194]
A
Pour l’équation du second ordre
Bdy Cddy
(9) X = Ay + + ,
dx dx2
il s’agira d’abord de déterminer α pour que l’intégrale des deux membres de l’équation
Bdy Cddy
(10) eαxXdx = eαx (Ay + + )dx
dx dx2
puisse s’interpréter sous la forme

B'dy
(11) ∫eαxX dx = eαx(A’y + ).
dx
Or la différentiation de cette relation (11) conduit à
B'ddy
(12) eαxX dx = eαx (αA’ y dx + A’dy + + αB’ dy )
dx
Finalement, l’identification de (12) et de (10) impose les relations suivantes
(13) B’ = C, (14) A’ + αB’ = B, (15) αA’ = A
Compte tenu de (13), la relation (14) permet d’écrire A’ à l’aide de α , de B et de C
A’ = B - αC ,
Le report de cette valeur dans (15) montre que α doit être racine de l’équation du second
degré
(16) A - αB + α 2 C = 0.
Pour une valeur de α ainsi choisie, l’équation du second ordre (10) est ramenée à l’équation
du premier ordre (11). Cette dernière équation peut aussi s’écrire
e- αx dx ∫eαxX dx = A’ ydx + B’ y.
Il suffit alors de lui appliquer les calculs réalisés précédemment sur l’équation (6), et de
chercher un nombre β qui permette d’exprimer comme une différentielle, l’expression
e(β - α)x dx ∫eαxX dx = A’ eβx ydx + B’ eβx y.
On trouve
B −α C
β = A' = .
B' C
Les deux nombres successivement obtenus sont liés par la relation

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 53 chapitre II

α +β = B .
C
Ce sont donc les deux racines de l’équation algébrique (16). Finalement, à l’aide de ces deux
racines, la solution de l’équation du second ordre (9) est donnée par la relation qu’Euler écrit
∫ e(α - β)x dx ∫eαxX dx = B’ eβx y = C eβx y.
Il faut comprendre que le premier membre contient deux intégrations successives que l’on
peut écrire de façon moins ambiguë
∫ (e(α - β)x ∫eαxX dx )dx.
Une intégration par parties permet d’obtenir une expression symétrique
−α x −β x
Cy= e ∫eαxX dx + e ∫eβxX dx [p. 195]
β −α α −β
D’autre part, Euler considère le polynôme obtenu à partir de l’équation différentielle en
dy 2 d 2y
posant 1 pour y, z pour , z pour [p. 196]
dx dx 2
P = A + Bz + Czz. [p. 196]
Sa factorisation met en jeu les nombres α et β
P = C (z + α ) (z + β ).
De même, Euler va considérer l’équation d’ordre n
Bdy Cddy Dd 3 y ? d ny
(17) X = Ay + + + 3
+....+ [p. 192]
dx dx 2 dx dx n
et lui associer le polynôme
(18) P = A + Bz + Czz + ….+ ∆zn = ∆(z + α ) (z + β ) (z + γ ) (z + δ )…
Il introduit le multiplicateur eα x dx
Bdy Cddy Dd 3y Nd n y
(19) eα x Xdx = eα x dx ( A y + + + + ...+ )
dx dx 2 dx 3 dx n
Il s’agira de déterminer les coefficients A’, B’…pour que les deux membres de (19) soient
intégrables sous la forme
A'dy B'ddy ∆d n y
eα x ( + + ...+ )
dx dx2 dx n
la différentiation de ce produit donne
B 'dy C 'ddy ∆d n −1 y A'dy B'ddy ∆d n y
α eα x (A’ y + + + ...+ )dx + e αx
dx ( + + ...+ ).
dx dx2 dxn −1 dx dx2 dx n
L’identification avec le second membre de l’équation (19) conduit aux égalités
αA’ = A ; αB’ + A’ = B ; αC’ + B’ = C ; ...... αD’ + C’ = N
Les coefficients A’, B’, C’, D’ sont alors interprétés comme les coefficients du polynôme P’
relié à P par la relation P = (z + α) P’.
P’ se factorisera donc sous la forme
P’ = ∆ (z + β )( (z + γ ) (z + δ )…
Le procédé a donc permis l’abaissement de l’équation (18), réduite à l’équation
A'dy B'ddy ∆d n−1 y
e −α x ∫ eα x Xdx = ( + 2
+...+ n−1 ).
dx dx dx
Cette équation est associée au polynôme
P’ = ∆ (z + β )(z + γ ) (z + δ )… = A’ + B’z + C’zz + ….+ ∆zn - 1
L’étape suivante conduira à l’équation écrite avec les notations d’Euler
∆d n −2 y
(20) ∫ e(α - β)x dx ∫eαxX dx = A''dy + B''ddy + ... + .
dx dx 2 dxn −2
Cette équation sera associée au polynôme de degré n - 2

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 54 chapitre II

P’’ = ∆ (z + γ ) (z + δ )… = A’’ + B’’z + C’’zz + ….+ ∆zn - 2


Quant au premier membre de (20), une intégration par parties permet d’en transformer
l’expression, pour obtenir la forme de l’équation du second ordre qui sera finalement prise en
compte
e −α x ∫eαxX dx + e −β x ∫eβxX dx = A''dy + B''ddy +...+ ∆d n −2 y
β −α α −β dx dx 2 dxn −2
Au rang suivant, on obtiendra l’équation
e− α x ∫eαxX dx + e−β x ∫eβxX dx + e−γ x
(α −γ )(β −γ ) ∫e X dx
γx
( β −α )(γ −α ) (α −β )(γ − β )
A'''dy B'''ddy ∆d n − 3 y
= + +... + .
dx dx 2 dx n− 3
L’itération du procédé permettra de ramener progressivement le problème à celui de la
résolution d’une équation d’ordre un. Pour exprimer le résultat définitif, Euler introduit des
notations spéciales pour les produits
A1 = ∆ (β - α) (γ - α) (δ- α) (ε - α) etc.
B1 = ∆ (α - β ) (γ - β ) (δ - β ) (ε - β ) etc.
C1 = ∆ (α - γ ) (β - γ ) (δ - γ ) (ε - γ ) etc.
D1 = ∆ (α - δ ) (β - δ ) (γ - δ ) (ε - δ) etc.
………………………………………
Dans le cas où le polynôme P a n racines distinctes, la solution s’écrit
−α x −β x −γ x
(21) y= e ∫eαxX dx + e ∫eβxX dx + e ∫eγxX dx + etc.
A1 B1 C1
L’auteur note que les dénominateurs font intervenir des valeurs du polynôme dP . Á l’aide du
dz
produit présent dans les égalités (18), il obtient en effet par différentiation
dP = ∆(z + β )((z + γ ) (z + δ )…+ ∆(z +α ) d. ∆ (z + β )(z + γ ) (z + δ )…+ etc. [p. 200]
dz dz
Et par suite, avec des notations actuelles
A1 = dP
dz z = −α
La forme développée du coefficient A1 … peut alors s’en déduire
A1 = B – 2Cα + 3Dα2 - 4E α 3 + ....± n∆zn - 1
Puis Euler change la signification des lettres α, β, γ, … : chacune est changée en son opposée,
ces lettres vont donc représenter exactement les racines du polynôme P, lequel se factorise
donc désormais en
P = ∆(z - α ) (z - β ) (z - γ ) (z - δ )…
Les quantités telles que A1 deviennent
A1 = dP .
dz z = α
Et la solution s’écrit sous une forme à peine modifiée
αx βx γx
(22) y = e ∫e-αxX dx + e ∫e-βxX dx + e ∫e-γxX dx + etc.
A1 B1 C1
Le cas où α est une racine double du polynôme P met en défaut cette formule. La question est
traitée en introduisant une quantité évanouissante ω, pour écrire β = α + ω [p. 201]. Les
exponentielles dans lesquelles figure la racine β, vont être transformées
(23) eβx = eαx(1 + ω x) e-βx = eαx(1 - ω x)

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 55 chapitre II

La partie de l’intégrale concernée par α et β était constituée des deux premiers termes de
l’expression (22), sa nouvelle expression sera
e −α x ∫ dx ∫e-αxX dx ,
A1'
le coefficient A1' est donné par

A1' = ddP2 .
2dz z =α

Le cas d’une racine triple est obtenu en introduisant deux quantités évanouissantes ω et Φ,
grâce auxquelles on va pouvoir exprimer les racines β et γ
β =α + ω et γ = α + Φ.
L’écriture de la fonctions eβ x telle qu’elle a été faite en (23) ne suffira plus ; il faudra cette
fois introduire un terme du second ordre, de même pour eγ x . La partie de l’intégrale
correspondant à cette racine triple fera intervenir un coefficient A1'' = d P3
3
. Euler ne
3dz z =α
donne pas les calculs pour des racines multiples d’ordre supérieur à 3, mais les résultats
obtenus se prêtent sans difficulté à une généralisation, et dans la conc lusion du mémoire Euler
pourra donner aussi l’expression de la solution pour le cas d’une racine d’ordre 4. Enfin le cas
des racines imaginaires est traité ; en regroupant les parties de l’intégrale qui correspondent à
deux racines conjuguées, l’auteur parvient à une expression qui ne fait plus apparaître
d’imaginaire.

2.4. les institutiones calculi integralis


Les trois volumes des institutiones calculi integralis ont été publiés respectivement en 1768,
1769 et 1770. Le manuscrit était prêt depuis plusieurs années mais la publication avait été
retardée. Les difficultés paraissent notamment liées au départ d’Euler, en 1766, de Berlin pour
Saint Petersbourg.
Les équations linéaires à coefficients constants et d’ordre quelconque sont présentes dans le
traité. Le deuxième volume contient une étude des équations homogènes à coefficients
constants (deuxième partie, deuxième section, chapitre II), elle reprend les méthodes du
mémoire fondamental paru en 1743. Le chapitre suivant traite les équations complètes à
coefficients constants. Les méthodes ne diffèrent pas de celles qui ont été utilisées dans le
mémoire de 1753. Il faudra cependant signaler quelques aspects nouveaux.
Les équations du premier et du second ordre apparaissent dans des rubriques diverses, où elles
sont traitées de façon spécifique.

2.4.1. les équations du premier et du second ordre


Dans un chapitre consacré aux méthodes de séparation des variables, Euler passe en revue les
cas où l’on peut réaliser cette séparation. L’un des exemples exposés concerne l’équation
différentielle :
(24) dy + Pydx = Qdx
où P et Q sont des fonctions de x.
La résolution est introduite en ces termes :
Cherchons une fonction de x, soit X, de sorte que, en faisant la substitution y= Xu
l’équation s’avère séparable. Alors il vient
Xdu + udX + PXudx = Qdx

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 56 chapitre II

Il est manifeste que l’équation permet la séparation si dX + PXdx = 0 [...]»26


La solution est obtenue au moyen de deux quadratures. Elle est appliquée à des exemples
particuliers d’équation (24). Puis, par le recours à la fonction z = 1n , elle sert à résoudre
y
l’équation
dy + Pydx = Qyn + 1 dx.
Plus loin, l’équation du premier ordre à coefficients variables apparaît à nouveau dans le
chapitre consacré à la résolution au moyen d’un facteur intégrant [1768, p. 295].
La première section du deuxième volume réunit 12 chapitres entièrement consacrés aux
équations du second ordre.
C’est ainsi qu’Euler considère l’équation
(25) ddy + Pdydx + Qydx2 = Xdx 2 ,
dans laquelle P, Q et X sont des fonctions de la variable x.
Il introduit alors à la place de y deux nouvelles inconnues, en posant y = uv [p. 82]. La
substitution dans l’équation (25) conduit à l’équation
uddv + 2dudv + vddu + Pudxdv + Pvdxdu + Quvdx 2 = Xdx2 .
Il s’agit alors de déterminer v de façon à détruire les termes qui affectent la lettre u [Ibid.], en
posant
ddv + Pdvdx + Qvdx 2 = 0.
Nous sommes donc très exactement en présence de la méthode de «dédoublement », que
nous avons déjà rencontrée.
Un chapitre concerne les résolutions à l’aide d’un facteur intégrant. Euler considère d’abord
l’équation à coefficients constants
ddy + Adydx + Bydx 2 = Xdx 2 .
Selon des modalités un peu différentes de celles qu’il utilise, ailleurs, pour une équation
d’ordre quelconque, il met en évidence l’existence de facteurs intégrants de forme
exponentielle [p. 95].
Immédiatement après, Euler considère l’équation dont les coefficients sont variables
(26) ddy + Pdydx + Qydx2 = Xdx 2 .
Il recherche un facteur V qui rende intégrable l’équation
Vddy + VPdydx + VQydx 2 = VXdx 2 .
Il trouve finalement que V doit vérifier l’équation
ddV – PdVdx + Vdx(Qdx – dP) =0 [p. 97]
Notons que cette dernière équation peut aussi s’écrire
ddV – d (PV) dx + VQdx2 =0.
Elle est précisément l’adjointe de l’équation initiale (26). Suivant une méthode présente à de
nombreuses reprises dans les Institutiones, Euler ramène cette dernière équation à une
équation du premier ordre. En posant V = e ∫ , il obtient en effet
v dx

(27) dv + vvdx – Pvdx + Qdx – dP = 0


Dans le Supplément de l’encyclopédie [article tangente, p. 102], cette méthode est décrite et,
l’écriture de la transformée (27), est suivie de l’indication qu’elle s’intègre dans quelques cas.

Les méthodes de dédoublement et de recherche de facteurs intégrants ne sont pas exposées


pour les équations linéaires à coefficients variables et d’ordre supérieur à 2. Dans le cas des
coefficients constants, on retrouve, à quelques nuances près les calculs que nous avons

26
« Quaeratur eiusmodo functio ipsius x, quae sit X, ut facta substitutione y = Xu aequatio prodeat
separabilis. Tum autem oritur
.....................
Quam aequationem separationem admittere evidens est, si fuerit ... » [Euler, Opera omnia, (I) 11, p. 267]

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 57 chapitre II

présentés et qui figuraient dans les mémoires publiés en 1743 et 1753. La factorisation du
« polynôme caractéristique » était déjà exploitée avec minutie dans les mémoires précédents.
Elle fait l’objet ici d’une remarque de caractère plus général.

2.4.2. la factorisation du « polynôme caractéristique » et la dissociation de


l’équation différentielle en deux équations d’ordre inférieur
L’équation initiale est écrite sous la forme
dy ddy d 3y d m +n y
(28) X = Ay + B + C 2 + D 3 +....+ N m + n
dx dx dx dx
Le polynôme caractéristique est supposé factorisé en deux polynômes de degrés respectifs m
et n.
P =QR,
2 n
Q = A y + B z + C z + …+ N z R = a y + b z + c z2 + …+ n zm .
Euler observe que la résolution de (28) peut être décomposée en deux étapes. On peut d’abord
chercher une fonction v solution de l’équation
d nv
(29) X = A v + B dv + C ddv2 + …+ N
dx dx dx n
Pour une telle fonction v, on considère les fonctions y solutions de l’équation différentielle
dy ddy dm y
(30) v=a y+b +c + …+ n
dx dx2 dx m
On substitue dans l’équation (29), l’expression de v donnée par (30). Euler est ainsi conduit à
une égalité qu’il écrit en disposant en colonne les coefficients des dérivées d’un même ordre
d 3v
(31) X = A a v + A b dv + A c ddv2 + A d + etc.
dx dx dx 3
+B a + B b + B c
C a + C b
D a [p. 353]
Il suffit d’invoquer l’égalité P = QR pour justifier, entre les coefficients des équations (28),
(29) et (30), les relations
A=A a , B = A b + B a , C = A c + Bb + C a , etc.
Finalement l’équation (31) n’est autre que l’équation initiale (28). Et celle-ci se trouvera donc
bien résolue par la prise en compte successive des équations (29) et de (30).

Le dernier chapitre du second volume des Institutiones differentialis traite « l’équation


d’Euler »
B xdy C x 2 ddy D x3d 3 y E x4 d 4 y
X = Ay + + + + + etc. [p. 381-413]
dx dx 2 dx3 dx 4
Les calculs s’effectuent dans un mode très voisin de celui qui convenait aux équations à
coefficients constants.
Il faut d’autre part signaler que ce second volume donne les solutions de plusieurs équations
« d’ordre infini »
dy ddy d3 y d 4y
X=y + + + 3
+ + etc
dx dx 2 dx dx 4
dy ddy d 3y d4y
X=y + + + + + etc
dx 1.2.dx 2 1.2.3 dx3 1.2.3.4 dx 4
Il prolonge donc les travaux sur l’équation homogène contenus dans le mémoire De serierum
determinatione seu nova methodus inveniendi terminos generales serierum [1753b].

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 58 chapitre II

Après ces travaux spécifiquement consacrés aux équations linéaires, nous allons voir un
exemple d’utilisation de ce type d’équation au sein d’un mémoire qui présente un autre
objectif. Un passage de ce mémoire témoigne d’une familiarité avec ce que nous appelons la
méthode de variation de la constante.

2.5. dans le mémoire Inquisitio in causam fluxus ac refluxus Maris


[1752/1740] : des méthodes qui me sont familières
Dans le cours de ce mémoire, Euler est amené à considérer l’équation
sdz 2 dz 2 (1 − 3 cos.2 z )
2dds + + =0 [p. 301]
g 2h
Il indique d’abord la difficulté propre à ce type d’équation
[…] puisque cette équation est différentielle d’ordre 2, et contient en outre l’arc et le
sinus de l’arc, on comprend facilement que son intégration est moins évidente.27
Puis il explique très clairement qu’il va d’abord résoudre l’équation homogène
cependant comme la deuxième variable s ne se présente nulle part avec plus d’une
dimension, cela pourra être traité par des méthodes qui me sont familières. Or j’ai
l’habitude, chaque fois que je rencontre des choses de ce genre, d’abord de rejeter les
termes dans lesquels l’autre variable n’est pas contenue ; d’où vient cette équation bien
connue 28
sdz 2
2dds + =0
g
La résolution de cette équation le conduit à une fonction qui contient une constante arbitraire
c
z
s = 2 cg .sin. .
2g
Euler poursuit
Or, la valeur étant connue, il s’en suit la substitution convenable que l’on doit faire
dans l’équation proposée 29
sdz 2 dz 2 (1 − 3 cos.2 z )
2dds + + =0;
g 2h
en effet soit
z
s = u.sin. ,
2g
on aura
z udz z
ds = du sin. + cos.
2g 2g 2g
et
z 2 dudz z udz 2 z
dds = ddu sin. + cos. − sin.. .
2g 2g 2g 2g 2g

27
Quoniam autem hæc æquatio est differentialis secundi gradûs, atque insuper arcus et sinus arcuum continet,
facilè intelligitur ejus integrationem minus esse obviam [p. 301]
28
interim tamen cum alterius variabilis s plus una dimensione nusquam adsit, ea per methodos mihi familiares
tractari poterit. Soleo autem, quoties ejusmodi occurrunt, initio eos terminus in quibus altera variabilis a
omnino non inest, rejicere ; unde hæc consideranda venit æquatio…[p. 301]
29
Cognito autem hoc valore, idonea nascitur substitutio facienda pro æquatione proposita…[p. 302]

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 59 chapitre II

Ces valeurs étant substituées, apparaîtra cette équation


z 2 dudz z dz 2 (1 − 3 cos.2 z )
2ddu sin. + cos. + = 0,
2g 2g 2g 2h
dans laquelle il arrive justement que la variable u elle-même n’apparaît pas, mais
seulement ses différentielles30 .
On sera attentif au passage systématique de l’équation homogène à l’équation complète. On
ne trouve pas ici l’invocation d’un dédoublement de la fonction inconnue comme nous
l’avons trouvé plusieurs fois sous la plume de d’Alembert. La présentation des calculs est plus
nettement orientée vers la prise en considération a priori de l’équation homogène.

3. bilan

Sur les travaux d’Euler en matière d’équations linéaires, les indications qui précèdent ne sont
pas exhaustives. Dans son article sur les recherches d’Euler dans le domaine des équations
différentielles [1968], Simonov souligne la tendance des historiens à minorer les apports
théoriques d’Euler sur les équations différentielles. Pour ce qui concerne les équations
linéaires, il distingue, quant à lui, quatre cycles. D’abord de nombreux travaux donnent la
solution de problèmes linéaires de mécanique et de physique les plus variés [p. 139] ; on les
trouve notamment dans la Mechanica [1736]. Les systèmes d’équations linéaires à
coefficients constants y sont représentés. Avant 1743, un second cycle concerne les équations
linéaires à coefficients variables, puis dans un troisième cycle Simonov regroupe les équations
linéaires à coefficients constants. Enfin, avec le mémoire methodus aequationes differentiales
altiorum graduum integrandi ulterius promota, commence un quatrième cycle , lequel
concerne à nouveau les équations à coefficients variables, et se termine avec les mémoire sur
les équations conjuguées dont nous avons rendu compte.
Les éléments que nous avons examinés ci-dessus, ne donnent pas une vue d’ensemble. En
particulier, ils ne contiennent pas d’indications sur les systèmes d’équations ni sur les travaux
directement liés à la mécanique. Sur cette base, il est donc exclu, par exemple, d’étudier des
questions de priorité entre Euler et d’Alembert. Cependant, les travaux passés en revue
contribuent à dessiner le paysage mathématique aux alentours de 1765-1766, au moment où a
lieu l’échange épistolaire entre Lagrange et d’Alembert sur les questions d’équations
linéaires. Des travaux d’Euler avant cette date, retenons quelques points essentiels.
Dès 1740, le recours à l’équation homogène puis à la variation de la constante est présenté
comme un procédé habituel dans le cas d’une équation d’ordre deux. La variation de la
constante est utilisée pour les équations homogènes à coefficients constants dans le cas où le
polynôme caractéristique a des racines multiples. Elle est présente aussi pour les équations
non homogènes à coefficients variables d’ordre un et d’ordre 2. Vraisemblablement, cette
limitation n’est pas liée à la difficulté d’adapter la méthode au cas d’une équation d’ordre plus
élevé ; par contre, les équations homogènes correspondantes ne sont pas susceptibles d’une
résolution simple, et c’est probablement dans cette direction qu’il faut voir les raisons pour
lesquelles le procédé n’est pas envisagé pour un ordre supérieur à 2 : son intérêt éventuel ne
pourrait tenir qu’à une construction théorique globale concernant les équations linéaires, et il
ne serait pas lié directement à la résolution effective des équations concernées.
Le même type de remarque vaut, si l’on s’intéresse aux prémices de la théorie de
l’ « adjointe ». Euler fait un usage assez fréquent de la méthode du facteur intégrant. Ses
calculs le conduisent de fait à l’utilisation de l’adjointe. Mais, là encore, apparaissent des
limitations. Dans les Institutiones calculi integralis, les équations d’ordre un et deux sont
30
Quibus valoribus substitutis emerget ista æquatio …. , in qua hoc commodè accendit, ut ipsa variabilis u
non insit, sed tantum ejus differentielia [p. 302]

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie…. 60 chapitre II

traitées dans le cas de coefficients variables, et les équations d’ordre quelconque ne sont
concernées que pour des coefficients constants. Les limitations semblent bien liées à la
problématique d’un traité de calcul intégral, destiné à fournir des méthodes effectives
d’intégration.

Enfin, dans le cas des coefficients constants, l’analogie entre la composition des opérateurs
différentiels linéaires et le produit des polynômes, est exploitée minutieusement, elle permet
d’obtenir les solutions dans le cas des racines multiples et des racines imaginaires. Mais elle
est aussi exprimée avec beaucoup de généralité pour un polynôme factorisé en P = QR. Si
l’on note l’équation
P( d ).y = X,
dx
le calcul d’Euler revient à la remplacer par le système
R( d ).v = X,
dx
Q( d ).y = v.
dx
Ce système peut lui- même se traduire à l’aide de la composition des opérateurs
[Q( d ).R( d )].y = X.
dx dx
Mais, si cette interprétation donne, en termes actuels, une idée assez nette des calculs d’Euler,
elle reste… une interprétation. De telles écritures supposent le franchissement d’un seuil, elles
interviendront, nous le verrons, chez des auteurs postérieurs Euler.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 61 chapitre III

chapitre 3

la Mécanique Céleste et le mémoire Solution de différents


problèmes de calcul intégral
Le mémoire Solution de différents problèmes de calcul intégral se termine par un chapitre
intitulé application de la solution précédente à la théorie de Saturne et de Jupiter. Il s’appuie
sur de longs développements qui décrivent des méthodes de résolution approchée d’équations
différentielles linéaires. Les questions de Mécanique Céleste s’avèrent importantes, si l’on
veut percevoir, dans sa genèse, la méthode de variation de la constante.
Nous avons vu que des interrogations sur la validité de la théorie newtonienne de l’attraction
avaient persisté durant la première moitié du XVIIIème siècle. En 1749, les calculs de Clairaut
sur le mouvement de » l’apogée de la Lune ont levé une grande partie des doutes qui
pouvaient subsister. En 1759, c’est l’annonce du retour de la comète de Halley qui se voit
confirmée par les faits, malgré un décalage de quelques semaines. Lorsque Lagrange
commence à s’intéresser à la Mécanique Céleste, l’hypothèque relative au bien-fondé de la
théorie est levée. Ce sont les calculs relatifs à sa mise en œuvre qui rencontrent bien des
obstacles.

1. des problèmes posés en termes de perturbations.


Nous avons vu aussi que la mise en équation du mouvement de la Lune devait tenir compte de
l’action du Soleil, sous peine de fournir des résultats qui ne correspondent pas aux
observations. Le problème des trois corps se pose alors en des termes particuliers : on peut
considérer que l’action du Soleil vient perturber la trajectoire elliptique qui serait obtenue par
l’action seule de la Terre. L’Astronomie du XVIIIème siècle connaissait d’autres situations où
le problème se posait de façon semblable : un premier type de calcul tenant compte de
l’attraction d’un seul corps donne des résultats qui s’éloignent des observations, et conduit à
prendre en compte des actions perturbatrices. Poursuivant le cours de son histoire de
l’Astronomie, Montucla introduit ainsi le chapitre consacré à la théorie des planètes
principales
Après la théorie du Soleil et de la Lune, la plus intéressante pour nous est celle des
planètes principales, dont les mouvements sont bien plus compliqués que ceux du Soleil,
soit en apparence soit réellement par l’effet des attractions. Jupiter et Saturne, par
exemple, à cause de leurs masses et de leur éloignement immense du soleil, sont régis
moins impérieusement dans leur cours ; ces deux planètes agissent assez fortement
l’une sur l’autre, et troublent mutuellement leurs mouvements de manière sensible.
[Montucla, p. 112-113].
Dans le mémoire Solution de différents problèmes de calcul intégral, l’étude des perturbations
est préparée par la résolution d’équations dans lesquelles i marque un coefficient très petit
d 2y
(A) 2
+ K 2 y + L + iMy 2 + i 2 Ny 3 +.... = 0 [Œuvres I, p. 554]
dt
puis :
d 2y  dy 
(S) + K 2 y + L + i My cos Ht + N sin Ht  .. = 0 [p. 586]
dt 2
 dt 
ou encore dans des systèmes associant des équations de ce type [p. 576, 592].

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 62 chapitre III

La résolution approchée de ce type d’équation recèle une difficulté, qui retentit sur toute la
Mécanique Céleste de l’époque et que nous allons découvrir à travers le calcul de Lagrange.

2. la question des arcs de cercles

2.1. description du problème


Il s’agit de déterminer la solution y de l’équation (A) qui satisfera pour t = 0 à la double
dy
condition y = f, = 0. Les lettres f représente une constante arbitraire. Lagrange, comme
dt
les autres mathématiciens du XVIIIème siècle utilise d’abord une méthode d’approximations
successives dont Laplace dira plus tard : [elle] est analogue à celle de Newton pour
déterminer par approximation les racines des équations numériques [1776a, p. 370]
Il néglige d’abord les termes qui contiennent le coefficient très petit i en facteur. Il suffit
donc de résoudre
d2y
(A’) + K2 y + L = 0
dx 2
Il obtient la solution
y = f cosKt + L2 (cosKt – 1)
K
2
Il reporte alors cette valeur de y dans le terme iMy de l’équation (A), négligeant cette fois les
termes i2 Ny 3 et tous les termes qui contiendraient au moins i2en facteur, il remplace
l’équation (A) par
d2y
+ K2 y + L + iM( F + L 4 ) – 2i MLF cosKt + i MF cos2Kt = 0.
2 4 2
(A’’)
dx 2 2 K K 2
Une difficulté se présente à propos de cette équation, en effet la présence du terme
2i MLF cosKt va faire apparaître dans la solution, un terme de la forme Ct sinKt, de façon
K
plus précise c’est i MLF t sinKt qui est ainsi présent dans la solution de (A’’).
K2
La poursuite du procédé exige alors que l’on utilise la solution de (A’’) pour la reporter dans
les termes iMy2, i2 Ny 3 en ne gardant que les puissances de i supérieures ou égales à 2. Mais
alors le terme i MLF t sinKt , présent dans la nouvelle équation (A’’’), va provoquer
K2
l’apparition, dans la solution de nouvelles puissances de t, dans des termes de la forme
Ct2 cosKt ou Ct2 sinKt. C’est cette situation qui amène Lagrange à s’interroger
Mais voici une difficulté. L’expression de y qu’on vient de trouver renferme un terme
multiplié par t, et si l’on continuait le calcul de la même manière, on trouverait des
termes multipliés par t2 , t3, … ; cependant il est certain que la valeur de y ne peut
contenir de pareils termes [p. 556].
Suit alors une démonstration a priori dont les arguments ne sont pas entièrement clairs. En
réalité, il y a un motif bien plus important pour rejeter ces puissances de l’arc de cercle t :
l’équation (A) est le modèle d’équations destinées à étudier le mouvement des planètes
soumises à une perturbation. L’apparition de termes non périodiques signifie d’abord que la
méthode d’approximation ne reste pas valide pour un intervalle de temps suffisant. Le
phénomène a déjà été perçu à propos du mouvement de la Lune. En 1754, d’Alembert réagit
en ces termes
La première difficulté qui se présente, tombe sur la méthode par laquelle on doit
déterminer ce mouvement. Il semble d’abord qu’on puisse y parvenir, en se servant à

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 63 chapitre III

l’ordinaire des méthodes connues pour la solution des problèmes où l’on néglige de
petites quantités, c’est-à-dire en employant dans chaque correction une valeur de plus
en plus exacte du rayon vecteur ; mais dès la seconde correction cette méthode
introduirait dans la valeur du rayon vecteur des arcs de cercle qui rendraient cette
valeur très fautive. Il faut convenir pourtant que, comme l’orbite de la Lune n’est pas
fort excentrique, et que les forces qui l’altèrent ne sont pas très considérables, on
pourrait se servir de telle méthode qu’on voudrait pour déterminer cette orbite durant
un petit nombre de révolutions ; et qu’en ce cas on parviendrait à déterminer pendant ce
même petit nombre de révolutions la mouvement de l’apogée, tel que la théorie doit le
donner. Mais en suivant cette route, on ne trouverait pas le mouvement de la Lune pour
un nombre de révolutions quelconque, et il serait impossible de s’assurer si le
mouvement de cette planète pendant plusieurs années est tel que l’observent les
astronomes. Il est donc nécessaire d’avoir une méthode qui donne le mouvement de
l’apogée de la Lune pour tant de temps qu’on voudra, et c’est en cela que consiste une
des principales difficultés qu’on rencontre pour intégrer l’équation de l’orbite [1754, p.
XXXV-XXXVI).
D’Alembert met alors en œuvre une parade. À la même époque, d’autres solutions sont
tentées par Clairaut et Euler.

2.2. la solution de Lagrange en 1766


Lagrange imagine une solution fondée sur un changement de fonction inconnue. Á l’aide de
coefficients indéterminés λ , µ , ν , ... il définit la fonction y’ par
y = y’ + λ + µ i + ν i2 + …
L’équation (A) va se traduit pour y’ par une équation
d2y'
(C ) + R2 y’ + (L + K2 λ) + i ( B + M y’ 2) + i 2(… = 0
dx 2

Dans l’équation (A), le coefficient constant L introduisait le terme 2i MLF cosKt dans
K
l’écriture de l’équation (A’) et ce dernier terme était responsable de l’apparition des
puissances de l’arc dans les étapes suivantes.. Cette fois-ci, c’est (L + K2 λ) qui joue le rôle
du coefficient L. Il suffit donc de choisir λ de façon que
L + K2 λ = 0,
et le phénomène ne se renouvellera pas.

2.3. la solution de Laplace et la variation des constantes


Dans le recueil des mémoires de l’Académie pour l’année 1772, Laplace publie un Mémoire
sur les solutions particulières des équations différentielles et sur les inégalités séculaires des
planètes. Pour une part le mémoire concerne les solutions singulières des équations
différentielles, nous aurons l’occasion d’en reparler. Mais une partie totalement distincte est
consacrée à la Mécanique Céleste. Cet ensemble couvre les pages 343 à 377 du recueil de
l’Académie. Mais le même recueil contient aux pages 651 à 656, une suite. C’est dans cette
suite que Laplace présente un moyen nouveau pour contourner l’obstacle des arcs de cercle, il
s’agit de faire varier des constantes arbitraires apparues dans la résolution des équations
différentielles
Je ferai usage d’une nouvelle méthode d’approximation à laquelle les recherches
précédentes m’ont conduit, et qui est générale et surtout fort simple, quel que soit le
nombre des variables ; c’est principalement sous ce dernier rapport qu’elle présente

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 64 chapitre III

quelque avantage sur les méthodes déjà connues, qui mènent à des calculs
impraticables, lorsque le nombre des variables est indéfini ; elle consiste à faire varier
Les constantes arbitraires dans les intégrales approchées, et à faire disparaître par ce
moyen les arcs de cercle lorsque cela est possible. Cette manière de faire ainsi varier
les constantes arbitraires est, si je ne me trompe, absolument nouvelle et d’une grande
fécondité dans l’Analyse ; je vais en donner ici une idée très succincte, me réservant de
la développer avec plus d’étendue dans le Volume suivant [1775, Œuvres, VIII, p. 361]

L’équation à étudier est écrite


d 2y
(1) 0= + y – l + α y2 ,
dt 2
α est un coefficient fort petit [p. 361]. Suivant le procédé que nous venons de voir avec
Lagrange, Laplace commence par remplacer α par 0 dans (1), il obtient alors la solution
générale
y = l + psin t + q cos t
dy
p et q étant des deux constantes arbitraires que je détermine au moyen de y et de lorsque
dt
t = 0 [Ibid.].
Cette détermination ne va pas véritablement intervenir dans la partie du calcul qui nous
intéresse. Des indications sur ce point continueront à parsemer les explications sans donner
lieu à un calcul effectif. Une étape supplémentaire est franchie en posant
y = l + psin t + q cos t + α z
Le report de cette expression dans l’équation (1) permet de déterminer z
2l 2 + p 2 + q 2 q2 − p2 pq
z=-α - l q t sin t + - l p t cos t + cos2t + sin2t
2 6 3
Laplace précise :
inutile d’ajouter ici de nouvelles constantes, parce qu’elles sont déjà renfermées dans la
première valeur de y partant on aura
2l 2 + p 2 + q 2
(2) y=l-α + (p - α l q t )sin t
2
q2 − p2 α pq
+ (q + α l p t ) cos t + α cos2t + sin2t. [Ibid.]
6 3
On peut donc supposer que, au moment où est obtenue cette expression, les lettres p et q
désignent encore des constantes arbitraires, Laplace se sert de leur présence, semble-t-il, pour
donner à (2) le caractère de solution générale. Il va ensuite écrire une autre forme de la
solution, en considérant une valeur constante T et en prenant pour variable t, 31 tel que
t = T + t, . Plusieurs marches possibles sont évoquées, mais les calculs ne sont pas détaillés,
on peut essayer de reconstituer. En choisissant α = 0, on obtient une première approximation
sous la forme.
y = l + ’psin ( T + t,) + ’q cos ( T + t, )
Puis, intervient la détermination du terme complémentaire α z tel que
y = l + ’psin ( T + t,) + ’q cos ( T + t, ) + α z
Elle conduit à
2l 2 + ' p 2 + 'q 2
(3) y=l-α ( ’p - α l . ’q t, )sin(T + t, )
2

31
Ici le signe qui suit le t ne doit pas être pris pour un signe de ponctuation : la notation de la nouvelle variable
fait intervenir un accent en position inférieure : t, .

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 65 chapitre III

'q 2 − ' p 2 α ' p 'q


+ (’q + α l . ’p t, ) cos (T + t, ) + α cos(2T + 2t,) + sin(2T + 2t,)
6 3
L’idée directrice semble d’abord être de comparer l’expression (2) dans laquelle on fait t = T,
à l’expression (3) dans laquelle on fait t, = 0.
2l 2 + p 2 + q 2
(2’) y=l-α + (p - α l q T )sin T
2
q2 − p2 α pq
+ (q + α l p T ) cos T + α cos2t + sin2T
6 3
2l 2 + ' p 2 + 'q 2
(3’) y=l-α ’p sinT
2
'q 2 − ' p 2 α ' p 'q
+ ’q cos T + α cos2T + sin2T .
6 3
Entre l’instant t = 0 et l’instant t = T, les coefficients de sint et cost, dans la formule (2),
passent respectivement de
p à ’p = (p - α l q T )
q à ’q = (q + α l p T ).
On peut alors essayer de contourner l’apparition de l’arc de cercle T en remplaçant la
constantes p et q par des fonctions qui subiraient les accroissements
(4) δp = - α lTq (5) δq = α lTp.
Les modifications qui peuvent intervenir dans les autres termes de (2’) en remplaçant p par
p + δp et q par q + δq seront en tout état de cause de l’ordre de α 2 .

La suite est obtenue en supposant ’p et ’q développées en série selon les puissances


croissantes de x = α lT
Et l’on aura, comme l’on sait
dp 2
d2p
’p = p + δp = p + x + x + ….
dx 1.2 dx 2
dq 2
d 2q
’q = q + δq = q + x + x + ….
dx 1.2 dx 2
donc
dp dq
δp = x , δq = x ,
dx dx
Les équations (4) et (5) deviendront ainsi, en négligeant les quantités de l’ordre x2, ou,
ce qui revient au même, en comparant les termes multipliés par x,
dp dq
=-q =p
dx dx
d’où l’on tire en général
p = f cosx – hsin x q = f sinx + hcos x
f et g étant deux nouvelles constantes arbitraires que je détermine au moyen des valeurs
de p et q, lorsque x = 0 ; donc on aura
’p = f cosα lT - h sinα lT
’q = f sinα lT + h cosα lT . [p. 363]
Reportées dans la formule (3), ces expressions conduisent à une solution libérée des arcs de
cercle, et dans laquelle on peut considérer que T est la variable
2l 2 + f 2 + g 2
y=l- + f sin (T + α lT )+ h cos (T + α lT )
2

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 66 chapitre III

h2 − f 2 αfg
+α cos(2T + α lT) + sin(2T + α lT)
6 3
Laplace reviendra de nombreuses fois sur cette méthode, qu’il applique aussi à des systèmes
d’équations différentielles. On la retrouve notamment dans les Recherches sur le calcul
intégral et sur le système du monde [1776a]. Le Mémoire sur l’intégration des équations
différentielles par approximation, [1780a], en donnera un exposé plus général. Enfin, elle sera
décrite et utilisée dans le traité de Mécanique Céleste [Œuvres tome I, pp. 257-276]. Andoyer
en donne un résumé très accessible dans sa biographie de Laplace. Il prend l’exemple d’une
équation du second ordre
d 2x = P
dt 2
où P est une fonction entière de x et de dx , périodique par rapport à certains arguments
dt
linéaires en t [p. 54]. Il suppose l’intégrale générale obtenue sous la forme d’une série entière
x = X + t Y + t 2Z + …
Les fonctions X, Y, Z… dépendent notamment de deux constantes arbitraires C1 et C2. On
admet qu’un tel développement est unique. Mais, un changement de l’origine des temps
amène, tout en conservant une solution de l’équation, à transformer l’écriture précédente
x’ = X ’ + (t - θ ) Y ’ + (t - θ ) 2Z’ + …
Les fonctions X, Y, Z .. ont été transformées en X ’ , Y ’ , Z’ … en changeant les constantes,
lesquelles deviennent désormais C’1 et C’2. Andoyer souligne que c’est là le point
fondamental, et il poursuit
En déterminant convenablement C’1 , C’2 , θ , on peut rendre identiques les expressions
de x et de x’ ; mais alors x’ sera indépendant de θ et on pourra donner à θ une valeur
absolument quelconque : si l’on fait θ = t, il restera
x = X’
en mettant pour C’1 , C’2 les valeurs correspondantes : si celles si sont périodiques, on
aura réussi de la façon la plus simple à faire disparaître les termes séculaires de
l’expression primitive de x. [p. 55]
La détermination de C’1 , C’2 peut être obtenue en écrivant que l’expression de x’ est
indépendante de θ.
Andoyer note que la mise au point du procédé a été progressive
[Laplace] est revenu bien des fois ensuite sur cette méthode extrêmement remarquable,
pour en mieux dégager les principes, qu’il avait d’abord sentis plutôt que démontrés ; il
semble que Lagrange, à qui il l’avait communiquée, n’en ait pas compris la haute
portée. [p. 54]
Il termine ce passage en commentant le sens que doit revêtir dans ce cas l’expression
variation de la constante
On voit que la méthode revient à faire varier les constantes d’intégration, mais qu’elle
s’appuie sur des principes bien différents que le procédé généralement connu sous le
nom de méthode de variation de la constante [p. 55].
Il reste maintenant à voir comment, dans son acception la plus courante, cette expression
s’applique à des procédés de Mécanique Céleste. Avec le mémoire Solution de différents
problèmes de calcul intégral, Lagrange en fait certainement la première utilisation qui soit
perceptible avec autant de netteté.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 67 chapitre III

3. la mise en équation par Lagrange


du mouvement de Saturne et de Jupiter
Le Soleil, Saturne et Jupiter ont pour masses respectives I, J’ et J. Les distances mutuelles
sont notées u, u’, v comme sur la figure jointe.

(Saturne)
M’

u’ v

(Soleil) S M
u (Jupiter)

L’application du principe fondamental de la Dynamique dans un repère absolu A conduit, pour


le mouvement de Jupiter, à l’équation vectorielle suivante :
 d 2 OM  MS MM '
J 2 
= I × J 3 + J × J' 3
 dt  A u v
Dans un repère L lié au Soleil, l’application du même principe se réalise en ajoutant des
forces fictives d’entraînement :
 d 2OM  SM SM '
− J 2 
= −J × J 3 − J × J' 3
 dt  A u u'
On obtient donc :
 d 2 OM 
J  = I × J MS + J × J ' MM ' − J × J SM − J × J ' SM'
 dt 2  L u3 v3 u3 u' 3
soit :
 d 2 OM  MS  MM ' SM '
 2 
= ( I + J ) 3 + J ' 3 − 3 
 dt  L u  v u' 

Si dans cette dernière équation on annule J’, on obtient évidemment l’équation du mouvement
d’une planète de même masse J que Jupiter et qui serait soumise à la seule action du Soleil. Le
terme complémentaire qui contient J’ en facteur permet de prendre en compte l’action de
Saturne, on obtient ainsi ce que Lagrange appelle le mouvement de Jupiter dérangé par
Saturne.
Lagrange traite le problème dans un système de coordonnées cylindriques (ϕ, r, p) dont le
Soleil est l’origine et dont le plan de l’écliptique est le plan méridien.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 68 chapitre III

M (Jupiter)

(Soleil) r
plan de S
l’écliptique ϕ
x

Dans ces conditions. (ϕ, r, p) représentent les coordonnées de Jupiter. Lagrange écrit les 3
équations :
d 2 r rdϕ 2 r
2
− 2
+ (I + J) 3 + R = 0
dt dt u
d r dϕ
2
( )
+Q= 0
dt 2
d2p p
2
+ (I + J) 3 + P = 0 [Œuvres I, p. 611]
dt u
P, Q, R, sont les trois composantes de la perturbation causée par Saturne, elles dépendent à la
fois des coordonnées (ϕ, r, p) de Jupiter et des coordonnées (ϕ’, r’, p’) de Saturne.

Q R
plan de
S
l’écliptique

 r − r 'cos(ϕ − ϕ ') r 'cos(ϕ − ϕ ') 


R= J’  + 
 v3 u '3 
 r' r' 
Q=J’  3 − 3  r sin(ϕ − ϕ ')
v u' 
 p − p' p' 
P=J’  3 + 3  [p. 610]
 v u' 

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 69 chapitre III

p 1
L’introduction des fonctions q = et s= et l’intervention d’une constante
r r
2
 r 2 dϕ 
C=   + 2 ∫ Qr dϕ permettent finalement de ramener le problème de la trajectoire de
2

 dt 
Jupiter à la résolution du système d’équations :

( )
3
2 −2
2
d s (I + J) 1 + q + U
(1) + s+ =0
dϕ 2
C − 2 ∫ Qr 2 dϕ
dq 2 V
(2) +q+ =0
dϕ 2
C − 2 ∫ Qr 2 dϕ
dans lesquelles les quantités U et V sont exprimées en fonction de P, Q et R, de telle sorte
qu’elles s’annulent si l’on remplace P, Q et R par 0. Lagrange résout d’abord le système
obtenu en faisant ces hypothèses :

( )
3

d 2s (I + J ) 1 + q2 2
(1’) +s+ =0
dϕ 2 C
dq 2
(2’) +q = 0
dϕ 2
L’équation (2’) a une solution générale de la forme :
q = ε sin(ϕ-α)
où ε et α sont des constantes arbitraires. Avec cette expression de la fonction q, on constate
I+J
que 1 + q 2 constitue une solution particulière de l’équation (1’), la solution générale de
D
(1’) peut donc s’exprimer avec des constantes arbitraires η et ω, sous la forme :
I+J
s= 1 + q 2 + η cos(ϕ-ω)
D
Lagrange interprète les résultats
La première de ces deux formules nous montre que l’orbite est toute dans un plan fixe
passant par le centre des rayons r, et coupant le plan de manière que ε soit la tangente
de l’inclinaison, et α le lieu du noeud ascendant. 32

32
En complétant l’axe Sx par un axe Sy qui lui soit orthogonal et qui soit situé aussi dans le plan de
l’écliptique, on peut en effet repérer la position de M par les coordonnées cartésiennes : x = rcosϕ , y = rsinϕ ,
p.
l’équation q = ε sin(ϕ-α) se met alors sous la forme de l’équation cartésienne d’un plan p = ycosα- xsinα

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 70 chapitre III

plan de l’orbite
M

p
i
r
ligne des doeuds
S α
plan de l’écliptique x

La seconde fait voir que l’orbite est une ellipse dont le foyer est dans le centre des
rayons r....[p. 613] L’équation polaire de la trajectoire de M dans son plan va être obtenue.

Φ
S A x

Lagrange nommeΦ et A les angles dont les projections respectives sont ϕ et α, u désignant le
rayon vecteur SM, et il obtient l’équation :
1
u=
I+J
D
+ ηε cos ϕ − β ( )
I+J
Il souligne que est le paramètre et que l’excentricité est ηε , celle-ci est déterminée en
D
fonction des constantes d’intégration d’abord apparues :
1 + ε 2 cos2 (α − ω )
ηε =η
1+ ε 2
De même l’angle β, angle polaire du périhélie, est déterminé en fonction de ces constantes.

p
L’inclinaison i a pour tangente la pente = q lorsque cette pente est maximale, c’est-à-dire lorsqu’elle est égale
r
à ε . L’interprétation de la seconde équation est moins immédiate.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 71 chapitre III

L’ellipse dont les éléments sont ainsi calculés serait la trajectoire suivie par la planète Jupiter
si, à partir de sa position et de sa vitesse à l’instant initial, elle poursuivait sa course sous
l’action des seules forces dues au Soleil. 33
Le calcul complet peut maintenant intervenir avec la réintroduction des expressions P, Q et R
qui avaient été provisoirement assimilées à 0 . Lagrange annonce ce calcul par ces mots :
Imaginons maintenant que l’effet des forces perturbatrices consiste à faire varier les
quantités ε, α, η et ω en sorte que l’orbite soit représentée par une ellipse qui change
continuellement d’espace et de position [p. 615].
Ce calcul doit aboutir à la détermination des quantités ε, α, η et ω en fonction de ϕ. L’écriture
de q sous la forme q = ε sin(ϕ-α), implique dorénavant
dq dε dα
= ε cos(ϕ − α ) + sin(ϕ − α ) − cos(ϕ − α )
dϕ dϕ dϕ
Avant d’utiliser ce résultat pour modifier en conséquence l’équation (1), Lagrange se sert de la
marge de manœuvre que lui laisse la recherche de deux fonctions ε et α, alors qu’il s’agit de
résoudre une seule équation
or, puisqu’on a deux indéterminées ε et α, dont l’une peut être tout ce que l’on voudra,
nous supposerons
sin(ϕ-α) dε=ε cos(ϕ-α) dα
ce qui donnera
dq
= ε cos(ϕ − α ) . [p. 615]

On notera les termes très voisins de ceux que l’on a trouvés sous la plume de d’Alembert dans
des phases de calcul semblables34. Mais la méthode possède ici une spécificité, les constantes
que l’on fait varier ont une signification dans le système mécanique étudié. D’ailleurs,
Lagrange rappelle cette signification pour souligner un avantage immédiat des choix qu’il a
réalisés : la variation instantanée de la latitude35 sera la même que si le plan de l’orbite ne
changeait point de position. [p. 615]
Finalement l’équation (1) se trouve résolue sous la forme q = ε sin(ϕ - α), pourvu que ε et α
soient eux-mêmes liés par deux équations différentielles
ε dα V
+ =0
sin(ϕ − α ) D
− 2 ∫ Qr dϕ
2

1+ ε 2
dε dα
− =0 [p. 615]
ε tan(ϕ − α )
Lagrange souligne que ces équations permettent de connaître le mouvement de la ligne des
nœuds et la variation de l’inclinaison de l’orbite [p. 615]. Intersection du plan de l’écliptique

33
L’ellipse est traditionnellement dite osculatrice, mais son contact avec la trajectoire réelle est d’ordre un
seulement (voir [Pascoli, p. 99])
34 zs
d’Alembert ayant dédoublé l’inconnue en , écrit : or, à cause des deux indéterminées z et s dont l’une peut
l
être tout ce que l’on voudra ... [1743, p. 101] . Voir ci-dessus chapitre II, paragraphe 1.2.3.
35
Il s’agit de la latitude héliocentrique, mesurée ici par arctanq. Il manque le facteur complémentaire donnant la
dq
dérivée par rapport au temps de l’angle ϕ pour que le quotient différentiel = ε cos(ϕ − α ) puisse être

interprété comme une variation instantanée.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 72 chapitre III

et du plan de l’orbite, la ligne des nœuds est effectivement donnée par l’angle α. Quant à
l’inclinaison i , elle est donnée pour l’orbite elliptique considérée, par tan i = ε
L’équation (2) est résolue selon le même principe. Si η et ω sont des fonctions de ϕ, la dérivée
de s s’écrit
ds I + J qdq dη dω
= − η sin(ϕ − ω ) + cos(ϕ − α ) + sin(ϕ − ω )
dϕ D dϕ 1 + q 2 dϕ dϕ
Invoquant la manière dont il vient de traiter la latitude q, Lagrange impose alors une égalité
supplémentaire qui va neutraliser les deux derniers termes de l’expression obtenue
cos(ϕ - α) dη = -η sin(ϕ - ω)dω
1
et, il obtient cette fois que la variation instantanée du rayon r = soit la même que si
s
l’ellipse demeurait constante [p. 616].
I+J
Finalement s restera donc déterminée par la relation s = 1 + q 2 + η cos(ϕ-ω), mais les
D
lettres η et ω représenteront des fonctions de ϕ, qui seront solutions d’un système de deux
équations différentielles du premier ordre.
Des équations semblables se trouvent évidemment établies pour la trajectoire de Saturne.
Au système initial, ont été associées de fait les équations linéaires homogènes :
d 2s
+s=0
dϕ 2
dq 2
+q = 0
dϕ 2
Ce sont les quatre constantes apparues dans les solutions générales de ces deux équations qui
ont joué un rôle dans le traitement du problème par Lagrange. Elles ont fait l’objet d’un
changement de point de vue : pour la résolution des équations (1) et (2) complètes elles ont été
considérées comme des fonctions de la variable ϕ. Lagrange ne commente pas la structure
d’un calcul qui a finalement une portée générale ; ces remarques ne concernent que les
éléments spécifiques à la situation mécanique envisagée : telle équation permettra de
déterminer la ligne des nœuds ou l’inclinaison de l’orbite, telle autre permettra d’envisager la
variation de la latitude ou du rayon vecteur sur la trajectoire réelle comme si le mouvement
avait lieu sur l’ellipse osculatrice.
Le mémoire prend ensuite un tour différent, il va s’orienter vers une résolution par
approximation. S’appuyant sur un constat expérimental (les observations nous apprennent
que le mouvement de Jupiter autour du Soleil est à peu près circulaire et uniforme [p. 618]),
Lagrange introduit la distance moyenne de Jupiter au Soleil, soit a, et sa vitesse angulaire
moyenne h. Puis il exprime les coordonnées de Jupiter à l’aide à l’aide de a, de h, et d’un
coefficient très petit désigné par i . Nous avons déjà vu que ce coefficient est introduit dans
des calculs préliminaires du mémoire de 1766, c’est sur sa présence qu’est fondée la recherche
d’une solution approchée.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 73 chapitre III

À la même époque, Lagrange rédige les recherches sur les inégalités des satellites de Jupiter
causées par leur attraction mutuelle. Le mémoire va obtenir le prix de l’Académie de Paris
pour l’année 1766. La même méthode est utilisée pour la mise en équation du mouvement.

satellite

rp
1+ p 2

arctanp

Jupiter ϕ

plan de l’orbite de Jupiter

En particulier, Lagrange note p la latitude d’un satellite par rapport au plan de la trajectoire de
Jupiter et il montre que p vérifie une équation différentielle du second ordre qui dépend de
forces perturbatrices de composantes P, Q, R.

 dp 
r 3  P − pR + Q 
2
d p  dϕ 
(c) + p+ =0
dϕ 2 c2 + 2 ∫ Qr 3dϕ
Cette équation est d’abord résolue sans tenir compte de ces forces
Supposons pour un moment que les forces perturbatrices P, Q, R soient nulles ; on aura
par l’équation (c )
d2p
+p=0
dϕ 2
dont l’intégrale est, comme on sait,
p = G sinϕ + Hcosϕ,
ou bien
p = λsin(ϕ - ε),
λ et ε étant deux constantes arbitraires. Cette dernière expression de p fait voir que
l’orbite est toute dans un plan fixe, dont la position dépend des quantité λ, ε, qui
expriment, la première, la tangente de l’inclinaison, et la seconde, la longitude du
noeud.

Puis la solution obtenue est utilisée quand interviennent à nouveau les forces perturbatrices
Retenons maintenant cette même expression de p, et supposons, à cause des forces
perturbatrices, λ et ε variables ; on aura
dp = dλ sin(ϕ - ε)+λcos(ϕ - ε)(dϕ - dε).
Or, afin que le corps puisse être regardé comme se mouvant réellement dans le plan
déterminé par λ et ε , il faut que la valeur de dp soit la même que si ces quantités
demeuraient constantes, c’est-à-dire, que
dp = λcos(ϕ - ε)dϕ [1777a, Oeuvres VI, p. 71]

73
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 74 chapitre III

On est bien en présence de la méthode utilisée dans le mémoire Solution de différents


problèmes de calcul intégral.
Il reste alors à évoquer les travaux d’Euler qui auraient pu présenter les mêmes caractères que
ceux que l’on vient de lire sous la plume de Lagrange. Puis nous donnerons de brèves
indications sur la place de la méthode de Lagrange en Mécanique Céleste.

4. la méthode de variation des constantes en Mécanique Céleste

4.1. la question de l’antériorité d’Euler


Le Volume XXV des œuvres complètes d’Euler (2ème série) contient des travaux de
Mécanique Céleste, il fait l’objet d’une présentation par l’éditeur, Max Schürer. Celui-ci
précise d’emblée que le plus grand mérite [d’Euler] dans ce domaine consiste à avoir
considéré les éléments de la trajectoire elliptique comme des variables dépendantes. Puis,
après avoir évoqué les travaux concomittants de d’Alembert et de Clairaut, il poursuit : il est
certain [cependant] que beaucoup de ce qui est aujourd’hui porté au crédit de Lagrange, était
déjà connu d’Euler36 [p. VII]
Dans l’Histoire Générale des Sciences, J. Lévy, évoque justement le problème des
perturbations de Saturne et de Jupiter, il rappelle qu’il a été proposé comme sujet de prix par
l’Académie de Paris en 1748 et en 1752, et il précise :
Euler gagna les deux prix ; à cette occasion, il introduisit la méthode aujourd’hui
classique qui a reçu le curieux nom de variation des constantes ; l’étude d’un système
d’équations différentielles se fait à partir d’un système approché mais intégrable : les
constantes d’intégration de ce dernier, exprimées en fonction des variables initiales,
sont choisies comme nouvelles variables [Taton III, 1958- 1995, pp. 504-505].
Deux mémoires sont donc invoqués. Les recherches sur la question des inégalités du
mouvement de Saturne et de Jupiter ont obtenu le prix pour l’année 1748, elles ont été
imprimées en 1749. Les Recherches sur les irrégularités du mouvement de Saturne et de
Jupiter ont remporté le prix pour l’année, elles ont été imprimées tardivement à Paris en 1769,
en même temps que des mémoires qui ont obtenu le prix de l’Académie pour les années 1751,
1753, 1759, 1760 et 1761. Les deux études font apparaître une même démarche partant
d’hypothèses simples mais grossières : recherche du mouvement de Saturne dans l’hypothèse
que les deux orbites soient dans un même plan, l’une et l’autre étant destituées d’excentricité
[1749b, p. 58]. Puis ces hypothèses reçoivent successivement des modifications, lesquelles
rendent la situation plus proche de la réalité, mais obligent à modifier les calculs précédents.
Euler va prendre en considération d’abord, l’excentricité de l’orbite de Saturne, [p. 73] puis
évaluer l’influence de l’excentricité de l’orbite de Jupiter sur le mouvement de Saturne [p.
88]… Mais aucune de ces étapes ne fait apparaître la mise en équation globale que Lagrange
réalise en 1766, ni l’usage très spécifique qu’il y fait de la variation des constantes. Il est
certain qu’Euler, dès cette époque, pense le problème des perturbations en termes de
modifications des paramètres de la trajectoire. Le mémoire De motu corporum cœlestium a
viribus quibuscunque perturbato [1758/1752-1753] fournit le témoignage de réflexions dans
ce sens. Par exemple, un corps est supposé décrire une trajectoire elliptique sous l’action
d’une unique force centrale, puis des perturbations sont introduites sous forme de chocs
instantanés, il s’agit alors d’en apprécier les effets sur la trajectoire qui se trouve ainsi
36
Sein gröβtes Verdienst auf diesem Gebiet bestand vielleicht darin, daβ er schon damals die elliptische
Bahnelemente der Planeten als abhändige Variable betrachte. [Da fast gleichzeitig auch Clairaut un
d’Alembert himmelsmechanische Arbeiten veröffentlichten und in der damaligen Zeit wenig zitiert wurde, lassen
sich Prioritäten nicht immer leicht feststellen.] Sicher ist jedoch, daβ vieles, dass heute Lagrange zugeschrieben
wird, schon von Euler bekannt war. [Opera omnia, (2), 25 p. VII]

74
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 75 chapitre III

modifiée. Mais les méthodes que Lagrange introduit en 1766 ont une spécificité : non
seulement les éléments de la trajectoire sont considérés comme variables, mais, de plus, ils
s’ajustent exactement aux constantes dont on va provoquer la variation dans les équations
différentielles.
L’appréciation émise par Arthur Berry semble être la plus proche de la réalité
Euler montra comment, lorsque la position de la planète perturbante est connue, le taux
de variation des éléments de l’ellipse variable pouvait être calculé ; quant à déduire de
ces données, les véritables éléments, il accomplit quelques progrès dans ce sens ; mais
il trouva les difficultés mathématiques trop grandes pour être surmontées sauf en
quelques cas simples, et il fut réservé à la nouvelle génération de mathématiciens,
notamment Lagrange, de montrer toute la puissance de la méthode.37
Pour fonder complètement ce jugement, il manque une étude exhaustive des mémoires de
Mécanique Céleste d’Euler.

4.2. Les éléments des planètes et les « crochets de Lagrange »


Dans les textes ultérieurs de Lagrange, les éléments des planètes vont intervenir de façon
systématique dans la résolution des équations différentielles de leur mouvement. Lagrange
s’exprime de façon très claire à ce sujet dans le Mémoire sur la théorie des variations des
éléments des planètes et en particulier des variations des grands axes de leurs orbites
[1809a]. Ce sont d’abord des définitions qui sont rappelées
On entend, en Astronomie, par éléments d’une planète les quantités qui déterminent
son orbite autour du Soleil, supposée elliptique, ainsi que le lieu de la planète dans un
instant marqué qu’on appelle l’époque . Ces quantités sont au nombre de cinq, dont
deux, le grand axe ou la distance moyenne qui en est la moitié, et l’excentricité,
déterminent la grandeur de l’ellipse dont le Soleil occupe l’un des foyers ; les trois
autres, la longitude de l’aphélie, celle des nœuds, et l’inclinaison, déterminent la
position du grand axe sur le plan de l’ellipse et la position de ce plan sur un plan qu’on
regarde comme fixe par rapport aux étoiles. [Œuvres VI, p. 713]

A aphélie (distance PS maximale)

P
i

S ligne des nœuds

A’

Lagrange explique ensuite que ces cinq quantités, jointes à l’époque, permettent de déterminer
à chaque instant la position d’une planète, si l’on ne tient compte que de l’attraction solaire. Si
l’on met en équation le mouvement de la planète dans cette hypothèse, on obtient trois
37
Euler shew further how, when the position of the perturbing planet was know, the corresponding rates of
change of the elements of the varying ellipse could be calculated, and made some progress towards deducing
from these data the actual elements ; but he found the mathematical difficulties too great to be overcome except
in some of the simpler cases, and it was reserved for the next generation of mathematicians, notably Lagrange,
to show the full power of the method. [Berry Arthur, 1898, p. 303-304]

75
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 76 chapitre III

équations du second ordre, lesquelles demandent par conséquent six intégrations [p. 714]. Or,
précisément
Ces intégrations introduisent chacune dans le calcul une constante arbitraire ; de sorte
que la solution du Problème renferme en dernière analyse six constantes arbitraires : ce
sont les éléments mêmes de la planète, ou des fonctions de ces éléments [Ibid.]
Mais, les autres planètes produisent aussi une action sur celle que l’on est en train d’étudier, et
il en résulte des inégalités qu’on nomme perturbations, dont le calcul est long et délicat, et
fait, depuis Newton, l’objet des travaux des Géomètres qui s’occupent de la Théorie du
Système du monde [Ibid.]. Les explications de Lagrange recoupent alors les deux aspects qui
ont été signalés ci-dessus. Il y a d’une part la nécessité de procéder à des approximations, c’est
ce que nous avons vu avec la méthode de Laplace, mais d’autre part les modifications
introduites se traduisent directement par des variations des éléments de la planète. Les termes
supplémentaires qu’il faut alors ajouter aux équations sont petits, et ils provoquent de petites
modifications des constantes arbitraires qui intervenaient dans la première phase du calcul
[ces constantes] se trouvent augmentées d’une petite partie variable due à ces mêmes
termes, dont on ne peut à la vérité trouver la valeur finie et rigoureuse, parce qu’elle
dépend d’une intégration qui est impossible, en général, mais dont on peut avoir, par
des approximations successives, la valeur approximative aussi approchée qu’on
voudra.[p. 715]
Et finalement, les modifications se traduisent sur la trajectoire
Ainsi, les éléments du mouvement elliptique, qui, par l’action du Soleil seul sont
constants, deviennent sujets à de petites variations ; et quoique, à la rigueur, le
mouvement ne soit plus elliptique, on peut néanmoins le regarder comme tel à chaque
instant ; l’ellipse variable devient alors osculatrice de la véritable orbite de la planète,
comme on peut le conclure de la Théorie générale de l’osculation que j’ai exposée
ailleurs et qui est fondée sur la variation des constantes[Ibid.]
Le terme d’osculation ne caractérise pas un contact d’ordre 2, la théorie des enveloppes à
laquelle semble renvoyer Lagrange est contenue notamment dans le mémoire sur différentes
questions d’analyse relatives aux intégrales particulières [1781].
Dans le mémoire publié en 1809, les deux étapes de calcul sont décrites en termes généraux à
l’aide de coordonnées cartésiennes. Il y a d’abord le système obtenu sans les perturbations
(S) d 2x + 1+ m x = 0 , d 2 y 1+ m
+ y = 0 , d 2z + 1+ m z = 0 ,
dt 2 r3 dt 2 r3 dt 2 r3
(la masse du Soleil est prise comme unité et m représente la masse de la planète étudiée). Les
solutions x, y, z sont des fonctions de t et de six constantes a, b, c… elles sont les expressions
elliptiques des coordonnées [p. 722].
Les perturbations se traduisent par la présence de seconds membres qui peuvent s’écrire à
l’aide d’une fonction Ω, laquelle fait intervenir les fonctions x, y, z, mais aussi les
coordonnées des autres planètes.
2
1+ m dΩ d 2 y 1+ m dΩ d 2z + 1+ m z = d Ω .
(S*) d 2x + 3 x = , + y = ,
dt r dx dt 2 r3 dy dt 2 r3 dz
Les calculs ultérieurs vont être structurés par le point de vue suivant
on conservera les expressions elliptiques des coordonnées x, y, z, ainsi que celles de
dx dy dz
leurs différentielles , , , mais en y regardant les constantes a, b, c… comme
dt dt dt
variables, et l’on vérifiera les équations par la variation de ces constantes dans les
différentielles secondes [Ibid.]

76
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 77 chapitre III

Les solutions x(t, a, b, c,..), y(t, a, b, c,..), z(t, a,b, c,..) du système (S) vont être introduites
dans les équations qui forment le système (S*). Lagrange distingue deux parties obtenues en
différentiant ces fonctions : l’une provient de la différentiation par rapport à la première
variable t, elle reste notée à l’aide de la caractéristique d, la seconde est obtenue en passant
par les dérivées partielles par rapport à a, b, c…, elle est notée à l’aide de la caractéristique δ.
Les fonctions a, b, c, … sont alors solutions d’un système formé par 3 couples d’équations tels
que
δ dx d Ω 38
δx = 0 ; = .
dt 2 dx
Dans les calculs systématiques qui suivent, Lagrange met à jour des régularités formelles, qui
se traduisent notamment à l’aide d’expressions qu’il note
(x, a, b) = dx d x - dx d x
2 2

db dt da da dt db
c’est la somme des trois termes obtenus avec les coordonnées x, y et z qui va constituer ce que
l’on nommera le « crochets de Lagrange » relatif aux « constantes » a et b .
Dans le mémoire de 1809, les calculs sont menés à l’aide de ce formalisme ; Lagrange
souligne, le cas échéant, que telle quantité y prend une forme élégante et symétrique [p. 739]
L’un des résultats acquis par ce moyen concerne la stabilité séculaire des grands axes des
orbites des planètes : l’expression de ces grands axes en fonction du temps t ne contient pas de
termes proportionnels à t.

38
La première équation indique que la vitesse est la même dans le système (S) ou dans le système perturbé (S*),
elle peut être imposée grâce à la marge de manœuvre que donne la présence de 6 fonctions a, b, c,… pour un
système (S*) de trois équations. Avec des notations de dérivées partielles que Lagrange n’emploie pas elle se
∂ x ∂a
traduit par Σ = 0 (la somme est étendue aux six éléments).
∂ a ∂t
∂a

∂t ∂ x
La seconde équation est la traduction de (S*), elle peut s’écrire Σ =0.
∂ a ∂t

77
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 78 chapitre III

conclusion : variation des constantes, utilisation de l’adjointe, le


chassé croisé du mémoire de 1766
Quand Lagrange écrit les premiers mémoires sur Saturne et Jupiter, la méthode de variation
des constantes reste un procédé isolé, propre à résoudre le problème de Mécanique Céleste
qu’il faut traiter à un moment donné. En particulier, elle n’est pas conçue comme un moyen
d’étudier les propriétés générales des équations différentielles linéaires. Le contenu du
mémoire Sur la solution de différents problèmes de calcul intégral est remarquable pour le
chassé-croisé auquel il donne lieu. Le début concerne les équations différentielles linéaires en
général, mais cette étude est appuyée sur la mise en évidence de l’adjointe. La variation des
constantes apparaît, de façon tout à fait indépendante, dans une seconde partie consacrée à la
Mécanique Céleste. Le 2 mars 1765, quand d’Alembert écrit sa réponse à Lagrange, il ignore
probablement le contenu de cette seconde partie. Mais c’est d’Alembert qui montre que
certains résultats obtenus à l’aide de l’adjointe, pouvaient l’être aussi par la technique de
« dédoublement » (elle-même identique, quant aux calculs, à la méthode de variation de la
constante).
C’est un mémoire publié en 1777 qui, nous allons le voir, va modifier la situation. Le tableau
1-III-a (page suivante) récapitule divers moyens de résolution ou d’étude des équations
différentielles linéaires, qui ont cours avant cette date. La plupart des textes cités en référence
ont déjà fait l’objet d’une présentation. Ont été mentionnés aussi des travaux de Lagrange sur
la propagation du son dans des mémoires parus en 1759 et 1762 ; Lagrange y résout des
équations linéaires ou des systèmes, selon des méthodes que nous avons rencontrées ailleurs et
pour lesquelles il cite d’Alembert. Enfin, ce tableau contient des références [Lagrange 1759,
Laplace 1771] dont l’importance ne se conçoit que par leurs liens avec les équations aux
différences finies. Elles vont être étudiées dans le chapitre suivant.

78
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 79 chapitre III

tableau 1-III-a
quelques méthodes d’étude et de résolution des équations différentielles
linéaires recensées aux alentours de 1770
1. équations à coefficients constants
1.1. Équations homogènes d’ordre quelconque
1.1.1. recherches des solutions sous la forme eλx, résolution de l’équation
caractéristique [Euler, 1743, p. 110]
1.1.2. méthode de variation de la constante dans le cas des racines multiples, méthode
voisine pour les racines imaginaires [Euler 1743, p. 116, 120]
1.2. Équation complète d’ordre quelconque
1.2.1. utilisation d’un facteur intégrant eλx , obtention d’une « équation adjointe »
[Euler 1753a, p. 192]
1.2.2. cas des racines multiples : solutions obtenues par passages à la limite dans le cas
de racines voisines [p. 201]
1.2.3. - l’équation est transformée en un système différentiel d’ordre 1 par
dy d 2y
l’introduction des fonctions inconnues p = ,q= ,… ;
dt dt 2
- la diagonalisation de ce système puis la résolution d’une équation d’ordre un
fournissent une intégrale première de l’équation proposée.
- si l’on utilise m valeurs propres distinctes apparues dans la diagonalisation, on
obtient m intégrales premières. La résolution peut se terminer par la résolution d’un
système algébrique de m équations [d’Alembert, 1754a p. 25-30 ; Lagrange 1759b,
Œuvres I, p. 73 ; 1762a, Œuvres I, p. 162].
1.3. Équations d’ordre 1 ou 2
méthode de variation de la constante [Euler 1740/52, p. 302], d’Alembert [1743, p. 100 ;
1754, p. 130]
1.4. Systèmes d’équations, utilisation de combinaisons linéaires équivalentes à une
diagonalisation [d’Alembert 1743, p. 99 ; Lagrange 1759b, p. 72]

2. équations à coefficients variables


2.1. premier ordre
2.1.1. utilisation d’un facteur intégrant [Jean Bernoulli, cité par Montucla, Euler 1768,
p. 267]
2.1.2. variation de la constante [Lagrange 1759a, Œuvres I, p. 23 ; Euler 1768, p. 267,
295]
2.2. second ordre
2.2.1. facteur intégrant conduisant de facto à l’équation adjointe [Euler 1769a, p.97]
2.2.2. variation de la constante [Euler 1769a, p. 82]
2.3. théorème fondamental
Lagrange [1766] au moyen de l’équation adjointe ; D’Alembert [1766] par variation de la
constante ; Laplace [1771] : voir ci-dessous le chapitre IV, § 2.
2.4. système d’équations issus de la Mécanique Céleste : Lagrange [1766] variation de la
constante.

3. résolutions approchées d’équations issues de la Mécanique Céleste


d 2y
+ K 2 y + L + iMy 2 + i 2 Ny 3 +.... = 0
dt 2
méthode analogue à celle que Newton utilise pour les équations algébriques : calcul de y en faisant
i = 0, report de cette valeur dans le terme iMy2, nouvelle résolution … Pour éviter l’apparition des
d l L l tili éth d ’il i i d l [1775 361]

79
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 80 chapitre III

arcs de cercle, Laplace utilise une méthode qu’il nomme variation de la constante [1775, p. 361]

80
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 81 chapitre III

81
© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine
1ère partie 80 chapitre IV

chapitre IV

les équations aux différences finies


Pour avoir une idée complète de la genèse de la méthode de variation de la constante, il faut
maintenant suivre son intervention dans la résolution des équations aux différences finies.
L’intérêt de Lagrange et de ses contemporains pour ces équations est souvent lié aux
recherches sur la théorie des hasards. Un mémoire de Laplace [1771] vient réveiller dans
l’esprit de Lagrange des réflexions entreprises dès 1759.

1. Lagrange : la théorie des suites récurrentes réduite au calcul


différentiel
Les écrits de Lagrange publiés avant 1766 sont contenus dans les deux premiers tomes des
Mélanges de philosophie et de mathématiques de l’Académie de Turin. Un mémoire concerne
la méthode des maxima et minima. Une part importante de ces premiers écrits est consacré à la
propagation du son, et nous verrons que les équations différentielles linéaires y sont présentes.
Enfin le mémoire le plus court s’intitule Sur l’intégration d’une équation différentielle à
différences finies, qui contient la théorie des suites récurrentes [1759a]. L’objet principal est
l’étude des suites récurrentes, traitées sous la forme d’équations linéaires aux différences
finies. Mais une partie de l’étude comporte le rappel et l’exploitation de méthodes
d’intégration connues pour les équations différentielles linéaires.

1.1. la méthode de dédoublement et les équations d’ordre un


Il commence par un calcul concernant une équation différentielle linéaire du premier ordre,
écrite :
dy + yXdx = Zdx
où X et Z expriment des fonctions quelconques de la variable [Oeuvres I, p. 23]
Il faut comprendre qu’il s’agit là d’une équation aux différences infiniment petites : ces
équations ne sont pas l’objet principal du mémoire, mais Lagrange rappelle à leur propos un
mode opératoire qu’il présente comme connu et qui servira ensuite de modèle pour la
résolution des équations aux différences finies
l’on sait que pour intégrer cette équation il suffit de faire
y = uz
ce qui donne
udz + zdu +uzXdx = Zdx,
où l’on peut faire évanouir deux termes par une valeur convenable de u et de z.
Supposons donc
zdu + uzXdx = 0
et divisant par z, on aura
du + uXdx = 0 [p. 23]
Lagrange écrit ensuite la solution de cette équation linéaire homogène du premier ordre, en
parcourant les étapes suivantes :
du
= − Xdx
u
lu = -∫ Xdx
u= e ∫
− Xdx

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 81 chapitre IV

la fonction u étant ainsi déterminée, on obtient la destruction des deux termes soulignés ci-
dessous dans l’équation initiale :
udz + zdu + uzXdx = Zdx,
La fonction z est donc déterminée par l’équation
udz = Zdx
Lagrange en donne la solution :
= ∫ e∫ Zdx
Zdx
z= ∫
Xdx

u
Et la solution de l’équation initiale est finalement obtenue sous la forme :

∫ e∫ Zdx
Xdx

y = uz = [p. 24]
e ∫ Xdx

Nous reviendrons plus loin sur ce calcul et sur l’usage que Lagrange en fera pour une étude
des équations aux différences finies. Mais constatons que Lagrange le mène dans des
conditions très semblables à celles que pratiquait d’Alembert. Les conditions spécifiques qui
permettent le succès de la méthode ne sont pas évoquées. La possibilité d’utiliser les mêmes
moyens pour une équation différentielle linéaire d’ordre quelconque n’apparaît pas
explicitement. Lagrange ne fait pas apparaître la constante multiplicative dans la résolution de
l’équation « sans second membre »
dz + zXdx = 0
Les solutions sont recherchées a priori sous la forme y = uz et ce produit uz n’est pas présenté
comme issu de la résolution de l’équation « sans second membre ».
Le rappel de ce type de calcul est ensuite clairement motivé :
en observant le procédé de cette méthode, on verra aisément qu’elle doit pouvoir
s’appliquer encore avec succès aux équations différentielles qui ont la même forme que
la précédente, quoique les différences soient supposées finies . [p. 24]
Cette volonté d’exploiter l’analogie entre les deux types d’équations se manifeste de plusieurs
façons. D’abord les notations retenues pour les différences finies sont presque identiques aux
notations différentielles ; ainsi dy représente désormais la différence finie de la fonction y et
l’équation du premier ordre s’écrit :
(1) dy + M y = N
où M et N sont des fonctions d’une variable quelconque x. Ensuite la marche du calcul va être
fidèlement calquée sur ce que nous avons appelé la méthode de « dédoublement ». En posant
y = uz, Lagrange développe la différence dy en une somme où s’introduit un terme dudz qui
était absent du calcul sur les différentielles
dy = udz + zdu + dudz
L’équation initiale devient donc
(2) udz + zdu + dudz + M uz = N
Lagrange impose à u d’être solution de l’équation sans second membre
Qu’on pose comme ci-dessus les deux termes
du + Mu = 0
savoir
du = − M ;
u
pour résoudre cette équation dans notre cas où la différentielle du n’est pas infiniment
petite, qu’on suppose
u + du = e t + dt et du = e t (edt - 1)
d’où

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 82 chapitre IV

du = et −1= − M et e t= 1 – M,
dt
et prenant les logarithmes,
dt = l(1-M)
et ensuite intégrant
t = ∫ l(1 - M) [p. 25]
Les propriétés fondamentales du logarithme sont alors invoquées pour transformer cette
somme dans le produit continuel de toutes quantités contenues dans la formule 1 – M
t = ∫ l(1 - M),
puis
u = et = ϖ(1 - M) [Ibid.]
Si u est ainsi choisi la forme (2) de l’équation, se ramène à
udz + dudz = N
ou encore
dz = N .
u + du
et
z= ∫ N .
u + du
Mais ayant trouvé u = ϖ(1 -M ), si l’on exprime par M1 le terme consécutif à M , on
aura
u+du = ϖ(1 –M1 ),
et par conséquent
z= ∫ N
ϖ (1− M 1 )
[p. 26]
Finalement, avec l’introduction d’une constante arbitraire A, la solution y = uz s’écrit
 N 
(3) y =ϖ(1-M)  const .+ ∫ 
 ϖ (1 − M1 ) 
Les produits consécutifs ϖ(1 -M) et ϖ(1 -M1) s’interprètent à l’aide d’un calcul que l’on
n −1 n
conduirait aujourd’hui avec des notations telles ques u0 ∏ (1 − M k ) et u0 ∏ (1 − M k ) (voir la
k =0 k =0
troisième colonne du tableau 1-IV-a, page suivante)
Les résultats obtenus sont utilisés pour traiter un problème posé initialement en termes de
suite. L’équation est écrite
y1 = Ry + T
où y1 est le terme qui suit y dans la suite y [p. 26].
L’équation est alors ramenée à la forme (1) d’une équation aux différences
dy + (1 – R)y = T
En particulier, si R et T sont constants, la formule (3) conduit à l’expression du « terme
général »
R m −1
ym = ARm + T [p. 27].
R −1

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 83 chapitre IV

équations linéaires du premier ordre tableau 1-IV-a


différences infiniment petites différences finies interprétation du calcul de Lagrange avec
[Lagrange, 1759a] [Lagrange, 1759a] notations indicielles (on pose : ∆yn = yn+1 - yn )
∆yn + ynMn = Nn
dy + yXdx = Zdx dy + yM = N yn = un zn ;
y = uz y = uz ; dy = udz + zdu + dudz ∆yn = un∆zn + zn∆un + ∆un ∆zn
un ∆zn + zn∆un+ ∆un∆zn + M n un zn = Nn
dy = udz + zdu udz + zdu + dudz + Muz = N
∆un + Mn un = 0
udz + zdu +uzXdx = Zdx, du + Mu = 0 un= etn ; ∆un = etn ( e∆tn −1 )
du ∆tn = l ( 1 - Mn )
du + uXdx = 0 = −M
u n
du
= − Xdx u = et ; u+du = et+dt ; du = e t (edt - 1) tn+1 = ∑ l(1-Mn ) un
k =0
u
( )
dt = l(1-M) n
= l ∏ 1−M n
lu = -∫ Xdx t = ∫ l(1 - M) k =0
n −1
t = lϖ(1 -M) un= etn = u0 ∏ (1 − M k )
k =0
u = et = ϖ(1 -M)
u= e ∫
− Xdx
un ∆zn+∆un ∆zn = Nn
udz+dudz = N Nn N
∆zn = = n
udz = Zdx
dz =
N un + ∆un un+1
Zdx u + du n −1 n −1 N
zn = ∑ ∆z p = ∑
p
dz = N
dz z= ∫ p =0 p = 0 u p +1
u + du p

u+du = ϖ(1-M1) up+1 = u0 ∏ (1 − M k )


k =0

∫ e∫
Zdx
z= ∫
Xdx
N
= Zdx z= ∫
u ϖ (1 − M 1 ) yn = un zn =
 
∫ Xdx Zdx  
∫e y =uz =ϖ(1-M) const .+ ∫
N
  n −1
  n −1 Np 
ϖ (1 − M 1 )  ∏ (1 − M k ) const .+ ∑ p
 
y = uz =

e∫ 
(1 − M k ) 
Xdx
 k =0 


p=0

k =0 
1ère partie 84 chapitre IV

Tirons les conclusions de cette première étape. Guidé par le souci de suivre la marche
observée pour les équations aux différences infiniment petites, Lagrange procède à des détours
que l’on peut juger inutiles ; si l’objectif était seulement d’obtenir l’expression de la solution,
le recours à la fonction exponentielle et à la fonction logarithme ne présenterait guère
d’avantage. Mais il y a clairement le choix de maintenir la meilleure proximité possible entre
le cas des différences finies et celui des différences infiniment petites. Et, passée cette
première étape, l’analogie entre les deux cas sera beaucoup plus facile à manier.

1.2. les équations d’ordre supérieur et la méthode d’abaissement de


d’Alembert
Le résultat obtenu pour l’équation du premier ordre va être utilisé dans des équations d’ordre
supérieur
après avoir trouvé la méthode d’intégrer toute équation différentielle à différences
finies, comprise sous la forme générale
dy+My=N
on pourra de même procéder à l’intégration de plusieurs autres qui dépendent de celle-
ci [p. 28].
Lagrange rappelle alors la méthode de d’Alembert : elle concerne les équations à coefficients
constants, elle permet leur abaissement par l’utilisation d’une équation du premier ordre,
comme nous l’avons vu au paragraphe 1.3.3. du chapitre II. Or : on s’apercevra que les
opérations que requiert cette méthode peuvent également se faire, soit que les différences
soient finies ou qu’elles soient infiniment petites [p. 31].
Dans la méthode de dédoublement que nous venons de voir, la différence finie du produit
y = zu faisait apparaître un terme dudz qui n’intervenait pas pour les différences infiniment
petites. Dans les calculs qui vont suivre, seules des propriétés « linéaires » vont être mises en
jeu, et les calculs se déroulent de façon strictement analogue, que les différences soient finies
ou infiniment petites.
Lagrange traite explicitement le cas de l’équation d’ordre 5
(4) y + Ady + Bd 2y +Cd 3y + Dd 4y + Ed 5y = X,
la résolution passe par l’introduction de notations auxiliaires identiques à celles qui
concernaient les différences infiniment petites
dy = p, dp = q , dq = r , d y = s,
z = y + (A + a) p + (B + b) q + (C + c) r + (D + d ) s.
L’équation (4) se traduit alors par l’équation du premier ordre
(5) z – adz = X
La constante a doit être l’une des racines a1 , a2 , a3 , a4 , a5 de l’équation algébrique
a5 + A a4 + B a3 + C a2 + D a + E = 0.
Pour chacune de ces valeurs de a, l’équation (5) se résout selon les modalités décrites
précédemment
 1+ a   X am 
m

zm =    const.+ ∫  [p. 32]


 a   (1+ a ) m+1 
Soient Z1, Z2, Z3, Z4, Z5 les cinq valeurs ainsi obtenues, l’expression de la solution y se
déduit alors du système algébrique linéaire formé par les 5 équations
y + (A + ai ) p + (B + bi) q + (C + ci) r + (D + di ) s = Zi .
Elle prend la forme
y = FZ1 + GZ2 + HZ3 + IZ4 + KZ5
Le calcul est ensuite repris pour une suite ym définie par la relation de récurrence
(5) ym + A ym-1 + B ym-2 + C am-3 + D ym-4 + Eym-5 =X

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 85 chapitre IV

Les résultats sont résumés, et particularisés dans le cas où X est une constante. Si X est nulle,
la relation (5) définit une suite récurrente, dont l’échelle de relation est
-A -B -C -D -E.[p. 35]. L’auteur constate qu’il retrouve une formule connue
ym = Fa1m + Ga2m+ Ha3m + Ia4m + Ka5m,
laquelle se trouve par exemple dans l’Introductio d’Euler.

En terminant, Lagrange insiste sur l’importance qu’il accorde à une méthode qui élargit le
champ du calcul différentiel :
Voilà donc la théorie des suites récurrentes réduite au calcul différentiel, et établie de
cette façon sur des principes directs et naturels, au lieu que jusqu’ici elle n’a été traitée
que par des voies tout à fait indirectes [p. 36]
Il souligne la nouveauté des résultats : les recherches qu’on a faites sur cette matière ont
toujours été bornées au cas de X = 0 [Ibid.].
Et il évoque les applications que peuvent avoir les suites récurrentes : elles sont de la dernière
importance pour la résolution de plusieurs problèmes [qui] conduisent à de telles équations
dont la doctrine des hasards est principalement remplie [p. 36] ; enfin, il annonce qu’il
produira ultérieurement des travaux sur ce thème.
C’est seulement en 1777 que nous verrons réapparaître cette préoccupation dans les écrits de
Lagrange. Entre-temps, Laplace aura poursuivi l’exploration de la voie ainsi ouverte.

2. Laplace : l’extension aux différences finies du théorème


fondamental de Lagrange
En 1771, Laplace a 22 ans. Il publie dans le 4ème tome des Mémoires de Turin, les Recherches
sur le calcul intégral aux différences infiniment petites, et aux différences finies. Ce texte est
redevable aux écrits de Lagrange pour deux de ses aspects.
D’abord, Laplace va donner une nouvelle démonstration du théorème fondamental que
Lagrange a obtenu en 1766 sur les équations différentielles linéaires : la connaissance de
l’intégrale complète de l’équation homogène permet de ramener à des quadratures la
résolution de l’équation complète. Mais la méthode de l’adjointe utilisée par Lagrange était
fondée sur des intégrations par parties (ou, ce qui revient au même, des différentiations de
produits de fonctions). En cela, elle n’est pas adaptable au cas des équations aux différences
finies.
Sur ce point, Laplace va approfondir l’exploration des analogies mises en évidence en 1759
par Lagrange. Les Recherches sur le calcul intégral aux différences infiniment petites, et aux
différences finies vont comporter deux parties équivalentes. Et la démonstration produite pour
le théorème fondamental va pouvoir s’adapter très exactement aux équations linéaires aux
différences finies.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 86 chapitre IV

2.1. une nouvelle démonstration du théorème fondamental


Laplace va étudier une équation linéaire d’ordre n dont les coefficients sont des fonctions de
la variable x
dy d2y dny
(A) X=y+H + H’ 2 +……+ H n - 1 [p. 273]
dx dx dx n
Nous conviendrons dans ce qui suit de noter systématiquement à l’aide de * l’équation
homogène associée à une équation complète donnée. Ainsi on notera
dy d2y dny
(A*) 0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
L’un des objectifs du mémoire est de donner une nouvelle démonstration du résultat que
Lagrange a obtenu en 1766 , l’un des avantages de cette méthode est de pouvoir s’adapter au
cas des équations aux différences finies
Dans le 3ème volume de ces mémoires on trouve les profondes recherches de M. de la
Grange… Il fait voir [de plus] que cette équation
dy d2y dny
X=y+H + H’ 2 +……+ H n - 1
dx dx dx n
est généralement intégrable dans les mêmes cas que celle-ci
dy d2y dny
0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
Ce beau théorème dont M. d’Alembert dans le même volume donne une démonstration
fort simple, est un pas très important vers la résolution générale de ce genre
d’équation.[…].
Voici une méthode[…] cette méthode ne se borne pas d’ailleurs aux différences
infiniment petites, on verra ci-après qu’elle s’applique également aux différences finies
[p. 273]
On peut comprendre la méthode en l’imaginant d’abord appliquée à une équation à
coefficients constants, en référence à la factorisation que nous avons vue pratiquée par Euler.
Soit le polynôme
P = 1 + H x + H’x2 +……+ H n - 1 xn
Supposons qu’il se factorise sous la forme
P = (1 + ω’x + ω’’x2 +……+ ωn - 1 xn - 1 )( 1 + ω x )
Dans ce cas, l’équation (A) peut être résolue au moyen des deux équations linéaires

d 2T d n −1T
(a) X = T + ω’ dT + ω’’ 2 +……+ ω n - 1
dx dx dx n −1
dy
(B) T=ω +y
dx
Laplace va chercher à se ramener à cette situation même dans le cas où l’équation (A) a des
coefficients variables. Il faudra alors chercher un système de fonctions ω, ω’ ω’’,… ω n – 1 tel
que, en reportant dans (a), l’expression de T donnée par (B), on obtienne une équation d’ordre
n identique à l’équation initiale (A).
Il sera nécessaire de tenir compte des dérivées successives de T
ω 2 + dω
d2y dy dy
+ = dT
dx dx dx dx dx
d3y
dx
( dx
)
ω 3 + 2dω +1 2 + d ω2
d2y
dx
2 dy d 2T
dx dx
=
dx 2
………………………………………………………….

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 87 chapitre IV

d n y  (n−1)dω  d n −1 y (n−1)(. n−2).d 2ω d n − 2 y + …+ d n −1ω dy = d n −1T


ω +  +1  n −1
+
dx n  dx  dx 1.2.dx 2 dx n − 2 dx n −1 dx dx n −1
Ces dérivées seront respectivement multipliées par les fonctions ω’ ω’’,… ωn – 1.
L’identification avec l’équation (A) conduit à un système de n équations
ω ωn–1 = Hn–1
ω ω n – 2 + ω n – 1 + n−1ω n −1 dω = H n – 2
1 dx
ω ω n – 3 + ω n – 2 + n− 2ω n − 2 dω
(n −1 ) (n−2)ω n −1 d 2ω = H n – 3
1 dx 1 .2 dx 2
ω ω’ + ..……………………+. = H’
ω + ω’ + ω’ dω + ω’’ d ω2 + … = H
2

dx dx
Les n – 1 premières équations de ce système permettent de calculer les fonctions ω’ ω’’,…
ωn – 1 en fonction de ω, de ses dérivées jusqu’à l’ordre n –1, et des fonctions H n - 1, H n - 2,
…H’. Le report de ses valeurs dans la dernière équation conduit à une équation différentielle
d’ordre n – 1, dont la fonction inconnue est ω, et que Laplace écrit
( 
dx  ω
) ( dx ωω
)[ ]( )
0 = ω - H + 1+ dω  H' − 1+ 2dω . H'' −... + 1+ 3dω . H'3'' −... − 3d ω
dx  ω
2
 H''' −... 
 dx 2  ω 3  
(D)
2

dx  ω
 ( dx  ω
)
+ d ω2  H'' − 1+ 3dω  H'3'' −... 
 


(
+ d ω3 H''' − ....
3

dx ω
)
Cette équation n’est pas linéaire. En théorie, elle peut servir à déterminer la fonction ω. Les
fonctions ω’, ω’’,… ω n – 1 s’en déduiront puisqu’elles ont été exprimées en fonction de ω.
Laplace réécrit d’ailleurs l’équation que nous avons notée (a) et il met en évidence que les
coefficients dépendent en dernier ressort de ω
(E)

dx  ω
( dx ω
) ( dx
)
X = T + dT  H' − 1+ 2dω  H2'' − 1 + 3dω [H'' − ...]−3 d ω2  H'2'' − ...  
2

dx  ω

  
d 2T
+ (…)
dx 2
+………….

La propriété visée par Laplace va concerner l’équation (A) d’ordre n : il s’agit de démontrer
que (A) est intégrable pourvu que (A*) le soit. Il va montrer que cette propriété est acquise
dès que la propriété semblable est acquise pour l’équation (E). Or, (E) est d’ordre n-1, il
suffira donc finalement de savoir que la propriété est vraie pour une équation linéaire d’ordre
un.
Soit ω = β une solution particulière de (D). Reportons cette valeur de ω dans l’équation (E),
Convenons de noter (Eβ) l’équation ainsi écrite t soit T une solution de l’équation (Eβ) ainsi
obtenue. Pour les valeurs β et T ainsi choisies, on sait résoudre l’équation linéaire du premier
ordre
dy
(Lβ) β + y = T.
dx
Toute solution y de cette équation sera aussi une solution de (A). En particulier si l’on désigne
par Z la solution complète de (Eβ) , on obtiendra la solution complète de (A) par la formule

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 88 chapitre IV

∫β
− dx Z dx ∫ dxβ
(G) y= e (C + ∫ e )β
De plus, si Z désigne la solution complète de l’équation homogène (Eβ*) la formule (G)
fournit la solution complète de (A*). Mais la solution complète de l’équation homogène est
une combinaison linéaire de n-1 solutions particulières R, R’,… R n – 2, soit en utilisant des
constantes arbitraires A, A’,… A n – 2
T = AR + A’R’ + A’’R’’ + ..... A n - 2 R n - 2
La formule (G) donne alors
− ∫ dx − ∫ dx − ∫ dx A 'R'dx ∫ dx A n −1 R n −1dx ∫ β
∫β − ∫ dx
dx dx

∫ β e + e ∫ β e + …+ e ∫ β
ARdx
β β β' β' β
(H) y=C e +e e

Laplace envisage n solutions particulières β, β’, β n - 1 de (D). Chacune de ces solutions


permet de former une équation (E). Il désigne par T, T’, … T n – 1 des solutions particulières de
chacune des n équations (E) ainsi obtenues. On peut résoudre chacune des équations
dy
β +y=T
dx
dy
β’ + y = T’
dx
dy
β’’ + y = T’’
dx
dy
βn-1 + y = T n – 1.
dx
Et l’on obtient ainsi n solutions de l’équation (A). Laplace poursuit : partant l’intégrale
complète de l’équation (A) sera
[(S)]
− ∫ dx
− ∫ dx
∫ − ∫ dx T 'dx ∫ dx T n −1 dx ∫
dx dx
y = e β (C + ∫ Tdx e β ) + e β ' (C’ + ∫ e β ' ) + …….+ e β (Cn- 1 + ∫ n −1 e β ) .
n −1 n −1

β β' β
[p. 279]
Il semble bien y avoir ici une confusion. En reportant cette expression de y dans
dy d2y dny
y+H + H’ 2 +……+ H n - 1 ,
dx dx dx n
chacun des termes étant déjà solution de (E), on obtiendra en réalité
dy d2y dny
y+H + H’ 2 +……+ H n - 1 = nX
dx dx dx n
En réalité on peut se passer de cette solution de l’équation. Laplace se sert seulement de
l’expression de la solution de (A*) ; dans l’expression (S), on peut en effet supposer que l’on
a choisi T = T’ = T’’ = T n – 1 =…= 0. On obtient alors la solution de (A*) qui s’écrit
−∫ dx
− ∫ dx − ∫ dx
y = C e β + C’ e β ' + …… C n- 1 e β
n −1
(I)
Aucune question n’est soulevée à propos de l’indépendance des fonctions β, β’, β n – 1 et des
conditions qui pourraient être requises pour que la formule (I) fournisse effectivement la
solution complète de (A*). En comparant les formules (H) et (I), Laplace identifie les termes
de même rang et obtient
β ' − β − ∫ dxβ ' β ' ' − β − ∫ βdx'' β n −1 − β − ∫ βdxn −1
(J) AR = C’ e , A’R’ = C’’ e , ….A n - 2 R n - 2 = C n- 1 e
β' β '' β n −1
Finalement, les solutions particulières R, R’,… R n – 2 de l’équation (Eβ*) s’expriment donc à
l’aide des solutions particulières β, β’, β n - 1 de l’équation (D). Il fait s’intéresser de plus près
à ces dernières solutions.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 89 chapitre IV

Supposons que l’équation homogène (A*) soit intégrable. Elle admet donc une solution
complète formée à l’aide de n solutions particulières u, u’, u’’, ….. u n – 1
y = Cu + C’u’ + C’’u ’’+ ….. + C n- 1 u n – 1
Laplace compare cette expression à l’expression (I) de la solution générale, il en déduit que
les fonctions β, β’, β n - 1 sont liées aux fonctions u, u’, ’u ’’ u n – 1par les relations
− ∫ dx − ∫ dx − ∫ dx
u = e β , u’ = e β ' , ….. u n – 1 = e β .
n −1
(K)

Le raisonnement peut alors commencer. Supposons que l’équation homogène (A*) soit
intégrable. On connaît donc les solutions u, u’, u ’’ u n – 1. Les relations (K) permettent d’en
déduire les fonctions β, β’, β n - 1 ; lesquelles sont solutions de l’équation (D). Et surtout, ces
fonctions β, β’, β n - 1, utilisées dans les formules (J), donnent les solutions R, R’,… R n – 2 de
l’équation (Eβ*). Mais cette dernière équation est linéaire et d’ordre n – 1 ; supposons que, de
son intégrale complète, on sache déduire la solution Z de l’équation complète (Eβ). Alors la
formule (G) permet d’exprimer la solution de l’équation complète (A)
donc la difficulté d’intégrer
dy d2y dny
X=y+H + H’ 2 +……+ H n - 1
dx dx dx n
lorsque l’on sait intégrer
dy d2y dny
0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
se réduit à intégrer
H ' 2dβ   H'  d 2T  H ''
X = T + dT  −1+ −... +  d n −1T H n −1
  −.... +……+ (∆)
dx  β  dx   β  dx 2  β  dx n −1 β
du degré n – 1, et que l’on sait intégrer lorsqu’on suppose X = 0 on fera pareillement ,
et par la même méthode, dépendre la résolution de celle-ci d’une autre de degré n – 2,
et… jusqu’à ce qu’on parvienne à une équation de degré n – n ou purement
algébrique ; d’où il résulte que l’équation
dy d2y dny
X=y+H + H’ 2 +……+ H n - 1
dx dx dx n
est intégrable dans les mêmes cas que celle-ci
dy d2y dny
0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
ce qui est le beau théorème de M. de la Grange. [p. 284]

2.2. Une démonstration analogue pour les équations aux différences


finies
Par rapport à celle fournie par Lagrange en 1766, la démonstration de Laplace a l’avantage
qui a déjà été signalé : elle se transpose sans grandes difficultés au cas des équations linéaires
aux différences finies. Les tableaux 1-IV-b et 1-IV-c donnent le schéma des calculs de
Laplace pour les différences infiniment petites, et pour les différences finies, ils mettent en
évidence la structure commune aux deux cas.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 90 chapitre IV

Équations aux différences infiniment petites

Démonstration de l’assertion
si l’équation homogène d’ordre n
dy d2y dny
(A*) 0=y+H + H’ 2 +……+ H n - 1
dx dx dx n
est intégrable, alors il en est de même pour l’équation complète
dy d2y dny
(A) X=y+H + H’ 2 +……+ H n - 1
dx dx dx n
Principe général
l’intégration de (A) peut être ramenée à l’intégration successive d’une équation d’ordre n – 1
et d’une équation d’ordre un
d 2T d n −1T
(a) X = T + ω’ dT + ω’’ 2 +……+ ω n - 1
dx dx dx n −1
dy
(B) T=ω +y
dx
Conditions préliminaires résultant du principe général
La fonction ω doit alors vérifier l’équation différentielle non linéaire d’ordre n – 1
( ) ( )[ ] ( )
(D) 0 = ω - H + 1+ dω  H' − 1+ 2dω . H'' −... + 1 + 3dω . H'3'' −... −
dx  ω dx ωω dx  ω
3d 2ω  H''' −...
 dx2  ω 3 

 ω −(1+ dx )  ω −...  + dx ( ω − ....)


 H'' 3dω  H'''  
+ d ω2 d ω H'''
2 3

dx   3
 3

Les fonctions ω, ω’, ….ω n – 1 s’expriment à l’aide de ω , si bien que les coefficients de (a)
dépendent de ω, l’équation (a) s’écrit
(E)

dx  ω dx ω
( ) dx
( ) dx  ω
 d 2T
X = T + dT  H' − 1 + 2dω  H2'' − 1 + 3dω [ H'' − ...] − 3 d ω2  H'2'' − ...   +
2

   dx 2
(…) +...

Démonstration par report sur l’équation (E) de la propriété à démontrer


Si la solution de (A*) est
y = Cu + C’u’ + C’’u ’’+ ….. + C n- 1 u n – 1
on peut en déduire des solutions β, β’, β n - 1 de (D), au moyen des formules
− ∫ dx − ∫ dx − ∫ dx
u = e β , u’ = e β ' , ….. u n – 1 = e β
n −1
(K)
Soit (Eβ) : l’équation (E) dans laquelle on a remplacé ω par la valeur particulière β,
(Eβ*) : l’équation (Eβ) dans laquelle on a fait, de plus, X = 0.
Les fonctions β, β’, β n - 1 permettent d’exprimer n – 1 solutions de l’équation (Eβ*)
β ' − β − ∫ dxβ ' β '' − β − ∫ βdx'' n-2 n-2 n- 1 β
n −1
− β − ∫ β n −1
dx
(J) AR = C’ e , A’R’ = C’’ e ,…. A R =C e
β' β '' β n −1
Si l’on sait passer de la solution complète de (Eβ*) à la solution complète de (Eβ), on
disposera donc de la solution T = Z de (Eβ), il suffira alors de faire T = Z dans (B), pour
obtenir l’intégrale complète de (A)
− ∫ dx Z dx ∫ dxβ
(G) y = e β (C + ∫ e )
β
tableau 1-IV-b

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 91 chapitre IV

Équations aux différences finies

Démonstration de l’assertion
si l’équation homogène d’ordre n
(B*) 0 = y x + H xy x + 1 + ’H x y x + II + ’’H x y x + III + … + n-1
Hx yx+n
est intégrable, alors il en est de même pour l’équation complète
(B) X x = y x + H xy x + 1 + ’H x y x + II + ’’H x y x + III + … + n-1
Hx yx+n
Principe général
l’intégration de (B) peut être ramenée à l’intégration successive de deux équations d’ordre n –
1
(b) X x = T x + ’β T x + I + ’’β T x + II + …. + n – 1β T x + n – 1

(C ) Tx = ωx yx+1 + yx
Conditions préliminaires résultant du principe général
La fonction ω doit alors vérifier l’équation non linéaire d’ordre n – 1
n −1 x
x 'H x
(E) 0 = 1 - H x + x x + 1 +….± H
ω ωω ω ω ...ω x + n −1
x x +1

Les coefficients ’β , ’’β , … n – 1β s’expriment à l’aide de ω x , si bien que l’équation (b)


s’écrit
Hx
(D) X x = T x + T x + I (H x - ω x ) + T x + II (’H x - H x ω x + 1 + ω x ω x + 1 ) + …+ T x + n – 1 x +n −1
ω
Démonstration par report sur l’équation (E) de la propriété à démontrer
Si la solution de (B*) est
y = A u + ’A ’u + ’’A ’’u + … + n – 1A n – 1u
x

on peut en déduire des solutions V, ’V’, x – 1V de (E), au moyen des formules


1 1 , ………. n – 1u = 1
∇(−V ) ∇(−'V ) ∇(− n −1V x − 1 )
u= x −1
, ’u = x −1

Soit (DV) : l’équation (D) dans laquelle on a remplacé la suite ω x par la solution V x
(DV*) l’équation (DV) dans laquelle on a, de plus, remplacé X x par 0.
Les suites ’V, ’’V, …n – 1V permettent d’exprimer n – 1 solutions de (DV*)
 ∇(−V x −1 )   ∇(−V x −1 )   ∇(−V x −1 ) 
 

∇(− x −1 
) 
∇(− x −1 
)  ∇(− n −1V x −1 ) 
R x = , ∇  ’R x = ∇   , ………… n – 1R x. = ∇  
'V ''V
∇(−V x −1 ) ∇(−V x −1 ) ∇(−V x −1 )

Si l’on sait passer de la solution complète de (DV*) à la solution complète de (DV), on


disposera donc de la solution T = Z x de (DV), il suffira alors de faire T = Z x dans (C), pour
obtenir l’intégrale complète de (B)

)[
A−∑ Z x∇ −V x −1 ( )]
1
yx =
∇ −V x −1
(
tableau 1-IV-c

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 92 chapitre IV

équations aux différences finies linéaires du premier ordre tableau 1-IV-d


[Laplace 1771] [Lagrange, fragments…non daté] [Laplace 1776b]
x+1
y = Rx yx + Zx ,
or elle donne y = Ny + P yx = Hx yx - 1 + Xx
Je commence par supposer P nul […]
y’ = R y + Z , Je fais dans cette équation
y’’ = R’ y’’ + Z’ 0 , ,, x −1
y = a N N N .... N
en substituant dans cette seconde équation , au lieu de y’, sa
yx = ux ∇Hx
valeur tirée de la première on aura Supposons maintenant que cette expression
y’’ = R’ R y’ + R’Z + Z’ ,
elle devient
donc satisfasse aussi à l’équation y = Ny + P , mais en y
y’’’ = R’’ R’ y’ + R’’Z’ + Z’’ ux ∇Hx = Hx ux-1 ∇Hx-1 + Xx
regardant a comme une fonction de x.
en substituant toujours au lieu de y’ sa valeur on aura ,
0 , ,, x −1 mais on a
y’’’ = R’’ R’ Ry + R’’ R’Z + R’’Z’ + Z’’
et Puisque y = a N N N .... N , on aura Hx∇Hx-1 = ∇Hx,
IV ,
y = R’’’ R’’ R’ y’ + R’’’ R’’ Z’ + R’’’ Z’’ + Z’’’ , , 0 , ,, x partant
et partant y = a N N N ....N ; donc substituant, on aura
ux = ux – 1 + X x
ou ∆ ux – 1 = X x
yIV = R’’’ R’’ R’ R y + R’’’ R’’ R’ Z + R’’’ R’’ Z’ , 0 , ,, x 0 , ,, x −1 ∇H x ∇H x
+ R’’’Z’’ + Z’’’ a N N N ....N = a N N N .... N + P
[…] et, comme cette équation a lieu quel
yV = R IV R’’’ R’’ R’ R y + R IVR’’’ R’’ R’ Z , que soit x, on aura
+ R IV R’’’ R’’ Z’ + R IV R’’’Z’’ + R IV Z’’’ + Z IV a =a+ P […]
0 1 2 3
et généralement N N N N ...N ∆ ux = X x +1
supposons ici successivement x = 0, 1, 2, 3 etc ∇H x +1
y x = R x - 1 R x - 2…R y + R x - 1 R x - 2…R’ Z 0 1 2
+ R x - 1 R x - 2 …R’’ Z’ + R x - 1 R x - 2R’’’ Z’’ +…Zx - 1 1 0 2 1 3 2
a = a + P0 , a = a + 0P1 , a = a + 0 P1 2 […] partant, en intégrant ,
N NN NNN
Z x −1 )
ux = A + Σ X x +1 ,
Z Z'
y x = R R’ R’’…R x - 1 (A + + + …+ x −1
R RR' R R'...R x −1 a= a +Σ
0
P […] ∇H x +1
0 1 2 x −1 A étant une constante arbitraire. On a
[…]
pour plus de simplicité, je marquerai par ∇Rx – 1, le produit N N N .... N donc
R R’ R’’ …. R x – 1 , ce qui donne x −1

[p. 169] yx = ∇Hx (A + Σ ∇H x +1 )[p 74 - 75]


0 , ,, x −1 0 X x +1
y = N N N .... N ( a + Σ P
Σ ∇ZR )
x
y x = ∇Rx – 1 (A + x ) [p. 303-304] 0 1 2 x −1
N N N .... N
1ère partie 93 chapitre IV

Le mémoire contient encore une résolution de l’équation


y x = Aφ xy x - 1 + ’Aφx φx - 1 y x - 2 + ’’A φx φx - 1φx - 2y x - 3 + …
Vraisemblablement, la publication de ce mémoire dans les Mélanges de Turin a été précédée
de manuscrits portant sur le même thème, et adressés à l’Académie des Sciences de Paris39.
Le Procès Verbal du 1er septembre 1770 mentionne un rapport de Condorcet et Borda sur un
manuscrit de M. Delaplace et intitulé : Sur quelques usages du calcul intégral appliqué aux
différences finies. Le rapport évoque en préambule le mémoire de Lagrange de 1759. L’ordre
de présentation semble avoir été d’abord l’inverse de celui qui sera finalement retenu pour le
texte publié à Turin :
M. Delaplace donne généralement comme M. Delagrange toute la théorie des suites
récurrentes et il l’applique ensuite à l’intégration des équations aux différences
infiniment petites.
Le procès verbal du 17 mai 1771 mentionne un rapport de Borda et Bossut sur un texte de
Laplace intitulé cette fois : Sur le calcul intégral appliqué aux différences finies à plusieurs
variables.
Dans une lettre à Laplace écrite le 15 mars 1773, Lagrange indique qu’il n’a pas encore lu le
Mémoire en totalité, mais il décerne à l’auteur un satisfecit
…ce que j’en ai lu suffit pour me donner la plus haute estime de vos talents. Votre
théorie de l’intégration des équations linéaires à différences finies est très belle et ne
laisse, ce me semble, rien à désirer. Je ne sais si vous avez lu ce que j’en ai donné
autrefois sur cette matière dans le 1er volume des Mélanges de Turin ; je n’avais fait
alors que l’effleurer, et je me proposais toujours de l’approfondir davantage ; mais
vous venez de l’épuiser , et je suis vraiment charmé que vous ayez si bien rempli mes
engagements que j’avais contractés, à cette occasion, avec les géomètres. J’ai vu
surtout, avec beaucoup de plaisir, l’application que vous faites à ces sortes d’équations
de mon théorème sur la manière de trouver les intégrales complètes à l’aide des
particulières [Œuvres III, p. 56]
Les calculs sont un peu laborieux, les notations compliquées, aucun souci n’apparaît quant à
l’indépendance des solutions qui engendrent la solution complète, mais c’est là une façon de
faire tout à fait courante à l’époque. Au total, le mémoire contient un apport réel et original de
Laplace. Nous allons bientôt voir Lagrange donner à son tour, une nouvelle démonstration du
théorème fondamental, qui puisse s’appliquer aux deux types d’équations linéaires. Le
mémoire concerné sera publié en 1777. Lagrange fera allusion à une courte remarque sur le
même sujet, insérée dans un mémoire de Condorcet [1773a, p. 135], il reviendra sur les
travaux de Laplace avec une appréciation plus nuancée
M. le Marquis de Condorcet et M. de Laplace avaient déjà remarqué que ce théorème
sur les équations aux différences infiniment petites était aussi applicable aux cas des
différences finies ; et ce dernier en a donné une démonstration générale et ingénieuse,
mais un peu compliquée, c’est ce qui m’a engagé à traiter ici cette matière par une
méthode nouvelle et aussi simple qu’on puisse le désirer [Œuvres IV, p. 159].

Mais avant cette intervention de Lagrange, Laplace reprendra une partie du mémoire de 1771
dans Les recherches sur l’intégration des équations différentielles aux différences finies et sur
leur usage dans la théorie du hasard, publiées en 1776 par l’Académie des Sciences. Cette
fois, c’est seulement la démonstration relative aux différences finies qui est présente. À
quelques nuances près elle est semblable à celle qui a été publiée en 1771, les notations ont un
caractère plus systématique, (voir le tableau de comparaison 1-IV-d). Mais ce mémoire peut
retenir notre attention pour l’état d’esprit qu’il révèle.

39
Voir à ce sujet Ch. C. Gillispie [1997, p. 7-12 et notes (1) et (2) p. 286 et 287.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 94 chapitre IV

2.3. Un intérêt accru pour le calcul des différences


Au début des recherches sur l’intégration des équations différentielles aux différences finies
et sur leur usage dans la théorie du hasard [1776b], Laplace donne sa vision de l’évolution
des connaissances sur les suites, puis sur le calcul des différences. Le texte recèle une certaine
naïveté par la reconstruction a posteriori qu’il opère
Les premières recherches que l’on a faites sur la sommation des progressions
arithmétiques et sur les progressions géométriques renfermaient le germe du Calcul
intégral aux différences finies à une ou deux variables ; voici comment : une
progression arithmétique est une suite de termes qui croissent également, et il fallait en
trouver la somme d’après cette condition ; il est visible que chaque terme de la suite est
la différence de la somme des termes précédents , à cette même somme augmentée de ce
terme ; on se proposait donc de trouver cette somme d’après la nature de sa différence
finie ; ainsi de quelque manière qu’on y soit parvenu, on a véritablement intégré une
équation aux différences finies [Œuvres VIII, p. 69].
Puis, les suites récurrentes linéaires sont apparues
Ensuite, on a généralisé cette recherche en se proposant de trouver le terme général des
suites telles que chacun de leurs termes soit égal à plusieurs des précédents multipliés
par des constantes quelconques ; ces suites ont été nommées pour cela récurrentes. On
est parvenu d’abord à trouver leur terme général par des voies indirectes, quoique fort
ingénieuses ; on ne s’apercevait pas que cela revenait à intégrer une équation linéaire
aux différences finies ;[p. 70]
Enfin, l’apport de Lagrange est présenté comme décisif
mais, lorsqu’on eut fait cette réflexion, on essaya d’appliquer à ces équations les
méthodes connues pour les équations linéaires aux différences infiniment petites, avec
les modifications qu’exige la supposition des différences finies, et l’on résolut de cette
manière des cas beaucoup plus étendus que ceux qui l’étaient déjà.
M. Moivre est, je crois, le premier qui ait déterminé le terme général des suites
récurrentes ; mais M. de Lagrange est le premier qui se soit aperçu que cette recherche
dépend de l’intégration d’une équation linéaire aux différences finies, et qui y ait
appliqué la belle méthode des coefficients indéterminés de M . d’Alembert.[Ibid.]
On peut être seulement attentif à la naïveté du propos, on peut aussi voir affleurer la volonté
de flatter Lagrange. Mais, à l’Académie, les rapporteurs, Borda, Leroi, Duséjour, expriment,
un enthousiasme semblable, même si le registre est différent. En particulier la théorie des
probabilités a été jusqu’à présent un domaine bien difficile pour les géomètres
Les solutions qu’ils nous ont données de quelques problèmes de cette théorie supposent
de ceux qui les ont résolus beaucoup de sagacité, de pénétration et même de force de
tête. En ce qu’ils ont laissé beaucoup de choses à faire dans cette partie intéressante des
mathématiques, ce n’est point à leur génie qu’il faut s’en prendre mais aux méthodes
qu’ils ont employées, méthodes qui procédaient par voie d’induction et qui, par là ne
pouvaient manquer d’être bornées.
Mais, dans ce domaine, on peut attendre du calcul des différences la même efficacité que le
calcul différentiel ordinaire a apportée à la géométrie des courbes
M. Delaplace a eu l’idée de substituer à ces méthodes l’usage du calcul différentiel aux
différences finies et de déduire les expressions générales des probabilités de leurs
variations finies, comme par le calcul intégral ordinaire on déduit les propriétés des
courbes de la considération de leurs variations infiniment petites[PV du 31 mars 1773].

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 95 chapitre IV

3. la variation de la constante comme méthode générale


Le projet de développer les sujets abordés en 1759 à propos des suites récurrentes n’est pas
exécuté immédiatement. C’est en avril et mai 1776, que Lagrange lit à l’Académie de Berlin
un mémoire qui se présente d’emblée comme la suite des réflexions entamées en 1759. Ce
mémoire est intitulé Recherches sur les suites récurrentes dont les derniers termes varient de
plusieurs manières différentes et sur l’intégration des équations linéaires aux différences
finies et partielles et sur l’usage de ces équations dans la théorie des hasards[1777b].
Lagrange commence par rappeler le Mémoire de 1759 : il contenait une méthode nouvelle
pour traiter la théorie des suites récurrentes, en la faisant dépendre de l’intégration des
équations linéaires aux différences finies [Œuvres IV, p. 151]. Il confesse alors que d’autres
objets lui ont fait perdre celui-là de vue, et que Laplace a traité le sujet en grande partie dans
deux mémoires présentés à l’Académie de Paris 40. Mais il pense qu’on peut ajouter encore
quelque chose au travail de Laplace et traiter le même sujet d’un manière plus directe, plus
simple, et surtout plus générale [p. 152].

3.1. la variation de la constante pour la résolution des équations aux


différences finies dans les Recherches sur les suites récurrentes [1777b]

Lagrange considère d’abord une relation de récurrence


(A) A yx + B yx + 1 + C yx + 2 + ...+ N yx + n = 0,
dans la quelles les coefficients A, B, C ... sont des constantes. Il rappelle une méthode connue
qui consiste à chercher d’abord des suites sous la forme y x = α r . Les valeurs de yx dépendent
alors des racines de l’équation algébrique
A + Bα + C α 2 + ...+ N α n = 0.
Il faut traiter de façon spécifique les cas où cette équation a des racines multiples : s’il arrive
que deux ou plusieurs racines soient égales, il n’y aura qu’à supposer leur différence
infiniment petites [p. 154] et Lagrange détaille les différents cas.
Puis le problème est élargi
Si dans l’équation proposée (A) les coefficients A, B, C, ...N, au lieu d’être constants,
sont des fonctions données de x, que nous désignerons par Ax , Bx , Cx , ....Nx , en
sorte que l’on ait l’équation
(C ) Ax yx + Bx yx + 1 + Cx yx + 2 + ...+ Nx yx + n = 0
on ne pourra, par la méthode précédente ni par aucune autre méthode connue,
l’intégrer en général, à moins que’elle ne soit que du premier ordre ; mais si l’on
suppose qu’on connaisse à posteriori n valeurs particulières de yx , que nous
désignerons par αx , βx , γx ,....il est visible que l’on aura, en général
yx = a αx + b βx + c γx +...
et que cette expression sera complète puisqu’elle renferme n constantes arbitraires a,b
c, ....[p. 155]

La suite va consister à utiliser les solutions de cette équation (C), pour déterminer les
solutions d’une équation analogue mais dans laquelle intervient un second membre Xx
(fonction quelconque de x) :
(D) Ax yx + yx - 1 + Cx yx - 2 + ...+ Nx yx - n =Xx ,

40
Sur les suites récurrentes appliquées à la théorie des hasards[1774a], sur l’intégration des équations
différentiellesaux différences finies et sur leur usage dans la théorie des hasards [1776b].

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 96 chapitre IV

L’intégrale complète de cette équation va alors être déterminée selon une méthode dont le
principe est immédiatement exprimé
puisque , dans le cas de Xx = 0 , on a
yx = a αx + b βx + c γx +...
pour l’intégrale complète , a, b, c, ... étant des constantes, supposons maintenant que les
quantités a,b,c,.. soient, en général des fonctions de x que nous désignerons par ax , bx ,
cx ,... en sorte que l’intégrale (D) soit
(E) yx = ax αx + bx βx + cx γx +... [p. 156]
Le terme de rang x + 1 doit alors s’écrire
yx + 1 = ax + 1 αx + 1 + bx + 1 βx + 1 + cx + 1 γx + 1 +...
Lagrange le réécrit en désignant par la caractéristique ∆ les différences
finies » (∆ax = ax + 1 - ax )
yx + 1 = ax αx + 1 + bx βx + 1 + cx γx + 1 +...
+ αx + 1 ∆ax +βx + 1 ∆bx + γx + 1 ∆cx +...
Et il impose une condition supplémentaire :
Donc, si je fais
(1) αx + 1 ∆ax +βx + 1 ∆bx + γx + 1 ∆cx +...= 0
j’aurai
yx + 1 = ax αx + 1 + bx βx + 1 + cx γx + 1 +...
comme si les quantités ax , bx , cx n’avaient point varié. [Ibid.]
Dans cette relation, Lagrange fait varier x, en lui substituant x + 1
yx + 2 = ax + 1 αx + 2 + bx + 1 βx + 2 + cx = 1 γx + 2 +...
L’intervention des différences finies permet aussi d’écrire
yx + 2 = ax αx + 2 + bx βx + 2 + cx γx + 2 +...
+ αx + 2 ∆ax + βx + 2 ∆bx + γx + 2 ∆cx +...
Mais en imposant la condition
(2) αx + 2 ∆ax + βx + 2 ∆bx + γx + 2 ∆cx +...= 0
on peut conserver à yx + 2 la forme :
yx + 2 = ax αx + 2 + bx βx + 2 + cx γx + 2 +...
..................................................
De proche en proche, on atteint le terme de rang x + n - 1 , pour lequel la condition
(n-1) α x +n - 1 ∆ax + β x +n - 1 ∆bx + γx +n - 1 ∆cx +...= 0
permet encore d’obtenir
yx + n - 1 = ax αx + n - 1 + bx βx + n - 1 + cx γx + n - 1 +...
Faisant varier x dans cette équation, Lagrange obtient
yx + n = ax + 1 αx + n + bx + 1 βx + n + cx + 1 γx + n +...
soit
yx + n = ax αx + n + b x βx + n + cx γx + n +...
+ α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...
Pour le moment aucune condition n’est imposée aux termes qui viennent d’apparaître et qui
contiennent les différences finies. Mais les expressions obtenues pour yx , yx + 1 ,....yx + n sont
reportées dans l’équation (D) ; et Lagrange pourra disposer d’une dernière relation pour
imposer que cette équation (D) soit vérifiée
comme toutes ces valeurs excepté la dernière, sont les mêmes que si ax , bx , cx
..n’avaient pas varié, et que la dernière ne diffère de ce qu’elle serait dans cette
hypothèse que par les termes
α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 97 chapitre IV

qui y sont ajoutés ; que d’ailleurs les valeurs de yx , yx + 1 ,.... dans le cas de αx , βx ,
γx ,...constantes , satisfont par l’hypothèse à l’équation (C), quelles que soient les
valeurs de ces constantes ; il s’ensuit que le premier membre de l’équation (D) se
réduira à
Nx ( α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...)
en sorte que l’on aura l’équation
X
(n) α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...= x .
Nx
Les différences finies ∆ax , ∆bx , .....doivent vérifier un système de n équations :
(1) αx + 1 ∆ax + βx + 1 ∆bx + γx + 1 ∆cx +...= 0
(2) αx + 2 ∆ax + βx + 2 ∆bx + γx + 2 ∆cx +...= 0
...........................................................................................
(n-1) α x +n - 1 ∆ax + β x +n - 1 ∆bx + γx +n - 1 ∆cx +...= 0
X
(n) α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...= x .
Nx
Lagrange peut conclure
On a donc ainsi n équations linéaires (1), (2), (3)....(n-1), (n) entre les n quantités
∆ax , ∆bx , ∆cx ..., d’où l’on tirera les valeurs de ces quantités en fonctions de x, que je
désignerai par Px , Qx , Rx .... Donc, passant des différences aux sommes et
désignant celles-ci par la caractéristique Σ, on aura
ax = ΣPx , bx = ΣQx ,cx = Σ Rx ,....,
ce qui, étant substitué dans la formule (E), il viendra
yx = αx ΣPx + βx ΣQx + γx Σ Rx +....,
pour l’intégrale complète de l’équation (D).
Il s’ensuit de là que l’équation
Ax yx + Bx yx + 1 + Cx yx + 2 + ...+ Nx yx + n =Xx ,
est généralement intégrable toutes les fois que l’on connaît n valeurs particulières de yx,
dans le cas Xx = 0. [p. 158].

La résolution de cette équation est donc finalement reliée à la résolution de l’équation « sans
second membre » qui avait d’abord été considérée :
(C ) Ax yx + Bx yx + 1 + Cx yx + 2 + ...+ Nx yx + n = 0
Lagrange retrouve la situation qu’il a explorée, au moyen de l’adjointe, pour le cas des
équations différentielles dans le mémoire Sur la résolution de différents problèmes de calcul
intégral [1766]. Il souligne qu’il s’agit bien d’un Théorème analogue à celui [qu’il a] donné
pour les équations différentielles linéaires dans le tome III des mémoires de Turin. [p. 159 ].

3.2. Les Fragments sur les suites récurrentes de la Bibliothèque de


l’Institut
La bibliothèque de l’Institut possède des manuscrits de Lagrange, ils sont regroupés par
thèmes. L’une des liasses a pour titre Réflexions sur la formation et l’intégration des
équations différentielles [mss 911]. Elle contient notamment des fragments sur les suites
récurrentes, couvrant 24 feuillets. Par le sujet traité et par les notations utilisées, ces 24
feuillets constituent un ensemble assez homogène. Pour une large part, le contenu recoupe les
développements que nous venons de lire concernant les équations aux différences finies, tels
qu’ils ont été présentés dans le mémoire de 1777. On peut distinguer 4 parties :
1. la résolution de l’équation du premier ordre

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 98 chapitre IV

,
y = Ny + P ,
le cas où les coefficients N et P sont constants est traité en détail, il fait l’objet d’une
application au calcul des rentes viagères ;
2. la résolution de l’équation homogène à coefficients constants
, ,, n
Ay + B y + C y + …+ N y = 0 ,
dans le cas où l’« équation caractéristique » a des racines multiples ;
3. la résolution de l’équation complète
, ,, n
Ay + B y + C y + …+ N y = P ,
à partir des solutions de l’équation homogène correspondante (coefficients variables) ;
4. une procédure d’interpolation pour prolonger les solutions yx lorsque x ne prend pas des
valeurs entières.
Le point 3 est certainement le plus fondamental : il présente la méthode de variation des
constantes, comme elle est décrite dans le mémoire de 1777. Mais le manuscrit et le mémoire
restent différents. Les notations adoptées sont très nettement distinctes, et pour des calculs
équivalents, les explications ne sont pas littéralement identiques, même si elles doivent
prendre la même signification. Le point 4 n’est pas du tout représenté dans le mémoire de
1777. Sur le point 2, les méthodes utilisées sont différentes : dans le mémoire, Lagrange traite
le cas des racines doubles par un passage à la limite à partir de deux racines voisines, comme
Euler le pratique dans les Institutiones (voir ci-dessus ch. II, § 2) ; au contraire, dans le
manuscrit, il souhaite éviter un artifice de calcul qu’il juge ingénieux mais insuffisamment
rigoureux [p. 173], et il obtient le résultat par un recours direct à des fonctions dérivées. Enfin,
l’équation d’ordre un ne fait l’objet d’aucune mention particulière dans le mémoire. Dans le
manuscrit, elle est traitée de façon très détaillée. Dans la forme et dans l’esprit, ce passage se
trouve à égale distance des deux mémoires que Laplace a publiés en 1771 et 1776 et qui
traitent la même équation (voir ci-dessus le tableau du § 2.2). Quelle est la situation
chronologique de ce manuscrit par rapport aux mémoires de Laplace ? par rapport au
mémoire que Lagrange a lui-même présenté en 1775 et publié en 1777 ?
Le point 1 a un aspect heuristique : on peut l’imaginer écrit au moment où la lecture du
premier mémoire de Laplace a réveillé des réflexions amorcées dès 1759. Mais d’autre part, le
point 2 semble un perfectionnement qui vient répondre à une exigence que le mémoire de
1777 ne formulait pas. Il est donc difficile de trancher, et on ne peut pas écarter non plus
l’idée que les différents points aient été rédigés à des époques différentes.
En tout état de cause, ce manuscrit, joint aux mémoires publiés en 1759 et 1777, montre que
des calculs équivalents ont été examinés successivement avec des points de vue différents.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 99 chapitre IV

Méthode de variation de la constante Tableau 1-IV-e

Calcul des suites récurrentes Résolution des équations différentielles linéaires


équation homogène équation homogène
(C ) Ax yx + Bx yx + 1 + Cx yx + 2 + ...+ Nx yx + n = 0 dy d2y
« solution complète de (C), obtenue à partir de n valeurs particulières Py + Q + R 2 +.... = 0
dx dx
de yx : solution complète obtenue à partir de
yx = a αx + b βx + c γx +... n valeurs particulières de y : p, q, r,.....
équation avec un second membre Xx : y = ap + bq + cr +.....
(D) Ax yx + B yx + 1 + Cx yx + 2 + ...+ Nx yx + n = Xx , équation avec second membre X
dy d2y dny
recherche de la solution de (D) sous la forme : Py + Q + R 2 +....+V = X,
...(E) yx = ax αx + bx βx + cx γx +... dx dx dx n
recherche de la solution sous la forme
si les différences finies ∆ax = ax + 1 - ax , ∆bx = bx + 1 - bx,...sont y = ap + b q + cr +...
solutions du système de n équations à n inconnues : si les différentielles da, db, dc ... sont solutions du système de n
(1) αx + 1 ∆ax + βx + 1 ∆bx + γx + 1 ∆cx +...= 0 équations à n inconnues
(2) αx + 2 ∆ax + βx + 2 ∆bx + γx + 2 ∆cx +...= 0
............................................................................................ p da + q db + r dc +.....= 0
(n-1) α x +n -1 ∆ax + β x +n -1 ∆bx + γx +n
∆cx +...= 0 -1 dp da + dq db +dr dc +....= 0
X .............................................................................
(n) α x +n ∆ax + β x +n ∆bx + γx +n ∆cx +...= x . d n- 2p da + d n - 2 q db + d n - 2 r dc +...= 0
Nx X n
les suites a, b, c,... obtenues par « intégration » dn - 1p da + dn - 1 q db + dn - 1 r dc +.... =
dx
x x x
V
ax = ∑ ∆a k , bx = ∑ ∆bk , cx = ∑ ∆ck .... les fonctions a, b, c,... obtenues par intégration
k =0 k =0 k =0 permettent de résoudre l’équation sous la forme
permettent de résoudre l’équation (D) sous la forme :
yx = αx a + βx b + γx c +.... y = ap + bq + cr +.....

et les expressions de yx + j (pour j = 1, 2,...n-1) ont la même forme que et les expressions de d jy (pour j = 0,1,..n-2) ont la même forme que si
si les suites a, b, c...étaient des constantes : les fonctions a, b, c,... étaient des constantes :
yx + j = αx + j ax + βx + j bx + γx + j cx.... d jy = a d jp + b d jq +c d j r +...
1ère partie 100 chapitre IV

3.3. l’extension de la méthode au cas des équations différentielles


linéaires ordinaires.
Après avoir obtenu les résultats qui viennent d’être relatés dans le cas des équations aux
différences finies, Lagrange ouvre un long paragraphe intitulé Remarque et qui occupe 6
pages dans l’édition des Oeuvres complètes. Dans un mémoire consacré en priorité aux suites
récurrentes, il s’agit d’une digression, justifiée par le caractère général de la méthode
employée :
Les principes de la méthode précédente peuvent s’appliquer aussi aux équations
différentielles ordinaires, et sont, en général, d’un très grand usage dans tout le Calcul
intégral. Quoique que ce ne soit point le lieu de nous occuper de cette matière, je vais
néanmoins en traiter en peu de mots, me réservant de le faire ailleurs avec plus
d’étendue [Œuvres IV, p.159].
Il s’agit d’abord de l’équation linéaire d’ordre n :
dy d y
2 dny
Py +Q + R 2 +....V n = X,
dx dx dx
où P, Q, R, ...V, et X sont des fonctions données de x. On suppose
qu’on connaisse l’intégrale complète de cette équation dans le cas X = 0, laquelle sera
nécessairement de la forme
y = ap + bq + cr + ....
a, b, c,.. étant des constantes arbitraires au nombre de n, et p, q, r,.. des fonctions de x
où les constantes a, b, c,..; n’entrent pas, et qui sont autant de valeurs particulières de y
dans l’hypothèse de X = 0 [p. 159].
L’intégrale complète de la proposée va être obtenue en regardant les arbitraires a, b, c, ...
comme des variables indéterminées et en supposant nulles dans les valeurs de dy, d 2y, d 3y,....
d n - 1y, les parties qui dépendent de la variabilité de ces quantités a, b, c,..., . Le calcul est
présenté en deux colonnes, sur chaque ligne on trouve l’expression d’une différentielle
identique à ce qu’elle serait si a, b, c,... étaient des constantes., suivie dans la deuxième
colonne de la condition à imposer aux différentielles da, db, dc,..; pour qu’il en soit ainsi.
Chaque ligne s’obtient à partir de la précédente par différentiation :

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 101 chapitre IV

dy = a dp + b dq +c dr +....., 0 = p da + q db + r dc +.....,
2 2 2 2
d y = a d p + b d q + c d r +....., 0 = dp da + dq db + dr dc +.....,
d3y = a d 3p + b d 3q + c d 3r +....., 0 = d 2p da+ d 2q db+ d 2r dc +.....,
................................................... ...............................................................
d n - 1y = a d n - 1p + b d n-1 q + c d n - 1 r +..., 0 = d n- 2p da + d n - 2 q db + d n - 2 r dc +...,

L’expression de la différentielle d’ordre n se déduit de celle de la différentielle d’ordre n-1


d n y = a d n p + b d n q + c d n r + ...+ d n- 1p da + d n - 1 q db + d n - 1 r dc +...
Cette fois-ci la condition imposée aux termes qui contiennent les différentielles da, db, dc.. va
résulter de l’équation proposée. En effet
les expressions de y, dy, d 2y, d 3y,..., d n - 1 y, ont la même forme que si a, b, c, ...étaient
des constantes, et [..] celle de d n y ne diffère de ce qu’elle serait dans ce cas que par les
termes
d n- 1p da + d n - 1 q db + d n - 1 r dc +...
qui y sont ajoutés ; or comme dans le cas de a, b, c.. constantes, les valeurs de y, dy,
d 2y, d 3y,..., d n - 1 y satisfont par l’hypothèse à l’équation proposée lorsqu’on y suppose
X = 0, quelles que soient d’ailleurs les valeurs de ces constantes, il est aisé de conclure
que si l’on substitue dans cette équation les valeurs ci-dessus de y, dy, d 2y, d 3y,..., dn -
1
y, tous les termes s’y détruiront, à l’exception des termes de la valeur de d n y qui
dépendent de la variation des quantités a, b, c...., et du terme X, qui avait été supposé
auparavant nul, de sorte qu’on aura, en divisant par V, l’équation
X n
d n - 1p da + d n - 1 q db + d n - 1 r dc +.... = dx [p. 160]
V
Cette équation est jointe aux n-1 conditions
p da + q db + r dc +.....= 0 ,
dp da + dq db + dr dc +...= .0,
d 2p da + d 2q db + d 2r dc +...= 0,
...............................................................
d n- 2p da + d n - 2 q db + d n - 2 r dc +..=0,
On obtient ainsi un système linéaire dont on tirera par les règles ordinaires de l’élimination,
les valeurs des n différentielles da, db, dc, ..[p. 161] Une intégration de chacune de ces
différentielles donnera l’expression de a,b,c... qu’il suffira de substituer dans
y = ap + bq + cr + .....
Parvenu à la solution, Lagrange constate que ce qui vient d’être fait est beaucoup plus simple
que tout ce que l’on trouve dans les tomes III et IV des mémoires de Turin sur cette matière.
[p. 161] Se trouve notamment visé son propre mémoire Sur différents problèmes de calcul
intégral , contenu dans le tome III des Mémoires de Turin. Quant au tome IV, il contenait le
mémoire de Laplace dont il a déjà été rendu compte : Recherches sur le calcul intégral aux
différences infiniment petites, et aux différences finies .

3.4. le cas des équations différentielles non linéaires


Lagrange considère ensuite une équation différentielle d’ordre n qui ne soit plus
nécessairement linéaire et qu’il écrit

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 102 chapitre IV

d ny
(1) +P=0
dx n
dy d n −1 y
P étant une fonction de x, y, ,..., n −1 [p. 161].
dx dx
Et il va montrer comment tirer parti de la solution générale de cette équation pour en déduire
la solution générale d’équations de la forme
d ny
(2) +P=Π
dx n
dy d n −1 y
où Π est aussi une fonction de x, y, ,..., n −1 .
dx dx
Dans ce but, il considère l’ intégrale complète M = 0 de l’équation (1). M est alors une
fonction de x, y et de n constantes arbitraires a, b, c....De l’équation M = 0, on peut tirer
l’expression de y qui vérifie l’équation (1). Supposons que a, b, c, ... désignent maintenant
des fonctions de x et que M = 0 représente ainsi une intégrale de l’équation (2)
dans cette hypothèse, l’expression de y en x, a, b, c, ... sera la même que dans le cas de
a, b, c.. constantes, mais celles de dy, d 2y, ..., seront différentes [Ibid.]
Lagrange impose alors d’annuler les parties des différentielles dy, d 2y, ..., d n - 1 y, qui
résultent de la variabilité des quantités a,b, c, ..., [p. 162]. Et il pose les n-1 équations de
condition
dy dy dy
da + db + dc+.... = 0
da db dc
d2y d2y d2y
da + db + dc+.... = 0
dxda dxdb dxdc
..................................................................
n −1
d y d n −1y d n −1y
da + db + dc+.... = 0
dx n − 2 da dx n − 2 db dx n − 2 dc
au moyen desquelles les valeurs de ces différentielles seront encore les mêmes que si a, b, c,...
étaient constantes, de sorte qu’en substituant ces valeurs ainsi que celles de y dans la quantité
P, on aura encore la même fonction de a, b, c,… que dans le cas où les quantités, a, b, c, …
seraient constantes [p. 162].
d n −1 y
En particulier, et grâce à ces conditions, la valeur de est la même que dans le cas où a,
dx n −1
d n −1 y
b, c,.. sont constantes. La valeur de d n −1 sera alors composée de deux parties
dx
d n −1 y
1/ une partie Ydx qui est identique à ce que serait d n −1 dans la cas où a, b, c, seraient
dx
constantes, et la quantité Y vérifie l’équation (1)
Y+ P = 0
d n −1 y
2/ une seconde partie qui est égale à la variation de due aux quantités a, b, c;.. »
dx n −1
[p.. 162].
Cette quantité complémentaire est

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 103 chapitre IV

dny dny dny


n −1
da + n −1
db + n −1
dc +.... 41

dx da dx db dx dc
Pour que l’équation (2) soit vérifiée il faudra donc
d ny dny dny
da + db + dc+.... = Πdx
dx n −1da dx n −1db dx n −1dc
Lagrange peut alors conclure
Cette équation étant combinée avec les n - 1 équations de condition trouvées ci-dessus,
on aura, après avoir substitué partout les valeurs de y et de ses différentielles en x, a, b,
c,.. tirées de l’équation finie M = 0, valeurs qui sont les mêmes que dans le cas de a, b,
c, ... constantes, on aura, dis-je, n équations différentielles du premier ordre entre les n
variables a, b, c, ... et la variable x ; si donc on intègre ces équations, on aura les
valeurs de a, b, c, .. e, x, qui étant substituées dans l’équation M = 0 donneront
l’équation proposée [p. 163].
Lagrange reconnaît ensuite que l’intégration des équations en a, b, c,... sera le plus souvent
très difficile, du moins aussi difficile que l’équation proposée
d ny
+ P = Π.
dx n
Le cas d’une équation initiale linéaire fait exception à cette difficulté parce que les équations
différentielles en a, b, c,.. sont alors elles-mêmes linéaires. Et pour finir Lagrange signale un
type d’application de cette méthode qui revêt une grande importance
le grand usage de la méthode précédente est pour intégrer par approximation les
équations dont on connaît déjà l’intégrale complète à peu près, c’est -à-dire en
négligeant des quantités qu’on regarde comme très petites [p. 163].
Les explications qui suivent concernent le passage des solutions de l’équation :
d ny
+P=0
dx n
à celles de :
d ny
+P=Π
dx n
la fonction Π étant supposée très petite vis-à-vis de P [p. 163]. La méthode conduit alors à
des valeurs des différentielles de a, b, c, qui peuvent s’écrire sous la forme
da = AΠdx, db = BΠdx dc = CΠdx,...
où A,B, C... sont des fonctions finies de x, a, b, c... et Π étant une fonction de ces mêmes
quantités, mais très petite par l’hypothèse [p. 164].
da db dc
Et Lagrange en déduit que les dérivées , , ... seront aussi très petites du même
dx dx dx
ordre [p. 163], si bien que la méthode permettra d’approcher de plus en plus des vraies
valeurs de ces quantités [p. 164].

3.5. retour à la Mécanique Céleste


Dans la conclusion, Lagrange signale l’intérêt de ce type de calcul pour les applications à la
Mécanique Céleste. Et il cite les recherches sur la théorie de Saturne et Jupiter qu’il a
données dans le mémoire Sur différents problèmes de calcul intégral [1766]
41
Lagrange n’utilise pas de notation spécifique pour les dérivées partielles. Ici, il y a lieu d’interpréter les
dny ∂ny
expressions telles que da .. sous la forme da..
dx n −1da ∂x n −1∂a

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 104 chapitre IV

Il est visible au reste que cette méthode, que je ne fais qu’exposer ici en passant, peut
s’appliquer également au cas où l’on aurait plusieurs équations différentielles entre
plusieurs variables dont on connaîtrait les intégrales complètes approchées, c’est-à-
dire en y négligeant des quantités supposées très petites. Elle sera par conséquent fort
utile pour calculer les mouvements des planètes en tant qu’ils sont altérés par leur
action mutuelle, puisqu’en faisant abstraction de cette action la solution complète du
Problème est connue ; il est bon de remarquer que, comme dans ce cas les constantes
a,b, c... représentent les éléments des planètes, notre méthode donnera immédiatement
les variations de ces éléments provenantes de l’action que les planètes exercent les une
sur les autres. J’avais donné un essai de cette méthode dans mes Recherches sur la
théorie de Jupiter et de Saturne [mémoires de Turin, tome III]. Elle est présentée ici
d’une manière plus directe et plus générale ; mais je me propose de la développer
ailleurs avec plus d’étendue, et de l’appliquer à la solution de quelques Problèmes
importants sur le Système du monde [p. 165].
La méthode sera effectivement souvent présente dans ses travaux de Mécanique Céleste. Nous
savons qu’il lui donnera, en 1808, un prolongement où il introduira notamment l’usage des
« crochets de Lagrange ». Il évoquera alors la méthode de variations des constantes arbitraires,
que j’ai employée depuis longtemps [1809a, p. 722]. Et il fera référence au mémoire publié en
1777, dans lequel il l’a exposée de manière générale [Ibid.]

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 105 cconclusion

conclusion : un modèle unique pour des pratiques éparses


Lagrange est-il l’inventeur de la méthode de variation de la constante pour la résolution des
équations différentielles ?
Les travaux qui viennent d’être étudiés invitent à une réponse nuancée.

Lagrange n’est pas le premier à se servir de la méthode. Lorsque Euler rédige le mémoire sur
le flux et le reflux de la mer, Lagrange est âgé de 4 ans. Et Euler présente comme une
méthode familière le recours à l’équation homogène associée, puis la variation de la constante
qui apparaît dans la solution obtenue par ce moyen. Dans les mémoires publiés en 1759, 1762
et 1766, Lagrange étudie les équations linéaires par plusieurs autres procédés, pour lesquels il
cite souvent d’Alembert. Lorsque, pour la première fois, il utilise la variation des constantes
en Mécanique Céleste, il introduit le calcul par une locution souvent rencontrée dans les écrits
de d’Alembert. L’utilisation d’une trajectoire elliptique qui subit des déformations n’est pas
non plus une spécificité de Lagrange. Mais il réalise une adéquation complète entre les
éléments de cette trajectoire et les constantes que l’on va faire varier dans les intégrales. Et les
prolongements qu’il donne en 1809 constituent de remarquables progrès théoriques.

Par plusieurs de leurs aspects, les travaux de Lagrange sont étroitement imbriqués dans ceux
de ses contemporains et de ses prédécesseurs immédiats. L’apport propre de Lagrange est de
réinterpréter selon un même modèle des pratiques de calcul éparses. Cet apport se réalise dans
un effort pour s’élever à un niveau de connaissance théorique général.

En 1766, le théorème fondamental est obtenu par l’utilisation de l’équation adjointe. À travers
des calculs assez laborieux, la question de la réciprocité du passage à l’adjointe reste mal
éclaircie. Mais la découverte de propriétés communes aux équations linéaires est une
nouveauté, elle concerne des équations d’ordre quelconque, et elle n’englobe pas seulement le
cas où les coefficients sont constants. Une problématique se trouve posée. D’Alembert peut
intervenir en donnant une portée plus générale à des calculs qu’il pratiquait lui-même depuis
longtemps.

En 1771, Laplace apporte un prolongement à deux domaines explorés par


Lagrange : l’utilisation pour les suites récurrentes de méthodes issues du calcul différentiel et
intégral, et l’articulation entre la résolution d’une équation linéaire complète et la résolution
de l’équation homogène associée. Cette initiative relance une réflexion que Lagrange s’était
promis de poursuivre, mais qu’il avait abandonnée. La traduction pour les suites récurrentes
de méthodes utilisées jusqu’alors pour les équations différentielles a un effet en retour : elle
rend mieux perceptibles les caractères communs de calculs que l’on réalisait pour les
équations différentielles et qui vont inclure cette fois de manière claire et explicite les
questions de Mécanique Céleste.
Il faut maintenant noter d’autres circonstances qui entourent les Recherches sur les suites
récurrentes de 1777. Dans la période qui a précédé la rédaction de ce mémoire, Lagrange
avait d’autres occasions de manifester son intérêt pour les constantes qui apparaissent dans le
calcul intégral. C’est ainsi que, sur les équations aux dérivées partielles du premier ordre, il
développe un point de vue nouveau : le rôle important n’y est pas tenu par les fonctions
arbitraires, mais par les constantes. Et, simultanément, ce sont les solutions singulières des
équations différentielles qui retiennent son attention ; elles sont obtenues aussi en faisant
varier les constantes apparues dans la solution générale.

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine


1ère partie 106 cconclusion

© 2002 Tous droits réservés. http://bibliotheques.univ-lille1.fr/grisemine

Vous aimerez peut-être aussi