Vous êtes sur la page 1sur 124

Intégration géométrique des équations différentielles

non-raides ou hautement oscillantes

P. Chartier

24 février 2016
2
Table des matières

A Systèmes hamiltoniens non-raides 5


1 Cadre général et rappel sur les équations différentielles ordinaires . . . . . . . . . 7
1.1 Définition du flot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Différentiabilité du flot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Exemples de systèmes hamiltoniens . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Différentes formulations . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Les pendules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Le problème à deux corps . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Le problème à N corps (mouvement planétaire et dynamique moléculaire) 15
3 Propriétés géométriques du flot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1 Intégrales premières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2 Conservation du volume . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3 Conservation de l’énergie . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.4 Symplecticité du flot hamiltonien . . . . . . . . . . . . . . . . . . . . . . 19
3.5 Flot et dérivées de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Méthodes numériques géométriques . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.1 Quelques expériences numériques . . . . . . . . . . . . . . . . . . . . . . 29
4.2 Problème de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3 Méthodes de Runge-Kutta . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4 Méthodes de composition . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5 Analyse rétrograde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1 Idée générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.2 Développement du flot numérique . . . . . . . . . . . . . . . . . . . . . . 39
5.3 Développement de l’équation modifiée . . . . . . . . . . . . . . . . . . . 40
5.4 Propriétés de l’équation modifiée . . . . . . . . . . . . . . . . . . . . . . 45
5.5 Conservation de l’énergie . . . . . . . . . . . . . . . . . . . . . . . . . . 47
6 Formule de Baker-Campbell-Hausdorff (BCH) . . . . . . . . . . . . . . . . . . . 50
6.1 Quelques résultats préliminaires . . . . . . . . . . . . . . . . . . . . . . . 51
6.2 Etude de l’opérateur d expΩ . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3 La formule BCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.4 Application aux méthodes de splitting . . . . . . . . . . . . . . . . . . . . 59

3
4 TABLE DES MATIÈRES

B Systèmes hamiltoniens hautement oscillants 65


7 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
8 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.1 Equation logistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
8.2 Equation de Van der Pol . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.3 Pendule inversé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
9 Moyennisation au premier ordre en ε . . . . . . . . . . . . . . . . . . . . . . . . . 72
9.1 Cas périodique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9.2 Moyenisation au premier ordre en ε : remarque sur le cas général . . . . . 77
9.3 Propriétés géométriques de l’équation moyenée à l’ordre 1 (cas périodique) 78
10 Méthode de moyennisation à un ordre quelconque : cas périodique . . . . . . . . . 79
10.1 Dérivation formelle des équations de la moyennisation stroboscopique . . . 79
10.2 Rappel sur les estimations de Cauchy d’une fonction analytique . . . . . . 81
10.3 Enoncé du résultat principal de moyennisation avec reste exponentiel . . . 83
10.4 Preuves et résultats intermédiaires . . . . . . . . . . . . . . . . . . . . . . 85
10.5 Cas linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
10.6 Calcul explicite des termes du développement du champ de vecteur moyen 95
10.7 Aspects géométriques de la moyennisation à un ordre quelconque . . . . . 100
11 Méthode de moyennisation à un ordre quelconque : cas quasi-périodique . . . . . . 104
11.1 Développements en séries formelles indexées par des mots . . . . . . . . . 105
11.2 Multiplication de séries d’opérateurs-composition de séries-mots . . . . . . 108
11.3 L’équation de transport . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
11.4 Moyennisation quasi-stroboscopique . . . . . . . . . . . . . . . . . . . . . 114
11.5 Calcul des coefficients . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
11.6 Propriétés géométriques de la moyennisation stroboscopique . . . . . . . . 117
11.7 Estimations d’erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Première partie

Systèmes hamiltoniens non-raides

5
1. CADRE GÉNÉRAL ET RAPPEL SUR LES ÉQUATIONS DIFFÉRENTIELLES ORDINAIRES7

1 Cadre général et rappel sur les équations différentielles ordi-


naires
1.1 Définition du flot
Dans cette première partie, D désigne un ouvert connexe de Rn . On considère le problème de
Cauchy sous forme autonome :

ẏ(t) = f (y(t))
, (1.1)
y(t0 ) = y0

où f est une fonction définie sur D et (t0 , y0 ) un point de R × D. On suppose en outre que f
est continue et localement lipschitzienne, de sorte que pour tout (t0 , y0 ) ∈ R × D, le système
(1.1) admet une solution maximale unique sur un intervalle ouvert J(t0 , y0) ⊂ R (théorème de
Cauchy-Lipschitz). Alors, l’application

(t, t0 , y0) 7→ y(t; t0 , y0)

qui associe la valeur en t de la solution de (1.1) est bien définie sur l’ouvert

Ω = {(t, t0 , y0 ) ∈ R × R × D; t ∈ J(t0 , y0 )}.

On note en outre
Ω0 = {(t, y0 ) ∈ R × D; t ∈ J(0, y0)}

Définition 1.1 On appelle flot de l’équation différentielle (1.1) l’application :

Ω0 → Rn
(t, y0 ) 7→ ϕt (y0 ) = y(t; 0, y0)

Il est clair que ϕt (y0 ) satisfait l’équation suivante :


 d
ϕ (y ) = f (ϕt (y0 ))
dt t 0 , (1.2)
ϕ0 (y0 ) = y0

et qu’on a en outre, pour tout (t, t0 , y0 ) ∈ Ω, (t − t0 , y0) ∈ Ω0 et y(t; t0 , y0 ) = ϕt−t0 (y0 ), ce qui
justifie la définition de ϕt comme une application indépendante de t0 .
Remarque 1.2 On peut aussi définir le flot d’un système non-autonome, mais on rappelle que
tout système non-autonome peut se réécrire comme un système autonome par l’adjonction de la
variable t. L’hypothèse d’autonomie ne constitue donc pas une restriction.

Proposition 1.3 L’application (t, y) 7→ ϕt (y) de Ω0 dans Rn est continue. En particulier, pour
tout (t, y) ∈ Ω0 , il existe un voisinage V de y tel que l’application ϕt (·) soit définie et continue sur
V.
8

Proposition 1.4 On suppose que D = Rn et que f est C 1 et globalement lipschitzienne. Alors le


flot est défini sur tout R × Rn (c’est-à-dire que Ω0 = R × Rn ), et l’application

R → Diff(Rn )
t 7→ ϕt (·)

est un homomorphisme du groupe (R, +) dans le groupe (Diff(Rn ), ◦), où Diff(Rn ) est l’ensemble
des difféomorphismes de Rn dans lui-même.

Preuve. Pour tout (s, t) ∈ R2 , on a ϕs ◦ ϕt = ϕt ◦ ϕs = ϕs+t , en vertu de l’unicité de la solution de


(1.1) (Theorème de Cauchy-Lipschitz). En conséquence ϕt est une bijection, (ϕt )−1 = ϕ−t et son
inverse est continue. En anticipant sur le paragraphe suivant, on a en outre que ϕt est continûment
différentiable d’inverse continûment différentiable.

1.2 Différentiabilité du flot


Nous nous intéressons ici à la dépendance de la solution en la condition initiale, et plus
précisément à la différentiabilté du flot ϕt (y) par rapport à la variable y. En admettant que cette
différentiabilité est assurée et que les dérivations par rapport à t et y commutent, on obtient, en
dérivant l’équation différentielle satisfaite par ϕt :
∂ ∂ ∂ ∂f ∂
ϕt (y0 ) = (f (ϕt (y0 ))) = (ϕt (y0 )) ϕt (y0 ),
∂y0 ∂t ∂y0 ∂y ∂y0
c’est-à-dire encore  
d ∂ϕt ∂f ∂ϕt
(y0 ) = (ϕt (y0 )) (y0 ).
dt ∂y0 ∂y ∂y0
∂ϕt
En posant Ψt = ∂y0
(y0 ), il apparaı̂t que Ψt est solution de l’équation différentielle matricielle

Ψ̇t = ∂f
∂y
(ϕt (y0 )) · Ψt
, (1.3)
Ψ 0 = In
dite équation variationnelle associée à (1.1). Il s’agit d’un système linéaire du type

Ẏ (t) = A(t, y0 )Y (t)

où A(t, y0 ) = ∂f
∂y
(ϕt (y0 )) ne dépend pas seulement du temps t mais aussi d’un “paramètre” y0 . La
résolvante exhibe donc elle-même une dépendance en y0 , mais aucune en t0 (seul t − t0 compte),
et on la note pour cette raison S(t; y0 ). D’après la discussion précédente, on a alors
∂ϕt
S(t; y0 ) = (y0 ).
∂y0
Cette égalité est en fait justifiée rigoureusement dans le théorème suivant (donné sans démonstration,
voir le cours de L3) :
2. EXEMPLES DE SYSTÈMES HAMILTONIENS 9

Théorème 1.5 Soit f une fonction de D dans Rn continue et localement lipschitzienne, telle
que ∂f∂y
(y) existe et soit continue sur D. Alors, le flot de (1.1) est une application continûment
différentiable par rapport à y et sa dérivée Ψt (y0 ) = ∂ϕ t
∂y0
(y0 ) vérifie l’équation variationelle as-
sociée à (1.1) :
(
Ψ̇t (y0) = ∂f ∂y
(ϕt (y0 ))Ψt (y0 )
(1.4)
Ψ̇0 (y0) = In

Théorème 1.6 Si f est de classe C k sur D, alors (t, y) 7→ ϕt (y) est également de classe C k sur
Ω0 .

Preuve. Par récurrence.

2 Exemples de systèmes hamiltoniens


2.1 Différentes formulations
Un système hamiltonien est un système d’équations différentielles ordinaires dérivant d’une
fonction scalaire appelée hamiltonien. Il revêt la forme suivante :

ẏ = J −1 ∇H(y)

où H : R2n → R est une fonction régulière (au moins C 2 ) et


 
0 I
J= .
−I 0

Dans les applications à la physique, le vecteur y ∈ R2n est souvent partitionné en ses composantes
position q ∈ Rn et quantité de mouvement p ∈ Rn . On peut alors écrire y = (p, q) et le système
sous la forme :

q̇ = ∇p H(q, p),
ṗ = −∇q H(q, p).

Lorsque l’hamiltonien est séparable, i.e. qu’il peut s’écrire sous la forme

H(p, q) = T (p) + U(q)


P
où T (p) = 21 pT p = 21 ni=1 p2i est l’énergie cinétique du système et U(q) l’énergie potentielle du
système, alors le système différentiel correspondant est d’ordre 2 et peut s’écrire

q̈ = −∇q U(q).
10

2.2 Les pendules


Pendule simple

Le pendule simple est constitué d’une masse fixée à l’extrémité d’un fil sans masse, inexten-
sible et sans raideur. Cette masse supposée ponctuelle oscille sous l’effet de l’attraction terrestre.
Pour mettre en équation le mouvement, on repère la position du pendule simple par l’angle θ qu’il
fait avec la verticale orientée vers le bas. descendante. L’accélération est notée g et vaut approxi-
mativement g ≃ 9, 81 m.s−2 en unités S.I. Deux forces s’exercent sur la masse : le poids mg et la
tension T du fil, perpendiculaire au mouvement de la masse. Dans ce modèle simplifié, les frotte-
ments sont négligés. L’énergie du pendule (cinétique + potentielle) s’écrit alors en fonction de de
la longueur du fil l, de la vitesse angulaire θ̇ comme :

1 1
H(mlθ̇, lθ) = ml2 θ̇2 + mgl(1 − cos θ) = (mlθ̇)2 + mgl(1 − cos((lθ)/l)) (2.5)
2 2m

Ici, la variable position q coı̈ncide avec lθ et la variable quantité de mouvement p avec mlθ̇. Les
équations hamiltoniennes s’écrivent ainsi :

∂H
q̇ = = p/m
∂p
∂H
ṗ = − = −mg sin(q/l)
∂q

c’est-à-dire en fonction de θ uniquement

θ̈ + ω 2 sin θ = 0

où l’on a posé ω 2 = g/l.

F IGURE 1 – Le pendule simple (fichier Wikipedia http ://en.wikipedia.org/wiki/Pendulum)


2. EXEMPLES DE SYSTÈMES HAMILTONIENS 11

F IGURE 2 – Le pendule double (fichier Wikipedia http ://en.wikipedia.org/wiki/Pendulum)

Pendule double

2.3 Le problème à deux corps


Soient x1 et x2 les centres de gravité de deux corps de masses respectives m1 et m2 . La loi de
Newton s’écrit :

m1 ẍ1 = Gm1 m2 x2r−x 3
1

m2 ẍ2 = Gm1 m2 x1r−x 3


2

où r = kx1 −x2 k2 . Le corps 1 exerce sur le corps 2 une force F1→2 portée par le vecteur u = x1 −xr
2
,
m1 m2
de direction la direction de u, et de norme G r2 . Le corps 2 exerce sur le corps 1 une force F2→1
portée par le vecteur −u, de direction la direction de −u, et de norme G m1rm 2
2
. On a ainsi la figure
suivante :
m1 F2→1 F1→2 m2
✲ ✛

Soit maintenant x, le centre de gravité de (x1 , m1 ) et (x2 , m2 ) : (m1 + m2 )x = m1 x1 + m2 x2 .


En notant m = m1 + m2 , il vient alors :
m1 m2
mẍ = m1 ẍ1 + m2 ẍ2 = G (x2 − x1 + x1 − x2 ) = 0,
r3
c’est-à-dire que x(t) = ta+ b, décrit un mouvement rectiligne de direction a ∈ R3 . Pour compléter
la description du mouvement, on considère donc X = x1 − x2 . Il vient aisément :

m2
mẌ(t) = −G 3 X(t),
r
où r(t) = kX(t)k2 . Cette composante décrit un mouvement à force centrale, que nous allons
maintenant analyser.
12

Remarque 2.1 Si m2 >> m1 , alors m ≈ m2 et x ≈ x2 . Après changement de repère (à mouve-


ment rectiligne), on a x2 ≈ 0 et x1 ≈ X. C’est la situation typiquement du système terre-soleil.

Lemme 2.2 Le mouvement de X, régi par l’équation


m2
mẌ(t) = −G X(t),
r 3 (t)
où r(t) = kX(t)k2 , est un mouvement plan. Il s’effectue dans le plan perpendiculaire à n0 =
Ẋ(0) ∧ X(0) passant 1 par X(0).

Preuve. En dérivant Ẋ(t) ∧ X(t) par rapport à t, il vient


d
Ẋ(t) ∧ X(t) = Ẍ(t) ∧ X(t) + Ẋ(t) ∧ Ẋ(t)
dt
Le second terme est nul car a ∧ b = 0 dès lors que a et b sont colinéaires. Le premier donne
m
Ẍ(t) ∧ X(t) = −G 3 X(t) ∧ X(t)
r
et est donc nul pour la même raison. Il résulte que
Ẋ(t) ∧ X(t) = Ẋ(0) ∧ X(0) := n0
On a alors
d
hX(t) − X(0), n0 i = hẊ(t), n0 i = hẊ(t), Ẋ(t) ∧ X(t)i = det(Ẋ(t), Ẋ(t), X(t)) = 0
dt
par définition du produit mixte et nullité de tout déterminant dont deux colonnes sont colinéaires.
Donc X(t) − X(0) est pour tout t perpendiculaire à n0 , ce qui implique que le mouvement a lieu
dans le plan perpendiculaire à n0 passant par X(0).
Dans la suite, on suppose donc que X(t) est un vecteur de R2 qui satisfait l’équation
m2
mẌ(t) = −G X(t),
r3
où r(t) = kX(t)k2 . Nous allons désormais montrer que le mouvement de X possède les deux
invariants suivants :
2
1. l’énergie totale du système : H(t) = 21 mkẊ(t)k22 − G kX(t)k
m
, somme de l’énergie cinétique
et de l’énergie potentielle.
2. le moment angulaire du système : L(t) = det(X(t), mẊ(t))

Remarque 2.3 On peut également travailler avec l’énergie massique Hm (t) = 21 kẊ(t)k22 −
m
G kX(t)k = E(t)/m. La constante G est la constante gravitationelle. Dans le système S.I., elle
vaut G = 6, 6742867 × 10−11 m3 kg−1 s−2 .
 
u2 v3 − u3 v2
1. On rappelle que le produit vectoriel est défini par u∧v =  u3 v1 − u1 v3 . Il est bilinéaire et antisymétrique.
u1 v2 − u2 v1
2. EXEMPLES DE SYSTÈMES HAMILTONIENS 13

Lemme 2.4 Soit X(t) ∈ R2 le vecteur coordonnées du centre de gravité du système, satisfaisant

m2
mẌ(t) = −G X(t),
r3
où r(t) = kX(t)k2 . Alors, il existe des constante E0 et L0 de R telles que pour tout t ≥ 0, on a

H(t) = E0 ,
L(t) = L0 .

Preuve. En dérivant E(t) par rapport à t, il vient


d −dkX(t)k2 1
H(t) = mhẌ(t), Ẋ(t)i − G m2
dt dt kX(t)k22
p
G m2 d hX(t), X(t)i
= mhẌ(t), Ẋ(t)i +
r2 dt
G m2 dhX(t), X(t)i
= mhẌ(t), Ẋ(t)i +
2r 3 dt
G m2
= mhẌ(t), Ẋ(t)i + 2hẊ(t), X(t)i
2r 3
G m2
= hmẌ(t) + X(t), Ẋ(t)i = 0
r3
Donc H(t) = H(0) := H0 . De même, on a :
d
L(t) = det(X(t), mẌ(t)) + det(Ẋ(t), mẊ(t))
dt
G m2
= det(X(t), − 3 X(t)) = 0
r
donc L(t) = L(0) := L0 .
L’idée est alors d’exploiter l’invariance de ces deux quantités en passant en coordonnées polaires :
 
r(t) cos(θ(t))
X(t) =
r(t) sin(θ(t))

Le calcul donne, d’une part


1 1
H(t) = mkẊ(t)k22 − G m2
2 kX(t)k2
1  
= m (ṙ(t) cos(θ(t)) − r(t) sin(θ(t))θ̇(t))2 + (ṙ(t) sin(θ(t)) + r(t) cos(θ(t))θ̇(t))2
2
1
−G m2
r(t)
1   1
= m ṙ (t) + r (t)θ̇ (t) − G m2
2 2 2
2 r(t)
14

et d’autre part
L(t) = m det(X(t), Ẋ(t))
r(t) cos(θ(t)) ṙ(t) cos(θ(t)) − r(t) sin(θ(t))θ̇(t)
= m
r(t) sin(θ(t)) ṙ(t) sin(θ(t)) + r(t) cos(θ(t))θ̇(t))
= mr 2 (t)θ̇(t)
L0 L0
autrement dit, θ̇(t) = mr 2 (t)
. En remplaçant θ̇(t) par mr 2 (t)
dans l’expression de H(t), il vient alors
 2 !
1 L0 m2
m ṙ 2 (t) + r 2 (t) −G = H0
2 mr 2 (t) r
soit
L20 2m 2H0
ṙ 2 (t) + 2 2
−G =
m r (t) r m
On observe alors que θ̇(t) conserve un signe constant, celui de L0 , que l’on suppose non nul (si L0
est nul, alors Ẋ(t) et X(t) sont colinéaires pour tout t, et donc le mouvement de X est rectiligne).
On peut alors faire le changement de changement de variable t = t(θ) et exprimer l’équation en
fonction de θ. Il vient :
dr dr dθ dr L0 L0 d(1/r)
ṙ = = = 2
=−
dt dθ dt dθ mr m dθ
de sorte qu’en posant z = 1/r, on obtient finalement l’équation :
 2
dz 2Gm3 2H0 m
(θ) + z 2 (θ) − 2
z(θ) =
dθ L0 L20
Gm3
Un dernier calcul avec α = L20
β = 2HL02m et u = z − α montre que
,
0
 2
du
(θ) + u2 (θ) = α2 + β

et en dérivant par rapport à θ :
d2 u
(θ) + u(θ) = 0
dθ2
p la solution générale peut s’écrire : u(θ) = uθ0 cos(θ − θ0 ), avec la condition initiale uθ0 =
dont
± β + α2 . Ainsi, r s’écrit :
p
r(θ) =
1 ± e cos(θ − θ0 )
q
L2 2H L2
avec p = 1/α = Gm0 3 et e = 1 + m50G20 . Suivant la valeur de e, la trajectoire de X(t) est
donc une parabole, une hyperbole, ou une ellipse d’excentricité e (on peut vérifier en effet que
2H L2
1 + m50G20 > 0).
2. EXEMPLES DE SYSTÈMES HAMILTONIENS 15

2.4 Le problème à N corps (mouvement planétaire et dynamique moléculaire)


Le problème à N corps apparaı̂t dans de nombreuses applications, notamment en mécanique
céleste, avec la simulation du mouvement de 2, 3 (ou plus), planètes, ou en dynamique moléculaire,
où l’on est amené à simuler des réseaux de N particules (atomes, molécules...) soumises à des
forces d’attraction-répulsion du type Lennard-Jones. Dans ces modèles, N est généralement très
grand, typiquement de l’ordre de 106 .

Système gravitationnel
On considère donc un système à N particules de positions qi ∈ R3 et moment cinétiques
pi ∈ R3 , i = 1, . . . , N, soumises à l’attraction gravitationnelle. L’hamiltonien s’écrit alors
N
1X 1 T X
H(p, q) = pi pi + Gmi mj U(kqi − qj k)
2 i=1 mi 1≤i<j≤N

où mi désigne la masse de la particule i et U(r) = − 1r . Le système peut être aisément si-
mulé (voir http ://w3.bretagne.ens-cachan.fr/math/people/gilles.vilmart/sunjupitersaturn.html pour
le problème à trois corps Soleil-Jupiter-Saturne). Un tel système comporte trois invariants :
1. l’hamiltonien (énergie totale du système)
P
2. la quantité de mouvement totale P (p) = N i=1 pi
PN
3. le moment angulaire total L(p, q) = i=1 qi ∧ pi
La conservation de l’énergie est une propriété générale des systèmes hamiltoniens (voir ci-après).
On vérifie par ailleurs aisément la conservation des deux autres quantités en dérivant par rapport à
t. D’une part
XN XN X
d
P (p) = ṗk = −G ∇q k mi mj U(kqi − qj k)
dt k=1 k=1 1≤i<j≤N
X

= −G mi mk U (kqi − qk k)∇qk kqi − qk k
1≤i<k≤N
X
−G mi mk U ′ (kqj − qk k)∇qk kqj − qk k
1≤k<j≤N
X
= −G mi mk U ′ (kqi − qk k)∇qk kqi − qk k = 0
1≤i6=k≤N

car
1
∇qk kqi − qk k = (qk − qi ).
kqi − qk k
D’autre part
XN XN  
d 1
L(p, q) = (q̇i ∧ pi + qi ∧ ṗi ) = pi ∧ pi + qi ∧ ṗi
dt i=1 i=1
mi
16

qui s’annule là-aussi par symétrie de mi mj U(kqi − qj k).

Dynamique moléculaire

Si le potentiel gravitationnel est remplacé par le potentiel de Lennard-Jones, alors :

N
1X 1 T X
H(p, q) = pi pi + U(kqi − qj k)
2 i=1 mi 1≤i<j≤N

avec

U(r) = 4E0 (r0 /r)12 − (r0 /r)6 .

Le potentiel de Lennard-Jones est utilisé pour décrire les interactions entre deux atomes au sein
d’un gaz monoatomique de type gaz rare. Le terme (r0 /r)6 est attractif et dominant à grande dis-
tance : c’est l’interaction de Van der Waals. L’exposant 12 du terme répulsif, dominant à courte
distance, est empirique.

Pour une simulation, voir http ://w3.bretagne.ens-cachan.fr/math/people/gilles.vilmart/lennardjones.html.

3 Propriétés géométriques du flot


Dans cette partie, nous énonçons quelques propriétés géométriques du flot : il s’agit de résultats
de conservation de quantités dont l’interprétation physique est pertinente dans de nombreuses ap-
plications (voir les exemples ci-dessus).

3.1 Intégrales premières


Définition 3.1 Une fonction non constante I : Rn → R est une intégrale première de l’équation
∂I
différentielle ẏ = f (y) si pour tout y ∈ D, on a ∂y (y)f (y) = 0.

Cette définition implique que la quantité I est conservée le long de toute solution de ẏ = f (y),
quelle que soit la condition initiale associée.

Exemple 3.2 L’énergie (l’hamiltonien) d’un système hamiltonien est une intégrale première (voir
paragraphe suivant).

Exemple 3.3 Quantité de mouvement et moment angulaire dans les systèmes à N particules.
3. PROPRIÉTÉS GÉOMÉTRIQUES DU FLOT 17

3.2 Conservation du volume


Supposons que f , de classe C 1 , soit de divergence nulle, c’est-à-dire que

  n
X
∂f ∂fi
∀y ∈ D, div (f )(y) = Tr (y) = (y) = 0
∂y i=1
∂yi

Considérons alors un ensemble mesurable A de Rn pour la mesure dy et


Z
Vol(A) = dy
A

son volume. Le flot ϕt (·) considéré comme application de Rn dans Rn envoie chaque point y de A
sur un point ϕt (y) de ϕt (A) et il est naturel de considérer le volume de l’ensemble image ϕt (A), à
savoir :
Z
dy
ϕt (A)

On a alors :

Théorème 3.4 Pour un système différentiel de la forme ẏ = f (y), avec f de classe C 1 sur D telle
que divf ≡ 0, alors

Vol(ϕt (A)) = Vol(A)

pour tout ensemble mesurable A ⊂ Rn ou de manière équivalente, det(ϕ′t (y)) = 1.

∂ϕt
Preuve. Soit Ψt (y) = ∂y
(y). Ψt est solution de l’équation variationnelle

Ψ̇t (y) = ∂f ∂y
(ϕt (y))Ψt(y),
Ψ0 (y) = IRn
Pour une matrice M ∈ GLn (R), on a :
∀ H ∈ Mn (R), (dM det)H = (det M)T r(M −1 H)
En effet :
 
det(M + tH) − det(M) −1 n 1 −1
= t det(M) t det( IRn + M H) − 1
t t
= t det(M) (1 + t T r(M −1 H) + . . . + tn det(M −1 H) − 1)
−1

= det(M) T r(M −1 H) + O(t)


18

Il vient donc 2 :
d d d
det(Ψt (y)) = (dΨt det) Ψt = det(Ψt ) T r(Ψ−1 t Ψt ),
dt dt dt
= det(Ψt ) T r(Ψ−1
t (∂y f (ϕt (y))) Ψt ),
= det(Ψt ) T r(∂y f (ϕt (y))) = 0.
Ainsi, det(Ψt (y)) = det(Ψ0 (y)) = det(IRn ) = 1, et
Z Z  ∂ϕ  Z
t
dz = det (y) dy = dy.
ϕt (A) A ∂y A

3.3 Conservation de l’énergie


Dans cette sous-section et la suivante, on suppose que le système différentiel (1.1) est hamil-
tonien, c’est-à-dire qu’il peut d’écrire sous la forme

ẏ = J −1 ∇y H(y),

où H(·) est une fonction de R2n dans R et où J est la matrice de M2n (R)
 
0 In
J=
−In 0
Notons que pour un système hamiltonien, on a
∂f
divf = Tr( ) = Tr(J −1 ∇2 H) = Tr(∇2 HJ −T ) = −Tr(J −1 ∇2 H) = −divf = 0
∂y
de sorte que le flot d’un système hamiltonien préserve le volume. On a en outre :
Théorème 3.5 Soit ϕt le flot associé à un système hamiltonien. Alors, pour tout (t, y) ∈ Ω0 ,
H(ϕt (y)) = H(y).
2. On peut aussi faire un calcul direct. Soient Ψ1 , . . . , Ψn les vecteurs colonnes de Ψt et αi,j , 1 ≤ i, j ≤ n, les
coefficients de la matrice Θ = Ψ−1
t ∂y f (ϕt (y))Ψt . On a bien sûr pour tout j = 1, . . . , n

X n
d
Ψj = (∂y f (ϕt (y)))Ψj = αi,j Ψi .
dt i=1

Le déterminant étant une n-forme antisymétrique ω n , on a :


n
X n
X
d
det(Ψt ) = ω n (Ψ1 , . . . , Ψj−1 , Ψ̇j , Ψj+1 , . . . , Ψn ) = ω n (Ψ1 , . . . , Ψj−1 , αi,j Ψi , Ψj+1 , . . . , Ψn ),
dt j=1 i,j=1
Xn
= αj,j ω n (Ψ1 , . . . , Ψj−1 , Ψj , Ψj+1 , . . . , Ψn ) = T r(Θ) det(Ψt ) = det(Ψt )T r(∂y f (ϕt (y))) = 0.
j=1
3. PROPRIÉTÉS GÉOMÉTRIQUES DU FLOT 19

Preuve. Le long de toute trajectoire exacte, il vient


d ∂H
H(ϕt (y)) = ϕ̇t (y)
dt ∂y
= (∇H(ϕt (y)))T J −1 ∇H(ϕt (y))
= 0
car la matrice J est antisymétrique, i.e. J T = −J.

3.4 Symplecticité du flot hamiltonien


On considère le parallélogramme P de R2n engendré par les vecteurs
 p   p 
ξ η
ξ= q et η =
ξ ηq

dans l’espace des“phases” (p, q) :

P = {tξ + sη | 0 ≤ t, s ≤ 1}

En dimension 1, l’aire orientée de P s’écrit :


ξ p ηp
aire.orientée(P ) = = ξ pηq − ξ q ηp.
ξ q ηq

En dimension n > 1, on remplace cette expression par la somme ω(ξ, η) des aires orientées des
projections sur les plans (pi , qi ) de P :
n
X n
X
ξip ηip
ω(ξ, η) = = (ξip ηiq − ξiq ηip ).
ξiq ηiq
i=1 i=1

ω définit ainsi une forme bilinéaire antisymétrique, que l’on peut encore écrire :

ω(ξ, η) = ξ T Jη,

où J est la matrice définie précédemment.

Transformations symplectiques
Définition 3.6 Une application linéaire A : R2n → R2n (confondue une fois encore avec sa
représentation matricielle de GL2n (R)) est dite symplectique si :

AT JA = J,

c’est-à-dire de manière équivalente, si :

∀(ξ, η) ∈ R2n × R2n , ω(Aξ, Aη) = ω(ξ, η).


20

R2n−2
ξ
η

qI

pI
(ξip ηiq − ξiq ηip )

F IGURE 3 – Application ω

En dimension n = 1, la symplecticité de A ne traduit rien d’autre que la conservation des aires. En


dimension n > 1, elle traduit la conservation de la somme des aires orientées des projections sur
les plans (pi , qi ).

Définition 3.7 Une application g de U ouvert de R2n dans R2n , de classe C 1 sur U, est dite sym-
plectique si sa matrice jacobienne g ′ (y) est symplectique pour tout y de U, c’est-à-dire si :
T
∀y ∈ U, (g ′ (y)) Jg ′(y) = J,

ou de manière équivalente si :

∀y ∈ U, ∀(ξ, η) ∈ R2n × R2n , ω(g ′(y)ξ, g ′(y)η) = ω(ξ, η).

Soit M une variété bidimensionnelle de U, telle qu’il existe une “carte globale” :

M = ψ(K),

où K est un compact de R2 et ψ(s, t) un difféomorphisme de K dans M. M peut être vue comme
la limite de l’union de “petits parallélogrammes” engendrés par les vecteurs

∂ψ ∂ψ
ds et dt.
∂s ∂t
Alors, la somme des aires orientées des projections sur les plans (pi , qi ) de tous ces parallélogrammes
s’écrit :
ZZ
∂ψ ∂ψ
Ω(M) = ω( (s, t), (s, t))dsdt.
K ∂s ∂t
3. PROPRIÉTÉS GÉOMÉTRIQUES DU FLOT 21

∂ψ ∂ψ
ds dt ∂g◦ψ
∂s ∂t g ∂s
ds

R2d−2

∂g◦ψ
∂t
dt
(p0 , q0 )
g(p0 , q0 )
qI
I
q

pI pI

F IGURE 4 – Image de M par g

Théorème 3.8 Soit U un ouvert de R2n et g une application de U dans R2n , de classe C 1 . Si g est
symplectique sur U, alors elle préserve Ω(M), c’est-à-dire :

Ω(g(M)) = Ω(M)

Preuve. La sous-variété g(M) peut être paramétrée par g ◦ ψ sur K. On a donc :


ZZ
∂g ◦ ψ ∂g ◦ ψ
Ω(g(M)) = ω( (s, t), (s, t))dsdt
K ∂s ∂t
ZZ
∂ψ ∂ψ
= ω(g ′(ψ(s, t)) (s, t), g ′(ψ(s, t)) (s, t))dsdt
K ∂s ∂t
ZZ  T
∂ψ T ∂ψ
= (s, t) (g ′(ψ(s, t))) Jg ′ (ψ(s, t)) (s, t)dsdt
K ∂s | {z } ∂t
=J
= Ω(M)

Symplecticité du flot d’un système hamiltonien


On considère toujours une fonction f (y) = J −1 ∇y H(y) et le système différentiel Hamiltonian
associé.

Théorème 3.9 (Poincaré 1899) Soit H(·) une fonction de classe C 2 d’un ouvert D de R2n dans R
(telle que ∇y H(·) soit localement lipschitzienne). Alors pour tout (t, y) ∈ Ω0 , ϕt est une transfor-
mation symplectique.
∂ϕt
Preuve. La matrice Ψt (y) = ∂y
est solution de l’équation variationnelle :

Ψ̇t (y) = J −1 ∇2 H(ϕt (y))Ψt (y)
Ψ0 (y) = I2n
22

T
Or ∇2 H(ϕt (y)) est symétrique, i.e. ((∇2 H(ϕt (y))) = ∇2 H(ϕt (y)). D’où :

d 
ΨTt (y)JΨt (y) = Ψ̇Tt (y)JΨt (y) + ΨTt (y)J Ψ̇t (y),
dt
= ΨTt (y)(∇2 H)T |J −T T −1 2
| {zJ}(∇ H)Ψt (y)
{z J} Ψt (y) + Ψt (y) J
=−J −1 J=−I =I
= 0
En outre, pour t = 0 on a
ΨT0 (y)JΨ0(y) = I T JI = J
ce qui permet de conclure.

Théorème 3.10 Soit D un ouvert connexe de R2n et f une fonction C 1 de D dans R2n . On suppose
qu’il existe un t > 0 et un ouvert U simplement connexe 3 ou étoilé 4 tels que [0, t] × U ⊂ Ω0 et
que pour tout 0 ≤ s ≤ t et tout y ∈ U, ϕs (y) est symplectique. Alors, ẏ = f (y) est un système
hamiltonien sur U, c’est-à-dire qu’il existe une fonction H de classe C 2 sur U telle que

∀y ∈ U, f (y) = J −1 ∇y H(y).

Preuve. Pour tout (s, y) ∈ [0, t] × U, Ψs (y) = ∂ϕ∂y


s
est solution de l’équation variationnelle :

Ψ̇s (y) = f ′ (ϕs (y))Ψs (y)
Ψ0 (y) = I2n
En différentiant, il vient :
d   
T T ′ T ′
Ψ (y)JΨs(y) = Ψs (y) (f (ϕs (y))) J + Jf (ϕs (y)) Ψs (y)
ds s
En écrivant l’égalité pour s = 0 et en tenant compte de J T = −J, on voit que Jf ′ (y) doit être
symétrique pour tout y ∈ U. Donc Jf ′ (y) = ∇y H(y) d’après le lemme d’intégrabilité détaillé
ci-après.

Lemme 3.11 (Lemme d’intégrabilité) Soit U un ouvert de R2n et f : U → R2n une fonction de
classe C 1 , telle que f ′ (y) soit symétrique pour tout y ∈ U. Alors, pour tout y0 de D, il existe un
voisinage V(y0 ) et une fonction H définie sur V(y0 ) telle que :

∀ y ∈ V(y0 ), f (y) = ∇y H(y). (3.6)


3. On rappelle qu’un ouvert simplement connexe est un ouvert dans lequel tout lacet peut être réduit continûment
(c’est-à-dire par homotopie) à un point.
4. Un ouvert U de R2n est dit étoilé par rapport à un point y0 si, pour tout point y de U , le segment [y0 , y] est
contenu dans U .
3. PROPRIÉTÉS GÉOMÉTRIQUES DU FLOT 23

Preuve. Soit B0 ⊂ U une boule de centre y0 contenue dans U. On définit H sur B0 par :
Z 1
H(y) = (y − y0 )T f (y0 + t(y − y0 ))dt.
0

Il vient alors, en utilisant la symétrie de f ′ (y) :


Z 1
∂H ∂f
(y) = fj (y0 + t(y − y0 )) + t(y − y0 )T (y0 + t(y − y0 ))dt
∂yj 0 ∂yj
Z 1
= fj (y0 + t(y − y0 )) + t(y − y0 )T (∇y fj )(y0 + t(y − y0 ))dt
0
Z 1
d
= (tfj (y0 + t(y − y0 ))) dt
0 dt
= fj (y)

Remarque 3.12 Lorsque l’ouvert considéré est étoilé par rapport à l’un de ses points y0 ∈ U,
alors on peut définir H sur tout U.

Remarque 3.13 Dans le cas général d’un ouvert quelconque, le résultat du théorème 3.10 est
faux. Considérons par exemple le système :
 p
ṗ = p2 +q 2
q (3.7)
q̇ = p2 +q2

défini sur U = {(p, q) ∈ R2 ; (p, q) 6= (0, 0)}. Pour (p0 , q0 ) ∈ U, le flot s’écrit :
 
p0
ϕt (p0 , q0 ) = α(t, r0 ) ,
q0
p p
avec α(t, r0 ) = 1 + 2t/r02 et r0 = p20 + q02 . Sa dérivée ∂(p∂ϕ t
0 ,q0 )
est de la forme :
  " #
p2
∂ϕt (∂p0 α)p0 + α (∂q0 α)p0 (∂r0 α) r00 + α (∂r0 α) pr00q0
= = q2 .
∂(p0 , q0 ) (∂p0 α)q0 (∂q0 α)q0 + α (∂r0 α) pr00q0 (∂r0 α) r00 + α

C’est une matrice symplectique si α2 + αr0 (∂r0 α) = 1, ce qui se vérifie par un simple calcul.
Localement, on peut écrire le système comme un système hamiltonien. Par exemple, dans le demi-
plan p > 0, on peut prendre H(p, q) = − arctan pq et vérifier que :

1 1 p
−∇q H(p, q) = q 2 = = ṗ (3.8)
p 1+ 2 p + q2
2
p
q 1 q
∇p H(p, q) = 2 2 = = q̇ (3.9)
p 1+ 2 q p + q2
2
p
24

δ(t)
δ0

F IGURE 5 – Symplecticité du flot de (3.7) : conservation de l’aire

A contrario, supposons qu’il existe un H de classe C 2 sur U, tel que le champ de vecteur f (p, q) =
(p2 + q 2 )−1 [p, q]T s’écrive f (p, q) = J −1 ∇p,q H(p, q). Considérons alors la forme différentielle

ωp,q = f2 (p, q)dp − f1 (p, q)dq (3.10)

et calculons son intégrale le long du chemin Γ paramétré par (p, q) = (cos(θ), sin(θ)) :
Z Z 2π   Z 2π
− sin(θ)
ω= ωcos(θ),sin(θ) dθ = (− sin2 (θ) − cos2 (θ))dθ = −2π
Γ 0 cos(θ) 0

Or on aurait par ailleurs ωp,q = (∂p H)(p, q)dp + (∂q H)(p, q)dq = dH dont l’intégrale sur Γ est
nulle. H ne peut donc pas être défini sur tout U. L’hypothèse de simple connexité est essentielle
pour cela.

L’une des propriétés fondamentales des transformations symplectiques est qu’elles préservent la
structure hamiltonienne. Plus encore, c’est une propriété caractéristique. On a en effet le théorème
suivant :
Théorème 3.14 Soit Ψ un difféomorphisme d’un ouvert U de R2n dans V = Ψ(U). Alors, si Ψ
est symplectique, le système hamiltonien

ẏ = J −1 ∇y H(y)

s’écrit dans les variables z = Ψ(y) :

ż = J −1 ∇z K(z) (3.11)

avec K(z) = (H ◦ Ψ−1 )(z). Réciproquement, si Ψ transforme tout système d’hamiltonien H en


un système hamiltonien d’hamiltonien K = H ◦ Ψ−1 , alors Ψ est symplectique.
Preuve. En dérivant z par rapport à t, il vient :
ż = Ψ′ (y)ẏ = Ψ′ (y)J −1∇y H(Ψ−1(z)).
3. PROPRIÉTÉS GÉOMÉTRIQUES DU FLOT 25

Or on a, en omettant les arguments des fonctions, ∇y H = (∂y (K ◦ Ψ))T = ((∂z K)(∂y Ψ))T =
(Ψ′ )T (∇z K). D’où :
ż = Ψ′ (Ψ−1 (z))J −1 (Ψ′ (Ψ−1 (z)))T ∇z K(z). (3.12)
Si Ψ est symplectique, (Ψ′ )T J(Ψ′ ) = J, donc Ψ′ J −1 (Ψ′ )T = J −1 et
ż = J −1 ∇z K(z).
Réciproquement, si le système en z (3.12) est hamiltonien pour tout K, alors Ψ′ J −1 (Ψ′ )T = J −1
donc (Ψ′ )T J(Ψ′ ) = J et Ψ est symplectique.

3.5 Flot et dérivées de Lie


Dans cette partie, nous nous intéressons à la composition de flots associés à des fonctions f1 et
f2 différentes. Il est en effet naturel, dans un certain nombre de situations, de considérer les flots
ϕ1t et ϕ2t associés à chacun des termes de la somme f = f1 + f2 de deux fonctions de Rn and Rn ,
supposées toutes deux continues et localement lipschitziennes sur un ouvert connexe D.

Représentation exponentielle du flot.


Définition 3.15 Soit f une fonction C 1 (D, Rn ). L’opérateur dérivée de Lie Lf est défini par :
 
∂·
Lf = f,
∂y

au sens où, si g une fonction de C 1 (D, Rm ), on a :


 
∂g
n
∀ y ∈ R , Lf [g](y) = (y) f (y) = g ′ (y)f (y)
∂y

Si f et g sont supposées de classe C ∞ , alors on peut itérer l’opérateur Lf et considérer ses puis-
sances Lkf en définissant
Lk+1 k
f [g] = Lf [Lf [g]], k = 1, . . . , ∞

On obtient par exemple :

L2f [g] = Lf [g ′ f ] = (g ′f )′ f = g ′′ (f, f ) + g ′f ′ f


L3f [g] = g ′′′ (f, f, f ) + 3g ′′(f ′ f, f ) + g ′ f ′′ (f, f ) + g ′f ′ f ′ f

Par ailleurs, il vient successivement


d
g(ϕt (y)) = g ′(ϕt (y))ϕ̇t(y) = g ′(ϕt (y))f (ϕt(y)) = Lf [g](ϕt (y))
dt
d2 ′′ ′ ′ d
g(ϕ t (y)) = g ( ϕ̇ t (y), f ) + g f ϕ̇ t (y) = Lf [ g(ϕt(y))] = L2f [g](ϕt (y))
dt2 dt
26

où l’argument ϕt (y) de g ′′, f ′ et f a été omis dans la seconde ligne pour alléger les notations, et
plus généralement

dk
k
g(ϕt(y)) = (Lkf [g])(ϕt (y))
dt
de sorte que le développement en série de Taylor de g(ϕt (y)) en t = 0 s’écrit :
X tk
g(ϕt (y)) = (Lkf [g])(y) = exp(tLf )[g](y),
k≥0
k!

et pour g(y) = y :

ϕt (y) = exp(tLf )[Id](y)

Notons que la série converge si f est analytique.

Remarque 3.16 L’opérateur Lf fait apparaı̂tre la dérivée première de son argument g et est dit
d’ordre 1 pour cette raison. Le k-ième itéré de Lf fait apparaı̂tre la dérivée k-ième de son argument
g et est dit d’ordre k.

Composition de flots et opérateur dérivée de Lie.


Considérons maintenant le cas de deux fonctions f1 et f2 de C 1 (D, Rn ). Les dérivées de Lie
associées peuvent être appliquées l’une après l’autre. Par exemple, on a

(Lf1 Lf2 )[g] = Lf1 [Lf2 [g]] = g ′′(f1 , f2 ) + g ′ f2′ f1


(Lf2 Lf1 )[g] = Lf2 [Lf1 [g]] = g ′′(f2 , f1 ) + g ′ f1′ f2

d’où il apparaı̂t clairement que les opérateurs Lf1 et Lf2 ne commutent pas en général. Les deux
opérateurs Lf1 Lf2 et Lf2 Lf1 sont d’ordre 2, mais de manière remarquable,

Lf1 Lf2 − Lf2 Lf1 est d’ordre un !

puisque le terme g ′′ (f1 , f2 ) = g ′′(f2 , f1 ) disparaı̂t.


La composition des flots ϕ1s et ϕ2t peut alors s’écrire (formellement ) comme :

(ϕ2t ◦ ϕ1s )(y) = exp(sLf1 ) exp(tLf2 )[Id](y). (3.13)

Les opérateurs apparaissent dans l’ordre inverse car (3.13) s’obtient en considérant g(y) = ϕ2t (y) et
en développant g(ϕ1s (y)). Les séries considérées sont des séries formelles, en général non conver-
gentes, car les opérateurs Lf1 et Lf2 sont non bornés. Par ailleurs, si Lf1 et Lf2 ne commutent pas,
alors
exp(sLf1 ) exp(tLf2 ) 6= exp(sLf1 + tLf2 ).
3. PROPRIÉTÉS GÉOMÉTRIQUES DU FLOT 27

Cependant, on peut formellement procéder à l’identification exp(sLf1 ) exp(tLf2 ) = exp(L(s, t))


avec

s2 t st2
L(s, t) = sLf1 + tLf2 + st[Lf1 , Lf2 ] + [Lf1 , [Lf1 , Lf2 ]] + [Lf , [Lf2 , Lf1 ]] + . . . (3.14)
12 12 2

où [Lf1 , Lf2 ] = Lf1 Lf2 − Lf2 Lf1 . Cette identification devient rigoureuse si elle est interprétée
comme l’identification de développements de Taylor au voisinage de s = t = 0. Les termes
suivants du développement sont donnés par la formule Baker-Campbell-Hausdorff (BCH). La for-
mule (3.14) conduit à penser que si [Lf1 , Lf2 ] = 0, alors les flots ϕ1s et ϕ2t commutent. Le résultat
est vrai mais ne peut être démontré à partir de (3.14) puisque les séries considérées ne sont pas
convergentes.

Théorème 3.17 Soient f1 et f2 deux champs de vecteurs de C 1 (D, Rn ). La composition des flots
ϕ1s et ϕ2t est commutative si et seulement si
  
∂· ∂f1 ∂f2
[Lf1 , Lf2 ] = f2 − f1 = 0.
∂y ∂y ∂y

Preuve. Quitte à reparamétriser s en multipliant f1 par une constante (ce qui ne change rien à la
nullité du crochet de Lie), on peut considérer s = t. La loi de groupe ϕ1t ◦ ϕ1s = ϕ1t+s = ϕ1s ◦ ϕ1t
donne par dérivation par rapport à t
ϕ̇1t ◦ ϕ1s = ∂y (ϕ1s ) ◦ ϕ1t · ϕ̇1t
i.e.
f1 ◦ ϕ1t ◦ ϕ1s = ∂y (ϕ1s ) ◦ ϕ1t · (f1 ◦ ϕ1t )

et donc pour t = 0
f1 ◦ ϕ1s = ∂y (ϕ1s ) · f1 .

Montrons la relation similaire suivante


(∂y ϕ1t ) · f2 = f2 ◦ ϕ1t .
On a par dérivation à nouveau
d 
(∂y ϕ1t ) · f2 − f2 ◦ ϕ1t = (∂y ϕ̇1t ) · f2 − ∂y f2 ◦ ϕ1t · ϕ̇1t
dt
= ∂y f1 ◦ ϕ1t · ∂y ϕ1t · f2 − ∂y f2 ◦ ϕ1t · f1 ◦ ϕ1t
= ∂y f1 ◦ ϕ1t · ∂y ϕ1t · f2 − ∂y f1 ◦ ϕ1t · f2 ◦ ϕ1t
 
1 1 1
= ∂y f1 ◦ ϕt · (∂y ϕt ) · f2 − f2 ◦ ϕt
où l’on a utilisé la nullité du crochet de Lie et remplacé ∂y f2 · f1 par ∂y f1 · f2 . Donc la fonction
w(t) := (∂y ϕ1t ) · f2 − f2 ◦ ϕ1t satisfait une équation différentielle linéaire avec condition initiale
28

w(0) = f2 − f2 = 0. Elle est donc constamment nulle. Il vient maintenant


d 1
(ϕ ◦ ϕ2t ) = (ϕ̇1t ) ◦ ϕ2t + (∂y ϕ1t ) ◦ ϕ2t · ϕ̇2t
dt t
= f1 ◦ ϕ1t ◦ ϕ2t + (∂y ϕ1t ) ◦ ϕ2t · f2 ◦ ϕ2t
= (f1 + f2 ) ◦ (ϕ1t ◦ ϕ2t )
La même relation est satisfaite par ϕ2t ◦ ϕ1t . Les fonctions ϕ2t ◦ ϕ1t et ϕ1t ◦ ϕ2t satisfont donc la même
équation différentielle avec la même condition initiale ϕ20 ◦ ϕ10 = ϕ10 ◦ ϕ20 = id, donc par unicité
sont égales.
Réciproquement, supposons que ϕ1s ◦ ϕ2t = ϕ2t ◦ ϕ1s . Alors, en dérivant deux fois, il vient
d2 1
ϕ ◦ ϕ2t = f1′ ◦ ϕ1s ◦ ϕ2t · (ϕ1s )′ ◦ ϕ2t · f2 ◦ ϕ2t
dsdt s
soit pour s = t = 0,
d2 1
ϕ ◦ ϕ2t = f1′ f2 .
dsdt s s=t=0

De même,
d2 2
ϕt ◦ ϕ1s = f2′ f1 .
dsdt s=t=0

La condition de commutation implique donc que f1′ f2 = f2′ f1 .

Preuve. [Preuve alternative] Quitte à reparamétriser s en multipliant f1 par une constante (ce qui
ne change rien à la nullité du crochet de Lie), on peut considérer s = t. On remarque tout d’abord
que, d’après la formule (3.14), pour tout y de Rn , et pour h > 0 suffisament petit :
(ϕ2h ◦ ϕ1h − ϕ2h ◦ ϕ1h )(y) = O(h3 ) (3.15)
où la constante contenue dans O est obtenue par majoration des dérivées sur un compact contenant
(ϕ2u ◦ ϕ1v )(y) et (ϕ1v ◦ ϕ2u )(y) pour tout 0 ≤ u, v ≤ t. Prenons h = t/N. Il vient :
ϕ2t ◦ ϕ1t = ϕ2t−h ◦ ϕ2h ◦ ϕ1h ◦ ϕ1t−h
= ϕ2t−h ◦ ϕ1h ◦ ϕ2h ◦ ϕ1t−h + O(h3 )
= ϕ2t−h ◦ ϕ12h ◦ ϕ2h ◦ ϕ1t−2h + 2O(h3 )
= ···
= ϕ2t−h ◦ ϕ1N h ◦ ϕ2h + NO(h3 ).
En répétant l’opération N fois, on obtient :
(ϕ2t ◦ ϕ1t − ϕ1t ◦ ϕ2t ) = N 2 O(h3 ) = O(1/N) (3.16)
4. MÉTHODES NUMÉRIQUES GÉOMÉTRIQUES 29

4 Méthodes numériques géométriques


4.1 Quelques expériences numériques
Oscillateur harmonique
On considère l’hamiltonien
1
H(p, q) = (p2 + ω 2q 2 )
2
et les équations correspondantes :

ṗ = − ∂H
∂q
= −ω 2 q
.
q̇ = ∂H
∂p
= p

La trajectoire exacte est une ellipse dans l’espace des phases (p, q) qui dépend des conditions
initiales. On teste maintenant le comportement qualitatif de trois schémas numériques :
1. Méthode d’Euler explicite :

pi+1 = pi + h(−ω 2 qi ) = pi + (−hω 2 )qi
qi+1 = qi + h(pi ) = hpi + qi

2. Méthode d’Euler implicite :


 1 −hω 2
pi+1 = pi + h(−ω 2 qi+1 ) = p
1+h2 ω 2 i
+ q
1+h2 ω 2 i
h 1
qi+1 = qi + h(pi+1 ) = p
1+h2 ω 2 i
+ q
1+h2 ω 2 i

3. Méthode du point milieu :


( 1−h2 ω 2 /4 −hω 2
pi+1 = pi + h(−ω 2 qi+12+qi ) = p
1+h2 ω 2 /4 i
+ q
1+h2 ω 2 /4 i
1−h2 ω 2 /4
qi+1 = qi + h( pi+12+pi ) = h
p
1+h2 ω 2 /4 i
+ q
1+h2 ω 2 /4 i

Tous ces schémas prennent la forme (particulièrement simple ici en raison du caractère linéaire du
problème) suivante :
   
pi+1 pi
= M(hω)
ωqi+1 ωqi

L’analyse des valeurs propres λ1,2 de M(hω) montre que :


1. Pour Euler explicite, λ1,2 = (1 ± ihω), de sorte que l’énergie s’accroı̂t.
2. Pour Euler implicite, λ1,2 = (1 ± ihω)−1 , de sorte que l’énergie décroı̂t.
3. Pour le point milieu, M(hω) est orthogonale, de sorte que l’énergie est préservée.
30

Explicit Euler (green), Midpoint Rule (red), Implicit Euler (blue)


3

0
v

−1

−2

−3
−3 −2 −1 0 1 2 3
u

F IGURE 6 – Trois solutions numériques de l’oscillateur harmonique

4.2 Problème de Kepler

1 1 2 1
H(p1 , p2 , q 1 , q 2 ) = [(p ) + (p2 )2 ] − p ,
2 (q 1 )2 + (q 2 )2
= T (p) + V (q).
Le système différentiel correspondant est donc de la forme :

ṗ = − ∂H = −V ′ (q)
∂q
⇐⇒ q̈ = −V ′ (q)
q̇ = ∂H∂p
= p
La trajectoire exacte est une ellipse pour H < −0.5 dans l’espace des phases qui dépend des
conditions initiales. La figure 7 démontre clairement que la méthode du point milieu (qui est sym-
plectique comme on le verra) se comporte de bien meilleure façon que les deux autres.

4.3 Méthodes de Runge-Kutta


Pour un système différentiel de la forme ẏ = f (y), une méthode de Runge-Kutta s’écrit
 Ps

 Y 1 = y i + h j=1 a1j f (Yj )

 ..
. Ps

 Y s = y i + h a f (Yj )

 y Psj=1 sj
i+1 = yi + h j=1 bj f (Yj )

Elle est donc déterminée par la donnée des coefficients A = (aij ) ∈ Rs×s et b = (bj ) ∈ Rs . Pour
un système différentiel de la forme

ṗ = f (p, q),
(4.17)
q̇ = g(p, q),
4. MÉTHODES NUMÉRIQUES GÉOMÉTRIQUES 31

Midpoint Rule Euler explicit/implicit Energy


2 3 0

1.5 −1
2

1 −2

1
0.5 −3
q2

q2

H
0 0 −4

−0.5 −5
−1

−1 −6

−2
−1.5 −7

−2 −3 −8
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 0 50 100 150 200 250 300 350 400 450
q1 q1 Time

F IGURE 7 – Solutions du problème de Kepler (pas h = 0.01 pour Euler, 0.1 pour le point milieu).

on peut utiliser deux jeux de coefficients :


 P
 Pi = pk + h sj=1 aij f (Pj , Qj ), i = 1, · · · , s

 Q P
i = qk + h sj=1 âij g(Pj , Qj ), i = 1, · · · , s
P (4.18)

 pk+1 = pk + h sj=1 bj f (Pj , Qj )
 P
qk+1 = qk + h sj=1 b̂j g(Pj , Qj )

Définition 4.1 Soit une méthode de Runge-Kutta partitionnée de coefficients A, Â, b, b̂. Pour |h|
suffisamment petit, les équations précédentes définissent une fonction “flot numérique” Φh , telle
que yi+1 = Φh (yi ) définit la solution approchée. Si cette fonction est symplectique dès lors que le
système est hamiltonien, alors la méthode est dite symplectique.

Remarque 4.2 La méthode est explicite lorsque A et  sont triangulaires inférieures strictes.

Préservation des invariants linéaires


Lorsque le système différentiel admet un invariant affine de la forme I(y) = cT y + b, alors cet
invariant est préservé par toute méthode de Runge-Kutta partitionnée ou non. En effet, pour tout
y ∈ Rn , (∇I(y))T f (y) = 0, de sorte que
s
X
T T
I(yi+1 ) = b + c yi+1 = b + c yi + h bj cT f (Yj ) = I(yi ).
j=1

Préservation des invariants quadratiques


Lemme 4.3 Une méthode de Runge-Kutta partitionnée de coefficients A, Â, b, b̂ appliquée au
système (4.17) conserve les invariants quadratiques, i.e. les invariants de la forme

Q(p, q) = pT Cq,
32

si les conditions suivantes

B ÂT + AB̂ − bb̂T = 0,


b = b̂,

où B = diag(b) et B̂ = diag(b̂), sont satisfaites. Si en outre dans (4.17), f ne dépend que de q et
g ne dépend que de p, alors la première condition est suffisante.

Preuve. En utilisant les équations (4.18), on obtient :


!T !
X X
Q(p1 , q1 ) = p0 + h bj f (Pj , Qj ) C q0 + h b̂j g(Pj , Qj ) ,
j j
X 
= pT0 Cq0 + h bj f T (Pj , Qj ) C q0 + b̂j pT0 C g(Pj , Qj ) .
j
X
+h2 bj b̂k f T (Pj , Qj ) C g(Pk , Qk ).
j, k

Or
X
p0 = P j − h ajk f (Pk , Qk ), j = 1, . . . , s,
k
X
q0 = Qj − h âjk g(Pk , Qk ), j = 1, . . . , s,
k

donc
X 
Q(p1 , q1 ) = pT0 Cq0 + h bj f T (Pj , Qj ) C Qj + b̂j PjT C g(Pj , Qj )
j | {z }
terme nul car f T (p,q)Cq+pT Cg(p,q)=0
X 
−h2 bj âj k f T (Pj , Qj ) C g(Pk , Qk ) + b̂j aj k f T (Pk , Qk ) C g(Pj , Qj )
j, k
X 
+h2 bj b̂k f T (Pj , Qj ) C g(Pk , Qk )
j, k
X 
= pT0 Cq0 −h 2
bj âj k + b̂k ak j − bj b̂k f T (Pj , Qj ) C g(Pk , Qk )
j, k | {z }
=0 par hypothèse

Finalement, Q(p1 , q1 ) = Q(p0 , q0 ). Il reste à remarquer que si f ne dépend pas de p et si g ne


dépend pas de q, alors l’invariance de pT Cq se traduit par
f T (q)Cq + pT Cg(p) = 0 (4.19)
ce qui implique que f T (q)Cq = pT Cg(p) = 0. La seconde condition est alors superflue.
4. MÉTHODES NUMÉRIQUES GÉOMÉTRIQUES 33

Préservation des invariants polynomiaux de degré au moins 3


On considère le système différentiel matriciel suivant :

Ẏ = MY, Y (0) = In ∈ M(Rn )

D’après le théorème 3.4, si Tr(M) = 0, alors det(Y (t)) = det(Y (0)) = 1 pour tout t ∈ R. Dès
que n ≥ 3, det Y est donc un invariant polynomial de degré au moins 3. Nous allons montrer
qu’aucune méthode de Runge-Kutta ne peut conserver cet invariant génériquement, c’est-à-dire
pour toute matrice M.

Lemme 4.4 Soit z 7→ R(z) une fonction analytique au voisinage de z = 0, satisfaisant R(0) = 1
et R′ (0) = 1. Soit n ≥ 3. Alors les deux assertions suivantes sont équivalentes :
1. ∀M ∈ M(Rn ), Tr(M) = 0 ⇒ det(R(M)) = 1
2. ∀z ∈ C, R(z) = exp(z)

Preuve. Il est clair que 2. implique 1., car la solution de l’équation différentielle en t = 1 est
donnée par
Y (1) = etM t=1 = R(M)
et d’après le théorème 3.4, 1 = det(Y (0)) = det(Y (1)) = det(R(M)). Montrons maintenant la
réciproque : pour M = Diag(ν, µ, −ν − µ, 0, . . . , 0) on a
R(M) = Diag(R(ν), R(µ), R(−ν − µ), 1, . . . , 1),
de sorte que 1 = det(R(M)) = R(ν)R(µ)R(−ν − µ). Pour ν = 0, on obtient R(−µ) = 1/R(µ),
puis
R(ν)R(µ) = R(ν + µ).
La fonction z 7→ R(z) est donc un morphisme de groupe de (C, +) dans (C, ×) satisfaisant R(0) =
R′ (0) = 1, donc R(z) = exp(z).

Théorème 4.5 Une méthode de Runge-Kutta consistante (d’ordre au moins 1) ne peut pas conser-
ver les invariants polynomiaux de degrés d ≥ 3.

Preuve. Soit une méthode de Runge-Kutta de coefficients (A, b). Appliquée au système matriciel
Ẏ = MY , la méthode s’écrit simplement :
Xs
Yk,i = Yk + hM aij Yk,j , i = 1, . . . , s
j=1
Xs
Yk+1 = Yk + hM bj Yk,j ,
j=1

de sorte que
Yk+1 = R(hM)Yk ,
34

avec R(z) = 1 + zbT (In − zA)−1 1. On a R(0) = 1 et la méthode étant consistante, R′ (0) = bT 1 =
1. Si la méthode de Runge-Kutta conserve les invariants de degrés d ≥ 3, alors elle satisfait la
proposition 1. du lemme précédent, et donc R(z) = exp(z), ce qui entre en contradiction avec la
forme rationnelle de R(z) obtenue ci-dessus.

Caractérisation des méthodes de Runge-Kutta symplectiques


Lemme 4.6 Pour une méthode de Runge-Kutta (partitionnée ou non), le diagramme suivant com-
mute :
∂/∂y0
ẏ = f (y), y(0) = y0 → ẏ = f (y), y(0) = y0
Ψ̇ = f ′ (y)Ψ, Ψ(0) = I
↓ ↓
méthode méthode
↓ ↓
∂/∂y0
{yk } → {yk , Ψk }
Preuve. Considérons une méthode de Runge-Kutta R non-partitionnée de coefficients A et b.
Appliquée à l’équation

ẏ = f (y)
(4.20)
y(0) = y0
la méthode R conduit à la récurrence
 P
yk+1 = yk + h j bj f (Yj ),
P (4.21)
Yi = yk + h j aij f (Yj ), i = 1, . . . , s.
En différentiant cette relation par rapport à y0 , il vient alors :
 P
∂y0 yk+1 = ∂y0 yk + h j bj f ′ (Yj ) ∂y0 Yj
P (4.22)
∂y0 Yi = ∂y0 yk + h j ai,j f ′ (Yj ) ∂y0 Yj , i = 1, . . . , s
De même, R appliquée au système


 ẏ = f (y)

Ψ̇ = f ′ (y)Ψ
(4.23)

 y(0) = y0

Ψ(0) = IRn
donne :
 P

 yk+1 = yk + h j bj f (Yj )
 Ψ P
k+1 = Ψk + h j bj f ′ (Yj ) Ψk,j
P (4.24)

 Y i = yk + h j aij f (Yj ), i = 1, . . . , s
 P
Ψk,i = Ψk + h j aij f ′ (Yj ) Ψk,j , i = 1, . . . , s
Donc si Ψk = ∂y0 yk , les équations coincident et Ψk+1 = ∂y0 yk+1. On conclut en remarquant que
Ψ(0) = IRn = ∂y0 y0 . Les calculs pour une methode partitionnée sont identiques.
4. MÉTHODES NUMÉRIQUES GÉOMÉTRIQUES 35

On est maintenant en mesure d’énoncer et de démontrer partiellement la caractérisation sui-


vante des méthodes de Runge-Kutta symplectiques.
Théorème 4.7 Soient A, Â, b, b̂, les coefficients d’une méthode de Runge-Kutta partitionnée. Alors
la méthode est symplectique si et seulement si

B ÂT + AB̂ − bb̂T = 0,


b = b̂,

avec B = diag(b), B̂ = diag(b̂). Si l’hamiltonien est séparable, i.e. H(p, q) = T (p) + V (q), la
première condition est nécessaire et suffisante.
Preuve. Pour démontrer que la condition est nécessaire, il suffit d’interpréter la condition de
symplecticité comme un invariant quadratique. Pour un système hamiltonien

ẏ(t) = J −1 ∇H(y(t))
(4.25)
y(0) = y0
on a en effet
d T
(Ψ JΨt ) = 0 (4.26)
dt t
∂ϕt (y0 )
où Ψt = ∂y0
. Maintenant, si Φh est le flot numérique d’une méthode de Runge-Kutta,
(Φh (y0 ), ∂y0 Φh (y0 ))
est, d’après le lemme 4.6, la solution numérique à l’instant h du système

ẏ = J −1 ∇H(y), y(0) = y0
−1 2
Ψ̇t = J (∇ H(y))Ψt, Ψ(0) = I
pour lequel ΨTt JΨt est un invariant quadratique. Si la méthode satisfait les conditions de sym-
plecticité, cet invariant est donc conservé. Pour montrer que la condition énoncée est en outre
nécessaire, il faut introduire une notion de méthode de Runge-Kutta “réduite”, traduisant le fait
que certaines étapes internes (autrement dit les Yi ) peuvent être redondantes.

Exemples
Il existe plusieurs classes de méthodes symplectiques. Citons en particulier les méthodes de
Gauss et les méthodes de Lobatto IIIA-IIIB (voir []), qui sont des méthodes partitionnées. La
méthode de Gauss la plus simple est la méthode du point milieu, qui est d’ordre 2 :
h
y1 = y0 + hf (Y ), Y = y0 + f (Y ).
2
Il est trivial de vérifier qu’elle est symplectique car ici A = 1/2 et b = 1. La méthode de Lobatto
IIIA-IIIB la plus simple est la méthode d’Euler symplectique que l’on peut écrire :

p1 = p0 + hf (p1 , q1 ), q1 = q0 + hg(p0, q0 ),
36

qui devient explicite dès lors que f de dépend que de q et g que de p. On a ici A = 1, = 0 et
b = b̂ = 1.

4.4 Méthodes de composition


Bien qu’il existe une théorie générale de l’ordre des méthodes de composition (basée sur les
B-séries indexées par des arbres), nous nous limiterons dans ce cours à la présentation d’une tech-
nique développée par plusieurs auteurs, Suzuki [22], Yoshida [23] et McLachlan [15]. L’idée est,
étant donnée une méthode de base Φh d’ordre p, d’accroı̂tre son ordre en la composant avec elle-
même, avec cependant des pas fractionnaires différents. On a le résultat suivant :
Théorème 4.8 Soit Φh une méthode d’intégration numérique d’ordre p et soit
Ψh = Φγs h ◦ · · · ◦ Φγ1 h .
Si les relations suivantes sont satisfaites
γ1 + . . . γs = 1 and γ1p+1 + . . . + γsp+1 = 0,
alors la méthode de composition Ψh est au moins d’ordre p + 1.
Preuve. La méthode Φh étant d’ordre p, son erreur locale au point y est de la forme
e = Φh (y) − ϕh (y) = hp+1 C(y) + O(hp+2 ),
où C(y) est une fonction régulière définie sur Rn et dépendant seulement de la méthode et du
champ de vecteur f . En notant yi = Φγi h (yi−1 ) pour i = 1, . . . , s, il vient
Φγ1 h (y0 ) = ϕγ1 h (y0 ) + hp+1 γ1p+1 C(y0 ) + O(hp+2 ),
Φγ2 h (y1 ) = ϕγ2 h (y1 ) + hp+1 γ2p+1 C(y1 ) + O(hp+2 ),
 
= ϕ(γ1 +γ2 )h (y0 ) + hp+1 γ1p+1 + γ2p+1 C(y0 ) + O(hp+2 ),
où l’on a utilisé la relation ϕch (y + ∆y) = ϕch (y) + ∆y + O(h∆y) and C(y1 ) = C(y0 ) + O(h).
Après s étapes, on a donc
 
p+1 p+1 p+1
Ψh (y) = Φγs h (ys−1 ) = ϕ(γ1 +...+γs )h (y0 ) + h γ1 + . . . + γs C(y0 ) + O(hp+2 ),
de sorte que la méthode est d’ordre au moins p + 1 si les conditions du théorème sont satisfaites.

Théorème 4.9 Sout ϕt le flot exact de l’équation différentielle. On considère une méthode numérique
Φh d’ordre p telle que pour tout y dans Rn ,
Φh (y) = ϕh (y) + hp+1 C(y) + O(hp+2 ).
Alors la méthode adjointe Φ∗h , définie par Φ∗h = Φ−1
−h est du même ordre p et on a

Φ∗h (y) = ϕh (y) + (−1)p hp+1 C(y) + O(hp+2 ).


En particulier, si la méthode est symétrique, i.e. telle que Φ∗h = Φh , alors elle est d’ordre pair.
5. ANALYSE RÉTROGRADE 37

Preuve. On a clairement
Φ−h (y) = ϕ−h (y) + (−h)p+1 C(y) + O(hp+2 ),
donc
(ϕh ◦ Φ−h )(y) = y + (−h)p+1 C(y) + O(hp+2 ),
puis
(ϕh ◦ Φ−h )−1 (y) = y − (−h)p+1 C(y) + O(hp+2 ),
ce qui implique enfin que
(Φ∗h ◦ ϕ−1
h )(y) = y − (−h)
p+1
C(y) + O(hp+2 ).
En prenant y = ϕh (z), il vient finalement
Φ∗h (z) = ϕh (z) + (−1)p hp+1 C(z) + O(hp+2 ).
Si la méthode Φh est symétrique, alors Φ∗h = Φh et on a nécessairement (−1)p = 1, i.e. p pair.
Notons que ces équations n’ont pas de solutions réelles pour les valeurs impaires de p. En revanche,
si p est pair et s = 3 par exemple, on obtient la solution

1 21/(p+1)
γ1 = γ3 = et γ 2 = − .
2 − 21/(p+1) 2 − 21/(p+1)
Il est donc possible à partir d’une méthode de base symétrique de construire une méthode d’ordre
au moins p + 1, donc p + 2 en raison de la symétrie de la méthode de composition obtenue. En
répétant la procédure, il est possible de construire des méthodes d’ordre arbitrairement élevé.

5 Analyse rétrograde
5.1 Idée générale
L’idée originale de l’analyse rétrograde est d’interpréter la solution numérique comme la solu-
tion exacte d’un problème approché.

A NALYSE R ÉTROGRADE
M
ẏ = f (y) numéthode
ériqu
e
q y0 , y1 , y2 , y3 , . . .
=
✶ ỹ(0), ỹ(h), ỹ(2h), . . .
ỹ˙ = f˜h (ỹ) t i on
Solxuacte
e
38

Le champ de vecteurs f˜h (ỹ) est déterminé sous la forme d’un développement en puissances
de h en général non convergent ; l’équation différentielle modifiée (satisfaite par l’approximation
numérique y0 , y1 , y2 , ...) est de la forme :
ỹ˙ = f (ỹ) + hf2 (ỹ) + h2 f3 (ỹ) + · · · , ỹ(0) = y0 .

Exemple 5.1 (Lotka-Volterra sous forme normale)


u̇ = ev − 2
v̇ = 1 − eu
i.e. y ′ = f (y) with f (y) = (ev − 2, 1 − eu )T . On calcule successivement :
 v   v 
′ e (1 − eu ) ′ ′ u+v ′′ e (1 − eu )2
ff= , f f f = −e f, f (f, f ) = .
−eu (ev − 2) −eu (ev − 2)2
On cherche le champ sous la forme :
h2
f˜h (y) = af (y) + hbf ′ (y)f (y) + cf ′′ (y)(f (y), f (y)) + h2 d f ′(y)f ′(y)f (y) + O(h3 ),
2
où les coefficients a, b, c et d dépendent de la méthode. On obtient pour respectivement Euler
explicite, Euler implicite et point milieu :
1 h2 h2
f˜eE
h
= f − hf ′ f + f ′′ (f, f ) + f ′ f ′ f + O(h3 ),
2 12 3
2 2
1 h h
f˜iE
h
= f + hf ′ f + f ′′ (f, f ) + f ′ f ′ f + O(h3 ),
2 12 3
2 2
h h
f˜mr
h
= f − f ′′ (f, f ) + f ′ f ′ f + O(h3 ).
24 12
Sur la figure 8 sont représentées les solutions exactes solutions de ces différentes équations ainsi
que la solution numérique de l’équation de départ. On peut observer une (presque) parfaite coı̈nci-
dence.
Résultat fondamental 1 : Sous certaines conditions portant sur f , et pour h suffisamment petit
inférieur à un certain h∗ , il existe une constante c et un N dépendant de h tels que
h∗ h∗
∀ ih ≤ e h , kΦih (y0 ) − ϕ̃N, ih (y0 )k ≤ ce− h ,
o˘ ϕ̃N, h est le flot de l’équation tronquée au N-ième terme.

Résultat fondamental 2 : Si le système est hamiltonien et la méthode numérique symplectique,


alors l’équation modifiée est encore hamiltonienne.

Conséquence : L’erreur numérique sur l’hamiltonien est en Chp si p est l’ordre de la méthode
et ce pour des intervalles de temps exponentiellement longs.
5. ANALYSE RÉTROGRADE 39

Explicit Euler Implicit Euler Midpoint Rule


4 3 3

2
2 2

1 1
−2

0 0
−4
v

v
−6
−1 −1

−8
−2 −2

−10

−3 −3
−12

−14 −4 −4
−20 −15 −10 −5 0 5 −7 −6 −5 −4 −3 −2 −1 0 1 2 3 −8 −6 −4 −2 0 2 4
u u u

F IGURE 8 – Solutions exactes des équations modifiées (en rouge) et solutions numériques (en
vert).

5.2 Développement du flot numérique


Théorème 5.2 On considère une méthode de Runge-Kutta de coefficients A = (ai j ) ∈ Rs×s et
b = (bi ) ∈ Rs . Soient alors
X X
µ= |bi | et κ = max |ai,j |. (5.27)
i
i j

Si le champ de vecteur f est supposé (réel-)analytique dans une boule complexe B2R (y0 ) et est
majoré par M sur B2R (y0 ), alors pour h suffisamment petit, le flot numérique Φh (y) associé à la
méthode de Runge-Kutta est analytique et les coefficients dj (y) de son développement

Φh (y) = y + hf (y) + h2 d2 (y) + . . . (5.28)

sont eux-mêmes analytiques et satisfont :


 j−1
2κM
kdj (y)k ≤ µM pour y ∈ BR (y0 ). (5.29)
R

R (n) (0)
Preuve. Soit h0 = γ 2κM pour γ < 1. On définit les fonctions Θi (h, y) par Θi (h, ·) ≡ idCm et
pour n ∈ N par :
(n+1)
Θi : {|h| ≤ h0 } × BR (y0 ) −→ Cm
X (n)
(h, y) 7−→ y + h ai,j f (Θj (h, y)),
j

m étant la dimension du système d’équations différentielles. Si pour tout j, tout |h| ≤ h0 et tout
(n) (n+1)
y ∈ BR (y0 ), Θj (h, y) ∈ B3R/2 (y0 ), alors il en est de même pour Θi . En effet :
(n+1)
X (n) R
max kΘi (h, y) − yk ≤ max kh ai j f (Θj (h, y))k ≤ h0 κ M ≤ .
|h|≤h0 , y∈BR (y0 ) |h|≤h0 , y∈BR (y0 )
j
2
40

(n)
Les fonctions Θi (h, ·) prennent donc leurs valeurs dans B3R/2 (y0 ). En dérivant par rapport à z la
fonction α(z) = f (y + z∆y) pour y ∈ B3R/2 (y0 ), k∆yk ≤ 1 et z ∈ BR/2 (0), une majoration de
Cauchy donne
M 2M
kα′(0)k = kf ′ (y)∆yk ≤ = . (5.30)
R/2 R
L’opérateur f ′ est donc borné par (2M)/R sur B3R/2 et il vient alors pour tous m ≥ n :
(m) (n)
X (m−1) (n−1)
max kΘi (h, y) − Θi (h, y)k ≤ max kh ai,j (f (Θj (h, y)) − f (Θj (h, y))k
i, |h|≤h0 , y∈BR (y0 ) i, |h|≤h0 , y∈BR (y0 )
j
2M (m−1) (n−1)
≤ h0 κ max kΘ (h, y) − Θj (h, y)k
R j, |h|≤h0, y∈BR (y0 ) j
...
(m−n) (0)
≤ γn max kΘi (h, y) − Θi (h, y)k
i, |h|≤h0 , y∈BR (y0 )
R
≤ γn
2
(n)
La suite des Θi converge donc uniformément vers une fonction Θ∞
i analytique (en h et y),
(n)
puisque chacune des Θi est analytique. Finalement,
kΦh (h, y) − yk ≤ µM|h| (5.31)
et
 j−1
1 dj µ M h0 2κM
kdj (y)k = (Φh (y) − y) ≤ ≤ µM . (5.32)
j! dhj h=0 hj0 γR
Le résultat s’obtient alors en faisant tendre γ vers 1.

5.3 Développement de l’équation modifiée


Calcul des coefficients
Lemme 5.3 Supposons que la méthode numérique Φh soit formellement développable en une série
de la forme :

Φh (y) = y + hf (y) + h2 d2 (y) + . . . (5.33)


Alors, les coefficients fj de l’équation modifiée
d h
ỹ (t) = f1 (ỹ h (t)) + hf2 (ỹ h (t)) + h2 f3 (ỹ h (t)) + . . . (5.34)
dt
sont déterminés par la formule de récurrence suivante :
j
X 1 X
fj (y) = dj (y) − Lk1 · · · Lki [id](y), (5.35)
i=2
i! k
1 +...+ki =j,k1 ≥1,...,ki ≥1
5. ANALYSE RÉTROGRADE 41

où les Li ≡ Lfi sont les opérateurs dérivée de Lie associés aux champs de vecteurs fi .

Preuve. Soit ϕ̃ht (y) le flot associé à l’équation modifiée :


d h
ỹ (t) = f˜h (ỹ h(t)) (5.36)
dt
= f1 (ỹ h (t)) + hf2 (ỹ h (t)) + h2 f3 (ỹ h (t)) + . . . (5.37)
Le développement en série formelle de ϕ̃ht (y) s’écrit à partir de l’opérateur dérivée de Lie Lf˜h de
f˜h sous la forme :
X ti
ϕ̃ht (y) = Lif˜h [id](y). (5.38)
i≥0
i!

Or Lif˜h 2
= L1 + hL2 + h L3 + . . ., et il vient donc :
!i
X ti X
ϕ̃ht (y) = hk−1 Lk [id](y)
i≥0
i! k≥1
X ti X
= y+ i i!
hk1 +...+ki Lk1 · · · Lki [id](y)
i≥1
h k ≥1,...,k ≥1
1 i

j
!
X X ti X
j
= y+ h Lk1 · · · Lki [id](y) .
j≥1 i=1
hi i! k
1 +...+ki =j,k1 ≥1,...,ki ≥1

En identifiant les puissances de h, on a maintenant que ϕ̃hh (y) = Φh (y) si on a pour tout j ≥ 1 :
j
X 1 X
dj (y) = Lk1 · · · Lki [id](y). (5.39)
i=1
i! k
1 +...+ki =j,k1 ≥1,...,ki ≥1

Le terme de la somme correspondant à i = 1 n’est autre que Lj [id](y) = fj (y) et le résultat est
alors immédiat.
42

Pour les trois premiers termes du développement, on obtient :


f1 (y) = d1 (y)
= f (y),
1
f2 (y) = d2 (y) − L21 [id](y)
2
1
= d2 (y) − L1 [f1 ](y)
2 
1 ∂f1
= d2 (y) − f1 (y),
2 ∂y
1 1
f3 (y) = d3 (y) − (L1 L2 + L2 L1 )[id](y) − L31 [id](y)
2  6  
1 ∂f2 ∂f1 1 ∂ 2 f1 ∂f1 ∂f1
= d3 (y) − f1 + f2 (y) − (f1 , f1 ) + f1 (y).
2 ∂y ∂y 6 ∂y 2 ∂y ∂y

Majoration des coefficients


Lemme 5.4 (Lemme technique) Soient f : Rn → Rn et g : Rn → Rm deux fonctions analy-
tiques et soient σ et ρ deux réels tels que 0 ≤ σ < ρ. On désigne par k · kr la norme sup sur Br (y0)
et par Lf la dérivée de Lie associée au champ f . Alors on a la majoration suivante :
kf kσ kgkρ
kLf [g]kσ ≤ (5.40)
ρ−σ
ρ−σ
Preuve. Soit, pour y ∈ Bσ (y0 ) et |ν| ≤ ε := kf kσ
, α(z) = g(y + νf (y)). La majoration de Cauchy
pour α donne alors :
1 kgkρ kf kσ kgkρ
kLf [g](y)k = kg ′(y)f (y)k = kα′ (0)k ≤ sup kα(ν)k ≤ = . (5.41)
ε |ν|≤ε ε ρ−σ

Théorème 5.5 On suppose que le champ de vecteur f est analytique sur B2R (y0) et borné par
M sur cette boule. On suppose par ailleurs, que la majoration (5.29) des coefficients dj du
développement en série de Taylor de la méthode numérique est valable sur la boule BR (y0 ). Alors
les coefficients fj de l’équation modifiée tels que calculés dans le lemme 5.3 sont majorés par :
 j−1
ηMj
∀ y ∈ BR/2 (y0 ), kfj (y)k ≤ (log 2)ηM , (5.42)
R
où η = 2 max(κ, µ/(2 log 2 − 1)).
R
Preuve : Soit J ≥ 2 un entier fixé et δ = 2(J−1) . On définit, pour j = 1, . . . , J, les rayons
   
j−1 R J −j
rj = + R (5.43)
J −1 2 J −1
5. ANALYSE RÉTROGRADE 43

de sorte que r1 = R et rJ = R/2. Pour un ensemble de i indices k1 , . . . , ki , supposés non nuls et de


somme j, on estime alors le terme général de (5.35) par l’utilisation répétée du lemme précédent :
1
kLk1 · · · Lki [id]krj ≤ kfk1 krj kLk2 · · · Lki [id]krj−1
rj−1 − rj
≤ ...
i
1 Y
≤ i−1 kfkl krj−l+1
δ l=1

Or, kl ≤ j − i + 1 ≤ j − l + 1, donc rkl ≥ rj−l+1 et kfkl krj−l+1 ≤ kfkl krkl . On a donc :

i
1 Y
kLk1 · · · Lki [id]krj ≤ kfkl krkl . (5.44)
δ i−1
l=1

En insérant cette majoration dans l’expression de fj calculée dans le lemme 5.3, on obtient alors,
pour 1 ≤ j ≤ J :
j i
X 1 X Y
kfj krj ≤ kdj kR + kfkl krkl . (5.45)
i=2
δ i−1 i! k
1 +...+ki =j l=1

En définissant βj pour j ≥ 1 par :


 j−1 Xj
X i
Y
µM 2κM 1
βj = + βkl , (5.46)
δ R i=2
i!
k1 +...+ki =j l=1

on peut montrer par une récurrence facile, que 5 kfj krj ≤ δβj . Afin d’estimer les βj , on définit
maintenant la fonction génératrice
X
b(ζ) = βj ζ j . (5.47)
j≥1

De (5.46), on tire :
 j−1 Xj
X Yi
µM
j 2κM 1
βj ζ = ζ ζ + βkl ζ kl ,
δ R i=2
i! k +...+k =j l=1
1 i

puis

X  j−1 j i
µM X
j 2κM XX 1 X Y
βj ζ = ζ ζ + βkl ζ kl ,
j≥1
δ j≥1
R j≥2 i=2
i!
k1 +...+ki =j l=1

µM
5. Notons au passage que β1 = δ et que kf1 kr1 = kf kR ≤ kf k2R ≤ M .
44

K(Blog 2 )

1/ν L(B1/ν ) log 2

B2 log 2−1
L

F IGURE 9 – Intersection des images de K et L

c’est-à-dire :
X1X X Yi
µM 1
b(ζ) = ζ + βkl ζ kl ,
δ 1 − 2κM
R
ζ i≥2
i! j≥i k +...+k =j l=1 1 i

X1 X i
Y
µM 1
= ζ 2κM
+ βkl ζ kl ,
δ 1− R ζ i≥2
i! k ,...,k l=1
1 i

µM 1 X 1
= ζ 2κM
+ b(ζ)i .
δ 1− R ζ i≥2
i!

Finalement, en notant γ = µM/δ et q = 2κM/R, on obtient la relation suivante :


γζ
b(ζ) = + eb(ζ) − 1 − b(ζ). (5.48)
1 − qζ
Soient alors les applications :
−γζ
K : b → eb − 1 − 2b et L : ζ → (5.49)
1 − qζ
L’image par K de la boule de centre b = 0 et de rayon log 2 contient la boule de centre 0, B2 log 2−1 .
2 log 2−1
Par ailleurs, l’image par L de la boule de centre 0 et de rayon 1/ν avec 1/ν = γ+q(2 log 2−1)
est
contenue dans B2 log 2−1 , et ce, quels que soient γ ≥ 0 et q ≥ 0. On a ainsi (voir figure 10.93) :
L(B1/ν ) ⊂ B2 log 2−1 ⊂ K(Blog 2 ). (5.50)
D’autre part, pour |b| < log 2, K′ (b) 6= 0 et donc la fonction K est localement inversible sur
B2 log 2−1 , et son inverse est analytique. On peut alors l’étendre sur tout B2 log 2−1 et donc en par-
ticulier sur L(B1/ν ). En conclusion, la fonction b(ζ) = (K−1 ◦ L)(ζ) est analytique sur B1/ν . En
outre, on a :
∀ ζ ∈ B1/ν , |b(ζ)| < log 2, (5.51)
5. ANALYSE RÉTROGRADE 45

ce qui implique finalement,

kfJ krJ = kfJ kR/2 ≤ δβJ ≤ log 2 δ ν J . (5.52)

On obtient le résultat en remarquant que


 
γ 2κM µM M µ(J − 1)
ν = q+ = + = 2κ + 2
2 log 2 − 1 R δ(2 log 2 − 1) R 2 log 2 − 1
MJ
≤ 2 max(κ, µ/(2 log 2 − 1)) .
R
Soit
 J
R ηMJ
kfJ kR/2 ≤ log 2
2(J − 1) R
 J−1
ηMJ
≤ log 2 η M .
R

5.4 Propriétés de l’équation modifiée


Théorème 5.6 Soit Φh le flot numérique associé à une méthode de Runge-Kutta d’ordre p et
δp+1 (y) le terme d’erreur principal :

Φh (y) = ϕh (y) + hp+1 δp+1 (y) + O(hp+2 ), (5.53)

où ϕt (y) désigne le flot exact de l’équation différentielle ẏ = f (y). Alors l’équation modifiée est
de la forme :

ỹ˙ = f (ỹ) + hp δp+1 (y) + hp+1 fp+2 (ỹ) + . . .


ỹ0 = y0 .

Preuve. C’est une conséquence immédiate de la définition des coefficients de l’équation modifiée.
On a en effet :
ϕ̃hh (y) = Φh (y) = ϕh (y) + hp+1 δp+1 (y) + O(hp+2 )
et donc :
j
!
X X 1 X X hj
hj
Lk1 · · · Lki [id](y) = Ljf [id](y) + hp+1 δp+1 (y) + O(hp+2 )
j≥1 i=1
i! k j≥1
j!
1 +...+ki =j,k1 ≥1,...,ki ≥1
46

On obtient alors successivement :


j=1 : f1 ≡ f
j=2 : f2 + 2!1 L21 [id] = 2!1 L2f [id] ⇒ f2 ≡ 0
... ...
j=p : fp + p!1 Lp1 [id] = p!1 Lp1 [id] ⇒ fp ≡ 0
j = p + 1 : fp+1 + (p+1)! 1
Lp+1 1 p+1
1 [id] = (p+1)! L1 [id] + δp+1 ⇒ fp+1 ≡ δp+1 .

Théorème 5.7 Soit Φh le flot numérique associé à une méthode de Runge-Kutta symplectique
appliquée à un système hamiltonien d’hamiltonien H de classe C ∞ sur R2n . Alors l’équation
modifiée est elle-aussi hamiltonienne, c’est-à-dire que pour tout j ∈ N∗ , il existe un hamiltonien
Hj de classe C ∞ sur R2n tel que
fj (y) = J −1 ∇Hj (y). (5.54)
Preuve. La preuve se fait par récurrence. Pour j = 1, f1 ≡ f et le résultat est vrai. Supposons
maintenant que pour r ≥ 1, la relation (5.54) soit établie pour tout 1 ≤ j ≤ r. Le flot ϕ̃r,h (y)
correspondant à l’équation modifiée
ỹ˙ = f (ỹ) + hf1 (y) + . . . + hr−1 fr (y) (5.55)
est le flot d’un système hamiltonien, donc est symplectique. Or :
Φh (y) = ϕ̃r,h (y) + hr+1 fr+1 (y) + O(hr+2 ) (5.56)
donc
Φ′h (y) = (ϕ̃r,h )′ (y) + hr+1 fr+1

(y) + O(hr+2 ). (5.57)
Les flots Φh (y) et ϕ̃r,h (y) étant symplectiques, on a alors :
T T
J = (Φ′h (y)) JΦ′h (y) = (ϕ̃r,h )′ (y)) J ϕ̃r,h )′ (y)
h T i
r+1 ′ T ′ ′ ′
+h (ϕ̃r,h ) (y)) Jfr+1 (y) + fr+1 (y) J(ϕ̃r,h ) (y)
+O(hr+2 )
(ϕ̃r,h )′ (y)=I+O(h)
h T i
r+1 ′ ′
= J +h Jfr+1 (y) + fr+1 (y) J + O(hr+2 ).

En conséquence, la matrice Jfr+1 (y) est symétrique et d’après le lemme d’intégrabilité, on a :

Jfr+1 (y) = ∇Hr+1 (y), (5.58)
où H est défini sur R2n et de classe C ∞ .

Théorème 5.8 Soit Φh le flot numérique associé à une méthode de Runge-Kutta préservant le
volume appliquée à un système dont le champ de vecteur est à divergence nulle. Alors l’équation
modifiée est elle-aussi à divergence nulle, c’est-à-dire que pour tout j ∈ N∗ , on a
divfj (y) = 0. (5.59)
5. ANALYSE RÉTROGRADE 47

Si même si I est un invariant de ẏ = f (y) ∈ Rn (i.e. (∇y I(y))T f (y) ≡ 0) et si Φh préserve I,


alors pour tout j ≥ 1

(∇y I(y))T fj (y) ≡ 0. (5.60)

Preuve. A nouveau, la preuve se fait par récurrence. Pour j = 1, f1 ≡ f et le résultat est vrai.
Supposons maintenant que pour r ≥ 1, la relation (5.59) soit établie pour tout 1 ≤ j ≤ r. Le flot
ϕ̃r,h (y) correspondant à l’équation modifiée
ỹ˙ = f (ỹ) + hf1 (y) + . . . + hr−1 fr (y) (5.61)
est le flot d’un système à divergence nulle, donc préserve le volume. De l”égalité
Φ′h (y) = ϕ̃′r,h (y) + hr+1 fr+1

(y) + O(hr+2 ),
on tire alors
det(Φ′h (y)) = det(ϕ̃′r,h (y) + hr+1 fr+1

(y) + O(hr+2 )).
Or det(M + H) = det(M) + (dM det)(H) + O(kHk2), soit ici avec M = ϕ̃′r,h (y) et H =

hr+1 fr+1 (y) + O(hr+2 ) :

1 = det(Φ′h (y)) = det(ϕ̃′r,h (y)) + hr+1 (dϕ̃′r,h (y) det)fr+1 (y) + O(hr+2 ),

= 1 + hr+1 Tr (ϕ̃′r,h (y))−1fr+1 ′
(y) + O(hr+2 ),


= 1 + hr+1 Tr fr+1 (y) + O(hr+2 ),

car ϕ̃′r,h (y) = I + O(h). Donc Tr fr+1

(y) = 0. En procédant de manière similaire avec I
I(y) = I (Φh (y)) = I (ϕ̃r,h (y)) + hr+1 (∇y I)T (ϕ̃r,h (y)) fr+1 (y) + O(hr+2 ),
on prouve la seconde partie du théorème.

5.5 Conservation de l’énergie


En tronquant l’équation modifiée de manière optimale, on peut maintenant montrer la conser-
vation de l’hamiltonien sur des temps exponentiellement longs en l’inverse du pas d’intégration.

Troncature optimale de l’équation modifiée

Soit donc, pour N ≥ 2, l’équation modifiée tronquée au N-ième terme :

ỹ˙ = f (ỹ) + hf2 (ỹ) + . . . + hN −1 fN (ỹ), (5.62)

et soit ϕ̃N,h (y) le flot exact correspondant. On souhaite ici déterminer s’il existe un N minimisant
l’erreur entre le flot numérique Φh et le flot ϕ̃h,N (y). Notons tout d’abord que si Φh admet un
développement de la forme (5.28) et que les termes du développement sont majorés comme en
48

R
(5.29), alors le dit développement est convergent pour |h| ≤ 2κM . Symétriquement, le flot ϕ̃N,h (y)
se développe en puissance de h et de l’opérateur Lf˜h = hL1 + . . . hN −1 LN :

N
!i
X hi X X
ϕ̃h,N = id + hk−1 Lk [id] = id + hj Gj [id]
i≥1
i! k=1 j≥1

où les Gj sont les opérateurs


j
X 1 X
Gj = Lk1 · · · Lki . (5.63)
i=1
i! 1≤k
1 ,...,ki ≤N, k1 +...+ki =j

Afin de majorer les Gj [id] sur la boule BR/4 (y0 ), on procède comme dans le théorème 5.5, avec
δ = R/(4(i − 1)). Pour i ≥ 2 indices kl , 1 ≤ kl ≤ N de somme j, on a :
i
1 Y
kLk1 · · · Lki [id]kR/4 ≤ kfkl kR/2
δ i−1 l=1
 i−1  j−1
4(i − 1) log 2 ηMN
≤ (ηM log 2) .
N R
Il vient alors :
 j−1 X
j  i−1
ηMN 1 4(i − 1) log 2
kGj [id]kR/4 ≤ (ηM log 2) Card S(i, j, N) (5.64)
R i=1
i! N

où S(i, j, N) = {(k1 , . . . , ki ) ∈ [1, N]i , k1 + . . . + ki = j}, de sorte que Card S(i, j, N) ≤ N i−1
et donc :
 j−1 X j  j−1
ηMN (4(j − 1) log 2)i−1 16ηMN
kGj [id])kR/4 ≤ (ηM log 2) ≤ (ηM log 2) (5.65)
R i=1
i! R

R
En particulier, le développement de ϕ̃N,h est convergent pour y ∈ BR/4 (y0 ) et |hN| ≤ 16ηM
.

On est maintenant en mesure d’énoncer le résultat principal de l’analyse rétrograde :


Théorème 5.9 On suppose que le champ de vecteur f est analytique sur B2R (y0) et borné par
M sur cette boule. On suppose par ailleurs, que la majoration (5.29) des coefficients dj du
développement en série de Taylor de la méthode numérique Φh est valable sur la boule BR (y0 ).
R
Soit h0 = 16ηM e
: alors, si |h| ≤ h0 , on a pour N = E(h0 /h) la majoration suivante :
h0
∀ y ∈ BR/4 (y0 ), kΦh (y) − ϕ̃N,h (y)k ≤ hγMe− h , (5.66)
(2e2 η log 2)
où γ = e−1
.
5. ANALYSE RÉTROGRADE 49

Preuve. Les champs de vecteurs fj , 1 ≤ j ≤ N sont construits de manière à ce que les termes des
développements de Φh et ϕ̃N,h coincident jusqu’à l’ordre N. On a donc :
X
Φh − ϕ̃N,h = hj (dj − Gj [id]) (5.67)
j≥N +1

Ainsi :
X
kΦh − ϕ̃N,h kR/4 ≤ hj kdj − Gj [id]kR/4
j≥N +1

X 
j−1  j−1!
2κM 16ηMN
≤ hj µM + (ηM log 2)
j≥N +1
R R
X  16ηMNh j
≤ (2ηM log 2) h
j≥N
R
Pour Nh ≤ h0 , on a alors :
 N
hN e (2eηM log 2) −N
kΦh − ϕ̃N,h kR/4 ≤ (2ηM log 2) h ≤ he (5.68)
eh0 e−1 e−1
car la fonction x 7→ (ǫx)x admet pour ǫ < 1 un minimum en x = (ǫe)−1 , et pour 0 < x ≤ (ǫe)−1 ,
(ǫx)x ≤ e−x (ici, ǫ = hh0 e ). Pour N = E(h0 /h) on obtient finalement :
(2e2 ηM log 2) − h0
kΦh − ϕ̃N,h kR/4 ≤ he h .
e−1

Conservation de l’énergie sur des temps “longs”


Dans le cas d’une système hamiltonien, on a vu (Théorème 5.7) que les termes fj de l’équation
modifiée pouvaient s’écrire fj (y) = J −1 ∇y H(y). L’équation modifiée tronquée au N-ième terme
est donc une équation hamiltonienne correspondant à l’hamiltonien
H̃ = H + hp Hp+1 + . . . hN −1 HN (5.69)
que l’on suppose défini sur le mÍme ensemble que H (c’est le cas en particulier si H est défini sur
un ouvert étoilé). Dans les conditions du théorème précédent, on a alors :
Théorème 5.10 On considère un hamiltonien analytique H : D ⊂ R2n → R où D est un
ouvert étoilé et une méthode numérique Φh vérifiant les inégalités (5.29) appliquée au système
différentiel d’hamiltonien H. Si la solution numérique yn = Φnh (y0 ), n = 0, . . . , reste dans un
compact K ⊂ KR := {z ∈ D, ∃y ∈ K, ky − zk ≤ R} ⊂ D pour un certain R > 0, alors il existe
h0 > 0 tel que :
h0
H̃(yn ) = H̃(y0 ) + O(e− h ), (5.70)
H(yn ) = H(y0) + O(hp ), (5.71)
50

h0
sur des intervalles de temps nh ≤ e h .
Preuve : On peut majorer uniformément f = J −1 ∇H, par M, sur le compact KR . Toutes les
majorations obtenues successivement dans les théorèmes 5.29, 5.5 et 5.9 sont donc applicables
uniformément sur K avec un h0 et un N = E(h0 /h) uniformes eux-aussi. Maintenant,
n 
X  Xn  
H̃(yn ) − H̃(y0 ) = H̃(yj ) − H̃(yj−1 ) = H̃(yj ) − H̃(ϕ̃N,h (yj−1 )) (5.72)
j=1 j=1
Xn  
= H̃(Φh (yj−1 )) − H̃(ϕ̃N,h (yj−1)) (5.73)
j=1

car le flot ϕ̃N,h conserve H̃. De plus, ∇H̃ = ∇H + . . . + hN −1 ∇HN +1 = J(f + . . . + hN −1 fN ) o˘


les fj sont majorés sur K par (5.5) d’où il résulte que H̃ est L-Lipschitz uniformément en |h| ≤ h0
et donc :
n
X h0 h0
kH̃(yn ) − H̃(y0 )k ≤ L kΦh (yj−1 ) − ϕ̃N,h (yj−1))k ≤ LMγe− h nh ≤ LMγe− 2h (5.74)
j=1

On conclut en remarquant que H(yn ) = H̃(yn ) + O(hp ). 

6 Formule de Baker-Campbell-Hausdorff (BCH)


On considère Mn (K) l’espace vectoriel des matrices carrées de taille n à éléments dans K = R
ou C, muni de la norme k.k, que l’on suppose multiplicative, c’est-à-dire telle

∀(A, B) ∈ Mn (K) × Mn (K), kABk ≤ kAkkBk.

On rappelle que l’exponentielle exp(A) d’une matrice A ∈ Mn (K) est définie par la série conver-
gente
X∞
1 k
exp(A) = A .
k!
k=0

Lorsque A et B sont deux matrices de Mn (K) qui commutent, alors exp(A+B) = exp(A) exp(B) =
exp(B) exp(A). L’objectif de cette section est d’établir une formule, dite formule de Baker-Campbell-
Hausdorff (BCH en abrégé), dans le cas où A et B ne commutent pas, puis d’approcher exp(t(A +
B)) par des produits de matrices de la forme exp(taA) et exp(tbB).

Pour Ω ∈ Mn (K) fixée, on définit l’opérateur adΩ comme l’application linéaire suivante :

adΩ : Mn (K) → Mn (K)


A 7→ adΩ (A) = ΩA − AΩ
6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 51

et on note adiΩ l’opérateur composé adΩ ◦ . . . ◦ adΩ . La norme considérée sur l’espace vectoriel
| {z }
i fois
L(Mn (K)) est la norme subordonnée, qu’on notera encore k.k : en particulier, on a

kadΩ (A)k
kadΩ k = sup
A∈Mn (K),kAk6=0 kAk

6.1 Quelques résultats préliminaires


On rappelle que l’application Ω 7→ Ωk est différentiable et que son application linéaire tangente
dΩk
dΩ
au point Ω de Mn (K) dans Mn (K) est définie par
 
dΩk (Ω + tH)k − Ωk
∀H ∈ Mn (K), H = lim
dΩ t→0 t

 
dΩk
Exemple 6.1 Pour H ∈ Mn (K), on peut calculer dΩ
H pour k = 1, 2, 3. Il est clair que
dΩ

dΩ
H = H. Pour k = 2, 3, le calcul donne :
 
dΩ2
H = HΩ + ΩH,
dΩ
 3
dΩ
H = HΩ2 + ΩHΩ + Ω2 H.
dΩ

On peut alors établir les premières relations suivantes :


 
dΩ2
H = 2HΩ + adΩ (H)
dΩ
 3
dΩ
H = 3HΩ2 + 3adΩ (H)Ω + ad2Ω (H)
dΩ

En effet, on a HΩ + ΩH = 2HΩ + (ΩH − HΩ) = 2HΩ + adΩ (H) puis on vérifie que

HΩ2 + ΩHΩ + Ω2 H = 3HΩ2 + 3(ΩHΩ − HΩ2 ) + (Ω2 H − 2ΩHΩ + HΩ2 ).

Lemme 6.2 Pour tout k ≥ 1


 k+1    dΩ     dΩk  
dΩ k
H= H Ω +Ω H
dΩ dΩ dΩ
52

Preuve. On a :
(Ω + tH)k+1 − Ωk+1 (Ω + tH)(Ω + tH)k − ΩΩk
=
t t
(Ω + tH)k − Ωk
= Ω + H(Ω + tH)k
t
En passant à la limite on obtient le résultat.

Lemme 6.3 Pour tout k ≥ 1, on a :


  k−1 
X 
dΩk k
H= adiΩ (H)Ωk−1−i
dΩ i+1
i=0

Preuve. La preuve se fait par récurrence. Pour k = 1, 2, 3, le résultat est établi (voir calculs
précédents). Supposons la formule établie jusqu’à un rang k ≥ 3. Alors
 k+1    dΩ     dΩk  
dΩ k
H = H Ω +Ω H
dΩ dΩ dΩ
Xk−1  
k
= Ω adiΩ (H)Ωk−1−i + HΩk
i+1
i=0

Comme ΩadiΩ (H)


= adiΩ (H)Ω
+ adi+1
Ω (H),
il vient
 k+1  k−1
X  
dΩ k 
H = adiΩ (H)Ωk−i + adi+1 Ω (H)Ω
k−i−1
+ HΩk
dΩ i + 1
i=0
X k 
k−1 X k 
k

i
= adΩ (H)Ω + k−i
adiΩ (H)Ωk−i + HΩk
i+1 i
i=0 i=1
k−1
X    
k k
= + adiΩ (H)Ωk−i + adkΩ (H)
i+1 i
i=0
X k + 1 
k−1 X k 
k+1

i k
= k−i
adΩ (H)Ω + adΩ (H) = adiΩ (H)Ωk−i .
i+1 i+1
i=0 i=0

Lemme 6.4 Soit d expΩ l’application linéaire de Mn (K) dans Mn (K) définie par
X 1
∀H ∈ Mn (K), d expΩ H = adkΩ (H)
k≥0
(k + 1)!

La série d expΩ H converge pour tout H et on a en outre kd expΩ k ≤ e2kΩk .


6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 53

Preuve. Notons tout d’abord que l’opérateur adiΩ est borné par 2i kΩki . En effet,
∀H ∈ Mn (K), kadΩ (H)k ≤ kΩkkHk + kHkkΩk = 2kΩkkHk
kadΩ (H)k
Donc, supkHk6=0 kHk
≤ 2kΩk et
kadiΩ (H)k i−1
kadΩ (H)k
sup ≤ 2kΩk sup ≤ . . . ≤ 2i kΩki .
kHk6=0 kHk kHk6=0 kHk
Maintenant, pour Ω non nulle et N quelconque, il vient
N
X N
X
1 k 1 e2kΩk − 1
k adΩ (H)k ≤ 2k kΩkk kHk ≤ kHk ≤ kHke2kΩk
(k + 1)! (k + 1)! 2kΩk
k=0 k=0

La borne reste valable pour Ω = 0, donc la série converge et l’opérateur d expΩ est borné par e2kΩk .

On conclut cette première série de lemmes avec le résultat suivant :


d exp(Ω)
Théorème 6.5 Soit dΩ
l’application linéaire tangente de Ω 7→ exp(Ω). Alors on la relation
suivante :
 
d exp(Ω)
∀H ∈ Mn (K), H = (d expΩ (H)) exp(Ω). (6.75)
dΩ

Preuve. Notons tout d’abord que toutes les séries considérées sont absolument
 0  convergentes. On
P−1
peut donc écrire (par convention i=0 = 0 ce qui correspond au fait que dΩ dΩ
H = 0) :
  X 1  dΩk 
d exp(Ω)
H = H
dΩ k! dΩ
k≥0

X 1 X k−1  
k
= adiΩ (H)Ωk−1−i
k! i+1
k≥0 i=0
X X 1
= adiΩ (H)Ωk−1−i
i≥0 k≥i+1
(i + 1)!(k − i − 1)!
XX 1
= adiΩ (H)Ωj
i≥0 j≥0
(i + 1)!j!

Cette dernière expression n’est autre que le produit de Cauchy des deux séries d expΩ (H) et
exp(Ω).

6.2 Etude de l’opérateur d expΩ


Dans cette partie, on suppose que K = C. Soit Ω ∈ Mn (C) une matrice fixée non nulle et
on s’intéresse au spectre de d expΩ , l’objectif ultime étant d’établir une formule de l’opérateur
54

inverse. Notons tout d’abord que 0 est valeur propre de adΩ . Les vecteurs propres associés sont les
matrices M qui commutent avec Ω. Par exemple, pour n = 2 et
 
0 1
Ω= ,
−1 0

il s’agit des matrices de la forme


 
a b
.
−b a
λ
Plus généralement, pour toute valeur propre non nulle λ de adΩ , e λ−1 est valeur propre de d expΩ .
En effet, si λ est une v.p non nulle de adΩ et H 6= 0 un vecteur propre associé, on a :
X 1 X 1 eλ − 1
d expΩ H = adkΩ (H) = λk H = H.
k≥0
(k + 1)! k≥0
(k + 1)! λ

On a donc le lemme suivant :


Lemme 6.6 L’opérateur d expΩ est inversible si et seulement si la condition suivante est satis-
faite :

Sp(adΩ ) ∩ 2iπZ∗ = ∅ (6.76)

Preuve. La valeur propre λ = 0 de adΩ est “envoyée” sur la valeur P propre 1 de d expΩ . En
1
effet, pour λ = 0 et H non nulle commutant avec Ω, d expΩ H = k≥0 (k+1)! λk H = H. Soit
Q
P (λ) = ri=1 (λ − λi )mi le polynôme caractéristique de adΩ . Notons alors
r
Y
Q(λ) = (λ − R(λi ))mi
i=1
λ
P 1 k
où R(λ) = (e − 1)/λ = Si on tronque R, alors Q ◦ R est un polynôme divisible
k≥0 (k+1)! λ .
par P car
Yr Yr Yr
Q(R(λ)) = (R(λ) − R(λi ))mi = (λ − λi )mi (Ri (λ))mi = P (λ) (Ri (λ))mi
i=1 i=1 i=1

où Ri (λ) est un polynôme tel que R(λ) − R(λi ) = (λ − λi )Ri (λ). Cette dernière égalité est encore
λ
vraie pour R non tronquée donc si λi est valeur propre de multiplicté mi de adΩ , alors e λi −1 i
est
valeur propre de d expΩ avec la même multiplicité mi . L’espace Mn (C) étant de dimension finie,
on obtient bien toutes les valeurs propres de d expΩ comptées avec leur multiplicité. L’opérateur
λ
d expΩ est donc inversible si pour tout λi de Sp(adΩ ), e λi −1
i
6= 0. Une condition nécessaire et
suffisante pour que d expΩ soit inversible est donc :
Sp(adΩ ) ∩ 2iπZ∗ = ∅
6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 55

La formule de l’opérateur inverse fait intervenir les nombres de Bernoulli définis par la donnée de
B0 = 1 et la relation récurrente suivante, pour n ≥ 1 :
n 
X 
n+1
Bk = 0.
k=0
k

On a par exemple

2B1 + B0 = 0
3B2 + 3B1 + B0 = 0
4B3 + 6B2 + 4B1 + B0 = 0
5B4 + 10B3 + 10B2 + 5B1 + B0 = 0

donc B1 = − 21 , B2 = 61 , B3 = 0 et B4 = −130
. D’une manière générale, Bk , k ≥ 1, est défini en
fonction des Bi pour i ≤ k − 1. On considère alors la série entière

X Bk
S(z) = zk
k=0
k!

pour z ∈ C. On peut montrer que le rayon de convergence de S(z) est 2π et que l’on a la relation
z
∀z ∈ C∗ , S(z) =
ez −1
En effet, en multipliant les deux séries suivantes (par produit de Cauchy) on obtient la relation
! ! n−1
!
X Bn X 1 X Bi X X Bk
zn z n−1 = z i+j−1 = z n−1 = B0 = 1.
n≥0
n! n≥1
n! i≥0,j≥1
i!j! n≥1 k=0
k!(n − k)!

Donc S(z)(ez − 1) = z. En outre, pour 0 < |z| < 2π, on a en particulier z ∈ / 2iπZ∗ , donc
ez − 1 6= 0. La série entière de la fonction holomorphe z/(ez − 1) est donc bien définie pour
|z| < 2π, car en z = 0 on a par continuité z/(ez − 1) = 1. Le rayon de convergence de S(z) est
donc bien 2π.
P Bk k
Notons que la fonction z 7→ S(z) − 1 − B1 z étant paire, la série k≥2 k! z ne comporte que
des termes pairs, de sorte que les B2k+1 sont nuls pour k ≥ 1.

Théorème 6.7 On suppose que kΩk < π. Alors l’opérateur d expΩ est inversible et son inverse
est donné par la formule suivante :
X Bk
d exp−1
Ω = adkΩ . (6.77)
k≥0
k!
56

Preuve. Pour kΩk < π, l’opérateur adΩ est borné strictement par 2π, et donc d expΩ est inversible
(d’après la question 3). En outre, la série
X Bk
adkΩ
k≥0
k!

converge et définit un opérateur qui n’est autre que d exp−1


Ω puisque
! !
X Bn X 1
d exp−1
Ω ◦d expΩ = adnΩ n−1
adΩ = ad0Ω = Id
n≥0
n! n≥1
n!

d’après la la relation S(z)(ez − 1)/z = 1.

6.3 La formule BCH


Soient A et B deux matrices de Mn (C) qui ne commutent pas. On cherche donc une matrice
C(t) de Mn (C) telle que, pour tout t suffisamment petit :
exp(tA) exp(tB) = exp(C(t)).
On va maintenant établir que C(t) satisfait une équation différentielle dont on va déterminer l’ex-
pression.

En développant le produit, on obtient aisément


t2 2
exp(tA) exp(tB) = I + t(A + B) + (A + 2AB + B 2 ) + O(t3 ).
2
En effet, reste peut être estimé de la manière suivante :
t2 2 t2
exp(tA) exp(tB) = (I + tA + A + t3 RA (t))(I + tB + B 2 + t3 RB (t))
2 2  
t2 2 2 3 1 2 2
= I + t(A + B) + (A + B + 2AB) + t RA (t) + RB (t) + (A B + AB )
2 2
où les matrices RA (t) et RB (t) sont bornées respectivement par Const kAk3 et Const kBk3 . On a
donc la formule souhaitée avec un reste majoré en norme par
 
3 1 2 2 3 3 3 1 2 2
|t| kRA (t)+RB (t)+ (A B+AB )k ≤ Const |t| kAk + kBk + (kAk kBk + kAkkBk ) .
2 2
t2
On pose X(t) = exp(tA) exp(tB) − I = t(A + B) + 2
(A2 + 2AB + B 2 ) + O(t3 ).
Lemme 6.8 Il existe ǫ > 0 tel que pour tout |t| ≤ ǫ, la série

X (−1)k+1
C(t) := X(t)k
k=1
k
6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 57

converge et C(t) vérifie


exp(tA) exp(tB) = exp(C(t)).

Preuve. On a
 
|t|2 2 2 3 3 3 1 2 2
kX(t)k ≤ |t|(kAk+kBk)+ (kAk +kBk +2kAkkBk)+C|t| kAk + kBk + (kAk kBk + kAkkBk )
2 2
donc pour |t| < ǫ, ǫ suffisamment petit, kX(t)k < 1 et la série C(t) (du logarithme) converge. On
a bien sûr que exp(C(t)) = exp(log(I + X(t))) = I + X(t) = I + (exp(tA) exp(tB) − I) =
exp(tA) exp(tB).
Premiers termes. Il vient alors
t2 
C(t) = t(A + B) + A2 + 2AB + B 2 − (A + B)2 + O(t3 ),
2
de sorte que C(t) = tC1 + t2 C2 + O(t3 ) avec C1 = (A + B) et C2 = A2 + 2AB + B 2 − (A + B)2 .

De la même manière, pour |s| ≤ ǫ et |t| ≤ ǫ, il existe une fonction (s, t) 7→ Z(s, t) à valeurs
dans Mn (C), différentiable et telle que

exp(sA) exp(tB) = exp(Z(s, t)).

Il suffit en effet de poser X(s, t) = exp(sA) exp(tB) − I = O(max(|s|, |t|) et Z(s, t) = log(I +
X(s, t)), puis de remarquer que Z(s, t) est différentiable car log est une série entière et X(s, t) est
différentiable par rapport à s et t.

Lemme 6.9 Pour tous |s| ≤ ǫ et |t| ≤ ǫ, on a les égalités suivantes :


  
∂Z
A exp(sA) exp(tB) = d expZ(s,t) (s, t) exp(Z(s, t)),
∂s

∂Z 1 X Bk
(s, t) = d exp−1
Z(s,t) (A) = A − adZ(s,t) (A) + adkZ(s,t) (A),
∂s 2 k≥2
k!

et
∂Z 1 X Bk
(s, t) = d exp−1
−Z(s,t) (B) = B + adZ(s,t) (B) + adkZ(s,t) (B).
∂t 2 k≥2
k!

Preuve. En dérivant par rapport à s l’égalité exp(sA) exp(tB) = exp(Z(s, t)), il vient
  
d exp Z(s, t) ∂Z
A exp(sA) exp(tB) = (s, t)
dZ(s, t) ∂s
  
∂Z
= d expZ(s,t) (s, t) exp(Z(s, t))
∂s
58

où l’on a utilisé la formule (6.75). Ainsi, en multipliant à gauche les deux membres de l’égalité par
le terme exp(−tB) exp(−sA) = (exp(Z(s, t)))−1 , on obtient
  
∂Z
A = d expZ(s,t) (s, t)
∂s
puis en appliquant l’opérateur d expZ(s,t)
∂Z
(s, t) = d exp−1
Z(s,t) (A)
∂s
c’est-à-dire, en tenant compte du fait que B0 = 1 et B1 = − 21 :
∂Z 1 X Bk
(s, t) = A − adZ(s,t) (A) + adkZ(s,t) (A).
∂s 2 k≥2
k!

Pour la dérivée par rapport à t, l’astuce consiste à écrire d’écrire tout d’abord l’égalité exp(sA) exp(tB) =
exp(Z(s, t)) sous la forme
exp(−tB) exp(−sA) = exp(−Z(s, t))
par passage aux inverses. En dérivant par rapport à t comme précédemment par rapport à s, puis
en remarquant que
adk−Z(s,t) = (−1)k adZ(s,t)
et en tenant compte du fait que les B2k+1 sont nuls pour k ≥ 1, on obtient la formule de l’énoncé.

La fonction recherchée C(t) peut maintenant s’obtenir comme solution d’un équation différentielle
en remarquant qu’on a bien sûr C(t) = Z(t, t). Il vient ainsi :
∂Z(s, t) ∂Z(s, t)
Ċ(t) = +
∂s s=t ∂t s=t
1 X Bk 1 X Bk
= A − adZ(t,t) (A) + adkZ(t,t) (A) + B + adZ(t,t) (B) + adkZ(t,t) (B)
2 k≥2
k! 2 k≥2
k!

et donc
 P Bk k
Ċ(t) = A + B − 21 adC(t) (A − B) + k≥2 k! adC(t) (A + B)
C(0) = 0
Premiers termes. En s’appuyant sur l’identité de Jacobi :
∀(D1 , D2 , D3 ) ∈ Mn (C), adD1 (adD2 (D3 )) + adD3 (adD1 (D2 )) + adD2 (adD3 (D1 )) = 0,
il est facile de vérifier que C(t) = tC1 + t2 C2 + t3 C3 + O(t4 ) avec
C1 = A + B,
1
C2 = adA (B),
2
1 
C3 = ad2A (B) + ad2B (A)
12
6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 59

en insérant C(t) = tC1 + t2 C2 + t3 C3 + O(t4 ) dans l’équation différentielle obtenue ci-dessus.


Les calculs s’écrivent :
1 B2
C1 + 2tC2 + 3t2 C3 = A + B − adtC1 +t2 C2 (A − B) + t2 ad2C1 (A + B)
2 2
de sorte que C1 = A + B, 2C2 = − 21 adC1 (A − B) et 3C3 = − 12 adC2 (A − B) + B2
2
ad2C1 (A + B).
C1 et C2 s’obtiennent directement, C3 en utilisant Jacobi.

6.4 Application aux méthodes de splitting


Soient A et B deux matrices de Mn (C) qui ne commutent pas. On cherche maintenant à
approcher exp(t(A + B)) par un produit d’exponentielles de la forme

ψs (t) = exp(ta1 A) exp(tb1 B) . . . exp(tas A) exp(tbs B),

pour s un entier non nul et (a1 , . . . , as ) et (b1 , . . . , bs ) des s-uplets de réels. Ceci revient à approcher
la solution du système différentiel linéaire

ẏ = (A + B)y = Ay + By, y(0) = y0 ,

c’est–à-dire exp(t(A + B))y0 comme composition des solutions des systèmes

ẏ = Ay et ẏ = By.

Cette technique, dite de décomposition ou en anglais de “splitting”, repose sur la possibilité de


résoudre chacun des deux sous-systèmes de manière simple et explicite. Dans le cas présent, une
telle situation se présente donc lorsque exp(tA) et exp(tB) sont simples à calculer (par exemple
si A est diagonale), ou en tout cas plus simples que exp(t(A + B)). Un avantage fondamental de
cette technique est son caractère géométrique : si M est par exemple de trace nulle, alors toute
décomposition de M en somme M = A + B de deux matrices de traces nulles permet d’obte-
nir une approximation de la solution qui conserve le volume : il est en effet immédiat qu’alors
det(ψs (t)) = det(exp(ta1 A)) det(exp(tb1 B)) . . . det(exp(tas A)) det(exp(tbs B)) = 1. Les autres
propriétés géométriques telles que la symplecticité ou la conservation d’invariants peuvent de la
même manière être conservées par cette technique. On s’intéresse donc ici à la construction de
méthode d’ordre élevé.

Définition 6.10 On dit que ψs (t) est d’ordre p, si p est le plus grand entier non nul tel que ψs (t) =
exp(tA) exp(tB) + O(tp+1 ).

Théorème 6.11 Le schéma de Lie est d’ordre 1 et le schéma de Strang est d’ordre 2, i.e.

exp(tA) exp(tB) = exp(t(A + B)) + O(t2 )

et
1 1
exp( tA) exp(tB) exp( tA) = exp(t(A + B)) + O(t3 ).
2 2
60

Preuve. Par application de la BCH, on a :


exp(tA) exp(tB) = exp(tC̃(t))
avec C̃(t) = A + B + 2t adA (B) + O(t2 ). Donc exp(tA) exp(tB) est d’ordre 1 et pas mieux car A
et B ne commutent pas nécessairement . De même :
1
exp(tB) exp( tA) = exp(tC̃(t))
2
1 t 1 2
avec C̃(t) = B + 2 A + 2 adB ( 2 A) + O(t ). En réappliquant la BCH, on obtient :
1
exp( tA) exp(tC̃(t)) = exp(tD̃(t))
2
avec
1 t t
D̃(t) = A+C̃(t)+ ad 1 A (C(t))+O(t2 ) = A+B+ (adB (A)+adA (B))+O(t2 ) = A+B+O(t2 ),
2 2 2 4
1 1
donc exp( 2 tA) exp(tB) exp( 2 tA) est d’ordre au moins 2 et pas mieux dès lors que A et B ne
commutent pas.
On considère maintenant la séquence d’approximation

ψj (t) = exp(ta1 A) exp(tb1 B) . . . exp(taj A) exp(tbj B), j = 1, . . . , s,

et on suppose que pour j = 1, . . . , s, ψj (t) = exp(tEj (t)) avec

t
Ej (t) = αj A + βj B + γj adA (B) + O(t2 )
2
Le même calcul que pour le schéma de Lie avec A et B remplacées respectivement par a1 A et b1 B
donne
exp(a1 A) exp(b1 B) = exp(tC̃(t)) = exp(tẼ1 (t))
avec C̃(t) = a1 A + b1 B + 2t ada1 A (b1 B) + O(t2 ), soit α1 = a1 , β1 = b1 et γ1 = a1 b1 .

Lemme 6.12 Pour 2 ≤ j ≤ s, on a les relations de récurrence suivantes :

(i) αj = αj−1 + aj
(ii) βj = βj−1 + bj
(iii) γj = γj−1 + aj bj + αj−1 bj − βj−1 aj

Preuve. Supposons la récurrence établie pour i = 1, . . . , j−1. Alors, de ψj = ψj−1 exp(taj A) exp(tbj B),
on tire
ψj = exp(tEj−1 (t)) exp(tC̃(t))
où
t t
C̃(t) = aj A + bj B + aj bj adA (B) + O(t2 ), Ej−1 (t) = αj−1A + βj−1B + γj−1 adA (B) + O(t2 ),
2 2
6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 61

et par application de la BCH, ψj = exp(tEj (t)) avec (modulo les termes en O(t2 ))
t
Ej (t) ≡ Ej−1 (t) + C̃(t) + adEj−1 (t) (C̃(t)),
2
t t t
≡ (αj−1 + aj )A + (βj−1 + bj )B + γj−1adA (B) + aj bj adA (B) + adαj−1 A+βj−1 B (aj A + bj B),
2 2 2
t
≡ (αj−1 + aj )A + (βj−1 + bj )B + (γj−1 + aj bj + bj αj−1 − aj βj−1) adA (B).
2
D’où les relations de récurrence.

Théorème 6.13 La méthode de splitting ψs (t) satisfait


Ps les assertions Pssuivantes :
— ψs est d’ordre au moins 1 si et seulement si j=1 aj = 1 et j=1 bj = 1
P P
— ψs est d’ordre au moins 2 si et seulement si elle est d’ordre au moins 1 et sj=1 bj ji=1 ai =
1
2

Ps
Preuve. Pour j = 2,P . . . , s, on a αj = αj−1 + aj . Comme α1 = a1 , on obtient
Ps α s = Pj=1 aj . De
s s
même, il vient βs = j=1 bj . Enfin, la troisième relation (iii) donne γs = i=1 ai bi + i=1 (αi bi −
βi ai ). Maintenant, on sait que
ψs (t) = exp(t(A + B)) + O(t2 )
Ps
si et seulement si Es (t) = A + B + O(t). Donc ψs (t) est d’ordre au moins 1 ssi
P j=1 aj =
s
j=1 bj = 1. En outre,
ψs (t) = exp(t(A + B)) + O(t3 )
2
Ps
si
Ps et seulement si
Ps Es (t) = A
Ps + B + O(t ). Donc, ψs (t) est d’ordre au moins 2 ssi j=1 aj =
j=1Pbj = 1 et i=1 ai bi + i=1 (αi bi − βi ai ) = 0. En tenant compte des deux premières relations
on a si,j=1 ai bj = 1 de sorte que la troisième
s
X s
X
0= ai bi + (βi ai − αi bi )
i=1 i=1

peut se réécrire !
s j
X X 1
ai bj = .
j=1 i=1
2

Pour atteindre des ordres supérieurs à 3, il convient de calculer les termes d’ordres supérieurs
au moyen de la BCH. Bien que le principe de la procédure soit simple, les calculs deviennent
rapidement compliqués. On reprend donc succinctement la technique de composition décrite plus
avant dans ce cours et on suppose que pour une entier s non nul donné, l’approximation ψs (t) est
d’ordre p, et qu’on peut donc écrire :

ψs (t) = exp(tC̃(t))
62

avec C̃(t) = A + B + tp Cp+1 + O(tp+1 ), où Cp+1 est une matrice non nulle de Mn (C) formée de
commutateurs de A et B, que l’on n’explicitera pas. On considère alors l’approximation suivante :

φ(t) = ψs (µ1 t)ψs (µ2 t)ψs (µ3 t),

pour tout triplet (µ1 , µ2 , µ3 ) de réels de somme 1 (µ1 + µ2 + µ3 = 1).


Lemme 6.14 La relation suivante est satisfaite pour tous (µ1 , µ2 , µ3 ) de réels de somme 1 :

φ(t) = exp(tD̃(t))

avec
D̃(t) = A + B + tp (µp+1
1 + µp+1
2 + µp+1
3 )Cp+1 + O(t
p+1
).
Preuve. En appliquant la BCH avec les deux matrices µ2 C̃(µ2 t) et µ3 C̃(µ3 t), on a
 
ψs (µ2 t)ψs (µ3 t) = exp t(µ2 C̃(µ2 t) + µ3 C̃(µ3 t)) + t2 R(t)
où R(t) est une somme de commutateurs comprenant k ≥ 2 matrices parmi A + B, tp Cp+1 et
O(tp+1 ). Si les k matrices sont toutes prises égales à A + B, alors le commutateur est nul. Si au
moins l’une d’entre elles est différente, alors le commutateur est un O(tp ). Donc t2 R(t) = O(tp+2 ).
Maintenant, on a :
µ2 C̃(µ2 t) + µ3 C̃(µ3 t) = (µ2 + µ3 )(A + B) + tp (µp+1
2 + µp+1
3 )Cp+1 + O(t
p+1
)
de sorte que

ψs (µ2 t)ψs (µ3 t) = exp t(µ2 + µ3 )(A + B) + tp+1 (µp+1
2 + µp+1
3 )Cp+1 + O(t
p+2
) .
En répétant l’opération avec ψs (µ1 t) et en tenant compte de la relation µ1 + µ2 + µ3 = 1, on obtient
la formule souhaitée.

Théorème 6.15 Si (µ1 , µ2 , µ3) satisfait les relations

µ1 + µ2 + µ3 = 1, µp+1
1 + µp+1
2 + µp+1
3 = 0,

alors φ(t) est d’ordre au moins p + 1.

Preuve. Pour avoir D̃(t) = A + B + O(tp+1 ), il suffit de prendre (µ1 , µ2 , µ3 ) comme indiqué.
Si p = 2q + 1 est impair, alors l’équation µ2q+2
1 + µ2q+2
2 + µ2q+2
3 = 0 n’a pas de solution réelle, en
dehors de (0, 0, 0), dont la somme de vaut pas 1. Si p = 2q est pair et µ1 = µ3 , alors l’équation

2µ2q+1
1 + (1 − 2µ1 )2q+1 = 0,
1
admet la solution réelle µ1 = 2−21/(2q+1) , µ3 = µ1 , µ2 = 1 − 2µ1. Pour cette solution, l’approxi-
mation φ(t) est d’ordre au moins p + 1. Si on suppose en outre que ψs (t) satisfait la relation de
symétrie suivante pour tout |t| suffisamment petit :

(ψs (t))−1 = ψs (−t),


6. FORMULE DE BAKER-CAMPBELL-HAUSDORFF (BCH) 63

alors p est nécessairement pair. En effet, en reportant ψs (t) = exp(t(A+B)+tp+1 Cp+1 +O(tp+2 ))
dans (ψs (t))−1 = ψs (−t), on obtient (−1)p+1 = −1. Pour la solution (µ1 , µ2, µ1 ) du théorème
précédent, on a alors également :
(φ(t))−1 = φ(−t),
car
ψs (µ1 t)ψs (µ2 t)ψs (µ1 t)ψs (−µ1 t)ψs (−µ2 t)ψs (−µ1 t) = I
L’ordre de φ(t) est donc pair, donc au moins p+2. En partant de ψ3 (t) = exp( 12 tA) exp(tB) exp( 12 A),
qui est d’ordre 2 et on peut ainsi construire des approximations d’ordres 4, 6, 8...
64
Deuxième partie

Systèmes hamiltoniens hautement oscillants

65
7. INTRODUCTION 67

Ce cours est une introduction à la théorie de la moyennisation des équations différentielles or-
dinaires dans Rn . Bien qu’il soit possible dans certaines situations d’appliquer (au moins en partie)
les techniques développées ici à des équations ni périodiques, ni quasi-périodiques, on se limitera
à donner les démonstrations dans les cas périodique et quasi-périodique, alors que les cas plus
généraux feront seulement l’objet de remarques. Les résultats présentés pourraient pour la plupart
s’envisager dans le cadre d’une équation différentielle posée dans un espace de Banach (ou de
Hilbert lorsque les aspects géométriques interviennent) sans difficulté conceptuelle majeure, mais
là-encore nous nous limiterons au seul cas de Rn afin de simplifier les développements.

Un grande partie des démonstrations provient des ouvrages et articles suivants :


— P. Lochak, C. Meunier, Multiphase Averaging for Classical Systems, with Applications to
Adiabatic Theorems [14]
— J. A. Sanders, F. Verhulst and J. Murdock, Averaging Methods in Nonlinear Dynamical
Systems [19]
— F. Castella, P. Chartier, F. Méhats et A. Murua, Stroboscopic averaging for the nonlinear
Schrödinger equation [5]
— P. Chartier, A. Murua, J.M. Sanz-Serna, Higher-Order averaging, formal series and nume-
rical integration II : the quasi-periodic case [7]
D’autres références complémentaires seront données en fin de ce cours.

7 Introduction
Considérons une équation différentielle ordinaire de la forme

ẏ ε = εftε (y ε ), y ε (0) = y0 , y ε , y 0 ∈ D ⊂ Rn , (7.78)

où D désigne un ouvert connexe d’adhérence compacte. La fonction (y, t, ε) 7→ ftε (y) est supposée
définie sur
Ω = D × R×] − ε0 , ε0 [,
où ε0 est un réel strictement positif. En règle générale, (y, t, ε) 7→ ftε (y) est supposée régulière sur
Ω, mais dans certains cas que l’on précisera, cette hypothèse peut être relaxée. On rappelle qu’en
vertu du théorème de Cauchy-Lipschitz, on a
Théorème 7.1 On considère l’équation différentielle (7.78) et on suppose que la fonction (y, t, ε) 7→
ftε (y) est définie, continue sur Ω, bornée par une constante Mf > 0 sur D × R×] − ε0 , ε0[ et uni-
formément lipschitzienne par rapport à y ∈ D, c’est-à-dire qu’il existe une constante Lf > 0 telle
que

∀t ∈ R, ∀|ε| < ε0 , ∀(y1 , y2 ) ∈ D × D, kftε (y1 ) − ftε (y2 )k ≤ Lf ky1 − y2 k. (7.79)

Soit ỹ0 ∈ D. Alors, il existe r > 0 tel que pour tout y0 ∈ Br (ỹ0 ), pour tout |ε| < ε0 , il existe une
unique solution y ε (t) ∈ D de (7.78) de classe C 1 en temps sur un intervalle de la forme [0, Tε [. En
T T
outre il existe T > 0 tel que, pour tout 0 < |ε| < ε0 , Tε > |ε| avec y ε (t) ∈ D pour tout 0 ≤ t ≤ |ε| .
68

Preuve. L’existence et l’unicité de la solution de (7.78) résultent du théorème de Cauchy-Lipschitz.


Maintenant, D étant ouvert, il existe R > r > 0 tel que BR (ỹ0 ) ⊂ D. Tant que y ε(t) reste dans D,
on a
ky ε (t) − ỹ0 k ≤ |ε|Mf t + r, (7.80)
R−r
donc en particulier, y ε (t) reste dans BR (ỹ0 ) ⊂ D tant que t < Mf |ε|
, ce qui prouve l’existence de
y ε (t) sur l’intervalle de temps [0, T /|ε|[ avec T = R−r
Mf
.
Le paramètre ε est supposé petit, et il est tentant de considérer le problème obtenu en remplaçant
ε par 0 dans l’équation (7.78), c’est-à-dire
ẏ 0 = 0, y 0 (0) = y0 .
Mais il est clair que la solution de ce système (y 0(t) = y0 ) ne constitue une approximation valable
de y ε (t) que pour des temps 0 ≤ t ≤ T (voir (7.80)). Si l’on souhaite obtenir une approximation de
y ε (t) pour des valeurs de t comprises entre et 0 et T /|ε|, l’idée qui consiste à moyenner le second
membre de (7.78) par rapport à t donne de bien meilleurs résultats. Par exemple, si la fonction f
est périodique de période P en la variable t, alors cette moyenne est définie par
Z
1 P 0
hf i(z) := f (z)ds.
P 0 s
On voit au passage qu’en remplaçant l’équation (7.78) par sa version moyennée
ż ε = εhf i(z ε ), z ε (0) = y0 , (7.81)
on a remplacé un problème non-autonome par un problème autonome (dont le champ de vecteur
hf i ne dépend pas du temps) et ainsi simplifié son étude dynamique. L’objet de ce cours est de
préciser dans un certain nombre de situations la validité et la pertinence de l’approximation en
moyenne.

On utilisera fréquemment le lemme de Gronwall que l’on rappelle ci-après à toutes fins utiles :

Lemme 7.2 Soit I un intervalle de la forme [a, +∞[, [a, b] ou [a, b[ avec a < b. On considère
trois fonctions α, β et u à valeurs réelles définies et continues sur I. Si β est positive et u satisfait
l’inégalité intégrale Z t
u(t) ≤ α(t) + β(s)u(s) ds, ∀t ∈ I,
a
alors Z Z t 
t
u(t) ≤ α(t) + α(s)β(s) exp β(r) dr ds, t ∈ I.
a s
En outre, si α est croissante, alors
Z t 
u(t) ≤ α(t) exp β(s) ds , t ∈ I.
a
8. EXAMPLES 69

Equation logistique
2

1.8

1.6
y et z

1.4

1.2

0.8
0 10 20 30 40 50 60 70 80 90 100
Temps

F IGURE 10 – Solutions de l’équation logistique (rouge) et de sa version moyennée (bleu).

8 Examples

8.1 Equation logistique


L’équation logistique régit la dynamique d’une population constituée d’une seule espèce. Si on
note y ε (t) l’effectif de cette espèce à l’instant t, alors y ε est solution de l’équation différentielle
suivante :
y˙ε = ε (y ε (1 − y ε ) + sin(t)) , y ε (0) = y0 .

On voit donc ici que ftε (y) = y(1 − y) + sin(t) est périodique de période P = 2π et il est facile de
vérifier que (y, t, ε) 7→ ftε (y) est bornée sur D × R × R où D = BR (y0 ) = {y ∈ R, |y − y0 | < R}
par Mf = (|y0|+R)(|y0|+R+1) et lipschitzienne (ou Lipschitz pour plus de brièveté) de constante
de Lipschitz Lf = 1 + 2(|y0| + R). Il existe donc une solution unique y ε (t) ∈ D de l’équation
R
logistique sur l’intervalle [0, |ε|M f
[ pour tout ε non nul (et bien sûr sur [0, +∞[ pour ε = 0). On
peut ici aisément obtenir hf i(z) = z(1 − z), de sorte que l’équation moyennée (à l’ordre 1) s’écrit
simplement
ż ε = εz ε (1 − z ε ), z ε = y0 ,

R
dont la solution existe (et reste dans D) sur [0, |ε|M f
[. En outre, z ε se calcule explicitement et l’on
a:
y0 eεt
z ε (t) = .
1 + y0 (eεt − 1)
70

8.2 Equation de Van der Pol


L’équation de Van der Pol décrit un oscillateur qui peut être vu comme une perturbation de
l’oscillateur harmonique :
 ε
q̇ = p
ṗε = −q + ε(1 − q 2 )p
Après le changement de variables
q ε = cos(t)y1ε + sin(t)y2ε
pε = − sin(t)y1ε + cos(t)y2ε
le système s’écrit
 ε
ẏ1 = −ε sin(t) (1 − (cos(t)y1ε + sin(t)y2ε )2 )(− sin(t)y1ε + cos(t)y2ε ) := εft,1ε
(y ε ))
ẏ2ε = ε cos(t) 1 − (cos (t) y1ε + sin (t) y2ε )2 (− sin (t) y1ε + cos (t) y2ε ) := εft,2
ε
(y ε))
ε ε
et est donc de la forme (7.78) avec (y, t, ε) 7→ (ft,1 (y), ft,2 (y)).
Remarque 8.1 L’équation de Van der Pol est un exemple d’une classe beaucoup plus large de
problèmes de la forme
u̇ε = Auε + εg(uε), uε (0) = y0 ,
où g : Rn → Rn est une fonction régulière et A une matrice de M(Rn ) antisymétrique dont le
spectre est inclus dans 2iπ
P
Z. En posant y ε (t) = e−tA uε (t), et en différentiant il vient

ẏ ε = −Ae−tA uε + e−tA u̇ε = −Ae−tA uε + e−tA (Auε + εg(uε )) = εe−tA g etA y ε

de sorte que y ε satisfait une équation de la forme (7.78) avec ftε (y) = e−tA g etA y . Le caractère
périodique en temps t (de période P ) de ftε est assuré par l’hypothèse Sp(A) ⊂ 2iπ P
Z.
Le calcul donne alors
1 1
hf i1(z) = − (kzk22 − 4)z1 , hf i2(z) = − (kzk22 − 4)z2 ,
8 8
et il est alors aisé de déterminer l’équation approchée du cycle limite kzk2 = 2. La moyennisation
à l’ordre 1 de l’équation de Van der Pol permet ainsi d’étudier très simplement sa dynamique. On
a en effet
d ε 2 ε
kz k2 = 2(z1ε ż1ε + z2ε ż2ε ) = – kz ε k22 (kz ε k22 − 4),
dt 4
équation qui a deux équilibres, kz ε k2 = 0 et kz ε k2 = 2. Le premier est instable, alors que le second
est stable. On peut visuellement se convaincre de la pertinence de l’équation (7.81) sur la figure 11
où l’on a représenté la solution (q ε , pε ) du problème de départ ainsi que la solution du problème
moyenné à l’ordre 1. Notons pour finir qu’il apparait clairement sur cette figure que le cycle limite
n’est pas un cercle. En poussant le développement de l’équation moyennée à l’ordre 2, on peut
z2z
montrer qu’une meilleure approximation du cycle est donnée par l’équation kzk22 − ε 22 1 = 4.
L’expression générale des termes d’ordres élevés de l’équation moyennée sera détaillée dans la
suite de ce cours.
8. EXAMPLES 71

Van Der Pol oscillator Van Der Pol oscillator


2.5 2.5

2 2

1.5 1.5

1 1

0.5 0.5

0 0
p

p
−0.5 −0.5

−1 −1

−1.5 −1.5

−2 −2

−2.5 −2.5
−2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5
q q

F IGURE 11 – Solutions de l’équation de Van Der Pol originale (rouge) et de sa version moyennée
(bleu)

F IGURE 12 – Le pendule inversé (ou pendule de Kapitsa)

8.3 Pendule inversé


L’équation du pendule inversé décrit le mouvement d’un pendule soumis à une oscillation
(extérieure) de sa base. Cette oscillation haute-fréquence permet dans certains cas de stabiliser le
pendule dans la position verticale θ = 0, position évidemment instable en l’absence du mouvement
imprimé à la base. Les données du problème (voir figure 12) sont les suivantes :
— θ : angle entre la tige du pendule et l’axe vertical
— l : longueur de la tige
— g : acceleration due à la gravité
— 1/ε : fréquence angulaire de la vibration du point de suspension de la tige (noté y(t) sur la
figure)
— vmax > 0 : vitesse verticale maximale de la base (de taille O(1))
— ϕ0 : phase initiale de la vibration.
72

Les équations du mouvement se réduisent alors à une équation sur l’angle θ du second ordre :
  
d2 ε g 1 vmax t
2
θ = + cos + ϕ0 sin θε
dt l ε l ε
Afin de simplifier l’étude et les notations, on suppose dans la suite que ϕ0 = 0 et on pose α = g/l
et β = vmax /l. Par changement d’échelle de temps τ = εt , on obtient l’équation
d2 θ ε
2
= θ̈ε = ε(εα + β cos(τ )) sin(θε )

et en posant q ε = θε et pε = 1ε θ̇ε , on est ramené à un système d’ordre 1 de la forme :
q̇ ε = εpε
ṗε = β cos(τ ) sin(q ε ) + εα sin(q ε )
Finalement, en posant y1ε = q ε et y2ε = −β sin(τ ) sin(q ε ) + pε , il vient
ẏ1ε = εpε = ε(y2ε + β sin(τ ) sin(y1ε))
ẏ2ε = −β cos(τ ) sin(y1ε ) − β sin(τ ) cos(y1ε )ẏ1ε + ṗε
= εα sin(y1ε ) − εβ sin(τ ) cos(y1ε )(y2ε + β sin(τ ) sin(y1ε))
Il s’agit donc d’un système de la forme (7.78) périodique en temps de période P = 2π, avec un
champ de composante
ε ε β2
ft,1 (y) = y2 + β sin(τ ) sin(y1 ), ft,2 (y) = α sin(y1) − sin2 (τ ) sin(2y1) − β sin(τ ) cos(y1 )y2 ,
2
dont la moyenne s’écrit :
β2
hf i1 (z) = z2 , hf i2 (z) = α sin(z1 ) − sin(2z1 ).
4
L’équation moyenne est donc de la forme
 
ε β2
Z̈ = ε α − cos(Z ) sin(Z ε ).
ε
2
2
Cette équation montre qu’une force d’expression − β2 cos(Z ε ) s’oppose à la gravité. Cette force
permet de stabiliser l’équilibre Z ε = 0 pour β suffisamment grand (voir figure 13).

9 Moyennisation au premier ordre en ε


Dans cette partie, nous considérons l’approximation du problème hautement oscillant par l’équation
moyennée à l’ordre un en ε. Nous donnons en particulier une estimation d’erreur dans le cas
périodique, qui constitue l’estimation la plus connue et la plus utilisée dans la littérature. Le cas
général fait l’objet d’un théorème non démontré, qui vise à illustrer que la technique peut s’ap-
pliquer dans un cadre plus large au prix d’une notion d’ordre plus faible. Le cas intermédiaire
quasi-périodique sera développé dans la dernière partie du cours.
9. MOYENNISATION AU PREMIER ORDRE EN ε 73

Equation du pendule inversé


0.15

0.1

0.05

0
θ

−0.05

−0.1

−0.15

−0.2
0 10 20 30 40 50 60 70 80 90 100
Temps

F IGURE 13 – Solutions de l’équation du pendule (rouge) et de sa version moyennée (bleu).

9.1 Cas périodique


On se place dans le cas où f dépend du temps de manière périodique et on considère donc
l’équation moyennée à l’ordre 1
z˙ε = εhf i(z ε ), z ε (0) = y0 . (9.82)
Sous les hypothèses du théorème 7.1, il existe bien évidemment une unique solution de cette
équation sur un intervalle de temps de la forme [0, T̃ /|ε|[, puisqu’il est immédiat de voir que hf i
est Lipschitz par rapport à z ∈ D de constante de Lipschitz Lf . On a le résultat suivant :
Théorème 9.1 Soit z ε (t) la solution de l’équation (9.82), et soit T̃ > 0 tel que pour tout |ε| < ε0
et pour tout 0 ≤ |ε|t ≤ T̃ , z ε (t) ∈ D et y ε (t) ∈ D. Alors, il existe une constante C > 0,
indépendante de ε, telle que
∀|ε| < ε0 , ∀0 ≤ |ε|t ≤ T̃ , ky ε (t) − z ε (t)k ≤ Cε
où y ε (t) est la solution de (7.78).
Nous allons donner deux preuves de ce théorème, l’une directe, l’autre par changement de va-
riable. La première a l’avantage d’exiger moins de régularité sur f alors que la seconde se prête à
une généralisation à des ordres plus élevés.

Preuve. [Première preuve] Désignons par E ε (t) = y ε (t) − z ε (t) l’erreur d’approximation. Il vient
Z t
ε
E (t) = ε (fsε (y ε (s)) − hf i(z ε (s)) ds
Z0 t Z t
ε ε ε ε
= ε (fs (y (s)) − fs (z (s))) ds + ε (fsε (z ε (s)) − hf i(z ε (s)) ds
0 0
:= E1ε (t) + E2ε (t).
74

La fonction f étant Lipschitz, on a immédiatement l’estimation suivante du premier terme


Z t
ε
kE1 (t)k ≤ |ε|Lf kE ε (s)kds.
0

Pour le second terme, on découpe l’intervalle [0, t] en [0, nP ] ∪ [nP, t] où n est la partie entière de
t/P . L’erreur E2ε (t) se décompose ainsi en
n−1 Z (i+1)P
X Z t
ε ε ε ε
E2 (t) = ε (fs (z (s)) − hf i(z (s)) ds + ε (fsε (z ε (s)) − hf i(z ε (s)) ds.
i=0 iP nP
RP
En notant ∆εs (z) = fsε (z) − hf i(z) et en remarquant que 0 ∆εs (z)ds = 0, le terme d’indice i de
la somme peut alors être réécrit de la manière suivante :
Z (i+1)P Z P
ε ε
∆s (z (s))ds = ∆εs (z ε (s + iP ))ds
iP 0
Z P
= (∆εs (z ε (s + iP )) − ∆εs (z ε (iP ))) ds
0
et donc estimé par
Z P Z P
∆εs (z ε (s + iP ))ds ≤ k∆εs (z ε (s + iP )) − ∆εs (z ε (iP ))kds
0 0
Z P
≤ 2Lf kz ε (s + iP ) − z ε (iP )kds.
0
ε ε
Or kz (s + iP ) − z (iP )k ≤ s|ε|Mf , de sorte que
kE2ε (t)k ≤ nP 2 ε2 Mf Lf + (t − nP )2 ε2 Mf Lf ≤ ε2 tMf Lf P
Finalement, on a l’inégalité
Z t
ε
kE (t)k ≤ |ε|Lf kE ε (s)kds + tε2 Mf Lf P
0
2
et le lemme de Gronwall (avec α(t) = tε P Mf Lf fonction croissante et β(t) = |ε|Lf > 0) donne
alors
kE ε (t)k ≤ ε2 tP Mf Lf e|ε|Lf t ≤ |ε|P Mf Lf T̃ eLf T̃ .

La seconde preuve repose sur un changement de variable de la forme

y = Utε (x) := x + εuεt (x) (9.83)

où la fonction (x, t, ε) 7→ uεt (x) est supposée de classe C 1 par rapport à x et continue par rapport
à (x, t, ε). On impose en outre que ce changement de variable soit périodique en t de période P .
L’idée est de transformer l’équation (7.78) en une équation différentielle sur x de la forme

ẋε = εhf i(xε ) + ε2 Rtε (xε ), xε (0) = (U0ε )−1 (y0 ) (9.84)
9. MOYENNISATION AU PREMIER ORDRE EN ε 75

où la fonction (x, t, ε) 7→ Rtε (x) est un reste périodique en t, de période P , que l’on va chercher à
borner, ce qui permettra d’estimer z ε − xε , puis y ε − z ε . En remplaçant y ε via (9.83), il vient

ẏ ε = εftε (y ε ) = ẋε + ε (∂t uεt (xε ) + ∂x uεt (xε ) · ẋε )

de sorte que si (I + ε∂x uεt (xε )) est supposé inversible le long de la solution xε , alors

ẋε = ε(I + ε∂x uεt (xε ))−1 (ftε (xε + εuεt (xε )) − ∂t uεt (xε ))

et en développant au premier ordre en puissance de ε (de manière formelle pour le moment), on


obtient finalement

ẋε = ε (ftε (xε ) − ∂t uεt (xε )) + O(ε2 ) (9.85)

On voit donc que pour transformer (7.78) en (9.84) via (9.83), uεt doit être solution de l’équation

∂t uεt (xε ) = ftε (xε ) − hf i(xε ) + O(ε) (9.86)

La seconde preuve procède donc à rebours en partant de


Z t
ε
ut (x) = (fsε (x) − hf i(x)) ds + κ(x) (9.87)
0

où κ(x) est une fonction quelconque régulière. Notons que la fonction uεt ainsi définie est bien
périodique de période P en temps car fsε (x) − hf i(x) est de moyenne nulle.

Preuve. [Seconde preuve] On considère le changement de variable x 7→ y défini par


Z t 
ε ε ε
y = Ut (x) = x + εut (x) := x + ε (fs (x) − hf i(x)) ds + κ(x) . (9.88)
0
La première étape de la preuve consiste à vérifier qu’il s’agit bien d’un changement de variable,
c’est-à-dire que x 7→ y = Utε (x) est une application inversible d’inverse Lipschitz uniformément
en t ∈ [0, P ] et en ε ∈ [−ε1 , ε1 ] pour ε1 < ε0 bien choisi. La seconde étape consiste à appliquer le
changement de variable y ε = Utε (xε ) à l’équation (7.78) et à estimer le reste Rtε ainsi obtenu. La
troisième et dernière étape est une application du lemme de Gronwall, qui permet d’obtenir une
estimation de l’erreur z ε − xε .

Etape 1 : Notons tout d’abord que uεt est Lipschitz uniformément en t et en ε :


∀|ε| ≤ ε0 , ∀t ∈ [0, P ], ∀(x1 , x2 ) ∈ D 2 , kuεt (x2 ) − uεt (x1 )k ≤ (2Lf P + Lκ )kx2 − x1 k,
où Lκ = supx∈D̄ k∂x κ(x)k. Ainsi, uεt est Lipschitz de constante de Lipschitz Lu := 2Lf P + Lκ .
Maintenant, soient x1 et x2 deux points de D tels que Utε (x1 ) = Utε (x2 ). Alors on a
kx2 − x1 k = |ε|kuεt(x2 ) − uεt (x1 )k ≤ |ε|Lu kx2 − x1 k
Si ε1 est choisi tel que ε1 Lu < 1, alors l’hypothèse |ε| < ε1 conduit à
(1 − |ε|Lu )kx2 − x1 k ≤ 0 avec 1 − |ε|Lu > 0
76

ce qui implique x2 = x1 . La fonction x 7→ Utε (x) est donc injective de D dans Utε (D), donc
bijective. En outre, en appliquant le théorème des fonctions implicites au voisinage d’un point
(x, t, ε) de D × R×] − ε1 , ε1 [, on montre que Vtε = (Utε )−1 est régulière et de la forme :
Vtε (y) = y + εvtε (y).
Etape 2 : Soit donc y ε = xε + εuεt (xε ) : les calculs effectués plus haut donnent
(I + ε∂x uεt (xε )) · ẋε = ε (ftε (xε + εuεt (xε )) − ∂t uεt (xε )))
 
= εhf i(xε ) + ε ftε (xε + εuεt (xε )) − ftε (xε )
c’est-à-dire
ẋε = εhf i(xε ) + ε2 Rtε (xε ) (9.89)
où
Z 1 
Rtε (x) = (I + ε∂x uεt (xε ))−1 ∂x ftε (x + ε(1 − s)uεt (x)) · uεt (x)ds − ∂x uεt (xε ) ε
· hf i(x )
0

Notons que l’inverse de l’application (x, t, ε) 7→ I + ε∂x uεt (x) ∈ L(Rn ) est bien définie car
kε∂x uεt (x)kL(Rn ) ≤ |ε|Lu < 1
dès lors que |ε| < ε1 . En outre, Rtε est clairement périodique de période P en temps, puisque uεt
l’est, et est régulière de classe C 0 en (x, t, ε), bornée sur un sous-domaine de D × R×] − ε1 , ε1[
contenant xε (t) pour t < T̃ε par une constante MR > 0.

Etape 3 : Par hypothèse, pour tout |ε| < ε0 , la solution z ε de l’équation


ż ε = εhf i(z ε ), z ε (0) = (U0ε )−1 (y0 )
existe pour tout 0 ≤ t ≤ T̃ /|ε|. D’après le théorème de Cauchy-Lipschitz, pour tout |ε| < ε1 ,
l’équation
ẋε = εhf i(xε ) + ε2 Rtε (xε ), xε (0) = (U0ε )−1 (y0 ),
admet également une solution sur un intervalle de temps [0, Txε ] avec possiblement Txε < T̃ /|ε|. Le
lemme de Gronwall permet alors d’affirmer que
∀t ∈ [0, min(Txε , T̃ /|ε|], kxε (t) − z ε (t)k ≤ ε2 te|ε|Lf t MR ≤ |ε|T̃ eLf T̃ MR
donc quitte à réduire ε1 , on peut affirmer que pour tout |ε| < ε1 , xε (t) existe sur l’intervalle
[0, T̃ /|ε|] et qu’on a
∀t ∈ [0, T̃ /|ε|], kxε (t) − z ε (t)k ≤ C|ε|
avec C = MR T̃ eLf T̃ . Finalement, une simple inégalité triangulaire permet de conclure, puisque
ky ε(t) − z ε (t)k = ky ε (t) − xε (t) + xε (t) − z ε (t)k ≤ |ε| sup kuεt k + C|ε|.
(x,t,ε)

En prenant κ ≡ 0, z ε est la solution de (9.82) et on obtient l’estimation de l’énoncé du théorème.


9. MOYENNISATION AU PREMIER ORDRE EN ε 77

Remarque 9.2 L’approximation Utε (z ε (t)) de y ε (t) est dite approximation “améliorée” de y ε(t).
En un sens qui apparaitrait plus clairement aux ordres plus élevés en ε, c’est une meilleure approxi-
mation que z ε (t). Cependant à l’ordre un en ε qui est la cas considéré ici, les deux approximations
sont en fait de même ordre puisque Utε (z) = z + O(ε).

Remarque 9.3 Plusieurs choix de la fonction κ sont possibles. Le choix consistant à rendre uεt
de moyenne nulle est bien souvent considéré comme le choix standard en particulier lorsque les
fonctions périodiques sont écrites sous la forme de leurs développements de Fourier. Néanmoins,
le choix κ ≡ 0 est le seul choix qui permette d’assurer la conservation des structures géométriques
de l’équation de départ. Il possède l’avantage que les conditions initiales des équations en y, x et
z sont identiques et ne dépendent pas de ε, puisqu’on a alors U0ε = id. En outre, pour les temps
dits stroboscopiques t = mP , on a également Utε = id de sorte que les solutions y ε (t) et Utε (xε (t))
coı̈ncident. Pour cette raison, la moyennisation correspondant à κ ≡ 0 est appelée moyennisation
stroboscopique. C’est celle que nous présenterons dans ce cours.

9.2 Moyenisation au premier ordre en ε : remarque sur le cas général


Si l’on abandonne l’hypothèse de périodicité en temps, il est encore possible de définir un
champ moyen
Z
1 t ε
hf i(y) = lim fs (y) ds.
t→∞ t 0

Lorsque cette limite est bien définie et uniforme en y sur tout compact de D, alors il convient de
calculer la fonction suivante, dite fonction d’ordre :
Z t
δ(ε) = sup sup ε (fsε (y) − hf i(y)) ds .
y∈D t∈[0,T /ε) 0

On a alors le résultat suivant :

Théorème 9.4 On suppose de que f est de classe C 1 ou au moins Lipschitz. Soit z ε (t) la solution
de l’équation
ż ε = εhf i(z), z ε (0) = x0 .

Alors, on a l’estimation suivante


p
y ε(t) = z ε (t) + O( δ(ε))

L’étude des conditions dans lesquelles δ est bien définie et son calcul sortent du cadre de ce cours
introductif. Nous renvoyons le lecteur intéressé à l’ouvrage [19].
78

9.3 Propriétés géométriques de l’équation moyenée à l’ordre 1 (cas périodique)


Un atout essentiel de la technique de moyennisation est son caractère “géométrique”. On en-
tend par là que les caractéristiques géométriques du système (7.78) d’origine sont conservées par
l’équation moyenne à l’ordre 1 (7.81). Ainsi, si (7.78) est hamiltonienne, il en est de même de
(7.81) ; si (7.78) possède un invariant, il en est de même pour (7.81) ; et enfin si le champ de
(7.78) est à divergence nulle, la divergence du champ moyenné est également nulle. On rappelle
brièvement les notions utilisées :
Définition 9.5 Le champ de vecteur (y, t, ε) 7→ ftε (y) est dit hamiltonien s’il existe une fonction
(y, t, ε) 7→ Htε (y) de R2D × R×] − ε0 , ε0[ dans R, telle que
∀(y, t, ε) ∈ R2D × R×] − ε0 , ε0 [, ftε (y) = J −1 ∇y Htε (y)
où J est la matrice canonique  
0 ID
J= .
−ID 0
Une fonction (y, t, ε) 7→ Itε (y), périodique en temps, est un invariant du champ (y, t, ε) 7→ ftε (y)
si on a
∀(y, t, ε) ∈ Rn × T×] − ε0 , ε0[, ∂t Itε (y) + ε∂y Itε (y) · ftε (y) = 0
Le champ (y, t, ε) 7→ ftε (y) est dit à divergence nulle si on a
n
X
n
∀(y, t, ε) ∈ R × R×] − ε0 , ε0[, div(ftε (y)) = ε
∂yi ft,i (y) = 0
i=1

Il est très facile de vérifier que ces propriétés sont conservées par hf i. On a en effet :
— si (y, t, ε) 7→ ftε (y) est hamiltonien, alors
Z Z 1 Z P 
1 P ε 1 P −1 −1
hf i(z) = fs (z)ds = ε
J ∇z Hs (z)ds = J ∇z Hsε (z)ds = J −1 ∇z hHi(z)
P 0 P 0 P 0
R P
avec hHi(z) = P1 0 Hsε (z)ds.
— si (y, t, ε) 7→ Itε (y) est un invariant du champ (y, t, ε) 7→ ftε (y) alors I0ε est un invariant à
ε-près de hf i, c’est-à-dire que l’on a
∀z ∈ Rn , ∂z I0ε (z) · hf i(z) = O(ε)
Il vient en effet, pour tout z ∈ Rn
Z P Z P
1 ε
ε∂z I0ε (z) · hf i(z) = ε∂z I0ε (z) · fsε (z)ds
∂z I0ε (z) · fsε (z)ds
=
0 P 0 P
Z P Z
ε ε ε ε 1 P
= (∂z I0 (z) − ∂z Is (z)) · fs (z)ds + ε∂z Isε (z) · fsε (z)ds
P 0 P 0
Z Z Z
ε P s ε ε 1 P
= ∂µ ∂z Iµ · fs (z)dµds + − (∂s Isε (z)) ds
P 0 0 P 0
Z Z
ε2 P s 2 ε ε  (I ε (z) − IPε (z))
= ∂z Iµ fs (z), fµε (z) dµds + 0 = O(ε2 )
P 0 0 P
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE79

— si (y, t, ε) 7→ ftε (y) est à divergence nulle, alors il vient là-encore très aisément
Z
1 P
div(hf i(z)) = div(fsε (z))ds = 0.
P 0

10 Méthode de moyennisation à un ordre quelconque : cas périodique


On s’intéresse ici à la moyennisation à un ordre quelconque de l’équation (7.78). On suppose
que Rn est équipée de la norme k · k euclidienne associée à un produit scalaire (·, ·) et on considère
donc le problème hautement oscillant suivant :
ẏ ε (t) = ε ft (y ε (t)) , y(t) ∈ Rn , (10.90)
y ε(0) = y0 , y 0 ∈ Rn ,
où y0 est donnée et supposée indépendante de ε, ainsi que f . Le cas où f dépend de manière
analytique en ε peut être traité de la même manière mais au prix de complications formelles
supplémentaires (il est aussi possible de geler ε dans la fonction f ). La fonction
(y, θ) ∈ Rn × T 7→ fθ (y) ∈ Rn
est donnée et supposée régulière en y et périodique en θ ∈ T de période P (par périodique, on
entend dans la suite “périodique de période P ” et la normalisation que l’on retient est telle que T
est le tore R/(P Z)). Plus précisément, on suppose que y 7→ fθ (y) est réelle-analytique en un sens
que nous préciserons un peu plus loin.
L’objectif est ici de calculer une approximation d’ordre élevé en ε de la solution y ε de (10.90)
sur un intervalle de temps de longueur 1/ε.

10.1 Dérivation formelle des équations de la moyennisation stroboscopique


Idéalement, on souhaite construire un changement de variable périodique, proche de l’identité
et régulier Φεθ
(y, θ) ∈ Rn × T 7→ Φεθ (y) ∈ Rn
et le flot Ψεt d’une équation différentielle autonome associée au champ de vecteur F ε défini sur
Rn
Ψ̇εt (y0 ) = ε F ε (Ψεt (y0 )) , (10.91)
tels que la solution de l’équation (10.90) puisse s’écrire sous la forme d’une composition
y ε(t) = Φεt ◦ Ψεt (y0 ). (10.92)
En outre, le cadre stroboscopique où l’on exige que la solution y ε et celle de l’équation moyennée
coı̈ncident (à une erreur près d’ordre élevée en ε) conduit à imposer
Φεθ=0 = Id.
80

Dans un premier temps, nous allons déterminer de manière formelle les équations satisfaites par
Φεθ et Ψεt . En différentiant les deux membres de l’équation (10.92) par rapport à t et en utilisant
l’équation (10.91) , on obtient immédiatement
∂Φεt ∂Φε
(Ψεt (y0 )) + ε t (Ψεt (y0 )) F ε (Ψεt (y0 )) = ε ft (Φεt ◦ Ψεt (y0 )) . (10.93)
∂t ∂y
En considérant (10.93) pour y0 = Ψε−t (y) et en remplaçant t par θ ∈ T (rappelons que ft et Φεt
sont périodiques en temps) il vient
∂Φεθ ∂Φε
(y) + ε θ (y) F ε (y) = ε fθ (Φεθ (y)) . (10.94)
∂θ ∂y
En prenant la moyenne des deux membres de l’équation (10.94), on obtient alors

∂hΦε i
(y) F ε (y) = hf ◦ Φε i (y) ,
∂y
où l’on a tenu compte du fait que la moyenne de la dérivée d’une fonction périodique est nulle, ici
∂hΦε i
h∂θ Φεθ i = 0. En supposant que l’opérateur ∆y 7→ (y) ∆y est inversible pour tout y, on peut
∂y
alors écrire
 −1
ε ∂hΦε i
F (y) := (y) hf ◦ Φε i (y). (10.95)
∂y
En d’autres termes, nous avons obtenu ici l’expression du champ moyen F ε et donc du flot Ψεt
associé. En insérant cette expression dans l’équation (10.94), il s’ensuit que
 −1
∂Φεθ ∂Φεθ ∂hΦε i
(y) + ε (y) (y) hf ◦ Φε i (y) = ε fθ ◦ Φεθ (y), (10.96)
∂θ ∂y ∂y

c’est-à-dire encore sous forme intégrale


Z  −1 !
θ ε ε
∂Φ ξ ∂hΦ i
Φεθ (y) = y + ε fξ ◦ Φεξ (y) − (y) (y) hf ◦ Φε i (y) dξ. (10.97)
0 ∂y ∂y

Il s’agit là dune équation fermée sur Φεθ , bien que non-linéaire et non-locale. En résumé, nous
avons obtenu de manière formelle les équations suivantes :

(i) Ψ̇εt (y0 ) = ε F ε (Ψεt (y0)) ,


 −1
ε ∂hΦε i
(ii) F (y) := (y) hf ◦ Φε i (y),
∂y
 −1
∂Φεθ ∂Φεθ ∂hΦε i
(iii) (y) + ε (y) (y) hf ◦ Φε i (y) = ε fθ ◦ Φεθ (y).
∂θ ∂y ∂y
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE81

La première est le pendant à un ordre quelconque de l’équation moyennée (7.81) à l’ordre 1. C’est
elle qui régit la dynamique du système sur les temps longs (en O(1/ε)). La seconde équation four-
nit l’expression du champ moyen en fonction du changement de variables. Résoudre la troisième
équation permet de déterminer le changement de variables lui-même à partir de la donnée f du
problème. C’est cette équation qui concentre la quasi-totalité des difficultés du problème. On sait
en particulier qu’elle ne possède pas de solution générique : il existe en effet des contre-exemples
dans la littérature (voir [17, 8]). En fait, il est impossible d’obtenir mieux qu’une solution ap-
prochée (c’est-à-dire ici à un terme d’erreur près de taille O(exp(−c/ε))), et c’est donc l’objectif
visé ici.

10.2 Rappel sur les estimations de Cauchy d’une fonction analytique


L’obtention de termes d’erreur de la forme O(e−c/ε ) repose de manière cruciale sur le caractère
réel-analytique (par rapport à la variable y) de la fonction (y, θ) 7→ fθ (y). On note donc Cn l’espace

Cn = {Y = y + iỹ, (y, ỹ) ∈ Rn × Rn }

et on désigne par y = ℜ(Y ) ∈ Rn et ỹ = ℑ(Y ) ∈ Rn les parties réelle et imaginaire de Y .


L’espace Cn est équipée de la norme k · kCn associée au produit scalaire

(y + iỹ, z + iz̃)Cn = (y, z) + (ỹ, z̃) + i ((ỹ, z) − (y, z̃)) ,

où (·, ·) désigne le produit scalaire sur Rn . Notons que pour tout (y, z) ∈ Rn × Rn , on a (y, z)Cn =
(y, z) et kykCn = kyk, de sorte que nous noterons identiquement (·, ·) et k · k les produit scalaire
et norme sur Rn et Cn .
Si K désigne un ouvert borné de Rn , on considère pour ρ > 0 l’extension ouverte de K dans
n
C définie par
Kρ = {y + ∆y : (y, ∆y) ∈ K × Cn , k∆yk < ρ},

y + ∆y
k∆yk < ρ
y
×
K ⊂ Rn
ρ

Kρ ⊂ C n

et on définit les fonctions analytiques sur Kρ de la manière suivante :


82

Définition 10.1 Soit une fonction (y, θ) ∈ Kρ × T 7→ gθ (y) ∈ Cn . L’application gθ est dite
analytique sur Kρ ⊂ Cn si elle est continûment differentiable sur Kρ , c’est-à-dire si il existe une
application linéaire continue

Kρ × T → L(Cn )
(y, θ) 7→ (∂y gθ )(y)

où L(Cn ) désigne l’ensemble des applications linéaires de Cn dans Cn , telle que

∀y ∈ Kρ , ∃δ > 0, ∀h ∈ Cn avec khk ≤ δ,


sup kgθ (y + h) − gθ (y) − (∂y gθ )(y)hk = o(khk).
θ∈T

Lorsque (y, θ) 7→ gθ (y) est bornée sur Kρ × T, on note

kgkρ = sup kgθ (y)k.


(y,θ)∈Kρ ×T

Si gθ est analytique sur Kρ au sens de la définition 10.1, la formule de Cauchy permet d’écrire pour
tout 0 < δ < ρ, tous y et ∆y tels que y ∈ Kρ−δ et ∆y ∈ Cn avec k∆yk = 1, et tout µ ∈ C avec
|µ| < δ Z
1 gθ (y + ξ∆y)
gθ (y + µ∆y) = dξ.
2iπ |ξ|=δ ξ−µ
Cette formule permet de recourir aux estimations dites “de Cauchy” au voisinage d’un point y ∈
Kρ . Par exemple, étant donné 0 < δ < ρ, on peut estimer la norme de sa dérivée première ∂y gθ par
1
k∂y gkρ−δ ≤ kgkρ, (10.98)
δ
inégalité qui découle de la relation
Z
d 1 gθ (y + ξ∆y)
(∂y gθ )(y)∆y = gθ (y + µ∆y) = dξ.
dµ µ=0 2iπ |ξ|=δ ξ2

Au passage, on retrouve le fait connu que ∂y gθ est également analytique au sens de la définition
10.1 comme fonction de Kρ dans L(Cn ). On peut désormais énoncer précisément les hypothèses
de régularité faites sur f :
Hypothèse 10.2 La fonction (y, θ) 7→ fθ (y) est C 0 et périodique en θ. En outre, (y, θ) 7→ fθ (y)
est réelle-analytique en y, c’est-à-dire qu’il existe

R > 0, CK > 0,

tels que, pour tout θ ∈ T, y 7→ fθ (y) est analytique sur K2R au sens de la définition 10.1, et
(y, θ) 7→ fθ (y) est bornée par CK sur K2R × T

kf k2R = sup kfθ (y)k ≤ CK .


(y,θ)∈K2R ×T
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE83

10.3 Enoncé du résultat principal de moyennisation avec reste exponentiel


Afin d’énoncer le résultat principal, on introduit tout d’abord les deux opérateurs linéaires
suivants. Etant donnée une fonction (y, θ) ∈ Kρ × T 7→ ϕθ (y) telle que ∂y hϕθ i soit inversible, on
associe la fonction (y, θ) ∈ Kρ × T 7→ Λ(ϕ)θ (y) definie par
 −1
∂ϕθ ∂hϕi
Λ(ϕ)θ (y) = fθ ◦ ϕθ (y) − (y) (y) hf ◦ ϕi (y). (10.99)
∂y ∂y
L’opérateur Γε quant à lui, associe à ϕθ la fonction (y, θ) ∈ Kρ × T 7→ Γε (ϕ)θ (y) définie par
Z θ
ε
Γ (ϕ)θ (y) = y + ε Λ(ϕ)ξ (y) dξ. (10.100)
0

Remarque 10.3 Dès lors que ϕθ est périodique, Λ(ϕ)θ est de moyenne nulle, de sorte que Γε (ϕ)θ
est à son tour périodique.

Ces notations permettent de considérer la forme intégrale de l’équation principale de la moyenni-


sation (10.97)

Φεθ (y) = Γε (Φε )θ (y), (10.101)

comme une équation de point fixe, que l’on cherche à résoudre par itération (Γε )k , k = 0, 1, . . . , n.
De manière équivalente, sous sa forme différentielle (10.96), elle peut s’interprèter comme

∂θ Φεθ (y) = εΛ(Φε )θ (y), (10.102)

avec Φεθ=0 (y) = y. On considère donc la suite de fonctions


[0] [k+1]
Φθ = id, Φθ = Γε (Φ[k] )θ , k = 0, 1, 2, . . . , n, (10.103)

et en parallèle la suite de champs de vecteurs


 −1
[k] ∂hΦ[k] i
F (y) := (y) hf ◦ Φ[k] i(y). (10.104)
∂y

On considère en outre les termes suivants du développement en puissances de ε de F [k] , à savoir


pour k ≥ 0
1 dk F [k]
Fk+1 (y) = (y). (10.105)
k! dεk ε=0

Remarque 10.4 Par construction (cela sera justifié de manière rigoureuse au moyen du théorème
10.12), pour tous n, k ≥ 0,
1 dk F [n+k]
(y) = Fk+1 (y).
k! dεk ε=0
84

Avant de conclure ce paragraphe avec l’énoncé du théorème principal, on rassemble ci-dessous les
notations utilisées :
1 ε0 P

1. ε0 := 8CRK P , ε1 := ε0 /2, ε2 = ε0 min 28 , T ,
2. C0 = 16CK , C1 = 2CK , η = 2/ε0,
R
3. rn := n+1
, Rk = 2R − krn pour k = 1, . . . , n − 1, de sorte que R0 = 2R et Rn+1 = R.

Rk = 2R − krn

K R×

K2R 2R

[k]
Lemme 10.5 Etant donné un entier n ∈ N, les applications Φθ et Fk+1 avec 0 ≤ k ≤ n + 1 sont
définies pour tout ε ∈ C tel que |ε| ≤ ε0 /(n + 1), sont de classe C 1 en θ ∈ T, analytiques en
y ∈ KRk , et analytiques en ε pour |ε| < ε0 /(n + 1). En outre, l’estimation suivante est valable
pour tout ε ∈ C tel que (n + 1)|ε| < ε0 :
rn
kΦ[k] − idkRk ≤ . (10.106)
2
Pour 0 < ε < ε2 /2, on définit l’entier nε ∈ N∗ par l’expression (nε + 1) = E(ε0 /(4|ε|)) et on note
n
X
Feε (y) = Fe [nε] (y), avec Fe [n](y) = εk Fk+1 (y), (10.107)
k=0

où les champs de vecteur Fk+1 (y) sont définis par l’équation (10.105).

Théorème 10.6 Soient ε tel que 0 < ε < min(ε∗ , ε2/2) et (nε + 1) = E(ε0 /(4|ε|)). Alors la
fonction Φe ε = Φ[nε ] définie dans le lemme 10.5 et la fonction Fe ε définie par l’équation (10.107)
θ θ
sont telles que :
(i) La solution y ε (t) de (10.90) vérifie

∀t ∈ [0, T /|ε|], e ε (xε (t)),


y ε (t) = Φ (10.108)
t

où xε (t) désigne la solution de l’équation (quasi-autonome)

ẋε = ε Fe ε (xε ) + ε Rεt (xε ), (10.109)


10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE85

et où (x, θ) 7→ Rεθ (x) est périodique et régulière en θ, analytique sur KR , et admet la borne
supérieure suivante  
ε ε0 log(2)
kR kR ≤ 32 CK exp − . (10.110)
4 |ε|
e ε le flot de l’équation différentielle autonome
(ii) Si l’on considère Ψ t

ż ε = εFeε (z ε ), (10.111)
alors la solution y ε(t) du problème hautement oscillant d’origine (10.90) est exponentiellement
proche de la forme composée Φ eε ◦ Ψ
e ε (y0 ). Plus précisément, on a
t t
 
ε e ε e ε | log(2)|ε0
∀t ∈ [0, T /|ε|], y (t) − Φt ◦ Ψt (y0 ) ≤ 48 R exp − . (10.112)
8 |ε|

10.4 Preuves et résultats intermédiaires


Deux lemmes élémentaires
Dans ce paragraphe, on donne des conditions suffisantes pour que les fonctions Λ(ϕ) et Γε (ϕ)
soient bien définies comme des fonctions analytiques.
Lemme 10.7 Soit 0 < δ < ρ ≤ 2R. On suppose que la fonction (y, θ) ∈ Kρ × T 7→ ϕθ (y) ∈ Cn
est analytique au sens de la définition 10.1, et que ϕθ est une perturbation de l’identité, c’est-à-dire
plus précisément une application satisfaisant la borne suivante
δ
kϕ − idkρ ≤ .
2
Alors les assertions suivantes sont vérifiées :
(i) L’application (∂y hϕi)−1 est bien définie et analytique sur Kρ−δ , et elle est bornée par
k∂y hϕi−1 kρ−δ ≤ 2.
(ii) Les applications (y, θ) ∈ Kρ−δ × T 7→ Λ(ϕ)θ (y) et (y, θ) ∈ Kρ−δ × T 7→ Γε (ϕ)θ (y) sont
définies et analytiques, et elles satisfont les inégalités suivantes
kΛ(ϕ)kρ−δ ≤ 4 CK et kΓε (ϕ) − idkρ−δ ≤ 4 CK P |ε|.
Preuve du lemme 10.7. En combinant l’hypothèse kϕ − idkρ ≤ δ/2 et l’estimation de Cauchy
(10.98) pour gθ (y) = ϕθ (y) − y, on a
1 1
k∂y ϕ − Idkρ−δ ≤ kϕ − idkρ ≤ .
δ 2
En conséquence, en développant en série de Neumann, il vient

X
3 −1
k∂y ϕkρ−δ ≤ et k(∂y hϕi) kρ−δ ≤ k∂y hϕi − Idkkρ−δ ≤ 2.
2 k=0
86

On a maintenant pour tous θ ∈ T, y ∈ K, et ∆y ∈ Cn tel que k∆yk < ρ − δ


δ
kϕθ (y + ∆y) − yk ≤ kϕ − idkρ−δ + k∆yk < + ρ − δ < ρ ≤ 2R.
2
On voit ainsi que ϕθ (Kρ−δ ) ⊂ K2R , de sorte qu’en vertu de l’hypothèse 10.2, on a kf ◦ϕkρ−δ ≤ CK
et khf ◦ ϕikρ−δ ≤ CK . Finalement, on obtient

kΛ(ϕ)kρ−δ ≤ 4 CK ,

et en intégrant en θ,
kΓε (ϕ) − idkρ−δ ≤ 4 CK P |ε|.
L’analyticité des fonctions Λ(ϕ)θ et Γε (ϕ)θ sur Kρ−δ est assurée par les théorèmes de composition
habituels. 

Le lemme 10.7 montre que, partant d’une fonction (y, θ) ∈ K2R ×T 7→ ϕθ (y) ∈ Cn et pour peu
que ε soit suffisamment petit, il est possible de construire la suite (Γε )k (ϕ)θ , mais au prix d’une
contraction graduelle des domaines de définition (et d’analyticité). Afin d’estimer la convergence
de cette suite, on montre maintenant la propriété de contraction suivante :

Lemme 10.8 Soient δ et ρ tels que 0 < δ < ρ ≤ 2R. On considère deux fonctions (y, θ) ∈
Kρ × T 7→ ϕθ (y) et (y, θ) ∈ Kρ × T 7→ ϕ̂θ (y), analytiques sur Kρ et telles que
δ δ
kϕ − idkρ ≤ et kϕ̂ − idkρ ≤ .
2 2
Alors les inégalités suivantes sont satisfaites pour |ε| ≥ 0 :

C0 C0 P |ε|
kΛ(ϕ) − Λ(ϕ̂)kρ−δ ≤ kϕ − ϕ̂kρ et kΓε (ϕ) − Γε (ϕ̂)kρ−δ ≤ kϕ − ϕ̂kρ .
δ δ

Preuve du lemme 10.8. Afin d’alléger la présentation, on note Aθ (y) = ∂y ϕθ (y) et Âθ (y) =
∂y ϕ̂θ (y). On a tout d’abord

kΛ(ϕ) − Λ(ϕ̂)kρ−δ ≤ kf ◦ ϕ − f ◦ ϕ̂kρ−δ


+ kAkρ−δ khAi−1 kρ−δ khf ◦ ϕ − f ◦ ϕ̂ikρ−δ
+ kAkρ−δ khAi−1 − hÂi−1 kρ−δ khf ◦ ϕ̂ikρ−δ
+ kA − Âkρ−δ khÂi−1 kρ−δ khf ◦ ϕ̂ikρ−δ

En procédant comme dans le lemme 10.7, on obtient kAkρ−δ ≤ 23 , ainsi que khAi−1 kρ−δ ≤ 2,
et des estimations similaires pour Â. L’identité hAi−1 − hÂi−1 = hAi−1 h − AihÂi−1 , et une
estimation de Cauchy permettent d’obtenir
4
khAi−1 − hÂi−1 kρ−δ ≤ khAi−1 kρ−δ khÂi−1 kρ−δ kA − Âkρ−δ ≤ kϕ − ϕ̂kρ .
δ
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE87

Finalement, étant donné que kϕ−idkρ ≤ δ/2 et kϕ̂−idkρ ≤ δ/2, il est clair que, dès que y ∈ Kρ−δ ,
ϕθ (y) ∈ Kρ−δ/2 et ϕ̂θ (y) ∈ Kρ−δ/2 , de sorte que

khf ◦ ϕ̂ikρ−δ ≤ CK

et
2CK
kf ◦ ϕ − f ◦ ϕ̂kρ−δ ≤ k∂y f kρ−δ/2 kϕ − ϕ̂kρ−δ ≤ kϕ − ϕ̂kρ−δ .
δ
En regroupant tous les termes, il vient finalement
 
2CK 6CK 6CK 2CK
kΛ(ϕ) − Λ(ϕ̂)kρ−δ ≤ + + + kϕ − ϕ̂kρ
δ δ δ δ

et l’estimation sur Γε s’obtient par intégration en θ. 

Existence et unicité de quasi-solutions de (10.96) avec reste polynomial


Dans ce paragraphe, nous mettons en évidence l’existence de “quasi-solutions” Φεθ de l’équation
(10.97). Les fonctions obtenues satisfont l’équation (10.97) à un terme d’erreur près de taille
O(εn+1 ) avec n ≥ 0 arbitrairement grand. On reprend tout d’abord la preuve du lemme 10.5.
[0]
Preuve du lemme 10.5. La function Φθ = Id est clairement analytique au sens de la définition
10.1 sur KR0 , analytique pour tout ε, régulière en θ, et satisfait l’estimation (10.106). Supposons
[k]
maintenant que, pour k ≤ n, la fonction Φθ soit analytique sur KRk , analytique en ε pour |ε| <
ε0 /(n + 1), régulière en θ, et satisfasse la relation (10.106). Alors, d’après le lemme 10.7 avec
R [k+1]
ρ = Rk et δ = n+1 = rn , la fonction Φθ est bien définie par (10.103), analytique sur KRk+1 et
satisfait, pour 0 ≤ |ε| < ε0 /(n + 1) l’inégalité

4 CK P ε 0 R rn
kΦ[k+1] − idkRk+1 ≤ 4CK P |ε| < = = .
n+1 2(n + 1) 2

Comme composition de fonctions analytiques, elle est de plus analytique en ε pour |ε| < ε0 /(n +
1). La régularité en θ est également claire, ce qui complète la preuve par induction pour Φ[k] .
Par définition de (10.104), F [k] est alors aussi analytique sur KRk de sorte que Fk+1 , définie
par(10.105), également. 

Nous sommes maintenant en mesure d’établir l’existence de quasi-solutions de (10.96).

Théorème 10.9 [Existence de quasi-solutions de (10.96)] Pour n ∈ N, on considère la suite de


fonctions
[0] [k+1]
Φθ = id, Φθ = Γε (Φ[k] )θ , k = 0, . . . , n,
88

[k]
et la suite associée des défauts (δθ )k=0,...,n , définie par
[k]
[k] ∂Φθ
εδθ (y) := (y) − εΛ(Φ[k] )θ (y) (10.113)
∂θ
[k] [k]  −1
∂Φθ ∂Φθ ∂hΦ[k] i [k]
= (y) + ε (y) (y) hf ◦ Φ[k] i(y) − εfθ ◦ Φθ (y).
∂θ ∂y ∂y
Alors, les assertions suivantes sont vérifiées :
[n] [n]
(i) Les fonctions Φθ et δθ sont C 1 en θ, analytiques respectivement sur KR+rn et KR , et
analytiques en ε ∈ C pour |ε| < ε0 /(n + 1).
[n] [n]
(ii) Les fonctions Φθ et δθ vérifient les estimations suivantes pour tout |ε| < ε0 /(n + 1) :
rn
kΦ[n] − idkR+rn ≤ , (10.114)
2
kδ [n] kR ≤ C1 (η(n + 1)|ε|)n . (10.115)
[n]
(iii) Pour tout θ ∈ T, l’application y 7→ Φθ (y) possède un inverse défini sur KR à valeurs
dans KR+rn . Cet inverse (Φ[n] )−1 est analytique. En outre, on a k(Φ[n] )−1 kR−rn ≤ R
[n]
Remarque 10.10 En d’autres termes, le n-ième itéré Φθ satisfait l’équation (10.96) à un reste
près de taille C1 ε(η(n + 1)ε)n .
Preuve du théorème 10.9. Le point (i) et l’estimation (10.114) découlent aisément du lemme 10.5,
possiblement à une singularité près en ε = 0, qui peut être éliminée en raison de l’estimation
[n]
(10.115), que nous allons maintenant prouver. D’une part, en différentiant Φθ = Γε (Φ[n−1] )θ , il
vient pour n ≥ 1 :
[n] 
εδθ = ε Λ(Φ[n−1] )θ − Λ(Φ[n] )θ .
En conséquence, la propriété de contraction établie dans le lemme 10.8 conduit, pour δ = rn et
ρ = R + δ = Rn , à l’inégalité :
C0 |ε| [n] 1 C0 P |ε| ε [n−1]  
|ε|kδ [n]kR ≤ kΦ − Φ[n−1] kRn = Γ Φ − Γε Φ[n−2] Rn
rn P rn
 2
1 C0 P |ε|  
≤ Γε Φ[n−2] − Γε Φ[n−3] Rn−1 ≤ . . .
P rn
 n
1 C0 P |ε|
≤ kΦ[1] − Φ[0] kR1 .
P rn
[1]
D’autre part, par définition de Φθ , on a kΦ[1] − Φ[0] kR1 ≤ 2|ε| P CK , ce qui prouve (10.115).
[n]
En ce qui concerne le point (iii), il est clair que si l’on prend y1 , y2 ∈ KR tels que Φθ (y1 ) =
[n]
Φθ (y2 ), alors on a :
1
ky1 − y2 k ≤ k∂u Φ[n] − IdkR ky1 − y2 k ≤ kΦ[n] − idkR+rn ky1 − y2 k
rn
1
≤ ky1 − y2 k
2
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE89

de sorte que y1 = y2 , ce qui prouve l’injectivité. Afin de démontrer l’existence d’un antécédent,
étant donnés (y, ỹ) ∈ K × Cn avec ρ := kỹkCn < R, on considère la suite vk définie par
[n]
v0 = y + ỹ ∈ KR , vk+1 = vk − Φθ (vk ) + y + ỹ.
Tout d’abord, pour vk ∈ K(R+ρ+rn )/2 on a
[n] R + ρ + rn
kvk+1 − yk ≤ ρ + kΦθ − idkR+rn < ,
2
de sorte qu’on peut montrer par récurrence que l’ensemble des éléments de la suite (vk )k∈N appar-
tiennent à K(R+ρ+rn )/2 . On peut alors écrire
[n] [n]
kvk+1 − vk k = k(Φθ − id)(vk ) − (Φθ − id)(vk−1 )k
1
≤ k∂u Φ[n] − Idk(R+ρ+rn )/2 kvk − vk−1 k ≤ kvk − vk−1 k,
1 + (R − ρ)/rn
et donc la suite vk converge vers une limite v ∈ K(R+ρ+rn )/2 ⊂ KR+rn . Si ρ < R − rn , on a de
[n]
plus kvk < R. L’analyticité de (Φθ )−1 est une consequence directe du théorème des fonctions
implicites. 

[k]
Remarque 10.11 A partir de la définition de la suite(Φθ )k=0,··· ,n+1, il est possible de montrer par
[n] [n]
récurrence que si y appartient à KR ∩ Rn et ε ∈ R, alors Φθ (y), F [n] (y) et δθ (y) appartiennent
à Rn également.
[n]
Le théorème suivant établit que les n premiers termes du développement de Φθ en puissances
de ε, sont independants du mode de construction utilisé (une propriété similaire prévaut claire-
ment pour F [n] aussi). Cette indépendance valide le caractère “canonique” des équations (10.96)
et (10.95).
Théorème 10.12 [Unicité des quasi-solutions de (10.96)] Pour n ∈ N fixé, on considère la
fonction (y, θ) 7→ Φ b θ (y), qui est C 1 en θ ∈ T, analytique sur KR+rn , analytique en ε pour
|ε| < ε0 /(n + 1), et satisfait
b 0 = id,
Φ kΦb − idkR+rn ≤ rn . (10.116)
2
On suppose que le défaut associé à Φ b θ , défini par

∂Φbθ  
b
εδθ := − εΛ Φ b
∂θ θ

bR ≤ C
vérifie, pour tout |ε| < ε0 /(n + 1), l’inégalité kδk b |ε|n pour une constante C
b > 0
indépendante de ε. Alors on a nécessairement pour tout |ε| < ε0 /(4(n + 1))
b − Φ[n] krn ≤ C3 (n) |ε|n+1,

 
[n] b + 20CK (η (n + 1))n .
où Φθ est la fonction définie dans le théorème 10.9 et C3 (n) = P 2C
90

Preuve du théorème 10.12. Le résultat résulte de l’application successive du lemme de contraction


10.8. En premier lieu, en vertu du lemme 10.7 et partant de (10.116) et (10.106), il vient pour tout
k ≤ n,

b − idkR+rn −krn ≤ rn ,
k (Γε )k (Φ) k (Γε )k (Φ[n] ) − idkR+rn −krn ≤
rn
, (10.117)
2 2
rn
où on a utilisé le fait que 4 CK P |ε| ≤ 2
. Ces inégalités permettent d’appliquer le lemme 10.8 et
on obtient, pour tout k ≤ n,
 k
ε k+1 b − (Γε )k (Φ)k
b R−krn ≤ C0 P |ε| b R ≤ 1 kΓε (Φ)
b − Φk b − Φk
b R
k (Γ ) (Φ) kΓε (Φ)
rn 2k

ainsi qu’une inégalité similaire pour Φ[n] , où l’on a eu recours à l’inégalité C0 P |ε|/rn ≤ 1/2. Par
sommation, il vient alors
n
X
k (Γ ) ε n+1 b − Φk
(Φ) b rn ≤ b − (Γε )k (Φ)k
k (Γε )k+1 (Φ) b − Φk
b rn ≤ 2 kΓε (Φ) b R, (10.118)
k=0

et de même pour Φ[n] . D’autre part, en utilisant la borne (10.117) et en appliquant une fois encore
n + 1 fois le lemme de contraction 10.8, on aboutit à
 n+1  n+1
ε n+1 b − (Γε )n+1 (Φ[n] )krn ≤ C0 P |ε| b − Φ[n] kR+rn ≤ C0 P |ε|
k (Γ ) (Φ) kΦ rn ,
rn rn
(10.119)
où la derrière inégalité repose sur (10.116) (de même pour Φ[n] ). Finalement, de l’inégalité (10.118)
portant sur Φ b (et sur Φ[n] ), et de (10.119), on déduit

b − Φ[n] krn

≤ kΦb − (Γε )n+1 (Φ)k b − (Γε )n+1 (Φ[n] )krn
b rn + kΦ[n] − (Γε )n+1 (Φ[n] )krn + k (Γε )n+1 (Φ)
 n
≤ 2kΦ b R + 2kΦ[n] − Γε (Φ[n] )kR + C0 P C0 P (n + 1)
b − Γε (Φ)k |ε|n+1 (10.120)
R
 n
b n+1 n C0 P
≤ 2C P |ε| + 2C1 P (η(n + 1)|ε|) ε + C0 P (n + 1) |ε|n+1,
R

où l’on a utilisé


Z θ Z θ
[n] [n]
Φθ ε [n]
− Γ (Φ )θ = ε δξ dξ et b θ − Γε (Φ)
Φ b θ=ε δbξ dξ,
0 0

b Le résultat est établi en regroupant les


ainsi que l’inégalité (10.115) sur δ [n] et l’hypothèse sur δ.
diverses constantes. 
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE91

Preuve du théorème 10.6


[n]
Jusqu’à présent, nous avons obtenu une collection de fonctions Φθ , qui, insérées dans l’équation
(10.96) (ou (10.102)), produisent un défaut de taille O((n + 1)n εn+1 ). En optimisant le choix du
paramètre n, nous allons maintenant établir que pour un indice nε bien choisi, le défaut associé à
Φ[nε ] est d’ordre O(exp(−c/ε)) pour une certaine constante c > 0.

ε0
Preuve. Partie (i). Puisque (nε + 1)|ε| ≤ 4
< ε0 , le théorème 10.9 s’applique avec n = nε et on a

e εθ (y) = ε fθ ◦ Φ
∂θ Φ e εθ (y) F [nε] (y) + ε δ [nε] (y),
e εθ (y) − ε ∂y Φ
θ

pour tout y ∈ KR ⊂ KR+rnε . En introduisant la solution exacte xε (t) de l’équation

dxε (t)  
= ε F̃ ε (xε (t)) + Rεt (xε (t)) , xε (0) = y0 ,
dt
 −1
[n ]
avec Rεt (x) = F [nε] (x) − Feε (x) − ∂x Φ e εt (x) e εt (xε (t)) vérifie
δt ε (x), la fonction y ε (t) := Φ
clairement y ε (0) = y0 ainsi que l’équation
dy ε e ε (xε (t)) · F [nε ] (xε (t)) + ε δt[nε] (xε (t))
e ε )(xε (t)) − ε ∂x Φ
(t) = ε (ft ◦ Φ t t
dt  
 −1
e (x (t)) · F ε (x (t)) − ∂x Φ
ε ε [n ] ε e (x (t))
ε ε [n ε ] ε
+ ε ∂x Φ t t δt (x (t))

e ε )(xε (t)) = ε ft (y ε (t)),


= ε (ft ◦ Φ t

comme souhaité. Donc, y ε (t) coı̈ncide pour tout temps t ∈ [0, T /|ε|] avec la solution de (10.90).
[n ]
Par ailleurs, le théorème 10.9 et le choix de nε assurent que le défaut δθ ε vérifie
 nε
[nε ] nε 1
kδ kR ≤ C1 (η(nε + 1)ε) ≤ C1 .
2

En outre, l’analyticité de F [nε ] par rapport à ε et la formule de Cauchy permettent d’écrire, pour
tout y ∈ KR et δ := 2(nεε0+1) , que

X εk dk F [nε]
kF [nε] (y) − Fe ε (y)k = (y)
k≥n +1
k! dεk ε=0
ε

X |ε|k k!  nε
[nε ] (|ε|/δ)nε+1 [nε ] 1
≤ k
sup kF (y)k ≤ sup kF kR ≤ C1 ,
k! δ |ε|<δ 1 − (|ε|/δ) |ε|<δ 2
k≥nε +1

−1
où l’on a utilisé l’inégalité ∂y hΦ[nε ] i ≤ 2 pour borner 6 F [nε ] sur KR par C1 et |ε|/δ ≤ 21 .
R

6. En utilisant le lemme 10.7-(i) et l’inégalité kΦ[nε ] − idkR+rnε ≤ rnε /2 (avec rnε = R/(nε + 1)), comme
établie dans le théorème 10.9.
92

Afin de conclure, il reste à écrire que


−1
kRkR ≤ kF [nε] − Feε kR + ∂u Φ[nε ] δ [nε ] R
R
 nε  
1 ε0 log(2)
≤ 3C1 ≤ 12 C1 exp − ,
2 4 |ε|
en remarquant que nε ≥ (ε0 /(4|ε|)) − 2.
e ε le flot de l’équation autonome
Partie (ii). Soit Ψ t

dz ε
= ε Fe ε (z ε ).
dt
e ε (y0) soit défini pour tout 0 ≤ t ≤ T1 /ε, car Feε est analytique sur KR ,
Il existe T1 > 0 tel que Ψ t
donc Lipschitz et continue sur tout Kρ pour ρ < R. On a d’une part
dy ε (t)
= εft (y ε (t))
dt
et d’autre part, pour ỹ ε (t) = Φ eε ◦ Ψ
e ε (y0 )
t t

dỹ ε (t)    
= εft (ỹ ε (t)) − ε ∂y Φ e ε ◦ (Φ e ε )−1 (ỹ ε (t))
e ε )−1 (ỹ ε (t)) · Rε ◦ (Φ
t t t t
dt
e εt )−1 (ỹ ε(t)) restent dans KR . Si L = CK désigne une constante de Lipschitz de f
tant que ỹ ε et (Φ R
sur KR , une variante du lemme de Gronwall conduit à
3 eεLt − 1 ε0 | log(2)|
ky ε (t) − ỹ ε (t)kCn ≤ kRε kR ≤ 48R eεLt− 4 |ε| := M(t, ε)
2 L
e ε − idkR ≤ 1/2.
où l’on a utilisé l’inégalité k∂u Φ t
On rappelle que par hypothèse y ε (t) existe et appartient à K pour 0 < |ε| < ε∗ et 0 ≤ t ≤ T /ε.
En particulier, en choisissant |ε| < ε2 /2 avec ε2 tel que M(T /|ε|, ε) ≤ R − rnε , on est assuré que
e ε )−1 (ỹ ε(t)) restent dans KR pour t ≤ T /|ε| (donc T1 ≥ T ). On peut affirmer que pour ce
ỹ ε et (Φ t
choix  ε2 P ε 
0
0 < ε < min ε∗ , 0 , , (10.121)
2T 56
| log(2)| εLt− | log(2)|
on obtient l’inégalité (10.112). En effet, pour |ε| ≤ 4ηLT
= ε20 | log(2)| PT , on a e 2|ε|η ≤
− | log(2)|
e 4|ε|η sur [0, T /|ε|], de sorte que pour tout 0 ≤ t ≤ T /|ε|
| log(2)|
M(t, ε) ≤ 48Re− 4εη .
La quantité M(T /ε, ε) est alors bornée par R/2 ≤ R − rnε (notons que par définition de nε et ε2 ,
on a nε ≥ 1) si en outre
ε0 − log(2)
ε< .
8 log (96)
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE93

L’agrégation des bornes sur ε (10.121) fournit une condition telle que
| log(2)|ε0
∀t ∈ [0, T /|ε|], ky ε(t) − ỹ ε (t)kCn ≤ 48 R e− 8ε .

10.5 Cas linéaire


Dans ce paragraphe nous considérons le cas particulier où fθ est un champ linéaire de la forme

fθ (y) ≡ Aθ y,

où Aθ est un élément de L(Rn ). Dans cette situation spécifique, il s’avère que le changement
de variable solution de (10.96) peut être construit exactement, en vertu du fait que la procédure
itérative mise en place précédemment est convergente. L’hypothèse 10.2 est ici formulée de la
manière suivante :

Hypothèse 10.13 La fonction θ 7→ Aθ ∈ L(Rn ) est continue et P -periodique.

Le problème de valeur initiale s’écrit ici :

d ε
y (t) = εAt y ε (t), y ε (t) ∈ Rn , (10.122)
dt
y ε (0) = y0 , y 0 ∈ Rn .

L’espace C(T, L(Rn )) est équippé de la norme

kΦk = sup kΦθ k.


(y,θ)∈Rn ×T, kyk=1

Le théorème 10.6 peut alors être formulé ainsi :

Théorème 10.14 [Moyennisation √ exacte dans leR cas linéaire] On considère y ε (t) la solution de
(10.122) et on note εl = α1 ( 23 − 2), avec α = T kAθ kdθ. Alors, pour tout 0 ≤ ε < εl , il existe
une application θ 7→ Φεθ ∈ L(Rn ) avec les propriétés suivantes :
(i) La fonction Φεθ est P -periodique et C 1 en θ, et vérifie Φθ=0 = id.
(ii) Pour tout θ ∈ T, la matrice Φεθ est inversible.
(iii) Pour toute valeur initiale y0 ∈ Rn , la solution de (10.122) peut s’écrire sous la forme
ε
∀t ∈ R+ y ε (t) = Φεt eεt F y0 ,

où F ε ∈ L(Rn ) est définie par


F ε = hΦε i−1 hAΦε i. (10.123)
94

Preuve du théorème 10.14. Dans le cadre linéaire, l’équation (10.96) revêt la forme suivante

dΦεθ
+ εΦεθ hΦε i−1 hAΦε i = εAθ Φεθ , ou de manière équivalente Φεθ = Γε (Φε )θ ,

où l’application Γε agit sur l’ensemble des functions de C(T, L(Rn )) inversibles pour tout θ, et est
définie, pour toute fonction Φ de la sorte, par

Z θ 
ε
Γ (Φ)θ = Id + ε Aξ Φξ − Φξ hΦi−1 hAΦi dξ. (10.124)
0

[0] [n+1]
On introduit alors la suite de fonctions Φθ = Id, Φθ = Γε (Φ[n] )θ pour tout n ∈ N. On peut
affirmer que cette suite est bien définie pour tout n ∈ N et satisfait l’inégalité suivante
r
1 1
kΦ[n] − Idk < d∗ := − εα − ε2 α2 − 3εα + . (10.125)
2 4

Notons que le terme ε2 α2 − 3εα + 14 est positif en vertu de l’hypothèse ε < εl . Nous allons montrer
(10.125) par récurrence (l’initialisation est claire). Supposons donc que (10.125) soit satisfaite pour
un certain n, et posons dn := kΦ[n] − Idk. Alors, on déduit de 0 < ε < εl et de l’hypothèse de
récurrence
1 √
dn < d∗ < + εα ≤ 2 − 2 < 1.
2
[n] [n+1]
Il est alors clair (Neumann) que Φθ est inversible pour tout θ. En particulier, Φθ = Γε (Φ[n] )θ
est bien définie et il vient alors en utilisant (10.124) :
 Z
ε [n] [n] kΦ[n] k
kΓ (Φ ) − Idk ≤ ε kΦ k 1+ kAθ kdθ,
1 − kΦ[n] − Idk T

d’où l’on déduit que


1 + dn
dn+1 ≤ 2εα .
1 − dn

Il est facile de vérifier grâce à l’hypothèse 0 < ε < εl , que si 0 ≤ d ≤ d∗ , alors 0 ≤ f (d) ≤
f (d∗ ) = d∗ où f (d) = 2εα 1+d 1−d
. Il résulte que dn+1 ≤ f (dn ) < d∗ et la majoration (10.125)
est ainsi prouvée. Afin de compléter la preuve du théorème, il reste à vérifier que la constante de
Lipschitz de Γε est strictement inférieure à 1 sur le domaine {Φ s.t. kΦ − Idk ≤ d∗ }. Pour ce faire,
on considère Φ ∈ C(T, L(Rn )) et Φ b ∈ C(T, L(Rn )) telles que kΦ − Idk < d∗ et kΦ b − Idk < d∗ :
pour tout θ ∈ T les applications Φθ et Φ b θ sont inversibles et leurs inverses peuvent être majorés
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE95

b −1 k ≤ 1/(1 − d∗ ). De même que dans le lemme 10.8, il vient alors :


par kΦ−1 k ≤ 1/(1 − d∗ ) et kΦ
b ≤ εP hkA(Φ − Φ)ki
kΓε (Φ) − Γε (Φ)k b + εP kΦk kΦ−1 k hkA(Φ − Φ)ki b
b −1 k hkAΦki
+ εP kΦk kΦ−1 − Φ b + εP kΦ − Φk b kΦb −1 k hkAΦki
b
 
≤ εα 1 + kΦk kΦ−1 k + kΦk kΦkb kΦ−1 k kΦ b −1 k + kΦk
b kΦ b −1 k kΦ − Φk
b
 
≤ εα 1 + kΦk kΦ−1 k 1 + kΦk b kΦb −1 k kΦ − Φk b
4εα b
≤ kΦ − Φk.
(1 − d∗ )2
En introduisant d∗ la plus grance racine de d(1 − d) − 2εα(1 + d) et en utilisant les relations
d∗ d∗ = 2εα et d∗ + d∗ = 1 − 2εα, on peut observer que
4εα 4εα
< = 1.
(1 − d∗ ) 2 (1 − d∗ )(1 − d∗ )
La convergence de la suite Φ[n] dans C(T, L(Rn )) en découle et le point (iii) résulte du cas général.

Ce théorème est à rapprocher du théorème de Floquet, que nous énonçons ci-dessous sans
démonstration :
Théorème 10.15 (Théorème de Floquet) Si At est une matrice périodique de période minimale
P et Y (t) la matrice fondamentale de solutions associée à l’équation dtd y = At y(t), c’est-à-dire
la matrice solution du problème de valeur initiale
d
Y (t) = At Y (y), Y (0) = Id,
dt
alors il existe une matrice périodique inversible Φt et une matrice constante F telles que
∀t ∈ R, Y (t) = Φt etF .
Exemple 10.16 Equation de Mathieu

10.6 Calcul explicite des termes du développement du champ de vecteur


moyen
Dans ce paragraphe, on considère une méthode de calcul explicite du développement en puis-
sances ε de F ε :
εF ε = εF1 + ε2 F2 + . . . + εn Fn + . . .
Pour ce faire, on introduit la notation suivante : étant données deux champs de vecteurs (y, t) 7→
ft (y) et (y, t) 7→ gt (y), le champ de vecteur ht = (f ⊳ g)t est défini par
Z t Z t 
∂fτ (u) ∂gt (u)
ht (u) = [fτ (u), gt (u)] dτ = gt (u) − fτ (u) dτ. (10.126)
0 0 ∂u ∂u
On a alors le théorème suivant :
96

Théorème 10.17 Etant donné l’équation (10.90), il existe un champ de vecteur (formel)
ε F ε (u) = ε F1 (u) + ε2 F2 (u) + ε3 F3 (u) + · · · (10.127)
tel que, pour toute valeur initiale y0 , la solution y (t) de (10.90) et la solution (formelle) z ε (t) du
ε

problème de valeur initiale


d ε
z = ε F ε (z ε ), z ε (0) = y0 , (10.128)
dt
coı̈ncident (formellement) à l’instant t = P . Les termes Fi du développement (10.127) sont donnés
par
Z
1 P [i]
Fi (y) = Rt (y) dt, (10.129)
P 0
[i]
où les champs de vecteur (dépendant du temps) Rt (y) sont déterminés de manière unique en
imposant à
[1] [2] [3]
εRtε = ε Rt + ε2 Rt + ε3 Rt + · · · (10.130)
de satisfaire l’équation suivante
ε2 ε ε3 ε4
ε f = ε Rε + R ⊳ Rε + Rε ⊳ (Rε ⊳ Rε ) + Rε ⊳ (Rε ⊳ (Rε ⊳ Rε )) + · · · (10.131)
2 3! 4!
Pour calculer les premiers termes F1 , F2 et F3 , il suffit d’identifier les termes des développements
en ε. Il vient en effet par linéarité de ⊳ :
εRε = εR[1] + ε2 R[2] + ε3 R[3] + O(ε4 ),
X  
ε2 R ε ⊳ R ε = εi+j R[i] ⊳ R[j] = ε2 R[1] ⊳ R[1] + ε3 R[1] ⊳ R[2] + R[2] ⊳ R[1] + O(ε4 ),
i,j≥1
! !
X X
ε3 Rε ⊳ (Rε ⊳ Rε ) = εk R[k] ⊳ εi+j R[i] ⊳ R[j] = ε3 R[1] ⊳ (R[1] ⊳ R[1] ) + O(ε4 ).
k i,j≥1
[1]
Il vient donc successivement Rt = ft (terme en ε1 ), puis R[2] = − 21 R[1] ⊳ R[1] = − 12 f ⊳ f
(terme en ε2 ) et
1  1
R[3] = − R[1] ⊳ R[2] + R[2] ⊳ R[1] − R[1] ⊳ (R[1] ⊳ R[1] )
2 6
1 1 1 1 
= − f ⊳ (f ⊳ f ) − f ⊳ (− f ⊳ f ) + (− f ⊳ f ) ⊳ f )
6 2 2 2
1 1
= (f ⊳ f ) ⊳ f + f ⊳ (f ⊳ f ) (terme en ε3 ).
4 12
Finalement, on obtient :
F1 = hf i,
Z t 
1
F2 = − [fτ (u), ft (u)] dτ ,
2 0
Z t  Z t   Z t Z τ  
1 1
F3 = fτ (u), [fs (u), ft(u)] ds dτ + [fs (u), fτ (u)] ds, ft (u) dτ
12 0 0 4 0 0
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE97

Exemple 10.18 On reprend ici l’exemple de l’équation de Van Der Pol considéré dans la première
section de ce cours, qu’on rappelle ci-après :

u̇ε = Jy ε + εg(uε)

avec    
0 1 0
J= et g(u) = ,
−1 0 (1 − u21 )u2
système que l’on peut donc réécrire sous la forme
 
ε ε −tJ tJ ε tJ cos(t) sin(t)
ẏ = εft (y ) := εe g(e y ) avec e = ,
− sin(t) cos(t)

c’est-à-dire encore
ẏ ε = εξt (y ε )Vt
avec
  
− sin(t) 2
Vt = et ξt (y) = 1 − (cos(t)y1 + sin(t)y2 ) (− sin(t)y1 + cos(t)y2 ).
cos(t)

D’après ce qui précède, on peut calculer les deux premiers termes du développement de F ε de la
manière suivante :
Z 2π " #
1 −1/8 z1 (z2 2 + z1 2 − 4) (kzk22 − 4)
F1 (z) = ξτ (z)Vτ dτ = = − z
2π 0 −1/8 z2 (z2 2 + z1 2 − 4) 8
Z Z
−1 2π t
F2 (z) = (ξt (∇z ξτ , Vt ) Vτ − ξτ (∇z ξt , Vτ ) Vt ) dτ
4π 0 0
" 1
#
− 256 z2 (32 − 24 z2 2 + 5 z2 4 − 88 z1 2 + 21 z1 4 + 10 z1 2 z2 2 )
= 1
256 1
z (21 z1 4 + 32 − 88 z1 2 + 40 z2 2 + 10 z1 2 z2 2 + 5 z2 4 )

L’équation moyennée au premier ordre est donc

(kz ε k22 − 4) ε
ż ε = −ε z
8
et il est facile de voir par dérivation que N = kz ε k2 satisfait l’équation

N(N − 4)
Ṅ = −ε
4
dont un point fixe stable est N = 4. C’est l’approximation au premier ordre (cercle de rayon 2
et de centre (0, 0)) du cycle limite de l’équation de Van Der Pol. On peut obtenir une meilleure
98

approximation en considérant L = N + εQ avec Q(z) = νz1 z23 dans l’équation moyennée au


second ordre
(kz ε k22 − 4) ε2
ż ε = −ε z− D(z)Jz,
8 256
où D1 (z) = 32 − 24 z2 2 + 5 z2 4 − 88 z1 2 + 21 z1 4 + 10 z12 z2 2 , D2 (z) = D1 (z) + 64z12 et D(z) =
diag (D1 (z), D2 (z)). On a en effet

dL(z ε ) dN(z ε ) N(N − 4) ε2 ε N −4


= + ε(∇z Q, ż ε ) = −ε − (z , D(z ε )Jz ε ) − ε2 (∇z Q, z ε )
dt dt 4 128 8
L(L − 4) ε2 1 1
= −ε − ε2 Q + QL + ε2 Q − ε2 (L − 4)Q + O(ε3 )
4 2 2ν 2
L(L − 4)
= −ε + O(ε3 )
4
pour ν = − 21 . Une équation plus précise du cycle limite est donc kzk22 − 2ε z1 z23 = 4.

Proposition 10.19 (Cas particulier de Magnus) Etant donné un champ de vecteur (y, t) 7→ ft (y),
il existe une unique paire de séries formelles
X [i]
X [i]
ε
Vs,t (y) = εi−1 Vs,t (y), Wtε (y) = εi−1 Wt (y), (10.132)
i≥1 i≥1

telles que
ε
V0,t (y) = 0, W0ε (y) = 0 et ε
V1,t (y) = ft (y), (10.133)

satisfaisant la condition suivante :


X  ∂ ε
i z(s, t) = ε Vs,t (z(s, t)), z(s, 0) = y0 ,
∀y0 , ∃z(s, t) = y0 + ε zi (s, t) t.q. ∂t
∂ ε (10.134)
∂s
z(s, t) = ε Wt (z(s, t)), z(0, t) = y0 .
i≥1

Les termes W [i] sont donnés par :


Z t
[i]
Wt (y) = Rτ[i] (y) dτ, (10.135)
0

où les R[i] et les V [i] sont déterminés par :

ε (εs)2 ε (εs)3 ε
ε Vs,· = (εs) Rε + R ⊳ Rε + R ⊳ (Rε ⊳ Rε ) + · · · (10.136)
2 3!
Il est immédiat de vérifier que pour y0 quelconque, z(1, t) = y ε (t) est l’unique solution de (10.90),
et que Y (t) = z(t/P, P ) est la solution du problème de valeur initiale
d ε
Y (t) = WPε (Y (t)), Y (0) = y0 ,
dt P
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE99

1
et donc que F ε (Y ) := P
WPε (Y ) en vertu du fait que y ε (P ) = z(1, P ) = Y (P ).

Preuve de la proposition 10.19 : Supposons dans un premier temps que les séries (10.132)
vérifient les équations (10.133) et (10.134). En dérivant respectivement la première et la seconde
équation de (10.134) par rapport à respectivement s et t, on obtient
   
∂s Vs,t(y) − ∂t Wt (y) = ε ∂y Wt (y) Vs,t(y) − ε ∂y Vs,t (y) Wtε (y)
ε ε ε ε ε
(10.137)
évaluée au point (s, t, y) = (s, t, z(s, t)), où z(s, t) désigne l’unique solution de (10.134) corres-
pondant à la valeur initiale y0 . Or y0 est quelconque, donc l’équation (10.137) doit être satisfaite
pour des valeurs arbitraires de (s, t, y). En considérant maintenant
Rtε (y) = ∂t Wtε (y), (10.138)
la condition (10.137) se réécrit (en prenant en compte le fait que W0ε (y) ≡ 0) comme
hZ t i
ε ε ε ε ε
∂s Vs,t = Rt + ε [Wt , Vs,t] = Rt + ε ∂τ Wτε dτ, Vs,t
ε
0
hZ t i
= Rtε + ε Rτε dτ, Vs,t
ε
= Rtε + (R·ε ⊳ Vs,·
ε
)t , (10.139)
0
ce qui conduit à (10.136). Il résulte que les équations (10.132), (10.133) et (10.134) impliquent
(10.136) avec (10.135).
Réciproquement, supposons qu’un couple de fonctions (V ε , W ε ) de la forme (10.132) satis-
fasse (10.133), (10.135) et (10.136). Alors les functions R[i] sont déterminées de manière unique
par l’équation (10.136) pour s = 1, de telle sorte que les W [i] sont également déterminées de
manière unique par (10.135). L’équation (10.137) est alors satisfaite. Il reste Pdonc à montrer que le
couple de fonctions (V ε , W ε ) vérifie (10.134). Soit en effet z(s, t) = y0 + i≥1 εi zi (s, t) l’unique
ε
solution de la première équation de (10.134) : puisque ∂t z(0, t) = ε V0,t (y) = 0, il résulte que
z(0, t) = y0 , et il suffit de prouver par récurrence sur i que, pour tout i ≥ 0,
∂s z(s, t) = ε Wtε (z(s, t)) + O(εi+1 ).
L’initialisation est claire. Supposons donc la relation vérifiée pour un certain i ≥ 0. En dérivant
par rapport à s la première équation de (10.134) et en utilisant l’hypothèse de récurrence, il vient
 
2 ε ε
∂t,s z(s, t) = ε(∂s Vs,t )(z(s, t)) + ε ∂y Vs,t (z(s, t)) ∂s z(s, t)
 
ε
= ε(∂s Vs,t )(z(s, t)) + ε2 ∂y Vs,t
ε
(z(s, t)) Wtε (z(s, t)) + O(εi+2 ),
 
ε 2 ε ε
= ε(∂t Wt )(z(s, t)) + ε ∂y Wt (z(s, t)) Vs,t (z(s, t)) + O(εi+2 ),
et finalement, puisque ∂s z(s, 0) ≡ 0,
Z t

∂s z(s, t) = ε (∂τ Wτε )(z(s, τ )) + ε∂y Wτε (z(s, τ )) Vs,τ
ε
(z(s, τ )) dτ + O(εi+2 )
0
= εWtε (z(s, t)) − εW0ε (z(s, 0)) + O(εi+2 )
= εWtε (z(s, t)) + O(εi+2 ).
100

10.7 Aspects géométriques de la moyennisation à un ordre quelconque


Préservation des intégrales premières
On suppose que la solution exacte de (10.90), associée au champ de vecteur (y, θ) 7→ εfθ (y),
admet un invariant. Plus pécisément, on suppose qu’il existe une fonction régulière Q : Rn × T →
R, dépendant possiblement de ε, telle que

Qt (y ε (t)) ≡ Q0 (y0 ).

La question que l’on se pose ici est de savoir si le champ de vector moyenné F [n] possède lui aussi
un invariant. Il s’avère que la réponse à cette question est positive et que la preuve de ce résultat
est fort simple. Le point clé est que Qθ ◦ Φθ est (presque) indépendant de θ, tandis que Q0 est
presque invariant pour le système moyenné (invariant à des termes d’erreur petits en ε). Avant de
poursuivre, il convient de définir précisément la notion d’invariant utilisée ici. En différentiant la
relation Qt (y ε (t)) ≡ Q0 (y0 ), il vient

∂θ Qθ (y) + ε ∂y Qθ (y)fθ (y) = 0, (10.140)

pour (y, θ) = (y ε (t), t). Dans la suite ce paragraphe, on suppose que cette relation est en fait
satisfaite pour tout θ ∈ T et tout y ∈ K.

Théorème 10.20 [La moyennisation stroboscopique préserve les invariants]


Sous les hypothèses du théorème 10.9, on suppose que la fonction (y, θ) ∈ Rn × T 7→ Qθ (y) ∈ R
est un invariant du champ de vecteur εfθ , au sens où la relation (10.140) est satisfaite pour tout
(y, θ) ∈ K × T. On suppose en outre que (y, θ) 7→ Qθ (y) est analytique sur Kρ pour un certain
[n]
ρ, 0 < ρ ≤ R. Alors, pour tout n ∈ N, le changement de variables Φθ et le champ moyenné F [n]
satisfont, pour tout y ∈ K et tout θ ∈ T, les équations
[n]
Qθ (Φθ (y)) = Q0 (y) + O(εn+1) et (∂y Q0 )(y) F [n] (y) = O(εn ). (10.141)

[n]
En particulier, on a (d/dt)Q0(Ψt (y0 )) = O(εn+1), pour t ∈ [0, T /ε].

Remarque 10.21 Si l’invariant Qθ de dépend pas de ε, alors, puisque F [n+1] − Fe[n] = O(εn+1)
et en remarquant que Fe[n] est un polynôme de degré n en ε, il est possible de conclure de (10.141)
que
(∂y Q0 )(y) Fe[n] (y) = 0,
c’est-à-dire que Q0 est exactement préservé par le système autonome (10.111).

Preuve du théorème 10.20. La relation (10.113), écrite sous la forme


[n] [n] [n]
∂θ Φθ (y) + ε∂y Φθ (y)F [n](y) = εfθ ◦ Φθ (y) + O(εn+1 ),
10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE101

[n]
conduit, en pre-multipliant par (∂y Qθ ) ◦ Φθ et en utilisant le fait que Q est un invariant de εfθ , à
[n] [n] [n]
(∂y Qθ ) ◦ Φθ (y) · ∂θ Φθ (y) + ε∂y (Qθ ◦ Φθ )(y) F [n](y)
   
[n] [n]
= ε ∂y Qθ ◦ Φθ (y) fθ ◦ Φθ (y) + O(εn+1 )
[n]
= − (∂θ Qθ ) ◦ Φθ (y) + O(εn+1 ),

pour y ∈ K. Notons que le terme d’erreur O(εn+1) est à entendre au sens des fonctions analytiques,
c’est-à-dire par exemple pour toute norme k.kρ′ avec 0 < ρ′ < ρ. En conséquence, il vient
   
[n] [n]
∂θ Qθ ◦ Φθ (y) + ε∂y Qθ ◦ Φθ (y) F [n] (y) = O(εn+1 ). (10.142)

En particulier, en prenant la moyenne des deux membres de l’équation, on obtient :

∂y Q ◦ Φ[n] (y) F [n](y) = O(εn ). (10.143)

Le résultat énoncé dans ce théorème découle alors d’un argument de récurrence. Supposons que
pour un certain k < n, et pour tout θ ∈ T, on ait
[n]
Qθ ◦ Φθ (y) = Q0 (y) + O(εk+1 ).

Notons que cette propriété est claire pour k = 0 car Φ[n] = Id + O(ε) et Qθ (y) = Q0 (y) + O(ε)
par intégration de (10.140). Il vient alors
[n]
Qθ ◦ Φθ = Q0 + O(εk+1) = hQ ◦ Φ[n] i + O(εk+1),

et donc par différentiation


[n]
∂y (Qθ ◦ Φθ ) = ∂y hQ ◦ Φ[n] i + O(εk+1),

et finalement, en vertu de (10.143)


[n]
∂y (Qθ ◦ Φθ )(y) F [n] (y) = O(εn + εk+1).

Insérée dans (10.142), cette estimation conduit à


[n]
∂θ (Qθ ◦ Φθ )(y) = O(εn+1 + εk+2 ),

et par intégration en θ, à
[n] [n]
Qθ ◦ Φθ = Q0 ◦ Φ0 + O(εk+2 ) = Q0 + O(εk+2),

pour k < n. L’argument de récurrence est ainsi complet. 


102

Preservation de la structure hamiltonienne

On rappelle la définition d’un champ hamiltonien et d’une application sysmplectique :

Définition 10.22 Le champ de vecteur (y, θ) 7→ fθ (y) dans l’hypothèse 10.2 est dit hamiltonien
s’il existe une fonction (y, θ) 7→ Hθ (y) analytique au sens de la définition 10.1, telle que

∀(y, θ) ∈ K × T, fθ (y) = J −1 ∇y Hθ (y), (10.144)

où J est la matrice canonique


 
0 ID
J=
−ID 0
avec n = 2D. Par ailleurs, une application (y, θ) 7→ Φθ (y) est dite symplectique si

∀(y, θ) ∈ K × T, (∂y Φθ (y))T J∂y Φθ (y) = J.

Remarque 10.23 Si f1 and f2 sont deux champs hamiltoniens d’hamiltoniens respectifs F1 et F2 ,


alors leur crochet de Lie

f (y) = [f1 (y), f2(y)] = f2′ (y)f1(y) − f1′ (y)f2(y)

est également hamiltonien d’hamiltonien

F (y) = {F1 , F2 } (y) = (∇y F1 (y))T J∇y F2 (y).

Nous allons établir dans cette partie que le champ de vecteur F [n] défini dans le théorème 10.6 est
lui-aussi hamiltonien, en tout cas à un terme d’erreur εn+1 près. Avant cela, le lemme suivant est
requis :

[n]
Lemme 10.24 Sous les hypothèses du théorème 10.6, on suppose que Φθ est symplectique à
εk+1-près, avec 0 ≤ k ≤ n, c’est-à-dire que
[n] [n]
(Sk ) ∀y ∈ K, (∂y Φθ (y))T J(∂y Φθ (y)) = J + O(εk+1).

Alors F [n] est hamiltonien à εk+1-près. Plus précisément, on a :

(Hk ) ∀y ∈ K, F [n] (y) = J −1 ∇y H [n](y) + O(εk+1),

avec

[n] 1 D [n] T [n]


E
H [n] = hHθ ◦ ϕθ i − (ϕθ ) J(∂θ ϕθ ) . (10.145)

10. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS PÉRIODIQUE103

[n]
Preuve : L’équation (10.96) avec les notations Φθ ≡ Φθ et F ≡ F [n] peut être mise sous la forme

(∂y Φθ )−1 ∂θ Φθ + εF = ε(∂u ϕθ )−1 fθ ◦ ϕθ + O(εn+1). (10.146)

La condition de quasi-symplecticité sur Φθ implique que

(∂y Φθ )−1 = J −1 (∂y Φθ )T J + O(εk+1 )

de telle sorte qu’on a, d’une part, en prenant en compte ∂θ Φθ = O(ε) :


 
(∂y Φθ )−1 (∂θ Φθ ) = J −1 (∂y Φθ )T J(∂θ Φθ ) + O(εk+2 ),

et d’autre part

ε(∂y Φθ )−1 fθ ◦ Φθ = εJ −1 (∂y Φθ )T JJ −1 (∇Hθ ) ◦ Φθ + O(εk+2)


= εJ −1 ∇(Hθ ◦ Φθ ) + O(εk+2).

L’équation (10.146) devient donc


 
εF = εJ −1 ∇(Hθ ◦ Φθ ) − J −1 (∂y Φθ )T J(∂θ Φθ ) + O(εk+2 )

et en prenant la moyenne des deux membres, on obtient


D E
−1 −1 −1
F =J ∇hHθ ◦ Φθ i − ε J (∂y Φ) J(∂θ Φ) + O(εk+1 ).
T

Il reste alors à remarquer que, par intégration par partie, on a :


D E D E
(∂y Φθ )T J(∂θ Φθ ) = − (∂θ ∂y ϕ)T JΦθ .

[n]
Théorème 10.25 Sous les hypothèses du théorème 10.6, Φθ est symplectique à εn+1-près et F [n]
est hamiltonien à εn+1 -près, c’est-à-dire qu’on a :
[n] [n]
∀y ∈ K, (∂y Φθ (y))T J(∂y Φθ (y)) = J + O(εn+1 ),
F [n] (y) = J −1 ∇y H [n] (y) + O(εn+1 ),
1 D [n] E
H [n] (y) = hH ◦ Φ[n] (y)i − (Φ (y))T J(∂θ Φ[n] (y)) .

-
104

[n]
Preuve : Par construction, Φθ (y) = y+O(ε), de sorte que (S0 ) et (H0 ) sont satisfaites. Supposons
maintenant que (Sk ) soit vérifiée pour un certain 0 ≤ k ≤ n − 1. Alors, en vertu du lemme 10.24,
(Hk ) est également vérifiée. L’équation (10.96) peut alors être réécrite, pour θ petit, comme
d  [n] 
−1

[n]

Φθ ◦ Ψθ = εJ (∇y Hθ ) ◦ Φθ ◦ Ψθ + O(εk+2 )

et donc    T   
[n] [n]
∂y Φθ ◦ Ψθ J ∂y Φθ ◦ Ψθ = J + O(εk+2).
d
La relation Ψ
dτ τ
= εJ −1 (∇y H [n] ) ◦ Ψτ + O(εk+2) permet finalement d’écrire
 T  
∂y Ψθ J ∂y Ψθ = J + O(εk+2),

et donc d’affirmer que (Sk+1 ) est vérifiée. Une récurrence permet de conclure. 

11 Méthode de moyennisation à un ordre quelconque : cas quasi-


périodique
Dans cette partie, nous supposons que le problème hautement oscillant dépend de manière
quasi-périodique du temps, c’est-à-dire qu’il peut s’écrire sous la forme :

ẏ ε = εftω (y ε ), (11.147)
y ε (0) = y0 ∈ Rn , (11.148)

où ε est un petit paramètre, la fonction (y, θ) ∈ Rn × Td 7→ fθ (y) est régulière (on précisera plus
avant le degré de régularité nécessaire), 2π-périodique par rapport à chaque composante 7 θj de
θ ∈ Rd , et où ω ∈ Rd est un vecteur constant de fréquences angulaires. On fait en outre l’hypothèse
fondamentale à travers toute cette partie, que ω est non-résonant, c’est-à-dire que, pour tout multi-
indice k ∈ Zd , k · ω 6= 0. Notons que lorsque le problème est résonant, il peut toujours se réécrire
sous la forme d’un problème non-résonant en diminuant le nombre de fréquences. De même que
dans le cas périodique, il s’agit ici d’étudier la solution de (11.147)–(11.148) sur un intervalle de
la forme 0 ≤ t ≤ L/ǫ de sorte que la solution y ε varie d’une quantité O(1). Le cas d = 1 est le cas
périodique que nous avons déjà étudié. Pour d > 1, le problème est beaucoup plus difficile à traiter,
en raison du problème dit des “petits dénominateurs” (voir la section concernant les estimations
d’erreur).

Exemple 11.1 Considérons l’équation de Schrödinger non-linéaire suivante (a > 0) :

i∂t ψ ε (t, x) = −∆ψ ε (t, x) + ε|ψ ε (t, x)|2 ψ ε (t, x), x ∈ [0, 2π] × [0, 2πa], t ∈ [0, T /ε[,
7. Les exposants correspondent ici aux composantes des vecteurs considérés.
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE105

et cherchons sa solution sous la forme de la série de Fourier


X Z 2π Z 2πa
ik·x ε ε 1 
ψ(t, x) = e ψ̂k (t), ψ̂k (t) = 2
ψ t, x1 , x2 dx1 dx2
2
(2π) a 0 0
k∈Z

où k · x = k1 x1 + a−1 k2 x2 si k = (k1 , k2 ) et x = (x1 , x2 ). En insérant dans l’équation et en


projetant sur la base de Fourier, il vient
d ε X
∀ l ∈ Z2 , i ψ̂ (t) = |l|2ψ̂lε (t) + ε ψ̂kε 1 (t) ψ̂kε 2 (t) ψ̂kε 3 (t)
dt l
k1 , k2 , k3 ∈ Z2
k1 − k2 + k3 = l

où |l|2 = (l1 )2 + a−2 (l2 )2 . En tronquant la série à l’ensemble de modes

I = {k ∈ Z2 , −N ≤ k1 , k2 ≤ N}
2
et en effectuant le changement de variables ψ̂lε (t) = e−i|l| t ξlε l(t), on obtient un système de la forme
(11.147) :
X 2 2 2 2
∀ l ∈ I, ξ˙lε (t) = iε ei(|k1 | −|k2 | +|k3 | −|l| )t ξkε 1 (t) ξkε 2 (t) ξkε 3 (t)
k1 , k2 , k3 ∈ I
k1 − k2 + k3 = l

11.1 Développements en séries formelles indexées par des mots


Les développements que nous considérons ici sont basés sur les opérateurs “dérivée de Lie”
associés aux coefficients de la série de Fourier de f , à savoir :
X
fθ (y) = eik·θ fk (y). (11.149)
k∈Zd

Dans un premier temps, et afin de travailler de manière formelle, nous supposons que les fonctions
fk sont de classe C ∞ et nulles sauf pour un nombre fini d’indices k ∈ Zd . Nous verrons par la suite
qu’il est possible de travailler sous des hypothèses beaucoup moins restrictives. A chaque fonction
fk , k ∈ Zd , on peut associer l’opérateur linéaire suivant :
 ∂· 
Ek := fk
∂y
(les exposants correspondent ici aux composantes des vecteurs considérés). L’opérateur Ek agit
sur l’espace C ∞ (Rn ; Rn ) de la manière suivante : pour g ∈ C ∞ (Rn ; Rn ), Ek [g] est défini comme
la fonction de C ∞ (Rn ; Rn ) telle que
n
!
X ∂
∀y ∈ Rn , Ek [g](y) = fkj (y) j g i (y) = g ′ (y)fk (y).
j=1
∂y
i=1...n
106

On considère maintenant l’opérateur Φt agissant sur les fonctions g ∈ C ∞ (Rd ; Rd ) tel que

Φt [g](y ε(0)) = g(y ε(t))

pour toute solution y ε de (11.147) et toute fonction g. Clairement Φ0 = I, où I désigne l’opérateur
identité, c’est-à-dire l’opérateur tel que I[g] = g pour tout g ∈ C ∞ (Rd ; Rd ). On a alors :
d X
g(y ε(t)) = g ′ (y(t))ftω (y ε (t)) = ε eik·ωt Ek [g](y ε (t)),
dt d k∈Z

ou de manière équivalente
d X
Φt [g](y(0)) = ε eik·ωt Φt Ek [g](y(0)),
dt d k∈Z

car Ek [g](y ε (t)) = (g ′ fk )(y ε (t)) = Φt [g ′fk ](y(0)) = Φt Ek [g](y(0)). Cette dernière équation
montre que l’opérateur Φt est solution de l’équation différentielle linéaire
d X
Φt = ε eik·ωt Φt Ek , Φ0 = I,
dt d k∈Z

que nous pouvons résoudre par itération de Picard. Partant de Φ[0] ≡ I, on construit la suite
Z t X
[l+1]
Φt =I +ε eikl+1 ·ωtl+1 Φtl+1 Ekl+1 dtl+1 , l = 0, . . . , +∞.
0
kl+1 ∈Zd

Il vient ainsi successivement

[1]
X Z t 
ik1 ·ωt1
Φt = I + ε e dt1 Ek1 ,
k1 0

[2]
XZ t
[1]
Φt = I +ε eik2 ·ωt2 Φt2 Ek2 dt2
k2 0
!
XZ t X Z t2 
ik2 ·ωt2 ik1 ·ωt1
= I +ε e I +ε e dt1 Ek1 Ek2 dt2
k2 0 k1 0

X Z t  X Z t Z t2 
ik2 ·ωt2 2 ik2 ·ωt2 ik1 ·ωt1
= I +ε e dt2 Ek2 + ε e e dt1 dt2 Ek1 Ek2 dt2 ,
k2 0 k1 ,k2 0 0

et d’une manière générale :


l
X X
[l]
Φt =I+ εj αk1 ···kj (t) Ek1 · · · Ekj ,
j=1 k1 ,...,kj ∈Zd
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE107

où l’on a défini les coefficients α par la formule :


Z t Z tj Z t2
ikj ·ωtj ikj−1 ·ωtj−1
αk1 ···kj (t) := e e ··· eik1 ·ωt1 dtj dtj−1 . . . dt1 . (11.150)
0 0 0

De manière formelle (c’est-à-dire sans se préoccuper de la convergence des séries considérées), on


peut en résumé écrire :

X X
Φt = I + εj αk1 ···kj (t) Ek1 · · · Ekj .
j=1 k1 ,...,kj ∈Zd

Par définition de l’opérateur Φt , pour toute fonction g ∈ C ∞ (Rd ; Rd ) et toute solution y ε (t) de
(11.147), on a la relation :

X X
ε ε
g(y (t)) = g(y (0)) + εj αk1 ···kj (t) Ek1 · · · Ekj [g](y ε(0)),
j=1 k1 ,...,kj ∈Zd

relation qui, dans le contexte de la théorie du contrôle non-linéaire, est connue sous le nom de
développement de Chen-Fliess. En prenant pour g la fonction y 7→ y, la solution y ε (t) de (11.147)–
(11.148) peut alors être représentée de manière formelle par la formule

X X
ε
y (t) = y0 + εj αk1 ···kj (t) fk1 ···kj (y0 ), (11.151)
j=1 k1 ,...,kj ∈Zd

avec
fk1 ···kj (y) := fk′ 2 ···kj (y)fk1 (y). (11.152)
Il est en effet facile de vérifier par récurrence que
Ek1 · · · Ekj [id] = fk1 ···kj .
Le coefficient X
αk1 ···kj (t) fk1 ···kj (y0 ) (11.153)
k1 ,...,kj ∈Zd

de εi dans (11.151) est constitué de deux ingrédients : les fonctions mots 8 fk1 ···kj (y) définies par
l’équation (11.152) et les coefficients scalaires αk1 ···kj dans (11.150). Il est important de noter que
ces coefficients dépendent du vecteur de fréquences ω mais sont complètement indépendants de la
fonction (y, θ) 7→ fθ (y) dans (11.149). D’un autre coté, les fonctions mots dépendent uniquement
des coefficients de Fourier fk ; ce sont des combinaisons de leurs dérivées partielles. On a par
exemple :
flk (y) = fk′ (y) fl(y), (11.154)

fmlk (y) = flk (y) fm(y)
= fk (y) (fl (y), fm (y)) + fk′ (y) fl′(y) fm (y).
′′
(11.155)
8. La terminologie “fonction mots” sera motivée ci-après.
108

Ici, fk′ (y) désigne la dérivée première de fk au sens de Fréchet, évaluée au point y, et fk′ (y) fl(y)
est le produit d’une matrice de Rn × Rn par un vecteur de Rn . De même, fk′′ (y) désigne la dérivée
seconde (toujours au sens de Fréchet) de fk au point y et fk′′ (y) (fl (y), fm (y)) représente son
action sur les deux vecteurs de Rn que sont fl (y) et fm (y) ; ainsi, la r-ième composante de
fk′′ (y) (fl (y), fm (y)) s’écrit
X n  
∂2
f (y) fli (y)fm
r
i ∂y j k
j
(y).
i,j=1
∂y

Les fonctions fk′ fl , fk′′ (fl , fm ), . . ., apparaissant dans (11.154)–(11.155) sont appelées éléments
différentiels relatifs à la fonction f dans (11.147). L’élément différentiel fk′ fl est d’ordre 2 (il
contient deux facteurs) et les éléments différentiels fk′′ (fl , fm ) et fk′ fl′ fm sont tous les deux
d’ordre 3. D’une manière générale, chaque fonction mot fk1 ···kl est une combinaison linéaire d’éléments
différentiels d’ordre l. Notons qu’un élément différentiel peut entrer dans la définition de plusieurs
fonctions mots. Par exemple, fk′′ (fl , fm ), l 6= m est un terme à la fois de fmlk et de flmk .
Les notations dans (11.153) et dans les expressions à suivre peuvent être simplifiées en considérant
la notion de mots k1 · · · kl , constitués des lettres kr , r = 1, . . . , l, prises parmi l’alphabet Zd . Si les
Wl , l = 1, 2, . . . , désignent les ensembles de mots à l lettres, alors la série (11.153) peut s’écrire :
X
αw (t) fw (y0). (11.156)
w∈Wl

Pour k ∈ Zd et l = 1, 2, . . . , la notation kl désigne k · · · k ∈ Wl . Deux mots w = k1 · · · kl et w ′ =


k′1 · · · k′m peuvent être concaténés pour donner un nouveau mot ww ′ = k1 · · · kl k′1 · · · k′m ∈ Wl+m .
Il est également utile de définir le mot vide ∅ comme l’unique mot tel que ∅w = w∅ = w pour tout
w et de définir |w| comme le nombre de lettres de w (avec la convention |∅| = 0). L’ensemble de
tous les mots (en incluant le mot vide) est finalement noté W.
Avec ces notations, le développement de y ε dans (11.151) est, pour tout t fixé, de la forme

X X X
W (δ, y) = δ∅ y + εl δw fw (y) = ε|w|δw fw (y), (11.157)
l=1 w∈Wl w∈W

où δ est une application qui, à chaque mot w ∈ W, associe un nombre complexe δw . Les séries de
la forme (11.157) sont appelées séries indexées par des mots (relatives à l’équation (11.147)). Le
cas particulier où δ est l’application telle que δ∅ = 1 et δw = 0 pour tout w 6= ∅ correspond à la
série identité W (δ, y) ≡ y.

11.2 Multiplication de séries d’opérateurs-composition de séries-mots


Multiplication de séries d’opérateurs
Il est clair que la multiplication formelle de deux séries d’opérateurs

X X ∞
X X
S(δ) = δ∅ I + εl δw Ew et S(δ̂) = δ̂∅ I + εl δ̂w Ew
l=1 w∈Wl l=1 w∈Wl
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE109

est encore une série du même type S(δ ⋆ δ̂) = S(δ)S(δ̂) où leproduit des coefficients β = δ ⋆ δ̂ est
défini par
X
∀w ∈ W, (δ ⋆ δ̂)w = δu δ̂v = δ∅ δ̂w + · · · + δw δ̂∅ (11.158)
(u, v) ∈ W 2
uv = w

L’élément neutre de cette multiplication est la série S(1) = I associée aux coefficients (1 est
l’élément neutre de ⋆)

1 si w=∅
1w =
0 si w ∈ W\{∅}
Etant donnée une application δ : W → C satisfaisant δ∅ = 1, on peut également définir l’inverse
δ −1 de δ comme étant l’unique application de W dans C telle que S(δ −1 )S(δ) = S(δ)S(δ −1) = I.
Il suffit pour cela de contruire δ −1 par récurrence sur le nombre de lettres à partir de la relation
δ −1 ⋆ δ = δ ⋆ δ −1 = 1. On a en effet, par définition (11.158), que δ −1 ⋆ δ = 1 si et seulement si
δ∅−1 δ∅ = 1,
X
∀l ≥ 1, ∀w ∈ Wl , δu−1 δv = 0.
(u, v) ∈ W 2
uv = w

La première relation impose δ∅−1 = 1. Supposons que la seconde soit vérifiée pour l ≥ 1 donné et
considérons un mot quelconque w ∈ Wl+1 . Alors nécessairement
X
δw−1 = − δu−1 δv
(u, v) ∈ W 2 , |u| ≤ l,
uv = w

où les mots u apparaissant dans le membre de droite comporte au plus l lettres. Ce qui définit δw−1
de manière unique. Par symétrie de la relation (11.158), l’inverse à droite est également inverse à
gauche.

Il est intéressant de noter que la série Φt = S(α(t)) est la solution de l’équation différentielle
d
S(α(t)) = S(α(t))S(β(t))
dt
où
X 
itk·ω eitk·ω si w = k ∈ W1 = Zd ,
S(β(t)) = ε e Ew avec βw (t) =
0 sinon.
k∈W1

avec la condition initiale S(α(0)) = I. Traduite en termes de relations sur les coefficients, cette
équation devient
d
α(t) = α(t) ⋆ β(t), α(0) = 1. (11.159)
dt
110

On retrouve ainsi l’expression (11.150) : il vient en effet

d X
αk1 ...kl (t) = αu (t)βv (t) = αk1 ...kl−1 (t) βkl (t) = αk1 ...kl−1 (t) eitkl ·ω
dt uv=k ...k
1 l

puis par intégration, en tenant compte de αk1 ...kl (0) = 0 :


Z t
αk1 ...kl (t) = eitl kl ·ω αk1 ...kl−1 (tl )dtl
0
Z t Z tl
itl kl ·ω
= e eitl kl−1 ·ω αk1 ...kl−2 (tl )dtl−1 dtl
0 0
= .Z. . Z Z
t tl t2
itl kl ·ω itl kl−1 ·ω
= e e ··· eik1 ·ωt1 dtl dtl−1 · · · dt1 .
0 0 0

Composition de séries indexées par des mots


On s’intéresse maintenant à la composition de séries indexées par des mots. En préalable, il
convient de remarquer que d’une manière générale, la composition de deux séries indexées par des
mots n’est pas nécessairement une série indexée par des mots. En effet, considérons par exemple,
pour un certain k ∈ Zd , la série
W (δ, y) = y + εfk (y).
Alors W (δ, W (δ, y)) = y + εfk (y) + εfk (y + fk (y)) et bien qu’il soit possible de développer en
série de Taylor le terme εfk (y + fk (y)) de la manière suivante

ε3 ′′
εfk (y + fk (y)) = εfk (y) + ε2 fk′ (y)fk (y) + f (y) (fk (y), fk (y)) + O(ε4 )
2 k
il n’y a pas d’identification possible avec les premiers termes d’une série indexée par des mots,
puisque comme nous l’avons détaillé ci-avant, on a

fk = Ek [id], Ek Ek [id] = fk′ fk et Ek Ek Ek [id] = fk′′ (fk , fk ) + fk′ fk′ fk .

En revanche, si
y(t) = W (δ(t), y(0)) = S(δ(t))[id](y(0))
est la solution d’une équation différentielle associée à un champ de vecteur

εFtε (y) = W (β̃(t), y) = S(β̃(t))[id](y), β̃∅ = 0,

c’est-à-dire si X
ẏ(t) = ε|w|β̃w (t)Ew [id](y(t))
w∈W
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE111

alors S(α(t)) est l’opérateur solution de l’équation différentielle (le processus est le même que
pour Φt )
d
S(δ(t)) = S(δ(t))S(β̃(t)), S(δ(0)) = I,
dt
ce qui équivaut, par définition du produit S(δ(t))S(β̃(t)) de séries d’opérateurs, à l’équation
différentielle
δ̇w (t) = δ(t) ⋆ β̃(t), δ(0) = 1.
Ainsi, pour toute fonction g ∈ C ∞ (Rn ; Rn ), on a

g (W (δ(t), y(0))) = g(y(t)) = S(δ(t))[g](y(0)) (11.160)

de sorte que si la fonction g est elle-même une série indexée par des mots de la forme g(y) =
W (ξ, y), alors la composition (11.160) peut s’écrire
 
W (ξ, W (δ(t), y(0))) = g W (δ(t), y(0)) = S(δ(t))[g](y(0))
h i   i
= S(δ(t)) S(ξ)[id] (y(0)) = S(δ(t))S(ξ) [id] (y(0))
= S(δ(t) ⋆ ξ)[id](y(0)) = W (δ(t) ⋆ ξ, y(0)).

Cette relation étant valable pour tout y(0), on a donc finalement le résultat suivant :

Lemme 11.2 Soient δ et ξ deux applications de W dans C et W (δ, y), W (ξ, y) les séries indexées
par des mots associées. Si il existe une application β̃(t) de W dans C, continue en t et vérifiant
β̃∅ ≡ 0, telle que δ coı̈ncide avec la valeur en un instant t de la solution de l’équation différentielle
˙
α̃(t) = α̃(t) ⋆ β̃(t), α̃(0) = 1,

alors la composition W (ξ, W (δ, y)) est encore une série indexée par des mots et on a

W (ξ, W (δ, y)) = W (δ ⋆ ξ, y).

11.3 L’équation de transport


En évaluant les intégrales itérées (11.150), il est possible de calculer les premières valeurs des
coefficients α :
i
αk (t) = (1 − eik·ωt ), k ∈ Z\{0},
k·ω
tn
α0n (t) = ,
n!
it 1 − eil·ωt
αkl (t) = + , k = −l 6= 0,
l·ω (l · ω)2
······ = ··················
112

On peut ainsi se convaincre aisément que les coefficients α sont des polynômes en les 2d + 1
variables t, eiω1 t , . . ., eiωd t , e−iω1 t , . . ., e−iωd t . On montre alors par récurrence que pour tout mot w,
il existe une unique fonction γw (t, θ), t ∈ R, θ ∈ Td , polynômiale en les variables t, eiθ1 , . . ., eiθd ,
e−iθ1 , . . ., e−iθd telle que
αw (t) = γw (t, tω). (11.161)
On a en particulier γ∅ (t, θ) ≡ 1.
Définition 11.3 On dit qu’une fonction µ de R × Td à valeurs dans C est polynomiale s’il existe
un polynôme P ∈ C[X0 , X1 , . . . , X2d ] à 2d + 1 variables X0 , . . . , X2d , tel que
1 d 1 d
∀(t, θ) ∈ R × Td , µ(t, θ) = P (t, eiθ , . . . , eiθ , e−iθ , . . . , e−iθ )

La suite de la construction des ingrédients de la moyennisation stroboscopique repose de manière


essentielle sur le lemme suivant :
Lemme 11.4 Soit ω un vecteur de Rd non-résonant et µ : R × Td → W une fonction polynomiale.
Si pour tout t ∈ R, µ(t, tω) = 0, alors pour tout (t, θ) ∈ R × Td , µ(t, θ) = 0.
Preuve : La démonstration repose sur un argument de densité de {tω − 2πk, t ∈ R, k ∈ Zd } dans
Td . 

Lemme 11.5 Etant donnée une fonction polynomiale µ : R×Td → C, il existe une unique solution
polynomiale de l’équation

(∂t + ω · ∇θ )ν(t, θ) = µ(t, θ), ν(0, 0) = 0. (11.162)

Preuve : Considérons les développements de Fourier de µ et ν


X X
µ(t, θ) = µ̂k (t)eik·θ , ν(t, θ) = ν̂k (t)eik·θ ,
k∈I k∈Zd

où, par hypothèse (µ polynomiale), I est un sous-ensemble fini de Zd et les µ̂k (t) et ν̂k (t) sont des
polynômes en t. L’équation (11.162) s’écrit alors

d µ̂k (t) si k ∈ I
ν̂k (t) + i(k · ω)ν̂k (t) = (11.163)
dt 0 sinon

équation détermine ν̂k (t) dès lors que k 6= 0. La condition ν(0, 0) =


Il est clair que cette dernièreP
0 devient alors ν̂0 (0) = − k6=0 ν̂k (0) qui, associée à l’équation (11.163) pour k = 0 est un
problème de Cauchy dont la solution est unique (et polynomiale en temps).

Proposition 11.6 Pour tout w ∈ W et tout k ∈ Zd , γwk est l’unique fonction polynomiale telle

(∂t + ω · ∇θ )γwk (t, θ) = γw (t, θ)eik·θ , γwk (0, 0) = 0, (11.164)

avec γ∅ ≡ 1.
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE113

Preuve : L’unicité d’une solution polynomiale est une conséquence immédiate du lemme précédent
et d’une récurrence sur le nombre de lettres. Considérons maintenant la fonction γ définie par
(11.161) : pour θ = tω, on a γwk (t, θ) = αwk (t) et γw (t, θ) = αw (t), de sorte que
(∂t + ω · ∇θ )γwk (t, tω) = α̇wk (t)
et d’après (11.159)
α̇wk (t) = αw (t)eitk·ω = γw (t, tω)eitk·.ω
Par ailleurs, γwk (0, 0) = αwk (0) = 0. La fonction γ définie par (11.150) satisfait donc (11.164)
pour tout (t, tω) ∈ R × Td : elle coı̈ncide donc avec l’unique solution de (11.164) pour tout
(t, tω) ∈ R × Td , et donc, en vertu du lemme 11.4, pour tout (t, θ) ∈ R × Td . 

L’équation de transport (11.164) joue ici le rôle de l’équation dite homologique dans l’ap-
proche usuelle de la moyennisation (c’est-à-dire l’approche basée sur une construction récursive
de changements de variables). C’est sur cette équation que repose les résultats suivants.
Proposition 11.7 Pour tous t, t′ ∈ R et tout y ∈ Rn

W γ(t′ , 0), W (γ(t, 0), y) = W (γ(t + t′ , 0), y), (11.165)
et pour tout t ∈ R , tout θ ∈ Td et tout y ∈ Rn

W γ(0, θ), W (γ(t, 0), y) = W (γ(t, θ), y). (11.166)
Preuve : Soient t′ ∈ R fixé et γ̃(t, θ) l’application de R × Td dans C définie par
γ̃(t, θ) = γ −1 (t′ , 0) ⋆ γ(t + t′ , θ).
Pour w ∈ W et k ∈ Zd , on a :
X  
(∂t + ω · ∇θ )γ̃wk (t, θ) = γu−1 (t′ , 0) ′
(∂t + ω · ∇θ )γv (t + t , θ)
(u, v) ∈ W 2
uv = wk

Les couples de mots tels que uv = wk sont, soit de la forme (u, v ′k) avec uv ′ = w, soit de la
forme (wk, ∅). En tenant compte du fait que γ∅ (t, θ) ≡ 1, on a (∂t + ω · ∇θ )γ∅ (t, θ) = 0 et il vient
donc
X  
−1 ′ ′
(∂t + ω · ∇θ )γ̃wk (t, θ) = γu (t , 0) (∂t + ω · ∇θ )γvk (t + t , θ)
(u, v) ∈ W 2
uv = w
X 
= γu−1 (t′ , 0) γv (t + t′ , θ)eik·θ
(u, v) ∈ W 2
uv = w
X
= eik·θ γu−1 (t′ , 0) γv (t + t′ , θ)
(u, v) ∈ W 2
uv = w

= eik·θ (γ −1 (t′ , 0) ⋆ γ(t + t′ , θ))w = eik·θ γ̃w (t, θ),


114

où l’on a utilisé le fait que γ(t+t′ , θ) satisfait l’équation de transport (11.164) évaluée en (t+t′ , θ).
On a en outre γ̃(0, 0) = γ −1 (t′ , 0) ⋆ γ(t′ , 0)) = 1. Par unicité de la solution de l’équation de
transport (11.164), on peut conclure que γ̃(t, θ) = γ(t, θ), soit encore

∀(t, t′ ) ∈ R2 , ∀θ ∈ Td , γ(t′ , 0) ⋆ γ(t, θ) = γ(t + t′ , θ). (11.167)

Maintenant, en particularisant cette relation pour θ = 0, on a

∀(t, t′ ) ∈ R2 , γ(t′ , 0) ⋆ γ(t, 0) = γ(t + t′ , 0), (11.168)

et en différentiant par rapport à t, il vient (par linéarité de ⋆)


d d
γ(t′ , 0) ⋆ γ(t, 0) = γ(t + t′ , 0),
dt dt
puis en évaluant en t = 0
d
γ(t′ , 0) ⋆ β̄ = γ(t′ , 0), γ(0, 0) = 1,
dt′
où l’on a a posé β̄ = dtd γ(t, 0) t=0 . D’après le lemme 11.2, la composition des séries indexées
par des mots W (γ(t′ , 0), y) et W (γ(t, 0), y) fait donc sens et la relation (11.168) prouve alors
l’identité (11.165). De même, la composition considérée dans (11.166) est elle-aussi légitime et
l’identité découle de la relation (11.167).

11.4 Moyennisation quasi-stroboscopique


Pour w ∈ W, on définit le coefficient

ᾱw (t) := γw (t, 0), (11.169)

et on considère la famille de transformations suivantes, paramètrées par t :

y ∈ Rn 7→ W (ᾱ(t), y) ∈ Rn .

Pour t = 0 et en vertu des relations (11.169) et (11.161), on a W (ᾱ(0), y) = W (γ(0, 0), y) =


W (α(0), y) = y, et la transformation correspondante est l’identité. La relation (11.165) indique
que cette famille est un groupe : c’est en effet, comme nous l’avons démontré dans la proposition
11.7, la solution du système autonome suivant :
d ε
z = W (β̄, z ε ).
dt
En tenant compte de la définition des séries indexées par des mots (11.157), on a, de manière plus
explicite :
d ε
z = εF ε (z ε ), F ε (z) = F1 (z) + εF2 (z) + · · · + εl−1 Fl (z) + · · · , (11.170)
dt
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE115

avec X
Fl (z) := β̄w fw (z) l = 1, 2, . . . (11.171)
w∈Wl

En particulier, il est facile de voir que ᾱk (t) = 0 pour k 6= 0 et que ᾱ0 = t, de telle sorte que, par
définition de β̄, β̄k (t) = 0 pour k 6= 0 et β̄0 = 1. Il vient donc
Z
1
F1 (z) = f0 (z) = fθ (z)dθ, (11.172)
(2π)d Td

c’est-à-dire que F1 est la moyenne de fθ (·) sur le tore θ ∈ Td .

Afin maintenant d’exploiter la relation (11.166), on définit les coefficients

κw (θ) := γw (0, θ), θ ∈ Td , w ∈ W, (11.173)

et on peut alors écrire, en utilisant la relation (11.166) et la définition (11.169) :



W κ(θ), W (ᾱ(t), y) = W (γ(t, θ), y).

En particulier, pour θ = tω, on a :



W κ(tω), W (ᾱ(t), y) = W (γ(t, tω), y) = W (α(t), y).

Puisque W (α(t), y) et W (ᾱ(t), y) sont respectivement la solution du système hautement oscil-


lant d’origine (11.147)–(11.148) et la solution du système autonome moyenné (11.170), on peut
conclure que le changement de variables y(t) = W (κ(tω), z(t)) envoie les solutions de (11.170)
sur celles de (11.147). Observons qu’en particulier y(0) = z(0) (les conditions initiales sont les
mêmes pour les deux systèmes) puisque, par définition (11.173), κw (0) = γw (0, 0) = 0 pour
w 6= ∅ et κ∅ (0) = γ∅ (0, 0) = 1.
On a ainsi prouvé le théorème suivant, qui constitue le résultat principal de la moyennisation
quasi-stroboscopique :
Théorème 11.8 (Moyennisation quasi-stroboscopique formelle) La solution de (11.147)–(11.148)
peut s’écrire sous la forme
y ε (t) = Utω
ε
(z ε (t)),
où U est le changement de variables dépendant de ε et paramétré par θ ∈ Td suivant :
[1] [l]
y = z + εǓθε (z); Ǔθε (z) := uθ (z) + · · · + εl−1 uθ (z) + · · · (11.174)

où X
[l]
uθ (z) = κw (θ) fw (z), l = 1, 2, . . . (11.175)
w∈Wl
ε
et où z (t) désigne la solution de l’équation autonome (moyennée) (11.170) avec condition initiale
z ε (0) = y0 .
116

11.5 Calcul des coefficients


En utilisant l’équation de transport, il est possible de calculer par récurrence les expressions
explicites des différents coefficients intervenant dans le précédent théorème. On donne simplement
ici le résultat de ces calculs, les preuves (faciles) reposent sur un argument d’induction et l’utili-
sation de la proposition 5.6. Une observation importante, et commune à toutes les techniques de
moyennisation, concerne la taille des dénominateurs k · ω qui peuvent être arbitrairement proches
de 0, rendant ainsi les coefficients γ possiblement très grands.

Proposition 11.9 Soit l = 1, 2, . . . , k ∈ Zd \{0} et l1 , . . . , ls ∈ Zd . Les coefficients γw , w ∈ W


satisfont les relations suivantes :

i
γk (t, θ) = (1 − eik·θ ),
k·ω
tl
γ0l (t, θ) = ,
l!
i 
γ0l k (t, θ) = γ0l−1 k (t, θ) − γ0l (t, θ)eik·θ ,
k·ω
i 
γkl1 ···ls (t, θ) = γl1 ···ls (t, θ) − γ(k+l1 )l2 ···ls (t, θ) ,
k·ω
i 
γ0l kl1 ···ls (t, θ) = γ0l−1 kl1 ···ls (t, θ) − γ0l (k+l1 )l2 ···ls (t, θ) .
k·ω

Proposition 11.10 Soit l = 1, 2, . . . , k ∈ Zd \{0} et l1 , . . . , ls ∈ Zd . Les coefficients β̄w , w ∈ W


satisfont les relations suivantes :

β̄k = 0,
β̄0 = 1,
β̄0l+1 = 0,
i
β̄0l k = (β̄ l−1 − β̄0l ),
k·ω 0 k
i
β̄kl1 ···ls = (β̄l ···l − β̄(k+l1 )l2 ···ls ),
k·ω 1 s
i
β̄0l kl1 ···ls = (β̄ l−1 − β̄0l (k+l1 )l2 ···ls ).
k · ω 0 kl1 ···ls

La valeur des coefficients κw dans (11.173), nécessaires pour exprimer le changement de va-
riables (11.174)–(11.175), peuvent également être calculés à partir de la proposition 11.9.

Remarque 11.11 Dans l’approche de la moyennisation retenue ici, le champ moyenné et le chan-
gement de variables peuvent être déterminés (et calculés) de manière indépendante.
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE117

Remarque 11.12 Dans le cas périodique, correspondant à d = 1, la solution du système d’origine


et celle du système moyenné coı̈ncident aux instants t = 2πj pour j entier, car elles coı̈ncident à
l’instant t = 0 et que le changement de variables y = Uθε (z) est 2π-périodique en θ. Les équations
(11.170)–(11.171) sont pour cette raison dites stroboscopiques. Dans le cas quasi-périodique,
correspondant à d > 1 avec ω non-résonant, l’effet stroboscopique n’existe plus, car l’application
t 7→ tω ∈ Td n’atteint jamais 0 ∈ Td (sauf pour t = 0), bien qu’elle s’en approche arbitrairement
près. Dans ce cas, on qualifie le système (11.170)–(11.171) de quasi-stroboscopique (relatif à
l’équation (11.147)).

Remarque 11.13 L’hypothèse faite sur f , à savoir que son développement en série de Fourier est
fini, a été utilisée afin d’assurer que les séries (11.153), (11.171), (11.175) convergent, de sorte que
(11.151), (11.170), (11.174) puissent être considérées comme des séries formelles en puissances
de ε. En tronquant ces dernières séries, on obtiendrait bien sûr des développements de Taylor poly-
nomiaux, et les hypothèses de régularité de f pourraient être affaiblies. Il est cependant aussi pos-
sible d’effectuer la même construction sans cette hypothèse de finitude du développement de Fou-
rier, tout en assurant la convergence des séries (11.153), (11.171), (11.175). C’est le choix retenu
dans le paragraphe qui détaille les estimations d’erreur (f est alors supposée réelle-analytique en
y mais aussi en θ).

11.6 Propriétés géométriques de la moyennisation stroboscopique


Le théorème de Dynkin-Specht-Wever, qui est un résultat abstrait d’algèbre applicable dans le
cadre des séries formelles et que nous ne détaillerons pas ici, implique que la série indexée par des
mots X
W (β̄, z) = ε|w| β̄w fw (z)
w∈W

peut être réécrite de la manière suivante



X X εl
W (β̄, z) = β̄k ···k [[· · · [[fk1 , fk2 ], fk3 ] · · · ], fkl ](z), (11.176)
l=1 k1 ,...,kl ∈Z d
l 1 l

où par convention, pour toute paire de champs de vecteurs g et h,


[g, h] = h′ g − g ′ h
désigne le crochet de Lie.
Remarque 11.14 Insistons sur le fait que dans la série (11.176), les commutateurs itérés ne sont
pas tous indépendants, et ce en raison des propriétés du crochet de Lie (anti-symétrie et identité
de Jacobi). Par exemple, [fk1 , fk1 ] = −[fk2 , fk1 ] pour tous k1 , k2 ∈ Zd .
En tenant compte de la valeur des coefficients β̄, on peut écrire les premiers termes de l’équation
moyennée sous la forme :
F ε = F1 + εF2 + ε2 [F3+ + F3− ] + O(ε3 )
118

avec F1 = f0 , et
X i
F2 = ([f−k , fk ] + [fk − f−k , f0 ])
k>0
k · ω
X 1  1 
F3+ = [f 0 , [f ,
0 kf ]] + [fk , [f , f
k −k ]] + [f k , [f ,
0 kf ]] + 2[f−k , [f ,
k 0f ]]
k>0
(k · ω)2 2
X 1  
+ [f−l , [fk , fl−k ]] − [fl , [fk , f−k−l ]] ,
k>l>0
(k · ω)(l · ω)

où F3− est obtenu en remplaçant dans l’expression de F3+ , (k, l) par (−k, −l). Ici, la notation >
désigne une relation d’ordre total sur Zd compatible avec l’addition.

Le résultat suivant établit une des propriétés fondamentales de la moyennisation quasi-stroboscopique,


à savoir que c’est une procédure intrinsèquement géométrique.

Théorème 11.15 (i) Le système autonome (11.170)–(11.171) obtenu par moyennisation quasi-
stroboscopique peut s’écrire sous la forme géométrique suivante

d ε X X εl
z = β̄k1 ···kl [[· · · [[fk1 , fk2 ], fk3 ] · · · ], fkl ](z ε ). (11.177)
dt l=1
l
k1 ,...,kl ∈Z d

(ii) Supposons que le champ de vecteur f dans l’équation hautement oscillante d’origine soit
à divergence nulle , alors le champ de vecteur moyenné (11.177) est également à divergence nulle.
(iii) Supposons que le champ de vecteur f dans l’équation hautement oscillante d’origine soit
hamiltonien dans une espace de dimension paire (n = 2D), associé à l’hamiltonien Hθ (y)
X
Hθ (y) = eik·θ Hk (y)
k∈Zd

(de sorte que pour tout k ∈ Zd , fk (y) soit le champ de vecteur hamiltonien associé à Hk ), alors le
champ de vecteur moyenné (11.177) est également hamiltonien et est associé à l’hamiltonien 9

X X εr
H̄ = β̄k ···k {{· · · {{Hk1 , Hk2 }, Hk3 } · · · }, Hkr }. (11.178)
r=1 k1 ,...,kr ∈Z d
r 1 r

Preuve : Le point (i) repose, comme mentionné en préambule de ce paragraphe, sur le théorème
de Dynkin-Specht-Wever. Le point (ii) découle du calcul suivant : pour g et h deux champs de
9. Le crochet de Poisson de deux hamiltoniens H et K est défini par la formule

{H, K} = (∇y H)T J∇y K


11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE119

vecteur, on a :

∂  X ∂hi j ∂g i j 
Xn n
div[g, h] = g − jh
i=1
∂y i j=1 ∂y j ∂y
n 
X ∂ 2 hi j ∂ 2 g i j ∂hi ∂g j ∂g i ∂hj 
= g − h + −
i,j=1
∂y j ∂y i ∂y j ∂y i ∂y j ∂y i ∂y j ∂y i
n 
X ∂(divh) ∂(divg) j 
= gj − h
j=1
∂y j ∂y j

de sorte que si divh = divg = 0, alors div[g, h] = 0. Le point (iii) s’obtient grâce à un calcul
similaire qui montre que le crochet de Lie de deux champs hamiltoniens est encore hamiltonien.
En effet, si g = J −1 ∇y K et h = J −1 ∇y L, alors

[g, h] = J −1 (∇2y L)J −1 ∇y K − J −1 (∇2y K)J −1 ∇y L = J −1 ∇y {K, L}.

Le formule (11.178) s’obtient alors par récurrence. 

11.7 Estimations d’erreurs


On considère ici les solutions de (11.147) restant dans un ouvert borné K ⊂ Rn . Les notations
sont les mêmes que dans la partie 4. Pour mémoire, on (re-)définit

Kρ = {y + z ∈ Cn : y ∈ K, kzk ≤ ρ}.

L’hypothèse fondamentale sur f est la suivante :


Hypothèse 11.16 (Hypothèse A.) Il existe R > 0 et µ > 0 tels que pour tout θ ∈ Td , y 7→ fθ (y)
est analytique sur KR . En outre les coefficients de Fourier fk de f sont bornés de la manière
suivante :
∀k ∈ Zd , kfk kR ≤ ak e−µ|k| , ak ≥ 0, (11.179)
où les réels ak satisfont X
M := ak < ∞.
k∈Zd

Remarque 11.17 Sous l’hypothèse A, la série de Fourier (11.149) converge absolument et uni-
formément pour y ∈ KR , θ ∈ Tdµ , où l’ensemble Tdµ est défini par

Tdµ = {ζ = θ + iη ∈ Cd : θ ∈ Td , η ∈ Rd , |η1 | ≤ µ, . . . , |ηd | ≤ µ}.

Ainsi, f peut être étendue à une fonction analytique sur KR × Tdµ . Remarquons que

∀θ ∈ Td , kf (·, θ)kR ≤ M.
120

La décroissance exponentielle des coefficients de Fourier , telle que supposée dans (11.179), per-
met de contrer l’influence des petits dénominateurs. Dans le cas d = 1, il est possible de prendre
µ = 0 dans l’hypothèse A : f n’a alors pas besoin d’être supposée analytique en θ. Cependant,
afin de traiter ces petits dénominateurs, une hypothèse supplémentaire est nécessaire : on suppose
donc que le vecteur ω ∈ Rd , d > 1, satisfait une condition de non-résonance forte :

∀k ∈ Zd \{0}, |k · ω| ≥ c|k|−ν (11.180)

pour une certaine constante c > 0 et un paramètre ν ≥ 1.


Remarque 11.18 Il est connu que pour tout ν > d − 1 fixé, la mesure de l’ensemble des vecteurs
ω ∈ Rd ne vérifiant pas (11.180) pour tout c > 0 est nulle.
On peut montrer que si f satisfait l’hypothèse A et que ω est fortement non-résonant, alors,
pour tout ρ ∈ [0, R[, tout l = 1, 2, . . . , et tout y0 ∈ Kρ , la série (11.156) converge absolument et
uniformément. En outre, les séries en facteur des puissances de ε dans (11.151) convergent pour
y0 ∈ Kρ et ǫt suffisamment petit. Il n’est cependant pas possible de démontrer la convergence des
séries (11.174) et (11.170). En fait, il est un établi que ces séries sont génériquement divergentes et
qu’il est en conséquence nécessaire de les tronquer. Cette troncature fait l’objet de la proposition
suivante :

Proposition 11.19 Supposons que f satisfait l’hypothèse A et que le vecteur ω ∈ Rd , d > 1,


satisfait la condition (11.180). Pour N = 1, 2, . . . , on considére le changement de variable

y = z + εǓtε,N (z)

où
[1] [2] [N ]
Ǔθε,N (z) := uθ (z) + εuθ (z) + · · · + ǫN −1 uθ (z)
(les fonctions ul sont définies comme dans (11.174)). Si ε ∈ C est tel que
R
|ε| ≤ ε0 , ε0 = ε0 (N) := , (11.181)
4LN ν+1
alors
1. Pour tout θ ∈ T, l’application z ∈ KR/2 7→ z + εǓθε,N (z) est analytique à valeurs KR .
2. Pour tous θ ∈ T, k(ω · ∂θ )Ǔ ε,N − θ(·)kR/2 ≤ 3M/2.
ε,N )
3. Pour tout θ ∈ T and z ∈ KR/2 , la matrice jacobienne I + ε∂z žθ (z) est inversible et

k(I + ε∂z Ǔ ε,N )−1


θ k ≤ 2.

Le théorème savant établit les estimations d’erreur recherchées : notins que le terme d’erreur en
exp(−c̃|ε|−1/(ν+1) ) dans (11.182) s’accroı̂t avec ν, c’est-à-dire que la qualité de l’approximation
par moyennisation se détériore à mesure que l’on se rapproche d’une valeur résonante de ω. Dans
le cas périodique, la borne sur Rε,N dans (11.182) était simplement de la forme C exp(−c̃/|ε|).
11. MÉTHODE DE MOYENNISATION À UN ORDRE QUELCONQUE : CAS QUASI-PÉRIODIQUE121

Théorème 11.20 Supposons que f satisfait l’hypothèse A et que le vecteur ω ∈ Rd , d > 1 ,


vérifie la condition de non-résonance forte (11.180). L’application du changement de variable de
la proposition 11.19 sous la condition (11.181) au problème de valeur initiale (11.147)–(11.148)
transforme l’équation de départ en l’équation moyennée
d ε 
z = ε F ε,N (z ε ) + Rtε,N (z ε ) , z ε (0) = y0 ,
dt
avec
F ε,N (z) = F1 (z) + εF2 (z) + · · · + εN −1 FN (z)
(les fonctions Fj sont définies dans 11.171)). Le reste Rε,N est alors borné par

5|ε/ε0|N
kRε,N kR/2 ≤ M.
1 − |ε/ε0|
ν
En particular, si |ε| ≤ R/(4eL) (L est donné par la relation L = 2M ν
cµν eν
), et si N est choisi comme
1/(ν+1)
la partie entière de R/(4eL|ε|) ≥ 1, alors l’estimation exponentielle suivante prévaut :
   1/(ν+1)
ε,N 5e2 c̃ R
kR kR/2 ≤ M exp − 1/(ν+1) , c̃ = . (11.182)
e−1 |ε| 4eL
122
Bibliographie

[1] V. I. Arnold, Geometrical Methods in the Theory of Ordinary Differential Equations, 2nd ed.,
Springer, New York, 1988.
[2] V. I. Arnold, Mathematical Methods of Classical Mechanics, 2nd ed., Springer, New York,
1989.
[3] M.P. Calvo, Ph. Chartier, A. Murua, J.M. Sanz-Serna, A stroboscopic method for highly
oscillatory problems. In : B. Engquist, O. Runborg, R. Tsai, (eds.) Numerical Analysis of
Multiscale Computations, Lect. Notes Comput. Sci. Eng. 82, pp. 73–87. Springer, Berlin,
2011.
[4] M.P. Calvo, Ph. Chartier, A. Murua, J.M. Sanz-Serna, Numerical stroboscopic averaging
for ODEs and DAEs, Applied Numerical Mathematics, Appl. Numer. Math. 61, 1077–1095
(2011).
[5] F. Castella, P. Chartier, F. Méhats and A. Murua, Stroboscopic averaging for the nonlinear
Schrödinger equation, hal-00732850, http ://hal.archives-ouvertes.fr/hal-00732850, FOCM
(2014).
[6] P. Chartier, A. Murua, J.M. Sanz-Serna, Higher-Order averaging, formal series and numerical
integration I : B-series, Found. Comput. Math. 10, 695–727 (2010).
[7] P. Chartier, A. Murua, J.M. Sanz-Serna, Higher-Order averaging, formal series and numerical
integration II : the quasi-periodic case, Found. Comput. Math. 12, 471-508 (2012).
[8] P. Chartier, A. Murua, J.M. Sanz-Serna, A formal series approach to averaging : exponentially
small error estimates, DCDS A 32, 3009-3027 (2012).
[9] G. Contopoulos, C. Efthymiopoulos and A. Giorgilli, Non-convergence of formal integrals
of motion, J. Phys. A 36, 8369–8660 (2003).
[10] A. Durga Devi, R. Gladwin Pradeep, V. K. Chandrasekar, M. Laksmanan, Method of genera-
ting N-dimensional nonsigular Hamiltonian systems, J. Nonlinear Math. Phys. to appear.
[11] C. Efthymiopoulos, A. Giorgilli and G. Contopoulos, Non-convergence of formal integrals :
II. Improved estimates for the optimal order of truncation, J. Phys. A 37, 10831–10858
(2004).
[12] E. Hairer, Ch. Lubich and G. Wanner, Geometric Numerical Integration, 2nd ed., Springer,
Berlin, 2006.

123
124 BIBLIOGRAPHIE

[13] E. Hairer, S. P. Nørsett and G. Wanner, Solving Ordinary Differential Equations I, Nonstiff
Problems, 2nd ed., Springer, Berlin, 1993.
[14] P. Lochak, C. Meunier, Multiphase Averaging for Classical Systems, with Applications to
Adiabatic Theorems, Springer, New York, 1988.
[15] R.I. McLachlan, On the numerical integration of ordinary differential equations by symmetric
composition methods, SIAM J. Sci. Comput. 16 (1995) 151–168.
[16] A. Murua, The Hopf algebra of rooted trees, free Lie algebras and Lie series, Found. Comput.
Math. 6, 387–426 (2006).
[17] A.I. Neishtadt, The separation of motions in systems with rapidly rotating phase, J. Appl.
Math. Mech. 48, 133–139 (1984).
[18] L.M. Perko, Higher order averaging and related methods for perturbed periodic and quasi-
periodic systems, SIAM J. Appl. Math. 17, 698–724 (1968).
[19] J. A. Sanders, F. Verhulst and J. Murdock, Averaging Methods in Nonlinear Dynamical
Systems (2nd. ed.), Springer, New York, 2007.
[20] J. M. Sanz-Serna and M. P. Calvo, Numerical Hamiltonian Problems, Chapman and Hall,
London, 1994.
[21] C. Simó, Averaging under fast quasi-periodic forcing. In : I. Seimenis (ed.) Proceedings of
the NATO-ARW Integrable and Chaotic Behaviour in Hamiltonian Systems, Torun, Poland,
1993, pp. 13–34. Plenum, New York, 1994.
[22] M. Suzuki, General theory of higher-order decomposition of exponential operators and sym-
plectic integrators, Phys. Lett. A 165 (1992) 387–395.
[23] H. Yoshida, Construction of higher order symplectic integrators, Phys. Lett. A 150 (1990)
262–268.

Vous aimerez peut-être aussi