Académique Documents
Professionnel Documents
Culture Documents
Emmanuel Trlat
Universit Pierre et Marie Curie (Paris 6)
et Institut Universitaire de France
Laboratoire Jacques-Louis Lions
CNRS, UMR 7598
4 place Jussieu, BC 187
75252 Paris cedex 05, FRANCE
Avant-propos
2 Contrlabilit
2.1 Ensemble accessible . . . . . . . . . . . . . . . . . .
2.1.1 Dfinition . . . . . . . . . . . . . . . . . . . .
2.1.2 Topologie des ensembles accessibles . . . . . .
2.1.3 Dfinition de la contrlabilit . . . . . . . . .
2.2 Contrlabilit des systmes linaires autonomes . . .
2.2.1 Cas sans contrainte sur le contrle : condition
2.2.2 Cas avec contrainte sur le contrle . . . . . .
2.2.3 Similitude de systmes, forme de Brunovski .
2.3 Contrlabilit des systmes linaires instationnaires .
19
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
de Kalman
. . . . . . .
. . . . . . .
. . . . . . .
23
23
23
23
28
28
28
30
31
35
3 Temps-optimalit
39
3.1 Existence de trajectoires temps-optimales . . . . . . . . . . . . . 39
3.2 Condition ncessaire doptimalit : principe du maximum dans le
cas linaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.1 Synthse optimale pour le problme de loscillateur harmonique linaire . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.2 Autres exemples . . . . . . . . . . . . . . . . . . . . . . . 49
3
4 Thorie linaire-quadratique
53
4.1 Existence de trajectoires optimales . . . . . . . . . . . . . . . . . 54
4.2 Condition ncessaire et suffisante doptimalit : principe du maximum dans le cas LQ . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3 Fonction valeur et quation de Riccati . . . . . . . . . . . . . . . 60
4.3.1 Dfinition de la fonction valeur . . . . . . . . . . . . . . . 60
4.3.2 Equation de Riccati . . . . . . . . . . . . . . . . . . . . . 61
4.3.3 Reprsentation linaire de lquation de Riccati . . . . . . 66
4.4 Applications de la thorie LQ . . . . . . . . . . . . . . . . . . . . 67
4.4.1 Problmes de rgulation . . . . . . . . . . . . . . . . . . . 67
4.4.2 Filtre de Kalman dterministe . . . . . . . . . . . . . . . 71
4.4.3 Rgulation sur un intervalle infini et rapport avec la stabilisation . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
II
81
5 Dfinitions et prliminaires
5.1 Application entre-sortie . . . . . . . . . . . . . . . . . . . . .
5.1.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.2 Rgularit de lapplication entre-sortie . . . . . . . .
5.2 Contrlabilit . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.1 Ensemble accessible . . . . . . . . . . . . . . . . . . .
5.2.2 Rsultats de contrlabilit . . . . . . . . . . . . . . . .
5.3 Contrles singuliers . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2 Caractrisation hamiltonienne des contrles singuliers
5.3.3 Calcul des contrles singuliers . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Contrle optimal
6.1 Prsentation du problme . . . . .
6.2 Existence de trajectoires optimales
6.2.1 Pour des systmes gnraux
6.2.2 Pour des systmes affines .
.
.
.
.
97
. 97
. 97
. 97
. 101
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
faible
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
85
85
85
86
88
88
90
93
93
94
96
103
103
103
105
108
108
111
112
114
114
119
.
.
.
.
.
.
.
.
.
.
.
.
154
154
162
171
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
179
179
180
180
184
187
187
190
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
193
193
193
194
196
197
197
199
200
8 Thorie dHamilton-Jacobi
8.1 Introduction . . . . . . . . . . . . . . . . . . . . . .
8.2 Solutions de viscosit . . . . . . . . . . . . . . . . .
8.2.1 Mthode des caractristiques . . . . . . . .
8.2.2 Dfinition dune solution de viscosit . . . .
8.3 Equations dHamilton-Jacobi en contrle optimal .
8.3.1 Equations dHamilton-Jacobi dvolution .
8.3.2 Equations dHamilton-Jacobi stationnaires .
III
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Annexe
213
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
219
219
222
225
225
225
231
231
231
232
233
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
236
236
236
239
244
247
247
251
251
252
259
Notations
: pour tout.
: il existe.
A : intrieur de A.
A : frontire de A, i.e. A \ A.
max : maximum.
min : minimum.
sup : borne suprieure.
inf : borne infrieure.
lim : limite.
lim sup : limite suprieure.
lim inf : limite infrieure.
IN : ensemble des entiers naturels.
Z : ensemble des entiers relatifs.
Q
l : ensemble des nombres rationnels.
IR : ensemble des nombres rels.
IR+ : ensemble des nombres rels positifs ou nuls.
C : ensemble des nombres complexes.
Re z : partie relle du nombre complexe z.
Im z : partie imaginaire du nombre complexe z.
| | : valeur absolue, ou module.
8
A (X) : polynme minimal de la matrice A.
exp(A), ou eA : exponentielle de la matrice A.
AT : transpose de la matrice A.
xT : transpose du vecteur x.
Avant-propos
Quest-ce que la thorie du contrle ? La thorie du contrle analyse les
proprits des systmes commands, cest--dire des systmes dynamiques sur
lesquels on peut agir au moyen dune commande (ou contrle). Le but est alors
damener le systme dun tat initial donn un certain tat final, en respectant
ventuellement certains critres. Les systmes abords sont multiples : systmes
diffrentiels, systmes discrets, systmes avec bruit, avec retard... Leurs origines
sont trs diverses : mcanique, lectricit, lectronique, biologie, chimie, conomie... Lobjectif peut tre de stabiliser le systme pour le rendre insensible
certaines perturbations (stabilisation), ou encore de dterminer des solutions
optimales pour un certain critre doptimisation (contrle optimal).
Dans les industries modernes o la notion de rendement est prpondrante,
le rle de lautomaticien est de concevoir, de raliser et doptimiser, tout au
moins damliorer les mthodes existantes. Ainsi les domaines dapplication sont
multiples : arospatiale, automobile, robotique, aronautique, internet et les
communications en gnral, mais aussi le secteur mdical, chimique, gnie des
procds, etc.
Du point de vue mathmatique, un systme de contrle est un systme
dynamique dpendant dun paramtre dynamique appel le contrle. Pour le
modliser, on peut avoir recours des quations diffrentielles, intgrales, fonctionnelles, aux diffrences finies, aux drives partielles, stochastiques, etc. Pour
cette raison la thorie du contrle est linterconnexion de nombreux domaines
mathmatiques. Les contrles sont des fonctions ou des paramtres, habituellement soumis des contraintes.
Contrlabilit. Un systme de contrle est dit contrlable si on peut lamener
(en temps fini) dun tat initial arbitraire vers un tat final prescrit. Pour les
systmes de contrle linaires en dimension finie, il existe une caractrisation
trs simple de la contrlabilit, due Kalman. Pour les systmes non linaires,
le problme mathmatique de contrlabilit est beaucoup plus difficile.
Origine du contrle optimal. Une fois le problme de contrlabilit rsolu,
on peut de plus vouloir passer de ltat initial ltat final en minimisant un
certain critre ; on parle alors dun problme de contrle optimal. En mathmatiques, la thorie du contrle optimal sinscrit dans la continuit du calcul des
variations. Elle est apparue aprs la seconde guerre mondiale, rpondant des
besoins pratiques de guidage, notamment dans le domaine de laronautique et
de la dynamique du vol. Historiquement, la thorie du contrle optimal est trs
lie la mcanique classique, en particulier aux principes variationnels de la
mcanique (principe de Fermat, de Huygens, quations dEuler-Lagrange). Le
point cl de cette thorie est le principe du maximum de Pontryagin, formul
par L. S. Pontryagin en 1956, qui donne une condition ncessaire doptimalit
et permet ainsi de calculer les trajectoires optimales (voir [31] pour lhistoire
de cette dcouverte). Les points forts de la thorie ont t la dcouverte de la
10
11
Rsum du livre
Lobjectif de ce livre est de prsenter, du point de vue mathmatique, les
bases thoriques du contrle optimal, ainsi que des applications concrtes de
cette thorie. Il a t rdig partir de notes de cours dAutomatique et de
Contrle Optimal enseigns par lauteur dans le master dIngnierie Mathmatique de lUniversit dOrsay, Option Automatique.
Il est accessible un lve suivant une formation universitaire (licence, master) ou une cole dingnieurs.
Dans une premire partie, on prsente la thorie du contrle optimal pour
des systmes de contrle linaires, ainsi que la thorie dite linaire-quadratique
et ses applications : rgulation, stabilisation, filtrage de Kalman.
Dans une seconde partie, on prsente la thorie du contrle optimal pour
des systmes de contrle gnraux (non linaires), avec notamment le principe du maximum de Pontryagin dans toute sa gnralit, ainsi que la thorie dHamilton-Jacobi. Un chapitre est consacr aux mthodes numriques en
contrle optimal.
Enfin, en appendice on effectue quelques rappels :
gnralisations des thormes de Cauchy-Lipschitz pour des quations diffrentielles ordinaires ;
bases de lautomatique : fonctions de transfert, stabilisation, observateurs.
Ce livre est rsolument orient vers les applications concrtes de lautomatique et du contrle optimal, et de nombreux exercices et applications sont
prsents. Les applications numriques sont galement dtailles ; elles sont effectues laide de logiciels standards comme Matlab et Maple, ou bien, si ncessaire, implmentes en C++. Parmi les applications dtailles dans cet ouvrage,
figurent le contrle optimal dun ressort (linaire ou non linaire) ; le filtrage
de Kalman ; diffrents problmes de rgulation ; le contrle optimal et la stabilisation dune navette spatiale en phase de rentre atmosphrique ; le transfert
orbital dun satellite pousse faible ; le contrle optimal et la stabilisation dun
pendule invers. Des exercices concernent aussi diffrents problmes daronautique, transfert de fichiers informatiques, contrle dun rservoir, problme de
Bolzano en conomie, dynamique des populations (systme prdateurs-proies),
ractions chimiques, mlangeurs, circuits lectriques, contrle dpidmies. Ils
sont prsents avec des lments de correction et, si ncessaire, des algorithmes
dimplmentation numrique.
12
Chapitre 1
Introduction : contrle
optimal dun ressort
Pour expliquer et motiver la thorie nous allons partir dun problme concret
simple : le contrle optimal dun ressort. Cet exemple, leitmotiv de cet ouvrage,
sera rsolu compltement, de manire thorique puis numrique.
Dans une premire partie, nous nous placerons dans le cas linaire : cest
le problme de loscillateur harmonique (trait en totalit dans [52]), et nous
dvelopperons la thorie du contrle optimal linaire.
Dans une deuxime partie nous traiterons le cas de loscillateur non linaire et
introduirons des outils gnraux de thorie du contrle optimal. Les applications
numriques seront effectues laide des logiciels Maple et Matlab.
1.1
Prsentation du problme
~
(1.1)
= y0 . Le problme est damener la masse ponctuelle la position dquilibre x = l en un temps minimal en contrlant la force externe u(t) applique
cet objet, et en tenant compte de la contrainte |u(t)| 6 1. La fonction u est
appele le contrle.
Des conditions initiales tant donnes, le but est donc de trouver une fonction
u(t) qui permet damener la masse ponctuelle sa position dquilibre en un
temps minimal.
1.2
Modlisation mathmatique
= y(t),
y(t)
= x(t) k2 x(t)3 + u(t),
x(0) = x0 , x(0)
= y0 .
Posons
A=
0
1
1
0
0
x
x0
, f (X) =
, B=
.
, X=
, X0 =
0
k2 x3
1
y0
y
On obtient
X(t)
= AX(t) + f (X(t)) + Bu(t) ,
X(0) = X0 .
On dit quil sagit dun systme diffrentiel contrl. Cest un systme linaire
dans le cas o k2 = 0.
1.3
15
Faisons quelques remarques sur lquation (1.1) dans le cas non linaire, avec
k2 = 2.
Le ressort libre
Dans ce paragraphe on suppose que u(t) = 0, cest--dire quaucune force
nest applique au ressort. Lquation (1.1) se rduit alors
x
(t) + x(t) + 2x(t)3 = 0,
qui sappelle lquation de Duffing. Il est trs facile de vrifier que toute solution
x() de cette quation est telle que
x(t)2 + x(t)4 + x(t)
2 = Cste.
Autrement dit, dans le plan de phase, toute solution est priodique, et son image
est incluse dans une courbe algbrique. Ci-dessous nous utilisons Maple pour
tracer dans le plan de phase (x, x)
plusieurs trajectoires solutions et le champ
de vecteurs associ, ainsi que les courbes x(t) en fonction de t.
Les commandes suivantes donnent la figure 1.2.
> with(DEtools):
> eq1 := D(x)(t)=y(t) :
eq2 := D(y)(t)=-x(t)-2*x(t)^3 :
sys := eq1,eq2 :
ic := [x(0)=1,y(0)=0],[x(0)=2,y(0)=0] :
> DEplot([sys],[x(t),y(t)],t=0..6,[ic],stepsize=0.05,
scene=[x(t),y(t)],linecolor=[blue,red]);
> DEplot([sys],[x(t),y(t)],t=0..6,[ic],stepsize=0.05,
scene=[t,x(t)],linecolor=[blue,red]);
4
y(t)
2
x(t) 1
1
x(t)
2
4
1
1
Figure 1.2
3t
= 0.
A laide de Maple, traons dans le plan de phase (x, x)
plusieurs trajectoires
solutions et le champ de vecteurs associ.
> eq1 := D(x)(t)=y(t) :
eq2 := D(y)(t)=-x(t)-2*x(t)^3-y(t) :
sys := eq1,eq2 :
ic := [x(0)=1,y(0)=0],[x(0)=2,y(0)=0] :
DEplot([sys],[x(t),y(t)],t=0..15,[ic],stepsize=0.05,
scene=[x(t),y(t)],linecolor=[blue,red]);
DEplot([sys],[x(t),y(t)],t=0..15,[ic],stepsize=0.05,
scene=[t,x(t)],linecolor=[blue,red]);
1
1
0.5
0.5
x(t)
1.5
1
1.5
x(t) 1
0.5
y(t) 2
0.5
3
8
t
10
12
14
Figure 1.3
On observe un amortissement : les solutions tendent vers lorigine (voir figure
1.3). En fait il est ais, laide de la thorie de Lyapunov, de montrer que
lorigine est globalement asymptotiquement stable. Notons cependant que ce
contrle u(t) ne rsout pas notre problme, car le temps pour amener le ressort
sa position dquilibre est infini !
Le ressort entretenu
Dans ce paragraphe on suppose que
u(t) = (x(t)2 1)x(t).
= 0.
17
4
y(t)
2
2
3
1
x(t)
2
x(t) 2
1
2
2
t 6
10
1
6
8
Figure 1.4
Numriquement (voir figure 1.4) on constate lexistence dune solution priodique qui semble attirer toutes les autres solutions. En fait on peut montrer
rigoureusement, toujours laide de la thorie de Lyapunov, que cette solution
priodique existe et est attractive.
Qualitativement on peut comprendre le comportement dun tel oscillateur en
discutant le signe de x(t)2 1. En effet si x(t) est grand il y a un amortissement
et le rayon polaire des solutions dans le plan de phase a tendance dcrotre.
Au contraire si x(t) est petit alors le terme (x(t)2 1)x(t)
apporte de lnergie
et le rayon a tendance augmenter. On retrouve bien ce comportement sur la
figure.
Lquation de Van der Pol est en fait le modle dune horloge.
Premire partie
19
21
Le problme gnral tudi dans cette partie est le suivant. Soient n et m
deux entiers naturels non nuls, I un intervalle de IR, et soient A, B et r trois
applications L sur I (en fait, localement intgrables, L1loc , suffit), valeurs
respectivement dans Mn (IR), Mn,m (IR), et Mn,1 (IR) (identifi IRn ). Soit
un sous-ensemble de IRm , et soit x0 IRn . Le systme de contrle linaire auquel
on sintresse est
t I
x(t)
(1.2)
o lensemble des contrles u considrs est lensemble des applications mesurables et localement bornes sur I, valeurs dans le sous-ensemble IRm .
Les thormes dexistence de solutions dquations diffrentielles (cf section
11.3) nous assurent que, pour tout contrle u, le systme (1.2) admet une unique
solution x() : I IRn , absolument continue. Soit M () : I Mn (IR) la
rsolvante du systme linaire homogne x(t)
x(t) = M (t)x0 +
pour tout t I.
Cette application dpend de u. Donc si on change la fonction u, on obtient
une autre trajectoire t 7 x(t) dans IRn (voir figure 1.5).
x0
Figure 1.5
Deux questions se posent alors naturellement :
Etant donn un point x1 IRn , existe-t-il un contrle u tel que la trajectoire associe ce contrle joigne x0 x1 en un temps fini T ? (voir figure
1.6)
Cest le problme de contrlabilit.
Si la condition prcdente est remplie, existe-t-il un contrle joignant x0
x1 , et qui de plus minimise une certaine fonctionnelle C(u) ? (voir figure
1.7)
22
x(t)
x0
x1 = x(T )
Figure 1.6 Problme de contrlabilit
x0
x1 = x(T )
Chapitre 2
Contrlabilit
2.1
2.1.1
Ensemble accessible
Dfinition
x(t)
2.1.2
CHAPITRE 2. CONTRLABILIT
24
x0
Acc(x0 , T )
Pour tout s [0, t], posons u(s) = u1 (s) + (1 )u2 (s). Le contrle u est dans
L2 , valeurs dans car est convexe. Soit x() la trajectoire associe u.
Alors, par dfinition de A(x0 , t), on a
Z t
M (t)M (s)1 (B(s)u(s) + r(s))ds Acc(x0 , t).
x(t) = M (t)x0 +
0
Or,
x11 + (1 )x12 = M (t)x0 + (1 )M (t)x0
Z t
+
M (t)M (s)1 (B(s)(u1 (s) + (1 )u2 (s)) + r(s) + (1 )r(s))ds
0
= x(t)
donc x11 + (1 )x12 Acc(x0 , t), ce qui prouve la convexit de Acc(x0 , t).
Pourtant, et ce rsultat est surprenant, la conclusion de ce thorme est
encore vraie si nest pas convexe. Ceci implique en particulier le rsultat
suivant.
Corollaire 2.1.2. Supposons que soit compact. Si on note Acc (x0 , t) lensemble accessible depuis x0 en temps t pour des contrles valeurs dans , alors
on a
Acc (x0 , t) = AccConv() (x0 , t),
o Conv() est lenveloppe convexe de . En particulier, on a Acc (x0 , t) =
Acc (x0 , t), o est la frontire de .
Ce dernier rsultat illustre le principe bang-bang (voir thorme 3.2.1).
25
(2.1)
Par dfinition, les contrles un sont valeurs dans le compact , et par consquent la suite (un )nIN est borne dans L2 ([0, t], IRm ). Par rflexivit de cet
espace (voir [19]), on en dduit que, sous-suite prs, la suite (un )nIN converge
faiblement vers un contrle u L2 ([0, t], IRm ). Comme est suppos convexe,
on a de plus u L2 ([0, t], ). Par ailleurs, de la formule de reprsentation (2.1)
on dduit aisment que la suite (xn ())nIN est borne dans L2 ([0, t], IRn ). De
plus, de lgalit x n = Axn + Bun + r, et utilisant le fait que A, B et r sont
dans L sur [0, T ], on conclut que la suite (x n ())nIN est galement borne
dans L2 ([0, t], IRn ), autrement dit que cette suite est borne dans H 1 ([0, t], IRn ).
Mais comme cet espace de Sobolev est rflexif et se plonge de manire compacte
dans C 0 ([0, t], IRn ) muni de la topologie uniforme, on conclut que, sous-suite
prs, la suite (xn ())nIN converge uniformment vers une application x() sur
[0, t]. En passant la limite dans (2.1) il vient alors
x(t) = M (t)x0 +
et en particulier
lim x1ni = lim xni (t) = x(t) Acc(x0 , t),
i+
i+
sup
yAcc(t2 )
sup
d(y, Acc(t2 )) .
yAcc(t1 )
CHAPITRE 2. CONTRLABILIT
26
Montrons juste le premier point (2. tant similaire). Soit y Acc(t2 ). Il suffit
de montrer que
z Acc(t1 ) | d(y, z) 6 .
Par dfinition de Acc(t2 ), il existe un contrle u L2 ([0, T ], ) tel que la trajectoire associe u, partant de x0 , vrifie x(t2 ) = y (voir figure 2.2). On va voir
x(t)
x(t1 )
x0
y = x(t2 )
Acc(t1 )
Acc(t2 )
Figure 2.2
que z = x(t1 ) convient. En effet on a
Z
t2
= M (t2 )
t2
t1
Z
+ (M (t2 ) M (t1 )) x0 +
t1
Si |t1 t2 | est petit, le premier terme de cette somme est petit par continuit
de lintgrale ; le deuxime terme est petit par continuit de t 7 M (t). Do
le rsultat.
Dans le cas gnral o est seulement compact (mais pas forcment convexe),
la preuve est plus difficile est fait appel au lemme de Lyapunov en thorie de
la mesure (dmontr par exemple dans [52, Lemma 4A p. 163]) et plus gnralement au thorme dAumann (voir par exemple [37]), grce auquel on a les
27
galits
{
={
={
= A(t)x(t)+B(t)u(t), x(0) =
0, scrit
Z t
x(t) = M (t)
M (s)1 B(s)u(s)ds,
0
et est linaire en u.
t
t
6 t2 t1
.
6 t2
CHAPITRE 2. CONTRLABILIT
28
= M (t2 )
= M (t1 )
t1
si s = t1 t2 + t
= x11
sous-espace vectoriel de IRn . En effet, une union croissante de sous-espaces vectoriels de IRn est un sous-espace vectoriel.
2.1.3
Dfinition de la contrlabilit
x1
x0
2.2
2.2.1
29
est de rang n.
La matrice C est appele matrice de Kalman, et la condition rg C = n est
appele condition de Kalman.
Remarque 2.2.1. La condition de Kalman ne dpend ni de T ni de x0 . Autrement
dit, si un systme linaire autonome est contrlable en temps T depuis x0 , alors
il est contrlable en tout temps depuis tout point.
Dmonstration. Lessentiel de la preuve est contenu dans le lemme suivant.
Lemme 2.2.2. La matrice C est de rang n si et seulement si lapplication
linaire
: L ([0, T ], IRm ) IRn
RT
u 7 0 e(T t)A Bu(t)dt
est surjective.
etA B = 0.
CHAPITRE 2. CONTRLABILIT
30
2.2.2
Dans le thorme 2.2.1, on na pas mis de contrainte sur le contrle. Cependant en adaptant la preuve on obtient aisment le rsultat suivant.
31
2. r = 0 et 0 ,
2.2.3
A =
, B =
,
0 A2
0
o A1 Mr (IR), B1 Mr,m (IR), r tant le rang de la matrice de Kalman de
la paire (A, B). De plus, la paire (A1 , B1 ) est contrlable.
CHAPITRE 2. CONTRLABILIT
32
B1
.
0
0
1
0
0
..
..
..
.
.
.
.
.
.
.
=
A = .
, B
. ,
0
0
0
1
an an1 a1
1
Remarque 2.2.5. Dans ces nouvelles coordonnes, le systme est alors quivalent
lquation diffrentielle scalaire dordre n
x(n) (t) + a1 x(n1) (t) + + an x(t) = u(t).
Dmonstration. Raisonnons par analyse et synthse. Sil existe une base (f1 , . . . , fn )
B),
alors on a ncessairement
dans laquelle la paire (A, B) prend la forme (A,
fn = B scalaire prs, et
Afn = fn1 a1 fn , . . . , Af2 = f1 an1 fn , Af1 = an fn .
Dfinissons donc les vecteurs f1 , . . . , fn par les relations
fn = B, fn1 = Afn + a1 fn , . . . , f1 = Af2 + an1 fn .
La famille (f1 , . . . , fn ) est bien une base de IRn puisque
Vect {fn } = Vect {B},
Vect {fn , fn1 } = Vect {B, AB},
..
.
Vect {fn , . . . , f1 } = Vect {B, . . . , An1 B} = IRn .
33
Si la paire (A, B) est contrlable, alors on peut la conjuguer une paire (A,
telle que
A1
..
0 A2 . . .
.
,
A= .
.
.
..
..
..
0
0 As
o les matrices Ai sont des matrices compagnons (i.e., ayant la forme de Brunovski du thorme prcdent) ; par ailleurs, il existe une matrice G Mm,s (IR)
telle que
1
B
= ..
BG
. ,
s
B
CHAPITRE 2. CONTRLABILIT
34
= u(t).
Circuit RLC
L
o q(t) =
Rt
q
di
+ Ri +
= u,
dt
C
dq
= i,
dt
di = R i 1 q + 1 u.
dt
L
LC
L
di
u = Ri + L dt + e,
e = k1 ,
J = kl2 i f c ,
do
i
R/L 0 k1 /L
1
0
d
=
0
0
1 + 0 u + 0 .
dt
k
/J
0
f
/J
0
c
x
= k1 x + k2 (y x),
y = k2 (y x) + u.
3
x
1
1
u
+
2
y
2 0
v
2.3
o
x = M (T )x0 + M (T )
M (t)1 r(t)dt.
Si C(T ) est inversible, posons u(t) = B(t) M (t)1 , avec IRn . Alors
x(T ) = x + M (T )C(T ),
et il suffit de prendre = C(T )1 M (T )1 (x1 x ).
Rciproquement, si C(T ) nest pas inversible, alors il existe IRn \ {0} tel
que T C(T ) = 0. On en dduit que
Z T
T
T
kB(t) M (t)1 k2 dt = 0,
0
do M (t)
1 T
Posons 1 = M (T )
CHAPITRE 2. CONTRLABILIT
36
dBi
(t).
dt
Ce thorme se montre aisment en thorie du contrle optimal, par lapplication du principe du maximum (voir plus loin).
Remarque 2.3.5. Dans le cas autonome, on retrouve la condition de Kalman.
Exercice 2.3.1. Montrer que le systme x(t)
t 1 0
0
A(t) = 0 t3 0 , et B(t) = 1 ,
0 0 t2
1
est contrlable en temps quelconque.
= Ax(t)+
Bu(t) est contrlable. Soit f : IR IR une fonction de classe C ; on pose, pour
tout t IR,
A(t) = A + f (t)I,
o I est la matrice identit dordre n. Montrer que le systme de contrle x(t)
=
A(t)x(t) + Bu(t) est contrlable en temps quelconque.
38
CHAPITRE 2. CONTRLABILIT
Chapitre 3
Temps-optimalit
3.1
x1 = x(t )
x0
Figure 3.1
Si t est le temps minimal, alors pour tout t < t , x1
/ Acc(x0 , t) (en
effet sinon x1 serait accessible partir de x0 en un temps infrieur t ). Par
consquent,
t = inf{t > 0 | x1 Acc(x0 , t)}.
Ce temps t est bien dfini car, daprs le thorme 2.1.1, Acc(x0 , t) varie continment avec t, donc lensemble {t > 0 | x1 Acc(x0 , t)} est ferm dans IR. En
particulier cette borne infrieure est atteinte.
Le temps t = t est le premier temps pour lequel Acc(x0 , t) contient x1 (voir
figure 3.2).
39
CHAPITRE 3. TEMPS-OPTIMALIT
40
x1
x0
Acc(x0 , t)
Acc(x0 , t)
3.2
(3.1)
pour presque tout t [0, T ]. Le vecteur ligne p(t) IRn est appel vecteur
adjoint.
Remarque 3.2.1. La condition initiale p(0) dpend en fait du point final x1 ,
comme on le voit dans la dmonstration. Comme elle nest pas directement
connue, lusage de ce thorme sera plutt indirect, comme on le verra dans les
exemples.
Remarque 3.2.2. Dans le cas mono-entre (contrle scalaire), et si de plus =
[a, a] o a > 0, la condition de maximisation implique immdiatement que
u(t) = a signe(p(t)B(t)). La fonction (t) = p(t)B(t) est appele fonction de
commutation, et un temps tc auquel le contrle extrmal u(t) change de signe
est appel un temps de commutation. Cest en particulier un zro de la fonction
.
Dmonstration. On a vu que Acc (x0 , T ) = AccConv() (x0 , T ), et par consquent on peut supposer que est convexe. Si u est extrmal sur [0, T ], soit x la
trajectoire associe u. On a x(T ) Acc(x0 , T ). Par convexit de Acc(x0 , T ),
il existe daprs le thorme du convexe (voir par exemple [19]) un hyperplan
sparant au sens large x(T ) et Acc(x0 , T ). Soit pT un vecteur normal cet
hyperplan (voir figure 3.3).
y1
pT
Acc(x0 , T )
x(T )
Figure 3.3
Daprs le thorme du convexe,
y1 Acc(x0 , T ) pT (y1 x(T )) 6 0.
(3.2)
CHAPITRE 3. TEMPS-OPTIMALIT
42
Appelons p(t) la solution sur [0, T ] de p = pA, telle que p(T ) = pT . Alors il
est clair que p(t) = p(0)M (t)1 et pT = p(T ) = p(0)M (T )1 . Il sensuit que
s [0, T ] pT M (T )M (s)1 = p(0)M (s)1 = p(s),
et donc que
Z
p(s)B(s)u1 (s)ds 6
p(s)B(s)u(s)ds
(3.3)
(3.4)
Raisonnons alors par labsurde, et supposons que x(T ) Int Acc(x0 , T ). Alors il
existerait un point y1 de Acc(x0 , T ) qui serait sur la demi-droite dorigine x(T )
et de direction p(T ) (voir figure 3.4). Mais alors p(T )(y1 x(T )) > 0, ce qui
contredirait (3.4). Donc x(T ) Acc(x0 , T ), et u est extrmal.
Remarque 3.2.3. Si u est extrmal sur [0, T ] alors u est aussi extrmal sur [0, t]
pour tout t [0, T ], et de plus p(t) est un vecteur normal extrieur Acc(x0 , t).
Cela dcoule facilement de la preuve et de la proprit (3.1).
x(T )
y1
p(T )
Figure 3.4
Remarque 3.2.4. Puisque tout contrle temps-minimal est extrmal, le thorme prcdent, qui est le principe du maximum dans le cas linaire, donne une
condition ncessaire doptimalit.
Remarque 3.2.5. Si u est un contrle temps-minimal joignant en temps T une
cible M1 , o M1 IRn est convexe, alors on peut de plus choisir le vecteur
adjoint pour que le vecteur p(T ) soit unitaire et normal un hyperplan sparant
(au sens large) Acc(x0 , T ) et M1 . Cest une condition dite de transversalit,
obtenue facilement dans la preuve prcdente.
Comme exemple thorique dapplication, montrons le rsultat suivant.
Proposition 3.2.2. Considrons dans IRn le systme linaire autonome x(t)
=
Ax(t) + Bu(t), avec B IRn et |u(t)| 6 1, et o la paire (A, B) vrifie la
condition de Kalman.
1. Si toute valeur propre de A est relle, alors tout contrle extrmal a au
plus n 1 commutations sur IR+ .
2. Si toute valeur propre de A a une partie imaginaire non nulle, alors tout
contrle extrmal a un nombre infini de commutations sur IR+ .
Dmonstration. Daprs le thorme 2.2.7, le systme peut scrire sous forme de
Brunovski, et il est alors quivalent une quation diffrentielle scalaire dordre
n de la forme
x(n) + a1 x(n1) + + an x = u, |u| 6 1.
De plus, tout contrle extrmal est de la forme u(t) = signe (t), o (t) est la
dernire coordonne du vecteur adjoint, qui vrifie lquation diffrentielle
(n) a1 (n1) + + (1)n an = 0.
En effet le vecteur adjoint vrifie p (t) = p(t)A(t).
1. Si toute valeur propre de A est relle, alors (t) scrit sous la forme
(t) =
r
X
Pj (t)ej t ,
j=1
CHAPITRE 3. TEMPS-OPTIMALIT
44
2. Si toute valeur propre de A a une partie imaginaire non nulle, alors, comme
prcdemment, on peut crire
(t) =
r
X
j=1
3.3
3.3.1
Exemples
Synthse optimale pour le problme de loscillateur
harmonique linaire
Appliquons la thorie prcdente lexemple de loscillateur harmonique prsent en introduction, pour k2 = 0, et rpondons aux deux questions suivantes :
1. Pour toute condition initiale x(0) = x0 , x(0)
Contrlabilit du systme
Le systme scrit
X = AX + Bu
X(0) = X0
avec A =
0 1
0
,B =
.
1 0
1
3.3. EXEMPLES
45
Interprtation physique
Si lon napplique aucune force extrieure, i.e. u = 0, alors lquation du
mouvement est x
+x = 0. La masse ponctuelle oscille, et ne sarrte jamais,
donc ne parvient pas sa position dquilibre en un temps fini.
Si lon applique certaines forces extrieures, on a tendance amortir les oscillations. La thorie prvoit quon parvient stopper lobjet en un temps
fini.
x = y,
y = x + 1.
(3.6)
CHAPITRE 3. TEMPS-OPTIMALIT
46
x
1
+1
Figure 3.5
Si p1 (0) = 1, p2 (0) = 0, alors p2 (t) = sin t, donc sur ]0, [ on a u(t) =
signe(p2 (t)) = +1. La trajectoire optimale correspondante, partant de 0,
suit donc pendant un temps larc de cercle + solution de (3.6), passant
par 0 (voir figure 3.6).
y
x
1
+1
+
Figure 3.6
Pour tout autre choix de p(0) tel que p2 (0) > 0, la trajectoire optimale
correspondante part de lorigine en suivant + jusqu ce que p2 (t) = 0.
Au-del de ce point, p2 (t) change de signe, donc le contrle commute et
prend la valeur 1, pendant une dure (i.e. jusqu ce que p2 (t) change
nouveau de signe). La trajectoire optimale doit alors tre solution de (3.5),
en partant de ce point de commutation M , et doit donc suivre un arc de
cercle centr en (1, 0), pendant un temps . Cest donc un demi-cercle,
vu la paramtrisation des courbes de (3.5) (voir figure 3.7).
La trajectoire optimale rencontre un deuxime point de commutation N
lorsque nouveau p2 (t) change de signe. On remarque que M et N sont symtriques par rapport au point (1, 0) (en effet ce sont les extrmits dun
3.3. EXEMPLES
47
y
+1
1
x
M
Figure 3.7
demi-cercle centr en ce point). Le point M appartenant au demi-cercle
+ , le point N appartient au demi-cercle image de + par la symtrie
par rapport au point (1, 0) qui est aussi, comme on le voit facilement, le
translat gauche de par la translation de vecteur (2, 0).
Poursuivons alors notre raisonnement. On se rend compte que les points de
commutation de cette trajectoire optimale partant de 0 sont situs sur la courbe
W construite de la manire suivante : W est lunion de tous les translats
gauche de par la translation prcdente, et aussi de tous les translats
droite de + (voir figure 3.8).
y
+1
+3
+5
CHAPITRE 3. TEMPS-OPTIMALIT
48
+3
+1
5
+5
Figure 3.9
0
+
3.3. EXEMPLES
3.3.2
49
Autres exemples
cos
.
sin + cos
CHAPITRE 3. TEMPS-OPTIMALIT
50
cos
Si 0 6 < 4 alors sin2+cos
> 1 donc lquation ci-dessus na pas de
solution, et donc u(t) = +1 sur IR+ .
Si 4 6 < 2 , lquation a une solution t() > 0, et lon voit facilement
que t() est strictement croissante de [ 4 , 2 ] dans [0, +[. Le contrle vaut
alors 1 sur [0, t()[ et +1 ensuite.
Si 2 6 6 , lquation na pas de solution dans IR+ , et on trouve
u(t) = 1 sur IR+ .
Ainsi dans le deuxime cas, lextrmale partant du point (0, 1) suit pendant un
moment la courbe , puis commute sur u = +1.
Enfin, on dfinit + , symtrique de par rapport lorigine (voir figure
3.11). Finalement, le lieu de commutation est + , et lon peut exprimer
en fonction de x, y la loi de commande optimale u(x, y) = 1 (resp. +1) si
(x, y) est au-dessus de W ou sur (resp. en dessous de W ou sur + ), o
W = M 1 + .
u = 1
M1
u = +1
3.3. EXEMPLES
51
x1
12
52
CHAPITRE 3. TEMPS-OPTIMALIT
Chapitre 4
Thorie linaire-quadratique
Dans ce chapitre on sintresse aux systmes de contrle linaires avec un
cot quadratique. Ces systmes sont dune grande importance dans la pratique,
comme on le verra en section 4.4. En effet un cot quadratique est souvent
trs naturel dans un problme, par exemple lorsquon veut minimiser lcart
au carr par rapport une trajectoire nominale (problme de poursuite). Par
ailleurs mme si les systmes de contrle sont en gnral non linaires, on est
trs souvent amen linariser le systme le long dune trajectoire, par exemple
dans des problmes de stabilisation.
Nous allons donc considrer un systme de contrle linaire dans IRn
x(t)
(4.1)
T
T
x(t) W (t)x(t) + u(t) U (t)u(t) dt,
(4.2)
o T > 0 est fix, et o, pour tout t [0, T ], U (t) Mm (IR) est symtrique
dfinie positive, W (t) Mn (IR) est symtrique positive, et Q Mn (IR) est une
matrice symtrique positive. On suppose que les dpendances en t de A, B, W
et U sont L sur [0, T ]. Par ailleurs le cot tant quadratique, lespace naturel
des contrles est L2 ([0, T ], IRm ).
Le problme de contrle optimal est alors le suivant, que nous appellerons
problme LQ (linaire-quadratique).
Problme LQ : Un point initial x0 IRn tant fix, lobjectif est de dterminer les trajectoires partant de x0 qui minimisent le cot C(u).
Notons que lon nimpose aucune contrainte sur le point final x(T ). Pour toute
la suite, on pose
kx(t)k2W = x(t)T W (t)x(t), ku(t)k2U = u(t)T U (t)u(t), et g(x) = xT Qx,
53
54
de sorte que
C(u) = g(x(T )) +
kx(t)k2W + ku(t)k2U dt.
Remarque 4.0.2. Par hypothse les matrices Q et W (t) sont symtriques positives, mais pas ncessairement dfinies. Par exemple si Q = 0 et W = 0 alors le
cot est toujours minimal pour le contrle u = 0.
Remarque 4.0.3. Comme dans le chapitre prcdent, on suppose pour allger
les notations que le temps initial est gal 0. Cependant tous les rsultats qui
suivent sont toujours valables si on considre le problme LQ sur un intervalle
[t0 , T ], avec des contrles dans lespace L2 ([t0 , T ], IRm ).
Remarque 4.0.4. Les rsultats des sections 4.1 et 4.2 seront en fait valables pour
des systmes linaires perturbs x = Ax + Bu + r, et avec une fonction g de IRn
dans IR continue ou C 1 . Nous prciserons pour chaque rsultat les extensions
possibles.
De mme nous envisagerons le cas o T = +.
4.1
> 0 | u L ([0, T ], IR )
ku(t)k2U dt
>
u(t) u(t)dt.
(4.3)
Par exemple cette hypothse est vrifie si lapplication t 7 U (t) est continue
sur [0, T ] et T < +, ou encore sil existe une constante c > 0 telle que pour
tout t [0, T ] et pour tout vecteur v IRm on ait v T U (t)v > cv T v.
On a le thorme dexistence suivant.
Thorme 4.1.1. Sous lhypothse (4.3), il existe une unique trajectoire minimisante pour le problme LQ.
Dmonstration. Montrons tout dabord lexistence dune telle trajectoire. Considrons une suite minimisante (un )nIN de contrles sur [0, T ], i.e. la suite C(un )
converge vers la borne infrieure des cots. En particulier cette suite est borne. Par hypothse, il existe une constante > 0 telle que pour tout u
L2 ([0, T ], IRm ) on ait C(u) > kukL2 . On en dduit que la suite (un )nIN est
borne dans L2 ([0, T ], IRm ). Par consquent sous-suite prs elle converge faiblement vers un contrle u de L2 . Notons xn (resp. x) la trajectoire associe au
contrle un (resp. u) sur [0, T ]. Daprs la formule de variation de la constante,
on a, pour tout t [0, T ],
xn (t) = M (t)x0 + M (t)
t
0
(4.4)
55
(et la formule analogue pour x(t)). On montre alors aisment que, sous-suite
prs, la suite (xn ) converge simplement vers lapplication x sur [0, T ] (en fait on
peut mme montrer que la convergence est uniforme).
Passant maintenant la limite dans (4.4), on obtient, pour tout t [0, T ],
x(t) = M (t)x0 + M (t)
M (s)1 B(s)u(s)ds,
et donc C(u) 6 lim inf C(un ). Mais comme (un ) est une suite minimisante, C(u)
est gal la borne infrieure des cots, i.e. le contrle u est minimisant, ce qui
montre lexistence dune trajectoire optimale.
Pour lunicit on a besoin du lemme suivant.
Lemme 4.1.2. La fonction C est strictement convexe.
Preuve du lemme. Tout dabord remarquons que pour tout t [0, T ], la fonction
f (u) = uT U (t)u dfinie sur IRm est strictement convexe puisque par hypothse la
matrice U (t) est symtrique dfinie positive. Ensuite, notons xu () la trajectoire
associe un contrle u. On a pour tout t [0, T ],
xu (t) = M (t)x0 + M (t)
M (s)1 B(s)u(s)ds.
56
est dans L1 .
4.2
et la condition finale
p(t)
= p(t)A(t) + x(t) W (t)
(4.5)
p(T ) = x(T )T Q.
(4.6)
(4.7)
(4.8)
Par ailleurs il est bien clair que le cot C() est une fonction lisse sur L2 ([0, T ], IRm )
(elle est mme analytique) au sens de Frchet. Le contrle u tant minimisant
on doit avoir
dC(u) = 0.
Or
C(upert ) = g(xpert (T )) +
(4.9)
ceci tant valable pour toute perturbation u. Cette quation va nous conduire
lexpression du contrle optimal u. Mais introduisons tout dabord le vecteur
adjoint p(t) comme solution du problme de Cauchy
p(t)
= p(t)A(t) + x(t)T W (t), p(T ) = x(T )T Q.
La formule de variation de la constante nous conduit
Z t
T
p(t) = M (t)1 +
x(s) W (s)M (s)ds M (t)1
0
58
Revenons alors lquation (4.9). Tout dabord, en tenant compte de (4.8) puis
en intgrant par parties, il vient
Z T
Z T
Z t
T
T
x(t) W (t)x(t)dt =
x(t) W (t)M (t)
M (s)1 B(s)u(s)ds dt
0
Or
1
p(t) M (t)
M (s)1 B(s)u(s)ds
M (t)1 B(t)u(t)dt
p(t)B(t)u(t)dt.
0
ceci pour toute application u L2 ([0, T ], IRm ). Ceci implique donc lgalit
pour presque tout t [0, T ]
T
(4.10)
t+
(4.11)
x =
et
H
= 0,
u
60
= 0.
On souhaite, pendant un temps T fix, maximiser la distance parcourue tout en
minimisant lnergie fournie. On choisit donc le critre
Z T
u(t)2 dt.
C(u) = x(T ) +
0
1
, py (T ) = 0.
2
T t
2
et la distance parcourue
1 3
T .
6
Remarque 4.2.4. Dans lexemple prcdent on aurait pu mettre des poids diffrents dans le cot, suivant quon accorde plus dimportance maximiser la
distance parcourue ou minimiser lnergie. On peut aussi choisir le cot
Z T
u(t)2 dt,
C(u) = x(T )2 +
x(T ) =
4.3
4.3.1
(4.12)
61
kx(t)k2W + ku(t)k2U dt.
(4.13)
4.3.2
Equation de Riccati
Thorme 4.3.1. Sous lhypothse (4.3), pour tout x IRn il existe une unique
trajectoire optimale x associe au contrle u pour le problme (4.12), (4.13). Le
contrle optimal se met sous forme de boucle ferme
T
(4.14)
E(t)
= W (t) A(t) E(t) E(t)A(t) E(t)B(t)U (t)1 B(t) E(t), E(T ) = Q.
(4.15)
De plus, pour tout t [0, T ], la matrice E(t) est symtrique, et
ST (x) = xT E(0)x.
(4.16)
Il faut donc montrer que lon peut crire p(t) = x(t) E(t), o E(t) est solution
de (4.15). Notons que si p scrit ainsi, alors, daprs lquation vrifie par
62
le couple (x, p), on trouve facilement que E(t) doit tre solution de lquation
(4.15). En utilisant lunicit de la trajectoire optimale, on va maintenant montrer
que p scrit effectivement ainsi. Soit E(t) solution de lquation
E = W AT E EA EBU 1 B T E, E(T ) = Q.
Tout dabord E(t) est symtrique car le second membre de lquation diffrentielle lest, et la matrice Q est symtrique. A priori on ne sait pas cependant
que la solution est bien dfinie sur [0, T ] tout entier. On montrera cela plus loin
(lemme 4.3.2).
T
Posons maintenant p1 (t) = x1 (t) E(t), o x1 est solution de
x 1 = Ax1 + Bu1 ,
et u1 = U 1 B T Ex1 . On a alors
T
p1 = x T
1 E + x1 E
T
= p1 A + x1 T W.
+ p(t)x(t)
dt
dt
T
= (p(t)A(t) + x(t) W (t))x(t) + p(t)(A(t)x(t) + B(t)u(t))
T
d
T
x(t) E(t)x(t) dt.
dt
63
Preuve du lemme. Si lapplication E(t) nest pas dfinie sur [0, T ] entier, alors il
existe 0 < t < T tel que kE(t)k tend vers + lorsque t tend vers t par valeurs
suprieures. En particulier pour tout > 0 il existe t0 ]t , T ] et x0 IRn , avec
kx0 k = 1, tels que
|x0 T E(t0 )x0 | > .
(4.17)
Daprs le thorme 4.1.1, il existe une unique trajectoire optimale x() pour
le problme LQ sur [t0 , T ], telle que x(t0 ) = x0 (voir remarque 4.0.3). Cette
trajectoire est caractrise par le systme dquations
x = Ax + BU 1 B T pT , x(t0 ) = x0 ,
T
p = pA + xT W, p(T ) = x(T ) Q.
Le raisonnement prcdent, en remplaant lintervalle [0, T ] par lintervalle [t0 , T ],
montre que ST t0 (x0 ) = x0 T E(t0 )x0 . Par ailleurs, ST t0 (x0 ) est infrieur au
cot de la trajectoire solution du systme, partant de x0 , associe (par exemple)
au contrle nul sur lintervalle [t0 , T ] ; or il est facile de voir que ce cot est major, une constante multiplicative C > 0 prs, par kx0 k2 . On en dduit donc
que |x0 T E(t0 )x0 | 6 Ckx0 k2 , ce qui contredit (??).
Ceci achve la preuve du thorme.
Remarque 4.3.3. Il est clair daprs lexpression (4.16) du cot minimal que la
matrice E(0) est symtrique ngative. On peut amliorer ce rsultat si la matrice
Q est de plus dfinie (voir lemme suivant).
Lemme 4.3.3. Si la matrice Q est symtrique dfinie positive, ou bien si pour
tout t [0, T ] la matrice W (t) est symtrique dfinie positive, alors la matrice
E(0) est symtrique dfinie ngative.
Preuve du lemme 4.3.3. Soit x0 tel que x0 T E(0)x0 = 0, et montrons que x0 = 0.
Pour cela on considre le problme LQ
x = Ax + Bu, x(0) = x0 ,
Z T
T
kx(t)k2W + ku(t)k2U dt,
min x(T ) Qx(T ) +
0
1
2x
+u
64
1 1 et eT
1 eT 2
1 et eT
, u(t) =
x(t), ST (x) =
x .
t
2t
T
t
t
T
e +e e
2e +e e
1 + eT
conduit une trajectoire minimisante telle que x(T ) = 0. Montrer que F (t) =
E(t)1 existe et est solution sur lintervalle [0, T ] entier dune quation de Riccati, avec F (T ) = 0.
Variante du problme prcdent. Soit T > 0 fix. Pour tout t [0, T ] et
tout x IRn , considrons le problme LQ de trouver une trajectoire solution de
x = Ax + Bu, x(t) = x,
(4.18)
kx(t)k2W + ku(t)k2U dt.
(4.19)
Thorme 4.3.4. Sous lhypothse (4.3), pour tout x IRn et tout t [0, T ] il
existe une unique trajectoire optimale x associe au contrle u pour le problme
(4.18), (4.19). Le contrle optimal se met sous forme de boucle ferme
T
(4.20)
pour tout s [t, T ], et o E(s) Mn (IR) est solution sur [t, T ] de lquation
matricielle de Riccati
E = W AT E EA EBU 1 B T E, E(T ) = Q.
(4.21)
De plus pour tout s [t, T ] la matrice E(s) est symtrique, et pour tout t [0, T ]
on a
ST (t, x) = xT E(t)x.
(4.22)
Dmonstration. La diffrence par rapport au cas prcdent est que lon paramtrise le temps initial. Le seul changement est donc la formule (4.22). Comme
dans la dmonstration prcdente, on a
Z T
d
T
T
x(s) E(s)x(s) ds.
ST (t, x) = x(T ) Qx(T ) +
ds
t
Or puisque E(T ) = Q et x(t) = x, il vient ST (t, x) = xT E(t)x.
65
Notons que pour implmenter lquation de Riccati (4.21), une condition finale
tant donne, on inverse le temps de faon se ramener une condition initiale.
Pour rtablir le bon sens du temps, on utilise la fonction flipud, cf programme
ci-dessous.
function riccati1
% Systeme
dx/dt=y, dy/dt=z, dz/dt=u
% min int_0^T (x^2+y^2+z^2+u^2)
clc ; clear all ;
range = [0 : 0.01 : 10 ];
global tricca ricca ;
minit = [ 0 ; 0 ; 0 ; 0 ; 0 ; 0 ] ;
[tricca,ricca] = ode113(@matriccati,range,minit);
ricca=flipud(ricca);
% on remet le temps dans le bon sens
xinit = [ 1 ; 2 ; 3 ] ;
[t,X] = ode113(@systriccati,range,xinit);
plot(t,X(:,1))
%-------------------------------------------------------function dXdt = systriccati(t,X)
global tricca ricca ;
x=X(1) ; y=X(2) ; z=X(3) ;
[bla,k]=min(abs(tricca-t));
e=ricca(k,5) ; f=ricca(k,6) ; c=ricca(k,3) ;
66
u=e*x+f*y+c*z ;
dXdt= [ y
z
u ] ;
%-------------------------------------------------------function dXdt = matriccati(t,X)
% Eq de Riccati dE/dt=W-AE-EA-EBU^{-1}BE, E(T)=-Q, en temps inverse
a=X(1) ; b=X(2) ; c=X(3) ; d=X(4) ; e=X(5) ; f=X(6) ;
dXdt= - [ 1-e^2
-2*d-f^2+1
-2*f-c^2+1
-a-e*f
-d-e*c
-e-b-f*c ] ;
4.3.3
On a la proprit suivante.
Proposition 4.3.5. Plaons-nous dans le cadre du thorme 4.3.1. Soit
R1 (t) R2 (t)
R(t) =
R3 (t) R4 (t)
la rsolvante du systme linaire
x = Ax + BU 1 B T pT ,
p T = AT pT + W x,
telle que R(T ) = Id. Alors pour tout t [0, T ] on a
E(t) = (R3 (t) R4 (t)Q) (R1 (t) R2 (t)Q)
67
4.4
4.4.1
Applications de la thorie LQ
Problmes de rgulation
(4.23)
et soit (t) une certaine trajectoire de IRn sur [0, T ], partant dun point 0 (et
qui nest pas forcment solution du systme (4.23)). Le but est de dterminer un
contrle tel que la trajectoire associe, solution de (4.23), suive le mieux possible
la trajectoire de rfrence (t) (voir figure 4.1).
(T )
(t)
x(t)
x0
0
Figure 4.1 Problme du rgulateur
On introduit alors lerreur sur [0, T ]
z(t) = x(t) (t),
qui est solution du systme de contrle
z(t)
= A(t)z(t) + B(t)u(t) + r1 (t), z(0) = z0 ,
(4.24)
68
z1 = A1 z1 + B1 u,
partant du point z1 (0).
La thorie LQ faite prcdemment prvoit alors que le contrle optimal
existe, est unique, et scrit
T
h(t)
.
(t)
E(t)
T
h(t)
= W AT E EA EBU 1 B T E, E(T ) = Q,
= AT h Er1 EBU 1 B T h,
h(T ) = 0,
= 2r1 T h hT BU 1 B T h,
(T ) = 0.
(4.25)
dt.
69
= W AT E EA EBU 1 B T E,
E(T ) = Q,
T
1 T
et de plus E(t) est symtrique. Par ailleurs le cot minimal est alors gal
T
Remarque 4.4.1. Notons que le contrle optimal scrit bien sous forme de boucle
ferme
u(t) = K(t)(x(t) (t)) + H(t).
Remarque 4.4.2. Si = A + r, i.e. la trajectoire de rfrence est solution du
systme sans contrle, alors dans les notations prcdentes on a r1 = 0, et
daprs les quations (4.25) on en dduit que h(t) et (t) sont identiquement
nuls. On retrouve alors le cadre LQ de la section prcdente. En fait,
si = 0 et r = 0, le problme est un problme LQ standard ;
si r = 0, il sagit dun problme de poursuite de la trajectoire ;
si = 0, cest un problme de rgulation avec la perturbation r.
Exercice 4.4.1. Rsoudre le problme de poursuite sur [0, 2 ] pour le systme
x = x + u, x(0) = 0, la fonction (t) = t, et des poids tous gaux 1.
Exercice 4.4.2. Considrons loscillateur harmonique
x + x = u, x(0) = 0, x(0)
= 1.
On dsire asservir le mouvement de cet oscillateur la courbe (cos t, sin t) sur
[0, 2], i.e. dcaler la phase de /2. Ecrire les quations permettant de rsoudre
le problme, puis raliser limplmentation numrique.
Variante : le problme de poursuite dune sortie (ou output tracking)
On ajoute au problme prcdent une variable de sortie :
x(t)
70
Posons alors
T
T
T
x
C WC
C(T ) QC(T ) C(T ) Q(T )
x1 =
, Q1 =
, W1 =
T
T
T
1
WC
(T )QC(T )
(T )Q(T )
C T W
,
TW
T
0
dt.
et de plus E(t) est symtrique. Par ailleurs le cot minimal est alors gal
T
= T W 2rT h hT BU 1 B T h, (T ) = (T ) Q(T ).
Remarque 4.4.3. On trouvera dans [64] dautres variantes de ce problme, notamment le mme problme que ci-dessus, sauf que le cot scrit
Z T
ky(t) (t)k2W + ku(t)k2U dt.
C(u) = x(T )T Qx(T ) +
0
Le seul changement est dans la matrice augmente Q1 , et donc dans les conditions aux limites de E et h, qui deviennent dans ce cas E(T ) = Q et h(T ) = 0.
On trouvera aussi dans [52, ex. 9, p. 203] une autre variante du problme
LQ, o la fonction g apparaissant dans le cot est linaire en x. Nous laissons
lcriture de toutes ces variantes au lecteur, la mthode tant de toute faon la
mme que prcdemment.
71
4.4.2
= A(t)x(t) + B(t)u(t),
minimisant le cot
T
k(C(t)x(t) (t))k2W + ku(t)k2U dt.
Il sagit dune variante des problmes de poursuite prcdents, sauf que lon
nimpose aucune condition sur x(0) et x(T ), et de plus le cot pnalise le point
initial x(0). En revanche dans ce problme on suppose que la matrice Q est
symtrique dfinie positive.
Pour se ramener aux cas prcdents, il convient donc tout dabord dinverser
le temps, de faon ce que le cot pnalise, comme avant, le point final. On
pose donc, pour tout t [0, T ],
= A(T t), B(t)
= B(T t),
x
(t) = x(T t), u
(t) = u(T t), A(t)
= (T t), W
(t) = W (T t), U(t)
= C(T t),
(t)
= U (T t), C(t)
de sorte que lon se ramne au problme de dterminer une trajectoire solution
x + B
u
de x = A
, minimisant le cot
u) = x(T )T Q
C(
x(T ) +
2
x(t) (t))k
k(C(t)
u(t)k2U dt.
+ k
W
u) = C(u).
Notons que, par construction, on a C(
Fixons une donne initiale x(0), et appliquons, pour cette donne initiale, le
mme raisonnement que dans les cas prcdents. On obtient alors
1 B
TE
x
1 B
T h,
u
(t) = U
+U
o
=
E
=
h
T E,
E
A E
B
U
1 B
C AT E
C T W
E
T h,
B
U
1 B
AT h
C T W
T 1 T
T
W h B U B h,
) = Q,
E(T
h(T ) = 0,
(T ) = 0,
72
x(0) E(0)
x(0) 2
x(0) h(0)
(0).
f (x) = xT E(0)x
2xT h(0)
(0).
Il faut donc dterminer un minimum de f . Notons tout dabord que, la matrice
1 h(0).
f (x) = 0, do x = E(0)
Finalement, en reprenant le cours positif du temps, et en posant pour tout
t [0, T ]
t),
t), h(t) = h(T
E(t) = E(T
on arrive au rsultat suivant.
Proposition 4.4.3. Soit () une trajectoire dfinie sur [0, T ] valeurs dans
IRp . On considre le problme de dterminer une trajectoire solution sur [0, T ]
de
x(t)
= A(t)x(t) + B(t)u(t),
minimisant le cot
T
k(C(t)x(t) (t))k2W + ku(t)k2U dt,
o la matrice Q est de plus suppose dfinie positive. Alors il existe une unique
trajectoire minimisante, associe au contrle
u(t) = U (t)1 B(t)T E(t)x(t) + U (t)1 B(t)T h(t),
et la condition finale
x(T ) = E(T )1 h(T ),
o
E
h
=
=
C T W C AT E EA EBU 1 B T E, E(0) = Q,
C T W AT h EBU 1 B T h,
h(0) = 0,
Ltat final x(T ) = E(T )1 h(T ) est la donne qui nous intresse principalement dans le problme du filtre de Kalman, qui est un problme destimation,
comme nous le verrons dans les exemples suivre. Lestimation de cet tat final
peut tre simplifie de la manire suivante.
73
,
Posons F (t) = E(t)1 . On trouve facilement, puisque F = F EF
F = BU 1 B T + AF + F AT F C T W CF, F (0) = Q1 .
Par ailleurs si on pose z(t) = F (t)h(t), on trouve que
z = (A F C T W C)z + F C T W , z(0) = 0.
Finalement on arrive au rsultat suivant.
Proposition 4.4.4. Sous les hypothses de la proposition 4.4.3, ltat final x(T )
de la solution optimale est gal z(T ), o
z
F
=
=
(A F C T W C)z + F C T W ,
BU 1 B T + AF + F AT F C T W CF,
z(0) = 0,
F (0) = Q1 .
x(0) Qx(0) +
= A(t)x(t) + B(t)u(t),
y(t) = C(t)x(t),
T
74
ewt (1 + w)
1
+
.
w
w
4.4.3
kx(t)k2W + |u(t)k2U dt,
75
Thorme 4.4.5. On suppose que les matrices W et U sont symtriques dfinies positives, et que le systme est contrlable. Alors il existe une unique
trajectoire minimisante pour ce problme, associe sur [0, +[ au contrle optimal
u(t) = U 1 B T Ex(t),
(4.26)
o E Mn (IR) est lunique matrice symtrique dfinie ngative solution de
lquation de Riccati stationnaire
AT E + EA + EBU 1 B T E = W.
(4.27)
lim p(t) = 0,
t+
76
Cette quation tant en fait indpendante de T , on peut poser D(t) = D(T, t),
et D(t) est solution de lquation de Riccati ci-dessus sur IR+ . De plus pour tout
T > 0 on a D(T ) = E(T, 0), et comme la matrice W est symtrique dfinie
positive on dduit du lemme 4.3.3 que D(T ) est symtrique dfinie positive.
Par ailleurs on a, pour tout T > 0, C(T, u) = x0 T D(T )x0 . Il est clair que si
0 < t1 6 t2 alors C(t1 , u) 6 C(t2 , u), et donc x0 T D(t1 )x0 6 x0 T D(t2 )x0 . Ceci
est en fait indpendant de x0 , car lquation de Riccati ne dpend nullement
de la donne initiale. Ainsi pour tout x IRn la fonction t 7 xT D(t)x est
croissante.
Montrons quelle est galement majore. Le systme tant contrlable, largument de la remarque 4.1.2 montre quil existe au moins un contrle v sur
[0, +[ de cot fini. Comme le contrle u est optimal, on en dduit que la
fonction t 7 C(t, u) est majore (par C(v)).
Pour tout x IRn , la fonction t 7 xT D(t)x tant croissante et majore, on
en dduit quelle converge. En appliquant cette conclusion aux lments dune
base (ei ) de IRn , on en dduit que chaque lment dij (t) de la matrice D(t)
converge, car en effet
dij (t) = ei T D(t)ej =
1
ei + ej T D(t)(ei + ej ) ei T D(t)ei ej T D(t)ej .
2
Ainsi la matrice D(t) converge vers une matrice E, qui est ncessairement
symtrique dfinie ngative daprs la croissance de la fonction t 7 xT D(t)x.
77
2)x(t), x(t) = x0 e 2t .
a
c
c
,
b
a = 1 3, b = 1 3.
78
1 3
1
,
E=
1
1 3
et le systme boucl est alors
x = 3x, x(0) = 1,
y = 3y, y(0) = 1.
= 1.
1. Quel est le comportement de la solution en labsence de contrle ?
2. On dsire stabiliser la solution de ce systme vers lorigine par la mthode
de Riccati stationnaire, en minimisant le cot
Z +
C(u) =
(x(t)2 + x(t)
2 + u(t)2 )dt.
0
2 1 2
E=
.
1 2
p
o = 2 2 1.
(b) Donner lexpression du contrle optimal.
(c) Montrer que la solution du systme boucl est
x(t) =
2 t
e 2 sin t,
p
o = 2 2 + 1.
(d) Commenter brivement les rsultats et la mthode.
Exercice 4.4.5. Montrer que la solution de lquation de Riccati stationnaire
pour le problme LQ
Z +
x = y, y = u, C(u) =
x(t)2 + y(t)2 + u(t)2 dt,
0
est la matrice
E=
3 1
.
1 3
2
2
0 (x(t) + u(t) )dt, avec > 0. Que se passe-t-il lorsque + ?
79
Solution numrique de lquation de Riccati stationnaire On peut calculer numriquement la solution de lquation de Riccati algbrique (4.27) en
employant une mthode de Schur (voir [50, 51]). Ceci est implment en Matlab
dans la fonction lqr.m (voir aussi care.m).
Ci-dessous, voici un exemple dutilisation de lqr, en reprenant lexemple
4.3.1.
function riccati2
% Systeme
dx/dt=y, dy/dt=z, dz/dt=u
% min int_0^T (x^2+y^2+z^2+u^2)
clc ; clear all ;
global A B W invU ;
% Systeme
A = [ 0 1 0
0 0 1
0 0 0 ] ;
B = [ 0
0
1 ] ;
% Matrices de ponderation
W = eye(3) ;
U = 1 ; invU = inv(U) ;
range = [0 : 0.01 : 10 ];
%% Utilisation de lqr
global K ;
[K,S,e] = lqr(A,B,W,U) ;
xinit = [ 1 ; 2 ; 3 ] ;
[t,X] = ode45(@systriccati,range,xinit) ;
plot(t,X(:,1));
%-------------------------------------------------------function dXdt = systriccati(t,X)
global K ; u = -K*X ;
dXdt = [ X(2)
X(3)
u
] ;
80
2.5
1.5
0.5
0.5
Figure 4.2
10
Deuxime partie
81
83
Lobjectif de cette partie est de prsenter des techniques danalyse de problmes de contrle optimal non linaires. On prsente notamment le principe
du maximum de Pontryagin et la thorie dHamilton-Jacobi. Un chapitre est
consacr aux mthodes numriques en contrle optimal.
Dun point de vue global, un problme de contrle optimal se formule sur
une varit M , mais notre point de vue est local et on travaille sur un ouvert
V petit de IRn . La problmatique gnrale du contrle optimal est la suivante.
Considrons un systme de contrle gnral
x(t)
(4.28)
(4.29)
84
Chapitre 5
Dfinitions et prliminaires
Un problme de contrle optimal se dcompose en deux parties : pour dterminer une trajectoire optimale joignant un ensemble initial une cible, il
faut dabord savoir si cette cible est atteignable. Cest le problme de contrlabilit. Ensuite, une fois ce problme rsolu, il faut chercher parmi toutes ces
trajectoires possibles celles qui le font en cot minimal .
Dans ce chapitre nous tudions le problme de contrlabilit et rappelons
quelques faits.
5.1
5.1.1
Application entre-sortie
Dfinition
IRn
7 xu (T )
86
5.1.2
f
f
(t, xu (t), u(t)) , B(t) =
(t, xu (t), u(t)).
x
u
87
M 1 (s)B(s)v(s)ds
f
d
(1 x)(t) =
(t, x(t), u(t))1 x(t),
dt
x
f
(t, x(t), u(t)) et M (0) = In . On
cest--dire M (t) = A(t)M (t) avec A(t) =
x
observe que 1 x(T ) est linaire et continu par rapport v() en topologie L .
Cest donc la diffrentielle de Frchet en u() de ET .
Remarque 5.1.1. En gnral ET nest pas dfinie sur L ([0, T ], IRm ) tout entier
cause de phnomnes dexplosion. Par exemple si on considre le systme
scalaire x = x2 + u, x(0) = 0, on voit que pour u = 1 la trajectoire associe
explose en t = 2 , et donc nest pas dfinie sur [0, T ] si T > 2 .
Pour un systme affine
Dfinition 5.1.2. On appelle systme affine contrl un systme de la forme
x(t)
= f0 (x(t)) +
m
X
ui (t)fi (x(t)),
i=1
88
5.2
Contrlabilit
5.2.1
Ensemble accessible
(5.2)
(5.3)
est convexe.
Alors lensemble Acc(x0 , t) est compact et varie continment en t sur [0, T ].
Dmonstration. Notons tout dabord que puisque est compact alors V (t, x) est
galement compact. Montrons la compacit de Acc(x0 , t). Cela revient montrer
que toute suite (xn ) de points de Acc(x0 , t) admet une sous-suite convergente.
Pour tout entier n soit un un contrle reliant x0 xn en temps t, et soit xn ()
la trajectoire correspondante. On a donc
Z t
f (s, xn (s), un (s))ds.
xn = xn (t) = x0 +
0
x( ) = x0 +
g(s)ds,
5.2. CONTRLABILIT
89
ce qui dfinit une application x() absolument continue sur [0, t]. De plus on a,
pour tout s [0, t],
lim xn (s) = x(s),
n+
i.e. la suite de fonctions (xn ())nIN converge simplement vers x(). Le but est de
montrer que la trajectoire x() est associe un contrle u valeurs dans , ce
qui revient montrer que pour presque tout s [0, t] on a g(s) = f (s, x(s), u(s)).
Pour cela, dfinissons, pour tout entier n et presque tout s [0, t],
hn (s) = f (s, x(s), un (s)),
et introduisons lensemble
V = {h() L2 ([0, t], IRn ) | h(s) V (s, x(s)) pour presque tout s [0, t]},
de sorte que hn V pour tout entier n. Pour tout (t, x) lensemble V (t, x) est
compact convexe, et, en utilisant le fait que de toute suite convergeant fortement
dans L2 on peut extraire une sous-suite convergeant presque partout, on montre
que V est convexe ferm dans L2 ([0, t], IRn ) pour la topologie forte ; donc il est
galement ferm dans L2 ([0, t], IRn ) muni de la topologie faible (voir [19]).
Or, similairement (gn ), la suite de fonctions (hn ) est borne dans L2 , et
donc sous-suite prs converge en topologie faible vers une fonction h, qui
appartient ncessairement V puisque ce sous-ensemble est ferm faible.
Enfin, montrons que g = h presque partout. Pour cela, crivons, pour toute
fonction L2 ([0, t], IR),
Z
(s)gn (s)ds =
(s)hn (s)ds +
(5.4)
(s)g(s)ds =
(s)h(s)ds,
pour toute fonction L2 ([0, t], IR), et par consquent g = h presque partout
sur [0, t].
90
t1
0 < c < 1, la trajectoire associe est xc (t) = c tan ct, donc est bien dfinie
sur [0, T ], mais lorsque c tend vers 1 alors xc (T ) tend vers +. Par ailleurs il est
facile de voir que sur cet exemple lensemble des contrles admissibles, valeurs
dans [1, 1], est lensemble des fonctions mesurables telles que u(t) [1, 1[.
Remarque 5.2.2. De mme, lhypothse de convexit (5.3) est ncessaire (voir
[52, Exemple 2 page 244]).
5.2.2
Rsultats de contrlabilit
Dfinition 5.2.2. Le systme (4.28) est dit contrlable (en temps quelconque)
depuis x0 si
[
IRn =
Acc(x0 , T ).
T >0
5.2. CONTRLABILIT
91
1 2 1
M + m(22 + 22 ), Ep = mg2 .
2
2
92
on obtient
do
(M + m) + ml cos ml 2 sin = u,
ml cos + ml2 mgl sin = 0,
=
,
M + m sin2
=
.
M + m sin2
0 1
0
0
0
0 0
1
mg
0
M
, et B = M .
A=
0 0
0
0
1
1
lM
0 0 (M+m)g
0
lM
m
X
ui fi (x) , x(0) = x0 .
i=1
On suppose que lalgbre de Lie engendre par les champs de vecteurs fi est de
dimension n. Alors le systme est contrlable.
Dmonstration. Pour simplifier, faisons la dmonstration dans le cas m = 2 et
n = 3. On suppose que rg(f1 , f2 , [f1 , f2 ])(x) = 3, x IRn . Soit IR. On
considre lapplication
: (t1 , t2 , t3 ) 7 (exp f1 exp t3 f2 exp f1 )(exp t2 f2 )(exp t1 f1 )(x0 ).
On a (0) = x0 . Montrons que pour 6= 0 assez petit, est une immersion
en 0. En utilisant la formule de Campbell-Hausdorff, on obtient
(t1 , t2 , t3 ) = exp(t1 f1 + (t2 + t3 )f2 + t3 [f1 , f2 ] + . . .),
do
(0) = f1 (x0 ),
(0) = f2 (x0 ),
(0) = f2 (x0 ) + [f1 , f2 ](x0 ) + o().
t1
t2
t3
Par hypothse, les champs de vecteurs f1 , f2 , [f1 , f2 ] sont linairement indpendants, donc la jacobienne de est de rang 3 en 0. Le thorme dinversion
locale et un argument de connexit nous permettent de conclure.
93
5.3
5.3.1
Contrles singuliers
Dfinition
Dfinition 5.3.1. Soit u un contrle dfini sur [0, T ] tel que sa trajectoire
associe xu issue de x(0) = x0 est dfinie sur [0, T ]. On dit que le contrle u (ou
la trajectoire xu ) est singulier sur [0, T ] si la diffrentielle de Frchet dET (u) de
lapplication entre-sortie au point u nest pas surjective. Sinon on dit quil est
rgulier.
Dans les rsultats ci-dessous on suppose que les contrles considrs sont
lintrieur de lensemble des contrles admissibles, sans quoi largument de
fonctions implicites classique ne pourrait sappliquer cause de lexistence dun
bord.
Proposition 5.3.1. Soient x0 et T fixs. Si u est un contrle rgulier, alors
ET est ouverte dans un voisinage de u.
Dmonstration. Par hypothse, il existe n contrles vi tels que dET (u).vi = ei
o (e1 , . . . , en ) est la base canonique de IRn . On considre lapplication
(1 , . . . , n ) IRn 7 ET (u +
n
X
i vi ).
i=1
94
Remarque 5.3.1. Le systme peut tre localement contrlable le long dune trajectoire singulire. Cest le cas du systme scalaire x = u3 , o le contrle u = 0
est singulier.
5.3.2
Montrons quune trajectoire singulire peut se paramtrer comme la projection dune solution dun systme hamiltonien contraint. Considrons de nouveau
le systme de contrle gnral
x(t)
(5.5)
x(t)
(5.6)
(5.7)
(5.8)
95
Dmonstration. Par dfinition, le couple (x, u) est singulier sur [0, T ] si dET (u)
nest pas surjective. Donc il existe un vecteur ligne IRn \ {0} tel que pour
tout contrle v dans L on ait
.dET (u).v =
M (T )M 1 (s)B(s)v(s)ds = 0
Par consquent
M (T )M 1 (s)B(s) = 0 p.p. sur [0,T].
On pose p(t) = M (T )M 1 (t) pour tout t [0, T ]. Cest un vecteur ligne de
IRn \ {0}, et p(T ) = . On a par drivation
p(t)
= p(t)
f
(t, x(t), u(t)).
x
H
(t, x(t), p(t), u(t)),
p
et
p(t)
f
H
(t, x(t), u(t)) =
(t, x(t), p(t), u(t)).
x
x
f
(t, x(t), u(t)).
u
M (s)1 B(s)v(s)ds,
Remarque 5.3.4. La proposition 5.3.4 et les remarques prcdentes sont les prmisses du principe du maximum de Pontryagin.
96
5.3.3
Chapitre 6
Contrle optimal
6.1
Prsentation du problme
6.2
6.2.1
97
98
f (t, x, u)
f 0 (t, x, u) +
u , > 0
(6.2)
est convexe.
Alors il existe un contrle optimal u sur [0, t(u)] tel que la trajectoire associe
joint M0 M1 en temps t(u) et en cot minimal.
Bien entendu pour un problme de contrle optimal temps final fix on
impose t(u) = T (et en particulier on suppose que la cible M1 est accessible
depuis M0 en temps T ).
La preuve de ce thorme est semblable celle du thorme 5.2.1. La prise en
compte de contraintes sur ltat ne pose aucun problme. Notons que lhypothse
(6.2) implique la convexit de lensemble des vecteurs vitesses, et aussi (terme
> 0) une proprit de convexit dpigraphe. Nous donnons tout de mme
cette preuve ci-dessous.
Remarque 6.2.1. On peut montrer un rsultat plus gnral o lensemble de
dpart M0 et la cible M1 dpendent du temps t, ainsi que le domaine des
contraintes sur le contrle (voir [52]).
Dmonstration. Soit linfimum des cots C(u) sur lensemble des contrles admissibles u L ([0, t(u)], ) engendrant des trajectoires telles que x(0) M0 ,
x(t(u)) M1 et vrifiant les contraintes sur ltat c1 (x()) 6 0, . . . , cr (x()) 6 0.
Considrons une suite minimisante de trajectoires xn () associes des contrles
un , cest--dire une suite de trajectoires vrifiant ces proprits et telle que
C(un ) quand n +. Pour tout n on note
Fn (t) =
Fn (t)
Fn0 (t)
pour presque tout t [0, t(un )]. Daprs les hypothses, la suite de fonctions
(Fn ())nIN (tendues par 0 sur ]tn (u), b]) est borne dans L ([0, b], IRn ), et par
consquent sous-suite prs elle converge vers une fonction
F ()
F () =
F 0 ()
pour la topologie faible toile de L ([0, b], IRn+1 ). A sous-suite prs de mme la
suite (tn (un ))nIN converge vers T > 0, et on a F (t) = 0 pour t ]T, b]. Enfin,
99
ce qui construit une fonction x() absolument continue sur [0, T ]. De plus on a,
pour tout t [0, T ],
lim xn (t) = x(t),
n+
i.e. la suite de fonctions (xn ())nIN converge simplement vers x(). Comme dans
la preuve du thorme 5.2.1, le but est de montrer que la trajectoire x() est
associe un contrle u valeurs dans , et que de plus ce contrle u est optimal
pour le problme considr.
Pour tout entier n et presque tout t [0, t(un )], on pose
f (t, x(t), un (t))
hn (t) =
.
f 0 (t, x(t), un (t))
n sur [0, T ] par
Si T > t(un ), on tend h
n (t) = f0(t, x(t), v) ,
h
f (t, x(t), v)
o v est quelconque. Par ailleurs, on dfinit
Comme est compact, > 0 est bien dfini. Pour tout (t, x) IR1+n , on
modifie alors lgrement la dfinition de V (t, x) pour le rendre compact (tout
en le gardant convexe), en posant
f (t, x, u)
0
V (t, x) =
u , > 0, |f (t, x, u) + | 6 .
f 0 (t, x, u) +
On dfinit alors
L2 ([0, T ], IRn+1 ) | h(t) V (t, x(t)) pour presque tout t [0, T ]}.
V = {h()
Par construction, on a
hn V pour tout entier n.
Lemme 6.2.2. Lensemble V est convexe ferm fort dans L2 ([0, T ], IRn+1 ).
et
Preuve du lemme 6.2.2. Montrons que V est convexe. Soient r1 , r2 V,
[0, 1]. Par dfinition, pour presque tout t [0, T ] on a r1 (t) V (t, x(t))
et r2 (t) V (t, x(t)), or V (t, x(t)) est convexe donc
r1 (t) + (1 )
r2 (t)
100
Lensemble V est donc aussi convexe ferm faible dans L2 ([0, T ], IRn+1 ). La
n )nIN tant borne dans L2 ([0, T ], IRn+1 ), sous-suite prs
suite de fonctions (h
qui appartient V puisque ce
elle converge faiblement vers une fonction h,
sous-ensemble est ferm faible.
presque partout. Pour cela, crivons, pour toute foncMontrons que F = h
2
tion L ([0, T ]),
Z T
Z T
Z T
n (t) dt +
(t)Fn (t) dt =
(t)h
(t) Fn (t) hn (t) dt.
(6.3)
0
La suite de fonctions (xn ())nIN converge simplement vers x(), donc daprs le
thorme de convergence domine,
Z T
n (t) dt 0.
(t) Fn (t) h
n+
(t)F (t) dt =
(t)h(t)
0
presque partout
pour toute fonction L ([0, T ]), et par consquent F = h
sur [0, T ].
et donc pour presque tout t [0, T ] il existe u(t)
En particulier, F V,
et (t) > 0 tels que
f (t, x(t), u(t))
F (t) =
.
f 0 (t, x(t), u(t)) + (t)
2
101
6.2.2
m
X
(6.4)
i=1
avec le cot
CT (u) =
m
T X
u2i (t)dt,
(6.5)
i=1
Les
(n)
ui
i=1
(nk )kIN | ui
k+
vi L2 ([0, T ], IRm ).
Il est par ailleurs facile de voir que la suite x (nk ) est borne dans L2 ([0, T ], IRn ),
et par consquent x(nk ) est borne dans H 1 ([0, T ], IRn ), et par rflexivit,
H1
uniformment
et que x(T ) = x1 .
i=1
102
Chapitre 7
Principe du Maximum de
Pontryagin
Dans cette section on donne une version gnrale du principe du maximum
de Pontryagin. Ce thorme est difficile dmontrer. En revanche lorsquil ny
a pas de contrainte sur le contrle, la preuve est simple, et on arrive au principe
du maximum dit faible. Cest cette version plus simple que nous allons dabord
nous intresser. Puis nous passerons au cas gnral.
7.1
7.1.1
(7.1)
o les contrles u() U sont dfinis sur [0, T ] et les trajectoires associes doivent
vrifier x(0) = x0 et x(T ) = x1 ; le problme est de minimiser un cot de la forme
C(u) =
(7.2)
o T est fix.
Associons au systme (7.1) le systme augment suivant
x(t)
(7.3)
104
et notons x
= (x, x0 ), f = (f, f 0 ). Le problme revient donc chercher une
trajectoire solution de (7.3) joignant les points x0 = (x0 , 0) et x1 = (x1 , x0 (T )),
et minimisant la dernire coordonne x0 (T ).
Lensemble des tats accessibles partir de x
0 pour le systme (7.3) est
x0 , T ) = S x
(T, x
0 , u).
Acc(
u()
dans Acc(
x0 , T ) contenant un point y(T ) solution du systme (7.3) et tel que lon
ait y 0 (T ) < x0 (T ), ce qui contredirait loptimalit du contrle u. Par consquent,
daprs la proposition 5.3.1, le contrle u est un contrle singulier pour le systme
augment (7.3) sur [0, T ].
x0
x0 (T )
1111111111111111111111111111111
0000000000000000000000000000000
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
x0 , T )
Acc(
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
0000000000000000000000000000000
1111111111111111111111111111111
x1
H
H
x
(t) =
(t, x
(t), p(t), u(t)), p (t) =
(t, x
(t), p(t), u(t)),
p
x
H
(t, x(t), p(t), u(t)) = 0
u
x
o H(t,
, p, u) = h
p, f(t, x, u)i.
(7.4)
(7.5)
f
x 0
0
0
(p,
p ) = (p, p )
,
f 0
0
x
H
f
f 0
=0=p
+ p0
.
u
u
u
Finalement on a obtenu lnonc suivant.
Thorme 7.1.2 (Principe du maximum faible). Si le contrle u associ au
systme de contrle (7.1) est optimal pour le cot (7.2), alors il existe une application p() absolument continue sur [0, T ], valeurs dans IRn , appele vecteur
adjoint, et un rel p0 6 0, tels que le couple (p(), p0 ) est non trivial, et les
quations suivantes sont vrifies pour presque tout t [0, T ]
H
(t, x(t), p(t), p0 , u(t)),
p
H
p(t)
=
(t, x(t), p(t), p0 , u(t)),
x
H
(t, x(t), p(t), p0 , u(t)) = 0,
u
x(t)
(7.6)
(7.7)
(7.8)
7.1.2
(7.9)
Le problme de Mayer-Lagrange
(7.10)
et o le temps final t nest pas fix. Soit M1 une varit de IRn . Le problme de
contrle optimal est alors de dterminer une trajectoire solution de
x(t)
106
F E + 0
= 0,
t
t
C
1 F E + 0
= 0.
u
u
1
Posons
C0 (t, u) =
de sorte que
(7.11)
(7.12)
C0
t
= f 0 et
E
t
= f,
C
g
g
= f0 +
+
f,
t
t
x
et
C
C0
g E
=
+
,
u
u
x u
au point (T, u). En reportant dans les relations (7.11) et (7.12) on obtient
f + 0 (f 0 +
g
) = 0,
t
(7.13)
E
C0
+ 0
= 0,
u
u
(7.14)
g
.
x
Pp
i=1
i Fi .
Le raisonnement prcdent est quasiment inchang, sauf que lon raisonne sur
lapplication temps fix T
hT (u) = (F ET (u), CT (u)),
et on obtient de mme la relation (7.14). En revanche on na plus lquation
(7.13).
Ainsi lquation (7.13) traduit-elle le fait que le temps final nest pas fix.
Remarque 7.1.3. La relation (7.14) affirme exactement que le contrle u est singulier sur [0, T ] pour le systme x = f (t, x, u) affect du cot C0 (u). Autrement
dit on sest ramen un problme de Lagrange temps non fix.
En particulier en appliquant la proposition 5.3.4, on obtient, similairement
au paragraphe prcdent, le rsultat suivant.
Thorme 7.1.4 (Principe du Maximum faible, cas de Mayer-Lagrange). Si
le contrle u est optimal sur [0, T ] alors il existe une application p : [0, T ]
IRn \ {0} absolument continue, et un rel p0 6 0, tels que le couple (p(), p0 ) est
non trivial, et
x(t)
H
H
(t, x(t), p(t), p0 , u(t)), p(t)
=
(t, x(t), p(t), p0 , u(t)),
p
x
(7.15)
108
(7.16)
p
X
i=1
i Fi + p0
g
.
x
(7.17)
De plus si le temps final nest pas fix dans le problme de contrle optimal,
et si u est continu au temps T , alors on a au temps final T
H(T, x(T ), p(T ), p0, u(T )) = p0
7.2
g
(T, x(T )).
t
7.2.1
Enonc gnral
(7.18)
109
adjoint, et un rel p0 6 0, tels que le couple (p(), p0 ) est non trivial, et tels que,
pour presque tout t [0, T ],
H
(t, x(t), p(t), p0 , u(t)),
p
H
p(t)
=
(t, x(t), p(t), p0 , u(t)),
x
x(t)
(7.19)
(7.20)
g
(T, x(T )).
t
(7.21)
Si de plus M0 et M1 (ou juste lun des deux ensembles) sont des varits
de IRn ayant des espaces tangents en x(0) M0 et x(T ) M1 , alors le vecteur
adjoint peut tre construit de manire vrifier les conditions de transversalit
aux deux extrmits (ou juste lune des deux)
p(0) Tx(0) M0
(7.22)
g
(T, x(T )) Tx(T ) M1 .
x
(7.23)
et
p(T ) p0
g
(T, x(T )).
t
(7.24)
p
X
i=1
i Fi (x(T )) + p0
g
(T, x(T )).
x
(7.25)
(7.26)
110
Notons que cette galit est alors valable partout sur [0, T ] (en effet cette fonction
de t est lipschitzienne).
Remarque 7.2.4. La convention p0 6 0 conduit au principe du maximum. La
convention p0 > 0 conduirait au principe du minimum, i.e. la condition (7.20)
serait une condition de minimum.
Remarque 7.2.5. Dans le cas o = IRm , i.e. lorsquil ny a pas de contrainte
sur le contrle, la condition de maximum (7.20) devient H
u = 0, et on retrouve
le principe du maximum faible (thorme 7.1.2).
Dfinition 7.2.1. Une extrmale du problme de contrle optimal est un quadruplet (x(), p(), p0 , u()) solution des quations (7.19) et (7.20). Si p0 = 0, on
dit que lextrmale est anormale, et si p0 6= 0 lextrmale est dite normale.
Remarque 7.2.6. Lorsque = IRm , i.e. lorsquil ny a pas de contrainte sur le
contrle, alors la trajectoire x(), associe au contrle u(), est une trajectoire
singulire du systme (7.1), si et seulement si elle est projection dune extrmale
anormale (x(), p(), 0, u()).
Ceci rsulte en effet de la caractrisation hamiltonienne des trajectoires singulires, cf proposition 5.3.4. Remarquons que puisque p0 = 0, ces trajectoires
ne dpendent pas du cot. Elles sont intrinsques au systme. Le fait quelles
puissent pourtant tre optimales sexplique de la manire suivante : en gnral,
une trajectoire singulire a une proprit de rigidit, i.e. cest la seule trajectoire
joignant ses extrmits, et donc en particulier elle est optimale, ceci indpendamment du critre doptimisation choisi.
Ce lien entre extrmales anormales et trajectoires singulires, pour = IRm ,
montre bien la difficult lie lexistence ventuelle de telles trajectoires.
Dfinition 7.2.2. Les conditions (7.22) et (7.23) sont appeles conditions de
transversalit sur le vecteur adjoint. La condition (7.21) est appele condition de
transversalit sur le Hamiltonien. Elles sont ici crites de manire trs gnrale,
et dans les deux paragraphes suivants nous allons les rcrire dans des cas plus
simples.
Remarque 7.2.7. Le problme important du temps minimal correspond f 0 = 1
et g = 0, ou bien f 0 = 0 et g(t, x) = t. Dans les deux cas les conditions de
transversalit obtenues sont bien les mmes.
Remarque 7.2.8. Il existe des versions plus gnrales du principe du maximum,
pour des dynamiques non lisses ou hybrides (voir par exemple [22, 69, 70] et leurs
rfrences, voir aussi plus loin pour le principe du maximum avec contraintes
sur ltat).
7.2.2
111
Conditions de transversalit
(7.27)
g
(T, x(T )),
x
(7.28)
(7.30)
112
7.2.3
Principe du maximum avec contrainte sur ltat. Le principe du maximum tel quil vient dtre nonc prend en compte des contraintes sur le contrle,
mais ne prend pas en compte dventuelles contraintes sur ltat. Ce problme
est en effet beaucoup plus difficile. Il existe plusieurs versions du principe du
maximum avec contraintes sur ltat (voir ce sujet [21, 22, 36, 42, 55, 56]).
La thorie est cependant beaucoup plus complique, et nous ne labordons pas
113
p Z T
X
ci
H
dt
di ,
x
x
t
i=1
o les i sont des mesures positives ou nulles dont le support est contenu dans
{t [0, T ] | ci (x(t)) = 0}.
Dans la section 7.4, on traite compltement un exemple (simplifi) de problme de contrle optimal o apparaissent des contraintes sur ltat (problme
de rentre atmosphrique dune navette). Cependant on arrive viter lusage
dun principe du maximum avec contraintes.
Mthode de pnalisation. Un moyen simple de manipuler des contraintes
sur ltat est de rsoudre un problme de contrle optimal modifi, o, comme
dans la thorie LQ, on pondre cette contrainte, de manire la forcer tre
vrifie. Le principe gnral de cette mthode est le suivant. Supposons quon
veuille imposer ltat dappartenir un sous-ensemble C IRn . Donnons-nous
une fonction g sur IRn , nulle sur C et strictement positive ailleurs (il faut tre
capable de construire une telle fonction). Alors, en ajoutant au cot C(t, u) le
RT
scalaire 0 g(x(t))dt, o > 0 est un poids que lon peut choisir assez grand,
on espre que la rsolution de ce problme de contrle optimal modifi va forcer
la trajectoire rester dans lensemble C. En effet si x(t) sort de lensemble C,
et si est grand, alors le cot correspondant est grand, et probablement la
trajectoire ne sera pas optimale.
La justification thorique de ce procd rside dans la proposition gnrale
suivante.
Proposition 7.2.2. Soit (E, d) un espace mtrique, C un sous-ensemble de
E, et f une fonction k-lipschitzienne sur E. Pour tout x E, posons g(x) =
d(x, C). Supposons que la fonction f restreinte C atteint son minimum en
x0 C, i.e.
f (x0 ) = min f (x).
xC
114
6 f (x0 ) + kd(x0 , C) +
7.3
7.3.1
Exemples et exercices
Contrle optimal dun ressort non linaire
= y(t),
y(t)
= x(t) 2x(t)3 + u(t),
o on autorise comme contrles toutes les fonctions u(t) continues par morceaux
telles que |u(t)| 6 1. Lobjectif est damener le ressort dune position initiale
quelconque (x0 , y0 = x 0 ) sa position dquilibre (0, 0) en temps minimal t .
Application du Principe du Maximum
Le Hamiltonien du systme prcdent scrit
H(x, p, u) = px y + py (x 2x3 + u),
et si (x, p, u) est une extrmale alors on doit avoir
p x =
H
H
= py (1 + 6x2 ), et p y =
= px .
x
y
115
Notons que puisque le vecteur adjoint (px , py ) doit tre non trivial, py ne peut
sannuler sur un intervalle (sinon on aurait galement px = p y = 0). Par
ailleurs la condition la condition de maximisation nous donne
py u = max py v.
|v|61
x(t)
= y(t)
y(t)
= x(t) + 2x(t)3 signe(py (t))
(7.31)
p y (t) = px (t)
:=
:=
:=
:=
:=
:=
D(x)(t)=-y(t) :
D(y)(t)=x(t)+2*x(t)^3-signum(z(t)) :
D(z)(t)=w(t) :
D(w)(t)=-z(t)*(1+6*x(t)^2) :
eq1,eq2,eq3,eq4 :
[x(0)=0,y(0)=0,z(0)=cos(1),w(0)=sin(1)] :
116
ic2 := [x(0)=0,y(0)=0,z(0)=cos(2.5),w(0)=sin(2.5)] :
ic := ic1,ic2 :
> DEplot([sys], [x(t),y(t),z(t),w(t)], t=0..10, [ic],
stepsize=0.05, scene=[x(t),y(t)],linecolor=[blue,red]);
8
6
y(t) 4
2
2
1 x(t)
2
4
6
Figure 7.2
Deuxime tape. On pose T = 10, N = 100, h = T /N et tn = nh, n = 0 . . . N .
Pour = 1, puis pour = 2.5, on crit une boucle qui calcule le plus petit entier
k tel que
x(tk )x(tk+1 ) 6 0 et |y(tk+1 ) 6| < 0.5.
On affiche alors les valeurs de la solution aux temps tk et tk+1 .
> sol1 := dsolve({sys,x(0)=0,y(0)=0,z(0)=cos(1),w(0)=sin(1)},
{x(t),y(t),z(t),w(t)}, type=numeric) :
T:=10.0 : N:=100 : h:=T/N :
xk:=0 :
for k from 1 to N do
solk := sol1(k*h) :
xknew := subs(solk,x(t)) :
yknew := subs(solk,y(t)) :
if xk*xknew<=0 and abs(yknew-6)<0.5 then break fi:
xk := xknew :
od: sol1(k*h);
Troisime tape. On crit une procdure temps :=proc(alpha,eps) qui calcule
une approximation du temps t tel que x(t) = 0 et |y(t) 6| < 0.5. Pour cela on
localise tout dabord ce temps comme ltape prcdente, puis on effectue une
dichotomie sur t entre tk et tk+1 pour calculer le temps o x(t) sannule eps
prs (cest--dire |x(t)| < eps).
117
118
ta:=temps(a,eps) : tb:=temps(b,eps) :
ya:=subs(sola(ta),y(t)) : yb:=subs(solb(tb),y(t)) :
while abs(yb-ya)>eps do
m:=evalf((a+b)/2) :
solm := dsolve({sys,x(0)=0,y(0)=0,z(0)=cos(m),w(0)=sin(m)},
{x(t),y(t),z(t),w(t)}, type=numeric) :
tm:=temps(m,eps) :
ym := subs(solm(tm),y(t)) :
if (ym-6)*(ya-6)<0 then b:=m : yb:=ym :
else a:=m : ya:=ym :
fi:
od:
RETURN(a);
end:
Cinquime tape. On calcule une approximation de pour eps = 0.01, et on
trace dans le plan de phase la solution obtenue (voir figure 7.3).
> dicho(0.01);
2.136718750
> temps(2.136718750,0.01);
8.737500000
> DEplot([sys], [x(t),y(t),z(t),w(t)],t=0..8.7375,
[[x(0)=0,y(0)=0,z(0)=cos(2.136718750),w(0)=sin(2.136718750)]],
stepsize=0.05, scene=[x(t),y(t)],linecolor=[blue]);
6
4
y(t)
2
2
1x(t)
2
4
Figure 7.3
Le temps minimal pour amener le ressort de la position (0, 6) lquilibre
(0, 0) est donc de 8.7375 s.
Remarque 7.3.1. Considrons le contrle
u(t) = signe (y(t) 0.1)/1.33.
119
7.3.2
Exercices
= u(t), y(t)
= u(t)2 ,
o x(t) reprsente la vitesse et y(t) est inversement proportionnelle la masse
de lengin. Le contrle u(t) est la pousse et vrifie la contrainte |u(t)| 6 1.
Rsoudre le problme du temps minimal pour atteindre le point final (x1 , y1 ),
en partant de lorigine.
Indications : Le Hamiltonien est H = px u + py u2 + p0 , o px et py
sont constantes. Quelle que soit la valeur de p0 , il faut maximiser
px u + py u2 , pour 1 6 u 6 1. Montrer que, selon les signes de px et
px
}.
py , le contrle u est constant, et prend ses valeurs dans {1, 1, 2p
y
tf
dt =
0
y1
dt
dy =
dy
y1
0
dy
=
u2
y1
dy = y1 .
120
px v
,
1 px c(y)
tf
121
tf
h(t)
= u(t) t, h(0) = 0,
o u(t) est le contrle. Quelle est la loi optimale permettant datteindre lobjectif
Rt
en minimisant 0 f u(t)2 dt, le temps final tf ntant pas fix ?
q
Indications : on trouve u(t) = 2 2h3 1 .
Exercice 7.3.5. Le mouvement dun missile, dcrit comme une particule de
masse m soumise la gravitation et la rsistance de lair, est donn par les
quations
x 1 = x3 , x 2 = x4 , x 3 = cos u, x 4 = sin u,
c1 + c2 t
,
c3 + c4 t
o c1 , c2 , c3 , c4 IR.
Indications : les quations donnent tan u =
avec p1 , p2 constantes.
p3 c
p4 c ,
p 3 = p1 , p 4 = p2 ,
ln u(t)eat dt.
122
n
X
ci xi (T ).
i=1
123
b
1
ln(1 ).
b
a
Pour t < t1 , on a p1 = p1 (ab) < 0, donc p1 est encore dcroissant.
Il ny a donc pas dautre commutation.
Conclusion : la politique optimale est u(t) = 1 sur [0, t1 ], puis u(t) =
0.
t1 = T +
124
(p1 p2 )x1
,
2(p1 3p2 )x2
(p1 p2 )2 x1
(p1 p2 )2 x21
, p 2 =
.
2(p1 3p2 )x2
4(p1 3p2 )x22
x(0) = x0 ,
125
Exercice 7.3.12 (Contrle optimal dune pidmie). Considrons une population touche par une pidmie que lon cherche enrayer par une vaccination.
On note
I(t), le nombre dindividus infectieux, qui peuvent contaminer les autres ;
S(t), le nombre dindividus non infectieux, mais contaminables ;
R(t), le nombre dindividus infects, et disparus, ou isols du reste de la
population.
Soit r > 0 le taux dinfection, > 0 le taux de disparition, et u(t) le taux de
vaccination. Le contrle u(t) vrifie la contrainte 0 6 u(t) 6 a. La modlisation
est
S(t)
= rS(t)I(t) + u(t),
= rS(t)I(t) I(t) u(t),
I(t)
R(t)
= I(t),
et le but est de dterminer une loi optimale de vaccination, de manire minimiser, en un temps T fix, le cot
C(u) = I(T ) +
u(t)2 dt,
a
si pS (t) pI (t) > a.
Au temps final, pS (T ) pI (T ) = /2, donc si 2a < alors u(t) = a
dans un voisinage du temps final.
Exercice 7.3.13 (Contrle optimal dun procd de fermentation). Considrons le procd de fermentation
x(t)
126
(a) Ecrire le Hamiltonien du problme de contrle optimal et les quations des extrmales.
(b) Ecrire les conditions de transversalit sur le vecteur adjoint et sur le
temps. Montrer que py (tf ) 6= 0.
3. (a) Pour tout t [0, tf ], soit (t) = px (t)(1 x(t)) py (t)y(t). Calculer
(t) et (t). Montrer que est strictement monotone.
(b) En dduire que les contrles optimaux sont bang-bang avec au plus
une commutation, et prciser leur expression.
(c) Montrer que y(t
f ) > 0.
(d) En dduire quil existe > 0 tel que u(t) = 0, pour presque tout
t [tf , tf ].
(e) Conclure sur la structure du contrle optimal.
Corrig :
1. u > 0, donc x(t)
127
En effet sinon, y serait strictement dcroissante sur un intervalle [tf , tf ], et puisque y(0) = 0, daprs le thorme des valeurs intermdiaires, il existerait t1 < tf tel
que y(t1 ) = y1 , ce qui contredit le fait que tf est le temps
minimal.
(d) Montrons que py (tf ) > 0. Par labsurde, si py (tf ) < 0, alors
(tf ) > 0, et donc par continuit, (t) > 0 la fin, donc
u = M . Donc y(t
f ) = x(tf ) u(tf )y(tf ) = x(tf ) M y1 <
1 M y1 < 0 (par hypothse), ce qui contredit la question
prcdente.
Donc py (tf ) > 0, et (t) < 0 la fin, i.e., u = 0 la fin.
(e) Si u ne commute pas alors u = 0 sur tout [0, tf ], donc on
rsout x = x et y = x, ce qui conduit y(t) = x0 (1et ).
En particulier, y(t) < x0 , et donc y1 > x0 est inatteignable.
Donc u commute une fois, et passe de M 0.
Exercice 7.3.14 (Contrle optimal dun avion). Considrons le mouvement
dun avion, modlis par
x(t)
= v(t), v(t)
c
u(t)
g v(t)2 ,
mv(t)
m
h(t)
= v(t), h(0) = 0,
u(t)
g, v(0) = 0,
m(t)
m(t)
= bu(t), m(0) = m0 ,
v(t)
128
sin u2 (t),
r(t)
r(t)2
m(t)
= v(t)(t) + u1 (t) c cos u2 (t),
(t)
r(t)
m(t)
m(t)
= u1 (t),
v(t)
129
c p 0 2
(p ) + 2 (tf t) pm (t).
m(t)
130
m0 m1
,
A
v1 (tf )
.
v2 (tf )
v2 (tc
)2
v1 (tc )2
.
2g(x12 x2 (tc ))
131
qui lui rapporte moins dintrts que largent investi dans des titres financiers.
La banque investit donc une partie du capital dans lachat de titres. Dautre
part, si la rserve dargent est trop faible, la banque doit vendre des titres et
pour cela doit payer une commission un agent de change.
Le problme est de dterminer une politique financire qui ralise un compromis entre quantit dargent disponible et argent investi, tout en maximisant
le gain.
Notations :
x(t) : quantit dargent disponible au temps t.
y(t) : quantit de titres financiers investis au temps t.
d(t) : taux instantan de demande demprunts par des clients
u(t) : taux de vente de titres (u(t) > 0 signifie que la banque vend des titres,
et u(t) < 0 signifie que la banque achte des titres).
r1 (t) : taux dintrt gagn sur largent disponible.
r2 (t) : taux dintrt gagn sur largent investi en titres (on suppose que
r2 (t) > r1 (t), pour tout temps t).
: taux de commission prlev par lagent de change lors de la vente et de
lachat de titres (on suppose que 0 < < 1).
Les quations modlisant le systme sont
x(t)
u + |u|
u + |u|
, u2 = min(u, 0) =
.
2
2
u1 > 0, u2 > 0,
U2 6 u 6 U1 u1 u2 = 0,
U2 6 u 1 u 2 6 U1 .
132
Exercice 7.3.19 (Sujet dexamen : Contrle optimal de la pollution par engrais). On considre lvolution de la quantit de pollution x(t) dans un champ
de crales o lon cherche, par ajout dengrais, optimiser le rendement tout
en minimisant la pollution produite.
Le contrle u(t) est la quantit dengrais ajout. Il vrifie la contrainte
0 6 u(t) 6 3.
On note > 0 le taux de dcroissance naturelle de la pollution. Lvolution de
la pollution x(t) est
x(t)
= u(t) x(t),
avec x(0) = x0 > 0.
Dune part, on cherche minimiser la pollution engendre par lengrais, mais
dautre part, on cherche optimiser le rendement de crales par ajout dengrais.
133
Cependant, un ajout excessif dengrais a aussi un effet nocif sur les plantes, et
donc sur le rendement. On fixe un temps final T , et on cherche minimiser le
critre
Z T
p
x(t)2 (3 u(t))(1 + u(t)) dt.
CT (u) =
0
2. (a) Montrer que x(t) > x0 et , et en particulier x(t) > 0, pour tout
t [0, T ].
(b) En dduire que p(t) < 0, pour tout t [0, T [.
0
1 + 2p(t)2
p(t) +1
p(t) +1
petit.
si p(t) 6 1/ 3,
si p(t) > 1/ 3.
sur [T , T ], pour > 0 assez
x0 t x0 t
e e , pour tout t [0, T ].
4. (a) Montrer que p(t) > p(0) +
x0 2T
(b) En dduire que p(0) 6
e
1 .
x0
> 0.
0
1 + 2p(t)2
p(t) +1
si 0 6 t 6 t1 ,
si t1 < t 6 T.
3
8. Dcrire et discuter, critiquer, les mthodes numriques que lon peut mettre
en oeuvre pour rsoudre numriquement ce problme de contrle optimal.
134
p
(3 u(t))(1 + u(t))), et p =
(b) p(T ) = 0.
2. (a) u(t) > 0, donc x > x, do x(t) > x0 et , et en particulier x(t) > 0, pour tout t [0, T ].
2p
1 + 2 = 0 (avec p < 0) si et seulement si p = 1/ 3.
p +1
Donc, finalement,
u(t) =
0
1 + 2p(t)2
p(t) +1
si p(t) 6 1/ 3,
si p(t) > 1/ 3.
p(t) +1
sur
d
4. (a) Daprs 2.a, on a p(t)
> p(t)+2x0 et , donc et dt
(et p(t)) >
x0
t
t
2x0 e , et en intgrant, p(t) > p(0) + e x0 et ,
pour tout t [0, T ].
(b) p(T ) = 0, donc par lingalit prcdente, p(0) 6 x0 e2T 1 .
x0
2T
1 < 1/ 3, et donc, u(t) = 0 sur un inter e
valle du type [0, t1 ].
135
6. Tant que u = 0, sur [0, t1 ], p(t) est donn par 5.b. En particulier, p(t)
en effet g(t)
7. Comme
t1 < T , et par croissance de la fonction g(t), on a
1/ 3 = g(t1 ) < g(T ), ce qui conduit p(0) > x0 e2T 1
1 eT et donc, daprs 4.b et 5.c,
3
x0 x0 2T
x0 2T
1
max ,
e
1 eT 6 p(0) 6
e
1 .
Exercice 7.3.20 (Sujet dexamen : Commande optimale dun racteur chimique). Un racteur chimique industriel permet de fabriquer un produit partir dun ractif par une raction irrversible du premier ordre avec dgagement
de chaleur. Pour refroidir le racteur, on fait circuler le contenu travers un
changeur thermique ; la chaleur passe ainsi dans le liquide de refroidissement
qui circule dans le circuit secondaire de lchangeur avec un dbit u(t). Aprs
diverses rductions de modle, le systme scrit sous la forme
x 1 (t) = a1 x1 (t) kx1 (t)e
a2
2 (t)
+ r1
a2
2 (t)
+ a6 (u(t) x2 (t)) r2
136
a2
p 1 = p1 (a1 + ke x2 ) p2 a5 ke x2
a2 a2
a2 a2
p 2 = p1 kx1 2 e x2 + p2 (a3 + a6 a5 kx1 2 e x2 )
x2
x2
137
a2
p 1 = p1 (a1 + ke x2 ) p2 a5 ke x2
a2 a2
a2 a2
p 2 = p1 kx1 2 e x2 + p2 (a3 + a6 a5 kx1 2 e x2 ) 2p0 x2
x2
x2
(b) Les conditions de transversalit sur le vecteur adjoint sont
p1 (T ) = p0 et p2 (T ) = 0, avec p0 6 0.
(c) Do il dcoule forcment que p0 6= 0. On pose alors p0 =
1.
(d) La condition de maximisation est
max
M6u6M
(a6 p2 (t)u u2 ).
si 12 a6 p2 (t) < M,
M
1
u(t) =
a6 p2 (t) si | 12 a6 p2 (t)| < M,
2
M
si 12 a6 p2 (t) > M.
138
Exercice 7.3.21 (Sujet dexamen : Troisime phase dun lanceur.). On considre un modle simplifi de la troisime phase dun lanceur, o la Terre est suppose plate et la gravit constante. Dans un repre cartsien, on note (x1 (t), x2 (t))
la position de la fuse au temps t (x2 (t) tant laltitude), et (v1 (t), v2 (t)) sa vitesse. Le contrle u scrit
cos (t)
u(t) = T (t)
,
sin (t)
o T (t) est la pousse et (t) est lincidence. La pousse vrifie la contrainte
0 6 T (t) 6 Tmax , o Tmax > 0 est fix. On note m(t) la masse de la fuse au
temps t. Le modle scrit, sous forme complte ou sous forme vectorielle :
Forme complte :
Forme vectorielle :
x 1 = v1
x = v
u
v =
~g
m
m
= kuk
x 2 = v2
T
cos
v 1 =
m
T
v 2 =
sin g
m
m
= T
0
o et g sont des constantes strictement positives, ~g =
, et avec les notag
x1
v
tions x =
, v = 1 . Les conditions initiales et finales sont :
x2
v2
x1 (0) libre
x2 (0) = x20
v1 (0) = v10
v2 (0) = v20
m(0) = m0
x1 (tf ) libre
x2 (tf ) = x2f
v1 (tf ) = v1f
v2 (tf ) = 0
m(tf ) libre
tf libre
v2
20
. On veut maximiser la masse finale ; autrement
avec v1f > v10 et x2f > x20 + 2g
dit on considre le problme de minimisation
min(m(tf )).
139
1. On note les variables adjointes p = (px1 , px2 , pv1 , pv2 , pm ) et p0 . En notations vectorielles, px = (px1 , px2 ) et pv = (pv1 , pv2 ).
(a) Ecrire le Hamiltonien du problme de contrle optimal et les quations des extrmales (dans les deux systmes de notations).
(b) Ecrire les conditions de transversalit sur le vecteur adjoint.
(c) Dans la suite, on pose = px2 . Montrer que pv2 (t) = t + pv2 (0).
kpv (t)k
m(t)
pv (t)
u(t) = T (t)
kpv (t)k
avec T (t) =
0
Tmax
si (t) < 0,
si (t) > 0.
m
kpv k
mkpv k
6. Dans cette question, on se place dans le cas o T admet une seule commutation, et est du type Tmax puis 0. On note t1 le temps de commutation.
(a) Montrer que v2 (t) = gpv2 (t) T (t)(t), pour tout t [0, tf ].
(b) Montrer que v2 (t1 ) + gt1 = gpv2 (0).
(c) Montrer que tf =
pv2 (0)
.
140
pv2 (0)
pv2 (0)
.
En dduire
< t2 < tf .
pv2 (0)
2 t1 .
pv2 (0)
<
v20
g ,
(f) En utilisant le fait que v2 (tf ) = 0, montrer quen fait ce cas narrive
jamais.
Corrig :
1. (a) On pose f 0 = 0 et g = m. Le Hamiltonien est
1
hpv , ui hpv , ~gi pm kuk
m
T
T
= px1 v1 + px2 v2 + pv1 cos + pv2 ( sin g) pm T
m
m
Les quations des extrmales sont
H = hpx , vi +
Forme complte :
px1 = 0
px2 = 0
Forme vectorielle :
p v1 = px1
p v2 = px2
T
pm = 2 (pv1 cos + pv2 sin )
m
p x = 0
pv = px
1
p m = 2 hpv , ui
m
,
,
kuk
max
m
m
kpv k kuk
uIR2 , kuk6Tmax
do lon dduit que soit kuk = 0, soit
u
kuk
0
Tmax
pv
kpv k
et la pa-
> 0. De plus si
dduit :
si (t) < 0,
si (t) > 0,
141
do la conclusion.
3. On a pm = m12 hpv , ui = mT2 kpv k, donc pm est croissante. Plus
prcisment, pm est strictement croissante lorsque > 0, et
constante lorsque < 0.
4. (a) Par labsurde, si pv = 0 sur un intervalle I, alors en drivant, px = 0, et par unicit de Cauchy, on a pv = px = 0
sur tout [0, tf ]. On en dduit que pm = Cste = p0 .
Par ailleurs, H = 0, donc p0 T = 0 sur [0, tf ]. Comme
x2f > x20 , la pousse T ne peut pas tre identiquement
nulle sur [0, tf ], do p0 = 0. Autrement dit, (p, p0 ) = (0, 0),
ce qui est une contradiction.
(b) On drive = kpmv k pm > 0, et avec les quations des
extrmales, on calcule
hpv , px i
=
,
mkpv k
ce qui a bien un sens puisque pv ne sannule identiquement
sur aucun sous-intervalle, puis
2
2 + kpx k .
= T m
m
kpv k
mkpv k
si px = 0 alors
= 0 donc
(c) Daprs lexpression de ,
= Cste. Rciproquement si est constante, alors = 0,
donc hpv , px i = 0 ; en redrivant, on obtient px = 0, car
p x = 0 et pv = px .
(d) Si = 0 sur un sous-intervalle I, on est dans le cas singulier. Dabord, on en dduit que px = 0, et par ailleurs
pv = Cste. De la relation
0=H =
T
kpv khpv , ~gipm T = T hpv , ~gi = hpv , ~gi
m
2
v20
2g .
2
v20
2g .
142
cas. Si
= 0 on a
> 0 (car px 6= 0), et donc ce point
l o
est un minimum local. Ce raisonnement montre que tout
extrmum de est un minimum local. Par consquent, la
fonction ne peut sannuler ailleurs, sinon on aurait un
autre minimum local, et donc il existerait forcment un
maximum local entre ces deux points : ce qui est absurde
puisque tout extrmum de est un minimum local. On en
dduit donc que admet un unique minimum, est strictement dcroissante avant ce point, et strictement croissante
ensuite.
(g) Daprs les raisonnements prcdents, la pousse optimale
T (t) est :
soit constante gale Tmax (ce qui peut tre impossible
selon les donnes initiales et finales),
soit du type Tmax puis 0 (une seule commutation),
soit du type 0 puis Tmax (une seule commutation),
soit du type Tmax puis 0 puis Tmax (deux commutations).
5. Raisonnons par labsurde : si p0 = 0, alors pm (tf ) = 0. Par
ailleurs, pm est croissante, donc pm (t) 6 0 sur [0, tf ]. Comme pv
ne sannule identiquement sur aucun sous-intervalle, on en dduit que = kpmv k pm > 0 p.p. sur [0, tf ], et donc T = Tmax
sur [0, tf ]. Cela contredit lhypothse dexistence de commutation.
6. (a) En utilisant H = 0, px1 = 0 et px2 = , on a v2 (t) +
T (t)(t) gpv2 (t) = 0.
143
pv2 (0)
.
(0)
2
v20
2g .
2
v20
2g .
Au temps tf , cela
144
v1
2
pm (t1 ) = pm (t2 ). Or, la fonction (t) =
m(t)
pm (t) sannule par dfinition en t1 et t2 . On en dduit que
q
q
p2v1 + (pv2 (0) t1 )2 = p2v1 + (pv2 (0) t2 )2 ,
145
Notons que cela illustre le fait que le graphe de sur linterp (0)
valle [t1 , t2 ] est symtrique par rapport au point t = v2
o le minimum est atteint.
(c) Mme raisonnement quen question 6.a.
(d) En prenant la relation de la question 7.c en t = tf , et en
remarquant que (tf ) > 0 et v2 (tf ) = 0, on en dduit que
p (0)
pv2 (tf ) > 0. Comme pv2 () est affine et sannule en v2 ,
cela impose que < 0 et pv2 (0) < 0.
(e) Sur lintervalle [0, t1 ], on a pv2 (t) < 0, donc v 2 (t) < g, et
donc, en intgrant, v2 (t1 ) < v20 gt1 . Par ailleurs, daprs
p (0)
la relation de la question 7.c., on a v2 (t1 ) = g( v2 t1 ).
p
(0)
2
v20
2g ,
on
2
v20
pour tout t [0, vg20 ]. Notons
en dduit que h(t) 6 h0 + 2g
2
v20
que, par hypothse, h0 + 2g
< hf . On obtient donc une
v20
contradiction si g > tf (puisquon doit avoir h(tf ) = hf ).
p (0)
Si vg20 < tf , vu que par ailleurs vg20 > v2 , la fonction
v2 () est ngative sur lintervalle [ vg20 , tf ] et donc h() est
2
v20
dcroissante sur cet intervalle ; donc h(tf ) 6 h0 + 2g
< hf
= x(t)(a by(t)),
y(t)
= cy(t) + u(t),
x(0) = x0 ,
y(0) = y0 ,
146
= x(t)(1 y(t)),
y(t)
= y(t)(u(t) x(t)),
x(0) = x0 ,
y(0) = y0 ,
147
(a) Dmontrer que, pour tout contrle u, x(t) > 0 et y(t) > 0 sur [0, T ].
(b) On rappelle que, de manire gnrale, un point dquilibre dun systme de contrle x(t)
viii. Montrer quil existe > 0 tel que u(t) = , pour presque tout
t [tf , tf ] (autrement dit, le contrle u vaut la fin).
ix. Supposons que les donnes initiales x0 et y0 sont telles que <
x0 < et y0 = 1. En admettant que la trajectoire optimale admet une seule commutation, donner la structure du contrle optimal et expliquer comment la construire gomtriquement dans
le plan (x, y).
x. En extrapolant la construction prcdente, donner une stratgie
de contrle pour relier nimporte quel point (x0 , y0 ) du quadrant
au point (, 1), et dcrire comment mettre en oeuvre numriquement cette stratgie.
Corrig :
1. (a) Comme u(t) > 0, on a y(t)
> cy(t), donc y(t) > y0 ect >
0. Concernant x(t), on raisonne par labsurde : sil existe
t1 [0, T ] tel que x(t1 ) = 0, alors x(t) = 0 pour tout t, par
unicit de Cauchy ; cela est absurde car x(0) = x0 > 0.
148
d
dt x(t)px (t) = x(t)px (t)(aby(t))x(t)px (t)(aby(t)) =
donc x(t)px (t) = Cste = x(T ) car px (T ) = p0 = 1.
0,
ii. H(tf ) = 0.
149
150
d
dt F (x(t), y(t))
151
F
q
+ ,
kqk3 m
152
F
,
ve
p =
e x
e y
L =
m
s
p3 Tmax
2
uor
W
m
r
r
p ex + cos L
p
Tmax
Tmax
+ cos L
uor +
sin L
ur
W
m
m
r
r
Tmax
Tmax
p ey + sin L
p
+ sin L
uor
cos L
ur
W
m
m
r
W2
p
p
Tmax |u|
p
o W = 1 + ex cos L + ey sin L, o |u| = u2or + u2o , et o Tmax est la valeur
maximale du module de pousse. Le problme consiste donc, en respectant la
contrainte u2r + u2or 6 1, minimiser le temps de transfert dune orbite basse
dfinie par p(0) = 11625 km, ex (0) = 0.75, ey (0) = 0, L(0) = , une orbite gostationnaire dfinie par p(tf ) = 42165 km, ex (tf ) = 0, ey (tf ) = 0, la
longitude finale tant libre.
Questions.
1. Pour des raisons numriques videntes il est prfrable de normaliser
r la vap
riable p en posant p =
et
. En introduisant les constantes =
p(tf )
pf
r
pf
=
Tmax , montrer que les quations scrivent
q
m
153
avec q = (
p, ex , ey , l) et o les champs de vecteurs F0 , Fr et For sont dfinis par
p
p3
0
0
m W
e
+
cos
L
0
x
p sin L
+ cos L
p
0
F0 =
W
, For = m
, Fr =
p cos L
W2
e
+
sin
L
y
m
p
+ sin L
p
0
m
W
p3/2
0
et crire le Hamiltonien de ce systme sous la forme
h, For i
uor = p
.
h, Fr i2 + h, For i2
3. En remarquant que lon peut oublier la variable adjoint m , crire les quations du systme extrmal donnes par le principe du maximum (faire les calculs
laide de Maple).
4 (application numrique). En utilisant une mthode de tir multiple, dterminer numriquement un vecteur adjoint initial (p(0), ex (0), ey (0), L (0))
pour lequel la trajectoire extrmale vrifie les conditions initiales et finales imposes.
Comme donnes numriques, on prendra
m0 = 1500 kg, = 0.05112 km1 .s, = 398600.47 km3 .s2 ,
et on choisira une valeur Tmax de plus en plus petite (problme faible pousse).
Par exemple on pourra prendre successivement
Tmax = 60, 24, 12, 9, 6, 3, 2, 1.4, 1, 0.7, 0.5, 0.3 N.
5. Pour Tmax = 0.3, on se propose de stabiliser le systme autour de la trajectoire construite dans la question prcdente. Pour tenir compte de la contrainte
sur le contrle, on modifie la trajectoire obtenue selon la nouvelle contrainte
|u| 6 1 , o est un petit paramtre. On choisit par exemple = 0.1.
5.1. Modifier la trajectoire prcdente en tenant compte de cette nouvelle
contrainte sur le contrle.
5.2. Linariser le systme le long de la nouvelle trajectoire obtenue, et proposer une mthode de stabilisation LQ. Effectuer les simulations numriques.
154
7.4
7.4.1
Prsentation du projet
Ce projet a t pos par le CNES, et est motiv par limportance croissante de
la thorie du contrle, et du contrle optimal, dans les techniques darocapture :
problmes de guidage, transferts dorbites aroassists,
dveloppement de lanceurs de satellites rcuprables (lenjeu financier trs
important),
problmes de rentre atmosphrique : cest lobjet du fameux projet Mars
Sample Return dvelopp par le CNES, qui consiste envoyer une navette
spatiale habite vers la plante Mars, dans le but de ramener sur Terre
des chantillons martiens.
En gros, le rle de larc atmosphrique est
de rduire suffisamment lnergie cintique, par frottement dans latmosphre ;
damener lengin spatial dune position initiale prcise une cible donne ;
de plus il faut prendre en compte certaines contraintes sur ltat : contrainte
sur le flux thermique (car il y a des gens lintrieur de la navette !),
sur lacclration normale (confort de vol), et sur la pression dynamique
(contrainte technique de structure),
enfin, on cherche de plus minimiser un critre doptimisation : le flux
thermique total de la navette.
Une trajectoire optimale tant ainsi dtermine, il faut ensuite stabiliser la
navette autour de cette trajectoire, de faon prendre en compte de possibles
perturbations.
156
K 6
eL
]
el
er
>
e
6r
G
L
6
- J
el 9
< 0
<0
~ eL
/
I
~v
(i)
(ii)
Figure 7.5
(7.32)
(7.33)
(7.34)
g0
.
r2
(7.35)
r
+ 2
v
cos
(7.36)
o ltat est q = (r, v, , l, L, ) et le contrle est langle de gte .
Dans la suite on pose r = rT + h, o rT est le rayon de la Terre, et h est
laltitude de la navette.
Le problme de contrle optimal
Le problme est damener lengin spatial dune varit initiale M0 une
varit finale M1 , o le temps terminal tf est libre, et les conditions aux limites
sont donnes dans la table 7.1.
158
altitude (h)
vitesse (v)
angle de vol ()
latitude (L)
longitude (l)
azimut ()
Conditions initiales
119.82 km
7404.95 m/s
-1.84 deg
0
libre ou fixe 116.59 deg
libre
Conditions finales
15 km
445 m/s
libre
10.99 deg
166.48 deg
libre
(7.37)
= Cq v 3 6 max ,
Contrainte sur lacclration normale
n = n0 ()v 2 6 nmax ,
(7.38)
(7.39)
Elles sont reprsentes sur la figure 7.6 dans le domaine de vol, en fonction
2
D
de lacclration d = 12 SC
m v et de v.
d
pression
dynamique
acceleration normale
flux thermique
Cq v 3 dt.
C() =
(7.40)
0
1
(r rT )
hs
a5 = 1.880235969632294.1022, a4 = 6.074073670669046.1015,
a3 = 7.848681398343154.108, a2 = 5.070751841994340.101,
a1 = 1.637974278710277.106, a0 = 2.116366606415128.1012.
160
0.00
0.231
0.231
0.199
0.159
0.133
0.125
0.105
0.101
0.101
0.101
10.00
0.231
0.231
0.199
0.159
0.133
0.125
0.105
0.101
0.101
0.101
15.00
0.269
0.269
0.236
0.195
0.169
0.160
0.148
0.144
0.144
0.144
20.00
0.326
0.326
0.292
0.248
0.220
0.211
0.200
0.205
0.208
0.208
25.00
0.404
0.404
0.366
0.318
0.288
0.279
0.269
0.275
0.278
0.278
30.00
0.500
0.500
0.458
0.405
0.373
0.363
0.355
0.363
0.367
0.367
35.00
0.613
0.613
0.566
0.509
0.475
0.465
0.458
0.467
0.472
0.472
40.00
0.738
0.738
0.688
0.628
0.592
0.581
0.576
0.586
0.591
0.591
45.00
0.868
0.868
0.818
0.757
0.721
0.710
0.704
0.714
0.719
0.719
50.00
0.994
0.994
0.948
0.892
0.857
0.846
0.838
0.846
0.849
0.849
55.00 deg
1.245
1.245
1.220
1.019
0.990
0.981
0.968
0.970
0.972
0.972
45.00
0.729
0.729
0.689
0.639
0.609
0.600
0.591
0.596
0.598
0.598
50.00
0.734
0.734
0.698
0.655
0.628
0.620
0.612
0.616
0.619
0.619
55.00 deg
0.756
0.756
0.723
0.649
0.626
0.618
0.609
0.612
0.613
0.613
0.00
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
10.00
0.185
0.185
0.172
0.154
0.139
0.133
0.103
0.091
0.087
0.087
15.00
0.291
0.291
0.269
0.238
0.215
0.206
0.184
0.172
0.169
0.169
20.00
0.394
0.394
0.363
0.322
0.292
0.281
0.259
0.257
0.258
0.258
25.00
0.491
0.491
0.454
0.404
0.370
0.358
0.337
0.336
0.338
0.338
30.00
0.578
0.578
0.535
0.481
0.445
0.433
0.414
0.416
0.418
0.418
35.00
0.649
0.649
0.604
0.549
0.513
0.502
0.487
0.490
0.493
0.493
40.00
0.700
0.700
0.657
0.603
0.569
0.559
0.547
0.552
0.555
0.555
12
Mach number
2
10
0.245 si v 6 1000,
0.55 si v > 3000,
CL (v) =
0.1732 + 1.256.104v si v 6 3000,
(voir figure 7.8).
Coefficient Cd en fonction de v
Coefficient Cl en fonction de v
0.6
0.6
0.55
0.5
0.5
0.45
0.4
0.4
0.3
0.35
0.3
0.2
0.25
0.2
1000
2000
3000
4000
v
5000
6000
7000
0.1
1000
2000
3000
4000
5000
6000
7000
= Cq v 3 6 max .
162
7.4.2
(7.42)
o x = (r, v, ), et
g v
(g sin + kv 2 )
+ cos ( + ) ,
r
v
v
r
Y = k v ,
X = v sin
o k =
1 SCD
2 m ,k
1 SCL
2 m .
tf
dt,
avec = Cq
p
(r)v 3 .
Proposition 7.4.1. Toute trajectoire optimale est bang-bang, i.e. est une succession darcs associs au contrle u = 1.
Dmonstration. Dans notre cas le Hamiltonien scrit
H(x, p, p0 , u) = hp, X(x) + uY (x)i + p0 (x),
et la condition de maximisation implique que u = signe(hp, Y i) si hp, Y i =
6 0.
Il suffit donc de montrer que la fonction t 7 hp(t), Y (x(t))i, appele fonction
de commutation, ne sannule sur aucun sous-intervalle, le long dune extrmale.
Supposons le contraire, i.e.
hp(t), Y (x(t))i = 0,
sur un intervalle I. En drivant deux fois par rapport t il vient
hp(t), [X, Y ](x(t))i = 0,
o [., .] est le crochet de Lie de champs de vecteurs. Par consquent sur lintervalle I le vecteur p(t) est orthogonal aux vecteurs Y (x(t)), [X, Y ](x(t)), et
[X, [X, Y ]](x(t)) + u(t)[Y, [X, Y ]](x(t)). Or on a le rsultat suivant.
164
clc ;
global g0 hs rt Cq Omega;
Omega=7.292115853608596e-005 ; g0=39800047e7 ; hs=7143 ;
rt=6378139 ; Cq = 1.705e-4 ;
range = [0 ; inf ];
% D\ebut de la trajectoire (altitude 120 km) :
r0 = 0.64979590000E+07 ; v0 = 0.74049501953E+04 ;
gam0 = -0.32114058733E-01 ; flux0=0;
%% Dichotomie pour trouver le temps de commutation de sorte
%% que vf=445 ("events") et hf=15000.
global tc ; tc = -5 ; hf=0 ;
while hf<15000
global tc ; tc = tc+5
xinit = [ r0 ; v0 ; gam0 ; flux0 ] ;
options = odeset(events,@events);
[t,x] = ode113(@systdim3,range,xinit,options);
hf=x(length(t),1)-rt ;
end
a=tc-10 ; b=tc ; hfm=hf ;
while abs(hfm-15000)>1
global tc ; tc=a;
xinit = [ r0 ; v0 ; gam0 ; flux0 ] ;
options = odeset(events,@events,RelTol,1e-6);
[t,x] = ode113(@systdim3,range,xinit,options);
hfa=x(length(t),1)-rt;
global tc ; tc=b;
xinit = [ r0 ; v0 ; gam0 ; flux0 ] ;
options = odeset(events,@events,RelTol,1e-6);
[t,x] = ode113(@systdim3,range,xinit,options);
hfb=x(length(t),1)-rt;
global tc ; tc=(a+b)/2 ;
xinit = [ r0 ; v0 ; gam0 ; flux0 ] ;
options = odeset(events,@events,RelTol,1e-6);
[t,x] = ode113(@systdim3,range,xinit,options);
hfm=x(length(t),1)-rt ;
if (hfa-15000)*(hfm-15000)<=0
b=(a+b)/2
else a=(a+b)/2
end
166
global Omega g0 hs rt Cq ;
r=X(1) ; v=X(2) ; gam=X(3) ;
dXdt=[v*sin(gam)
-g(r)*sin(gam)-coef_k(v)*rho(r)*(v)^2
cos(gam)*(-g(r)/v+v/r)+2*Omega+coef_kp(v)*rho(r)*v*u(t,r,v,gam)
Cq*sqrt(rho(r))*v^3] ;
%------------------------------------------------------------------function controle=u(t,r,v,gam)
% Contr\^ole pour le probl\eme sans contrainte : -1 puis +1.
global tc ;
if t<tc
controle = -1 ;
else controle = 1 ;
%------------------------------------------------------------------function locdensite = rho(r)
global hs rt ;
locdensite = 1.225*\mathrm{exp}(-1/hs.*(r-rt)) ;
%------------------------------------------------------------------function ge=g(r)
global g0 ;
ge = g0./r.^2 ;
%------------------------------------------------------------------function k = coef_k (v)
k = 0.5*15.05* CDsimple(v) /7169.602 ;
%------------------------------------------------------------------function kp = coef_kp (v)
kp = 0.5*15.05* CLsimple(v) /7169.602 ;
%-------------------------------------------------------------------
Les rsultats obtenus sont tracs sur les figures 7.9 et 7.10. On se rend compte
que cette stratgie ne permet pas de respecter la contrainte sur le flux thermique,
et nest donc pas adapte au problme. La prise en compte de cette contrainte
sur ltat est donc indispensable
4
15
Altitude
x 10
10
5
0
200
400
600
800
Vitesse
1000
1200
1400
1600
200
400
600
800
Angle de vol
1000
1200
1400
1600
200
400
600
800
1000
1200
1400
1600
8000
6000
4000
2000
0
0.4
0.2
0
0.2
0.4
168
15
x 10
1
0.8
0.6
0.4
10
0.2
0
0.2
5
0.4
0.6
0.8
1
500
1000
200
1500
400
600
800
1000
1200
1400
= (
= (t)
= 0,
do lon dduit
us (t) =
A(t)
.
B(t)
170
if (fluxa-717300)*(fluxm-717300)<=0
b=(a+b)/2
else a=(a+b)/2
end
end
Par ailleurs, la fonction events doit tre modifie ainsi.
function [value,isterminal,direction]=events(t,x)
global g0 hs Omega rt Cq;
%% Arret a derivee(flux)=0 :
value = -1/2*x(2)/hs*sin(x(3))-3/x(2)/x(1)^2*g0*sin(x(3))-...
3*x(2)*coef_k(x(2))*rho(x(1)) ;
isterminal=1;
direction=0;
On dtermine ainsi numriquement le premier temps de commutation t1 =
153.5.
Le temps de sortie de la phase iso-flux est dtermin de manire compltement analogue. Finalement, on arrive aux rsultats reprsents sur les figures
7.11 et 7.12.
4
15
Altitude
x 10
10
5
0
200
400
600
800
1000
1200
1400
Vitesse
8000
6000
4000
2000
0
200
400
600
800
Angle de vol
1000
1200
1400
200
400
600
1000
1200
1400
0.4
0.2
0
0.2
0.4
800
x 10
1
7
0.8
0.6
0.4
5
0.2
0
0.2
3
0.4
2
0.6
0.8
1
0
200
400
600
800
1000
1200
1400
200
400
600
800
1000
1200
7.4.3
On se propose maintenant de stabiliser le systme simplifi autour de la trajectoire construite dans le paragraphe prcdent, de faon prendre en compte
dventuelles perturbations, dues aux erreurs de modles, aux perturbations atmosphriques, etc. Pour cela, on va utiliser la thorie linaire-quadratique traite
prcdemment dans cet ouvrage, qui permet dexprimer le contrle sous forme
de boucle ferme, au voisinage de la trajectoire nomimale, de faon la rendre
stable.
Le systme tudi est un systme de contrle non linaire dans IRn , du type
x(t)
= f (x(t), u(t)),
o f : IRn IRm IRn est C 1 , et les contrles admissibles u sont valeurs dans
IRm . Soit (xe (.), ue (.)) une trajectoire solution sur [0, T ], telle que pour
o
f
f
(xe (t), ue (t)), B(t) =
(xe (t), ue (t)).
x
u
Le but est alors de rendre lerreur y() la plus petite possible, ce qui nous amne
considrer, pour ce systme linaire, un cot quadratique du type (4.2), o
les matrices de pondration Q, W, U sont choisir en fonction des donnes du
problme. Il sagit, au premier ordre, dun problme de poursuite avec = xe .
En particulier on a h = 0 pour ce problme.
A(t) =
172
Cest cette stratgie que lon adopte pour stabiliser la navette vers sa trajectoire de rfrence.
Pour tenir compte de la contrainte sur le contrle, il faut dabord modifier la
trajectoire nominale xe () obtenue prcdemment de faon ce quelle respecte
la nouvelle contrainte sur le contrle |ue | 6 1 , o est un petit paramtre.
On choisit par exemple = 0.05. On trouve alors de nouveaux temps de commutation, qui sont
t1 = 143.59, t2 = 272.05, t3 = 613.37.
Dans le programme suivant, on implmente lquation de Riccati. Celle-ci
est intgre en temps inverse puisquon se donne une condition finale. Il faut
donc ensuite rtablir le cours normal du temps en symtrisant la matrice de
discrtisation obtenue. Enfin, le contrle boucl obtenu est rinject dans le
systme initial. Les simulations sont effectues en prenant des conditions initiales
proches, mais diffrentes, de celles de la table 7.1.
function stabdim3
% Stabilisation de la navette, en dimension 3, par Riccati.
clc ;
global g0 hs rt Cq Omega S m;
Omega=7.292115853608596e-005 ; g0=39800047e7 ; hs=7143 ;
rt=6378139 ; Cq = 1.705e-4 ; S=15.05 ; m=7169.602 ;
range = [0 ; inf ] ;
%% Debut de la trajectoire (alt. 120000 km) :
r0 = 0.64979590000E+07 ; v0 = 0.74049501953E+04 ;
gam0 = -0.32114058733E-01 ; flux0 = 0 ;
%% Entree dans la phase iso-flux :
r0=6.443919913623549e+06 ; v0=7.243006878621867e+03 ;
gam0=-0.00319355995196 ;
global t1 t2 t3 ;
%t1=-1 ; t2=t1 ; t3=533.75-268.9198 ;
%t1=143.5908945796609 ; t2=272.0484928785223 ; t3=613.3766178785223 ;
t1=-1 ; t2=t1 ; t3=613.376617878522-272.0484928785223 ;
xinit = [ r0 ; v0 ; gam0 ; flux0 ] ;
options = odeset(events,@events,RelTol,1e-6) ;
global te xe ;
%% trajectoire nominale
[te,xe] = ode113(@systdim3,range,xinit,options) ;
%% Definition des poids
global W invU ;
174
10
0
0
10
0 0
102 0 , Q = 0
0 0 et U = 1010 .
W = 0
0
0
10
0
0 0
Bien entendu dautres choix sont possibles. Ici notre choix de Q force laltitude
finale tre proche de laltitude souhaite. En revanche on laisse plus de libert
la vitesse finale et langle de vol final.
La trajectoire x() part dun point x(0) diffrent de xe (0). On a pris les
donnes numriques suivantes :
cart sur laltitude initiale : 1500 m,
176
100
200
300
400
500
ecart de vitesse
600
700
800
900
100
200
300
400
500
ecart sur langle de vol
600
700
800
900
100
200
300
600
700
800
900
100
50
0
50
100
0.02
0.01
0
0.01
400
500
200
300
400
500
600
700
800
900
600
700
800
900
controle feedback
1
0.8
0.6
0.4
0.2
0
0.2
100
200
300
400
500
Altitude (m)
x 10
6
4
2
0
100
200
300
400
500
Vitesse (m/s)
600
700
800
900
100
200
300
400
500
Angle de vol (rad)
600
700
800
900
100
200
300
600
700
800
900
8000
6000
4000
2000
0
0.5
0.5
400
500
178
x 10
100
200
300
400
500
600
700
800
900
Chapitre 8
Thorie dHamilton-Jacobi
8.1
Introduction
1
,
v(x)2
S(t, x) =
179
180
Alors, le long dune extrmale (i.e. une courbe vrifiant les quations dEulerRt
=
L,
do
rapport t, on obtient S
t
x
S
S
= 0,
+ H t, x,
t
x
qui est lquation dHamilton-Jacobi.
8.2
Solutions de viscosit
(8.1)
(8.2)
8.2.1
On introduit des chemins x(s) dans , partant de , appels caractristiques, le long desquels on rsout lquation et on obtient les valeurs de S.
Posons z(s) = S(x(s)) et p(s) = S(x(s)), et cherchons une quation diffrentielle ordinaire dcrivant lvolution de z et p. On a
z(s)
= S(x(s)).x(s)
= p(s).x(s),
p(s)
= d2 S(x(s)).x(s).
181
H
p .
Il vient alors z = p. H
p , et
H
(x(s), z(s), p(s)), x(0) = x ,
p
H
z(s)
= p(s).
(x(s), z(s), p(s)), z(0) = S(
x) = g(
x),
p
H
H
p(s)
=
(x(s), z(s), p(s))
(x(s), z(s), p(s)).p(s), p(0) = S(
x),
x
z
x(s)
dt
ds
= 1,
H
H
, p =
,
p
x
H
+ p0 = px + p0 ,
p
= 0, do z = pxH
avec p0 +H = H
182
H
n
183
Exemple 8.2.1. Un exemple simple de cette situation est donn par le problme
de Dirichlet pour lquation eikonale
kS(x)k2 = 1 dans ,
S = 0 sur .
(8.3)
2
S
= 0 p.p. sur IR]0, +[,
x
S(0, ) = 0,
0
t + |x|
si |x| > t,
si |x| < t.
184
8.2.2
3. si (8.1) est lquation dHamilton-Jacobi dune fonction valeur dun problme de contrle optimal, alors la fonction valeur est lunique solution de
(8.1).
(8.4)
185
p D+ v(x)
H(x, v(x), p) 6 0.
p D v(x)
Finalement, S est une solution de viscosit de (8.4) si elle est la fois soussolution et sur-solution.
Remarque 8.2.7. Si S est une solution de viscosit nulle part diffrentiable, on
impose des conditions l o D S(x) 6= , i.e. sur un ensemble dense.
Remarque 8.2.8.
Si S est une solution de classe C 1 , alors S est aussi solution de viscosit.
Rciproquement, si S est solution de viscosit, alors en tout point x de
o S est diffrentiable, on a H(x, S(x), S(x)) = 0.
Ceci assure la cohrence avec la notion classique de solution. En particulier,
si S est lipschitzienne, alors lquation dHamilton-Jacobi (8.4) est vraie presque
partout.
Exemple 8.2.4. La solution de viscosit du problme
S
1 = 0 sur ]0, 1[, S(0) = S(1) = 0,
x
est
S(x) =
x si 0 6 x 6 1/2,
1 x si 1/2 6 x 6 1.
186
Remarquons toutefois que S nest pas solution de viscosit de 1 S
x = 0.
Notons aussi que cette solution est bien S(x) = d(x, ). Enfin, remarquons que,
parmi linfinit de solutions de ce problme, S est la seule pouvoir tre obtenue
comme limite de viscosit vanescente. En effet, toute autre solution admet au
moins un minimum local strict dans ]0, 1[. Or si S converge uniformment vers
S, avec |S | 1 = S , et si on note x un minimum local strict de S , alors
S (x ) = 0 et S (x ) > 0, ce qui est absurde.
On a les rsultats suivants (voir [23, 7, 8]).
Thorme 8.2.1. Soient un ouvert born de IRn , g une fonction continue
sur , et H : IRn IR une fonction continue, uniformment continue en
x au sens o il existe une fonction : IR+ IR+ continue et croissante, avec
(0) = 0 telle que
|H(x, p) H(y, p)| 6 (kx yk(1 + kpk)).
Alors le problme de Dirichlet
S(x) + H(x, S(x)) = 0 dans ,
S| = g,
admet au plus une solution de viscosit.
Thorme 8.2.2. Soient g une fonction continue sur IRn , et H : [0, T ] IRn
IRn IR telle que
|H(t, x, p) H(s, y, p)| 6 C(|t s| + kx yk)(1 + kpk),
|H(t, x, p) H(t, x, q)| 6 Ckp qk.
kpk+
+.
En montrant que les caractristiques sont des droites, montrer que la solution
de viscosit du problme de Cauchy
S
S
+ H( ) = 0 dans IRn ]0, +[,
t
x
S(0, ) = g() sur IRn ,
est, pour tout t 6= 0,
x y
S(t, x) = minn tL
+ g(y) ,
yIR
t
8.3
8.3.1
(8.5)
(8.6)
188
Lquation dHamilton-Jacobi
Etablissons tout dabord formellement lquation dHamilton-Jacobi. Supposons que pour tout t ]0, T ] et tout x IRn il existe une trajectoire optimale
xu () solution du problme de contrle optimal (8.5), (8.6) (voir thorme 6.2.1).
On a alors x = xu (t), et donc
Z t
S(t, x) = S(t, xu (t)) = C(t, u) =
f 0 (xu (s), u(s))ds + g(xu (0)).
0
S
S
(t, x) +
(t, x))f (x, u(t)) f 0 (x, u(t)) = 0.
t
x
Introduisons par ailleurs le Hamiltonien du problme de contrle optimal
H(x, p, p0 , u) = hp, f (x, u)i + p0 f 0 (x, u).
Daprs le principe du maximum, le contrle optimal u() doit vrifier
H(x(t), p(t), p0 , u(t)) = max H(x(t), p(t), p0 , v).
vU
S
S
(t, x) + max H(x, p0
(t, x), p0 , v) = 0.
vU
t
x
(8.7)
Thorme 8.3.1. On suppose quil existe une constante C > 0 telle que, pour
tous x, y IRn et tout u U , on ait
kf (x, u)k 6 C, kf 0 (x, u)k 6 C, kg(x)k 6 C,
(8.8)
o H1 (x, p) = maxvU H(x, p, 1, v) = maxvU hp, f (x, v)i f 0 (x, v) .
Remarque 8.3.3. En contrle optimal, si on est capable de rsoudre lquation dHamilton-Jacobi alors on est capable dexprimer les contrles optimaux
comme des feedbacks. En effet, rappelons que le principe du maximum permet
dexprimer les contrles optimaux comme fonctions de (x, p). Or on vient de
voir prcdemment que p(t) = p0 S
x (t, x(t)) (au moins si S est diffrentiable
en ce point). La connaissance de la solution S donne donc beaucoup plus que
le principe du maximum, mais bien entendu cette quation dHamilton-Jacobi
est aussi beaucoup plus difficile rsoudre. Pour les aspects numriques, voir le
chapitre 9.
Remarque 8.3.4. Dans le cas de systmes linaires avec un cot quadratique,
on retrouve lquation de Riccati. En liaison avec la remarque prcdente, on
retrouve donc le fait que, dans le cadre LQ, lquation de Riccati permet dexprimer les contrles optimaux comme des feedbacks.
Faisons enfin une dernire remarque qui fait le lien entre la thorie dHamiltonJacobi et le principe du maximum.
Remarque 8.3.5. Au moins dans le cas o = IRm , i.e. sil ny a pas de
contrainte sur le contrle, et si le contrle sexprime, par le PMP, comme une
fonction lisse de (x, p), alors les extrmales du principe du maximum sont les
courbes caractristiques de lquation dHamilton-Jacobi (8.8).
En effet, la mthode des caractristiques consiste rsoudre, pour trouver
une solution lisse de (8.8), le systme dquations
x =
H1
H1
, p =
, x(0) = x , p(0) = g(
x).
p
x
S
(t, x(t, x)),
x
H
u (x, p, 1, u(x, p))
190
et de mme
H
H1
=
.
p
p
On retrouve donc les quations du principe du maximum
x
H p
H
=
,
=
.
t
p t
x
xu (0) = x0 , xu (t) = x,
Z t
f 0 (xu (s), u(s))ds,
C(t, u) =
(8.9)
le temps final t tant fix. Pour tout t [0, T ] et tout x IRn , la fonction valeur
est dfinie par
S(t, x) = inf{C(t, u) | xu () solution de (8.9)}.
La diffrence par rapport au cas prcdent rside dans la donne initiale. Ici, il
est clair que S(0, x0 ) = 0, et par convention on pose S(0, x) = + si x 6= x0 .
Thorme 8.3.2. On suppose quil existe une constante C > 0 telle que, pour
tous x, y IRn et tout u U , on ait
kf (x, u)k 6 C, kf 0 (x, u)k 6 C,
kf (x, u) f (y, u)k 6 Ckx yk,
(8.10)
o H1 (x, p) = maxvU H(x, p, 1, v) = maxvU hp, f (x, v)i f 0 (x, v) .
8.3.2
(8.11)
(8.12)
T (x0 ) = 0, T (x) = + si x 6= x0 .
(8.13)
192
Chapitre 9
Mthodes numriques en
contrle optimal
On distingue deux types de mthodes numriques en contrle optimal : les
mthodes directes et les mthodes indirectes. Les mthodes directes consistent
discrtiser ltat et le contrle, et rduisent le problme un problme doptimisation non linaire (programmation non linaire, ou "nonlinear programming").
Les mthodes indirectes consistent rsoudre numriquement, par une mthode
de tir ("shooting method"), un problme aux valeurs limites obtenu par application du principe du maximum. Dans ce chapitre, on sintresse dabord aux
mthodes indirectes, puis aux mthodes directes. Dans une dernire section, on
compare les mthodes, et on dcrit les mthodes hybrides qui sont un mlange
des deux approches.
9.1
9.1.1
Mthodes indirectes
Mthode de tir simple
z(t)
= F (t, z(t)),
R(z(0), z(tf )) = 0.
193
(9.1)
9.1.2
Fs (t, z(t)) si ts 6 t 6 tf
(9.2)
195
Remarque 9.1.2. A priori le temps final tf est inconnu. Par ailleurs dans la
mthode de tir multiple le nombre s de commutations doit tre fix ; on le
dtermine lorsque cest possible par une analyse gomtrique du problme.
La mthode de tir multiple consiste subdiviser lintervalle [t0 , tf ] en N sousintervalles, la valeur de z(t) au dbut de chaque sous-intervalle tant inconnue.
Plus prcisment, soit t0 < 1 < < k < tf une subdivision fixe de lintervalle [t0 , tf ]. En tout point j la fonction z est continue. On peut considrer j
comme un point de commutation fixe, en lequel on a
(
z(j+ ) = z(j ),
j = j fix.
(9.3)
F1 (t, z(t))
si 1 6 t < 2
F2 (t, z(t))
si 2 6 t < 3
z(t)
= F (t, z(t)) =
..
(9.4)
rm (m , z(1 ), z(m )) = 0
On a
+
).
z(j ) = z(j , j1 , zj1
)) = 0.
rm (m , z1+ , z(m
, m1 , zm1
(9.5)
rm (m , z1+ , z(m
, m1 , zm1
))
+
+
r
(
,
z(
,
,
z
),
z
)
2
2
1
2
1
2
G(Z) =
..
+
+
rm1 (m , z(m1
, m2 , zm2
), zm1
)
= 0.
(9.6)
On sest donc ramen dterminer un zro de la fonction G, qui est dfinie sur
un espace vectoriel dont la dimension est proportionnelle au nombre de points
de commutation et de points de la subdivision. Lquation G = 0 peut alors
tre rsolue itrativement par une mthode de type Newton (voir la section
suivante).
9.1.3
197
Ceci peut sembler paradoxal, mais il existe des moyens de se donner une approximation, mme grossire, de cette trajectoire optimale. Il sagit l en tout cas
dune caractristique majeure des mthodes de tir : elles sont trs prcises mais
requirent une connaissance a priori (plus ou moins grossire) de la trajectoire
optimale cherche.
9.2
Mthodes directes
Les mthodes directes consistent transformer le problme de contrle optimal en un problme doptimisation non linaire en dimension finie.
9.2.1
o Z = (x1 , . . . , xN , u1 , . . . , un ), et
C = {Z | gi (Z) = 0, i 1, . . . , r,
gj (Z) 6 0, j r + 1, . . . , m}.
(9.8)
N
X
i=1
N
X
i=1
ui Ui (t), ui IR,
xi Xi (t), xi IR,
m
X
i=1
i gi (Z) = 0,
9.2.2
199
a+ = max(a, 0) =
a + |a|
a |a|
, a = min(a, 0) =
.
2
2
Pour tout p {1, . . . , n}, on note ep = (0, . . . , 1, . . . , 0), le "1" tant en p-me
position. On obtient donc le schma explicite
0 =
S,k+1 S,k
k
X
n
S,k Sep ,k
S+ep ,k S,k
fp (x, u)+
+ max
+ fp (x, u)
f 0 (x , u) .
uU
hp
hp
p=1
Il existe de nombreuses mthodes de discrtisation. Le schma de discrtisation par diffrences finies propos ci-dessus est le plus simple, mais on peut
adopter des schmas dordre suprieur.
Il existe aussi les mthodes de front donde (voir [63]), qui consistent calculer les ensembles de niveau de la fonction valeur S solution de lquation
dHamilton-Jacobi. Particulirement efficaces en petite dimension, ces mthodes
consistent faire voluer le front donde de la fonction valeur en partant dun
point ou dun ensemble initial donn. La complexit algorithmique est linaire
en fonction du nombre de points de discrtisation. Ces mthodes ont t implmentes de manire trs efficace sur des problmes de dimension moyenne
(typiquement 3). La construction de tels schmas nest cependant pas immdiate, et en fonction de lquation il faut tre capable dlaborer un schma
stable et consistant (voir [63] pour des exemples).
9.3
Les mthodes directes prsentent les avantages suivants sur les mthodes
indirectes :
leur mise en oeuvre est plus simple car elles ne ncessitent pas une tude
thorique pralable comme les mthodes indirectes ; en particulier, on na
pas tudier les variables adjointes, ou bien connatre lavance la
structure des commutations ;
elles sont plus robustes ;
elles sont peu sensibles au choix de la condition initiale (contrairement
aux mthodes indirectes, cf ci-dessous) ;
il est facile de tenir compte dventuelles contraintes sur ltat ;
elles permettent de calculer les contrles optimaux sous forme de feedback,
i.e. en boucle ferme, ce qui est particulirement adapt aux problmes de
stabilisation, et/ou la mise en oeuvre de systmes embarqus.
En revanche,
les mthodes directes sont moins prcises que les mthodes indirectes ; par
exemple dans les problmes de contrle optimal issus de laronautique,
la prcision des mthodes directes savre en gnral insuffisante, malgr
laugmentation du nombre de pas de la discrtisation ;
la discrtisation directe dun problme de contrle optimal comporte souvent plusieurs minima (locaux), et les mthodes directes peuvent converger
vers ces minima ; pourtant la solution ainsi dtermine peut savrer tre
trs loigne de la vraie solution optimale ;
les mthodes directes sont gourmandes en mmoire, et de ce fait peuvent
devenir inefficaces si la dimension despace est trop grande.
Remarque 9.3.1. Si la dynamique du systme de contrle est complique, le calcul du systme extrmal, notamment des quations adjointes, peut tre effectu
avec un logiciel de calcul formel comme Maple.
Les avantages des mthodes indirectes sont
lextrme prcision numrique ;
la mthode de tir multiple est, par construction, paralllisable, et son implmentation peut donc tre envisage sur un rseau dordinateurs monts
en parallle.
Les inconvnients des mthodes indirectes sont les suivants :
201
Remarque 9.3.2. Que lon ait utilis une mthode directe ou une mthode indirecte, il faut tre capable de vrifier, a posteriori, que lon a bien obtenu la
trajectoire optimale. Les causes sont cependant diffrentes selon la mthode.
Si on a utilis une mthode directe, il se peut quelle ait converg vers
un (pseudo)-minimum local, d la discrtisation du problme. Notons
toutefois que lquation dHamilton-Jacobi donne une condition ncessaire
et suffisante doptimalit, et conduit donc des trajectoires globalement
optimales.
Les mthodes indirectes sont bases sur le principe du maximum qui donne
une condition ncessaire doptimalit locale. Une fois ces trajectoires dtermines, la thorie des points conjugus permet dtablir quune extrmale
est localement optimale avant son premier temps conjugu (voir [13]).
Loptimalit globale est beaucoup plus difficile tablir en gnral, et sur
des exemples spcifiques on ltablit numriquement.
Remarque 9.3.3. Les mthodes directes donnent les contrles extrmaux sous
forme de boucle ferme, et les mthodes indirectes sous forme de boucle ouverte
seulement. Cependant, une trajectoire optimale ayant t dtermine par une
mthode indirecte, on peut stabiliser cette trajectoire en calculant, par une mthode LQ par exemple, un contrle feedback localement autour ce la trajectoire.
Mthodes indirectes
connaissance a priori de la structure
de la trajectoire optimale
trs sensibles au choix de la
condition initiale
difficult thorique de la prise en compte
de contraintes sur ltat
contrles (localement) optimaux
en boucle ouverte
trs grande prcision numrique
efficaces en toute dimension
calculs paralllisables
petit domaine de convergence
Pour pallier linconvnient majeur des mthodes indirectes, savoir la sensibilit extrme par rapport la condition initiale, on propose plusieurs solutions.
Une premire solution raisonnable consiste combiner les deux approches :
mthodes directes et indirectes, de faon obtenir ce quon appelle une mthode
hybride. Quand on aborde un problme de contrle optimal, on peut dabord
essayer de mettre en oeuvre une mthode directe. On peut ainsi esprer obtenir
une ide assez prcise de la structure des commutations, ainsi quune bonne
approximation de la trajectoire optimale, et du vecteur adjoint associ. Si on
souhaite plus de prcision numrique, on met alors en oeuvre une mthode
de tir, en esprant que le rsultat fourni par la mthode directe donne une
approximation suffisante de la trajectoire optimale cherche, fournissant ainsi
un point de dpart appartenant au domaine de convergence de la mthode de
tir. En combinant ainsi les deux approches (mthodes directes puis indirectes),
on peut bnficier de lexcellente prcision numrique fournie par la mthode de
tir tout en rduisant considrablement le dsavantage d la petitesse de son
domaine de convergence.
En appliquant dabord une mthode directe, on peut obtenir une approximation de ltat adjoint. En effet, on a vu quune mthode directe consiste
rsoudre numriquement un problme de programmation non linaire avec
contraintes. Les multiplicateurs de Lagrange associs au Lagrangien de ce problme de programmation non linaire donnent une approximation de ltat adjoint (on a dj vu que le vecteur adjoint nest rien dautre quun multiplicateur
de Lagrange). A ce sujet, voir [21, 66, 34].
Une deuxime solution consiste utiliser une mthode dhomotopie (ou mthode de continuation). Il sagit de construire une famille de problmes de
contrle optimal (P )[0,1] dpendant dun paramtre [0, 1], o le problme initial correspond P0 . On doit sarranger pour que le problme P1 soit
plus simple rsoudre que P0 . Une telle famille ne peut tre construite que si
lon possde une bonne intuition et une bonne connaissance de la physique du
problme. Par la mthode de tir, chaque problme de contrle optimal P se
ramne la dtermination dun zro dune fonction. On obtient donc une famille
203
= y(t), x(0) = 0,
y(t)
= u(t), y(0) = 0,
avec |u(t)| 6 1.
(9.9)
Solution exacte.
Commenons par calculer la solution exacte de ce problme. Le Hamiltonien est
H = px y + py u + p0 , et les quations adjointes sont
p x = 0, py = px .
205
u=+1
2
u=+1
2
u=1
u=1
3
4
y2
signe(y)}
2
2 x + y 2 y si x > signe(y),
2
2
T (x, y) =
r
2
2 x + y 2 + y si x < y signe(y).
2
2
(9.10)
Remarque 9.3.4. Notons que la fonction temps minimal (9.10) vrifie bien lquation dHamilton-Jacobi associe au problme de contrle optimal (9.9)
T T
y
= 1, T (0, 0) = 0.
+
x
y
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
1
1
0.8
0.6
0.4
0.2
0
x
0.2
0.4
0.6
0.8
207
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
1
1
0.8
0.6
0.4
0.2
0
x
0.2
0.4
0.6
0.8
209
hx=hy=0.01, Nit=200
Solution theorique
0.5
0.5
0.4
0.4
0.9
0.3
0.8
0.9
1
0.1
0.2
0.4
0..89
000.7.6
0.5
0.3
0.2
0.3
0.4
0.6
0.7
0.8
0.9
0.4
0.3
0.4
0.5
0.6
0.7
0.3 0.5
0.6
0.7
0.8
0.9
0.1
0.8
0.7
0.5
0.3
0.20.4 0.1
0.4 0.3
0.6
0.7 0.8
0.7
0.1
0.2
0.6
0.5
0.8
0.9
0.9
0.9
0.8
0.7
0.8
0.8
0.7
0.6
0.6
0.5
0.7
0.8
0.91
0.9
1
0.9
1
0.9
0.8
0.3
0.4
0.2 .1
0
0.2
0.5
0.9
0.8
0.7
0.6
0.5
0.1
0.3
0.7
0.8
0.7
0.6
0.5
0.9
0.2
0.3
0.9
0.4
0.4
0.5
0.5
0.4
0.3
0.2
0.1
0.1
0.2
0.3
0.4
0.5
0.5
0.5
0.4
0.3
0.2
hx=hy=0.002, Nit=1000
0.5
0.4
0.4
0.3
0.3
0.4
0.5
0.6
0.7
0.7
0.7
0.6
0.9
0.4
0.3
0.4
0.1
1
00.9.8
0.7
0.7
0.2
0.8
0.3
0.4
0.5
0.5
0.5
0.9
0.9
0.8
0.7
1
0.9
0.8
0.7
0.1
0.7
0.6
0.6
0.6
0.5
0.3
0.1 0.20.2
0.6
0.5
0.7
0.8
0.9
0.4
0.6
0.5
0.5
0.6
0.3
0.4
0.9
1
0.7
0.8
0.9
1
0.9
0.3
0.4
0.5
0.3 0.4
0.5 0.6
0.8
0.9
1
0.8
0.9
1
0.8
0.2
0.7
0.6
0.4
0.1
0.2
0.3
0.5
0.7
0.6
1
.9
0.1 0 0.8
0.5
0.2
0.3
0.2
0.9
0.8
0.9 .8
0
0.1
0.9
0.1
hx=hy=0.001, Nit=2000
0.5
0.2
0.1
0.4
0.4
0.3
0.2
0.1
0.1
0.2
0.3
0.4
0.5
0.5
0.5
0.4
0.3
0.2
0.1
0.1
0.2
0.5
= 0 ;
%
%
211
Trajectoire
Controle
0.8
0.6
0.4
0.5
0.2
0
0
0.2
0.4
0.5
0.6
0.8
1
0.2
0.2
0.4
0.6
0.5
1.5
2.5
] ;
% systeme extremal
Controle
0.5
0.5
0
0
0.5
0.5
1
1.5
0.2
0.4
0.6
0.8
0.5
1.5
2.5
Troisime partie
Annexe
213
Chapitre 10
Exponentielle de matrice
Proposition 10.1.1.
Pour tout A Mn (IK), on a eA GLn (IK), et
A 1
A
(e ) = e .
Lapplication exponentielle est IK-analytique (et donc en particulier est de
classe C sur le corps IK).
La diffrentielle de Frchet d exp(0) de lapplication exponentielle en 0 est
gale lidentit sur Mn (IK).
Pour toutes matrices A, B Mn (IK) qui commutent, i.e. AB = BA, on
a
eA+B = eA eB .
1
216
10.2
Lespace vectoriel Mn (IK) est de dimension n2 sur IK, donc les lments
2
I, A, . . . , An sont linairement dpendants. Par consquent il existe des polynmes P annulateurs de A, i.e. tels que P (A) = 0. Lanneau IK[X] tant
principal, lidal des polynmes annulateurs de A admet un unique gnrateur
normalis, i.e. un unique polynme de plus petit degr, dont le coefficient dominant est gal 1, annulant A ; on lappelle polynme minimal de la matrice
A, not A .
Par ailleurs, le polynme caractristique de A, not A , est dfini par
A (X) = det (XI A).
Thorme 10.2.1 (Thorme de Hamilton-Cayley). A (A) = 0.
En particulier, le polynme minimal A divise le polynme caractristique
A . Notons que deg A = n et deg A 6 n.
Exemple 10.2.1. Pour une matrice N Mn (IK) nilpotente, i.e. il existe un
entier p > 1 tel que N p = 0, on a ncessairement p 6 n, N (X) = X p et
N (X) = X n .
Exemple 10.2.2. Pour une matrice compagnon, i.e. une matrice de la forme
0
1
0
0
..
..
..
..
.
.
.
.
0
,
..
..
..
A = ..
.
.
0
.
.
0
0
1
an an1 a2 a1
on a
Le scalaire IK est dit valeur propre sil existe un vecteur non nul v IKn ,
appel vecteur propre, tel que Av = v. Lespace propre associ la valeur
propre est dfini par
E() = ker(A I) ;
r
Y
mi
(X i )
i=1
et A (X) =
r
Y
i=1
(X i )si ,
avec si 6 mi . Lentier si (resp. mi ) est appel ordre de nilpotence (resp. multiplicit) de la valeur propre i . Lespace caractristique de la valeur propre i
est dfini par
N (i ) = ker(X i )si .
217
r
Y
Pi (X),
i=1
r
M
ker Pi (A).
i=1
)
.
Alors
il existe P GLn (IK) telle que
i
i=1
A1
0
P 1 AP = ... . . . ... ,
0
Ar
Ji,1
0
.. ,
..
Ai = ...
.
.
0
Ji,ei
i 1
0
0 ... ...
,
Ji,k = .
.
.
..
.. 1
..
0
0 i
218
nayant pas forcment toutes le mme ordre |Ji,k |. Pour tout i {1, . . . , r}, on
a ei = dim E(i ), et max |Ji,k | = si .
16k6ei
Chapitre 11
Thorme de
Cauchy-Lipschitz
Dans cette section nous rappelons une version gnrale du thorme de
Cauchy-Lipschitz, adapte la thorie du contrle, qui tablit sous certaines
conditions lexistence et lunicit dune solution dune quation diffrentielle.
Une bonne rfrence ce sujet est [64, Appendix C].
11.1
Un nonc gnral
f (s, x(s))ds,
t0
219
220
t I
Alors pour toute donne initiale (t0 , x0 ) I V , il existe une unique solution
maximale (J, x()) du problme de Cauchy (11.1).
Remarque 11.1.1. On na pas forcment J = I ; par exemple considrons le
problme de Cauchy x(t)
= |x(t)|, x(0) = 0. La
fonction nulle est solution, ainsi que
0
si t 6 0,
x(t) =
t2 /4
si t > 0.
Thorme 11.1.2 (Thorme dexplosion). Sous les hypothses du thorme
de Cauchy-Lipschitz, soit (]a, b[, x()) une solution maximale. Si b < sup I, alors
pour tout compact K contenu dans V , il existe un rel > 0 tel que x(t)
/ K,
pour tout t ]b , b[.
Remarque 11.1.3. En particulier si V = IRn , alors kx(t)k +.
tb
t<b
221
y, z IRn
Alors J = I.
Exercice 11.1.1 (Lemme de Gronwall). Soient et y : [t0 , t1 ] IR+ deux
fonctions continues vrifiant
Z t
(s)y(s)ds.
c > 0 / t [t0 , t1 ] y(t) 6 c +
t0
Montrer que
t [t0 , t1 ] y(t) 6 c exp
Indication : poser F (t) =
t0
Z
t
t0
(s)ds .
Z t
(s)ds .
(s)y(s)ds, puis G(t) = F (t)exp
t0
Exercice 11.1.2.
1. Soit y0 IR. Justifier quil existe une solution maximale y(.) sur un intervalle ]a, b[ du problme de Cauchy
(E)
y (t) = y(t) +
y(t)4
, y(0) = y0 .
1 + t2
y(t) = e y0 +
est
y(s)4
ds
1 + s2
3. Soit T tel que 0 < T < b. Supposons que pour tout t [0, T ] on ait
|y(t)| 6 1. A laide du lemme de Gronwall, montrer que
t [0, T ] |y(t)| 6 |y0 |.
4. Supposons que |y0 | < 1. Montrer que |y(t)| 6 1 pour tout t [0, b[, puis
que b = +.
Indication : utiliser le lemme de Gronwall, et le thorme dexplosion.
Exercice 11.1.3. Soit q : IR IR une fonction de classe C 1 , strictement
positive et croissante. Montrer lexistence et lunicit dune solution maximale
dfinie sur un intervalle contenant [0, +[, pour le problme de Cauchy y (t) +
q(t)y(t) = 0, y(0) = y0 , y (0) = y0 , puis que toutes les solutions de lquation
diffrentielle y (t) + q(t)y(t) = 0 sont bornes sur IR+ .
Indication : driver la fonction V (t) = y(t)2 +
y (t)2
q(t) .
222
Exercice 11.1.4 (Mthode des entonnoirs). Soit (E) : x (t) = f (t, x(t)) une
quation diffrentielle, o f : IR IR IR est de classe C 1 .
On dit que (resp. ) est une barrire infrieure (resp. une barrire suprieure), si cest une fonction de classe C 1 telle que pour tout t IR on ait
(t) < f (t, (t)) (resp. (t) > f (t, (t))). On appelle entonnoir lensemble
E = {(t, y) IR IR | (t) < y < (t)}.
Montrer que si t 7 x(t) est une solution de (E) sur un intervalle J IR telle
que x(t0 ) = x0 avec (t0 , x0 ) E, alors (t, x(t)) E pour tout t > t0 , t J.
Indication : raisonner par labsurde, et poser t1 = inf{t > t0 / (t, x(t))
/
E}. Montrer que x(t1 ) = (t1 ) ou (t1 ), et conclure.
Exercice 11.1.5 (Loi de Hubble). Une des thories actuelles de lunivers (thorie du big-bang) admet que lorigine de lunivers est une gigantesque explosion
partir de laquelle la matire de lunivers a commenc diverger partir du
point 0.
On considre que cette expansion est homogne et isotrope ; les positions
successives se dduisent les unes des autres par une homothtie de centre 0 :
v (M ) = H(t)OM (t)
(loi de Hubble)
o on explicitera H(t).
2. Montrer que la loi de Hubble est incompatible avec une valeur constante
de H.
3. La valeur actuelle de H est H 2, 5.1018 s1 . En prenant comme
modle H(t) = t (o est dterminer), trouver lordre de grandeur
du rayon maximum de lunivers (on rappelle la vitesse de la lumire c =
3.108 m.s1 ).
En dduire lge de lunivers selon cette thorie.
11.2
x(t)
223
= Ax(t), x(0) = x0 ,
o A Mn (IR). Alors, dans ce cas, la rsolvante est M : t 7 etA , et la solution
de ce problme est
x : t 7 etA x0 .
La dcomposition de Jordan permet de prciser ce rsultat. En effet, on a
tJ
0
e 1,e1
1
..
etA = P
P .
.
tJ1,er
0
e
On calcule facilement
tJi,k
=e
ti
..
.
0
..
..
.
..
.
0
t|Ji,k |1
eti (|J
i,k |1)!
..
.
.
ti
e t
eti
224
06k6|Ji,k |
4
0
A=
2
0
0
4
0
2
2
0
4
0
0
2
.
0
4
2t + 1t 0 1t t
A(t) = t 1t 3t t 1t .
2
0 2t + t
t 2t
225
11.3
11.3.1
11.3.2
226
Il est facile de montrer qualors les hypothses du thorme 11.1.1 sont vrifies,
et donc que, pour chaque contrle fix, il existe une unique solution maximale
(J, x()) du problme de Cauchy
x(t)
Chapitre 12
= Ax(t) + Bu(t),
y(t) = Cx(t),
(12.1)
12.2
u(t) =
1/ = ei ,
0
.
..
0
y(t) = Ce
tA 1
W (t s)u(s)ds =
y(t) =
W (t s)u(s)ds.
0
IR
f (x y)g(y)dy), on a le rsultat
y(t) = (W u)(t).
L(f )(s) =
est f (t)dt.
W (t)est dt.
(12.4)
1
T
com(sI A) .
det(sI A)
= Ax(t) + Bu(t),
alors
H(s) = C(sI A)1 B + D.
Dans ce cas, il est clair que les coefficients de la matrice H(s) sont des fractions
rationnelles dont le numrateur et le dnominateur ont mme degr.
Rciproquement, lorsquon dispose dune matrice de transfert H(s) pour
reprsenter un systme linaire continu, on peut chercher calculer un modle
dtat (i.e. dterminer des matrices A, B, C) tel que H(s) = C(sI A)1 B.
Un tel triplet (A, B, C) est appel ralisation dtat continue de la matrice de
transfert H(s).
..
A= .
0
an
1
..
an1
b1 sn1 + + bn
sn + a1 sn1 + + an
..
..
..
1
0
a2
0
0
..
.
.
, B = .. ,
0
1
1
a1
C = (bn b1 ), D = b0 .
1/(s2 1)
H(s) = s/(s2 + s) .
s/(s2 s)
Chapitre 13
x0 IRn
232
13.1.2
a1 a3 a5 a7
b1 b2 b3
c1 c2 c3
..
.
..
.
..
.
Le processus continue tant que le premier lment de la ligne est non nul.
La table de Routh est dit complte si elle possde n+1 lignes dont le premier
coefficient est non nul.
Thorme 13.1.2. Tous les zros de P sont partie relle strictement ngative
si et seulement si la table complte existe, et les lments de la premire colonne
sont de mme signe.
Thorme 13.1.3. Si la table complte existe, alors P na aucun zro imaginaire pur, et le nombre de zros partie relle strictement positive est gal au
nombre de changements de signes dans la premire colonne.
Critre de Hurwitz
On pose an+1 = an+2 =
dordre n
a1
a0
H =0
0
..
.
0
a5
a4
a3
a2
a1
..
.
o = a0 ou a1 selon la parit de n.
a2n1
a2n2
a2n3
a2n4
,
a2n5
..
.
an
233
H, i.e.
a5
a4 , . . . , Hn = det H.
a3
13.1.3
a1 , a2 > 0
a1 , a3 > 0 et a1 a2 > a0 a3
a1 , a2 , a4 > 0 et a3 (a1 a2 a0 a3 ) > a21 a4
= (A + BK)x(t),
soit asymptotiquement stable, i.e.
Spec(A + BK) Re < 0.
Remarque 13.1.4. Ce concept est invariant par similitude
A1 = P AP 1 , B1 = P B, K1 = KP 1 .
Thorme 13.1.5 (Thorme de placement de ples (pole-shifting theorem)).
Si la paire (A, B) vrifie la condition de Kalman, alors pour tout polynme rel P
unitaire de degr n, il existe K Mm,n IR tel que A+BK = P , i.e. le polynme
caractristique de A + BK est gal P .
234
0
0
1
0
..
..
..
.
.
.
.
.
.
.
A= .
, B = . .
0
0
0
1
1
an an1 a1
0
1
..
..
..
.
.
.
A + BK =
0
0
k1 an k2 an1
et donc
0
..
.
1
kn a1
235
On en dduit que
Im (B, AB, . . . , An1 B) = Im B + Im AB + + Im An1 B IRx1 ,
ce qui contredit la condition de Kalman.
Fait 2 : Pour tout k 6 n, il existe xk Axk1 + Im B (et donc il existe
yk1 IRm tel que xk = Axk1 + Byk1 ) tel que dim Ek = k, o Ek =
Vect{x1 , . . . , xk }.
En effet sinon, on a Axk1 + Im B Ek1 , do Axk1 Ek1 et Im B
Ek1 . On en dduit que
AEk1 Ek1 .
En effet, on remarque que Ax1 = x2 By1 Ek1 + Im B Ek1 , de mme
pour Ax2 , etc, Axk2 = xk1 Byk1 Ek1 + Im B Ek1 , et enfin,
Axk1 Ek1 .
Par consquent
Im AB = AIm B AEk1 Ek1 ,
et de mme
i IN Im Ai B Ek1 .
Do
Im (B, AB, . . . , An1 B) Ek1 ,
ce qui contredit la condition de Kalman.
On a donc ainsi construit une base (x1 , . . . , xn ) de IRn . On dfinit alors
C Mm,n (IR) par les relations
Cx1 = y1 , Cx2 = y2 , . . . , Cxn1 = yn1 , Cxn quelconque.
Alors la paire (A + BC, x1 ) vrifie la condition de Kalman, car
(A + BC)x1 = Ax1 + By1 = x2 , . . . , (A + BC)xn1 = Axn1 + Byn1 = xn .
236
nest pas fiable numriquement. Il vaut mieux utiliser place.m, qui est une mthode de placement de ples robuste (voir [45]), base sur des dcompositions
aux valeurs propres.
Dans lexemple 13.3.1 trait plus loin, nous donnons un exemple dutilisation
de cette procdure.
Enfin, une troisime solution consiste appliquer la thorie LQ (voir section
4.4.3).
13.2
Tout dabord, remarquons que les ples de la matrice de transfert H(s) sont
exactement les valeurs propres de A. Cest pourquoi on parle des ples de A
(ou modes propres). Ainsi, le systme est naturellement stable si les ples sont
partie relle strictement ngative.
Dfinition 13.2.1. Le systme est dit EBSB-stable (Entre Borne, Sortie
Borne) si pour toute entre borne, la sortie est borne.
Proposition 13.2.1. Si les ples de A sont partie relle strictement ngative
alors le systme est EBSB-stable (la rciproque est fausse).
Remarque 13.2.1. La EBSB-stabilit peut donc se tester par les critres de
Routh-Hurwitz.
Un feedback sinterprte de la manire suivante. Posons C = I. On a H(s) =
(sI A)1 B, et X(s) = H(s)U (s). On prend u = Kx + v, i.e. U = KX + V ,
do
X(s) = (I H(s)K)1 H(s)V (s).
Proposition 13.2.2. Si les ples de I H(s)K sont partie relle strictement
ngative, alors le systme est EBSB-stable.
Dans cette interprtation, la matrice de feedback K sappelle le gain.
Remarque 13.2.2. La rponse impulsionnelle est W (t) = etA B, donc
si W (t) 0, alors le systme est asymptotiquement stable ;
t+
13.3
13.3.1
= f (x(t)),
237
> 0 | x0 B(
x, ) t > 0 kx(t, x0 ) x
k 6 .
Le point dquilibre x
est dit localement asymptotiquement stable (LAS)
si x
est stable et si de plus x(t, x0 ) x.
t+
d
dt V
Thorme 13.3.2 (Thorme de Lyapunov). Sil existe une fonction de Lyapunov au point dquilibre x
sur , alors le point x est stable. Si la fonction de
Lyapunov est stricte alors x est LAS. Si de plus V est propre sur alors x est
globalement asymptotiquement stable (GAS) sur .
Thorme 13.3.3 (Principe de Lasalle). Soit V : IR+ une fonction de
classe C 1 telle que
V est propre, i.e. L V () V 1 ([0, L]) est compact dans ,
x hV (x), f (x)i 6 0.
Soit I le plus grand sous-ensemble de {x | hV (x), f (x)i = 0} invariant
par le flot (en temps t > 0) de x = f (x). Alors toute solution x(t) de x = f (x)
tend vers I, i.e.
d(x(t), I) 0.
t+
238
I3 3 = (I1 I2 )1 2 3
y2
2 .
Exercice 13.3.5. Soit f : IRn IRn une fonction continue telle que toute
solution de lquation y = f (y), y(0) = y0 , reste sur une sphre de IRn , i.e.
t > 0
ky(t)k = ky(0)k.
(Indication : poser B =
239
(b) En dduire que V (x) = hx, Bxi est une fonction de Lyapunov pour
lquation diffrentielle x = Ax, et que lorigine est asymptotiquement stable.
2. (a) Soit q : IRn IRn une fonction continue telle que q(x) = o(||x||).
Montrer que la fonction V prcdente est encore une fonction de
Lyapunov pour le systme x = Ax + q(x), et que lquilibre 0 est
asymptotiquement stable.
(b) Quel rsultat peut-on en dduire sur la stabilit des points fixes dun
systme autonome x = F (x), o F : IRn IRn est de classe C 1 ?
13.3.2
= f (x(t), u(t)),
et soit (xe , ue ) un point dquilibre, i.e. f (xe , ue ) = 0. Le systme linaris en
ce point est
y(t)
= Ay(t) + Bv(t),
o
A=
f
f
(xe , ue ), B =
(xe , ue ).
x
u
= f (x(t), K(x(t) xe ) + ue ).
Exemple 13.3.1. On tablit quune condition ncessaire et suffisante sur K
pour stabiliser le pendule invers (cf exemple 5.2.1) localement autour du point
dquilibre ( = c , = 0, = 0, = 0) est
k4 k2 L > 0, k3 k1 L (m + M )g > 0, k1 > 0,
k2 ((k4 k2 L)(k3 k1 L (m + M )g) M Lgk2 ) > k1 (k4 k2 L)2 .
Mettons en oeuvre, en Matlab, sur cet exemple, diffrentes mthodes de
stabilisation.
function placementpole
%
%
%
%
%
%
240
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
(M+m)*g*sin(theta)-u*cos(theta))/(L*(M+m*sin(theta)^2))
avec M masse du chariot,
m masse du pendule (tige sans masse),
L longueur de la tige,
au voisinage de sa position dequilibre instable
xi = xidot = theta =thetadot = 0.
Le systeme linearise en ce point est Xdot=AX+Bv avec
( 0 1
0
0 )
(
0
)
A = ( 0 0
-m*g/M
0 )
et B = (
1/M
) .
( 0 0
0
1 )
(
0
)
( 0 0 (M+m)*g/(L*M) 0 )
( -1/(L*M) )
Pour cela on va poser u=K*X, o\u K = ( k1 k2 k3 k4 ), et tester
plusieurs m\ethodes.
1. M\ethode directe : calculer \a laide de Maple le polynome
caract\eristique de la matrice A+B*K, puis en appliquant
le crit\ere de Routh d\eterminer une CNS sur K
pour que la matrice A+B*K soit Hurwitz.
Tester diff\erents feedbacks K.
Par identification des coefficients, d\eterminer un feedback
K permettant de placer
les poles exactement aux valeurs (-1,-1,-1,-1).
Tester tous les feedbacks ainsi d\etermin\es sur le syst\eme non
lin\eaire initial.
2. Utilisation des outils Matlab (Control Toolbox).
2.a. Utiliser la fonction Matlab "acker" pour placer les poles
exactement aux valeurs (-1,-1,-1,-1).
2.b. Utiliser la fonction Matlab "place" pour placer les poles
exactement aux valeurs (-1,-2,-3,-4).
(attention : il faut forc\ement prendre des poles distincts,
voir laide sur place)
2.c. Utiliser la fonction Matlab "lqr" pour stabiliser le syst\eme.
Tester ces diff\erents outils pour stabiliser le syst\eme non
lin\eaire initial.
241
242
243
xidot
2
0
0
2
4
6
20
40
60
80
100
20
theta
40
60
80
100
80
100
thetadot
0.6
0.4
0.2
0
0
1
0.2
2
0.4
0.6
20
40
60
80
100
20
40
60
= f (x(t)) + u(t)g(x(t)),
o ltat x et le contrle u sont des rels, les fonctions f et g sont de classe C ,
et f (0) = 0. On suppose que le point dquilibre (x = 0, u = 0) est globalement
asymptotiquement stabilisable au sens suivant : il existe un contrle feedback
u(x) de classe C , avec u(0) = 0, et une fonction de Lyapunov globale stricte
V pour le systme boucl x = f (x) + u(x)g(x) au point dquilibre x = 0.
On considre alors le systme augment
(
x(t)
= f (x(t)) + y(t)g(x(t)),
y(t)
= v(t),
u
V
(x)(f (x) + yg(x))
(x)g(x) (y u(x))
x
x
244
xidot
10
10
15
20
theta
10
15
20
15
20
thetadot
0.6
0.4
0.5
0.2
0
0.2
0.5
0.4
0.6
10
15
20
10
13.3.3
= f (x(t)) +
m
X
ui (t)gi (x(t)),
i=1
avec f (
x) = 0. Supposons quil existe une fonction V : IRn IR+ telle que
V (
x) = 0 et x 6= x
V (x) > 0,
V est propre,
x IRn Lf V (x) = hV (x), f (x)i 6 0,
{x IRn | Lf V (x) = 0 et Lkf Lgi V (x) = 0, i {1, . . . , n}, k IN} =
{
x}.
m
X
(Lgi V (x))2 6 0,
i=1
245
Par drivation,
d
Lg V (x(t)) = Lf Lgi V (x(t)),
dt i
puisque Lgi V (x(t)) = 0. Do, clairement,
0=
246
Chapitre 14
= Ax(t) + Bu(t),
y(t) = Cx(t) + Du(t),
(14.1)
14.1
x1 6= x2 u L ([0, T ], IRm ) | yu (, x1 ) 6= yu (, x2 )
u L ([0, T ], IRm ) yu (, x1 ) = yu (, x2 ) x1 = x2 ,
248
C
CA
rang . = n.
..
CAn1
CetA x1 + CetA
esA Bu(s)ds 6= CetA x2 + CetA
esA Bu(s)ds
0
0
tA
x0 = x1 x2 6= 0 t [0, T ] | Ce x0 6= 0
x0 6= 0 y() 6 0 sur [0, T ] pour le systme x = Ax, y = Cx, x(0) = x0
On est maintenant en mesure de montrer le thorme.
Si (14.1) nest pas observable en temps T , alors
x0 6= 0 | t [0, T ] y(t) = 0,
i.e.
t [0, T ] CetA x0 = 0.
C
CA
..
.
x0 = 0,
n1
CA
rang
et donc
249
C
CA
..
.
CAn1
< n.
C
CA
rang . = n rang C T
..
AT C T
CAn1
T
An1 C T = n,
et par consquent, le systme x = Ax + Bu, y = Cx est observable si et seulement si le systme x = AT x + C T u est contrlable. Cest la dualit contrlabilit/observabilit. Ce fait, trs important, permet de transfrer aux systmes
observs tous les rsultats tablis sur les systmes contrls.
On aurait pu prouver cette quivalence directement en utilisant lapplication
entre-sortie, et en remarquant quune application linaire E : L2 IRn est
surjective si et seulement si lapplication adjointe E : IRn L2 est injective.
Corollaire 14.1.3. Le systme (14.1) est observable en temps T si et seulement
si la matrice
Z
T
O(T ) =
esA C T CesA ds
est inversible.
250
sont dits semblables sil existe une matrice P GLn (IR) telle que
A2 = P A1 P 1 , B2 = P B2 , C2 = C1 P 1
(et dans ce cas on a x2 = P x1 , u2 = u1 , y2 = y1 ).
Proposition 14.1.4. Tout systme x = Ax + Bu, y = Cx, est semblable un
x + Bu,
y = C x, avec
systme x
= A
A1 0
, C = (C1 0),
A=
A2 A3
i.e.
1 u
1 = A1 x
1 + B
x
2 u
x
2 = A2 x
1 + A3 x2 + B
y1 = C1 x
1
A3 sont
A1 sont
0
0 an
1 0
.
..
..
..
, C1 = (0 0 1).
.
.
0
A1 =
.
.. 0
..
0
0 1 a1
Exercice 14.1.1 (Ressort). Le systme m
x + kx = u est-il observable
avec y = x ?
avec y = x ?
est-il observable
avec y1 = x1 , y2 = x2 ?
251
avec y = x1 ?
avec y1 = x1 , y2 = x 2 ?
Exercice
vable
avec
avec
avec
14.2
y = ?
y = ?
y1 = , y2 = ?
14.3
Motivation : supposons que le systme x = Ax + Bu, y = Cx, soit observable. Le but est de construire un observateur asymptotique x
() de x(), i.e. une
fonction dynamique x() de lobservable y(), telle que x
(t) x(t) 0. Lide
t+
x
(t) x(t) 0.
t+
252
Thorme 14.3.1 (Thorme de placement des modes propres de lobservateur). Si la paire (A, C) est observable, alors le systme admet un observateur
asymptotique (i.e. on peut construire une matrice de gains L telle que A + LC
soit Hurwitz).
Dmonstration. La paire (AT , C T ) tant contrlable, daprs le thorme de
placement de ples il existe une matrice LT telle que la matrice AT + C T LT
soit Hurwitz.
14.4
On a vu comment construire
un rgulateur (feedback) pour un systme contrlable,
un observateur asymptotique pour un systme observable.
Il semble naturel, pour un systme contrlable et observable, de construire un
rgulateur en fonction de lobservateur asymptotique de ltat : cest ltape de
synthse rgulateur-observateur .
Dfinition 14.4.1. On appelle feedback dynamique de sortie, ou observateurrgulateur, le feedback u = K x
, o
x = A
x + Bu + L(C x
y).
Thorme 14.4.1 (Thorme de stabilisation par retour dynamique de sortie).
Si le systme x = Ax + Bu, y = Cx, est contrlable et observable, alors il est
stabilisable par retour dynamique de sortie, i.e. il existe des matrices de gain
K Mm,n (IR) et L Mn,p (IR) telles que les matrices A + BK et A + LC
soient Hurwitz, et alors le systme boucl
x = Ax + BK x
x
= (A + BK + LC)
x Ly
est asymptotiquement stable.
Dmonstration. Posons e = x
x. Alors
d x
A + BK
=
0
dt e
BK
A + LC
x
,
e
253
= f (x(t), u(t))
y(t) = g(x(t))
Soit (xe , ue ) un point dquilibre, i.e. f (xe , ue ) = 0. Le systme linaris en
(xe , ue ) scrit
x(t)
= Ax(t) + Bu(t)
y(t) = Cx(t)
avec
f
f
g
(xe , ue ), B =
(xe , ue ), C =
(xe ).
x
u
x
Daprs le thorme de linarisation, on obtient le rsultat suivant.
A=
254
u01 + u02 = d0 = V 0 ,
c1 u01 + c2 u02 = c0 d0 = c0 V 0 .
c1 c0
c2 c0
avec = , 1 =
et 2 =
.
0
V
V0
2 V0
(c) Montrer que ce systme linaris est contrlable.
k1
(d) Enoncer et dmontrer une condition suffisante sur K =
k3
pour que le systme boucl par le feedback
0
u1
V V0
u=
+
K
u02
c c0
k2
k4
255
x
m
2 g sin (t)
(t) = x(t)(t)
x
1
=
mgx(t) cos (t) .
(t)
u(t)
2mx(t)
x(t)
(t)
J + mx(t)2
2.
3.
4.
5.
6.
(c) En posant y = x,
= , et X = (x, y, , ), mettre ce systme sous
256
a
k
l
2
u
m
g
1
ka2
ka2
+ , =
, =
.
2
ml
l
ml2
ml2
2
, k1 + k3 + 2 < 2 ,
(k4 +k2 )(k4 (2k3 )+(k4 +k2 )) < k42 (k3 + 2 2 +k1 ).
(b) Construire un tel feedback plaant les ples en 1.
257
L0
,
1 + xa1
o L0 , L1 et a sont des constantes positives. La force lectromagntique (verticale) engendre par llectroaimant est alors
F (x1 , x3 ) =
L0 ax23
.
2(a + x1 )2
x1
R
u
m
lectroaimant
x 1 = x2
L0 ax23
x 2 = g k x2
m
2m(a + x1 )2
L0 ax2 x3
1
Rx
+
x
=
+
u
3
3
(a + x1 )2
L1 + 1+L0x1
a
1. (a) En posant x = (x1 , x2 , x3 )T , mettre ce systme sous forme dun systme de contrle (S) de la forme x(t)
= f (x(t), u(t)).
(b) Montrer que les points dquilibre (xe , ue ) du systme sont de la forme
((r, 0, i), ue ), o r > 0, et
r
2mg
, ue = Ri.
i = (a + r)
L0 a
258
1
L0 ai
, =
.
L0
(a + r)2
L1 + 1+
r
a
0
1
0
0
i
k
m
m
A = m(a+r)
, B = 0 ,
0
R
et montrer quil est contrlable (en temps quelconque).
i
,
a+r
k3 < R +
k
,
m
k
i
i
R +
Rk + 2
k3
+ k2 kk3 > k1 +
.
m
(a + r)
a+r
(b) Construire un tel feedback plaant les ples en 1.
Bibliographie
[1] H. Abou-Kandil, G. Freiling, V. Ionescu, G. Jank, Matrix Riccati equations, Control and systems theory, Systems & Control : Foundations &
Applications, Birkhuser Verlag, Basel, 2003.
[2] A. Agrachev, Y. Sachkov, Control theory from the geometric viewpoint,
Encyclopaedia of Mathematical Sciences, 87, Control Theory and Optimization, II, Springer-Verlag, Berlin, 2004.
[3] B. D. Anderson, J. B. Moore, Optimal filtering, Prentice hall, Englewood
Cliffs, 1979.
[4] B. dAndra-Novel, M. Cohen de Lara, Cours dAutomatique, commande
linaire des systmes dynamiques, les Presses, Ecole des Mines de Paris,
2000.
[5] V. I. Arnold, Mthodes mathmatiques pour la mcanique classique, Editions Mir, Moscou, 1976.
[6] A. Avez, Calcul diffrentiel, Masson, Paris, 1983.
[7] M. Bardi, I. Capuzzo-Dolcetta, Optimal control and viscosity solutions of
Hamilton-Jacobi-Bellman equations, Birkhuser, Inc., Boston, 1997.
[8] G. Barles, Solutions de viscosit des quations de Hamilton-Jacobi, Math.
& Appl. 17, Springer-Verlag, 1994.
[9] A. Bensoussan, Filtrage optimal des systmes linaires, Dunod, Paris, 1971.
[10] M. Bergounioux, Optimisation et contrle des systmes linaires, Dunod,
Collection Sciences Sup, 2001.
[11] J.T. Betts, Practical methods for optimal control and estimation using nonlinear programming, Second edition, Advances in Design and Control, 19,
SIAM, Philadelphia, PA, 2010.
[12] O. Bolza, Calculus of variations, Chelsea Publishing Co., New York, 1973.
[13] B. Bonnard, M. Chyba, The role of singular trajectories in control theory,
Math. Monograph, Springer-Verlag, 2003.
[14] B. Bonnard, L. Faubourg, E. Trlat, Optimal control of the atmospheric
arc of a space shuttle and numerical simulations by multiple-shooting techniques, Math. Models Methods Applied Sci. 2, 15, 2005.
259
260
BIBLIOGRAPHIE
BIBLIOGRAPHIE
261
262
BIBLIOGRAPHIE
[55] H. Maurer, On optimal control problems with bounded state variables and
control appearing linearly, SIAM Journal on Control and Optimization,
Vol. 15, 3, pp. 345362, 1977.
[56] A. Miele, Recent advances in the optimization and guidance of aeroassociated orbital transfers, Acta Astronautica, Vol. 38, 10, pp. 747768, 1996.
[57] H. Nijmeijer, A. J. Van der Shaft, Nonlinear dynamical control systems,
Springer Verlag, 1990.
[58] R. Pallu de la Barrire, Cours dautomatique thorique, Collection Universitaire de Mathmatiques, No. 17, Dunod, Paris, 1966.
[59] F. Pham, Gomtrie diffrentielle, 1992.
[60] L. Pontryagin, V. Boltyanski, R. Gamkrelidze, E. Michtchenko, Thorie
mathmatique des processus optimaux, Editions Mir, Moscou, 1974.
[61] J. Rappaz, M. Picasso, Introduction lanalyse numrique, Presses Polytechniques et Universitaires Romandes, Lausanne, 1998.
[62] A. V. Sarychev, First- and second-order integral functionals of the calculus
of variations which exhibit the Lavrentiev phenomenon, J. of Dynamical
and Control Systems, Vol. 3, No. 4, 1997, 565-588.
[63] J. A. Sethian, Level set methods and fast marching methods. Evolving
interfaces in computational geometry, fluid mechanics, computer vision, and
materials science. Cambridge Monographs on Applied and Computational
Mathematics, 3, Cambridge University Press, 1999.
[64] E. D. Sontag, Mathematical Control Theory, Deterministic Finite Dimensional Systems, Springer-Verlag, 2nd edition, 1998.
[65] J. Stoer, R. Bulirsch, Introduction to numerical analysis, Springer-Verlag,
Berlin, 1980.
[66] O. von Stryk, R. Bulirsch, Direct and indirect methods for trajectory optimization, Annals of Operations Research 37, 1992, 357373.
[67] A. Subbotin, Generalized solutions of first-order PDEs, The dynamical optimization perspective, Systems & Control : Foundations & Applications,
Birkhuser Boston, Inc., Boston, MA, 1995.
[68] H. J. Sussmann, J. C. Willems, The brachistochrone problem and modern
control theory, Contemporary trends in nonlinear geometric control theory
and its applications (Mexico City, 2000), 113166, World Sci. Publishing,
River Edge, NJ, 2002.
[69] H. J. Sussmann, New theories of set-valued differentials and new versions
of the maximum principle of optimal control theory, Nonlinear Control in
the Year 2000, A. Isidori, F. Lamnabhi-Lagarrigue and W. Respondek Eds.,
Springer-Verlag, 2000, 487526.
[70] H. J. Sussmann, A nonsmooth hybrid maximum principle, Stability and
stabilization of nonlinear systems (Ghent, 1999), 325354, Lecture Notes
in Control and Inform. Sci., 246, Springer, London, 1999.
BIBLIOGRAPHIE
263
[71] E. Trlat, Some properties of the value function and its level sets for affine
control systems with quadratic cost, Journal of Dynamical and Control
Systems, Vol. 6, No. 4, 2000, 511541.
[72] E. Trlat, Etude asymptotique et transcendance de la fonction valeur en
contrle optimal ; catgorie log-exp en gomtrie sous-Riemannienne dans
le cas Martinet. Thse de doctorat, Univ. de Bourgogne, 2000.
[73] R. Vinter, Optimal control, Systems & Control : Foundations & Applications, Birkhuser Boston, Inc., Boston, MA, 2000.