Académique Documents
Professionnel Documents
Culture Documents
Cette dtermination rpond souvent un objectif tel que, larrt du Dun point de vue formel, le problme de commande optimale est un
systme en un temps minimum. Trouver C (t ) qui rpond cet objectif, problme de minimisation ou de maximisation dune fonctionnelle ;
est lobjet de la thorie de la commande optimale. c'est--dire, un problme de calcul des variations
Le problme de dtermination dune commande optimale dun 2- Formulation du problme de commande optimale
processus peut snoncer comme suit :
La thorie de la commande optimale couvre toutes les activits
Un processus dynamique tant donn et dfini par son modle dynamiques o une performance optimale est exige. Les systmes
(reprsentation dtat, matrice de transfre, quations aux commander peuvent donc tre dorigine diverses : mcanique,
diffrences,), trouver parmi les commandes admissibles celles qui lectrique, lectronique, biologie, chimie, conomie,
permet la fois :
Chaque problme de commande ncessite une description des
- de vrifier des conditions initiales et finales donns. proprits dynamiques du processus commander.
Les systmes tudis sont dcrits par des variables dtat. Par exemple : physiques
X& = f ( X ,U , t ) o f ( X , U , t ) est une fonction toutefois on peut toujours se ranger dans lune des catgories
- minimiser un temps ;
(c) Systmes discrets linaires
- optimiser une amplitude ;
X k +1 = Ak X k + BkU k
- maximiser un profit o un revenu ;
(d) Systmes discrets non linaires - minimiser une erreur ;
physiques. T
J = dt
t0
T1 1
J = X T QX + U T RU dt
t0
2 2
Cas gnral :
T
J = ( X (T ), T ) + L( X , U , t ) dt
t0
On peut citer :
Alors :
1- lments de calcul des variations
T
Nous prsentons les deux relations les plus importantes pour la dJ ( X ) = h( X (T ), T ) dT h( X (t0 ), t0 ) dt0 + hXT ( X (t ), t ) X (t ) dt
t0
rsolution du problme de commande optimale des systmes continus.
h
Ces relations seront utiles pour la dtermination des conditions ( hX = )
X
ncessaires doptimalit partir de la minimisation du critre augment.
2- Solution du problme de commande optimale des systmes
1.1 Relation entre variation et diffrentielle
continus
Soit X (t ) une fonction continue en t , les deux diffrentielles dX (t ) et
dt sont alors dpendantes. On dfinit la variation X (t ) qui reprsente 2.1 Position du problme
la variation sur X (t ) t fix : Soit le systme dcrit par les quations dtat :
avec X (t ) n et U (t ) m ,
1.2 Rgle de Leibnitz
et soit minimiser le critre :
La rgle de Leibnitz permet de dterminer la variation dune
fonctionnelle de la forme : T
J (t0 ) = ( X (T ), T ) + L( X (t ), U (t ), t ) dt (2)
t0
T
J ( X ) = h( X (t ), t ) dt
t0
o ( X (T ), T ) est la fonction cot terminal et L ( X (t ), U (t ), t ) dcrit le
cot chaque instant sur la trajectoire X (t ) .
( X (T ), T ) = 0 (3)
En utilisons la rgle de Leibnitz pour dterminer dJ , on obtient aprs
avec p appel cible. calcul :
t0
H f L
T
& = = + , t p t0 (4)
X X X
Posons :
appel systme adjoint.
H ( X (t ),U (t ), (t ), t ) = L( X (t ),U (t ), t ) + f ( X (t ),U (t ), t )
T
La troisime condition est appele condition de stationnarit : En effet on a : & = H X (4) et HU = 0 (5).
H f L
T
Si f et L ne dpendent pas du temps alors :
0= = + (5)
U U U
H& = 0
X (t0 ) donn, les variables dX (T ) et dT ne sont pas indpendantes, la
condition terminale est alors : Dans le cas des systmes stationnaires, le Hamiltonien est constant le
long dune trajectoire.
( + ) dX + (t + + H ) dt = 0
T T T
X X t (6)
T T
( X (T ), T ) = 0
Remarques :
( )
T
= H t + HUT U& + H X + & f
{ 14243
0
0
= Ht
(LQ)
La premire condition ncessaire doptimalit redonne les quations
dtats du systme :
Dans ce cas le systme commander est reprsent par des quations
H
dtats linaires et le critre minimiser est quadratique. X& = = AX + BU
X& A BR 1 BT X 1 T T
2 t0
& = J (t0 ) = U RUdt
(13)
Q AT
Il sagit donc de dterminer la commande qui transfre le systme de
3- Solution du problme LQ
ltat initial X (t0 ) donn, ltat final X (T ) = r (T ) donn, en
Pour rsoudre le systme (13), il faut tenir compte des conditions
minimisant lnergie de commande.
terminales. Deux cas sont envisags :
Dans ce cas les quations dtat et les quations adjacentes sont
- Etat final connu, conduisant une commande en boucle ouverte.
donnes par :
- Etat final libre, conduisant une commande en boucle ferme.
X& = AX BR 1 BT (14)
3.1 Commande en boucle ouverte (Etat final connu)
et
On suppose que ltat final est connu X (T ) = r (T ) , cest--
dire dX (T ) = 0 , le temps final tant fix, alors dT = 0 , la & = AT (15)
condition (6) est donc vrifie.
La solution de (15) est obtenue simplement en fonction de (T ) :
Dautre part, puisque X (T ) est fix, le terme
(t ) = e A (T t )
(T )
T
X (T )T S (T ) X (T ) est une constante, il est donc inutile de le (16)
garder dans le critre. En utilisons (16) dans (14) :
Il sagit de rsoudre le systme Hamiltonien (13) form par 2n
X& = AX BR 1BT e A (T t ) (T )
T
(17)
quations diffrentielles couples connaissant la condition initiale
X (t0 ) et condition finale X (T ) . do :
T
X (T ) = e A(T t0 ) X (t0 ) e A (T ) BR 1 BT e A
T
(T )
(T )d ii. Lexpression de U * (t ) montre que la commande optimale est
t0
proportionnelle la diffrence entre ltat final dsir et la
o encore : solution du systme en rgime libre t = T .
U * (t ) = R 1 BT e A (T t )
G 1 (t0 , T ) r (T ) e A(T t0 ) X (t0 )
T
S (T ) X (T ) = (T )
Remarques : 1 T
En effet (6) X = (T ) car ( = X (T ) S (T ) X (T ) ) soit
2
i. La commande optimale est en boucle ouverte puisquelle
S (T ) X (T ) = (T ) .
dpend de ltat initial et non de ltat courant X (t ) .
X& = ( A BG ) X
X& = AX (t ) BR 1 BT S (t ) X (t )
Cette condition, valable pour tout t , nous avons : 4- Commande LQ horizon infini
On suppose que les matrices A, B, Q, R sont indpendantes du temps.
S& = Q + AT S + SA SBR 1 BT S , tpT (19)
En rgime permanent, c'est--dire pour T , en supposant que S (t )
Cette quation diffrentielle non linaire est appele quation de converge, nous avons alors :
Ricatti dans le cas continu. Connaissant S (T ) , on peut dterminer S (t )
S& = 0, t p T
pour t p T .
Dans ce cas S est une constante solution de lquation algbrique de
La commande optimale est donn par :
Ricatti :
U (t ) = R B (t )
* 1 T
AT S + SA SBR 1 BT S + Q = 0 (20)
Soit :
La commande optimale est : Supposons que ( A, C ) est observable. Alors ( A, B ) est stabilisable si et
U = GX (t ) seulement si :
et le systme boucl est donn par : - Le systme boucl donn par (22), o G est donn par (21), est
asympttiquement stable.
X& = ( A BG ) X (22)
Remarques :
Nous devons donc connatre les conditions dexistence dune telle i. La condition de stabilisabilit du systme est une condition
limite pour tout S (T ) . De plus, il serait intressant de savoir quand ncessaire pour la rsolution du problme LQ horizon infini. Or
cette limite est indpendante de S (T ) . un systme est stabilisable sil est commandable, ou si les
variables non commandables ont une dynamique stable.
Les thormes suivants permettent de rpondre ces questions :
Une condition moins forte que la condition de commandabilit
Thorme 1 :
du systme est donc exige. Notons que, comme on la dj vu,
Si ( A, B ) est stabilisable alors pour chaque S (T ) , il existe une limite la solution dans le cas LQ tat final libre et horizon fini, ne
borne S quand T , solution de lquation de Ricatti. Mieux ncessite pas la commandabilit du systme.
encore S est une solution semi dfinie positive de lquation ii. Le deuxime thorme a aussi permis de conclure la stabilit
algbrique de Ricatti. asympttique du systme en boucle ferme.
Thorme 2 : iii. Par un choix convenable de Q et R , on peut placer les ples
Soit C une matrice tel que Q = C T C . dsirs du systme en boucle ferme.
Posons : W 1 HW = D
A BR 1 BT
H = Dfinissons le changement de variables suivants :
Q AT
x W11 W12 w
On montre que la solution de Ricatti peut tre dtermine en fonction = W W
21 22 z
des valeurs propres et vecteurs propres de la matrice H .
Posons : Si S (T ) est la condition terminale de lquation de Ricatti, dfinissons :
la matrice de passage forme par les valeurs propres de H , avec : Quand T la solution de lquation algbrique de Ricatti scrit :
S = W21W121