Vous êtes sur la page 1sur 47

See

discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/229023986

Commande Optimale

Article

CITATIONS READS

0 266

2 authors, including:

Edouard Laroche
University of Strasbourg
87 PUBLICATIONS 427 CITATIONS

SEE PROFILE

All content following this page was uploaded by Edouard Laroche on 17 February 2017.

The user has requested enhancement of the downloaded file. All in-text references underlined in blue are added to the original document
and are linked to publications on ResearchGate, letting you access and read them immediately.
Commande Optimale
rieure de Physique de Strabourg
Ecole Nationale Supe
3A - Option ISAV
Louis Pasteur de Strasbourg
Universite

Edouard Laroche
laroche@lsiit.u-strasbg.fr
http://eavr.u-strasbg.fr/perso/edouard/Student

Bernard Bayle
bernard@eavr.u-strasbg.fr
http://eavr.u-strasbg.fr/~bernard

20072008
Table des mati`
eres
1 Introduction 4

2 Commande optimale 5
2.1 Position du probl`eme . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Principe doptimalite de Bellman . . . . . . . . . . . . . . . . 6
2.3 Principe du minimum de Pontriagine . . . . . . . . . . . . . . 6
2.4 Equation dEuler-Lagrange . . . . . . . . . . . . . . . . . . . 8
2.5 Commande bang-bang . . . . . . . . . . . . . . . . . . . . . . 9

3 Commande Lin eaire Quadratique 9


3.1 Commande LQ `a horizon fini . . . . . . . . . . . . . . . . . . 9
3.2 Commande LQ `a horizon infini . . . . . . . . . . . . . . . . . 11
3.3 Robustesse de la commande LQ . . . . . . . . . . . . . . . . . 12
3.3.1 Difference de retour . . . . . . . . . . . . . . . . . . . 12
3.3.2 Marges de stabilite . . . . . . . . . . . . . . . . . . . . 13
3.4 Structure des regulateurs . . . . . . . . . . . . . . . . . . . . . 13
3.5 Choix des ponderations . . . . . . . . . . . . . . . . . . . . . . 15
3.6 Commande LQ `a temps discret . . . . . . . . . . . . . . . . . 16
3.6.1 Commande LQ `a temps discret `a horizon fini . . . . . . 16
3.6.2 Crit`ere `a horizon infini . . . . . . . . . . . . . . . . . . 18

4 Commande Lin eaire Quadratique Gaussienne 19


4.1 Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.2 Theor`eme de separation . . . . . . . . . . . . . . . . . . . . . 19
4.3 Structure de la commande LQG . . . . . . . . . . . . . . . . 20
4.4 Choix des ponderations . . . . . . . . . . . . . . . . . . . . . . 21
4.4.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . 21
4.4.2 Reglage de lestimateur detat . . . . . . . . . . . . . . 21
4.4.3 Loop Transfert Recovery . . . . . . . . . . . . . . . . . 21
4.5 Commande LQG `a temps discret . . . . . . . . . . . . . . . . 22

5 Commande H2 23
5.1 Norme H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.2 Proprietes . . . . . . . . . . . . . . . . . . . . . . . . . 23
5.1.3 Calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.1.4 Formulation LMI . . . . . . . . . . . . . . . . . . . . . 25
5.2 Probl`eme standard . . . . . . . . . . . . . . . . . . . . . . . . 26
5.3 Equivalence H2 et LQG . . . . . . . . . . . . . . . . . . . . . . 27

2
6 Forme LQG equivalente 28
6.1 Parametrisation de Youla du correcteur LQG . . . . . . . . . 28
6.2 Calcul des param`etres . . . . . . . . . . . . . . . . . . . . . . 29
6.3 Application `a linterpolation de correcteurs . . . . . . . . . . . 30

A Syst`
eme lin eaires multivariables 33
A.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.2 Poles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.3 Commandabilite et observabilite . . . . . . . . . . . . . . . . . 33
A.4 Syst`eme lineaire `a temps variant . . . . . . . . . . . . . . . . . 34
A.4.1 Mod`ele LTV . . . . . . . . . . . . . . . . . . . . . . . . 34
A.4.2 Observabilite . . . . . . . . . . . . . . . . . . . . . . . 35
A.4.3 Commandabilite . . . . . . . . . . . . . . . . . . . . . 35

B Analyse des syst` emes asservis multivariables 36


B.1 Position du probl`eme . . . . . . . . . . . . . . . . . . . . . . . 36
B.2 Valeur singuli`ere . . . . . . . . . . . . . . . . . . . . . . . . . 36
B.3 Trace des valeurs singuli`eres . . . . . . . . . . . . . . . . . . . 37
B.4 Stabilite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
B.5 Suivi de consigne . . . . . . . . . . . . . . . . . . . . . . . . . 39
B.6 Rejet de perturbation . . . . . . . . . . . . . . . . . . . . . . . 39
B.7 Robustesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

C In
egalit
es matricielles affines 40
C.1 Positivite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
C.2 Inegalite matricielle affine ou lineaire . . . . . . . . . . . . . . 40
C.3 Exemple de LMI . . . . . . . . . . . . . . . . . . . . . . . . . 41
C.4 Resolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3
1 Introduction
Les probl`emes de commande optimale se rencontrent dans la vie de tous
les jours : comment arriver `a destination le plus rapidement possible, com-
ment minimiser sa consommation... Pour un syst`eme dynamique donne dont
les equations sont connues, le probl`eme de commande optimale consiste
alors `a trouver la commande minimisant un crit`ere donne. Cest sous cette
forme que la commande optimale a ete etudiee d`es le XIX`eme si`ecle avec
le calcul des variations. Une des grandes applications de la commande op-
timale a ete lapplication au lanceur Apollo dans les annees 1960. Notons
neanmoins que les difficultes soulevees par ce genre de probl`eme sont loin
detre compl`etement resolues comme en temoignent les sessions dediees `a
la commande optimale dans les conferences dautomatique. La commande
optimale reste donc un sujet de recherche dactualite.
On sinteressera dans une premi`ere partie (2) `a la commande optimale
telle quelle a ete posee initialement et dans le cas des syst`emes les plus
generaux. Dans une seconde partie (3), on sinteressera plus particuli`erement
au cas des syst`emes lineaires dans le cas dun crit`ere quadratique, cas connu
sous le nom de commande lineaire quadratique (LQ), ce qui est en fait un
retour detat. On sinteressera ensuite (4) `a la commande lineaire quadra-
tique gaussienne (LQG) permettant de synthetiser un correcteur dynamique
pour un syst`eme dont letat nest pas mesure. On verra au 5 comment la
commande LQG peut se formaliser comme la synth`ese dun correcteur mi-
nimisant une norme matricielle (norme H2 ) entre des signaux particuliers.
Finalement, on sinteressera `a la possibilite dobtenir, pour un correcteur
donne, une forme LQG equivalente.

4
2 Commande optimale
Plutot que de presenter de mani`ere approfondie le probl`eme de la com-
mande optimale, cette partie constitue plutot une introduction au sujet. Le
choix a ete fait de presenter un resultat sappuyant sur le principe du maxi-
mum de Pontriagine sans rentrer dans la theorie du calcul des variations.
Pour approfondir ce domaine, pour pourrez consulter les ouvrages dispo-
nibles [1, 2].

2.1 Position du probl`


eme
Soit un syst`eme `a temps continu de representation detat :

x = f (x, u, t) (1)

et de condition initiale x(t0 ) = x0 , o` u t R, u Rm et x Rn . Les


signaux u et x sont des fonctions de R vers respectivement Rm et Rn . Pour
la condition initiale x0 et la commande u, lequation detat (1) definit une
trajectoire unique x pour letat sur [t0 , tf ]. Celle-ci est fonction de la condition
initiale x0 et de la commande u sur [t0 , tf ].
Soit un crit`ere :
Z tf
J(x0 , t0 , u) = (xf , tf ) + (x, u, t)dt (2)
t0

avec xf = x(tf ). Les fonctions et ainsi que les instants t0 et tf etant


donnes, ce crit`ere ne depend que de x0 et de u sur [t0 , tf ]. Lapplication qui
au signal de commande u associe le crit`ere scalaire J(x0 , t0 , u) est une fonc-
tionnelle. On peut noter que differents crit`eres existent dans la litterature :
le probl`eme de Lagrange :
Z tf
(x, u, t)dt (3)
t0

le crit`ere de Bolza :
Z tf
(xf ) + (x, u, t)dt (4)
t0

le crit`ere de Mayer :
(xf , tf ) (5)

5
Eventuellement au moyen dune augmentation detat du syst`eme, il est interessant
de noter quils sont equivalents.
En plus de lequation detat qui lie les trajectoires de u et de x, dautres
contraintes peuvent intervenir (sans pour autant remettre en cause le crit`ere
choisi). Typiquement :
linstant final peut etre impose ou libre ;
la commande peut appartenir `a un ensemble u U = 6 Rm ;
des contraintes peuvent exister sur letat final : xf X .
Le probl`eme de la commande optimale consiste alors `a trouver la com-
mande u minimisant J(x0 , t0 , u) :

u = min J(x0 , t0 , u) (6)


uU

0 ) = J(x0 , t0 , u)
On notera alors x la trajectoire correspondante de letat et J(x
la valeur du crit`ere.

2.2 Principe doptimalit


e de Bellman
Soit le crit`ere :
Z tf
J(x0 , t0 , u) = (xf , tf ) + (x, u, t)dt (7)
t0

La commande optimale sur [t0 , tf ] est u et le crit`ere optimal :


0 ) = min J(x0 , t0 , u).
J(x (8)
u|[t0 ,t1 ]

Soit t1 [t0 , tf ]. Le principe doptimalite de Bellman enonce que la trajectoire


optimale sur [t0 , tf ] contient la trajectoire optimale sur [t1 , tf ] avec comme
condition initiale x1 = x(t1 ). Autrement dit :
Z t1

J(x0 ) = min
(x, u, t)dt + J(x1 ) . (9)
u|[t0 ,t1 ] t0

Bien que les developpements suivants ne sappuient pas directement sur


ce principe, mais sur le principe du maximum, ce principe est un resultat clas-
sique de la commande optimale et se trouve souvent utilise dans la litterature.

2.3 Principe du minimum de Pontriagine


Le principe du minimum de Pontriagine [3] est ici bri`evement enonce. On
peut se referer `a Sage et White [1] 4.3.1 pour sa demonstration.

6
Soit le syst`eme dequation detat :

x = f (x, u, t) (10)

et le crit`ere de performance :
Z tf
J(x0 , t0 , u) = (xf , tf ) + (x, u, t)dt (11)
t0

On definit lHamiltonien du syst`eme :

H(x, u, p, t) = (x, u, t) + pT f (x, u, t) (12)

u p est appele etat-adjoint1 . Le principe du minimum de Pontriagine enonce


o`
que la trajectoire optimale minimise lHamiltonien du syst`eme. Autrement
dit :
H( x, u, p, t)) 6 H(
x, u, p, t)) u U, t [t0 tf ] (13)
Le long de la trajectoire optimale, on dispose dun certain nombre dequations
permettant de resoudre le probl`eme de commande optimale. Ces equations
sont generalement etablies en utilisant le calcul des variations. Pour plus
dinformations, se reporter `a un ouvrage de reference.
Lextremalite de la solution conduit `a un jeu dequations, appelees equations
canoniques de Hamilton, qui regissent les dynamiques de letat dune part et
de letat adjoint dautre part :
etat
H
= x
p
etat adjoint
H
= p
x
Les equations provenant des conditions dites terminales, en t0 dune part et
en tf dautre part sont appelees equations de transversalite :
`a lorigine
T

H(t0 ) + t0 + p(t0 ) + x0 = 0
t0 x0
`a larrivee
T

H(tf ) + tf + p(tf ) + xf = 0
tf xf
1
En Anglais : costate vector

7
Enfin, selon la nature du probl`eme, on aura encore certaines relations addi-
tionnelles :
si aucune contrainte nest imposee sur u
H
=0
u
si H nest pas une fonction explicite du temps
H dH
= =0
t dt

2.4 Equation dEuler-Lagrange


Cf. [1] 3.5 et [4] 4.1.3.
Lequation dEuler-Lagrange, bien connue en mecanique, peut etre re-
trouvee `a partir du principe du minimum. En notant T = T (q, q), lenergie
cinetique et U = U (q) lenergie potentielle dun syst`eme mecanique, le prin-
cipe de moindre action enonce par Maupertuis postule que le syst`eme evolue
en minimisant lintegrale :
Z tf
(T U )dt. (14)
t0

Notons q les cordonnees generalisees du syst`eme. Soit L(q, q)


= T (q, q)

U (q) le Lagrangien, avec le crit`ere :
Z tf
=
J(q0 , t0 , q)
L(q, q)dt (15)
t0
On consid`ere un syst`eme dont on commande la vitesse, lequation detat du
syst`eme secrivant alors simplement :
q = u (16)
LHamiltonien secrit alors :
H(q, q) + pT q
= L(q, q) (17)
et le principe du minimum donne les deux equations suivantes :
H L
= = p (18)
q q
H L
= +p=0 (19)
q q
En derivant la seconde equation par rapport au temps puis en remplacant p
grace `a la premi`ere, on obtient lequation dEuler-Lagrange :
d L L
= 0. (20)
dt q q

8
2.5 Commande bang-bang
Un type particulier de commande optimale bien connue est la commande
`a temps minimal. Prenons un exemple : vous commandez lacceleration dun
vehicule que vous devez amener dune position initiale darret `a une posi-
tion finale, egalement `a larret, dans le temps le plus court possible. Si lon
consid`ere un mouvement en ligne droite, on concoit intuitivement que la
commande optimale est dans ce cas une acceleration maximale jusqu`a un
certain instant `a partir duquel il faudra freiner au maximum. On parle de
commande bang-bang parce que la commande est toujours saturee, alternati-
vement `a sa valeur minimale ou `a sa valeur maximale. Quant `a la robustesse
de la commande, cest-`a-dire la capacite `a remplir la mission de mani`ere
precise, lorsque la masse du vehicule est imparfaitement estimee, vous ima-
ginez bien que ce genre de commande nest pas tr`es recommandable. Pour
un exemple de ce type de commande, cf. Sage & White [1], 5.3, p. 103.
Un exemple complet de commande en temps minimal sera traite en cours :
celui du double integrateur.

3 Commande Lin
eaire Quadratique
On parle de commande lineaire quadratique : LQ ou LQR pour linear
quadratic regulator. Le syst`eme est lineaire et la commande est quadratique.
La commande optimale est un retour detat.

3.1 Commande LQ `
a horizon fini
Cf. [1] 5.1 et lexemple 5.1-1 (tr`es didactique) ; cf. annexe C de[2].
Soit le probl`eme de commande optimale du syst`eme :
x = A(t)x + B(t)u (21)
avec le crit`ere :
Z tf
1 1 T
J(q0 , t0 , u) = xf Sxf + x Q(t)x + uT R(t)u dt, (22)
2 t0 2
les matrices Q, R et S etant symetriques avec Q et S 0 et R > 0 2 .
LHamiltonien secrit alors :
1
H(x, u, p, t) = pT A(t)x + pT B(t)u + (xT Q(t)x + uT R(t)u). (23)
2
R tf1 T
2
Remarquons que le crit`ere t0 2
(y Qy (t)y + uT R(t)u)dt est equivalent avec Qy =
C T (t)Q(t)C(t).

9
LHamiltonien, verifie les conditions suivantes :
equation de letat adjoint
L
p = = AT (t)p Q(t)x (24)
x
condition de transversalite

p(tf ) = Sxf (25)

absence de contrainte sur la commande


L
= B T (t)p + R(t)u = 0 (26)
u
De lequation (26), on deduit :

u = R1 (t)B T (t)p. (27)

Alors lequation dynamique du syst`eme secrit :

x = A(t)x B(t)R1 (t)B T (t)p. (28)

Les equations (24) et (28) peuvent se mettre sous la forme dun syst`eme
matriciel appele syst`eme hamiltonien :

d x A(t) B(t)R1 (t)B T (t) x
= T (29)
dt p Q(t) A (t) p

Ecrivons p = P (t)x, comme nous y incite (25), avec, dapr`es (25), la


condition finale P (tf ) = S. Lequation (24) secrit alors :

p = AT (t)P (t) + Q(t) x. (30)

Avec p = P x+P x et lequation detat (21) du syst`eme, lequation (30) secrit


(en omettant la reference au temps afin dalleger les notation) :

(P + P A + AT P P BR1 B T P + Q)x = 0 (31)

La solution est alors obtenue en resolvant lequation (differentielle) de Riccati


suivante :
P + P A + AT P P BR1 B T P + Q = 0 (32)
avec la condition finale P (tf ) = S.
On montre que la condition :

xT (P + P A + AT P P BR1 B T P + Q)x = 0 (33)

10
secrit aussi :
d T
(x P x) + xT Qx + uT Ru = 0. (34)
dt
Le crit`ere :
Z tf
1 1 T
J(x0 , t0 , u) = xf Sxf + (x Q(t)x + uT R(t)u)dt. (35)
2 t0 2
secrit alors :
Z tf
1 d T
J(x0 , t0 , u) = xf Sxf (x P x)dt . (36)
2 t0 dt

soit, avec la condition de transversalite S = P (tf ) :


1
J(x0 , t0 , u) = xT0 P (t0 )x0 (37)
2
Le minimum du crit`ere est donc :

0 ) = J0 (t0 , x0 , u) = 1 x0 P (t0 )x0 .


J(x (38)
2
Il est interessant de noter que la commande optimale obtenue secrit
comme un retour detat u = K(t)x avec :

K = R1 B T P. (39)

Neanmoins, noublions pas que, dans le cas present, K varie en fonction du


temps, meme dans le cas dun syst`eme et dun crit`ere `a temps invariant
(cest-`a-dire si les matrices A, B, Q et R ne dependent pas du temps). En
effet, la matrice P (t) reste dependant du temps dans le cas dun crit`ere `a
temps fini.

3.2 Commande LQ `
a horizon infini
Interessons nous ici au cas du syst`eme LTV precedent o`
u:
Z
1 T
J(x0 , t0 , u) = x Q(t)x + uT R(t)u dt. (40)
t0 2

On montre que ce crit`ere est fini si le syst`eme est stabilisable `a tout instant t,
(cest-`a-dire qu`a chaque instant, il existe un K(t) tel que les valeurs propres
de A BK soient `a partie reelle negative). Remarquons par ailleurs que
la partie du crit`ere concernant letat final nest plus pertinente car, sur un
horizon infini, letat tend vers zero si le syst`eme boucle est stable.

11
Dans le cas dun probl`eme LTI (lineaire `a temps invariant), la commande
optimale est un retour detat statique u = Kx o` u K est exprime par
lequation (39) et o`
u P verifie lequation algebrique de Riccati :

P A + AT P P BR1 B T P + Q = 0. (41)

La resolution de lequation algebrique de Riccati (41), disponible dans les


Toolboxes du logiciel Matlab, depasse le cadre de ce cours.

3.3 Robustesse de la commande LQ


Cf. [2] pp. 104 & 122, cf. [5]. Sur les proprietes de robustesse de la com-
mande LQ, cf. [6].

3.3.1 Diff
erence de retour
A partir de lequation de Riccati, faisons apparatre les termes sI A en
ajoutant P sI sIP o` u I est la matrice unite3 :

P (sI A) + (sI AT )P + P BR1 B T P = Q (42)

Multiplions `a droite par (sI A)1 B et `a gauche par B T (sI AT )1 :

B T (sI AT )1 P B + B T P (sI A)1 B


+B T (sI AT )1 P BR1 B T P (sI A)1 B (43)
= B T (sI AT )1 Q(sI A)1 B.

En notant que dapr`es (39), on a B T P = RK et P B = K T R, on obtient :

B T (sI AT )1 K T R + RK(sI A)1 B


+B T (sI AT )1 P BR1 B T P (sI A)1 B (44)
= B T (sI AT )1 Q(sI A)1 B.

Le premier membre de legalite secrit :

(I + B T (sI AT )1 K T )R(I + K(sI A)1 B) R. (45)

On obtient finalement lequation de la difference de retour :

(I + B T (sI AT )1 K T )R(I + K(sI A)1 B)


(46)
= R + B T (sI AT )1 Q(sI A)1 B.
3
Ces calculs sont repris de [7], II.7 ; voir aussi [2], 5.2.

12
3.3.2 Marges de stabilit
e
Reprenons lequation de la difference de retour en frequentiel avec s = j
et en notant H(j) = (jI A)1 B. On obtient alors pour tout :

(I + KH(j))H R(I + KH(j)) = R + H H (j)QH(j) (47)

u M H est le hermitien de M , cest-`a-dire le conjugue transpose. On en


o`
deduit alors linegalite de Kalman :

(I + KH(j))H R(I + KH(j)) R. (48)

Restreignons nous au cas o` u R = I et factorisons Q en4 Q = LT L.


Legalite (47) secrit alors :
1
(I + KH(j))H (I + KH(j)) = I + (LH(j))H (LH(j)) (49)

dont on deduit les valeurs singuli`eres de I + H(j)K :


p
i (I + KH(j)) = i ((I + KH(j))H (I + KH(j))) (50)
s
1 H
= i I + (LH(j)) (LH(j)) (51)

r
1
= 1 + i2 (LH(j)) (52)

1 (53)

u i represente la i`eme valeur propre5 . En monovariable, ce resultat sin-


o`
terpr`ete facilement sur le lieu de Nyquist, comme le fait que la distance au
point 1 est toujours superieure `a 1. Ainsi, la commande LQ presente la
propriete de robustesse suivante : sa marge de module est egale a` 1. On en
deduit ainsi les intervalles dans lesquels le gain et la phase peuvent varier :
gain ]0, 5 ; +[,
phase ] 60 ; 60[

3.4 Structure des r


egulateurs
Lorsque des signaux de consigne y sont donnes pour certaines compo-
santes y de x, comment les integrer `a la loi de commande ? Imaginons que
4
Cest toujours possible puisque Q 0, par exemple avec une factorisation de Choleski.
5
En utilisant les proprietes i2 (M ) = i (M H M ) et i (I + M ) = 1 + i (M ).

13
les consignes concernent les premi`eres composantes de x et decomposons x
et K ainsi :
y
Kx = [Ky Kz ] (54)
z
Alors la loi de commande sera :

u = Ky (y y) Kz z. (55)

Si y est donne par une loi de type equation de sortie, y = Cx, on peut effectuer
un changement detat de sorte que le nouveau vecteur detat contienne y, par
exemple en utilisant la forme canonique dobservabilite.
La commande LQ est de type proportionnelle. Dans le but dameliorer
les performances en regulation en presence de perturbations constantes, il est
souhaitable dajouter un effet integral. Imaginons, `a titre dexemple, que la
premi`ere composante x1 de x doive etre asservie `a x1 sans erreur statique.
Construisons letat supplementaire :
Z t
I1 = (x1 ( ) x1 ( ))d (56)
0

avec lequation correspondante :

I1 = x1 x1 (57)

En considerant x1 comme une perturbation constante et, de ce fait, en ne


lintegrant pas dans le mod`ele, lequation detat du syst`eme augmente de son
nouvel etat I1 secrit :
x e = Ae (t)xe Be (t)u (58)
o`
u le vecteur detat augmente est :

x
xe = (59)
I1

et les matrices detat sont6 :



A On1
Ae = (60)
[1 O1n1 ] 0

B
Be = (61)
O1m
6
La matrice Okl represente la matrice nulle de dimension k l.

14
Sur ce mod`ele, un regulateur Ke Rmn+1 de type LQ peut etre synthetise.
Decomposons Ke selon :

x
Ke xe = [K KI ] (62)
I1

Le regulateur obtenu, dentrees x et x1 , et de sortie u est un syst`eme dyna-


mique dordre 1 de mod`ele detat :

I1 = x1 x1
(63)
u = KI I1 Kx

La consigne x1 peut aussi etre retranchee `a x1 ; dautres consignes peuvent


etre integrees de la meme mani`ere en retranchant leur valeur `a letat corres-
pondant. Si une commande en boucle ouverte (feed-forward) est disponible,
elle peut etre egalement integree ; la commande sera alors la somme de la
commande en boucle fermee et de la commande en boucle ouverte.

3.5 Choix des pond


erations
Il est interessant de remarquer dabord que la multiplication des ponderations
Q et R par un meme scalaire laisse inchange le gain K. En effet, soit P so-
lution de (41) et soit le nouveau probl`eme base sur les ponderations Q = Q

et R = R. On verifie que P = P est solution de lequation de Riccati
correspondante. En effet :
= R
K 1 B T P = RB T P = K (64)

Sans restriction, les ponderations peuvent etre choisies symetriques. Elles


sont generalement choisies diagonales. Ainsi, on se ram`ene au choix de n
scalaires pour letat et de p scalaires pour la commande. Voici une methode
simple de choix et de modification des ponderations en vue daboutir `a un
correcteur satisfaisant.
1. Au depart, on choisit generalement des ponderations egales aux ma-
trices identite.
2. Dans une seconde etape, on accel`ere ou decel`ere globalement le syst`eme
en multipliant la matrice Q par un scalaire (acceleration avec > 1
et deceleration avec < 1), jusqu`a obtenir une dynamique moyenne
adaptee.
3. Dans le cas o`u certains etats auraient des dynamiques trop lentes par
rapport `a dautres, on peut choisir daugmenter la ponderation de Q
correspondant aux premiers.

15
4. Dans le cas o`u certains actionneurs seraient trop sollicites par rapport
`a dautres, on peut choisir daugmenter la ponderation de R leur cor-
respondant.
Les etapes 2, 3 et 4 peuvent etre reiterees dans lordre souhaite jusqu`a obtenir
un correcteur satisfaisant le cahier des charges.

3.6 Commande LQ `
a temps discret
Cf. 9 de [8].

3.6.1 Commande LQ `
a temps discret `
a horizon fini
Soit le syst`eme dynamique `a temps discret defini par :

x(k + 1) = A(k)x(k) + B(k)u(k) (65)

avec la condition initiale x(0) = x0 et cherchons la commande minimisant le


crit`ere :
k=n
1X T
J= x (k)Q(k)x(k) + uT (k)R(k)u(k). (66)
2 k=0
Ce probl`eme est plus simple que celui `a temps continu car il sagit ici dun
probl`eme dont les inconnues sont les n + 1 valeurs de u(k) et non plus une
fonction du temps. Il sagit dune minimisation de (66) sous les contraintes
(65). Le Lagrangien secrit alors :
k=n
X 1 T 1
L= x (k)Q(k)x(k) + uT (k)R(k)u(k)
k=0
2 2

+pT (k + 1) (x(k + 1) + A(k)x(k) + B(k)u(k)) (67)

et la solution optimale verifie les equations suivantes :


L
= R(k)u(k) + B T (k)p(k + 1) = 0 (68)
u(k)
L
= Q(k)x(k) p(k) + AT (k)p(k + 1) = 0 (69)
x(k)
L
= x(k + 1) + A(k)x(k) + B(k)u(k) = 0 (70)
p(k + 1)

Lequation de la commande (68) donne :

u(k) = R1 (k)B T (k)p(k + 1). (71)

16
La derni`ere commande u(n) nintervient pas levolution du syst`eme sur lho-
rizon considere ; sa valeur optimale est donc nulle :

u(n) = 0. (72)

On a ainsi :
p(n + 1) = 0 (73)
et dapr`es lequation adjointe (69) :

p(n) = Q(n)x(n). (74)

Choisissons alors pour la variable adjointe :

p(k) = P (k)x(k) (75)

avec P (n) = Q(n). La commande u(k) verifie alors :

R(k)u(k) = B T (k)P (k + 1)x(k + 1) (76)


= B T (k)P (k + 1)(A(k)x(k) + B(k)u(k)) (77)

et peut donc secrire :


u(k) = K(k)x(k) (78)
avec :
1 (k)B T (k)P (k + 1)A(k)
K(k) = R (79)
o`
u:

R(k) = R(k) + B T (k)P (k + 1)B(k). (80)
Il reste maintenant `a determiner la matrice P (k). Partant de (69), on obtient :

P (k)x(k) = Q(k)x(k) + AT (k)P (k + 1)x(k + 1) (81)


= Q(k)x(k) + AT (k)P (k + 1)(A(k)x(k) + B(k)u(k)) (82)

Dapr`es (78), on obtient :



P (k)x(k) = Q(k) + AT (k)P (k + 1)(A(k) B(k)K(k)) x(k). (83)

Comme cette equation doit etre verifiee pour tout x(k), il est necessaire que :

P (k) = Q(k) + AT (k)P (k + 1)(A(k) B(k)K(k)), (84)

ce qui secrit :
P (k) = Q(k) + AT (k)M (k + 1)A(k), (85)

17
avec :

M (k+1) = P (k+1)P (k+1)B(k)(R(k)+B T (k)P (k+1)B(k))1 B T (k)P (k+1).


(86)
Cette equation recursive `a inconnue matricielle est appelee equation de Ric-
cati discr`ete. Sa condition finale est P (n) = Q(n) et sa resolution se fait donc
`a rebours. Dans le cas de syst`emes LTV o` u les matrices A, B dependent ef-
fectivement de k ou bien si cest le cas des matrices de ponderation Q et R,
cela suppose de connatre `a lavance lensemble des matrices pour k = 0 . . . n.

3.6.2 Crit`
ere `
a horizon infini
Cherchons la commande minimisant le crit`ere :

1X T
J= x (k)Qx(k) + uT (k)Ru(k). (87)
2 k=0

Il sagit du crit`ere precedent o`


u n tend vers linfini.
On peut montrer alors que pour un syst`eme LTI le gain du retour detat
est constant. Il secrit :

K = (R + B T P B)1 B T P A (88)

o`
u P est solution de lequation algebrique de Riccati discr`ete :

P = Q + AT (P P B(R + B T P B)1 B T P )A. (89)

La resolution de cette equation non lineaire nest pas triviale. Des algorithmes
[9] sont disponibles dans les Toolboxes du logiciel Matlab [10].

18
4 Commande Lin
eaire Quadratique Gaussienne

Par rapport `a la commande LQ, la commande LQG presente linteret de


sappliquer `a des syst`emes dont letat nest pas mesure. Developpee au debut
de la seconde moitie du 20`eme si`ecle et appliquee lors du programme spatial
Apollo pour la stabilisation de lanceurs, elle est apparu comme la premi`ere
methode generale pour lasservissement des syst`emes multivariables. De ce
fait, elle a connu un grand succ`es comme en temoigne les nombreuses publi-
cations sur le sujet. Depuis la fin du 20`eme si`ecle, la commande H apparat
comme un serieux concurrent pour lasservissement robuste des syst`emes
multivariables. Neanmoins, la commande LQG nen demeure pas moins un
standard industriel.

4.1 Formulation
Soit le syst`eme dynamique stochastique dequation detat :

x = Ax + Bu + v
(90)
y = Cx + w

o`
u le bruit detat v et le bruit de mesure w sont des bruits blancs centres de
variance E{v T v} = V 0 et E{wT w} = W > 0. Le probl`eme LQG consiste
en la minimisation du crit`ere :
Z tf
1 T T

J(x0 , t0 , u) = lim E x Qx + u Ru dt , (91)
tf tf t0

o`
u Q 0 et R > 0. Du fait des entrees de bruit v et w, les grandeurs u
et x sont des grandeurs stochastiques. Comme crit`ere, il est ainsi naturel de
sinteresser `a lesperance dune integrale. Comme pour la commande LQ, il
est possible de considerer des crit`eres `a temps fini.

4.2 Th
eor`
eme de s
eparation
La solution de ce probl`eme de commande optimale de processus stochas-
tique est bien connue sous le nom de theor`eme de separation7 . Ce theor`eme
enonce que la solution du probl`eme est composee de deux parties :
un observateur de Kalman permettant de donner lestimee x de x qui
est non biaisee et `a variance minimale,
7
En Anglais : Seperation Theorem ou Certainty Equivalence Principle.

19
la commande par retour detat u = K x `a appliquer `a x o` u K est
calcule en considerant le probl`eme LQ correspondant (en enlevant v et
w de lequation detat et E dans le crit`ere).
Ce theor`eme est interessant dans la mesure o`u il donne la solution du probl`eme
complet comme etant la reunion des solutions de deux probl`emes plus simples
et dej`a resolus : celui de la commande LQ et celui de lestimation de Kalman.
Pour une demonstration de ce theor`eme, cf. [2] 8.2 et [11].

4.3 Structure de la commande LQG


Lestimee optimale x est donnee par lobservateur dequation detat :

x = A
x + Bu + L(y C x), (92)

o`
u le gain de Kalman est :

L = C T W 1 , (93)

avec la solution de lequation algebrique de Riccati :

AT + A C T W 1 C + V = 0. (94)

La commande etant donnee par u = K x, on peut reecrire les equations


de la commande dentree y et de sortie u :

x = (A BK LC) x + Ly
(95)
u = K x

Le suivi dune consigne y se fera par la loi de commande u = C(s)(y y)


o`
u la fonction de transfert du correcteur est :

C(s) = K(sI A + BK + LC)1 L. (96)

Ses equations detat sont :



x = (A BK LC)
x + L
(97)
u = K x

u = y y. Notons que ce correcteur LTI a le meme ordre que le processus.


o`

20
4.4 Choix des pond
erations
4.4.1 G
en
eralit
es
Le reglage du correcteur LQG necessite la donnee de quatre matrices de
ponderation : Q et R pour le retour detat ; V et W pour lestimateur. La
methode de reglage la plus simple repose sur un reglage separe : regler V et W
de sorte que letat soit bien reconstruit et regler Q et R pour avoir un bon
retour detat. Si les dynamiques de la regulation sont relativement lentes
devant celles de lobservation, on peut supposer que letat est parfaitement
connu du point de vue du retour detat et la commande sera robuste (marge
de module egale `a 1). Si cette hypoth`ese nest pas respectee, et ce sera le cas
d`es que vous souhaiterez obtenir un regulateur avec des dynamiques elevees,
la robustesse nest plus assuree. La methode de reglage des ponderations Q
et R du retour detat vue au paragraphe precedent reste valable. Abordons
la question du reglage de lestimateur avant de presenter les methodes de
recouvrement du gain destinees `a rendre robuste la commande LQG.

4.4.2 R
eglage de lestimateur d
etat
Lestimateur detat sappuie sur la commande u et sur la mesure y du
syst`eme pour donner lestimee de letat la plus plausible, compte-tenu des
incertitudes et bruits affectant le mod`ele et la mesure.
Une premi`ere approche du reglage du filtre concerne le cas o`
u lhypoth`ese
de depart sur le mod`ele est respectee ; cest-`a-dire que le seul defaut du
mod`ele est detre affecte par des signaux stochastiques blancs. Dans ce cas,
le reglage se fera directement par une evaluation des variances des bruits.
Evaluer le bruit de mesure w en observant y est direct ; ce qui nest pas le cas
du bruit detat v. Ce bruit peut etre attribue `a la commande u en choisissant
V = BVu B T , avec Vu la variance du bruit de mesure.
Cependant, la principale source de bruit detat dun mod`ele provient
generalement des erreurs de modelisation qui sont deterministes et non sto-
chastiques. Neanmoins ces erreurs de modelisation sont generalement mal
connues et il nest pas aberrant den tenir compte globalement grace `a un
terme stochastique. La validation du filtre de Kalman peut alors se faire en
simulation en introduisant des erreurs sur le mod`ele telles que des variations
sur ses param`etres.

4.4.3 Loop Transfert Recovery


Cf. [2] 8.4, p.236.

21
La presence dun observateur fait que les proprietes de robustesse du cor-
recteur LQ ne sont plus valables [12]. Les methodes de Loop Transfert Reco-
very (LTR ou en Francais recouvrement du transfert de la boucle) consistent
`a modifier les conditions de la synth`ese afin de se rapprocher du transfert
qui serait obtenu avec un retour detat LQ. Si ce transfert est obtenu, la
robustesse est alors assuree. Depuis les premiers travaux de Doyle et Stein en
1981 [13], de nombreux travaux ont ete menes sur ce sujet [14, 15, 16]. Cest
cette premi`ere approche qui est presentee ici ; elle est egalement presentee
dans [5]. Elle a linconvenient de ne pas convenir aux syst`emes `a dephasage
non-minimal8 . Des travaux ulterieurs se sont attaches `a ce type de syst`eme
[17].
La methode de recouvrement repose sur lecriture de la matrice de cova-
riance V de la forme :
V = V0 + q 2 BB T . (98)
On montre que le gain de la boucle ouverte C(s)G(s) tend vers K(sI A)1 B,
celui du regulateur LQ, lorsque q tend vers linfini. Ainsi, `a partir dun correc-
teur initial reposant sur les ponderations V0 et W , on augmente petit-`a-petit
q jusqu`a obtenir la robustesse suffisante.
Une approche duale consiste `a retoucher le gain du retour detat en choi-
sissant la matrice de ponderation Q de la forme :

Q = Q0 + q 2 C T C. (99)

La methode reste la meme : on augmente q jusqu`a obtenir la robustesse


desiree. Dans tous les cas, laugmentation de la robustesse se fait au detriment
des performances et un compromis doit etre trouve.

4.5 Commande LQG `


a temps discret
A limage de la commande LQG `a temps continu, la version `a temps
discret consiste en la combinaison dun filtre de Kalman `a temps discret et
dun retour detat. La methode LTR sapplique egalement.

8
Il sagit des syst`emes possedant des zeros `a partie reelle positive.

22
5 Commande H2
Les commandes LQ et LQG peuvent se mettre sous une forme particuli`ere
dite forme standard. Il sagit alors de synthetiser un correcteur minimisant
une norme sur les signaux de transfert.

5.1 Norme H2
La presentation de la norme H2 reprend celle de [5], 1.2.

5.1.1 D
efinition
Soit G(s) le syst`eme LTI multivariable defini par :

x A B x
= (100)
z C D v

avec D = O (syst`eme strictement propre9 ). On definit la norme matricielle


H2 de ce syst`eme par :
s Z

1 H
||G||2 = tr [G (j)G(j)] d (101)
2

5.1.2 Propri
et
es
Soit g la reponse impulsionnelle du syst`eme. Dans le cas monovariable, le
theor`eme de Parseval donne une forme equivalente10 :
Z
2
||G||2 = g T (t)g(t)dt. (102)
0

Dans le cas monovariable, la norme H2 du syst`eme est egale `a lenergie de la


reponse impulsionnelle.
Supposons maintenant que v soit un bruit blanc gaussien verifiant
9
Cette restriction est necessaire pour que la norme du syst`eme soit finie.
10
On rappelle que la fonction de transfert est la transformee de Laplace de la reponse
impulsionnelle.

23
E{v(t)v T ( )} = I(t ) et calculons la puissance de sortie :

E{z T z} = tr E{zz T }
Z + Z +
T T
= tr E g(t 1 )v(1 )v (2 )g (t 2 )d1 d2

Z + Z +
T
T
= tr g(t 1 )E v(1 )v (2 ) g (t 2 )d1 d2

Z +
T
= tr g(t )g (t )d

Z +
T
= tr g( )g ( )d

Z +

= tr g T ( )g( ) d

Z +
1
= tr GH (j)G(j) d
2
= ||G||2

Ainsi, la norme H2 est la puissance de sortie lorsque le syst`eme est alimente


pas un bruit blanc gaussien unitaire.

5.1.3 Calcul
La norme H2 peut etre calculee pour tous les syst`emes strictement propres
(D = O) et strictement stables. En effet, elle peut secrire ainsi :
Z
2

||G||2 = tr g T (t)g(t) dt (103)
0
Z
T
= tr B exp(AT t)C T (C exp(At)B) dt (104)
0
Z
T T T
= tr B exp(A t)C C exp(At)dtB (105)
0

ou encore :
Z
||G||22 = tr g(t)g T (t) dt (106)
0
Z
= tr (C exp(At)B) B T exp(AT t)C T dt (107)
0 Z
T T T
= tr C exp(At)BB exp(A t)dtC (108)
0

24
soit :
||G||22 = tr B T Wo B = tr CWc C T (109)
o`
u Wo et Wc sont les Gramiens de commandabilite et dobservabilite :
Z
Wo = exp(At)BB T exp(AT t)dt (110)
0
Z
Wc = exp(AT t)C T C exp(At)dt (111)
0
11
Ils peuvent etre obtenus comme les solutions des equations de Lyapunov
suivantes :

AWc + Wc AT + BB T = 0 (112)
AT Wo + Wo A + C T C = 0 (113)

En effet, partons de :
d
exp(At)BB T exp(AT t) = A exp(At)BB T exp(AT t)+exp(At)BB T exp(AT t)AT .
dt
(114)
En notant que pour un syst`eme stable :

lim exp(At) = 0, (115)


t

et en integrant sur [0, ], on obtient directement les deux equations de Lya-


punov. Cest cette methode qui est utilisee dans les Toolboxes de Matlab
pour le calcul de la norme H2 [10].

5.1.4 Formulation LMI


Les inegalites matricielles affines (LMI pour inegalites matricielles lineaires)
sont devenues un outil classique de lautomatique. Ils sont `a la base de nom-
breuses methodes innovantes et les methodes classiques ont generalement une
formulation LMI. Une introduction sur les LMI est developpee en Annexe B.
Voici la formulation LMI de la norme H2 [18].
11
Dapr`es la theorie de Lyapunov, lequation AX + X T A + Q = 0 dinconnue X, avec Q
symetrique definie positive, a une solution positive si A est Hurwitz (ses poles sont `a partie
reelle strictement negative). Alors une solution symetrique peut etre facilement obtenue
par la resolution dun syst`eme de n(n + 1) equations lineaires `a autant dinconnues (les
composantes de X), o` u n est la dimension de A. La resolution de lequation de Lyapunov
est disponible dans les Toolboxes [10].

25
Soit S0 la solution de lequation de Lyapunov (112), cest-`a-dire verifiant :
AS0 + S0 AT + BB T = 0, (116)
avec S0 = S0T 0. Alors toute matrice S verifiant :
AS + SAT + BB T < 0 (117)
verifie aussi S > S0 .
Le syst`eme G(s) stable avec D = 0 verifie ||G||22 < si et seulement si il
existe une matrice symetrique positive, :
S > 0, (118)
verifiant (117) et :
tr CSC T < . (119)
Lensemble des inegalites (117-119) constitue un syst`eme LMI et peut se
resoudre avec les solveurs disponibles [19, 20].

5.2 Probl`
eme standard
Soit le syst`eme dynamique LTI dequations detat :

x A B1 B2 x
z = C1 D11 D12 v (120)
y C2 D21 D22 u
qui peut aussi secrire sous forme de fonction de transfert :

z(s) G11 (s) G12 (s) v(s)
= (121)
y(s) G21 (s) G22 (s) u(s)
avec :
G11 (s) = D11 + C1 (sI A)1 B1
G12 (s) = D12 + C1 (sI A)1 B2
(122)
G21 (s) = D21 + C2 (sI A)1 B1
G22 (s) = D22 + C2 (sI A)1 B2
On appelle probl`eme standard le probl`eme consistant `a trouver la loi de
commande :
u(s) = K(s)y(s) (123)
tel que le transfert Tzv entre v et z, du syst`eme boucle, minimise une norme
matricielle donnee.
En considerant la norme H2 , on parlera de synth`ese H2 standard. Une
autre technique populaire repose sur la norme H 12 et fait lobjet dun
enseignement specifique de la formation.
12
La norme H dun syst`eme G(s) est le maximum pour [0, ] de la plus grande
des valeurs singuli`eres de G(j).

26
5.3 Equivalence H2 et LQG
Considerons dabord le cas de la commande LQ avec le crit`ere :
Z
T
J= x Qx + uT Ru dt. (124)
0

Ce crit`ere peut secrire :


Z
J= z T (t)z(t)dt. (125)
0

avec :
Q1/2 x
z= (126)
R1/2 u
En utilisant le theor`eme de Parseval , on obtient :
Z
1
J= Z H (j)Z(j)d. (127)
2

o`
u Z(s) est la transformee de Laplace de z. En boucle fermee et en absence
de signal exog`ene, z ne depend que de la condition initiale et on a Z(s) =
M (s)x0 . On a alors :
Z
1 T H
J = tr x M (j)M (j)x0 d (128)
2 0
Z
xT0 x0 H
= tr M (j)M (j) d (129)
2
= ||M ||22 x20 (130)

La commande LQ est alors la commande minimisant la norme H2 du transfert


entre x0 et z.
Considerons desormais la commande LQG et posons :

v = L (131)
w = N (132)

o`u et sont des bruits blancs de variance unitaire. On montre alors que le
correcteur LQG est equivalent au correcteur H2 minimisant le transfert entre
[ T T ]T et z = [xT Q1/2 uT R1/2 ]T [15].

27
6 Forme LQG
equivalente
Un correcteur quelconque de meme ordre que le processus peut se mettre
sous la forme dun correcteur LQG. Cette possibilite, expliquee dans ce pa-
ragraphe, presente plusieurs interets. Tout dabord, cela signifie quun cor-
recteur initial obtenu par une autre methode et que lon voudrait ameliorer
grace `a une synth`ese LQG peut servir de point de depart pour le reglage des
ponderations. Ensuite, la methode LQG a comme interet que les etats du cor-
recteur sont les estimees des etats du syst`eme ; ils peuvent donc etre utilises
dans un but de diagnostic ou de supervision. Dans ce cas, il est interessant
dimplanter le correcteur sous forme LQG quelle que soit la methode de
synth`ese. Lobtention de cette forme LQG equivalente repose sur une pro-
priete particuli`ere de cette forme, donnant lieu `a ce quon appelle la pa-
rametrisation de Youla. Des complements sur la forme LQG equivalente
peuvent etre trouves dans les references [21, 22].

6.1 Param
etrisation de Youla du correcteur LQG
Considerons le syst`eme complet compose du processus et de sa commande
LQG avec le signal dentree w tel que u = w K x et comme sortie lerreur
destimation de la sortie, egalement appelee innovation, y = y y = y C x.
La representation detat de ce syst`eme boucle secrit :

x = Ax BK x + Bw
x = LCx + (A BK LC) x + Bu (133)

y = Cx C x

En utilisant comme vecteur detat :



x x
= , (134)
x x x

le mod`ele secrit :

x = (A BK)x BKx + Bw
x = (A LC)x (135)

y = Cx

De par sa structure, il apparat que ce syst`eme presente n poles non obser-


vables (les valeurs propres de A BK qui sont independants du gain dob-
servation L) et n poles non commandables (les valeurs propres de ALC qui
sont independantes du gain de la commande K). Il sagit l`a dune autre ex-
pression du principe de separation : les poles du syst`eme boucle sont reglables

28
independamment par le gain de la commande et par le gain de lobservateur13 .
Ainsi, aucun mode du syst`eme nest `a la fois commandable (par lentree w) et
observable (par la sortie y ). Le transfert entre w et y est donc nul. On peut
alors ajouter un transfert N (s) quelconque sans changer le comportement
du syst`eme. Ce parametrage du correcteur par un bouclage sur un transfert
exterieur N (s) est appele parametrisation de Youla .
En notant le mod`ele de N (s) :

x N = AN xN + BN y
(136)
w = CN xN + DN y

on peut alors ecrire les equations du correcteur :



x = (A LC BK BDN C) x + BCN xN + (L + BDN )y
x = BN C x + AN xN + BN y (137)
N
u = (K + DN C) x + CN xN + DN y

6.2 Calcul des param`


etres
Cherchons sil est possible dobtenir un correcteur LQG (cest-`a-dire les
gains K et L ainsi que le syst`eme N (s)) identique `a un correcteur {AK , BK , CK , DK }
quelconque dordre n. Pour que les correcteurs soient de meme ordre, N (s)
doit etre statique, cest-`a-dire que seul DN est non nul parmi les matrices
detat de N (s). Le mod`ele du correcteur LQG secrit alors :

x = (A LC BK BDN C) x + (L + BDN )y
(138)
u = (K + DN C) x + DN y

Les deux correcteurs sont identiques du point de vue entree/sortie sil existe
un changement detat T :
xK = T x (139)
tel que

T 1 AK T = A LC BK BDN C (140)
T 1 BK = L + BDN (141)
CK T = K DN C (142)
DK = DN (143)
13
Afin de mieux visualiser ce resultat, le lecteur est invite `a representer graphiquement
le syst`eme dequations (135)

29
ce qui secrit :

DN = DK (144)
K = CK T DK C (145)
L = T 1 BK BDK (146)
0 = T BCK T T (A BDK C) + AK T + BK C (147)

La derni`ere equation est une equation algebrique de Riccati non symetrique


(GNARE pour Generalized Non-symetric Algebraic Riccati Equation) et
peut se mettre sous la forme hamiltonienne :

A + BDK C BCK I
[T I] = 0. (148)
BK C AK T

Pour la resolution, cf. [22]. Une fois T determine, les matrices K, L et DN


peuvent etre calculees.

6.3 Application `
a linterpolation de correcteurs
Une application de ces techniques est la synth`ese de correcteurs `a gains
sequences (gain scheduling en anglais) `a partir dinterpolation de correcteurs
LTI. Imaginez que le comportement du syst`eme `a asservir varie en fonc-
tion dune variable dite variable de sequencement. Pour differentes valeurs
constantes k de , le comportement de votre syst`eme est lineaire et connu
(par des lois de la physique ou par identification). On peut alors synthetiser
une batterie de correcteurs LTI Kk (s) valables pour les differents points de
fonctionnement. La question est maintenant de determiner un correcteur va-
lable pour toute la plage de fonctionnement par interpolation des correcteurs
Kk (s). Ce correcteur dependra bien s ur de et on peut le noter K (s).
La question de linterpolation de deux mod`eles nest pas triviale. Bien en-
tendu, lidee dinterpoler directement les matrices de la representation detat
na pas beaucoup de sens si rien nest fait pour que les variables detat aient
le meme sens physique. En utilisant une representation detat particuli`ere,
la representation equilibree (balanced en anglais), le resultat nest pas non
plus satisfaisant. En effet, on observe que les poles nevoluent pas de mani`ere
reguli`ere entre deux points dinterpolation, meme proches [23].
Une des methodes presentes dans la litterature et qui donne de bons
resultats consiste `a interpoler les gains dobservation et de commande de
la representation LQG equivalente, etablie `a partir du mod`ele nominal du
processus. Dans le cas o` u le correcteur est dordre superieur au syst`eme (cest
generalement le cas des commandes H ), on determine tout dabord une

30
representation detat augmentee du mod`ele nominal du processus en ajoutant
des etats non commandables ou non observables afin de garder un param`etre
de Youla statique.

31
Annexes

32
A Syst`
eme lin
eaires multivariables
Recapitulons les resultats fondamentaux concernant les syst`emes multi-
variables lineaires, tout dabord `a temps invariant (LTI) puis `a temps variant
(LTV).

A.1 G
en
eralit
es
Soit le syst`eme LTI defini par :

x = Ax + Bu
(149)
y = Cx + Du
u A Rnn , B Rnm , C Rpn et D Rpm . La matrice de transfert
o`
de ce syst`eme secrit :
H(s) = D + C(sIn A)1 B. (150)
u H(s) Rpm . Elle est invariante par changement detat x = P x o`
o` u
nn
P R est inversible. Le syst`eme sera indifferemment represente par sa
matrice de transfert ou par sa representation detat.

A.2 P
oles
On appelle poles du syst`eme les poles de la fonction de transfert qui sont
(par definition) aussi les valeurs propres de A. Ces poles sont invariants par
changement detat.
Le syst`eme est stable si ses poles sont tous `a parties reelles strictement
negatives. La matrice A dun tel syst`eme est dit Hurwitz.

A.3 Commandabilit
e et observabilit
e
Un syst`eme est dit stabilisable sil existe un retour detat qui le stabilise ;
cest-`a-dire quil existe K Rmn tel que A BK soit Hurwitz. Puisque
cette propriete ne concerne que les matrices A et B, on dit que la paire
{A, B} est stabilisable.
Un syst`eme est dit commandable si on peut imposer arbitrairement les
poles du syst`eme boucle par un retour detat, cest-`a-dire les valeurs propres
de A BK. La commandabilite est une condition plus forte que la stabili-
sabilite. La commandabilite dun syst`eme correspond `a la stabilisabilite des
modes instables. La paire {A, B} est commandable si la matrice de comman-
dabilite :
B AB . . . An1 B (151)

33
est de rang n.
Un syst`eme est dit detectable sil existe un observateur detat stable ; cest-
`a-dire sil existe L Rnp tel que A LC soit Hurwitz. On dit que la paire
{A, C} est detectable.
Un syst`eme est dit observable si on peut imposer arbitrairement les poles
de son observateur detat, cest-`a-dire les valeurs propres de A LC. Lob-
servabilite est une condition plus forte que la detectabilite. La paire {A, C}
est observable si la matrice dobservabilite :

C
CA

.. (152)
.
CAn1

est de rang n.
Les proprietes de commandabilite et dobservabilite sont duales. Ainsi,
{A, C} est observable si et seulement si {AT , C T } est commandable. Il en est
de meme pour la stabilisabilite et la detectabilite.

A.4 Syst`
eme lin
eaire `
a temps variant
A.4.1 Mod`
ele LTV
Soit le syst`eme LTV defini par :

x = A(t)x + B(t)u
(153)
y = C(t)x + D(t)u

Sa matrice de transition (t, t0 ) est definie par :


d
dt
(t, t0 ) = A(t)(t, t0 ),
(154)
(t0 , t0 ) = In ,

o`
u In est la matrice unite dordre n. La trajectoire de letat secrit alors :
Z t
x = (t, t0 )x0 + 1 (, t)B( )u( )d (155)
t0

o`
u x0 = x(t0 ). Lecriture de x sous cette forme a le merite de faire ap-
paratre deux termes : lun issu de la condition initiale et lautre du si-
gnal de commande. Dans le cas dun syst`eme LTI, la matrice de transi-
tion secrit (t0 , t) = exp(A(t t0 )). Une propriete interessante est que
(t, t0 ) = 1 (t0 , t).

34
A.4.2 Observabilit
e
De mani`ere generale, un syst`eme non lineaire est observable si on peut
determiner son etat initial `a partir de lenregistrement de sa sortie sur un
certain horizon. Une fois connu letat initial, la trajectoire peut alors etre
enti`erement reconstruite `a partir du mod`ele.
Supposons pour simplifier les calculs que lentree est nulle (u = 0) ; le
signal de sortie secrit y( ) = C(, t0 )x0 . Multiplions cette relation `a gauche
par T (, t0 )C T et integrons sur [t0 , t1 ], on obtient alors :
Z t1 Z t1
T T
(, t0 )C y( )d = T (, t0 )C T C(, t0 )d x0 . (156)
t0 t0
| {z }
Wo (t0 ,t1 )

La condition initiale x0 est alors obtenue en multipliant `a gauche par Wo (t0 , t1 )1 .


Le syst`eme est donc observable si le Gramien dobservabilite Wo (t0 , t1 ) est
defini14 (non singulier) [24]. Lobservabilite peut dependre de la trajectoire
de letat, celle-ci dependant du signal dentree ; un signal dentree rendant le
syst`eme observable est dit entree universelle.

A.4.3 Commandabilit
e
De mani`ere generale, un syst`eme est dit (compl`etement) commandable si,
`a partir dune condition initiale x0 = x(t0 ), on peut trouver une commande
u permettant datteindre tout etat final arbitraire xf = x(tf ) avec tf > t0 .
Remarquons que cette notion de commandabilite est equivalente `a la possi-
bilite de suivre une trajectoire quelconque pour letat, a` condition toutefois
que cette trajectoire soit suffisamment reguli`ere.
Le syst`eme LTV (153) est commandable sur lhorizon [t0 , tf ] si et seule-
ment si son Gramien de commandabilite :
Z tf
Wc (t0 , tf ) = 1 (t0 , )BB T T (t0 , )d (157)
t0

est defini.
Le caract`ere suffisant de cette condition se montre en considerant la com-
mande :

u = B T (t)T (t0 , t)Wc1 (t0 , tf ) xf 1 (t0 , tf )x0 (158)

14
Toutes les valeurs propres de Wo (t0 , t1 ) sont reelles et positives puisque quelle est
symetrique.

35
B Analyse des syst`
emes asservis multivariables
B.1 Position du probl`
eme
Considerons un processus lineaire multivariable y = G(s)u asservi par
un correcteur K(s), avec nu entrees et ny sorties. En tenant compte de la
consigne r et dune perturbation d en entree du processus, les equations
secrivent :

u = K(s)(r y) (159)
y = G(s)(u + d) (160)

En notant Sy (s) = (Iny + K(s)G(s))1 la sensibilite en sortie et Su (s) =


(Inu +G(s)K(s))1 la sensibilite en entree, on obtient les transferts en boucle
fermes suivants :

= Sy (s)r Sy (s)G(s)d (161)


u = K(s)Sy (s)r K(s)Sy (s)G(s)d (162)
= Su (s)K(s)r Su (s)K(s)G(s)d (163)
y = Sy (s)G(s)K(s)r + Sy (s)G(s)d (164)
(165)

o`
u = r y est lerreur de regulation.
Les objectifs de ce schema general dasservissement sont les suivants :
stabilite,
robustesse,
un bon suivi de trajectoire,
un bon rejet des perturbations.
Voici comment les evaluer `a partir de la representation frequentielle des trans-
ferts en boucle fermee.
Les outils classiques de lautomatique monovariable (lieu de Bode, de
Black et de Nyquist) ne sont pas directement utilisables en multivariable.
Les outils presentes sappuient sur le trace des valeurs singuli`eres, extension
de la notion de gain.

B.2 Valeur singuli`


ere
Definition 1 Les valeurs singuli`eres dune matrice complexe M sont les ra-
cines carrees des valeurs propres de M H M o`
u M H est le hermitien (transpose
conjugue) de M . On les note i (M ).

Propri
et
e 1 (Propri
et
es g
en
erales)

36
Les valeurs singuli`eres sont des nombres reels positifs.
Les valeurs singuli`eres non nulles de M sont identiques `a celles de M H
(invariance par loperation transpose/conjugue)
Les valeurs singuli`eres non nulles sont au plus au nombre de min(nu , ny ),
la plus petite dimension de M .
Propriet
e 2 (Norme matricielle) La valeur singuli`ere maximale (M )
est une norme matricielle. Les proprietes generales des normes sappliquent
donc.
(M ) = ||(M )
(M + N ) (M ) + (N )
(M N ) (M )(N )
Propri ete 3 (Inversion de matrice) M est inversible si et seulement si
sa plus petite valeur singuli`ere est non nulle ((M ) > 0). Alors, (M ) =
1
(M 1 )
et (M ) = (M11 ) .
On en deduit les proprietes suivantes :
Propri
et
e4 (M ) = ||(M )
(M + N ) (M ) + (N )
(M )(N ) (M N )
Propriet
e 5 (Interpretation) La norme est la norme induite sur les
matrices par la norme euclidienne des vecteurs :
||M z||2
(M ) = max
z6=0 ||z||2
z MHMz
H
2 (M ) = max (166)
z6=0 zH z
Ainsi, la norme est lamplification maximale du syst`eme de transfert M .

B.3 Trac
e des valeurs singuli`
eres
Pour un transfert dynamique multivariable M (s), la representation frequentielle
consiste en le trace des valeurs singuli`eres de M (j) en fonction de sur
[0, ]. Lechelle logarithmique est generalement choisie pour les abscisses et
les ordonnees. Ce trace generalise celui du gain aux syst`emes multivariables.
Definition 2 (Norme H ) La norme H de M (s), notee ||M || est la
borne superieure des valeurs singuli`eres maximales de M (j) lorsque varie
sur [0, ] :
||M || = sup (M (j)) (167)
[0,]

37
Definition 3 (Norme L2 sur les signaux) Soit z un signal `a valeur reelle
ou complexe sur [0, ] ; on note ||z||2 sa norme L2 definie par :
Z
||z||2 = z H (t)z(t)dt (168)
0

Propri et
e 6 (Interpr etation de la norme H ) La norme H est la norme
induite sur les syst`emes par la norme L2 sur les signaux :
||M (s)z||2
||M (s)|| = max (169)
z6=0 ||z||2
Ainsi, la norme ||M (s)|| est lamplification maximale.

Des crit`eres de stabilite, robustesse, qualite du suivi de trajectoire et qua-


lite du rejet de perturbation peuvent sevaluer `a partir des representations
frequentielles de certains transferts du syst`eme boucle. Cela fait lobjet des
paragraphes suivants. Pour obtenir les valeurs singuli`eres dun syst`emes dy-
namique, vous pouvez utiliser sous Matlab la fonction sigma de la Control
System Toolbox ou la fonction vsvd de la -Analysis and Synthesis Toolbox.

B.4 Stabilit
e
La stabilite est evaluable `a partir du lieu des poles (tous les poles de la
boucle fermee doivent etre `a partie reelle strictement positive), ce qui sevalue
en multivariable de la meme mani`ere quen monovariable. Cependant, on sait
que la stabilite ne suffit pas et que des marges sont necessaires. La marge
de module est definie en monovariable comme la distance minimale au point
1 du transfert complexe en boucle ouverte, ce qui secrit avec les notations
utilisees :
M = min |1 + K(j)G(j)|. (170)

En notant que :

min |1 + K(j)G(j)| = max |(1 + K(j)G(j))1 |, (171)


on definit en multivariable la marge de module en sortie :


1
M = , (172)
||Sy (s)||
et la marge de module en entree :
1
M = . (173)
||Su (s)||

38
B.5 Suivi de consigne
Afin davoir un bon comportement en suivi de consigne, il faut que le
transfert entre la reference et lerreur soit de type coupe-bas (ou passe-haut).
On pourra alors tracer la representation frequentielle de Sy (s) et relever la
bande passante `a -3 dB ainsi que lattenuation maximale (en continu).

B.6 Rejet de perturbation


Afin davoir un bon comportement en rejet de perturbation, il faut que le
transfert entre la perturbation et lerreur soit le plus faible possible notam-
ment en basse frequence. Ce transfert est generalement de type passe-bande.
On pourra alors tracer la representation frequentielle de Sy (s)G(s) et relever
lattenuation maximale (en continu) ainsi que lamplification maximale en
precisant la frequence.

B.7 Robustesse
Les syst`emes dynamiques physiques sont generalement de type passe-
bande et on dont un gain qui diminue en haute frequence. Il en resulte
donc quau-del`a dune certaine bande de frequences, ces dynamiques sont
necessairement mal connues. Ainsi, une des sources classique de manque de
robustesse des syst`emes asservis correspond `a des amplifications de modes
hautes frequence mal connus, entranant ainsi des instabilites. Afin de palier
ce probl`eme, il convient de sassurer que le gain du correcteur decrot au-
del`a de la bande passante. Une mani`ere detournee de sen assurer consiste `a
considerer la reponse frequentielle du transfert Su (s)K(s) ou K(s)Sy (s) du
transfert entre r et u.

39
C In
egalit
es matricielles affines
Les Inegalites Matricielles Affines ou LMI prennent une place de plus
importante dans les methodes modernes de lautomatique. De nombreux
resultats anterieurs trouvent une formulation LMI et ce formaliste permet
aussi de resoudre de nouveaux probl`emes qui navaient pas trouve jusqualors
de solution.

C.1 Positivit
e
D efinition 4 (Matrice positive) Une matrice A Rn est dite (semi-
definie) positive et on note A 0 si la forme quadratique xT Ax est positive
pour tout vecteur x.

Cette definition se transpose evidemment au cas negatif. On peut tou-


jours ecrire une forme quadratique `a partir dune matrice symetrique. Ainsi,
xT Ax = 21 xT (AT + A)x. On ne contentera donc de considerer le cas des
matrices symetriques. Ces matrices ont la particularite davoir toutes leurs
valeurs propres reelles.

Propri ete 7 (Matrice n egative) Une matrice A symetrique est negative


si et seulement toutes ses valeurs propres sont negatives et on note A 0.

On definit aussi la positivite stricte et on dit quune matrice est definie po-
sitive si toutes ses valeurs propres sont strictement positives. Cest equivalent
`a dire que la forme quadratique correspondante xT Ax est strictement positive
pour tout x non nul.

Propri
et
e8 Soit un scalaire, A I > 0 i (A) > .
P > 0 P < 0 ; on peut donc toujours se ramener `a un probl`eme
de positivite (ou de negativite).

C.2 In
egalit
e matricielle affine ou lin
eaire
D efinition 5 (In egalite Matricielle Affine) On appelle inegalite matri-
cielle affine (ou lineaire et en anglais linear matrix inequality note LMI) le
probl`eme suivant ; etant donnees les matrices reelles, carrees et symetriques
Mk , k = 1..n, trouver les reels xk , k = 1...n tels que M (x) = M0 + x1 M1 +
... + xn Mn > 0.

Le succ`es des LMI vient du developpement des methodes dites du point


interieur (interior point methods) qui permettent de resoudre de mani`ere
efficace ces probl`emes [19].

40
Propri
et
e 9 Un syst`eme de plusieurs LMI est une LMI. En effet :

P (x) > 0 P (x) 0
>0 (174)
Q(x) > 0 0 Q(x)

C.3 Exemple de LMI


Les LMI ne se presentent pas directement sous la forme de linegalite
presentee ci-dessus. Prenons un exemple classique de lautomatique ; la sta-
bilite au sens de Lyapunov pour un syst`eme lineaire x = Ax. Il sagit de
trouver une matrice reelle P = P T > 0 de meme dimension que A telle que
AT P + P A < 0. Considerons `a titre dexemple, le cas o`u A est une matrice
2 2.
a1 a2
A= (175)
a3 a4
La matrice P depend alors de 3 param`etres xi , k = 1..3 et peut secrire :

x1 x2
P = (176)
x2 x3

La condition de positivite de P secrit :



1 0 0 1 0 0
x1 + x2 + x3 >0 (177)
0 0 1 0 0 1

Linegalite de Lyapunov, elle se reecrit :



2a1 a2 a2 + a3 a1 + a4 0 a2
x1 + x2 + x3 <0 (178)
a3 0 a1 + a4 a2 + a3 a3 2a4

C.4 R
esolution
Afin de rendre les solveurs de LMI facilement utilisables pour les probl`emes
de lautomatique, des interfaces ont ete developpees permettant decrire les
probl`eme sous des formes matricielles simples. On peut citer LMI-Tools de El
Ghaoui15 , la LMI Control Toolbox de MathWorks [20] et linterface SeDuMi
developpe au LAAS par Peaucelle et al. [25]. On pourra egalement utiliser
loutil YALMIP16 .
Les trois probl`emes classiques que ces outils resolvent sont
la faisabilite (ou existence) : trouver x solution de A(x) < 0,
15
http ://robotics.eecs.berkeley.edu/ elghaoui/
16
http ://control.ee.ethz.ch/ joloef/yalmip.php

41
la minimisation dune fonction lineaire ; trouver x minimisant cT x sous
la contrainte A(x) < 0,
le probl`eme de valeur propre generalisee : minimiser sous les contraintes
A(x) < B(x), B(x) > 0 et C(x) < 0.

42
Index
Boucle LMI, 25, 26, 40, 41
fermee, 15, 27, 36, 38 Loop Transfert Recovery, 21
ouverte, 15, 22, 38 Lyapunov, 25, 26, 41

Commandabilite, 3335 Marge de module, 38


Commande Matrice de transition, 34
bang-bang, 9 Maupertuis, 8
H2 , 23
H , 19, 30 Norme
LQ, 9, 11, 12, 27 H2 , 23, 24, 26, 27
LQG, 19, 20, 27 H , 26, 37, 38
Crit`ere matricielle, 4, 23, 26, 37
de Bolza, 5 Observabilite, 3335
de Lagrange, 5
de Mayer, 5 Parametrisation de Youla, 29
Parametrisation de Youla, 28
Detectabilite, 34 Param`etre de Youla, 31
Difference de retour, 13 Ponderations, 15, 21
Difference de retour, 12 Pontriagine, 5
Entree universelle, 35 Principe
Equation doptimalite, 6
de Lyapunov, 26 de moindre action, 8
de Riccati, 12 du minimum, 6
de Lyapunov, 25 Probl`eme standard, 26
de Riccati, 12 Regulation, 14
Euler-Lagrange, 8 Rejet de perturbation, 36, 38, 39
Gain Scheduling, 30 Representation frequentielle, 37, 38
Gramien, 25 Robustesse, 9, 12, 13, 21, 22, 36, 38,
dobservabilite, 25, 35 39
de commandabilite, 25, 35 Separation, 19
Inegalite Sensibilite
de Kalman, 13 en entree, 36
de Lyapunov, 41 en sortie, 36
matricielle affine, 40 Stabilisabilite, 11, 33, 34
matricielle affine, 40 Stabilite, 36, 38
Interpolation de correcteurs, 30 Suivi
de consigne, 39

43
de trajectoire, 36, 38
Syst`eme hamiltonien, 10

Theor`eme
de Parseval, 23, 27
de separation, 19

Valeur singuli`ere, 3638


maximale, 37

Youla, 28, 29, 31

44
R
ef
erences
[1] A. P. Sage and C. C. White. Optimum Systems Control. Prentice Hall,
1977.
[2] B. D. O. Anderson and J. B. Moore. Optimal Control - Linear Quadratic
Methods. Prentice Hall, 1989.
[3] L. Pontriagine, V. Boltianski, G. Gamkrelidze, and E. Michtchenko.
Theorie Mathematique des Processus Optimaux. Moscou : Mir, 1974.
[4] H. Bourles. Optimisation et Commande Optimale. Ecole Normale
Superieure de Cachan, 1996.
[5] G. Duc. Robustesse des Syst`emes Lineaires Multivariables. Ecole

Superieure dElectricit
e, 1994.
[6] N. A. Lehtomaki, N. R. Sandell, and M. Athans. Robustness results
in linear quadratic gaussian based multivariable control design. IEEE
Transactions on Automatic Control, 26(1), 1981.

[7] E. Ostertag. Filtrage Optimal et Commande Optimale. Ecole Superieure
de Physique de Strasbourg, 2002.
[8] G. F. Franklin, J. D. Powell, and M. L. Workman. Digital Control of
Dynamic Systems. Addison-Wesley, 1990.
[9] W. F. Arnold and A. J. Laub. Generalized eigenproblem algorithms
and software for algebraic riccati equations. Proceedings of the IEEE,
72 :17461754, 1984.
[10] The MathWorks Inc. Getting Started with the Control System Toolbox,
2000-2002.
[11] M. H. A. Davis. Linear Estimation and Stochastic Control. Chapman
and Hall, 1977.
[12] J. C. Doyle and G. Stein. Robustness with observers. IEEE Transactions
on Automatic Control, 24(4), 1979.
[13] J. C. Doyle and G. Stein. Multivariable feedback design : Concepts for a
classical/modern synthesis. IEEE Transactions on Automatic Control,
26(1), 1981.
[14] J. B. Moore and L. Xia. Loop recovery and robust state estimate feed-
back design. IEEE Transactions on Automatic Control, 32(6), 1987.
[15] G. Stein and M. Athans. The LQG/LTR procedure for multivariable
feedback control design. IEEE Transactions on Automatic Control,
32(2), 1987.
[16] J. D. Birdwell and A. J. Laub. Balanced singular values for lqg/ltr
design. International Journal of Control, 45(3), 1987.

45
[17] Z. Zhang and J. Freudenberg. Loop transfert recovery for nonminimal
phase plants. IEEE Transactions on Automatic Control, 35(5), 1990.
[18] C. Scherer, P. Gahinet, and M. Chilali. Multi-objective output-feedback
control via LMI optimization. IEEE trans. on Automatic Control,
42(7) :896911, 1997.
[19] Y. Nesterov and A. Nemirovski. Interior-point Polynomial Methods in
Convex Programming. SIAM, 1994.
[20] P. Gahinet, A. Nemirovski, A. J. Laub, and M. Chilali. LMI Control
Toolbox. The MathWorks Inc., 1995.
[21] D. Alazard and P. Apkarian. Exact observer-based structures for ar-
bitrary compensators. International Journal of Robust and Nonlinear
Control, 9 :101118, 1999.
[22] D. Alazard, C. Cumer, P. Apkarian, M. Gauvrit, and G. Ferr`eres. Ro-

bustesse et Commande Optimale. Cepadu`es Editions, 1999.
[23] M. Berriri. Commande LPV dun syst`eme dentranement de bande
flexible, 2004.
[24] G. Bornard, F. Celle-Couenne, and G. Gilles. Syst`emes Non-Lineaires,
volume 1 : modelisation-estimation, chapter 5 : observation, observabi-
lite, pages 177221. Masson, 1993.
[25] D. Peaucelle, D. Henrion, Y. Labit, and K. Taitz. Users guide
for SeDuMi interface. LAAS - CNRS, http ://www.laas.fr/ peau-
cell/SeDuMiInt.html, 2002.

46

View publication stats