Vous êtes sur la page 1sur 59

ENSICA

D epartement Avionique et Syst` emes


Notes de cours
COMMANDE DES SYST
`
EMES LIN

EAIRES
2` eme ann ee ENSICA
septembre 2004
Jo el BORDENEUVE-GUIB

E
TABLE DES MATI ` ERES 1
Table des mati` eres
1 Asservissement par m ethodes fr equentielles 5
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Principes de correction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Correction par avance de phase . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Correction par retard de phase . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Correction par avance-retard de phase . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Le r egulateur PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.1 Premi` ere m ethode de Ziegler-Nichols . . . . . . . . . . . . . . . . . . 13
1.6.2 Deuxi` eme m ethode de Ziegler-Nichols . . . . . . . . . . . . . . . . . 14
1.7 Alternatives au r egulateur PID . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7.1 Pseudo d erivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7.2 R egulateur PI-D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7.3 R egulateur I-PD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.7.4 G en eralisation: R egulateur I-PDn . . . . . . . . . . . . . . . . . . . . 16
2 Commande par retour d etat 17
2.0.5 Principe du retour d etat . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1 Commande ` a placement de la dynamique . . . . . . . . . . . . . . . . . . . . 18
2.1.1 Principe du calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.2 Interpr etation du retour d etat en terme de sortie . . . . . . . . . . . . . 22
2.2 Adjonction dune action int egrale . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.2 Sch ema n

1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.3 Sch ema n

2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3 Commande lin eaire quadratique . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.1 Pr esentation g en erale du probl` eme . . . . . . . . . . . . . . . . . . . . 28
2.3.2 R esolution par le calcul des variations . . . . . . . . . . . . . . . . . . 29
2.3.3 Application ` a la commande des syst` emes lin eaires . . . . . . . . . . . 30
2.3.4 Cas particulier du crit` ere ` a horizon inni . . . . . . . . . . . . . . . . 33
2.3.5 Interpr etation et r eglage . . . . . . . . . . . . . . . . . . . . . . . . . 33
3 Reconstruction de l etat 37
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Approche intuitive de la reconstruction de l etat dun syst` eme . . . . . . . . . . 39
3.3 Equations g en erales de lobservateur . . . . . . . . . . . . . . . . . . . . . . . 41
3.3.1 Relations fondamentales . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3.2 Conditions dexistence . . . . . . . . . . . . . . . . . . . . . . . . . . 42
ENSICA 2
` eme
ann ee
2 TABLE DES MATI ` ERES
3.3.3 Observateur minimal de Luenberger (cas mono-sortie) . . . . . . . . . 43
3.4 Observateur identit e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5 Lobservateur dans la boucle de commande . . . . . . . . . . . . . . . . . . . 47
3.5.1 Inuence de la dynamique de lobservateur sur le syst ` eme boucle . . . 47
3.5.2 Retour d etat observ e: cas g en eral . . . . . . . . . . . . . . . . . . . . 48
3.6 Lobservateur optimal de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.6.1 Position du probl` eme . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.6.2 Equations du ltre de Kalman . . . . . . . . . . . . . . . . . . . . . . 51
3.6.3 Filtre de Kalman dans le cas stationnaire . . . . . . . . . . . . . . . . 54
ENSICA 2
` eme
ann ee
TABLE DES MATI ` ERES 3
Avant-propos
La d emarche choisie pour lenseignement de lautomatique ` a lENSICA peut etre r esum ee
(tr` es succinctement) ainsi:
1. etudes des syst` emes lin eaires et du principe de bouclage
2. synth` ese de r egulateurs pour les syst` emes asservis
3. etude de cas complexes et applications.
Le premier point fait lobjet du cours de premi` ere ann ee ([4]). Tous les principes de mod elisation
des syst` emes lin eaires y sont abord es; les outils classiques danalyse temporelle et fr equentielle
sont pr esent es, et le principe du bouclage ` a r etroaction n egative, le fameux feedback, est egalement
trait e.
Une fois ces bases acquises, il est temps daborder la partie commande proprement dite.
Le cours de deuxi` eme ann ee est donc consacr e ` a la pr esentation de diff erents r egulateurs. Ces
diff erences se feront sur le formalisme utilis e, sur la complexit e du r egulateur, sur son r eglage
et sur des aspects plus pratiques.
A la n du cours, plus que de savoir calculer un r egulateur, il vous sera demand e de sa-
voir sp ecier un probl` eme dasservissement, s electionner un r egulateur, appliquer et nalement
critiquer lasservissement r ealis e. Il va de soi que lenseignement de premi` ere ann ee est un
pr e-requis fort pour suivre ce cours.
La troisi` eme ann ee est ax ee (en modules) sur les probl` emes plus complexes: syst` emes
multi-entr ees et multi-sorties, robustesse des asservissement, identication, etc. Les applica-
tions a eronautiques et spatiales sont egalement d etaill ees.
ENSICA 2
` eme
ann ee
4 TABLE DES MATI ` ERES
ENSICA 2
` eme
ann ee
5
Chapitre 1
Asservissement par m ethodes
fr equentielles
1.1 Introduction
Les objectifs poursuivis lorsquon met en place un syst` eme de commande sont li es aux
propri et es essentielles de stabilit e du syst` eme, de forme du r egime transitoire, de pr ecision en
r egime permanent.
Stabilit e
Le syst` eme corrig e doit poss eder des marges de stabilit e convenables. En pratique, on choisit
une marge de gain de lordre de 12dB (variation de gain dun facteur 4) et une marge de phase
de lordre de 45

.
Remarque :
Dans le plan de Black, la droite passant par les points (0dB; 135

) et (12dB; 180

) est
pratiquement tangente ` a la courbe donnant le module 2,3dB en boucle ferm ee. On a alors pour
le syst` eme en boucle ferm ee, un comportement du type second ordre avec une r esonance de
2,3dB qui correspond ` a un coefcient damortissement de lordre de 0,5.
On rappelle le r esultat qualitatif suivant: pour avoir une bonne marge de stabilit e, il faut en
g en eral diminuer le gain de boucle du syst` eme.
Pr ecision
La pr ecision en r egime permanent, pour une entr ee donn ee, est inversement proportionnelle
au gain de boucle du syst` eme. Donc pour diminuer lerreur en r egime permanent on doit aug-
menter le gain de boucle. Cette condition est ( evidemment) antagoniste avec les conditions de
stabilit e pratique...
ENSICA 2
` eme
ann ee
6 CHAPITRE 1. ASSERVISSEMENT PAR M ETHODES FR EQUENTIELLES
R egime transitoire
On recherche en g en eral la rapidit e de r eponse (souvent mesur ee par le temps de r eponse ` a
95% avec un d epassement transitoire admissible (10 ` a 20%).
Finalement, les sp ecications que lon xe pour la synth` ese dun syst` eme de commande
portent sur:
la pr ecision en r egime permanent,
la marge de gain et/ou la marge de phase.
Cependant, elles sont souvent compl et ees par des sp ecications sur la r eponse temporelle (temps
de mont ee, temps d etablissement, etc.). Elles peuvent egalement etre agr ement ees de gaba-
rits temporels ou fr equentiels, de contraintes, etc. Toutes ces sp ecications ne sont evidemment
pas ind ependantes et ne sont pas syst ematiquement bien pos ees: tout le monde est confront e
un jour ` a la sp ecication utilisateur: je veux que ca marche mieux, que ce soit plus able, et (sur-
tout) moins cher!!! Ce quil faut retenir, cest que le travail de mise en forme des sp ecications
est fondamental pour lautomaticien, et repr esente souvent la majeure partie de son travail... Les
outils de lautomatique permettent souvent dobtenir un correcteur dun simple clic de souris ` a
partir de la seule sp ecication de performances.
Step Response
Time (sec)
A
m
p
l
i
t
u
d
e
0 10 20 30 40 50 60
0
0.2
0.4
0.6
0.8
1
1.2
1.4
consigne
systme trop oscillant
systme "optimal"
systme trop lent
erreur
FIG. 1.1 Exemples de diff erents r eglages en boucle ferm ee
La seule m ethode de correction abord ee en cours de premi` ere ann ee est la correction par
un gain variable (g 1.2). Cette m ethode est la plus simple (un degr e de libert e uniquement
pour le r egulateur), et lutilisateur dispose de plusieurs outils danalyse et de r eglage dun tel
asservissement (lieu des racines ou lieu dEvans, diagramme de Bode, abaque de Black, etc.).
Cependant, les performances obtenues ne sont pas toujours sufsantes pour atteindre (ou appro-
cher) les sp ecications et il faut se r esoudre ` a employer un r egulateur plus riche: le moyen le
ENSICA 2
` eme
ann ee
1.2. PRINCIPES DE CORRECTION 7
plus simple est de rajouter dabord un second degr e de libert e, et eventuellement un troisi` eme
comme nous allons le voir dans le reste du chapitre.
FIG. 1.2 Asservissement par un gain variable
1.2 Principes de correction
Consid erons la repr esentation dans le plan complexe (courbe en trait plein sur les gures
1.3 et 1.4) dune fonction de transfert en boucle ouverte de la forme:
KG(p) =
K
(1 +
1
p)(1 +
2
p)(1 +
3
p)
Supposons le syst` eme corrig e par un gain K (retour unitaire). Il y a alors deux possibilit es de
r eglage:
on peut tout dabord r egler la pr ecision, ce qui donne un nouveau gain K

(courbe en
pointill e sur g 1.3). Le syst` eme ne v erie alors plus les conditions de stabilit e. On va
donc introduire dans la chane de commande un correcteur R(p) qui va avancer la phase
dans la zone critique, cest ` a dire autour du point 1 (courbe discontinue). Cest le prin-
cipe de correction par avance phase, ou correction d eriv ee.
ENSICA 2
` eme
ann ee
8 CHAPITRE 1. ASSERVISSEMENT PAR M ETHODES FR EQUENTIELLES
K K

1
Im KG(jw)
Re KG(jw)
courbe
corrige
FIG. 1.3 Correction ` a avance phase
on peut egalement r egler le gain pour avoir une marge de phase convenable (45

par
exemple), ce qui donne K
45
, et ensuite on ajoute dans la chane directe un r egulateur
R(p) qui permet dam eliorer le gain statique sans modier la courbe dans la zone du
point 1. Cest le principe de de correction int egrale, ou retard de phase(g 1.4).
K K
45
-1
Im KG(jw)
Re KG(jw)
c
o
u
r
b
e
c
o
r
r
i
g

e
FIG. 1.4 Correction ` a retard phase
1.3 Correction par avance de phase
Ce type de correction est utilis e pour am eliorer les performances de stabilit e dun syst` eme
sans d et eriorer ses performances en r egime permanent, ou autrement dit, on am eliore la stabilit e
dun syst` eme pr ecis.
Soit le r egulateur de fonction de transfert
ENSICA 2
` eme
ann ee
1.3. CORRECTION PAR AVANCE DE PHASE 9
Bode Diagram
Frequency (rad/sec)
P
h
a
s
e
(
d
e
g
)
M
a
g
n
itu
d
e
(
d
B
)
0
5
10
15
10
2
10
1
10
0
10
1
0
30
60
FIG. 1.5 Avance de phase: Diagramme de
Bode
Nyquist Diagram
Real Axis
Im
a
g
in
a
r
y
A
x
is
1 0 1 2 3 4 5
0
0.5
1
1.5
2
2.5
3

m
FIG. 1.6 Avance de phase: Diagramme de Ny-
quist
R(p) =
1 + ap
1 + p
a > 1
Les lieux de transfert dans les plans de Bode et Nyquist sont donn es sur les gures 1.5 et
1.6
Leffet b en eque recherch e est donc lajout de phase sur une bande de fr equence centr ee en

m
=
1

a
A noter que la phase maximale ajout ee

m
= arcsin(
a 1
a + 1
)
ne d epend que du param` etre a.
Proc edure de r eglage du r egulateur
1. apr` es avoir x e le gain K = K

qui permet de satisfaire les sp ecications en r egime


permanent (erreur de position, de vitesse, etc...), on d etermine la phase n ecessaire
d
que
devra apporter R(p) pour assurer une bonne stabilit e.
2. on calcule la valeur de a ` a partir de
d
grace ` a

d
= arcsin(
a 1
a + 1
)
Remarque :
On voit tr` es bien que lajout de phase est fatalement accompagn e dune augmentation
de module (de 10 log a), et donc dune augmentation de la pulsation de coupure
c
.
ENSICA 2
` eme
ann ee
10 CHAPITRE 1. ASSERVISSEMENT PAR M ETHODES FR EQUENTIELLES
Bode Diagram
Frequency (rad/sec)
P
h
a
s
e
(
d
e
g
)
M
a
g
n
itu
d
e
(
d
B
)
0
5
10
15
10
2
10
1
10
0
10
1
60
30
0
FIG. 1.7 Retard de phase: Diagramme de
Bode
Nyquist Diagram
Real Axis
Im
a
g
in
a
r
y
A
x
is
1 0 1 2 3 4 5
3
2.5
2
1.5
1
0.5
0

m
FIG. 1.8 Retard de phase: Diagramme de Ny-
quist
Par cons equent, lapport de phase sera inf erieur ` a celui escompt e; pour anticiper sur ce
ph enom` ene, on majore a priori
d
de 20 ` a 30% avant de calculer a.
3. Sur la caract eristique en amplitude de la fonction de transfert non corrig ee, on recherche
le point ` a 10 log a: soit
c
cette pulsation. On en d eduit la valeur de
=
1

a
1.4 Correction par retard de phase
Ce type de correction est utilis e pour am eliorer la pr ecision en r egime permanent tout en
conservant de bonnes performances en stabilit e, ou autrement dit, on am eliore la pr ecision dun
syst` eme stable.
Soit le r egulateur de fonction de transfert
R(p) = b
1 + p
1 + bp
b > 1
Les lieux de transfert dans les plans de Bode et Nyquist sont donn es sur les gures 1.7 et
1.8
Leffet b en eque est ici lajout de gain en basse fr equence, leffet pervers etant le d ephasage
induit.
Proc edure de r eglage du r egulateur
1. on xe dabord le gain K = K
45
pour avoir une bonne marge de stabilit e.
2. on d etermine b pour avoir une erreur donn ee en r egime permanent:
b =
K

K
45
ENSICA 2
` eme
ann ee
1.5. CORRECTION PAR AVANCE-RETARD DE PHASE 11
3. enn, pour d eterminer , on va faire en sorte que le d ephasage suppl ementaire apport e
par ce r egulateur dans la zone de r esonance en boucle ferm ee soit le plus faible possible.
Si
sup
est ce d ephasage, on peut montrer quune condition ` a remplir est:
>
1

sup
1.5 Correction par avance-retard de phase
En premi` ere approximation, le r egulateur ` a avance de phase joue le r ole dune action de
d erivation ( equivalent ` a p dans la bande de pulsation [1/a . . . 1/]). De m eme le correcteur
` a retard de phase joue le r ole dun int egrateur dans la bande de pulsation [1/b . . . 1/]. On
parle alors souvent de correction par action d eriv ee (pour am eliorer la stabilit e) et de correction
par action int egrale (pour am eliorer la pr ecision).
Comme vu pr ec edemment, la mise en place et le r eglage de ces r egulateurs se fait de mani` ere
approch ee et/ou par essais successifs, sans la garantie a priori datteindre les sp ecications.
Logiquement, on peut donc combiner les effets positifs des deux r egulateurs et ainsi former un
r egulateur du type avance-retard de phase:
R(p) = b
1 + p
1 + bp

1 + a

p
1 +

p
a > 1 b > 1
Les r eglages des deux param` etres a et b et des deux constantes de temps et

se font de
mani` ere equivalente ` a ceux vus pr ec edemment.
Sur la gure 1.9 est repr esent ee un exemple de r eponse fr equentielle dun r egulateur avance-
retard. On retrouve bien les deux effets escompt es:
lavance de phase ` a partir de 0,1rd/s environ
le retard de phase en dessous 0.01rd/s
Il est evident que les deux zones doivent etre clairement s epar ees pour que la correction soit
efcace.
Remarque :
Intuitivement, on retrouve bien un r esultat naturel: laction d eriv ee, donc en p, agit plut ot en
haute fr equence (li ee aux performances dynamiques), et laction int egrale, en 1/p, agit en basse
fr equence (comportement statique).
ENSICA 2
` eme
ann ee
12 CHAPITRE 1. ASSERVISSEMENT PAR M ETHODES FR EQUENTIELLES
Bode Diagram
Frequency (rad/sec)
P
h
a
s
e

(
d
e
g
)
M
a
g
n
i
t
u
d
e

(
d
B
)
10
4
10
3
10
2
10
1
10
0
10
1
90
45
0
45
0
5
10
15
20
action intgrale action drive
FIG. 1.9 Correction ` a avance-retard phase
1.6 Le r egulateur PID
Le r egulateur PID (Proportionnel Int egral D eriv e) combine les trois modes de correction de
base que nous avons vus jusqu` a maintenant:
P: le simple gain proportionnel
I: leffet retard de phase
D: leffet avance de phase.
Ce r egulateur est le plus populaire (et de loin!) dans le milieu industriel. A ce succ` es, on peut
trouver plusieurs causes:
sa compacit e (3 param` etres ` a r egler en g en eral)
son r eglage: il existe de nombreuses m ethodes pour cela, mais la plupart ne font appel
` a aucun mod` ele du processus ` a commander. Une connaissance empirique est souvent
sufsante
sa souplesse: on peut modier facilement sa structure en fonction de lapplication ou des
sp ecications (on peut faire du PI-D, du I-PD, du PID2, etc...)
son implantation: en num erique, elle peut se r esumer ` a une ligne de code! En analogique,
il suft de quelques connaissances de base en electronique pour c abler son PID.
Dans son expression la plus simple, la fonction de transfert du PID est donn ee par:
R(p) =
U(p)
(p)
= K
p
(1 +
1
T
i
p
+ T
d
p) (1.1)
o` u K
p
, T
i
et T
d
sont respectivement les gains proportionnel, int egral et d eriv e.
ENSICA 2
` eme
ann ee
1.6. LE R EGULATEUR PID 13
FIG. 1.10 Asservissement par un r egulateur PID
Nous allons voir deux m ethodes classiques de r eglages de ces gains, dues ` a MM. Ziegler
et Nichols. Ils ont propos e des techniques bas ees sur lutilisation graphique de la r eponse tran-
sitoire du syst` eme non corrig e. Il ny a donc pas besoin de connatre le mod` ele du syst` eme.
De cette observation, on peut tirer des valeurs pour les diff erents gains de mani` ere ` a obtenir
une r eponse indicielle en boucle ferm ee pr esentant un d epassement de lordre de 25% (bon
compromis rapidit e-stabilit e).
1.6.1 Premi` ere m ethode de Ziegler-Nichols
Dans le cas o` u le syst` eme ` a corriger ne comporte ni int egrateur ni p oles complexes domi-
nants, alors la r eponse indicielle en boucle ouverte sera de la forme suivante:
K
T L
tangente au point
d'inflexion
FIG. 1.11 R eponse indicielle en boucle ouverte pour le r eglage du PID
Cette r eponse peut etre caract eris ee, en premi` ere approximation, par une fonction de trans-
fert de la forme
Y (p)
U(p)
=
Ke
Lp
1 + Tp
o` u K est le gain statique, L est un retard pur, T une constante de temps. A partir de l ` a, Ziegler
et Nichols ont propos e les r eglages suivants:
Type de r egulateur obtenu K
p
T
i
T
d
P
T
L
0
PI 0,9T/L L/0,3 0
PID 1,2T/L 2L 0,5L
ENSICA 2
` eme
ann ee
14 CHAPITRE 1. ASSERVISSEMENT PAR M ETHODES FR EQUENTIELLES
Remarque :
On peut maintenant exprimer la fonction de transfert du PID en fonction des param` etres iden-
ti es:
R(p) = K
p
(1 +
1
T
i
p
+ T
d
p)
= 1,2
T
L
(1 +
1
2Lp
+ 0,5Lp)
= 0,6T
(p +
1
L
)
2
p
Le PID poss` ede donc un p ole ` a lorigine et un z ero double en 1/L
1.6.2 Deuxi` eme m ethode de Ziegler-Nichols
Pour la deuxi` eme m ethode, on boucle le syst` eme sur le PID (g 1.10), et on choisit T
i
=
et T
d
= 0; le PID se r eduit alors ` a un gain variable. On augmente ensuite le gain jusqu` a obtenir
un r egime critique doscillations entretenues (g 1.12). On note alors le gain critique K = K
cr
Pcr
FIG. 1.12 R egime critique pour le r eglage du PID
Apartir du gain critique et de la p eriode des oscillations correspondante (P
cr
), on peut etablir
les r eglages suivants:
Type de r egulateur obtenu K
p
T
i
T
d
P 0,5K
cr
0
PI 0,45K
cr
P
cr
/1,2 0
PID 0,6K
cr
0,5P
cr
0,5P
cr
Remarque :
De la m eme facon que pr ec edemment, on peut exprimer la fonction de transfert du PID en
ENSICA 2
` eme
ann ee
1.7. ALTERNATIVES AU R EGULATEUR PID 15
fonction des param` etres identi es:
R(p) = K
p
(1 +
1
T
i
p
+ T
d
p)
= 0,6K
cr
(1 +
1
0,5P
cr
p
+ 0,125P
cr
p)
= 0,075K
cr
P
cr
(p +
4
P
cr
)
2
p
Le PID poss` ede donc un p ole ` a lorigine et un z ero double en 4/P
cr

Commentaire :
Les m ethodes de Ziegler et Nichols sont largement utilis ees pour la commande des syst` emes
dont la dynamique nest pas pr ecis ement connue. Mais en pratique, elles servent de pr e-r eglage,
cest ` a dire de base de d epart pour un r eglage plus n, qui lui, est fait de mani` ere plus empirique.

Une certaine pratique des m ethodes de Ziegler et Nichols montre tr` es vite que les compor-
tements obtenus peuvent etre eloign es de ceux attendus (d epassement de lordre de 25%): il ne
faut alors pas se d emoraliser! Limportant est de connatre leffet qualitatif de chacune des trois
composantes du PID sur la r eponse temporelle su syst` eme asservi, pour ensuite utiliser dautres
structures de PID, mieux adapt ees pour des probl` emes sp eciques.
1.7 Alternatives au r egulateur PID
1.7.1 Pseudo d erivation
Consid erons lexpression initiale du PID (1.1) et lasservissement de la gure 1.10: on voit
imm ediatement que si la r ef erence r(t) est un echelon de position, le terme d erivatif dans la
boucle directe va g en erer une impulsion (un Dirac, pour etre rigoureux) qui va se propager dans
la chane de commande. Pour eviter ce probl` eme (lautomaticien naime pas les impulsions!),
on peut remplacer le terme d eriv e T
d
p par une pseudo d eriv ee
T
d
p
1 + T
d
p
o` u le param` etre est choisi faible (autour de 0,1 g en eralement). Ce ltrage permet datt enuer
le ph enom` ene sans perdre les avantages li es ` a leffet d erivatif stabilisant.
1.7.2 R egulateur PI-D
Une alternative ` a la pseudo d erivation consiste ` a placer le terme d eriv e dans la boucle de
retour et non plus dans la chane directe.
ENSICA 2
` eme
ann ee
16 CHAPITRE 1. ASSERVISSEMENT PAR M ETHODES FR EQUENTIELLES
r(t) e(t)
u(t) y(t)
FIG. 1.13 Asservissement par un PI-D
Seul le signal de sortie est d eriv e, ce qui permet lutilisation de signaux de r ef erence non
d erivables.
1.7.3 R egulateur I-PD
Les sch emas pr ec edents permettent d eliminer la g en eration dimpulsions sur le signal de
commande. Mais pour certains syst` emes, il peut m eme etre g enant de g en erer une fonction
echelon sur u(t) (ce qui induit une forte sollicitation de lactionneur). Pour eviter cela, il faut
placer le terme proportionnel dans la boucle de retour: on obtient alors le r egulateur I-PD.
r(t)
u(t) y(t)
e(t)
FIG. 1.14 Asservissement par un I-PD
1.7.4 G en eralisation: R egulateur I-PDn
Lorsque le syst` eme est dordre elev e (typiquement sup erieur ` a 3), les trois degr es de libert e
offerts par le r egulateur PID peuvent ne pas sufre pour atteindre les objectifs de performances
x es. On peut alors g en eraliser le r egulateur I-PD en ajoutant des termes d eriv es dans la boucle
de retour. Lexpression de la commande devient alors:
U(p) =
K
p
T
i
p
R(p) K
p
(1 +
1
T
i
p
+ T
d1
p + T
d2
p
2
+ . . .)
Ces degr es de libert e suppl ementaires permettent de mieux contr oler la dynamique. Nous ver-
rons au chapitre suivant que lutilisation de n1 d erivations pour un syst` eme dordre n permet
de xer compl` etement la dynamique en boucle ferm ee.
ENSICA 2
` eme
ann ee
17
Chapitre 2
Commande par retour d etat
2.0.5 Principe du retour d etat
La dynamique dun syst` eme de commande en boucle ouverte est x ee par lensemble des
modes du syst` eme, cest-` a-dire des racines de l equation caract eristique associ ee ` a la matrice
d evolution dans une repr esentation d etat.
La phase danalyse permet de caract eriser la r eponse du syst` eme en boucle ouverte, les pro-
pri et es de stabilit e, le comportement statique, etc. Le choix du r egulateur ` a mettre en place pour
asservir le syst` eme d epend bien entendu de cette analyse, mais egalement des sp ecications en
boucle ferm ee, et du degr e de complexit e (physique ou num erique) du r egulateur.
Nous avons vu que le r egulateur proportionnel constitue la solution la plus simple et que le
r egulateur PIDest plus riche en terme de performances obtenues, mais plus co uteux. De mani` ere
assez logique, nous allons voir que la commande par retour d etat constitue une solution plus
compl` ete, et quelle peut etre interpr et ee comme une g en eralisation de la commande par PID.
Le principe g en eral repose sur une contre-r eaction constitu ee par un retour lin eaire du vec-
teur d etat. Lutilisation des variables d etat permet de disposer dun maximum de degr es de
libert e pour agir sur la dynamique en boucle ferm ee et la contraindre ` a souhait.
La mod elisation utilis ee pour repr esenter le comportement entr ee-sortie du syst` eme est
x(t) = Ax(t) + Bu(t)
y(t) = Cx(t)
(2.1)
On retrouve dans ces equations d etat l equation dynamique et l equation de sortie.
La commande est calcul ee par diff erence entre la consigne e(t) et une combinaison lin eaire
de tous les etats
u(t) = e(t) Kx(t) (2.2)
o` u K est un vecteur de gains constants.
ENSICA 2
` eme
ann ee
18 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
FIG. 2.1 Syst` eme corrig e par retour d etat
La combinaison de (2.1) et de (2.2) permet d ecrire l equation d etat du syst` eme en boucle
ferm ee:
x(t) = (A BK)x(t) + Be(t)
y(t) = Cx(t)
(2.3)
Tout le probl` eme est alors de d eterminer le vecteur K. Dans ce chapitre, nous etudierons deux
techniques:
la premi` ere a pour objectif de modier toute la dynamique du syst ` eme, ceci an que le
concepteur soit alors compl` etement matre de la dynamique du syst` eme boucl e.
la seconde (commande quadratique) a pour objectif la minimisation dun crit ` ere quadra-
tique comportant un terme sur lerreur de sortie, et un terme relatif ` a l energie du syst` eme.
2.1 Commande ` a placement de la dynamique
L equation caract eristique (p) = det(pI A) comporte toute linformation sur la dyna-
mique du syst` eme ` a corriger; cest donc sur ses coefcients quil faudra agir pour modier la
dynamique. La base du vecteur d etat la mieux adapt ee sera alors la base compagne de com-
mande (ou horizontale), car dans ce cas la matrice dynamique A contient explicitement les
coefcients de l equation caract eristique.
2.1.1 Principe du calcul
Il faut avant tout noter que les etats du syst` eme sont suppos es mesurables, cest a dire quils
sont physiquement disponibles ou accessibles.
Remarque :
La notion de mesurabilit e des etats est ` a distinguer de la notion de gouvernabilit e. La gouver-
nabilit e est une notion th eorique qui stipule seulement que les etats peuvent etre modi es par
action sur la commande. La mesurabilit e est une notion pratique qui assure que lon a physi-
quement acc` es (via des capteurs en g en eral) aux variables d etat.
ENSICA 2
` eme
ann ee
2.1. COMMANDE ` A PLACEMENT DE LA DYNAMIQUE 19
Si M = [m
1
m
2
. . . m
n
] est la matrice de passage de la base initiale (2.1) ` a la base
canonique de commande, la nouvelle equation d etat est:

x(t) =

A x(t) +

Bu(t)
y(t) =

C x(t)
(2.4)
o` u x = Mx est le vecteur d etat dans la base compagne.
Remarque :
On rappelle les equations de changements de base:

A = M
1
AM

B = M
1
B

C = CM

La commande ` a retour d etat va etre de la forme:


u(t) = e(t)

K x(t)
avec

K qui est le vecteur de gains de retour d etat. On peut montrer facilement que

K = KM
Soient
i
, i = 1 . . . n, les modes du syst` eme en boucle ouverte, solutions de l equation
caract eristique:
(p) = det(pI A) = p
n
+ a
n1
p
n1
+ . . . + a
0
= 0
Soient
i
, i = 1 . . . n, les modes du syst` eme en boucle ferm ee, solutions de l equation ca-
ract eristique du syst` eme boucl e:
(p) = det(pI

A +

B

K) = p
n
+
n1
p
n1
+ . . . +
0
= 0
(p) =

n
i=1
(p
i
)
(2.5)
Remarque :
A titre de rappel, la matrice de passage M est donn ee par:
m
n
= B
m
n1
= (A + a
n1
I)B
m
n2
= (A
2
+ a
n1
A + a
n2
I)B
.
.
.
m
1
= (A
n1
+ a
n1
A
n1
+ . . . + a
1
I)B
ENSICA 2
` eme
ann ee
20 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT

Sachant que (2.1), apr` es changement de base, devient:

x(t) =
_
_
_
_
_
_
0 1
0 1
.
1
a
0
a
1
. . a
n1
_
_
_
_
_
_
x(t) +
_
_
_
_
_
_
0
.
.
0
1
_
_
_
_
_
_
u(t)
et en prenant

K = [k
0
k
n1
]
il vient alors

A

B

K =
_
_
_
_
_
_
0 1
0 1
.
1
(a
0
+

k
0
) (a
1
+

k
1
) . . (a
n1
+

k
n1
)
_
_
_
_
_
_

A

B

K =
_
_
_
_
_
_
0 1
0 1
.
1

0

1
. .
n1
_
_
_
_
_
_
On retrouve bien une forme compagne de commande dont la derni ` ere ligne est constitu ee des
coefcients de l equation caract eristique (2.5). Par identication, on obtient la valeur des gains

k
i
:

k
i
=
i
a
i
i = 0 . . . n 1 (2.6)
Le retour d etat

K a et e calcul e dans la base compagne par souci de simplication du calcul,
mais le retour d etat effectivement appliqu e (K)le sera dans la base initiale:
K =

KM
1
(2.7)
Existence dune solution
Il est evident que
i
et a
i
, (2.6) aura toujours une solution. La seule contrainte vient
donc de (2.7), cest ` a dire de linversibilit e de M: les vecteurs m
i
doivent etre lin eairement
ind ependants pour que la matrice M soit non singuli` ere: ceci est synonyme de
rang[B AB . . . A
n1
B] = n
ce qui revient ` a v erier la gouvernabilit e du syst` eme.
Le r esultat important de cette etude peut etre enonc e comme suit: Si la paire (A,B) est
gouvernable, les modes du syst` eme peuvent etre modi es de mani` ere arbitraire.
ENSICA 2
` eme
ann ee
2.1. COMMANDE ` A PLACEMENT DE LA DYNAMIQUE 21
Proc edure de calcul dune loi de commande ` a placement de dynamique
1. Sassurer que le syst` eme est gouvernable et que les etats sont mesurables.
2.

Ecrire les equations d etats dans la base canonique (2.4).
3. Se xer le polyn ome caract eristique en boucle ferm ee (2.5).
4. En d eduire le correcteur (2.6 et 2.7).
Remarque :
Dun point de vue pratique, la mise en place de la commande ` a retour d etat se fera par implan-
tation (analogique ou num erique) de
u(t) = e(t) k
0
x
0
(t) k
1
x
1
(t) k
n1
x
n1
(t)
Cette application, en elle-m eme, ne pose aucun probl` eme (n multiplications et n additions!).
Par contre, laccessibilit e aux n composantes du vecteur d etat en posera souvent...
Exemple : Consid erons le syst` eme de fonction de transfert:
Y (p)
U(p)
=
p + 2
(p 1)(p + 1)
Ce syst` eme etant manifestement instable, on d esire trouver une correction d etat (en supposant
tous les etats mesurables), pour que le syst` eme en boucle ferm ee ait une equation caract eristique
correspondant a un second ordre damortissement = 0.75 et de pulsation propre = 1 rd/s.
En boucle ouverte, on a
(p) = p
2
1
En boucle ferm ee, on d esire obtenir
(p) = p
2
+ 2p +
2
= p
2
+ 1,5p + 1
La repr esentation d etat adapt ee est la suivante:
_
x
1
x
2
_
=
_
0 1
0 1
__
x
1
x
2
_
+
_
0
1
_
u
y =
_
2 1
_
_
x
1
x
2
_
Dans la base compagne, le correcteur sera donc calcul e comme suit:

K = [1 + 1 1,5 0] = [2 1,5] = K
et lexpression de la commande est alors
u(t) = e(t) 2x
1
(t) 1,5x
2
(t)
ENSICA 2
` eme
ann ee
22 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
2.1.2 Interpr etation du retour d etat en terme de sortie
Except e le probl` eme de la mesurabilit e des etats, la plus grande limitation du retour d etat
est parfois linterpr etation physique du vecteur d etat. En effet, la mod elisation dun syst` eme
complexe peut aboutir sur lutilisation de variables d etats que le praticien ne saura pas in-
terpr eter, ou lier a la sortie r egul ee. Cest pourquoi il peut etre int eressant de ramener la loi de
commande pr ec edente ` a des grandeurs davantage li ees ` a la sortie.

Etudions par exemple le cas ou la fonction de transfert du syst ` eme a un num erateur de degr e
nul (cest ` a dire que le num erateur se r eduit ` a un gain b
0
). L equation de sortie est alors donn ee
par:
y(t) =
_
b
0
0 . . . 0
_
x(t)
ce qui permet d ecrire:
x
1
=
1
b
0
y x
1
= x
2
=
1
b
0
y . . . x
n
=
1
b
0
y
(n1)
La loi de commande s ecrit alors en fonction de la sortie:
u(t) = e(t)
1
b
0
(k
0
y + . . . + k
n1
y
(n1)
)
ce qui revient donc a reboucler sur lentr ee une combinaison lin eaire de la sortie y(t) et de ses
d eriv ees successives jusqu` a lordre (n 1).

b
0

p
n
+a
n-1
p
n-1
+&+a
0


k
0
+k
1
p+..+k
n-1
p
n-1

1
b
0

+
-
e
u y
Le sch ema pr ec edent permet de comprendre de mani` ere intuitive comment il est possible
de modier tous les modes du syst` eme: Le syst` eme ayant n p oles, le correcteur ram` ene n 1
z eros vers lesquels convergeront, pour un gain sufsamment grand, les n branches du lieu des
racines.
Remarque :
Linconv enient majeur de cette formulation du retour d etat (et il est de taille!), est la n ecessit e
de d eriver plusieurs fois la sortie du syst` eme, ce qui peut se traduire par une perte dinforma-
tion (en r egime stationnaire par exemple), et par une amplication des perturbations affectant
la sortie (bruits de mesures).
ENSICA 2
` eme
ann ee
2.1. COMMANDE ` A PLACEMENT DE LA DYNAMIQUE 23
Exemple : On veut modier la dynamique du syst` eme de fonction de transfert
G(p) =
Y (p)
U(p)
=
1
p
2
(p 1)
pour avoir, en boucle ferm ee,
(p) = p
3
+ 4p
2
+ 4p + 3
Dapr` es ce qui a et e vu pr ec edemment, le correcteur s ecrit
u(t) = e(t) 5(p
2
+ 0,8p + 0,6)y(t)
On a donc rajout e deux z eros en 0,4 0,66j, qui seront des points darr et du lieu des racines.
Si maintenant on trace le lieu des racines de l equation caract eristique (g 2.2):
1 + KG(p) = 1 + K
p
2
+ 0,8p + 0,6
p
2
(p 1)
= 0
3.5 3 2.5 2 1.5 1 0.5 0 0.5 1 1.5
1.5
1
0.5
0
0.5
1
1.5
3.5
0.5 0.3
0.945
3 2.5 2 1.5 1 0.5
0.994
0.976
0.945
0.89 0.68
0.89 0.68 0.81
0.81
0.976
0.994
0.3 0.5
Lieu des racines de 1+KG(p)=0
Re(p)
I
m
(
p
)
k=5
k=5
k=5
FIG. 2.2 Lieu dEvans du transfert boucle ouverte
On peut facilement v erier que pour K = 5, les racines sont bien celles que nous voulions,
cest ` a dire 3 et 0,5 0,87i.
ENSICA 2
` eme
ann ee
24 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
2.2 Adjonction dune action int egrale
2.2.1 Introduction
Nous avons vu que la commande ` a retour d etat permet de modier la dynamique dun
syst` eme sous la seule condition de gouvernabilit e de tous les etats. Si la matrise de la dyna-
mique reste lobjectif principal dun asservissement, il ne faut pour autant pas oublier laspect
statique. Or nous avons montr e que la commande ` a retour d etat peut etre interpr et ee comme
une g en eralisation du r egulateur PD, cest ` a dire un r egulateur sans action int egrale, pourtant
n ecessaire pour r egler le gain statique du syst` eme corrig e: on ne pourra donc pas r egler le gain
statique avec une commande ` a retour d etat u(t) = e(t) Kx(t). Pour sen convaincre davan-
tage, il suft de consid erer un syst` eme de transmittance N(p)/D(p) avec
N(p) = 1
D(p) = a
0
+ a
1
p + . . . + a
n1
p
n1
+ p
n
et une commande ` a retour d etat exprim ee en fonction de la sortie
U(p) = E(p) K(p)Y (p)
avec K(p) = k
0
+ k
1
p + . . . + k
n1
p
n1
Le calcul de la fonction de transfert en boucle ferm ee nous donne
Y (p)
E(p)
=
N(p)
K(p) + D(p)
On voit bien que le gain statique en boucle ferm ee vaut N(0)/(K(0) + D(0)) et quil ne peut
pas etre r egl e, car tous les degr es de libert e de k
i
sont utilis es pour placer la dynamique.
Il va donc falloir rajouter articiellement une action int egrale, ce qui peut etre fa it de plu-
sieurs mani` eres.
2.2.2 Sch ema n

1
L equation d etat du syst` eme sous forme compagne de commande est donn ee par
x(t) =
_
_
_
_
_
_
0 1
0 1
.
1
a
0
a
1
. . a
n1
_
_
_
_
_
_
x(t) +
_
_
_
_
_
_
0
.
.
0
1
_
_
_
_
_
_
u(t)
y(t) =
_
b
0
b
n1
_
x(t)
On rajoute alors une variable d etat suppl ementaire d enie par:
x
n+1
(t) = y(t) =
_
b
0
. . . b
n1
_
x(t)
Cette modication est illustr ee sur la gure 2.3
ENSICA 2
` eme
ann ee
2.2. ADJONCTION DUNE ACTION INT EGRALE 25

u(t)
y(t)
N(p)
D(p)
y dt
1
p
FIG. 2.3 Ajout dun int egrateur par la premi` ere m ethode
Do` u les equations d etat augment ees:
x(t) =
_
_
_
_
_
0 1 0
.
.
.
a
0
a
1
. . . a
n1
0
b
0
b
1
. . . b
n1
0
_
_
_
_
_
_
_
_
_
_
x
1
.
.
.
x
n
x
n+1
_
_
_
_
_
+
_
_
_
_
_
0
.
.
.
1
0
_
_
_
_
_
u(t)
y(t) =
_
b
0
b
n1
0
_
_
_
_
_
_
x
1
.
.
.
x
n
x
n+1
_
_
_
_
_
Il va de soi que le vecteur de gain de retour d etat est lui aussi augment e dune unit e (k
n+1
). Le
sch ema bloc du syst` eme command e est repr esent e sur la gure 2.4:
FIG. 2.4 Retour d etat avec action int egrale
La repr esentation d etat du syst` eme boucl e est alors:
x(t) = Ax(t) + Bu(t)
y(t) = Cx(t)
u(t) = e(t) Kx(t) k
n+1
x
n+1
(t)
Par elimination de u(t), on obtient l equation:
x(t) = (A BK)x(t) + B(e(t) k
n+1
x
n+1
(t))
ENSICA 2
` eme
ann ee
26 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
do` u lon tire, par transformation de Laplace:
X(p) = (pI A + BK)
1
B[E(p) k
n+1
X
n+1
(p)]
Y (p) = CX(p) = C((pI A + BK)
1
B[E(p) k
n+1
X
n+1
(p)])
Y (p) =
N(p)
(p)
_
E(p) k
n+1
Y (p)
p
_
avec
N(p) = b
0
+ b
1
p + . . . + b
n1
p
n1
(p) = (a
0
+ k
0
) + (a
1
+ k
1
)p + . . . + (a
n1
+ k
n1
)p
n1
+ p
n
On pose alors
(p) D(p) + K(p)
avec D(p) de degr e n et K(p) de degr e (n 1). Ainsi on peut r e ecrire:
Y (p)
_
1 +
k
n+1
N(p)
p(p)
_
=
N(p)
(p)
E(p)
et la transmittance du syst` eme corrig e devient:
Y (p)
E(p)
=
pN(p)
p(p) + k
n+1
N(p)
do` u lon tire lexpression du polyn ome caract eristique en boucle ferm ee avec int egration:

BF
(p) = p(p) + k
n+1
N(p)
Connaissant N(p) et D(p), et se xant
BF
(p), le calcul des gains k
i
, i = 0 . . . n r esulte de
lidentication des coefcients de polyn omes:
pK(p) + k
n+1
N(p) =
BF
(p) pD(p)
2.2.3 Sch ema n

2
Dans ce cas, on utilise le mod` ele de la gure 2.5

u(t) y(t)
N(p)
pD(p)
y dt
p u(t) y(t)
N(p)
pD(p)
y dt
p
FIG. 2.5 Ajout dun int egrateur par la deuxi` eme m ethode
La transmittance F(p) = Y (p)/U(p) a maintenant un d enominateur de degr e n + 1; le
polyn ome caract eristique est egal a:
pD(p) = a
0
p + a
1
p
2
+ . . . + a
n1
p
n
+ p
n+1
ENSICA 2
` eme
ann ee
2.2. ADJONCTION DUNE ACTION INT EGRALE 27
dou la repr esentation d etat sous forme canonique de commande:
x(t) =
_
_
_
_
_
0 1 0
.
.
.
0 . . . 1
0 a
0
. . . a
n1
_
_
_
_
_
_
_
_
_
_
x
1
.
.
.
x
n
x
n+1
_
_
_
_
_
+
_
_
_
_
_
0
.
.
.
1
0
_
_
_
_
_
u(t)
y(t) =
_
0 b
1
b
n
_
_
_
_
_
_
x
1
.
.
.
x
n
x
n+1
_
_
_
_
_
La repr esentation d etat de ce syst` eme est:
x(t) = Ax(t) + Bu(t)
y(t) = Cx(t)
u(t) = e(t)

Kx(t)
Par elimination de u(t), on obtient l equation:
x(t) = (A B

K)x(t) + B(e(t)
do` u lon tire, par transformation de Laplace:
X(p) = (pI A + B

K)
1
BE(p)
Y (p) = CX(p) = C((pI A + B

K)
1
BE(p)
Y (p) =
N(p)

(p)
E(p)
avec

(p) = (0 + k
0
) + (a
0
+ k
1
)p + . . . + (a
n1
+ k
n
)p
n
+ p
n+1
On pose alors

(p) pD(p) + K(p)

(p) est le polyn ome caract eristique en boucle ferm ee. Si


BF
(p) est la valeur d esir ee de ce
polyn ome, on doit avoir:
pD(p) + K(p) =

BF
(p)
Le calcul des gains de boucle k
i
, i = 0 . . . n r esulte de lidentication des coefcients de
polyn omes:
K(p) =

BF
(p) pD(p)
ENSICA 2
` eme
ann ee
28 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
2.3 Commande lin eaire quadratique
Le placement des modes du syst` eme par retour d etat, bien que repr esentant une solution
th eoriquement parfaite, souffre dun inconv enient majeur. Si lon prend lexemple dun syst` eme
lent que lon veut acc el erer de mani` ere importante, on aboutira fatalement sur une commande
a gains tr` es importants: en effet, dapr` es (2.2), les gains du correcteur sont calcul es comme les
diff erences entre
les coefcients du polyn ome caract eristique boucle ferm ee, qui seront importants en va-
leur absolue,
et des coefcients du polyn ome caract eristique boucle ouverte, plus faibles en valeur
absolue.
Ces gains importants entraneront une activit e importante de la commande, avec eventuellement
des risques de saturations ou dendommagement des actionneurs. Il est clair quil y a, dans ce
cas, un compromis ` a trouver entre
les performances d esir ees
l energie ` a d epenser pour satisfaire ces performances.
Ces deux sous-objectifs sont g en eralement antagonistes. Un moyen syst ematique de formuler
ce compromis est de consid erer une fonction de co ut, cest ` a dire une fonctionnelle quadratique
comprenant des mesures des deux crit` eres ` a optimiser. La minimisation de ce nouveau crit` ere
par rapport ` a la variable de commande, sous la contrainte d evolution du vecteur d etat, constitue
la m ethode de commande lin eaire quadratique.
Nous pr esentons par la suite une mani` ere g en erale de r esoudre le probl` eme, et lapplication
aux syst` emes lin eaires. Par souci de simplicit e d emonstrative mais sans perte de g en eralit e, nous
consid ererons une commande du type u(t) = Kx(t), cest ` a dire avec consigne nulle.
2.3.1 Pr esentation g en erale du probl` eme
Le probl` eme pos e est le suivant : Choisir la s equence u(.) qui minimise le crit` ere:
J = (x(t
f
)) +
_
t
f
0
L(x,u,t)dt
sous la contrainte egalit e:
x = f(x,u,t) f(x,u,t) x = 0
(x(t
f
)) repr esente une fonction co ut nal(tr` es utile par exemple pour formuler un probl` eme
de rendez-vous spatial ou de docking).
La m ethode des param` etres de Lagrange permet de transformer ce probl` eme de minimisa-
tion sous contraintes en un probl` eme de minimisation sans contraintes. Il suft pour cela de
consid erer la fonctionnelle augment ee:
L(x,u,t) +
T
(f(x,u,t) x)
o` u
T
est un vecteur de multiplicateurs de Lagrange. Le crit` ere devient alors:
J = (x(t
f
)) +
_
t
f
0
[L(x,u,t) +
T
(f(x,u,t) x)]dt
ENSICA 2
` eme
ann ee
2.3. COMMANDE LIN EAIRE QUADRATIQUE 29
En d enissant lHamiltonien H par:
H(x,u,t) = L(x,u,t) +
T
(f(x,u,t)) (2.8)
le crit` ere peut s ecrire:
J = (x(t
f
)) +
_
t
f
0
[H(x,u,t)
T
x]dt
Une fois le probl` eme formul e, la r esolution passe par l elimination du terme en x, par
int egration par parties:
_
t
f
0

T
xdt = [
T
x]
t
f
0

_
t
f
0

T
xdt
On peut alors en d eduire le nouveau crit` ere:
J = (x(t
f
)) + [
T
x]
t
f
0
+
_
t
f
0
[H(x,u,t) +

T
x]dt (2.9)
On appliquera ensuite le principe du calcul des variations: si lon trouve la s equence u(.) qui
minimise J, alors de petites variations arbitraires de u ne doivent pas changer J, donc J = 0
(approximation au premier ordre). Le probl` eme revient donc ` a annuler les petites variations
el ementaires de la fonctionnelle co ut J.
2.3.2 R esolution par le calcul des variations
Le d etail du calcul des variations de chaque composante du crit ` ere (2.9) est le suivant (en
omettant volontairement les arguments x, u et t):


x
x|
t
f
[
T
x]
t
f
0

T
x|
0

T
x|
t
f
H
H
x
x +
H
u
u

T
x

T
x
Ce qui donne nalement pour la variation el ementaire de J:
J = (

x

T
)x|
t
f
+
T
x|
0
+
_
t
f
0
((
H
x
+

T
)x +
H
u
u)dt
Remarque :
A linstant initial, t
0
= 0, et x(0) est connu, donc x|
0
= 0.
ENSICA 2
` eme
ann ee
30 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
A partir de cette expression du crit` ere, on peut alors proc eder ` a un choix judicieux du pa-
ram` etre de Lagrange. En effet, en prenant:

T
=
H
x
avec
T
(t
f
) =

x
|
t
f
(2.10)
Il reste alors pour la variation du crit` ere:
J =
_
t
f
0
(
H
u
u)dt
Une condition n ecessaire pour que cette variation el ementaire soit nulle est:
H
u
= 0 (2.11)
Remarque :
Les equations (2.10) et (2.11) sont les equations dEuler-Lagrange; elles donnent les
conditions n ecessaires pour que la s equence u(.) minimise J.
la deuxi` eme equation deuler-Lagrange (2.11))permet de d eterminer lexpression de la
commande optimale u au sens du crit` ere J.

T
(t
f
) =

x
|
t
f
est appel e la condition de transversalit e.

2.3.3 Application ` a la commande des syst` emes lin eaires


Le point de d epart est le choix du crit` ere ` a minimiser.

Etant donn e que ce crit` ere doit me-
surer une performance ainsi quun co ut energ etique, on le prend g en eralement de la forme:
J = x
T
Gx|
t
f
+
_
t
f
0
(x
T
Qx + ru
2
)dt
sous la contrainte:
x = Ax + Bu
G et Q sont des matrices d enies positives et sym etriques, de dimension n n. r est un r eel
positif.
Remarque :
On retrouve bien un terme quadratique sur le co ut nal (x
T
Gx|
t
f
), et deux termes quadratiques
ENSICA 2
` eme
ann ee
2.3. COMMANDE LIN EAIRE QUADRATIQUE 31
relatifs ` a la performance de lasservissement (x
T
Qx) et ` a l energie d epens ee (ru
2
).
Lexpression de lhamiltonien (2.8)devient:
H = x
T
Qx + ru
2
+
T
(Ax + Bu)
A partir de l` a, les equations dEuler-Lagrange s ecrivent:

= 2Qx A
T

H
u
= 2ru + B
T
= 0
De la deuxi` eme equation on d eduit imm ediatement lexpression de la commande optimale:
u
opt
(t) =
B
T
(t)
2r
(2.12)
Remarque :
La condition de transversalit e devient (t
f
) = 2Gx(t
f
)
Il sagit maintenant de d eterminer lexpression du param` etre de Lagrange (t) qui intervient
dans lexpression de la commande optimale (2.12). Pour cela, on dispose des deux equations
d evolution suivantes:
x = Ax + Bu = Ax
BB
T
2r

= 2Qx A
T

que lon peut r e ecrire sous la forme matricielle:


_
x

_
=
_
A
BB
T
2r
Q A
T
__
x

_
avec x(0) = x
0
et (t
f
) = 2Gx(t
f
)
Ce probl` eme sav` ere particuli` erement difcile a r esoudre car une partie du vecteur d etat
(x)
T
poss` ede une condition aux limites sur t
0
, et lautre partie sur t
f
: il sagit dun probl` eme
aux deux bouts.
Cependant, il est possible de montrer que si:
la paire (A,B) est gouvernable,
la paire (A,C) est observable.
alors on peut proposer:
(t) = 2P(t)x(t)
avec P(t) matrice (n n).
Le probl` eme est maintenant transpos e ` a la d etermination de P(t)
ENSICA 2
` eme
ann ee
32 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
Pour cela, on injecte lexpression pr ec edente de (t) dans son equation d evolution:

(t) = 2

P(t)x(t) + 2P(t) x(t)

(t) = 2

P(t)x(t) + 2P(Ax
BB
T
2r
)

(t) = 2

P(t)x(t) + 2PAx 2
PBB
T
P
r
x
Or, dapr` es l equation dEuler:

(t) = 2Qx(t) A
T
(t)

(t) = 2Qx(t) 2A
T
Px(t)
En egalant les deux expressions pr ec edentes de (t), il vient:
2Qx(t) 2A
T
P(t)x(t) = 2

P(t)x(t) + 2P(t)Ax(t) 2
P(t)BB
T
P(t)
r
x(t)
En eliminant la solution triviale (x(t) = 0), il reste:

P(t) = P(t)A A
T
P(t) +
P(t)BB
T
P(t)
r
Q (2.13)
Cette equation diff erentielle matricielle non-lin eaire porte le nom d equation de Riccati.
Remarque :
P(t) est la matrice de Riccati. Elle est sym etrique et d enie positive.
Lexpression de u
opt
(t) peut maintenant etre exprim ee en fonction de la matrice de Riccati:
u
opt
(t) =
B
T
P(t)
r
x(t) (2.14)
Remarque :
On retrouve bien lexpression dune commande lin eaire par retour d etat, ` a ceci pr` es que pour le
moment, le gain d epend du temps. A noter egalement que ce gain d epend de toutes les donn ees
du probl` eme:
de la repr esentation du syst` eme ` a travers les matrices A et B,
de lexpression du crit` ere quadratique ` a travers les pond erations Q, et r.

ENSICA 2
` eme
ann ee
2.3. COMMANDE LIN EAIRE QUADRATIQUE 33
2.3.4 Cas particulier du crit` ere ` a horizon inni
On peut montrer que dans le cas ou le crit` ere est evalu e sur un horizon inni t
f
= , la
matrice de Riccati est constante. L equation de Riccati devient alors :
PA + A
T
P
PBB
T
P
r
+ Q = 0 (2.15)
Elle est alors appel ee equation alg ebrique de Riccati.
Remarque :
A priori rien nassure lexistence de solution(s) de l equation alg ebrique de Riccati, et donc
dune commande optimale au sens du crit` ere. Cependant, il existe deux r esultats importants:
si le syst` eme est gouvernable et observable, il existe au moins une solution ` a l equation
alg ebrique de Riccati.
sil existe au moins une solution, une seule conduit a un polyn ome caract eristique en
boucle ferm ee stable.

Exemple : Soit le syst` eme du premier ordre d equation d etat:


x = 4x + u
et le crit` ere quadratique ` a minimiser:
J =
_

0
(9x
2
+ u
2
)dt
L equation alg ebrique de Riccati s ecrit donc:
8P + 9 P
2
= 0
P = 9
P = 1

k = 9
k = 1

pole
BF
= 5
pole
BF
= 5
on en d eduit donc lexpression de la commande optimale :
u
opt
(t) = 9x(t)
2.3.5 Interpr etation et r eglage
La commande elabor ee (2.14) est bien du type retour d etat, mais il y a une diff erence fonda-
mentale avec la commande par placement de la dynamique. En effet, dans le cas de la commande
lin eaire quadratique, lobjectif nest pas dimposer une dynamique en boucle ferm ee, mais de
minimiser un crit` ere physique. Donc, une fois le gain de retour d etat calcul e, il convient de
calculer le polyn ome caract eristique en boucle ferm ee pour avoir une id ee pr ecise du comporte-
ment dynamique du syst` eme corrig e. Autrement dit, il faut choisir les pond erations intervenant
ENSICA 2
` eme
ann ee
34 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
dans le crit` ere de mani` ere ad equate, car le lien quantitatif entre ces pond erations et la dyna-
mique en boucle ferm ee nest pas imm ediat. Par contre, il est possible de savoir qualitativement
quelle va etre linuence dune variation de telle ou telle pond eration.
Remarque :
En pratique, quel que soit le type de commande ` a retour d etat choisi (placement de dynamique
ou LQ), le r eglage se fera pas ` a pas, et rarement de mani` ere syst ematique. On proc` ede en fait ` a
plusieurs essais, en afnant les r eglages au fur et ` a mesure.
pour la commande ` a placement de la dynamique, le r eglage initial des modes d esir es doit
etre afn e en fonction des performances obtenues, de la valeur des gains du r egulateur...
pour la commande LQ, le r eglage initial des pond erations doit etre revu en fonction de la
dynamique obtenue, entre autres.
Cest ` a ce niveau quintervient limportance de la simulation de lasservissement.
La matrice Q agit directement sur le transitoire du syst` eme corrig e: on peut dire que plus les
el ements de Q seront importants, plus la dynamique obtenue sera rapide: en effet, si la norme
de Q est grande, le terme x
T
Qx sera pr epond erant devant ru
2
, ce qui revient ` a ne consid erer
que laspect performance dans le crit` ere pour aboutir ` a une dynamique rapide.
Remarque :
En g en eral, un choix judicieux est de prendre Q diagonale, dabord par souci de simplicit e, et
egalement pour pouvoir affecter des contraintes diff erentes suivant les etats. A titre dexemple,
on peut imaginer lexemple dun vecteur d etat contenant position, vitesse et acc el eration, gran-
deurs physiques qui nauront pas le m eme dynamique en boucle ferm ee.
Le r eel r agit sur la commande: plus il sera elev e, plus la commande sera p enalis ee et donc
peu active (r intervient au d enominateur du gain K). Il est cependant int eressant d etudier les
cas extr emes:
cas o` u r 0
Dans ce cas, l energie d epens ee par le contr oleur nest th eoriquement pas limit ee. Si le
d enominateur de la fonction de transfert en boucle ouverte est de degr e n et le num erateur
est de degr e m, alors m p oles rejoindront les m z eros, et les (n m) p oles restants
iront a linni (ce qui est tout a fait classique dapr` es l etude du lieu des racines). La
conguration des p oles sera du type ltre de Butterworth, cest a dire que les p oles seront
plac es sur un demi-cercle centre en 0, et de rayon 1/

r
nm
(gure 2.6).
ENSICA 2
` eme
ann ee
2.3. COMMANDE LIN EAIRE QUADRATIQUE 35
n-m=1
n-m=3
n-m=2
n-m=4
FIG. 2.6 Diff erentes congurations de p oles boucle ferm ee pour r 0
Les p oles etant ` a linni, on obtiendra la r eponse temporelle la plus rapide possible. Par
contre, il peut r esulter des d epassements importants dus ` a de mauvais amortissements
(dautant plus mauvais que n m est grand). On retrouve bien le (trop cruel) dilemme
rapidit e - stabilit e...
cas o` u r
Dans le cas ou la commande est fortement p enalis ee, le contr oleur ne modie aucun des
p oles de la boucle ouverte, except e ceux qui sont instables. Ceux ci sont simplement
transform es en leur sym etrique par rapport a laxe imaginaire. Le contr oleur fait ainsi un
effort minimum pour stabiliser le syst` eme, ceci sans lacc el erer.
ENSICA 2
` eme
ann ee
36 CHAPITRE 2. COMMANDE PAR RETOUR D ETAT
ENSICA 2
` eme
ann ee
37
Chapitre 3
Reconstruction de l etat
3.1 Introduction
La mise en oeuvre dune commande par retour d etat lin eaire, ou plus g en eralement de toute
commande construite ` a partir de la connaissance du vecteur d etat, fait apparatre la notion de
mesurabilit e ou accessibilit e en ligne de chaque composante de l etat. La mesurabilit e est une
notion tout ` a fait pratique: elle traduit simplement le fait que les n composantes du vecteur d etat
sont physiquement mesurables (via une chane dacquisition ad equate). Il ne faut pas confondre
la mesurabilit e et lobservabilit e de l etat: celle-ci est une notion plus th eorique qui traduit le fait
que la connaissance de la sortie du syst` eme permet de reconstruire ou reconstituer lint egralit e
du vecteur d etat.
Pour des syst` emes de grande dimension, on ne peut pas toujours avoir acc` es aux compo-
santes de x. Il faut alors trouver des alternatives, en gardant pour objectif principal la modica-
tion compl` ete de la dynamique du syst` eme. Plusieurs solutions sont envisageables:
1. La premi` ere solution ` a envisager est tout simplement lannulation des gains correspondant
aux etats non mesurables. Par exemple, pour un syst` eme dordre 3, dont l etat x
3
nest pas
accessible, on effectuera le retour d etat avec le gain k = [ k
1
k
2
0] .

Evidemment, la
dynamique en boucle ferm ee ne sera pas celle souhait ee. Il convient donc d evaluer si oui
ou non la perturbation caus ee par ce gain nul k
3
= 0 est acceptable par rapport au cahier
des charges.
2. Une solution envisageable est de r ealiser cette commande ` a partir de la sortie:
u(t) = e(t) Ry(t) avec y(t) = Cx(t)
soit
u(t) = e(t) RCx(t) e(t) Kx(t)
Cette alternative nest possible que si la matrice K est factorisable sous la forme RC, ce
qui nest en g en eral pas le cas..
3. Nous avons vu au chapitre pr ec edent que le retour d etat etait equivalent a un retour
dynamique de sortie (en utilisant les d eriv ees successives de la sortie). Cette solution,
bien quattrayante, est ` a manipuler avec dautant plus de pr ecautions que n est grand, car
chaque etape de d erivation conduit ` a un appauvrissement du signal et ` a une amplication
des perturbations hautes fr equences.
ENSICA 2
` eme
ann ee
38 CHAPITRE 3. RECONSTRUCTION DE L ETAT
4. Une autre m ethode consiste a modier le sch ema-bloc du syst` eme command e, pour nuti-
liser que les composantes mesurables du vecteur d etat; le retour statique (K constant) est
alors remplac e par un retour dynamique (transmittance) des etats mesurables. Prenons
par exemple le cas dun syst` eme du 3
ieme
ordre (3 variables d etat), de transmittance G
d ecomposable en un produit de trois transmittances du 1
er
ordre G = G
1
G
2
G
3
, de sorties
respectives x
1
, x
2
, x
3
, et soit y = x
1
la sortie du syst` eme. Le syst` eme boucl e peut ainsi
etre repr esent e par le sch ema-bloc suivant (g 3.1):

G
1


G
2
G
3

k
1


k
2

k
3

y
e u
x
1


x
2


x
3


FIG. 3.1 Exemple de retour statique
En supposant que la variable x
2
nest pas mesurable, on peut modier le sch ema-bloc de
la facon suivante

G
1


G
2
G
3

k
1
+ k
2
/G
1

k
3

y
e u
x
1


x
2


x
3


FIG. 3.2 Premier exemple de retour dynamique
ou bien encore


G
1


G
2
G
3

k
3
+ k
2
G
2

k
1

y
e u
x
1


x
2


x
3


FIG. 3.3 Deuxi` eme exemple de retour dynamique
ENSICA 2
` eme
ann ee
3.2. APPROCHE INTUITIVE DE LA RECONSTRUCTION DE L ETAT DUN SYST` EME 39
Dans les deux cas (gures 3.2 et 3.3) lobjectif est bien atteint, on conserve la possibilit e
de modier toute la dynamique du syst` eme, ceci sans utiliser tous les etats, mais au prix
dune complexit e plus importante: on retrouve ` a chaque fois dans la boucle de retour un
r egulateur dynamique. Or dun point de vue pratique, il est plus facile de r ealiser un retour
statique quun retour dynamique.
5. Finalement, la m ethode g en eralement retenue consiste ` a reconstruire les etats non mesu-
rables directement par un syst` eme dynamique appropri e, syst` eme appel e observateur de
l etat, ou estimateur de l etat. Cette m ethode est d evelopp ee par la suite.
3.2 Approche intuitive de la reconstruction de l etat dun syst` eme
.
D enition On appelle observateur un syst` eme dynamique capable de reproduire les etats
non mesurables dun syst` eme ` a partir de la connaissance des entr ees et sorties, et eventuellement
des etats mesurables.
A partir dun syst` eme dont l equation d etat est donn ee par:
x(t) = Ax(t) + Bu(t)
on peut reconstruire l etat (et par cons equent la sortie) ` a partir du mod` ele m eme de ce syst` eme:

x(t) = A(t) x(t) + Bu(t)


y(t) = C x(t)
o` u x est lestim e du vecteur d etat r eel x. Les matrices A et B sont bien sur connues, ainsi
que u(t). On recherchera evidemment ` a obtenir x(t) x(t), le plus rapidement et le plus
d` element possible.

systme
modle (A, B)
C
C
u
y
x
x
y
FIG. 3.4 Estimateur de l etat en boucle ouverte
On peut d ej` a remarquer que lobservateur evolue en boucle ouverte, et ceci posera certains
probl` emes:
lobservateur permettra de connatre exactement l etat du syst` eme ` a la condition que
x(0) = x(0). En effet, si la condition initiale sur l etat nest pas connue (ce qui est
tr` es souvent le cas), lerreur destimation peut augmenter ind eniment, ou bien dimi-
nuer tr` es lentement, sa dynamique etant impos ee par la matrice A du syst` eme. Pour sen
ENSICA 2
` eme
ann ee
40 CHAPITRE 3. RECONSTRUCTION DE L ETAT
convaincre, il suft de consid erer lerreur entre l etat r eel et l etat estim e:
(t) = x(t) x(t)
qui satisfait l equation d evolution
(t) = A(t) avec (0)
Lerreur destimation ne d epend plus alors que de sa condition initiale et de la dynamique
de A. Si cette condition initiale nest pas nulle, il est clair que la stabilit e de lestimateur
est impos ee par A, do` u evidemment s erieux probl` eme pour un syst` eme instable...
toute erreur sur la connaissance des matrices A et B se traduira par une divergence de
l etat estim e par rapport ` a sa vraie valeur (ou au moins une non convergence...).
Une solution a ces probl` emes consiste a r einjecter sur lentr ee de lobservateur lerreur entre
la sortie mesur ee y et la sortie estim ee y, de mani` ere ` a corriger lestimation contin ument: on
parle alors destimation en boucle ferm ee.

systme
modle (A, B)
C
C
u
y
x
x
y
L
+
_
FIG. 3.5 Estimateur de l etat en boucle ferm ee
L equation d etat de lobservateur est:

x(t) = A x(t) + Bu(t) + L(y(t) C x(t)) = (A LC) x(t) + Bu(t) + Ly(t)


o` u L est le vecteur de gain destimation, de dimension n.
En fait, ` a partir de lestimateur boucle ouverte, on r einjecte un signal derreur. Le signal
derreur id eal est bien sur (t) = x(t) x(t), mais ne disposant pas de l etat vrai, on utilise
alors plut ot lerreur entre la sortie mesur ee (qui est proportionnelle a l etat!) et la sortie es-
tim ee. Le fait dutiliser une r etroaction permet dobtenir la convergence de lestimateur, ceci
ind ependamment de la valeur initiale de l etat estim e. Dapr` es l equation pr ec edente, la dyna-
mique d evolution de lerreur destimation est maintenant r egie par:
det(pI A + LC) = 0
Ainsi le gain L peut etre choisi de mani` ere ` a obtenir une dynamique dobservation plus rapide
que la dynamique du syst` eme lui m eme.
ENSICA 2
` eme
ann ee
3.3. EQUATIONS G EN ERALES DE LOBSERVATEUR 41
3.3 Equations g en erales de lobservateur
3.3.1 Relations fondamentales
On consid` ere un syst` eme (S) repr esent e par le mod` ele d etat:
x(t) = Ax(t) + Bu(t)
y(t) = Cx(t)
(3.1)
o` u x est de dimension n. A, B et C sont connues, et B et C sont de rang plein. On cherchera
` a repr esenter lobservateur par un mod` ele lin eaire gouvernable:
z(t) = Fz(t) + Gy(t) + Hu(t)
x(t) = Qz(t) + Ry(t)
(3.2)
o` u z est le vecteur d etat de lobservateur, F caract erise la dynamique de lobservation.
Lid ee de d epart est de g en erer un vecteur z de dimension q, tel que
z(t) = Tx(t)
et tel quon puisse calculer x ` a partir de
_
z
y
_
=
_
T
C
_
x
q est lordre de lobservateur.
Dans un premier temps, nous poserons:
z(t) = Tx(t) + (t)
ce qui revient ` a ecrire que l egalit e est v eri ee ` a un pr` es. En combinant cette expression avec
les equations du syst` eme (3.1) et de lobservateur (3.2), il vient:
z(t) = T x(t) + (t)
= T(Ax(t) + Bu(t)) + (t) et
z(t) = Fz(t) + Gy(t) + Hu(t)
= (FT + GC)x(t) + Hu(t) + F(t)
On doit donc v erier, pour tout x et tout u:
(TA FT GC)x(t) + (TB H)u(t) + (t) F(t) = 0
Do` u les equations fondamentales:
TA FT = GC (3.3)
TB = H (3.4)
avec la condition suppl ementaire (t) = F(t). La solution de cette equation matricielle du
premier ordre est:
(t) =
0
e
F(tt
0
)
donc
z(t) Tx(t) = (z
0
Tx
0
)e
F(tt
0
)
ENSICA 2
` eme
ann ee
42 CHAPITRE 3. RECONSTRUCTION DE L ETAT
Le choix de z
0
est libre, mais il ny a aucune raison a priori pour que lon puisse mesurer x
0
` a
t
0
, puisque x est non mesurable! Mais si lon choisit la dynamique de F sufsamment rapide,
(t) d ecrotra rapidement jusqu` a 0.
||e||
||e ||
0
t
t
e
On pourra alors distinguer deux phases successives:
une phase de r ecup eration li ee au d es equilibre des conditions initiales (t < t
e
)
une phase ou z(t) = Tx(t) sera valide(t > t
e
)
Finalement, on veut que l etat observ e x colle au mieux ` a l etat vrai x, donc x = x. Donc,
dapr` es (3.2)
x(t) = Qz(t) + Ry(t)
= QTx(t) + RCx(t)
= x(t)
Dou lon tire par identication:
QT + RC = I (3.5)
3.3.2 Conditions dexistence
La premi` ere condition dexistence porte sur lordre de lobservateur. La relation (3.5) r e ecrite
[R Q]
_
C
T
_
= I
implique evidemment
rang([R Q]) = rang(
_
C
T
_
) = n
De mani` ere g en erale, pour un syst` eme ` a p sorties, on a:
dim
_
C
T
_
= (p + q,n) = n = rang(
_
C
T
_
) min(p + q,n)
ENSICA 2
` eme
ann ee
3.3. EQUATIONS G EN ERALES DE LOBSERVATEUR 43
ce qui revient donc ` a avoir
q n p
Conclusion: Lordre minimal dun observateur dun syst ` eme dordre n est egal a n p, si
p est le nombre de sorties du syst` eme.
La seconde condition est relative a lexistence de la solution de la relation (3.3). On peut
montrer que cette equation admet une solution unique en T si:
A et F nont pas de valeurs propres communes
la paire (F,G) est gouvernable.
Conclusion: On choisira donc les modes de F stables, rapides et distincts des modes de
A.
Lobservateur d etat est construit ` a partir de la relation z = Tx que lon impose entre l etat
vrai x et l etat de lobservateur z. Le choix de la matrice T est donc primordial et offre (a priori)
une innit e de possibilit es pour lobservateur. Nous allons voir deux versions particuli ` eres de
lobservateur d etat:
lobservateur de Luenberger qui minimise la taille du vecteur z
lobservateur identit e pour lequel T = I, donc z = x.
3.3.3 Observateur minimal de Luenberger (cas mono-sortie)
Pour un syst` eme ` a une sortie, C est une matrice ligne. Dans ce cas, la dimension de lob-
servateur dordre minimal est q = n 1, ` a la condition que le syst` eme soit observable, bien
entendu. Par souci de simplicit e d ecriture nous utiliserons la forme compagne dobservation
pour repr esenter le syst` eme:
x =
_
_
_
_
_
_
_
a
n1
1
a
n2
0 1
.
.
.
1
a
0
0
_
_
_
_
_
_
_
x +
_
_
_
_
_
_
b
n1
b
n2
b
0
_
_
_
_
_
_
u
y =
_
1 0 0
_
x
Choisissons pour F la matrice (n1,n1), egalement sous forme compagne dobservation:
F =
_
_
_
_

n2
1

n3
0 1
1

0
0
_
_
_
_
les
i
sont les coefcients du polyn ome caract eristique d esir e pour lobservateur. Luenber-
ger a propos e une solution permettant de v erier la premi` ere equation fondamentale TAFT =
ENSICA 2
` eme
ann ee
44 CHAPITRE 3. RECONSTRUCTION DE L ETAT
GC en utilisant les matrices T (n 1,n) et G (n 1,n) suivantes:
T =
_
_
_
_
_

n2
1

n3
0 1
.
.
.

0
0 1
_
_
_
_
_
G =
_
_
_
_
g
1
g
2
.
g
n1
_
_
_
_
En fait, on simpose T (` a partir de F), et ensuite on r esout (3.3) en G. Pour le produit GC,
on aura alors:
GC =
_
_
_
_
_
g
1
0 0
g
2
.
.
.
g
n1
0 0
_
_
_
_
_
On peut v erier que pour tout A et tout F, la structure de T choisie permet davoir
GC =
_
_
_
_
_
0 0

.
.
.
0 0
_
_
_
_
_
G est donc calcul e en faisant la diff erence des premi` eres colonnes de TA et de FT
H est calcul e dapr` es (3.4) en faisant le produit TB
Remarque :
Il est ainsi possible de d eterminer un observateur dordre (n 1) ` a dynamique arbitraire. En
effet, le point de d epart du calcul de lobservateur est le choix de F, pour lequel il nexiste
aucune condition sur les param` etres
i
, et donc sur la dynamique.
Enn, on peut r e ecrire la troisi` eme equation fondamentale (3.5)
[R Q] =
_
C
T
_
1
=
_
_
_
_
_
1 0

n2
1
.
.
.
.
.
.

0
1
_
_
_
_
_
1
Or, on sait que
_
_
_
_
_
1 0

n2
1
.
.
.
.
.
.

0
1
_
_
_
_
_
1
=
_
_
_
_
_
1 0

n2
1
.
.
.
.
.
.

0
1
_
_
_
_
_
ENSICA 2
` eme
ann ee
3.3. EQUATIONS G EN ERALES DE LOBSERVATEUR 45
do` u lon tire les valeurs de Q et R:
R =
_
_
_
_
_
1

n2
.
.
.

0
_
_
_
_
_
Q =
_
_
_
_
_
0 0
1 0
.
.
.
0 1
_
_
_
_
_
Remarque :
Les matrices T et R ne d ependent que de la dynamique F de lobservateur
La matrice Q ne d epend que de la dimension de lobservateur

Exemple : On consid` ere le syst` eme de fonction de transfert:


Y (p)
U(p)
=
p + 2
p
2
(p 1)
En supposant que seule la sortie y(t) est mesurable, on se propose de construire un observateur
dordre minimal.
Dans la base canonique, les equations d etats sont:
x =
_
_
1 1 0
0 0 1
0 0 0
_
_
x +
_
_
0
1
2
_
_
u
y =
_
1 0 0
_
x
Lobservateur sera dordre q = 3 1 = 2. On choisit une dynamique rapide par rapport aux
modes ` a observer, par exemple:
det(pI F) = (p + 3)
2
= p
2
+ 6p + 9
On en d eduit la matrice F et la matrice T:
F =
_
6 1
9 0
_
T =
_
6 1 0
9 0 1
_
On peut alors calculer H:
H = TB =
_
6 1 0
9 0 1
_
_
_
0
1
2
_
_
=
_
1
2
_
On calcule ensuite GC, et on en d eduit G:
TA =
_
6 1 0
9 0 1
_
_
_
1 1 0
0 0 1
0 0 0
_
_
=
_
6 6 1
9 9 0
_
FT =
_
6 1
9 0
__
6 1 0
9 0 1
_
=
_
27 6 1
54 9 0
_
ENSICA 2
` eme
ann ee
46 CHAPITRE 3. RECONSTRUCTION DE L ETAT
=GC = TA FT =
_
33 0 0
63 0 0
_
=G =
_
33
63
_
Remarque :
En fait il suft de faire la diff erence des premi` eres colonnes de TA et FT pour obtenir G, du
fait de la structure canonique de C
On termine par la d etermination de Q et R:
Q =
_
_
0 0
1 0
0 1
_
_
R =
_
_
1
6
9
_
_
Finalement, l equation d etat lobservateur est:
z =
_
6 1
9 0
_
z +
_
33
63
_
y +
_
1
2
_
u
x =
_
_
0 0
1 0
0 1
_
_
z +
_
_
1
6
9
_
_
y
3.4 Observateur identit e
Cest un observateur tel que lon impose a la matrice T d etre unitaire T = I. On a donc par
la suite
z(t) = x(t) + (t) = x(t)
Le vecteur d etat de lobservateur est directement l etat observ e du syst` eme. Comme
x(t) = Qz(t) + Ry(t) (3.6)
on en d eduit
Q = I R = O (3.7)
L equation de lobservateur etant donn e par:

x(t) = F x(t) + Gy(t) + Hu(t)


et les equations fondamentales des observateurs (3.3, 3.4) donnant
F = A GC H = B
ENSICA 2
` eme
ann ee
3.5. LOBSERVATEUR DANS LA BOUCLE DE COMMANDE 47
on tire la nouvelle equation d etat de lobservateur identit e:

x(t) = (A GC) x(t) + Gy(t) + Hu(t)

x(t) = A x(t) + Bu(t) + G(y(t) C x(t)) (3.8)


Remarque :
On v erie bien que quand lobservateur a converg e, on a x = x, donc y = C x, et l equation
d etat de lobservateur est alors la m eme que celle du mod` ele

x(t) = A x(t) + Bu(t)

Remarque :
Cette equation est identique ` a celle du ltre de Kalman-Bucy qui sera abord e plus loin, o` u G
est le gain du ltre et (y(t) C x(t)) le processus dinnovation. Compte tenu de la relation
F = A GC dans laquelle A et C sont des donn ees connues, il revient au m eme de xer le
gain G ou de xer la dynamique F de lobservateur.
3.5 Lobservateur dans la boucle de commande
3.5.1 Inuence de la dynamique de lobservateur sur le syst` eme boucle
Lasservissement du syst` eme va etre assur e par un retour d etat sur x et non plus sur x.
u(t) = e(t) K x(t)
On peut imaginer que le fait de corriger le syst` eme par retour de l etat observ e entrane une
d et erioration des performances du syst` eme boucl e. Nous allons donc calculer lexpression du
polyn ome caract eristique du syst` eme avec correction et observation d etat.
dynamique syst` eme x(t) = Ax(t) + Bu(t)
sortie y(t) = Cx(t)
dynamique observateur z(t) = Fz(t) + Gy(t) + Hu(t)
etat observ e x(t) = Qz(t) + Ry(t)
commande u(t) = e(t) K x(t)
Par elimination de u et de x entre ces equations, on obtient le mod` ele global du syst` eme:
_
x
z
_
= A
_
x
z
_
+
_
B
H
_
e
y =
_
C O
_
_
x
z
_
ENSICA 2
` eme
ann ee
48 CHAPITRE 3. RECONSTRUCTION DE L ETAT
o` u
A =
_
A BK + BKQT BKQ
T(A BK) + (TBKQF)T F TBKQ
_
= PA

P
1
avec
P =
_
I O
T I
_
A

=
_
A BK BKQ
O F
_
P
1
=
_
I O
T I
_
On peut alors calculer la dynamique totale (syst` eme boucl e sur l etat observ e)
det(pI A) = det(pI A

) = det(pI A + BK)det(pI F)
On a donc rajout e aux modes d esir es par le retour d etat ceux de lobservateur. Si ceux-ci sont
stables et sufsamment rapides, ils ne jouent le r ole que de constantes de temps parasites.
Conclusion: L equation caract eristique du syst` eme avec retour d etat observ e est egale a celle
du syst` eme avec le retour d etat id eal, multipli ee par celle de lobservateur.
Remarque :
En poussant plus loin les calculs, on peut remarquer que la fonction de transfert du syst ` eme
corrig e par retour de l etat observ e est la m eme que celle du syst` eme corrig e sans observation:
Les modes de lobservateur ont donc disparu. Cela implique simplement que tous les modes de
lobservateur sont inobservables.
3.5.2 Retour d etat observ e: cas g en eral
Dans le cas ou le syst` eme nest pas sous forme compagne dobservation, la d emarche est
exactement la m eme que pr ec edemment. On d eterminera un etat observ e dans la base cano-
nique, et il faudra ensuite faire un changement de base inverse pour retrouver l etat dans sa base
initiale. Un autre changement de base sera alors n ecessaire pour effectuer le retour d etat.
R ealisation de lobservateur
z(t) = Fz(t) + Gy(t) + Hu(t)
x
obs
(t) = Qz(t) + Ry(t)
x(t) = M
1
x
obs
(t)
o` u M
1
est la matrice de changement de base (base initiale vers base compagne dobservation).
ENSICA 2
` eme
ann ee
3.5. LOBSERVATEUR DANS LA BOUCLE DE COMMANDE 49
R ealisation du correcteur
u(t) = e(t)

K
2
x
com
(t)
x(t) = M
2
x
com
(t)
o` u M
2
est la matrice de changement de base (base initiale vers base compagne de com-
mande).
Synth` ese dans la base initiale
u(t) = e(t)

K
2
x
com
(t) = e(t)

K
2
M
1
2
M
1
x
obs
(t)
u(t) = e(t)

K
2
M
1
2
M
1
(Qz(t) + Ry(t))
Exemple : On consid` ere le syst` eme d equations d etat:
x =
_
_
1 0 1
0 1 1
1 2 1
_
_
x +
_
_
1
1
1
_
_
u
y =
_
1 0 0
_
x
Le syst` eme est gouvernable et observable. Son equation caract eristique est
(p) = p
3
p
2
4p
On d esire corriger le syst` eme pour avoir
(p) = p
3
+ 6p
2
+ 11p + 6
Calcul du correcteur:
On effectue un changement de base vers la base compagne de commande, avec
M
2
=
_
A
2
B AB 4B AB B B
_
=
_
_
2 3 1
2 1 1
2 1 1
_
_
le correcteur est

K
2
=
_
6 15 7
_
=K
2
=

K
2
M
1
2
=
_
2 4 5
_
Calcul de lobservateur:
On passe dans la base compagne dobservation par la transformation
(M
1
1
)
T
=
_
C
T
A
T
C
T
C
T
A
2T
C
T
A
T
C
T
4C
T
_
=
_
_
1 2 1
0 0 2
0 1 1
_
_
ENSICA 2
` eme
ann ee
50 CHAPITRE 3. RECONSTRUCTION DE L ETAT
soit
M
1
=
_
_
1 0 0
1,5 0,5 0,5
2 1 0
_
_
On choisit ensuite la dynamique de lobservateur, soit (p + 5)
2
. On en d eduit
F =
_
10 1
25 0
_
et par cons equent
T =
_
10 1 0
25 0 1
_
H = TB =
_
13
27
_
G =
_
81
275
_
Finalement, les matrices Q et R sont simplement d eduites de F et de la dimension de lobser-
vateur:
Q =
_
_
0 0
1 0
0 1
_
_
R =
_
_
1
10
25
_
_
Le sch ema complet de lasservissement avec observation de l etat et correction par retour de
l etat observ e est donn e sur la gure suivante:
3.6 Lobservateur optimal de Kalman
3.6.1 Position du probl` eme
Nous avons vu pr ec edemment quil existe plusieurs mani` eres de s electionner le gain dun
observateur. Ce choix, bien que bas e sur une certaine exp erience, comporte n eanmoins une
ENSICA 2
` eme
ann ee
3.6. LOBSERVATEUR OPTIMAL DE KALMAN 51
part darbitraire. Nous allons ici traiter une m ethode de choix optimal de ce gain. Pour ceci,
nous devrons faire des hypoth` eses sp eciques sur la nature des perturbations et des erreurs
dobservations qui affectent le syst` eme. Le point de d epart est donc l ecriture des equations
d etat avec perturbations:
x(t) = Ax(t) + Bu(t) + v(t)
y(t) = Cx(t) + w(t)
o` u v(t) repr esente le bruit sur l etat et w(t) le bruit de mesure ou dobservation.
Supposons maintenant que lobservateur dordre n suivant

x(t) = A x(t) + Bu(t) + G(t)(y(t) C x(t)) (3.9)


soit connect e au syst` eme de d epart. Lerreur de reconstruction ou dobservation est alors donn ee
par
(t) = x(t) x(t)
On peut d enir comme mesure de la qualit e de la reconstruction de l etat lesp erance math ematique
de lerreur de reconstruction
E[
T
(t)(t)]
Cette mesure d epend evidemment de la valeur initiale de l etat estim e x(t
0
) = x
0
et du gain
G(t) de lobservateur.
D enition Le probl` eme qui consiste ` a trouver le gain G(), t
0
t, et la condition
initiale x(t
0
) qui minimise
E[
T
(t)(t)]
o` u
(t) = x(t) x(t)
est appel e le probl` eme dobservation (ou destimation) optimale.
3.6.2 Equations du ltre de Kalman
Hypoth` eses de d epart
x(t) = Ax(t) + Bu(t) + v(t)
y(t) = Cx(t) + w(t)
v et w sont des bruits blancs gaussiens ` a moyenne nulle et de covariances respectives Q et R.
E[v(t)v
T
(t)] = Q Q > 0
E[w(t)w
T
(t)] = R R > 0
E[x(t
0
)] = 0
E[x(t
0
)x
T
(t
0
)] = P
0
v, w et x(t
0
) sont ind ependants entre eux.
ENSICA 2
` eme
ann ee
52 CHAPITRE 3. RECONSTRUCTION DE L ETAT
Equation du ltre

x(t) = A x(t) + Bu(t) + G(t)(y(t) C x(t)) (3.10)


La trajectoire de lestimateur est d enie par:
la dynamique du syst` eme A
lerreur entre valeur observ ee et pr edite
Gain du ltre
G(t) = P(t)C
T
R
1
(3.11)
Matrice de covariance de lerreur destimation
P(t) = E[(x(t) x(t))(x(t) x(t))
T
]
est donn ee par

P(t) = AP(t) + P(t)A


T
P(t)C
T
R
1
CP(t) + Q (3.12)
Remarque :
3.10 correspond ` a n equations
3.12 correspond ` a n(n + 1)/2 equations diff erentielles pour d eterminer les el ements de
P(t) sym etrique
(3.10 + 3.11 + 3.12) sont les equations du ltre de Kalman Bucy pour une formulation en
continu.
Ces equations sont valables pour les syst` emes variants dans le temps, cest ` a dire les
syst` emes pour lesquels les matrices A, B et C d ependent de t.

D emonstration des equations du ltre


Les equations du ltre peuvent etre obtenues par la recherche dun ltre non biais e ` a moyenne
de lerreur minimale.
On consid` ere l equation d etat dun syst` eme non command e (u(t) = 0) sans perte de
g en eralit e:
x(t) = Ax(t) + v(t) (3.13)
y(t) = Cx(t) + w(t) (3.14)
ENSICA 2
` eme
ann ee
3.6. LOBSERVATEUR OPTIMAL DE KALMAN 53
On va directement rechercher un estimateur x(t) dynamique d ependant lin eairement des obser-
vations y(t) sous la forme

x(t) = F(t) x(t) + G(t)y(t) (3.15)


o` u les matrices F(t) et G(t) seront choisies de telle sorte que lestimateur soit sans biais et quil
soit solution de
min
x(t)
E[(x(t) x(t))
T
(x(t) x(t))]
Pour la premi` ere condition (estimateur sans biais), il est n ecessaire que t et x(t)
E[ x(t)] = E[x(t)] E[

x(t)] = E[ x(t)]
cest ` a dire
F(t)E[ x(t)] + G(t)CE[x(t)] = AE[x(t)]
do` u il vient
F(t) = A G(t)C
donc l equation diff erentielle d enissant le ltre devient

x(t) = A x(t) + G(t)(y(t) C x(t)) (3.16)


Il reste alors ` a choisir G(t) an dobtenir lestim e du minimum de variance, estim e qui minimise
tout crit` ere quadratique
J = E[(x(t) x(t))
T
(x(t) x(t))]
= E[trace{(x(t) x(t))
T
(x(t) x(t))}]
= trace{P(t)}
o` u
P(t) = E[(t)(t)
T
]
On cherchera donc
min
x(t)
J = min
x(t)
trace{P(t)}
do` u la d enomination minimum de variance...
A partir de 3.14 et de 3.16 on d etermine l equation diff erentielle
(t) = (A G(t)C)(t) + w(t) + G(t)v(t) (3.17)
equation diff erentielle stochastique lin eaire, le bruit w(t) + G(t)v(t) etant un bruit blanc gaus-
sien car combinaison lin eaire de deux bruits blancs gaussiens,
(w(t) + G(t)v(t)) N(0,Q + G(t)RG
T
(t))
ENSICA 2
` eme
ann ee
54 CHAPITRE 3. RECONSTRUCTION DE L ETAT
Donc P(t) satisfait

P(t) = [A G(t)C]P(t) + P(t)[A G(t)C]


T
+ Q + G(t)RG
T
(t)
equation qui peut s ecrire

P(t) = AP(t) + P(t)A


T
P(t)C
T
R
1
CP(t) + Q + (3.18)
(G(t) P(t)C
T
R
1
)R(G(t) P(t)C
T
R
1
)
T
(3.19)
Sachant que R est d enie positive, on en d eduit que la matrice (G(t) P(t)C
T
R
1
)R(G(t)
P(t)C
T
R
1
)
T
est au moins semi-d enie positive; ` a partir de ce r esultat, on d emontre que
P(t)

P(t)
o` u

P(t) est solution de l equation de Riccati

P(t) = A

P(t) +

P(t)A
T


P(t)C
T
R
1
C

P(t) + Q (3.20)
Or, on peut voir que 3.20 est obtenue de 3.19 en prenant
G(t) = P(t)C
T
R
1
De plus,
P(t)

P(t) trace{P(t)} trace{

P(t)}
Donc,
G(t) =

P(t)C
T
R
1
(3.21)
est bien le gain du ltre optimal recherch e, et 3.16, 3.21 et 3.20 sont bien les equations du ltre
de Kalman recherch e.
3.6.3 Filtre de Kalman dans le cas stationnaire
Nous avons vu que dans la repr esentation d etat du syst` eme ` a observer, les matrices A, B
et C peuvent d ependre du temps: cette libert e offerte est tr` es utile pour mod eliser des syst` emes
non stationnaires (par ex. evolution dune constante de temps, prise en compte du vieillissement
dun actionneur, etc.).
Cependant, dans le cas stationnaire o` u les trois matrices sont constantes, on peut montrer
que si la paire (A,C) est observable, le ltre de Kalman poss` ede un r egime permanent unique
lim
t
G(t) = G
d eni par les equations alg ebriques suivantes:
G = PC
T
R
1
AP + PA
T
PC
T
R
1
CP + Q = 0
(3.22)
Remarque :
Dans le cas dun syst` eme avec entr ee exog` ene en boucle ouverte (la commande par exemple!),
ce signal apparat (logiquement) dans les equations du ltre.
ENSICA 2
` eme
ann ee
3.6. LOBSERVATEUR OPTIMAL DE KALMAN 55
Syst` eme
x(t) = Ax(t) + Bu(t) + v(t)
y(t) = Cx(t) + w(t)
avec u un signal d eterministe.
Filtre de Kalman

x(t) = A x(t) + Bu(t) + G(y(t) C x(t))


G = PC
T
R
1
AP + PA
T
PC
T
R
1
CP + Q = 0

ENSICA 2
` eme
ann ee
56 CHAPITRE 3. RECONSTRUCTION DE L ETAT
ENSICA 2
` eme
ann ee
BIBLIOGRAPHIE 57
Bibliographie
[1] G. Franklin, J. Powell, A. Emami-Naeini, Feedback control of dynamic systems, Addison-
Wesley, 1991.
[2] K. Ogata, Modern Control Engineering, Prentice Hall, 1997.
[3] J.C. Gille, M. Clique, La repr esentation d etat pour l etude des syst` emes dynamiques, Ey-
rolles, 1975.
[4] D. Arzelier, Repr esentation et analyse des syst` emes lin eaires, notes de cours ENSICA,
2004.
[5] J.L. Abatut, R egulation - Commande des syst` emes lin eaires continus. M ethodes
fr equentielles, notes de cours ENSICA, 1998.
[6] A. Bryson, Control of spacecraft and aircraft, Princeton University Press, 1994.
[7] G. Alengrin, A. Titli, Estimation, Filtrage, Commande, notes de cours INSA Toulouse,
1981.
[8] H. Kwakernaak, R. Sivan, Linear optimal control systems, Wiley Interscience, 1972.
ENSICA 2
` eme
ann ee