Chapitre1_Introduction_a _la_Commande_Optimale

1 Introduction
Les problèmes de commande optimale se rencontrent dans la vie de tous

les jours : comment arriver à destination le plus rapidement possible, com-
ment minimiser sa consommation... Pour un système dynamique donné et
dont les équations sont connues, le problème de commande optimale con-
siste alors à trouver la commande minimisant un critère donné. C’est sous
cette forme que la commande optimale a été étudiée dès le XIXème siècle
avec le calcul des variations. Une des grandes applications de la commande
optimale a été l’application au lanceur Apollo dans les années 1960. Notons
néanmoins que les difficultés soulevées par ce genre de problème sont loin
d’être complètement résolues comme en témoignent les sessions dédiées à la
commande optimale dans les conférences d’automatique. La commande op-
timale reste donc un sujet de recherche d’actualité.
On s’intéressera dans une première partie (§2) à la commande optimale

telle qu’elle a été posée initialement et dans le cas des systèmes les plus
généraux. Dans une seconde partie (§3), on s’intéressera plus particulièrement
aux systèmes linéaires dans le cas d’un critère quadratique, cas connu sous
le nom de commande linéaire quadratique (LQ), et qui s’exprime sous la
forme d’un retour statique d’état. On s’intéressera ensuite (§4) à la com-
mande linéaire quadratique gaussienne (LQG) permettant de synthétiser un
correcteur dynamique pour un système dont l’état n’est que partiellement
mesuré. On verra au §5 comment la commande LQG peut se formaliser
comme la synthèse d’un correcteur minimisant une norme matricielle (norme
H2 ) entre des signaux particuliers. Finalement, on s’intéressera à la possibilité
d’obtenir, pour un correcteur quelconque, une forme LQG équivalente.
1
2 Commande optimale
Plutôt que de présenter de manière approfondie le problème de la com-
mande optimale, cette partie constitue plutôt une introduction au sujet. Le
choix a été fait de présenter un résultat s’appuyant sur le principe du max-
imum de Pontriaguine sans rentrer dans la théorie du calcul des variations.
Pour approfondir ce domaine, pour pourrez consulter les ouvrages disponibles
[1, 2, 3]. D’autres cours sont également disponibles ; notamment celui de De-
nis Arzelier (http://www.laas.fr/~arzelier/cours.html).
2.1 Position du problème

Soit un système à temps continu de représentation d’état :
ẋ = f (x, u, t) (1)
et de condition initiale x(t0 ) = x0 , où t ∈ R, u ∈ Rm et x ∈ Rn . Les

signaux u et x sont des fonctions de R vers respectivement Rm et Rn . Pour
la condition initiale x0 et la commande u, l’équation d’état (1) définit une
trajectoire unique x pour l’état sur [t0 , tf ]. Celle-ci est fonction de la condition
initiale x0 et de la commande u sur [t0 , tf ].
Soit un critère :
Z tf
J(x0 , t0 , u) = θ(xf , tf ) + φ(x, u, t)dt (2)
t0
avec xf = x(tf ). Les fonctions θ et φ ainsi que les instants t0 et tf étant

donnés, ce critère ne dépend que de x0 et de u sur [t0 , tf ]. L’application qui
au signal de commande u associe le critère scalaire J(x0 , t0 , u) est une fonc-
tionnelle. On peut noter que différents critères existent dans la littérature :
– le problème de Lagrange :
Z tf
ψ(x, u, t)dt (3)
t0
– le critère de Bolza :
Z tf
θ(xf ) + φ(x, u, t)dt (4)
t0
– le critère de Mayer :
σ(xf , tf ) (5)
2
Eventuellement au moyen d’une augmentation d’état du système, il est intéressant
de noter qu’ils sont équivalents.
En plus de l’équation d’état qui lie les trajectoires de u et de x, d’autres
contraintes peuvent intervenir (sans pour autant remettre en cause le critère
choisi). Typiquement :
– l’instant final peut être imposé ou libre ;
– la commande peut appartenir à un ensemble u ∈ U = 6 Rm ;
– des contraintes peuvent exister sur l’état final : xf ∈ X .
Le problème de la commande optimale consiste alors à trouver la com-
mande ũ minimisant J(x0 , t0 , u) :
ũ = min J(x0 , t0 , u) (6)

u∈U
˜ 0 ) = J(x0 , t0 , ũ)
On notera alors x̃ la trajectoire correspondante de l’état et J(x
la valeur du critère.
2.2 Principe d’optimalité de Bellman

Soit le critère :
Z tf
t0
La trajectoire optimale sur [t0 , tf ] est ũ et le critère optimal :

˜ 0 , t0 ) = min J(x0 , t0 , u).
J(x (8)
u[t0 ,tf ]
Soit t1 ∈ [t0 , tf ]. Le principe d’optimalité de Bellman énonce que la trajectoire

optimale sur [t0 , tf ] contient la trajectoire optimale sur [t1 , tf ] avec comme
condition initiale x1 = x(t1 ). Autrement dit :
Z t1
˜
J(x0 ) = min ˜
φ(x, u, t)dt + J(x1 ) . (9)
u[t0 ,t1 ] ,x1 t0
Bien que les développements suivants ne s’appuient pas directement sur

ce principe, mais sur le principe du maximum, ce principe est un résultat clas-
sique de la commande optimale et se trouve souvent utilisé dans la littérature.
Il permet d’obtenir une solution optimale en découpant l’intervalle et en
résolvant un problème récursif.
3
2.3 Principe du minimum de Pontriaguine
Le principe du minimum de Pontriaguine [4] est ici brièvement énoncé.
On peut se référer à Sage et White [1] § 4.3.1 pour sa démonstration.
Soit le système d’équation d’état :
ẋ = f (x, u, t) (10)
et le critère de performance :
Z tf
t0
On définit l’hamiltonien du système :
H(x, u, p, t) = φ(x, u, t) + pT f (x, u, t) (12)
où p est appelé état-adjoint 1 . Le principe du minimum de Pontriaguine

énonce que la trajectoire optimale minimise l’hamiltonien du système. Autrement
dit :
H(x̃, ũ, p̃) 6 H(x̃, u, p̃) ∀u ∈ U (13)
Le long de la trajectoire optimale, on dispose d’un certain nombre d’équations
permettant de résoudre le problème de commande optimale. Ces équations
sont généralement établies en utilisant le calcul des variations. Pour plus
d’informations, se reporter à un ouvrage de référence.
L’extrémalité de la solution conduit à un jeu d’équations, appelées équations
canoniques de Hamilton, qui régissent les dynamiques de l’état d’une part et
de l’état adjoint d’autre part :
– état
∂H
= ẋ
∂p
– état adjoint
∂H
= −ṗ
∂x
Les équations provenant des conditions dites terminales, en t0 d’une part et
en tf d’autre part sont appelées équations de transversalité :
– à l’origine
T
∂θ ∂θ
−H(t0 ) + δt0 + p(t0 ) + δx0 = 0
∂t0 ∂x0
1. En Anglais : costate vector
4
– à l’arrivée
T
∂θ ∂θ
H(tf ) + δtf + −p(tf ) + δxf = 0
∂tf ∂xf
Enfin, selon la nature du problème, on aura encore certaines relations addi-

tionnelles :
– si aucune contrainte (de type saturation) n’est imposée sur u(t) à l’in-
stant t, on a :
∂H
(t) = 0
∂u
– si H n’est pas une fonction explicite du temps, on a :
dH ∂H
= =0
dt ∂t
Lien avec le calcul des variations

Il s’agit d’un problème d’optimisation sous contrainte égalité f (x, u, t) −
ẋ = 0. En s’appuyant sur le calcul des variations, on est amené à introduire un
multiplicateur de Lagrange p, qui est une fonction du temps, et à introduire
le Hermicien :
H(x, u, p, t) = φ(x, u, t) + pT f (x, u, t) (14)
Le critère s’écrit alors :
Z tf
J˜ = θ(xf , tf ) + (φ(x, u, t) + pT (f (x, u, t) − ẋ)) dt
t
Z 0tf
= θ(xf , tf ) + (H(x, u, p, t) − pT ẋ) dt
t
Z 0tf
= θ(xf , tf ) + (H(x, u, p, t) + ṗT x) dt − pT T
f xf + p (t0 )x0
t0
Z tf
= θ̃(x0 , t0 , xf , tf ) + (H(x, u, p, t) + ṗT x) dt (15)
t0
où θ̃(x0 , t0 , xf , tf ) = θ(xf , tf ) − pT T

f xf + p0 x0 . Le calcul des variations permet
de donner des conditions nécessaires pour résoudre ce problème (cf. para-
graphe A.2, page 42). On comprends ainsi l’apparition de l’équation de l’état
adjoint ∂H ∂x
= −ṗ.
5
2.4 Equation d’Euler-Lagrange
Cf. [1] §3.5 et [5] §4.1.3.
L’équation d’Euler-Lagrange, bien connue en mécanique, peut être retrouvée
à partir du principe du minimum. En notant T , l’énergie cinétique et U
l’énergie potentielle d’un système mécanique, le principe de moindre ac-
tion énoncé par Maupertuis postule que le système évolue en minimisant
l’intégrale : Z tf
(T − U )dt. (16)
t0
Notons q les cordonnées généralisées du système. Soit L(q, q̇) = T (q, q̇) −
U (q) le lagrangien, avec le critère :
Z tf
J(q0 , t0 , q̇) = L(q, q̇)dt (17)
t0
On considère un système dont on commande la vitesse, l’équation d’état du

système s’écrivant alors simplement :
q̇ = u (18)
L’hamiltonien s’écrit alors :
H(q, q̇) = L(q, q̇) + pT q̇ (19)
et le principe du minimum donne les deux équations suivantes :

∂H ∂L
= = −ṗ (20)
∂q ∂q
∂H ∂L
= +p=0 (21)
∂ q̇ ∂ q̇
En dérivant la seconde équation par rapport au temps puis en remplaçant ṗ
grâce à la première, on obtient l’équation d’Euler-Lagrange :
d ∂L ∂L
− = 0. (22)
dt ∂ q̇ ∂q

Chapitre1_Introduction_a _la_Commande_Optimale

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre1_Introduction_a _la_Commande_Optimale

Transféré par

Droits d'auteur :

Formats disponibles

1 Introduction

Les problèmes de commande optimale se rencontrent dans la vie de tous

On s’intéressera dans une première partie (§2) à la commande optimale

2.1 Position du problème

et de condition initiale x(t0 ) = x0 , où t ∈ R, u ∈ Rm et x ∈ Rn . Les

avec xf = x(tf ). Les fonctions θ et φ ainsi que les instants t0 et tf étant

ũ = min J(x0 , t0 , u) (6)

2.2 Principe d’optimalité de Bellman

La trajectoire optimale sur [t0 , tf ] est ũ et le critère optimal :

Soit t1 ∈ [t0 , tf ]. Le principe d’optimalité de Bellman énonce que la trajectoire

Bien que les développements suivants ne s’appuient pas directement sur

On définit l’hamiltonien du système :

H(x, u, p, t) = φ(x, u, t) + pT f (x, u, t) (12)

où p est appelé état-adjoint 1 . Le principe du minimum de Pontriaguine

Enfin, selon la nature du problème, on aura encore certaines relations addi-

Lien avec le calcul des variations

où θ̃(x0 , t0 , xf , tf ) = θ(xf , tf ) − pT T

On considère un système dont on commande la vitesse, l’équation d’état du

L’hamiltonien s’écrit alors :

H(q, q̇) = L(q, q̇) + pT q̇ (19)

et le principe du minimum donne les deux équations suivantes :

Vous aimerez peut-être aussi