Académique Documents
Professionnel Documents
Culture Documents
Les problèmes de commande optimale se rencontrent dans la vie de tous les jours : comment
arriver à destination le plus rapidement possible, comment minimiser sa consommation...
Pour un système dynamique quelconque et dont le modèle est connu, le problème de commande
optimale consiste alors à trouver la commande minimisant un critère donné et à vérifier un ensemble
de contraintes. C’est sous cette forme que la commande optimale a été étudiée dès le XIX ème siècle
avec le calcul des variations.
Une des grandes applications de la commande optimale a été l’application au lanceur Apollo dans les
années 1960.
La commande optimale reste un sujet de recherche d’actualité.
On s’intéresse dans une première partie à la commande optimale telle qu’elle a été posée initialement
et dans le cas des systèmes les plus généraux (non linéaires et non stationnaires).
Dans une seconde partie, on traite plus particulièrement les systèmes linéaires non stationnaires
(retour d’état dynamique) et stationnaires (retour d’état statique) dans le cas d’un critère quadratique,
cas connu sous le nom de commande linéaire quadratique (LQ).
avec xf = x(tf). Les fonctions et ainsi que les instants t0 et tf étant donnés, ce critère ne dépend que
de x0 et de u sur [t0, tf]. L’application qui au signal de commande u associe le critère scalaire J(x0,t0,u)
est une fonctionnelle. On peut noter que différents critères existent dans la littérature :
tf
-* le problème de Lagrange : t0
( x, u, t )dt (3)
tf
-* le critère de Bolza : ( x f ) + t ( x, u, t )dt (4)
0
Eventuellement au moyen d'une augmentation d'état du système, il est intéressant de noter qu'ils
sont équivalents. En plus de l'équation d'état qui lie les trajectoires de u et de x, d'autres contraintes
peuvent intervenir. Typiquement :
- l'instant final tf peut être imposé ou libre;
- la commande peut appartenir à un ensemble u U m;
- des contraintes peuvent exister sur l'état final : xf X.
Soit t1 [t0, tf]. Le principe d’optimalité de Bellman énonce que la trajectoire optimale sur [t0, tf]
contient trajectoire optimale sur [t1, tf] avec comme condition initiale x1= x(t1). Autrement dit :
~ t1 ~
J ( x0 ) = min
u[ t0 ,t f ] , x1
[
t0
( x, u, t )dt + + J ( x1 )] (9)
Bien que les développements suivants ne s'appuient pas directement sur ce principe, mais sur le
principe du maximum, ce principe est un résultat classique de la commande optimale et se trouve
souvent utilisé dans la littérature. Il permet d'obtenir une solution optimale en découpant l'intervalle et
en résolvant un problème récursif.
II.1.3 Principe du minimum de Pontriaguine
Soit le système d'équation d'état :
x = f ( x, u, t ) (10)
et le critère de performance :
tf
J ( x0 , t0 , u ) = ( x f , t f ) + ( x, u, t )dt (11)
t0
H ( x, u, p, t ) = ( x, u, t ) + pT f ( x, u, t ) (14)
tf
= ( x f , t f ) + ( H ( x, u, p, t ) + p T x ) dt
t0
tf
= ( x f , t f ) + ( H ( x, u, p, t ) − p T x ) dt − pTf x f + p0T x0
t0
~ tf
= ( x0 , t0 , x f , t f ) + ( H ( x, u, p, t ) − p T x ) dt (15)
t0
~
où ( x0 , t0 , x f , t f ) = ( x f , t f ) − pTf x f + p0T x0 .
Le calcul des variations permet de donner des conditions nécessaires pour résoudre ce problème.
H
On comprend ainsi l'apparition de l'équation de l'état adjoint = − p .
x
b/ Calcul des variations
Le calcul des variations est à la base des méthodes de la commande optimale.
nous donnons un exemple introductif. Dans ce cas, l'inconnue n'est plus un scalaire ni un vecteur,
mais une fonction. Autrement dit, la solution du problème est cherchée dans un espace de dimension
infinie.
b
On cherche une fonction y(x) minimisant une intégrale de la forme : J ( y ) = ( y( x), y ( x), x) dx .
a
trajectoire.
II.1.4 Equation d'Euler-Lagrange
L'équation d'Euler-Lagrange, bien connue en mécanique, peut être retrouvée à partir du principe du
minimum. En notant Ec, l'énergie cinétique et Ep l'énergie potentielle d'un système mécanique, le
principe de moindre action énoncée par Maupertuis postule que le système évolue en minimisant
l'intégrale :
tf
t0
( Ec − E p ) dt (16)
critère :
tf
J ( q0 , t0 , q ) = L( q, q ) dt (17)
t0
On considère un système dont on commande la vitesse, l'équation d'état du système s'écrivant alors
simplement:
q = u (17)
En dérivant la seconde équation par rapport au temps puis en remplaçant p grâce à la première, on
obtient l'équation d'Euler-Lagrange :
d L L
− =0 (22)
dt q q
c'est-à-dire la capacité à remplir la mission de manière précise, lorsque la masse du véhicule est
imparfaitement estimée, ce genre de commande n'est pas très recommandable.
➢ Il s'agit des commandes à temps minimal avec des contraintes intervalle sur les commandes.
➢ La commande optimale est alors toujours égale au maximum ou au minimal.
➢
Exemple illustratif :
o Le Lagrangien est L( x, u, p, t ) = pT Ax + pT bu + 1
tf
o Le critère s’écrit J = L( x, u, p, t )dt .
t0