Vous êtes sur la page 1sur 61

Commande adaptative directe basée sur la passivité

Dimitri PEAUCELLE - LAAS-CNRS - Université de Toulouse

Razvan LUZI - CNES - ONERA

New trends & challenges in control from specification to validation

RTG12 Workshop Toulouse - 29-30 Novembre 2011


Introduction

n Commande adaptative :
“Modifier le comportement de la loi de commande en réponse à des modifications
dans les dynamiques du processus à contrôler et des perturbations”
θ,δ
yc w y
Σc(θ,δ) Σ(θ,δ)
u

s Suppose de connaı̂tre θ, δ, w. Comment ?


s Impose un choix de loi d’adaptation. Lequel ?
s Le schéma global est non-linéaire. Preuves de stabilité ?
n Commande adaptative robuste :
θ
yc w δ
Σc(θ) Σ(θ,δ)
y
u

Commande adaptative - RTG12 Workshop 1 Novembre 2011, Toulouse


Introduction

n Commande adaptative - Séquencement de gain


l Hypothèses : θ connu en temps réel, varie lentement dans le temps
θc θ
yc δ
Σc(θc) w Σ(θ,δ)
y
u

s Calculer régulièrement les paramètres (optimaux, robustes...) de Σc


s Choisir les paramètres de Σc dans une table de valeurs pré-calculées
(commande tabulée)
s Définir a priori une fonction θc (θ)
(Quand Σc est linéaire : commande Linéaire à Paramètres Variants, LPV)

l Variations temporelles de θ induisent des comportements non-linéaires


l Et si θ n’est pas mesurée ?

Commande adaptative - RTG12 Workshop 2 Novembre 2011, Toulouse


Introduction

n Commande adaptative indirecte


l Hypothèses : θ, δ varient lentement dans le temps
l Estimation paramétrique en temps réel : estimées θ̂, δ̂
θc
θ,δ
θ,δ
yc w
Σc(θc) Σ(θ,δ)
u y

l Principe de séparation :
s Dynamiques d’estimation/séquencement de gain
n’ont pas/peu d’influence sur la dynamique globale
s Estimation indépendante de Σc
l Différentes techniques d’estimation : moindres carrés, gradient, projections...
l Précision d’estimation : besoin d’excitation permanente
Commande adaptative - RTG12 Workshop 3 Novembre 2011, Toulouse
Introduction

n Commande adaptative indirecte


l Si les dynamiques de Σ sont suffisamment lentes : estimation de l’hyper-état
x,w,θ,δ
θ,δ
yc w
N.L. Σ(θ,δ)
y
u

s Dynamiques de θ et celles de x peuvent être proches


s Généralise le schéma : retour d’état/observateur
s Problème d’estimation très complexe
s Commande fortement non linéaire, grandes dimensions

Commande adaptative - RTG12 Workshop 4 Novembre 2011, Toulouse


Introduction

n Commande adaptative indirecte


θc
θ,δ
θ,δ
yc w
Σc(θc) Σ(θ,δ)
u y

n Commande adaptative directe


θc
θ,δ
yc w
Σc(θc) Σ(θ,δ)
u y

s Si θc = F (θ, δ) et F inversible :
le calcul de θc est un problème d’estimation pour Σ(F −1 (θc ))
s “MIT rule” : heuristique quand F est inconnue
Commande adaptative - RTG12 Workshop 5 Novembre 2011, Toulouse
Introduction

n Commande adaptative directe


θc
θ,δ
yc w
Σc(θc) Σ(θ,δ)
y
u

l Schéma de commande plus simple


(parfois appelée “simple adaptive control”, [Barkana])
l Possibilité d’obtenir des preuves de stabilité de la boucle fermée complète
(sans principe de séparation)

s Résultats de stabilité par la théorie de Lyapunov


s Limitations : Hypothèses de passivité sur Σ
(parfois appelée “passivity-based adaptive control”, [Fradkov])

Commande adaptative - RTG12 Workshop 6 Novembre 2011, Toulouse


Introduction

n Commande adaptative à modèle de référence - MRAC


l Jusqu’ici : régulation autour d’un point d’équilibre
l Résultats s’étendent à : adaptation pour suivre comportement de référence
Σm

θc
ym
θ,δ
yc w y −
Σc(θc) Σ(θ,δ) +
u ε

l Exemple : Modèle de référence du second ordre pour moteur à courant continu


1
(τ1s+1)(τ2s+1)

ωc u k ω − e
+ +
− Is+f

Commande adaptative - RTG12 Workshop 7 Novembre 2011, Toulouse


Plan

Ê MRAC dans le cas SISO et règle du MIT


s Basée sur problème de régulation à 2 degrés de liberté (RST)
s Méthode de gradient issue des techniques d’estimation
s Règle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypothèses de type passivité sur les systèmes
s Preuves de stabilité avec théorie de Lyapunov
Ì PBMRAC
Í Cas des systèmes non passifiables

Commande adaptative - RTG12 Workshop 8 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Commande à deux degrés de liberté pour les systèmes linéaires


l Hypothèses
B
s Système à commander SISO, LTI : y = u
A
Bm
s Modèle de référence : ym = uc
Am
T S
l Loi de commande : u = uc − y
R R

l Nombreuses hypothèses sur A, B , Am , Bm , R, S , T

Commande adaptative - RTG12 Workshop 9 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Commande adaptative pour régler les coefficients de R, S, T

R(s) = sq + rq−1 sq−1 + . . . r1 s + r0 ,


S(s) = sq sq + . . . s1 s + s0 , T (s) = tq sq + . . . t1 s + t0

l Paramètres de commande
 
θc = rq−1 · · · r0 sq · · · s0 tq · · · t0

s Commande adaptative : ajuster les θci pour avoir y = ym


s Choix d’un coût à minimiser :
1 2
J1 = |e|, J2 = e ...
2
où e = y − ym

Commande adaptative - RTG12 Workshop 10 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

l Méthode du gradient pour minimiser les paramètres de commande :


dθci ∂J
= −γ
dt ∂θci
dθci ∂e
s Pour J2 on trouve = −γe
dt ∂θci

∂e
l Connaı̂tre en temps réel ?
∂θci

Commande adaptative - RTG12 Workshop 11 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

l Règle du MIT :
∂e si ∂e si ∂e si
' uc , '− y , '− u
∂ti Ao Am ∂si Ao Am ∂ri Ao Am
où Ao polynôme aux dynamiques rapides (le plus souvent = 1).

l Les règles d’adaptation sont réalisables à l’aide de filtres et d’intégrateurs


s Exemple pour coût J2 :
Σm

dsi si θ,δ ym
ε
= γe y Σ(θ,δ) +

dt Ao Am y
si γ
AoAm * s si

Commande adaptative - RTG12 Workshop 12 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

l Remarques :
s Résultat est heuristique : pas de garantie (ni suivi de référence, ni stabilité)
s Si l’ordre du système est inconnu :
choisir Ao et degrés de R, S et T intuitivement
s Stabilité implique convergence de e = y − ym
s Aucune indication sur la convergence des gains du correcteur

Commande adaptative - RTG12 Workshop 13 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT
n Exemple : moteur à courant continu
Gm

ωc u k ω − e
+ +
− Is+f

S s0 T t0
l Boucle de régulation = , Précommande =
R s + r0 R s + r0
so ω

ṡo = γe[ A1m ω]


ωc to − 1 u
+ ṫo = −γe[ A1m ωc ]
− s

ro ṙo = γe[ A1m u]

Commande adaptative - RTG12 Workshop 14 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


1 6
l G(s) = s+1 , Gm (s) = s2 +5s+6 , γ = 0.6,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125

0.5

0.4

0.3

0.2

0.1

−0.1

0 20 40 60 80 100 120 140 160 180 200 220

s Relativement bonne convergence

Commande adaptative - RTG12 Workshop 15 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 0.6,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125
0.6

0.5

0.4

0.3

0.2

0.1

−0.1

−0.2
0 20 40 60 80 100 120 140 160

s Parait robuste

Commande adaptative - RTG12 Workshop 16 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 0.6,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125
0.4

0.35

0.3
t0
0.25

0.2

s0
0.15

0.1

0.05
r0
0

0 20 40 60 80 100 120 140 160

s Convergence lente (deux périodes) - augmenter γ pour accélérer

Commande adaptative - RTG12 Workshop 17 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 6,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125

t0
0.8

0.6

s0
0.4

0.2

r0
0

0 20 40 60 80 100 120 140 160

s Les gains sont rapidement plus grands (et très différents...)

Commande adaptative - RTG12 Workshop 18 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 6,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125

0.8

0.7

0.6

0.5
ω
0.4

0.3

0.2

0.1
ωm
0

−0.1

−0.2

0 20 40 60 80 100 120 140 160

s Le transitoire (avant convergence des gains adaptatifs)


plus court, mais avec fort dépassement

Commande adaptative - RTG12 Workshop 19 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 60,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125

0.8

0.6 ω
0.4

0.2
ωm
0

−0.2
0 10 20 30 40 50 60 70 80 90 100

s Le transitoire très court, mais avec fort dépassement


s Suivi de référence parfait une fois que les gains ont convergé

Commande adaptative - RTG12 Workshop 20 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 60,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125
6

t0
4

2 s0
1

0
r0
−1
0 10 20 30 40 50 60 70 80 90 100

s Les gains semblent vraiment converger

Commande adaptative - RTG12 Workshop 21 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT
n Exemple : moteur à courant continu - Simulations
10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 60,
l ωc (t) créneau de période 20s, valeur max = 0.075, valeur min = −0.025
0.16

0.14

0.12

0.1

0.08 ω
0.06

0.04

0.02
ωm
0

−0.02

−0.04

0 50 100 150

s L’amplitude de l’erreur étant faible, la convergence est lente


s Possibilité pour éviter ces phénomènes : adapter γ

Commande adaptative - RTG12 Workshop 22 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10 6
l G(s) = (s2 +s+1) , Gm (s) = s2 +5s+6 , γ = 60,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125
5

ω
2

1
ωm
0

−1
0 10 20 30 40 50 60 70 80 90 100

s Ce n’est quand même pas parfait pour tout système


s Degrés du régulateur RST sous hypothèse d’un système du 1er ordre

Commande adaptative - RTG12 Workshop 23 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


l G(s) = −1.1s+10
(s2 +s+1)
, Gm (s) = 6
s2 +5s+6
, γ = 60,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125
1

0.8

0.6

0.4

0.2
ω
0

−0.2

−0.4 ωm
−0.6

−0.8

−1
200 220 240 260 280 300 320 340 360 380 400

s Il peut y avoir des phénomènes instables : ‘burst’

Commande adaptative - RTG12 Workshop 24 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


l G(s) = −1.1s+10
(s2 +s+1)
, Gm (s) = 6
s2 +5s+6
, γ = 60,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125
2000

1800

1600
t0
1400

1200

1000
s0
800

600

400

200
r0
0
330 335 340 345 350 355 360

s Ce ne sont évidement pas des valeurs de gain réalisables

Commande adaptative - RTG12 Workshop 25 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Modification des lois d’adaptation


l σ -modification : Empêcher les gains de diverger
(en particulier sous l’effet de bruits de mesure)

γ
ṡo = γe[ A1m ω] ṡo = 1+βe 2 e[ 1
Am
ω] − σso
γ
ṫo = −γe[ A1m ωc ] −→ ṫo = − 1+βe 1
2 e[ A ωc ] − σto
m
γ
ṙo = γe[ A1m u] ṙo = 1+βe 2 e[ 1
Am
u] − σro

s Pas de point d’équilibre possible pour les gains

Commande adaptative - RTG12 Workshop 26 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10
l G(s) = (s+0.8)(s+8) 6
, Gm (s) = s2 +5s+6 , γ = 60, β = 0.1, σ = 10−4 ,
l ωc (t) créneau de période 20s, valeur max = 0.75, valeur min = −0.25

1.5

ω
1

0.5
ωm
0

0 20 40 60 80 100 120 140 160 180 200

s Bon réglage de l’algorithme d’adaptation : bonnes performances de suivi

Commande adaptative - RTG12 Workshop 27 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Exemple : moteur à courant continu - Simulations


10
l G(s) = (s+0.8)(s+8) 6
, Gm (s) = s2 +5s+6 , γ = 60, β = 0.1, σ = 10−4 ,
l ωc (t) créneau de période 20s, valeur max = 0.75, valeur min = −0.25
20

15 t0
10

s0
5

r0
−5
0 50 100 150 200 250 300

s Bon réglage de l’algorithme d’adaptation : gains raisonnables, varient peu

Commande adaptative - RTG12 Workshop 28 Novembre 2011, Toulouse


Ê MRAC dans le cas SISO et règle du MIT

n Conclusions
l Algorithme du gradient potentiellement satisfaisant
s Robustesse relativement grande - mais non prouvée
s Pas besoin de connaı̂tre le modèle du système
s γ influe sur la vitesse de convergence, à régler par expérimentations
s β, σ modifications, à régler par expérimentations
l Aucune preuve de stabilité/performance
s Quelles hypothèses à faire sur le système ?
s Est-il possible de stabiliser des systèmes instables ?
s Extensions aux systèmes MIMO ?
s Comment garantir des gains bornés/réalisables ?

Commande adaptative - RTG12 Workshop 29 Novembre 2011, Toulouse


Plan

Ê MRAC dans le cas SISO et règle du MIT


s Basée sur problème de régulation à 2 degrés de liberté (RST)
s Méthode de gradient issue des techniques d’estimation
s Règle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypothèses de type passivité sur les systèmes
s Preuves de stabilité avec théorie de Lyapunov
Ì PBMRAC
Í Cas des systèmes non passifiables

Commande adaptative - RTG12 Workshop 30 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n Commande adaptative basée sur la passivité (PBAC)


s Hypothèses de type passivité sur les systèmes
s Preuves de stabilité avec théorie de Lyapunov

Σm

θc
ym
θ,δ
yc w y −
Σc(θc) Σ(θ,δ) +
u
e

l Dans un premier temps on suppose yc = 0


l On veut montrer que le système est stable

Commande adaptative - RTG12 Workshop 31 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n Systèmes passifs
l Système non-linéaire ẋ = f (x, v), z = g(x, v) est passif si
s il est carré : nombre d’entrées v = nombre de sorties z ,
s pour des CI nulles x(0) = 0, pour tout v et pour tout t ≥ 0, on a
Z t
z T (t)v(t)dt ≥ 0
0

l Passivité : produit scalaire entrées/sorties est positif


“sorties vont dans le même sens que les entrées”
l Propriété de nombreux systèmes
l Pour les systèmes mécaniques (entrées : forces - sorties : vitesse),
l’intégrale correspond à l’énergie accumulée dans le système

Commande adaptative - RTG12 Workshop 32 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n Théorème - Systèmes passifs

Un système est strictement passif s’il existe une fonction V : Rn → R


s nulle à l’origine : V (0) = 0
s définie-positive : V (x) > 0 ∀x 6= 0
s dont les dérivées le long des trajectoires du système vérifient

V̇ (x) ≤ z T v − xT x

l V : “storage function”
l aussi fonction de Lyapunov prouvant la stabilité asymptotique du système

Commande adaptative - RTG12 Workshop 33 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n Rétroaction de systèmes passifs


l Soient deux systèmes avec le même nombre d’entrées/sorties

ẋ1 = f1 (x1 , v1 ) , z1 = g1 (x1 , v1 )


ẋ2 = f2 (x2 , v2 ) , z2 = g2 (x2 , v2 )

s s’ils sont tous les deux strictement passifs


s alors l’interconnexion v2 = z1 , v1 = −z2 est asymptotiquement stable
l Preuve V̇1 + V̇2 ≤ z1T v1 + z2T v2 −1 xT1 x1 − 2 xT2 x2 < 0
| {z }
=0

l Cas particulier : z2 (t) = ∆K (t)v2 (t) avec ∆K (t) + ∆TK (t)  0


s un cône de gains statiques qui préservent la stabilité de la boucle fermée
s les gains peuvent varier dans le temps, quelle que soit la règle, adaptative ?

Commande adaptative - RTG12 Workshop 34 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

l Conditions de strict-passivité des systèmes linéaires :


 
T T
A P + P A + 21 P B − C
P = PT  0 :  0
BT P − C −D − DT

s Preuve : V = 21 xT P x
 T   
x AT P + P A + 21 PB − CT x
= 2(V̇ − z T w + xT x) ≤ 0
w BT P − C −D − DT w

s Dans le cas des systèmes sans transfert direct (D = 0)

P = P T  0 , AT P + P A + 21  0 , P B = C T

Commande adaptative - RTG12 Workshop 35 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n [Fra74, BK85] Théorème


l Passification par retour de sortie adaptatif des systèmes “presque passifs”
l S’il existe un retour de sortie statique u = −F y qui rend le système

ẋ = Ax + Bu + Bv, y = Cx, z = y

strictement passif en boucle fermée, alors, pour tout Γ  0,


la commande adaptative

u = −Ky, K̇ = yy T Γ

rend le système passif en boucle fermée.

Commande adaptative - RTG12 Workshop 36 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

l Preuve intuitive
s Existence d’un retour de sortie passifiant :

⇒ ẋ = (A − BF C)x + Bv, z = Cx est passif

⇒ ∀∆TK + ∆K  0 ẋ = (A − BF C − B∆K C)x est stable


s En prenant ∆K suffisamment grand,
tout K = F + ∆K , K + K T  0, stabilise le système

s La loi adaptative K̇ = yy T Γ “pousse” les gains à devenir “grands”


dans la direction K + K T  0

s Tand que y n’a pas convergé à zéro,


la loi tend à augmenter le gain de commande

Commande adaptative - RTG12 Workshop 37 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

l Preuve par la théorie de Lyapunov


s On souhaite prouver la passivité du système non linéaire :

ẋ(t) = (A−BK(t)C)x(t)+Bv(t) , K̇(t) = y(t)y T (t)Γ , z(t) = Cx(t)

s sous l’hypothèse qu’il existe un gain Ko strictement passifiant :

∃F, P  0,  > 0 :
(A − BF C)T P + P (A − BF C) + 21  0 , P B = C T

s Choix d’une fonction de Lyapunov qui dépend de tous les états


1 T −1 T

V (x, K) = x P x + Tr (K − F )Γ (K − F )
2
s Il suffit de démontrer que V̇ ≤ z T v , le long des trajectoires

Commande adaptative - RTG12 Workshop 38 Novembre 2011, Toulouse


Ë Stabilisation par PBAC
l Preuve par la théorie de Lyapunov
1 T −1 T

V (x, K) = x P x + Tr (K − Ko )Γ (K − Ko )
2
s Calcul de sa dérivée
 
V̇ = ẋT P x + Tr K̇Γ−1 (K − Ko )T

s Trajectoires : ẋ = (A − BKC)x + Bv , K̇ = yy T Γ
T T T T T T

V̇ = x (A − BKC) P x + v B P x + Tr yy (K − Ko )
s Propriété de l’opérateur trace : Tr(AB) = Tr(BA) :
T T
= Tr y (K − Ko ) y = y T (K − Ko )T y
T T
 
Tr yy (K − Ko )

s Donc comme y = Cx on a
V̇ = xT (A − BKC)T P x + v T B T P x + xT C T (K − Ko )T Cx

Commande adaptative - RTG12 Workshop 39 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n Conditions pour qu’un système linéaire soit stabilisable par PBAC [Fra03]
l Cas des systèmes SISO, y = H(s)u :
s Le système doit être stabilisable par u = −ky avec k > 0 grand
s Lieu d’Evans : H(s) ne doit pas avoir de zéros instables
s Lieu d’Evans : H(s) doit être de degré relatif ≤ 1
l Cas des systèmes MIMO : (A, B, C) à hyper minimum de phase
s det(sI − A) det(C(sI − A)−1 B) a toutes ses racines stables (zéros)
s CB = (CB)T  0, gain haute fréquence est défini positif
(le degré relatif du système ≤ m où m : nb d’entrées)

l Limitations
s Systèmes carrés (CB est carrée), et tels que CB = (CB)∗  0
s Degré relatif ≤ m et zéros stables

Commande adaptative - RTG12 Workshop 40 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n PBAC modifiée pour les systèmes non-carrés


n [Fra03] Théorème
l S’il existe un retour de sortie statique u = −Ko y ,
et une matrice G qui rendent le système

ẋ = Ax + Bu + Bv, y = Cx, z = Gy

strictement passif en boucle fermée, alors, pour tout Γ  0,


la commande adaptative

u = −Ky, K̇ = Gyy T Γ

rend le système passif en boucle fermée.


s Exercice : démontrer le théorème
l Applicable si le nombre de sorties est supérieur au nombre de commandes

Commande adaptative - RTG12 Workshop 41 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n Exemple - Modèle avion - longitudinal


 T
l x = α q , α incidence, q vitesse de tangage,
l u = δ braquage de gouverne
   
zα 1 0
ẋ =   x+  u , y=x
mα mq mδ

s Matrice de transfert :
 
mδ 1
y= 2  u
s − (zα + mq )s + zα mq − mα s − zα

Commande adaptative - RTG12 Workshop 42 Novembre 2011, Toulouse


Ë Stabilisation par PBAC

n Exemple - Modèle avion


h i
s Combinaison linéaire des sorties z = g1 g2 y:

z mδ g2 (s − zα + g1 /g2 )
= 2
u s − (zα + mq )s + zα mq − mα
est à hyper minimum de phase si g1 /g2 − zα > 0 et mδ g2 > 0
s En prenant g2 = sign(mδ ) (mδ doit être de signe connu)
et en prenant |g1 | suffisamment grand devant valeurs attendues de zα

u = −Ky , K̇ = Gyy T Γ

stabilise le système pour toute valeur des paramètres.

s Γ (et β , σ modifications) à régler en simulation.

Commande adaptative - RTG12 Workshop 43 Novembre 2011, Toulouse


Plan

Ê MRAC dans le cas SISO et règle du MIT


s Basée sur problème de régulation à 2 degrés de liberté (RST)
s Méthode de gradient issue des techniques d’estimation
s Règle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypothèses de type passivité sur les systèmes
s Preuves de stabilité avec théorie de Lyapunov
Ì PBMRAC
Í Cas des systèmes non passifiables

Commande adaptative - RTG12 Workshop 44 Novembre 2011, Toulouse


Ì PBMRAC

n MRAC basée sur la passivité


Σm

θc
ym
θ,δ
yc w y −
Σc(θc) Σ(θ,δ) +
u
e

l Jusqu’ici yc = 0 et commande u(t) = −K(t)y(t)


l Cas avec modèle de référence : u = −K(t)e(t) + L(t)xm (t) + M (t)yc (t)
s K(t) a pour rôle de stabiliser la boucle (comme précédemment)
s L(t) et M (t) définissent une pré-commande pour le suivi de la référence
l Etude menée pour les systèmes linéaires (linéarisé d’un modèle non-linéaire)

Commande adaptative - RTG12 Workshop 45 Novembre 2011, Toulouse


Ì PBMRAC
n Hypothèses sur le système
l Le système est “presque passif” :
Il existe un retour de sortie statique u = −Ko y ,
et une matrice G qui rendent le système

ẋ = Ax + Bu + Bv, y = Cx, z = Gy

strictement passif en boucle fermée

l Il existe une pré-commande Lo , Mo qui permet le suivi parfait :

ẋo = Axo + B(Lo xm + Mo yc ) ⇒ Cxo = ym

où xm est l’état du modèle de référence (dont l’ordre peut être 6= n)

ẋm = Am xm + Bm yc , ym = Cm xm

s Hypothèse forte, équivalente aux hypothèses sur régulateurs RST


Commande adaptative - RTG12 Workshop 46 Novembre 2011, Toulouse
Ì PBMRAC

n MRAC basée sur la passivité


Σm

θc
ym
θ,δ
yc w y −
Σc(θc) Σ(θ,δ) +
u
e

l Si les hypothèses sont vérifiés, alors pour tous ΓK  0, ΓL  0, ΓM  0,


la loi de commande

u = −K(t)e(t) + L(t)xm (t) + M (t)yc (t) , e = y − ym


K̇ = GeeT ΓK , L̇ = −GexTm ΓL , Ṁ = −GeycT ΓM

est telle que lim(x(t) − xo (t)) = 0.

Commande adaptative - RTG12 Workshop 47 Novembre 2011, Toulouse


Ì PBMRAC

n PBMRAC pour une classe de systèmes nonlinéaires

ẋ = Ax + Aφ φ(y, u, t) + Bu , y = Cx

l La loi de commande suivante stabilise le système et x(t) → xm (t).

u = −Ke + Lxm + M yc + N φ , e = y − ym
K̇ = GeeT ΓK , L̇ = −GexTm ΓL , Ṁ = −GeycT ΓM , Ṅ = −GeφT ΓN

s Example : système saturé

ẋ = Ax + B sat(u) = Ax + Bu − B dz(u)

Le terme N dz(u) de la commande est un anti-windup.

s En pratique si yc n’est pas constante N (t) diverge...

Commande adaptative - RTG12 Workshop 48 Novembre 2011, Toulouse


Ì PBMRAC
n Conclusions sur PBMRAC
l Fort potentiel d’application pour les systèmes “presque passifs”
(existence de G et Ko tels que G(H(s) ? Ko ) est passif
l Loi d’adaptation de la forme K̇ = GeĕT Γ
s Tant que e n’a pas convergé les gains s’adaptent, dans la direction G
s Ils peuvent potentiellement diverger
s Si (transitoirement) ||e|| est grand, alors K̇ est grand (pas réalisable)
l Possibilité de faire β, σ modifications :
K̇ = GeĕT Γ(1 + eT βe)−1 − σK
s mais les preuves de stabilité ne tiennent plus ...
s Ici dans le cas β = 0
V̇ ≤ −||x − xo ||2 − σ Tr(KΓ−1 (K − Ko )T ) ≤ 0?
Si K est bornée, on peut avoir V̇ ≤ 0 pour ||x − xo || ≥ ρ : stabilité pratique
Commande adaptative - RTG12 Workshop 49 Novembre 2011, Toulouse
Plan

Ê MRAC dans le cas SISO et règle du MIT


s Basée sur problème de régulation à 2 degrés de liberté (RST)
s Méthode de gradient issue des techniques d’estimation
s Règle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypothèses de type passivité sur les systèmes
s Preuves de stabilité avec théorie de Lyapunov
Ì PBMRAC
Í Cas des systèmes non passifiables

Commande adaptative - RTG12 Workshop 50 Novembre 2011, Toulouse


Í Cas des systèmes non passifiables

n Passivity-Based Adaptive Control [Fradkov 1974, 2003]


& Simple Adaptive Control [Kaufman, Barkana, Sobel 94]

l Let Σ ∼ (A, B, C, D) be a MIMO system with m inputs / p ≥ m outputs.


l If ∃ (G, F ) ∈ (Rp×m )2 such that the following system is passive
+ Σ G
v u y z
F
l then the following adaptive law stabilizes the system for all Γ > 0

K̇ = −Gyy T Γ , u = Ky

Commande adaptative - RTG12 Workshop 51 Novembre 2011, Toulouse


Í Cas des systèmes non passifiables

n Underlying properties
l Passivity implies that for all ∆ + ∆∗ ≥ 0 the following system is stable
+ Σ G
v u y z
F

−∆
l i.e. all gains (F − ∆G) stabilize the system, for ∆ + ∆∗ ≥ 0, possibly large
l K̇ = −Gyy T Γ “pushes” the gains in that direction until stability is reached
s In practice : Need to limit growth of K . Modifications of adaptive law

K̇ = −Gyy T Γ + φ(K) (eg. φ(K) = −σK)

Commande adaptative - RTG12 Workshop 52 Novembre 2011, Toulouse


Í Cas des systèmes non passifiables
n What if Σ is not passifiable by (G, F ) ?
l ∃S a feedthrough (or Shunt) such that the following system is passive
S

+ Σ + G
v u y z
F
l then the adaptive law stabilizes the system Σ + S .
s [KBS94] For SISO Σ one can take S(s) = FS−1 (s) where FS is stabilizing
s In practice : S should be small for tracking issues (u = K(y + Su))
u Σ y
s Rq : The actual gain is bounded
K +
K̂ = (1 − KS)−1 K
S
K

Commande adaptative - RTG12 Workshop 53 Novembre 2011, Toulouse


Í Cas des systèmes non passifiables

n Proposed result [PDPM11]


l K bounded thanks to a modification of the adaptive law :

K̇ = −Gyy T Γ − ψD (K) · (K − F ) , u = Ky

s ψD is a deadzone : no modification when K is close to F

ψD (K) = 0 if ||K − F ||2• ≤ ν

s ψD is a barrier : goes to infinity when K reaches border of accepted region

ψD (K) → +∞ if ||K − F ||2• → νβ (β > 1)

Commande adaptative - RTG12 Workshop 54 Novembre 2011, Toulouse


Í Cas des systèmes non passifiables
n LMI-based design of (G, D = µ2 1, ν) assuming a given stabilizing F

 ẋ = A(F )x + Bw,
l Step 1 (LMI) : minimize µ such that is passive :
 z = GCx + w µ
" #2
AT (F )P + P A(F ) P B − C T GT
T
<0
B P − GC −µ1
l Step 2 (LMI) : maximize ν , the size of admissible adaptive gains
 
T (F̂ − F )T
  ≥ 0, Tr(T ) ≤ νµ,
(F̂ − F ) µ−1 1
 
AT (F )Q + QA(F ) + νµβC T C
Q > 0,   < 0.
+R + C T (GT (F̂ − F ) + (F̂ − F )T G)C
 
R QB − C T GT
  ≥ 0,
B T Q − GC µ1

Commande adaptative - RTG12 Workshop 55 Novembre 2011, Toulouse


Í Cas des systèmes non passifiables

n LMI-based design of (G, D = µ2 1, ν) assuming a given stabilizing F


s Procedure guaranteed to succeed if F stabilizes the system
s K remains in a convex set around F (appreciated by engineers)
s ν may be small, i.e. small admissible adaptation (K ' F )
s LMI results can be easily extended to uncertain systems
⇒ proof of robustness of adaptive control for given uncertainty set
s In the robust case, step 2 is based on the existence of a PDSOF F̂ (θ)
Compared to F̂ (θ), the adaptive gain K needs not the estimation of θ
s Lyapunov function for global (robust) stability of PBAC

V (x, K, θ) = xT Q(θ)x + Tr((K − F̂ (θ))Γ−1 (K − F̂ (θ))T )

Commande adaptative - RTG12 Workshop 56 Novembre 2011, Toulouse


Conclusions

n LMI-based method that guarantees (robust) stability of PBAC


l Applies to any stabilizable LTI MIMO system
l Adaptive gains remain bounded
l Adaptive gains remain close to known value F
l With σ -modification : converge to known value F0

K̇ = −Gyy T Γ − ψD (K) · (K − F ) − σ(K − F0 )

n Prospectives
l Enlarge admissible region for K
l Structured control (decentralized etc.)
l Guaranteed robustness for time-varying uncertainties
l Take advantage of flexibilities on G for engineering issues (saturations...)
l ...

Commande adaptative - RTG12 Workshop 57 Novembre 2011, Toulouse


RÉFÉRENCES Quelques références RÉFÉRENCES

Références

[AKO07] A. Astolfi, D. Karagiannis, and R. Ortega, Nonlinear and adaptive


control with applications, Communications and Control Engineering,
Springer-Verlag, 2007.

[AOS00] A. Astolfi, R. Ortega, and R. Sepulchre, Control of complex systems,


ch. Passivity–based control of Nonlinear Systems, Springer, London,
2000.

[ÅW89] K.J. Åström and B. Wittenmark, Adaptive control, Addison-Wesley,


1989.

[BK85] I. Barkana and H. Kaufman, Global stability and performance of an


adaptive control algorithm, Int. J. Control 42 (1985), no. 6, 1491–
1505.

Commande adaptative - RTG12 Workshop 58 Novembre 2011, Toulouse


RÉFÉRENCES Quelques références RÉFÉRENCES

[FFY81] V. Fomin, A. Fradkov, and V. Yakubovich, Adaptive control of dynamic


plants, Nauka, Moscow, 1981, In Russian.
[Fra74] A.L. Fradkov, Adaptive stabilization of a linear dynamic plant, Autom.
Remote Contr. 35 (1974), no. 12, 1960–1966.
[Fra90] , Adaptive control of complex systems, Nauka, 1990, in Rus-
sian.
[Fra03] , Passification of non-square linear systems and feedback
Yakubovich-Kalman-Popov lemma, European J. of Control 6 (2003),
573–582.
[HC98] W.M. Haddad and V.-S. Chellaboina, Nonlinear fixed-order dynamic
compensation for passive systems, International Journal of Robust
and Nonlinear Control 8 (1998), 349–365.
[IF06] P. Ioannou and B. Fidan, Adaptive control tutorial, Advances in Design
and Control, SIAM, 2006.

Commande adaptative - RTG12 Workshop 59 Novembre 2011, Toulouse


RÉFÉRENCES Quelques références RÉFÉRENCES

[IS96] P. Ioannou and J. Sun, Robust adaptive control, Prentice Hall, Inc,
1996.

[KBS94] H. Kaufman, I. Barkana, and K. Sobel, Direct adaptive control algo-


rithms, Springer, New York, 1994.

[PDPM11] D. Peaucelle, A. Drouot, C. Pittet, and J. Mignot, Simple adaptive


control without passivity assumptions and experiments on satellite at-
titude control DEMETER benchmark, IFAC World Congress, August
2011.

[PKP09] D. Peaucelle, H.M. Khan, and P.V. Pakshin, LMI-based analysis of ro-
bust adaptive control for linear systems with time-varying uncertainty,
Autom. Remote Contr. 70 (2009), no. 9, 1540–1552.

Commande adaptative - RTG12 Workshop 60 Novembre 2011, Toulouse

Vous aimerez peut-être aussi