EADSRGT2011

Commande adaptative directe basée sur la passivité
Dimitri PEAUCELLE - LAAS-CNRS - Université de Toulouse
Razvan LUZI - CNES - ONERA
New trends & challenges in control from specification to validation
RTG12 Workshop Toulouse - 29-30 Novembre 2011

Introduction
n Commande adaptative :
“Modifier le comportement de la loi de commande en réponse à des modifications
dans les dynamiques du processus à contrôler et des perturbations”
θ,δ
yc w y
Σc(θ,δ) Σ(θ,δ)
u
s Suppose de connaı̂tre θ, δ, w. Comment ?

s Impose un choix de loi d’adaptation. Lequel ?
s Le schéma global est non-linéaire. Preuves de stabilité ?
n Commande adaptative robuste :
θ
yc w δ
Σc(θ) Σ(θ,δ)
y
u
Commande adaptative - RTG12 Workshop 1 Novembre 2011, Toulouse

Introduction
n Commande adaptative - Séquencement de gain

l Hypothèses : θ connu en temps réel, varie lentement dans le temps
θc θ
yc δ
Σc(θc) w Σ(θ,δ)
y
u
s Calculer régulièrement les paramètres (optimaux, robustes...) de Σc

s Choisir les paramètres de Σc dans une table de valeurs pré-calculées
(commande tabulée)
s Définir a priori une fonction θc (θ)
(Quand Σc est linéaire : commande Linéaire à Paramètres Variants, LPV)
l Variations temporelles de θ induisent des comportements non-linéaires

l Et si θ n’est pas mesurée ?

Introduction
n Commande adaptative indirecte

l Hypothèses : θ, δ varient lentement dans le temps
l Estimation paramétrique en temps réel : estimées θ̂, δ̂
θc
θ,δ
θ,δ
yc w
Σc(θc) Σ(θ,δ)
u y
l Principe de séparation :
s Dynamiques d’estimation/séquencement de gain
n’ont pas/peu d’influence sur la dynamique globale
s Estimation indépendante de Σc
l Différentes techniques d’estimation : moindres carrés, gradient, projections...
l Précision d’estimation : besoin d’excitation permanente
Introduction

l Si les dynamiques de Σ sont suffisamment lentes : estimation de l’hyper-état
x,w,θ,δ
θ,δ
yc w
N.L. Σ(θ,δ)
y
u
s Dynamiques de θ et celles de x peuvent être proches

s Généralise le schéma : retour d’état/observateur
s Problème d’estimation très complexe
s Commande fortement non linéaire, grandes dimensions

Introduction

θc
θ,δ
θ,δ
yc w
Σc(θc) Σ(θ,δ)
u y
n Commande adaptative directe

θc
θ,δ
yc w
Σc(θc) Σ(θ,δ)
u y
s Si θc = F (θ, δ) et F inversible :
le calcul de θc est un problème d’estimation pour Σ(F −1 (θc ))
s “MIT rule” : heuristique quand F est inconnue
Introduction
n Commande adaptative directe

θc
θ,δ
yc w
Σc(θc) Σ(θ,δ)
y
u
l Schéma de commande plus simple

(parfois appelée “simple adaptive control”, [Barkana])
l Possibilité d’obtenir des preuves de stabilité de la boucle fermée complète
(sans principe de séparation)
s Résultats de stabilité par la théorie de Lyapunov

s Limitations : Hypothèses de passivité sur Σ
(parfois appelée “passivity-based adaptive control”, [Fradkov])

Introduction
n Commande adaptative à modèle de référence - MRAC

l Jusqu’ici : régulation autour d’un point d’équilibre
l Résultats s’étendent à : adaptation pour suivre comportement de référence
Σm
θc
ym
θ,δ
yc w y −
Σc(θc) Σ(θ,δ) +
u ε
l Exemple : Modèle de référence du second ordre pour moteur à courant continu

1
(τ1s+1)(τ2s+1)
ωc u k ω − e
+ +
− Is+f

Plan
Ê MRAC dans le cas SISO et règle du MIT

s Basée sur problème de régulation à 2 degrés de liberté (RST)
s Méthode de gradient issue des techniques d’estimation
s Règle heuristique
Ë Stabilisation par PBAC - le cas MIMO
s Hypothèses de type passivité sur les systèmes
s Preuves de stabilité avec théorie de Lyapunov
Ì PBMRAC
Í Cas des systèmes non passifiables

n Commande à deux degrés de liberté pour les systèmes linéaires

l Hypothèses
B
s Système à commander SISO, LTI : y = u
A
Bm
s Modèle de référence : ym = uc
Am
T S
l Loi de commande : u = uc − y
R R
l Nombreuses hypothèses sur A, B , Am , Bm , R, S , T

n Commande adaptative pour régler les coefficients de R, S, T
R(s) = sq + rq−1 sq−1 + . . . r1 s + r0 ,

S(s) = sq sq + . . . s1 s + s0 , T (s) = tq sq + . . . t1 s + t0
l Paramètres de commande

θc = rq−1 · · · r0 sq · · · s0 tq · · · t0
s Commande adaptative : ajuster les θci pour avoir y = ym

s Choix d’un coût à minimiser :
1 2
J1 = |e|, J2 = e ...
2
où e = y − ym

l Méthode du gradient pour minimiser les paramètres de commande :

dθci ∂J
= −γ
dt ∂θci
dθci ∂e
s Pour J2 on trouve = −γe
dt ∂θci
∂e
l Connaı̂tre en temps réel ?
∂θci

l Règle du MIT :
∂e si ∂e si ∂e si
' uc , '− y , '− u
∂ti Ao Am ∂si Ao Am ∂ri Ao Am
où Ao polynôme aux dynamiques rapides (le plus souvent = 1).
l Les règles d’adaptation sont réalisables à l’aide de filtres et d’intégrateurs

s Exemple pour coût J2 :
Σm
dsi si θ,δ ym
ε
= γe y Σ(θ,δ) +
−
dt Ao Am y
si γ
AoAm * s si

l Remarques :
s Résultat est heuristique : pas de garantie (ni suivi de référence, ni stabilité)
s Si l’ordre du système est inconnu :
choisir Ao et degrés de R, S et T intuitivement
s Stabilité implique convergence de e = y − ym
s Aucune indication sur la convergence des gains du correcteur

n Exemple : moteur à courant continu
Gm
ωc u k ω − e
+ +
− Is+f
S s0 T t0
l Boucle de régulation = , Précommande =
R s + r0 R s + r0
so ω
ṡo = γe[ A1m ω]

ωc to − 1 u
+ ṫo = −γe[ A1m ωc ]
− s
ro ṙo = γe[ A1m u]

n Exemple : moteur à courant continu - Simulations

1 6
l G(s) = s+1 , Gm (s) = s2 +5s+6 , γ = 0.6,
l ωc (t) créneau de période 20s, valeur max = 0.375, valeur min = −0.125
0.5
0.4
0.3
0.2
0.1
−0.1
0 20 40 60 80 100 120 140 160 180 200 220
s Relativement bonne convergence


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 0.6,
0.6
0.5
0.4
0.3
0.2
0.1
−0.1
−0.2
0 20 40 60 80 100 120 140 160
s Parait robuste


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 0.6,
0.4
0.35
0.3
t0
0.25
0.2
s0
0.15
0.1
0.05
r0
0
0 20 40 60 80 100 120 140 160
s Convergence lente (deux périodes) - augmenter γ pour accélérer


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 6,
t0
0.8
0.6
s0
0.4
0.2
r0
0
0 20 40 60 80 100 120 140 160
s Les gains sont rapidement plus grands (et très différents...)


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 6,
0.8
0.7
0.6
0.5
ω
0.4
0.3
0.2
0.1
ωm
0
−0.1
−0.2
0 20 40 60 80 100 120 140 160
s Le transitoire (avant convergence des gains adaptatifs)

plus court, mais avec fort dépassement


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 60,
0.8
0.6 ω
0.4
0.2
ωm
0
−0.2
0 10 20 30 40 50 60 70 80 90 100
s Le transitoire très court, mais avec fort dépassement

s Suivi de référence parfait une fois que les gains ont convergé


10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 60,
6
t0
4
2 s0
1
0
r0
−1
0 10 20 30 40 50 60 70 80 90 100
s Les gains semblent vraiment converger

10 6
l G(s) = (s+0.8)(s+8) , Gm (s) = s2 +5s+6 , γ = 60,
0.16
0.14
0.12
0.1
0.08 ω
0.06
0.04
0.02
ωm
0
−0.02
−0.04
0 50 100 150
s L’amplitude de l’erreur étant faible, la convergence est lente

s Possibilité pour éviter ces phénomènes : adapter γ


10 6
l G(s) = (s2 +s+1) , Gm (s) = s2 +5s+6 , γ = 60,
5
ω
2
1
ωm
0
−1
0 10 20 30 40 50 60 70 80 90 100
s Ce n’est quand même pas parfait pour tout système

s Degrés du régulateur RST sous hypothèse d’un système du 1er ordre


l G(s) = −1.1s+10
(s2 +s+1)
, Gm (s) = 6
s2 +5s+6
, γ = 60,
1
0.8
0.6
0.4
0.2
ω
0
−0.2
−0.4 ωm
−0.6
−0.8
−1
200 220 240 260 280 300 320 340 360 380 400
s Il peut y avoir des phénomènes instables : ‘burst’


l G(s) = −1.1s+10
(s2 +s+1)
, Gm (s) = 6
s2 +5s+6
, γ = 60,
2000
1800
1600
t0
1400
1200
1000
s0
800
600
400
200
r0
0
330 335 340 345 350 355 360
s Ce ne sont évidement pas des valeurs de gain réalisables

n Modification des lois d’adaptation

l σ -modification : Empêcher les gains de diverger
(en particulier sous l’effet de bruits de mesure)
γ
ṡo = γe[ A1m ω] ṡo = 1+βe 2 e[ 1
Am
ω] − σso
γ
ṫo = −γe[ A1m ωc ] −→ ṫo = − 1+βe 1
2 e[ A ωc ] − σto
m
γ
ṙo = γe[ A1m u] ṙo = 1+βe 2 e[ 1
Am
u] − σro
s Pas de point d’équilibre possible pour les gains


10
l G(s) = (s+0.8)(s+8) 6
, Gm (s) = s2 +5s+6 , γ = 60, β = 0.1, σ = 10−4 ,
1.5
ω
1
0.5
ωm
0
0 20 40 60 80 100 120 140 160 180 200
s Bon réglage de l’algorithme d’adaptation : bonnes performances de suivi


10
l G(s) = (s+0.8)(s+8) 6
, Gm (s) = s2 +5s+6 , γ = 60, β = 0.1, σ = 10−4 ,
20
15 t0
10
s0
5
r0
−5
0 50 100 150 200 250 300
s Bon réglage de l’algorithme d’adaptation : gains raisonnables, varient peu

n Conclusions
l Algorithme du gradient potentiellement satisfaisant
s Robustesse relativement grande - mais non prouvée
s Pas besoin de connaı̂tre le modèle du système
s γ influe sur la vitesse de convergence, à régler par expérimentations
s β, σ modifications, à régler par expérimentations
l Aucune preuve de stabilité/performance
s Quelles hypothèses à faire sur le système ?
s Est-il possible de stabiliser des systèmes instables ?
s Extensions aux systèmes MIMO ?
s Comment garantir des gains bornés/réalisables ?

Plan

Ì PBMRAC

Ë Stabilisation par PBAC
n Commande adaptative basée sur la passivité (PBAC)

Σm
θc
ym
θ,δ
yc w y −
u
e
l Dans un premier temps on suppose yc = 0

l On veut montrer que le système est stable

n Systèmes passifs
l Système non-linéaire ẋ = f (x, v), z = g(x, v) est passif si
s il est carré : nombre d’entrées v = nombre de sorties z ,
s pour des CI nulles x(0) = 0, pour tout v et pour tout t ≥ 0, on a
Z t
z T (t)v(t)dt ≥ 0
0
l Passivité : produit scalaire entrées/sorties est positif

“sorties vont dans le même sens que les entrées”
l Propriété de nombreux systèmes
l Pour les systèmes mécaniques (entrées : forces - sorties : vitesse),
l’intégrale correspond à l’énergie accumulée dans le système

n Théorème - Systèmes passifs
Un système est strictement passif s’il existe une fonction V : Rn → R

s nulle à l’origine : V (0) = 0
s définie-positive : V (x) > 0 ∀x 6= 0
s dont les dérivées le long des trajectoires du système vérifient
V̇ (x) ≤ z T v − xT x
l V : “storage function”
l aussi fonction de Lyapunov prouvant la stabilité asymptotique du système

n Rétroaction de systèmes passifs

l Soient deux systèmes avec le même nombre d’entrées/sorties
ẋ1 = f1 (x1 , v1 ) , z1 = g1 (x1 , v1 )

ẋ2 = f2 (x2 , v2 ) , z2 = g2 (x2 , v2 )
s s’ils sont tous les deux strictement passifs

s alors l’interconnexion v2 = z1 , v1 = −z2 est asymptotiquement stable
l Preuve V̇1 + V̇2 ≤ z1T v1 + z2T v2 −1 xT1 x1 − 2 xT2 x2 < 0
| {z }
=0
l Cas particulier : z2 (t) = ∆K (t)v2 (t) avec ∆K (t) + ∆TK (t) 0

s un cône de gains statiques qui préservent la stabilité de la boucle fermée
s les gains peuvent varier dans le temps, quelle que soit la règle, adaptative ?

l Conditions de strict-passivité des systèmes linéaires :

 
T T
A P + P A + 21 P B − C
P = PT 0 :  0
BT P − C −D − DT
s Preuve : V = 21 xT P x
T
x AT P + P A + 21 PB − CT x
= 2(V̇ − z T w + xT x) ≤ 0
w BT P − C −D − DT w
s Dans le cas des systèmes sans transfert direct (D = 0)
P = P T 0 , AT P + P A + 21 0 , P B = C T

n [Fra74, BK85] Théorème

l Passification par retour de sortie adaptatif des systèmes “presque passifs”
l S’il existe un retour de sortie statique u = −F y qui rend le système
ẋ = Ax + Bu + Bv, y = Cx, z = y
strictement passif en boucle fermée, alors, pour tout Γ 0,

la commande adaptative
u = −Ky, K̇ = yy T Γ
rend le système passif en boucle fermée.

l Preuve intuitive
s Existence d’un retour de sortie passifiant :
⇒ ẋ = (A − BF C)x + Bv, z = Cx est passif
⇒ ∀∆TK + ∆K 0 ẋ = (A − BF C − B∆K C)x est stable

s En prenant ∆K suffisamment grand,
tout K = F + ∆K , K + K T 0, stabilise le système
s La loi adaptative K̇ = yy T Γ “pousse” les gains à devenir “grands”

dans la direction K + K T 0
s Tand que y n’a pas convergé à zéro,

la loi tend à augmenter le gain de commande

l Preuve par la théorie de Lyapunov

s On souhaite prouver la passivité du système non linéaire :
ẋ(t) = (A−BK(t)C)x(t)+Bv(t) , K̇(t) = y(t)y T (t)Γ , z(t) = Cx(t)
s sous l’hypothèse qu’il existe un gain Ko strictement passifiant :
∃F, P 0, > 0 :
(A − BF C)T P + P (A − BF C) + 21 0 , P B = C T
s Choix d’une fonction de Lyapunov qui dépend de tous les états

1 T −1 T

V (x, K) = x P x + Tr (K − F )Γ (K − F )
2
s Il suffit de démontrer que V̇ ≤ z T v , le long des trajectoires

l Preuve par la théorie de Lyapunov
1 T −1 T

V (x, K) = x P x + Tr (K − Ko )Γ (K − Ko )
2
s Calcul de sa dérivée

V̇ = ẋT P x + Tr K̇Γ−1 (K − Ko )T
s Trajectoires : ẋ = (A − BKC)x + Bv , K̇ = yy T Γ
T T T T T T

V̇ = x (A − BKC) P x + v B P x + Tr yy (K − Ko )
s Propriété de l’opérateur trace : Tr(AB) = Tr(BA) :
T T
= Tr y (K − Ko ) y = y T (K − Ko )T y
T T

Tr yy (K − Ko )
s Donc comme y = Cx on a
V̇ = xT (A − BKC)T P x + v T B T P x + xT C T (K − Ko )T Cx

n Conditions pour qu’un système linéaire soit stabilisable par PBAC [Fra03]
l Cas des systèmes SISO, y = H(s)u :
s Le système doit être stabilisable par u = −ky avec k > 0 grand
s Lieu d’Evans : H(s) ne doit pas avoir de zéros instables
s Lieu d’Evans : H(s) doit être de degré relatif ≤ 1
l Cas des systèmes MIMO : (A, B, C) à hyper minimum de phase
s det(sI − A) det(C(sI − A)−1 B) a toutes ses racines stables (zéros)
s CB = (CB)T 0, gain haute fréquence est défini positif
(le degré relatif du système ≤ m où m : nb d’entrées)
l Limitations
s Systèmes carrés (CB est carrée), et tels que CB = (CB)∗ 0
s Degré relatif ≤ m et zéros stables

n PBAC modifiée pour les systèmes non-carrés

n [Fra03] Théorème
l S’il existe un retour de sortie statique u = −Ko y ,
et une matrice G qui rendent le système
ẋ = Ax + Bu + Bv, y = Cx, z = Gy
strictement passif en boucle fermée, alors, pour tout Γ 0,

la commande adaptative
u = −Ky, K̇ = Gyy T Γ
rend le système passif en boucle fermée.

s Exercice : démontrer le théorème
l Applicable si le nombre de sorties est supérieur au nombre de commandes

n Exemple - Modèle avion - longitudinal

T
l x = α q , α incidence, q vitesse de tangage,
l u = δ braquage de gouverne
   
zα 1 0
ẋ =   x+  u , y=x
mα mq mδ
s Matrice de transfert :
 
mδ 1
y= 2  u
s − (zα + mq )s + zα mq − mα s − zα

n Exemple - Modèle avion

h i
s Combinaison linéaire des sorties z = g1 g2 y:
z mδ g2 (s − zα + g1 /g2 )
= 2
u s − (zα + mq )s + zα mq − mα
est à hyper minimum de phase si g1 /g2 − zα > 0 et mδ g2 > 0
s En prenant g2 = sign(mδ ) (mδ doit être de signe connu)
et en prenant |g1 | suffisamment grand devant valeurs attendues de zα
u = −Ky , K̇ = Gyy T Γ
stabilise le système pour toute valeur des paramètres.
s Γ (et β , σ modifications) à régler en simulation.

Plan

Ì PBMRAC

Ì PBMRAC
n MRAC basée sur la passivité

Σm
θc
ym
θ,δ
yc w y −
u
e
l Jusqu’ici yc = 0 et commande u(t) = −K(t)y(t)

l Cas avec modèle de référence : u = −K(t)e(t) + L(t)xm (t) + M (t)yc (t)
s K(t) a pour rôle de stabiliser la boucle (comme précédemment)
s L(t) et M (t) définissent une pré-commande pour le suivi de la référence
l Etude menée pour les systèmes linéaires (linéarisé d’un modèle non-linéaire)

Ì PBMRAC
n Hypothèses sur le système
l Le système est “presque passif” :
Il existe un retour de sortie statique u = −Ko y ,
et une matrice G qui rendent le système
ẋ = Ax + Bu + Bv, y = Cx, z = Gy
strictement passif en boucle fermée
l Il existe une pré-commande Lo , Mo qui permet le suivi parfait :
ẋo = Axo + B(Lo xm + Mo yc ) ⇒ Cxo = ym
où xm est l’état du modèle de référence (dont l’ordre peut être 6= n)
ẋm = Am xm + Bm yc , ym = Cm xm
s Hypothèse forte, équivalente aux hypothèses sur régulateurs RST

Ì PBMRAC
n MRAC basée sur la passivité

Σm
θc
ym
θ,δ
yc w y −
u
e
l Si les hypothèses sont vérifiés, alors pour tous ΓK 0, ΓL 0, ΓM 0,

la loi de commande
u = −K(t)e(t) + L(t)xm (t) + M (t)yc (t) , e = y − ym

K̇ = GeeT ΓK , L̇ = −GexTm ΓL , Ṁ = −GeycT ΓM
est telle que lim(x(t) − xo (t)) = 0.

Ì PBMRAC
n PBMRAC pour une classe de systèmes nonlinéaires
ẋ = Ax + Aφ φ(y, u, t) + Bu , y = Cx
l La loi de commande suivante stabilise le système et x(t) → xm (t).
u = −Ke + Lxm + M yc + N φ , e = y − ym
K̇ = GeeT ΓK , L̇ = −GexTm ΓL , Ṁ = −GeycT ΓM , Ṅ = −GeφT ΓN
s Example : système saturé
ẋ = Ax + B sat(u) = Ax + Bu − B dz(u)
Le terme N dz(u) de la commande est un anti-windup.
s En pratique si yc n’est pas constante N (t) diverge...

Ì PBMRAC
n Conclusions sur PBMRAC
l Fort potentiel d’application pour les systèmes “presque passifs”
(existence de G et Ko tels que G(H(s) ? Ko ) est passif
l Loi d’adaptation de la forme K̇ = GeĕT Γ
s Tant que e n’a pas convergé les gains s’adaptent, dans la direction G
s Ils peuvent potentiellement diverger
s Si (transitoirement) ||e|| est grand, alors K̇ est grand (pas réalisable)
l Possibilité de faire β, σ modifications :
K̇ = GeĕT Γ(1 + eT βe)−1 − σK
s mais les preuves de stabilité ne tiennent plus ...
s Ici dans le cas β = 0
V̇ ≤ −||x − xo ||2 − σ Tr(KΓ−1 (K − Ko )T ) ≤ 0?
Si K est bornée, on peut avoir V̇ ≤ 0 pour ||x − xo || ≥ ρ : stabilité pratique
Plan

Ì PBMRAC

n Passivity-Based Adaptive Control [Fradkov 1974, 2003]

& Simple Adaptive Control [Kaufman, Barkana, Sobel 94]
l Let Σ ∼ (A, B, C, D) be a MIMO system with m inputs / p ≥ m outputs.

l If ∃ (G, F ) ∈ (Rp×m )2 such that the following system is passive
+ Σ G
v u y z
F
l then the following adaptive law stabilizes the system for all Γ > 0
K̇ = −Gyy T Γ , u = Ky

n Underlying properties
l Passivity implies that for all ∆ + ∆∗ ≥ 0 the following system is stable
+ Σ G
v u y z
F
−∆
l i.e. all gains (F − ∆G) stabilize the system, for ∆ + ∆∗ ≥ 0, possibly large
l K̇ = −Gyy T Γ “pushes” the gains in that direction until stability is reached
s In practice : Need to limit growth of K . Modifications of adaptive law
K̇ = −Gyy T Γ + φ(K) (eg. φ(K) = −σK)

n What if Σ is not passifiable by (G, F ) ?
l ∃S a feedthrough (or Shunt) such that the following system is passive
S
+ Σ + G
v u y z
F
l then the adaptive law stabilizes the system Σ + S .
s [KBS94] For SISO Σ one can take S(s) = FS−1 (s) where FS is stabilizing
s In practice : S should be small for tracking issues (u = K(y + Su))
u Σ y
s Rq : The actual gain is bounded
K +
K̂ = (1 − KS)−1 K
S
K

n Proposed result [PDPM11]

l K bounded thanks to a modification of the adaptive law :
K̇ = −Gyy T Γ − ψD (K) · (K − F ) , u = Ky
s ψD is a deadzone : no modification when K is close to F
ψD (K) = 0 if ||K − F ||2• ≤ ν
s ψD is a barrier : goes to infinity when K reaches border of accepted region
ψD (K) → +∞ if ||K − F ||2• → νβ (β > 1)

n LMI-based design of (G, D = µ2 1, ν) assuming a given stabilizing F

 ẋ = A(F )x + Bw,
l Step 1 (LMI) : minimize µ such that is passive :
 z = GCx + w µ
" #2
AT (F )P + P A(F ) P B − C T GT
T
<0
B P − GC −µ1
l Step 2 (LMI) : maximize ν , the size of admissible adaptive gains
 
T (F̂ − F )T
  ≥ 0, Tr(T ) ≤ νµ,
(F̂ − F ) µ−1 1
 
AT (F )Q + QA(F ) + νµβC T C
Q > 0,   < 0.
+R + C T (GT (F̂ − F ) + (F̂ − F )T G)C
 
R QB − C T GT
  ≥ 0,
B T Q − GC µ1

n LMI-based design of (G, D = µ2 1, ν) assuming a given stabilizing F

s Procedure guaranteed to succeed if F stabilizes the system
s K remains in a convex set around F (appreciated by engineers)
s ν may be small, i.e. small admissible adaptation (K ' F )
s LMI results can be easily extended to uncertain systems
⇒ proof of robustness of adaptive control for given uncertainty set
s In the robust case, step 2 is based on the existence of a PDSOF F̂ (θ)
Compared to F̂ (θ), the adaptive gain K needs not the estimation of θ
s Lyapunov function for global (robust) stability of PBAC
V (x, K, θ) = xT Q(θ)x + Tr((K − F̂ (θ))Γ−1 (K − F̂ (θ))T )

Conclusions
n LMI-based method that guarantees (robust) stability of PBAC

l Applies to any stabilizable LTI MIMO system
l Adaptive gains remain bounded
l Adaptive gains remain close to known value F
l With σ -modification : converge to known value F0
K̇ = −Gyy T Γ − ψD (K) · (K − F ) − σ(K − F0 )
n Prospectives
l Enlarge admissible region for K
l Structured control (decentralized etc.)
l Guaranteed robustness for time-varying uncertainties
l Take advantage of flexibilities on G for engineering issues (saturations...)
l ...

RÉFÉRENCES Quelques références RÉFÉRENCES
Références
[AKO07] A. Astolfi, D. Karagiannis, and R. Ortega, Nonlinear and adaptive

control with applications, Communications and Control Engineering,
Springer-Verlag, 2007.
[AOS00] A. Astolfi, R. Ortega, and R. Sepulchre, Control of complex systems,

ch. Passivity–based control of Nonlinear Systems, Springer, London,
2000.
[ÅW89] K.J. Åström and B. Wittenmark, Adaptive control, Addison-Wesley,

1989.
[BK85] I. Barkana and H. Kaufman, Global stability and performance of an

adaptive control algorithm, Int. J. Control 42 (1985), no. 6, 1491–
1505.

[FFY81] V. Fomin, A. Fradkov, and V. Yakubovich, Adaptive control of dynamic

plants, Nauka, Moscow, 1981, In Russian.
[Fra74] A.L. Fradkov, Adaptive stabilization of a linear dynamic plant, Autom.
Remote Contr. 35 (1974), no. 12, 1960–1966.
[Fra90] , Adaptive control of complex systems, Nauka, 1990, in Rus-
sian.
[Fra03] , Passification of non-square linear systems and feedback
Yakubovich-Kalman-Popov lemma, European J. of Control 6 (2003),
573–582.
[HC98] W.M. Haddad and V.-S. Chellaboina, Nonlinear fixed-order dynamic
compensation for passive systems, International Journal of Robust
and Nonlinear Control 8 (1998), 349–365.
[IF06] P. Ioannou and B. Fidan, Adaptive control tutorial, Advances in Design
and Control, SIAM, 2006.

[IS96] P. Ioannou and J. Sun, Robust adaptive control, Prentice Hall, Inc,
1996.
[KBS94] H. Kaufman, I. Barkana, and K. Sobel, Direct adaptive control algo-

rithms, Springer, New York, 1994.
[PDPM11] D. Peaucelle, A. Drouot, C. Pittet, and J. Mignot, Simple adaptive

control without passivity assumptions and experiments on satellite at-
titude control DEMETER benchmark, IFAC World Congress, August
2011.
[PKP09] D. Peaucelle, H.M. Khan, and P.V. Pakshin, LMI-based analysis of ro-
bust adaptive control for linear systems with time-varying uncertainty,
Autom. Remote Contr. 70 (2009), no. 9, 1540–1552.

EADSRGT2011

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

EADSRGT2011

Transféré par

Droits d'auteur :

Formats disponibles

Commande adaptative directe basée sur la passivité

Dimitri PEAUCELLE - LAAS-CNRS - Université de Toulouse

Razvan LUZI - CNES - ONERA

New trends & challenges in control from specification to validation

RTG12 Workshop Toulouse - 29-30 Novembre 2011

s Suppose de connaı̂tre θ, δ, w. Comment ?

Commande adaptative - RTG12 Workshop 1 Novembre 2011, Toulouse

n Commande adaptative - Séquencement de gain

s Calculer régulièrement les paramètres (optimaux, robustes...) de Σc

l Variations temporelles de θ induisent des comportements non-linéaires

Commande adaptative - RTG12 Workshop 2 Novembre 2011, Toulouse

n Commande adaptative indirecte

n Commande adaptative indirecte

s Dynamiques de θ et celles de x peuvent être proches

Commande adaptative - RTG12 Workshop 4 Novembre 2011, Toulouse

n Commande adaptative indirecte

n Commande adaptative directe

n Commande adaptative directe

l Schéma de commande plus simple

s Résultats de stabilité par la théorie de Lyapunov

Commande adaptative - RTG12 Workshop 6 Novembre 2011, Toulouse

n Commande adaptative à modèle de référence - MRAC

l Exemple : Modèle de référence du second ordre pour moteur à courant continu

Commande adaptative - RTG12 Workshop 7 Novembre 2011, Toulouse

Ê MRAC dans le cas SISO et règle du MIT

Commande adaptative - RTG12 Workshop 8 Novembre 2011, Toulouse

n Commande à deux degrés de liberté pour les systèmes linéaires

l Nombreuses hypothèses sur A, B , Am , Bm , R, S , T

Commande adaptative - RTG12 Workshop 9 Novembre 2011, Toulouse

n Commande adaptative pour régler les coefficients de R, S, T

R(s) = sq + rq−1 sq−1 + . . . r1 s + r0 ,

s Commande adaptative : ajuster les θci pour avoir y = ym

Commande adaptative - RTG12 Workshop 10 Novembre 2011, Toulouse

l Méthode du gradient pour minimiser les paramètres de commande :

Commande adaptative - RTG12 Workshop 11 Novembre 2011, Toulouse

l Les règles d’adaptation sont réalisables à l’aide de filtres et d’intégrateurs

Commande adaptative - RTG12 Workshop 12 Novembre 2011, Toulouse

Commande adaptative - RTG12 Workshop 13 Novembre 2011, Toulouse

ṡo = γe[ A1m ω]

ro ṙo = γe[ A1m u]

Commande adaptative - RTG12 Workshop 14 Novembre 2011, Toulouse

n Exemple : moteur à courant continu - Simulations

0 20 40 60 80 100 120 140 160 180 200 220

s Relativement bonne convergence

Commande adaptative - RTG12 Workshop 15 Novembre 2011, Toulouse

n Exemple : moteur à courant continu - Simulations

Commande adaptative - RTG12 Workshop 16 Novembre 2011, Toulouse

n Exemple : moteur à courant continu - Simulations

0 20 40 60 80 100 120 140 160

s Convergence lente (deux périodes) - augmenter γ pour accélérer

Commande adaptative - RTG12 Workshop 17 Novembre 2011, Toulouse

n Exemple : moteur à courant continu - Simulations

0 20 40 60 80 100 120 140 160

s Les gains sont rapidement plus grands (et très différents...)

Commande adaptative - RTG12 Workshop 18 Novembre 2011, Toulouse

n Exemple : moteur à courant continu - Simulations

0 20 40 60 80 100 120 140 160

s Le transitoire (avant convergence des gains adaptatifs)

Commande adaptative - RTG12 Workshop 19 Novembre 2011, Toulouse

n Exemple : moteur à courant continu - Simulations

s Le transitoire très court, mais avec fort dépassement

Commande adaptative - RTG12 Workshop 20 Novembre 2011, Toulouse

n Exemple : moteur à courant continu - Simulations

s Les gains semblent vraiment converger

l Cas particulier : z2 (t) = ∆K (t)v2 (t) avec ∆K (t) + ∆TK (t) 0

strictement passif en boucle fermée, alors, pour tout Γ 0,

⇒ ∀∆TK + ∆K 0 ẋ = (A − BF C − B∆K C)x est stable

strictement passif en boucle fermée, alors, pour tout Γ 0,