Académique Documents
Professionnel Documents
Culture Documents
M
etodos de Dise
no para Sistemas No
Lineales
Jaime A. Moreno
Universidad Nacional Aut
onoma de M
exico (UNAM)
Instituto de Ingeniera, M
exico D.F.,M
exico
Email: JMorenoP@ii.unam.mx
26 de Mayo de 2009
Indice general
I
Control
2. Estabilizaci
on
46
3. Estabilizaci
on Robusta
178
4. Seguimiento
233
5. Regulaci
on robusta estructural: Control Integral
247
II
Observaci
on
6. Introducci
on
265
266
7. Observabilidad
272
293
313
10. Dise
no de Observadores para Sistemas Lineales
329
11. Dise
no de observadores para sistemas no lineales:
M
etodos por aproximaci
on (linealizaci
on)
359
12. Dise
no de observadores para sistemas no lineales:
M
etodos exactos
380
13. Dise
no de observadores para sistemas no lineales:
Dise
no disipativo de observadores no lineales
438
Parte I
Control
Captulo 1
Algunas propiedades de sistemas
1.1.
Grado Relativo
Lf h (x)
Lg Lf h (x) =
g (x)
x
L2f h (x)
Lkf h (x)
= Lf Lf h (x) =
Lf Lk1
f h (x)
Lf h (x)
x
Luego
y = Lf h (x) + Lg h (x) u
Lg h (x) = 0
f (x)
k1
Lf h (x)
Si
f (x)
entonces
y = Lf h (x)
La primera derivada de la salida no depende de la entrada u. Tomando
una derivada (con respecto al tiempo) adicional de la salida
y (2)
Lf h (x)
= y =
[f (x) + g (x) u]
x
= L2f h (x) + Lg Lf h (x) u
Si
Lg Lf h (x) = 0
y (3)
2
Lf h (x)
[f (x) + g (x) u]
x
= L3f h (x) + Lg L2f h (x) u
Si
Lg L2f h (x) = 0
Generalizando: Si
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , 1 ;
1
Lg Lf
h (x) 6= 0
y () = Lf h (x) + Lg Lf
h (x) u
Definici
on 1 El sistema SISO
x = f (x) + g (x) u
y = h (x)
tiene grado relativo , 1 n, en D0 D Rn si x D0
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , 1 ;
1
Lg Lf
h (x) 6= 0
Ejemplo 2
x 1 = x2
2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x1
y = x 1 = x2
y = x 2 = x1 +
1 x21
x2 + u
2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x2
y = x 2 = x1 +
1 x21
x2 + u
Ejemplo 4
x 1 = x2
2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x1 + x22
y = x 1 + 2x2x 2 = x2 2x1x2 + 2
n
1 x21
o
x22 + 2x2u
y = x 3 = x1x2
y = x 1x2 + x1x 2
= [ax1x2 + x1 (bx2 + k cx1x3)] + x2u
n
R2
| x2 6= 0
1.2.
Forma Normal
Lg Lf
h (x) 6= 0 ; x D0
1 (x)
...
n (x)
z = T (x) =
h (x)
...
1
Lf h (x)
(x)
(x)
1 (x), ,n (x) son elegidos de tal forma que T (x) sea un difeomor 0 D0 D.
fismo en un dominio D
Entonces la din
amica del sistema en las nuevas coordenadas es
(x)
= x [f (x) + g (x) u] = f0 (, ) + g0 (, ) u
Li1
f h(x)
i =
[f (x) + g (x) u]
x
i
= Lf h (x) + Lg Li1
f h (x) u = i+1
1
= Lf h (x) + Lg Lf h (x) u
y = 1
, 1i1
una vecindad Nx de x
, y
funciones suaves 1 (x), ,n (x)
tales que
i (x)
g (x) = 0 , 1 i n ; x Nx
x
y el mapa
(x)
T (x) = ,
(x)
restringido a Nx, es un difeomorfismo en Nx.
En tal caso el sistema en las nuevas coordenadas queda en la Forma Normal
= f0 (, )
=
i
i+1 , 1 i 1
Forma Normal:
= L h (x) + Lg L1h (x) u
f
f
y = 1
o en forma m
as compacta
= f0 (, )
= Ac + Bc (x) [u (x)]
Forma Normal:
y = Cc
d
onde
Ac =
Cc =
0
0
...
0
0
1
0
...
0
0
0
1
...
0
0
...
0
0
...
0
0
0
0
...
1
0
1 0 0 0 0
, Bc = ... ,
(x) = Lg Lf
h (x) , (x) =
Lf h (x)
1
Lg Lf
h (x)
decir,
f (x) = 0
h (x) = 0
(x) = 0
1.3.
Din
amica Cero
= f0 (, )
= Ac + Bc (x) [u (x)]
y = Cc
se denomina la Din
amica Cero (DC) del sistema.
Se dice que el sistema de Fase Mnima si la Din
amica Cero tiene un punto
de equilibrio asint
oticamente estable en el dominio de inter
es (en el origen
si T (0) = 0).
Comentario 9 La Din
amica Cero corresponde a todas las parejas de condiciones iniciales y entradas al sistema que tienen salida cero. En la Forma
Normal esto es especialmente simple:
Si (0, 0) = (0, 0) y u (t) (x (t)) , d
onde
"
x (t) = T 1
(t)
0
#!
y (t) 0
Entonces
y (t) 0 = x (t) Z
= u (t) = u (x) , (x) |xZ
La din
amica restringida del sistema se describe como
x = f (x) , [f (x) + g (x) (x)]xZ
Ejemplo 11
x 1 = x2
2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x2
y = x 2 = x1 +
1 x21
x2 + u = = 1
Ejemplo 12
x 1 = x1 +
2+x23
u
1+x23
x 2 = x3
x 3 = x1x3 + u
y = x2
y = x 2 = x3
y = x 3 = x1x3 + u = = 2
Lf h (x)
1
Lg Lf h (x)
= x1x3
Z = {x2 = x3 = 0}
u = u (x) = 0
x 1 = x1
El sistema es de Fase Mnima
Cu
al es la transformaci
on para llevar al sistema a la Forma Normal?
h
i
(x)
(x)
(x)
(x)
(0) = 0 ,
g (x) =
, x , x
x
1
2
3
x
(x)
T (x) = x2
x3
sea un difeomorfismo.
(x)
(x) 2 + x23 (x)
g (x) =
=0
+
2
x
x1 1 + x3
x3
La funci
on
(x) = x1 + x3 + tan1 x3
2+x23
1+x23
0
1
=0
T (x) = 1 =
2
1
x1 + x3 + tan x3
x2
x3
, T 1 (z) =
2
2+
+
tan
1
+
2
2
1+22 2
1 = 2 ,
2 = + 2 + tan 2 2 + u
y = 1
1
+ 2 + tan3 2
1
2
1.4.
Forma de Controlador
Definici
on 13 Se dice que un sistema no lineal (con m
ultiples entradas)
est
a en la Forma de Controlador si
x = Ax + B (x) [u (x)]
d
onde
Comentario 14 N
otese que un sistema que est
a en la Forma de Controlador se puede linealizar exactamente mediante retroalimentaci
on de los
estados:
Si se elige
u = (x) + 1 (x) v
d
onde
1 (x) : Matriz Inversa de (x)
v:
nueva entrada de control
entonces la din
amica del sistema en lazo cerrado es
x = Ax + Bv
que es lineal en los estados y la entrada v.
Definici
on 15 Se dice que un sistema no lineal
x = f (x) + G (x) u
d
onde f : D Rn y G : D Rnp son suficientemente suaves en un
dominio D Rn, es Linealizable por Retroalimentaci
on (o Linealizable
Entrada-Estados) si existe un Difeomorfismo T : D Rn, tal que
Proposici
on 16 El sistema de dimensi
on n y con una entrada (p = 1)
x = f (x) + g (x) u
puede ser transformado a la Forma de Controlador mediante una transformaci
on de estados z = T (x) si y solo si existe una funci
on (de salida)
h (x) tal que el sistema SISO
x = f (x) + g (x) u
y = h (x)
tenga grado relativo = n.
Prueba. =: Si el sistema tiene grado relativo = n, entonces se puede
llevar a la Forma Normal, que en este caso se reduce a la Forma de Controlador
= Ac + Bc () [u ()]
y = Cc
Ac =
0
0
...
0
0
1
0
...
0
0
0
1
...
0
0
...
0
0
...
0
0
0
0
...
1
0
, Bc = ... .
S (x)
T
(x) M
Eligiendo
y = Cc = 1 = T1 (x) = h (x)
el sistema tiene Grado Relativo = n.
(x)
1.5.
C
omo decidir si existe una funci
on suave h (x) tal que
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , n 1 ; x D0
h (x) 6= 0 ; x D0
Lg Ln1
f
y
T (x) =
sea un difeomorfismo?
h (x)
Lf h (x)
...
Ln1
h (x)
f
1.5.1.
El par
entesis de Lie
Definici
on 17 El par
entesis de Lie de dos campos vectoriales f ,g es un
tercer campo vecotrial definido como
[f, g] (x) =
g (x)
f (x)
f (x)
g (x)
x
x
Notaci
on 18 Para simplificar la escritura se introduce la siguiente notaci
on
ad0f g (x) = g (x)
adf g (x) = [f, g] (x)
adkf
Propiedades
g (x) =
i
k1
f, adf g (x) (x)
, k1
[f, g] = [g, f ]
Ejemplo 19
"
f =
x2
sin x1 x2
"
, g=
0
x1
Entonces
"
x1
x1 + x2
0 0
1 0
#
#"
x2
sin x1 x2
"
0
1
cos x1 1
#"
0
x1
"
1.5.2.
"
1 0
1 1
0
1
cos x1 1
#"
#"
x2
sin x1 x2
x1
x1 + x2
x1 2x2
x1 + x2 sin x1 x1 cos x1
Distribuciones
Definici
on 20 Para los campos vectoriales f1, f2, , fk en D Rn sea
(x) = span {f1 (x) , f2 (x) , , fk (x)}
fi, fj , 1 i, j k
1
2x2
f1 = 1 , f2 = 0
x2
0
dim ( (x)) = 2 , x D
0
f2
f1
[f1, f2] =
f1
f2 = 0
x
x
1
2x2 1 0
Ejemplo 23 D = x
R3
f1 =
o
2
|
+ x3 6= 0 ; = span {f1, f2}
x1
2x3
1 , f2 = 2x2
x21
x3
dim ( (x)) = 2 , x D
f
f
[f1, f2] = 2 f1 1 f2 =
x
x
4x3
2
0
2x3 x1 4x3
"
x =
adn2
g (x)
f
a sin x2
x21
"
= n , x D0, y
es involutiva en D0
0
1
f
adf g (x) = [f , g] = g =
x
1.6.
"
a cos x2
0
1.6.1.
Sistemas Planos
f (0)
x + g (0) u , Ax + bu
x
1.6.2.
Sistemas no planos
La controlabilidad de la linealizaci
on para sistemas de orden n 3 es
una condici
on necesaria pero no suficiente de Linealizabilidad por Retroalimentaci
on:
Corolario 27 Si el sistema no lineal con una sola entrada
x = f (x) + g (x) u
es Linealizable localmente por Retroalimentaci
on (es localmente transformable a la Forma de Controlador) en una vecindad del origen entonces
su aproximaci
on lineal (linealizaci
on) en el origen
f (0)
x =
x + g (0) u , Ax + bu
x
es controlable, es decir,
h
rango b , Ab ,
A2b
, ,
i
n1
A
b
=n.
1.6.3.
Prueba. Veremos dos pruebas: una verificando directamente las condiciones del teorema y la otra dando una transformaci
on explcita.
Comentario 30 Una Forma Triangular m
as general est
a dada por
x i = i (x1, , xi+1) , 1 i n 1
x n = n (x1, , xn) + (x1, , xn) u ,
con 1, , n y funciones suaves tales que i (0) = 0, 1 i n ,
(0) 6= 0 , y
i (0)
6= 0 , 1 i n 1 .
xi+1
Este sistema es tambi
en Linealizable localmente por Retroalimentaci
on.
Comentario 31 Cuando el control u entra en forma no lineal en las ecuaciones de estado
x = f (x, u) , f (0, u) = 0 , u R
el problema de Linealizaci
on por Retroalimentaci
on puede ser formulado
para el sistema extendido
x = f (x, u)
u = w ,
en el cual w es el nuevo control y (x, u) es el estado extendido. Si las condiciones del teorema de linealizaci
on se satisfacen para el sistema extendido,
entonces el control resultante
u = w = (x, u) + (x, u) v , u (0) = u0
es un control din
amico linealizante para el sistema original.
Captulo 2
Estabilizaci
on
2.1.
Conceptos b
asicos y Linealizaci
on
la din
amica del sistema satisface
x = f (xss + x , uss + u ) , f (x , u )
0 = f (0, 0)
El control
u = (x ) = u = uss + (x xss)
Problema 33 de estabilizaci
on por retroalimentaci
on de los estados: Dado
x = f (x, u)
, f (0, 0) = 0
encuentre
u = (x)
, (0) = 0
2.1.1.
Sistemas Lineales
Sea el sistema
x = Ax + Bu
con (A, B) estabilizable ( controlable o todo valor propio incontrolable
tiene parte real negativa)
Encuentre K tal que (A BK) sea Hurwitz
u = Kx
M
etodos tpicos:
Colocaci
on de polos (o de valores propios)
Colocaci
on de valores y vectores propios
LQR
2.1.2.
Linealizaci
on
, f (0, 0) = 0
f
f
A=
(x, u)
; B=
(x, u)
x
u
x=0 , u=0
x=0 , u=0
Linealizaci
on
f
f
x
(x, Kx)
(x, Kx) K
x =
x
u
x=0
x = (A BK) x
Ya que (A BK) es Hurwitz, el origen es un punto de equilibrio exponencialmente estable del sistema en lazo cerrado.
Ejemplo 34 Ecuaci
on del p
endulo
= a sin b + cT
Estabilice el p
endulo en el punto =
0 = a sin + cTss
a
x1 = , x2 = , u = T Tss = T sin
c
x 1 = x2
x 2 = a [sin (x1 + ) sin ] bx2 + cu
"
A=
0
1
=
a cos (x1 + ) b x =0
1
"
B=
K=
"
A BK =
0
c
"
0
1
a cos b
k1 k2
0
1
(a cos + ck1) (b + ck2)
a cos
b
k1 >
, k2 >
c
c
es Hurwitz
T =
2.2.
a
a sin
sin Kx =
k1 ( ) k2
c
c
Linealizaci
on por retroalimentaci
on
d
onde (i) (A, B) es controlable, y (ii) (x) es una matriz no singular para
cada x D Rn.
Si se elige
u = (x) + 1 (x) v
entonces la din
amica del sistema en lazo cerrado es
z = Az + Bv
que es lineal en los estados y la entrada v.
Si adem
as la nueva entrada v se dise
na como
v = Kz
(x) 1 (x) KT
N
otese que (Pruebe las afirmaciones!)
(x)
x = 0 es asint
oticamente estable (AE), ya que T (x) es un difeomorfismo.
x = 0 es Global y Asint
oticamente Estable (GAE) si T (x) es un
difeomorfismo global (Ver [25, pag. 508]).
2.2.1.
Cu
al es el efecto de las incertidumbres en (x), (x), y T (x) ?
Sean
(x),
(x), y T (x) modelos nominales de (x), (x), y T (x). Con
la ley de control
u=
(x)
1 (x) K T (x)
el sistema en lazo cerrado es (en coordenadas z)
z = (A BK) z + B (z)
=
+ 1KT
1K T
(1)
i
Prueba. Sea
V (z) = z T P z
zT
2 kP Bk2
2
(1 )
con (0, 1). Del Teorema q
4.18 de [25] se concluye que z (t) es Global y
Finalmente Acotado por c0 max (P ) /mn (P )
Comentario 36 Es claro de la prueba del Lema que si la cota de (z) se
satisface solo en una vecindad del origen el resultado es v
alido localmente.
Ejemplo 37 Ecuaci
on del p
endulo
= a sin b + cT
a
x1 = , x2 = , u = T Tss = T sin
c
x 1 = x2
x 2 = a [sin (x1 + ) sin ] bx2 + cu
1
u = {a [sin (x1 + ) sin ] k1x1 k2x2}
c
"
A BK =
T =u+
0
1
k1 (k2 + b)
es Hurwitz
1
a
sin = [a sin (x1 + ) k1x1 k2x2]
c
c
Sean a
y c modelos nominales de a y c
1
a sin (x1 + ) k1x1 k2x2]
T = [
c
x = (A BK) x + B (x)
a
c a
c
c c
(x) =
sin (x1 + )
(k1x1 + k2x2)
c
c
| (x)| k kxk +
a
c c
a
c
a
c
2
2
|sin |
k=
+
k1 + k2 , =
c
c
c
"
P =
p11 p12
p12 p22
"
, PB =
p12
p22
1
k< q
2 p212 + p222
sin = 0 = = 0
Es la linealizaci
on por retroalimentaci
on una buena idea?
Ejemplo 38
x = ax bx3 + u , a, b > 0
u = (k + a) x + bx3 , k > 0 , = x = kx
bx3 es un t
ermino de amortiguamiento. Por qu
e cancelarlo?
u = (k + a) x , k > 0 , = x = kx bx3
Dise
no por linealizaci
on por retroalimentaci
on:
u = h (x1) (k1x1 + k2x2)
"
x =
0
1
k1 k2
Dise
no basado en pasividad: Considere la funci
on de almacenamiento de
energa
Z x
1
1 2
V (x) =
h (z) dz + x2
2
0
V = h (x1) x2 x2h (x1) + x2u = x2u
Entonces el sistema es pasivo si la salida es
y = x2
La ley de control
u = (x2) ,
(0) = 0 , x2 (x2) > 0 , x2 6= 0
estabiliza asint
oticamente (globalmente?) el origen de
x 1 = x2
x 2 = h (x1) (x2)
ya que
V = x2 (x2)
x2 (t) 0 = x 2 (t) 0 = h (x1 (t)) 0 = x1 (t) 0 ,
La estabilidad asint
otica es una consecuencia del principio de invariancia
de Lasalle.
Linealizaci
on:
"
x =
0
1
h0 (0) k
x , k = 0 (0)
El polinomio caracterstico es
s2 + ks + h0 (0) = 0
s
k
k 2
s1,2 =
h0 (0)
2
2
cuando k vara entre 0 ,quna de las races no puede moverse a la
izquierda del punto Re [s] = h0 (0)
2.3.
Linealizaci
on Parcial (o entrada/salida) por
Retroalimentaci
on
z=
"
= T (x) =
T1 (x)
T2 (x)
= f0 (, )
= A + B (x) [u (x)]
d
onde (i) (A, B) es controlable, y (ii) (x) es una matriz no singular para
cada x D Rn.
Si se elige
u = (x) + 1 (x) v
entonces la din
amica del sistema en lazo cerrado es
(
= f0 (, )
= A + Bv
Si adem
as la nueva entrada v se dise
na como
v = K
con K tal que la matriz (A BK) sea Hurwitz, entonces el sistema en
lazo cerrado es
(
= f0 (, )
= (A BK)
(2)
2.3.1.
en alguna vecindad de = 0, d
onde 3 es una funci
on tipo K. Sea P =
P T > 0 la soluci
on de la ecuaci
on algebraica de Lyapunov
P (A BK) + (A BK)T P = I
y use
q
V (, ) = V1 () + k T P , k > 0
como candidata a funci
on de Lyapunov para (2). N
otese que aunque V
no es continuamente diferenciable en la variedad = 0 el teorema de
Lyapunov sigue siendo v
alido en este caso (por qu
e?).
La derivada V est
a dada por
h
i
k
V1 ()
T
T
V =
f0 (, ) + q
P (A BK) + (A BK) P
T
2 P
V1 ()
V1 ()
k T
=
f0 (, 0) +
[f0 (, ) f0 (, 0)] q
2 T P
En cualquier vecindad acotada V del origen, y por la diferenciabilidad
contnua de V1 y f0, es posible acotar
kf0 (, ) f0 (, 0)k k1 kk
V ()
1
k2
y entonces
V 3 (kk) + k1k2 kk kk3 kk
para algunas constantes positivas k1, k2, k3. Eligiendo k > k1k2/k3 se asegura que V es negativa definida. Por lo tanto el origen es local y asint
oticamente estable.
Comentario 42 N
otese que la funci
on candidata de Lyapunov m
as simple,
es decir, la suma de las funciones de Lyapunov para cada uno de los sistemas de la cascada, W (, ) = V1 () + k T P , k > 0 no es u
til en este
caso!
2.3.2.
El origen de
=
es global y exponencialmente estable, y el origen de
= k , k > 0
es tambi
en global y exponencialmente estable. Sin embargo, el origen de
= + 2
= k , k > 0
no es global y asint
oticamente estable! (Ver simulaciones en Figura 2.1)
Para calcular la regi
on de atracci
on del origen, considere la variable v =
y n
otese que
v =
+ = + 2 2 k = (1 + k) v + v 2
Si v0 = (1 + k), entonces v (t) = 1 + k para todo t 0.
x = x + x2 y
y=2y
2
4
2
1
x
= (A BK) =
0
1
k2 2k
e(ABK)t =
(1 + kt) ekt
tekt
k2tekt
(1 kt) ekt
m
ax
t0
k2tekt
k2tekt
k
= cuando k
t=1/k
e
1.5
2.5
3.5
Figura 2.2: Gr
aficas de la funci
on k2tekt para valores de k
[1 , 5 , 10 , 20]
Si
"
(0) =
1
0
"
= (t) =
(1 + kt) ekt
k2tekt
1
2
kt
3 , (0) = 0
= = 1 k te
2
02
2
h
i
= (t) =
1 + 02 t + (1 + kt) ekt 1
es global y asint
oticamente estable si el sistema
= f0 (, )
es Entrada-a-Estados Estable.
2.3.3.
La discusi
on anterior muestra que todo sistema Linealizable Parcialmente
(o linealizable entrada-salida), y que sea de fase mnima, puede ser estabilizado (localmente) mediante la ley de control por retroalimentaci
on de
estados
u = (x) 1 (x) KT2 (x)
Comentario 46 N
otese que esta ley de control es independiente de la funci
on (x) = T1 (x), que satisface (en el caso de una sola entrada) la
ecuaci
on en derivadas parciales (EDP)
(x)
g (x) = 0
x
Cu
al es el efecto de las incertidumbres en (x), (x), y T2 (x) ?
Sean
(x),
(x), y T2 (x) modelos nominales de (x), (x), y T2 (x).
Con la ley de control
u=
(x)
1 (x) K T2 (x)
el sistema en lazo cerrado es (en coordenadas z)
= f0 (, )
h
i
1
= A + B (x)
(x)
(x) K T2 (x) (x) + BKT2 (x) BK
y por lo tanto
= f0 (, )
= (A BK) + B (z)
=
+ 1KT
1K T2
2
(3)
i
Prueba. Sea
V () = T P
d
onde P = P T > 0 es la soluci
on de la ecuaci
on algebraica de Lyapunov
P (A BK) + (A BK)T P = I .
Esta es una funci
on de Lyapunov para el subsistema lineal nominal de
(3). Luego, tomando su derivada a lo largo de las trayectorias del sistema
perturbado (3) se obtiene
V () =
(k (T )k2 , t T ) + 0 (c)
d
onde es una funci
on tipo KL, y 0 es una funci
on tipo K. Despu
es de
un cierto tiempo finito se satisface
(k (T )k2 , t T )
y por lo tanto z (t) est
a finalmente acotada
kz (t)k2 k (t)k2 + k (t)k2 c + + 0 (c)
V ()
1
c4 kk2
2
en alguna vecindad de = 0. Usando
V (z) = bV1 () + T P , b > 0
V1 ()
V1 ()
f0 (, 0) + b
[f0 (, ) f0 (, 0)] +
V =b
h
i
T
T
+ P (A BK) + (A BK) P + 2 T P B (z)
bc3 kk22 + bc4L kk2 kk2 kk22 +
+ 2k kP Bk2 kk22 + 2k kP Bk2 kk2 kk2
"
=
"
kk2
kk2
kk2
kk2
#T
#T
12 bc4L + k kP Bk2
"
bc3
kk2
kk2
1 bc L + k kP Bk
2
2 4
1 2k kP Bk2
"
kk2
kk2
d
onde L es una constante de Lipschitz de f0 (, ) con respecto a . Haciendo b = k, se puede ver que
2
1
det Q = kc3 (1 2k kP Bk2)
kc4L + k kP Bk2
2
(
"
2 # )
1
k >0
c4L + kP Bk2
= k c3 2c3 kP Bk2 +
2
si
c3
k<
2
2c3 kP Bk2 + 12 c4L + kP Bk2
Entonces Q es positiva definida para una k suficientemente peque
na. Por
lo tanto el origen es Exponencialmente Estable.
2.4.
Backstepping
2.4.1.
El caso m
as simple: Backstepping de integrador
La idea b
asica del m
etodo conocido como backsteppingse puede explicar,
en su forma m
as simple, considerando el sistema con entrada escalar
= f () + g ()
= u , Rn , R , u R
N
otese que este sistema se puede ver como una conexi
on en cascada,
d
onde el maestro es un integrador y el esclavo es el sistema no lineal
= f () + g () . El objetivo de control es estabilizar el origen utilizando
retroalimentaci
on de los estados. El dise
no se divide en dos etapas:
Dise
no del Control virtual:
V
ease a como una entrada de control virtual del sistema
= f () + g ()
Suponga que existe una ley de control retroalimentado
= ()
que estabiliza el origen de
= f () + g () ()
y que, adem
as, conocemos una funci
on de Lyapunov V () que lo asegura
V ()
V () =
[f () + g () ()] W () , D
Dise
no del control verdadero por backstepping
Cambio de coordenadas Como no se puede implementar el control virtual
= (), definimos el error como una nueva variable
z = ()
Escribiendo el sistema en t
erminos de esta nueva variable se obtiene
= [f () + g () ()] + g () z
()
z = u [f () + g () ] .
Si se dise
na la variable de control como
()
u=
[f () + g () ] + v
Comentario 48 N
otese que este sistema tiene la misma estructura que el
sistema original: Un integrador en cascada con un sistema no lineal. Pero
hay una diferencia fundamental: el sistema
= [f () + g () ()] + g () z
tiene un punto de equilibrio asint
oticamente estable cuando la entrada
z = 0. Esto no es siempre el caso en el sistema inicial.
Dise
no del control por Lyapunov El dise
no se realiza proponiendo una
funci
on candidata de Lyapunov, en nuestro caso se puede usar
1
Vc (, ) = V () + z 2 .
2
El control v se elige de tal forma que V c
V ()
V ()
g () z + zv
Vc =
[f () + g () ()] +
V ()
g () z kz , k > 0
con lo que
V c W () kz 2
El control finalmente resulta ser
()
V ()
u=
[f () + g () ]
g () z kz , k > 0
Comentario 50 Tambi
en a diferencia de la secci
on anterior el subsistema
esclavo de la cascada no tiene que ser estable con entrada cero, sino que
se puede estabilizar mediante el control virtual!
Ejemplo 51 Considere el sistema
x 1 = x21 x31 + x2
x 2 = u ,
x1 , x2 , u R
Una ley de control virtual para el primer sistema
x2 = (x1) = x21 x1
estabiliza globalmente el origen de
x 1 = x1 x31
como lo prueba la funci
on de Lyapunov
1 2
V (x1) = x1 = V = x21 x41 < 0 , x1 R
2
3
z2 = u + (1 + 2x1) x1 x1 + z2
Se propone como candidata a Funci
on de Lyapunov
1 2 1 2
Vc (x) = x1 + z2
2
2
cuya derivada
V c =
=
i
3
3
x1 x1 x1 + z2 + z2 u + (1 + 2x1) x1 x1 + z2
h
i
2
4
3
x1 x1 + z2 x1 + (1 + 2x1) x1 x1 + z2 + u
eligiendo
u = x1 (1 + 2x1)
x1 x31
+ z2 z2
x21
x41
2
2
x2 + x1 + x1
El m
etodo puede ser aplicado recursivamente!
Ejemplo 52 Considere el sistema
x 1 = x21 x31 + x2
x 2 = x3 ,
x 3 = u ,
Para el sistema esclavo
x 1 = x21 x31 + x2
x 2 = x3 ,
x1 x31
+ z2 z2 = (x1, x2)
2
3
z3 = u x x1 x1 + x2 x
( + z3) ,
1
V
V 2
3
x x1 + x2 +
(z3 + ) +
Vc =
x"1 1
x2
#
x21 x31 + x2
(z3 + )
+ z3 u
x1
x2
2
2
x2 + x1 + x1 +
=
V
2
3
+ z3
x x1 + x2
x2 x1 1
x21
"
x41
(z3 + ) + u
x2
eligiendo
V
2
3
u=
+
x x1 + x2 +
(z3 + ) z3
x2 x1 1
x2
2.4.2.
Un caso m
as general
1
[v fa (, )]
ga (, )
el sistema se convierte en
= f () + g ()
= v ,
que est
a en la forma original.
2.4.3.
mentaci
on estricta, es decir, un sistema descrito por
x = f0 (x) + g0 (x) z1
z1 = f1 (x, z1) + g1 (x, z1) z2 ,
z2 = f2 (x, z1, z2) + g2 (x, z1, z2) z3 ,
...
Comentario 55 N
otese que el subsistema z es linealizable por retroalimentaci
on. As que el sistema en la forma de retroalimentaci
on estricta es
linealizable parcialmente (entrada/salida). As que el Backstepping se aplica esencialmente a la clase de sistemas que son linealizables parcialmente.
Ejemplo 56 Considere el sistema
= + 2
= u .
El sistema esclavo
= + 2
con la ley de control virtual
= 0 = =
1 2
2
V =
+
2
cuya derivada es
V =
+ 2
+ u =
+u
2.4.4.
Backstepping en bloques
y que, adem
as, conocemos una funci
on de Lyapunov V (), suave y positiva
definida, que lo asegura
V ()
V () =
[f () + G () ()] W () , D
V ()
V ()
[f () + G () ()] +
G () ( ()) +
V c =
"
#
()
T
+ [ ()] fa (, ) + Ga (, ) u
(f () + G () )
u = G1
a (, )
!T
()
V ()
(f () + G () )
G ()
fa (, ) k ( ())] , k > 0
resulta en
V ()
W () k ( ())T ( ())
2.5.
2.5.1.
Idea b
asica
Considere el sistema
:
x = f (x, u) , x Rn , u Rp
y = h (x) , y Rp
f (0, 0) = 0 , h (0) = 0
Definici
on 57 El sistema es pasivo si existe una funci
on de almacenamiento de energa V (x), contnuamente diferenciable y positiva semidefinida,
tal que
V (x)
V =
f (x, u) uT y, x Rn , u Rp
x
Definici
on 58 El sistema es de estado cero observable si la u
nica trayectoria del sistema con entrada u = 0
x = f (x, 0)
que puede hacer la salida cero, es decir, que puede permanecer en el conjunto {h (x) = 0} es la soluci
on trivial x (t) 0.
Un resultado b
asico de estabilizaci
on asint
otica para sistemas pasivos es el
siguiente
Teorema 59 Si el sistema es
1. Pasivo, con funci
on de almacenamiento positiva definida y radialmente no
acotada, y
2. de estado cero observable
entonces el origen x = 0 puede ser estabilizado global y asint
oticamente
mediante la ley de control
u = (y)
d
onde es cualquier funci
on localmente Lipschitz, tal que (0) = 0 y es
pasiva
y T (y) > 0 , y 6= 0
se puede interpretar de la siguiente manera: la no linealidad pasiva inyecta amortiguamiento al sistema, haciendo que las trayectorias converjan
al origen.
N
otese que hay una gran libertad de elecci
on en la forma de la funci
on de
inyecci
on de amortiguamiento : por ejemplo, se pueden satisfacer restricciones de acotamiento de la entrada.
Ya que el teorema s
olo es u
til para sistemas pasivos, su utilidad se incrementa si se pueden convertir sistemas no pasivos en pasivos. Hay dos
formas b
asicas de hacer pasivo a un sistema:
1. Mediante la selecci
on de la salida
2. Por retroalimentaci
on de estados, o
ambos.
2.5.2.
Pasivizaci
on por elecci
on de la salida
x = f (x) + G (x) u
y = h (x) ,
#T
V (x)
G (x)
x
ya que
V (x)
V (x)
[f (x) + G (x) u]
G (x) u = y T u .
V =
x
x
Si adicionalmente es de estado cero observable, entonces puede utilizarse
el teorema para estabilizar asint
oticamente el origen.
Comentario 60 N
otese que no existe una u
nica salida pasiva. Para cada
elecci
on de V (x) se obtiene una salida pasiva (posiblemente) diferente.
#T
"
= 0 (V (x))
#T
V (x)
G (x)
x
Ejemplo 61
x 1 = x2 ,
x 2 = x31 + u .
Con u = 0
1 4 1 2
V (x) = x1 + x2 = V = x31x2 x2x31 = 0
4
2
= 0 (V (x)) h (x) .
V (x)
V (x)
G (x) =
= x2
x
x2
2k
u = kx2 , o u =
tan1 x2 , k > 0
2.5.3.
Pasivizaci
on por retroalimentaci
on de estados
La pasivizaci
on por elecci
on de la salida exige que el sistema tenga un
punto de equilibrio estable, por lo que muchos sistemas no pueden ser
pasivizados por tal m
etodo. Para poder considerar sistemas no estables, se
requiere utilizar una retroalimentaci
on preliminar.
Definici
on 62 El sistema
(
A :
x = f (x) + G (x) u , x Rn , u Rp
y = h (x) , y Rp
tal que
x = f (x) + G (x) (x) + G (x) (x) v , x Rn , v Rp
y = h (x) , y Rp
sea pasivo.
Teorema 64 El sistema
(
A :
x = f (x) + G (x) u , x Rn , u Rp
y = h (x) , y Rp
2. Es de fase mnima d
ebil, es decir, la din
amica cero tiene un punto de equilibrio estable en el origen, con una funci
on de Lyapunov positiva definida.
Prueba. Se har
a la prueba para el caso SISO. Si el grado relativo es = 1 se
puede llevar a la Forma Normal mediante un difeomorfismo local z = T (x)
= f0 (, )
Forma Normal:
= Lf h (x) + Lg h (x) u
y=
del c
alculo diferencial se sabe que existe una funci
on contnua F (, ) tal
que
f0 (, )
, (0, )
"Z
#
1 f0 (, )
=
d
f0 (, ) f0 (, 0) =
, F (, )
Considere como funci
on de almacenamiento del sistema a
1
V (, ) = W () + 2
2
Su derivada temporal a lo largo de las trayectorias del sistema, cuando se
aplica un control por retroalimentaci
on de estados
"
u=
1
W ()
F (, y) Lf h (x) + v
Lg h (x)
es
h
i
W
()
V =
f0 (, ) + Lf h (x) + Lg h (x) u
h
i
W ()
W ()
=
f0 (, 0) +
[f0 (, y) f0 (, 0)] + y Lf h (x) + Lg h (x) u
"
#
W ()
W ()
f0 (, 0) + y
F (, y) + Lf h (x) + Lg h (x) u yv
=
MT
>0,
2C
M
2C
= M
, D = DT 0
La funci
on positiva definida
Z
e
1 T
V = e M (q) e +
T
p () d
2
0
1
1
1
(q) e + T
V = eT M (q) e + e T M (q) e + e T M
p (e) e
2
2
2
1
1
= [C (q, q)
e De p (e) + v]T e + e T [C (q, q)
e De p (e) + v] +
2
2
1 T
+ e M (q) e + T
p (e) e
2
i
1 Th
Tv
= e M 2C e e T De e T p (e) + T
(e)
e
+
e
p
2
= e T De + e T v e T v
Entonces, si se elige la salida y = e el sistema es pasivo, y V es una funci
on
de almacenamiento positiva definida (es radialmente no acotada?)
d
onde
d (0) = 0 , e T d (e)
> 0 , e 6= 0 .
El control final queda
u = g (q) p (e) d (e)
que contiene un t
ermino proporcional y uno derivativo. Un caso especial
corresponde a funciones lineales
u = g (q) Kpe Kde , Kp = KpT > 0 , Kd = KdT > 0 .
C
omo se comparan el control basado en pasividad con la linealizaci
on por
retroalimentaci
on?
Ejemplo 66 Considere el sistema
con
x 1 = x2
x 2 = h (x1) + u
h (0) = 0 , x1h (x1) > 0 , x1 6= 0
Dise
no por linealizaci
on por retroalimentaci
on:
u = h (x1) (k1x1 + k2x2)
"
x =
0
1
k1 k2
Dise
no basado en pasividad: Considere la funci
on de almacenamiento de
energa
V (x) =
Z x
1
0
1 2
h (z) dz + x2
2
Linealizaci
on:
"
x =
0
1
h0 (0) k
x , k = 0 (0)
El polinomio caracterstico es
s2 + ks + h0 (0) = 0
s
k
s1,2 =
2
2
k
h0 (0)
d
onde
(0) = 0 , x1 [h (x1) + (x1)] > 0 , x1 6= 0
convierte al sistema en lazo cerrado en
x 1 = x2
x 2 = h (x1) (x1) + v
Este sistema, con salida
y = x2
es pasivo, con funci
on de almacenamiento de energa
V (x) =
Z x
1
0
1 2
[h (z) + (z)] dz + x2
2
Adem
as, el sistema es de estado cero observable, ya que con v = 0
y (t) = x2 (t) 0 = [h (x1 (t)) + (x1 (t))] 0 = x1 (t) 0 .
Entonces la ley de control
v = (x2) ,
(0) = 0 , x2 (x2) > 0 , x2 6= 0
es decir,
u = (x1) (x2)
estabiliza asint
oticamente (globalmente?) el origen de
x 1 = x2
x 2 = h (x1) (x1) (x2)
Linealizaci
on:
"
x =
0
1
h0 (0) + k2 k1
x , k1 = 0 (0) , k2 = 0 (0)
El polinomio caracterstico es
s2
+ k1 s +
h0 (0) + k
i
2
=0
2.5.4.
La pasivizaci
on por retroalimentaci
on puede ser aplicada, en particular, a
la clase de sistemas en cascada
z = f0 (z, y)
x = f (x) + G (x) u
y = h (x)
Si f0 (z, y) es suficientemente suave, por el teorema del valor medio se
puede escribir como
f0 (z, y) = f0 (z, 0) + [f0 (z, y) f0 (z, 0)]
#
"Z
1 f0 (z, sy)
ds y
= f0 (z, 0) +
y
0
, fa (z) + F (z, y) y
la representaci
on es global,
Usando
U (z, x) = W (z) + V (x)
W (z)
W (z)
V (x)
V (x)
U =
fa (z) +
F (z, y) y +
f (x) +
G (x) u
z
z
x
x
!T
W (z)
T
y u+
F (z, y)
z
u=
!T
W (z)
F (z, y)
z
+v
resulta que
U y T v
Por lo tanto el sistema
z = fa (z) + F (z, y) y
x = f (x) G (x)
W (z)
z F
(z, y)
+ G (x) v
y = h (x)
es pasivo, con funci
on de almacenamiento U . Si el sistema es de estado
cero observable, entonces se puede estabilizar asint
oticamente mediante
una retroalimentaci
on pasiva de la salida.
+ S () + T
= I3
M = S () M + u
d
onde R3 es el vector de velocidades, y R3 es una selecci
on particular de los par
ametros cinem
aticos que conducen a una representaci
on
tridimensional del grupo rotacional. La matriz
x3 x2
0
x1
x2 x1
0
es antisem
etrica, M es una matriz de inercia sim
etrica y positiva definida,
e I3 es la matriz identidad de dimensi
on 3 3.
S (x) = x3
maestro
M = S () M + u
y=
y el sistema esclavo
i
1h
T
=
I3 + S () + .
2
V = M + M
2
2
h
i
i
1 T
1h
T
T
T
=
M S () + u + S () M + u = y T u
2
2
ya que
x3 x2
x1
0
x1 x2 =
x2 x1
0
x3
S (x) x = x3
x3x2 + x2x3
x3x1 x1x3 = 0
x2x1 + x1x2
u=
W () 1 h
I3 + S () + T
!
i T
+v
Eligiendo
W () = k ln
1 + T
, k>0
se obtiene
u=
kT
1 + T
I3 + S () + T
!
i T
+ v = k + v
y el sistema resultante es
1
2
+ S () + T
= I3
y
M = S () M k + v
y=
Este sistema es de estado cero observable, ya que con v = 0
y (t) 0 (t) 0 = (t) 0 = (t) 0 .
Por lo tanto puede ser estabilizado global y asint
oticamente mediante la
ley de control
u = k ()
con
(0) = 0 , y T (y) > 0 , y 6= 0 .
2.5.5.
Un caso especial
Si se imponen condiciones m
as fuertes sobre el sistema esclavo, no se
requiere probar que el todo el sistema interconectado es de estado cero
observable.
entonces el origen (z, x) = (0, 0) del sistema puede ser global y asint
oticamente estabilizado mediante la ley de control
u=
!T
W (z)
F (z, y)
z
(y)
con
(0) = 0 , y T (y) > 0 , y 6= 0 .
u = 3 k
2.6.
Considere el sistema SI
x = f (x) + g (x) u
f (0) = 0 , x Rn , u R
y suponga que existe una ley de control por retroalimentaci
on de los estados
u = (x)
contnua, tal que el origen del sistema en lazo cerrado
x = f (x) + g (x) (x)
es asint
oticamente estable.
De la desigualdad
V (x)
[f (x) + g (x) (x)] < 0 , x D , x 6= 0
x
se concluye que
V (x)
V (x)
g (x) = 0 , para alg
un x D , x 6= 0 =
f (x) < 0
x
x
Adem
as, ya que (x) es contnua, y (0) = 0, > 0 , > 0 tal que si
x 6= 0 y kxk < existe u con kuk < tal que
V (x)
[f (x) + g (x) u] < 0
x
Propiedad de control peque
no
Definici
on 71 Una funci
on V (x), contnuamente diferenciable y positiva
definida, es una Funci
on de Lyapunov de Control (FLC) para el sistema
x = f (x) + g (x) u
si
V (x)
V (x)
g (x) = 0 , para alg
un x D , x 6= 0 =
f (x) < 0 (4)
x
x
Es una Funci
on de Lyapunov de Control Global si es radialmente no acotada
y (4) se satisface para D = Rn.
El sistema
x = f (x) + g (x) u
es estabilizable por una ley de control retroalimentado contnua s
olo si este
posee una FLC.
Es esta condici
on suficiente?
u = (x) =
V f +
x
0,
F
ormula de Sontag
2
4
V
+ x g
V g
x
V f
x
si
V (x)
x g (x)
6= 0
si
V (x)
x g (x)
=0.
La funci
on (x) es contnua para toda x D0 (una vecindad del orgen)
que incluye x = 0.
Si f y g son suaves, entonces (x) es suave para x 6= 0.
Sea V (x) una FLC global, entonces el control u = (x) estabiliza globalmente el origen.
V (x)
x g (x)
= 0 entonces
V (x)
V (x)
[f (x) + g (x) (x)] =
f (x) < 0 para x 6= 0
x
x
Si
V (x)
x g (x)
6= 0
V
V
V =
f
g
x
x
s
V f
x
V
V
f +
g
x
x
V f 2 + V g 4
x
x
V g
x
4
< 0 para x 6= 0
Problema: C
omo se puede encontrar una Funci
on de Lyapunov de Control
(FLC)?
Si se conoce alg
un control estabilizante y una funci
on de Lyapunov correspondiente V , entonces V es una FLC.
Linealizaci
on por retroalimentaci
on
Mediante el dise
no de Backstepping se obtiene una FLC.
Ejemplo 73
x = ax bx3 + u , a, b > 0
Linealizaci
on por retroalimentaci
on:
u = (k + a) x + bx3 , k > 0 , = x = kx
1 2
V (x) = x es una FLC
2
V (x)
V (x)
3
g (x) = x ,
f (x) = x ax bx
x
x
V f
x
V f
x
V g
x
4
V
+ x g
ax bx3
x2 ax bx
=
r
(x) =
ax + bx3
a bx2
2
3
+1
+ x4
Comp
arela con
u = ax + bx3 kx , k > 0 .
M
etodo
LR-u
LR-LCerr
FLC-u
FLC-L Cer
Expresi
on
ax + bx3kx
x =rkx
ax + bx3x
r
x = x
2
2
a bx
a bx2
+1
+1
peque
no |x|
(a + k) x
x = kx
a+
a2
+1 x
x = a2 + 1x
gran |x|
bx3
x = kx
ax
x = bx3
Entonces la f
ormula de Sontag tiene un m
argen de ganancia de
es decir, u = k (x) es estabilizante para toda k 21 .
1
2
Prueba. Sea
q (x) =
1 V
f+
2
x
V
f
x
V
g
x
, q (0) = 0 .
Si
V (x)
g (x) 6= 0 = q (x) > 0
x
Si
V (x)
g (x) = 0 = q (x) = 0
x
, ,
V (x)
V (x)
g (x) = 0 = V =
f (x) < 0 para x 6= 0
x
x
V (x)
V (x)
V (x)
g (x) 6= 0 = V = q (x)+q (x)+
f (x)+
g (x) k (x)
x
x
x
V (x)
V (x)
q (x) +
f (x) +
g (x) k (x) =
x
x
s
2
V
1 V
V
f+
f +
g
k
2
x
x
x
2.7.
Retroalimentaci
on de la salida
En general la estabilizaci
on por retroalimentaci
on de la salida requiere el
uso de observadores. Sin embargo, en algunas ocasiones esto no se requiere
explcitamente. Se presentar
an aqui tres casos simples, en los cuales no es
necesario dise
nar un observador:
Sistemas pasivos
2.7.1.
Sea el sistema
x = f (x) + g (x) u
y = h (x)
f (0) = 0 , h (0) = 0 , Lg h (x) 6= 0 , x D Rn , u R
En su forma normal
(x)
(0) = 0 , Lg (x) 6= 0 =
h (x)
y
(
Forma Normal:
= f0 (, y)
y = (x) [u (x)] , (x) 6= 0
Supuestos:
V1 ()
f0 (, 0) c3 kk2
V ()
1
c4 kk
1
V (, y) = V1 () + y 2
2
V1 ()
V =
f0 (, y) k (x) y 2 (x) (x) y
V1 ()
V1 ()
f0 (, 0) +
=
[f0 (, y) f0 (, 0)] k (x) y 2 (x) (x) y
kk
|y|
#T "
|
c3
1 (c L + L )
2
2 4 1
{z
Q
1 (c L + L )
2
2 4 1
(k0 L3)
1
det Q = c3 (k0 L3) (c4L1 + L2)2
4
#"
}
kk
|y|
L3
1
+
(c4L1 + L2)2
0
4c30
2.7.2.
Sistemas pasivos
Sup
onga que el sistema
(
x = f (x, u) , x Rn , u Rp
y = h (x, u) , y Rp
f (0, 0) = 0 , h (0, 0) = 0
es pasivo, con funci
on de almacenamiento de energa V (x), contnuamente
diferenciable y positiva definida
V (x)
f (x, u) uT y, x Rn , u Rp ,
V =
x
y de estado cero observable.
Entonces puede ser estabilizado mediante la ey de control por retroalimentaci
on de la salida
u = (y)
(0) = 0 , y T (y) > 0 , y 6= 0
V (x)
V =
f (x, u) uT y = y T (y) 0,
x
2.7.3.
Sea el sistema
x = f (x, u) , x Rn , u Rp
y = h (x) , y Rp
d :
x = f (x, u) , x Rn , u Rp
h(x)
(x, u) , y Rp
y = x f (x, u) , h
Caso escalar
bs
y = sy
y , a>0, b>0
s+a
Caso multivariable: Para 1 i p
y i = syi
bis
yi , ai > 0 , bi > 0
s + ai
Implementaci
on:
zi es la salida de
bis
con entrada yi
s + ai
Recu
erdese que la cascada del sistema lineal estrictamente pasivo
bis
Gi (s) =
s + ai
con la no linealidad pasiva
i (zi)
es estrictamente pasiva, con funci
on de almacenamiento
Wi (zi) = ki
ya que
Z z
i
0
i () d , ki > 0
Z
p
X
1 zi
i=1 bi 0
i () d
X 1
V (x)
Vc (x, z) =
i (zi) [aizi + biy i]
f (x, u) +
x
i=1 bi
p "
X
ai
+
i (zi) zi + i (zi) y i
bi
i=1
#
p
p "
X
X
a
=
i (zi) y i +
i i (zi) zi + i (zi) y i
bi
i=1
i=1
uT y
p
X
ai
i=1 bi
i (zi) zi < 0 , z 6= 0
Ejemplo 75 Estabilice el p
endulo
ml + mg sin = u
en = 1 usando retroalimentaci
on de
a
x1 = 1 , x2 = , u = T Tss = T sin
c
x 1 = x2
1 [mg sin (x + ) + u]
x 2 = ml
1
1
u = mg sin (x1 + 1) kpx1 + v , kp > 0
x 1 = x2
k
1 v
x 2 = mlp x1 + ml
y = x1
y = x2
1
1
2
V = kpx1 + mlx22
2
2
V
V
kp
1
= kpx1x2 + mlx2 x1 +
v
ml
ml
= x2v = yv
= Pasivo v y
bs
: y (t) y z (t)
s+a
realizaci
on
= a + y
z = b (a + y)
v = kdz , kd > 0
u = mg sin kp ( 1) kdz
Captulo 3
Estabilizaci
on Robusta
3.1.
3.1.1.
Ejemplo introductorio
Considere el sistema
x 1 = x2
x 2 = h (x) + g (x) u , g (x) g0 > 0
Variedad deslizante (superficie):
s = a1x1 + x2 = 0
s (t) 0 = x 1 = a1x1
a1 > 0 = lm x1 (t) = 0
t
C
omo podemos llevar la trayectoria a la variedad s = 0?
C
omo podemos mantenerla all?
s = a1x 1 + x 2 = a1x2 + h (x) + g (x) u
Sup
ongase que
a x + h (x)
1 2
% (x)
g (x)
1
V = s2
2
V = ss = s [a1x2 + h (x)] + sg (x) u
"
#
a1x2 + h (x)
= sg (x)
+ sg (x) u
g (x)
|s| g (x) % (x) + sg (x) u
Si
(x) % (x) + 0 , 0 > 0
s > 0 , u = (x)
V |s| g (x) % (x) |s| g (x) (x)
|s| g (x) % (x) |s| g (x) (% (x) + 0) = g (x) 0 |s|
Si
s < 0 , u = (x)
V |s| g (x) % (x) + sg (x) u = |s| g (x) % (x) |s| g (x) (x)
|s| g (x) % (x) |s| g (x) (% (x) + 0) = g (x) 0 |s|
(
sign (s) =
1,
s>0
1 , s < 0
V g00 2V
dV
g00 2dt
V
V (s(t))
2 V
g00 2t
V (s(0))
V (s (t))
1
V (s (0)) g00 t
2
|s| c , y |x1|
(
= |x1|
es invariante positivo si
c
a1
)
c
, |s| c
a1
a x + h (x)
1 2
% (x) en
g (x)
a x + h (x)
1 2
k1 < k , x
g (x)
u = k sign (s)
C
omo se puede reducir o eliminar el chattering(casta
neo)?
u=
(x)
a1x2 + h
g (x)
+v
s = (x) + g (x) v
#
"
(x) = a1 1
g (x)
g (x)
x2 + h (x)
h (x)
g (x)
g (x)
(x)
u = (x) sat
(
sat (y) =
y,
si |y| 1
sign (y) , si |y| > 1
C
omo podemos analizar el sistema?
Para
Con c
= |x1|
c
a1
0<<1
x1x 1 (1 ) a1x21 , |x1|
a1
= |x1|
, |s|
a1
en tiempo finito.
Qu
e ocurre dentro de ?
Encuentre los puntos de equilibrio
0 = a1x1 + s = x2
0 = a1x2 + h (x) g (x) (x) s ,
h (x)
(x1) =
x2 =0
x1 = (x1)
Sup
ongase que x1 = (x1) tiene una raz aislada x
1 = k1
h (0) = x
1 = 0
z1 = x1 x
1 , z2 = s a1x
1
x2 = a1x1 + s = a1 (x1 x
1) + s a1x
1 = a1z1 + z2
z1 = a1x1 + s = a1z1 + z2
s
z2 = a1x2 + h (x) g (x) (x)
z + a1x
1
= a1 (a1z1 + z2) + h (x) g (x) (x) 2
z
z2 = l (z) g (x) (x) 2
"
h (x)
x
1
a1g (x) (x)
z1 = a1z1 + z2
z2 = l (z) g (x) (x) z2
l (0) = 0 , |l (z)| l1 |z1| + l2 |z2|
g (x) (x) g00
1 2 1 2
V = z1 + z2
2
2
z
V = z1 (a1z1 + z2) + z2 l (z) g (x) (x) 2
g00 2
2
2
a1z1 + (1 + l1) |z1| |z2| + l2z2
z
2
"
|z1|
|z2|
"
1
a1
(1 + l1)
2
g 0 0
1 (1 + l )
1
2
l2
|
{z
}
Q
#T
g
1
det Q = a1 0 0 l2 (1 + l1)2
4
h (0) = 0 = lm x (t) = 0
t
"
h (0) 6= 0 = lm x (t) =
t
x
1
0
|z1|
|z2|
L
ease la secci
on 14.1.1 del libro de Khalil.
3.1.2.
Consid
erese un sistema en la Forma Regular
(
= fa (, )
= fb (, ) + g (, ) u + (t, , , u)
Rn1 , R , u R
fa (0, 0) = 0 , fb (0, 0) = 0 , g (, ) g0 > 0 .
El dise
no se realiza en dos fases:
Fase 1:
Variedad de Deslizamiento (Superficie Deslizante):
s = () = 0 , (0) = 0
s (t) 0 = = fa (, ())
Dis
en
ese () de tal forma que el origen de = fa (, ()) sea asint
oticamente estable.
Fase 2:
Dise
ne el control de tal forma que las trayectorias converjan a s = 0 en
tiempo finito y permanezcan all a pesar de las perturbaciones e incertidumbres.
()
fa (, ) + g (, ) u + (t, , , u)
s = fb (, )
Sea
1
()
fb (, )
fa (, ) + v , o u = v
g (, )
o en forma compacta
u=
1
()
fa (, ) + v , L =
, o L=0
u = L fb (, )
g (, )
s = g (, ) v + (t, , , v)
(t, , , v) = fb
fa + gL fb
fa
Si se supone que
(t, , , v)
% (, ) + 0 |v|
g (, )
% (, ) 0 , 0 0 < 1 (conocidas)
1 2
V = s
2
V = ss = sg (, ) v + s (t, , , v) sgv + |s| ||
#
"
= g sv + |s|
g
g [sv + |s| (% (, ) + 0 |v|)]
Eligiendo
v = (, ) sign (s)
(, )
% (, )
+ 0 , 0 > 0
1 0
V g00 2V
dV
g00 2dt
V
V (s(t))
g00 2t
2 V
V (s(0))
V (s (t))
1
V (s (0)) g00 t
2
u = (x) sat
C
omo podemos analizar el sistema?
, >0
ss g0 (1 0) 0 |s| para
(r) = 2 ( (r))
V () (c) V () 2 ( (c)) = 2 (kk) 2 ( (c))
= kk (c) = V 3 (kk) 3 ( (c))
El conjunto {V () c0}, con c0 (c), es invariante positivo
= {V () c0} {|s| c} , con c0 (c)
y todas las trayectorias que se inician en llegan a
= {V () ()} {|s| }
en tiempo finito.
Teorema 76 ([25, Theorem 14.1]) Sup
onga que todas las hip
otesis son
v
alidas en . Entonces, para toda condici
on inicial ( (0) , (0)) la
trayectoria ( (t) , (t)) est
a acotada para todo t 0 y llega al conjunto
Ejemplo 78
x 1 = x2 + 1x1 sin x2
x 2 = 2x22 + x1 + u
|1| a , |2| b
x2 = kx1 = x 1 = kx1 + 1x1 sin x2
1 2
V1 = x1 = x1x 1 kx21 + ax21
2
Variedad deslizante (superficie):
s = kx1 + x2 = 0 , k > a
s = 2x22 + x1 + u + k (x2 + 1x1 sin x2)
u = x1 kx2 + v = s = v + (x)
Estabilizar
a el control
s
u = x1 kx2 (x) sat
el origen?
= f0 (, )
=
i
i+1 , 1 i 1
= L h (x) + Lg L1h (x) u
f
f
y = 1
= f0 , 1, , 1,
i = i+1 , 1 i 2
1 =
Dise
ne
= , 1, , 1
s = , 1, , 1
s = + k11 + + k11
= f0 , 1, , 1, k11 k11
1
0
1
1
...
...
..
k1
k1
1
1
3.1.3.
Consid
erese un sistema en la Forma Regular
(
= fa (, )
= fb (, ) + G (, ) E (, ) u + (t, , , u)
Rnp , Rp , u Rp
fa (0, 0) = 0 , fb (0, 0) = 0 , det G (, ) 6= 0 , det E (, ) 6= 0 ,
fa , fb , E conocidos, G , inciertos,
G (, ) = diag [g1 (, ) , g2 (, ) , , gp (, )] , gi (, ) g0 > 0
El dise
no se realiza en dos fases:
Fase 1:
Variedad de Deslizamiento (Superficie Deslizante):
s = () = 0 , (0) = 0
s (t) 0 = = fa (, ())
Dis
en
ese () de tal forma que el origen de = fa (, ()) sea asint
oticamente estable.
Fase 2:
Dise
ne el control de tal forma que las trayectorias converjan a s = 0 en
tiempo finito y permanezcan all a pesar de las perturbaciones e incertidumbres.
()
s = fb (, )
fa (, ) + G (, ) E (, ) u + (t, , , u)
Sea
u=
E 1
"
L fb
fa + v
1 , o L = 0
, L=G
s i = gi (, ) vi + i (t, , , v) , 1 i p
Si se supone que
(t, , , v)
i
ax |vi| , 1 i p
% (, ) + 0 m
gi (, )
1ip
% (, ) 0 , 0 0 < 1 (conocidas)
1X 2
V =
si
2 i=1
!)
ax |vi|
gi sivi + |si| % (, ) + 0 m
1ip
Eligiendo
vi = (, ) sign (si) , 1 i p
% (, )
(, )
+ 0 , 0 > 0
1 0
sis i gi [ + % + 0] |si|
= gi [ (1 0) + %] |si|
gi [% (1 0) 0 + %] |si|
g00 (1 0) |si|
si (t) llega a cero en tiempo finito!
Una vez llega a la superficie s = 0, la trayectoria no puede abandonarla.
C
omo se puede reducir o eliminar el chattering(casta
neo)?
Reemplazar el sign por una funci
on de saturaci
on de gran pendiente:
s
vi = (x) sat i
, >0, 1ip
L
ease los teoremas 14.1 y 14.2 en Khalil [25].
3.2.
Redise
no de Lyapunov (o Control Mini-Max)
Control (redise
nado) robustificante:
u = (x) + v
Hip
otesis acerca de la perturbaci
on
k (t, x, (x) + v)k % (x) + 0 kvk , 0 0 < 1
El sistema con el control robustificante queda
x = f (x) + G (x) (x) + G (x) [v + (t, x, (x) + v)]
La funci
on de Lyapunov para sistema nominal usada como candidata a f.
de Lyapunov para el sistema perturbado
V
V
G [v + ]
V =
[f + G] +
x
x
Definiendo
wT
V
G
=
x
V
V =
[f + G] + wT v + wT
x
wT v + wT wT v + kwk kk wT v + kwk [% (x) + 0 kvk]
Eligiendo el control como
v = (x)
w
kwk
w
= sign (w) para p = 1
kwk
d
onde
(x)
% (x)
1 0
v=
w , si (x) kwk
(x) kwk
2 (x) w
,
En la regi
on
(x) kwk = V W (x)
En la regi
on (x) kwk <
w
V W (x) + wT 2 (x) +
2 (x)
W (x)
kwk2 + % (x) kwk + 0 kwk kvk
2
2
2
kwk + % kwk + 0 kwk2
W (x)
V W (x) + (1 0)
kwk2 + kwk
como
y2
+ y , para y 0
entonces
(1 0)
V W (x) +
, x D
4
Teorema 80 [25, Teorema 14.3]x (t) es uniforme y finalmente acotada por
una funci
on clase K de . Si las hip
otesis se satisfacen globalmente, y V
es radialmente no acotada, entonces x (t) es global, uniforme y finalmente
acotada.
Corolario 81 [25, Corolario 14.1] Si % (0) = 0 y (x) 0 > 0 se puede
recobrar la estabilidad uniforme y asint
otica.
Ejemplo 82 El modelo de un p
endulo con aceleraci
on horizontal del punto
de suspensi
on est
a dado por
h
i
T
Objetivo: estabilizar el p
endulo en el punto =
g
1
A (t)
x1 = , x2 = , a = , c =
, h (t) =
,
2
`
m`
`
x 1 = x2
x 2 = a sin x1 + cu + h (t) cos x1
El modelo nominal es
x 1 = x2
x 2 = a
sin x1 + cu
Control nominal (linealizaci
on exacta)
1
(x) =
sin x1
(k1x1 + k2x2)
c
c
Din
amica nominal en lazo cerrado
"
x =
|
0
1
x , V (x) = xT P x
k1 k2
{z
Hurwitz
Perturbaci
on
1
=
c
a
ca
c
c c
c c
sin x1 + h (t) cos x1
(k1x1 + k2x2) +
v
c
c
c
q
a
c c
c c
a
c
,
+
k 2 + k 2 k , |h (t)| H
0
1
2
c
c
c
| (x)|
(k kxk + H)
+ 0 |v| , (x) + 0 |v| , (0 < 1)
c
(x) =
(x)
H
, (x)
1 0
c (1 0)
V
w=
G = 2xT P
x
(
v=
"
0
1
= 2 (p12x1 + p22x2)
1
u=
sin x1
(k1x1 + k2x2) + v
c
c
3.3.
Backstepping robusto
Pero tambi
en puede aplicarse a sistemas en esta forma con perturbaciones
o incertidumbres
z1 = f1 (z1) + g1 (z1) z2 + 1 (z) ,
z2 = f2 (z1, z2) + g2 (z1, z2) z3 + 2 (z) ,
...
k1 (z) k1 z1 , , zk1 ,
|k (z)| k (z1, , zk ) ,
Para esto, cada control virtual
zi = i (z1, , zi1) ,
Control virtual
x2 = k1x1
1 2
agase k1 = 1 + a
V1 = x1 , V1 (k1 a) x21 , H
2
con lo que el control virtual estabiliza robustamente el origen x1 = 0.
1
1
Vc (x) = x21 + z22
2
2
V c x21 + z2 [x1 + 1 (x) + 2 (x, ) + u]
Primer M
etodo (Ejemplo 14.13 de Khalil):
u = x1 1 (x) kz2 , k > 0
V c x21 kz22 + z22 (x, )
Se restringe el an
alisis al conjunto compacto
c = {Vc (x) c}
|2| a (1 + a) |x1| + b |x2| , = m
ax |x2|
xc
x2 = z2 (1 + a) x1
v=
V c x21 kz22 +
4
Se puede mostrar (h
agalo!) que este control estabiliza globalmente al
origen.
Captulo 4
Seguimiento
4.1.
Por Linealizaci
on Parcial
Lg Lf
h (x) 6= 0 ; x D0
Cambio de variables:
z = T (x) ,
(x)
(x)
Forma Normal:
= f0 (, )
i = i+1 , 1 i 1
1
= Lf h (x) + Lg Lf h (x) u
y = 1
f0 (0, 0) = 0
Se
nal de referencia r (t):
r (t) y todas sus derivadas hasta r() (t) son acotadas para todo t 0,
y la
esima derivada r() (t) es una funci
on contnua a tramos en t;
Se dispone de las se
nales r (t) , , r() (t) en lnea.
Objetivo:
lm [y (t) r (t)] = 0 .
r (t)
R = ...
, e=
r(1) (t)
1 r
...
=R ,
r(1)
1
()
e = Ace + Bc Lf h (x) + Lg Lf h (x) u r (t)
d
onde
Ac =
0
0
...
0
0
1
0
...
0
0
0
1
...
0
0
...
0
0
...
0
0
0
0
...
1
0
, Bc = ...
1
1
Lg Lf
h (x)
e = (Ac BcK)e
|
{z
Hurwitz
lmt e (t) = 0
Qu
e condici
on se requiere del sistema = f0 (, ) ?
4.2.
Lg Lf
h (x) a > 0 ; x D0
Forma Normal:
= f0 (, )
i = i+1 , 1 i 1
1
= Lf h (x) + Lg Lf h (x) [u + (t, x, u)]
y = 1
f0 (0, 0) = 0
Se
nal de referencia r (t):
r (t) y todas sus derivadas hasta r() (t) son acotadas para todo t 0,
y la
esima derivada r() (t) es una funci
on contnua a tramos en t;
Se dispone de las se
nales r (t) , , r() (t) en lnea.
Objetivo:
lm [y (t) r (t)] = 0 .
r (t)
R = ...
, e=
r(1) (t)
1 r
...
=R ,
r(1)
1
e = Lf h (x) + Lg Lf h (x) [u + (t, x, u)] r() (t)
s = k1e1 + + k1e1 + e ,
= f0 (, e + R)
e 1 = e2
...
e 1 = k1e1 + + k1e1
Dis
en
ense k1 k1 tales que la matriz
0
1
0
0
0
1
...
...
...
0
0
0
k1 k2 k3
0
0
0
0
...
...
...
0
1
k2 k1
sea Hurwitz .
Suposici
on 86 El sistema = f0 (, ) es BIBS (Bounded Input Bounded
State Stable).
s = k1e1 + + k1e1 + e =
1
X
kiei + e
i=1
s =
1
X
i=1
kiei+1 + Lf h (x) + Lg Lf
1
X
1
() (t) + v
u=
k
e
+
L
h
(x)
r
i
i+1
f
1
Lg Lf h (x) i=1
1
s = Lg Lf
h (x) v + (t, x, v)
(t, x, v)
s
v = (x) sat
, >0
% (x)
(x)
+ 0 , 0 > 0
1 0
Ejercicio 87 Qu
e propiedades se pueden probar para esta ley de control?
Captulo 5
Regulaci
on robusta estructural:
Control Integral
[25, Secci
on 12.3]La regulaci
on es un caso especial del seguimiento, cuando
la se
nal a seguir r (t) es constante. La acci
on integral permite obtener
regulaci
on a pesar de incertidumbres y/o perturbaciones que produzcan
una desviaci
on constante en la variable a regulada. A este se debe su
importancia fundamental en control cl
asico.
Considere el sistema
x = f (x, u, w)
y = h (x, w)
ym = hm (x, w)
x Rn estado , u Rp entrada de control , y Rp variable controlada ,
Objetivo:
lm y (t) r
r Rp referencia constante.
Defnase
v = (r, w) , e (t) = y (t) r
Suposici
on: e se puede medir.
Condici
on de estado estacionario: Sup
onga que, para cada w Rl , existe
un u
nico par (xss , uss) que satisface las ecuaciones
0 = f (xss, uss, w)
0 = h (xss, w) r
Estabilice el sistema en el punto de equilibrio x = xss para toda w Rl .
5.1.
5.1.1.
Retroalimentaci
on de estados
Retroalimentaci
on de estados:
u = K1x K2 K3e
Sistema en lazo cerrado:
x = f (x , K1x K2 K3 [h (x, w) r] , w)
= h (x, w) r
Puntos de equilibrio:
0 = f (
x, u
, w)
0 = h (
x, w) r
u
= K1x
K2
Unico
punto de equilibrio en
x = xss , = ss , u = uss .
Linealizaci
on alrededor de (xss , ss):
"
x xss
ss
= (A BK)
"
A=
A 0
C 0
h
f
(x, u, w) , C =
(x, w)
, A=
x
x
eq
eq
"
B=
B
0
f
h
, B=
(x, u, w) , C =
(x, w)
u
x
eq
eq
K=
K1 + K3C , K2
Lema 89 (A , B) es controlable si y s
olo si
1. (A , B) es controlable y
"
2. rango
A B
C 0
=n+p
Tarea: Dise
ne K, independiente de v = (r, w), tal que (A BK) es Hurwitz para todo v.
Ejemplo 90 P
endulo
= a sin b + cT
Objetivo: regule en
x1 = , x2 = , u = T ,
x 1 = x2
x 2 = a sin (x1 + ) bx2 + cu
"
xss =
0
0
a
, uss = sin
c
= x1
A = a cos b 0 , B = c
K1 =
k1 , k 2
, K 2 = k3 , K 3 = 0
(A BK) es Hurwitz si
b + k2c > 0 , (b + k2c) (a cos + k1c) k3c > 0 , k3c > 0
Sup
onga que
a
1
1 , 2
c
c
k
k2 > 0 , k3 > 0 , k1 > 1 + 2 3
k2
El controlador est
a dado por
u = k1 ( ) k2 k3
=
que es el controlador PID cl
asico.
5.1.2.
Retroalimentaci
on de salida
Si s
olo se miden (e, ym) el controlador integral puede ser
= e = y r
z = F z + G1 + G2ym
u = Lz + M1 + M2ym + M3e
Tarea: Dise
ne F, G1, G2, L, M1, M2, M3, independientes de v, tales que
Ac =
C
0
0
G2Cm
G1
F
hm
Cm =
(x, w)
x
eq
5.2.
= f0 (, , w)
1 = 2 ,
...
1 = ,
= b (, , u, w) + a (, , w) u
y = 1
a (, , w) a0 > 0
Objetivo:
y (t) r , cuando t
ss = [r, 0, , 0]T
Condici
on de estado estacionario: Para cada w existe un u
nico par (ss, uss)
que satisface las ecuaciones
0 = f0 (ss, ss, w)
0 = b (ss, ss, uss, w) + a (ss, ss, w) uss
Defnase
e 0 = y r
z = ss , e =
e1
e2
...
e
1 r
2
...
z = f0 (, , w) , f0 (z, e, w, r)
e 0 = e1 ,
e 1 = e2 ,
...
e 1 = e ,
e = b (, , u, w) + a (, , w) u
Retroalimentaci
on parcial de los estados: {e1, , e} son medidas
s = k0e0 + k1e1 + + k1e1 + e
k0, , k1 se eligen de tal forma que el polinomio
k11 + + k1 + k0
sea Hurwitz.
s = k0e1 + k1e2 + + k1e + b (, , u, w) + a (, , w) u
s = (, , u, w, r) + a (, , w) u
(, , u, w, r)
s
u = (e) sat
(e)
% (e)
+ 0 , 0 > 0
1 0
Para |s| , ss a0 (1 0) 0
Qu
e pasa con las otras variables de estado?
z = f0 (z, e, w, r)
= A + Bs , (A es Hurwitz )
s = a () (e) sat s + () ,
h
= e0, , e1
iT
1 (kzk) V1 (z, w, r)
2 (kzk)
V1
f0 (z, e, w, r)
3 (kzk) , kzk
(kzk)
z
V2 () = T P , P A + AT P = I
n
= {|s| c} V2
c2
o
1
{V1 c0}
= {|s| c} V2
c2
o
1
{V1
2 (
(2))}
Parte II
Observaci
on
Captulo 6
Introducci
on
El objetivo de esta parte del curso es dar una perspectiva acerca del problema de observaci
on en control y los m
etodos m
as importantes. Se hace
una selecci
on personal del problema y de las soluciones.
Nos restringiremos a una visi
on determinstica, excluyendo la importante
perspectiva de los sistemas estoc
asticos.
6.0.1.
Formulaci
on del problema
en d
onde x es el estado, u corresponde al vector de entradas medidas, d
corresponde al vector de entradas no medidas, p es el vector de par
ametros
desconocidos, y es el vector de variables de salida medidas y z es una
funci
on del estado que se quiere estimar.
El problema general de observaci
on (no estoc
astica y sin perturbaciones
en la medici
on) se puede formular de la siguiente manera:
Observabilidad: Dado un intervalo de tiempo t [t0, t0 + T ] , T > 0,
es posible determinar unvocamente el estado inicial z0 = g (t0, x0)
utilizando la indormaci
on disponible (u, y)?
Observador: Existe un sistema din
amico
= ()
que estime asint
oticamente (en t. finito) (aproximadamente...) a z?
6.0.2.
Motivaci
on
5. La eliminaci
on/sustituci
on/robustificaci
on de sensores costosos
6.0.3.
Organizaci
on del curso
3. M
etodos de dise
no para sistemas din
amicos no lineales
a) M
etodos por aproximaci
on (Linealizaci
on) (Ej. EKF)
b) M
etodos por transformaci
on
1) Uso de difeomorfismos
2) Uso de inmersiones
c) M
etodos por interconexi
on
Captulo 7
Observabilidad
7.1.
Sistemas est
aticos o sin memoria
Se el sistema est
atico (consideramos el caso sin ruido y sin incertidumbres)
f : [0, ) Rn Rq
y (t) = f (t, x (t)) , x Rn, y Rq , t 0
donde se desea estimar la variable (se
nal) x a partir de las mediciones de
la variable (se
nal) y. Ejemplo: recuperar la im
agen tridimensional a partir
de sus proyecciones bidimensionales (camaras).
Existen dos situaciones (extremas) esencialmente diferentes:
x (t) = x0 constante: Entonces las observaciones y (t) en distintos instantes de tiempo se complementan para determinar el valor de x0.
Es claro que las condiciones bajo las cuales podemos determinar a x (t)
a partir de y (t) deben ser muy distintas en ambos casos. Las situaciones
intermedias son mezclas de las situaciones extremas consideradas.
7.1.1.
Relaci
on: Una relaci
on R es un subconjunto del conjunto producto X Y .
Se dice que x est
a relacionado con y si (x, y) R.
Funci
on: Una funci
on (mapa) f es una relaci
on con dos propiedades adicionales:
1. x X , y Y tal que (x, y) f
2. Para cada x X existe un u
nico y Y tal que (x, y) f
Por esta raz
on se escribe f : X Y y entonces y = f (x)
Una relaci
on R en X, Y se puede ver como una funci
on r : X
subconjuntos (Y ) o una funci
on multivaluada.
Relaci
on inversa La inversa de R (denotada como R1) es la relaci
on
definida como el subconjunto de Y X tal que (y, x) R1 si y s
olo
si (x, y) R
N
otese que:
La inversa de cualquier relaci
on siempre existe y es una relaci
on.
La inversa de una funci
on f siempre existe, pero en general f 1
no es una funci
on, sino una funci
on multivaluada (relaci
on)!
Funci
on inyectiva: f : X Y es inyectiva si [y = f (x1) y = f (x2)] =
x1 = x2
Funci
on sobreyectiva: f : X Y es sobreyectiva si y Y existe al
menos un x X tal que y = f (x)
Funci
on biyectiva: f : X Y es biyectiva si es inyectiva y sobreyectiva.
La relaci
on inversa f 1 es una funci
on si y solo si f es biyectiva
Si f es inyectiva entonces su inversa f 1 : Y X no es una
funci
on. Pero en un dominio restringido f 1 : f (X) X es una
funci
on.
7.1.2.
Si el mapa (deformaci
on) f : Rn Rq no cambia con el tiempo
y (t) = f (x (t)) , x Rn, y Rq
Caso Lineal
Si f : Rn Rq es lineal, entonces
y (t) = Ax (t) , x Rn, y Rq
d
onde A es una matriz constante de dimensi
on q n.
Teorema 92 f es inyectiva si y s
olo si
los vectores columna de A son linealmente independientes
m
rango (A) = {# de vectores columna de A linealmente independientes} = n
m
rango (A) = {# de vectores fila de A linealmente independientes} = n
Prueba. =:
Proposici
on 93 Observabilidad: Se puede determinar unvocamente x a
partir de y si y s
olo si A es inyectiva.
C
omo se puede calcular en este caso a x? Consideremos dos casos:
Caso cuadrado: q = n
inyectiva, ser
a invertible (regular). Asi que en este caso
x (t) = A1y (t)
Caso no cuadrado: q 6= n
La matriz
1
T
A A
AT
1
T
A A
AT y (t)
f (
x)
Jf (
x) =
x
es regular (= invertible) entonces f es invertible localmente y la inversa es
contnuamente diferenciable.
Este Teorema nos permite obtener condiciones suficientes de observabilidad local para nuestro problema:
Teorema 95 Bajo las condiciones del Teorema anterior dada una se
nal
y (t) cercana a y (ky (t) yk ) entonces existe una u
nica x (t) cercana
ax
(kx (t) x
k ) tal que y (t) = f (x (t)).
7.1.3.
x (t) arbitraria
El valor de x (t) debe ser recuperado de la medici
on en el mismo instante
de tiempo y (t).
Teorema 97 f es inyectiva si y s
olo si los vectores columna de A son
linealmente independientes t 0
Proposici
on 98 Observabilidad: Se puede determinar unvocamente x a
partir de y si y s
olo si A (t) es inyectiva t 0
y la matriz
1
T
A A
AT
AT
(t) A (t)
AT (t) y (t)
es la Moore-Penrose seudoinversa de A.
x (t) = x0 constante
Este es un caso m
as interesante, ya que las observaciones y (t) en distintos
instantes de tiempo se complementan para determinar el valor de x0.
Como todos los valores de y (t) en el intervalo de tiempo t [t0, t1] son
consecuencia de la misma x0, entonces
y (t) = f (t, x0) , x0 Rn, y (t) Rq , t 0
puede verse como un mapa F que le asigna a x0 la se
nal en el tiempo y (t)
con t [t0, t1], es decir
y[t0,t1] = F (x0)
As que el dominio de este mapa es x Rn pero su codominio no es Rq sino
las se
nales de tiempo en Rq , que es un espacio de dimensiones infinitas.
Caso Lineal
Si f es lineal, entonces
y (t) = A (t) x0 , x0 Rn, y (t) Rq
d
onde A (t) es una matriz variante en el tiempo de dimensi
on q n. Una
forma de determinar la inyectividad del operador F correspondiente es la
siguiente:
1. Premultiplicar la ecuaci
on por la transpuesta de A (t)
AT (t) y (t) = AT (t) A (t) x0
AT (t) y (t) dt =
Z t
1
t0
AT (t) A (t) dt x0
Rt
y s
olo si la matriz cuadrada t01 AT (t) A (t) dt es positiva definida. En
este caso la matriz es regular (invertible).
Comentario 101 N
otese que en este caso, a diferencia del caso anterior,
no se requiere que q n, es decir, que el n
umero de mediciones sea
mayor o igual que el n
umero de inc
ognitas. Una soluci
on de esta aparente
q
contradicci
on se obtiene al notar que Y[t ,t ] es de dimensi
on infinita (para
0 1
todo q), as que el n
umero de mediciones es en cualquier caso mayor que
el n
umero de inc
ognitas (de dimensi
on finita n).
Ejemplo 102 Sea el sistema
y (t) =
t t2
"
x1
x2
, x R2, y (t) R
Z T
1T 4
4
1T 5
5
1
es 15
1
16
T 8.
Proposici
on 103 Observabilidad: Se puede determinar unvocamente x0
a partir de y[t0,t1] si y s
olo si F es inyectivo.
C
omo se puede calcular en este caso a x?
Despejar a x0
x0 =
Z
t1
t0
AT (t) A (t) dt
!1 Z
t1
t0
AT (t) y (t) dt
La idea de Linealizaci
on utilizada en el caso anterior (en dimensiones finitas) para asegurar inyectividad local de un mapa no lineal puede ser exq
tendido al caso de un mapa no lineal F : Rn Y[t ,t ], pero el resultado
0 1
es un tanto m
as t
ecnico.
Captulo 8
Observabilidad de Sistemas
Din
amicos Lineales
Consid
erese un sistema lineal variante en el tiempo (SLVT)
(
L :
8.1.
Soluci
on de la ecuaci
on diferencial
La ecuaci
on diferencial tiene una soluci
on u
nica para cada entrada u (t) y
para cada condici
on inicial x (t0) = x0, que se puede escribir explcitamente
como
R
para enfatizar la dependencia del estado actual x (t) del estado inicial y de
la entrada.
N
otese que la soluci
on t, t0, x0, u[t0,t] es
1. Lineal en x0
2. Lineal en u (t)
3. La suma de la soluci
on a x0 y a u (t)
8.2.
La matriz de transici
on de estado
4.
(t,t0 )
t
5. Si A es constante
(t, t0) = eA(tt0)
d
onde la matrix exponencial est
a dada por
eAt
X
1
k=0
8.3.
k!
Ak tk
1 2 2
= I + At + A t +
2
Problema de Observabilidad
Cu
ando es posible determinar el estado inicial x0 si se miden y (t) y
u (t) en el intervalo de tiempo t [t0, t1]?
Aunque en realidad usualmente nos interesa determinar el estado actual x (t) si se puede determinar a x0 entonces el estado actual se puede
determinar de la expresi
on
x (t) = (t, t0) x0 +
Z t
t0
(t, ) B ( ) u ( ) d
8.4.
Determinaci
on de la Observabilidad
De la soluci
on general se puede escribir
y (t) C (t)
Z t
t0
N
otese que el lado izquierdo es conocido y en el lado derecho la inc
ognita
entra linealmente. De los resultados del captulo anterior se obtiene que
Teorema 104 Se puede determinar unvocamente a x0 a partir de y[t0,t1]
y u[t0,t1], es decir, el sistema es observable, si y s
olo si la matriz cuadrada
M (t1, t0) =
Z t
1
t0
N
otese que la observabilidad del sistema lineal no depende de la entrada seleccionada, as que se puede elegir por simplicidad a u (t) = 0.
Esto es cierto para cualquier sistema cuya soluci
on se pueda expresar
como la suma de un t
ermino dependiente solo de x0 y otro dependiente
solo de u (t).
8.5.
Consid
erese un sistema lineal invariante en el tiempo (SLIT) (consideramos
u (t) = 0 sin p
erdida de generalidad)
x (t) = Ax (t) , x (0) = x0
y (t) = Cx (t)
con A, C constantes. La salida se puede escribir explcitamente como
y (t) = CeAtx0
Para establecer observabilidad se utiliz
o un m
etodo que usa la operaci
on
de integraci
on, para combinar la informaci
on contenida en cada instante
(t)
=
CA
0
dt2
...
dk y (t)
(k) (t) = CAk eAtx
=
y
0
dtk
Si se eval
uan las ecuaciones en un instante de tiempo, por ejemplo t = 0,
se obtiene (e0 = I)
y (0)
y (0)
y (0)
...
y (k) (0)
CA
= CA2
...
CAk
| {z
Ok
x
0
Recordando el an
alisis del captulo anterior para este caso se puede concluir
que
C
CA
CA2
...
CAn1
=n
Z t
1
t0
T (tt ) T
A
0 C CeA(tt0 ) dt
e
sea positiva definida para cualesquiera t0 < t1. En este caso la matriz es
regular (invertible).
Otra forma de caracterizar la observabilidad de la pareja (C, A) es el denominado criterio de Hautus-Belevitch-Popov: El sistema es observable si
y s
olo si
"
rango
8.6.
sI A
C
= n , s C .
L :
El sistema
D
L
es el sistema dual de L.
D
Teorema 106 L es observable si y s
olo si D
L es controlable. L es
observable si y s
olo si L es controlable.
Esta relaci
on es v
alida para sistemas variantes en el tiempo, pero es un
tanto m
as sutil.
8.7.
Escribiendo la ecuaci
on, separando los t
erminos conocidos de los desconocidos
x (t) f (t, x (t) , u (t)) = g (t, x (t) , u (t)) p ,
Z t
1
t0
Proposici
on 107 Se pueden determinar unvocamente los par
ametros p en
el intervalo [t0, t1] si y s
olo si la matriz
Z t
1
t0
con el fen
omeno conocido de las condiciones de excitaci
on persistente para
la identificaci
on de sistemas.
Captulo 9
Observabilidad de Sistemas
Din
amicos No Lineales
Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . Se asumen conocidas las funciones
f , h y u (t) e y (t) se pueden medir.
9.1.
Soluci
on de la ecuaci
on diferencial
La ecuaci
on diferencial tiene una soluci
on u
nica para cada entrada u (t) y
para cada condici
on inicial x (t0) = x0, que generalmente es imposible de
expresar analticamente.
Es u
til representar la soluci
on como
9.2.
La funci
on de transici
on de estados
2. t, t1, t1, t0, x0, u[t0,t1] , u[t1,t] = t, t0, x0, u[t0,t] para todos
los valores de t0 t1 t.
9.3.
Problema de Observabilidad
9.4.
Determinaci
on de la Observabilidad
De la soluci
on general se puede escribir
Esta interpretaci
on, junto con los resultados del captulo 1 nos permiten
afirmar
Teorema 108 En el intervalo de tiempo [t0, t], dada una entrada u[t0,t], se
puede determinar unvocamente a x0 a partir de y[t0,t1], es decir, el sistema
es observable para la entrada u[t0,t], si y s
olo si el mapa Hu[t ,t] (x0) is
0
inyectivo.
N
otese que la observabilidad del sistema no lineal depende, en general, de
la entrada seleccionada!
x 1
x 2
"
=
y=
1 u (t)
0 1
1 0
"
#"
x1
x2
x1
x2
1 0
1 1
=2
1 0
1 0
=1<2
9.5.
ecuaciones se tomar
an derivadas temporales.
y (t) = h (x (t))
d
h (x)
h (x)
y (t) = h (x (t)) =
x (t) =
f (x) := Lf h (x)
dt
x
x
Lf h (x)
Lf h (x)
y (t) =
x (t) =
f (x) := L2f h (x)
x
x
...
y (k) (t) =
Lk1
f h (x)
x
x (t) =
Lfk1h (x)
x
obtiene
y (0)
y (0)
y (0)
...
y (k) (0)
h (x0)
Lf h (x0)
L2f h (x0)
...
Lkf h (x0)
:= ok (x0)
Recordando el an
alisis del primer captulo para este caso se puede concluir
que
Es posible determinar x0 unvocamente de esta ecuaci
on si y
s
olo si para alg
un valor de k el mapa de observabilidad (no lineal)
ok (x0) es inyectivo.
Se puede ir aumentando el valor de k paulatinamente, hasta que se cumpla
la condici
on. Si nunca se cumple, hay alg
un valor de k para detenerse?
NO
Se obtiene asi una condici
on suficiente de observabilidad
x 1
x 2
"
x2
0
y = x31
El mapa de observabilidad es
"
o1 (x) =
x31
3x21x2
o3 (x) =
x31
3x2x2
1
6x x2
1 2
6x32
3
x
12
o2 (x) = 3x1x2
6x1x22
3
x1
3x2
x
1 2
6x1x2
2
ok (x) =
6x3
N
otese que o1 (x) no es inyectivo, ya que o1
...
0 1
= o1
0 2
Igual sucede con o2 (x). Pero o3 (x) si es inyectivo, por lo que el sistema
es globalmente observable.
9.6.
Z t
1
t0
Captulo 10
Dise
no de Observadores para
Sistemas Lineales
Hasta ahora se ha discutido la posibilidad (te
orica) de determinar el estado
inicial de un sistema din
amico a partir del conocimiento perfecto del modelo
y de las se
nales de entrada y de salida. Si un sistema es (localmente)
observable entonces en principio es posible recuperar (en tiempo finito) el
valor del estado inicial, con lo que se puede determinar perfectamente su
valor actual.
Aunque la inversi
on del mapa de observabilidad constituye una posibilidad
de recuperar el valor del estado, es deseable y preferible en control, entre
otras razones porque se introduce retroalimentaci
on, la utilizaci
on de algoritmos recursivos de estimaci
on u observadores. Un observador (asint
otico
de estados) para el sistema (planta)
(
L :
10.1.
N (t, t0) ,
Z t
t0
(1)
T (, t) C T ( ) C ( ) (, t) d
D
onde N (t, t0) es la matriz de observabilidad (de primera clase), an
aloga
Z t
t0
De (1) se puede obtener x (t) en cuanto N (t, t0) sea regular. Como
aqu nos interesa obtener una versi
on recursiva, procederemos de la siguiente manera, en cuatro pasos:
10.1.1.
luego
dT (t, t0) N (t, t0) (t, t0)
dM (t, t0)
=
dt
dt
dT (t, t0)
dN (t, t0)
=
N (t, t0) (t, t0) + T (t, t0)
(t, t0) +
dt
dt
d (t, t0)
+ T (t, t0) N (t, t0)
dt
"
#
N (t, t0)
T
T
= (t, t0) A (t) N (t, t0) +
+ N (t, t0) A (t) (t, t0)
t
por lo tanto
dN (t, t0)
= AT (t) N (t, t0)N (t, t0) A (t)+C T (t) C (t) , N (t0, t0) = 0 .
dt
10.1.2.
10.1.3.
Como
N 1 (t, t0) N (t, t0) = I
y utilizando la ecuaci
on diferencial para N (t, t0) se sigue que
dN 1 (t, t0)
dN (t, t0) 1
1
= N (t, t0)
N (t, t0)
dt
dt
1
= N (t, t0) AT (t) N (t, t0) N (t, t0) A (t) +
+C T
es decir,
dN 1 (t, t0)
= N 1 (t, t0) AT (t) + A (t) N 1 (t, t0)
dt
N 1 (t, t0) C T (t) C (t) N 1 (t, t0)
10.1.4.
Si se escribe x
(t) para el estimado de x (t)
dN (t, t0)
d
x (t)
z (t) =
x
(t)+N (t, t0)
= AT (t) N (t, t0) x
(t)+C T (t) y (t) ,
dt
dt
entonces
d
x (t)
= A (t) x
(t) + N 1 (t, t0) C T (t) (y (t) C (t) x
(t)) .
dt
10.1.5.
Filtro de Kalman
Una deducci
on m
as completa nos lleva al Filtro de Kalman para la planta
(
Ln :
d
onde
E {x (t0)} = 0
n
= P0 > 0
(t) = 0
) wT
(t) = 0
v (t) wT
( ) = 0
E x (t0
n
E x (t0
E
) vT
Q (t) = QT (t) 0
R (t) = RT (t) > 0
est
a dado por
d
x
(t) = A (t) x
(t) + B (t) u (t) + H (t) (y (t) C (t) x
(t)) , x
(t0) = 0
dt
d
P (t) = P (t) AT (t) + A (t) P (t) P (t) C T (t) R1 (t) C (t) P (t) + Q (t) ,
dt
H (t) = P (t) C T (t) R1 (t) ,
P (t0) = P0 > 0
Aqui
n
P (t) = E [x (t) x
(t)] [x (t) x
(t)]
N
otese que el Filtro (o el observador) tienen una estructura muy peculiar:
consisten en una copia de la planta con un t
ermino de inyecci
on de salida,
que es la diferencia entre la salida de la planta y la salida estimada, multiplicada por una ganancia. Esta ganancia se calcula mediante la matriz de
covarianza del error de observaci
on, que satisface una Ecuaci
on Diferencial
de Riccati.
Ecuaci
on Diferencial de Riccati
d
P (t) = P (t) AT (t)+A (t) P (t)P (t) C T (t) R1 (t) C (t) P (t)+Q (t) , P (t0)
dt
Si (A (t) , C (t)) es uniformemente observable, entonces P (t) existe para
todo t t0 y satisface
0 < p1I P (t) < p2I = 0 < p3I P 1 (t) < p4I
V = e P e + e P e + e
P e
dt
Recuerdese que
dP (t) 1
d 1
1
P (t) = P (t)
P (t)
dt
dt
entonces
V = eT (A HC)T P 1e + eT P 1 (A HC) e + eT P 1 + T P 1e
dP 1
P e
eT P 1
dt
dP 1
V = eT (A HC)T P 1 + P 1 (A HC) P 1
P
e+
dt
+ 2eT P 1
dP
V = eT P 1 P (A HC)T + (A HC) P
dt
+ 2eT P 1
V = eT P 1 P A P C T R1C
+ 2eT P 1
P 1e+
dP
+ A P C T R1C P
dt
dP
T
1
T
T
1
T
1
V =e P
P A + AP P C R CP P C R CP
dt
+ 2eT P 1
P 1e+
P 1e+
dP
T
1
V = e P
P AT AP + P C T R1CP P 1e eT C T R1Ce+
dt
+ 2eT P 1
10.2.
El observador de Luenberger
L :
L :
dx
dt (t)
= A (t) x
(t) + B (t) u (t) + H (t) [y (t) y (t)] , x
(t0) = x
0
y (t) = C (t) x
(t)
que tiene otra vez la estructura de ser una copia de la planta modificada
por una inyecci
on de salida multiplicada por una ganancia. Esta ganancia
H (t) es el u
nico par
ametro a dise
nar en el observador, y debe seleccionarse
para satisfacer la condici
on de convergencia.
El error de estimaci
on de estados
e (t) = x
(t) x (t)
satisface la ecuaci
on
e (t) = [A (t) H (t) C (t)] e (t) , e (t0) = x
(t0) x (t0)
(2)
10.2.1.
Asignaci
on de polos
Si la pareja (C, A) es observable, entonces se pueden asignar arbitrariamente los valores propios de (A HC) mediante alg
un algoritmo de asignaci
on de polos. Por ejemplo, la F
ormula de Ackermann para sistemas con
una sola salida.
Soluci
on de un problema de LQR
10.3.
El principio de separaci
on lineal
Una utilizaci
on tpica de un observador de estados es en la implementaci
on
de un control dise
nado suponiendo que se pueden medir todos los estados.
Qu
e se puede asegurar en este caso acerca del lazo cerrado a trav
es del
observador? En el caso lineal se cuenta con un resultado muy satisfactorio
en este sentido: el teorema o principio de separaci
on.
Sup
ongase que se tiene un sistema lineal
(
L :
LSC :
L :
dx
dt (t)
= A (t) x
(t) + B (t) u (t) + H (t) [y (t) y (t)] , x
(t0) = x
0
y (t) = C (t) x
(t)
d
(t) = A (t) x
(t) + B (t) u (t) + H (t) [y (t) y (t)] , x
(t0) = x
0
dt x
LOC :
y
(t) = C (t) x
(t)
La din
amica de este sistema puede ser reescrita en t
erminos del error de
observaci
on como
(
LOC :
o en forma matricial
(
LOC :
d
dt
"
x (t)
e (t)
"
#"
x (t)
e (t)
A BK BK
0
A HC
#)
= {A BK} {A HC}
Captulo 11
Dise
no de observadores para
sistemas no lineales:
M
etodos por aproximaci
on
(linealizaci
on)
M
etodos por aproximaci
on (linealizaci
on)
Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . Todos estos m
etodos se basan en
aproximar al sistema no lineal por uno lineal, obtenido de la linealizaci
on
de este en un punto de operaci
on o a lo largo de una trayectoria.
11.1.
Linealizaci
on en un punto de operaci
on
Basados en la linealizaci
on se pueden construir dos observadores:
1. Un observador lineal
2. Un observador no lineal
11.1.1.
Observador Lineal
[y (t) y (t)] , x
(0) = x0
(A HC) es Hurwitz
operar
a aproximadamente bien para el sistema no lineal, siempre y cuando
sus trayectorias permanezcan cerca del punto de operaci
on, es decir, para
valores peque
nos de kx (0)k, k
x (0)k, ku (t)k.
dx
x (t) + Bu (t) + H
dt (t) = A
u (t) = K x
(t)
u (t) = u
Kx
(t)
[y (t) C x
(t)] , x
(0) = x0
(A HC) es Hurwitz
"
x (t)
x
(t)
"
A BK BK
0
A HC
#"
x (t)
x
(t)
11.1.2.
Observador No Lineal
N L :
dx
dt (t)
= f (
x (t) , u (t)) + H [y (t) y (t)] , x
(t0) = x
0
y (t) = h (
x (t))
x
=x
x
d
:
x
(t) = g (
x (t) , x (t) , u (t)) , x
(t0) = x
0 x0
dt
d
onde
g (
x, x, u) , f (x + x
, u) f (x, u) + H [h (x) h (x + x
)]
que satisface
g (0, x, u) = 0 , x, u
Se puede verificar (hacerlo!) que la linealizaci
on del sistema error de observaci
on alrededor del punto de equilibrio
x=x
, u=u
, x
=0
es
d
x
= (A HC) x
dt
que es exponencialmente estable (por el dise
no de H). Entonces por el
Teorema de Linealizaci
on de Lyapunov este observador operar
a aproximadamente bien para el sistema no lineal, siempre y cuando sus trayectorias permanezcan cerca del punto de operaci
on, es decir, para valores
peque
nos de k
x (0)k, kx (t) x
k, ku (t) u
k.
Ejercicio 113 Qu
e ocurre con el controlador implementado utilizando este
observador?
11.2.
Linealizaci
on a lo largo de una trayectoria
= f (
x (t) , u
(t)) ,
y (t) = h (
x (t))
entonces se puede obtener una aproximaci
on lineal del sistema para cuando
la entrada, la salida y el estado se encuentren cerca de sus valores de
operaci
on. Si definimos las desviaciones de estas variables como
x (t) = x (t) x
(t) , y (t) = y (t) y (t) , u (t) = u (t) u
(t) ,
La linealizaci
on es
x (t) = A (t) x (t) + B (t) u (t) , x (t0) = x0
y (t) = C (t) x (t)
f (
x(t),
u(t))
f (
x(t),
u(t))
h(
x(t))
A (t) =
,
B
(t)
=
,
C
(t)
=
x
u
x
que es un sistema lineal variante en el tiempo. Si el sistema Linealizado es
observable, entonces el sistema no lineal ser
a localmente observable en una
vecindad de x
(t), y un observador construido para el sistema linealizado
operar
a aproximadamente bien para el sistema no lineal, siempre y cuando
sus trayectorias permanezcan cerca de la trayectoria de referencia.
11.2.1.
En particular, la aplicaci
on del dise
no del Filtro de Kalman junto con la
linealizaci
on lleva al Filtro de Kalman Extendido, uno de los filtros m
as
utilizados en la pr
actica. Su estructura es la siguiente
(
dx
(t) = f (
x (t) , u (t)) + H (t) (y (t) h (
x (t))) , x
(t0) = x
0
dt
T
1 (t)
P
C
(t)
h (
A (t) = f (
x
(t)
,
u
(t))
,
C
(t)
=
x (t))
x
x
Resolver la ecuaci
on diferencial de Riccati
N
otese que la ecuaci
on de Riccati y la ecuaci
on del observador deben ser
resueltas simult
aneamente, ya que A (t) y C (t) dependen de (
x (t) , u (t)).
Convergencia
= f (
x, u) f (x, u) + H (h (x) h (
x)) + , x
(t0) = x
0
H = P C T R1
d P = P AT + AP P C T R1CP + Q
dt
= Hv w
f (
h (
A (t) = x
x (t) , u (t)) , C (t) = x
x (t))
Si se asume que x (t), u (t), H (t), v (t), w (t) son acotadas y que f y
h son dos veces contnuamente diferenciables, entonces, se puede escribir
como (haci
endo un desarrollo en series de Taylor alrededor del punto de
equilibrio x
= 0)
dx
dt
(0, t) = 0
y d
onde
k (
x, t)k k1 k
xk2 , k (t)k k2 .
f (
x, u) f (x, u) A (t) x
= f (
x, u) f (
xx
, u) A (t) x
Z1
f (
x
x, u) d
x
f (
x (t) , u (t)) x
x
x
0
Z1
=
0
Z1
=
0
f (
x
x, u)
f (
x (t) , u (t)) d
x
x
x
f (
x
x, u)
f (
x (t) , u (t)) d
x
x
x
fi (
x
x, u)
fi (
x (t) , u (t)) =
x
x
Z1
0
2
fi (
x
x, u) d x
2
x
y por lo tanto
kf (
x, u) f (x, u) A (t) x
k k11 k
xk2 .
Los mismos argumentos conducen a que
kH (t) C (t) x
H (h (
x) h (x))k k12 k
xk2 ,
y por lo tanto
k (
x, t)k k1 k
xk2 .
que es decreciente y positiva definida si la pareja (A (t) , C (t)) es uniformemente observable. Entonces
dP
V = x
T P 1 P AT + AP P C T R1CP P C T R1CP
P 1x
+
dt
+ 2
xT P 1 ( (
x, t) + )
=
xT P 1QP 1x
x
T C T R1C x
+ 2
xT P 1 (
x, t) + 2
xT P 1
c1 k
xk22 + c2 k
xk32 + c3 k
xk2 kk2
Qu
e se puede decir del control en lazo cerrado con este observador?
Captulo 12
Dise
no de observadores para
sistemas no lineales:
M
etodos exactos
12.1.
Linealizaci
on exacta del error de observaci
on
Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . La idea b
asica del m
etodo de
linealizaci
on exacta del error de observaci
on [9, 26, 27, 52] es buscar una
transformaci
on de los estados y de las salidas
= T (x)
= (y)
tales que sean difeomorfismos, es decir, que sean invertibles y que tanto
la transformaci
on como la inversa sean diferenciables, y que el sistema en
(1)
, (t0) = 0
El error de observaci
on (e = ) en las nuevas coordenadas est
a dado
por
e (t) = (A HC) e (t)
T 1
(t)
El problema m
as difcil en el m
etodo consiste en encontrar las tranformaciones T y , si es que estas existen. Desafortunadamente, las condiciones
de existencia de tales transformaciones son tan fuertes, que s
olo pocos
sistemas pueden ser transformados de esta manera. As que este m
etodo
solo puede ser aplicado a una peque
na clase de sistemas.
12.1.1.
x (0) = x0 , y = h (x) ,
(2)
d
onde x Rn, u Rp, y R, f , g son campos vectoriales suaves con
f (0) = 0 y g (x, 0) = 0, x, y h es una funci
on suave con h (0) = 0.
Teorema 115 Existe un difeomorfismo local T () en una vecindad U0 del
origen que transforma al sistema (2) a la forma (1) si y s
olo si en U0:
(x)
x
=n,
(ii)
adif
r,
j
adf
(iii) g ,
d
onde
j
adf
r =0 , 0i , j n1 ,
r = 0 , 0 j n 2 , u Rm
(x) =
h (x) , Lf h (x) ,
iT
n1
Lf h (x)
y r es el u
nico campo vectorial que es soluci
on de
h
iT
n1
Lr Lf h (x)
h
i
(x)
Lr h (x) , Lr Lf h (x) ,
r (x) = 0 0 1
=
x
(3)
El difeomorfismo es global U0 = Rn, si y s
olo si las condiciones (i)-(iii) se
satisfacen en Rn y, adicionalmente,
i1
funci
on h a lo largo del campo vectorial f , y Lif h (x) = Lf Lf h (x) . La
diferencial dh de una funci
on suave h : U Rn Rh puede ser escrita en i
h(x)
coordenadas locales como un vector fila del gradiente h(x)
.
,
,
x1
xn
Para dos campos vectoriales f y g se define un nuevo campo vectorial meg
diante el par
entesis de Lie [f , g] = x
f f
x g, en coordenadas locales.
Para par
entesis de Lie repetidos el operador ad est
a definido como
ad0f
g=g ,
adif
g= f ,
adi1
f g
x =
1 (x1) + x2
f2 (x)
"
0
1
y = x1
Entonces
"
(x) =
h (x)
Lf h (x)
"
x1
1 (x1) + x2
1
0
(x)
= d1(x1)
1
x
dx1
"
(x)
rango
= 2 , x
x
(x)
r (x) =
x
"
0
1
r (x) =
= d1(x1)
1
dx1
"
0
1
1 "
"
#
#
"
#
1
0
1
0
0
0 = 0
=
r (x) = d1(x1)
d1 (x1 )
1
1
1
dx
1
1
dx1
1
f (x)
adf r = [f, r] =
r=
x
h
d1 (x1 )
1
fdx(x)
2
x1
f2 (x)
x2
"
adf r
r , adf r =
r = 2f2(x) 2f2(x)
x
x1 x2
x22
i
"
0
1
0
1
= f2(x)
x2
#
= 2f2(x)
x22
2f2 (x)
= 0 f2 (x) = 2 (x1) + x23 (x1)
r , adf r = 0
2
x2
i
"
r1 = (1)0 ad0f r = r =
"
0
1
1
3 (x1)
T (x)
[r1 , r2] = I
x
T1 (x)
x1
T (x)
2
x1
T1 (x) "
x2
T2 (x)
x2
0
1
1 3 (x1)
"
1 0
0 1
T1 (x)
x1
T (x)
2
x1
T1 (x)
x1
T (x)
2
x1
T1 (x)
x2
T2 (x)
x2
"
T1 (x)
x2
T2 (x)
x2
T1 (x) = x2
"
Z x
1
0
0
1
1 3 (x1)
#1
3 (x1) 1
1
0
3 () d
T2 (x) = x1
"
1
2
"
#
R x1
x2 0 3 () d
x1
"
y = 2
"
=
y=
12.1.2.
0 0
1 0
"
+
i
0 1
x2 , xn n (x)
iT
x (0) = x0 , y = x1 ,
d(y)
dy .
Los t
erminos de inyecci
on de salida en (1) se
"
x =
x2
x1 x2 x21 x22
"
x1
x1x2
u,
y = x1 ,
Este sistema es transformable a la forma (1)
"
0 1
0 0
y = z1 .
z =
"
z+
y u (
y + 1) ln |
y + 1|
ln |
y + 1| (1 + y) (1 + ln |
y + 1| + u)
z = T (x) =
exp (x1) 1
exp (x1) (x2 + 1) 1
"
x=
T 1 (z)
ln |z1 + 1|
z2 +1
z +1 1
, T : R2 (1, ) R
12.1.3.
Control retroalimentado
Sea
u = (x)
= A
x (t) + (y (t) , u (t)) + H (y (t) C x
(t)) , x
(0) = x
0
u = (
x)
El sistema Planta-Observador, en las coordenadas (x, e), con e = x
x el
error de observaci
on, est
a dado por
x = Ax + (y, (x + e)) , x (0) = x0
e = (A HC) e , e (0) = e0
o
x = Ax + (y, (x)) + [ (y, (x + e)) (y, (x))] , x (0) = x0
e = (A HC) e , e (0) = e0
Este es un sistema en cascada, d
onde
El origen del sistema maestro (error de observaci
on)
e = (A HC) e , e (0) = e0
es GEE (global y exponencialmente estable), y
El origen del sistema esclavo, sin la entrada del sistema maestro (e =
0), es decir, la planta controlada
x = Ax + (y, (x)) , x (0) = x0
es GAE (global y asint
oticamente estable).
12.2.
Linealizaci
on por inmersi
on
Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . La idea b
asica de este m
etodo
consiste en usar una inmersi
on de los estados en un espacio de dimensi
on
mayor
= T (x) , Rm , m > n
de tal forma que el sistema en las nuevas variables toma la forma
(t) = A (t) + ( (t) , u (t)) , (t0) = 0
(t) = C (t)
d (t)
dt
, (t0) = 0
El error de observaci
on (e = ) en las nuevas coordenadas est
a dado
por
e (t) = (A HC) e (t)
que es una din
amica lineal. Si (A HC) es Hurwitz, el estado del observador converge al verdadero valor del estado en forma exponencial. Un
estimado para el sistema original se obtiene seudo-invirtiendo la transformaci
on, es decir, haciendo una proyecci
on del estado Rm a x Rn
x
(t) =
TI
(t)
x2 x22
"
o1 (x) =
: no inyectivo
x1
o2 (x) =
x
: inyectivo
y + x3
2
2
3ay (3a + 1) y 2ax2
Entonces, si a 6= 0 el sistema es globalmente observable. Si a = 0 no hay
observabilidad, ya que hay indistinguibilidad.
dt
0
1
0
1
1
0
1
2 = 0
2
3
3
3a2 a (4 + 3a) (4a + 1)
h
i 1
y = 1 0 0 2
3
3a1 (3a + 1) 2 3
x
2 =
2a
12.3.
Transformaci
on a sistemas afines en los estados no medibles
Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
(4)
Si este es el caso, u (t) es tal que A (y (t) , u (t)) sea uniformamente acotada y la pareja (C, A (y (t) , u (t))) sea uniformamente observable, entonces
se puede construir un observador (tipo Kalman) para el sistema transformado como
T 1
(t)
El problema m
as difcil en el m
etodo consiste en encontrar las tranformaciones T y , si es que estas existen.
12.4.
on1 (x) =
h (x)
Lf h (x)
L2f h (x)
...
h (x)
Ln1
f
1. es un difeomorfismo global,
2. es globalmente Lipschitz.
Adem
as, que el sistema es observable globalmente para cualquier entrada
(uniformemente observable). Entonces, la transformaci
on de estados
= T (x) = on1 (x) ,
lleva al sistema a la forma
(t) = Ao (t) + ( (t) , u (t)) , (t0) = 0
(t) = Co (t)
d
onde
Ao =
Co =
0
0
...
0
0
1 0
0 1
... . . . ...
0 0
0 0
1 0 0
0
0
...
1
0
( , u)
1 1
2 (1, 2, u)
, (, u) = ( , , , u)
3 1 2 3
...
n (, u)
0 0
0 2 0
... ... . . . 0
0 0
0 n
, (t0) = 0
que converge exponencialmente si (Ao HoCo) es Hurwitz y es suficientemente grande. La velocidad de convergencia es proporcional a .
12.4.1.
Ejemplo de motivaci
on
Considere el sistema
x 1 = x2
x 2 = (x, u)
y = x1
Suponga que el control u = (x) estabiliza el origen de
x 1 = x2
x 2 = (x, (x)) .
Sea el observador
x
1 = x
2 + l1 (y x
1 )
x
2 = 0 (
x, u) + l2 (y x
1 )
d
onde 0 (x, u) es un modelo nominal de (x, u). El error de observaci
on
x
1 = x
1 x1 , x
2 = x
2 x2
x
1 = l1x
1 + x
2
x
2 = l2x
1 + (x, x
)
(x, x
) = 0 (
x, (
x)) (x, (
x))
"
l1
tal que A0 =
l2
transferencia de x
es
Dise
ne L =
"
l1 1
l2 0
1
Go (s) = 2
s + l1 s + l2
"
es Hurwitz. La matriz de
1
s + l1
Dise
ne L para hacer supR kGo (j)k tan peque
na como sea posible.
Elija
1
2
l1 =
, l2 = 2 , > 0
Go (s) =
(s)2 + 1s + 2
"
s + 1
N
otese que
lm Go (s) = 0 ,
el efecto de atenuaci
on es mayor para peque
nos valores de .
Defnase
x
1 = 1 , 2 = x
2
entonces
1 = 11 + 2
2 = 21 + (x, x
)
Luego:
2. decae m
as r
apidamente que un modo exponencial eat/, a > 0.
El fen
omeno de pico
x1 (0) 6= x
1 (0) = 1 (0) = O (1/)
La soluci
on contiene un t
ermino de la forma
1 at/
e
Ejemplo 122
x 1 = x2
x 2 = x32 + u
y = x1
x
2 = 12 (y x
1 )
u =
x32 x
1 x
2
An
alisis del sistema en lazo cerrado:
x 1 = x2
x 2 = (x, (x x
))
1 = 11 + 2
2 = 21 + (x, x
)
Figura 12.4: An
alisis del sistema en lazo cerrado: x 1 = x2 , x 2 =
(x, (x x
)) , 1 = 11 + 2 , 2 = 21 + (x, x
)
Cu
al es el efecto del ruido de medici
on?
2
2
(s) + 1s + 2
1 + (1/2) s
s
"
1
s
cuando 0
La diferenciaci
on amplifica el efecto del ruido de medici
on.
y = x1 + v , kn = sup |v (t)| < , kd = sup |
x1 (t)|
s
opt = O
kn
kd
t0
t0
12.4.2.
Estabilizaci
on
Sea
x = Ax + B (x, z, u)
z = (x, z, u)
y = Cx
= q (x, z)
u Rp , y Rm , Rs , x R , z R`
Ai =
Ci =
0
0
...
0
0
1 0
0 1
... . . . ...
0 0
0 0
1 0 0 0
0
0
...
1
0
i
, Bi =
i i
1i
, =
m
X
0
0
...
0
1
i1
i=1
Las variables medidas son y, . Esto sucede, por ejemplo, para sistemas
Sistemas mec
anicos y electromec
anicos
x 1 = x2
x 2 = g
(
z : x 3 =
kx
m 2
"
L0 ax23
2m(a+x1 )2
1
L ax x
Rx3 + 0 2 32 + u
L (x1)
(a + x1)
y = x1
= x3
Se proceder
a en dos pasos al dise
no de un control por retroalimentaci
on
de salida:
1. Dise
no de un controlador por retroalimentaci
on parcial del estado que
usa las mediciones de x y para estabilizar asint
oticamente el origen.
2. Se dise
na un observador de alta ganancia para estimar a x a partir de
y.
El controlador de estados puede ser un sistema din
amico de la forma
= (, x, )
u = (, x, )
d
onde y son funciones localmente Lipschitz en sus argumentos, en el
dominio de inter
es, y son funciones globalmente acotadas en x. Adem
as,
(0, 0, 0) = 0, (0, 0, 0) = 0. O, como caso particular del anterior, un
control est
atico de la forma
u = (x, ) .
El sistema en lazo cerrado con controlador de estados se escribe como
X = f (X ) , X = (x, z, )
El origen de X = f (X ) es asint
oticamente estable.
El controlador de salida se toma como
= (, x
, )
u = (, x
, )
d
onde x
es generada por el observador de alta ganancia
x
= A
x + B0 (
x, , u) + L (y C x
)
La ganancia del observador L es elegida como
i1/
i2/2
...
L = blockdiag [L1, , Lm] , Li =
i
1
i1/ i
ii /i
i 1
d
onde es una constante positiva a especificar y las constantes positivas
ij son elegidas de tal forma que
si + i1si1 + + ii1s + i i
sea Hurwitz. 0 (x, , u) is un modelo nominal de (x, z, u), que es globalmente acotado en x, y 0 (0, 0, 0) = 0.
Teorema 124 [25, Theorem 14.6](Principio de separaci
on no lineal).
Sup
ongase que el origen de X = f (X ) es asint
oticamente estable y R es
su regi
on de atracci
on. Sea S cualquier conjunto compacto en el interior
de R y sea Q cualquier subconjunto compacto de R. Entonces
1 > 0 tal que, para todo 0 < 1, las soluciones (X (t) , x
(t)) del
sistema en lazo cerrado, que se inician en S Q, est
an acotadas para todo
t 0.
An
alisis no local versus an
alisis local.
1. Recuperaci
on de la estabilidad exponencial.
2. Recuperaci
on de la regi
on de atracci
on en el sentido que se puede
recuperar cualquier conjunto compacto en su interior.
3. La soluci
on X (t) bajo control de salida se acerca a la soluci
on con
control de estados cuando 0.
Estabilizaci
on en = , = 0 . Un control por modos deslizantes es
a1 ( ) +
u = k sat
Sup
ongase que s
olo se mide :
2
=
+
= 0 , u + 2
u =
0 ,
a sin + cu
a1 +
u = k sat
o tambi
en
a1 ( ) +
u = k sat
12.5.
Observador Lipschitz
x (0) = x0
Captulo 13
Dise
no de observadores para
sistemas no lineales:
Dise
no disipativo de observadores
no lineales
Este m
etodo, propuesto hace un par de a
nos por el autor de estas notas
[31], y que incluye y generaliza diversos m
etodos en la literatura tiene como
idea b
asica la siguiente:
Sup
ongase que se tiene un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . Sup
ongase adem
as que despu
es
de aplicar alguna de las transformaciones anteriormente mencionadas el
sistema no alcanza la forma deseada. Para hacerlo concreto suponga que en
vez de obtener la forma para linealizar exactamente el error de observaci
on
(t) = A (t) + ( (t) , u (t)) , (t0) = 0
(t) = C (t)
13.0.1.
Preliminaries
In this work the stability properties of dissipative systems will be used for
the design of observers for systems that can be represented as the feedback
interconnection of a dynamical linear time invariant (LTI) system in the
forward loop and a memoryless nonlinearity in the feedback loop. From the
general dissipativity theory [47, 49, 50, 21, 25] the following results are of
relevance here.
x (0) = x0 , y = Cx , u = (t, y) , x Rn , u Rq , y Rm
(1)
v
w
#T "
Q S
ST R
#"
v
w
, v Rr , w Rs
(2)
P A + AT P
+ P , P B
BT P
0
"
C T QC
CT S
ST C
0.
(3)
T
T
T
T
K x+W u
K x+W u
xT P x, such that along any trajectory of the system V (x (t)) = (y (t) , u (t))
Z (x (t) , u (t)).
Definici
on 127 The nonlinear part of system (1), a time-varying memoryless nonlinearity : [0, ) Rm Rq , u = (t, y), piecewise continuous
in t and locally Lipschitz in y, such that (t, 0) = 0, is said to satisfy a
dissipative condition in with respect to the supply rate (u, y) (2), or
for short (Q, S, R)-D in , if
(u, y) = ( (t, y) , y) 0 , t 0 , y Rm ,
0, 12 I, 12
K1 + K1T
Lema 130 Consider the system (1). If the linear system (C, A, B) is R, S T , Q SSD, then the equilibrium point x = 0 of (1) is globally (locally) exponentially stable for every (Q, S, R)-D (in for some Rm) nonlinearity.
"
V =
x
u
"
#T "
P A + AT P
#T "
BT P
Q S
ST R
#"
PB
0
#"
x
u
"
#T "
C T RC
CT ST
SC
#"
V (x) V (x) ,
13.0.2.
z (0) = z0 , y = Cz , = Hz ,
(4)
where z Rn is the state, y Rp is the measured output, u Rm is
the input, and Rr is a (not necessarily measured) linear function of
the state. (y, u) is an arbitrary nonlinear function of the input and the
output. (, y, u) is a q-dimensional vector that depends on , y, u.
and are assumed to be locally Lipschitz in , y, u, so that existence
and uniqueness of solutions is guaranteed. It will be assumed that the
trajectories of interest of are defined for all the time, i.e. there are no
finite escape times.
An observer for system (4) is a dynamical system that has as inputs the
input u and the output y of , and its output z is an estimation of the
state z of . A full order observer for of the form
: z = A
z +L (
y y)+G (
+ N (
y y) , y, u)+ (y, u) , y = C z ,
= H z
(5)
is proposed, where matrices L Rnp, and N Rrp have to be designed.
(6)
: z = ALz + G ,
z (0) = z0 , = HN z , = (, , y, u) , (7)
Comentario 131 Note that when the plant is LTI (at least up to an
output injection term), then = 0, and the error dynamics is LTI and
autonomous, i.e. it does not depend on the plant state. The same is true
if is dependent on the output y, since in this case there exists a matrix
such that = F y, and there exists an N such that HN = H +N C = 0. In
these both cases detectability of the pair (A, C) is a necessary and sufficient
condition to construct an observer. However, in general, the error dynamics
(7) is not autonomous, but it is driven by the system (4) through the linear
function of the state = Hx. is therefore a time varying nonlinearity,
whose time variation depends on the state trajectory of the plant.
Suposici
on 132 in (7) is (Qi, Si, Ri)-dissipative (in ) for some finite set
of non positive semidefinite quadratic forms i (, z) = T Qi+2T Siz +
z T Riz 0, for all , y, u, for i = 1, 2, , M .
PM
i=1 i (Qi, Si, Ri )-dissipative (in
iT
: RnRm
(8)
with (0, u) = 0 for all u. Assume that each component
is (globally)
Lips
i
i
chitz, uniformly in u (or for u in a compact set). i.e. i x , u i y , u
(x, u) =
the Lipschitzcondition
on implies for each component of phi that
ki2
z12
+ + zi2
, i = 1, , n.
vectors of Rn, Ii = diag (Ii, 0ni), and Ip is the identity matrix of dimension p.
Teorema 134 Suppose that Assumption 132 is satisfied. If there are matrices L and N , and a vector = (1, , M ), i 0, such that
PM
i=1 i (Qi, Si, Ri ), then is a global (local) exponential observer for ,
i.e. there exist constants , > 0 such that for all z (0) (in a vicinity of
z = 0) k
z (t)k k
z (0)k exp (t).
T
Prueba. By definition of R , S , Q -SSD there exist a vector
(1, , M ), i 0, a matrix P = P T > 0, and > 0 such that
"
#
T
T
T
T
P AL + AL P + P + HN R HN , P G HN S
0.
GT P S HN
Q
(9)
V (e), with
The application of Lemma 130 leads immediately
to
V
r
V (e) = eT P e. Convergence follows with =
max (P )
, and
mn (P )
= 2 (P ) .
m
ax
13.1.
x (0) = x0 , y = h (x) ,
(10)
where the system (f, h) can be transformed into the observer normal form
(??) after a state transformation (??), and the full system is transformed
into an Approximate Nonlinear Observer Form (ANOF)
aonf : z = Aoz+G (, y, u)+ (y, u) ,
z (0) = z0 , y = Coz , = Hz ,
(11)
T (x)
output mapping x
= T 1 (
z ) is a (local or global) exponential observer for
the system, if T 1 is uniformly continuous.
This result includes the exact error linearization method (when = 0) but
it offers a greater flexibility: Since the decomposition (10) can be made
in many different ways, one can try different possibilities. Note that the
same idea can be used for the extensions of the exact linearization method
described in Remark ??.
13.2.
Examples
In this section some examples are given to illustrate how this method can
be applied and the advantages and flexibility it offers in the design of
nonlinear observers.
13.2.1.
Example 1
is not transformable into the observer form because of the cubic term.
Decomposing the system as
"
x =
x2
x1 x2 x21 x22
"
x1
x1x2
"
u+
0
x32
, y = x1 ,
it can be readily seen (see Example 12.1.2) that the first term can be
linearized by a state and an output transformation [27], given by
y = (y) = exp (y) 1 , y = 1 (
y ) = ln |
y + 1| , : R (1, ) ,
"
z = T (x) =
exp (x1) 1
exp (x1) (x2 + 1) 1
"
x = T 1 (z) =
ln |z1 + 1|
z2 +1
z +1 1
1
, T : R2 (1, ) R
In the new coordinates the system has the approximate observer form (11)
"
z =
0 1
0 0
(1+
y )2
"
z+
y u (
y + 1) ln |
y + 1|
ln |
y + 1| (1 + y) (1 + ln |
y + 1| + u)
(
y z2 )
y = z1 .
This system can be written in the form (4), and the error equation (7) is
given with
"
A=
(, , y) =
0 1
0 0
"
, G = HT =
h
0
1
"
, CT =
i
1
0
, (, y) =
3
3
(
+
)
, = z2 .
2
(1 + y)
(
y )3
(1 + y)
It is easy to check
that (,, y) = Q2 + 2S + R 2 0 for all with
2(1+
y)
so that is 0, 1, R
-dissipative. The observer design can be done if the
R
design inequality (9) is feasible. The inequality is satisfied, for example, for
l1 = 3R,
l2 = 2R
2. This observer is not global, because z1 has
N = 2R,
to be bounded, but there is no restriction on z2, and u.
13.2.2.
the control) that are uniformly observable for any input, defined in [16].
These systems can be transformed by the diffeomorphic observability map
(??), z = q (x), into the approximate observer normal form (11), where
the nonlinearity has the triangular structure given by (8) and, in general,
G = H = I and (y, u) = 0 [15, 16]. The HGO design is done for this
plant representation, and this design can be derived from the dissipative
design in the previous section.
Lema 137 Under the same assumptions as in [16] the high-gain observer
designed in that reference is a particular solution of Theorem 134.
Next it will be shown that the high-gain solution satisfies theorem 134.
By Hypothesis each component of (x, u) is globally Lipschitz, uniformly in u. Following Example 133 it is easy to show that (e, x, u) =
(x, u) (e + x, u) is low triangular and globally Lipschitz. This implies
that is (Qi, Si, Ri)-dissipative, i = 1, 2, , n, with (Qi, Si, Ri) =
bibT
i , 0, ki Ii , where ki > 0 is the Lipschitz constant of i , and the
other symbols are as in Example 133.
It is required to show that the high-gain solution [16], given by L =
Xg1C T , and P = Xg , that satisfies for some (high) gain g > 0
gXg + AT Xg + Xg A = C T C ,
(12)
satisfies Theorem 134, there exist = (1, , n), i > 0, and > 0
Pn
T = diag ( ), R =
such that (9) is satisfied,
where
Q
=
b
b
i
i
i
i=1
i
Pni
diag
j=0 nj knj , S = 0, A = Ao , C = Co , H = G = I, and
N = 0.
g, g 2,
, gn
it is obtained
gXg
CT C
+ Xg + R Xg
Xg
Q
0.
g, g 2,
, gn
g gC T C
+ +
1 R
1 Q
0 .
(13)
.
1
2i1
Selecting (positive) such that g Q = diag g
i = I ,then
P
ni 2(n(i+j))
1
(2i1)
i = g
and g R = diag
knj . Note that,
j=0 g
since in the last expression (i + j) n there is a finite limit lmg g1 R =
diag (ki). It follows then easily that for any > 0, and for g big enough the
inequality (13) is satisfied. This can be seen using the Schur complement
[10, Appendix A]: (13) is satisfied iff
1
g gC T C + + R + 2 0 .
g
Since is positive definite, i.e. > I for some > 0, the inequality is
satisfied for g big enough.
This result is interesting for different reasons: 1) It shows that the proposed method is always applicable when the high-gain methodology is. 2)
Moreover, it represents a generalization of the HG method, and can deliver a solution when the HG does not. 3) Since the HG represents only
one possible solution, the proposed method can find better solutions, and
is not constrained to high-gain ones. Moreover, other optimization and
design criteria can be included to find a better solution. 4) On the other
side, the HG method and the strong theoretical characterization of when
it is feasible, provides a class of systems for which the proposed method is
assured to deliver a solution. Since Theorem 134 does not give explicit conditions on the system for a solution to be feasible, the HG case shows that
it is possible to assure existence of solutions for a large class of systems.
5) A simple and immediate generalization of HG is to use the additional
injection depending on matrix N . 6) Since in the proposed method the
particular characteristics of the nonlinearities can be taken into account
using several supply rates, and not only the triangular and Lipschitzness
characteristics used by the HG method, it is expected that the system class
for which this method is applicable is much bigger, the conservativeness
of the results is reduced, and the quality of the results increased.
It can be shown [31] that the proposed method includes several other
design strategies proposed in the literature as the Circle Criterion Design
[3, 14] and the Lipschitz Observer Design [38, 46].
13.2.3.
x 1 = g (x2) u , x 2 = x1 x2 , y = x1 ,
where g (x2) is any globally Lipschitz nonlinearity, with Lipschitz constant
kg . This system is not observable for every input, since for u = 0 it is
detectable but not observable.
This system can be written in the form (4), and the error equation (7) is
given with
"
A=
0 1
1 1
"
, G=
CT
1
0
, H=
0 1 , (, u) = g () u ,
(, , u) = z + (g () g ( + )) u , = x2
(, , u) is globally Lipschitz in with constant k = kg |u|
+ 1, whenever
2
u is bounded. is therefore dissipative for (Q, S, R) = 1, 0, k . It is
13.3.
Separation Principle
stability of the closed loop is not assured, since the separation principle
is not valid in general for non linear systems. It is therefore surprising,
that under certain mild assumptions on the plant controller, dissipative
observers can be redesigned to assure the global stability of the closed
loop. The following results are in the same spirit and generalize the results
of [37, 4] for circle criterion observers.
13.3.1.
Plant-Observer representation
The closed loop dynamics, i.e. the dynamics of the plant and that of
the observer R , with state vector given by (x, x
), will be represented in
the coordinates (
x, e) by
R :
x
= A
x + G (
) + (t, y, (
x)) + (e, x
) ,
y
= Cx
,
= Hx
e = ALe + G , e (0) = e0
z = HN e , = (z, ) ,
(14)
(15)
where
(e, x
) = LCe G (N Ce,
) +
(16)
+ [ (t, y, (
x)) (t, y, (
x))]
is the interconnection term between the observation error and the observer dynamics (14). Note that when e = 0 then (0, x
) = 0, and since
(14) is a copy of the plant perturbed by , the behavior of (14) corresponds
to that of the plant with state controller, and so its equilibrium point at
(17)
L (W (x))
x Rn .
(18)
The inequality (17) is not restrictive, since it requires only that W (x) is
a Lyapunov function. Note that if W (x) is a Lyapunov function for f (x),
then so is L (W (x)) for any K function L (). However, this condition
is too weak since, as shown in [41, 45], there are systems that are GAS
and that can be destabilized by an arbitrarily small (in L1) perturbation.
To avoid this situation, inequality (18) is introduced. It means that there
is a Lyapunov function with bounded gradient. As it is shown in [2] this
condition assures the forward completeness of x = f (x), i.e. the existence
of trajectories for all the future time. As such, this condition is not restrictive. Moreover, if (18) is satisfied, system x = f (x) + d (t) is forward
complete for every bounded perturbation d (t) [2], and that x (t) 0 as
t when d (t) L1 [41]. The results of [41, 45] show that, in general,
condition (18) cannot be relaxed.
As a counterpart to the relaxation of the ISS property of the controlled
plant a strengthening of the convergence of the perturbation to zero is
required. As the previous discussion shows (t) given in (16) is required to
be in L1. The first term in (16) is clearly in L1 since e converges exponentially to zero (see (??)). The third term, depending on the input/output
injection nonlinearity, is in L1 if the following assumption is made on it.
Suposici
on 139 The function (t, y, u) is such that, for all y, y, u and
t0
k (t, y, u) (t, y, u)k (k
y yk)
for some class K function , which is differentiable at zero.
13.3.2.
Observer redesign
For this consider the error dynamics of the observer (7), where an additional nonlinear term, depending on measured signals and on the to be
compensated nonlinearity , will be added to the observer (5)
R :
x
= A
x + L (
y y) + G (
+ N (
y y)) +
+ (t, y, u) E (N y,
) ,
y
= Cx
,
= Hx
,
(19)
e = ALe G (HN e, ) + E ,
= (N y,
) ,
e (0) = e0
y
= Ce , w
= N y ,
(20)
where
(N y,
) = (
) (
+ N y) ,
and matrix E is to be designed. For simplicity of the presentation it will
be assumed that Assumption 132 is satisfied with M = 1, and that is
"
(; t) =
=
e = ALe + v ,
(21)
= e ,
v = (; t) ,
(z, )
(N y,
)
G E
"
, =
HN
NC
S,
R
-D, with
The composite nonlinearity (; , t) is Q,
"
=
Q
Q 0
0 Q
"
, S =
S 0
0 S
"
=
, R
R 0
0 R
+ 2 T S
+ T R
0.
This means that the supply rate $ (, ) , T Q
(II) R > 0 and the conditions of Theorem 134 are satisfied with (??) replaced
by
11 + 0 ,
where
(22)
"
11 =
T RH
P AL + AT
P
+
P
+
H
N
L
N
GT P SHN
"
C T N T RN C
0
T ST
P G HN
0
0
(23)
(24)
2. Consider the error equation (21) additively perturbed by signal (t), i.e.
p
e = ALe + v ,
= e ,
e (0) = e0
v = (; t) + (t) .
(25)
(25) is ISS with respect to this signal, and if (t) converges exponentially
to zero, so will do every signal in the system.
3. The signal $ (t) = $ ( ( (t) ; (t) , t) , (t)) satisfies for every plants
trajectory and every t 0, with V (e) = eT P e
Z t
0
11 + 12
T
Q
12
where
"
12 =
PE
0,
CT N T ST
0
(27)
e = (AL + aI) e + v ,
: = e ,
v = ( , t) ,
e (0) = e0
where
(; t) , exp (at) ( exp (at) , ) .
T
T
T
Q+2 Sz +z Rz
The equalities (, z) =
= exp (2at) T Q + 2T Sz +
exp (2at) (, z) 0 show that if a nonlinearity (z, t) is (Q, S, R)D, then its weighted counterpart (z, t) is (Q, S, R)-D too. Therefore
(, t) satisfies the same sector condition as (, t). Since satisfies
(27) it follows easily that satisfies also (27) with ( a) instead of .
T
Taking 0 < a < , and V (e) = eT
P e , where P = P > 0, as Lyapunov
function candidate, its derivative is V ( a) V (e). It follows that
ke (t)k ke (0)k exp (t). It is clear that (, t) 0, and so
13.3.3.
When the redesigned observer (19) is used instead of the observer (5) the
closed loop dynamics is given by (14) and (21), with a new given by
(e, x
) = LCe (G + E) (N Ce,
) +
(28)
+ [ (t, y, (
x)) (t, y, (
x))] .
The main result of this section is the following Theorem, that asserts, under the two previous Assumptions, the Global Asymptotic Stability (GAS)
Teorema 141 Suppose that the plant (4) satisfies Assumption 139, that
there exists a state feedback u = (x) as in Assumption 138 and that the
nonlinearities of the plant satisfy Assumption 132. Consider the observer
(19) designed in one of the following two forms:
Prueba. For both cases the estimation error dynamics converges exponentially, ke (t)k ke (0)k exp (t), with the same for any plant
trajectory. From Assumption 138, L (W (x)) is a Lyapunov function for
the state feedback controlled plant. Consider as Lyapunov function candidate for (14) v (
x) , L (W (
x)). Its derivative along the trajectories of the
system is
W (
x)
[f (
x) + (e, x
)]
x
L (W (
x))
)k k (e, x
)k .
k (e, x
v = L0 (W (
x))
k (N Ce,
)k dt (k(
x0, e0)k) ,
R
and, therefore, that 0 k (e, x
)k dt
(k(
x0, e0)k), for some K-function
.
This implies that (
x, e) = 0 is stable.
Moreover, since e (t) 0 the trajectories in the -limit set coincide with
those of the system d
x/dt = f (
x), which by Assumption 138 has x
=0
13.4.
Example
System
x 1 = 4 tanh x2 x52
x 2 = x2 x52 + u
y = x1 ,
"
Q=
1 0
0
0
tanh x2 , x52
"
, S=
1
1
, R=0.
y = 2 (
y y) 4 tanh (
x2 + y y) (
x2 + y y)5
x
2 = (
y y) x
2 (
x2 + y y)5 + u .
5
function, since V = x2 4 tanh x2 + x 0 is negative semidefinite,
2
L (V (x))
x
1+
+ 4 ln |cosh x2| +
1 x6
6 2
y = 2 (
y y) 6 tanh (
x2 + y y) 2 (
x2 + y y)5 +
+ 2 tanh x
2 + x
52
x
2 = (
y y) x
2 (
x2 + y y)5 + u
is obtained, and used in the certainty equivalence controller u = (
x) =
x
1 + x
52 leads to a globally asymptotically stable equilibrium point in closed
loop. Note that since : R R2 the results of [4] cannot be applied.
13.5.
Conclusions
several observer design methodologies, this certainty-equivalence result applies to many kinds of observers, as High-Gain, Lipschitz or Circle-Criterion
Observers.
A shortcoming of our result compared to [37, 4] is that we require completeness of the system. Although this requirement can be probably dropped,
and it is easy to show this for some cases, as for example when Q < 0, a
proof for the general case is still missing.
Bibliografa
[1] V. Andrieu and L. Praly. Remarks on the existence of a KazantzisKravaris/Luenberger observer. In Proceedings of the 43rd IEEE Conference on Decision and Control, pages 38743879. IEEE, Dec. 14-17
2004.
[2] D. Angeli and E. Sontag, Forward completeness, unboundedness observability, and their lyapunov characterizations, Sys. & Cont. Lett.,
38, pp. 209217, 1999.
[3] M. Arcak and P. Kokotovic. Nonlinear observers: A circle criterion
design. In Proceedings of the 38th. Conference on Decision & Control,
pages 48724876, Phoenix, Arizona, USA, 1999. IEEE.
[4] M. Arcak, Certainty-equivalence output-feedback design with circlecriterion observers, IEEE Trans. Aut. Con., 50, no. 6, pp. 905909,
2005.
[5] M. Arcak and P. Kokotovic, Nonlinear observers: a circle criterion
design and robustness analysis, Automatica, vol. 37, no. 12, pp.
19231930, 2001.
[14] X. Fan and M. Arcak, Observer design for systems with multivariable
monotone nonlinearities, Sys. & Cont. Lett., 50, pp. 319330, 2003.
[15] J.-P. Gauthier and G. Bornard, Observability for any u(t) of a class
of nonlinear systems, IEEE Trans. Aut. Cont., 26, pp. 922926,
1981.
[27] A.J. Krener and W. Respondek. Nonlinear observers with linear error
dynamics. SIAM J. Control and Optimization, 23:197216, 1985.
[32] S.Nicosia,
P. Tomei, and A. Tornamb
e. A nonlinear observer
for elastic robots. IEEE Journal of Robotics and Automation,
4(1):4552, February 1988.
[33] H.Nijmeijer
and T.I. Fossen, editors. New Directions in Nonlinear
Observer Design. Number 244 in Lecture notes in control and
information sciences. SpringerVerlag, London, 1999.
[34] H.Nijmeijer
and A. van der Schaft. Nonlinear Dynamical Control
Systems. SpringerVerlag, New York, 1990.
[42] J.A.K. Suykens, P.F. Curran, J. Vandewalle, and L.O. Chua. Robust
nonlinear H synchronization of chaotic lure systems. IEEE Trans.
on Circuits and SystemsI: Fundamental theory and applications,
44(10):891904, 1997.
[43] A. Teel and L. Praly, Semi-global stabilizability by output feedback,
Syst.& Cont. Lett., 22, pp. 313325, 1994.
[44] , Tools for semiglobal stabilization by partial state feedback
and output feedback, SIAM J. Cont. Opt., 33, pp. 14431488,
1995.
[45] A. Teel and J. Hespanha, Examples of ges systems that can be
driven to infinity by arbitrarily small additive decaying exponentials,
IEEE Trans. Aut. Cont., 49, pp. 14071410, 2004.
Englewood
[50] J.C. Willems. Dissipative dynamical systems, part II: Linear systems
with quadratic supply rates. Archive for Rational Mechanics and
Analysis, 45:352393, 1972.
[51] J. Willems, Dissipative dynamical systems, part I: General theory.
Part II: Linear systems with quadratic supply rates, Archive for
Rational Mechanics and Analysis, vol. 45, pp. 321351, and 352393,
1972.
[52] X. Xia and W. Gao. Nonlinear observer design by observer
error linearization. SIAM Journal of Control and Optimization,
27(1):199216, 1989.
[53] X. Xia and M. Zeitz. On nonlinear continuous observers. Int. J.
Control, 66(6):943954, 1997.