Vous êtes sur la page 1sur 520

Notas del Curso

M
etodos de Dise
no para Sistemas No
Lineales

Jaime A. Moreno
Universidad Nacional Aut
onoma de M
exico (UNAM)
Instituto de Ingeniera, M
exico D.F.,M
exico
Email: JMorenoP@ii.unam.mx

26 de Mayo de 2009

Indice general
I

Control

1. Algunas propiedades de sistemas

2. Estabilizaci
on

46

3. Estabilizaci
on Robusta

178

4. Seguimiento

233

5. Regulaci
on robusta estructural: Control Integral

247

II

Observaci
on

6. Introducci
on

265
266

7. Observabilidad

272

8. Observabilidad de Sistemas Din


amicos Lineales

293

9. Observabilidad de Sistemas Din


amicos No Lineales

313

10. Dise
no de Observadores para Sistemas Lineales

329

11. Dise
no de observadores para sistemas no lineales:
M
etodos por aproximaci
on (linealizaci
on)

359

12. Dise
no de observadores para sistemas no lineales:
M
etodos exactos

380

13. Dise
no de observadores para sistemas no lineales:
Dise
no disipativo de observadores no lineales

438

Parte I
Control

Captulo 1
Algunas propiedades de sistemas

1.1.

Grado Relativo

Sistema No Lineal SISO (Una Entrada Una Salida) afn en la entrada


x = f (x) + g (x) u
y = h (x)
d
onde

f , g, h son suficientemente suaves en un dominio D Rn

f : D Rn y g : D Rn son campos vectoriales en D

Tomando la derivada temporal de la salida


h (x)
y =
x
x
h (x)
h (x)
=
f (x) +
g (x) u
x
x
, Lf h (x) + Lg h (x) u
d
onde
h (x)
f (x)
Lf h (x) =
x
es la Derivada de Lie de h con respecto a f o a lo largo de f .
N
otese

Lf h (x)
Lg Lf h (x) =
g (x)
x

L2f h (x)
Lkf h (x)

= Lf Lf h (x) =
Lf Lk1
f h (x)

Lf h (x)
x

L0f h (x) = h (x)

Luego
y = Lf h (x) + Lg h (x) u

Lg h (x) = 0

f (x)

k1
Lf h (x)

y se define por convenci


on

Si

f (x)

entonces
y = Lf h (x)
La primera derivada de la salida no depende de la entrada u. Tomando
una derivada (con respecto al tiempo) adicional de la salida

y (2)

Lf h (x)
= y =
[f (x) + g (x) u]
x
= L2f h (x) + Lg Lf h (x) u

Si
Lg Lf h (x) = 0

y (2) = L2f h (x)

Derivamos con respecto al tiempo una vez m


as

y (3)

2
Lf h (x)

[f (x) + g (x) u]

x
= L3f h (x) + Lg L2f h (x) u

Si

Lg L2f h (x) = 0

y (3) = L3f h (x)

Generalizando: Si
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , 1 ;
1

Lg Lf

h (x) 6= 0

y (i) = Lif h (x) , i = 1, 2, . . . , 1 ;

y () = Lf h (x) + Lg Lf

h (x) u

Definici
on 1 El sistema SISO
x = f (x) + g (x) u
y = h (x)
tiene grado relativo , 1 n, en D0 D Rn si x D0
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , 1 ;
1

Lg Lf

h (x) 6= 0

Ejemplo 2
x 1 = x2

2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x1

y = x 1 = x2
y = x 2 = x1 +

1 x21

x2 + u

Grado relativo = 2 sobre R2


Ejemplo 3
x 1 = x2

2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x2

y = x 2 = x1 +

1 x21

x2 + u

Grado relativo = 1 sobre R2

Ejemplo 4
x 1 = x2

2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x1 + x22

y = x 1 + 2x2x 2 = x2 2x1x2 + 2
n

1 x21
o

Grado relativo = 1 sobre D0 = x R2 | x2 6= 0

x22 + 2x2u

Ejemplo 5 Motor de corriente directa controlado por campo


x 1 = ax1 + u
x 2 = bx2 + k cx1x3
x 3 = x1x2
y = x3
a, b, c, k, son constantes positivas

y = x 3 = x1x2
y = x 1x2 + x1x 2
= [ax1x2 + x1 (bx2 + k cx1x3)] + x2u
n

Grado relativo = 2 sobre D0 = x

R2

| x2 6= 0

1.2.

Forma Normal

Para el sistema SISO


x = f (x) + g (x) u
y = h (x)
con grado relativo , 1 n, en D0 D Rn
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , 1 ; x D0
1

Lg Lf

h (x) 6= 0 ; x D0

sea el cambio de variables

1 (x)

...

n (x)

z = T (x) =

h (x)

...

1
Lf h (x)

(x)

(x)

1 (x), ,n (x) son elegidos de tal forma que T (x) sea un difeomor 0 D0 D.
fismo en un dominio D

Entonces la din
amica del sistema en las nuevas coordenadas es
(x)

= x [f (x) + g (x) u] = f0 (, ) + g0 (, ) u
Li1
f h(x)

i =
[f (x) + g (x) u]

x
i
= Lf h (x) + Lg Li1
f h (x) u = i+1
1

= Lf h (x) + Lg Lf h (x) u
y = 1

, 1i1

Eljase (x) tal que T (x) sea un difeomorfismo y


i (x)
0
g (x) = 0 , 1 i n ; x D
x

Comentario 6 Esto siempre es posible, al menos localmente

Teorema 7 Suponga que el sistema (SISO)


x = f (x) + g (x) u
y = h (x)
tiene grado relativo , 1 n, en D0 D Rn.

Si = n entonces, para todo x


D0, existe una vecindad Nx de x
tal
que el mapa (x), restringido a Nx, es un difeomorfismo en Nx.

Si < n entonces, para todo x


D0, existen

una vecindad Nx de x
, y
funciones suaves 1 (x), ,n (x)

tales que
i (x)
g (x) = 0 , 1 i n ; x Nx
x
y el mapa

(x)

T (x) = ,
(x)
restringido a Nx, es un difeomorfismo en Nx.
En tal caso el sistema en las nuevas coordenadas queda en la Forma Normal

= f0 (, )

=
i
i+1 , 1 i 1
Forma Normal:
= L h (x) + Lg L1h (x) u

f
f

y = 1

o en forma m
as compacta

= f0 (, )
= Ac + Bc (x) [u (x)]
Forma Normal:

y = Cc

d
onde

Ac =

Cc =

0
0
...
0
0

1
0
...
0
0

0
1
...
0
0

...

0
0
...
0
0

0
0
...
1
0

1 0 0 0 0

, Bc = ... ,

(x) = Lg Lf

h (x) , (x) =

Lf h (x)
1

Lg Lf

h (x)

Si x es un punto de equilibrio con entrada u = 0, para el cual y = 0, es

decir,

f (x) = 0
h (x) = 0

(x) = 0

Elija (x) tal que (x) = 0 y entonces z = 0 es un punto de equilibrio


con entrada u = 0.

1.3.

Din
amica Cero

Sea el sistema SISO en la forma normal

= f0 (, )
= Ac + Bc (x) [u (x)]

y = Cc

Si la salida es cero durante un intervalo de tiempo t (0, T ) entonces


durante tal intervalo
y (t) 0 = y (i) (t) 0 , i = 1, 2, = (t) 0
= u (t) (x (t)) = = f0 (, 0)
Definici
on 8 La ecuaci
on
= f0 (, 0)

se denomina la Din
amica Cero (DC) del sistema.
Se dice que el sistema de Fase Mnima si la Din
amica Cero tiene un punto
de equilibrio asint
oticamente estable en el dominio de inter
es (en el origen
si T (0) = 0).
Comentario 9 La Din
amica Cero corresponde a todas las parejas de condiciones iniciales y entradas al sistema que tienen salida cero. En la Forma
Normal esto es especialmente simple:
Si (0, 0) = (0, 0) y u (t) (x (t)) , d
onde
"

x (t) = T 1

(t)
0

#!

(t) = f0 ( (t) , 0) , (0) = 0

y (t) 0

Comentario 10 En las coordenadas originales la DC puede caracterizarse


de la siguiente manera
Z

0 | h (x) = Lf h (x) = = L1h (x) = 0


= xD
f

Entonces
y (t) 0 = x (t) Z
= u (t) = u (x) , (x) |xZ
La din
amica restringida del sistema se describe como
x = f (x) , [f (x) + g (x) (x)]xZ
Ejemplo 11
x 1 = x2

2
x 2 = x1 + 1 x1 x2 + u , > 0
y = x2

y = x 2 = x1 +

1 x21

x2 + u = = 1

y (t) 0 = x2 (t) 0 = x 1 (t) = u (t) = x1 (t)


El sistema es de Fase No Mnima

Ejemplo 12
x 1 = x1 +

2+x23
u
1+x23

x 2 = x3
x 3 = x1x3 + u
y = x2

y = x 2 = x3
y = x 3 = x1x3 + u = = 2

(x) = Lg Lf h (x) = 1 , (x) =

Lf h (x)
1
Lg Lf h (x)

= x1x3

Z = {x2 = x3 = 0}
u = u (x) = 0
x 1 = x1
El sistema es de Fase Mnima
Cu
al es la transformaci
on para llevar al sistema a la Forma Normal?

Hay que hallar (x) tal que

h
i
(x)
(x)
(x)
(x)
(0) = 0 ,
g (x) =

, x , x
x

1
2
3
x

(x)

T (x) = x2
x3
sea un difeomorfismo.
(x)
(x) 2 + x23 (x)
g (x) =
=0
+
2
x
x1 1 + x3
x3
La funci
on
(x) = x1 + x3 + tan1 x3

2+x23
1+x23

0
1

=0

satisface la EDP y (0) = 0.

T (x) = 1 =
2

1
x1 + x3 + tan x3

x2

x3

, T 1 (z) =

es un difeomorfismo global. La Forma Normal es entonces

2
2+

+
tan
1
+
2
2

1+22 2

1 = 2 ,

2 = + 2 + tan 2 2 + u

y = 1

1
+ 2 + tan3 2

1
2

1.4.

Forma de Controlador

Definici
on 13 Se dice que un sistema no lineal (con m
ultiples entradas)
est
a en la Forma de Controlador si
x = Ax + B (x) [u (x)]
d
onde

(A, B) es controlable, A Rnn, B Rnp

(x), con : D Rn Rpp, es una matriz no singular para cada


x D Rn.

Comentario 14 N
otese que un sistema que est
a en la Forma de Controlador se puede linealizar exactamente mediante retroalimentaci
on de los
estados:
Si se elige
u = (x) + 1 (x) v
d
onde
1 (x) : Matriz Inversa de (x)
v:
nueva entrada de control
entonces la din
amica del sistema en lazo cerrado es
x = Ax + Bv
que es lineal en los estados y la entrada v.

Definici
on 15 Se dice que un sistema no lineal
x = f (x) + G (x) u
d
onde f : D Rn y G : D Rnp son suficientemente suaves en un
dominio D Rn, es Linealizable por Retroalimentaci
on (o Linealizable
Entrada-Estados) si existe un Difeomorfismo T : D Rn, tal que

Dz = T (D) contiene el origen, y

el cambio de variables z = T (x) transforma al sistema a la Forma de


Controlador.

En el caso de sistemas con una sola entrada (p = 1) se tiene que

Proposici
on 16 El sistema de dimensi
on n y con una entrada (p = 1)
x = f (x) + g (x) u
puede ser transformado a la Forma de Controlador mediante una transformaci
on de estados z = T (x) si y solo si existe una funci
on (de salida)
h (x) tal que el sistema SISO
x = f (x) + g (x) u
y = h (x)
tenga grado relativo = n.
Prueba. =: Si el sistema tiene grado relativo = n, entonces se puede
llevar a la Forma Normal, que en este caso se reduce a la Forma de Controlador
= Ac + Bc () [u ()]
y = Cc

=: Si el sistema se puede transformar a la Forma de Controlador mediante


una transformaci
on z = S (x), entonces
z = Az + B
(z) [u
(z)] .
Como (A, B) es controlable, entonces existe una matriz regular M Rnn
tal que
M AM 1 = Ac + BcT
M B = Bc
d
onde

Ac =

0
0
...
0
0

1
0
...
0
0

0
1
...
0
0

...

0
0
...
0
0

0
0
...
1
0

, Bc = ... .

Por lo tanto la transformaci


on
= M z = M S (x) , T (x)
transforma al sistema a la forma
= Ac + Bc () [u ()]
d
onde
(x) =
(x) , (x) =

S (x)
T

(x) M

Eligiendo
y = Cc = 1 = T1 (x) = h (x)
el sistema tiene Grado Relativo = n.

(x)

1.5.

Condiciones de existencia de h (x)

C
omo decidir si existe una funci
on suave h (x) tal que
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , n 1 ; x D0
h (x) 6= 0 ; x D0
Lg Ln1
f
y

T (x) =

sea un difeomorfismo?

h (x)
Lf h (x)
...
Ln1
h (x)
f

1.5.1.

El par
entesis de Lie

Definici
on 17 El par
entesis de Lie de dos campos vectoriales f ,g es un
tercer campo vecotrial definido como
[f, g] (x) =

g (x)
f (x)
f (x)
g (x)
x
x

Notaci
on 18 Para simplificar la escritura se introduce la siguiente notaci
on
ad0f g (x) = g (x)
adf g (x) = [f, g] (x)
adkf
Propiedades

g (x) =

i
k1
f, adf g (x) (x)

, k1

[f, g] = [g, f ]

Para campos vectoriales constantes f , g, [f, g] = 0

Ejemplo 19

"

f =

x2
sin x1 x2

"

, g=

0
x1

Entonces
"

adf g (x) = [f, g] =


"

x1
x1 + x2

0 0
1 0
#

#"

x2
sin x1 x2

"

0
1
cos x1 1

#"

0
x1

ad2f g (x) = f, adf g =


"

"

1.5.2.

"

1 0
1 1

0
1
cos x1 1

#"

#"

x2
sin x1 x2

x1
x1 + x2

x1 2x2
x1 + x2 sin x1 x1 cos x1

Distribuciones

Definici
on 20 Para los campos vectoriales f1, f2, , fk en D Rn sea
(x) = span {f1 (x) , f2 (x) , , fk (x)}

el espacio vectorial generado por los vectores f1 (x) , f2 (x) , , fk (x).


La colecci
on de espacios vectoriales (x) para todo x D se denomina
Distribuci
on y nos referimos a ella como
= span {f1, f2, , fk } .
Si la dim ( (x)) = k para todo x D, se dice que es una distribuci
on
no singular en D, generada por f1, f2, , fk
La distribuci
on es involutiva si
g1 y g2 = [g1, g2]
Lema 21 Si es una distribuci
on no singular en D, generada por f1, f2, , fk
entonces es involutiva si y s
olo si
h

fi, fj , 1 i, j k

Ejemplo 22 D = R3; = span {f1, f2}

1
2x2

f1 = 1 , f2 = 0
x2
0
dim ( (x)) = 2 , x D

0
f2
f1

[f1, f2] =
f1
f2 = 0
x
x
1

2x2 1 0

rank [f1 (x) , f2 (x) , [f1 , f2] (x)] = rank 1


0 0 = 3 , x D
0 x2 1
no es involutiva

Ejemplo 23 D = x

R3

f1 =

o
2
|
+ x3 6= 0 ; = span {f1, f2}

x1
2x3

1 , f2 = 2x2

x21

x3

dim ( (x)) = 2 , x D

f
f

[f1, f2] = 2 f1 1 f2 =
x
x

4x3

2
0

2x3 x1 4x3

rank [f1 (x) , f2 (x) , [f1 , f2] (x)] = rank 1 2x2


2 = 2 , x D
0
x3
0
es involutiva

Teorema 24 El sistema de dimensi


on n con una sola entrada (SI)
x = f (x) + g (x) u
es transformable a la Forma de Controlador si y solo si existe un dominio
D0 tal que
i
n1
adf g (x)

1. rank g (x) , adf g (x) , ,


n

2. span g (x) , adf g (x) , ,


Ejemplo 25

"

x =

adn2
g (x)
f

a sin x2
x21

"

= n , x D0, y

es involutiva en D0

0
1

f
adf g (x) = [f , g] = g =
x

1.6.

"

a cos x2
0

Tres consecuencias del teorema de linealizaci


on

Tres consecuencias importantes del anterior teorema ser


an presentadas [30,
Secci
on 2.2]

1.6.1.

Sistemas Planos

Corolario 26 Un sistema no lineal en el plano (n = 2) con una sola entrada


x = f (x) + g (x) u
es Linealizable localmente por Retroalimentaci
on (es localmente transformable a la Forma de Controlador) en una vecindad del origen si y solo
si su aproximaci
on lineal (linealizaci
on) en el origen
x =
es controlable.

f (0)
x + g (0) u , Ax + bu
x

1.6.2.

Sistemas no planos

La controlabilidad de la linealizaci
on para sistemas de orden n 3 es
una condici
on necesaria pero no suficiente de Linealizabilidad por Retroalimentaci
on:
Corolario 27 Si el sistema no lineal con una sola entrada
x = f (x) + g (x) u
es Linealizable localmente por Retroalimentaci
on (es localmente transformable a la Forma de Controlador) en una vecindad del origen entonces
su aproximaci
on lineal (linealizaci
on) en el origen
f (0)
x =
x + g (0) u , Ax + bu
x

es controlable, es decir,
h

rango b , Ab ,

A2b

, ,

i
n1
A
b

=n.

Ejercicio 28 Pruebe el corolario.

1.6.3.

Sistemas en forma Triangular

Corolario 29 El sistema en Forma Triangular


x i = i (x1, , xi) + xi+1 , 1 i n 1
x n = n (x1, , xn) + u ,
en el cual 1, , n son funciones suaves tales que i (0) = 0, 1 i n,
es Linealizable localmente por Retroalimentaci
on.

Prueba. Veremos dos pruebas: una verificando directamente las condiciones del teorema y la otra dando una transformaci
on explcita.
Comentario 30 Una Forma Triangular m
as general est
a dada por
x i = i (x1, , xi+1) , 1 i n 1
x n = n (x1, , xn) + (x1, , xn) u ,
con 1, , n y funciones suaves tales que i (0) = 0, 1 i n ,
(0) 6= 0 , y
i (0)
6= 0 , 1 i n 1 .
xi+1
Este sistema es tambi
en Linealizable localmente por Retroalimentaci
on.
Comentario 31 Cuando el control u entra en forma no lineal en las ecuaciones de estado
x = f (x, u) , f (0, u) = 0 , u R

el problema de Linealizaci
on por Retroalimentaci
on puede ser formulado
para el sistema extendido
x = f (x, u)
u = w ,
en el cual w es el nuevo control y (x, u) es el estado extendido. Si las condiciones del teorema de linealizaci
on se satisfacen para el sistema extendido,
entonces el control resultante
u = w = (x, u) + (x, u) v , u (0) = u0
es un control din
amico linealizante para el sistema original.

Captulo 2
Estabilizaci
on

2.1.

Conceptos b
asicos y Linealizaci
on

Se desea estabilizar al sistema


x = f (x, u)
en el punto de equilibrio x = xss
Problema 32 de estado estacionario: Encuentre un control de estado estacionario uss tal que
0 = f (xss, uss)
Definiendo
x = x xss , u = u uss

la din
amica del sistema satisface
x = f (xss + x , uss + u ) , f (x , u )
0 = f (0, 0)
El control
u = (x ) = u = uss + (x xss)
Problema 33 de estabilizaci
on por retroalimentaci
on de los estados: Dado
x = f (x, u)

, f (0, 0) = 0

encuentre
u = (x)

, (0) = 0

tal que el origen es un punto de equilibrio asint


oticamente estable para el
sistema
x = f (x, (x))

f y son funciones localmente Lipschitz.

2.1.1.

Sistemas Lineales

Sea el sistema
x = Ax + Bu
con (A, B) estabilizable ( controlable o todo valor propio incontrolable
tiene parte real negativa)
Encuentre K tal que (A BK) sea Hurwitz
u = Kx

M
etodos tpicos:
Colocaci
on de polos (o de valores propios)
Colocaci
on de valores y vectores propios
LQR

2.1.2.

Linealizaci
on

Se desea estabilizar al sistema


x = f (x, u)

, f (0, 0) = 0

con f contnuamente diferenciable en un dominio Dx Du Rn Rp


que contiene el origen (x = 0 , u = 0)
La linealizaci
on es
x = Ax + Bu

f
f
A=
(x, u)
; B=
(x, u)
x
u
x=0 , u=0
x=0 , u=0

Suponga que (A, B) es estabilizable. Dise


ne una matriz K tal que (A BK)
sea Hurwitz
u = Kx
Sistema en lazo cerrado:
x = f (x, Kx)

Linealizaci
on

f
f
x
(x, Kx)
(x, Kx) K
x =
x
u
x=0
x = (A BK) x
Ya que (A BK) es Hurwitz, el origen es un punto de equilibrio exponencialmente estable del sistema en lazo cerrado.
Ejemplo 34 Ecuaci
on del p
endulo
= a sin b + cT
Estabilice el p
endulo en el punto =
0 = a sin + cTss
a

x1 = , x2 = , u = T Tss = T sin
c

x 1 = x2
x 2 = a [sin (x1 + ) sin ] bx2 + cu
"

A=

0
1
=
a cos (x1 + ) b x =0
1
"

B=
K=
"

A BK =

0
c

"

0
1
a cos b

k1 k2

0
1
(a cos + ck1) (b + ck2)
a cos
b
k1 >
, k2 >
c
c

es Hurwitz

T =

2.2.

a
a sin
sin Kx =
k1 ( ) k2
c
c

Linealizaci
on por retroalimentaci
on

Considere el sistema no lineal


x = f (x) + G (x) u
f (0) = 0 , x Rn , u Rp
Suponga que existe un cambio de variables z = T (x), definido para todo
x D Rn, que transforma al sistema a la Forma de Controlador
z = Az + B (x) [u (x)]

d
onde (i) (A, B) es controlable, y (ii) (x) es una matriz no singular para
cada x D Rn.

Si se elige
u = (x) + 1 (x) v
entonces la din
amica del sistema en lazo cerrado es
z = Az + Bv
que es lineal en los estados y la entrada v.

Si adem
as la nueva entrada v se dise
na como
v = Kz

con K tal que la matriz (A BK) sea Hurwitz, entonces el origen z = 0


del sistema en lazo cerrado
z = (A BK) z
es global y exponencialmente estable (GEE).
En las coordenadas originales el control que estabiliza el origen es
u = (x) 1 (x) KT (x)
y la din
amica en lazo cerrado en coordenadas x es
x = f (x) + G (x)

(x) 1 (x) KT

N
otese que (Pruebe las afirmaciones!)

(x)

x = 0 es un punto de equilibrio del sistema en lazo cerrado.

x = 0 es asint
oticamente estable (AE), ya que T (x) es un difeomorfismo.

x = 0 es exponencialmente estable (EE) localmente, ya que T (x) es


un difeomorfismo.

x = 0 no es, en general, Global y Asint


oticamente Estable (GAE).

x = 0 es Global y Asint
oticamente Estable (GAE) si T (x) es un
difeomorfismo global (Ver [25, pag. 508]).

Si T (x) es un difeomorfismo global, x = 0 no es, en general, Global


y Exponencialmente Estable (GEE).
x = 0 es Global y Exponencialmente Estable (GEE) si T (x) es un
difeomorfismo global y es Globalmente Lipschitz.
Qu
e informaci
on se requiere para implantar la ley de control
u = (x) 1 (x) KT (x) ?

2.2.1.

Robustez ante incertidumbres

Cu
al es el efecto de las incertidumbres en (x), (x), y T (x) ?

Sean
(x),
(x), y T (x) modelos nominales de (x), (x), y T (x). Con
la ley de control
u=
(x)
1 (x) K T (x)
el sistema en lazo cerrado es (en coordenadas z)
z = (A BK) z + B (z)
=

+ 1KT

1K T

(1)
i

Este sistema constituye una perturbaci


on del sistema nominal. Lo analizamos utilizando las herramientas de sistemas perturbados.
Lema 35 Considere el sistema en lazo cerrado (1), d
onde (A BK) es
Hurwitz. Sea P = P T > 0 la soluci
on de la ecuaci
on algebraica de Lyapunov
P (A BK) + (A BK)T P = I

y sea k una constante tal que


1
0k<
.
2 kP Bk2
Si k (z)k k kzk para todo z, entonces el origen de (1) ser
a Global y
Exponencialmente Estable (GEE).

Si k (z)k k kzk + para todo z, entonces el estado z ser


a Global y
Finalmente Acotado por c, para alguna c > 0.

Prueba. Sea
V (z) = z T P z

Esta es una funci


on de Lyapunov para el sistema nominal (lineal). Luego,
tomando su derivada a lo largo de las trayectorias del sistema perturbado
(1) se obtiene
V (z) =

zT

P (A BK) + (A BK) P z + 2z T P B (z)

kzk22 + 2 kzk2 kP Bk2 k (z)k2


Si k (z)k2 k kzk2 + entonces se tiene
V (z) (1 ) kzk22 kzk22 + 2k kP Bk2 kzk22 + 2 kP Bk2 kzk2
d
onde (0, 1) se elige cercana a 1 de tal forma que k < 2kPBk . Por
2
lo tanto
V (z) (1 ) kzk22 + 2 kP Bk2 kzk2
Si k (z)k2 k kzk2 hacemos = 0 en la anterior desigualdad y con-

cluimos que el origen es GEE. Si > 0

2 kP Bk2
2

V (z) (1 ) 1 kzk2 , kzk2


, c0

(1 )
con (0, 1). Del Teorema q
4.18 de [25] se concluye que z (t) es Global y
Finalmente Acotado por c0 max (P ) /mn (P )
Comentario 36 Es claro de la prueba del Lema que si la cota de (z) se
satisface solo en una vecindad del origen el resultado es v
alido localmente.
Ejemplo 37 Ecuaci
on del p
endulo
= a sin b + cT
a

x1 = , x2 = , u = T Tss = T sin
c

x 1 = x2
x 2 = a [sin (x1 + ) sin ] bx2 + cu
1
u = {a [sin (x1 + ) sin ] k1x1 k2x2}
c
"

A BK =

T =u+

0
1
k1 (k2 + b)

es Hurwitz

1
a
sin = [a sin (x1 + ) k1x1 k2x2]
c
c

Sean a
y c modelos nominales de a y c
1
a sin (x1 + ) k1x1 k2x2]
T = [
c
x = (A BK) x + B (x)

a
c a
c
c c
(x) =
sin (x1 + )
(k1x1 + k2x2)
c
c
| (x)| k kxk +

a
c c

a
c

a
c

2
2

|sin |
k=
+
k1 + k2 , =
c
c
c
"

P =

p11 p12
p12 p22

"

, PB =

p12
p22

1
k< q
2 p212 + p222
sin = 0 = = 0

Es la linealizaci
on por retroalimentaci
on una buena idea?

Ejemplo 38
x = ax bx3 + u , a, b > 0
u = (k + a) x + bx3 , k > 0 , = x = kx
bx3 es un t
ermino de amortiguamiento. Por qu
e cancelarlo?
u = (k + a) x , k > 0 , = x = kx bx3

Ejemplo 39 Considere el sistema


x 1 = x2
x 2 = h (x1) + u
con
h (0) = 0 , x1h (x1) > 0 , x1 6= 0

Dise
no por linealizaci
on por retroalimentaci
on:
u = h (x1) (k1x1 + k2x2)
"

x =

0
1
k1 k2

Dise
no basado en pasividad: Considere la funci
on de almacenamiento de
energa
Z x
1
1 2
V (x) =
h (z) dz + x2
2
0
V = h (x1) x2 x2h (x1) + x2u = x2u
Entonces el sistema es pasivo si la salida es
y = x2

La ley de control
u = (x2) ,
(0) = 0 , x2 (x2) > 0 , x2 6= 0
estabiliza asint
oticamente (globalmente?) el origen de
x 1 = x2
x 2 = h (x1) (x2)
ya que
V = x2 (x2)
x2 (t) 0 = x 2 (t) 0 = h (x1 (t)) 0 = x1 (t) 0 ,
La estabilidad asint
otica es una consecuencia del principio de invariancia

de Lasalle.
Linealizaci
on:

"

x =

0
1
h0 (0) k

x , k = 0 (0)

El polinomio caracterstico es
s2 + ks + h0 (0) = 0
s

k
k 2
s1,2 =
h0 (0)
2
2
cuando k vara entre 0 ,quna de las races no puede moverse a la
izquierda del punto Re [s] = h0 (0)

Ventajas/Desventajas del control basado en pasividad:

1. Ventaja: El control basado en pasividad no requiere un modelo de la


funci
on no lineal h (x1), por lo que es robusto ante variaciones en ella,

2. Ventaja: Flexibilidad en la elecci


on de (x2), para satisfacer restricciones de la entrada.

3. Desventaja: la velocidad de convergencia no puede ser asignada arbitrariamente.

2.3.

Linealizaci
on Parcial (o entrada/salida) por
Retroalimentaci
on

Considere el sistema no lineal


x = f (x) + G (x) u
f (0) = 0 , x Rn , u Rp
Suponga que existe un cambio de variables
"

z=

"

= T (x) =

T1 (x)
T2 (x)

definido para todo x D Rn, que transforma al sistema a la Forma


(Normal)
(

= f0 (, )
= A + B (x) [u (x)]

d
onde (i) (A, B) es controlable, y (ii) (x) es una matriz no singular para
cada x D Rn.

Si se elige
u = (x) + 1 (x) v
entonces la din
amica del sistema en lazo cerrado es
(

= f0 (, )
= A + Bv

Si adem
as la nueva entrada v se dise
na como
v = K
con K tal que la matriz (A BK) sea Hurwitz, entonces el sistema en
lazo cerrado es
(

= f0 (, )
= (A BK)

(2)

y el origen = 0 del subsistema lineal


= (A BK)
es GEE. Es el origen del sistema en lazo cerrado (, ) = (0, 0) asint
oticamente estable?
N
otese que una condici
on necesaria para que el origen de (2) sea (global
y) asint
oticamente estable es que el origen del sistema
= f0 (, 0)

sea (global y) asint


oticamente estable (por qu
e?). Entonces el sistema
(2) es una conexi
on en cascada (o serie) de dos sistemas asint
oticamente
estables. En el caso lineal e invariante en el tiempo esto es suficiente para
asegurar la establidad del origen del sistema completo, pero en el caso no
lineal la situaci
on es m
as compleja, como se ver
a a continuaci
on.

2.3.1.

Estabilidad Local de la cascada

Lema 40 El origen de (2) es Asint


oticamente Estable (localmente!) si el
origen = 0 del sistema
= f0 (, 0)
es local y asint
oticamente estable.

Prueba. Por el teorema converso de Lyapunov [25, Teorema 4.16] existe


una funci
on de Lyapunov V1 (), contnuamente diferenciable, tal que
V1 ()
f0 (, 0) 3 (kk)

en alguna vecindad de = 0, d
onde 3 es una funci
on tipo K. Sea P =
P T > 0 la soluci
on de la ecuaci
on algebraica de Lyapunov
P (A BK) + (A BK)T P = I
y use
q

V (, ) = V1 () + k T P , k > 0
como candidata a funci
on de Lyapunov para (2). N
otese que aunque V
no es continuamente diferenciable en la variedad = 0 el teorema de
Lyapunov sigue siendo v
alido en este caso (por qu
e?).

La derivada V est
a dada por
h
i
k
V1 ()
T
T

V =
f0 (, ) + q
P (A BK) + (A BK) P

T
2 P

V1 ()
V1 ()
k T
=
f0 (, 0) +
[f0 (, ) f0 (, 0)] q

2 T P
En cualquier vecindad acotada V del origen, y por la diferenciabilidad
contnua de V1 y f0, es posible acotar
kf0 (, ) f0 (, 0)k k1 kk

V ()
1

k2

y entonces
V 3 (kk) + k1k2 kk kk3 kk

para algunas constantes positivas k1, k2, k3. Eligiendo k > k1k2/k3 se asegura que V es negativa definida. Por lo tanto el origen es local y asint
oticamente estable.

Comentario 41 El lema anterior s


olo es v
alido en regiones acotadas y no
puede ser extendido al caso global.

Comentario 42 N
otese que la funci
on candidata de Lyapunov m
as simple,
es decir, la suma de las funciones de Lyapunov para cada uno de los sistemas de la cascada, W (, ) = V1 () + k T P , k > 0 no es u
til en este
caso!

2.3.2.

Estabilidad Global de la cascada

Si el origen = 0 del sistema


= f0 (, 0)
es global y asint
oticamente estable ser
a el origen de la cascada
= f0 (, )
= (A BK)
global y asint
oticamente estable? En general la respuesta es NO!

Ejemplo 43 Considere el sistema de segundo orden


= + 2
= v

El origen de
=
es global y exponencialmente estable, y el origen de
= k , k > 0
es tambi
en global y exponencialmente estable. Sin embargo, el origen de
= + 2
= k , k > 0
no es global y asint
oticamente estable! (Ver simulaciones en Figura 2.1)
Para calcular la regi
on de atracci
on del origen, considere la variable v =
y n
otese que
v =
+ = + 2 2 k = (1 + k) v + v 2
Si v0 = (1 + k), entonces v (t) = 1 + k para todo t 0.

x = x + x2 y
y=2y
2

4
2

1
x

Figura 2.1: Simulaciones con k = 2

Si v0 > (1 + k), entonces v (t) cuando t .

Si v0 < (1 + k), entonces v (t) 0 cuando t .

Por lo tanto el conjunto { < 1 + k} es invariante positivo y, mediante


un an
alisis adicional, se puede mostrar que corresponde a la regi
on de
atracci
on del sistema.

Podra pensarse que la cascada se puede estabilizar, dado que el sistema


maestro () es estable y el esclavo () es tambi
en globalmente estable
con entrada cero, haciendo que (t) 0 r
apidamente. Aunque esto es
razonable, y funciona bien en muchas ocasiones, no es siempre cierto debido
al Fen
omeno de Pico.

Ejemplo 44 Considere el sistema de tercer orden


= 12 (1 + 2) 3
1 = 2
2 = v
El origen del subsistema esclavo
1
= 3
2
es global y asint
oticamente estable. Si se define el control v como
v = k21 2k2 , K , k > 0
entonces el subsistema maestro ser
a
"

= (A BK) =

0
1
k2 2k

cuyos valores propios son {k , k}, y la matriz de transici


on de estados
est
a dada por
"

e(ABK)t =

(1 + kt) ekt

tekt

k2tekt

(1 kt) ekt

Cuando k las trayectorias del sistema maestro convergen a cero


arbitrariamente r
apido. El t
ermino (2, 1) tiene un pico (Ver 2.2)

m
ax
t0

k2tekt

k2tekt

k
= cuando k
t=1/k
e

1.5

2.5

3.5

Figura 2.2: Gr
aficas de la funci
on k2tekt para valores de k
[1 , 5 , 10 , 20]

Si
"

(0) =

1
0

"

= (t) =

(1 + kt) ekt

k2tekt

1
2
kt
3 , (0) = 0
= = 1 k te
2
02
2
h
i
= (t) =
1 + 02 t + (1 + kt) ekt 1

Si 02 > 1 el sistema tendr


a un escape a infinito en tiempo finito, si k se
selecciona suficientemente grande.

Lema 45 El origen del sistema en cascada


= f0 (, )
= (A BK)

es global y asint
oticamente estable si el sistema
= f0 (, )
es Entrada-a-Estados Estable.

Prueba. Use el Lema 4.7 de [25]: El origen del sistema


x 1 = f1 (x1, x2)
x 2 = f2 (x2)
es GAE si el sistema esclavo es ISS y el origen del sistema maestro es GAE.

2.3.3.

Robustez ante incertidumbres

La discusi
on anterior muestra que todo sistema Linealizable Parcialmente
(o linealizable entrada-salida), y que sea de fase mnima, puede ser estabilizado (localmente) mediante la ley de control por retroalimentaci
on de
estados
u = (x) 1 (x) KT2 (x)
Comentario 46 N
otese que esta ley de control es independiente de la funci
on (x) = T1 (x), que satisface (en el caso de una sola entrada) la
ecuaci
on en derivadas parciales (EDP)
(x)
g (x) = 0
x

Cu
al es el efecto de las incertidumbres en (x), (x), y T2 (x) ?
Sean
(x),
(x), y T2 (x) modelos nominales de (x), (x), y T2 (x).
Con la ley de control
u=
(x)
1 (x) K T2 (x)
el sistema en lazo cerrado es (en coordenadas z)
= f0 (, )
h
i
1
= A + B (x)
(x)
(x) K T2 (x) (x) + BKT2 (x) BK
y por lo tanto
= f0 (, )
= (A BK) + B (z)
=

+ 1KT

1K T2
2

(3)
i

Este sistema constituye una perturbaci


on del sistema nominal. Lo analizamos utilizando las herramientas de sistemas perturbados.
Lema 47 Considere el sistema en lazo cerrado (3), d
onde (A BK) es
Hurwitz.

Si k (z)k para todo z, y = f0 (, ) es Entrada-a-Estados Estable,


entonces el estado z ser
a Global y Finalmente Acotado por una funci
on
clase K de .

Si k (z)k k kzk en alguna vecindad de z = 0, con k suficientemente


peque
na, y el origen de = f0 (, 0) es exponencialmente estable, entonces
z = 0 es un punto de equilibrio exponencialmente estable del sistema (3).

Prueba. Sea
V () = T P
d
onde P = P T > 0 es la soluci
on de la ecuaci
on algebraica de Lyapunov
P (A BK) + (A BK)T P = I .
Esta es una funci
on de Lyapunov para el subsistema lineal nominal de
(3). Luego, tomando su derivada a lo largo de las trayectorias del sistema
perturbado (3) se obtiene
V () =

P (A BK) + (A BK) P + 2 T P B (z)

kk22 + 2 kP Bk2 kk2 k (z)k2


Si k (z)k2 entonces se tiene
1
2

V () kk2 + 2 kP Bk2 kk2 kk22 , kk2 4 kP Bk2


2

Por lo tanto, aplicando el teorema 4.18 de [25] se puede concluir que


existen un tiempo finito T y una constante positiva c tales que
k (t)k2 c , t T
De la estabilidad Entrada-a-Estados del sistema = f0 (, ) se sigue que

k (t)k2 (k (T )k2 , t T ) + 0 sup k (t)k2


tT

(k (T )k2 , t T ) + 0 (c)
d
onde es una funci
on tipo KL, y 0 es una funci
on tipo K. Despu
es de
un cierto tiempo finito se satisface
(k (T )k2 , t T )
y por lo tanto z (t) est
a finalmente acotada
kz (t)k2 k (t)k2 + k (t)k2 c + + 0 (c)

que es una funci


on tipo K de .

Para probar la segunda parte del lema, recu


erdese que por el teorema
converso de Lyapunov [25, Teorema 4.16] existe una funci
on de Lyapunov
V1 (), contnuamente diferenciable, tal que
c1 kk22 V1 () c2 kk22
V1 ()
f0 (, 0) c3 kk22

V ()
1

c4 kk2

2
en alguna vecindad de = 0. Usando
V (z) = bV1 () + T P , b > 0

como candidata a funci


on de Lyapunov para (3) se obtiene

V1 ()
V1 ()

f0 (, 0) + b
[f0 (, ) f0 (, 0)] +
V =b

h
i
T
T
+ P (A BK) + (A BK) P + 2 T P B (z)
bc3 kk22 + bc4L kk2 kk2 kk22 +
+ 2k kP Bk2 kk22 + 2k kP Bk2 kk2 kk2
"

=
"

kk2
kk2
kk2
kk2

#T

#T

12 bc4L + k kP Bk2
"

bc3

kk2
kk2

1 bc L + k kP Bk
2
2 4

1 2k kP Bk2

"

kk2
kk2

d
onde L es una constante de Lipschitz de f0 (, ) con respecto a . Haciendo b = k, se puede ver que

2
1
det Q = kc3 (1 2k kP Bk2)
kc4L + k kP Bk2
2
(
"
2 # )

1
k >0
c4L + kP Bk2
= k c3 2c3 kP Bk2 +
2

si
c3
k<

2
2c3 kP Bk2 + 12 c4L + kP Bk2
Entonces Q es positiva definida para una k suficientemente peque
na. Por
lo tanto el origen es Exponencialmente Estable.

2.4.

Backstepping

2.4.1.

El caso m
as simple: Backstepping de integrador

La idea b
asica del m
etodo conocido como backsteppingse puede explicar,
en su forma m
as simple, considerando el sistema con entrada escalar
= f () + g ()
= u , Rn , R , u R
N
otese que este sistema se puede ver como una conexi
on en cascada,
d
onde el maestro es un integrador y el esclavo es el sistema no lineal
= f () + g () . El objetivo de control es estabilizar el origen utilizando
retroalimentaci
on de los estados. El dise
no se divide en dos etapas:

Dise
no del Control virtual:

V
ease a como una entrada de control virtual del sistema
= f () + g ()
Suponga que existe una ley de control retroalimentado
= ()
que estabiliza el origen de
= f () + g () ()
y que, adem
as, conocemos una funci
on de Lyapunov V () que lo asegura
V ()
V () =
[f () + g () ()] W () , D

Dise
no del control verdadero por backstepping
Cambio de coordenadas Como no se puede implementar el control virtual
= (), definimos el error como una nueva variable
z = ()
Escribiendo el sistema en t
erminos de esta nueva variable se obtiene
= [f () + g () ()] + g () z
()
z = u [f () + g () ] .
Si se dise
na la variable de control como
()
u=
[f () + g () ] + v

entonces el sistema se describe como


= [f () + g () ()] + g () z
z = v .

Comentario 48 N
otese que este sistema tiene la misma estructura que el
sistema original: Un integrador en cascada con un sistema no lineal. Pero
hay una diferencia fundamental: el sistema
= [f () + g () ()] + g () z
tiene un punto de equilibrio asint
oticamente estable cuando la entrada
z = 0. Esto no es siempre el caso en el sistema inicial.

Dise
no del control por Lyapunov El dise
no se realiza proponiendo una
funci
on candidata de Lyapunov, en nuestro caso se puede usar
1
Vc (, ) = V () + z 2 .
2
El control v se elige de tal forma que V c
V ()
V ()

g () z + zv
Vc =
[f () + g () ()] +

sea negativa definida. Aqui se propone


v=

V ()
g () z kz , k > 0

con lo que
V c W () kz 2
El control finalmente resulta ser
()
V ()
u=
[f () + g () ]
g () z kz , k > 0

Comentario 49 En este caso, y en contraste con la secci


on anterior, la
suma de las funciones de Lyapunov para los sistemas individuales se convierte en una funci
on de Lyapunov para el sistema en cascada! Esto es
gracias a la acci
on del control!

Comentario 50 Tambi
en a diferencia de la secci
on anterior el subsistema
esclavo de la cascada no tiene que ser estable con entrada cero, sino que
se puede estabilizar mediante el control virtual!
Ejemplo 51 Considere el sistema
x 1 = x21 x31 + x2
x 2 = u ,
x1 , x2 , u R
Una ley de control virtual para el primer sistema
x2 = (x1) = x21 x1
estabiliza globalmente el origen de
x 1 = x1 x31
como lo prueba la funci
on de Lyapunov
1 2
V (x1) = x1 = V = x21 x41 < 0 , x1 R
2

Introduciendo el cambio de variables


z2 = x2 (x1) = x2 + x1 + x21
el sistema se puede representar como
x 1 = x1 x31 + z2

3
z2 = u + (1 + 2x1) x1 x1 + z2
Se propone como candidata a Funci
on de Lyapunov
1 2 1 2
Vc (x) = x1 + z2
2
2
cuya derivada
V c =
=

i
3
3
x1 x1 x1 + z2 + z2 u + (1 + 2x1) x1 x1 + z2
h

i
2
4
3
x1 x1 + z2 x1 + (1 + 2x1) x1 x1 + z2 + u

eligiendo
u = x1 (1 + 2x1)

x1 x31

+ z2 z2

se hace negativo definida


V c = x21 x41 z22
=

x21

x41

2
2
x2 + x1 + x1

El m
etodo puede ser aplicado recursivamente!
Ejemplo 52 Considere el sistema
x 1 = x21 x31 + x2
x 2 = x3 ,
x 3 = u ,
Para el sistema esclavo
x 1 = x21 x31 + x2
x 2 = x3 ,

una ley de control virtual es


x3 = x1 (1 + 2x1)

x1 x31

+ z2 z2 = (x1, x2)

estabiliza globalmente el origen como lo prueba la funci


on de Lyapunov
1 2 1 2
V = x1 + z2 = V = x21 x41 z22 < 0 , (x1, x2) R2
2
2
Introduciendo el cambio de variables
z3 = x3 (x1, x2)
el sistema se puede representar como
x 1 = x21 x31 + x2
x 2 = (x1, x2) + z3 ,

2
3
z3 = u x x1 x1 + x2 x
( + z3) ,
1

Se propone como candidata a Funci


on de Lyapunov
1
Vc (x) = V + z32
2
cuya derivada

V
V 2
3

x x1 + x2 +
(z3 + ) +
Vc =
x"1 1
x2
#

x21 x31 + x2
(z3 + )
+ z3 u
x1
x2
2
2
x2 + x1 + x1 +
=

V
2
3
+ z3

x x1 + x2
x2 x1 1

x21
"

x41

(z3 + ) + u
x2

eligiendo

V
2

3
u=
+
x x1 + x2 +
(z3 + ) z3
x2 x1 1
x2

se hace negativa definida.

2.4.2.

Un caso m
as general

La idea del backstepping puede generalizarse al sistema


= f () + g ()
= fa (, ) + ga (, ) u , ga (, ) 6= 0 ,
d
onde Rn , R , u R.
Mediante la ley de control
u=

1
[v fa (, )]
ga (, )

el sistema se convierte en
= f () + g ()
= v ,
que est
a en la forma original.

2.4.3.

Sistema en la Forma de Retroalimentaci


on Estricta

Aplicando la idea anterior en forma recursiva se puede concluir que la idea


de Backstepping puede ser utilizada a sistemas en la forma de retroali-

mentaci
on estricta, es decir, un sistema descrito por
x = f0 (x) + g0 (x) z1
z1 = f1 (x, z1) + g1 (x, z1) z2 ,
z2 = f2 (x, z1, z2) + g2 (x, z1, z2) z3 ,
...

zk1 = fk1 x, z1, , zk1 + gk1 x, z1, , zk1 zk ,


zk = fk (x, z1, , zk ) + gk (x, z1, , zk ) u ,
para todo x Rn, z1, , zk R y
gi (x, z1, , zi) 6= 0 para 1 i k
Ejercicio 53 Halle el grado relativo si y = z1
Ejercicio 54 Halle la Din
amica Cero si y = z1 y
fi (x, 0) = 0 para 1 i k

Comentario 55 N
otese que el subsistema z es linealizable por retroalimentaci
on. As que el sistema en la forma de retroalimentaci
on estricta es
linealizable parcialmente (entrada/salida). As que el Backstepping se aplica esencialmente a la clase de sistemas que son linealizables parcialmente.
Ejemplo 56 Considere el sistema
= + 2
= u .
El sistema esclavo
= + 2
con la ley de control virtual
= 0 = =

tiene el punto de equilibrio GEE, y


1 2
V0 = = V 0 = 2 , R
2
es una funci
on de Lyapunov. Se propone como candidata a Funci
on de
Lyapunov a

1 2
2
V =
+
2

cuya derivada es

V =

+ 2

+ u =

+u

que se puede hacer negativa definida eligiendo el control


u = 3 k , k > 0
V = 2 k 2 < 0 , (, ) R2

2.4.4.

Backstepping en bloques

La idea del backstepping puede generalizarse al sistema de m


ultiples entradas
= f () + G ()
= fa (, ) + Ga (, ) u , det Ga (, ) 6= 0 ,
d
onde Rn , Rp , u Rp. Suponga que existe una ley de control
retroalimentado suave
= () , (0) = 0
que estabiliza el origen de
= f () + G () ()

y que, adem
as, conocemos una funci
on de Lyapunov V (), suave y positiva
definida, que lo asegura
V ()
V () =
[f () + G () ()] W () , D

para alguna funci


on W () positiva definida.
Considere la funci
on candidata de Lyapunov
1
[ ()]T [ ()] .
2
El control u se elige de tal forma que V c
Vc (, ) = V () +

V ()
V ()
[f () + G () ()] +
G () ( ()) +
V c =

"
#
()
T
+ [ ()] fa (, ) + Ga (, ) u
(f () + G () )

sea negativa definida. El control

u = G1
a (, )

!T

()
V ()
(f () + G () )
G ()

fa (, ) k ( ())] , k > 0

resulta en
V ()

[f () + G () ()] k ( ())T ( ())


Vc =

W () k ( ())T ( ())

que muestra que el origen (, ) = (0, 0) es asint


oticamente estable.

2.5.

Control basado en pasividad

La propiedad de pasividad, que poseen algunos sistemas, puede ser usada


para el dise
no de controladores.

2.5.1.

Idea b
asica

Considere el sistema
:

x = f (x, u) , x Rn , u Rp
y = h (x) , y Rp
f (0, 0) = 0 , h (0) = 0

Definici
on 57 El sistema es pasivo si existe una funci
on de almacenamiento de energa V (x), contnuamente diferenciable y positiva semidefinida,
tal que
V (x)
V =
f (x, u) uT y, x Rn , u Rp
x
Definici
on 58 El sistema es de estado cero observable si la u
nica trayectoria del sistema con entrada u = 0
x = f (x, 0)
que puede hacer la salida cero, es decir, que puede permanecer en el conjunto {h (x) = 0} es la soluci
on trivial x (t) 0.
Un resultado b
asico de estabilizaci
on asint
otica para sistemas pasivos es el
siguiente

Teorema 59 Si el sistema es
1. Pasivo, con funci
on de almacenamiento positiva definida y radialmente no
acotada, y
2. de estado cero observable
entonces el origen x = 0 puede ser estabilizado global y asint
oticamente
mediante la ley de control
u = (y)
d
onde es cualquier funci
on localmente Lipschitz, tal que (0) = 0 y es
pasiva
y T (y) > 0 , y 6= 0

Prueba. Use la funci


on de almacenamiento V (x) como candidata a funci
on
de Lyapunov para el sistema en lazo cerrado
x = f (x, (y))
Su derivada es
V (x)
V =
f (x, u) y T (y) 0
x
negativa semidefinida. Adem
as V = 0 si y s
olo si y = 0. De la propiedad
de estado cero observable se concluye
y (t) 0 = u (t) = (y (t)) 0 = x (t) 0
Por el principio de invariancia de Lasalle el origen es global y asint
oticamente estable.
Recu
erdese que, si la funci
on de almacenamiento es positiva definida, el
origen del sistema pasivo es estable, y que la interconexi
on en retroalimentaci
on negativa de sistemas pasivos es pasiva. Por lo tanto el teorema

se puede interpretar de la siguiente manera: la no linealidad pasiva inyecta amortiguamiento al sistema, haciendo que las trayectorias converjan
al origen.
N
otese que hay una gran libertad de elecci
on en la forma de la funci
on de
inyecci
on de amortiguamiento : por ejemplo, se pueden satisfacer restricciones de acotamiento de la entrada.
Ya que el teorema s
olo es u
til para sistemas pasivos, su utilidad se incrementa si se pueden convertir sistemas no pasivos en pasivos. Hay dos
formas b
asicas de hacer pasivo a un sistema:

1. Mediante la selecci
on de la salida

2. Por retroalimentaci
on de estados, o

ambos.

2.5.2.

Pasivizaci
on por elecci
on de la salida

Considere el sistema afn en las entradas

x = f (x) + G (x) u

y suponga que existe una funci


on V (x) contnuamente diferenciable, positiva definida, tal que
V (x)
f (x) 0 , x
x
Entonces el sistema es pasivo con respecto a la salida
"

y = h (x) ,

#T

V (x)
G (x)
x

ya que
V (x)
V (x)

[f (x) + G (x) u]
G (x) u = y T u .
V =
x
x
Si adicionalmente es de estado cero observable, entonces puede utilizarse
el teorema para estabilizar asint
oticamente el origen.
Comentario 60 N
otese que no existe una u
nica salida pasiva. Para cada
elecci
on de V (x) se obtiene una salida pasiva (posiblemente) diferente.

Considere, por ejemplo, como funci


on de Lyapunov alternativa
W (x) = (V (x))
d
onde es una funci
on tipo K, contnuamente diferenciable (K para
el caso global). Entonces una salida pasiva con esta funci
on de Lyapunov
sera
"

(x) , W (x) G (x)


y = h
x

#T

"

= 0 (V (x))

#T

V (x)
G (x)
x

Ejemplo 61
x 1 = x2 ,
x 2 = x31 + u .
Con u = 0
1 4 1 2
V (x) = x1 + x2 = V = x31x2 x2x31 = 0
4
2

= 0 (V (x)) h (x) .

El sistema es pasivo con respecto a la salida


y=

V (x)
V (x)
G (x) =
= x2
x
x2

Es de estado cero observable? Si


con u = 0, y (t) 0 = x (t) 0
Aplicando el teorema el origen se puede estabilizar global y asint
oticamente
con cualquier pasiva, como por ejemplo

2k
u = kx2 , o u =
tan1 x2 , k > 0

2.5.3.

Pasivizaci
on por retroalimentaci
on de estados

La pasivizaci
on por elecci
on de la salida exige que el sistema tenga un
punto de equilibrio estable, por lo que muchos sistemas no pueden ser
pasivizados por tal m
etodo. Para poder considerar sistemas no estables, se
requiere utilizar una retroalimentaci
on preliminar.

Definici
on 62 El sistema
(

A :

x = f (x) + G (x) u , x Rn , u Rp
y = h (x) , y Rp

es equivalente por retroalimentaci


on a un sistema pasivo si existe
u = (x) + (x) v

tal que
x = f (x) + G (x) (x) + G (x) (x) v , x Rn , v Rp
y = h (x) , y Rp
sea pasivo.

Comentario 63 Esta definici


on es an
aloga a la de sistemas linealizables por
retroalimentaci
on. Una diferencia importante es que en la de pasivizaci
on
no se requiere de una transformaci
on de estados, ya que la pasividad, a
diferencia de la linealidad, es una propiedad invariante ante transformaciones del estado.

No cualquier sistema puede ser pasivizado mediante retroalimentaci


on de
estados.

Teorema 64 El sistema
(

A :

x = f (x) + G (x) u , x Rn , u Rp
y = h (x) , y Rp

es localmente equivalente por retroalimentaci


on a un sistema pasivo, con
funci
on de almacenamiento positiva definida, si:

1. En x = 0 el sistema tiene grado relativo uno, y

2. Es de fase mnima d
ebil, es decir, la din
amica cero tiene un punto de equilibrio estable en el origen, con una funci
on de Lyapunov positiva definida.

Prueba. Se har
a la prueba para el caso SISO. Si el grado relativo es = 1 se
puede llevar a la Forma Normal mediante un difeomorfismo local z = T (x)

= f0 (, )
Forma Normal:
= Lf h (x) + Lg h (x) u

y=

Por la segunda hip


otesis la din
amica cero
= f0 (, 0)
tiene un punto de equilibrio estable en = 0 y existe una funci
on de
Lyapunov W () tal que
= W () f0 (, 0) 0
W

en una vecindad del origen.


Como se asume que todas las funciones son suaves resulta que, en particular, f0 (, ) es contnuamente diferenciable. Por el teorema del valor medio

del c
alculo diferencial se sabe que existe una funci
on contnua F (, ) tal
que
f0 (, )
, (0, )

"Z
#
1 f0 (, )
=
d

f0 (, ) f0 (, 0) =

, F (, )
Considere como funci
on de almacenamiento del sistema a
1
V (, ) = W () + 2
2
Su derivada temporal a lo largo de las trayectorias del sistema, cuando se
aplica un control por retroalimentaci
on de estados
"

u=

1
W ()

F (, y) Lf h (x) + v
Lg h (x)

es
h
i
W
()
V =
f0 (, ) + Lf h (x) + Lg h (x) u

h
i
W ()
W ()
=
f0 (, 0) +
[f0 (, y) f0 (, 0)] + y Lf h (x) + Lg h (x) u

"
#
W ()
W ()
f0 (, 0) + y
F (, y) + Lf h (x) + Lg h (x) u yv
=

Ejemplo 65 Manipulador rob


otico con p articulaciones
M (q) q + C (q, q)
q + Dq + g (q) = u , q, u Rp
d
onde
M =

MT

>0,

2C
M

2C
= M

, D = DT 0

El objetivo es estabilizar el sistema en el punto q = qr . Definiendo el error


de regulaci
on
e = q qr , e = q
la din
amica en estas variables queda
M (q) e + C (q, q)
e + De + g (q) = u
N
otese que (e, e)
= (0, 0) no es un punto de equilibrio con u = 0. Con el
control
u = g (q) p (e) + v
d
onde
p (0) = 0 , eT p (e) > 0 , e 6= 0
el sistema en lazo cerrado se convierte en
M (q) e + C (q, q)
e + De + p (e) = v

La funci
on positiva definida
Z

e
1 T
V = e M (q) e +
T
p () d
2
0

tiene como derivada

1
1
1
(q) e + T
V = eT M (q) e + e T M (q) e + e T M
p (e) e
2
2
2
1
1
= [C (q, q)
e De p (e) + v]T e + e T [C (q, q)
e De p (e) + v] +
2
2
1 T
+ e M (q) e + T
p (e) e
2
i
1 Th
Tv
= e M 2C e e T De e T p (e) + T
(e)
e

+
e

p
2
= e T De + e T v e T v
Entonces, si se elige la salida y = e el sistema es pasivo, y V es una funci
on
de almacenamiento positiva definida (es radialmente no acotada?)

Es el sistema de estado cero observable? Si, ya que con v = 0


y (t) = e (t) 0 = e (t) 0 = p (e (t)) 0 = e (t) 0 .
Entonces se puede aplicar el teorema b
asico: el origen puede ser estabilizado
asint
oticamente (Globalmente?) aplicando una ley de control
v = d (e)

d
onde
d (0) = 0 , e T d (e)
> 0 , e 6= 0 .
El control final queda
u = g (q) p (e) d (e)

que contiene un t
ermino proporcional y uno derivativo. Un caso especial
corresponde a funciones lineales
u = g (q) Kpe Kde , Kp = KpT > 0 , Kd = KdT > 0 .

C
omo se comparan el control basado en pasividad con la linealizaci
on por
retroalimentaci
on?
Ejemplo 66 Considere el sistema

con

x 1 = x2
x 2 = h (x1) + u
h (0) = 0 , x1h (x1) > 0 , x1 6= 0

Dise
no por linealizaci
on por retroalimentaci
on:
u = h (x1) (k1x1 + k2x2)
"

x =

0
1
k1 k2

Dise
no basado en pasividad: Considere la funci
on de almacenamiento de
energa
V (x) =

Z x
1
0

1 2
h (z) dz + x2
2

V = h (x1) x2 x2h (x1) + x2u = x2u


Entonces el sistema es pasivo si la salida es
y = x2
Es el sistema de estado cero observable? Si, ya que con u = 0
y (t) = x2 (t) 0 = h (x1 (t)) 0 = x1 (t) 0 .
Entonces la ley de control
u = (x2) ,

(0) = 0 , x2 (x2) > 0 , x2 6= 0


estabiliza asint
oticamente (globalmente?) el origen de
x 1 = x2
x 2 = h (x1) (x2)

Linealizaci
on:

"

x =

0
1
h0 (0) k

x , k = 0 (0)

El polinomio caracterstico es
s2 + ks + h0 (0) = 0
s

k
s1,2 =
2

2
k

h0 (0)

cuando k vara entre 0 ,quna de las races no puede moverse a la


izquierda del punto Re [s] = h0 (0)
Ventajas/Desventajas del control basado en pasividad:
1. Ventaja: El control basado en pasividad no requiere un modelo de la
funci
on no lineal h (x1), por lo que es robusto ante variaciones en ella,
2. Ventaja: Flexibilidad en la elecci
on de (x2), para satisfacer restricciones de la entrada.
3. Desventaja: la velocidad de convergencia no puede ser asignada arbitrariamente.
La desventaja del dise
no en el ejemplo anterior puede subsanarse

Ejemplo 67 Considere el sistema


x 1 = x2
x 2 = h (x1) + u
con
h (0) = 0 .
N
otese que no se requiere la pasividad de h!
Este sistema no es, en general, pasivo (si h no lo es), pero es pasivizable
por retroalimentaci
on de estados, ya que es de grado relativo 1 y de fase
mnima, cuando la salida es y = x2. La ley de retroalimentaci
on de los
estados
u = (x1) + v

d
onde
(0) = 0 , x1 [h (x1) + (x1)] > 0 , x1 6= 0
convierte al sistema en lazo cerrado en
x 1 = x2
x 2 = h (x1) (x1) + v
Este sistema, con salida
y = x2
es pasivo, con funci
on de almacenamiento de energa
V (x) =

Z x
1
0

1 2
[h (z) + (z)] dz + x2
2

V = [h (x1) + (x1)] x2 x2 [h (x1) + (x1)] + x2v = x2v

Adem
as, el sistema es de estado cero observable, ya que con v = 0
y (t) = x2 (t) 0 = [h (x1 (t)) + (x1 (t))] 0 = x1 (t) 0 .
Entonces la ley de control
v = (x2) ,
(0) = 0 , x2 (x2) > 0 , x2 6= 0
es decir,
u = (x1) (x2)
estabiliza asint
oticamente (globalmente?) el origen de
x 1 = x2
x 2 = h (x1) (x1) (x2)

Linealizaci
on:
"

x =

0
1

h0 (0) + k2 k1

x , k1 = 0 (0) , k2 = 0 (0)

El polinomio caracterstico es
s2

+ k1 s +

h0 (0) + k

i
2

=0

al que se le pueden asignar las races!


N
otese que siempre es posible elegir (x1) de tal forma que la condici
on
x1 [h (x1) + (x1)] > 0 , x1 6= 0
sea satisfecha. T
omese por ejemplo a
(x1) = h (x1) + k2x1 ,
(x1) = h (x1) + (x1) , x1 (x1) > 0 , x1 6= 0

2.5.4.

Una clase de sistemas en cascada

La pasivizaci
on por retroalimentaci
on puede ser aplicada, en particular, a
la clase de sistemas en cascada
z = f0 (z, y)
x = f (x) + G (x) u
y = h (x)
Si f0 (z, y) es suficientemente suave, por el teorema del valor medio se
puede escribir como
f0 (z, y) = f0 (z, 0) + [f0 (z, y) f0 (z, 0)]
#
"Z
1 f0 (z, sy)
ds y
= f0 (z, 0) +
y
0

, fa (z) + F (z, y) y

de tal forma que el sistema en cascada adquiere la forma


z = fa (z) + F (z, y) y
x = f (x) + G (x) u
y = h (x)
d
onde
fa (0) = 0 , f (0) = 0 , h (0) = 0
las funciones fa, F , f , G son localmente Lipschitz y h es contnua. Se
asume que:

la representaci
on es global,

el sistema maestro es pasivo, con una funci


on de almacenamiento
V (x) positiva definida y radialmente no acotada, y

el origen del sistema esclavo sin entrada z = fa (z) es un punto de


equilibrio estable, y se conoce una funci
on de Lyapunov W (z), positiva
definida y radialmente no acotada, que satisface
W (z)
fa (z) 0 , z
z

Usando
U (z, x) = W (z) + V (x)
W (z)
W (z)
V (x)
V (x)

U =
fa (z) +
F (z, y) y +
f (x) +
G (x) u
z
z
x
x

!T
W (z)
T

y u+
F (z, y)
z

Mediante el control en retroalimentaci


on

u=

!T

W (z)
F (z, y)
z

+v

resulta que
U y T v
Por lo tanto el sistema
z = fa (z) + F (z, y) y

x = f (x) G (x)

W (z)
z F

(z, y)

+ G (x) v

y = h (x)
es pasivo, con funci
on de almacenamiento U . Si el sistema es de estado
cero observable, entonces se puede estabilizar asint
oticamente mediante
una retroalimentaci
on pasiva de la salida.

Ejemplo 68 El movimiento rotacional de un cuerpo rgido que posee tres


torques de control escalares independientes puede ser modelado por
1
2

+ S () + T

= I3
M = S () M + u
d
onde R3 es el vector de velocidades, y R3 es una selecci
on particular de los par
ametros cinem
aticos que conducen a una representaci
on
tridimensional del grupo rotacional. La matriz

x3 x2

0
x1
x2 x1
0
es antisem
etrica, M es una matriz de inercia sim
etrica y positiva definida,
e I3 es la matriz identidad de dimensi
on 3 3.

S (x) = x3

Tomando y = el sistema tiene la forma de la cascada, con el sistema

maestro
M = S () M + u
y=
y el sistema esclavo
i
1h
T
=
I3 + S () + .
2

El sistema maestro es pasivo, con funci


on de almacenamiento
1 T
V () = M
2
1 T
1 T

V = M + M
2
2
h
i
i
1 T
1h
T
T
T
=
M S () + u + S () M + u = y T u
2
2

ya que

x3 x2
x1

0
x1 x2 =
x2 x1
0
x3

S (x) x = x3

x3x2 + x2x3

x3x1 x1x3 = 0
x2x1 + x1x2

El sistema esclavo sin entrada ( = 0)


= 0
tiene un punto de equilibrio en = 0 y cualquier funci
on W () contnuamente diferenciable, positiva definida y radialmente no acotada es una
funci
on de Lyapunov.
Por lo tanto, todas las hip
otesis son satisfechas y el sistema puede ser
pasivizado mediante el control

u=

W () 1 h

I3 + S () + T

!
i T

+v

Eligiendo
W () = k ln

1 + T

, k>0

se obtiene

u=

kT
1 + T

I3 + S () + T

!
i T

+ v = k + v

y el sistema resultante es
1
2

+ S () + T

= I3
y
M = S () M k + v
y=
Este sistema es de estado cero observable, ya que con v = 0
y (t) 0 (t) 0 = (t) 0 = (t) 0 .
Por lo tanto puede ser estabilizado global y asint
oticamente mediante la

ley de control
u = k ()
con
(0) = 0 , y T (y) > 0 , y 6= 0 .

2.5.5.

Un caso especial

Si se imponen condiciones m
as fuertes sobre el sistema esclavo, no se
requiere probar que el todo el sistema interconectado es de estado cero
observable.

Teorema 69 Para el sistema en cascada


z = fa (z) + F (z, y) y
x = f (x) + G (x) u
y = h (x)
suponga que

el sistema maestro es de estado cero observable

el sistema maestro es pasivo, con una funci


on de almacenamiento V (x)
positiva definida y radialmente no acotada, y

el origen del sistema esclavo sin entrada z = fa (z) es un punto de equilibrio


global y asint
oticamente estable, y se conoce una funci
on de Lyapunov

W (z), positiva definida y radialmente no acotada, que satisface


W (z)
W (0)
fa (z) < 0 , z 6= 0 , y
=0
z
z

entonces el origen (z, x) = (0, 0) del sistema puede ser global y asint
oticamente estabilizado mediante la ley de control

u=

!T

W (z)
F (z, y)
z

(y)

con
(0) = 0 , y T (y) > 0 , y 6= 0 .

Prueba. Usando U como candidata a funci


on de Lyapunov del sistema del
sistema en lazo cerrado se obtiene
W (z)
U =
fa (z) y T (y) 0
z
Adicionalmente
U (t) 0 = (z (t) 0 , y (t) 0) = u (t) 0 = x (t) 0 ,
d
onde la u
ltima implicaci
on resulta de la hip
otesis de que el sistema maestro
es de estado cero observable. Se concluye estabilidad global y asint
otica
de la aplicaci
on del principio de invariancia de Lasalle.

Ejemplo 70 Considere el sistema


= + 2
= u

Con la salida y = el sistema tiene la forma en cascada. El sistema maestro


es pasivo con funci
on de almacenamiento V () = 2/2 y es claramente
de estado cero observable, ya que y = . El origen del sistema esclavo
sin entrada = es global y exponencialmente estable con funci
on de
Lyapunov W () = 2/2. Las condiciones del teorema anterior se satisfacen
y una ley de control estabilizante es

u = 3 k

que es el mismo control obtenido por backstepping.

2.6.

Funciones de Lyapunov de control

Considere el sistema SI
x = f (x) + g (x) u
f (0) = 0 , x Rn , u R
y suponga que existe una ley de control por retroalimentaci
on de los estados
u = (x)
contnua, tal que el origen del sistema en lazo cerrado
x = f (x) + g (x) (x)
es asint
oticamente estable.

Por el teorema converso de Lyapunov, existe una funci


on de Lyapunov
V (x) tal que
V (x)
[f (x) + g (x) (x)] < 0 , x D , x 6= 0
x
Si u = (x) estabiliza globalmente al origen, entonces D = Rn y V (x)
es radialmente no acotada.

De la desigualdad
V (x)
[f (x) + g (x) (x)] < 0 , x D , x 6= 0
x
se concluye que
V (x)
V (x)
g (x) = 0 , para alg
un x D , x 6= 0 =
f (x) < 0
x
x

Adem
as, ya que (x) es contnua, y (0) = 0, > 0 , > 0 tal que si
x 6= 0 y kxk < existe u con kuk < tal que
V (x)
[f (x) + g (x) u] < 0
x
Propiedad de control peque
no
Definici
on 71 Una funci
on V (x), contnuamente diferenciable y positiva
definida, es una Funci
on de Lyapunov de Control (FLC) para el sistema
x = f (x) + g (x) u
si

V (x)
V (x)
g (x) = 0 , para alg
un x D , x 6= 0 =
f (x) < 0 (4)
x
x

Satisface la propiedad de Control Peque


no.

Es una Funci
on de Lyapunov de Control Global si es radialmente no acotada
y (4) se satisface para D = Rn.

El sistema
x = f (x) + g (x) u
es estabilizable por una ley de control retroalimentado contnua s
olo si este
posee una FLC.

Es esta condici
on suficiente?

Teorema 72 Sea V (x) una FLC para el sistema


x = f (x) + g (x) u ,
entonces el origen es estabilizable por

u = (x) =

V f +
x

0,
F
ormula de Sontag

2
4
V
+ x g

V g
x
V f
x

si

V (x)
x g (x)

6= 0

si

V (x)
x g (x)

=0.

La funci
on (x) es contnua para toda x D0 (una vecindad del orgen)
que incluye x = 0.
Si f y g son suaves, entonces (x) es suave para x 6= 0.
Sea V (x) una FLC global, entonces el control u = (x) estabiliza globalmente el origen.

Prueba. Para la prueba de las propiedades de v


ease [?, Secci
on 5.9] o
[?, Secci
on 9.4]. Ahora se probar
a que el control propuesto efectivamente
estabiliza el origen
V (x)
V =
[f (x) + g (x) (x)]
x
Consideremos dos casos:
Si

V (x)
x g (x)

= 0 entonces

V (x)
V (x)
[f (x) + g (x) (x)] =
f (x) < 0 para x 6= 0
x
x

Si

V (x)
x g (x)

6= 0
V
V
V =
f
g
x
x
s

V f
x

V
V
f +
g
x
x

V f 2 + V g 4
x
x

V g
x
4

< 0 para x 6= 0

Problema: C
omo se puede encontrar una Funci
on de Lyapunov de Control
(FLC)?
Si se conoce alg
un control estabilizante y una funci
on de Lyapunov correspondiente V , entonces V es una FLC.

Linealizaci
on por retroalimentaci
on

x = f (x) + G (x) u , z = T (x) , z = (A BK) z


P (A BK) + (A BK)T P = Q , Q = QT > 0
V (z) = z T P z = T T (x) P T (x) es una FLC

Mediante el dise
no de Backstepping se obtiene una FLC.

Ejemplo 73
x = ax bx3 + u , a, b > 0

Linealizaci
on por retroalimentaci
on:
u = (k + a) x + bx3 , k > 0 , = x = kx
1 2
V (x) = x es una FLC
2

V (x)
V (x)
3
g (x) = x ,
f (x) = x ax bx
x
x

V f
x

V f
x

V g
x

4
V
+ x g

ax bx3

x2 ax bx

=
r

(x) =

ax + bx3

a bx2

2
3

+1

+ x4

Comp
arela con
u = ax + bx3 kx , k > 0 .
M
etodo
LR-u
LR-LCerr
FLC-u
FLC-L Cer

Expresi
on
ax + bx3kx
x =rkx
ax + bx3x
r
x = x

2
2
a bx

a bx2

+1

+1

Lema 74 Sea V (x) una FLC para el sistema


x = f (x) + g (x) u ,
y sup
ongase que
V (0)
=0.
x

peque
no |x|
(a + k) x
x = kx

a+

a2

+1 x

x = a2 + 1x

gran |x|
bx3
x = kx
ax
x = bx3

Entonces la f
ormula de Sontag tiene un m
argen de ganancia de
es decir, u = k (x) es estabilizante para toda k 21 .

1
2

Prueba. Sea

q (x) =

1 V

f+
2
x

V
f
x

V
g
x

, q (0) = 0 .

Si

V (x)
g (x) 6= 0 = q (x) > 0
x

Si

V (x)
g (x) = 0 = q (x) = 0
x

q (x) es positiva semidefinida.

, ,

u = k (x) = x = f (x) + g (x) k (x)


V (x)
V (x)
f (x) +
g (x) k (x)
V =
x
x
Si
Si
pero

V (x)
V (x)

g (x) = 0 = V =
f (x) < 0 para x 6= 0
x
x

V (x)
V (x)
V (x)
g (x) 6= 0 = V = q (x)+q (x)+
f (x)+
g (x) k (x)
x
x
x

V (x)
V (x)
q (x) +
f (x) +
g (x) k (x) =
x
x

s
2

V
1 V
V
f+
f +
g
k
2
x
x
x

2.7.

Retroalimentaci
on de la salida

En general la estabilizaci
on por retroalimentaci
on de la salida requiere el
uso de observadores. Sin embargo, en algunas ocasiones esto no se requiere
explcitamente. Se presentar
an aqui tres casos simples, en los cuales no es
necesario dise
nar un observador:

Sistemas con grado relativo uno y de fase mnima

Sistemas pasivos

Sistemas con mapas pasivos de la entrada a la derivada de la salida

2.7.1.

Sistemas con grado relativo uno y de fase mnima

Sea el sistema
x = f (x) + g (x) u
y = h (x)
f (0) = 0 , h (0) = 0 , Lg h (x) 6= 0 , x D Rn , u R

En su forma normal

(x)

(0) = 0 , Lg (x) 6= 0 =
h (x)
y
(

Forma Normal:

= f0 (, y)
y = (x) [u (x)] , (x) 6= 0

Supuestos:

El origen del sistema


= f0 (, 0)
es exponencialmente estable.
c1 kk2 V1 () c2 kk2

V1 ()
f0 (, 0) c3 kk2

V ()
1

c4 kk

kf0 (, y) f0 (, 0)k L1 |y|


| (x) (x)| L2 kk + L3 |y|
(x) 0 > 0
Retroalimentaci
on de salida de Alta Ganancia:
u = ky , k > 0
= f0 (, y)
y = (x) [u (x)] , (x) 6= 0

1
V (, y) = V1 () + y 2
2
V1 ()
V =
f0 (, y) k (x) y 2 (x) (x) y

V1 ()
V1 ()
f0 (, 0) +
=
[f0 (, y) f0 (, 0)] k (x) y 2 (x) (x) y

c3 kk2 + c4L1 kk |y| k0y 2 + L2 kk |y| + L3y 2


"

kk
|y|

#T "
|

c3
1 (c L + L )
2
2 4 1

{z
Q

1 (c L + L )
2
2 4 1
(k0 L3)

1
det Q = c3 (k0 L3) (c4L1 + L2)2
4

#"
}

kk
|y|

det Q > 0 si k >

L3
1
+
(c4L1 + L2)2
0
4c30

El origen del sistema en lazo cerrado es exponencialmente estable.


Si la suposici
on se satisface globalmente, entonces el origen es global y
exponencialmente estable

2.7.2.

Sistemas pasivos

Sup
onga que el sistema
(

x = f (x, u) , x Rn , u Rp
y = h (x, u) , y Rp

f (0, 0) = 0 , h (0, 0) = 0
es pasivo, con funci
on de almacenamiento de energa V (x), contnuamente
diferenciable y positiva definida
V (x)
f (x, u) uT y, x Rn , u Rp ,
V =
x
y de estado cero observable.
Entonces puede ser estabilizado mediante la ey de control por retroalimentaci
on de la salida
u = (y)
(0) = 0 , y T (y) > 0 , y 6= 0
V (x)

V =
f (x, u) uT y = y T (y) 0,
x

V = 0 = y (t) 0 = u (t) = (y (t)) 0 = x (t) 0

2.7.3.

Sistemas con mapas pasivos de u a y

Sea el sistema

x = f (x, u) , x Rn , u Rp
y = h (x) , y Rp

f (0, 0) = 0 , h (0) = 0 , h es connuamente diferenciable


Suponga que el sistema
(

d :

x = f (x, u) , x Rn , u Rp
h(x)
(x, u) , y Rp
y = x f (x, u) , h

es pasivo, con funci


on de almacenamiento de energa V (x), contnuamente
diferenciable y positiva definida
V (x)
f (x, u) uT y,
x Rn , u Rp ,
V =
x
y de estado cero observable
con u = 0 , y (t) 0 = x (t) 0 .
Entonces el sistema es estabilizable mediante una control de salida
derivativo
u = (y)
, (0) = 0 , z T (z) > 0 , z 6= 0
Problema: implementaci
on de la derivada y
Soluci
on pr
actica: derivada sucia

Caso escalar
bs
y = sy
y , a>0, b>0
s+a
Caso multivariable: Para 1 i p
y i = syi

bis
yi , ai > 0 , bi > 0
s + ai

Implementaci
on:
zi es la salida de

bis
con entrada yi
s + ai

ui = i (zi) , i (0) = 0 , ziT i (zi) > 0 , zi 6= 0


zi = aizi + biy i

Recu
erdese que la cascada del sistema lineal estrictamente pasivo
bis
Gi (s) =
s + ai
con la no linealidad pasiva
i (zi)
es estrictamente pasiva, con funci
on de almacenamiento
Wi (zi) = ki
ya que

Z z
i
0

i () d , ki > 0

i (zi) = kii (zi) [aizi + biy i] = aikizii (zi) + bikii (zi) y i


W
Entonces, con la candidata a funci
on de Lyapunov (positiva definida)
Vc (x, z) = V (x) +

Z
p
X
1 zi
i=1 bi 0

i () d

X 1
V (x)

Vc (x, z) =
i (zi) [aizi + biy i]
f (x, u) +
x
i=1 bi
p "
X

ai

+
i (zi) zi + i (zi) y i
bi
i=1
#
p
p "
X
X
a
=
i (zi) y i +
i i (zi) zi + i (zi) y i
bi
i=1
i=1
uT y

p
X
ai

i=1 bi

i (zi) zi < 0 , z 6= 0

se prueba la estabilidad asint


otica del origen del sistema en lazo cerrado.

Ejemplo 75 Estabilice el p
endulo
ml + mg sin = u

en = 1 usando retroalimentaci
on de
a

x1 = 1 , x2 = , u = T Tss = T sin
c
x 1 = x2
1 [mg sin (x + ) + u]
x 2 = ml
1
1
u = mg sin (x1 + 1) kpx1 + v , kp > 0
x 1 = x2
k
1 v
x 2 = mlp x1 + ml
y = x1
y = x2
1
1
2
V = kpx1 + mlx22
2
2

V
V

kp
1
= kpx1x2 + mlx2 x1 +
v
ml
ml
= x2v = yv
= Pasivo v y

Es de estado cero observable? Si


Con v = 0 , y (t) = x2 (t) 0 = x1 (t) 0 .
Control-Implementaci
on
F. de transferencia G (s) =

bs
: y (t) y z (t)
s+a

realizaci
on
= a + y
z = b (a + y)
v = kdz , kd > 0
u = mg sin kp ( 1) kdz

Captulo 3
Estabilizaci
on Robusta

3.1.

Control por Modos Deslizantes

3.1.1.

Ejemplo introductorio

Considere el sistema
x 1 = x2
x 2 = h (x) + g (x) u , g (x) g0 > 0
Variedad deslizante (superficie):
s = a1x1 + x2 = 0
s (t) 0 = x 1 = a1x1
a1 > 0 = lm x1 (t) = 0
t

C
omo podemos llevar la trayectoria a la variedad s = 0?
C
omo podemos mantenerla all?
s = a1x 1 + x 2 = a1x2 + h (x) + g (x) u
Sup
ongase que

a x + h (x)
1 2

% (x)

g (x)

1
V = s2
2
V = ss = s [a1x2 + h (x)] + sg (x) u
"
#
a1x2 + h (x)
= sg (x)
+ sg (x) u
g (x)
|s| g (x) % (x) + sg (x) u

Si
(x) % (x) + 0 , 0 > 0
s > 0 , u = (x)
V |s| g (x) % (x) |s| g (x) (x)
|s| g (x) % (x) |s| g (x) (% (x) + 0) = g (x) 0 |s|
Si
s < 0 , u = (x)
V |s| g (x) % (x) + sg (x) u = |s| g (x) % (x) |s| g (x) (x)
|s| g (x) % (x) |s| g (x) (% (x) + 0) = g (x) 0 |s|
(

sign (s) =

1,
s>0
1 , s < 0

u = (x) sign (s)


V g (x) 0 |s| g00 |s|

V g00 2V

dV
g00 2dt
V
V (s(t))

2 V
g00 2t
V (s(0))

V (s (t))

1
V (s (0)) g00 t
2

|s (t)| |s (0)| g00t


s (t) llega a cero en tiempo finito!

Una vez llega a la superficie s = 0, la trayectoria no puede abandonarla


Cu
al es la regi
on de validez?
x 1 = x2
x 2 = h (x) g (x) (x) sign (s) ,
x 1 = a1x1 + s
s = a1x2 + h (x) g (x) (x) sign (s) ,
ss g00 |s| , si (x) % (x) + 0 , 0 > 0
1
V1 = x21
2
V 1 = x1x 1 = a1x21 + x1s a1x21 + |x1| c 0

|s| c , y |x1|
(

= |x1|

es invariante positivo si

c
a1
)

c
, |s| c
a1

a x + h (x)
1 2

% (x) en

g (x)

a x + h (x)
1 2

k1 < k , x

g (x)

u = k sign (s)
C
omo se puede reducir o eliminar el chattering(casta
neo)?

Reducir la amplitud de la funci


on signo:
s = a1x2 + h (x) + g (x) u
h

u=

(x)
a1x2 + h
g (x)

+v

s = (x) + g (x) v
#

"

(x) = a1 1

g (x)
g (x)
x2 + h (x)
h (x)
g (x)
g (x)

(x)

% (x) , (x) % (x) + 0


g (x)

v = (x) sign (s)

Reemplaar el sign por una funci


on de saturaci
on de gran pendiente:

u = (x) sat
(

sat (y) =

y,
si |y| 1
sign (y) , si |y| > 1

C
omo podemos analizar el sistema?

Para
Con c

|s| , u = (x) sign (s)

= |x1|

c
a1

, |s| c es invariante positivo.

La trayectoria llega a la boundary layer{|s| } en tiempo finito.

La boundary layer.es invariante positiva.

Dentro de la boundary layer:


x 1 = a1x1 + s
s = a1x2 + h (x) g (x) (x) s ,

x1x 1 a1x21 + |x1|

0<<1
x1x 1 (1 ) a1x21 , |x1|

a1

Las trayectorias llegan al conjunto invariante positivo


(

= |x1|
, |s|
a1

en tiempo finito.
Qu
e ocurre dentro de ?
Encuentre los puntos de equilibrio
0 = a1x1 + s = x2
0 = a1x2 + h (x) g (x) (x) s ,

h (x)

(x1) =

a1g (x) (x)

x2 =0

x1 = (x1)
Sup
ongase que x1 = (x1) tiene una raz aislada x
1 = k1
h (0) = x
1 = 0
z1 = x1 x
1 , z2 = s a1x
1
x2 = a1x1 + s = a1 (x1 x
1) + s a1x
1 = a1z1 + z2
z1 = a1x1 + s = a1z1 + z2
s
z2 = a1x2 + h (x) g (x) (x)

z + a1x
1
= a1 (a1z1 + z2) + h (x) g (x) (x) 2

z
z2 = l (z) g (x) (x) 2

"

l (z) = a1 (z2 a1z1) + a1g (x) (x)

h (x)
x

1
a1g (x) (x)

z1 = a1z1 + z2
z2 = l (z) g (x) (x) z2
l (0) = 0 , |l (z)| l1 |z1| + l2 |z2|
g (x) (x) g00
1 2 1 2
V = z1 + z2
2
2

z
V = z1 (a1z1 + z2) + z2 l (z) g (x) (x) 2

g00 2
2
2
a1z1 + (1 + l1) |z1| |z2| + l2z2
z
2
"

|z1|
|z2|

"
1
a1
(1 + l1)
2

g 0 0
1 (1 + l )
1
2
l2
|
{z
}
Q

#T

g
1
det Q = a1 0 0 l2 (1 + l1)2

4
h (0) = 0 = lm x (t) = 0
t

"

h (0) 6= 0 = lm x (t) =
t

x
1
0

|z1|
|z2|

L
ease la secci
on 14.1.1 del libro de Khalil.

3.1.2.

Sistemas con control escalar

Consid
erese un sistema en la Forma Regular
(

= fa (, )
= fb (, ) + g (, ) u + (t, , , u)

Rn1 , R , u R
fa (0, 0) = 0 , fb (0, 0) = 0 , g (, ) g0 > 0 .
El dise
no se realiza en dos fases:

Fase 1:
Variedad de Deslizamiento (Superficie Deslizante):
s = () = 0 , (0) = 0
s (t) 0 = = fa (, ())
Dis
en
ese () de tal forma que el origen de = fa (, ()) sea asint
oticamente estable.

Fase 2:
Dise
ne el control de tal forma que las trayectorias converjan a s = 0 en
tiempo finito y permanezcan all a pesar de las perturbaciones e incertidumbres.

()
fa (, ) + g (, ) u + (t, , , u)
s = fb (, )

Sea

1
()
fb (, )
fa (, ) + v , o u = v
g (, )

o en forma compacta
u=

1
()

fa (, ) + v , L =
, o L=0
u = L fb (, )

g (, )

s = g (, ) v + (t, , , v)

(t, , , v) = fb


fa + gL fb
fa

Si se supone que

(t, , , v)

% (, ) + 0 |v|
g (, )

% (, ) 0 , 0 0 < 1 (conocidas)
1 2
V = s
2
V = ss = sg (, ) v + s (t, , , v) sgv + |s| ||
#
"


= g sv + |s|
g
g [sv + |s| (% (, ) + 0 |v|)]
Eligiendo
v = (, ) sign (s)

(, )

% (, )
+ 0 , 0 > 0
1 0

V = ss g [ |s| + % |s| + 0 |s| ]


= g [ |s| (1 0) + % |s|]
g [% |s| (1 0) 0 |s| + % |s|]
V = ss g (, ) (1 0) 0 |s| g0 (1 0) 0 |s|

V g00 2V

dV
g00 2dt
V
V (s(t))

g00 2t
2 V
V (s(0))

V (s (t))

1
V (s (0)) g00 t
2

|s (t)| |s (0)| g00t


s (t) llega a cero en tiempo finito!
Una vez llega a la superficie s = 0, la trayectoria no puede abandonarla
C
omo se puede reducir o eliminar el chattering(casta
neo)?
Reemplazar el sign por una funci
on de saturaci
on de gran pendiente:

u = (x) sat

C
omo podemos analizar el sistema?

, >0

ss g0 (1 0) 0 |s| para

|s| , u = (x) sign (s)

Entonces la trayectoria llega a la boundary layer{|s| } en tiempo


finito y permanece all para todo tiempo futuro.
Estudi
ese el comportamiento de
= fa (, () + s)
Qu
e conocemos acerca de este sistema y qu
e necesitamos?
1 (kk) V () 2 (kk)
V ()
fa (, () + s) 3 (kk) , kk (|s|)

|s| c = V 3 (kk) , kk (c)

(r) = 2 ( (r))
V () (c) V () 2 ( (c)) = 2 (kk) 2 ( (c))
= kk (c) = V 3 (kk) 3 ( (c))
El conjunto {V () c0}, con c0 (c), es invariante positivo
= {V () c0} {|s| c} , con c0 (c)
y todas las trayectorias que se inician en llegan a
= {V () ()} {|s| }
en tiempo finito.
Teorema 76 ([25, Theorem 14.1]) Sup
onga que todas las hip
otesis son
v
alidas en . Entonces, para toda condici
on inicial ( (0) , (0)) la
trayectoria ( (t) , (t)) est
a acotada para todo t 0 y llega al conjunto

invariante positivo en tiempo finito. Si las hip


otesis son v
alidas globalmente, y V () es radialmente no acotada entonces las conclusiones anteriores son v
alidas para cualquier condici
on inicial.
Teorema 77 ([25, Theorem 14.2]) Sup
onga que todas las hip
otesis son
v
alidas en .
% (0) = 0, 0 = 0
El origen de = fa (, ()) es exponencialmente estable.
Entonces existe > 0 tal que para toda 0 < < el origen del sistema
en lazo cerrado es exponencialmente estable y es un subconjunto de su
regi
on de atracci
on. Si las hip
otesis son v
alidas globalmente, entonces el
origen ser
a global, uniforme y asint
oticamente estable.

Ejemplo 78
x 1 = x2 + 1x1 sin x2
x 2 = 2x22 + x1 + u
|1| a , |2| b
x2 = kx1 = x 1 = kx1 + 1x1 sin x2
1 2
V1 = x1 = x1x 1 kx21 + ax21
2
Variedad deslizante (superficie):
s = kx1 + x2 = 0 , k > a
s = 2x22 + x1 + u + k (x2 + 1x1 sin x2)
u = x1 kx2 + v = s = v + (x)

(x) = 2x22 + k1x1 sin x2


| (x)| ak |x1| + bx22
(x) = ak |x1| + bx22 + 0 , 0 > 0
u = x1 kx2 (x) sign (s)

Estabilizar
a el control

s
u = x1 kx2 (x) sat

el origen?

Ejemplo 79 Forma Normal

= f0 (, )

=
i
i+1 , 1 i 1
= L h (x) + Lg L1h (x) u

f
f

y = 1

Considere a como la entrada del sistema

= f0 , 1, , 1,

i = i+1 , 1 i 2


1 =
Dise
ne

= , 1, , 1

para estabilizar el origen

s = , 1, , 1

Para sistemas de fase mnima:


El origen de = f0 (, 0) es asint
oticamente estable

s = + k11 + + k11

= f0 , 1, , 1, k11 k11

1
0
1
1

...

...
..

k1
k1
1
1

3.1.3.

Sistemas con control multivariable

Consid
erese un sistema en la Forma Regular
(

= fa (, )
= fb (, ) + G (, ) E (, ) u + (t, , , u)

Rnp , Rp , u Rp
fa (0, 0) = 0 , fb (0, 0) = 0 , det G (, ) 6= 0 , det E (, ) 6= 0 ,
fa , fb , E conocidos, G , inciertos,
G (, ) = diag [g1 (, ) , g2 (, ) , , gp (, )] , gi (, ) g0 > 0
El dise
no se realiza en dos fases:

Fase 1:
Variedad de Deslizamiento (Superficie Deslizante):
s = () = 0 , (0) = 0
s (t) 0 = = fa (, ())
Dis
en
ese () de tal forma que el origen de = fa (, ()) sea asint
oticamente estable.

Fase 2:
Dise
ne el control de tal forma que las trayectorias converjan a s = 0 en
tiempo finito y permanezcan all a pesar de las perturbaciones e incertidumbres.

()
s = fb (, )
fa (, ) + G (, ) E (, ) u + (t, , , u)

Sea

u=

E 1

"

L fb
fa + v

1 , o L = 0
, L=G

s i = gi (, ) vi + i (t, , , v) , 1 i p
Si se supone que

(t, , , v)
i

ax |vi| , 1 i p

% (, ) + 0 m
gi (, )
1ip

% (, ) 0 , 0 0 < 1 (conocidas)

1X 2
V =
si
2 i=1

sis i = sigivi + sii


(

!)

ax |vi|
gi sivi + |si| % (, ) + 0 m
1ip
Eligiendo

vi = (, ) sign (si) , 1 i p

% (, )
(, )
+ 0 , 0 > 0
1 0

sis i gi [ + % + 0] |si|
= gi [ (1 0) + %] |si|
gi [% (1 0) 0 + %] |si|
g00 (1 0) |si|
si (t) llega a cero en tiempo finito!
Una vez llega a la superficie s = 0, la trayectoria no puede abandonarla.
C
omo se puede reducir o eliminar el chattering(casta
neo)?
Reemplazar el sign por una funci
on de saturaci
on de gran pendiente:

s
vi = (x) sat i

, >0, 1ip

L
ease los teoremas 14.1 y 14.2 en Khalil [25].

3.2.

Redise
no de Lyapunov (o Control Mini-Max)

Considere el sistema no lineal


x = f (x) + G (x) [u + (t, x, u)]
f (0) = 0 , x Rn , u Rp
Modelo Nominal:
x = f (x) + G (x) u
Control estabilizante:
u = (x)
V (x)
[f (x) + G (x) (x)] W (x) , x D , W es p.d.
x

Control (redise
nado) robustificante:
u = (x) + v
Hip
otesis acerca de la perturbaci
on
k (t, x, (x) + v)k % (x) + 0 kvk , 0 0 < 1
El sistema con el control robustificante queda
x = f (x) + G (x) (x) + G (x) [v + (t, x, (x) + v)]
La funci
on de Lyapunov para sistema nominal usada como candidata a f.
de Lyapunov para el sistema perturbado
V
V

G [v + ]
V =
[f + G] +
x
x
Definiendo
wT

V
G
=
x

V
V =
[f + G] + wT v + wT
x
wT v + wT wT v + kwk kk wT v + kwk [% (x) + 0 kvk]
Eligiendo el control como
v = (x)

w
kwk

w
= sign (w) para p = 1
kwk

d
onde
(x)

% (x)
1 0

wT v + wT (x) kwk + kwk % (x) + 0 (x) kwk


= (x) (1 0) kwk + kwk % (x) 0
Luego
V W (x)

Entonces las trayectorias convergen asint


oticamente al punto de equilibrio
a pesar de las perturbaciones e incertidumbres.
Problemas:
1. Te
oricos con la existencia y unicidad de las soluciones, ya que el control
es discontnuo.
2. Pr
acticos debido al Chattering (casta
neo) producido por el control
discontinuo.
Para resolver este segundo problema se puede aproximar el control discontinuo por un control contnuo de alta ganancia
(

v=

w , si (x) kwk
(x) kwk

2 (x) w
,

si (x) kwk <

En la regi
on
(x) kwk = V W (x)
En la regi
on (x) kwk <

w
V W (x) + wT 2 (x) +

2 (x)
W (x)
kwk2 + % (x) kwk + 0 kwk kvk

2
2
2
kwk + % kwk + 0 kwk2
W (x)

V W (x) + (1 0)

kwk2 + kwk

como
y2

+ y , para y 0

entonces
(1 0)

V W (x) +
, x D
4
Teorema 80 [25, Teorema 14.3]x (t) es uniforme y finalmente acotada por
una funci
on clase K de . Si las hip
otesis se satisfacen globalmente, y V
es radialmente no acotada, entonces x (t) es global, uniforme y finalmente
acotada.
Corolario 81 [25, Corolario 14.1] Si % (0) = 0 y (x) 0 > 0 se puede
recobrar la estabilidad uniforme y asint
otica.
Ejemplo 82 El modelo de un p
endulo con aceleraci
on horizontal del punto
de suspensi
on est
a dado por
h

i
T

m ` + A (t) cos = mg sin


`

Objetivo: estabilizar el p
endulo en el punto =
g
1
A (t)

x1 = , x2 = , a = , c =
, h (t) =
,
2
`
m`
`
x 1 = x2
x 2 = a sin x1 + cu + h (t) cos x1
El modelo nominal es
x 1 = x2
x 2 = a
sin x1 + cu
Control nominal (linealizaci
on exacta)

1
(x) =
sin x1
(k1x1 + k2x2)
c
c

Din
amica nominal en lazo cerrado
"

x =
|

0
1
x , V (x) = xT P x
k1 k2
{z
Hurwitz

Perturbaci
on
1
=
c

a
ca
c
c c
c c
sin x1 + h (t) cos x1
(k1x1 + k2x2) +
v
c
c
c


q
a
c c

c c

a
c

,
+
k 2 + k 2 k , |h (t)| H
0


1
2
c
c
c

| (x)|

(k kxk + H)
+ 0 |v| , (x) + 0 |v| , (0 < 1)
c
(x) =

(x)
H
, (x)
1 0
c (1 0)

V
w=
G = 2xT P
x
(

v=

"

0
1

= 2 (p12x1 + p22x2)

(x) sign (w) , si (x) |w|


si (x) |w| <
2 (x) w
,

1
u=
sin x1
(k1x1 + k2x2) + v
c
c

Ejercicio 83 Este control estabiliza el origen x = 0?

3.3.

Backstepping robusto

El backsteppingse aplica a sistemas en la forma de retroalimentaci


on
estricta
z1 = f1 (z1) + g1 (z1) z2 ,
z2 = f2 (z1, z2) + g2 (z1, z2) z3 ,
...

zk1 = fk1 z1, , zk1 + gk1 z1, , zk1 zk ,


zk = fk (z1, , zk ) + gk (z1, , zk ) u ,
d
onde
gi (z1, , zi) 6= 0 para 1 i k

Pero tambi
en puede aplicarse a sistemas en esta forma con perturbaciones
o incertidumbres
z1 = f1 (z1) + g1 (z1) z2 + 1 (z) ,
z2 = f2 (z1, z2) + g2 (z1, z2) z3 + 2 (z) ,
...

zk1 = fk1 z1, , zk1 + gk1 z1, , zk1 zk + k1 (z) ,


zk = fk (z1, , zk ) + gk (z1, , zk ) u + k (z) ,
si las incertudumbres satisfacen
|1 (z)| 1 (z1) ,
|2 (z)| 2 (z1, z2) ,
...

k1 (z) k1 z1 , , zk1 ,
|k (z)| k (z1, , zk ) ,
Para esto, cada control virtual
zi = i (z1, , zi1) ,

que debe ser suave, se dise


na para que sea robusto ante las incertidumbres
en su subsistema.
Ejemplo 84
x 1 = x2 + 1x1 sin x2
x 2 = 2x22 + x1 + u
|1| a , |2| b
1 = 1x1 sin x2 , 2 = 2x22
Dise
no:
Primer paso:
x 1 = x2 + 1x1 sin x2 , |1| = |1x1 sin x2| a |x1|

Control virtual
x2 = k1x1
1 2
agase k1 = 1 + a
V1 = x1 , V1 (k1 a) x21 , H
2
con lo que el control virtual estabiliza robustamente el origen x1 = 0.

Segundo paso: Mediante el cambio de variables


z2 = x2 + (1 + a) x1
x 1 = (1 + a) x1 + 1x1 sin x2 + z2
z2 = 1 (x) + 2 (x, ) + u
1 (x) = x1 + (1 + a) x2 , 2 (x, ) = (1 + a) 1x1 sin x2 + 2x22

1
1
Vc (x) = x21 + z22
2
2
V c x21 + z2 [x1 + 1 (x) + 2 (x, ) + u]
Primer M
etodo (Ejemplo 14.13 de Khalil):
u = x1 1 (x) kz2 , k > 0
V c x21 kz22 + z22 (x, )
Se restringe el an
alisis al conjunto compacto
c = {Vc (x) c}
|2| a (1 + a) |x1| + b |x2| , = m
ax |x2|
xc

x2 = z2 (1 + a) x1

|2| (1 + a) (a + b) |x1| + b |z2| ,


V c x21 kz22 + (1 + a) (a + b) |x1| |z2| + bz22
Se puede mostrar que (para cualquier c) eligiendo k suficientemente
grande se puede estabilizar exponencialmente al origen y c est
a contenido en la regi
on de atracci
on. Por lo tanto se obtiene estabilizaci
on
semiglobal del origen, pero no estabilizaci
on global!
Segundo M
etodo (Ejemplo 14.14 del Khalil): Aqui se combinan backstepping y Redise
no de Lyapunov
u = x1 1 (x) kz2 + v , k > 0
V c x21 kz22 + z2 [2 (x, ) + v]
|2| a (1 + a) |x1| + bx22 ,

v=

(x) sign (z2) , si (x) |z2|


2 (x) z2 ,
si (x) |z2| <

(x) = 0 + a (1 + a) |x1| + bx22 , 0 > 0 , > 0

V c x21 kz22 +
4
Se puede mostrar (h
agalo!) que este control estabiliza globalmente al
origen.

Captulo 4
Seguimiento

4.1.

Por Linealizaci
on Parcial

Considere el sistema SISO con grado relativo


x = f (x) + g (x) u
y = h (x)
f (0) = 0 , h (0) = 0 , x Rn , u R , y R
con grado relativo , 1 n, en D0 D Rn
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , 1 ; x D0
1

Lg Lf

h (x) 6= 0 ; x D0

Cambio de variables:
z = T (x) ,

(x)

(x)

Forma Normal:
= f0 (, )
i = i+1 , 1 i 1

1
= Lf h (x) + Lg Lf h (x) u
y = 1
f0 (0, 0) = 0
Se
nal de referencia r (t):

r (t) y todas sus derivadas hasta r() (t) son acotadas para todo t 0,
y la
esima derivada r() (t) es una funci
on contnua a tramos en t;

Se dispone de las se
nales r (t) , , r() (t) en lnea.

Objetivo:

lm [y (t) r (t)] = 0 .

Con el cambio de variables

r (t)

R = ...
, e=
r(1) (t)

1 r

...
=R ,
r(1)

el sistema (en la forma normal) queda


= f0 (, e + hR)
i

1
()
e = Ace + Bc Lf h (x) + Lg Lf h (x) u r (t)

d
onde

Ac =

0
0
...
0
0

1
0
...
0
0

0
1
...
0
0

...

0
0
...
0
0

0
0
...
1
0

, Bc = ...

Mediante el control retroalimentado (por linealizaci


on parcial)
u=

1
1

Lg Lf

h (x)

Lf h (x) + r() (t) + v

se obtiene (para la parte linealizable del sistema)


e = Ace + Bcv

que mediante el control por retroalimentaci


on lineal
v = Ke

e = (Ac BcK)e
|

{z
Hurwitz

lmt e (t) = 0

lmt [y (t) r (t)] = 0


Adem
as,
e (t) es acotado = (t) = e (t) + R (t) es acotado.
Qu
e ocurre con (t)?
= f0 (, ) = f0 (, e + R)

Tenemos dos casos:

1. Seguimiento Local: valores peque


nos de k (0)k, ke (0)k, kR (t)k
Sistema de Fase Mnima = El origen de = f0 (, 0) es
asint
oticamente estable
= (t) es acotada para k (0)k , ke (0)k ,
kR (t)k suficientemente peque
nos

2. Seguimiento Global: valores grandes de k (0)k, ke (0)k, kR (t)k

Qu
e condici
on se requiere del sistema = f0 (, ) ?

Ejemplo 85 Sea el sistema


x 1 = x2
x 2 = a sin x1 bx2 + cu
y = x1
e1 = x1 r , e2 = x2 r
e 1 = e2
e 2 = a sin x1 bx2 + cu r
1
u = [a sin x1 + bx2 + r k1e1 k2e2]
c
e 1 = e2
e 2 = k1e1 k2e2
Ver los resultados de simulaci
on en el ejemplo 13.21 del libro de Khalil.

4.2.

Seguimiento Robusto por Modos Deslizantes

Considere el sistema SISO con incertidumbre acoplada


x = f (x) + g (x) [u + (t, x, u)]
y = h (x)
f (0) = 0 , h (0) = 0 , x Rn , u R , y R
con grado relativo , 1 n, en D0 D Rn
Lg Li1
f h (x) = 0 , i = 1, 2, . . . , 1 ; x D0
1

Lg Lf

h (x) a > 0 ; x D0

Forma Normal:
= f0 (, )
i = i+1 , 1 i 1

1
= Lf h (x) + Lg Lf h (x) [u + (t, x, u)]
y = 1
f0 (0, 0) = 0
Se
nal de referencia r (t):

r (t) y todas sus derivadas hasta r() (t) son acotadas para todo t 0,
y la
esima derivada r() (t) es una funci
on contnua a tramos en t;

Se dispone de las se
nales r (t) , , r() (t) en lnea.

Objetivo:
lm [y (t) r (t)] = 0 .

Con el cambio de variables

r (t)

R = ...
, e=
r(1) (t)

1 r

...
=R ,
r(1)

el sistema (en la forma normal) queda


= f0 (, e + R)
e 1 = e2
...
e 1 = e

1
e = Lf h (x) + Lg Lf h (x) [u + (t, x, u)] r() (t)

Superficie Deslizante (viendo a e como control virtual):

s = k1e1 + + k1e1 + e ,

s (t) 0 = e = k1e1 + + k1e1

= f0 (, e + R)
e 1 = e2
...

e 1 = k1e1 + + k1e1
Dis
en
ense k1 k1 tales que la matriz

0
1
0
0
0
1
...
...
...
0
0
0
k1 k2 k3

0
0

0
0
...
...
...

0
1
k2 k1

sea Hurwitz .

Suposici
on 86 El sistema = f0 (, ) es BIBS (Bounded Input Bounded
State Stable).

s = k1e1 + + k1e1 + e =

1
X

kiei + e

i=1

s =

1
X
i=1

kiei+1 + Lf h (x) + Lg Lf

h (x) [u + (t, x, u)] r() (t)

1
X
1

() (t) + v

u=
k
e
+
L
h
(x)

r
i
i+1
f
1
Lg Lf h (x) i=1
1

s = Lg Lf

h (x) v + (t, x, v)

(t, x, v)

% (x) + 0 |v| , 0 0 < 1


L L1h (x)
g f

s
v = (x) sat

, >0

% (x)
(x)
+ 0 , 0 > 0
1 0
Ejercicio 87 Qu
e propiedades se pueden probar para esta ley de control?

Captulo 5
Regulaci
on robusta estructural:
Control Integral

[25, Secci
on 12.3]La regulaci
on es un caso especial del seguimiento, cuando
la se
nal a seguir r (t) es constante. La acci
on integral permite obtener
regulaci
on a pesar de incertidumbres y/o perturbaciones que produzcan
una desviaci
on constante en la variable a regulada. A este se debe su
importancia fundamental en control cl
asico.

Considere el sistema
x = f (x, u, w)
y = h (x, w)
ym = hm (x, w)
x Rn estado , u Rp entrada de control , y Rp variable controlada ,

ym Rm salida medida , w Rl par


ametros y perturbaciones desconocidas consta

Objetivo:
lm y (t) r

r Rp referencia constante.
Defnase
v = (r, w) , e (t) = y (t) r
Suposici
on: e se puede medir.
Condici
on de estado estacionario: Sup
onga que, para cada w Rl , existe
un u
nico par (xss , uss) que satisface las ecuaciones
0 = f (xss, uss, w)
0 = h (xss, w) r
Estabilice el sistema en el punto de equilibrio x = xss para toda w Rl .

Ejercicio 88 Se puede reducir esto a un problema de estabilizaci


on trasladando el punto de equilibrio al origen mediante el cambio de variables
x = x xss , u = u uss ?
Acci
on Integral:
= e
Sistema extendido:
x = f (x, u, w)
= h (x, w) r
Tarea: Estabilice el sistema extendido en el punto (xss , ss), d
onde ss
produce uss

5.1.

Control Integral via linealizaci


on (de Taylor)
[25, Secci
on 12.4]

5.1.1.

Retroalimentaci
on de estados

Retroalimentaci
on de estados:
u = K1x K2 K3e
Sistema en lazo cerrado:
x = f (x , K1x K2 K3 [h (x, w) r] , w)
= h (x, w) r

Puntos de equilibrio:
0 = f (
x, u
, w)
0 = h (
x, w) r
u
= K1x
K2

Unico
punto de equilibrio en
x = xss , = ss , u = uss .
Linealizaci
on alrededor de (xss , ss):
"

x xss
ss

= (A BK)
"

A=

A 0
C 0

h
f

(x, u, w) , C =
(x, w)
, A=
x
x
eq
eq

"

B=

B
0

f
h

, B=
(x, u, w) , C =
(x, w)
u
x
eq
eq

K=

K1 + K3C , K2

Lema 89 (A , B) es controlable si y s
olo si

1. (A , B) es controlable y
"

2. rango

A B
C 0

=n+p

Tarea: Dise
ne K, independiente de v = (r, w), tal que (A BK) es Hurwitz para todo v.

(xss , ss) es un punto de equilibrio exponencialmente estable para el


sistema en lazo cerrado. Todas las soluciones que se inician en su regi
on
de atracci
on convergen a el cuando t tiende a infinito
e (t) 0 , cuando t

Ejemplo 90 P
endulo
= a sin b + cT
Objetivo: regule en
x1 = , x2 = , u = T ,
x 1 = x2
x 2 = a sin (x1 + ) bx2 + cu

"

xss =

0
0

a
, uss = sin
c

= x1

A = a cos b 0 , B = c

K1 =

k1 , k 2

, K 2 = k3 , K 3 = 0

(A BK) es Hurwitz si
b + k2c > 0 , (b + k2c) (a cos + k1c) k3c > 0 , k3c > 0
Sup
onga que

a
1
1 , 2
c
c

k
k2 > 0 , k3 > 0 , k1 > 1 + 2 3
k2
El controlador est
a dado por
u = k1 ( ) k2 k3
=
que es el controlador PID cl
asico.

5.1.2.

Retroalimentaci
on de salida

Si s
olo se miden (e, ym) el controlador integral puede ser
= e = y r
z = F z + G1 + G2ym
u = Lz + M1 + M2ym + M3e

Tarea: Dise
ne F, G1, G2, L, M1, M2, M3, independientes de v, tales que

Ac sea Hurwitz para todo v

Ac =

A + BM2Cm + BM3C , BM1 , BL

C
0
0
G2Cm
G1
F

hm
Cm =
(x, w)
x
eq

5.2.

Control Integral via Modos Deslizantes [25,


Secci
on 14.1.4]

= f0 (, , w)
1 = 2 ,
...
1 = ,
= b (, , u, w) + a (, , w) u
y = 1
a (, , w) a0 > 0
Objetivo:
y (t) r , cuando t

ss = [r, 0, , 0]T
Condici
on de estado estacionario: Para cada w existe un u
nico par (ss, uss)
que satisface las ecuaciones

0 = f0 (ss, ss, w)
0 = b (ss, ss, uss, w) + a (ss, ss, w) uss
Defnase
e 0 = y r

z = ss , e =

e1
e2
...
e

1 r
2
...

z = f0 (, , w) , f0 (z, e, w, r)
e 0 = e1 ,
e 1 = e2 ,
...
e 1 = e ,
e = b (, , u, w) + a (, , w) u
Retroalimentaci
on parcial de los estados: {e1, , e} son medidas
s = k0e0 + k1e1 + + k1e1 + e
k0, , k1 se eligen de tal forma que el polinomio
k11 + + k1 + k0
sea Hurwitz.
s = k0e1 + k1e2 + + k1e + b (, , u, w) + a (, , w) u

s = (, , u, w, r) + a (, , w) u

(, , u, w, r)

% (e) + 0 |u| , 0 0 < 1


a (, , w)
!

s
u = (e) sat

(e)

% (e)
+ 0 , 0 > 0
1 0

Para |s| , ss a0 (1 0) 0
Qu
e pasa con las otras variables de estado?

z = f0 (z, e, w, r)
= A + Bs , (A es Hurwitz )
s = a () (e) sat s + () ,
h

= e0, , e1

iT

1 (kzk) V1 (z, w, r)
2 (kzk)
V1
f0 (z, e, w, r)
3 (kzk) , kzk
(kzk)
z
V2 () = T P , P A + AT P = I
n

= {|s| c} V2

c2

o
1

{V1 c0}

= {|s| c} V2

c2

o
1

{V1
2 (
(2))}

Todas las trayectorias que se inician en entran en en tiempo finito y


permanecen all para todo tiempo futuro.
En el intererior de existe un u
nico punto de equilibrio en
(z = 0 , e = 0 , e0 = e0) , s = k0e0 , uss = (0)

Bajo condiciones adicionales


el origen de z = f0 (z, 0, w, r) es exponencialmente estable
el an
alisis local dentro de muestra que, para valores suficientemente
peque
nos de , todas las trayectorias convergen al punto de equilibrio
cuando el tiempo tiende a infinito.

Parte II
Observaci
on

Captulo 6
Introducci
on

El objetivo de esta parte del curso es dar una perspectiva acerca del problema de observaci
on en control y los m
etodos m
as importantes. Se hace
una selecci
on personal del problema y de las soluciones.
Nos restringiremos a una visi
on determinstica, excluyendo la importante
perspectiva de los sistemas estoc
asticos.

6.0.1.

Formulaci
on del problema

Considere que se tiene el sistema din


amico
x = f (t, x, u, d, p) , x (t0) = x0
y = h (t, x)
z = g (t, x)

en d
onde x es el estado, u corresponde al vector de entradas medidas, d
corresponde al vector de entradas no medidas, p es el vector de par
ametros
desconocidos, y es el vector de variables de salida medidas y z es una
funci
on del estado que se quiere estimar.
El problema general de observaci
on (no estoc
astica y sin perturbaciones
en la medici
on) se puede formular de la siguiente manera:
Observabilidad: Dado un intervalo de tiempo t [t0, t0 + T ] , T > 0,
es posible determinar unvocamente el estado inicial z0 = g (t0, x0)
utilizando la indormaci
on disponible (u, y)?
Observador: Existe un sistema din
amico
= ()
que estime asint
oticamente (en t. finito) (aproximadamente...) a z?

6.0.2.

Motivaci
on

Existen diversos problemas u


tiles que motivan esta formulaci
on:
1. Estimaci
on (robusta) de los estados internos del sistema con fines de
control
2. La identificaci
on de los par
ametros de un sistema
3. La estimaci
on simult
anea de los par
ametros y los estados (observac
on
adaptable)
4. La detecci
on de fallas en sistemas din
amicos

5. La eliminaci
on/sustituci
on/robustificaci
on de sensores costosos

6.0.3.

Organizaci
on del curso

El camino que seguiemos es estudiar los dos problemas para clases de


sistemas cada vez m
as complejas:
1. Sistemas est
aticos o sin memoria
2. Sistemas din
amicos lineales
a) El caso invariante en el tiempo

b) El caso variante en el tiempo

3. M
etodos de dise
no para sistemas din
amicos no lineales
a) M
etodos por aproximaci
on (Linealizaci
on) (Ej. EKF)
b) M
etodos por transformaci
on
1) Uso de difeomorfismos
2) Uso de inmersiones
c) M
etodos por interconexi
on

Captulo 7
Observabilidad
7.1.

Sistemas est
aticos o sin memoria

Se el sistema est
atico (consideramos el caso sin ruido y sin incertidumbres)
f : [0, ) Rn Rq
y (t) = f (t, x (t)) , x Rn, y Rq , t 0
donde se desea estimar la variable (se
nal) x a partir de las mediciones de
la variable (se
nal) y. Ejemplo: recuperar la im
agen tridimensional a partir
de sus proyecciones bidimensionales (camaras).
Existen dos situaciones (extremas) esencialmente diferentes:

x (t) arbitraria: es decir, x (t1) y x (t2) no est


an (co)relacionados, o sea el
valor de uno no tiene que ver con el del otro, entonces el valor de x (t)
debe ser recuperado de la medici
on en el mismo instante de tiempo
y (t).

x (t) = x0 constante: Entonces las observaciones y (t) en distintos instantes de tiempo se complementan para determinar el valor de x0.

Es claro que las condiciones bajo las cuales podemos determinar a x (t)
a partir de y (t) deben ser muy distintas en ambos casos. Las situaciones
intermedias son mezclas de las situaciones extremas consideradas.

7.1.1.

Repaso de algunos conceptos b


asicos de funciones

Sean X, Y dos conjuntos. Sus elementos ser


an denotados por x, y, respectivamente.

Relaci
on: Una relaci
on R es un subconjunto del conjunto producto X Y .
Se dice que x est
a relacionado con y si (x, y) R.

Funci
on: Una funci
on (mapa) f es una relaci
on con dos propiedades adicionales:
1. x X , y Y tal que (x, y) f
2. Para cada x X existe un u
nico y Y tal que (x, y) f
Por esta raz
on se escribe f : X Y y entonces y = f (x)
Una relaci
on R en X, Y se puede ver como una funci
on r : X
subconjuntos (Y ) o una funci
on multivaluada.

Relaci
on inversa La inversa de R (denotada como R1) es la relaci
on
definida como el subconjunto de Y X tal que (y, x) R1 si y s
olo
si (x, y) R
N
otese que:
La inversa de cualquier relaci
on siempre existe y es una relaci
on.
La inversa de una funci
on f siempre existe, pero en general f 1
no es una funci
on, sino una funci
on multivaluada (relaci
on)!
Funci
on inyectiva: f : X Y es inyectiva si [y = f (x1) y = f (x2)] =
x1 = x2
Funci
on sobreyectiva: f : X Y es sobreyectiva si y Y existe al
menos un x X tal que y = f (x)

Funci
on biyectiva: f : X Y es biyectiva si es inyectiva y sobreyectiva.
La relaci
on inversa f 1 es una funci
on si y solo si f es biyectiva
Si f es inyectiva entonces su inversa f 1 : Y X no es una
funci
on. Pero en un dominio restringido f 1 : f (X) X es una
funci
on.

7.1.2.

Caso invariante en el tiempo

Si el mapa (deformaci
on) f : Rn Rq no cambia con el tiempo
y (t) = f (x (t)) , x Rn, y Rq

entonces las condiciones de solubilidad para x (t) arbitraria o constante son


id
enticas!
Teorema 91 Se puede determinar unvocamente x a partir de y si y s
olo
si el mapa f : Rn Rq es inyectivo.
En realidad este teorema es una tautologa, ya que la inyectividad de f
significa que, dado un y exista un u
nico valor de x tal que y = f (x).
Si f : Rn Rq es inyectivo entonces tiene que ocurrir que q n: es decir
el n
umero de mediciones debe ser igual o superior al n
umero de variables
por estimar! Ej: De la imagen bidimensional de una c
amara es imposible (en
general) determinar la ubicaci
on de un objeto en el espacio tridimensional!
(Para lograrlo se requiere informaci
on adicional).

Caso Lineal
Si f : Rn Rq es lineal, entonces
y (t) = Ax (t) , x Rn, y Rq
d
onde A es una matriz constante de dimensi
on q n.
Teorema 92 f es inyectiva si y s
olo si
los vectores columna de A son linealmente independientes
m
rango (A) = {# de vectores columna de A linealmente independientes} = n
m
rango (A) = {# de vectores fila de A linealmente independientes} = n

Prueba. =:

Proposici
on 93 Observabilidad: Se puede determinar unvocamente x a
partir de y si y s
olo si A es inyectiva.

C
omo se puede calcular en este caso a x? Consideremos dos casos:

Caso cuadrado: q = n

En este caso A es una matriz cuadrada y, si es

inyectiva, ser
a invertible (regular). Asi que en este caso
x (t) = A1y (t)

Caso no cuadrado: q 6= n

A es rectangular y no posee inversa! Pero si

A es inyectiva entonces q > n y la matriz AT A es cuadrada y regular (o


positiva definida), as que posee inversa! En este caso podemos entonces
obtener
AT y (t) = AT Ax (t)
de donde se obtiene a x
x (t) =

La matriz

1
T
A A
AT

1
T
A A
AT y (t)

es la denominada Moore-Penrose seudoinversa de

A y tiene propiedades de optimalidad cuando hay ruidos en las mediciones!

Caso no lineal especial


Decidir si una funci
on f : Rn Rq es inyectiva es en general muy difcil.
A
un el caso m
as especial de biyectividad (= inyectividad + sobreyectividad)
es difcil. Si f es continuamente diferenciable y nos contentamos con la
inyectividad (o biyectividad = invertibilidad) local, entonces una idea de
linealizaci
on es muy u
til:
Teorema 94 (Teorema de la funci
on inversa) Sea f : Rn Rn contnuamente diferenciable y consid
erese un punto x
con imagen y = f (
x). Si la
matriz Jacobiana de f evaluada en x

f (
x)
Jf (
x) =
x
es regular (= invertible) entonces f es invertible localmente y la inversa es
contnuamente diferenciable.

Este Teorema nos permite obtener condiciones suficientes de observabilidad local para nuestro problema:
Teorema 95 Bajo las condiciones del Teorema anterior dada una se
nal
y (t) cercana a y (ky (t) yk ) entonces existe una u
nica x (t) cercana
ax
(kx (t) x
k ) tal que y (t) = f (x (t)).

7.1.3.

Caso variante en el tiempo

Retornemos al caso general variante en el tiempo f : [0, ) Rn Rq


y (t) = f (t, x (t)) , x Rn, y Rq , t 0
entonces las condiciones de solubilidad para x (t) arbitraria o constante son
muy diferentes!

x (t) arbitraria
El valor de x (t) debe ser recuperado de la medici
on en el mismo instante
de tiempo y (t).

Teorema 96 Se puede determinar unvocamente x a partir de y si y s


olo
si el mapa f (t, ) : Rn Rq es inyectivo para cada instante de tiempo
t0
Este caso es similar al caso invariante en el tiempo.
Por ejemplo, en el caso lineal
y (t) = A (t) x (t) , x Rn, y Rq
d
onde A (t) es una matriz constante de dimensi
on q n.

Teorema 97 f es inyectiva si y s
olo si los vectores columna de A son
linealmente independientes t 0

Proposici
on 98 Observabilidad: Se puede determinar unvocamente x a
partir de y si y s
olo si A (t) es inyectiva t 0

Se puede calcular a x de la siguiente manera:


x (t) =

y la matriz

1
T
A A
AT

AT

(t) A (t)

AT (t) y (t)

es la Moore-Penrose seudoinversa de A.

x (t) = x0 constante
Este es un caso m
as interesante, ya que las observaciones y (t) en distintos
instantes de tiempo se complementan para determinar el valor de x0.
Como todos los valores de y (t) en el intervalo de tiempo t [t0, t1] son
consecuencia de la misma x0, entonces
y (t) = f (t, x0) , x0 Rn, y (t) Rq , t 0
puede verse como un mapa F que le asigna a x0 la se
nal en el tiempo y (t)
con t [t0, t1], es decir
y[t0,t1] = F (x0)
As que el dominio de este mapa es x Rn pero su codominio no es Rq sino
las se
nales de tiempo en Rq , que es un espacio de dimensiones infinitas.

Con esta interpretaci


on, entonces la condici
on de observabilidad es la
misma que en el caso anterior:
Teorema 99 Se puede determinar unvocamente x0 a partir de y[t0,t1] si y
q
s
olo si el mapa F : Rn Y[t ,t ] es inyectivo.
0 1

Otra vez, esta es una tautologa: inyectividad de F significa que cada x0


produce una u
nica y[t0,t1]. En general, es difcil determinar cu
ando una
funci
on F es inyectiva.

Caso Lineal
Si f es lineal, entonces
y (t) = A (t) x0 , x0 Rn, y (t) Rq

d
onde A (t) es una matriz variante en el tiempo de dimensi
on q n. Una
forma de determinar la inyectividad del operador F correspondiente es la
siguiente:

1. Premultiplicar la ecuaci
on por la transpuesta de A (t)
AT (t) y (t) = AT (t) A (t) x0

2. Integrar en el intervalo de tiempo t [t0, t1] (como x0 es constante


puede salir de la integral)
Z t
1
t0

AT (t) y (t) dt =

Z t
1
t0

AT (t) A (t) dt x0

Teorema 100 Sea f lineal. El operador F correspondiente


es inyectivo si

Rt
y s
olo si la matriz cuadrada t01 AT (t) A (t) dt es positiva definida. En
este caso la matriz es regular (invertible).
Comentario 101 N
otese que en este caso, a diferencia del caso anterior,
no se requiere que q n, es decir, que el n
umero de mediciones sea
mayor o igual que el n
umero de inc
ognitas. Una soluci
on de esta aparente
q
contradicci
on se obtiene al notar que Y[t ,t ] es de dimensi
on infinita (para
0 1
todo q), as que el n
umero de mediciones es en cualquier caso mayor que
el n
umero de inc
ognitas (de dimensi
on finita n).
Ejemplo 102 Sea el sistema
y (t) =

t t2

"

x1
x2

, x R2, y (t) R

Considere el intervalo de tiempo t [0, T ]. Entonces


#
Z T"
h
i
t
T
2
A (t) A (t) dt =
t t dt
2
t
0
0
"
#
"
Z T
1T 3
2
3
t t
=
dt = 31 4
3
4
t t
0
4T

Z T

que es regular para toda T > 0, ya que su determinante

1T 4
4
1T 5
5

1
es 15

1
16

T 8.

Proposici
on 103 Observabilidad: Se puede determinar unvocamente x0
a partir de y[t0,t1] si y s
olo si F es inyectivo.

C
omo se puede calcular en este caso a x?

Despejar a x0
x0 =

Z
t1
t0

AT (t) A (t) dt

!1 Z
t1
t0

AT (t) y (t) dt

La idea de Linealizaci
on utilizada en el caso anterior (en dimensiones finitas) para asegurar inyectividad local de un mapa no lineal puede ser exq
tendido al caso de un mapa no lineal F : Rn Y[t ,t ], pero el resultado
0 1
es un tanto m
as t
ecnico.

Captulo 8
Observabilidad de Sistemas
Din
amicos Lineales

Consid
erese un sistema lineal variante en el tiempo (SLVT)
(

L :

x (t) = A (t) x (t) + B (t) u (t) , x (t0) = x0


y (t) = C (t) x (t)

con x (t) Rn, u (t) Rp, y (t) Rq . Se asumen conocidas (A, B, C) y


u (t) e y (t) se pueden medir.

8.1.

Soluci
on de la ecuaci
on diferencial

La ecuaci
on diferencial tiene una soluci
on u
nica para cada entrada u (t) y
para cada condici
on inicial x (t0) = x0, que se puede escribir explcitamente

como
R

x (t) = (t, t0) x0 + tt0 (t, ) B ( ) u ( ) d


R
y (t) = C (t) (t, t0) x0 + C (t) tt0 (t, ) B ( ) u ( ) d
A veces es u
til representar la soluci
on como

x (t) = t, t0, x0, u[t0,t]

para enfatizar la dependencia del estado actual x (t) del estado inicial y de
la entrada.

N
otese que la soluci
on t, t0, x0, u[t0,t] es

1. Lineal en x0

2. Lineal en u (t)

3. La suma de la soluci
on a x0 y a u (t)

8.2.

La matriz de transici
on de estado

(t, t0) es una matriz cuadrada de dimensi


on n y se denomina la matriz de
transici
on de estados, mediante la cual la soluci
on de la ecuaci
on diferencial
x (t) = A (t) x (t) , x (t0) = x0

se puede expresar como


x (t) = (t, t0) x0
Algunas propiedades importantes de la matriz de transici
on de estados son:
1. (t, t) = I
Si en el tiempo t se inicia en el estado x0, entonces en ese instante el
sistema se encuentra en x0
2. (t, t1) (t1, t0) = (t, t0) para todos los valores de t0, t1, t.
3. 1 (t, t0) siempre existe y 1 (t, t0) = (t0, t)

4.

(t,t0 )
t

= A (t) (t, t0)

5. Si A es constante
(t, t0) = eA(tt0)
d
onde la matrix exponencial est
a dada por
eAt

X
1
k=0

8.3.

k!

Ak tk

1 2 2
= I + At + A t +
2

Problema de Observabilidad

La pregunta por la observabilidad en el intervalo t [t0, t1] es la siguiente:

Cu
ando es posible determinar el estado inicial x0 si se miden y (t) y
u (t) en el intervalo de tiempo t [t0, t1]?

Aunque en realidad usualmente nos interesa determinar el estado actual x (t) si se puede determinar a x0 entonces el estado actual se puede
determinar de la expresi
on
x (t) = (t, t0) x0 +

Z t
t0

(t, ) B ( ) u ( ) d

8.4.

Determinaci
on de la Observabilidad

De la soluci
on general se puede escribir
y (t) C (t)

Z t
t0

(t, ) B ( ) u ( ) d = C (t) (t, t0) x0

N
otese que el lado izquierdo es conocido y en el lado derecho la inc
ognita
entra linealmente. De los resultados del captulo anterior se obtiene que
Teorema 104 Se puede determinar unvocamente a x0 a partir de y[t0,t1]
y u[t0,t1], es decir, el sistema es observable, si y s
olo si la matriz cuadrada
M (t1, t0) =

Z t
1
t0

T (t, t0) C T (t) C (t) (t, t0) dt

es positiva definida. En este caso la matriz es regular (invertible).

La matriz M (t0, t1) se denomina Grammiano de Observabilidad y


depende del intervalo [t0, t1]. A medida que crece t1 el Grammiano
crece: si t2 > t1 entonces M (t2, t0) > M (t1, t0) (en el sentido de
la positividad definida).

N
otese que la observabilidad del sistema lineal no depende de la entrada seleccionada, as que se puede elegir por simplicidad a u (t) = 0.
Esto es cierto para cualquier sistema cuya soluci
on se pueda expresar
como la suma de un t
ermino dependiente solo de x0 y otro dependiente
solo de u (t).

8.5.

Un caso especial: Sistemas lineales Invariantes en el tiempo

Consid
erese un sistema lineal invariante en el tiempo (SLIT) (consideramos
u (t) = 0 sin p
erdida de generalidad)
x (t) = Ax (t) , x (0) = x0
y (t) = Cx (t)
con A, C constantes. La salida se puede escribir explcitamente como
y (t) = CeAtx0
Para establecer observabilidad se utiliz
o un m
etodo que usa la operaci
on
de integraci
on, para combinar la informaci
on contenida en cada instante

de tiempo. Ahora se presentar


a un m
etodo alternativo basado en la diferenciaci
on, para combinar la informaci
on en un instante con el de sus vecinos temporales: a la ecuaci
on anterior se le agregar
an nuevas ecuaciones
obtenidas de su derivada temporal. N
otese que si se conoce a y (t) en teora
se pueden calcular sus derivadas temporales de cualquier orden
y (t) = CeAtx0
dy (t)
= y (t) = CAeAtx0
dt
d2y (t)
2 eAt x
=
y

(t)
=
CA
0
dt2
...
dk y (t)
(k) (t) = CAk eAtx
=
y
0
dtk

Si se eval
uan las ecuaciones en un instante de tiempo, por ejemplo t = 0,
se obtiene (e0 = I)

y (0)
y (0)
y (0)
...
y (k) (0)

CA

= CA2

...

CAk
| {z
Ok

x
0

Recordando el an
alisis del captulo anterior para este caso se puede concluir
que

Es posible determinar x0 unvocamente de esta ecuaci


on si y
s
olo si para alg
un valor de k la matriz Ok es inyectiva
rango (Ok ) = n

Se puede ir aumentando el valor de k paulatinamente, hasta que se cumpla


la condici
on. Si nunca se cumple la condici
on, hay alg
un valor de k para
detenerse? SI. k = n 1

Por el Teorema de Cayley-Hamilton (una matriz cuadrada satisface su


propio polin
omio caracterstico) se sabe que
An = p0I p1A p2A2 pn1An1
Cuando se aumenta k se aumentan filas (no columnas) a Ok . Pero de
la expresi
on anterior se sabe que las filas nuevas de On son linealmente
dependientes de las anteriores, con lo que el rango no puede aumentar!
Repitiendo este argumento se concluye que
rango (O1) rango (On1) = rango (On) = rango (On+1) =

Teorema 105 Se puede determinar unvocamente a x0 a partir de y (t), es


decir, el sistema Lineal Invariante en el Tiempo es observable, si y s
olo si

rango (On1) = rango

C
CA
CA2
...
CAn1

=n

Esto equivale a que la matriz cuadrada


M (t1, t0) =

Z t
1
t0

T (tt ) T
A
0 C CeA(tt0 ) dt
e

sea positiva definida para cualesquiera t0 < t1. En este caso la matriz es
regular (invertible).
Otra forma de caracterizar la observabilidad de la pareja (C, A) es el denominado criterio de Hautus-Belevitch-Popov: El sistema es observable si

y s
olo si
"

rango

8.6.

sI A
C

= n , s C .

El principio de dualidad para sistemas lineales

En el caso lineal existe una estrecha relaci


on entre el problema de observabilidad y el de controlabilidad: estos conceptos son duales.

Sea el sistema lineal invariante en el tiempo


(

L :
El sistema
D
L

x (t) = Ax (t) + Bu (t) , x (t0) = x0


y (t) = Cx (t)

x D (t) = AT xD (t) + C T uD (t) , xD (t0) = xD


0
D
T
D
y (t) = B x (t)

es el sistema dual de L.
D
Teorema 106 L es observable si y s
olo si D
L es controlable. L es
observable si y s
olo si L es controlable.

Esta relaci
on es v
alida para sistemas variantes en el tiempo, pero es un
tanto m
as sutil.

8.7.

Observabilidad de Sistemas con par


ametros
desconocidos (Identificabilidad)

Considere el sistema no lineal con par


ametros desconocidos, que entran en
forma lineal en el modelo
x (t) = f (t, x (t) , u (t)) + g (t, x (t) , u (t)) p , x (t0) = x0
y (t) = x (t)
con x (t) Rn, u (t) Rp, p Rr , d
onde p corresponde a los par
ametros
constantes y desconocidos. Se asumen conocidas las funciones f , g y u (t),
x (t) se pueden medir.

Escribiendo la ecuaci
on, separando los t
erminos conocidos de los desconocidos
x (t) f (t, x (t) , u (t)) = g (t, x (t) , u (t)) p ,

premultiplicando por g T e integrando


Z t
1
t0

g T (t, x (t) , u (t)) [x (t) f (t, x (t) , u (t))] dt =


=

Z t
1
t0

g T (t, x (t) , u (t)) g (t, x (t) , u (t)) dt p .

Proposici
on 107 Se pueden determinar unvocamente los par
ametros p en
el intervalo [t0, t1] si y s
olo si la matriz
Z t
1
t0

g T (t, x (t) , u (t)) g (t, x (t) , u (t)) dt

es positiva definida (o sea regular).


N
otese que la posibilidad de identificar los par
ametros depende en general
de las entradas y las trayectorias seguidas por el sistema! Esto est
a asociado

con el fen
omeno conocido de las condiciones de excitaci
on persistente para
la identificaci
on de sistemas.

Captulo 9
Observabilidad de Sistemas
Din
amicos No Lineales

Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . Se asumen conocidas las funciones
f , h y u (t) e y (t) se pueden medir.

9.1.

Soluci
on de la ecuaci
on diferencial

La ecuaci
on diferencial tiene una soluci
on u
nica para cada entrada u (t) y
para cada condici
on inicial x (t0) = x0, que generalmente es imposible de
expresar analticamente.

Es u
til representar la soluci
on como

x (t) = t, t0, x0, u[t0,t]

y (t) = h t, t0, x0, u[t0,t]


para enfatizar la dependencia del estado actual x (t) del estado inicial y de
la entrada.

9.2.

La funci
on de transici
on de estados

t, t0, x0, u[t0,t] es un vector con n componentes y se denomina la funci


on de transici
on de estados.
Algunas de sus propiedades importantes son:

1. t0, t0, x0, u[t0,t0] = x0

2. t, t1, t1, t0, x0, u[t0,t1] , u[t1,t] = t, t0, x0, u[t0,t] para todos
los valores de t0 t1 t.

9.3.

Problema de Observabilidad

La pregunta por la observabilidad en el intervalo t [t0, t1] es la siguiente:


Cu
ando es posible determinar el estado inicial x0 si se miden y (t) y
u (t) en el intervalo de tiempo t [t0, t1]?

Aunque en realidad usualmente nos interesa determinar el estado actual


x (t), si se puede determinar a x0, entonces el estado actual se puede
determinar usando la funci
on de transici
on de estados.

9.4.

Determinaci
on de la Observabilidad

De la soluci
on general se puede escribir

y (t) = h t, t0, x0, u[t0,t]

En el intervalo [t0, t] esta igualdad puede interpretarse como un mapa que,


dada una entrada u[t0,t], le asigna al estado inicial x0 una salida y[t0,t]
y[t0,t] = Hu[t ,t] (x0)
0

Esta interpretaci
on, junto con los resultados del captulo 1 nos permiten
afirmar

Teorema 108 En el intervalo de tiempo [t0, t], dada una entrada u[t0,t], se
puede determinar unvocamente a x0 a partir de y[t0,t1], es decir, el sistema
es observable para la entrada u[t0,t], si y s
olo si el mapa Hu[t ,t] (x0) is
0
inyectivo.

N
otese que la observabilidad del sistema no lineal depende, en general, de
la entrada seleccionada!

Ejemplo 109 Considere el sistema


"

x 1
x 2

"

=
y=

1 u (t)
0 1
1 0

"

#"

x1
x2

x1
x2

Si la entrada es u (t) = 1 entonces el sistema (LIT) es observable, ya que


"

rango (O1) = rango

1 0
1 1

=2

Si la entrada es u (t) = 0 entonces el sistema (LIT) no es observable, ya


que
"

rango (O1) = rango

1 0
1 0

=1<2

9.5.

Sistemas no lineales sin entradas

En general es difcil determinar la observabilidad del sistema no lineal.


Como la idea integral usada en el caso lineal variante en el tiempo es
difcil de usar aqu, se usar
a el m
etodo diferencial para hallar condiciones
suficientes de observabilidad. Para simplificar se considerar
a el caso especial
en que la entrada es constante (cero en partcular). Consid
erese un sistema
no lineal (SNL) sin entradas
x (t) = f (x (t)) , x (t0) = x0
y (t) = h (x (t))
De la ecuaci
on de salida, en general, no es posible determinar unvocamente a x, ya que hay mas inc
ognitas que ecuaciones. Para agregar m
as

ecuaciones se tomar
an derivadas temporales.

y (t) = h (x (t))
d
h (x)
h (x)
y (t) = h (x (t)) =
x (t) =
f (x) := Lf h (x)
dt
x
x
Lf h (x)
Lf h (x)
y (t) =
x (t) =
f (x) := L2f h (x)
x
x
...
y (k) (t) =

Lk1
f h (x)
x

x (t) =

Lfk1h (x)
x

f (x) := Lkf h (x)

Aqui se utilizan las derivadas de Lie de h a lo largo de f : Lkf h (x). Si se


eval
uan las ecuaciones en un instante de tiempo, por ejemplo t = 0, se

obtiene

y (0)
y (0)
y (0)
...
y (k) (0)

h (x0)
Lf h (x0)
L2f h (x0)
...
Lkf h (x0)

:= ok (x0)

Recordando el an
alisis del primer captulo para este caso se puede concluir
que
Es posible determinar x0 unvocamente de esta ecuaci
on si y
s
olo si para alg
un valor de k el mapa de observabilidad (no lineal)
ok (x0) es inyectivo.
Se puede ir aumentando el valor de k paulatinamente, hasta que se cumpla
la condici
on. Si nunca se cumple, hay alg
un valor de k para detenerse?

NO
Se obtiene asi una condici
on suficiente de observabilidad

Teorema 110 Se puede determinar unvocamente a x0 a partir de y (t),


es decir, el sistema es observable, si para alg
un valor de k el mapa de
observabilidad (no lineal) ok (x0) es inyectivo.

Ejemplo 111 Considere el sistema


"

x 1
x 2

"

x2
0

y = x31

El mapa de observabilidad es
"

o1 (x) =

x31
3x21x2

o3 (x) =

x31

3x2x2
1

6x x2

1 2
6x32

3
x
12
o2 (x) = 3x1x2

6x1x22

3
x1

3x2
x
1 2

6x1x2
2
ok (x) =
6x3

N
otese que o1 (x) no es inyectivo, ya que o1

...

0 1

= o1

0 2

Igual sucede con o2 (x). Pero o3 (x) si es inyectivo, por lo que el sistema
es globalmente observable.

Ya que, en general, decidir acerca de la inyectividad de un mapa no lineal


es difcil, se usa frecuentemente un criterio de observabilidad local, que se
basa en la linealizaci
on del mapa de observabilidad:
Teorema 112 El sistema es localmente observable en el punto x0 si para
alg
un valor de k la matriz de observabilidad
ok (x0)
Ok (x0) =
x
es inyectiva, es decir, tiene rango (Ok (x0)) = n.

9.6.

Sistemas con estados y par


ametros desconocidos

Considere el sistema no lineal con par


ametros desconocidos, que entran en
forma lineal en el modelo y con estados no conocidos
y 1 (t) = f1 (t, x (t) , u (t)) + g (t, x (t) , u (t)) p , y1 (t0) = y10
z (t) = f2 (t, x (t) , u (t)) , z (t0) = z0
y2 (t) ="h (z (t))#
y1 (t)
x (t) =
z (t)
con x (t) Rn, u (t) Rp, p Rr , d
onde p corresponde a los par
ametros
constantes y desconocidos. Se asumen conocidas las funciones f1, f2, g y
u (t), y1 (t), y2 (t) se pueden medir.
El an
alisis de observabilidad e identificabilidad se puede dividir en 2 partes:

1. Observabilidad de los estados:

Se analiza la observabilidad del subsistema que no depende de los


par
ametros
z (t) = f2 (t, x (t) , u (t)) , z (t0) = z0
y2 (t) = h (z (t))
En el caso de que haya observabilidad es posible recuperar el valor
verdadero de los estados z (t) en tiempo finito.

2. Identificabilidad de los par


ametros:
Escribiendo la primera ecuaci
on, separando los t
erminos conocidos de
los desconocidos
y 1 (t) f1 (t, x (t) , u (t)) = g (t, x (t) , u (t)) p ,

premultiplicando por g T e integrando


Z t
1
t0

g T (t, x (t) , u (t)) [y 1 (t) f1 (t, x (t) , u (t))] dt =


=

Z t
1
t0

g T (t, x (t) , u (t)) g (t, x (t) , u (t)) dt p .

Entonces los par


ametros p se pueden determinar en el intervalo [t0, t1]
(una vez los estados hayan sido determinados) si y s
olo si la matriz
Z t
1
t0

g T (t, x (t) , u (t)) g (t, x (t) , u (t)) dt

es positiva definida (o sea regular).

Aunque la estructura del sistema analizado es muy particular, la mayor


parte de los m
etodos de dise
no de observadores adaptables se basan en
llevar al sistema a esta forma.

Captulo 10
Dise
no de Observadores para
Sistemas Lineales
Hasta ahora se ha discutido la posibilidad (te
orica) de determinar el estado
inicial de un sistema din
amico a partir del conocimiento perfecto del modelo

y de las se
nales de entrada y de salida. Si un sistema es (localmente)
observable entonces en principio es posible recuperar (en tiempo finito) el
valor del estado inicial, con lo que se puede determinar perfectamente su
valor actual.
Aunque la inversi
on del mapa de observabilidad constituye una posibilidad
de recuperar el valor del estado, es deseable y preferible en control, entre
otras razones porque se introduce retroalimentaci
on, la utilizaci
on de algoritmos recursivos de estimaci
on u observadores. Un observador (asint
otico
de estados) para el sistema (planta)
(

x (t) = f (x (t) , u (t)) , x (t0) = x0


y (t) = h (x (t))

con x (t) Rn, u (t) Rp, y (t) Rq , es un sistema din


amico
z (t) = g (z (t) , u (t) , y (t)) , z (t0) = z0
x
(t) = k (z (t) , u (t) , y (t))

con z (t) Rm, que tiene como entradas las se


nales medibles (u (t) , y (t))
de la planta, tal que para toda condici
on inicial z0 y x0 y toda entrada
u (t) el valor estimado del estado x
(t) converge asint
oticamente al valor
verdadero x (t)
lm (
x (t) x (t)) = 0

En el caso lineal, es decir cuando el sistema est


a descrito por
(

L :

x (t) = A (t) x (t) + B (t) u (t) , x (t0) = x0


y (t) = C (t) x (t)

y para el cual la caracterizaci


on de la observabilidad es muy completa,
presentaremos dos m
etodos b
asicos para dise
nar observadores (lineales):
El m
etodo de Kalman y el de Luenberger.

10.1.

El Observador (Filtro) de Kalman

Para determinar un algoritmo recursivo para estimar el estado actual x (t)


de la planta L procederemos aqui con un m
etodo integral an
alogo al
utilizado para determinar la observabilidad (una alternativa mejor pero m
as
compleja es utilizar optimizaci
on). De la soluci
on general para el sistema
escribimos (suponemos para la deducci
on, por simplicidad, que u (t) = 0)
y ( ) = C ( ) (, t) x (t) , t
premultiplicando a ambos lados e integrando se obtiene
Z t
t0

T (, t) C T ( ) y ( ) d = N (t, t0) x (t) ,

N (t, t0) ,

Z t
t0

(1)

T (, t) C T ( ) C ( ) (, t) d

D
onde N (t, t0) es la matriz de observabilidad (de primera clase), an
aloga

a M (t, t0) definida en el captulo 8. Como


N (t, t0) = T (t0, t) M (t, t0) (t0, t) =
=

Z t
t0

T (t0, t) T (, t0) C T ( ) C ( ) (, t0) (t0, t) d

es claro que N (t, t0) es positiva definida si y s


olo si M (t, t0) lo es, es
decir, el sistema es observable en el intervalo [t0, t] si y s
olo si N (t, t0) es
positiva definida.

De (1) se puede obtener x (t) en cuanto N (t, t0) sea regular. Como
aqu nos interesa obtener una versi
on recursiva, procederemos de la siguiente manera, en cuatro pasos:

10.1.1.

Paso 1: Obtener una ecuaci


on diferencial para N (t, t0)

Por simplicidad lo hacemos a trav


es de M (t, t0)
Z
d t T
dM (t, t0)
=
(, t0) C T ( ) C ( ) (, t0) d
dt
dt t0
= T (t, t0) C T (t) C (t) (t, t0)

luego
dT (t, t0) N (t, t0) (t, t0)
dM (t, t0)
=
dt
dt
dT (t, t0)
dN (t, t0)
=
N (t, t0) (t, t0) + T (t, t0)
(t, t0) +
dt
dt
d (t, t0)
+ T (t, t0) N (t, t0)
dt
"
#
N (t, t0)
T
T
= (t, t0) A (t) N (t, t0) +
+ N (t, t0) A (t) (t, t0)
t
por lo tanto
dN (t, t0)
= AT (t) N (t, t0)N (t, t0) A (t)+C T (t) C (t) , N (t0, t0) = 0 .
dt

10.1.2.

Paso 2: Obtener un ecuaci


on diferencial para el
estimado

De (1) podemos escribir, definiendo


z (t) , N (t, t0) x (t)
Z t
t0

T (, t0) C T ( ) y ( ) d = T (t, t0) z (t) .

Derivando esta ecuaci


on con respecto al tiempo obtenemos
T (t, t0) C T (t) y (t) = T (t, t0) AT (t) z (t) + T (t, t0) z (t) ,
o sea
z (t) = AT (t) z (t) + C T (t) y (t) , z (t0) = 0

Tan pronto como N (t, t0) se haga regular, entonces


x (t) = N 1 (t, t0) z (t)

10.1.3.

Paso 3: Obtener una ecuaci


on diferencial para la
inversa de N (t, t0)

Como
N 1 (t, t0) N (t, t0) = I

y utilizando la ecuaci
on diferencial para N (t, t0) se sigue que
dN 1 (t, t0)
dN (t, t0) 1
1
= N (t, t0)
N (t, t0)
dt
dt

1
= N (t, t0) AT (t) N (t, t0) N (t, t0) A (t) +
+C T

(t) C (t) N 1 (t, t0)

es decir,
dN 1 (t, t0)
= N 1 (t, t0) AT (t) + A (t) N 1 (t, t0)
dt
N 1 (t, t0) C T (t) C (t) N 1 (t, t0)

10.1.4.

Paso 4: Obtener una ecuaci


on diferencial para el
estimado del estado

Si se escribe x
(t) para el estimado de x (t)
dN (t, t0)
d
x (t)
z (t) =
x
(t)+N (t, t0)
= AT (t) N (t, t0) x
(t)+C T (t) y (t) ,
dt
dt
entonces
d
x (t)
= A (t) x
(t) + N 1 (t, t0) C T (t) (y (t) C (t) x
(t)) .
dt

10.1.5.

Filtro de Kalman

Una deducci
on m
as completa nos lleva al Filtro de Kalman para la planta
(

Ln :

x (t) = A (t) x (t) + B (t) u (t) + v (t) , E {x (t0)} = 0


y (t) = C (t) x (t) + w (t)

d
onde
E {x (t0)} = 0
n

E [x (t0) E {x (t0)}] [x (t0) E {x (t0)}]

= P0 > 0

y v (t) y w (t) son ruido blanco Gaussiano con


E {v (t)}
o=0
E v (t) v T ( ) = Q (t) (t )
E {w (t)}
n
o=0
E w (t) wT ( ) = R (t) (t )
n

(t) = 0

) wT

(t) = 0

v (t) wT

( ) = 0

E x (t0
n

E x (t0
E

) vT

Q (t) = QT (t) 0
R (t) = RT (t) > 0

est
a dado por
d
x
(t) = A (t) x
(t) + B (t) u (t) + H (t) (y (t) C (t) x
(t)) , x
(t0) = 0
dt
d
P (t) = P (t) AT (t) + A (t) P (t) P (t) C T (t) R1 (t) C (t) P (t) + Q (t) ,
dt
H (t) = P (t) C T (t) R1 (t) ,
P (t0) = P0 > 0

Aqui
n

P (t) = E [x (t) x
(t)] [x (t) x
(t)]

es la matriz de covarianza del error de estimaci


on y el Filtro de Kalman
minimiza la varianza del error de observaci
on.

N
otese que el Filtro (o el observador) tienen una estructura muy peculiar:
consisten en una copia de la planta con un t
ermino de inyecci
on de salida,
que es la diferencia entre la salida de la planta y la salida estimada, multiplicada por una ganancia. Esta ganancia se calcula mediante la matriz de
covarianza del error de observaci
on, que satisface una Ecuaci
on Diferencial
de Riccati.

Ecuaci
on Diferencial de Riccati

Sean Q (t) y R (t) matrices acotadas, sim


etricas y positivas definidas, es
decir, que satisfacen
0 < q1I Q (t) < q2I
0 < r1I R (t) < r2I
y sea P (t) la soluci
on (sim
etrica) de la ecuaci
on diferencial de Riccati

d
P (t) = P (t) AT (t)+A (t) P (t)P (t) C T (t) R1 (t) C (t) P (t)+Q (t) , P (t0)
dt
Si (A (t) , C (t)) es uniformemente observable, entonces P (t) existe para
todo t t0 y satisface
0 < p1I P (t) < p2I = 0 < p3I P 1 (t) < p4I

Convergencia del Filtro de Kalman


El error de observaci
on (filtrado)
e=x
x
satisface la ecuaci
on diferencial
d
e (t) = [A (t) H (t) C (t)] e (t) + (t) , e (t0) = e0
dt
d
P (t) = P (t) AT (t) + A (t) P (t) P (t) C T (t) R1 (t) C (t) P (t) + Q (t) ,
dt
H (t) = P (t) C T (t) R1 (t) ,
P (t0) = P0 > 0
(t) , H (t) w (t) v (t)
Considere la candidata a funci
on de Lyapunov
V (t, e (t)) = eT (t) P 1 (t) e (t) ,

que es decreciente y positiva definida si la pareja (A (t) , C (t)) es uniformemente observable.


d 1
T
1
T
1
T

V = e P e + e P e + e
P e
dt
Recuerdese que
dP (t) 1
d 1
1
P (t) = P (t)
P (t)
dt
dt
entonces
V = eT (A HC)T P 1e + eT P 1 (A HC) e + eT P 1 + T P 1e
dP 1
P e
eT P 1
dt

dP 1
V = eT (A HC)T P 1 + P 1 (A HC) P 1
P
e+
dt
+ 2eT P 1

dP
V = eT P 1 P (A HC)T + (A HC) P
dt
+ 2eT P 1

V = eT P 1 P A P C T R1C
+ 2eT P 1

P 1e+

dP
+ A P C T R1C P
dt

dP
T
1
T
T
1
T
1

V =e P
P A + AP P C R CP P C R CP
dt
+ 2eT P 1

P 1e+

P 1e+

dP
T
1

V = e P
P AT AP + P C T R1CP P 1e eT C T R1Ce+
dt
+ 2eT P 1

= eT P 1QP 1e eT C T R1Ce + 2eT P 1


c1 kek22 + 2c2 kek2 kk2

Entonces el sistema de error de observaci


on es ISS con respecto a : si = 0
entonces e = 0 es un punto de equilibrio global, uniforme y asint
oticamente estable, si 0 entonces e 0 y si es acotado entonces e
permanecer
a acotado.

10.2.

El observador de Luenberger

La idea original de Luenberger es proponer como observador (identidad)


para la planta
(

L :

x (t) = A (t) x (t) + B (t) u (t) , x (t0) = x0


y (t) = C (t) x (t)

otro sistema din


amico lineal
d
L : x
(t) = F (t) x
(t) + G (t) u (t) + H (t) y (t) , x
(t0) = x
0
dt
que tiene como entradas las se
nales medibles de la planta y que debe ser
dise
nado de tal manera que
lm (
x (t) x (t)) = 0

para toda condici


on inicial de la planta x (t0) y del observador x
(t0).

Un requerimiento natural al observador es que si x


(t0) = x (t0) entonces
debe satisfacerse que x
(t) = x (t) para todo t t0. Esta condici
on se
satisface si
F (t) = A (t) H (t) C (t)
G (t) = B (t)
Esto implica que el observador puede ser escrito de la forma
(

L :

dx
dt (t)

= A (t) x
(t) + B (t) u (t) + H (t) [y (t) y (t)] , x
(t0) = x
0
y (t) = C (t) x
(t)

que tiene otra vez la estructura de ser una copia de la planta modificada
por una inyecci
on de salida multiplicada por una ganancia. Esta ganancia
H (t) es el u
nico par
ametro a dise
nar en el observador, y debe seleccionarse
para satisfacer la condici
on de convergencia.
El error de estimaci
on de estados
e (t) = x
(t) x (t)

satisface la ecuaci
on
e (t) = [A (t) H (t) C (t)] e (t) , e (t0) = x
(t0) x (t0)

(2)

H (t) se debe seleccionar de tal forma que el origen (e = 0) de (2) sea


asint
oticamente estable.
N
otese que este es un problema de estabilizaci
on de la ecuaci
on de error de
observaci
on, an
aloga al problema de estabilizaci
on en control (dualidad).
Esta retroalimentaci
on, si est
a bien dise
nada, le otorga una robustez que
no poseen los algoritmos en lazo abierto calculados de la caracterizaci
on
de la observabilidad.
C
omo se puede dise
nar H (t) para lograr la estabilizaci
on?

10.2.1.

Sistemas Lineales Invariantes en el tiempo

En este caso A y C son constantes y se puede elegir H tambi


en constante,
de tal forma que la matriz (A HC) sea Hurwitz, es decir, que todos
sus valores propios tengan parte real negativa. Esto se puede lograr de
m
ultiples formas. Dos de ellas son:

Asignaci
on de polos
Si la pareja (C, A) es observable, entonces se pueden asignar arbitrariamente los valores propios de (A HC) mediante alg
un algoritmo de asignaci
on de polos. Por ejemplo, la F
ormula de Ackermann para sistemas con
una sola salida.

Soluci
on de un problema de LQR

Corresponde al caso estacionario del Filtro de Kalman. Se elige H de la


siguiente manera
AP + P AT P C T R1CP + Q = 0
H = P C T R1
Para esto hay que resolver una ecuaci
on algebraica de Riccati, d
onde P es
positiva definida.
Este m
etodo tambi
en puede ser utilizado en el caso variante en el tiempo,
pero con la ecuaci
on diferencial de Riccati. Con esto se obtiene un Filtro
de Kalman.

10.3.

El principio de separaci
on lineal

Una utilizaci
on tpica de un observador de estados es en la implementaci
on
de un control dise
nado suponiendo que se pueden medir todos los estados.
Qu
e se puede asegurar en este caso acerca del lazo cerrado a trav
es del
observador? En el caso lineal se cuenta con un resultado muy satisfactorio
en este sentido: el teorema o principio de separaci
on.
Sup
ongase que se tiene un sistema lineal
(

L :

x (t) = A (t) x (t) + B (t) u (t) , x (t0) = x0


y (t) = C (t) x (t)

y que se conoce una ley de control por retroalimentaci


on lineal de los
estados
u = K (t) x (t)

que estabiliza exponencialmente el origen del sistema


(

LSC :

x (t) = [A (t) B (t) K (t)] x (t) , x (t0) = x0


y (t) = C (t) x (t)

Cuando todos los estados no pueden ser medidos se dise


na un observador
lineal
(

L :

dx
dt (t)

= A (t) x
(t) + B (t) u (t) + H (t) [y (t) y (t)] , x
(t0) = x
0
y (t) = C (t) x
(t)

para el cual la matriz H (t) ha sido dise


nada de tal forma que el error de
observaci
on de los estados
e (t) = [A (t) H (t) C (t)] e (t) , e (t0) = x
(t0) x (t0)
tiene e = 0 como punto de equilibrio exponencialmente estable.Si se cierra

el lazo de control a trav


es del observador se obtiene el sistema

x (t) = A (t) x (t) B (t) K (t) x


(t) , x (t0) = x0

d
(t) = A (t) x
(t) + B (t) u (t) + H (t) [y (t) y (t)] , x
(t0) = x
0
dt x
LOC :

y (t) = C (t) x (t)

y
(t) = C (t) x
(t)

La din
amica de este sistema puede ser reescrita en t
erminos del error de
observaci
on como
(

LOC :

x (t) = [A (t) B (t) K (t)] x (t) B (t) K (t) e (t) , x (t0) = x0


e (t) = [A (t) H (t) C (t)] e (t) , e (t0) = x
(t0) x (t0)

o en forma matricial
(

LOC :

d
dt

"

x (t)
e (t)

"

A (t) B (t) K (t)


B (t) K (t)
0
A (t) H (t) C (t)

#"

x (t)
e (t)

Si B (t) K (t) es acotada, entonces se puede demostrar f


acilmente que
tanto e (t) como x (t) convergen exponencialmente. Si las matrices son

constantes (el caso invariante en el tiempo) entonces este resultado es


inmediato, ya que los valores propios de la matriz del sistema en lazo
cerrado es triangular superior a bloques y entonces
("

A BK BK
0
A HC

#)

= {A BK} {A HC}

que por dise


no est
an todos en el semiplano izquierdo del plano complejo.
Por lo tanto: si se dise
nan independientemente un control por retroalimentaci
on de estados que estabilice a la planta y un observador que estime
asint
oticamente los estados de la planta, entonces la conexi
on de ellos asegura la estabilidad del sistema en lazo cerrado y, en el caso invariante en
el tiempo, los valores propios en lazo cerrado son la uni
on de los valores
propios del sistema controlado por retroalimentaci
on de los estados y los
valores propios del observador.

Captulo 11
Dise
no de observadores para
sistemas no lineales:
M
etodos por aproximaci
on
(linealizaci
on)

Existen una gran diversidad de m


etodos para el dise
no de observadores
para sistemas no lineales, aunque no existe ninguno universal que se pueda
aplicar a todos los casos. Veremos algunos de ellos.

M
etodos por aproximaci
on (linealizaci
on)

Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . Todos estos m
etodos se basan en
aproximar al sistema no lineal por uno lineal, obtenido de la linealizaci
on
de este en un punto de operaci
on o a lo largo de una trayectoria.

11.1.

Linealizaci
on en un punto de operaci
on

Si para una entrada constante u


el sistema tiene un punto de equilibrio x

que produce una salida y, es decir,


0 = f (
x, u
) ,
y = h (
x)
entonces se puede obtener una aproximaci
on lineal del sistema para cuando
la entrada, la salida y el estado se encuentren cerca de sus valores de
operaci
on. Si definimos las desviaciones de estas variables como
x (t) = x (t) x
, y (t) = y (t) y , u (t) = u (t) u
,
La linealizaci
on es
x (t) = Ax (t) + Bu (t) , x (t0) = x0
y (t) = Cx (t)
f (
x,
u)
f (
x,
u)
h(
x)
A = x , B = u , C = x

que es un sistema lineal invariante en el tiempo.

Si el sistema Linealizado es observable (detectable), entonces el sistema


no lineal ser
a localmente observable (detectable) en una vecindad de x
.

Basados en la linealizaci
on se pueden construir dos observadores:

1. Un observador lineal

2. Un observador no lineal

11.1.1.

Observador Lineal

El observador lineal construido para el sistema linealizado


dx
x (t) + Bu (t) + H
dt (t) = A
y (t) = C x
(t)

[y (t) y (t)] , x
(0) = x0

(A HC) es Hurwitz

operar
a aproximadamente bien para el sistema no lineal, siempre y cuando
sus trayectorias permanezcan cerca del punto de operaci
on, es decir, para
valores peque
nos de kx (0)k, k
x (0)k, ku (t)k.

Control por retroalimentaci


on

dx
x (t) + Bu (t) + H
dt (t) = A
u (t) = K x
(t)
u (t) = u
Kx
(t)

[y (t) C x
(t)] , x
(0) = x0

(A HC) es Hurwitz

Se puede verificar (Hacerlo!) que el sistema en lazo cerrado tiene un punto


de equilibrio en
x=x
, x
=x
x=0
y la linealizaci
on en este punto de equilibrio es
d
dt

"

x (t)
x
(t)

"

A BK BK
0
A HC

#"

x (t)
x
(t)

que es exponencialmente estable. Entonces por el Teorema de Linealizaci


on
de Lyapunov este controlador estabiliza localmente el punto de equilibrio
del sistema no lineal.

11.1.2.

Observador No Lineal

Para el sistema no lineal


(

x (t) = f (x (t) , u (t)) , x (t0) = x0


y (t) = h (x (t))

con pareja de equilibrio


0 = f (
x, u
) ,
y = h (
x)

construya el observador no lineal


(

N L :

dx
dt (t)

= f (
x (t) , u (t)) + H [y (t) y (t)] , x
(t0) = x
0
y (t) = h (
x (t))

El sistema interconectado Planta-Observador tiene un punto de equilibrio


en
x=x
, u=u
, x
=x
.
Introduciendo la variable de error de observaci
on

x
=x
x

el sistema Planta-Observador puede ser escrito en las nuevas variables de


estado (x, x
)
(

x (t) = f (x (t) , u (t)) , x (t0) = x0


y (t) = h (x (t))

d
:
x
(t) = g (
x (t) , x (t) , u (t)) , x
(t0) = x
0 x0
dt

d
onde
g (
x, x, u) , f (x + x
, u) f (x, u) + H [h (x) h (x + x
)]
que satisface
g (0, x, u) = 0 , x, u
Se puede verificar (hacerlo!) que la linealizaci
on del sistema error de observaci
on alrededor del punto de equilibrio
x=x
, u=u
, x
=0

es
d
x
= (A HC) x

dt
que es exponencialmente estable (por el dise
no de H). Entonces por el
Teorema de Linealizaci
on de Lyapunov este observador operar
a aproximadamente bien para el sistema no lineal, siempre y cuando sus trayectorias permanezcan cerca del punto de operaci
on, es decir, para valores
peque
nos de k
x (0)k, kx (t) x
k, ku (t) u
k.

Ejercicio 113 Qu
e ocurre con el controlador implementado utilizando este
observador?

11.2.

Linealizaci
on a lo largo de una trayectoria

Si para una entrada fija, posiblemenete variante con el tiempo u


(t) el
sistema tiene una trayectoria soluci
on x
(t) que produce una salida y (t),
es decir,
dx
dt (t)

= f (
x (t) , u
(t)) ,
y (t) = h (
x (t))
entonces se puede obtener una aproximaci
on lineal del sistema para cuando
la entrada, la salida y el estado se encuentren cerca de sus valores de
operaci
on. Si definimos las desviaciones de estas variables como
x (t) = x (t) x
(t) , y (t) = y (t) y (t) , u (t) = u (t) u
(t) ,

La linealizaci
on es
x (t) = A (t) x (t) + B (t) u (t) , x (t0) = x0
y (t) = C (t) x (t)
f (
x(t),
u(t))
f (
x(t),
u(t))
h(
x(t))
A (t) =
,
B
(t)
=
,
C
(t)
=
x
u
x
que es un sistema lineal variante en el tiempo. Si el sistema Linealizado es
observable, entonces el sistema no lineal ser
a localmente observable en una
vecindad de x
(t), y un observador construido para el sistema linealizado
operar
a aproximadamente bien para el sistema no lineal, siempre y cuando
sus trayectorias permanezcan cerca de la trayectoria de referencia.

11.2.1.

El Filtro de Kalman Extendido

En particular, la aplicaci
on del dise
no del Filtro de Kalman junto con la
linealizaci
on lleva al Filtro de Kalman Extendido, uno de los filtros m
as
utilizados en la pr
actica. Su estructura es la siguiente
(

x (t) = f (x (t) , u (t)) + w (t) , x (t0) = x0


y (t) = h (x (t)) + v (t)

dx

(t) = f (
x (t) , u (t)) + H (t) (y (t) h (
x (t))) , x
(t0) = x
0

dt

T
1 (t)

H (t) = P (t) C (t) R


d P (t) = P (t) AT (t) + A (t) P (t) +
EKF :
dt

T (t) R1 (t) C (t) P (t) + Q (t)

P
C
(t)

h (
A (t) = f (
x
(t)
,
u
(t))
,
C
(t)
=
x (t))
x
x

Para implementar el EKF se debe:

Calcular las matrices A (t) y C (t)

Resolver la ecuaci
on diferencial de Riccati

Calcular la ganancia de inyecci


on de salida H (t)

N
otese que la ecuaci
on de Riccati y la ecuaci
on del observador deben ser
resueltas simult
aneamente, ya que A (t) y C (t) dependen de (
x (t) , u (t)).

Convergencia

La convergencia de todos estos observadores/filtros s


olo puede asegurarse
localmente. La din
amica del error de observaci
on x
=x
x est
a dada por
dx
dt

= f (
x, u) f (x, u) + H (h (x) h (
x)) + , x
(t0) = x
0
H = P C T R1
d P = P AT + AP P C T R1CP + Q
dt
= Hv w
f (
h (
A (t) = x
x (t) , u (t)) , C (t) = x
x (t))
Si se asume que x (t), u (t), H (t), v (t), w (t) son acotadas y que f y
h son dos veces contnuamente diferenciables, entonces, se puede escribir
como (haci
endo un desarrollo en series de Taylor alrededor del punto de

equilibrio x
= 0)
dx
dt

= [A (t) H (t) C (t)] x


+ (
x, t) + (t) , x
(t0) = x
0
,
H = P C T R1
d P = P AT + AP P C T R1CP + Q
dt
d
onde
(
x, t) = f (
x, u) f (x, u) H (h (
x) h (x)) [A (t) H (t) C (t)] x

(0, t) = 0
y d
onde
k (
x, t)k k1 k
xk2 , k (t)k k2 .

Prueba. Por el teorema del valor medio

f (
x, u) f (x, u) A (t) x
= f (
x, u) f (
xx
, u) A (t) x

Z1

f (
x
x, u) d
x
f (
x (t) , u (t)) x

x
x

0
Z1

=
0
Z1

=
0

f (
x
x, u)
f (
x (t) , u (t)) d
x
x
x

f (
x
x, u)
f (
x (t) , u (t)) d
x
x
x

Ahora, para cada componente de f , i = 1, 2, , n, y dado que f es


dos veces contnuamente diferenciable, se puede aplicar por segunda vez

el teorema del valor medio

fi (
x
x, u)
fi (
x (t) , u (t)) =
x
x

Z1
0

2
fi (
x
x, u) d x

2
x

y por lo tanto
kf (
x, u) f (x, u) A (t) x
k k11 k
xk2 .
Los mismos argumentos conducen a que
kH (t) C (t) x
H (h (
x) h (x))k k12 k
xk2 ,
y por lo tanto
k (
x, t)k k1 k
xk2 .

Lema 114 El sistema


dx
dt

= [A (t) H (t) C (t)] x


+ (
x, t) + (t) , x
(t0) = x
0
,
H = P C T R1
d P = P AT + AP P C T R1CP + Q
dt
es ISS de peque
na ganancia con respecto a (t), es decir, para condiciones
iniciales peque
nas y peque
nas perturbaciones (t), si = 0 entonces x
=
0 es un punto de equilibrio local y exponencialmente estable, si 0
entonces x
0 y si es acotado entonces x
permanecer
a acotado.

Prueba. Igual que en el caso lineal considere la candidata a funci


on de
Lyapunov
V (t, x
) = x
T P 1x
,

que es decreciente y positiva definida si la pareja (A (t) , C (t)) es uniformemente observable. Entonces

dP
V = x
T P 1 P AT + AP P C T R1CP P C T R1CP
P 1x
+
dt
+ 2
xT P 1 ( (
x, t) + )
=
xT P 1QP 1x
x
T C T R1C x
+ 2
xT P 1 (
x, t) + 2
xT P 1
c1 k
xk22 + c2 k
xk32 + c3 k
xk2 kk2

Qu
e se puede decir del control en lazo cerrado con este observador?

Captulo 12
Dise
no de observadores para
sistemas no lineales:
M
etodos exactos

12.1.

Linealizaci
on exacta del error de observaci
on

Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . La idea b
asica del m
etodo de
linealizaci
on exacta del error de observaci
on [9, 26, 27, 52] es buscar una
transformaci
on de los estados y de las salidas
= T (x)
= (y)
tales que sean difeomorfismos, es decir, que sean invertibles y que tanto
la transformaci
on como la inversa sean diferenciables, y que el sistema en

las nuevas variables el sistema toma la forma


(t) = A (t) + ( (t) , u (t)) , (t0) = 0
(t) = C (t)

(1)

Si este es el caso, y la pareja (C, A) es observable, se dice que el sistema


est
a en la Forma de Observador.
Si el sistema est
a en la forma (1) y la pareja (C, A) es observable (detectable), entonces se puede construir un observador para el sistema transformado como
d (t)
dt

= A (t) + ( (t) , u (t)) + H (t) (t)


(t) = C (t)

, (t0) = 0

El error de observaci
on (e = ) en las nuevas coordenadas est
a dado
por
e (t) = (A HC) e (t)

que es una din


amica lineal. Si (A HC) es Hurwitz, el estado del observador converge al verdadero valor del estado en forma exponencial. Un
estimado para el sistema original se obtiene invirtiendo la transformaci
on
x
(t) =

T 1

(t)

El problema m
as difcil en el m
etodo consiste en encontrar las tranformaciones T y , si es que estas existen. Desafortunadamente, las condiciones
de existencia de tales transformaciones son tan fuertes, que s
olo pocos
sistemas pueden ser transformados de esta manera. As que este m
etodo
solo puede ser aplicado a una peque
na clase de sistemas.

12.1.1.

Condiciones de existencia de la transformaci


on

Consideremos el caso de sistemas con una sola salida y d


onde s
olo se utiliza
la transformaci
on de los estados
: x = f (x) + g (x, u) ,

x (0) = x0 , y = h (x) ,

(2)

d
onde x Rn, u Rp, y R, f , g son campos vectoriales suaves con
f (0) = 0 y g (x, 0) = 0, x, y h es una funci
on suave con h (0) = 0.
Teorema 115 Existe un difeomorfismo local T () en una vecindad U0 del
origen que transforma al sistema (2) a la forma (1) si y s
olo si en U0:

(i) rango dh (x) , dLf h (x) , , dLn1


h (x) = rango
f

(x)
x

=n,

(ii)

adif

r,
j
adf

(iii) g ,
d
onde

j
adf

r =0 , 0i , j n1 ,

r = 0 , 0 j n 2 , u Rm
(x) =

h (x) , Lf h (x) ,

iT
n1
Lf h (x)

y r es el u
nico campo vectorial que es soluci
on de
h

iT
n1
Lr Lf h (x)

h
i
(x)
Lr h (x) , Lr Lf h (x) ,
r (x) = 0 0 1
=
x
(3)
El difeomorfismo es global U0 = Rn, si y s
olo si las condiciones (i)-(iii) se
satisfacen en Rn y, adicionalmente,

(iv) adif r , 0 i n 1 , son campos vectoriales completos.

El cambio de coordenadas = T (x) est


a dado por
T (x)
[r1 , r2 , , rn] = I
x
d
onde
ri = (1)i1 adi1
f r , 1in
h(x)

Comentario 116 Lf h (x) = x f (x) denota la derivada de Lie de la

i1
funci
on h a lo largo del campo vectorial f , y Lif h (x) = Lf Lf h (x) . La
diferencial dh de una funci
on suave h : U Rn Rh puede ser escrita en i
h(x)
coordenadas locales como un vector fila del gradiente h(x)
.
,

,
x1
xn
Para dos campos vectoriales f y g se define un nuevo campo vectorial meg
diante el par
entesis de Lie [f , g] = x
f f
x g, en coordenadas locales.
Para par
entesis de Lie repetidos el operador ad est
a definido como
ad0f

g=g ,

adif

g= f ,

adi1
f g

Un campo vectorial f se dice que es completo si las soluciones de la


ecuaci
on diferencial x = f (x) puede ser definida para todo tiempo t R.
Comentario 117 Las condiciones del Teorema son muy fuertes y no son
satisfechas en forma gen
erica. La condici
on (i) corresponde a la observabilidad local para todo x del sistema sin entradas, y se satisface en casi
todos los casos. La condici
on de conmutatividad (ii) es muy restrictiva.
Comentario 118 Esta es la forma m
as simple del problema de linealizaci
on
del error de observaci
on. Este puede ser extendido de diversas maneras. Por
ejemplo, permitiendo que la transformaci
on T sea un semi-difeomorfismo
(la inversa no se requiere que sea diferenciable) se pueden dise
nar observadores continuos cuando la condici
on (i) del teorema no es satisfecha
[53, 40]. Si se incluye una transformaci
on de salida [27] y/o una transformaci
on de la escala de tiempo [18, 39] o el uso de t
ecnicas de inmersi
on,

mediante las cuales el sistema transformado puede poseer una dimensi


on
mayor al original permite una extensi
on del m
etodo [28, 22]. Adicionalmente, es posible considerar formas en las que se permitan derivadas de la
entrada y de la salida [55, 19].
Ejemplo 119 Sea el sistema
"

x =

1 (x1) + x2
f2 (x)

"

0
1

y = x1
Entonces

"

(x) =

h (x)
Lf h (x)

"

x1
1 (x1) + x2

1
0
(x)

= d1(x1)
1
x
dx1

"

(x)
rango
= 2 , x
x
(x)
r (x) =
x

"

0
1

r (x) =
= d1(x1)
1
dx1

"

0
1

1 "

"
#
#
"
#
1
0
1
0
0

0 = 0
=
r (x) = d1(x1)
d1 (x1 )
1
1
1
dx
1
1
dx1
1

f (x)
adf r = [f, r] =
r=
x
h

d1 (x1 )

1
fdx(x)
2
x1

f2 (x)
x2

"

adf r
r , adf r =
r = 2f2(x) 2f2(x)
x
x1 x2
x22
i

"

0
1

0
1

= f2(x)
x2
#

= 2f2(x)
x22

2f2 (x)
= 0 f2 (x) = 2 (x1) + x23 (x1)
r , adf r = 0
2
x2
i

[g, r] = 0 (g y r son campos vectoriales constantes)


Entonces todas las condiciones son satisfechas.

"

r1 = (1)0 ad0f r = r =
"

r2 = (1)1 ad1f r = adf r =

0
1

1
3 (x1)

T (x)
[r1 , r2] = I
x

T1 (x)
x1
T (x)
2
x1

T1 (x) "
x2
T2 (x)
x2

0
1
1 3 (x1)

"

1 0
0 1

T1 (x)
x1
T (x)
2
x1

T1 (x)
x1
T (x)
2
x1

T1 (x)
x2
T2 (x)
x2

"

T1 (x)
x2
T2 (x)
x2

T1 (x) = x2

"

Z x
1
0

0
1
1 3 (x1)

#1

3 (x1) 1
1
0

3 () d

T2 (x) = x1
"

1
2

"

#
R x1
x2 0 3 () d
x1

"

2 (x1) + x23 (x1) 3 (x1) (1 (x1) + x2) + u


1 (x1) + x2

y = 2
"

=
y=

12.1.2.

0 0
1 0

"

+
i

2 (y) 1R(y) 3 (y) + u


y
1 (y) + 0 3 () d

0 1

Algunos casos particulares

[27, 35] Para sistemas en la Forma Normal de Observabilidad


x =

x2 , xn n (x)

iT

x (0) = x0 , y = x1 ,

existen una transformaci


on de estados z = T (x) y una transformaci
on de
salidas y = (y) que llevan al sistema a la Forma de Observador (1) si y
s
olo si:

Si n = 2: 2 (x) tiene la forma polinomial


2 (x) = k0 (y) + k1 (y) x2 + k2 (y) x22 .
En este caso la transformaci
on de salida se calcula de
00 (y) = k2 (y) 0 (y) , (0) = 0 ,
d
onde 0 (y) ,
calculan de

d(y)
dy .

Los t
erminos de inyecci
on de salida en (1) se

01 (y) = k1 (y) 0 (y) , 1 (0) = 0


2 (y) = k0 (y) 0 (y) , 2 (0) = 0 .

Si n = 3: 3 (x) tiene la forma polinomial


3 (x) = k0 (y)+k1 (y) x2+k2 (y) x3+k3 (y) x22+k4 (y) x2x3+k5 (y) x32 ,
d
onde los coeficientes satisfacen las relaciones:
1 2
0
3k5 (y) = k4 (y) k4 (y) ,
3
1
k3 (y) = k20 (y) k2 (y) k4 (y) .
3
En tal caso la transformaci
on de salida se calcula de
1
00 (y) = k4 (y) 0 (y) , (0) = 0 .
3
Los t
erminos de inyecci
on de salida resultan de
01 (y) = k2 (y) 0 (y) , 1 (0) = 0 ,
02 (y) = k1 (y) 0 (y) , 2 (0) = 0 ,
3 (y) = k0 (y) 0 (y) , 3 (0) = 0 .

Si no se permite una transformaci


on de la salida, se requieren restricciones adicionales en los coeficientes, que pueden ser derivados imponiendo
0 (y) = 1 en las relaciones anteriores.
Ejemplo 120 Considere el sistema

"

x =

x2
x1 x2 x21 x22

"

x1
x1x2

u,

y = x1 ,
Este sistema es transformable a la forma (1)
"

0 1
0 0
y = z1 .

z =

"

z+

y u (
y + 1) ln |
y + 1|
ln |
y + 1| (1 + y) (1 + ln |
y + 1| + u)

mediante una transformaci


on de estados y de salidas [27], dadas por
y = (y) = exp (y) 1 , y = 1 (
y ) = ln |
y + 1| , : R (1, ) ,
"

z = T (x) =

exp (x1) 1
exp (x1) (x2 + 1) 1
"

x=

T 1 (z)

ln |z1 + 1|
z2 +1
z +1 1

, T : R2 (1, ) R

12.1.3.

Control retroalimentado

Sea
u = (x)

una ley de control que estabiliza globalmente el punto de equilibrio (x = 0),


es decir,
x (t) = Ax (t) + (y (t) , u (t)) , x (0) = x0
y (t) = Cx (t)
u = (x)
es GUA. La ley de control din
amica de salida, a trav
es de observador
est
a dada por
d (t)
dt x

= A
x (t) + (y (t) , u (t)) + H (y (t) C x
(t)) , x
(0) = x
0
u = (
x)
El sistema Planta-Observador, en las coordenadas (x, e), con e = x
x el
error de observaci
on, est
a dado por
x = Ax + (y, (x + e)) , x (0) = x0
e = (A HC) e , e (0) = e0

o
x = Ax + (y, (x)) + [ (y, (x + e)) (y, (x))] , x (0) = x0
e = (A HC) e , e (0) = e0
Este es un sistema en cascada, d
onde
El origen del sistema maestro (error de observaci
on)
e = (A HC) e , e (0) = e0
es GEE (global y exponencialmente estable), y
El origen del sistema esclavo, sin la entrada del sistema maestro (e =
0), es decir, la planta controlada
x = Ax + (y, (x)) , x (0) = x0
es GAE (global y asint
oticamente estable).

Entonces el origen de la cascada (x, e) = (0, 0) ser


a GAE si (condici
on
suficiente) el sistema esclavo

x = Ax + (y, (x) + e) , x (0) = x0

es ISS de la entrada e x. Un caso particular es, por ejemplo, cuando


(y, u) sea globalmente Lipschitz en (y, u), y el sistema esclavo sin entrada x = Ax + (y, (x)) tenga un punto de equilibrio GEE (global y
exponentcialmente estable) [25, Lemma 4.6].

12.2.

Linealizaci
on por inmersi
on

Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . La idea b
asica de este m
etodo
consiste en usar una inmersi
on de los estados en un espacio de dimensi
on
mayor
= T (x) , Rm , m > n
de tal forma que el sistema en las nuevas variables toma la forma
(t) = A (t) + ( (t) , u (t)) , (t0) = 0
(t) = C (t)

Si este es el caso, y la pareja (C, A) es observable, entonces se puede


construir un observador para el sistema transformado como

d (t)
dt

= A (t) + ( (t) , u (t)) + H (t) (t)


(t) = C (t)

, (t0) = 0

El error de observaci
on (e = ) en las nuevas coordenadas est
a dado
por
e (t) = (A HC) e (t)
que es una din
amica lineal. Si (A HC) es Hurwitz, el estado del observador converge al verdadero valor del estado en forma exponencial. Un
estimado para el sistema original se obtiene seudo-invirtiendo la transformaci
on, es decir, haciendo una proyecci
on del estado Rm a x Rn
x
(t) =

TI

(t)

Ejemplo 121 Considere el sistema


x 1 = x1 + g (x2)
x 2 = ax2
y = x1
d
onde g (x2) =

x2 x22
"

o1 (x) =

1 . Los mapas de observabilidad son


x1
x1 + g (x2)

: no inyectivo

x1

o2 (x) =

x
: inyectivo
y + x3
2
2
3ay (3a + 1) y 2ax2
Entonces, si a 6= 0 el sistema es globalmente observable. Si a = 0 no hay
observabilidad, ya que hay indistinguibilidad.

Si se deriva una vez m


as
y (3) (t) = 3ay (t) (3a + 1) y (t) + 2a2x2
= (4a + 1) y (t) a (4 + 3a) y (t) 3a2y
Es decir, se puede representar a este sistema por uno lineal

dt

0
1
0
1
1

0
1
2 = 0
2
3
3
3a2 a (4 + 3a) (4a + 1)

h
i 1

y = 1 0 0 2
3

que es observable. As que se puede construir un observador para el sistema


en las nuevas coordenadas y recuperar un estimado de los estados originales

mediante, por ejemplo, la proyecci


on
x
1 = 1

3a1 (3a + 1) 2 3
x
2 =
2a

12.3.

Transformaci
on a sistemas afines en los estados no medibles

Consid
erese un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))

con x (t) Rn, u (t) Rp, y (t) Rq . La idea b


asica de este m
etodo
(similar a la de linealizaci
on exacta del error de observaci
on) es buscar una
transformaci
on (difeomorfismos) de los estados y de las salidas
= T (x) , = (y)
tales que el sistema en las nuevas variables tome la forma
(t) = A (y (t) , u (t)) (t) + ( (t) , u (t)) , (t0) = 0
(t) = C (t)

(4)

Si este es el caso, u (t) es tal que A (y (t) , u (t)) sea uniformamente acotada y la pareja (C, A (y (t) , u (t))) sea uniformamente observable, entonces
se puede construir un observador (tipo Kalman) para el sistema transformado como

d (t) = A (y, u) (t) + (, u) + H (t) (t) C (t) , (t ) =


0
0
dt
d P (t) = P (t) AT (y, u) + A (y, u) P (t) P (t) C T R1 CP (t) + Q ,
dt
H (t) = P (t) C T R1,
P (t0) = P0

Un estimado para el sistema original se obtiene invirtiendo la transformaci


on
x
(t) =

T 1

(t)

El problema m
as difcil en el m
etodo consiste en encontrar las tranformaciones T y , si es que estas existen.

12.4.

El observador de alta ganancia

Considere un sistema afn en las entradas y con una sola salida


x (t) = f (x (t)) + g (x (t)) u (t) , x (t0) = x0
y (t) = h (x (t))

con x (t) Rn, u (t) Rp, y (t) R. Sup


ongase que el mapa de observabilidad de orden n 1

on1 (x) =

h (x)
Lf h (x)
L2f h (x)
...
h (x)
Ln1
f

del sistema con entrada cero satisface las condiciones:

1. es un difeomorfismo global,

2. es globalmente Lipschitz.

Adem
as, que el sistema es observable globalmente para cualquier entrada
(uniformemente observable). Entonces, la transformaci
on de estados
= T (x) = on1 (x) ,
lleva al sistema a la forma
(t) = Ao (t) + ( (t) , u (t)) , (t0) = 0
(t) = Co (t)
d
onde

Ao =

Co =

0
0
...
0
0

1 0
0 1
... . . . ...
0 0
0 0

1 0 0

0
0
...
1
0

( , u)
1 1

2 (1, 2, u)

, (, u) = ( , , , u)
3 1 2 3

...

n (, u)

Si (, u) es globalmente Lipschitz en uniformemente en u entonces


existe un observador de la forma [?]
d (t)
dt

= Ao (t) + (t) , u (t) + Ho (t) Co (t)

0 0
0 2 0

... ... . . . 0

0 0
0 n

, (t0) = 0

que converge exponencialmente si (Ao HoCo) es Hurwitz y es suficientemente grande. La velocidad de convergencia es proporcional a .

12.4.1.

Ejemplo de motivaci
on

Considere el sistema
x 1 = x2
x 2 = (x, u)
y = x1
Suponga que el control u = (x) estabiliza el origen de
x 1 = x2
x 2 = (x, (x)) .
Sea el observador

x
1 = x
2 + l1 (y x
1 )

x
2 = 0 (
x, u) + l2 (y x
1 )

d
onde 0 (x, u) es un modelo nominal de (x, u). El error de observaci
on
x
1 = x
1 x1 , x
2 = x
2 x2

x
1 = l1x
1 + x
2

x
2 = l2x
1 + (x, x
)
(x, x
) = 0 (
x, (
x)) (x, (
x))
"

l1
tal que A0 =
l2
transferencia de x
es
Dise
ne L =

"

l1 1
l2 0

1
Go (s) = 2
s + l1 s + l2

"

es Hurwitz. La matriz de

1
s + l1

Dise
ne L para hacer supR kGo (j)k tan peque
na como sea posible.
Elija
1
2
l1 =
, l2 = 2 , > 0

Go (s) =

(s)2 + 1s + 2

"

s + 1

Los valores propios del observador son (1/) y (2/), d


onde 1 y 2 son
las races de
2 + +1 + 2 = 0
sup kGo (j)k = O ()

N
otese que
lm Go (s) = 0 ,

el efecto de atenuaci
on es mayor para peque
nos valores de .
Defnase
x

1 = 1 , 2 = x
2

entonces
1 = 11 + 2
2 = 21 + (x, x
)
Luego:

1. La cota final de es del orden de O ()

2. decae m
as r
apidamente que un modo exponencial eat/, a > 0.

El fen
omeno de pico

x1 (0) 6= x
1 (0) = 1 (0) = O (1/)
La soluci
on contiene un t
ermino de la forma
1 at/
e

que aproxima una funci


on impulso cuando 0.

Ejemplo 122
x 1 = x2
x 2 = x32 + u
y = x1

Control por retroalimentaci


on de estados
u = x32 x1 x2
Control por retroalimentaci
on de la salida

x
1 = x
2 + 2 (y x
1 )

x
2 = 12 (y x
1 )
u =
x32 x
1 x
2

An
alisis del sistema en lazo cerrado:
x 1 = x2
x 2 = (x, (x x
))

1 = 11 + 2
2 = 21 + (x, x
)

Figura 12.1: Inestabilidad inducida por el fen


omeno de pico cuando =

Figura 12.2: Regi


on de atracci
on con retroalimentaci
on de los estados

Figura 12.3: Regi


on de atracci
on con retroalimentaci
on de salida. = 0,1
(discontnua), = 0,05 (discontnua-punteada),

Figura 12.4: An
alisis del sistema en lazo cerrado: x 1 = x2 , x 2 =
(x, (x x
)) , 1 = 11 + 2 , 2 = 21 + (x, x
)

Cu
al es el efecto del ruido de medici
on?

El observador de alta ganancia es un diferenciador aproximado. La funci


on
de transferencia de y x
(con 0 = 0) es
"

2
2

(s) + 1s + 2

1 + (1/2) s
s

"

1
s

cuando 0

La diferenciaci
on amplifica el efecto del ruido de medici
on.
y = x1 + v , kn = sup |v (t)| < , kd = sup |
x1 (t)|
s

opt = O

kn
kd

t0

t0

12.4.2.

Estabilizaci
on

Sea
x = Ax + B (x, z, u)
z = (x, z, u)
y = Cx
= q (x, z)

u Rp , y Rm , Rs , x R , z R`

A, B, C son matrices diagonales a bloques d


onde

Ai =

Ci =

0
0
...
0
0

1 0
0 1
... . . . ...
0 0
0 0

1 0 0 0

0
0
...
1
0
i

, Bi =

i i

1i

, =

m
X

0
0
...
0
1

i1

i=1

Las variables medidas son y, . Esto sucede, por ejemplo, para sistemas

En la forma normal de los sistemas linealizables entrada/salida

Sistemas mec
anicos y electromec
anicos

Ejemplo 123 Sistema de suspensi


on magn
etica
x:

x 1 = x2
x 2 = g
(

z : x 3 =

kx
m 2
"

L0 ax23
2m(a+x1 )2

1
L ax x
Rx3 + 0 2 32 + u
L (x1)
(a + x1)

y = x1
= x3
Se proceder
a en dos pasos al dise
no de un control por retroalimentaci
on
de salida:

1. Dise
no de un controlador por retroalimentaci
on parcial del estado que
usa las mediciones de x y para estabilizar asint
oticamente el origen.

2. Se dise
na un observador de alta ganancia para estimar a x a partir de
y.
El controlador de estados puede ser un sistema din
amico de la forma
= (, x, )
u = (, x, )
d
onde y son funciones localmente Lipschitz en sus argumentos, en el
dominio de inter
es, y son funciones globalmente acotadas en x. Adem
as,
(0, 0, 0) = 0, (0, 0, 0) = 0. O, como caso particular del anterior, un
control est
atico de la forma
u = (x, ) .
El sistema en lazo cerrado con controlador de estados se escribe como
X = f (X ) , X = (x, z, )

El origen de X = f (X ) es asint
oticamente estable.
El controlador de salida se toma como
= (, x
, )
u = (, x
, )
d
onde x
es generada por el observador de alta ganancia

x
= A
x + B0 (
x, , u) + L (y C x
)
La ganancia del observador L es elegida como

i1/
i2/2

...
L = blockdiag [L1, , Lm] , Li =

i
1
i1/ i
ii /i

i 1

d
onde es una constante positiva a especificar y las constantes positivas
ij son elegidas de tal forma que
si + i1si1 + + ii1s + i i
sea Hurwitz. 0 (x, , u) is un modelo nominal de (x, z, u), que es globalmente acotado en x, y 0 (0, 0, 0) = 0.
Teorema 124 [25, Theorem 14.6](Principio de separaci
on no lineal).
Sup
ongase que el origen de X = f (X ) es asint
oticamente estable y R es
su regi
on de atracci
on. Sea S cualquier conjunto compacto en el interior
de R y sea Q cualquier subconjunto compacto de R. Entonces
1 > 0 tal que, para todo 0 < 1, las soluciones (X (t) , x
(t)) del
sistema en lazo cerrado, que se inician en S Q, est
an acotadas para todo
t 0.

Dado cualquier > 0, 2 > 0 y T2 > 0, ambos dependientes de , tales


que, para todo 0 < 2, las soluciones (X (t) , x
(t)) del sistema en lazo
cerrado, que se inician en S Q, satisfacen
kX (t)k , k
x (t)k , t T2 .
Dado cualquier > 0, 3 > 0, dependiente de , tal que, para todo
0 < 3, las soluciones (X (t) , x
(t)) del sistema en lazo cerrado, que
se inician en S Q, satisfacen
kX (t) Xr (t)k , t 0 ,
d
onde Xr (t) es la soluci
on de X = f (X ), que se inicia en X (0).
Si el origen de X = f (X ) es exponencialmente estable, entonces 4 > 0
tal que, para todo 0 < 4, el origen del sistema en lazo cerrado es

exponencialmente estable, y S Q es un subconjunto de su regi


on de
atracci
on.
Ideas fundamentales de la prueba:
Representaci
on del sistema en lazo cerrado como un sistema con perturbaciones singulares, d
onde X es el estado lento y (el error de
estimaci
on escalado) es el estado r
apido.
Uso del teorema converso de Lyapunov para construir conjuntos invariantes positivos.
Uso del acotamiento global de x
para mostrar que alcanza O ()
mientras X se encuentra dentro de un conjunto invariante positivo.

An
alisis no local versus an
alisis local.

Un aspecto novedoso es la recuperaci


on del desempe
no, que se manifiesta
en tres puntos:

1. Recuperaci
on de la estabilidad exponencial.

2. Recuperaci
on de la regi
on de atracci
on en el sentido que se puede
recuperar cualquier conjunto compacto en su interior.

3. La soluci
on X (t) bajo control de salida se acerca a la soluci
on con
control de estados cuando 0.

Ejemplo 125 [25, Example 14.19]

m`2 + mg0` sin + k0`2 = u

Estabilizaci
on en = , = 0 . Un control por modos deslizantes es

a1 ( ) +
u = k sat

Sup
ongase que s
olo se mide :

2
=
+

= 0 , u + 2

u =
0 ,
a sin + cu

a1 +

u = k sat

o tambi
en

a1 ( ) +

u = k sat

12.5.

Observador Lipschitz

Considere un sistema de la forma


x = Ax + (x, u) ,
y = Cx .

x (0) = x0

Si se asume que la no linealidad (x, u) es globalmente Lipschitz en x,


uniformemente en u, es decir,
k (x + z, u) (x, u)k kzk
Bajo estas condiciones, si existe una L y una P = P T y positiva definida
tales que se satisfaga la desigualdad
P (A LC) + (A LC)T P + P + 2I + P P 0
entonces el sistema
d
x
= A
x + (
x, u) + L (y C x
) , x
(0) = x
0
dt
es un observador global y que converge exponencialmente para el sistema.

Captulo 13
Dise
no de observadores para
sistemas no lineales:
Dise
no disipativo de observadores
no lineales

Este m
etodo, propuesto hace un par de a
nos por el autor de estas notas
[31], y que incluye y generaliza diversos m
etodos en la literatura tiene como
idea b
asica la siguiente:

Sup
ongase que se tiene un sistema no lineal
x (t) = f (x (t) , u (t)) , x (t0) = x0
y (t) = h (x (t))
con x (t) Rn, u (t) Rp, y (t) Rq . Sup
ongase adem
as que despu
es
de aplicar alguna de las transformaciones anteriormente mencionadas el
sistema no alcanza la forma deseada. Para hacerlo concreto suponga que en
vez de obtener la forma para linealizar exactamente el error de observaci
on
(t) = A (t) + ( (t) , u (t)) , (t0) = 0
(t) = C (t)

se llega a una forma, que constituye una perturbaci


on de esta
(t) = A (t) + G (, , u) + (, u) , (t0) = 0
(t) = C (t)
(t) = H (t)
d
onde Rr es una funci
on lineal del estado, que no es (necesariamente)
medible. En este caso no se puede usar la teora lineal para dise
nar el observador, debido a la perturbaci
on no lineal en un lazo de retroalimentaci
on,
introducida por la funci
on (, , u). Si es triangular inferior, como en
el caso del observador de alta ganancia, o es globalmente Lipschitz, se
pueden usar estas metodologas para tratar de dise
nar el observador. El
dise
no disipativo considera casos m
as generales de perturbaciones, para lo
cual se utiliza la teora de la disipatividad.

13.0.1.

Preliminaries

In this work the stability properties of dissipative systems will be used for
the design of observers for systems that can be represented as the feedback
interconnection of a dynamical linear time invariant (LTI) system in the
forward loop and a memoryless nonlinearity in the feedback loop. From the
general dissipativity theory [47, 49, 50, 21, 25] the following results are of
relevance here.

Consider the feedback interconnection


x = Ax+Bu ,

x (0) = x0 , y = Cx , u = (t, y) , x Rn , u Rq , y Rm
(1)

and quadratic supply rates


"

(v, w) = v T Qv+2v T Sw+wT Rw =

v
w

#T "

Q S
ST R

#"

v
w

, v Rr , w Rs
(2)

where Q Rrr , S Rrs, R Rss, and Q, R symmetric.


Definici
on 126 The linear part (A, B, C) of system (1) is said to be state
strictly dissipative (SSD) with respect to the supply rate (y, u), or for
short (Q, S, R)-SSD, if there exist a matrix P = P T > 0, and > 0 such
that
"

P A + AT P

+ P , P B
BT P
0

"

C T QC

CT S

ST C

0.

(3)

For quadratic systems, i.e. m = q, passivity corresponds to the supply rate


(y, u) = y T u. If (A, B) controllable, (A, C) observable, then condition

(3) is equivalent, by the Kalman-Yakubovich-Popov Lemma [25], to the


fact that the transfer matrix of , i.e. G (s) = C (sI A)1 B, is strictly
positive real (SPR). Note that this definition assures the existence of a
quadratic positive definite storage function V (x) = xT P x, and a positive definite loss function Z (x, u) =

T
T
T
T
K x+W u
K x+W u

xT P x, such that along any trajectory of the system V (x (t)) = (y (t) , u (t))
Z (x (t) , u (t)).
Definici
on 127 The nonlinear part of system (1), a time-varying memoryless nonlinearity : [0, ) Rm Rq , u = (t, y), piecewise continuous
in t and locally Lipschitz in y, such that (t, 0) = 0, is said to satisfy a
dissipative condition in with respect to the supply rate (u, y) (2), or
for short (Q, S, R)-D in , if
(u, y) = ( (t, y) , y) 0 , t 0 , y Rm ,

where is a subset of Rm whose interior is connected and contains the


origin. If = Rm, then satisfies the dissipativity condition globally, in
which case it is said that is dissipative with respect to , or for short,
(Q, S, R)-D.
Comentario 128 Note that the classical sector conditions [25] for square
nonlinearities, i.e. m = q, can be represented in this form. If is in the
T
sector [K1, K2], i.e.
is (Q, S, R)-D,
(y K1u) (K2u
y) 0, then it
with (Q, S, R) = I, 21 (K1 + K2) , 12 K1T K2 + K2T K1 . If is in the
T

sector [K1, ], i.e. (y K1u) u 0, then it is


D.

0, 12 I, 12

K1 + K1T

Comentario 129 Classically the concept of dissipativity has been defined


globally. However, it is of interest to consider the local (or non global)
case, for which the local version of dissipativity of a nonlinearity has been
introduced.

For the interconnected system (1) a generalization of the passivity and of


the small gain theorems for non square systems can be easily obtained,
and it will be used in the sequel.

Lema 130 Consider the system (1). If the linear system (C, A, B) is R, S T , Q SSD, then the equilibrium point x = 0 of (1) is globally (locally) exponentially stable for every (Q, S, R)-D (in for some Rm) nonlinearity.

Prueba. By hypothesis (3) is satisfied with R, S T , Q . Take V (x) =


xT P x as Lyapunov function candidate for the closed loop system. The time
derivative of V (x) along the solutions of (1) is V = (Ax + Bu)T P x +

xT P (Ax + Bu), or, because of (3) and (1)

"

V =

x
u
"

#T "

P A + AT P

#T "

BT P
Q S
ST R

#"

PB
0

#"

x
u

"

#T "

C T RC

CT ST

SC

#"

V (x) V (x) ,

since is (Q, S, R)-dissipative. If satisfies the dissipativity condition only


for Rm, then the foregoing analysis shows that the origin is (locally)
exponentially stable in some finite domain.

13.0.2.

Dissipative observer design

Consider the class of systems described by a LTI subsystem with a nonlinear


perturbation term, connected in feedback, i.e.
: z = Az + G (, y, u) + (y, u) ,

z (0) = z0 , y = Cz , = Hz ,
(4)
where z Rn is the state, y Rp is the measured output, u Rm is
the input, and Rr is a (not necessarily measured) linear function of
the state. (y, u) is an arbitrary nonlinear function of the input and the
output. (, y, u) is a q-dimensional vector that depends on , y, u.
and are assumed to be locally Lipschitz in , y, u, so that existence
and uniqueness of solutions is guaranteed. It will be assumed that the
trajectories of interest of are defined for all the time, i.e. there are no
finite escape times.

An observer for system (4) is a dynamical system that has as inputs the
input u and the output y of , and its output z is an estimation of the
state z of . A full order observer for of the form

: z = A
z +L (
y y)+G (
+ N (
y y) , y, u)+ (y, u) , y = C z ,
= H z
(5)
is proposed, where matrices L Rnp, and N Rrp have to be designed.

Defining the state estimation error by z , z z, the output estimation


error by y , y y, and the function estimation error by
,
,
, (H + N C) z =
+ N y, and a new nonlinearity
(, , y, u) , (, y, u) ( + , y, u) ,

(6)

the dynamics of the error can be written as

: z = ALz + G ,

z (0) = z0 , = HN z , = (, , y, u) , (7)

where AL , A + LC, and HN , H + N C. Note that (0, ; y, u) = 0


for all , y, u.

Comentario 131 Note that when the plant is LTI (at least up to an
output injection term), then = 0, and the error dynamics is LTI and
autonomous, i.e. it does not depend on the plant state. The same is true
if is dependent on the output y, since in this case there exists a matrix
such that = F y, and there exists an N such that HN = H +N C = 0. In
these both cases detectability of the pair (A, C) is a necessary and sufficient
condition to construct an observer. However, in general, the error dynamics
(7) is not autonomous, but it is driven by the system (4) through the linear
function of the state = Hx. is therefore a time varying nonlinearity,
whose time variation depends on the state trajectory of the plant.

The observer design consists in finding matrices L and N , if they exist, so


that satisfies the conditions of Lemma 130. For this it is necessary to
assume that the nonlinear part of (7) belongs to one or several sectors.

Suposici
on 132 in (7) is (Qi, Si, Ri)-dissipative (in ) for some finite set
of non positive semidefinite quadratic forms i (, z) = T Qi+2T Siz +
z T Riz 0, for all , y, u, for i = 1, 2, , M .

It is clear that it is necessary that the quadratic forms be independent.


It is also easy to see that then is

PM
i=1 i (Qi, Si, Ri )-dissipative (in

) for every i 0, i.e. is dissipative with respect to the supply rate


PM
(, z) = i=1 ii (, z).

Ejemplo 133 Consider a lower triangular nonlinearity


h

iT

: RnRm
(8)
with (0, u) = 0 for all u. Assume that each component
is (globally)

Lips

i
i
chitz, uniformly in u (or for u in a compact set). i.e. i x , u i y , u
(x, u) =

1 (x1, u) , n1 (x1, , xn1, u) , n (x, u)

ki x y i, i = 1, , n, where ki > 0 is the Lipschitz constant of i,


h
iT
i
and x = x1 xi . Defining (z, x, u) = (x, u) (x + z, u)

the Lipschitzcondition
on implies for each component of phi that

i z i, xi, u ki z i, i = 1, , n. Considering the Euclidean norm


this implies
2i (z1,

, zi, x1, , xi, u)

ki2

z12

+ + zi2

, i = 1, , n.

These inequalities show that is


for every i =

(Qi, Si, Ri)-dissipative


1, 2, , n, with (Qi, Si, Ri) = bibT
i , 0, kiIi , where bi are the basis

vectors of Rn, Ii = diag (Ii, 0ni), and Ip is the identity matrix of dimension p.

In this case the design is as follows

Teorema 134 Suppose that Assumption 132 is satisfied. If there are matrices L and N , and a vector = (1, , M ), i 0, such that

the linear subsystem of is R , ST , Q -SSD, with (Q , S , R ) =

PM
i=1 i (Qi, Si, Ri ), then is a global (local) exponential observer for ,

i.e. there exist constants , > 0 such that for all z (0) (in a vicinity of
z = 0) k
z (t)k k
z (0)k exp (t).

T
Prueba. By definition of R , S , Q -SSD there exist a vector
(1, , M ), i 0, a matrix P = P T > 0, and > 0 such that
"
#
T
T
T
T
P AL + AL P + P + HN R HN , P G HN S
0.
GT P S HN
Q

(9)

V (e), with
The application of Lemma 130 leads immediately
to
V
r
V (e) = eT P e. Convergence follows with =

max (P )
, and
mn (P )

= 2 (P ) .
m
ax

Comentario 135 In general (9) is a nonlinear matrix inequality feasibility


problem. Under some conditions it becomes a Linear Matrix Inequality
(LMI) feasibility problem, for which a solution can be effectively found by
several algorithms in the literature [11]. For a further discussion of the
computational issues see [31]. Note also that when the inequality (9) is
feasible, there exist in general several solutions for L and N .

13.1.

Approximate error linearization using dissipativity

The major drawback of the observer error linearization method is that it


can be applied only to a very small class of nonlinear systems. To deal with
a much bigger set of systems several approximate techniques have been
proposed (see [29] and its references, [8, 32]). The basic idea of these
methods is to decompose the nonlinear system (??) in two parts
: x = f (x, u) + g (x, u) ,

x (0) = x0 , y = h (x) ,

(10)

where the system (f, h) can be transformed into the observer normal form
(??) after a state transformation (??), and the full system is transformed
into an Approximate Nonlinear Observer Form (ANOF)
aonf : z = Aoz+G (, y, u)+ (y, u) ,

z (0) = z0 , y = Coz , = Hz ,
(11)

T (x)

where G (, y, u) = x g (x, u), with x = T 1 (z). Note that (11) is a


special form of (4), and that in general G = H = I. This procedure can
be applied to a very big class of systems. Since the decomposition in (10)
can be made in many different forms, the transformation and the perturbation term in (11) are not uniquely determined. In [29, 8] an observer
in the new coordinates (11) is proposed as (5), where A = Ao, C = Co,
N = 0, and L is selected so that the matrix (Ao LCo) is Hurwitz. The
error equation, z = z z, is then approximately linear (7). In these references T , and are selected to reduce the size of the error perturbation
term in a compact region of the state space. Doing so it is hoped that
the error equation becomes more linear, so that it has an asymptotically
stable equilibrium point at z = 0 with a possible big attraction region.
Although intuitively appealing, in the previous method it is not justified
that the minimization does indeed reach its objective for the observer design. Moreover, the approach is restricted to local observers, since the state

space has to be restricted to a compact set, and the minimization has to


be done numerically.
Instead of relying on reducing the magnitude of the perturbation term ,
what in general can be only achieved on a compact set, it is proposed in
this paper to select the transformation (if possible) so that the transformed
system (11) satisfies the conditions of Theorem 134 (globally or locally). It
is possible to state the following result of the combination of both methods,
that is simple to prove.
Teorema 136 Suppose that a nonlinear system (??) can be decomposed as
in (10), such that after a diffeomorphic state transformation z = T (x) the
approximate observer normal form (11) is obtained. Suppose furthermore
that the conditions of Theorem 134 are satisfied (locally or globally) by
the approximate observer normal form (11). Then the system (5) with the

output mapping x
= T 1 (
z ) is a (local or global) exponential observer for
the system, if T 1 is uniformly continuous.
This result includes the exact error linearization method (when = 0) but
it offers a greater flexibility: Since the decomposition (10) can be made
in many different ways, one can try different possibilities. Note that the
same idea can be used for the extensions of the exact linearization method
described in Remark ??.

13.2.

Examples

In this section some examples are given to illustrate how this method can
be applied and the advantages and flexibility it offers in the design of

nonlinear observers.

13.2.1.

Example 1

Consider the system

x 1 = x2 x1u , x 2 = x1 x2 x21 x22 x32 +x1x2u , > 0 , y = x1 ,


for which an observer in a compact set of the state space was proposed
in [29]. For u = 0 and from Example 12.1.2 it is seen that the system

is not transformable into the observer form because of the cubic term.
Decomposing the system as
"

x =

x2
x1 x2 x21 x22

"

x1
x1x2

"

u+

0
x32

, y = x1 ,

it can be readily seen (see Example 12.1.2) that the first term can be
linearized by a state and an output transformation [27], given by
y = (y) = exp (y) 1 , y = 1 (
y ) = ln |
y + 1| , : R (1, ) ,
"

z = T (x) =

exp (x1) 1
exp (x1) (x2 + 1) 1
"

x = T 1 (z) =

ln |z1 + 1|
z2 +1
z +1 1
1

, T : R2 (1, ) R

In the new coordinates the system has the approximate observer form (11)
"

z =

0 1
0 0

(1+
y )2

"

z+

y u (
y + 1) ln |
y + 1|
ln |
y + 1| (1 + y) (1 + ln |
y + 1| + u)

(
y z2 )

y = z1 .

This system can be written in the form (4), and the error equation (7) is
given with
"

A=
(, , y) =

0 1
0 0

"

, G = HT =
h

0
1

"

, CT =
i

1
0

, (, y) =

3
3
(
+

)
, = z2 .
2
(1 + y)

(
y )3
(1 + y)

It is easy to check
that (,, y) = Q2 + 2S + R 2 0 for all with

(Q, S, R) = 0, 1, 2 . If y is bounded there is a minimum value of

2(1+
y)

so that is 0, 1, R
-dissipative. The observer design can be done if the
R
design inequality (9) is feasible. The inequality is satisfied, for example, for
l1 = 3R,
l2 = 2R
2. This observer is not global, because z1 has
N = 2R,
to be bounded, but there is no restriction on z2, and u.

13.2.2.

Example 2: High-Gain observer design

It will be shown that the well-known high-gain observer (HGO) design


[16, 17] for non linear systems is covered by Theorem 136, and its solution
represents a particular one. Consider the class of systems (??) (affine in

the control) that are uniformly observable for any input, defined in [16].
These systems can be transformed by the diffeomorphic observability map
(??), z = q (x), into the approximate observer normal form (11), where
the nonlinearity has the triangular structure given by (8) and, in general,
G = H = I and (y, u) = 0 [15, 16]. The HGO design is done for this
plant representation, and this design can be derived from the dissipative
design in the previous section.

Lema 137 Under the same assumptions as in [16] the high-gain observer
designed in that reference is a particular solution of Theorem 134.

Prueba. Note first that the high-gain observer in [16] corresponds to


(5), with A = Ao, C = Co, H = G = I, and N = 0.

Next it will be shown that the high-gain solution satisfies theorem 134.
By Hypothesis each component of (x, u) is globally Lipschitz, uniformly in u. Following Example 133 it is easy to show that (e, x, u) =
(x, u) (e + x, u) is low triangular and globally Lipschitz. This implies
that is (Qi, Si, Ri)-dissipative, i = 1, 2, , n, with (Qi, Si, Ri) =

bibT
i , 0, ki Ii , where ki > 0 is the Lipschitz constant of i , and the
other symbols are as in Example 133.
It is required to show that the high-gain solution [16], given by L =
Xg1C T , and P = Xg , that satisfies for some (high) gain g > 0
gXg + AT Xg + Xg A = C T C ,

(12)

satisfies Theorem 134, there exist = (1, , n), i > 0, and > 0
Pn
T = diag ( ), R =
such that (9) is satisfied,
where
Q
=

b
b
i
i
i

i=1
i
Pni
diag
j=0 nj knj , S = 0, A = Ao , C = Co , H = G = I, and
N = 0.

Pre and postmultiplying (12) with = diag

g, g 2,

, gn

it is obtained

Xg + AT Xg + Xg A = gC T C, since, as it is easily checked, C =


gC, and 1A = gA. If is the symmetric and positive definite solution
of + AT + A = C T C, then it follows that Xg = g. It will be
shown that this solution satisfies (9). Replacing L and P in (9) and using
(12)
"

gXg

CT C

+ Xg + R Xg
Xg
Q

0.

Pre and posmultiplying this inequality with the matrix = diag

g, g 2,

, gn

dividing by g and simplifying the expression one obtains

g gC T C

+ +

1 R

1 Q

0 .

(13)

.
1
2i1
Selecting (positive) such that g Q = diag g
i = I ,then
P

ni 2(n(i+j))
1
(2i1)
i = g
and g R = diag
knj . Note that,
j=0 g
since in the last expression (i + j) n there is a finite limit lmg g1 R =
diag (ki). It follows then easily that for any > 0, and for g big enough the

inequality (13) is satisfied. This can be seen using the Schur complement
[10, Appendix A]: (13) is satisfied iff
1
g gC T C + + R + 2 0 .
g
Since is positive definite, i.e. > I for some > 0, the inequality is
satisfied for g big enough.
This result is interesting for different reasons: 1) It shows that the proposed method is always applicable when the high-gain methodology is. 2)
Moreover, it represents a generalization of the HG method, and can deliver a solution when the HG does not. 3) Since the HG represents only

one possible solution, the proposed method can find better solutions, and
is not constrained to high-gain ones. Moreover, other optimization and
design criteria can be included to find a better solution. 4) On the other
side, the HG method and the strong theoretical characterization of when
it is feasible, provides a class of systems for which the proposed method is
assured to deliver a solution. Since Theorem 134 does not give explicit conditions on the system for a solution to be feasible, the HG case shows that
it is possible to assure existence of solutions for a large class of systems.
5) A simple and immediate generalization of HG is to use the additional
injection depending on matrix N . 6) Since in the proposed method the
particular characteristics of the nonlinearities can be taken into account
using several supply rates, and not only the triangular and Lipschitzness
characteristics used by the HG method, it is expected that the system class
for which this method is applicable is much bigger, the conservativeness
of the results is reduced, and the quality of the results increased.

It can be shown [31] that the proposed method includes several other
design strategies proposed in the literature as the Circle Criterion Design
[3, 14] and the Lipschitz Observer Design [38, 46].

13.2.3.

Example 3: Observer design for detectable systems

Most design methods require the system to be uniformly observable for


every input, as for example the HGO and the exact error linearization. Our
method does not require this property but it is able to construct observers
for detectable systems, as the following example shows.
Consider the planar system

x 1 = g (x2) u , x 2 = x1 x2 , y = x1 ,
where g (x2) is any globally Lipschitz nonlinearity, with Lipschitz constant
kg . This system is not observable for every input, since for u = 0 it is
detectable but not observable.
This system can be written in the form (4), and the error equation (7) is
given with
"

A=

0 1
1 1

"

, G=

CT

1
0

, H=

0 1 , (, u) = g () u ,

(, , u) = z + (g () g ( + )) u , = x2
(, , u) is globally Lipschitz in with constant k = kg |u|
+ 1, whenever

2
u is bounded. is therefore dissipative for (Q, S, R) = 1, 0, k . It is

easy (but tedious) to check that, for example, with N = 0, l1 = (k + 1),


l2 = 2 the design inequality (9), which is an LMI, is feasible. This means
that a global observer can be designed for any Lipschitz g (x2) for bounded
inputs, despite of the fact that the system is not observable.

13.3.

Separation Principle

In this section it will be assumed that a state feedback control u = (x)


has been designed, so that the origin of the plant (4) is globally asymptotically stable (GAS). It is well known that, if a certainty equivalence
controller is applied to the plant, i.e. instead of the true state the state x

estimated by an observer is used in the control law, u = (


x), the global

stability of the closed loop is not assured, since the separation principle
is not valid in general for non linear systems. It is therefore surprising,
that under certain mild assumptions on the plant controller, dissipative
observers can be redesigned to assure the global stability of the closed
loop. The following results are in the same spirit and generalize the results
of [37, 4] for circle criterion observers.

13.3.1.

Plant-Observer representation

The closed loop dynamics, i.e. the dynamics of the plant and that of
the observer R , with state vector given by (x, x
), will be represented in

the coordinates (
x, e) by

R :

x
= A
x + G (
) + (t, y, (
x)) + (e, x
) ,
y
= Cx
,
= Hx

e = ALe + G , e (0) = e0
z = HN e , = (z, ) ,

(14)

(15)

where
(e, x
) = LCe G (N Ce,
) +

(16)

+ [ (t, y, (
x)) (t, y, (
x))]
is the interconnection term between the observation error and the observer dynamics (14). Note that when e = 0 then (0, x
) = 0, and since
(14) is a copy of the plant perturbed by , the behavior of (14) corresponds
to that of the plant with state controller, and so its equilibrium point at

the origin is GAS. Since when t , e 0, and with it 0, if the


plant (14) is ISS from to e, then for the closed loop (14, 15) (
x, e) = 0,
or equivalently (x, e) = 0, is GAS. However, ISS is a strong condition on
the state controlled plant. Instead of requiring the ISS property on the
controlled plant a much weaker condition will be assumed.
Suposici
on 138 There exists a locally Lipschitz state feedback control law
u = (x), a continuously differentiable, radially unbounded, and positive
definite Lyapunov function W (x), and a continuously differentiable and
class K function L (), such that the origin x = 0 of the closed loop
x = Ax + G () + (t, y, (x)) =: f (x)
is globally asymptotically stable, and
W (x)
f (x) 0
x

(17)

L (W (x))

x Rn .

(18)

The inequality (17) is not restrictive, since it requires only that W (x) is
a Lyapunov function. Note that if W (x) is a Lyapunov function for f (x),
then so is L (W (x)) for any K function L (). However, this condition
is too weak since, as shown in [41, 45], there are systems that are GAS
and that can be destabilized by an arbitrarily small (in L1) perturbation.
To avoid this situation, inequality (18) is introduced. It means that there
is a Lyapunov function with bounded gradient. As it is shown in [2] this
condition assures the forward completeness of x = f (x), i.e. the existence
of trajectories for all the future time. As such, this condition is not restrictive. Moreover, if (18) is satisfied, system x = f (x) + d (t) is forward
complete for every bounded perturbation d (t) [2], and that x (t) 0 as

t when d (t) L1 [41]. The results of [41, 45] show that, in general,
condition (18) cannot be relaxed.
As a counterpart to the relaxation of the ISS property of the controlled
plant a strengthening of the convergence of the perturbation to zero is
required. As the previous discussion shows (t) given in (16) is required to
be in L1. The first term in (16) is clearly in L1 since e converges exponentially to zero (see (??)). The third term, depending on the input/output
injection nonlinearity, is in L1 if the following assumption is made on it.
Suposici
on 139 The function (t, y, u) is such that, for all y, y, u and
t0
k (t, y, u) (t, y, u)k (k
y yk)
for some class K function , which is differentiable at zero.

13.3.2.

Observer redesign

Under the previous assumption if (N Ce,


) L1 then L1 and
(e, x
) 0 as t , i.e. the certainty equivalence controller is convergent.
There are several situations when this happens for the observer (5):
1. When N = 0 is feasible for the observer design. However, this is a
restrictive condition.
2. When is globally Lipschitz, i.e. when Q < 0, then (N Ce,
) L1 .
However, although the second term in (16) converges to zero, it is in
general not necessarily in L1. In order to assure that (N Ce,
) is in L1
it is possible to introduce a compensation term in the dissipative observer.

For this consider the error dynamics of the observer (7), where an additional nonlinear term, depending on measured signals and on the to be
compensated nonlinearity , will be added to the observer (5)
R :

x
= A
x + L (
y y) + G (
+ N (
y y)) +

+ (t, y, u) E (N y,
) ,

y
= Cx
,
= Hx
,

(19)

what leads to an error dynamics in the following form


:

e = ALe G (HN e, ) + E ,

= (N y,
) ,

e (0) = e0

y
= Ce , w
= N y ,

(20)

where
(N y,
) = (
) (
+ N y) ,
and matrix E is to be designed. For simplicity of the presentation it will
be assumed that Assumption 132 is satisfied with M = 1, and that is

(Q, S, R)-D, with Q 0.


System (20) can be written in a compact form as
:
where

"

(; t) =
=

e = ALe + v ,

(21)

= e ,

v = (; t) ,

(z, )
(N y,
)
G E

"

, =

HN
NC

S,
R
-D, with
The composite nonlinearity (; , t) is Q,
"

=
Q

Q 0
0 Q

"

, S =

S 0
0 S

"

=
, R

R 0
0 R

+ 2 T S
+ T R
0.
This means that the supply rate $ (, ) , T Q

Teorema 140 Suppose that (z, ) is continuous in z and (Q, S, R)-D.


Consider two cases:

(I) R 0 and the conditions of Theorem 134 are satisfied.

(II) R > 0 and the conditions of Theorem 134 are satisfied with (??) replaced
by
11 + 0 ,
where

(22)

"

11 =

T RH
P AL + AT
P
+
P
+
H
N
L
N
GT P SHN

"

C T N T RN C
0

T ST
P G HN

0
0

(23)

In both cases select in the observer (19)


E = P 1C T N T S T .

(24)

Under these conditions:


1. All signals in the error system (20), included (z (t) , (t)) and (N y (t) ,
(t)),
converge exponentially to zero for arbitrary plant trajectories, with the same
convergence rate. These signals are therefore in L1.

2. Consider the error equation (21) additively perturbed by signal (t), i.e.
p

e = ALe + v ,

= e ,

e (0) = e0

v = (; t) + (t) .

(25)

(25) is ISS with respect to this signal, and if (t) converges exponentially
to zero, so will do every signal in the system.

3. The signal $ (t) = $ ( ( (t) ; (t) , t) , (t)) satisfies for every plants
trajectory and every t 0, with V (e) = eT P e

Z t
0

exp ( ) $ ( ) d V (e (0)) exp (t) V (e (t)) V (e (0)) . (26)

Prueba. If (21) satisfies Lemma 130, then internal stability is assured.


This is characterized by the Matrix Inequality
"

11 + 12
T
Q
12

where

"

12 =

PE

0,

CT N T ST
0

(27)

Setting E as in (24) 12 = 0, and since Q 0, (27) is satisfied if


11 + 0. In Case I this is fulfilled since 11 0 and 0. In Case
II this is also fulfilled since 11 + 0. Part 1) In the proof the classical
exponential weighting technique [12] is used. For some scalar a R, and
any time signal (t) define the exponentially weighted signal (t) ,
(t) exp (at). Consider the signals in the error equation (21). It is easy to

see that for every a the dynamics is

e = (AL + aI) e + v ,
: = e ,

v = ( , t) ,

e (0) = e0

where
(; t) , exp (at) ( exp (at) , ) .
T
T
T
Q+2 Sz +z Rz

The equalities (, z) =
= exp (2at) T Q + 2T Sz +
exp (2at) (, z) 0 show that if a nonlinearity (z, t) is (Q, S, R)D, then its weighted counterpart (z, t) is (Q, S, R)-D too. Therefore
(, t) satisfies the same sector condition as (, t). Since satisfies
(27) it follows easily that satisfies also (27) with ( a) instead of .
T
Taking 0 < a < , and V (e) = eT
P e , where P = P > 0, as Lyapunov
function candidate, its derivative is V ( a) V (e). It follows that
ke (t)k ke (0)k exp (t). It is clear that (, t) 0, and so

( (t) , t) converge exponentially to zero, with a convergence rate that is


independent of the plants trajectory. Therefore this signal is in L1. Part
2) Taking the derivative of V (e) = eT P e along the trajectories of (25) it
is obtained
V V (e) + 2eT P (t) .
ISS follows from standard results on characterization of ISS [25]. If (t)
0 all signals in the system (25) converge to zero. If (t) converges exponentially to zero then all signals in the system converge exponentially to zero.
This follows by the application of the exponential weighting technique.
Part 3) The derivative of V (e) = eT P e along the trajectories of (21) is
(t) = W (t) $ (t)
V (t) V (t) $ (t). The solution of the DE W
Rt
is W (t) = exp (t) W (0) 0 exp ( (t )) $ ( ) d . Using the comparison principle the result is immediate.
The results of part 2 of this theorem show that the observer designed is
robust against uncertainty in the knowledge of the nonlinearity of the

plant. It generalizes for dissipative observers the corresponding result for


circle criterion observers [5].

13.3.3.

Certainty equivalence control

When the redesigned observer (19) is used instead of the observer (5) the
closed loop dynamics is given by (14) and (21), with a new given by
(e, x
) = LCe (G + E) (N Ce,
) +

(28)

+ [ (t, y, (
x)) (t, y, (
x))] .
The main result of this section is the following Theorem, that asserts, under the two previous Assumptions, the Global Asymptotic Stability (GAS)

of the equilibrium point (x, x


) = 0 of the certainty equivalence output
feedback control, realized using the (redesigned) dissipative observer and
the state feedback control.

Teorema 141 Suppose that the plant (4) satisfies Assumption 139, that
there exists a state feedback u = (x) as in Assumption 138 and that the
nonlinearities of the plant satisfy Assumption 132. Consider the observer
(19) designed in one of the following two forms:

1. If Q < 0 set E = 0 and design the observer as in Theorem 134, or


2. If Q 0 set E = P 1C T N T ST and design the observer as proposed in
Theorem 140.

Under these conditions the certainty equivalence controller u = (


x), with
x
obtained from the observer, renders the origin (
x, e) = 0 of the closed
loop system (14,21) GAS (Globally Asymptotically Stable).

Prueba. For both cases the estimation error dynamics converges exponentially, ke (t)k ke (0)k exp (t), with the same for any plant
trajectory. From Assumption 138, L (W (x)) is a Lyapunov function for
the state feedback controlled plant. Consider as Lyapunov function candidate for (14) v (
x) , L (W (
x)). Its derivative along the trajectories of the
system is
W (
x)
[f (
x) + (e, x
)]

x
L (W (
x))

)k k (e, x
)k .

k (e, x

v = L0 (W (
x))

If Q < 0 the nonlinearity is globally Lipschitz, and therefore (N Ce,


)
L1. If Q 0 the results of Theorem 140 assure that (N Ce,
) L1 .
From this and Assumption 139 it is easy to see that (e, x
) converges to
zero for an arbitrary trajectory x
(t), and belongs to L1. Integrating v it is
obtained that v (t) converges to a finite limit as t . This assures that
x
(t) remains bounded, i.e. there is no finite escape time. The facts that
(
x (t) , e (t)) stays in a compact set for each initial condition (
x0, e0), that
(N Ce,
) L1 for every (
x0, e0) and that (N Ce,
) is continuous in
both variables imply that there exist a class K-function such that
Z
0

k (N Ce,
)k dt (k(
x0, e0)k) ,

R
and, therefore, that 0 k (e, x
)k dt
(k(
x0, e0)k), for some K-function

.
This implies that (
x, e) = 0 is stable.

Moreover, since e (t) 0 the trajectories in the -limit set coincide with
those of the system d
x/dt = f (
x), which by Assumption 138 has x
=0

as a GAS equilibrium point. By the invariance principle (


x, e) = 0 is an
attractive point. This together with stability implies GAS.

13.4.

Example

System
x 1 = 4 tanh x2 x52
x 2 = x2 x52 + u
y = x1 ,

can be represented as (4) with T


D with

"

Q=

1 0
0
0

tanh x2 , x52

"

, S=

1
1

. (z, ) is (Q, S, R)-

, R=0.

Theorem 134, with LT = [2, 1], N = 1, M = 1, = 1, P = I, leads to


the observer (5)

y = 2 (
y y) 4 tanh (
x2 + y y) (
x2 + y y)5

x
2 = (
y y) x
2 (
x2 + y y)5 + u .

The state feedback control u = (x) = x1 + x52 globally stabilizes the


origin of the plant and V (x) = 21 x21 + 4 ln |cosh x2| + 16 x62 is a Lyapunov

5
function, since V = x2 4 tanh x2 + x 0 is negative semidefinite,
2

and V = 0 implies that x = 0. Taking L (V ) = ln (1 + V ) it follows that


r

L (V (x))

x
1+

x21 + 4 tanh x2 + x52


1 x2
2 1

+ 4 ln |cosh x2| +

1 x6
6 2

that is bounded. This shows that Assumption 132 is satisfied.


Applying Theorem 140 the redesigned observer

y = 2 (
y y) 6 tanh (
x2 + y y) 2 (
x2 + y y)5 +

+ 2 tanh x
2 + x
52

x
2 = (
y y) x
2 (
x2 + y y)5 + u
is obtained, and used in the certainty equivalence controller u = (
x) =
x
1 + x
52 leads to a globally asymptotically stable equilibrium point in closed
loop. Note that since : R R2 the results of [4] cannot be applied.

13.5.

Conclusions

A new dissipative method to design observers for a big class of nonlinear


systems has been introduced recently by the author. It generalizes and includes several well-known observer design methods in the literature. In this
paper it is shown that this class of observers satisfies a kind of separation
property: If there exists a state controller that stabilizes the origin of a
nonlinear system, under weak assumptions a Certainty-Equivalence output
feedback controller implemented using the Dissipative Observer renders
the closed loop system globally asymptotic stable. When the nonlinearities are non globally Lipschitz the Observer has to be compensated, in
order to accelerate its convergence and avoid the destabilizing effect of a
slow convergence on the closed loop. Since Dissipative observers generalize

several observer design methodologies, this certainty-equivalence result applies to many kinds of observers, as High-Gain, Lipschitz or Circle-Criterion
Observers.
A shortcoming of our result compared to [37, 4] is that we require completeness of the system. Although this requirement can be probably dropped,
and it is easy to show this for some cases, as for example when Q < 0, a
proof for the general case is still missing.

Bibliografa
[1] V. Andrieu and L. Praly. Remarks on the existence of a KazantzisKravaris/Luenberger observer. In Proceedings of the 43rd IEEE Conference on Decision and Control, pages 38743879. IEEE, Dec. 14-17
2004.

[2] D. Angeli and E. Sontag, Forward completeness, unboundedness observability, and their lyapunov characterizations, Sys. & Cont. Lett.,
38, pp. 209217, 1999.
[3] M. Arcak and P. Kokotovic. Nonlinear observers: A circle criterion
design. In Proceedings of the 38th. Conference on Decision & Control,
pages 48724876, Phoenix, Arizona, USA, 1999. IEEE.
[4] M. Arcak, Certainty-equivalence output-feedback design with circlecriterion observers, IEEE Trans. Aut. Con., 50, no. 6, pp. 905909,
2005.
[5] M. Arcak and P. Kokotovic, Nonlinear observers: a circle criterion
design and robustness analysis, Automatica, vol. 37, no. 12, pp.
19231930, 2001.

[6] A. Atassi and H. Khalil, A separation principle for the stabilization


of a class of nonlinear systems, IEEE Trans. Aut. Con., 44, pp.
16721687, 1999.
[7] , Separation results for the stabilization of nonlinear systems
using different high-gain observer designs, Syst. Control Lett.,
vol. 39, pp. 183191, 2000.
[8] A. Banaszuk and W. Sluis. On nonlinear observers with approximately
linear error dynamics. In Proc. of the American Control Conference,
pages 34603464. IEEE, 1997.
[9] D. Bestle and M. Zeitz. Canonical form observer design for non-linear
time-variable systems. Int. J. Control, 38:419431, 1983.

[10] S. Boyd and L. Vandenberghe. Convex Optimization. Cambridge


University Press, Cambridg, UK, 2004.

[11] S.P. Boyd, L. El Ghaoui, E. Feron, and V. Balakrishnan. Linear Matrix


Inequalities in System and Control Theory. SIAM, Philadelphia,
1994.

[12] C. Desoer and M. Vidyasagar, Feedback systems: Input-Output


properties. New York: Academic Press, 1975.

[13] L. El Ghaoui and S.Niculescu,


Advances in Linear Matrix Inequality
Methods in Control. Phil., SIAM, 1999.

[14] X. Fan and M. Arcak, Observer design for systems with multivariable
monotone nonlinearities, Sys. & Cont. Lett., 50, pp. 319330, 2003.

[15] J.-P. Gauthier and G. Bornard, Observability for any u(t) of a class
of nonlinear systems, IEEE Trans. Aut. Cont., 26, pp. 922926,
1981.

[16] J.-P. Gauthier, H. Hammouri, and S. Othman. A simple observer


for nonlinear systems. Applications to bioreactors. IEEE Trans.
Automatic Control, 37:875880, 1992.

[17] J.-P. Gauthier and I. Kupka, Deterministic Observation Theory and


Applications. Cambridge, UK: Cambridge University Press, 2001.

[18] M. Guay. Observer linearization by output-dependent time-scale


transformations. IEEE Trans. Automatic Control, 47(10):17301735,
2002.

[19] A. Glumineau and V. Lopez-M. Transformation to state affine system


and observer design. In Nijmeijer and Fossen [33], pages 5971.

[20] R. Hermann and A.J. Krener. Nonlinear controllability and


observability. IEEE Trans. Automatic Control, 22:728740, 1977.

[21] D. Hill and P. Moylan, Dissipative dynamical systems: Basic


input-output and state properties, J. of the Franklin Inst., 309, pp.
327357, 1980.

[22] P. Jouan. Immersion of nonlinear systems into linear systems


modulo output injection. SIAM J. Control and Optimization,
41(6):17561778, 2003.
[23] N. Kazantzis and C. Kravaris. Nonlinear observer design using
Lyapunovs auxiliary theorem. Systems & Control Letters, 34:241
247, 1998.
[24] H. Khalil, High-gain observers in nonlinear feedback control, in
New Directions in Nonlinear Observer Design, ser. Lecture notes in

control and information sciences, H.Nijmeijer


and T. Fossen, Eds.
London: SpringerVerlag, 1999, no. 244, pp. 249268.
[25] H. Khalil, Nonlinear Systems, 3rd ed. Upsaddle River, New Jersey:
PrenticeHall, 2002.

[26] A.J. Krener and A. Isidori. Linearization by output injection and


nonlinear observers. Syst. Control Lett., 3:4752, 1983.

[27] A.J. Krener and W. Respondek. Nonlinear observers with linear error
dynamics. SIAM J. Control and Optimization, 23:197216, 1985.

[28] J. Levine and R. Marino. Nonlinear system immersion, observers and


finite dimensional filters. Syst. Control Lett., 7:133142, 1986.

[29] A. Lynch and S. Bortoff. Nonlinear observers with approximated


linear error dynamics: the multivariable case. IEEE Trans. Automatic
Control, 46(6):927932, 2001.

[30] R. Marino and P. Tomei. Nonlinear Control Design; Geometric,


Adaptive & Robust. Prentice Hall, London, 1995.
[31] J. A. Moreno. Observer design for nonlinear systems: A dissipative
approach. In Proceedings of the 2nd IFAC Symposium on System,
Structure and Control SSSC2004, pages 735740, Oaxaca, Mexico,
Dec. 8-10, 2004, 2004. IFAC.

[32] S.Nicosia,
P. Tomei, and A. Tornamb
e. A nonlinear observer
for elastic robots. IEEE Journal of Robotics and Automation,
4(1):4552, February 1988.

[33] H.Nijmeijer
and T.I. Fossen, editors. New Directions in Nonlinear
Observer Design. Number 244 in Lecture notes in control and
information sciences. SpringerVerlag, London, 1999.


[34] H.Nijmeijer
and A. van der Schaft. Nonlinear Dynamical Control
Systems. SpringerVerlag, New York, 1990.

[35] A.R. Phelps. On constructing nonlinear observers. SIAM J. Control


Optimization, 29:516534, 1991.

[36] Alexander Pogromsky and Henk Nijmeijer. Observer-based robust


synchronization of dynamical systems. International Journal of
Bifurcations and Chaos, 8(11):22432255, 1998.

[37] L. Praly and M. Arcak, A relaxed condition for stability of nonlinear


observer-based controllers, Sys. & Cont. Lett., 53, pp. 311320,
2004.

[38] R. Rajamani, Observers for Lipschitz nonlinear systems, IEEE


Trans. Aut. Cont., 43, pp. 397401, 1998.

[39] W. Respondek, H.Nijmeijer,


and P. Gromoski. Observer linearization
by output-dependent time-scaling transformation. In 5th IFAC
Symposium Nonlinear Control Systems (NOLCOS), Saint Petersburg,
Russia, July 2001.
[40] J. Schaffner and M. Zeitz. Variants of nonlinear normal form
observer design. In Nijmeijer and Fossen [33], pages 161180.
[41] E. Sontag and M. Krichman, An example of a gas system which
can be destabilized by an integrable perturbation, IEEE Trans. Aut.
Cont., 48, pp. 10461049, 2003.

[42] J.A.K. Suykens, P.F. Curran, J. Vandewalle, and L.O. Chua. Robust
nonlinear H synchronization of chaotic lure systems. IEEE Trans.
on Circuits and SystemsI: Fundamental theory and applications,
44(10):891904, 1997.
[43] A. Teel and L. Praly, Semi-global stabilizability by output feedback,
Syst.& Cont. Lett., 22, pp. 313325, 1994.
[44] , Tools for semiglobal stabilization by partial state feedback
and output feedback, SIAM J. Cont. Opt., 33, pp. 14431488,
1995.
[45] A. Teel and J. Hespanha, Examples of ges systems that can be
driven to infinity by arbitrarily small additive decaying exponentials,
IEEE Trans. Aut. Cont., 49, pp. 14071410, 2004.

[46] F. Thau, Observing the state of nonlinear dynamic systems, Int. J.


Control, vol. 17, pp. 471479, 1973.

[47] A. Van der Schaft, L2-Gain and Passivity Techniques in Nonlinear


Control, 2nd ed. London: Springer-Verlag, 2000.

[48] M. Vidyasagar, Nonlinear Systems Analysis, 2nd ed.

Englewood

Cliffs: PrenticeHall, 1993.

[49] J.C. Willems. Dissipative dynamical systems, part I: General theory.


Archive for Rational Mechanics and Analysis, 45:321351, 1972.

[50] J.C. Willems. Dissipative dynamical systems, part II: Linear systems
with quadratic supply rates. Archive for Rational Mechanics and
Analysis, 45:352393, 1972.
[51] J. Willems, Dissipative dynamical systems, part I: General theory.
Part II: Linear systems with quadratic supply rates, Archive for
Rational Mechanics and Analysis, vol. 45, pp. 321351, and 352393,
1972.
[52] X. Xia and W. Gao. Nonlinear observer design by observer
error linearization. SIAM Journal of Control and Optimization,
27(1):199216, 1989.
[53] X. Xia and M. Zeitz. On nonlinear continuous observers. Int. J.
Control, 66(6):943954, 1997.

[54] M. Zeitz. The extended Luenberger observer for nonlinear systems.


Syst. Control Lett., 9:149156, 1987.

[55] M. Zeitz. Canonical normal forms for nonlinear systems. In A. Isidori,


editor, Nonlinear Control Systems Design - Selected Papers from
IFAC-Symposium, pages 3338. Pergamon Press, Oxford, 1989.

Vous aimerez peut-être aussi