Vous êtes sur la page 1sur 145

UNIVERSIDADE FEDERAL DE SANTA CATARINA PROGRAMA DE POS-GRADUACAO EM ENGENHARIA ELETRICA

SISTEMAS MULTIVARIAVEIS: Uma abordagem via LMIs Verso preliminar a

Alexandre Trono Daniel Coutinho Karina Acosta Barbosa

Florianpolis, agosto de 2003. o

Sumrio a
Lista de Figuras 1 Introduo ca 1.1 Obteno de um modelo . . . . . . . . ca 1.1.1 Modelo f sico . . . . . . . . . . 1.1.2 Modelo experimental . . . . . . 1.2 Denio do ponto de equil ca brio . . . . 1.3 Linearizao . . . . . . . . . . . . . . . ca 1.3.1 Propriedades estruturais . . . . 1.3.2 Plos e zeros . . . . . . . . . . o 1.4 Anlise de malha aberta . . . . . . . . a 1.4.1 Estabilidade . . . . . . . . . . . 1.4.2 Desempenho . . . . . . . . . . . 1.4.3 Robustez . . . . . . . . . . . . . 1.5 Especicao de desempenho desejado ca 1.6 Projeto de controladores . . . . . . . . 1.7 Anlise de malha fechada . . . . . . . . a 1.8 Exemplos de problemas de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii 1 1 1 2 2 3 5 6 8 8 8 8 8 8 8 9 11 11 12 13 14 14 15 17 20 21 23 23 26 28 30 30

2 Sistemas Dinmicos Multivariveis a a 2.1 Descrio de Sistemas Dinmicos . . . . . . . . ca a 2.2 Sistemas Incertos . . . . . . . . . . . . . . . . . 2.3 Modelos Matemticos Para Sistemas Incertos . . a 2.4 Exemplos de Sistemas com Incertezas . . . . . . 2.4.1 Pndulo Invertido . . . . . . . . . . . . . e 2.4.2 Controle de Posiao Longitudinal de uma c 2.5 Descrio das incertezas . . . . . . . . . . . . . ca 2.6 Exerc cios . . . . . . . . . . . . . . . . . . . . . 2.7 Referncias Complementares . . . . . . . . . . . e 3 Estabilidade e Desempenho 3.1 Estabilidade exponencial . . . . . . . . . . . . 3.1.1 Sistemas lineares Variantes no tempo . 3.1.2 Sistemas lineares Invariantes no tempo 3.2 Desigualdades Matriciais Lineares - LMIs . . . 3.2.1 Denioes e nooes de anlise convexa c c a i . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aeronave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3.3 3.4

3.5

3.6 3.7

3.2.2 Estabilidade Quadrtica . . . . . . . . . . . . . a 3.2.3 Resolvendo LMIs simultneas . . . . . . . . . . a 3.2.4 O conjunto de soluoes de uma LMI convexo . c e 3.2.5 LMIs para sistemas incertos . . . . . . . . . . . 3.2.6 Otimizaao com restriao LMI . . . . . . . . . . c c 3.2.7 Complemento de Schur . . . . . . . . . . . . . . 3.2.8 Lema de Finsler . . . . . . . . . . . . . . . . . . 3.2.9 Procedimento-S . . . . . . . . . . . . . . . . . . 3.2.10 Escalonamento D-G . . . . . . . . . . . . . . . . D-Estabilidade: plos em regies desejadas . . . . . . . o o Norma H2 de Sistemas . . . . . . . . . . . . . . . . . . 3.4.1 Determinaao da Norma H2 via gramianos . . . c 3.4.2 Determinaao da Norma H2 via LMIs . . . . . . c 3.4.3 Limitantes da Norma H2 para sistemas incertos Norma H de Sistemas . . . . . . . . . . . . . . . . . . 3.5.1 Determinaao da Norma H sub-tima . . . . . c o 3.5.2 Determinaao da Norma H via LMI . . . . . . c 3.5.3 Limitante da Norma H para sistemas incertos Notas e Referncias . . . . . . . . . . . . . . . . . . . . e Exerc cios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31 33 33 34 37 38 39 41 42 43 46 50 51 53 54 57 57 59 61 62 65 66 67 71 74 74 77 79 82 86 88 90 92 92 95 95 97 101 104 105 110 112 115 115

4 Controle via Realimentao de Estados ca 4.1 Alocao de plos: abordagem clssica . . . ca o a 4.1.1 Referncia nula: regulao . . . . . . e ca 4.1.2 Referncia constante: rastreamento . e 4.2 Alocao de plos via LMIs . . . . . . . . . ca o 4.2.1 Estabilizaao . . . . . . . . . . . . . c 4.2.2 Alocaao de plos via D-Estabilidade c o 4.3 Controle LQR . . . . . . . . . . . . . . . . . 4.4 Controle a Custo Garantido . . . . . . . . . 4.5 Controle H2 . . . . . . . . . . . . . . . . . . 4.6 Controle H . . . . . . . . . . . . . . . . . 4.7 Controle de sistemas incertos . . . . . . . . 4.8 Notas e Referncias . . . . . . . . . . . . . . e 4.9 Exerc cios Propostos . . . . . . . . . . . . . 5

Observadores de Estados e Filtragem 5.1 Observador de ordem completa . . . . . . . . . . . . 5.1.1 Tcnicas para projeto do ganho do observador e 5.2 Observador de Ordem Reduzida . . . . . . . . . . . . 5.3 Filtros H2 . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Norma H2 para sistemas estocsticos. . . . . . a 5.3.2 Projeto do ltro H2 : varincia m a nima. . . . . 5.4 Filtros H . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Filtragem para sistemas incertos . . . . . . . . . . . . 5.6 Exerc cios Propostos . . . . . . . . . . . . . . . . . . ii

6 Controle por realimentao de Sa ca da 6.1 Controle via observador de estados . . . . . 6.1.1 Princ pio da Separaao . . . . . . . . c 6.1.2 Efeito de ru dos e distrbios externos u 6.1.3 Rastreamento . . . . . . . . . . . . . 6.2 Controlador LQG . . . . . . . . . . . . . . . 6.3 Controlador dinmico de sa . . . . . . . . a da 6.4 Controle H2 por realimentaao de sa . . . c da 6.5 Controle H com Realimentaao de Sa c da . 6.6 Notas e Referncias . . . . . . . . . . . . . . e 6.7 Exerc cios . . . . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

117 117 118 120 121 123 127 129 131 134 134

iii

iv

Lista de Figuras
1.1 2.1 2.2 2.3 2.4 2.5 2.6 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.1 5.2 5.3 5.4 5.5 5.6 5.7 Sistema de 4 tanques acoplados. . . . . . . . . . . . . . . . . . . . . . . Diagrama de Blocos de um sistema de Controle Robusto . . . . Pndulo invertido . . . . . . . . . . . . . . . . . . . . . . . . . . e Denio das Variveis para a dinmica longitudinal para o F-8 ca a a Representaao de um politopo . . . . . . . . . . . . . . . . . . . c Sistema LFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sistema Massa-Mola-Amortecedor . . . . . . . . . . . . . . . . . Combinaao convexa dos pontos g, h com 0 1. . . . c Interpretaao grca. . . . . . . . . . . . . . . . . . . . . . c a Regies LMIs - (a) semi-plano, (b) disco e (c) setor cnico. o o Diagrama de Blocos para o sistema (3.80). . . . . . . . . . Energia do sistema (3.80) na faixa de frequncia 0 , 0 . . e Diagrama de Blocos para o sistema (3.80) com nw = 2 e nz Relao entrada/sa ca da. . . . . . . . . . . . . . . . . . . . . Diagrama de Bode . . . . . . . . . . . . . . . . . . . . . . Diagrama de Bode para o sistema (3.100). . . . . . . . . . . . . . . . . . . . . . . . . =2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 13 14 16 18 19 21 34 37 45 48 49 49 55 55 58 71 72 73 77 79 80 88 90 91 96 97 102 103 112 114 115

Rastreamento com correao de ganho esttico. . . . . . . . . . . . . . . c a Diagrama para ajuste do ganho esttico. . . . . . . . . . . . . . . . . . a Rastreamento com integradores. . . . . . . . . . . . . . . . . . . . . . . Trajetrias do sistema (4.21) em malha fechada. . . . . . . . . . . . . . o Trajetrias do sistema (4.21) em malha fechada com alocaao de plos. o c o Sinais de controle para o sistema (4.21) em malha fechada com alocaao c de plos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o Trajetrias x1 e x2 do sistema (4.43) em malha fechada com perturbaes o co impulsivas em t = 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sa de desempenho do sistema (4.47) em malha fechada. . . . . . . . da Diagrama de Bode do sistema (4.47) em malha fechada. . . . . . . . . . Diagrama de blocos de um estimador de estado. . . . . . . . . . . Observador de ordem completa para o sistema (5.1). . . . . . . . . Trajetria do sinal de erro de estimaao, caso de alocao de plos o c ca o Diagrama de blocos de um estimador de estado genrico. . . . . . e Trajetria de z(t) e sua estimativa zf (t) . . . . . . . . . . . . . . . o Trajetria do sinal de erro e= z(t) zf (t) . . . . . . . . . . . . . o Diagrama de bode(Mdulo) do sistema no forado (5.32) . . . . o a c v . . . . . . . . . . . . . . . . . . . . .

5.8 6.1 6.2 6.3 6.4 6.5 6.6

Trajetria z(t) e sua estimativa zf (t) . . . . . . . . . . . . . . . . . . . 116 o Realimentao dos estados observados. . . . . . . . . . . . . . . . . . . 118 ca Controlador baseado num observador. . . . . . . . . . . . . . . . . . . . 119 Rastreamento com correao de ganho esttico e observador. . . . . . . . 122 c a Rastreamento com integradores. . . . . . . . . . . . . . . . . . . . . . . 122 Trajetrias do sinal de erro e(t) = x(t) xf (t). . . . . . . . . . . . . . . 123 o Trajetrias do sistema (4.21) em malha fechada com observador de estados.124 o

vi

Notao ca
Rnm Cnm A (A ) A>0 det(A) LM I LQG LQR tr{A} = n aii i=1 E[.] 1 v = (v v) 2 1 A = ( (A)) 2 (A) 1 i (A) = (i (A A)) 2 i (A) A11 A12 A22 Re() L2 e ou exp{.} posto(M )
{.}

Espao das matrizes reais de dimenso n m. c a Espao das matrizes complexas de dimenso n m. c a matriz transposta de A (transposta conjugada). matriz simtrica, positiva denida. e determinante de A. Corresponde ao produto dos autovalores de A. Linear Matrix Inequality. Linear Quadratic Gaussian Control. Linear Quadratic Regulator. trao da matriz A Rnn com elementos aij . c operador esperana matemtica. c a norma euclidiana de vetores. norma espectral de matrizes. valor singular mximo da matriz A. a i-simo valor singular da matriz A. e i-simo autovalor da matriz A. e matriz simtrica onde o elemento e se deduz por simetria.

parte real de um nmero complexo. u Espao dos sinais quadraticamente integrveis c a com norma v(t)
2

v(t) v(t) dt

1 2

Indicam funao exponencial de {.}. c Maior nmero de linhas ou colunas linearmente u independentes na matriz M .

vii

viii

Cap tulo 1 Introduo ca


Nas seoes a seguir descrevemos as etapas a serem vencidas na resoluao de um c c problemas de controle. A idia apresentar o problema de forma concisa e simples, e e indicando referncias que tratam do tema, onde o tema tratado no livro e poss e e veis extenses. o

1.1
1.1.1

Obteno de um modelo ca
Modelo f sico

Uma das formas de se obter um modelo matemtico para representar a dinmica a a do sistema consiste na utilizaao das leis da f c sica. Por exemplo, considere o sistema de 4 tanques da gura 1.1 onde se deseja controlar os n veis dos tanques 1 e 2. As bombas (atuadores) so alimentadas com tenses v1 , v2 (vetor de controle) e produzem vazes a o o ki vi (i = 1, 2) onde ki so os ganhos das bombas. A vlvula 1 distribui a vazo da a a a

h3 valvula 1 bomba 1 h1

h4 valvula 2 h2 bomba 2

Figura 1.1: Sistema de 4 tanques acoplados. bomba 1 entre os tanques 1 e 4, de acordo com o fator 0 1 1, sendo que 1 k1 v1 a e parcela da vazo que vai para o tanque 1 e (1 1 )k1 v1 a do tanque 4. Analogamente, a 2 k2 v2 a percentagem da vazo jogada no tanque 2 e (1 2 )k2 v2 no tanque 3. As e a equaoes que descrevem a evoluao do n dos tanques podem ser obtidas fazendo-se c c vel

1. Introduo ca

balano de uxo nos 4 tanques. A variaao de volume no tanque 1 dada por c c e dh1 A1 = a1 dt 2gh1 + a3 2gh3 + 1 k1 v1 (1.1)

onde h1 o n de l e vel quido no tanque, A1 a seo do tanque 1. Assim lado esquerdo e ca o da expresso acima a variao de volume do tanque 1. O termo a1 2gh1 a vazo a e ca e a de escoamento do tanque 1 para o reservatrio atravs do orif de seao a1 (g a o e cio c e constante de aceleraao gravitacional) e a3 2gh3 a vazo que o tanque 1 recebe do c e a tanque 3 atravs do orif de seao a3 . O termo 1 k1 v1 a parcela da vazo recebida e cio c e a da bomba 1. De forma anloga podemos obter a variaao de volume dos demais tanques a c o que nos leva `s seguintes equaes de estado (Johansson, 2000): a co
dh1 dt dh2 dt dh3 dt dh4 dt

a = A1 2gh1 + 1 a = A2 2gh2 + 2 a = A3 2gh3 + 3 a = A4 2gh4 + 4

a3 2gh3 A1 a4 2gh4 A2 12 k 2 v2 A3 11 k 1 v1 A4

+ +

1 k1 v A1 1 2 k2 v A2 2

(1.2)

No prottipo de laboratrio descrito em (Johansson, 2000), apenas os n o o veis dos tanques 1 e 2 so medidos e o sinal de tenso na sa dos medidores i = kc hi para a a da e i = 1, 2, sendo kc o ganho dos medidores.

1.1.2

Modelo experimental

Fornecer algoritmo de m nimos quadrados e um exemplo.

1.2

Denio do ponto de equil ca brio

Grande parte dos problemas de controle consistem em manter o sistema operando com as variveis oscilando numa estreita faixa de funcionamento chamada de regime a permanente. Por esse motivo, dizemos que um sistema opera em regime permanente quando todas as variveis de estado do sistema se mantm constantes com o passar do a e tempo. Os valores constantes dessas variveis so chamados de pontos de equil a a brio e so obtidos igualando-se as derivadas das equaoes acima a zero. Por exemplo, os a c pontos de equil brio (hi ) do sistema de 4 tanques em (1.2) so obtidos da condiao a c i = 0 e so dados por : h a h4 = h3 = h2 = h1 = 1 (1 1 )2 k1 2 v1 2 a4 2 2g 1 (1 2 )2 k2 2 v2 2 a3 2 2g (1.3) (1.4) (1.5) (1.6)

1 [(1 1 )k1 v1 + 2 k2 v2 ] 2 a2 2 2g 1 [(1 2 )k2 v2 + 1 k1 v1 ] 2 a1 2 2g

1. Introduo ca

No prottipo de laboratrio descrito em (Johansson, 2000) os parmetros do sistema o o a so k1 = 3.33, k2 = 3.35, 1 = 0.7 e 2 = 0.6. Observe que nessa conguraao do sistema a c podemos encontrar tenses de controle v1 e v2 de forma a ajustar o n de dois tanques o vel no equil brio, porm no poss ajustar os quatro n e a e vel veis de forma independente. Um ponto de equil brio dito ser estvel se, partindo de qualquer ponto prximo e a o a esse equil brio, o sistema capaz de retornar ao mesmo equil e brio sem o aux lio de sinais externos (sinais externos nulos). Quando essa propriedade no se verica a podemos projetar um controlador para tornar o ponto de equil brio estvel e ainda a diminuir as oscilaoes provocadas por perturbaoes externas que esto presentes na c c a quase totalidade das aplicaoes prticas. Como o objetivo fazer com que o sistema c a e funcione numa vizinhana prxima ao ponto de equil c o brio desejado podemos utilizar, para o projeto do controlador, um modelo mais simples baseado na linearizaao. c

1.3

Linearizao ca

Para que possamos linearizar um sistema x = f (x) no entorno de um dado ponto de funcionamento x precisamos que o modelo no linear tenha algumas caracter a sticas, como por exemplo a funo f (x) deve ser anal ca tica no ponto x. Uma funao f : R R c anal e tica num dado ponto a se ela pode ser representada por uma srie de potncias e e em torno de a. Tais funoes possuem uma representaao conhecida como expanso em c c a srie de Taylor, que dada por: e e

f (x) =
n=0

f (n) (a) (x a)n n!

(1.7)

Funoes anal c ticas em a so innitamente diferenciveis em a. a a Muitas vezes basta considerar a expanso representada na equao (1.7) at n = 1, a ca e o que resulta na aproximao de f nas vizinhanas de a por uma reta tangente ` f em ca c a a. Para funes f : Rn R diferenciveis em x0 = x10 x20 xn0 , a extenso co a a do conceito de linearizao do caso unidimensional dada pela expresso: ca e a
n

f (x)
i=1

f (x0 ) (xi xi0 ) xi

(1.8)

onde f representa agora uma hiper-superf no espao Rn+1 e sua aproximao, um cie c ca hiperplano tangente ` f no ponto x0 . a Para funes vetoriais f : Rn Rn , utiliza-se para a linearizao em torno do ponto co ca de equil brio x a chamada matriz jacobiana, aqui representada por J(f,x) e denida como: f1 f1 f1 xn x1 x2 . . para x = x .. . (1.9) J(f,x) = . . . .
fn x1 fn x2

fn xn

Assim, para a equao vetorial diferencial de primeira ordem no-linear: ca a h = f (h, v) (1.10)

1. Introduo ca

onde v representa um sinal de atuaao externo, a linearizao em torno do ponto de c ca e equil brio (h, v ) obtida fazendo-se: f (h, v) f (h, v ) + J(f,h) (h h) + J(f,v) (v v ) = J(f,h) x + J(f,v) u onde o estado x = h h e controle u = v v do sistema linearizado indicam a variaao c v) do estado e controle no-lineares em relaao ao equil a c brio. Note que o termo f (h, da igualdade nulo, pois por deniao de ponto de equil e c brio do sistema dinmico a denido pela equao (1.10) temos h = f (h, v ) = 0. Como h = x + h temos x = h ca e pois h constante. De forma similar podemos linearizar a equaao que dene o vetor c de medidas do sistema. Por exemplo, se denotarmos o vetor de medidas pela funo ca v ) + J(,h) (h h) + J(,v) (v v ). Assim (h, v) a linearizaao desta dada por (h, c e o sistema linearizado ca x = Ax + Bu y = Cx + Du x=hh u=vv y = A = J(f,h) B = J(f,v) C = J(,h) D = J(,v) (1.11)

onde y = a variaao do sinal medido em relao ao seu valor no equil e c ca brio v ). A anlise da estabilidade do sistema linearizado em torno de h feita e = (h, a olhando-se para os autovalores de J(f,h) . E importante salientar que o modelo linearizado fruto de uma aproximaao e que e c esta aproximao pode ser grosseira para trajetrias de estado no muito prximas do ca o a o ponto de equil brio usado na linearizaao. Note que a estabilidade do sistema linear c implica que na ausncia de sinais externos, i.e. u = 0, o estado converge para a e origem em regime permanente. Logo, para pequenas utuaoes do ponto de equil c brio provocadas por sinais externos, a estabilidade do sistema linearizado uma garantia e de que o estado do sistema no linear (sistema real) retorna ao equil a brio usado na linearizaao quando os sinais externos cessarem. Observe que x = 0,v = 0 implicam c h = h e v = v. Por exemplo, o sistema de 4 tanques (1.2) linearizado no ponto de equil brio h = h1 h4 , v = v1 v2 dado por (1.11) com e 1 k1 1 A3 0 T1 0 0 kc 0 0 0 A1 A1 T3 2 k2 C= A4 0 1 0 0 0 kc 0 0 A2 T4 A2 T4 , B = A= (12 )k2 , 1 0 0 T3 0 0 A3 1 (11 )k1 D=0 0 0 0 T4 0 A4 (1.12) onde Ti so as constantes de tempo do sistema dadas por a Ti = Ai ai 2hi g i = 1, . . . , 4 (1.13)

E importante observar que as constantes de tempo, e portanto as matrizes do modelo linearizado, so em geral diferentes para cada ponto de equil a brio (h, v ) escolhido. co ca a Exerc cio 1.1 As condies para obteno do modelo linear esto satisfeitas para 1 = 1 ? Existe alguma explicao fsica para esse resultado?. ca

1. Introduo ca

1.3.1

Propriedades estruturais

Dentre as propriedades de um sistema linear de malha aberta, duas delas merecem destaque: controlabilidade e observabilidade. A primeira est associada ao nmero e a u localizao dos atuadores do sistema enquanto a segunda ao nmero e localizao dos ca u ca sensores. Quando a estrutura do sistema apresenta essas propriedades temos garantia de poder projetar um controlador de tal forma que os plos da malha fechada possam o ser escolhidos de forma arbitrria pelo projetista. a Os conceitos de controlabilidade e observabilidade foram introduzidos por Kalman em 1960 (T.Kailath, 1980). Denio 1.1 (Controlabilidade) Um sistema controlvel num instante t0 se ca e a for poss vel, por meio de um vetor de controle sem restries em seus elementos, transco ferir o sistema de qualquer estado inicial x(t0 ) para qualquer outro estado em um intervalo nito de tempo. A controlabilidade do sistema (1.11) pode ser testada vericando se o posto da matriz de controlabilidade Mc abaixo igual ` dimenso do vetor de estado do sistema (T.Kailath, e a a 1980). Mc = B AB . . . An1 B (1.14)

Quando a matriz de controlabilidade possui posto r, inferior ao nmero de variveis u a de estado, ento existe uma transformao de similaridade T tal que a ca A = T AT 1 = A11 A12 0 A22 , B = TB = B1 0 , C = CT 1 , D = D

e onde A11 Rrr e o par (A11 , B1 ) controlvel (Mackenroth, 2004). a e a Denio 1.2 (Estabilizabilidade) O sistema dito ser estabilizvel quando os auca 22 possuem parte real tovalores no controlveis so estveis, isto os autovalores de A a a a a e negativa. Denio 1.3 (Observabilidade) O sistema (1.11) observvel se todo estado ca e a inicial x(t0 ) puder ser determinado a partir do conhecimento de y(t), u(t) durante um intervalo de tempo nito, t0 t t1 . A observabilidade do sistema (1.11) pode ser testada vericando se o posto da matriz de observabilidade Mo abaixo igual ` dimenso do vetor de estado do sistema (T.Kailath, e a a 1980). C CA (1.15) Mo = . . . CAn1

1. Introduo ca

Quando a matriz de observabilidade possui posto r, inferior ao nmero de variveis u a de estado, ento existe uma transformao de similaridade T tal que a ca A = T AT 1 = A11 0 A21 A22 , C = CT 1 = C1 0 , B = TB , D = D

e onde A11 Rrr e o par (A11 , C1 ) observvel (Mackenroth, 2004). a Denio 1.4 (Detectabilidade) O sistema dito ser detectvel quando os autoca e a 22 possuem parte real valores no observveis so estveis, isto os autovalores de A a a a a e negativa.

1.3.2

Plos e zeros o

Como as matrizes do modelo linearizado so constantes, i.e. o sistema linear a e invariante no tempo, podemos utilizar a transformada de Laplace para obter a matriz de transferncia do sistema. Para isso basta supor condies iniciais nulas e a partir e co de (1.11) obtemos Y (s) = G(s)U (s) , G(s) = C(sI A)1 B + D (1.16)

Para um sistema onde x Rn representa o estado, y Rny o vetor de sa da, u nu R o sinal externo de entrada, teremos uma matriz de transferncia G(s) Cny nu . e Por linearidade conclu mos que cada elemento Gij (s) de G(s) representa a funao de c transferncia da entrada j para a sa i do sistema. e da Denio 1.5 (Plos) Um nmero complexo s um plo de G(s) se ele um plo ca o u e o e o de pelo menos uma das funes Gij (s). co Todo plo de G(s) um autovalor de A, porm o contrrio no verdade em geral o e e a a e pois cancelamentos plos/zeros podem ocorrer nas funes Gij (s). Podemos mostrar o co as seguintes relaoes (Mackenroth, 2004): c Teorema 1.1 Seja G(s) = C(sI A)1 B + D. Ento as seguintes armaes so a co a verdadeiras: a Se (A, B) controlvel e (A, C) observvel ento todos os autovalores de A so plos e a a a a o de G(s). b Se (A, B) estabilizvel e (A, C) detectvel ento todos os autovalores de A localie a a a zados no semiplano complexo esquerdo so plos de G(s). a o c Todos os autovalores de A que no so plos de G(s) ou so no controlveis ou no a a o a a a a observveis. a Para denir zeros de um sistema multivarivel note que s0 : G(s0 ) = 0 no uma dea a e niao adequada pois dicilmente encontrar c amos um valor de s0 com tal propriedade. Assim precisaremos da seguinte deniao (Mackenroth, 2004). c

1. Introduo ca

Denio 1.6 (Posto normal) Denimos posto normal de G(s) o maior posto de ca G(s) qualquer que seja o complexo s. Por exemplo o posto normal de G(s) = 1 s + 1 s+1 1 s+2 2

2, porm posto(G(0)) = 1. Assim o posto normal o posto para a maior parte dos e e e valores de s, excluindo-se apenas alguns valores para os quais existe reduo do posto. ca Dizemos que G(s) possui posto normal completo se o posto normal de G(s) coincide com o nmero de linhas ou colunas (o que for menor), isto se as linhas ou colunas de u e G(s) forem linearmente independentes para a maior parte dos valores de s. Denio 1.7 (Zeros de transmisso) Seja G(s) Crq uma matriz de posto norca a mal completo. Dizemos que s0 um zero de transmisso de G(s) se uma das condies e a co abaixo est satisfeita: a e a (i) Posto normal de G(s) igual ` q e existe um vetor v Cq tal que G(s0 )v = 0. (ii) Posto normal de G(s) igual ` r e existe um vetor w Cr tal que w G(s0 ) = 0. e a e (iii) G(s) quadrada e det(G(s0 )) = 0. Uma forma alternativa de se denir zeros de um sistema multivarivel decorre direa tamente de (1.11). Tomando a transformada de Laplace vemos que (sI A)X(s) BU (s) = 0 e CX(s) + DU (s) = 0 onde X(s), U (s) so as transformadas de x(t), u(t) a respectivamente. De forma compacta temos R(s) X(s) U (s) = 0 , onde R(s) = sI A B C D

Denio 1.8 (Zero invariante) Um nmero complexo s0 chamado de zero invaca u e riante de uma representao de estados se posto(R(s0 )) inferior ao posto normal de ca e R(s). Todo autovalor de A no controlvel e todo no observvel so zeros invariantes do a a a a a sistema. Num sistema controlvel e observvel os zeros invariantes e os zeros de transmisso a a a coincidem. Para G(s) quadrada e invers todo zero invariante um autovalor de A BD1 C vel e 1 e todo zero de transmisso um plo de G(s) . a e o Por exemplo, o sistema (1.11) com as matrizes (1.12) possui a seguinte seguinte matriz de transferncia e G(s) =
1 c1 1+sT1 (11 )c2 (1+sT2 )(1+sT4 ) (12 )c1 (1+sT1 )(1+sT3 ) 2 c2 1+sT2

(1.17)

8 onde c1 = T1 k1 kc /A1 e c2 = T2 k2 kc /A2 e os plos e zeros so dados por o a det(G(s)) = c1 c2 (1 + sT3 )(1 + sT4 ) 1 2 (1 + sT1 )(1 + sT2 )(1 + sT3 )(1 + sT4 )

1. Introduo ca

(1.18)

onde = (1 1 )(1 2 )/1 2 . Veja que os plos do sistema so os autovalores da o a matriz A e os plos de cada um dos elementos da matriz G(s) so um subconjunto o a dos autovalores de A. Note ainda que que nenhum dos elementos de G(s) possui zeros, porm o sistema multivarivel possui dois zeros que so as ra e a a zes da equao ca (1 + sT3 )(1 + sT4 ) = 0. Atravs do lugar da ra podemos vericar que o sistema e zes ser de fase no-m a a nima, isto , pelo menos um dos zeros estar no semiplano direito, e a se 0 < 1 + 2 < 1 e ser de fase m a nima (nenhum zero no semiplano direito) se 1 < 1 + 2 < 2. E interessante observar que a parcela da vazo da bomba 1 jogada a no tanque 1 1 k1 vv e da bomba 2 para tanque 2 2 k2 v2 . Assim quanto maior for e e a soma 1 + 2 mais efetiva ser a inuncia das bombas no controle dos n a e veis dos tanques 1 e 2. Da conclu mos que se o sistema for de fase no-m a nima a inuncia das e bombas no controle de n dos tanques 1 e 2 ser reduzida quando comparada com vel a a situaao de fase m c nima. Em geral, a localizaao de zeros no semi-plano prximo c o ao eixo imaginrio ou fora do semi-plano esquerdo limita o desempenho que podemos a obter de um sistemas de controle.

1.4
1.4.1 1.4.2 1.4.3

Anlise de malha aberta a


Estabilidade Desempenho Robustez

Incertezas paramtricas e Dinmicas no modeladas a a

1.5

Especicao de desempenho desejado ca

Limitao dos atuadores, impreciso dos medidores (ru ca a dos), conhecimento impreciso do sistema a ser controlado (incertezas, caracter sticvas dos ru dos e perturbaes), co limitaao dos mtodos de projeto, tipos de controladores adequados ao problema. c e

1.6 1.7

Projeto de controladores Anlise de malha fechada a

Satisfao do desempenho desejado, respeito `s limitaoes do sistema (atuadores e ca a c estado), simulaes. co

1. Introduo ca

1.8

Exemplos de problemas de controle

10

1. Introduo ca

Cap tulo 2 Sistemas Dinmicos Multivariveis a a


Neste cap tulo, apresenta-se de forma resumida alguns conceitos importantes sobre a representaao matemtica de sistemas dinmicos multivariveis. Vrios conceitos c a a a a utilizados na teoria clssica de controle para a anlise e projeto de controladores para a a sistemas SISO (uma entrada e uma sa da), no podem ser aplicados de forma direta a a sistemas MIMO (vrias entradas e vrias sa a a das), pois geralmente existe um forte acoplamento entre os vrios canais entrada-sa a da. Outro fator a ser levado em consideraao c na obteno de um modelo matemtico que descreva o comportamento dinmico de ca a a um sistema a possibilidade da existncia de incertezas em alguns parmetros do moe e a delo. Estas incertezas podem existir devido aos mais diversos fatores, como impreciso a de alguns componentes do sistema, erros de linearizaao, entre outros. Esses so os c a aspectos a serem abordados nesse cap tulo.

2.1

Descrio de Sistemas Dinmicos ca a

Os sistemas dinmicos lineares e invariantes no tempo pela seguinte representaao a c por variveis de estado: a x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t), x(0) = x0 (2.1)

onde x(t) Rn o vetor de estados do sistema, x(0) a condiao inicial, u(t) Rnu so e e c a ny as entradas do sistema, y(t) R so as sa a das do sistema, e A, B, C, D so matrizes a constantes com elementos reais de dimenses apropriadas. o Um sistema com nu = ny = 1 chamado de SISO, e em caso contrrio de MIMO. e a Pode-se obter uma representao do ponto de vista entrada-sa ca da, atravs da Matriz e Funo de Transferncia do sistema. Desta forma, ao aplicar-se a transformada de ca e Laplace na representaao (2.1), supondo por simplicidade que x0 = 0, obtm-se a c e seguinte descrio entrada-sa para o mesmo sistema dinmico: ca da a Y (s) = G(s)U (s), G(s) = C(sIn A)1 B + D (2.2)

onde Y (s) e U (s) so as transformadas de Laplace dos sinais y(t) e u(t), respectivaa mente, e G(s) a matriz funo de transferncia do sistema cujos elementos so funoes e ca e a c racionais na varivel complexa s. a

12

2. Sistemas Dinmicos Multivariveis a a

A anlise de sistemas MIMO com base na localizaao de plos e zeros muito mais a c o e complexa do que no caso SISO. Para exemplicar, os plos e zeros de um sistema onde o G(s) quadrada (nmero de entradas e sa e u das so iguais) so determinados a partir a a do denominador e numerador de det G(s), isto , eles so determinados a partir das e a seguintes equaes: co N (s) . D(s)

D(s) = 0, N (s) = 0, det G(s) =

Uma das grandes diferenas entre os sistemas SISO e MIMO a interpretaao f c e c sica dos zeros multivariveis, que dependem no somente da sua posiao, mas tambm de a a c e sua direo, para maiores detalhes o leitor deve se referir a referncia (?). ca e

2.2

Sistemas Incertos

Em muitas situaoes prticas no poss e/ou conveniente representar com prec a a e vel ciso todas as dinmicas de um sistema. Flutuaes em parmetros e dinmicas muito a a co a a rpidas so com freqncia representadas como incertezas do modelo. No primeiro a a ue caso, a idia representar o parmetro f e e a sico por um parmetro incerto cujo valor no a a conhecemos precisamente, mas sabemos que se encontra em um intervalo conhecido. No segundo caso, as dinmicas rpidas negligenciadas no modelo do sistema so rea a a presentadas por um ou mais operadores no conhecidos precisamente, mas com ganho a limitado por uma constante com valor conhecido. Em ambos os casos, parmetros e a operadores, os elementos parcialmente conhecidos recebem o nome de incerteza e o modelo do sistema que contm algum desses elementos chamado de sistema incerto. e e Desta forma, os modelos matemticos utilizados para descrever a dinmica de sistea a mas incertos representam de forma simplicada os fenmenos que dicilmente poderiam o ser representados exatamente, seja porque o modelo completo seria muito complexo, ou ainda pela diculdade de se conhecer e obter modelos para todos os fenmenos que o ocorrem na prtica. Deve-se salientar que geralmente modelos dinmicos mais sima a ples facilitam a fase de s ntese de controladores e ltros, alm de possibilitar a analise e de estabilidade e desempenho utilizando mtodos mais ecientes do ponto de vista e numrico. e Os sistemas incertos podem ser variantes ou invariantes no tempo, dependendo se os elementos incertos variam ou no com o tempo. Por exemplo, um resistor pode a no ter suas caracter a sticas alteradas com o tempo mas tipicamente o valor da sua resistncia no conhecido de forma precisa. Sabemos apenas que o valor se encontra e a e dentro de uma determinada faixa em torno do valor nominal. Nesse caso, considerase que o sistema incerto e invariante no tempo. Caso as caracter e sticas do resistor mudem com o tempo, ento o sistema incerto considerado como variante no tempo. a e A seguir, nesse cap tulo, descreve-se sucintamente algumas das mais utilizadas tcnicas e na descrio matemtica de incertezas e suas implicaes. ca a co

2. Sistemas Dinmicos Multivariveis a a

13

2.3

Modelos Matemticos Para Sistemas Incertos a

Todo modelo matemtico pode ser considerado na prtica como uma aproximao a a ca da dinmica do processo f a sico real. Conseqentemente, o modelo matemtico obtido u a pode apresentar diferentes tipos de incertezas, decorrentes das dinmicas no modea a ladas, variaoes paramtricas, presena de ru c e c dos, ou at mesmo erros decorrentes da e etapa de linearizao, entre outros fatores. Dependendo da sua origem e de como elas ca so descritas matematicamente, as incertezas podem ser classicadas como estruturaa das, no estruturadas, paramtricas ou no paramtricas. a e a e Obviamente, de grande importncia que as incertezas sejam levadas em conta e a tanto na anlise como s a ntese de controladores para sistema sujeitos a variaoes pac ramtricas. Para tal, conveniente representar o modelo f e e sico por um sistema incerto, constitu do modelo matemtico (sistema nominal) mais incertezas em torno deste, do a sendo a anlise ou projeto feita em torno do sistema incerto. a Vrias diculdades surgem ao se trabalhar com sistemas incertos. Uma das prina cipais como modelar e descrever as incertezas no problema. Incertezas descritas de e forma genrica podem acarretar restries na busca de soluoes. A este processo de e co c busca de soluo de um problema de controle envolvendo o sistema nominal e uma ca fam de incertezas em torno dele, chama-se de Controle Robusto. No Controle Rolia busto busca-se tambm minimizar o efeito sobre certas variveis do sistema devido a e a perturbaes externas ao sistema, como ru co dos, mudanas de temperatura, rajadas de c vento, etc. Um esquema geral de um sistema de Controle Robusto pode ser visto na Figura 2.1.
Perturbaoes Externas c

Referncia e

Controlador

Controle

Planta
Parcialmente desconhecida Dinmicas no modelveis a a a Geralmente no linear a

Sa Medida da

Sensor Ru dos

Figura 2.1: Diagrama de Blocos de um sistema de Controle Robusto Logo a questo chave em Controle Robusto minimizar a inuncia das incertezas a e e e das perturbaoes que atuam no sistema. Este problema pode ser dividido em duas c partes: um problema de estabilizaao robusta e outro de desempenho robusto. No c primeiro caso, busca-se manter o sistema estvel para uma dada classe de incertezas e, a no segundo, minimizar a inuncia das perturbaoes externas em relao ao critrio de e c ca e desempenho escolhido.

14

2. Sistemas Dinmicos Multivariveis a a

2.4

Exemplos de Sistemas com Incertezas

Para ilustrar, como os sistema dinmicos podem ser modelados de maneira a reprea sentar incertezas e perturbaoes, apresentaremos a seguir dois exemplos. No primeiro, c descreve-se matematicamente um sistema para o controle de posio em um pndulo ca e invertido, e no segundo descreve-se o comportamento de um sistema para controlar a posio longitudinal de um avio. ca a

2.4.1

Pndulo Invertido e

O sistema mostrado na Figura 2.2 constitu de um pndulo invertido de massa e do e uniforme m e de comprimento 2l e de um carrinho de massa M . O movimento do sistema denido pela posio z(t) do carrinho e o ngulo (t) entre o pndulo e o eixo e ca a e vertical. m

(t) z(t) cm u(t) M 2l

CM

Figura 2.2: Pndulo invertido e

Na modelagem matemtica deste sistema considera-se a presena de atrito entre o a c pndulo e o carrinho cm , na roda do carrinho CM , e JM que momento de inrcia. e e e Para evitar a formulaao no linear do sistema, vamos simplic-la considerando que c a a o ngulo pequeno tal que: a e = cos() 1 sen() 2 0 = = Considere que os estados do sistema so a xp := [z, , z, ]

2. Sistemas Dinmicos Multivariveis a a e a representaao por variveis de c a 0 0 xp (t) = 0 0 y(t) = estados do sistema linearizado: 0 0 1 0 0 0 1 xp (t) + 0 u(t) b1 a1 a2 a3 b2 a4 a5 a6 xp (t).

15

(2.3)

c2 0 0 0 0 c3 0 0

onde xp (t) o vetor de estados, u(t) o vetor das variveis de controle e y(t) o vetor de e a sa da, e as variveis escalares so dadas por a a
1 a1 = d m2 gl2 , 1 a3 = d cm l, 1 a5 = d cM ml, 1 b1 = d c1 (Jm + ml2 ), d = (M + m)Jm + mM l2 , 1 a2 = d cM (Jm + ml2 ) 1 a4 = d mgl(M + m) 1 a6 = d cm (M + m) 1 b2 = d c1 ml

(2.4)

Um conjunto de valores numricos usado neste sistema pode ser encontrado, por e exemplo em (?). Na prtica, os valores dos coecientes de atrito cm e CM so incertos, ou seja tema a se apenas uma noao da faixa de valores `s quais eles podem assumir. Desta forma, c a pode-se assumir que estes dois parmetros so incertos com a seguinte variaao : a a c cm (1 + 1 )cm e CM (1 + 2 )CM = = Com isso o sistema (2.3) pode ser reescrito como xp (t) = A()xp (t) + Bu(t) y(t) = Cxp (t) onde 0 0 0 1 0 0 0 0 0 1 A() = 0 a1 (1 + 1 )a2 (1 + 2 )a3 , B = b1 b2 0 a4 (1 + 1 )a5 (1 + 2 )a6 , C = c2 0 0 0 0 c3 0 0 (2.6) (2.5)

2.4.2

Controle de Posio Longitudinal de uma Aeronave ca

O avio F-8 um projeto antigo que tem sido utilizado pela NASA no seu projeto de a e pesquisa y-by-wire, (?). Assumindo que a aeronave esteja voando a uma altitude constante em equil brio, podemos linearizar as equaoes aerodinmicas no lineares. c a a Desta forma, desacoplamos a dinmica longitudinal da lateral, (Friedland, 1986). a Pode-se caracterizar a dinmica longitudinal da aeronave pela seguinte escolha de a variveis , veja detalhes na gura (2.3). a

16 (t) a velocidade horizontal; e

2. Sistemas Dinmicos Multivariveis a a

(t) o ngulo de inclinaao com a horizontal (pitch angle); e a c q(t) a taxa de variao de (t); e ca (t) o ngulo de ataque; e a (t) = (t) (t) o ngulo de voo. e a Para controlar o movimento longitudinal existem os elevators, ue (t), e os aperons, uf (t), que so iguais aos elevators exceto pelo movimento na mesma direao. a c As variveis mensurveis so os ngulos de inclinao horizontal e de vo y(t) = a a a a ca o (t) (t) .

Figura 2.3: Deniao das Variveis para a dinmica longitudinal para o F-8 c a a

As rajadas de vento, w(t), provocam distrbios no movimento longitudinal do avio, u a afetando primeiro o ngulo de ataque (t). a Outro problema a ser considerado a dinmica no modelada associada a exibilie a a dade da estrutura do avio ocasionando incertezas no modelo do movimento longitua dinal do avio. a Considerando o seguinte vetor de estados x(t) = (t) (t) q(t) (t)

podemos modelar as equaoes linearizadas do movimento longitudinal do avio F-8 c a pela seguinte representaao por variveis de estado c a x(t) = A() x(t) + Bu u(t) + Bw w(t) y(t) = C x(t) (2.7)

2. Sistemas Dinmicos Multivariveis a a

17

com u(t) =

ue (t)

uf (t)

0 0 1 0 (1.5 + 0.1) (1.5 + 0.5) 0 0.0057 A() = (12 + 1) (12 + 1) (0.6 + 0.06) 0.0344 (0.8520 + 0.1) (0.29 + 0.1) 0 0.014 1 0 0 0 Bw = 0 1.71885 13.7508 0.332311 ; C= 0 1 0 0 0 0 0.16 0.8 Bu = 19 3 0.015 0.0087 A variao paramtrica e sua taxa de variaao ao longo do tempo, , esto limica e c a {10, 10}. tadas as seguintes regies: {1, 1} e o O objetivo de controle do sistema diminuir os efeitos da perturbao do vento, apee ca sar das variaoes no parmetro e das restrioes nas entradas de controle (saturao): c a c ca |ue (t)| ue e |uf (t)| uf .

2.5

Descrio das incertezas ca

Um grande problema ao se trabalhar com sistemas incertos como tratar a incerteza e na formulaao nal do problema, pois dependendo do tipo de incerteza, pode-se inserir c mais restrio na busca de soluo do problema. ca ca Uma primeira alternativa seria descrever os poss veis valores que a matriz A() pode assumir atravs de uma combinaao convexa dos valores extremos assumidos e c pelas incertezas. Supondo que: B = { i : |i | i , i = 1, ..., q} onde B representa um politopo 1 com 2q vrtices, onde q o nmeros de incertezas no e e u problema. Para o exemplo suponha que 1 < 1 < 1 e 2 < 2 < 2 e A() = A1 q1 + A2 q2 + A3 q3 + A4 q4 Com q1 + q2 + q3 + q4 = 1 e qi 0, onde as matrizes Ai so constru a das nos vrtices e
Politopo um conjunto convexo fechado, que pode ser representado pela combinao convexa dos e ca vrtices, ou por inequaes matriciais, para mais detalhes sobre politopo veja (?) e co
1

18 do Politopo, mostrado na Figura 2.4. A1 (1 , 2 )

2. Sistemas Dinmicos Multivariveis a a

0 0 1 0 0 0 0 1 = 0 a1 (1 + 1 )a2 (1 + 2 )a3 0 a4 (1 + 1 )a5 (1 + 2 )a6 0 0 1 0 0 0 0 1 = 0 a1 (1 1 )a2 (1 + 2 )a3 0 a4 (1 1 )a5 (1 + 2 )a6 0 0 1 0 0 0 0 1 = 0 a1 (1 + 1 )a2 (1 2 )a3 0 a4 (1 + 1 )a5 (1 2 )a6

A2 (1 , 2 )

A3 (1 , 2 )

0 0 1 0 0 0 0 1 A4 (1 , 2 ) = 0 a1 (1 1 )a2 (1 2 )a3 0 a4 (1 1 )a5 (1 2 )a6 2


(1 , 2 ) (1 , 2 )

(1 , 2 )

(1 , 2 )

Figura 2.4: Representaao de um politopo c Este tipo de abordagem para descrever as incertezas conhecido como abordagem e politpica e formalmente enunciada a seguir. o e o Denio 2.1 A classe de matrizes A() com incertezas na forma politpica pode ser ca descrita pelo conjunto
j j

A = {A : A =
i=1

qi A i ,
i=1

qi = 1, qi 0}

(2.8)

onde o conjunto A convexo, fechado e as matrizes Ai so conhecidas. e a

2. Sistemas Dinmicos Multivariveis a a

19

Uma caracter stica importante deste tipo de abordagem para descrever as incertezas a convexidade do conjunto resultante, isto , tem-se pela propriedade de convexidade e e que se as condioes esto satisfeitas nos vrtices ento garante-se que todas as condies c a e a co tambm estaro satisfeitas no interior desta regio. Entretanto, surge o problema da e a a exploso exponencial das condioes a serem testadas, pois para testarmos, por exema c plo, as condioes para um sistema com 3 elementos incertos, teremos que vericar 23 c vrtices, ou seja, tem-se que testar as condies 8 vezes. e co Outra forma de declarar as incertezas, representar o sistema por LFT 2 (Linear e Fractional Transformation). Basicamente, busca-se representar o sistema incerto atravs de um sistema invae riante no tempo interconectado a um bloco incerto, como no sistema realimentado mostrado na Figura 2.5.
w
x = A0 x + Ew z = Hx

Figura 2.5: Sistema LFT Assim pode-se descrever o sistema (2.5) no forado, ou seja, somente a parte a c incerta, como: x = A0 x + Ew z = Hx w = z onde 0 0 0 0 1 0 0 0 0 0 0 1 A0 = 0 a1 a2 a3 , E = a2 a3 a5 a6 0 a4 a5 a6 , H= 0 0 1 0 0 0 0 1 , = 1 0 0 2

(2.9)

Em geral, o bloco incerto uma matriz bloco diagonal, limitada em norma. Com e isso a incerteza na representao LFT vista como uma restrio 3 . ca e ca Note que esta forma de representao equivalente a redenirmos a matriz incerta ca e A() da seguinte forma: A() = A0 +EH. Desta forma pode-se apresentar a seguinte deniao c
2 3

Mais detalhes sobre sistemas na forma LFT podem ser obtidos em (Doyle et al., 1991; ?; ?; ?). Veja exemplo (??).

20

2. Sistemas Dinmicos Multivariveis a a

Denio 2.2 A classe de matrizes A() com incerteza limitada em norma pode ser ca descrita pelo conjunto A = A() = {A : A = A0 + EH} onde = diag(Ii i ) i : 1, ..., q e . (2.10)

2.6

Exerc cios

i. No exemplo (1) o efeito das perturbaes externas no foi modelado. Mas na co a prtica sabe-se que o sistema sempre sofre algum tipo de perturbaao. Considere a c ento que o sistema est sujeito a inuncia de uma rajada de vento, na base do a a e carrinho de direo contrria ` fora aplicada e de intensidade de fora bw . Insira ca a a c c no modelo matemtico esta perturbaao. a c ii. Considerando o sistema do exemplo (2): Obtenha a representaao politpica. c o Obtenha a descriao na forma LFT, abaixo descrita, com incerteza limitada c em norma; x = Ax + Bp p + Bu u + Bw w q =C x+D p+D u+D w q qp qu qw y = Cy x + Dyp p + Dyw w p = q , || O modelo (2.7) uma aproximaao linear em torno do ponto de equil e c brio do sistema no linear real. Como poder a amos incluir neste sistema os erros entre o modelo linear e o no linear. a iii. Para os artigos (?; ?; ?; ?; ?; ?; ?) analise os sistemas a serem controlados com relaao aos seguintes itens: c a Modelo Linear ou No Linear; Perturbaoes; c Incertezas; Restries no Controle; co Outras fontes de erro. iv. Considere o seguinte sistema mecnico, visto na gura (2.6). a A equaao dinmica de movimento do sistema pode ser descrita por: c a y+ k F c y+ y= m m m

2. Sistemas Dinmicos Multivariveis a a

21

m y(t)

Figura 2.6: Sistema Massa-Mola-Amortecedor onde y o deslocamento vertical, m a massa do bloco, k a constante da mola, e e e c o coeciente de amortecimento e F a fora externa aplicada ao bloco. e e c Suponha que os parmetros f a sicos k, c, no so conhecidos exatamente, mas a a acredita-se pertencerem a um intervalo conhecido. Em particular, o coeciente de amortecimento c encontra-se entre +/ 20% do seu valor nominal c0 , e a constante da mola est entre +/ 30% do seu valor nominal k0 . Introduzindo a variveis paramtricas c , k B = {1, 1}, podemos redenir c, k como a e c = c0 (1 + 0.2c ) , k = k0 (1 + 0.3k ) Para o sistema acima, determine as representaoes politpica e na forma LFT. c o Considere a seguinte deniao de variveis: x1 = y, x2 = y, u = F , c = 1 e c a k = 2 .

2.7

Referncias Complementares e

Alm das referncias j citadas, pode-se buscar mais informaes a respeito de e e a co controle Robusto e sistemas com incertezas nos livros (Greeen and Limebeer, 1995; ?; Zhou, 1998), nas dissertaoes de mestrado (?; ?; Crusius, 1996) e nos exames de c qualicaao (de Oliveira, 1998; ?). c

22

2. Sistemas Dinmicos Multivariveis a a

Cap tulo 3 Estabilidade e Desempenho


3.1 Estabilidade exponencial

Estabilidade o desempenho m e nimo de todo sistema de controle. Por esse motivo a anlise de estabilidade o ponto de partida para o projeto de sistemas de controle. a e Existem vrias denies que nos permitem caracterizar a estabilidade de um sisa co tema linear. Em linhas gerais, a estabilidade de sistemas pode ser caracterizada a partir da resposta de estado zero ou de entrada zero. A primeira explora o fato que todo sistema estvel, com condies iniciais nulas, produz sa a co das limitadas sempre que as entradas forem limitadas. A segunda explora o fato que todo sistema estvel sem a excitaao externa possui um transitrio que desaparece qualquer que seja a condiao c o c inicial que lhe deu origem. Para sistemas lineares invariantes no tempo essas duas formas distintas de denir estabilidade so na realidade equivalentes aos critrios clssicos a e a baseados na localizao dos plos do sistema. As denioes que iremos utilizar ao longo ca o c de todo esse documento se baseiam na resposta de entrada nula. Para caracterizar o conceito de estabilidade exponencial de sistemas algumas denioes e resultados preliminares se fazem necessrios. c a Denio 3.1 Seja o sistema ca x = f (t, x) f (t, 0) = 0 t [0, ) (3.1)

onde f : [0, ) X Rn cont e nua por partes em t e localmente Lipschitz em x, sendo X Rn uma dada vizinhana da origem. A origem um ponto de equil c e brio exponencialmente estvel se existem constantes positivas c, k, tais que a x(t) k x(t0 ) e (tt0 ) x(t0 ) < c (3.2)

e globalmente exponencialmente estvel se isto ocorre para toda condio inicial x(t0 ) a ca nita. 2 Podemos testar se a origem de um sistema exponencialmente estvel atravs do e a e seguinte resultado.

24

3. Estabilidade e Desempenho

Teorema 3.1 Considere o sistema (3.1) e seja V : [0, ) X R uma funo ca continuamente diferencivel tal que a k1 x a V (t, x) k2 x a V V + f (t, x) k3 x a t x x X t [0, ) (3.3) (3.4)

onde a, ki so constantes positivas. Ento o equil a a brio x = 0 de (3.1) exponenciale n mente estvel. Se alm disso, X = R ento a origem globalmente exponencialmente a e a e estvel. a Prova: Observe que k3 V (t, x) (3.5) k2 de onde conclu mos pelo Lema da Comparaao (Lemma 3.4 (Khalil, 1996)) que c V (t, x) k3 x
a

V (t, x) e Logo

k3 (tt0 )
2

V (t0 , x(t0 ))
k 1 a

(3.6)

x(t) (V (t, x(t))/k1 ) e e


k3 (tt0 )
2 k

1 a

k3 (tt0 )
2

V (t0 , x(t0 ))/k1 x(t0 ) e


k 2

k2 x(t0 ) /k1

1 a

= (k2 /k1 )

1 a

3 a k (tt0 )

(3.7)

que mostra a estabilidade exponencial. Para estabilidade global basta que x(t0 ) seja qualquer em X = Rn . 2 O teorema acima caracteriza a estabilidade de um sistema atravs de uma funo e ca V (t, x) que deve satisfazer algumas condioes. Essa funo, que recebe o nome de c ca funao de Lyapunov, deve ser determinada pelo projetista, porm o teorema no forc e a nece nenhuma pista de como determin-la. Para algumas classes de sistemas, como a sistemas lineares por exemplo, j se conhece tcnicas de determinao de funes de a e ca co Lyapunov muito ecientes. Este o tema das prximas duas seoes. Antes porm, e o c e alguns resultados preliminares se fazem necessrios, pois o mtodo utiliza um tipo a e especial de funao quadrtica conhecida como forma quadrtica. c a a Formas Quadrticas a Uma forma quadrtica toda funo V : Rn R do tipo: a e ca
n n

v(x) =
i=1 j=1

aij xi xj

aij = aji

onde xi , xj so duas componentes quaisquer da varivel vetorial x e aij so constantes. a a a A condiao aij = aji simplesmente uma normalizao e pode ser feita sem perda de c e ca generalidade. Veja no exemplo V (x) = 2x2 + 3x1 x2 + 5x2 x1 + 10x2 1 2 2 2 = 2x1 + 8x1 x2 + 10x2 = 2x2 + 4x1 x2 + 4x2 x1 + 10x2 1 2

3. Estabilidade e Desempenho

25

Assim, toda forma quadrtica pode ser representada em termos matriciais atravs de a e uma matriz simtrica cujos elementos so as constantes aij . Ainda no exemplo acima e a temos x1 2 4 x1 V (x) = = x Ax x2 4 10 x2 e note que a matriz A simtrica. A mesma normalizao acima pode ser feita em e e ca termos matriciais. Retornando ao exemplo, dena B= 2 4 4 10 , A = (B + B )/2 , A = (B B )/2

e note que B = A + A. Como x B x um escalar real temos x B x = (x B x) = x Bx. e Logo temos x Bx = x Ax + x Ax = x Ax + (x Bx x B x)/2 = x Ax Em situaes particulares, tipicamente quando representamos o sistema por sua funo co ca de transferncia, podemos precisar trabalhar com formas quadrticas complexas. e a Quando aij so constantes complexas, basta trocar a relaao aij = aji por aij = aji , a c onde aji o conjugado complexo de aij . Nesse caso a matriz A recebe o nome de e hermitiana e satisfaz a relao A = A = A onde o s ca mbolo A representa o transposto conjugado complexo de A. Podemos mostrar as seguintes propriedades: i. Toda matriz simtrica possui autovalores reais; e ii. A funo v(x) = x P x positiva para todo x = 0 se, e somente se, os autovalores ca e da matriz P so todos positivos. Nesse caso, dizemos que v(x) uma funao poa e c sitiva denida (notaao: v(x) > 0), e P uma matriz positiva denida (notao: c e ca P > 0);
Sinal de v(x) positivo para todo x = 0 positivo ou nulo para todo x = 0 negativa para todo x = 0 negativa ou nula para todo x = 0 autovalores de P todos positivos todos positivos ou nulos todos negativos todos negativos ou nulos Nomenclatura Funo v(x) ca Matriz P positiva denida positiva denida v(x) > 0 P >0 positiva semi-denida positiva semi-denida v(x) 0 P 0 negativa denida negativa denida v(x) < 0 P <0 negativa semi-denida negativa semi-denida v(x) 0 P 0

iii. Uma matriz P positiva denida (P > 0) se, e somente se, os determinantes e menores principais de P forem positivos. Esse resultado conhecido como critrio e e de Sylvester. Por exemplo para P1 P2 P3 P = P2 P4 P5 P3 P5 P6 os determinantes Menores Principais so: a

26 P1 > 0 P1 P2 P2 P4 = P1 P4 P2 2 > 0

3. Estabilidade e Desempenho

P1 P2 P3 P2 P4 P5 P3 P5 P6

= P1 P4 P6 + 2P2 P5 P3 P3 2 P4 P2 2 P6 P1 P5 2 > 0

iv. A funao v(x) = x P x uma medida de distncia do ponto x ` origem quando c e a a P positiva denida. e Por exemplo, a seguinte funao positiva denida: c e v(x) = x P x, v(x) = x1 x2 x= x1 x2 x1 x2 P = 1 0 0 4

1 0 0 4

= x1 2 + 4x2 2

e v. O conjunto de todos os vetores x tais que v(x) = c, onde c uma constante positiva qualquer, formam uma elipse quando P > 0. Os semi-eixos da elipse so a 1 onde i so os autovalores de P/c. a i vi. Todas as propriedades acima continuam vlidas se x, P forem complexos e troa carmos x , P por x , P . Em particular a matriz P deve ser hermitiana, isto e P = P .

3.1.1

Sistemas lineares Variantes no tempo

Para sistemas lineares variantes no tempo temos o seguinte resultado. Teorema 3.2 O sistema linear variante no tempo x = A(t) x (3.8)

onde x Rn e A(t) contnua t 0, globalmente exponencialmente estvel se e e a nn 1 e somente se existe P (t) : [0, ) R , simtrica positiva denida , cont e nua e limitada t 0, que satisfaz a seguinte equao diferencial ca P (t) + A(t) P (t) + P (t)A(t) + Q(t) = 0 (3.9)

onde Q(t) : [0, ) Rnn simtrica positiva denida, cont e e nua e limitada t 0 e pode ser arbitrariamente escolhida. Em caso armativo, a funo V (t, x) = x P (t)x ca e uma funo de Lyapunov para o sistema. ca
Uma matriz P (t) positiva denida (P (t) > 0) se todos seus autovalores so positivos t 0. e a Veja apndice para detalhes. e
1

3. Estabilidade e Desempenho Prova: Suponha que o sistema seja globalmente exponencialmente estvel e dena a

27

P (t) =
t

(, t) Q( )(, t)d

(3.10)

onde (t, t0 ) a matriz de transiao do sistema que satisfaz x(t) = (t, t0 ) x(t0 ). Como e c (3.2) deve estar satisfeito para toda condio inicial conclu ca mos que (t, t0 ) possui norma limitada por uma exponencial decrescente. Logo para qualquer matriz Q(t) : [0, ) Rnn simtrica positiva denida, cont e nua e limitada t 0, temos que (, t) Q( )(, t) tambm simtrica positiva denida, cont e e nua t 0 e converge exponencialmente para zero quando . Da conclu mos com (3.10) que P (t) e simtrica positiva denida, cont e nua e limitada t 0. Portanto satisfaz a relaao c k1 x 2 min (P (t))x x x P (t)x max (P (t))x x k2 x 2 k1 = mint0 min (P (t)) > 0 k2 = maxt0 max (P (t)) > 0 Por outro lado sabemos que (, t) = (, t)A(t) t e portanto P (t) =
t

(3.11)

(3.12)

(, t) Q( )(, t) + (, t) Q( )(, t) d + (, t) Q()(, t) (t, t) Q(t)(t, t)

(3.13)

Com (3.12) e lembrando que Q(t) limitada t 0, (, t) = 0 e (t, t) = In a e expresso acima se reescreve na forma a P (t) = A(t)
t

(, t) Q( )(, t) d

(, t) Q( )(, t) d A(t) Q(t) (3.14)

que nos leva ` (3.9) com (3.10). a Suponha agora que existe P (t) : [0, ) Rnn , simtrica positiva denida, e cont nua e limitada t 0, que satisfaz a equao diferencial (3.9) onde Q(t) : [0, ) ca Rnn simtrica positiva denida, cont e e nua e limitada t 0 e pode ser arbitrariamente escolhida. Dena a funao V (t, x) = x P (t)x e observe que ela satisfaz (3.11). c Calculando sua derivada temporal para o sistema (3.8) encontramos V (t, x) = x P (t)x + x P (t)x + x P (t)x = x (P (t) + A(t) P (t) + P (t)A(t))x = x Q(t)x k3 x x k3 = min min (Q(t))
t0

Logo o sistema globalmente exponencialmente estvel pelo teorema 3.1. e a 2 Para sistemas lineares invariantes no tempo, onde A(t) = A, t 0, a estabilidade pode ser caracterizada em termos dos autovalores da matrix A. Assim poder amos pensar que um sistema variante no tempo seria estvel se os autovalores da matriz A(t) a possuem parte real negativa t 0. No entanto isso no verdade em geral como a e mostra o exemplo a seguir.

28

3. Estabilidade e Desempenho

Exemplo 3.1 ((Khalil, 1996)) Considere o sistema linear (3.8) onde A(t) = 1 + 1.5 cos(t)2 1 1.5 sin(t) cos(t) 1 1.5 sin(t) cos(t) 1 + 1.5 sin(t)2 (3.15)

Os autovalores de A(t) so 0.25 j0.25 (7) t 0. Logo a matrix A(t) possui todos a os autovalores com parte real negativa o tempo todo. Porm a origem no estvel e a e a como podemos vericar pela matriz de transio indicada abaixo. ca (t, 0) = e0.5t cos(t) et sin(t) e0.5t sin(t) et cos(t) (3.16)

Observe que x(t) = (t, 0)x(0) pode divergir dependendo da condio inicial. ca E interessante notar que a matriz Q(t) em (3.9) pode ser arbitrariamente escolhida. A escolha mais simples Q(t) = In porm podemos eliminar a matriz Q(t) da equaao. e e c Como Q(t) > 0 a equao (3.9) equivalente ` desigualdade ca e a P (t) + A(t) P (t) + P (t)A(t) < 0 (3.17)

Para ver isso basta vericar que se (3.9) est satisfeita para alguma P (t), Q(t) ento a a (t) + A(t) P (t) + P (t)A(t) = Q(t) < 0. Logo (3.17) tambm est satisfeita. Por P e a outro lado se (3.17) est satisfeita para alguma P (t) ento podemos denir Q(t) como a a sendo Q(t) = (P (t) + A(t) P (t) + P (t)A(t)) e observe que Q(t) > 0. Logo (3.9) est a satisfeita. Se por um lado as expresses (3.9) e (3.17) so equivalentes, por outro elas possuem o a propriedades bem distintas. Em particular, as vantagens de (3.17) sero exploradas a mais tarde na seo sobre LMIs. ca

3.1.2

Sistemas lineares Invariantes no tempo

Para sistemas lineares invariantes no tempo o teorema 3.2 pode ser simplicado tornando-se equivalente aos resultados clssicos de Routh-Hurvitz e Nyquist. a Teorema 3.3 O sistema linear invariante x = Ax (3.18)

exponencialmente estvel, isto , os autovalores da matriz A possuem parte real ese a e tritamente negativa, se, e somente se, a soluo P simtrica da equao matricial: ca e ca A P + PA + Q = 0 (3.19)

for positiva denida, onde Q uma matriz positiva denida dada que pode ser arbitrae riamente escolhida. Prova: E um caso particular da prova do teorema 3.2. Se P > 0 soluao de A P + c P A + Q = 0 com Q > 0 dada, ento v(x) = x P x funo de Lyapunov para o sistema a e ca x = Ax pois para v(x) = x P x temos:

3. Estabilidade e Desempenho

29

v(x) = x P x + x P x = x (A P + P A)x = x Qx < 0 e como v(x) > 0 e v(x) < 0 para todo ponto x da trajetria do sistema x = Ax, o conclu mos que o estado converge para a origem. A estabilidade exponencial se mostra como na prova do teorema 3.1. Por outro lado, se o sistema exponencialmente estvel, ento a matriz de transio e a a ca de estados = eAt limitada e converge para zero quando t . Isto implica que, e para qualquer matriz Q > 0, temos (t) Q(t) = eA t QeAt > 0, tambm limitada e e convergindo para zero quando t . Logo, a matriz

P =
0

eA t QeAt dt

(3.20) 2

positiva denida, nita e satisfaz a equaao A P + P A + Q = 0. e c Exemplo 3.2 O sistema x = Ax com: A= 0 1 1 2

estvel pois (A) = {1, 1}. Logo, devemos encontrar uma soluo P > 0 para e a ca A P + P A + Q = 0, sendo Q > 0 uma matriz positiva denida que podemos escolher de forma arbitrria. Escolhendo Q igual ` identidade temos: a a 0 1 1 2 que resulta: P2 P3 P1 2P2 P2 2P3 Logo: + P2 P1 2P2 P3 P2 2P3 1 0 0 1 =0 P1 P2 P2 P3 + P1 P2 P2 P3 0 1 1 2 + 1 0 0 1 =0

2P2 + 1 = 0 P2 = 1/2 P3 + P1 2P2 = 0 P3 = 1/2 2P2 4P3 + 1 = 0 P1 = 3/2 Menores Principais: 1.5 0.5 P1 = 1.5 > 0 P = 0.5 0.5 det(P ) = 1.5 0.5 0.52 > 0

Logo P > 0, pois seus menores principais so positivos2 , e portanto o sistema a e exponencialmente estvel. a O teorema de Lyapunov pode ser usado se escolhemos Q 0 ao invs de Q > 0. e Para esse m, vamos decompor a matriz Q na forma Q = C C onde C uma matriz e qualquer. Se C possuir posto completo, ento Q = C C positiva denida. Caso a e contrrio, Q = C C ser positiva semi-denida. a a
2

Verique que os autovalores de P so positivos. a

30

3. Estabilidade e Desempenho

Teremos uma soluo P > 0 para A P + P A + C C = 0 se, e somente se, o sistema ca x = Ax for exponencialmente estvel, isto , (A) C , e o (A, C) for observvel, isto a e a : e C CA Posto = n, A Rnn , C Rmn . . . n1 CA Para entender esse fato note que a trajetria do sistema x = Ax para uma dada condiao o c At inicial x0 x(t) = e x0 . Se o sistema estvel, a soluo da equaao A P +P A+C C = e e a ca c 0 dada por (3.20) e assim temos e

x0 P x 0 =

x0 eA t C CeAt x0 dt =

x0 eA t C CeAt x0 dt =

y(t) y(t)dt
0

(3.21)

onde y(t) = Cx(t) = CeAt x0 uma sa ct e da cia. Se o par (A, C) observvel ento e a a no existe nenhuma condiao inicial que leva y(t) a ser nula o tempo todo. Logo temos a c P > 0 pela expresso (3.21). Por outro lado, se o sistema estvel porm existe uma a e a e condiao inicial x0 tal que y(t) = 0, t 0 ento o par (A, C) no observvel. Nessas c a a e a condioes temos pela expresso (3.21) que x0 P x0 = 0. Logo P possui algum autovalor c a nulo, isto , P positiva semi-denida. e e A equao A P + P A + Q = 0 conhecida como equaao de Lyapunov e possui ca e c soluao unica para uma dada Q se os autovalores da matriz A satisfazem i + j = 0 c para i = j = 1, . . . , n. Exemplo 3.3 Determine a faixa de estabilidade para o ganho k do sistema abaixo: 0 1 0 x = 0 2 1 x k 0 1 2 O exemplo acima encontra-se resolvido em (Ogata, 1993) onde tambm se encontra e uma lista de exerc cios que recomendamos (B9-1 B9.20).

3.2

Desigualdades Matriciais Lineares - LMIs

A grande motivaao para se trabalhar com LMIs que estaremos trabalhando com c e problemas convexos que podem ser resolvidos de forma eciente. Assim, antes de estudarmos as principais propriedades de uma LMI, apresentaremos uma breve seao c sobre anlise convexa. a

3.2.1

Denies e nooes de anlise convexa co c a

Denir funao convexa, conjunto convexo e politopo. Usar (H.Hindi, 2004), seoes c c II e III. Uma LMI (Linear Matrix Inequality) uma desigualdade matricial do tipo F (g) > e 0, no qual F (g) : Rm Rqq simtrica e am nas variveis de busca que so e e a a

3. Estabilidade e Desempenho

31

representadas pelo vetor g. Assim uma LMI pode ser genericamente representada na forma g1 m . F (g) = F0 + gi Fi > 0 g= . (3.22) . 1=1 gm a a a onde Fi = FiT Rqq so matrizes dadas e gi so variveis escalares a serem determinadas de forma a satisfazer a desigualdade (se poss vel). Quando existe uma soluo g ca para F (g) > 0 dizemos que a LMI fact e vel. E importante enfatizar que uma LMI pode ser representada de vrias formas e a dicilmente aparece num problema na forma genrica am (3.22). Por exemplo, dado e uma matriz A e uma matriz Q > 0, a funo matricial F (P ) = A P + P A + Q, ca que aparece em vrios problemas de estabilidade, am na varivel P e portanto a a e a desigualdade F (P ) < 0 uma LMI que pode ser facilmente reescrita na forma (3.22) e onde g o vetor contendo os elementos da matriz P a ser determinada. A vantagem da e representaao genrica am (3.22) que toda LMI pode ser reescrita dessa forma e por c e e isso todos os algoritmos de resoluao de LMIs so desenvolvidos para essa representaao. c a c No entanto a converso de uma LMI para a forma am feita internamente nos pacotes a e e o usurio no precisa se preocupar com isso. a a Inmeros problemas em diferentes reas do conhecimento podem ser reformulados e u a numericamente resolvidos atravs de LMIs (Boyd et al., 1994). Este o caso por exeme e plo dos resultados de estabilidade apresentados nos teoremas 3.3 e 3.2 como veremos na seo a seguir. ca

3.2.2

Estabilidade Quadrtica a

Funoes de Lyapunov quadrticas do tipo v(x) = x P x so facilmente determinadas c a a atravs de (3.19) para o caso de sistemas lineares invariantes no tempo e alm disso e e fornecem condioes necessrias e sucientes para a estabilidade. Para sistemas lineares c a variantes o mtodo de Lyapunov requer a utilizaao de uma funo v(t, x) = x P (t)x e c ca que tambm varia no tempo e que satisfaz a equaao diferencial matricial (3.9) cuja e c soluao mais complicada de ser obtida numericamente. Devido ` sua simplicidade, c e a e muito comum o estudo da estabilidade de um sistema atravs da funo v(x) = x P x e ca onde P constante. Para sistemas variantes no tempo ou ainda no-lineares este tipo de e a funao de poder conduzir a resultados conservadores, pois sendo P constante a funo c ca de Lyapunov no consegue levar em conta a rapidez de variaao da matriz A(t). J com a c a a funao v(t, x) = x P (t)x essa taxa de variaao levada em consideraao atravs do c c e c e (t) presente nas condies de estabilidade (3.9). Assim, quando conseguimos termo P co mostrar a estabilidade de um sistema com uma funao do tipo v(x) = x P x onde P c constante, apenas os valores que a matriz A(t) assume com o passar do tempo e e que so levados em consideraao mas no a rapidez com que A(t) muda de valores. a c a Logo estamos armando que o sistema exponencialmente estvel independentemente e a da taxa de variao de A(t). Essa forma de mostrar a estabilidade de um sistema ca e conhecida na literatura como estabilidade quadrtica e bastante util no estudo de a e estabilidade de sistemas incertos quando nenhuma informaao sobre a taxa de variaao c c

32 do parmetro incerto est dispon a a vel.

3. Estabilidade e Desempenho

Denio 3.2 (Estabilidade Quadrtica) O sistema (3.1) quadraticamente ca a e estvel se as condies do teorema 3.1 esto satisfeitas com V (t, x) = x P x, sendo a co a P uma matriz constante. 2 Observe que as condies para estabilidade quadrtica de um sistema linear variante co a no tempo (3.8) so dadas pelas desigualdades matriciais a A(t) P + P A(t) < 0 P >0 (3.23)

que so obtidas diretamente da deniao acima. Em particular temos (3.3) satisfeita a c com a = 2, K1 = min (P ), K2 = max (P ) e (3.4) com K3 = mint0 min ((A(t) P + P A(t))). Note que as condies acima so um caso particular de (3.19) correspondente co a ` matriz P constante e portanto o resultado pode ser conservador. Alm disso, quando a e o sistema invariante no tempo, i.e. A(t) = A, t, ento as desigualdades acima para e a estabilidade quadrtica so equivalentes ` equaao de Lyapunov (3.19). Para ver isso a a a c basta vericar que se (3.19) est satisfeita para alguma P, Q ento A P +P A = Q < 0. a a Logo A P + P A < 0 tambm est satisfeita. Por outro lado se A P + P A < 0 est e a a satisfeita para alguma P ento podemos denir Q como sendo Q = (A P + P A) e a observe que Q > 0. Logo (3.19) est satisfeita e portanto os resultados so equivalentes. a a Exemplo 3.4 A estabilidade quadrtica do sistema x = Ax caracterizada pelas LMIs a e A P + P A < 0, P >0 (3.24)

onde P > 0 a soluo que desejamos encontrar (se poss e ca vel). Para vericar que (3.24) uma LMI basta notar que as funes F (P ) = A P + P A e G(P ) = P so ans e co a em P e portanto podem ser reescritas como em (3.22). Para um sistema de dimenso a 2 temos: 3 p1 p2 P = = p1 G1 + p2 G2 + p3 G3 = G0 + gi Gi (3.25) p2 p3 i=1 p1 0 1 0 0 p2 G1 = 1 0 g= G2 = G3 = G0 = 0 0 0 1 0 0 1 p3
3

A P + P A = F0 +
i=1

gi Fi

(3.26)

F0 = 0, F1 = G1 A + A G1 , F2 = G2 A + A G2 F3 = G3 A + A G3 Assim a LMI P > 0 pode ser representada como G(g) = G0 + A P + P A < 0 como F (g) = F0 + 3 gi Fi < 0. i=1
3 i=1

gi Gi > 0 e a LMI

A representaao am de uma LMI (3.22) ser utilizada apenas para se deduzir propriec a dades que sejam genricas e vlidas para toda LMI. No entanto, sempre que estivermos e a trabalhando com um problema espec co no nos preocuparemos em converter as LMIs a para a representaao am. c A seguir apresentamos as principais propriedades de uma LMI.

3. Estabilidade e Desempenho

33

3.2.3

Resolvendo LMIs simultneas a

A soluo de LMIs simultneas equivalente ` soluao de uma unica LMI blococa a e a c diagonal de dimenso maior. Por exemplo, as duas LMIs F (g) < 0, G(g) > 0 podem a ser reescritas na forma diag{F (g), G(g)} > 0 onde diag{.} denota uma matriz blocodiagonal formada com elementos indicados em {.}. Exemplo 3.5 As duas LMIs em (3.24) podem ser escritas com (3.25) na forma H(g) = ou seja, H(g) = H0 + A P P A 0 0 P
3 i=1

F (g) 0 0 G(g)

>0

(3.27)

Hi gi > 0 com 0 0 0 0 , Hi = Fi 0 0 Gi

H0 =

Esta propriedade permite a incorporao de novas restries ao problema original ca co desde que essas novas restries se apresentem como novas LMIs a serem satisfeitas. co Por exemplo, a restrio de que a curva de n ca vel de v(x) = x P x seja maior que a unidade para uma dada condio inicial x(0), isto , x(0) P x(0) > 1, pode ser facilmente ca e incorporada `s condies originais (3.24), como indicado a seguir: a co J(g) = 1 + x(0) P x(0) = 1 + 3 gi x(0) Gi x(0) = J0 + i=1 Ji = x(0) Gi x(0), J0 = 1 Para obter H0 0 0 J0
3 3 i=1

g i Ji

(3.28)

+
i=1

gi

Hi 0 0 Ji

>0

3.2.4

O conjunto de soluoes de uma LMI convexo c e

Seja S o conjunto de todas as soluoes poss c veis de uma dada LMI, i. e., S = {g : simples vericar que S um conjunto convexo. Note que se g, h so F (g) > 0}. E e a duas solues quaisquer da LMI, i.e., F (g) > 0 e F (h) > 0, ento qualquer combinaao co a c convexa de g e h, representada por g + (1 )h sendo 0 1 o coeciente de combinaao convexa, teremos F (g + (1 )h) = F (g) + (1 )F (h) > 0 e portanto c g + (1 )h tambm uma soluo da LMI. Logo S convexo. e e ca e Esta propriedade importante do ponto de vista numrico pois teremos garantia e e que o problema de encontrar uma soluao qualquer de uma LMI consiste na busca c de um elemento qualquer num conjunto convexo, problema que pode ser resolvido de forma eciente, com convergncia global e tempo polinomial. Detalhes sobre algoritmos e e pacotes computacionais para resoluao de LMIs podem ser encontrados em (Ghaoui c and Niculescu, 2000).

34

3. Estabilidade e Desempenho

g g + (1 )h h

S = {g : F (g) > 0}

Figura 3.1: Combinao convexa dos pontos g, h com 0 1. ca

3.2.5

LMIs para sistemas incertos

Em muitos sistemas podem ocorrer utuaoes nos elementos das matrizes do sisc tema. Isto acarreta utuaoes nas matrizes Fi da LMI F (g) > 0 em (3.22). Por c exemplo, considere um circuito RLC srie cuja tenso de entrada v1 (t) e tenso de e a e a sa (no capacitor) v2 (t). As equaes so indicadas abaixo. da e co a v2 + RC v2 + Lv2 = v1 , x = x = Ax + Bv1 A= 0
1 LC

v2 v1

(3.29)

1
R L

, B=

0
1 LC

Suponha que a resistncia seja um parmetro incerto que pode assumir qualquer valor e a no intervalo Rmin R Rmax . Podemos analisar a estabilidade de (3.29) diretamente com (3.25), no qual 0
1 LC

Fi =

1 0

Gi + Gi
Fi1

0
1 LC

1 0

+R

0 0

0
1 L

Gi + Gi
Fi2

0 0

0
1 L

(3.30)

Fi (R) = Fi1 + RFi2 Nesse caso, variaoes no parmetro R ocasionam utuaoes nas matrizes Fi (R). c a c Um caso particular importante ocorre quando as utuaoes nas matrizes Fi podem c ser descritas na forma de combinaoes convexas de um conjunto xo de dados {Fij }, c chamados de vrtices. e
r r

Fi () =
j=1

j Fij ,

i = 0, . . . , m, 0 j 1,
j=1

j = 1

(3.31)

onde = [1 . . . r ] o vetor de coecientes de combinao convexa. Considere o e ca problema de encontrar uma soluao g para a LMI F (g) > 0 em (3.22) que seja robusta c para qualquer utuaao nas matrizes Fi dadas em (3.31),isto , encontre g tal que c e

3. Estabilidade e Desempenho

35

F (g, ) = F0 () +
i=1

gi Fi () > 0 em (3.31)

e como F (g, ) am em , a LMI acima equivalente ` e e a


m

F0j +
i=1

gi Fij > 0 , j = 1, . . . , r

(3.32)

Observe que F (g, ) > 0 no numericamente tratvel pois esta LMI depende de a e a que no conhecido. Porm (3.32) no depende de e pode ser resolvida. Para a e e a vericar a equivalncia, suponha que (3.32) est satisfeita. Ento e a a 1 . gi Fij ) > 0 pois 0 j 1, j = 1, = . . j=1 r
r r m r

F (g, ) =
j=1

j (F0j +
i=1

=
j=1

j F0j +
i=1 F0 () m

gi
j=1

j Fij > 0
Fi ()

= F0 () +
i=1

gi Fi () > 0

com Fi em (3.31)

(3.33)

Logo (3.32) implica F (g, ) > 0, em (3.31). E a soluao g encontrada em (3.32) c robusta para as utuaoes em (3.31). Por outro lado, Fi = Fij um dos valores e c e poss veis da matriz Fi que ocorre para j = 1(e portanto i = 0, i = j), logo se existe uma soluo g : F (g, ) > 0, em (3.31) as LMIs em (3.32) esto satisfeitas ca a mostrando assim a equivalncia. e Exerc cio 3.1 Encontre as matrizes Fij de (3.31) para as matrizes Fi dadas em (3.30) supondo R = Rmax + (1 )Rmin . Exemplo 3.6 Considere o sistema linear incerto x(t) = A() x(t) (3.34)

onde x(t) Rn o estado, Rm o vetor de parmetros incertos, um politopo e e a e conhecido representando os valores admissveis de e A() uma funo am desses e ca parmetros. Sejam vi , i = 1, . . . , 2m os vrtices conhecidos do politopo e note que a e 3 podemos represent-lo na forma = Co {v1 , . . . , v2m }. Queremos vericar a estaa bilidade do sistema incerto acima supondo que os valores admiss veis dos parmetros a incertos so denidos pelo politopo mas a taxa de variao desses parmetros so a ca a a
Dene-se convex hullde um conjunto de vetores {v1 , . . . , vq } o politopo obtido pela combinao ca convexa de todos os elementos desse conjunto. Os elementos desse conjunto so chamados de vrtices a e e o politopo obtido denotado por Co{v1 , . . . , vq }. e
3

36

3. Estabilidade e Desempenho

desconhecidas. Assim, a noo de estabilidade a ser empregada para estudar a estabica lidade desse sistemas deve ser tal que no dependa da taxa de variao de , qualquer a ca que seja ela. A noo de estabilidade que precisamos a de estabilidade quadrtica, ca e a denio 3.2, e as condies a serem satisfeitas so, de acordo com (3.23), a existncia ca co a e de uma matriz P denida positiva tal que A() P + P A() < 0 P >0 (3.35)

As condies acima no podem ser numericamente testadas pois dependem do co a parmetro incerto que pode assumir qualquer valor em . No entanto, como a F (P, ) = A() P + P A() am em no necessrio resolver (3.35) para todo e a e a em mas apenas para nos vrtices de , i.e. para = vi , i = 1, . . . , 2m . Assim e resolver (3.35) para todo equivalente a resolver o conjunto de 2m + 1 LMIs e simultneas a A(vi ) P + P A(vi ) < 0 P >0 i = 1, . . . , 2m (3.36) e Exemplo 3.7 Sejam A1 , . . . , Ar um conjunto de matrizes obtidas atravs da linearizao de um sistema no linear em r pontos de funcionamento distintos. Suponha ca a que o modelo do sistema entre os pontos de funcionamento possa ser aproximado por combinaes convexas desse r modelos linearizados, isto , o sistema ser representado co e a por
r r

x = Ax, A A := {A : A =
i=1

i Ai , 0 i 1,
i=1

i = 1}

(3.37)

A condio de estabilidade para esse sistema pode ser expressa pela LMI ca P > 0 : A P + P A < 0, A A (3.38)

Mesmo que A possa assumir innitos valores no conjunto A, a LMI (3.38) equie valente ` r LMIs simultneas a a P > 0 : Ai P + P Ai < 0, i = 1, . . . , r (3.39)

Observe que a equivalncia entre (3.38) e (3.39) vem do fato que a funo F (P ) = e ca A P + P A am nos coecientes i que caracterizam o modelo do sistema por come binao convexa. A equivalncia seria perdida se, por exemplo, a matriz P tambm ca e e fosse funo desses coecientes, isto , ca e P () > 0 : A() P () + P ()A() < 0, A() A , constante (3.40)

Exerc cio 3.2 Seja Pi = P ()|i =1 . Mostre que (3.40) implica Pi > 0 : Ai Pi + Pi Ai < 0, i = 1, . . . , r (3.41)

Porm (3.41) no implica (3.40), logo no suciente para mostrar a estabilidade do e a a e sistema linear invariante em (3.37).

3. Estabilidade e Desempenho

37

3.2.6

Otimizao com restrio LMI ca ca

Em muitos casos no basta encontrar uma soluo qualquer do conjunto de soluoes a ca c de uma LMI. Deseja-se encontrar uma soluao que seja tima segundo um dado critrio. c o e Em muitas situaes a otimalidade pode ser expressa atravs de uma funao linear co e c dando assim origem ao seguinte problema de otimizao ca ming d g tal que F (g) > 0 (3.42)

onde d um vetor dado que dene a direao de otimizaao e F (g) > 0 uma LMI e c c e como em (3.22). Como o conjunto de solues de F (g) > 0 convexo o problema (3.42) co e consiste em encontrar uma soluao fact g : F (g) > 0 para o qual d g tenha o menor c vel valor poss vel. Observe que nessas condioes a soluo tima do problema consiste em c ca o se aproximar com a preciso desejada da fronteira do conjunto de soluoes. a c dg fronteira: F (g) 0 interior: F (g) > 0 soluao tima c o

Figura 3.2: Interpretaao grca. c a Sob certas condies, ver livro (Ghaoui and Niculescu, 2000), poss consideco e vel rar restrioes de igualdade no problema, isto , pode-se considerar problemas do tipo c e F (g) 0 ou ainda F (g) > 0 com G(g) = 0, sendo F e G funes ans. A idia central co e que as restries de igualdade possam ser eliminadas dando origem a um problema e co com um nmero menor de variveis e sujeitas apenas ` restrioes com desigualdades u a a c estritas. Exemplo 3.8 A soluo P = P tima do problema ca o minP Trao(P ) c tal que A P + P A + Q < 0 , P > 0 (3.43)

para Q > 0 dado, converge com a preciso desejada para P = P0 onde P0 a soluo a e ca da equao A P0 + P0 A + Q = 0. ca Para ver isso, note que se P, Q so tais que A P + P A + Q < 0, podemos denir a a matriz Q0 = (A P + P A + Q) que ser positiva denida (Q0 > 0). Logo teremos a A P + P A + Q + Q0 = 0. A soluo desta equao de Lyapunov ca ca e

P =
0

eA t (Q + Q0 )eAt dt

(3.44)

E a soluo da equao A P0 + P0 A + Q = 0 ca ca e

38

3. Estabilidade e Desempenho

P0 =
0

eA t QeAt dt

(3.45)

Resultando que P P0 = 0 eA t Q0 eAt dt > 0, pois Q0 > 0. Da qualquer soluo P da ca desigualdade A P + P A + Q < 0 satisfaz a relao P > P0 . Para Q0 arbitrariamente ca pequena, por exemplo Q0 = com 0, teremos P arbitrariamente prxima de P0 , o P0 , onde a aproximao se d com a preciso que desejarmos. Como a isto , P = e ca a a relao P > P0 implica trao(P ) >trao(P0 ), conclu que a soluo de menor trao ca c c -se ca c P P0 . e = Tanto a equao de Lyapunov A P0 + P0 A + Q = 0 quanto o problema de otimizao ca ca (3.43) podem ser resolvidos de forma eciente. A vantagem de (3.43) que este pode e ser resolvido mesmo quando o sistema for incerto, o que no o caso da equao. Alm a e ca e disso pode-se incorporar novas restries no problema (3.43), como feito na seo 3.2.3, co ca o que tambm no poss na equao. e a e vel ca

3.2.7

Complemento de Schur

Tipicamente, o problema de controle que queremos resolver no aparece naturala mente na forma de uma LMI. Algumas ferramentas matemticas so bastantes uteis a a na tarefa de tentar reescrever o problema em questo atravs de LMIs. Se a natureza a e do problema original for convexa, muito provavelmente encontraremos uma forma de reescrev-lo atravs de LMIs. e e O complemento de Schur uma ferramenta bsica na manipulao de desigualdades e a ca matriciais. Lema 3.1 Seja g Rm o vetor de variveis de deciso e M1 (g), M2 (g), M3 (g) funes a a co ans de g com M1 (g), M2 (g) simtricas. Ento as seguintes armaes so equivalene a co a tes a)M1 (g) M3 (g) M2 (g)1 M3 (g) > 0 com M2 (g) > 0 M1 (g) M3 (g) >0 b) M3 (g) M2 (g) (3.46) (3.47)

2 Note que (a) no uma LMI pois M (g) = M1 (g) M3 (g) M2 (g)1 M3 (g) no uma a e a e funao am em g. No entanto as desigualdades em (a) so equivalentes ` (b), que c a a e uma LMI. Note que para satisfazer (a), (b) devemos ter M1 (g) > 0 e M2 (g) > 0 como condioes necessrias, porm no sucientes. c a e a Exemplo 3.9 Sejam A, B, C, R matrizes dadas e note que A P + P A P BR1 B P + C C < 0 com P > 0, R > 0 (3.48)

no uma LMI na varivel P, pois quadrtica em P. Nem tampouco o complemento a e a e a de Schur pode ser aplicado para eliminar o termo quadrtico, devido ao sinal deste a termo. Note que invertendo o sinal da desigualdade em (3.48) obtm-se, e (A P + P A + C C) + P BR1 B P > 0 com P > 0, R > 0

3. Estabilidade e Desempenho

39

Como R > 0, o termo quadrtico positivo, no sendo assim poss aplicar o coma e a vel plemento de Schur. Seja ento S = P 1 , o que implica que S > 0. Portanto (3.48) equivalente ` a e a S(A P + P A P BR1 B P + C C)S < 0 com S > 0 Como S = P 1 tem-se SA + AS BR1 B + SC CS < 0 com S > 0 (3.50) (3.49)

Agora (3.50) quadrtica em S e o sinal do termo no linear coerente com o e a a e complemento de Schur, que ao ser aplicado fornece SA AS + BR1 B CS SC I > 0 com S > 0 (3.51)

Note que (3.51) uma LMI em S e que ao ser resolvida fornece P , pois P = S 1 e e satisfaz (3.48). A importncia do sinal do termo no linear pode ser facilmente entendida no caso a a escalar. 2 Considere a funao f (p) = 2ap br p2 + c2 com a,b,r,c constantes positivas dadas. c 2 a E fcil perceber que esta funao cncava e que a funao h(s) = 2as br + s2 c2 c e o c e 2 convexa em s. A relao s = 1/p e h(s) = s f (p). ca e Assim a desigualdade f (p) < 0 tem um conjunto de soluao no convexo mas c a h(s) < 0 possui um conjunto de soluao convexo (entre as ra de h(s) = 0). Logo o c zes complemento de Schur se aplica em h(s) < 0 mas no em f (p) < 0. a

3.2.8

Lema de Finsler

Este lema muito util pois permite que restries de igualdade sejam inseridas em e co uma unica desigualdade que pode ser resolvida via LMI. Lema 3.2 (lema de Finsler) Seja C Rnm uma matriz dada e C0 uma base para o espao nulo de C. Seja F (g) uma funo am em G Rq com F (g) = F (g) Rmm . c ca As seguintes condies so equivalentes co a a)g : x F (g)x < 0 x Rm : Cx = 0, x = 0 b)g, L : F (g) + LC + C L < 0 L Rm+n c)g : C0 F (g)C0 < 0 d)g, : F (g) C C < 0 R

(3.52)

2 Algumas relaoes so facilmente vericadas. Por exemplo a equivalncia entre (c) c a e e (a) imediata uma vez que todo x : Cx = 0 possui a forma x = C0 y para algum y. e

40

3. Estabilidade e Desempenho Que (b) e (d) implicam em (a) tambm imediato, uma vez que (b) e (d) implicam e e x (F (g) C C)x < 0 x = 0 x (F (g) + LC + C L )x < 0

Logo, para Cx=0, recuperamos (a). As demais relaoes possuem prova no trivial c a e podem ser encontradas em (de Oliveira and Skelton, 2001) e referncias. Existem e variaoes do Lema de Finsler conhecidas por outros nomes, como Lema da projeo, c ca Lema da eliminaao de variveis, bastante conhecidos na teoria H . c a Lema 3.3 (lema da projeo) Sejam B, C matrizes dadas e B0 , C0 bases para os ca espaos nulos de B e C respectivamente. Seja F (g) uma funo am em g. Ento as c ca a seguintes armaes so equivalentes. co a a)g, L : F (g) + BLC + C L B < 0 b)g : C0 F (g)C0 < 0 e B0 F (g)B0 < 0 e Exemplo 3.10 Considere o sistema Algbrico Diferencial x = A1 x + A2 z x Rn 0 = A3 x + A4 z z Rm (3.54) (3.53)

onde Ai so matrizes dadas, com A4 inversvel e z um vetor de variveis algbricas. a e a e A estabilidade desse sistema pode ser analisada com o aux da funo de Lyapunov lio ca v(x) = x P x de duas formas equivalentes a) com eliminao da varivel algbrica ca a e x = (A1 A2 A1 A3 )x 4 que por sua vez leva `s seguintes condies a co P > 0 : (A1 A2 A1 A3 ) P + P (A1 A2 A1 A3 ) < 0 4 4 (3.56) (3.55)

Para sistemas incertos, onde as matrizes Ai possuem elementos incertos, a condiao (3.56) trabalhosa pois o termo A2 A1 A3 no am nos elementos c e a e 4 incertos em geral. ca a e b) sem eliminao da varivel algbrica. Tomando a derivada de v(x) = x P x para o sistema (3.54) temos as seguintes condioes c

v(x) = x P x > 0, x = 0 v(x) = (A1 x + A2 z) P x + x P (A1 x + A2 z) < 0, x = 0 e z : A3 x + A4 z = 0 (3.57) Dena

3. Estabilidade e Desempenho

41

x z

, C = [A3 A4 ], F (P ) =

P 0

[A1 A2 ] +

A1 A2

[P 0]

(3.58)

e reescreva (3.57) na forma P >0 F (P ) < 0 : C = 0 que pelo lema de Finsler em (3.52) equivalente ` e a P, L : {F (P ) + LC + C L < 0, P > 0} (3.60) (3.59)

que uma condio de estabilidade equivalente ` (3.57) porm as matrizes Ai e ca a e aparecem linearmente na expresso F (P ) + LC + C L e o caso onde Ai possuem a elementos incertos pode ser tratado como na seo 3.2.5. ca

3.2.9

Procedimento-S

A tcnica que cou conhecida como S-Procedure permite concatenar vrias rese a trioes escalares de desigualdade em uma unica. Para reduzir o conservadorismo, a c tcnica introduz multiplicadores como fatores de ponderaao a serem determinados. e c nn Sejam Ti , . . . , Tp R matrizes simtricas dadas e F (g) Rnn uma funao am e c em g. Considere o seguinte problema: encontre g, se poss vel, tal que F (g) > 0 = 0 : Ti 0, i = 1, . . . , p (3.61)

a E fcil perceber que se existem escalares i 0, i = 1, . . . , p e algum g tais que


p

F (g)
i=1

i Ti > 0

(3.62)

ento (3.61) est satisfeita. Porm no trivial mostrar que (3.61) e (3.62) so equivaa a e a e a lentes para p = 1. Existem variantes do procedimento S(ver livro (Boyd et al., 1994)). Exemplo 3.11 Considere o sistema incerto
q

x = (A0 +
i=1

i bi ci )x

(3.63)

onde A0 Rnn , bi , ci Rn so conhecidos e i so parmetros incertos tais que a a a |i | 1. a Exerc cio 3.3 Suponha que os parmetros i estejam no intervalo min i max . Redena A0 , bi , ci , de forma a poder reescrever o sistema como em (3.63) onde |i | 1. 2

42

3. Estabilidade e Desempenho

Dena o vetor auxiliar zi = i ci x e note que a condio |i | 1 pode ser represenca tada na forma zi zi x ci ci x Assim o sistema (3.63) pode ser reescrito como
q

(3.64)

x = A0 x +
i=1

bi zi ,

zi

ci x

(3.65)

A estabilidade deste sistema garantida se existe uma funo v(x) = x P x > 0, x = e ca 0, tal que v(x) = x P x + x P x = (A0 x + q bi zi ) P x + x P (A0 x + i=1

< 0 x, zi = 0 : zi zi x ci ci x (3.66) Usando o procedimento-S tem-se (3.66) satisfeita se existem escalares i 0 e uma matriz P > 0 tal que
q q q

q i=1 bi zi )

(A0 x +
i=1

bi zi ) P x + x P (A0 x +
i=1

bi zi ) +
i=1

i (x ci ci x zi zi ) < 0 x, zi = 0 (3.67)

A desigualdade acima, que suciente para (3.66), pode ser reescrita na seguinte e forma: x z1 . . . zq [A0 P + P A0 + q i ci ci ] P b1 . . . P bq i=1 [P b1 . . . P bq ] diag{i In }
M

x z1 . . . zq

< 0,

x z1 . . . zq

=0 (3.68)

que equivalente ` LMI: M < 0 com P > 0. e a O procedimento S tem seu conservadorismo aumentado ` medida que o nmero a u de restrioes p em (3.61) aumenta. Em alguns casos poss atenuar esse aspecto c e vel conservador substituindo-se os multiplicadores usuais do procedimento-S por outros mais ecientes. Esse o caso, por exemplo, de uma tcnica que cou conhecida como e e escalonamento D G.

3.2.10
S.

Escalonamento D-G

Esta tcnica de escalonamento pode ser vista como uma variao do procedimento e ca Sejam Vi Rmi n matrizes dadas e F (g) uma funao am em g. Considere o c problema de determinar, se poss vel, um vetor g, tal que

3. Estabilidade e Desempenho

43

F (g) > 0, =

x zi . . . zq

= 0 tal que zi = i Vi x, i = 1, . . . , q, |i | 1, i R

(3.69) Sejam Di Rmi mi matrizes simtricas denidas positivas e Gi Rmi mi matrizes e anti-simtricas, isto , Gi = Gi . e e Observe que a condiao |i | 1 pode ser representada por zi Di zi x Vi Di Vi x onde c Di uma matriz positiva denida que pode ser arbitrariamente escolhida. Alm disso, e e x Vi Gi zi + zi Gi Vi x = 0, zi , x onde Gi uma matriz anti-simtrica que tambm pode e e e ser arbitrariamente escolhida. Assim se a seguinte condiao for satisfeita c x zi g, Gi , Di : F (g) < 0 = . : H 0 (3.70) . . zq H= [ q Vi Di Vi ] i=1 V1 G1 . . . Vq Gq V1 G1 . . . Vq Gq diag{Di }

teremos (3.59) tambm satisfeita. Aplicando agora o procedimento S para p = 1 e obtemos (F (g) + H) < 0 que equivalente ` LMI e a g, Di , Gi : F (g) + H < 0 Observe que esta desigualdade equivalente ` (3.70), pois o procedimento S e a e necessrio e suciente para p = 1. Porm (3.70) apenas suciente para (3.69). Quando a e e mi = 1, isto , Vi R1n (zi so escalares) temos Di e Gi tambm escalares e nesse e a e caso devemos ter Di = i > 0 e Gi = 0. Logo se aplicarmos o escalonamento D G na resoluao do Exemplo 3.11 encontraremos o mesmo resultado indicado em (3.68). c Exerc cio 3.4 Aplique o escalonamento D G para resolver o Exemplo 3.11 a) com zi = i Ci x (Vi = Ci ) b) com zi = i x (Vi = I) c) Em qual caso o nmero de variveis a serem determinadas menor? E quanto ao u a e conservadorismo dos resultados no dois casos? Qual abordagem parece ser mais adequada?

3.3

D-Estabilidade: plos em regies desejadas o o

O sistema linear invariante (3.18) exponencialmente estvel se e somente se todos e a os autovalores da matriz A esto no semiplano esquerdo estrito. Um sistema que seja a exponencialmente estvel pode apresentar uma performance muito pobre se existirem a

44

3. Estabilidade e Desempenho

autovalores muito prximos do eixo imaginrio ou ainda se a parte imaginria de alo a a gum autovalor for muito grande em relao ` sua parte real (plo oscilatrio pouco ca a o o amortecido). Por esse motivo importante saber se os autovalores se encontram em e sub-regies do semiplano esquerdo que garantam ao sistema rapidez e poucas oscilaoes o c na resposta. Nesta seo apresenta-se critrios de estabilidade que garantem que os ca e plos do sistema nominal se encontram em uma dada regio D do plano Complexo, o a isto , ser determinado se todos os autovalores da matriz A pertencem a uma regio e a a D C. Com esta nalidade, considere a seguinte denio: ca e a Denio 3.3 (D-Estabilidade) O sistema linear invariante x = Ax D-estvel se ca e somente se todos os autovalores da matrix A pertencem a sub-regio D do plano a complexo, isto : e i (A) D C, i = 1, . . . , n (3.71) A noao de D-estabilidade acima denida permite determinar no somente a sua c a estabilidade, mas tambm analisar o comportamento transitrio do sistema x = Ax e o visto que este comportamento est diretamente relacionado ao posicionamento do plos a o no plano complexo. Note tambm que a estabilidade quadrtica pode ser vista como e a uma situao particular da D-estabilidade quando D = C . ca A seguir apresenta-se uma classe de regies do plano complexo descritas em termos o de LMIs, proposta inicialmente em (Chilali and Gahinet, 1996). Denio 3.4 (Regies LMIs) Um subconjunto D do plano complexo denominado ca o e nd nd nd nd de uma regio LMI se existem matrizes L = L R a eM R tais que: D = s C : L + sM + s M < 0 onde s = + j. Note que uma regio LMI um subconjunto do plano complexo a qual reprea e e sentada por uma LMI em s e s , ou equivalentemente, uma LMI em = Re(s) e = Im(s). Exemplo 3.12 (Exemplos de Regies LMIs) Considere as seguintes regies LMIs (reo o presentadas na Figura 3.3): (a) Da , semi-plano com Re(s) < . Esta regio pode ser denida pela inequao a ca s + s < 2, a qual pode ser representada na formulao LMI em (3.72) atravs das ca e seguintes matrizes: L = 2 e M = 1. (b) Db , disco com raio r centrado em (c, 0). Esta regio pode ser denida pela a seguinte relao ( + c)2 + 2 < r2 ou equivalentemente por (s + c)r1 (s + c) < r ca levando ` seguinte denio das matrizes L e M em (3.72): a ca L= r c c r e M= 0 1 0 0 . (3.72)

(c) Dc , setor cnico com ngulo interno 2. Esta regio pode ser denida por o a a sin + cos < 0 levando `s seguintes matrizes: a L = 02 e M = sin cos cos sin .

3. Estabilidade e Desempenho PSfrag replacements j r c (a) (b) (c)

45

1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 0000

w
$r$

w p s

al

$c$

(a)

(b)

(c)

Figura 3.3: Regies LMIs - (a) semi-plano, (b) disco e (c) setor cnico. o o Utilizando o resultado proposto em (Chilali and Gahinet, 1996, Teorema 2.2), a D-estabilidade pode ser determinada atravs do seguinte condio LMI. e ca Teorema 3.4 O sistema x = Ax D-estvel se e somente se existe uma matriz e a simtrica denida positiva P tal que: e L P + M (P A) + M (A P ) < 0 onde a operao corresponde ao produto de Kronecker4 de duas matrizes. ca Exemplo 3.13 Determine se o seguinte sistema tem seus autovalores com parte real menor do que 1. 0 1 x1 x= x, x = . (3.74) 20 4 x2 Pelo Exemplo 3.12, a regio com Re(i (A)) < 1 pode ser representada na forma a (3.72) com L = 2 e M = 1. Utilizando o Teorema 3.4, obtm-se a seguinte condio e ca LMI: P > 0 : A P + P A + 2P < 0 Atravs do LMITOOL do Scilab, tem-se o seguinte resultado: e -->[P]=d_est(); -->[P]=d_est(); Construction of canonical representation Basis Construction FEASIBILITY PHASE. primal obj. dual obj. dual. gap 1.92e+001 -7.77e+003 7.79e+003 -2.92e+001 -7.72e+003 7.69e+003 Target value reached feasible solution found -->P P = ! 637.00835 35.231849 ! ! 35.231849 31.286088 !
4

(3.73)

Para duas matrizes A e B, o produto de Kronecker dado por A B = [Aij B]ij . e

46

3. Estabilidade e Desempenho Portanto, o sistema (3.74) D-estvel onde a regio D dada por: e a a e D = {s C : 2 + s + s < 0}

Uma importante caracter stica das regies LMIs a sua invarincia com relao a o e a ca operao de interseco de conjuntos, como mencionado na seo 3.2.3. Por exemplo, ca ca ca considere duas regies LMIs D1 e D2 , a interseco D1 D2 tambm uma regio LMI o ca e e a representada por: D1 D 2 = sC: L1 0 0 L2 + M1 0 0 M2 s+ M1 0 0 M2 s < 0 (3.75)

Com o resultado acima pode-se determinar a D-estabilidade de um sistema nominal, onde D uma regio LMI formada a partir da intersecao de outras regies LMIs. Este e a c o resultado resumido no seguinte corolrio (Chilali and Gahinet, 1996, Corolrio 2.3). e a a Corolrio 3.1 Sejam D1 , D2 , . . . , Dl regies LMIs dadas, o sistema x = Ax D1 a o e Dl -estvel se e somente se existe uma matriz simtrica denida positiva P satisfazendo a e as seguintes restries LMIs: co Li P + Mi (P A) + Mi (A P ) < 0, i = 1, . . . , l onde Di = {s C : Li + Mi s + Mi s < 0} para i = 1, . . . , l. E importante observar que alm da localizao desejada dos autovalores a De ca estabilidade garante a estabilidade quadrtica do sistema. Para sistemas lineares invaa riantes no tempo os autovalores esto diretamente ligados ao desempenho do sistema a e as condies aqui apresentadas no so conservadoras. Porm importante lembrar co a a e e que para sistemas variantes no tempo a performance do sistema no pode ser caraca terizada de forma simples em funao da localizaao dos autovalores. Veja seo 3.1.1. c c ca Apesar desse inconveniente as condioes aqui apresentadas ainda garantem estabilidade c quadrtica do sistema. a Finalmente note que para analisar a D-estabilidade de um sistema incerto podemos utilizar as mesmas LMIs aqui apresentadas bastando apenas que a matriz de dinmica a do sistema x = Ax possa ser representada como uma funo am dos parmetros ca a incertos. Veja seao 3.2.5. c (3.76)

3.4

Norma H2 de Sistemas

Em muitas aplicaoes importante se ter garantias que poss c e veis perturbaoes ocorc rendo num sistema de controle no afetam de maneira proibitiva as variveis de interesse a a sob controle. A capacidade de um sistema de controle de limitar os efeitos indesejveis a dessas perturbaes denominada de rejeio de perturbaoes e pode ser quanticada co e ca c de vrias formas. Nesta seo aborda-se o uso de normas de sistemas (com relao ao a ca ca ganho do operador entrada de perturbao - sa de interesse) como forma de medir ca da o grau de inuncia das perturbaoes externas sobre as sa e c das de interesse.

3. Estabilidade e Desempenho

47

Historicamente, as normas de sistemas so denidas a partir da resposta em a frequncia do sistema5 . Por esse motivo estaremos supondo nesta seao que o sistema e c a ser analisado exponencialmente estvel. Caso isso no ocorra podemos primeiro e a a projetar um controlador estabilizante e proceder a anlise em questo para o sistema a a em malha fechada. Norma de sistemas uma extenso da idia de norma de sinais que uma medida e a e e de energia. A norma 2 de um sinal z(t) denida como sendo e ||z(t)||2 = 2
0

z(t)2 dt = E,

(3.77)

A expresso acima uma generalizaao da noo de energia dissipada, pois se z(t) fosse a e c ca um sinal de tenso a expresso acima nos d a energia dissipada num resistor unitrio. a a a a O conjunto de todos os sinais que possuem energia nita, i.e. so quadraticamente a integrveis, formam um espao denominado L2 . a c A norma 2 de um sinal vetorial z(t) = z1 (t) . . . zn (t) denida como sendo e a soma das energias de todas as componentes do vetor6 .
n

||z(t)||2 = 2
i=1

z(t)2 dt = i

z(t) z(t)dt = E,
0

(3.78)

O teorema de Parseval (abaixo) um resultado importante pois permite relacionar e energia de um sinal, denida no dom nio do tempo, com a transformada de Fourier do sinal. Teorema 3.5 (Teorema de Parseval) Seja f (t) um sinal real causal com energia limitada e F (jw) a sua transformada de Fourier. Ento, a seguinte relao envolvendo a a ca energia E do sinal f (t) verdadeira: e

E=
0

f (t) f (t)dt =

1 2

F (jw) F (jw)dw

(3.79)

A seguir, apresenta-se a deniao da norma H2 para sistemas nominais alm dos c e mtodos utilizados na sua determinao numrica. e ca e Considere o seguinte sistema nominal x(t) = Ax(t) + Bw w(t) z(t) = Cz x(t), x(0) = 0 (3.80)

onde x(t) Rn representa o vetor de estados, w(t) Rnw a entrada de pertubaoes, c nz z(t) R as sa das de interesse, e A, Bw , Cz so matrizes constantes com dimenses a o apropriadas.
A resposta em frequncia de um sistema linear invariante estvel caracteriza a resposta de regime e a permanente para excitaes senoidais de diversas frequncias. Em resumo, para uma excitao w(t) = co e ca A sen(w0 t) a resposta em regime permanente do sistema Z(s) = H(s)W (s) z(t) = B sen(w0 t + e onde B = A |H(jw0 ) | e = H(jw0 ). n 6 Note que z(t) z(t) = i=1 zi (t)2 .
5

48

3. Estabilidade e Desempenho

O sistema acima pode ser representado no dom nio da freqncia pela seguinte ue matriz de transferncia: e H(s) = Cz (sI A)1 Bw (3.81) No caso SISO (nw = nz = 1) norma H2 pode ser denida como a energia da sa da quando o sistema excitado por um impulso. Assim, considerando que no sistema e (3.80) nw = 1 e nz = 1, a relaao entrada-sa pode ser representada pela funao de c da c transferncia H(s) = Hwz (s), conforme o diagramas de blocos visto na Figura 3.4. e

Hwz ( s )

Figura 3.4: Diagrama de Blocos para o sistema (3.80). A energia da resposta ao impulso ento dada por: e a ||z(t)||2 = 2
0

z(t)2 dt = E,

(3.82)

onde z(t) o sinal de sa e da. Da gura 3.4, verica-se que Z(s) = H(s)W (s) Como o sinal de entrada w(t) um impulso na origem7 tem-se que W (s) = 1 e e portanto z(t) = h(t). Como h(t) representa o operador entrada-sa do sistema da denimos como norma H2 do sistema a energia da resposta ao impulso ||h(t)||2 = 2
0

h(t)2 dt

h(t) = L1 [H(s)]

(3.83)

ou de forma alternativa no dom nio da frequncia (veja teorema de Parseval) e H(s)


2 2

1 2

H(jw) H(jw) dw =

H(jw) H(jw) dw

(3.84)

Argumentos similares a esses podem ser usados para a deniao da norma H2 para c sistema MIMO. Considere o caso de um sistema sujeito ` duas entradas e duas sa a das, descrito na Figura 3.6. Perceba que agora o operador entrada-sa representado pela matriz de transda e ferncia H(s) implicando que e h(t) = L1 [H(s)] =
7

h11 (t) h12 (t) h21 (t) h22 (t)

(3.85)

Baseado na relao frequencial Z(j) = H(j)W (j) podemos interpretar o sinal de entrada como ca uma ponderao que, ao ser aplicada no sistema, produz a sa ca da. Como a transformada do impulso e uma constante dizemos que um impulso pondera igualmente todas as componentes de freqncia do ue sistema. Nenhum outro sinal de entrada tem essa propriedade.

3. Estabilidade e Desempenho |H(jw)|2

49

E(w0 )

w0

Figura 3.5: Energia do sistema (3.80) na faixa de frequncia 0 , 0 . e

H( s ) w1 w2 H11 H12 H21 H22 z1 z2

Figura 3.6: Diagrama de Blocos para o sistema (3.80) com nw = 2 e nz = 2 . Neste caso a norma H2 do sistema denida como sendo a soma das energias de e todas as funes hij (t). Esta deniao pode ser interpretada em termos da resposta ao co c impulso como segue. Como o sistema linear pode-se usar a idia da superposiao, e analisar de forma e e c separada o efeito dos sinais de entrada w1 e w2 . Considerando primeiro que o sistema e afetado pelo sinal w(t) = wa (t) correspondente ` um impulso no canal w1 com w2 = 0, a o sinal de sa ser dado por da a z(t) = za (t) = h11 (t) h21 (t)

Considerando agora o sinal w(t) = wb (t) correspondente ` um impulso no canal w2 a com w1 = 0, o sinal de sa ser dado por da a z(t) = zb (t) = h12 (t) h22 (t) .

50 Desta forma a energia total do sistema expressa por e


3. Estabilidade e Desempenho

Etotal =
0

za (t) za (t) dt +
0

zb (t) zb (t) dt

(3.86)

que pode ser reescrita como8 :

Etotal =
i,j 0

hij (t)2 dt =
0

tr {h(t) h(t)} dt

(3.87)

Da mesma forma como a norma 2 de um sinal x(t) obtida atravs da energia e e e das componentes do vetor, i.e. x(t) 2 = i 0 xi (t)2 dt, a norma 2 da matriz h(t) 2 2 2 obtida atravs da energia das componentes da matriz, i.e. h(t) 2 = i,j 0 hij (t) dt. e Lembrando que a soma do quadrado dos elementos da matriz h(t) pode ser expressa como tr {h(t) h(t)} tem-se que a norma H2 para sistemas MIMO dada por e h(t)
2 2

=
i,j 0

hij (t)2 dt =
0

tr{h(t) h(t)}dt

h(t) = L1 [H(s)]

(3.88)

Usando o teorema de Parseval a expresso acima pode ser reescrita na forma a H(s)
2 2

1 2

i,k

Hik (j)2 d =

1 2

tr{H (jw)H(jw)}dw

(3.89)

onde Hik (j) so os elementos de H(j). a Pela denio da norma H2 em (3.89), observa-se que a norma ser nita somente ca a para sistemas estveis e estritamente prprios, isto , limw H(jw) = 0. a o e Baseado no fato que a norma 2 de um sistema representa a energia da resposta ao impulso, podemos tambm usar a norma 2 para obter a energia da resposta para um e sinal qualquer conhecido de energia limitada. Seja W (s) a transformada do sinal de entrada para o qual queremos calcular a energia da resposta. O sinal de resposta e ento Z(s) = H(s)W (s) que pode ser visto como a resposta impulsional de um sistema a auxiliar cuja funo de transferncia H(s) = H(s)W (s). Assim basta incorporar a ca e e transformada do sinal de entrada na funao de transferncia e usar os mesmos resultados c e anteriores desenvolvidos para resposta ao impulso.

3.4.1

Determinao da Norma H2 via gramianos ca

A norma H2 de um sistema genrico estritamente prprio e estvel obtida a partir e o a e da anti-transformada da funao de transferncia c e h(t) = Cz eAt Bw = L1 [H(s)]
8

(3.90)

O trao de uma matriz quadrada M , que ser denotado por tr {M }, por denio a soma c a e ca dos elementos da diagonal principal de M e corresponde ` soma dos autovalores de M . Alm disso a e tr {M M } = tr {M M } e corresponde ` soma do quadrado de todos os elementos de M . a

3. Estabilidade e Desempenho Substituindo a expresso acima em (3.88) obtm-se: a e H(s)


2 2

51

=
0

tr{Bw eA t Cz Cz eAt Bw }dt


0

(3.91) (3.92) (3.93)

= tr Bw

eA t Cz Cz eAt dt Bw

= tr{Bw Po Bw } onde a matriz simtrica positiva denida e

Po =
0

eA t Cz Cz eAt dt

conhecida como gramiano de observabilidade, a qual pode ser obtida pela soluao da e c seguinte equao de Lyapunov: ca A Po + Po A + Cz Cz = 0 (3.94)

Devido ` comutatividade do operador tr{} poss a e vel inverter os termos na expresso (3.88) levando ` seguinte expresso dual da norma H2 : a a a H(s)
2 2

= tr Cz
0

eAt Bw Bw eA t dt Cz

(3.95) (3.96)

= tr{Cz Pc Cz }

onde Pc uma matriz simtrica denida positiva, conhecida como gramiano de controe e labilidade, dada por:

Pc =
0

eAt Bw Bw eA t dt

De maneira similar ao gramiano de observabilidade, a matriz Pc pode ser obtida atravs da resoluao da seguinte equao de Lyapunov: e c ca APc + Pc A + Bw Bw = 0 (3.97)

Os gramianos de controlabilidade e observabilidade Pc , Po podem ser facilmente calculados por mtodos numricos ecientes. No entanto, para sistemas incertos os gramianos e e acima so de pouca utilidade pois no podem ser obtidos numericamente. Para cona a tornar essa diculdade podemos utilizar LMIs para obter um limitante superior para a norma.

3.4.2

Determinao da Norma H2 via LMIs ca


A P + P A + Cz Cz < 0 (3.98)

Na seao 3.2.6 mostrou-se que toda soluao P da desigualdade c c

satisfaz a relao P > Po e que podemos obter a igualdade P = P0 com a preciso ca a desejada. Assim temos a seguinte relao ca tr{Bw P Bw } > tr{Bw Po Bw } = H(s)
2 2

52

3. Estabilidade e Desempenho

e podemos resolver o problema de clculo da norma H2 atravs de um problema de a e otimizaao convexa c H(s)
2 2

= min tr{Bw P Bw } : P > 0, A P + P A + Cz Cz < 0


P

(3.99)

com a segurana de que a igualdade acima ocorre com a preciso desejada. c a Do ponto de vista prtico, a diferena entre o valor obtido por meio da LMI e a c a soluo exata dada pelo gramiano pode ser controlada ajustando-se a preciso do ca a algoritmo utilizado. Exemplo 3.14 Considere o seguinte sistema nominal: x= 0 1 1 2 x+ 0 1 w, z = 1 1 , x= x1 x2 (3.100)

O valor exato na norma H2 do sistema acima pode ser obtido atravs da expresso e a ca ca H(s) 2 = tr{Bw Po Bw }, onde Po satisfaz a equao (3.94). Utilizando a funo lyap() do Scilab, obtm-se o seguinte resultado: e
-->[Po]=lyap(A,-Cz*Cz,c) Po = ! 0.5 0.5 ! ! 0.5 0.5 ! -->norma_h2=trace(Bw*Po*Bw) norma_h2 = 0.5

Equivalentemente, pode-se determinar a norma H2 do sistema (3.100) atravs do e seguinte problema de otimizao: ca min tr{Bw Po Bw } : Po > 0, A Po + Po A + Cz Cz < 0
Po

Utilizando o LMITOOL do Scilab com uma preciso (abstol = 1e-10, reltol = 1e-10), a obtm-se o mesmo resultado: e
-->[Po,norma_h2]=H2() Construction of canonical representation Basis Construction FEASIBILITY PHASE. primal obj. 1.36e+00 -8.69e+02 dual obj. -1.33e+03 -1.32e+03 dual. gap 1.33e+03 4.52e+02

3. Estabilidade e Desempenho

53

Target value reached feasible solution found OPTIMIZATION PHASE. primal obj. 2.77e+03 2.83e+05 . . -5.00e-01 -5.00e-01 dual obj. -1.51e+06 -1.50e+06 . . -5.00e-01 -5.00e-01 dual. gap 1.52e+06 1.78e+06 . . 5.72e-08 5.93e-09

optimal solution found norma_h2 0.5 Po ! ! =

= 0.5000000 0.5000000

0.5000000 ! 0.5 !

3.4.3

Limitantes da Norma H2 para sistemas incertos


x(t) = A() x(t) + Bw w(t) z(t) = Cz x(t) (3.101)

Um sistema linear incerto pode ser genericamente representado por

onde x(t) Rn o estado, w(t) Rr o vetor de perturbaao externa, z(t) Rs e e c e m o vetor de performance, R o vetor de parmetros incertos, um conjunto e a e compacto conhecido representando os valores admiss veis de e A() uma funao e c conhecida desses parmetros. Por simplicidade na apresentaao, assumiremos que a c invariante no tempo e que Bw e Cz no dependem dos parmetros incertos. Estas e a a hipteses podem ser removidas como veremos mais tarde. o Os gramianos para este sistema incerto podem ser obtidos diretamente da seao c 3.4.1 e so indicados abaixo. a A() P0 () + P0 ()A() + Cz Cz = 0 A()Pc () + Pc ()A() + Bw Bw = 0 A norma H2 desse sistema incerto dada por e H(s, )
2 2

(3.102) (3.103)

= tr{Bw Po ()Bw } = tr{Cz Pc ()Cz }

(3.104)

e como no conhecido no podemos utilizar a expresso acima para calcular a a e a a norma desse sistema incerto. Uma idia natural nessa situao calcular a norma para e ca e

54

3. Estabilidade e Desempenho

o pior caso poss da incerteza, i.e. para o elemento de que provoca o maior valor vel da norma denida acima. Mesmo assim ainda no poder a amos obter o gramiano que corresponde ao pior caso pois ter amos que resolver um problema de dimenso innita a dado que possui innitos elementos. Se ao invs de calcularmos o valor exato do e pior caso da norma, nos contentarmos com um limitante superior do pior caso podemos utilizar os resultados da seao 3.4.2 para resolver numericamente esse problema. c Considere as desigualdades abaixo onde P, S so independentes de . a A() P + P A() + Cz Cz < 0 A()S + SA() + Bw Bw < 0 (3.105) (3.106)

Como vimos na seao 3.2.6 as seguintes relaoes ocorrem P > P0 () e S > Pc () c c . Logo, as desigualdades acima sugerem os seguintes limitantes superiores para o pior caso da norma H2 : H(s, ) H(s, )
2 2 2 2

< tr{Bw P Bw } < tr{Cz SCz }

(3.107)

Infelizmente no poss saber a priori qual dos dois limitantes menos conservador a e vel e (i.e. fornece o menor valor). Entretanto basta que A() seja am em e que seja um politopo podemos calcular os limitantes acima de forma bastante eciente. Basta construir as LMIs (3.105) ou (3.106) para os vertices do politopo e minimizar tr{Bw P Bw } ou tr{Cz SCz } respectivamente.

3.5

Norma H de Sistemas
x(t) = Ax(t) + Bw w(t) z(t) = Cz x(t) + Dwz w(t), x(0) = 0 (3.108)

Considere o seguinte sistema nominal

onde x(t) Rn representa o vetor de estados, w(t) Rnw a entrada de pertubaoes, c z(t) Rnz as sa das de interesse, e A, Bw , Cz , Dwz so matrizes constantes com dia menses apropriadas. Este sistema pode ser representado no dom o nio da freqncia ue pela seguinte matriz de transferncia: e Hwz (s) = Cz (sI A)1 Bw + Dwz A norma H do sistema (3.108) denida como o maior ganho da sua resposta em e frequencia9 . Como na seo anterior, antes de apresentar a deniao geral de norma ca c H , considera-se o caso de sistemas SISO onde a entrada w, a sa z e a funo de da ca transferncia Hwz (s) indicados no diagrama 3.7 so escalares. e a A Figura 3.8 mostra a resposta em freqncia deste sistema, onde Mr representa o ue pico de ressonncia e r a freqncia de ressonncia. a e ue a
A resposta em frequncia de um sistema linear invariante estvel caracteriza a resposta de regime e a permanente para excitaes senoidais de diversas frequncias. Em resumo, para uma excitao w(t) = co e ca A sen(w0 t) a resposta em regime permanente z(t) = B sen(w0 t + ) onde B = A |Hwz (jw0 ) | e e = Hwz (jw0 ).
9

3. Estabilidade e Desempenho

55

Hwz ( s )

Figura 3.7: Relao entrada/sa ca da.


|H(j)| M

Figura 3.8: Diagrama de Bode Note que o pico de ressonncia o maior ganho que o sistema capaz de oferecer a e e ao sinal de entrada. Desta forma, para o caso de sistemas SISO, a norma H pode ser descrita como ||Hwz (s)|| = maxw |H(jw)| = Mr (3.109)

No caso de sistemas MIMO a idia de mdulo no se aplica e deve ser substitu e o a da pela norma espectral da matriz de transferncia10 . Assim, um diagrama de Bode similar e ao da gura 3.8 pode ser obtido para a funo Hwz (j) = {Hwz (j)} e a norma H ca do sistema corresponde ao pico de ressonncia dessa funao dando origem ` deniao a c a c
A norma espectral a norma de matrizes induzida pela norma Euclidiana de vetores, i.e. para e vetores y, w e uma matriz M satisfazendo y = M w temos y = M w M w . Ela denida e como sendo M = {M } onde {M } denota o valor singular mximo de M . Os valores singulares a (i ) de uma matriz M so denidos como sendo a raiz quadrada dos autovalores de M M , i.e. a e i (M ) = i (M M ) onde M matriz complexa conjugada transposta de M . Note que os valores singulares so reais e no negativos. a a
10

56

3. Estabilidade e Desempenho

Hwz (s)

= sup {Hwz (jw)}


w

(3.110)

Note que se Hwz (jw) for uma funo escalar ento {Hwz (jw)} = |Hwz (jw)|, reca a tornando ` expresso (3.109) para o caso de sistemas SISO. a a Como j foi salientado a norma H de um sistema representa o maior ganho da a sua resposta em frequncia e pode tambm ser vista como o maior ganho em termos e e de energia que o sistema pode oferecer a um sinal de entrada (Burl, 1999). Esta interpretaao bastante util e fornece uma deniao alternativa para a norma H . c e c Pelo teorema de Parseval temos w(t)
2 2

1 2

W (j) W (j) d , z(t)

2 2

1 2

Z(j) Z(j) d Como

onde W (j), Z(j) so as transformadas de Fourier dos sinais w(t), z(t). a Z(j) = Hwz (j)W (j) temos z(t)
2 2

1 2 1 2 =

W (j) Hwz (j) Hwz (j)W (j) d ( {Hwz (j)})2 W (j) W (j) d 1 2
0

(3.111)

(sup {Hwz (j)})2

W (j) W (j) d

Esta ultima expresso pode ser reescrita na forma a z(t)


2

Hwz (s)

w(t)

onde se nota que a norma H de um sistema pode tambm ser vista como o maior gae nho em termos de energia que o sistema pode oferecer a um sinal de entrada. Se escolhermos o sinal de entrada W (j) adequadamente11 podemos ter a igualdade z(t) 2 = Hwz (s) w(t) 2 . Para isso basta escolher w(t) = V0 sen(0 t) GT (t) onde V0 o autovetor de Hwz (j0 ) Hwz (j0 ) correspondente ao seu maior autovalor, 0 e e 12 a frequncia onde ocorre o sup {Hwz (j)} e GT (t) a funo porta que dene o e e ca truncamento do sinal para T sucientemente grande (veja nota de rodap). Os elee mentos do vetor V0 so as amplitudes das senides de cada componente do vetor w(t). a o Um valor negativo de uma das componentes de V0 indica uma defasagem de 180 graus dado que sen( t) = sen( t + ). A partir dessa relaao pode-se denir a verso no dom c a nio tempo da norma H como: z(t) 2 (3.112) Hzw (s) = sup w=0 w(t) 2
Note que sinais de entrada persistentes do tipo degrau ou senoides no possuem energia nita a e portanto para eles no podemos calcular w(t) 2 nem tampouco a norma da resposta do sistema a z(t) 2 . Para obter a resposta em frequncia com sinais de energia nita basta considerar senoides e truncadas num instante de tempo sucientemente grande de tal forma que o regime estacionrio da a resposta seja atingido com a preciso desejada. a 12 A funo porta GT (t) denida como GT (t) = 1 para |t| < T e zero caso contrrio. ca e a
11

3. Estabilidade e Desempenho

57

3.5.1

Determinao da Norma H sub-tima ca o

Uma das maneiras de determinar a norma H de um sistema nominal atravs da e e sua resposta em freqncia. Para sistemas com uma entrada e uma sa (SISO) podeue da se utilizar o diagrama de Bode para obter o ganho mximo do sistema com relaao a a c todas as freqncias. Entretanto, o conceito de resposta em freqncia para sistemas ue ue com mltiplas entradas e sa u das (MIMO) mais complexo e pode ser obtido atravs e e da noo da decomposiao pelo valor singular (Burl, 1999; Zhou, 1998). ca c Ao invs de determinar o valor exato da norma H , uma idia bastante comum e e consistem em se determinar numericamente um limitante superior para Hwz (s) utilizando a denio (3.112), em outras palavras, busca-se um escalar positivo tal que: ca Hwz (s)

<

(3.113)

O problema de encontrar o limitante acima conhecido como problema H sube timo. Para encontrar o valor exato da norma basta minimizar de forma iterativa. o Este problema pode ser resolvido de diversas maneiras, como por exemplo pela equaao de Riccati (Zhou, 1998, Cap c tulo 12), pela matriz Hamiltoniana (Burl, 1999, Apndice) ou por LMI (Boyd et al., 1994). e

3.5.2

Determinao da Norma H via LMI ca


z(t) z(t) dt 0 w(t) w(t)dt 0

Primeiro observe que a condiao desejada c Hwz (s) z(t) = sup w=0 w(t)
2 2

= sup
w=0

<

(3.114)

pode ser reescrita na forma


0

z(t) z(t)dt < 2


0

w(t) w(t)dt

(3.115)

Como o sistema exponencialmente estvel, i.e. x() = 0 e as condioes iniciais so e a c a nulas, i.e. x(0) = 0, considere o problema de determinar uma funo V (x) = x(t) P x(t), ca onde P uma matriz simtrica denida positiva, tal que e e V (x) + z(t) z(t) 2 w(t) w(t) < 0 (3.116)

onde V (x) a derivada de V (x) para as trajetrias do sistema. Observe que se encone o tramos V (x) que satisfaa a condiao acima ento teremos (3.115) e portanto (3.114) c c a satisfeitas. Para recuperar (3.115) basta integrar (3.116) no intervalo t (0, T ) com T . O interesse da condiao acima que podemos express-la como uma LMI. c e a Para isso basta notar que V (x) + z(t) z(t) 2 w(t) w(t) = x (A P + P A + Cz Cz ) (P Bw + Cz Dwz ) w (Bw P + Dwz Cz ) 2 Inw + Dwz Dwz

x w

<0

x w

=0

58 que nos leva ` LMI a

3. Estabilidade e Desempenho

(A P + P A + Cz Cz ) (P Bw + Cz Dwz ) 2 Inw + Dwz Dwz (Bw P + Dwz Cz )

<0

(3.117)

Este resultado, conhecido como Bounded Real Lemma, na realidade uma condio e ca necessria e suciente para (3.114) (Boyd et al., 1994). Isto implica que o valor exato a da norma pode ser obtido, com a preciso desejada, atravs do problema de otimizaao a e c convexa: P > 0, (A P + P A + Cz Cz ) (P Bw + Cz Dwz ) (3.118) min 2 : <0 P 2 (Bw P + Dwz Cz ) Inw + Dwz Dwz Exemplo 3.15 Considere o sistema (3.100). O valor exato da norma H pode ser obtido diretamente do diagrama de Bode apresentado na Figura 3.9, onde conclui-se que Hwz (s) = 1.00 (na freqncia w = 0). ue
0 db

-10

-20

-30

-40

-50

-60

-70
.

-80
-3 -2 -1 0 1 2

10

10

10

10

10

10

Hz

10

Figura 3.9: Diagrama de Bode para o sistema (3.100). Alternativamente, pode-se obter uma estimativa da norma H atravs do problema e de otimizao denido em (3.118). Utilizando o LMITOOL do Scilab, obtm-se: ca e

3. Estabilidade e Desempenho

59

-->[P,g]=Hinf() Construction of canonical representation Basis Construction FEASIBILITY PHASE. primal obj. 1.39e+00 -1.25e+01 . . . 9.35e-09 1.10e-09 dual obj. -1.56e+03 -1.56e+03 . . . -5.39e-08 -8.52e-09 dual. gap 1.57e+03 1.55e+03 . . . 6.32e-08 9.62e-09

optimal solution found g = 1. = 0.9999670 1.000015 1.000015 ! 2.3607682 !

P ! !

-->norma_hinf=sqrt(g) norma_hinf = 1.

3.5.3

Limitante da Norma H para sistemas incertos


x(t) = A()x(t) + Bw w(t) z(t) = Cz x(t) + Dwz w(t), x(0) = 0 (3.119)

Considere o seguinte sistema linear incerto

onde x(t) Rn representa o vetor de estados, w(t) Rnw a entrada de pertubaoes, c nz z(t) R as sa das de interesse, e Bw , Cz , Dwz so matrizes constantes com dimenses a o apropriadas, Rm o vetor de parmetros incertos, um conjunto compacto e a e conhecido representando os valores admiss veis de e A() uma funao conhecida e c desses parmetros. Por simplicidade na apresentaao, assumiremos que invariante a c e no tempo e que Bw , Cz , Dwz no dependem dos parmetros incertos. Estas hipteses a a o podem ser removidas como veremos mais tarde. Este sistema incerto pode ser representado no dom nio da freqncia pela seguinte ue matriz de transferncia: e Hwz (s, ) = Cz (sI A())1 Bw + Dwz

60

3. Estabilidade e Desempenho

A norma H do sistema incerto (3.119) denida como o mximo ganho do sistema e a com relao ` todas as freqncias e todos os poss ca a ue veis valores de incerteza. Hwz (s)

sup w=0

z(t) w(t)

2 2

sup w=0

z(t) 0 w(t) 0

z(t) dt < w(t) dt

(3.120)

Procedendo de maneira anloga ` seao anterior obtemos a seguinte condiao para o a a c c clculo exato da norma H do sistema incerto: a P () > 0, (A() P () + P ()A() + Cz Cz ) (P ()Bw + Cz Dwz ) min 2 : < 0 P () (Bw P () + Dwz Cz ) 2 Inw + Dwz Dwz (3.121) Observe que o problema acima no pode ser numericamente resolvido de forma eciente a porque a desigualdade matricial envolve uma funao no am nos parmetros incertos c a a devido ao produto A()P () e seu transposto. Esta no-linearidade causada pelo a produto pode ser eliminada se nos contentarmos com um limitante superior para o valor exato da norma dado por (3.121). Por exemplo, restringindo-se a matriz P () a ser a mesma para todo , i.e. P () = P o produto indesejado eliminado. Entretanto e o menor valor de obtido de (3.121) com P () = P em geral maior que o valor e exato obtido de (3.121) com P () livre. Esse limitante superior, mesmo podendo ser conservador em geral, pode ser obtido numericamente de forma eciente quando A() e m am em e um politopo de vrtices vi , i = 1, . . . , 2 conhecidos. Nessas condies e e co basta resolver 2m LMIs simultneas obtidas de (3.121) para = vi , i = 1, . . . , 2m . a Exerc cio 3.5 Mostre atravs do complemento de Schur que a desigualdade (3.117) e pode ser reescrita na forma A P + P A P Bw Cz Bw P 2 Inw Dwz < 0 Cz Dwz Inz Suponha em seguida que A, Bw , Cz , Dwz sejam funes ans de um parmetro incerto co a como em (3.119). Nessas condies, com P independente de , seria poss mico vel nimizando na desigualdade acima, obter o valor exato da norma em (3.121)? Seria possvel encontrar um valor de menor que o exato? Supondo que a norma13 da matriz Dwz seja Dwz 2 = , seria possvel obter < na LMI acima? Exerc cio 3.6 Mostre que a LMI do exemplo anterior, obtida de (3.117) para o sistema (3.108), pode ser reescrita na forma QA + AQ Bw QCz Inw Dwz < 0 Bw Cz Q Dwz Inz Sugesto: Use o fato de que uma matriz M positiva denida se e somente a e se T M T > 0 para qualquer matriz T inversvel. Em particular escolha T = 1 1 1 c c a diag{ 2 P 1 , 2 Inw , 2 Inz } e faa a mudana de varivel Q = P 1 .
Utilize como norma de matrizes a norma spectral que a norma induzida da norma-2 e corresponde e ao seu valor singular mximo a
13

3. Estabilidade e Desempenho

61

3.6

Notas e Referncias e

Estabilidade
A condio de estabilidade quadrtica (3.23) pode ser caracterizada na sua forma ca a dual. Com este objetivo, considere a seguinte funao de Lyapunov V (x) = x P 1 x. c Pr- e ps-multiplicando a LMI (3.23) por P 1 leva a seguinte expresso: e o a Q > 0 : A(t)Q + QA(t) < 0 onde Q = P 1 .

Estabilidade-D
Existem outras formas para representar-se sub-regies do plano complexo como a o classe de regies polinomiais proposta em (Gutman and Jury, 1981) e denida a seguir: o i j aij s (s ) < 0 , D= sC:
0(i,j)nd

onde os coecientes aij so reais satisfazendo aij = aji . Entretanto a classe acima a denida no sucientemente genrica para representar todas as regies normalmente a e e o utilizadas em situaoes prticas, alm de no ser adequada para a s c a e a ntese de controladores com alocaao de plos (Chilali and Gahinet, 1996). c o Recentemente em (Peaucelle, 2000) foi proposta uma extenso das regies LMIs dea o nominada de regies EMI, na qual obtm-se uma caracterizao compacta do resultado o e ca apresentado no Teorema 3.4.

Norma H2
Uma outra interpretao para a norma H2 pode ser obtida no contexto estocstico, ca a onde considera-se um sistema sujeito a uma entrada com sinal ru branco (Colaneri do et al., 1997). Por exemplo, seja a entrada do sistema (3.80) um sinal ru branco com do mdia nula e varincia E[w(t)w (t)] = Inw . O valor mdio quadrtico da potncia do e a e a e sinal de sa dada por: da e

E[y (t)y(t)] = tr Bw

(eA t Cz Inw Cz eAt )dt Bw

= tr{Bw Po Bw } = Hwz (s)

2 2

onde P0 a soluo da equao (3.94). De maneira similar a anlise acima, a norma e ca ca a H2 tambm pode ser vista como o custo quadrtico de um sistema autnomo onde e a o a condiao inicial x(0) = x0 uma varivel aleatria com mdia zero e varincia c e a o e a E[x0 x0 ] = Bw Bw . Para demonstrar esta interpretao, considere o sistema (3.80) com ca nz = nw = 1, w(t) 0, x(0) = x0 , isto , e x = Ax, x(0) = x0 z = Cx (3.122)

62 e a seguinte funao custo: c J =E


0

3. Estabilidade e Desempenho

z (t)z(t)dt

Sabe-se da teoria de controle, veja por exemplo (Zhou, 1998, Cap tulo 13), que:
0

z (t)z(t)dt x0 Po x0

Portanto, a funo custo J pode ser reescrita da seguinte maneira: ca J E[x0 Po x0 ] = Bw Po Bw = Hwz (s)
2 2

Este resultado pode ser estendido para sistemas MIMO redenindo a funo custo da ca seguinte forma:
nz 0

J=
i=1

E[zi (t)zi (t)]dt,

(3.123)

onde zi (t) a resposta de (3.80) para a condiao inicial x0i , onde E[x0i x0i ] = Bwi Bwi . e c Quando as matrizes Bw , Cz possuem elementos incertos os limitantes em (3.107) no podem ser calculados diretamente via LMIs pois as expresses Bw () P Bw () a o e Cz ()SCz () deixam de ser ans nos parmetros incertos . Nos casos onde a Bw (), Cz () so ans em o seguinte artif pode ser utilizado. Seja N uma maa cio triz tal que N > Bw () P Bw () e note que isto implica tr{Bw () P Bw ()} < tr{N }. Logo, devido ` (3.107) conclu a mos que a matriz N dene um limitante para a norma desejada, j que Hwz (s, ) 2 < tr{N }. Para obter a matriz N via LMI basta aplicar a 2 o complemento de Schur na desigualdade acima o que nos leva ` a N Bw () P P Bw () P >0

Um procedimento anlogo se aplica para Cz ()SCz () . a Quando o sistema varia no tempo o gramiano utilizado nas seoes anteriores prec cisa ser redenido. A expresso do gramiano nesses casos do tipo (3.9) e pode ser a e encontrada em (Greeen and Limebeer, 1995).

Norma H
A inequao de Lyapunov em (3.116) utilizada na determinao de um limitante ca ca superior da norma H implica, caso ela seja satisfeita, que o sistema estvel no sentido e a entrada-sa com ganho-L2 nito conforme a deniao proposta em (Khalil, 1996, da c Cap tulo 6).

3.7

Exerc cios Propostos

o vel E 1.1 Determine numericamente a estabilidade assinttica e quando poss as normas H2 e H dos seguintes sistemas:

3. Estabilidade e Desempenho x1 x2 (a) z1 z2 x1 x2 (b) z x1 x2 x3 (c) x4 z1 z2 = = = = 2x1 w 3x2 + 2w x1 x 1 + x2

63

= x2 = x1 2x2 + w = x1 + w = = = = = = x3 x4 x1 + x2 0.2x3 + 0.2x4 + w1 0.5x1 2.5x2 + 0.1x3 0.15x4 + 0.5w2 x1 x2

e a a E 1.2 Determine se o sistema (3.74) D-estvel considerando a regio na Figura 3.3(c) com = 62.5o . E 1.3 Mostre que para um sistema MIMO com condiao inicial c
nz

x0R =
i=1

x0i

onde cada x0i uma varivel aleatria com mdia zero e varincia e a o e a E[x0i x0i ] = Bwi Bwi a funo custo quadrtico J denida em (3.123) satisfaz ca a J tr{Bw Po Bw ), onde Po a soluao do gramiano de observabilidade e Bw = [Bwi Bwnz ]. e c

64

3. Estabilidade e Desempenho

Cap tulo 4 Controle via Realimentao de ca Estados


O projeto de controladores para sistemas dinmicos visa estabilizar o sistema em a malha fechada e, em geral, deve-se satisfazer restries adicionais como, por exemplo, co resposta transitria, rejeiao de perturbaoes e limitaes no sinal de controle. Poo c c co demos classicar as estruturas de controle de acordo com o tipo de informao que ca e injetado no controlador. Quando o sinal de controle constru com informaoes dos e do c medidores de todas as variveis de estado dizemos que o controle de realimentao de a e ca estados. Quando o sinal de controle constru com informaoes dos medidores de um e do c subconjunto das variveis de estado, que chamaremos de variveis de sa a a da, dizemos que o controle de realimentaao de sa e c da. Como na grande maioria dos casos no a poss (ou economicamente invivel) medir todas as variveis de estados, a realie vel a a mentaao de sa a soluao mais comum na prtica. No entanto a realimentaao de c da e c a c estados possui propriedades importantes e, alm disso, veremos nos prximos cap e o tulos que podemos construir um controlador de sa a partir da realimentaao de estada c dos simplesmente estimando as variveis de estado para as quais no temos medidores a a dispon veis. Neste cap tulo estudaremos vrias tcnicas de projeto de realimentao de estados. a e ca Para precisar o problema que gostar amos de resolver, considere o seguinte sistema linear: x(t) = Ax(t) + Bu u(t) (4.1) onde x(t) Rn representa o vetor de estados, u(t) Rnu o sinal de controle, A, Bu so a matrizes constantes com dimenses apropriadas. o S uponha que dispomos de medidores para todas as variveis de estado. Gostar a amos de determinar uma lei de controle do tipo u(t) = Kx(t) onde K Rnu n a matriz e de ganhos de realimentao a ser determinada de tal forma que o sistema em malha ca fechada satisfaa os seguintes requisitos: (i) o regime permanente seja atingido, isto o c e sistema seja exponencialmente estvel e (ii) que a resposta transitria satisfaa certos a o c critrios de desempenho desejados. e Observe que a todo instante de tempo o valor das variveis de estado x(t) est a a dispon na sa dos medidores e portanto o sinal de controle u(t) = Kx(t) pode ser vel da aplicado instantaneamente nos atuadores do sistema. Por exemplo, para um sistema que possui dois atuadores com sinais de controle u1 e u2 e quatro estados com valores

66 medidos x1 , x2 , x3 , x4 , ter amos

4. Controle via Realimentao de Estados ca

u1 = k11 x1 + k12 x2 + k13 x3 + k14 x4 u2 = k21 x1 + k22 x2 + k23 x3 + k24 x4 onde as constantes kij so os ganhos de realimentaao a serem determinados. Na forma a c matricial u(t) = Kx(t) as expresses acima se tornam o x1 (t) u1 (t) k11 k12 k13 k14 x2 (t) = u2 (t) k21 k22 k23 k24 x3 (t) x4 (t) Observe que o sinal da realimentaao est atrelado aos ganhos kij a serem determinados. c a Observe ainda que o sistema (4.1) em malha fechada com a lei de controle u(t) = Kx(t) dado por e x(t) = (A + Bu K) x(t) (4.2) e para que ele seja exponencialmente estvel todos os autovalores da matriz (A + a Bu K) devem estar no semi-plano complexo esquerdo estrito, isto devem ter parte e real estritamente negativa. Nas seoes seguintes apresentamos vrios mtodos para determinao da matriz de c a e ca ganhos K que estabiliza o sistema em malha fechada e que atende a um conjunto de critrios de desempenho que desejamos satisfazer. e

4.1

Alocao de plos: abordagem clssica ca o a

Queremos nesta seao desenvolver mtodos de projeto para a determinao da mac e ca triz de ganhos K da realimentaao de estados u(t) = Kx(t) de tal forma que os plos c o do sistema realimentado (4.2) estejam localizados em posies do plano complexo que co podem ser arbitrariamente escolhidas pelo projetista. A motivao para resolver o problema acima, conhecido como alocaao de plos, ca c o vem do fato de que a localizaao dos plos de malha fechada dene a estabilidade c o e est fortemente ligada ao comportamento transitrio do sistema. Assim, basta o a o projetista escolher adequadamente a localizao dos plos de malha fechada que o ca o sistema de controle ir funcionar como desejado tanto em regime permanente como a durante o transitrio. Observe entretanto que o transitrio depende tambm dos zeros o o e do sistema e no apenas dos plos. Para acomodar a inuncia dos zeros, o projeto a o e de alocao de plos feito tipicamente de forma iterativa at que os requisitos de ca o e e resposta durante o transitrio sejam atingidos nas simulaoes. o c Para que possamos projetar os ganhos de realimentaao de forma a atingir o desemc penho desejado (a ser denido pelo projetista atravs da escolha dos plos de malha e o fechada) o sistema de malha aberta precisa apresentar uma propriedade que foi denominada controlabilidade por Kalman em 1960 (T.Kailath, 1980). e a Denio 4.1 (Controlabilidade) Um sistema controlvel num instante t0 se ca for possvel, por meio de um vetor de controle sem restries em seus elementos, trans co ferir o sistema de qualquer estado inicial x(t0 ) para qualquer outro estado em um intervalo nito de tempo.

4. Controle via Realimentao de Estados ca

67

A controlabilidade do sistema (4.1) pode ser testada vericando se o posto da matriz de controlabilidade Uc abaixo igual ` dimenso do vetor de estado do sistema. e a a Uc = Bu ABu . . . An1 Bu (4.3)

Quando o sistema de malha aberta controlvel podemos escolher a localizaao e a c dos plos de malha fechada de forma arbitrria que sempre podemos encontrar uma o a realimentaao de estados que modica os plos da forma desejada. O projeto dos c o ganhos de realimentaao bastante simples no caso de sistemas com uma entrada, c e uma sa (SISO) e referncia nula que apresentamos a seguir. O caso de sistemas com da e mais de uma entrada e sa (MIMO) e referncia no nula sero tratados na sequncia. da e a a e

4.1.1

Referncia nula: regulao e ca

Perturbaes esto presentes em todo sistema de controle e ao ocorrer elas foram co a c o sistema a sair do ponto de operao desejado. Um ponto de equil ca brio assintoticae mente estvel se as variveis de estado retornam assintoticamente ao ponto de equil a a brio depois de cessarem as perturbaoes. Para garantir a estabilidade de um certo ponto c de equil brio, tipicamente linearizamos o sistema em torno do ponto de equil brio dese importante jado e projetamos um controlador para estabilizar o sistema linearizado. E lembrar que se (x, u) representam o estado e controle do sistema linearizado e (h, v) o estado e controle do sistema no linear ento temos as relaoes x = h h e u = v v , a a c isto , o modelo linear descreve na realidade as variaoes do estado (h) e do controle e c (v) do sistema f sico no entorno do ponto de equil brio desejado (h, v ). Assim um controlador projetado para que o estado linear convirja para zero tambm faz com que o e estado do sistema f sico convirja para o ponto de equil brio desejado. O problema de determinar um controlador para que o estado do sistema linear convirja para zero e chamado de regulaao e pode ser interpretado como um problema de controle onde a c referncia nula. Este problema que iremos estudar nesta seao. Comearemos com e e e c c o caso de sistema SISO e na sequncia veremos o caso MIMO. e Mtodo para sistemas SISO: u R e Para o sistema da equaao (4.1) com u R, seja uma mudana de coordenadas c c T z(t) = x(t) tal que o sistema transformado se encontre na forma cannica de controo labilidade, ou seja: z(t) = Ac z(t) + Bc u(t) 1 Ac = T AT = 0 0 . . . 1 0 . . . 0 1 . . . .. . 0 0 . . . (4.4)

0 0 0 1 an an1 an2 a1

68 Bc = T
1

4. Controle via Realimentao de Estados ca 0 . . . 0 1 , Vc = Uc =


n1 Bc Ac Bc . . . Ac Bc Bu ABu . . . An1 Bu T = Uc Vc1

Bu =

onde det(sI A) = sn + a1 sn1 + + an = 0 o polinmio caracter e o stico de malha 1 aberta do sistema SISO em questo . a Supondo que os medidores nos fornecem em tempo real o vetor de estados x(t), ento conseguimos tambm obter o vetor de estados transformados z(t). Logo, podemos a e implementar a seguinte lei de controle: u(t) = Kc z(t), Kc = kn kn1 k1 (4.5)

O problema que devemos resolver agora encontrar Kc de forma que o sistema em e malha fechada dado por: z(t) = Ac z(t) + Bc u(t) = (Ac Bc Kc )z(t) seja estvel. a Ora, a matriz Ac Bc Kc est na forma companheira: a 0 1 0 0 0 0 1 0 . . . . .. . . . . . . . . . 0 0 0 1 an kn an1 kn1 an2 kn2 a1 k1 (4.6)

(4.7)

det(sI (Ac Bc Kc )) = sn + (a1 + k1 )sn1 + + an + kn = 0

(4.8)

Como desejamos que, em malha fechada, o sistema seja estvel e, ainda, atinja a certas especicaoes de desempenho, queremos que os autovalores de malha fechada c satisfaam uma dada equaao caracter c c stica: sn + 1 sn1 + + n = 0 Assim, das equaes (4.8) e (4.9), temos que: co ai + ki = i , i = 1, . . . , n (4.10) (4.9)

Ou seja, o vetor de ganhos para o sistema na forma cannica controlvel : o a e Kc = n an 1 a1

Notemos, no entanto, que a lei de controle ser implementada para o sistema oria ginal, e no para o sistema transformado. Como u(t) = Kc z(t) = Kx(t), temos a que: 1 K = Kc T 1 = n an 1 a1 Vc Uc
Para obter a relao T = Uc Vc1 basta substituir Ac = T 1 AT e Bc = T 1 Bu em Vc que resulta ca Vc = T 1 Uc .
1

4. Controle via Realimentao de Estados ca

69

E importante notar que para que possamos calcular a matriz de ganhos acima, que aloca os plos nas posies desejadas, preciso que a matriz Uc seja invers e isto o co e vel ocorre se e somente se o sistema for controlvel. Apesar da frmula acima ser vlida a o a apenas para sistemas SISO, a controlabilidade ainda requisito necessrio e suciente e a para alocaao de plos no caso MIMO tratado a seguir. c o Mtodo para sistemas MIMO: e Consideremos agora o sistema em malha fechada: x(t) = Ax(t) + Bu u, u = Kx x Rn u Rr (4.11)

ou seja, x(t) = (A Bu K)x(t). Queremos encontrar a matriz de ganhos K de tal forma que os autovalores de (A Bu K) sejam {1 , . . . , n }. Para isso, devemos ter: (A Bu K)vi = i vi (4.12)

sendo i autovalores e vi seus respectivos autovetores. Podemos reescrever a condio ca acima na forma: vi Kvi

(A i I)vi Bu Kvi =

A i I Bu

=0

(4.13)

Observe que todos os elementos da matriz A i I Bu so conhecidos e desejaa mos encontrar vi , K que satisfazem a relaao acima. Lembrando que espao nulo de c c uma dada matriz M o conjunto de todos os vetores g = 0 que satisfazem M g = 0, o e vi problema a ser resolvido consiste em encontrar vi , K tal que o vetor pertena c Kvi ao espao nulo da matriz A i I Bu para todo i = 1, . . . , n. c Este problema pode ser facilmente resolvido pois a base Qi do espao nulo2 da c matriz A i I Bu pode ser facilmente determinada. Assim, qualquer vetor gi obtido atravs da relao e ca gi = Qi fi (4.14) um elemento do espao nulo de A i I Bu . O vetor fi pode ser arbitrariae c mente escolhido3 e representa uma combinao linear dos vetores da base, ou seja das ca colunas da matriz Qi . Assim temos A i I Bu gi = 0

Fazendo esta operao para todo i = 1, . . . , n, obtemos a igualdade: ca g1


2

gn

v1 Kv1

vn Kvn

R(n+r)n

A matriz Qi tem em suas colunas os vetores qi que formam uma base do espao nulo de c A i I Bu . 3 O nmero de elementos do vetor fi igual ao nmero de colunas da matriz Qi . u e u

70 Se particionarmos a matriz obtemos: g1 gn G= = V G = g1 v1 Kv1 Kvn =K gn

4. Controle via Realimentao de Estados ca de acordo com os vetores vi e Kvi , Rnn

vn Kvn v1

V = vn

v1

vn

Kv1

= KV Rrn

Supondo V invers podemos obter a matriz de ganhos atravs da relaao K = GV 1 . vel e c Para que o mtodo acima funcione a matriz V deve ser invers e vel. Se o sistema for controlvel sempre podemos escolher vetores fi em (4.14) tais que V seja invers a vel. Por exemplo podemos escolher fi de forma aleatria ou ainda um vetor onde todas as o componentes so unitrias. a a Note que nas expresses acima ca impl o cito que os autovalores desejados i devem ser reais e distintos. Existem variaoes deste mtodo que permitem i complexos ou c e ainda reais repetidos. No Matlab podemos determinar a matriz de ganhos usando o comando place que funciona para plos reais ou complexos, repetidos ou no, e utiliza o a uma escolha dos vetores fi j otimizada. Ver referncias no manual do Matlab. a e Exemplo 4.1 Seja o sistema x = Ax + Bu u, com u = Kx, A = Bu = 0 1 0 0 e

0 . Queremos que os plos de malha fechada do sistema sejam {1, 2}. o 1 Calcularemos a matriz de ganho usando os mtodos SISO e MIMO. e

Pelo mtodo para sistemas SISO: e

Equao caracterstica desejada: ca (s + 1)(s + 2) = s2 + 3s + 2 = 0 Equao caracterstica de malha aberta: ca det(sI A) = s 1 0 s = s2 a1 = 0 a2 = 0 1 = 3 2 = 2

Usando o mtodo visto anteriormente, temos: e K= 2 a2 1 a1 T 1 = 2 3 ,

com T = I, pois o sistema j est na forma cannica de controlabilidade. a a o Pelo mtodo para sistemas MIMO: e i 1 0 0 i 1

A i I Bu

gi =

gi = 0

4. Controle via Realimentao de Estados ca

71

Os autovetores associados aos autovalores 1 = 1 e 2 = 2 so g1 = a 1 1 1 e g2 = 1 2 4 . Desta forma, temos: 1 1 V g1 g2 = 1 2 = G 1 4 Assim, K = GV 1 = 2 3

4.1.2

Referncia constante: rastreamento e

Outro problema importante na rea de controle consiste em projetar controladores a para que algumas variveis importantes do sistema sejam mantidas em n a veis constantes, mesmo na presena de distrbios no sistema. Este problema conhecido como c u e rastreamento e pode ser visto como um problema de controle onde a referncia conse e tante. Apresentaremos duas soluoes para esse problema. Uma baseada na correao c c do ganho esttico do sistema e outra baseada na introduao de integradores. a c Rastreamento com correo de ganho esttico ca a Seja o sistema x(t) = Ax(t) + B(u(t) + r(t)) y(t) = Cx(t) + Dr(t) u(t) = Kx(t) (4.15) (4.16) (4.17)

onde x Rn o estado; y, r, u Rm so os sinais de medida, referncia e controle, e a e respectivamente; K Rmn a matriz de ganhos de realimentaao de estados que deve e c ser determinada de tal forma que o sistema em malha fechada seja estvel, isto , os a e autovalores da matriz A BK devem estar no semi-plano complexo esquerdo. Como
z r + + u K x = Ax + B(u + r) x C y

Figura 4.1: Rastreamento com correao de ganho esttico. c a no projeto da matriz de realimentao de estados K dicilmente conseguimos levar em ca consideraao o requisito de erro nulo de regime permanente, vamos introduzir um novo c sinal de referncia z(t) Rm dado por r(t) = F z(t) onde F Rmm uma matriz e e de ganhos, cujo papel corrigir o ganho esttico do sistema de tal forma que o erro e a

72

4. Controle via Realimentao de Estados ca

de regime permanente entre z(t) e y(t) seja nulo. As equaes de estado e matriz de co transferncia para o sistema em malha fechada so indicadas a seguir. e a x(t) = Ax(t) + B(u(t) + r(t)) = (A BK)x(t) + Br(t) y(t) = Cx(t) + Dr(t) Y (s) = G(s)R(s) G(s) = C(sI (A BK))1 B + D R(s) = F Z(s) Supondo que G(s) seja estvel, a resposta em regime permanente para referncias do a e z F r G(s) y (4.18)

Figura 4.2: Diagrama para ajuste do ganho esttico. a tipo degrau pode ser obtida pelo teorema do valor nal:
t

lim (z(t) y(t)) = lim s(Z(s) Y (s)) = lim s(I G(s)F )Z(s)
s0 s0

Como Z(s) = 1 v, onde v um vetor contendo as amplitudes dos degraus de ree s ferncia, e a condio (I G(0)F )v = 0 deve ser satisfeita quaisquer que sejam as e ca amplitudes dos degraus no vetor v, devemos ter a relao G(0)F = I, ou seja, o ganho ca esttico entre Z(s) e Y (s) deve ser unitrio. Logo, o ajuste a ser feito a a e F = G(0)1 Devido ` sua simplicidade esse esquema no garante erro de regime permanente nulo a a para perturbaes nos atuadores (sinal de controle) e medidores (sinal de mediao) e co c tambm no robusto em face ` mudanas no ponto de operaao do sistema f e a e a c c sico (no a linear). Rastreamento com integradores Uma forma alternativa de um esquema de controle para seguimento de referncia e com erro de regime nulo consiste na utilizao de integradores como ilustra a gura ca 4.3. As equaoes de estado associadas ao diagrama da gura 4.3 so c a x(t) = Ax(t) + Bu(t) = Ax(t) B(Ke x(t) + Ki (t)) (t) = r(t) y(t) = r(t) Cx(t) onde x o estado do sistema, o estado dos integradores e queremos determinar os e ganhos Ki , Ke dos integradores e da realimentaao de estados, respectivamente, de tal c forma a ter erro nulo em regime permanente da referncia r para a sa y. e da

4. Controle via Realimentao de Estados ca


73

1 s

Ki

x = Ax + Bu

Ke

Figura 4.3: Rastreamento com integradores. As equaes de estado podem ser colocadas numa forma mais compacta indicada a co seguir. x
xa

A 0 C 0
Aa

B 0
Ba

Ke Ki
Ka

x
xa

0 I
Ea

Nessa representaao o problema a ser resolvido consiste em se determinar a matriz Ka c de tal forma que o sistema xa = (Aa Ba Ka )xa + Ea r seja estvel. A matriz Ka pode ser determinada, por exemplo, com as tcnicas de a e projeto de realimentao de estados j estudadas na seao 4.1.1. Neste caso podemos ca a c escolher os autovalores da matrix Aa Ba Ka desde que o par (Aa , Ba ) seja controlvel. a Quando isso ocorre, o sistema de malha fechada ser estvel e o estado xa no regime a a estacionrio pode ser determinado atravs da expresso a e a 0 = (Aa Ba Ka )a + Ea r x xa = (Aa Ba Ka )1 Ea r O controle em regime dado por e u = Ka xa = Ka (Aa Ba Ka )1 Ea r Note ainda que em regime = 0, logo r = y indicando que o erro de rastreamento nulo em regime permanente. e Esse esquema de rastreamento robusto em relaao ` mudanas no ponto de e c a c operao do sistema no linear e garante erro nulo para distrbios constantes nos ca a u atuadores, porm no nos medidores. e a Exerc cio 4.1 Considere o sistema descrito em (Johansson, 2000). Vericar o erro de regime permanente para degraus de referncia utilizando o ponto de equil e brio G+ (s). Projetar um ajuste de ganho esttico para o sistema de malha aberta (u = 0), isto a e sem realimentao de estado, e vericar o erro de regime para: ca

74 Sistema linear; Sistema no-linear; a

4. Controle via Realimentao de Estados ca

Explicar porque o no-linear no possui erro nulo. a a Exerc cio 4.2 Para o mesmo sistema do exerccio anterior, projetar um esquema de rastreamento com integrador para se ter erro nulo em regime. Vericar que o erro nulo no sistema linear e no no-linear. Verique atravs de simulaes qual dos e a e co esquemas garante erro nulo para perturbaes constantes no sinal de sa (medidores) co da e no sinal de controle (atuadores).

4.2

Alocao de plos via LMIs ca o

Na seao anterior apresentamos os mtodos clssicos para determinao da matriz c e a ca de ganhos de realimentao de estados de tal forma que os plos do sistema de malha ca o fechada estejam localizados em pontos do plano complexo previamente escolhidos pelo projetista, i.e. sejam as ra zes do polinmio caracter o stico desejado. Agora, ao invs e de escolher a localizao precisa dos plos, apresentaremos uma forma mais ex de ca o vel projeto onde os plos de malha fechada podem se encontrar em qualquer ponto deno tro de uma regio especicada pelo projetista. A motivaao para isso so inmeras, a c a u mas poder amos destacar trs principais. Primeiro, que em geral o projetista deve e e procurar satisfazer vrios critrios de desempenho desejados para sistema, porm cada a e e critrio est associado ` uma localizaao diferente dos plos. Como tipicamente exise a a c o tem vrias localizaes poss a co veis dos plos que levam um dado critrio de desempenho o e a ser satisfeito, seria interessante usar como critrio de projeto uma regio onde vrios e a a critrios de desempenho desejados estariam satisfeitos. Segundo, que a escolha da e e localizao dos plos de malha fechada tem implicaes na magnitude do sinal de conca o co trole. Como em geral o sinal de controle no pode exceder certos limites de magnitude, a sob a pena de saturar os atuadores do sistema, seria interessante ter a exibilidade de poder escolher, dentro na regio onde os critrios de desempenho esto satisfeia e a tos, uma localizaao dos plos que evite a saturao. A terceira que para sistemas c o ca e incertos a metodologia clssica apresentada na seo anterior no pode ser aplicada a ca a pois a localizaao dos plos de malha fechada mudam de acordo com os valores dos c o parmetros incertos. Novamente a idia de connar os plos numa regio desejada se a e o a mostra interessante. A primeira regio desejada com a qual trabalharemos o semi-plano complexo a e esquerdo estrito onde o unico critrio de desempenho que estaremos considerando e e a estabilidade exponencial do sistema em malha fechada. Este o assunto tratado a e seguir.

4.2.1

Estabilizao ca

Podemos precisar o problema a ser resolvido nesta seo da seguinte forma. ca Suponha que dispomos de medidores para todas as variveis de estado. Gostar a amos de determinar uma lei de controle do tipo u(t) = Kx(t) onde K Rnu n a matriz e

4. Controle via Realimentao de Estados ca

75

de ganhos de realimentao a ser determinada de tal forma que o sistema em malha ca fechada seja exponencialmente estvel. Note que no desejamos escolher a posio a a ca precisa dos plos mas simplesmente que eles estejam em qualquer lugar do semi-plano o esquerdo estrito. Vimos na seao anterior que quando o sistema controlvel podemos determinar c e a uma lei de controle tal que a localizaao dos plos da malha fechada possa ser arbitrac o riamente escolhida. Quando o sistema no controlvel mas os modos no controlveis a e a a a so estveis ainda assim podemos determinar uma lei de controle que torne o sistema a a exponencialmente estvel em malha fechada. Essa idia nos leva ` seguinte denio: a e a ca Denio 4.2 (Estabilizabilidade) O sistema linear invariante (4.1) estabica e lizvel se os modos no controlveis (quando existirem) so estveis. a a a a a A controlabilidade de um sistema pode ser facilmente testada atravs do posto da e matriz de controlabilidade. Porm como saber se os modos no controlveis, quando e a a existirem, so estveis? Na abordagem clssica isso pode ser testado com o aux a a a lio de formas cannicas (T.Kailath, 1980), mas este mtodo se torna invivel no caso de o e a sistemas incertos. O resultado apresentado a seguir baseado em LMIs e pode ser e facilmente estendido para sistemas incertos. Teorema 4.1 O sistema (4.1) estabilizvel se e somente se existem matrizes S e a Rnn positiva denida e L Rnu n tais que a seguinte LMI seja fact vel. AS + SA + Bu L + L Bu < 0 , S>0 (4.19)

Prova: (Necessidade:) Se o sistema estabilizvel ento todas as trajetrias x(t) no e a a o a controlveis, i.e. no afetadas pelo sinal de controle, so estveis. Assim, para todas a a a a essas trajetrias podemos encontrar uma funo v(x(t)) = x(t) P x(t) positiva denida o ca tal que sua derivada para essas trajetrias satisfaa o c v(x(t)) = x(t) P x(t)+x(t) P x(t) = (Ax(t)+Bu u(t)) P x(t)+x(t) P (Ax(t)+Bu u(t)) < 0 (4.20) 1 Dena z(t) = P x(t) e S = P e note que S > 0. Com isso podemos reescrever a expresso acima como a v(x(t)) = z(t) (AS + SA )z(t) + z(t) Bu u(t) + u(t) Bu z(t) < 0 , z(t) = P x(t)

As trajetrias guiadas pelos modos no controlveis so aquelas cuja dinmica no o a a a a a depende do sinal de controle e para elas v(x(t)) tambm no depende do sinal de e a a c controle u(t). Para isso devemos ter Bu z(t) = 0, t 0 que nos leva ` condiao ca z(t) (AS + SA )z(t) < 0, z(t) : Bu z(t) = 0, t 0. Pelo lema de Finsler (veja seo 3.2.8) esta condiao equivalente ` (4.19). c e a (Sucincia:) Se (4.19) est satisfeita dena K = LS 1 . Logo temos (A + Bu K)S + e a S(A+Bu K) < 0 ou seja P (A+Bu K)+(A+Bu K) P < 0. Como P > 0 conclu mos que o sistema em malha fechada exponencialmente estvel e portanto todos os modos de e a malha fechada so estveis. Se existem modos no controlveis eles tambm so modos a a a a e a da malha fechada e portanto tambm so estveis. Logo o sistema estabilizvel. e a a e a 2 Da prova deste teorema podemos enunciar o seguinte resultado:

76

4. Controle via Realimentao de Estados ca

Corolrio 4.1 Existe uma realimentao de estados u(t) = Kx(t) que torna o sistema a ca (4.1) exponencialmente estvel com esta realimentao se e somente se o sistema (4.1) a ca for estabilizvel. Alm disso, toda realimentao de estados u(t) = Kx(t) estabilizante a e ca 1 pode ser decomposta como K = LS onde L, S uma das solues de (4.19). e co 2 Para ilustrar os resultados acima, considere o seguinte exemplo. Exemplo 4.2 Considere o seguinte sistema multivarivel: a 0 0 x1 x1 0 1 0 x2 = 0 0 1 x2 + 0 1 1 0 1 2 1 x3 x3 Aplicando o Teorema 4.1, obtm-se os seguintes resultados e -->[S,L]=stab(); Construction of canonical representation Basis Construction WARNING: rank deficient problem FEASIBILITY PHASE. primal obj. dual obj. dual. gap 4.19e+00 -1.95e+03 1.96e+03 -1.78e+03 -1.93e+03 1.54e+02 Target value reached feasible solution found -->S S = ! 2823.463 - 930.10203 0. ! ! - 930.10203 2823.463 0. ! ! 0. 0. 1977.8668 ! -->L L = ! 4684.0357 - 8554.9861 988.9811 ! ! - 2821.042 989.12222 0. ! -->K=L*S^(-1) K = ! 0.7412833 - 2.7857695 0.5000241 ! ! - 1.2502147 - 0.7621667 0. ! A Figura 4.4 mostra as trajetrias do sistema em malha fechada (com u(t) = Kx(t)) o para uma condio inicial x(0) = [ 2 1 1 ] . ca Observa-se no exemplo acima que a resposta no tempo do sistema em malha fechada bastante oscilatria com uma convergncia lenta para o ponto de equil e o e brio. Pode-se melhorar consideravelmente a resposta do sistema em malha fechada impondo restries co adicionais na lei de controle visando atender a algum critrio de desempenho, como e apresentado nas prximas sees deste cap o co tulo. u1 u2

(4.21)

4. Controle via Realimentao de Estados ca


3

77

x1

x3

PSfrag replacements x1 (t) x2 (t) x3 (t)3 t(s)

x2 t(s)
0 5 10

Figura 4.4: Trajetrias do sistema (4.21) em malha fechada. o

4.2.2

Alocao de plos via D-Estabilidade ca o

Estabilidade um requisito fundamental de um sistema de controle mas no garante e a um bom desempenho da resposta transitria do sistema. Existem sub-regies do semio o plano complexo esquerdo que alm da estabilidade nos d garantia de bom desempenho e a transitrio. Nesta seo apresentamos mtodos de projeto de uma realimentaao de o ca e c estados que nos oferece garantia de que os plos do sistema de malha fechada estaro o a numa dada regio escolhida pelo projetista. a Como ponto de partida considere a forma dual do Teorema 3.4, isto 4 : e Q > 0 : L Q + M (AQ) + M (QA ) < 0 (4.22)

A formulaao acima para a estabilidade-D permite a proposio do seguinte resulc ca tado. Teorema 4.2 Considere o sistema (4.1) e uma regio LMI D contida em C . Supoa nha que as matrizes Q e Y de dimenses apropriadas sejam uma soluo do seguinte o ca problema LMI: Y, Q > 0 : L Q + M (AQ + Bu Y ) + M (QA + Y Bu ) < 0
4

(4.23)

Como os autovalores da matriz A so os mesmos de A , o problema de alocao de plos ser a ca o a denido aqui nesta seo em termos do sistema dual onde substitu ca mos A, M por A , M nas condies co originais.

78

4. Controle via Realimentao de Estados ca

Ento, o sistema (4.1) com K = Y Q1 D-estvel. Em outras palavras: a e a i (A + Bu Y Q1 ) D C , i = 1, . . . , n. Exemplo 4.3 Considere o sistema (4.21) e a regio LMI denida na Figura 3.3(b) a com raio 2 e centro em (5, 0). Para esta regio a condio (4.23) equivalente ao a ca e seguinte problema LMI: Y, Q > 0 : 2Q (5Q + AQ + Bu Y ) (5Q + QA + Y Bu ) 2Q <0

Aplicando o LMITOOL do Scilab, obtm-se o seguinte resultado: e -->Q Q = ! 422.26907 ! - 1682.5827 ! - 11.057118 -->Y Y = ! 3797.1628 ! 6445.6822 -->K=Y*Q^(-1) K = ! .4549008 ! - 21.636907

- 1682.5827 7704.8599 - 4.4526817

- 11.057118 ! - 4.4526817 ! 6029.5974 !

- 17054.426 - 34895.535

- 23997.794 ! - 5492.0118 !

- 2.1164231 - 9.2546374

- 3.9807281 ! - .9573544 !

Note que os plos em malha fechada para a matriz de controle acima denida so o a dados por: 1,2 = 4.6294267 0.4778254j e 3 = 4.9765121. A Figura 4.5 mostra a resposta transitria do sistema em malha fechada para a o mesma condio inicial utilizada no Exemplo 4.3, isto , x(0) = [ 2 1 1 ] . ca e Analisando as Figuras 4.4 e 4.5, observa-se que ocorreu uma melhora signicativa no tempo de resposta do sistema em malha fechada com a restriao adicional da alocaao c c de plos. No entanto, a trajetria do estado x2 (t) apresenta um elevado sobre-sinal o o negativo devido a uma inadequada escolha da regio D. A escolha ideal desta regio a a pode ser analiticamente determinada somente para sistemas de segunda ordem levandose em conta os valores desejados para o tempo de estabilizaao, sobre-sinal, freqncia c ue de amortecimento, etc. Outro fator agravante no posicionamento de plos a tendncia o e e de produzir elevados sinais de controle, o que em situaoes prticas pouco desejado. c a e A Figura 4.6 mostra os sinais de controle u1 (t) e u2 (t) para o sistema em malha fechada no Exemplo 4.3 exemplicando uma elevada atuaao do sinal de controle. c

4. Controle via Realimentao de Estados ca


4

79

x1

x3

PSfrag replacements x1 (t) x2 (t) x3 (t)4 t(s)

x2

t(s)
1 2

Figura 4.5: Trajetrias do sistema (4.21) em malha fechada com alocao de plos. o ca o

4.3

Controle LQR

Os mtodos de projeto estudados nas sees anteriores esto baseados na localizaao e co a c dos plos que xada pelo projetista. Em muitos casos no entanto o desempenho o e da resposta do sistema fortemente degradado pela presena de zeros na funao de e c c transferncia. Nesses casos uma escolha adequada dos plos de malha fechada no e o a e trivial. O mtodo que veremos nesta seao cou conhecido na literatura com regulador e c linear-quadrtico(LQR) pois ao invs de utilizar a localizaao dos plos como critrio a e c o e de projeto, o LQR est baseado na minimizaao de um critrio quadrtico que est a c e a a associado ` energia das variveis de estado e dos sinais de controle a serem projetados. a a A energia de um sinal escalar s(t) : [0, ) R denida por e
0

s(t)2 dt

Se s(t) a tenso aplicada num resistor unitrio a integral acima expressa a energia e a a dissipada nesse resistor por esse sinal. Deni-se L2 o espao dos sinais que possuem c energia nita. A energia de um sinal vetorial x(t) : [0, ) Rn denida por e
0 n

xi (t)2 dt =
i=1 0

x(t) x(t) dt

80
60

4. Controle via Realimentao de Estados ca

u1
0

u2

Sfrag replacements u1 (t) u2 (t) 60 t(s)

t(s)
0 1 2

Figura 4.6: Sinais de controle para o sistema (4.21) em malha fechada com alocao ca de plos. o e corresponde ` soma das energias de cada componente xi (t) do sinal x(t). Assim a quanto maior a amplitude e duraao do sinal no tempo, maior ser sua energia. c a Considere o sistema de controle x(t) = Ax(t) + Bu u(t) x(0) = x0 (4.24)

onde x(t) Rn o estado e u(t) Rnu o controle. Baseado nas interpretaoes acima e e c podemos armar que quanto maior for a energia do estado t=0 x(t) x(t) dt mais oscilatrio e/ou lento o sistema. Por outro lado, quanto maior for a energia do controle o e u(t) u(t) dt maior o esforo dos atuadores no sentido de que o sinal de controle posc t=0 sui maiores amplitudes e/ou os atuadores so excitados em regime transitrio durante a o um tempo maior. Idealmente dever amos ter pequena energia do estado e de controle mas isso no poss pois o sistema se torna mais rpido (plos mais ` esquerda) a e vel a o a graas a um esforo maior de controle. A losoa de projeto do controlador LQR c c e estabelecer um compromisso entre as energias de estado e controle atravs do seguinte e funao custo a ser minimizada c

J = min
u(t) 0

[x(t) Q0 x(t) + u(t) R0 u(t)] dt

(4.25)

onde Q0 > 0, R0 > 0 so matrizes de ponderao dadas representando o compromisso a ca desejado. Tipicamente Q0 , R0 so escolhidas diagonais e nesse caso x(t) Q0 x(t) = a n a qi xi (t)2 e u(t) R0 u(t) = nu ri ui (t)2 onde qi , ri so os elementos positivos nas i=1 i=1

4. Controle via Realimentao de Estados ca

81

diagonais das matrizes Q0 , R0 . Como o sinal de controle a ser projetado deve minimizar a funao custo acima, o elemento qi deve ser escolhido maior que qj quando a minic mizaao da energia da varivel xi prioritria em relaao ` minimizaao da energia de c a e a c a c xj . Os elementos ri de ponderaao do controle so escolhidos de forma anloga. c a a Teorema 4.3 Suponha que o sistema (4.24) seja estabilizvel e considere o critrio a e quadrtico (4.25) com Q0 > 0, R0 > 0 dadas. A lei de controle que estabiliza o sistema a 1 e minimiza o critrio (4.25) u(t) = Kx(t) onde K = R0 Bu P e P > 0 a soluo e e e ca da equao de Riccati abaixo. ca
1 A P + P A P B u R 0 Bu P + Q 0 = 0

(4.26)

Prova: Dena v(x(t)) = x(t) P x(t) onde P > 0 a soluao da equao de Riccati e c ca acima. Como o sistema deve ser estvel em malha fechada devemos ter limt x(t) = 0. a Logo v(x()) = 0 e podemos reescrever o critrio (4.25) na forma e

J = min
u(t) 0
1

[x(t) Q0 x(t) + u(t) R0 u(t) + v(x(t))] dt + v(x(0))


1

2 Dena (t) = R0 u(t) + R0 2 Bu P x(t) e reescreva o critrio acima como e

J = min
u(t) 0

1 x(t) A P + P A P Bu R0 Bu P + Q0 x(t) + (t) (t) dt + v(x(0))

(4.27) Para a lei de controle proposta no teorema temos J = v(x(0)) = x(0) P x(0) pois 1 1 A P + P A P Bu R0 Bu P + Q0 = 0 e u(t) = R0 Bu P x(t) que implica (t) = 0. Para qualquer outra lei de controle teremos um valor maior da funo custo pois (t) ser ca a no nulo. Para mostrar que o sistema em malha fechada exponencialmente estvel a e a note que a equao de Riccati (4.26) pode ser reescrita na forma ca (A Bu K) P + P (A Bu K) + K R0 K + Q0 = 0 Como P > 0 e K R0 K + Q0 > 0, pois Q0 > 0, conclu mos que o sistema expoe nencialmente estvel pois v(x(t)) uma funao de Lyapunov para o sistema de malha a e c fechada. Para completar a prova note que a soluo do problema, quando existe, uma ca e realimentaao de estados e portanto o sistema precisa ser estabilizvel de acordo com c a o corolrio 4.1. a 2 No teorema acima a matriz Q0 positiva denida. Podemos relaxar essa hiptese e o para Q0 positiva semi-denida desde que possamos decompor Q0 = C0 C0 com o par (A, C0 ) observvel (Greeen and Limebeer, 1995). a O controlador LQR possui propriedades interessantes. Vrias delas so apresentaa a das em (R.T.Stefani et al., 1994) para o caso SISO. Por exemplo, o LQR possui margem de ganho innita e pode ser reduzido pela metade que o sistema continua estvel. Alm a e disso o LQR apresenta uma margem de fase de pelo menos 60 graus. Para sistemas MIMO com R0 = I as mesmas propriedades se aplicam canal por canal no sinal de controle. No caso SISO o LQR apresenta uma atenuaao de 20 db/dcada nas altas c e frequncias o que em muitos casos insuciente para uma boa supresso de ru e e a dos.

82

4. Controle via Realimentao de Estados ca

4.4

Controle a Custo Garantido

Veremos nesta seo uma abordagem similar ao LQR da seao anterior onde uma ca c 5 funao custo minimizada. Porm, ao invs de utilizar equaoes de Riccati para c e e e c resolver o problema iremos utilizar LMIs. De forma similar ao critrio quadrtico do LQR iremos aqui tambm explorar o e a e compromisso que existe entre estabilizar o sistema rapidamente e a energia de controle utilizada. Considere o sistema (4.1) reescrito na seguinte forma: x(t) = Ax(t) + Bu u(t) z(t) = Cz x(t) + Duz u(t) u(t) = Kx(t) (4.28)

onde z(t) Rnz um vetor auxiliar cuja energia queremos minimizar e Cz , Dzu so e a matrizes constantes de ponderaao com dimenses apropriadas a serem escolhidas pelo c o projetista de forma similar `s matrizes de ponderao Q0 , R0 do LQR. Considere ainda a ca a seguinte funao custo: c

J = min
u(t) 0

z(t) z(t)dt

(4.29)

Note que z(t) z(t) = x(t) Cz Cz x(t) + x(t) Cz Duz u(t) + u(t) Duz Cz x(t) + u(t) Duz Duz u(t) e portanto a funao custo acima se torna idntica a do LQR se escolhermos Cz , Duz c e de forma que Cz Duz = 0 e Cz , Duz de posto completo o que implica Q0 = Cz Cz > 0 e R0 = Duz Duz > 0. O problema de interesse nesta seo pode ser formalizado como se segue: ca Problema 4.1 Determinar uma lei de controle u = Kx para o sistema (4.28) tal que a funo custo denida em (4.29) seja minimizada para uma dada condio inicial ca ca x(0) = x0 . Uma soluao para o problema acima pode ser facilmente obtida impondo-se a sec guinte condio na inequao de Lyapunov (Boyd et al., 1994): ca ca V (x) + z z < 0 (4.30)

onde V (x) a derivada temporal da funao de Lyapunov quadrtica V (x) = x P x. e c a Integrando-se (4.30) de 0 a T > 0, obtm-se: e
T

V (x(T )) V (x(0)) +
0

z(t) z(t)dt < 0

Supondo que o sistema (4.28) seja estvel em malha fechada conclui-se que a limT x(T ) = 0 e ento limT V (x(T )) = 0. Desta forma, a expresso acima a a equivale `: a
0
5

z(t) z(t)dt < x0 P x0 = V (x0 )

x(0) = x0

(4.31)

Um valor de custo pequeno indica um sistema com elevado desempenho.

4. Controle via Realimentao de Estados ca

83

Logo, minimizando o valor de x0 P x0 estamos minimizando um limitante superior de J que a funao custo em (4.29). e c Por outro lado, como o sistema em malha fechada dado por x = (A + Bu K)x e e z = (Cz + Duz K)x a condio (4.30) pode se reescrita na forma ca V (x) + z z = x (A + Bu K) P x + x P (A + Bu K)x + x (Cz + Duz K) (Cz + Duz K)x < 0 (4.32) Denindo Q = P 1 e um escalar tal que > x0 P x0 obtemos as seguintes condioes: c x0 Q1 x0 > 0 Q [(A + Bu K) P + P (A + Bu K) + (Cz + Duz K) (Cz + Duz K)] Q < 0 (4.33)

Com o complemento de Schur e a mudana de varivel Y = KQ podemos enunciar c a a seguinte soluao em termos de LMIs para o Problema 4.1. c Teorema 4.4 Considere o sistema linear em (4.28) com uma dada condio inicial ca x(0) = x0 . Suponha que as matrizes Q = Q e Y de dimenses apropriadas sejam a o soluo do seguinte problema de otimizao: ca ca min sujeito a: x0 >0 x0 Q QA + AQ + Y Bu + Bu Y Cz Q + Duz Y QCz + Y Duz Inz <0

(4.34) (4.35)

Ento o sistema (4.28) com K = Y Q1 assintoticamente estvel e a funo custo a e a ca denida em (4.29) satisfaz J < x0 Q1 x0 . da Exemplo 4.4 Considere o sistema linear (4.21), com a seguinte sa de desempenho: 0 0.1 0 0 0 z(t) = 0 0 0 x(t) + 0.01 0 u(t) 0 0 0 0 1 e uma condio inicial x0 = [ 2 1 1 ] . ca Note que z(t) = 0.1 x2 (t) 0.01 u1 (t) u2 (t) e portanto as matrizes Cz , Duz foram escolhidas para ponderar fortemente a entrada de controle u2 , evitando assim excessiva energia desse sinal. Aplicando a tcnica de controle custo garantido pode-se e projetar uma lei de controle u = Kx de maneira a minimizar a energia destes sinais de interesse. Atravs do Teorema 4.4 , obtm-se os seguintes resultados: e e Y = ! 0.0051460 ! 0.0000452 =

-0.0112142 -9999.9417 ! -1.0000888 0.0004984 !

84 ! 859.46698 ! -199.99977 ! 611.85185 lambda K -199.99977 611.85235 -1871.3175

4. Controle via Realimentao de Estados ca 611.85185 ! - 1871.3175 ! 8154.6886 !

= 0.0101946

= ! 0.0008478 ! -0.0004114

-12.578844 -0.0056159

-4.1129064 ! -0.0012578 !

% cdigo para implementaao no scilab o c~ % matrizes do sistema A=[0 1 0;0 0 1;-1 2 -1]; B=[0 0;0 1;1 0]; C=[0 .1 0;0 0 0;0 0 0]; D=[0 0;.01 0;0 1]; X0=[2 1 -1]; %funao para soluao do problema de custo garantido c~ c~ function [P,K,lambda, Q, Y]=controle_ctgtdo(A,B,C,D,X0) // Generated by lmitool on Mbound = 1e3; abstol = 1e-10; nu = 10; maxiters = 100; reltol = 1e-10; options=[Mbound,abstol,nu,maxiters,reltol]; ///////////DEFINE INITIAL GUESS AND PRELIMINARY CALCULATIONS BELOW lambda_init=0; Q_init=eye(3,3) Y_init=eye(2,3) /////////// XLIST0=list(lambda_init, Q_init, Y_init) XLIST=lmisolver(XLIST0,controle_ctgtdo_eval,options) [lambda, Q, Y]=XLIST(:) K=Y*inv(Q); P=inv(Q); endfunction

/////////////////EVALUATION FUNCTION//////////////////////////// function [LME,LMI,OBJ]=controle_ctgtdo_eval(XLIST) [lambda, Q, Y]=XLIST(:)

4. Controle via Realimentao de Estados ca /////////////////DEFINE LME, LMI and OBJ BELOW LME=Q-Q; LMI=list(); LMI(1)=[lambda X0;X0 Q]; LMI(2)=-[Q*A+A*Q+Y*B+B*Y Q*C+Y*D;C*Q+D*Y -eye(3,3)]; OBJ=lambda endfunction

85

Verique que a segunda linha da matriz K, que deni o sinal de controle u2 (t), possui elementos bastante pequenos indicando que o sinal de controle u2 (t) possui amplitudes bem menores que u1 (t) para o mesmo vetor de estado. Exerc cio 4.3 Verique no exemplo acima que a funo custo idntica a do LQR se ca e e escolhermos Q0 = Cz Cz > 0 e R0 = Duz Duz > 0. Resolva o LQR com essas matrizes de ponderao e compare Q1 , K obtidas no exemplo acima com P, K obtidos no ca LQR. Qual o valor timo da funo objetivo nos dois casos para a mesma condio o ca ca inicial? Para uma outra condio inicial a matriz Q obtida seria diferente? ca Utilizando a propriedade de convexidade das LMIs, pode-se resolver o problema de minimizar em (4.34) considerando qualquer condio inicial num dado conjunto ca politpico X0 com vrtices conhecidos, isto : x0 X0 . O prximo corolrio formaliza o e e o a este resultado. Corolrio 4.2 Considere o sistema (4.28) e um conjunto X0 de condies iniciais, a co onde X0 um politopo com vrtices conhecidos. Suponha que existam matrizes Q = Q e e e Y de dimenses apropriadas que solucionem o seguinte problema de otimizao para o ca todo x0 nos vrtices do politopo X0 : e min sujeito a: (4.34) e (4.35). (4.36)

Ento o sistema (4.28) com K = Y Q1 assintoticamente estvel e a funo custo a e a ca 1 denida em (4.29) satisfaz J < x0 Q x0 para qualquer x0 X0 . Freqentemente, os sistemas reais esto sujeitos a perturbaes externas e ru u a co dos de medida que podem degradar o desempenho do sistema. Existem, na prtica, vrias a a formas de perturbaes e ru co dos, como, por exemplo, fora da gravidade, presso atc a mosfrica, ventos, interferncia eletromagntica, etc. Estas entradas no controlveis e e e a a podem ser modeladas por diferentes tipos de sinais. Para perturbaoes de curta durao c ca no tempo, por exemplo, pode-se utilizar o impulso como modelo para tal classe de sinais. Da mesma forma, sinais praticamente constantes (lentos) podem ser modelados pela funo degrau. Equivalentemente, outras formas de entradas so modeladas por ca a sinais normalmente utilizados na teoria de controle (sinais senoidais, ru branco, do etc.). Portanto, para sistemas sujeitos a perturbaes externas deve-se minimizar de alco guma maneira a inuncia destes sinais nas sa e das de interesse do sistema atravs de e uma adequada lei de controle. Nas prximas sees sero considerados os projetos de o co a controladores que atendam especicaoes de controle em termos das normas H2 e H c de sistemas como forma de minimizar o problema de rejeio de perturbaoes. ca c

86

4. Controle via Realimentao de Estados ca

4.5

Controle H2
x = Ax + Bu u + Bw w z = Cz x + Duz u u = Kx

Considere o seguinte sistema linear: (4.37)

onde w Rnw corresponde aos sinais de perturbaao e Bw um matriz constante com c e dimenses apropriadas. o O problema a ser resolvido consiste em projetar um controlador que minimize a norma H2 do sistema em malha fechada. Como visto no cap tulo anterior, minimizar a norma H2 corresponde a minimizar a energia da resposta impulsional do sistema de malha fechada cuja funao de transferncia : c e e H(s) = (Cz + Duz K) (sI (A + Bu K))1 Bw . De forma similar as seoes anteriores, pode-se obter uma formulaao convexa para c c o problema de controle H2 atravs do gramiano de controlabilidade. Logo, a norma H2 e do sistema (4.37) em malha fechada pode ser determinada atravs do seguinte problema e de otimizao: ca min tr{(Cz + Duz K)Q(Cz + K Duz )} : Q > 0,
Q,K

(4.38) (4.39)

(A + Bu K)Q + Q(A + K Bu ) + Bw Bw < 0.

Note que a parametrizaao Y = KQ utilizada nas sees anteriores para tornar c co as condioes de estabilizaao convexas no pode ser aplicada diretamente na funao c c a c objetivo. Para contornar este problema, considere a seguinte inequaao matricial: c N (Cz + Duz K)QQ1 Q(Cz + K Duz ) > 0 Aplicando o complemento de Schur na inequao acima, obtm-se: ca e N Q(Cz + Duz K) (Cz + Duz K)Q Q >0 (4.40)

Agora, um limitante superior da norma H2 do sistema em malha fechada pode ser determinado atravs do seguinte problema de otimizao6 : e ca min tr{N } sujeito `: (4.40) e (4.39). a
Q,K

Portanto, uma soluo convexa para o problema de controle H2 pode ser expressa ca atravs do seguinte teorema. e
6

Observe que nesse caso tr{N } tende a tr{(Cz + Duz K)Q(Cz + K Duz )}.

4. Controle via Realimentao de Estados ca

87

Teorema 4.5 Considere o sistema linear em (4.37). Suponha que as matrizes Q = Q , N = N e Y de dimenses apropriadas sejam a soluo do seguinte problema de o ca otimizao: ca min tr{N } sujeito `: a N Cz Q + Duz Y QCz + Y Duz Q

>0

(4.41) (4.42)

QA + AQ + Y Bu + Bu Y + Bw Bw < 0

Ento o sistema (4.37) com K = Y Q1 assintoticamente estvel e a norma H2 do a e a sistema em malha fechada satisfaz Hwz 2 tr{N }. 2 Exemplo 4.5 Considere o seguinte sistema linear sujeito a perturbaes impulsivas: co 0 0 0 0 1 0 0 0 0 0 0 0 1 0 x + u + x = 1 0 w 0 0 0 0 1 (4.43) 0 1 1 1 2 3 1 z = 1 0 0 0 0 1 0 0 x+ 0 0.1 u

O objetivo neste exemplo determinar uma lei de controle u = Kx tal que o sistema e seja assintoticamente estvel em malha fechada e a sua norma H2 seja minimizada. a Aplicando o teorema 4.5, obtm-se o seguinte resultado: e -->Q Q = ! 0.5654039 - 0.0000050 - 0.2722405 0.0000049 ! ! - 0.0000050 0.2722405 - 0.0000051 - 0.4854745 ! ! - 0.2722405 - 0.0000051 0.4854763 - 0.5000153 ! ! 0.0000049 - 0.4854745 - 0.5000153 1.6989597 ! -->Y Y = ! 1.8675964 0.5590117 - 3.927422 1.7267448 ! -->K=Y*Q^(-1) K = ! - 9.049563 - 19.572199 - 25.654583 - 12.126655 ! -->N N = ! 0.5654039 0.1867646 ! ! 0.1867646 2.5640558 ! -->trace(N) ans = 3.1294597 A gura 4.7 mostra as trajetrias x1 (t) e x2 (t) do sistema em malha fechada cono siderando um sinal de perturbao na forma: ca w(t) = 1 1 (t 1),

88

4. Controle via Realimentao de Estados ca

onde (t 1) representa um impulso unitrio em t = 1s. a


0.2

x1

0.0

x2

Sfrag replacements x1 (t) x2 (t)0.2 t(s)

t(s)
0.0 7.5 15.0

Figura 4.7: Trajetrias x1 e x2 do sistema (4.43) em malha fechada com perturbaoes o c impulsivas em t = 1.

4.6

Controle H

A norma H representa o maior ganho que o sistema oferece para um dado sinal perturbao, qualquer que seja ele. Deste forma, o controle H pode ser visto, como ca um problema de otimizaao no qual deseja-se determinar uma lei de controle u(t) c que minimiza o maior ganho que o sistema em malha fechada vai oferecer a um sinal perturbao qualquer. ca Nesta seao apresenta-se uma formulaao LMI para o problema de controle acima c c atravs de realimentaao de estados. Para tal, considere o seguinte sistema linear: e c x(t) = Ax(t) + Bu u(t) + Bw w(t) z(t) = Cz x(t) + Duz u(t) + Dwz w(t) u(t) = Kx(t) onde Dzw uma matriz constante com dimenses apropriadas. e o Em malha fechada o sistema acima ca x(t) = (A + Bu K)x(t) + Bw w(t) z(t) = (Cz + Duz K)x(t) + Dwz w(t) (4.45) (4.44)

4. Controle via Realimentao de Estados ca

89

Utilizando os resultados apresentados no exerc 3.6 para o sistema acima e a mudana cio c de varivel Y = KQ a norma H do sistema (4.44) dada pelo seguinte problema de a e otimizaao: c Q > 0, AQ + QA + Bu Y + Y Bu Bw QCz + Y Duz min : (4.46) Q,Y <0 Inz Bw Dwz Cz Q + Duz Y Dwz Inz O resultado acima resumido atravs do seguinte teorema. e e Teorema 4.6 Considere o sistema linear em (4.44). Suponha que as matrizes Q = Q e Y de dimenses apropriadas e o escalar positivo sejam a soluo do problema de o ca otimizao denido em (4.46). ca Ento o sistema (4.44) com K = Y Q1 assintoticamente estvel e a norma H a e a do sistema em malha fechada satisfaz Hwz . Exemplo 4.6 Considere o seguinte 0 1 x = 0 0 1 2 1 0 0 z = sistema linear instvel em malha aberta: a 0 0 0 1 x + 0 u + 1 w 1 1 0 x + u + 0.1w

(4.47)

Para o sistema acima deseja-se projetar uma lei de controle u = Kx tal que o sistema seja estvel em malha fechada e a norma H seja minimizada. a Utilizando o teorema 4.6, obtm-se os seguintes resultados: e -->Q Q = ! 332826.59 - 755359.88 1714312.4 ! ! - 755359.88 1714312.6 - 3890685.2 ! ! 1714312.4 - 3890685.2 8830029.9 ! -->Y Y = ! - 332831.23 755370.37 - 1714338.8 ! -->K=Y*Q^(-1) K = ! - 197.88367 - 827.88069 - 326.55643 ! -->norm_hinf norm_hinf = 2.4519588 As guras 4.8 e 4.9 mostram respectivamente a sa de desempenho z(t) para um da de sinal perturbao na forma: ca w(t) = 1 0 0 < t 1s t > 1s

e o diagrama de Bode para o sistema em malha fechada.

90
3

4. Controle via Realimentao de Estados ca

z(t)

Sfrag replacements z(t)3 t(s)

t(s)
0 10 20

Figura 4.8: Sa de desempenho do sistema (4.47) em malha fechada. da

4.7

Controle de sistemas incertos

Todos os resultados de projeto de realimentao de estados via LMIs apresentados ca neste cap tulo se aplicam diretamente para a estabilizaao de sistemas incertos. Para c isto basta que as incertezas estejam connadas num politopo de vrtices conhecidos, e pois nas LMIs aqui apresentadas as matrizes do sistema aparecem de forma am nas expresses. Este fato nos permite utilizar propriedades de convexidade para trabalhar o com os vrtices do politopo. Veja sees 3.2.5, 3.4.3 e 3.5.3. e co A seguir apresentamos o caso de controle H para sistemas com incertezas do tipo politopo. Considere o sistema incerto x(t) = A()x(t) + Bu ()u(t) + Bw ()w(t) z(t) = Cz ()x(t) + Duz ()u(t) + Dwz ()w(t) u(t) = Kx(t)

(4.48)

onde Rq o vetor de parmetros incertos e = Co{v1 , . . . , v2q } um politopo e a e de vrtices vi conhecidos. As matrizes A(), Bu (), Bw (), Cz (), Duz (), Dwz () so e a funoes ans de . Os demais vetores x(t), w(t), u(t), z(t) so os mesmos denidos em c a (4.44). De (4.46) temos

4. Controle via Realimentao de Estados ca


db Amplitude

91

8 7 6 5 4 3 2 1 10
. 3

10

10

10

10

Hz

10

Graus

Fase

100

200
.

300
3 2 1 0 1 2

10

10

10

10

10

Hz

10

Figura 4.9: Diagrama de Bode do sistema (4.47) em malha fechada.

Q > 0, A()Q + QA() + Bu ()Y + Y Bu () min : Q,Y Bw () Cz ()Q + Duz ()Y

<0 Inz Dwz () Inz (4.49)

onde um limitante superior da norma H de forma idntica ` seo 3.5.3 e repree e a ca senta termos que podem ser deduzidos por simetria. Alm disso, devido ` convexidade e a as LMIs acima so equivalentes ao conjunto de 2q LMIs a Q > 0, A(v1 )Q + QA(v1 ) + Bu (v1 )Y + Y Bu (v1 ) <0 Bw (v1 ) Inz Cz (v1 )Q + Duz (v1 )Y Dwz (v1 ) Inz min : Q,Y . . . A(v2q )Q + QA(v2q ) + Bu (v2q )Y + Y Bu (v2q ) <0 Bw (v2q ) Inz Cz (v2q )Q + Duz (v2q )Y Dwz (v2q ) Inz (4.50)

92

4. Controle via Realimentao de Estados ca

obtidos de (4.49) com = vi para i = 1, . . . , 2q onde vi so os vrtices do politopo . a e Os resultados das seoes 4.2,4.6, 4.5, 4.4 so facilmente estendidos para o caso c a incerto de forma anloga. a

4.8

Notas e Referncias e

Em geral, no projeto de controladores deseja-se um desempenho do sistema em malha fechada que atenda vrios objetivos, por exemplo, obter uma boa resposta trana sitria (alocao de plos) e ao mesmo tempo rejeitar perturbaoes com energia nita o ca o c (controle H ). Na teoria de controle, tal problema denominado de controle multie objetivo ou misto. Felizmente, tcnicas de projeto de controladores baseadas em LMIs e podem atender a uma grande variedade de especicaoes de desempenho dentro de um c simples problema de otimizao LMI (Scherer et al., 1997). ca A idia bsica em problemas com vrios objetivos a de considerar a mesma pae a a e rametrizaao (em outras palavras, a mesma funo de Lyapunov) nas restrioes LMIs c ca c 7 (Chilali et al., 1999) ao custo de algum conservadorismo nos resultados . A seguir, apresentam-se solues para alguns problemas com mltiplos critrios de desempenho: co u e H com alocao de plos - minimizar um limitante superior da norma H ca o tal que os plos em malha fechada pertenam a uma dada regio D C : o c a min sujeito ` (4.23) e (4.46). a
Y,Q

(4.51)

Problema misto H2 /H - para um dado tal que Hwz limitante superior da norma H2 supondo que Dwz = 0:
N,Y,Q

< minimizar um (4.52)

min tr(N ) sujeito a (4.41) e a segunda LMI em (4.46).

4.9

Exerc cios Propostos


instvel em malha aberta: a 0 0 0 0 1 0 x + u. 0 0 1 3 1 1

E 2.1 Considere o seguinte sistema linear 0 1 0 0 x = 0 0 2 10

Para o sistema acima determinar uma lei de controle u = Kx tal que: o (a) os plos em malha fechada tenham a parte real menor do que 2; c ca (b) minimize a funo custo J = 0 (x2 + u2 ) dt para um conjunto de condioes 1 iniciais 0 0 0 2 0 1 0 0 , X0 = , , 0 1 0 0 0 0 0 2
Note que neste caso a soluo obtida ser um limitante superior do valor timo (de Oliveira ca a o et al., 1999).
7

4. Controle via Realimentao de Estados ca

93

(c) minimize um limitante superior da norma H2 do sistema em malha fechada e ao mesmo tempo tenha um ganho L2 limitado por Hwz 3, supondo que o sistema perturbado por sinais w1 (t) (ru branco com mdia nula e do e 2 e varincia E[w1 (t) ] = 1) e a w2 (t) = onde 0 0 , w = 0 1 1 0 0<t1 t>1 ,

0 0 Bw = 1 0

w1 w2

Cz = , Duz =

1 0 0 0 0 0 0 0 0 1

, Dwz = 0.

co E 2.2 Demonstre que as condies do Teorema 4.4 implicam que J < x0 Q1 x0 para uma dada condio inicial x(0) = x0 . ca E 2.3 Obtenha uma formulao convexa para o problema de controle H2 utilizando ca o graminiano de observabilidade (dica: pr- e ps-multiplique as condioes de e o c 1 estabilidade por Q = P ). E 2.4 Demonstre que (4.46) implica em (3.116) para V (x) = x Q1 x

94

4. Controle via Realimentao de Estados ca

Cap tulo 5 Observadores de Estados e Filtragem


No cap tulo anterior mostra-se que atravs do processo de realimentaao dos estados e c poss controlar as variveis de sa de um sistema para efeito de estabilizao ou e vel a da ca desempenho. No entanto, na prtica, nem sempre poss a e vel medir sicamente um sinal desejado, seja pela falta de equipamentos apropriados (sensores), ou mesmo por questes de economia, dado que a medida direta deste sinal pode tornar o projeto muito o caro. Nesses casos necessrio estimar estes estados atravs das medidas dispon e a e veis. Uma forma de fazer esta estimativa o projeto de observadores de estados, ou seja, e sistemas que so projetados a partir do sinais dos medidores do sistema original, de a forma que o erro entre o estado real e o estado estimado convirja para zero na ausncia e de ru dos externos. Alm de estimar as variveis desejadas, para as quais no se tem medidores dise a a pon veis, outro ponto importante atenuar o mximo poss e a vel o efeito dos ru dos e perturbaes externas nessas variveis estimadas. Como ser visto no decorrer deste co a a cap tulo, nesse caso o ltro a ser projetado ir depender das caracter a sticas do ru e do do sinal de perturbao aos quais o sistema est sujeito. ca a Neste cap tulo apresenta-se o projeto de observadores de estados e ltros onde o efeito dos ru dos e perturbaes so medidos atravs das normas H2 e H . Inicialco a e mente apresenta-se os resultados clssicos de Luenberg e Kalman-Bucy e na seqncia a ue o projeto de ltro H . Neste cap tulo no estaremos considerando o projeto de cona troladores, mas sim o projeto de ltros para estimaao de variveis. O projeto de c a controladores que utilizam as variveis estimadas ser abordado no prximo cap a a o tulo.

5.1

Observador de ordem completa

Nesta seo consideraremos o problema de estimar todas as variveis de estado ca a de um sistema a partir dos sinais conhecidos dispon veis nesse sistema. Para isso consideraremos que o sistema seja descrito por x(t) = Ax(t) + Bu u(t), x(0) = x0 y(t) = Cx(t) (5.1)

96

5. Observadores de Estados e Filtragem

onde x Rn o vetor de estados, u(t) Rnu a varivel de controle que suporemos e e a conhecida1 e y(t) Rny o sinal de sa do sistema proveniente dos medidores e e da suporemos que no existe redundncia nas variveis medidas, isto posto(C) = ny . a a a e Observe que se o nmero de sensores for igual ao nmero de variveis de estado u u a (ny = n) e as medidas efetuadas no so redundantes (a matriz C invers a a e vel) ento a 1 podemos determinar o estado atravs da relaao algbrica x(t) = C y(t). No entanto e c e na grande maioria dos casos no dispomos de sensores para todas as variveis de estado a a e nesses casos temos ny < n e portanto a matriz C no mais invers e no mais a e vel a podemos encontrar o estado de atravs da relaao algbrica acima. A soluao nesses e c e c casos obter uma estimativa xf (t) do sinal x(t) atravs de um ltro dinmico cujas e e a entradas so os sinais conhecidos do sistema y(t), u(t) e cuja sa a estimativa xf (t), a da e como ilustra a gura 5.1. A representaao de estados desse ltro indicada abaixo. c e xf (t) = Af xf (t) + Bf u + Kf y(t) (5.2)

onde as matrizes Af , Bf , Kf devem ser determinadas tais que as seguintes condies co sejam satisfeitas: (i) A estimativa xf (t) deve convergir para x(t) em regime permanente, i.e.
t

lim (x(t) xf (t)) = 0

(ii) A dinmica do erro de estimaao e(t) = x(t) xf (t) deve depender apenas da a c condiao inicial e(0) = x(0) xf (0). c Um ltro que satisfaz as condies acima denominado de observador de Luenberger co e e foi proposto originalmente em Luenberger (1966). O observador denominado de e ordem completa quando o estado xf (t) do observador (5.2) possui dimenso igual a do a estado x(t) que se deseja estimar. O requisito (i) indica que no existe erro de estimaao em regime permanente a c enquanto (ii) indica que o erro de estimaao no depende dos sinais de entrada do ltro c a y(t), u(t) e portanto o projeto do observador e da lei de controle cam independentes. Para determinar as matrizes do ltro que satisfazem as condies acima basta calco cular a dinmica do erro de estimaao e(t) = x(t) xf (t) que nos leva `: a c a e = = = =
1

x xf = Ax + Bu u [Af xf + Bf u + Kf y] (A Kf C)x + (Bu Bf )u Af xf (A Kf C)(e + xf ) + (Bu Bf )u Af xf (A Kf C)e + (Bu Bf )u + (A Kf C Af )xf

(5.3)

Como mencionado anteriormente os mtodos de projeto de controladores que utilizam as variveis e a de estado estimadas sero estudados no prximo cap a o tulo.

y(t) u(t)

estimador

xf (t)

Figura 5.1: Diagrama de blocos de um estimador de estado.

5. Observadores de Estados e Filtragem Para que o requisito (i) seja atendido devemos escolher Af = A Kf C , B f = Bu

97

(5.4)

que resulta na seguinte dinmica do erro de estimao a ca e = (A Kf C)e (5.5)

e num ltro, conhecido como observador de Luenberger de ordem completa, dado por xf (t) = (A Kf C)xf (t) + Bu u(t) + Kf y(t) (5.6)

Por outro lado para que o requisito (ii) seja atendido devemos escolher a matriz Kf , conhecida como ganho do observador, de tal forma que os autovalores da matriz A Kf C, que dene a dinmica do erro de acordo com (5.5), tenham todos parte real a negativa, pois dessa forma teremos e(t) = exp{At}e(0) com
t

lim e(t) = 0 e(0)

u(t)

Bu

+ + +

xf

1 s

xf

y(t)

Kf

A Kf C

Figura 5.2: Observador de ordem completa para o sistema (5.1).

5.1.1

Tcnicas para projeto do ganho do observador e

O problema que estudaremos nesta seao consiste em projetar a matriz Kf de ganho c do observador de tal forma que os autovalores da matriz A Kf C estejam no semiplano complexo esquerdo. Observe que este problema similar ao problema de projeto e de realimentaao de estados estudado no cap c tulo anterior onde apresentamos tcnicas e para determinar uma matriz K tal que autovalores da matriz A Bu K estejam no semi-plano complexo esquerdo. A unica diferena a localizao das matrizes K e Kf , c e ca a serem determinadas, em relaao `s matrizes constantes Bu e C e isto impede que c a as mesmas tcnicas do cap e tulo anterior sejam usadas diretamente. No entanto essa diculdade pode ser eliminada notando que os autovalores de A Kf C so os mesmos a da sua transposta A C Kf onde agora Kf e K aparecem na mesma posiao. Portanto c podemos estabelecer a seguinte correspondncia: e projeto de controlador A Bu K projeto de observador A C Kf

98

5. Observadores de Estados e Filtragem

A tabela acima indica que se denirmos um sistema de controle auxiliar ct cio, chamado de sistema dual, na forma ed = A ed + C ud , ud = Kf ed (5.7)

onde ed , ud so o estado dual e controle dual, respectivamente, podemos utilizar as a mesmas tcnicas do cap e tulo anterior para encontrar a matrix de ganho Kf tal que o a sistema dual acima em malha fechada A C Kf seja estvel. Note que controlabilidade no sistema dual (5.7) signica observabilidade do par (A, C) que indica observabilidade do sistema original (5.1). Isto decorre do fato de que a matriz de controlabilidade do par (A , C ) a transposta da matriz de observabilidade e do par (A, C). Projeto por abordagens clssicas. a Para determinao de Kf via alocaao de plos, temos da seao 4.1 que o par (A , C ) ca c o c precisa ser controlvel, ou de forma equivalente (A, C) observvel. Os resultados da a a seao 4.1 se aplicam diretamente para a soluo do problema ct de controle por c ca cio realimentaao de estados do sistema dual (5.7). c Exemplo 5.1 Considere o problema de projetar um observador para o sistema x = Ax + Bu u, onde 0 1 0 A= , Bu = , C= 1 0 0 0 1 . Queremos que os plos de malha fechada do sistema sejam {3, 6}. Calcularemos a o matriz de ganho Kf do observador usando os mtodos SISO e MIMO de forma anloga e a ao exemplo 4.1.

Mtodo para sistemas SISO: e

Equao caracterstica desejada: ca (s + 3)(s + 6) = s2 + 9s + 18 = 0 Equao caracterstica de malha aberta: ca det(sI A ) = Clculo da matriz de ganho a Kf = 2 a2 1 a1 T 1 = 18 9 0 1 1 0 = 9 18 s 0 1 s = s2 a1 = 0 a2 = 0 1 = 9 2 = 18

Note que A , C no se encontram na forma cannica de controlabilidade Ac , Bc em a o 1 a (4.4) e por isso a transformao T = Uc Vc se faz necessrio. Note que Vc = I2 para ca este exemplo e a matriz Uc a matriz de controlabilidade do par (A , C ). e

5. Observadores de Estados e Filtragem Mtodo para sistemas MIMO: e i 0 1 1 i 0

99

A I2 C

gi =

gi = 0

Os autovetores associados aos autovalores 1 = 3 e 2 = 6 so g1 = a 1 1/3 3 e g2 = 1 1/6 6 . Desta forma, temos: 1 1 V g1 g2 = 1/3 1/6 = G 3 6 Assim, Kf = GV 1 = 9 18

Os resultados da seo de controle via LQR tambm se aplicam diretamente. ca e Exerc cio 5.1 Projete um observador de estados para o sistema do exemplo anterior usando LQR com o critrio 0 (ed Qed + ud Rud )dt onde ed , ud so os vetores de estado e a e controle duais (5.7). Escolha Q, R de forma a ter rpida convergncia dos estados a e observados. Verique os autovalores de A Kf C obtidos e compare com o desempenho do observador obtido no exemplo anterior. Projeto por abordagens baseadas em LMIs. Da seao 4.2.1 sabemos que quando o sistema dual (5.7) controlvel, isto o c e a e sistema (5.1) observvel, podemos encontrar uma matriz de ganhos Kf tal que a e a localizao dos autovalores de A C Kf possa ser arbitrariamente escolhida. Quando o ca sistema (5.1) no observvel no podemos mais escolher a localizaao dos autovalores a e a a c de A C Kf de forma arbitrria, mas se os modos no observveis so estveis, a a a a a ainda assim podemos determinar uma matriz de ganhos Kf tal que os autovalores de A C Kf estejam no semi-plano complexo esquerdo tornando estvel a dinnica do a a erro de estimaao. Essa idia nos leva ` seguinte deniao: c e a c Denio 5.1 (Detectabilidade) O sistema linear invariante (5.1) detectvel se ca e a os modos no observveis (quando existirem) so estveis. a a a a A observabilidade de um sistema pode ser facilmente testada atravs do posto da matriz e de observabilidade. Porm como saber se os modos no observveis, quando existirem, e a a so estveis? Na abordagem clssica isso pode ser testado com o aux de formas a a a lio cannicas (T.Kailath, 1980), mas este mtodo se torna invivel no caso de sistemas o e a incertos. O resultado apresentado a seguir baseado em LMIs e pode ser facilmente e estendido para sistemas incertos. e a Teorema 5.1 O sistema (5.1) detectvel se e somente se existem matrizes S Rnn nny positiva denida e L R tais que a seguinte LMI seja fact vel. A S + SA + C L + LC < 0 , S>0 (5.8)

100

5. Observadores de Estados e Filtragem

A prova deste teorema idntica ` do teorema 4.1. Basta notar que provar a detece e a tabilidade do par A, C no sistema (5.1) idntica a provar a estabilizabilidade do par e e (A , C ) no sistema dual (5.7). Como fruto dessa analogia podemos enunciar a seguinte verso dual do corolrio 4.1. a a Corolrio 5.1 Existe uma matriz de ganho Kf do observador (5.6) que torna a a dinmica do erro de estimao (5.5) exponencialmente estvel se e somente se o sisa ca a tema (5.1) for detectvel. Alm disso, toda matriz de ganhos Kf estabilizante pode ser a e decomposta como Kf = S 1 L onde L, S uma das solues de (5.8). e co 2 Exerc cio 5.2 Encontre um observador de estados para o sistema dinmico (5.1) onde a 0 1 0 0 1 C= 1 0 0 A= 0 5 1 4 O procedimento de alocaao de plos, visto na Seo 4.2.2, pode ser usado tambm c o ca e no projeto de observadores para melhorar a convergncia do erro de estimao. Neste e ca caso, busca-se garantir que a convergncia de xf para o estado x ocorra com a rapidez e desejada e isto se consegue atravs da alocao adequada dos plos do sistema dinmico e ca o a do erro de estimao. ca Para garantir que o erro de estimao tenda assintoticamente para zero com auca tovalores na regio D, aplica-se as condies do Teorema 3.4 ` dinmica do erro de a co a a estimaao (5.5), obtendo-se: c L P + M (P (A + Kf C)) + M ((A + Kf C) P ) < 0 (5.9)

A expresso acima no uma LMI em P e Kf , porm uma simples mudana de a a e e c varivel suciente para tornar estas condies convexas. Este resultado apresentado a e co e no prximo teorema. o Teorema 5.2 Considere o sistema (5.1) e uma regio LMI D contida em C . Suponha a que as matrizes P e X de dimenses apropriadas sejam soluo do seguinte problema o ca LMI: L P + M (P A + XC) + M (A P + C X ) < 0 (5.10) ento o sistema do erro de estimao (5.5) com Kf = P 1 X D-estvel. a ca e a Na seqncia apresenta-se um exemplo numrico. ue e Exemplo 5.2 Considere o sistema usado no Exemplo 5.2. Busca-se agora garantir que o sistema do erro de estimao tenha uma dinmica mais rpida, restringindo ca a a que os seus autovalores pertenam a regio LMI denida na Figura 3.3(b) com raio c a 2 e centro em (4, 0). Para esta regio a condio (5.10) equivalente ao seguinte a ca e problema LMI: X, P > 0 : 2P (4P + P A + XC) (4Q + A P + C X ) 2P <0

Aplicando o LMITOOL do Scilab, obtm-se o seguinte resultado: e

5. Observadores de Estados e Filtragem X =

101

! - 22624.493 ! ! 10382.626 ! ! 18858.031 ! P = ! 5799.9469 ! - 1852.372 ! - 336.90558 Kf = - 1852.372 962.98814 1020.2954 - 336.90558 ! 1020.2954 ! 3534.4051 !

! 6.7781018 ! ! 10.408455 ! ! - 7.6941234 ! Note que, agora os autovalores do sistema do erro de estimao so dados por: ca a 4.16161 3.3082459 .2027620i A Figura 5.3 apresenta as trajetrias do sistema do erro de estimao, considerando o ca T a mesma condio inicial [1 1 0] usada no Exemplo 5.2. ca O procedimento de alocao de plos para o projeto de observadores interessante ca o e dado que permite um maior controle da convergncia do erro de estimaao. Observa-se e c no entanto que, como no caso de realimentaao de estados, uma escolha inadequada c da regio pode acarretar sobre-sinais elevados alm de um ganho Kf muito elevado a e o que pode ocasionar amplicao de ru ca dos e excitar dinmicas de altas frequncias a e desprezadas no modelo.

5.2

Observador de Ordem Reduzida

Na seao anterior estudamos o observador de ordem completa, onde uma estimativa c das variveis de estado obtida a partir de um ltro que possui a mesma dimenso do a e a sistema cujo estado desejamos estimar. Como algumas variveis de estado do sistema a podem ser obtidas diretamente dos medidores, podemos pensar em estimar apenas aquelas variveis para as quais no dispomos de medidores. Nesse caso o ltro que a a estima esse sub-conjunto de variveis no medidas ter dimenso menor que a do sisa a a a tema original e recebe o nome de observador de ordem reduzida. Para melhor formular o problema considere uma nova representao de estados para o sistema (5.1) tal que ca nessa nova representao as variveis medidas y(t) faam parte do vetor de estados. ca a c Isto se consegue com a mudana de varivel c a z(t) = T x(t) = y(t) w(t) , T = C R Rnn (5.11)

102

5. Observadores de Estados e Filtragem

1.5

0.5

e1(t)

e3(t) 0 e2(t)

t(s) 0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Figura 5.3: Trajetria do sinal de erro de estimaao, caso de alocao de plos o c ca o onde R pode ser arbitrariamente escolhida de tal forma que T seja invers e w(t) = vel nny Rx(t) R a parte do vetor de estado contendo as variveis para as quais no e a a dispomos de medidores e portanto precisam ser estimadas. Aplicando a transformaao c de similaridade encontramos z(t) = T AT 1 z(t) + T Bu u(t) , y(t) = CT 1 z(t) (5.12)

e para separar as dinmicas das variveis y(t) que medimos e w(t) que iremos estimar, a a consideraremos a seguinte partiao: c T AT 1 = A11 A12 A21 A22 , T Bu = B1 B2 , CT 1 = I 0 (5.13)

Assim vemos que a dinmica das variveis que desejamos estimar regida pela a a e equaao diferencial c w(t) = A22 w(t) + A21 y(t) + B2 u(t) (5.14) Como em (5.1) os sinais y(t), u(t) so conhecidos porm agora desejamos obter uma a e estimativa wf (t) Rnny do sinal w(t) atravs de um ltro dinmico cujas entradas e a so os sinais conhecidos do sistema e cuja sa a estimativa wf (t), como ilustra a a da e gura 5.4. Uma representaao de estados genrica desse ltro indicada abaixo. c e e (t) = Af (t) + Bf u(t) + Cf y(t) wf (t) = Ff (t) + Hf u(t) + Gf y(t) (5.15)

5. Observadores de Estados e Filtragem

103

onde as matrizes Af , Bf , Cf , Gf , Hf , Ff devem ser determinadas tais que as seguintes condioes sejam satisfeitas: c (i) A estimativa wf (t) deve convergir para w(t) em regime permanente, i.e.
t

lim (w(t) wf (t)) = 0

(ii) A dinmica do erro de estimaao e(t) = w(t) wf (t) deve depender apenas da a c condiao inicial e(0) = w(0) wf (0). c Como visto na seo anterior, um ltro que satisfaz as condies acima denomica co e nado de observador de Luenberger. O observador denominado de ordem reduzida e quando o estado (t) do observador (5.15) possui dimenso inferior a do estado x(t) a que se deseja estimar. Dizemos que o observador de ordem m e nima quando o estado (t) do observador (5.15) possui dimenso igual ` n ny . a a O requisito (i) indica que no existe erro de estimao em regime permanente a ca enquanto (ii) indica que o erro de estimaao no depende dos sinais de entrada do ltro c a y(t), u(t) e portanto o projeto do observador e da lei de controle cam independentes. Observe que, no projeto de observadores de ordem completa, foi poss atender as vel condioes de Luenberger com Gf = 0, Hf = 0, Ff = I, ou seja o estado do observador c (t) a propria estimativa wf (t) = xf (t) Rn . Mostraremos a seguir que para o caso e de ordem reduzida podemos atender os requisitos acima com Hf = 0, Ff = I que nos leva ` seguinte expresso para a estimativa wf (t): a a wf (t) = Gf y(t) + (t) (5.16)

Para encontrar as demais matrizes do ltro observe que a dinmica do erro e(t) = a w(t) wf (t) dada por e e(t) = w(t) wf (t) = A21 y(t) + A22 w(t) + B2 u(t) (Gf y(t) + (t)) e como pode ser visto de (5.12) e (5.13) temos y(t) = A11 y(t) + A12 w(t) + B1 u(t). Logo e(t) = A21 y(t) + A22 w(t) + B2 u(t) Gf (A11 y(t) + A12 w(t) + B1 u(t)) Af (t) Cf y(t) Bf u(t) Como e(t) = w(t) wf (t) = w(t) Gf y(t) temos e(t) = Af e(t) + (A21 Gf A11 Cf + Af Gf )y(t) + (A22 Gf A12 Af )w(t) +(B2 Gf B1 Bf )u(t) y(t) u(t) estimador wf (t)

Figura 5.4: Diagrama de blocos de um estimador de estado genrico. e

104

5. Observadores de Estados e Filtragem

Para satisfazer o requisito (ii) devemos escolher Af = A22 Gf A12 , Bf = B2 Gf B1 , Cf = A21 Gf A11 + Af Gf que resulta no seguinte observador de ordem m nima (t) = Af (t) + (B2 Gf B1 )u(t) + (A21 Gf A11 + Af Gf )y(t) wf (t) = Gf y(t) + (t) , Af = A22 Gf A12 (5.18) (5.17)

que fornece uma estimativa wf (t) e cuja dinmica de erro de estimao dada por a ca e e(t) = (A22 Gf A12 )e(t) , e(t) = w(t) wf (t) (5.19)

Para que o requisito (ii) seja atingido a matriz de ganho Gf do observador deve ser projetada de tal forma que os autovalores da matriz A22 Gf A12 estejam todos no semi-plano complexo esquerdo. Na seao 5.1.1 foram apresentadas vrias tcnicas de c a e projeto para esse m. Finalmente observe que o problema original era encontrar uma estimativa xf (t) para o estado do sistema (5.1) estimando apenas as variveis w(t) para as quais no a a dispomos de medidores. Usando a relaao (5.11) temos c xf (t) = T 1 y(t) wf (t) (5.20)

onde wf (t) Rnny a estimativa dada pelo observador de ordem m e nima (5.18). Exerc cio 5.3 Mostre que a estimativa acima no apresenta erro em relao `s a ca a variveis medidas, isto Cxf (t) = y(t) e alm disso limt (x(t) xf (t)) = 0. a e e

5.3

Filtros H2

O problema tratado nas seoes precedentes trata da estimaao das variveis de c c a estado de um sistema. Em muitas aplicaes na rea de tratamento de sinais temos um co a problema similar conhecido como ltragem de sinais que pode ser descrito da seguinte forma. Considere um sinal y(t) gerado por um sistema com o seguinte modelo de estados x(t) = Ax(t) + Bu u(t) + Bw w(t) y(t) = Cx(t) + Dw w(t) z(t) = Cz x(t) x(0) = x0 (5.21)

onde x(t) Rn o vetor de estados do sistema de geraao do sinal, y(t) Rny a e c e nz parcela conhecida do sinal gerado, z(t) R a parcela no conhecida do sinal gerado e a e que desejamos estimar, u(t) Rnu um sinal de entrada conhecido, e w(t) Rnw e um sinal de entrada no conhecido que pode ser representado por um ru branco e a do com mdia nula e covarincia dada por: e a E[w(t)w(t) ] = W (t)

5. Observadores de Estados e Filtragem

105

sendo (t) um impulso na origem e W uma matriz positiva denida (ou semi-denida) constante. Suponha tambm que o estado inicial de (5.21) seja uma varivel aleatria e a o de mdia nula e de matriz de covarincia P0 , sendo no correlacionado com w(t). e a a Na representao acima o mesmo ru w(t) afeta a dinmica do sistema e a varivel ca do a a de sa da. Ru dos diferentes em cada uma das partes podem ser facilmente considerados bastando para isso particionar as matrizes Bw , Dw convenientemente como indicado abaixo. Com Bw = [B 0] e Dw = [0 D], e w = [w1 w2 ], o sinal w1 afeta a dinmica e a w2 o sinal de sa do sistema. da Considerando Cz = In , busca-se estimar todo o vetor de estados. Nesta seao desejamos estimar a varivel z(t) atravs de um ltro que deve ser c a e projetado de forma a minimizar o impacto que as diferentes realizaes do ru w(t) co do possa causar na estimao. Este problema foi resolvido no in da dcada de 60 por ca cio e Kalman (1960), e Kalman and Bucy (1961) e a soluo encontrada aquela que minica e miza a varincia do erro de estimaao para as diferentes realizaoes de w(t). Veremos a c c na sequncia que isto corresponde a minimizar a norma H2 do sistema que dene a e dinmica do erro de estimaao. a c Para que possamos apresentar o projeto do ltro e denir norma H2 para sistemas estocsticos alguns conhecimentos bsicos de variveis estocsticas se fazem necessrios. a a a a a Este o objetivo da prxima seo. e o ca

5.3.1

Norma H2 para sistemas estocsticos. a

Nesta seao apresentamos um resumo, extra de (Friedland, 1986), sobre os princ do cipais tpicos relacionados ` caracterizaao de variveis estocsticas e veremos como o a c a a podemos denir norma H2 para sistemas estocsticos. a O termo varivel estocstica pode ser interpretado como uma generalizaao do a a c conceito de varivel aleatria. Enquanto um processo estocstico gera resultados que a o a so funoes do tempo, que representamos por uma varivel estocstica, um processo a c a a aleatrio gera resultados que so nmeros, representados por uma varivel aleatria. o a u a o Por exemplo, vericar o resultado num jogo de dados um processo aleatrio enquanto e o o processo de efetuar a mediao de um sinal em cada realizao de um certo experimento c ca estocstico. O sistema (5.21) estocstico pois cada realizaao do sinal w(t) gera e a e a c como resposta sinais y(t), z(t). As estat sticas de uma varivel estocstica, como a mdia e varincia por exemplo, a a e a so denidas a partir da funao densidade de probabilidade (FDP) que representa a c estatisticamente o comportamento dessa varivel. a A FDP representa a probabilidade da varivel se encontrar num certo intervalo num a dado instante, isto , se Fdp (.) a FDP de uma certa varivel ento e e a a Fdp (x1 , t1 ) x1 = prob[x1 < x(t1 ) < x1 + x1 ] Por exemplo, se compararmos a FDP ` densidade de um certo l a quido, a probabilidade seria a massa desse l quido no volume em questo. a

106

5. Observadores de Estados e Filtragem

Na maior parte dos casos as variveis estocsticas so caracterizadas pelas esa a a tat sticas de 1a e 2a ordem. As estatisticas de primeira ordem so indicativos dos a desvios que esta varivel pode sofrer num instante genrico de tempo ao longo das a e poss veis realizaoes da varivel. As mais comuns so a mdia, a mdia quadrtica e a c a a e e a varincia denidas a seguir para o caso escalar. a

mdia (t) = E{x(t)} = e


2

x Fdp (x, t) dx

mdia quadrtica E{x (t)} = e a

x2 Fdp (x, t) dx

varincia 2 (t) = E{(x )2 } = a

(x )2 Fdp (x, t) dx

Observe que 2 (t) = E{(x )2 } = E{x2 2x + 2 } = E{x2 } 2 . As estatisticas de segunda ordem dizem respeito ao valor da varivel em dois insa tantes de tempo distintos ao longo das poss veis realizaoes da varivel. A mais comum c a a correlaao denida a seguir tambm para o caso escalar. e c e

correlao (t, ) = E{x(t) x( )} = ca

x1 x2 Fdp (x1 , x2 ; t, ) dx1 dx2

O s mbolo E{} representa a esperana matemtica do sinal {} e signica o valor mdio c a e de {} calculado no sentido probabil stico que diferente do valor mdio determin e e stico dado por T 2 1 x(t) dt x= T T 2 Apesar da dupla integral que dene a funo de correlaao ela se reduz ` mdia ca c a e quadrtica quando t = . Isto pode ser vericado da seguinte forma. Com t = a temos

(t, t) = E{x(t) x(t)} =

x1 x2 Fdp (x1 , x2 ; t, t) dx1 dx2

(5.22)

Porm e Fdp (x1 , x2 ; t, t) dx1 dx2 = P rob [x1 < x(t) < x1 + dx1 , x2 < x(t) < x2 + dx2 ] e como x(t) no pode estar nos intervalos x1 < x(t) < x1 + dx1 e x2 < x(t) < x2 + dx2 a no mesmo instante a menos que x1 = x2 temos Fdp (x1 , x2 ; t, t) dx1 dx2 = Fdp (x1 ; t) (x1 x2 ) dx1 dx2 onde (x1 x2 ) denota um impulso para x1 x2 = 0. Substituindo a expresso acima a em (5.22) e integrando para o impulso temos o resultado desejado

(t, t) =

x2 Fdp (x1 ; t) dx1 = E{x(t)2 } 1

5. Observadores de Estados e Filtragem

107

Como a FDP dicilmente conhecida na prtica, as estat e a sticas exatas denidas atravs do operador E{} possuem interesse apenas terico. Do ponto de vista prtico e o a podemos obter aproximaes das estat co sticas do sinal atravs das suas amostras dando e origem ` estat a sticas emp ricas indicadas abaixo.
N

mdia e

1 x(t) = N

xi (t)
i=1 N

mdia quadrtica e a

x2 (t)

1 = N

x2 (t) i
i=1

varincia a

v(t) = x2 (t) (x(t))2


N

correlao ca

1 r(t, ) = N

xi (t) xi ( )
i=1

Observe que nas denioes emp c ricas acima a correlao para t = coincide com a ca mdia quadrtica e quando a mdia nula a varincia coincide com a mdia quadrtica. e a e e a e a Para um sinal vetorial na forma x1 (t) E{x1 (t)} . . . e e x(t) = . Rn a mdia dada por E{x(t)} = . . xn (t) E{xn (t)} e a correlaao uma matriz simtrica dada por c e e E{x1 (t)x1 ( )} . . . E{x1 (t)xn ( )} . . ... . . R(t, ) = E{x(t)x( ) } = . . E{xn (t)x1 ( )} . . . E{xn (t)xn ( )} Os elementos da diagonal E{xi (t)xi ( )} so as funoes de autocorrelaao dos sinais a c c xi (t). Os elementos fora da diagonal E{xi (t)xj ( )} so as funoes de correlaao cruzada. a c c Um caso especial importante ocorre quando t = . A matriz R(t, t) chamada de e matriz de covarincia do sinal e positiva denida (ou semi-denida). Observe que se a e x(t) possui mdia nula ento sua varincia, denida por E{x(t) x(t)}, pode ser obtida e a a atravs do trao da matriz de covarincia R(t, t) da seguinte forma e c a E{x(t) x(t)} = E{tr{x(t)x(t) }} = tr{E{x(t)x(t) }} = tr{R(t, t)} (5.23)

Quando E{xi (t)xj ( )} nula dizemos que os sinais xi (t) e xj (t) so noe a a correlacionados. Observe que isto no implica que eles sejam estatisticamente indea

108

5. Observadores de Estados e Filtragem

pendentes. Para que isto ocorra a FDP conjunta de xi (t) e xj (t) deve ser o produto das FDP individuais. Um processo que d origem ` uma varivel estocstica onde sua FDP satisfaz a a a a a relaao c Fdp (x, t + ) = Fdp (x, t), chamado processo estacionrio indicando que as estat e a sticas no se alteram com desa locamentos no tempo. Quando as estat sticas tomadas sobre o conjunto dos resultados dos experimentos coincidem com as estat sticas temporais de cada experimento, dizemos que o processo que gera esses resultados ergdico. Observe que um processo ergdico precisa ser e o o estacionrio. Num processo ergdico o resultado de um unico experimento represena o e tativo de todos os resultados poss veis de serem obtidos. Assim, num processo ergdico o temos: T 1 2 mdia (t) = lim e x(t) dt T T T 2 1 mdia quadrtica (t) = lim e a T T
2
T 2

(x(t) (t))2 dt

T 2

1 correlao ( ) = lim ca T T

T 2

x(t) x(t + ) dt

T 2

Uma varivel estocstica w(t) chamada de ru branco se ela possuir mdia nula a a e do e (E{w(t)} = 0) e se sua matrix de correlao for dada por ca R( ) = W ( ) = E{w(t)w(t + ) } (5.24)

onde W > 0 (ou W 0) a matriz de covarincia do ru e ( ) um impulso e a do e unitrio na origem. Da vemos que um ru branco um sinal no correlacionado a do e a no tempo pois ( ) = 0 para = 0. Alm disso a transformada de Fourier da funo e ca 2 de correlao de um ru branco uma constante dada pela matriz W . Por ter ca do e uma funo de correlaao expressa atravs de um impulso, o ru branco um sinal ca c e do e que no existe no mundo real. Porm, devido `s suas propriedades ele tem um papel a e a fundamental na anlise de sinais que comparado ao papel do impulso na teoria de a e sistemas lineares. Note que a resposta de um sistema linear invariante estvel ` um ru branco a a do tambm um sinal de mdia nula3 . Para vericar isso seja (t) a matriz de transio e e e ca de estados um sistema linear invariante causal. Assim sua resposta a um sinal w(t) com w(t) = 0, t < 0 e
t

y(t) =
0
2

(t )w( ) d

A transformada de Fourier da funo de correlao conhecida em tratamento de sinais como ca ca e espectro de potncia do sinal pois o mdulo da transformada numa certa frequncia indica a potncia e o e e do sinal nessa frequncia. e 3 Na realidade a sa ter mdia nula para qualquer sinal de entrada de mdia nula. da a e e

5. Observadores de Estados e Filtragem de onde obtemos4


t t

109

E{y(t)} = E{
0

(t )w( ) d } =
0

(t )E{w( )} d

Logo se E{w(t)} = 0 temos E{y(t)} = 0. A varincia do sinal de resposta a um ru branco pode ser interpretada como a a do norma H2 do sistema pois possui as mesmas propriedades da norma H2 denida em (3.88). Para vericar essa analogia seja h(t) = L1 [H(s)] a transformada inversa da matriz de transferncia do sistema. Usando linearidade e superposiao, vimos no nal e c da seo 3.4 podemos interpretar a matriz h(t) como sendo a resposta impulsional do ca sistema. Observe ainda que h(t) = 0 para t < 0 pois h(t) representa a resposta de um sistema causal para um impulso na origem. Considere um ru branco w(t) com do w(t) = 0, t < 0 e covarincia identidade, isto satisfaz (5.24) com W = I. A resposta a e do sistema dada pela integral de convoluao e c
t

z(t) =
0

h(t )w( ) d =

h(t )w( ) d

(5.25)

e a varincia da resposta z(t) obtida a partir da expresso (5.23) de onde vem a e a E{z(t) z(t)} = E{tr{z(t)z(t) }}

= E tr

h(t )w( )w() h(t ) d d tr {h(t ) E {w( )w() } h(t ) } d d

Usando a propriedade (5.24) que caracteriza um ru branco de covarincia identidade do a temos E {w( )w() } = ( )I onde ( ) representa um impulso em = . Levando esta identidade na expresso acima e usando a propriedade do impulso a f (t)(t t0 ) dt = f (t0 ) temos

E{z(t) z(t)} =

tr {h(t )h(t ) } d

Com a mudana de varivel = t temos d = d para qualquer instante de c a tempo t dado. Alm disso, como h() = 0 , < 0 obtemos o resultado desejado e

E{z(t) z(t)} =
0

tr {h()h() } d = h(t)

2 2

(5.26)

de onde vemos que a varincia da resposta ao ru branco a norma H2 do sistema a do e como denida em (3.88) atravs da resposta ao impulso. e E interessante notar que apesar da norma 2 ser uma medida da energia da resposta ao impulso, a varincia do sinal de sa E{z(t) z(t)} no tem interpretaao em termos a da a c de energia j que z(t) z(t) est relacionado com o potncia do sinal z(t). a a e
Note que a esperana matemtica E{.} tomada em relao `s poss c a e ca a veis realizaes de w(t) e co (t ) a mesma para todas as realizaes. Logo E{(t )w( )} = (t )E{w( )}. e co
4

110

5. Observadores de Estados e Filtragem

5.3.2

Projeto do ltro H2 : varincia m a nima.

Nesta seao desejamos projetar um ltro para estimar a varivel z(t) no sistema c a (5.21) de tal forma que a varincia do erro de estimao seja minimizada. Em outras a ca palavras, desejamos encontrar uma estimativa zf (t) da varivel z(t) de tal forma que a a funo custo J, denida como a varincia do erro de estimao ca a ca J = E{e(t) e(t)} , e(t) = z(t) zf (t)

seja minimizada. A partir da identidade (5.26) vemos que este problema corresponde a minimizar a norma H2 do sistema que dene a dinmica do erro de estimaao. O ltro que a c 5 procuramos tem a forma de um observador de Luenberger xf (t) = Axf (t) + Bu u(t) + Kf (y(t) Cxf (t)) zf (t) = Cz xf (t) (5.27)

onde agora a matriz de ganho Kf deve ser escolhida de forma que a varincia do erro a de estimao seja minimizada. ca A soluao clssica para esse problema dada em termos de equaao de Riccati c a e c (Friedland, 1986),(Anderson and Moore, 1979),(Greeen and Limebeer, 1995). Na sequncia apresentamos uma soluo atravs de uma formulao LMI. e ca e ca Considerando as equaoes que denem a dinmica do sistema (5.21) e do ltro c a (5.27) e denindo a seguinte varivel auxiliar xa (t) = x(t)xf (t), constri-se o seguinte a o sistema do erro de estimaao: c xa (t) = (A Kf C)xa (t) + (Bw Kf Dw )w(t), e(t) = Cz xa (t) xa (t) = x(t) xf (t) e(t) = z(t) zf (t) (5.28)

Usando (5.26) e os resultados da seao 3.4 o ltro timo pode ser projetado atravs do c o e seguinte problema de otimizaao: c
P,Kf

min J = Hwe (s)

2 2

= E[e (t)e(t)] < tr{(Bw Kf Dw ) P (Bw Kf Dw )}

onde P > 0, Kf so soluoes da seguinte desigualdade: a c A P C Kf P + P A P Kf C + Cz Cz < 0 Considerando a mudana de varivel X = P Kf , pode-se transformar o problema c a acima numa LMI de maneira anloga aos resultados na seao 4.5. Assim procedendo a c obtemos o seguinte teorema. a a Teorema 5.3 Considere o sistema (5.21), com o par (A, C) detectvel. Ento existem matrizes P , N e X que resolvem o seguinte problema
A prova completa que o ltro timo tem a estrutura indicada pode ser encontrada por exemplo o em (Anderson and Moore, 1979),(Greeen and Limebeer, 1995).
5

5. Observadores de Estados e Filtragem

111

N,P,X

min Tr[N ]; N Bw P Dw X P Bw XDw P > 0; P > 0;

(5.29) (5.30) (5.31)

A P + P A C X XC + Cz Cz < 0.

Com Kf = P 1 X o sistema do erro de estimao (5.28) exponencialmente estvel, ca e a a varincia do erro de estimao (5.28) minimizada e o valor m a ca e nimo dado por e Tr[N ]. A prova deste resultado pode ser obtida diretamente da deniao da norma H2 c vista no Cap tulo 3. Exemplo 5.3 Considere o modelo aproximado de um pndulo invertido, descrito pela e seguinte equao diferencial: ca x= y= z= 0 1 0.5 0 1 0 1 0 x+ x+ x 0 1 0 1 u+ w 0 0 1 0 w, x(0) = 0, x = x1 x2 (5.32)

e Onde x1 = a posiao angular e x2 = a velocidade angular. Assume-se neste e c exemplo que o sinal de perturbao w do tipo ru branco. Note que pela estrutura ca e do das matrizes Bw e Dw , o sinal de rudo afeta de forma distinta a dinmica do sistema a e o sinal de medida. O objetivo projetar o ltro timo, de forma a estimar o vetor e o de estados z(t), que no caso implica em estimar a posio angular do pndulo. ca e Para projetar o ltro timo (5.27), aplica-se o Teorema 5.3 ao sistema do erro de o estimao (5.28). Usando o LMITOOL obtm-se o seguinte ganho: ca e kf ! ! = P^{-1}X

- 1.7989207 ! - 1.6180146 !

Sendo que a varincia do erro de estimao dada por a ca e -->J=trace(N) ans = 1.7989074

112

5. Observadores de Estados e Filtragem

Observe que para o projeto do ganho Kf do ltro (5.27), no levado em conta o a e sinal de controle u. Assumindo u = 0, poss vericar que o sistema no forado e vel a c e instvel com plos em 0.7071. A Figura 5.5 apresenta a trajetria do sinal z(t) para a o o o sistema no forado e a sua estimativa zf (t), onde o sistema excitado por um sinal a c e de ru branco com varincia de 0.2 na dinmica do sistema e 0.4 no sinal de sa do a a da.
50 45 40 35 30 25 20 15 10 5 0 t(s) 5 0 1 2 3 4 5 6 7 8 estado estimado estado real

Figura 5.5: Trajetria de z(t) e sua estimativa zf (t) o Pode-se perceber pelo grco que o estado estimado zf (t), segue a trajetria instvel a o a do sinal original z(t), amenizando o efeito dos ru dos.

5.4

Filtros H

Nesta seao apresenta-se uma tcnica baseada em LMIs para o projeto de ltros c e H . Diferentemente do caso H2 onde o sinal de perturbao um ru branco, ca e do de covarincia conhecida, e o objetivo minimizar a varincia do erro de estimaao, a e a c considera-se agora que o sinal de perturbao desconhecido, nem tampouco suas ca e estat sticas so conhecidas, sabe-se apenas que possui energia limitada. O ltro deve a ser projetado para minimizar a norma H do sistema que dene o erro de estimao. ca Para esse m consideraremos o seguinte sistema

5. Observadores de Estados e Filtragem

113

x(t) = Ax(t) + Bu u(t) + Bw w(t) y(t) = Cx(t) + Dw w(t) z(t) = Cz x(t)

x(0) = x0 (5.33)

onde w um processo com estat e sticas desconhecidas, mas pertencente a L2 . O objetivo projetar um ltro F para minimizar, no sentido da norma H , o efeito das e perturbaes w na dinmica do erro de estimaao e(t) = z(t) zf (t), ou seja: co a c min (max Hwe (s)
F w )

Assume-se uma estrutura para o ltro similar ` utilizada no ltro H2 , dada por: a xf (t) = Axf (t) + Bu u(t) + Kf (y(t) Cxf (t)) zf (t) = Cz xf (t) (5.34)

Com a estrutura acima, o projeto do ltro se resume na determinaao do ganho c Kf . Da dinmica do sistema (5.33) e do ltro (5.34), pode-se construir o sistema que a dene a dinmica do erro de estimaao xa (t) =: x(t) xf (t). a c xa (t) = (A Kf C)x(t) + (Bw Kf Dw )w(t) e(t) = Cz xa (t) (5.35)

Note que este problema pode ser visto como um problema dual do problema de controle H visto na Seo 4.6. Desta forma a busca de uma soluao consiste em ca c encontrar a matriz de ganho Kf juntamente com a matriz P de forma que a seguinte inequaao seja satisfeita. c P > 0, P A + A P XC X C min : P,X Bw P D w X Cz

P Bw XDw Cz Inz 0 <0 0 Inz

(5.36)

O prximo teorema apresenta a formalizaao para o projeto de ltros H para o sistema o c (5.33). Teorema 5.4 Dado um sistema (5.33), onde o par (A, C) detectvel. Suponha que e a existam matrizes P , X e um escalar que seja soluo do problema de otimizao ca ca dado em (5.36). Ento o ltro (5.34) com Kf = P 1 X, assegura que a norma H do sistema do a erro de estimao (5.35) seja menor que para todo o sinal de perturbao w L2 . ca ca Exemplo 5.4 Considere o sistema (5.32), assumindo agora que w um sinal com e estatstica desconhecida, mas limitado pertencente a L2 . O objetivo projetar um ltro e de forma a estimar o vetor de estados z(t), garantindo que a norma H , do sistema do erro de estimao seja menor que . ca Aplicando o Teorema 5.4, limitando P > 1e 3I, obtm-se = 1.0010634, com o e seguinte ganho.

114

5. Observadores de Estados e Filtragem

optimal solution found kf = ! 666.74715 ! ! 471.96063 !

As Figuras 5.7 e 5.6 apresentam, respectivamente, o digrama de bode do sistema no forado e a trajetria do sinal de erro quando o sinal de perturbao w = [w1 w2 ] a c o ca dado por: e w1 = 1 0 < t 1s , w2 = 0 t > 1s sen(0.1t) 0 < t 10s 0 t > 10s

Enquanto que a Figura 5.8 apresenta a trajetria do sinal z(t), e sua estimativa zf (t), o para o sistema no forado. a c

0.12 e(t) 0.1

0.08

0.06

0.04

0.02

0.02

0.04 t(s) 0.06 0 1 2 3 4 5 6 7 8 9 10

Figura 5.6: Trajetria do sinal de erro e= z(t) zf (t) o

5. Observadores de Estados e Filtragem

115

From: w1
0 20 40 Magnitude (dB) 60 80

From: w2

100 120 140 160 180

10

10

10 10 Frequency (rad/sec)

10

10

Figura 5.7: Diagrama de bode(Mdulo) do sistema no forado (5.32) o a c

5.5 5.6

Filtragem para sistemas incertos Exerc cios Propostos


0 0 1 0 0 0 x = 1 1 0 1 1 0 1 0 0 0 y = 0 1 0 0 Estime: (a) todos os estados do sistema (b) todos os estados do sistema de forma que erro de estimaao tenha todos os c autovalores menores que 3. (c) apenas as variveis no mensurveis de x, garantindo que os autovalores do a a a erro de estimao estejam no semi-plano esquerdo do nmeros complexos. ca u 0 1 x + 0 0 x 0 0 u 1 0

E 3.1 Para o seguinte sistema

(5.37)

116

5. Observadores de Estados e Filtragem

3.5

2.5

1.5

z(t) zf(t)

0.5 t(s) 0 0 0.5 1 1.5 2 2.5 3

Figura 5.8: Trajetria z(t) e sua estimativa zf (t) o (d) apenas as variveis no mensurveis de x, garantindo agora que os autovalores a a a do erro de estimaao estejam num c c rculo de raio 2 e centro em (-3,1). E 3.2 E poss fazer o projeto de observadores atravs da metodologia LMI usando vel e a abordagem primal? Por que? E 3.3 Para o sistema (a) considerado no Exemplo E 1.2 com y = [1 z = [1 0], projete um ltro para os seguintes casos: (a) quando w for um sinal de ru branco. do (b) quando w for um sinal de estat sticas desconhecidas, mas limitado. E 3.3 Projete o ltro de Kalman para o sistema (c) considerado no Exerc E 1.2, cio 0 0 1 0 quando y = x + w2 . 0 0 1 1 0]x + 0.5w e

Cap tulo 6 Controle por realimentao de ca Sa da


No cap tulo 4, utilizou-se a realimentaao de estados para o controle (estabilizaao c c e desempenho) de sistemas lineares invariantes no tempo. Entretanto, os resultados propostos necessitam da medio de todos os estados do sistema. Em geral nem todos ca os estados do sistema dinmico esto dispon a a veis para realimentao. Por exemplo, ca para sistemas monovariveis o unico estado dispon a vel para realimentao a sa ca e da deste sistema. Nestes casos, a implementaao de uma lei de controle por realimentao c ca de estados necessita de sensores para as variveis restantes o que em muitas situaoes a c sicamente imposs ou mesmo economicamente invivel. e vel a Veremos neste cap tulo que os mesmos ganhos de realimentaao de estados apresenc tados no cap tulo 4 podem ser usados para realimentar os estados estimados oriundos dos observadores do cap tulo anterior eliminando-se assim a necessidade de medidores para todas as variveis de estado. A estabilidade do sistema realimentado via observaa dor ser mostrada aqui atravs de um resultado que cou conhecido como princ a e pio da separao. ca Observe que uma lei de controle baseada em observadores uma forma particular de e realimentaao dinmica de sa onde o controlador possui a mesma ordem do sistema c a da a ser controlado. Veremos ainda neste cap tulo tcnicas de projeto de controladores de e mesma ordem do sistema que no utilizam de forma explicita um observador na malha a de realimentaao. Nesses casos o princ c pio da separaao no se aplica e a estabilidade c a ser mostrada de outra forma. Em primeiro lugar consideraremos leis de controle a baseadas na realimentaao dos estados estimados. Posteriormente, propem-se soluoes c o c em termos de LMIs para o problema da realimentao dinmica da sa considerando ca a da a estabilizao, controle H2 e H . Para simplicar a anlise, considera-se por hiptese ca a o que o sistema seja controlvel e observvel. a a

6.1

Controle via observador de estados

Uma das formas de controle por realimentaao de sa consiste em utilizar as c da variveis medidas para estimar o estado atravs de um observador e construir o sinal a e de controle atravs de uma realimentao do estado estimado. O observador projetado e ca e

118

6. Controle por realimentao de Sa ca da

com as tcnicas do cap e tulo 5 e o ganho de realimentaao de estados com as tcnicas c e do cap tulo 4. Nesta seao veremos sob que condies o sistema de malha fechada c co projetado dessa forma estvel. Em seguida veremos o efeito de ru e a dos e distrbios u nesse esquema de controle e nalmente veremos como esse esquema de controle pode ser usado para o rastreamento de referncia. e

6.1.1

Princ pio da Separao ca


+

Considere o esquema de controle ilustrado no diagrama da Figura 6.1 e observe que


r u + x = Ax + Bu u x C y

xf

xf = (A Kf C)xf + Bu u + Kf y

Figura 6.1: Realimentaao dos estados observados. c podemos represent-lo pelo seguinte conjunto de equaoes: a c x(t) = Ax(t) + Bu u(t) , y(t) = Cx(t) xf (t) = (A Kf C)xf (t) + Bu u(t) + Kf y(t) , (6.1) u(t) = Kxf (t) + r(t) (6.2)

onde x Rn representa o estado do sistema a ser controlado, y Rny o vetor de medidas, u Rnu o vetor de controle, xf Rn representa o vetor dos estados estimados, r Rnu a entrada de referncia e A, Bu , C, K, Kf so matrizes constantes com e e a dimenses apropriadas. o Utilizando como variveis de estado os vetores x(t) e o erro de estimaao e(t) = a c x(t) xf (t), o sistema (6.1) em malha fechada tem a seguinte representaao no espao c c de estados: x e = y = A + Bu K Bu K 0 A Kf C x C 0 e x e + Bu 0 r (6.3)

Os autovalores da matriz de dinmica do sistema de malha fechada so dados pela a a equaao caracter c stica indicada abaixo1 . ec(s) = det sI2n = det A + Bu K Bu K 0 A Kf C (6.4) (6.5)

sIn (A + Bu K) Bu K 0 sIn (A Kf C) = det (sIn (A + Bu K)) det (sIn (A Kf C)) = 0


1

A notao Im indica a matriz identidade de dimenso m m. ca a

6. Controle por realimentao de Sa ca da

119

Assim vemos que a dinmica do sistema de malha fechada regida pelos autovalores das a e matrizes A + Bu K e A Kf C que devem estar todos no semi-plano complexo esquerdo para que o sistema realimentado seja estvel. Os autovalores de A Kf C denem a a dinmica do erro de estimaao de estados, como pode ser visto a partir de (6.3). Por a c outro lado, os autovalores de A + Bu K podem ser interpretados como os autovalores dominantes pois so esses autovalores que denem a dinmica do sistema realimentado a a quando o erro de estimao de estados nulo. Tipicamente a dinmica do erro de ca e a estimaao escolhida de duas ` cinco vezes mais rpida que a dinmica dominante c e a a a representada pelos autovalores de A + Bu K. Em resumo, o projeto de controladores baseados em observadores de estado pode ser realizado da seguinte maneira: i. Projetar a matriz de realimentaao de estados K Rnu n utilizando as tcnicas c e propostas no Cap tulo 4. ii. Projetar a matriz de ganhos do observador Kf Rnny utilizando os resultados apresentados no Cap tulo 5; iii. Utilizar a estrutura de controle proposta na Figura 6.1. Observe que o projeto do ganho de controle e do observador so independentes. Esta a propriedade conhecida na literatura por Princ e pio da Separao(Friedland, 1986). ca O princ pio da separaao tambm se aplica para observadores de ordem reduzida. c e Exerc cio 6.1 Obtenha a representao de estados do sistema ca x = Ax + Bu u , y = Cx , u = Kxf + r

onde xf a estimativa de estado dada pelo observador de ordem reduzida (5.20). Utie lizando como variveis de estado x(t) e e(t) = w(t) wf (t), mostre que a x e onde T0 = caso. 0 Inny = A + Bu K Bu KT 1 T0 0 A22 Gf A12 x e + Bu 0 r

e portanto o princpio da separao tambm se aplica nesse ca e

Veja na gura 6.2 que podemos interpretar o controle baseado em observador como um controlador de mesma ordem do sistema de malha aberta. r xf = (A LC + Bu K)xf + Ly + Bu r u = Kxf + r u x = Ax + Bu u y = Cx y

Figura 6.2: Controlador baseado num observador.

120

6. Controle por realimentao de Sa ca da

6.1.2

Efeito de ru dos e dist rbios externos u

Ru dos de medida e distrbios externos sempre esto presentes num problema u a prtico. Nesta seo iremos vericar o efeito desses sinais indesejados no desempea ca nho do sistema de controle baseado em observador. Para esse m considere o sistema de controle cuja representao de estados est ca a indicada a seguir. x(t) = Ax(t) + Bu u(t) + Bd d(t) , y(t) = Cx(t) + v(t) xf (t) = (A Kf C)xf (t) + Bu u(t) + Kf y(t) , u(t) = Kxf (t) (6.6) (6.7)

onde x Rn o estado do sistema a ser controlado xf Rn representa o vetor dos e estados estimados, y Rny o vetor de medidas, d Rnd o vetor de distrbios e e u nv nu externos, v R o vetor de ru de medida, u R o vetor de controle, e e do e A, Bu , Bd , C, K, Kf so matrizes constantes com dimenses apropriadas. a o Utilizando como variveis de estado os vetores x(t) e o erro de estimaao e(t) = a c x(t) xf (t), o sistema (6.6) em malha fechada tem a seguinte representaao no espao c c de estados: x e = y = A + Bu K Bu K 0 A Kf C x C 0 +v e x e + Bd d Bd d K f v

(6.8)

Da equaao acima podemos vericar que a presena de ru c c dos e distrbios no mudam u a a matriz de dinmica do sistema e seus autovalores continuam sendo dados por (6.4). a Como o sistema projetado para ser estvel, conclu e a mos de (6.8) que ru dos e distrbios u funcionam como referncias indesejadas que o sistema de malha fechada ser forado e a c a seguir. Na presena de ru c dos e distrbios o erro de estimaao no ser nulo j que u c a a a a dinmica do erro excitada pela condiao inicial e(0) mas tambm por d(t) e v(t) a e c e como se v na expresso abaixo. e a e = (A Kf C)e + Bd d Kf v (6.9)

Observe ainda que a matriz Kf de ganho do observador tambm a matriz de entrada e e do ru de medida. Assim, se aumentamos o ganho Kf para acelerar a convergncia do do e erro de estimaao de estados, estamos tambm forando o erro de estimao a seguir c e c ca um ru agora amplicado por Kf . Por esse motivo observadores de estados com do ganhos elevados tem pouco interesse na prtica. a Outro motivo para se evitar grandes ganhos no observador que o sinal de controle, e que dado por u(t) = Kxf (t) = K(x(t) e(t)), pode saturar se o erro atingir valores e elevados. As mesmas concluses acima se aplicam para observadores de ordem reduzida. Eso tes, porm, possuem uma diculdade adicional. No observador de ordem completa, a e funao de transferncia do ru para o erro de estimaao estritamente prpria. c e do c e o E(s) = (sIn (A Kf C))1 (Bd D(s) Kf V (s))

6. Controle por realimentao de Sa ca da

121

Isto implica que teremos uma atenuaao nas altas frequncias de no m c e nimo 20 dB/dcada. No observador de ordem reduzida pode ocorrer amplicao nas altas e ca frequncias j que o erro de estimao e(t) = w(t) wf (t) dado por e a ca e e(t) = Af e(t) + (B4 Gf B3 )d(t) + Af Gf v(t) Gf v(t) , T Bd = B3 B4

onde Bd a matriz de entrada da perturbaao d(t) como indicado em (6.6), T a e c e transformaao em (5.11) e w(t) a estimativa de ordem reduzida dada por (5.19). Da c e expresso acima obtemos a funao de transferncia a c e E(s) = (sInny Af )1 ((B4 Gf B3 )D(s) + Af Gf V (s) Gf s V (s)) de onde notamos que o termo (sInny Af )1 Gf sV (s) pode provocar amplicaoes c do ru V (s) nas altas frequncias. Isto altamente indesejvel na prtica pois, ao do e e a a aumentar a banda passante do sistema, estamos permitindo amplicaoes de dinmicas c a no modeladas que podem causar deterioraao no desempenho do sistema ou mesmo a c problemas de instabilidade. Por esses motivos a utilizao de observadores de Luenca berger de ordem reduzida para ns de controle tem aplicao limitada na prtica. ca a Finalmente observe que se o distrbio d(t) conhecido em tempo real, por exemplo u e atravs de medioes, ento podemos interpret-lo como um sinal de referncia e incore c a a e por-lo no observador. Este procedimento anlogo ao dado para o sinal r(t) na seao a e a c 6.1.1.

6.1.3

Rastreamento

Suponha agora que os ru dos e distrbios sejam desprez u veis e que desejamos resolver o problema de rastreamento da seao 4.1.2, porm agora utilizando um controlador c e baseado em observador ao invs da realimentaao de estados. A soluao desse problema e c c imediata com o aux do princ e lio pio da separaao. c No caso do rastreamento com ajuste de ganho esttico basta projetar um observaa dor e substituir a realimentao de estados u = Kx pela realimentaao de estados ca c estimados u = Kxf , como indicado na gura 6.3. Nesse caso a inserao do observador c no altera o ganho esttico G(0), calculado para realimentao de estados. Isso ocorre a a ca porque em regime permanente o erro de estimao de estados nulo, isto x = xf . ca e e Assim a matriz F de ajuste idntica ` obtida para realimentao de estados. e e a ca F = G(0)1 , G(s) = C(sI (A BK))1 B + D

No caso do rastreamento com integradores os argumentos so similares. Basta a projetar um observador e substituir a realimentaao de estados u = Ke x pela realic mentaao de estados estimados u = Ke xf , como indicado na gura 6.4. Nesse caso, c as equaes do sistema de controle so dadas por co a xa e A 0 C 0 = A a Ba K a BKe 0 A Kf C B 0 0 I xa e + Ea 0 r

onde e = x xf o erro de estimao de estados, Kf o ganho do observador e e ca e Aa = , Ba = , Ea = , xa = x , Ka = Ke Ki

122
+ + u K xf

6. Controle por realimentao de Sa ca da

x = Ax + B(u + r) x

xf = (A Kf C)xf + B(u + r) + Kf y

Figura 6.3: Rastreamento com correao de ganho esttico e observador. c a O problema a ser resolvido consiste ento em determinar Kf e Ka de tal forma que a os autovalores de Aa Ba Ka e A Kf C estejam no semi-plano complexo esquerdo. Com o princ pio da separaao podemos projetar o ganho Kf como no cap c tulo 5 e de forma independente projetar a matriz de ganhos Ka como na seo 4.1.2. ca Observe que em regime permanente o erro de estimaao de estados nulo, isto c e e x = xf . Logo o esquema de controle acima, baseado em observador, se torna em regime permanente, idntico ao esquema baseado em realimentao de estados estudado na e ca seao 4.1.2. Entretanto, devido ` sensibilidade do observador em relao ` mudanas c a ca a c no ponto de equil brio, podemos esperar um menor grau de robustez do esquema acima (em relao ao de realimentaao de estados) para mudanas no ponto de equil ca c c brio.
r +
1 s

Ki Ke

x = Ax + Bu

xf

xf = (A Kf C)xf + Bu + Kf y

Figura 6.4: Rastreamento com integradores. Exemplo 6.1 Considere o sistema linear (4.21) com o seguinte sinal de sa da: y= 1 0 0 1 1 0 x (6.10)

Utilizando o Corolrio 5.1, obtm-se a seguinte matriz de ganhos do observador: a e Kf = ! .1118538 ! .1481152 ! - 4.0504938 .3880439 ! .4449873 ! 3.0257949 !

Considere a mesma matriz K obtida no exemplo 4.2 como a matriz de realimentao ca dos estados observados. As Figuras 6.5 e 6.6 mostram respectivamente as trajetrias o

6. Controle por realimentao de Sa ca da


2.6

123

2.2

1.8

1.4

1.0

f
0.6

0.2

PSfrag replacements e1 (t) 0.6 e2 (t) e3 (t) 1.0 t(s)

0.2

g
0 1 2 3 4 5 6 7 8

t
9 10

Figura 6.5: Trajetrias do sinal de erro e(t) = x(t) xf (t). o do sinal de erro e(t) = x(t) xf (t) e do sistema em malha fechada para uma condio ca inicial x(0) = [ 2 1 1 ] e xf (0) = 0 com r(t) = 0. Comparando o resultado apresentado na gura 6.6 com o resultado obtido no exemplo 4.2, observa-se que ocorreu uma certa degradao na resposta transitria do sistema ca o em malha fechada. Entretanto, pode-se melhorar a resposta em malha fechada atravs e de uma adequada localizao dos plos do observador utilizando os resultados apresentaca o dos na seo 5.1. Em outras palavras, projeta-se a dinmica do observador de maneira ca a a no interferir na dinmica do sistema em malha fechada com isso aproxima-se da a a resposta transitria obtida com realimentao de estados. o ca

6.2

Controlador LQG

O controlador LQG uma combinaao do controlador LQR, que minimiza um e c critrio quadrtico, e de um observador particular, chamado de Filtro de Kalman, que e a projetado para minimizar a varincia do erro de estimaao. e a c O sistema agora ser descrito por: a x = Ax + Bu + w y = Cx + v (6.11)

onde x Rn o estado do sistema, y Rq o vetor de medidas contaminado pelo e e q m ru v R , u R o vetor de controle a ser determinado, w Rn o vetor de do e e perturbao, A, B, C so matrizes dadas que denem o modelo do sistema. O ru de ca a do

124
3

6. Controle por realimentao de Sa ca da

x
2

Sfrag replacements 2 x1 (t) x2 (t) x3 (t) 3 t(s)

t
0 1 2 3 4 5 6 7 8 9 10

Figura 6.6: Trajetrias do sistema (4.21) em malha fechada com observador de estados. o medida v(t) e a perturbaao w(t) sero considerados como variveis estocsticas para c a a a 2 as quais se conhece apenas a mdia e a varincia . e a Em relaao ao sistema (6.11) assumiremos: c v(t), w(t) so ru a dos brancos, isto , variveis estocsticas de mdia nula e a a e (E{w(t)} = 0, E{v(t)} = 0) e no correlacionadas no tempo: a E{v(t) v( ) } = 0 , E{w(t) w( ) } = 0 para t =

v(t), w(t) so no correlacionadas entre si: a a E{v(t) w(t) } = 0 v(t), w(t) possuem matrizes de covarincia conhecidas: a E{w(t) w(t) } = Qw 0 , E{v(t) v(t) } = Rv > 0

Observe que a condiao Rv > 0 implica que todas as medidas so contaminadas por c a ru do. Por outro lado, a hiptese Qw 0 nos permite considerar casos em que algumas o componentes de w(t) so nulas o tempo todo. a
2

Veja seao 5.3.1 para um resumo sobre variveis estocsticas. c a a

6. Controle por realimentao de Sa ca da

125

Problema: Encontre uma lei de controle u(t) que, ao ser aplicada no sistema (6.11), minimiza a funao custo. c
T

J = lim E{
T 0

(x Qx + u Ru)dt}

onde Q 0, R > 0 so matrizes de ponderaao dadas como no problema LQR estudado a c na seo 4.3. ca A demonstrao de como resolver este problema, conhecido como LQG, pode ser ca encontrada em vrios livros como por exemplo (Greeen and Limebeer, 1995; Andera son and Moore, 1979; Burl, 1999; Friedland, 1986). A seguir mostramos a soluao c nal do problema que pode ser apresentada em duas etapas usando um Princ pio da Separaaosimilar ao j estudado na seo 6.1.1. O princ c a ca pio da separaao um resulc e tado que nos permite encontrar a soluo tima do problema de controle acima atravs ca o e da soluao tima de dois sub-problemas: o primeiro corresponde a um problema de c o controle LQR j estudado e o segundo corresponde a um problema de projeto de um a observador onde a varincia do erro de estimaao deve ser minimizada. O observador a c que possui varincia m a nima do erro de estimao conhecido como ltro de Kalman ca e (Greeen and Limebeer, 1995; Anderson and Moore, 1979; Friedland, 1986). Assim, a soluao do problema de controle LQG encontrada adotando-se o seguinte c e procedimento. Primeiro, obtenha a estimativa xf tima do estado x, onde tima signica que a o o varincia do erro de estimaao E{(x xf )(x xf ) } minimizada. a c e Em seguida, use xf como se fosse o estado verdadeiro e aplique a lei de controle u = Kxf , onde K a soluao de um problema de controle LQR que veremos a seguir. e c Observe portanto que a soluo do problema de controle LQG resulta tambm num ca e controlador baseado em observador, como j estudado na seao 6.1. a c O Filtro de Kalman um observador de estados do tipo Luenberger e xf (t) = (A LC)xf (t) + Bu(t) + Ly(t) onde o ganho L do observador projetado para minimizar a varincia do erro de e a estimaao E{e e}, e dado pelas equaes abaixo. c e co
1 L = SC Rv

1 SA + AS S C Rv C S + Qw = 0

(6.12)

A equao acima, que quadrtica na matriz S, conhecida como equaao de ca e a e c Riccati. Ela possui soluao S positiva denida se o par (A, C) observvel e o par c e a (A, Bc ) controlvel, onde Bc qualquer matriz que satisfaz a decomposio Qw = e a e ca Bc Bc . A segunda parte do problema de controle LQG consiste em se resolver um problema LQR. Nesse caso procuramos uma lei de controle u = Kx que minimiza a funao custo c

(x Qx + u Ru)dt
0

para as trajetrias do sistema x = Ax + Bu (observe que agora w(t) = 0 e v(t) = 0). o O ganho timo do LQR dado por: o e

126

6. Controle por realimentao de Sa ca da

K = R1 B P

A P + P A P BR1 B P + Q = 0

(6.13)

A equaao de Riccati acima possui soluao P positiva denida se o par (A, B) c c e controlvel e o par (A, Co ) observvel, onde Q = Co Co . a e a Finalmente, a soluao do LQG u = Kxf que resulta no seguinte sistema de c e malha fechada: x = Ax + Bu + w , y = Cx + v xf = (A LC)xf + Bu + Ly , u = Kxf que pode ser representado pelas equaoes c x e = A BK BK 0 A LC x e + w w Lv

onde e = x xf o erro de estimao de estados. Observe que as equaes acima so e ca co a idnticas `quelas da seo 6.1.2, e de forma anloga ` seao 6.1.1, podemos notar que e a ca a a c os autovalores da malha fechada so os autovalores das matrizes (A BK) e (A LC) a que so dados por: a det(sI (A BK)) det(sI (A LC)) = 0 Para vericar a estabilidade do sistema em malha fechada vamos reescrever as equaoes (6.12) e (6.13) na forma c (A BK) P + P (A BK) + K RK + Q = 0 (A LC)S + S(A LC) + LRv L + Qw = 0 (6.14) (6.15)

Comparando as expresses acima com a equaao de Lyapunov do teorema 3.3 pero c cebemos que os autovalores das matrizes (A BK) e (A LC) esto no semi-plano a esquerdo se as matrizes P, S so positivas denidas. Isto ocorre quando: a O par (A, C) observvel e o par (A, Bc ) controlvel, para Qw = Bc Bc . e a e a O par (A, Co ) observvel, para Q = Co Co , e o par (A, B) controlvel. e a e a Se as condies acima no se vericam, porm os modos no controlveis e no co a e a a a observveis so estveis, o sistema em malha fechada ainda estvel. Nessas condioes a a a e a c teremos P 0 e/ou S 0. Veja seao 3.1.2 para mais detalhes sobre esse ponto. c O LQR possui propriedades de robustez interessantes. Escolhendo R = rI, mostrase que o controle LQR possui pelo menos 60 de margem de fase em cada canal de controle, margem de ganho innita em cada canal e admite uma reduo de at de at ca e e 6dB simultaneamente em todos os canais. J o Filtro de Kalman no possui nenhuma a a garantia de robustez e o LQG, que combina os dois (LQR e ltro) tambm no possui e a garantia de robustez.

6. Controle por realimentao de Sa ca da

127

6.3

Controlador dinmico de sa a da

Nas seoes anteriores vimos que o controle baseado em observador de ordem comc pleta resulta num controlador dinmico, de mesma ordem do sistema, e com uma a estrutura particular como podemos notar na gura 6.2. Nesta seo apresentamos ca uma tcnica de projeto de um controlador dinmico de sa onde o controlador pose a da sui possui uma estrutura mais genrica, permitindo assim a incorporao de novos e ca requisitos para o sistema em malha fechada. A tcnica de projeto aqui apresentada e e vlida para controladores dinmicos de mesma ordem do sistema, chamados de controa a ladores de ordem completa. Outros tipos de controladores podem ser encontrados em (J.C.Geromel, 1999), (C.Scherer, 1997), (A.Trono, 2002). Considere o sistema S : x(t) = Ax(t) + Bu(t) y(t) = Cx(t) (6.16)

onde x Rn o estado, y Rny as variveis medidas e u Rnu o sinal de controle. e a Para estabilizar o sistema (6.16) iremos utilizar um controlador do tipo K : xf (t) = Af xf (t) + Bf y(t) u(t) = Cf xf (t) (6.17)

onde xf Rn o estado do controlador e Af , Bf , Cf as matrizes a serem determinadas. e O sistema em malha fechada, representado por S(K), dado por e S(K) : xa (t) = Aa xa (t) Aa = A BCf Bf C A f , xa = x xf (6.18)

Para que o sistema em malha fechada seja exponencialmente estvel a seguinte a condiao deve ser satisfeita c K, P : Aa P + P Aa < 0 , P >0 (6.19)

Como a desigualdade acima no convexa em K, P precisamos transform-la adea e a quadamente para que o problema possa ser resolvido como uma LMI. Note que (6.19) equivalente ` e a K, P, M : M (Aa P + P Aa )M < 0 , MP M > 0 (6.20)

onde M qualquer matriz invers e vel. Em particular, deniremos M e uma matriz auxiliar Q da seguinte forma P =: S T T R , M =: In 0n In T R1 , Q =: T R1 T (6.21)

onde S, T, R Rnn so as matrizes a serem determinadas. Como as desigualdades so a a estritas, podemos usar argumentos de pequenas perturbaoes para assumir sem perda c

128

6. Controle por realimentao de Sa ca da

de generalidade que a matriz T invers e vel. Alm disso, a condiao P > 0 requer e c S > 0, R > 0 e portanto so invers a veis tambm. e Aps algumas manipulaoes algbricas a expresso (6.20) pode ser reescrita na o c e a forma 1 2 Am := <0 3 S SQ P := >0 SQ (6.22) 1 = SA + Bm C + (SA + Bm C) 2 = S(A BCq ) + Bm C + A (S Q) 3 = (S Q)(A BCq ) + (A BCq ) (S Q) onde Am , Bm , Cq esto relacionadas com as matrizes do ltro atravs das transformaes a e co de variveis a Am = T Af R1 T , Bm = T Bf , Cq = Cf R1 T (6.23) Como as transformaes so revers co a veis, e lembrando que Q = T R1 T , as matrizes do ltro so dadas por a Af = T 1 Am Q1 T, Bf = T 1 Bm , Cf = Cq Q1 T (6.24)

e a matriz P da funao de Lyapunov ca c P = S T T T Q1 T (6.25)

Como a unica restriao na matriz Am dada pela condio < 0 podemos escolh-la c e ca e de tal forma que Am = 2 . Veja que isto pode ser feito sem perda de generalidade pois se existe uma soluo Am , Bm , Cq , Q, S qualquer para (6.22) ento as mesmas matrizes ca a Bm , Cq , Q, S com Am = 2 tambm levam (6.22) a ser satisfeita. e Com Am = 2 a condiao < 0 se reduz ` 1 < 0 que uma LMI e 3 < 0 c a e e 1 1 equivalente ` (S Q) (3 )(S Q) < 0 que pode ser transformada numa LMI com a a mudana de varivel W = (S Q)1 e Cq = Cm (S Q). Por outro lado P > 0 c a e equivalente ` G P G > 0 que tambm se torna uma LMI com G = diag{In , W }. Isso a e nos leva ao seguinte teorema: Teorema 6.1 Existe um controlador K que estabiliza o sistema S se somente se existem matrizes S, W, Cm , Bm que resolvem o seguinte problema convexo: SA + Bm C + (SA + Bm C) < 0 AW BCm + W A Cm B < 0 S I I W >0 (6.26)

No caso armativo, as matrizes do controlador so dadas por a Af = T 1 (SA SBCm W 1 + Bm C + A W 1 ) (S W 1 )1 T, Bf = T 1 Bm , Cf = Cm (SW I)1 T (6.27)

onde T uma matriz inversvel que pode ser arbitrariamente escolhida, e a funo de e ca Lyapunov que satisfaz (6.19) v(xa ) = xa P xa com e P = S T T T (S W 1 )1 T (6.28)

6. Controle por realimentao de Sa ca da

129

Prova: Primeiro observe algumas condies de regularidade. Note que P > 0 co e equivalente ` LMI da direita em (6.26) e que tambm implica que S, Q, S Q, W so a e a todas positivas denidas e portanto invers veis. Assim todas as inverses em (6.28) o 1 e (6.27) esto garantidas pois Q = (S W ). Alm disso, a matriz invers a e vel T pode ser arbitrariamente escolhida pois ela dene a realizao de espao de estados do ca c controlador e no afeta a funao de transferncia do mesmo. Para provar o teorema a c e basta notar que a estabilidade da malha fechada equivalente ` condiao (6.19) que e a c por sua vez equivalente ` (6.22). Com a escolha Am = 2 e as transformaes e a co 1 W = (S Q) e Ca = Cm (S Q) esta ultima tambm equivalente `s LMIs em e e a (6.26). 2 E interessante notar que a matriz de dinmica Af do controlador depende das a matrizes A, B, C do sistema S. Este mesmo fato ocorre se construirmos o controlador utilizando um observador como pode ser visto na gura 6.2. Observe ainda que no controlador baseado em observador o ganho de controle K e do observador Kf podem ser projetados de forma independente e devem ser tais que os autovalores de A Kf C e A + BK tenham parte real negativa. Veja que a soluao de (6.26) tambm implica c e que os autovalores de A Kf C e A + BK tenham parte real negativa com Kf = S 1 Bm e K = Cm W 1 . Isto uma consequncia das duas LMIs ` esquerda de e e a (6.26). A vantagem da abordagem do teorema acima em relaao ` clssica que ela c a a e permite, por exemplo, o projeto de controladores robustos. Veja (J.C.Geromel, 1999), (A.Trono, 2002) para mais detalhes. Exerc cio 6.2 Determine uma realimentao de sa para o sistema do exemplo 6.1. ca da

6.4

Controle H2 por realimentao de sa ca da

Nesta seo veremos uma tcnica de projeto de controladores dinmicos de sa ca e a da que estende os resultados da seao anterior para o caso em que o controlador, alm de c e estabilizar o sistema em malha fechada, deve minimizar um certo critrio de desempee nho baseado na norma 2 do sistema indicado abaixo. x(t) = Ax(t) + Bu(t) + Ex d(t) y(t) = Cx(t) + Ey d(t) S : (6.29) z(t) = Cz x(t) + Dz u(t) x Rn representa o estado, y Rny o vetor de medidas, u Rnu o sinal de controle, d c Rnd um sinal externo de perturbaao, z Rnz um sinal auxiliar cuja energia desejamos minimizar3 , A, B, C, Ex , Ey , Cx , Dz so matrizes reais de dimenso compat a a veis. Para controlar o sistema (6.29) vamos considerar um controlador dinmico do tipo a K : xf (t) = Af xf (t) + Bf y(t) u(t) = Cf xf (t) (6.30)

a onde xf Rnf representa o estado do controlador e Af , Bf , Cf so matrizes reais a serem determinadas.


3

Na seo 4.5 um problema idntico formulado para o problema de realimentao de estados. ca e e ca

130

6. Controle por realimentao de Sa ca da

Denotaremos o sistema de malha fechada por S(K) : d z e sua representaao de c estados e S(K) : Aa = xa (t) = Aa xa (t) + Ba d(t) z(t) = Ca xa (t) A BCf Bf C A f , Ba = Ex Bf E y , xa (t) = x(t) xf (t) (6.31)

, Ca =

Cz Dz Cf

O problema a ser resolvido consiste em projetar um controlador que minimize a norma H2 do sistema em malha fechada acima, isto desejamos resolver minK S(K) 2 e . Como visto no cap tulo 3, isto corresponde a minimizar a energia da resposta impulsional desse sistema cuja funao de transferncia : c e e H(s) = Ca (sI Aa )1 Ba (6.32)

Do cap tulo 3 sabemos que esse problema pode ser resolvido atravs do gramiano e de observabilidade como indicado a seguir.
N,P,K

min tr{N } : Aa P + P Aa + Ca Ca < 0 ,

N Ba P B a > 0 ,

P >0

(6.33)

Considerando as mesmas matrizes P, M, Q denidas em (6.21) podemos reescrever (6.33) como min tr{N } : M (Aa P + P Aa + Ca Ca )M < 0 , M P M > 0 N Ba P M (M P M )1 M P Ba > 0

N,P,K

Usando o complemento de Schur e algumas manipulaes algbricas simples podeco e mos reescrever as condioes acima na forma c
N,Q,S,Am ,Bm ,Cq

min

tr{N } : <0

(6.34)

:=

1 + Cz Cz

N >0 S N := SEx + Bm Ey (S Q)Ex S Q S Q 1 = SA + Bm C + (SA + Bm C) 2 = S(A BCq ) + Bm C + A (S Q) 3 = (S Q)(A BCq ) + (A BCq ) (S Q)

2 Am + Cz (Cz Dz Cq ) 3 + (Cz Cq Dz )(Cz Dz Cq )

onde Am , Bm , Cq esto relacionadas com as matrizes do controlador atravs de (6.23) a e ou equivalentemente (6.24) e a matriz P dada por (6.25). Como a unica restriao na matriz Am dada pela condio < 0 podemos escolh c e ca e la de tal forma que Am = 2 +Cz (Cz Dz Cq ). Veja que isto pode ser feito sem perda de generalidade pois se existe uma soluao N, Am , Bm , Cq , Q, S qualquer para (6.34) ento c a e as mesmas matrizes N, Bm , Cq , Q, S com Am = 2 + Cz (Cz Dz Cq ) tambm levam (6.34) a ser satisfeita. Com esta escolha de Am a condiao < 0 se torna equivalente c e `s desigualdades 1 + Cz Cz < 0 e 3 + (Cz Cq Dz )(Cz Dz Cq ) < 0. A primeira a

6. Controle por realimentao de Sa ca da

131

uma LMI e a segunda equivalente ` W (3 + (Cz Cq Dz )(Cz Dz Cq ))W < 0 que e a pode ser transformada numa LMI com as mudanas de variveis W = (S Q)1 e c a Cq = Cm (S Q). Por outro lado a condiao N < 0 equivalente ` G N G < 0 e c e a tambm se torna uma LMI com G = diag{Ind , W }. e Isto nos leva ao seguinte teorema: Teorema 6.2 Existe um controlador K que minimiza a norma H2 do sistema (6.32) se e somente se existe uma soluo N, S, W, Cm , Bm para o problema convexo ca
N,S,W,Cm ,Bm

min

tr{N } :

(6.35)

SA + Bm C + (SA + Bm C) Cz <0 Cz Inz AW BCm + (AW BCm ) W Cz Cm Dz <0 Inz N SEx + Bm Ey S >0 Ex In W Em caso armativo, as matrizes do controlador so dadas por a Af = T 1 As (S W 1 )1 T As = SA SBCm W 1 + Bm C + A W 1 + Cz (Cz Dz Cm W 1 ) Bf = T 1 Bm , Cf = Cm (SW I)1 T (6.36)

onde T uma matriz inversvel que pode ser arbitrariamente escolhida. Alm disso e e minK S(K) 2 = tr{N } e o gramiano de observabilidade P dado por (6.28). e 2 2 Prova: As mesmas condioes de regularidade apresentadas na prova do teorema 6.1 a c respeito das inverses matriciais tambm se aplicam aqui. Observe ainda que a terceira o e LMI implica P > 0. Como (6.35) equivalente ` (6.33) o temos o resultado desejado e a atravs do gramiano de observabilidade apresentado na seo 3.4.1. e ca 2

6.5

Controle H com Realimentao de Sa ca da

A norma H representa o maior ganho que o sistema oferece para um dado sinal perturbao, qualquer que seja ele. Deste forma, o controle H pode ser visto, como ca um problema de otimizao no qual deseja-se determinar uma lei de controle u(t) ca que minimiza o maior ganho que o sistema em malha fechada vai oferecer a um sinal perturbao qualquer. ca Nesta seao apresenta-se uma formulaao LMI para o problema de controle acima c c atravs de realimentao dinmica de sa e ca a da. Para tal, considere o seguinte sistema linear: x(t) = Ax(t) + Bu(t) + Ex d(t) y(t) = Cx(t) + Ey d(t) S : (6.37) z(t) = Cz x(t) + Dz u(t) + Ez d(t)

132

6. Controle por realimentao de Sa ca da

x Rn representa o estado, y Rny o vetor de medidas, u Rnu o sinal de controle, d Rnd um sinal externo de perturbaao, z Rnz um sinal auxiliar cuja energia desejamos c 4 minimizar , A, B, C, Ex , Ey , Cx , Dz so matrizes reais de dimenso compat a a veis. Para controlar o sistema (6.37) vamos considerar um controlador dinmico do tipo a K : xf (t) = Af xf (t) + Bf y(t) u(t) = Cf xf (t) + Df y(t) (6.38)

onde xf Rnf representa o estado do controlador e Af , Bf , Cf , Df so matrizes reais a a serem determinadas. Denotaremos o sistema de malha fechada por S(K) : d z e sua representaao de c estados e S(K) : xa (t) = Aa xa (t) + Ba d(t) z(t) = Ca xa (t) + Da d(t) , xa (t) = x(t) xf (t) (6.39)

Aa = Ca =

A + BDf C BCf Ex + BDf Ey , Ba = Bf C Af Bf Ey Cz + Dz Df C Dz Cf , Da = Ez + Dz Df Ey

O problema a ser resolvido consiste em projetar um controlador que minimize a norma H do sistema em malha fechada acima, isto desejamos resolver e minK S(K) . Como visto na seo 3.5, isto corresponde a minimizar o pico de ca ressonncia da resposta em frequncia de H(j) onde H(s) a funao de transa e e c ferncia de S(K) dada por e H(s) = Ca (sI Aa )1 Ba + Da Dos exerc cios 3.5 e 3.6 podemos mostrar que S(K) seguintes desigualdade esto satisfeitas: a Ba P Ca Ba P Ca

(6.40) < se e somente se as

Aa P + P Aa +

<0 ,

Ind Da Da Inz

>0 ,

P >0

(6.41) Seja M uma matriz invers vel. Ento as desigualdades acima so equivalentes ` > 0 a a a e =: M (Aa P + P Aa )M + Ba P M Ca M 1 Ba P M Ca M <0 , P =: M P M > 0

(6.42) Com P, Q, M denidas em (6.21), Am , Bm , Cq denidas em (6.23),(6.24) e algumas manipulaoes algbricas encontramos c e M (Aa P + P Aa )M =
4

1 2 Am 3

(6.43)

Na seo 4.6 um problema idntico formulado para o problema de realimentao de estados. ca e e ca

6. Controle por realimentao de Sa ca da onde

133

1 = S(A + BDf C) + Bm C + (S(A + BDf C) + Bm C) 2 = S(A + BDf C BCq ) + Bm C + (A + BDf C) (S Q) 3 = (S Q)(A + BDf C BCq ) + (A + BDf C BCq ) (S Q) M P B a M Ca = 4 5 (6.44)

onde

4 = 5 =

S(Ex + BDf Ey ) + Bm Ey (Cz + Dz Df C) (S Q)(Ex + BDf Ey ) (Cz + Dz Df C) Cq Dz S SQ SQ

Portanto camos com = 1 + 4 1 4 2 + 4 1 5 Am 3 + 5 1 5 , P = (6.45)

De forma anloga ` seao anterior podemos, sem perda de generalidade, escolher a a a c matriz Am tal que 2 + 4 1 5 Am = 0. Com isto < 0 se torna equivalente ` a 1 + 4 1 4 < 0 e 3 + 5 1 5 < 0. A primeira se torna uma LMI com a mudana c de varivel Bm = Bs SBDf . A segunda, que equivalente ` W (3 +5 1 5 )W < 0 a e a se torna uma LMI com as mudanas de variveis W = (S Q)1 e Cq W = Cs +Df CW . c a Por outro lado a condio P > 0 equivalente ` G P G > 0 e tambm se torna uma ca e a e LMI com G = diag{In , W }. Assim podemos enunciar o seguinte teorema. Teorema 6.3 Existe um controlador K que minimiza a norma H do sistema (6.40) se e somente se existe uma soluo , S, W, Cs , Bs , Df para o problema convexo ca
,S,W,Cs ,Bs ,Df

min

: <0 , <0 S In W >0

(6.46)

SA + Bs C + (SA + Bs C) AW BCs + (AW BCs )

6 7

6 = 7 =

SEx + Bs Ey (Cz + Dz Df C) Ex + BDf Ey W Cz Cs Dz

, =

Ind Da Da Inz

Em caso armativo, as matrizes do controlador so dadas por a Af = T 1 As (S W 1 )1 T, As = SA SBCs W 1 + Bs C SBDf C + (A + BDf C) W 1 + 6 1 7 Bf = T 1 (Bs SBDf ) , Cf = (Cs W 1 + Df C)(S W 1 )1 T (6.47)

onde T uma matriz inversvel que pode ser arbitrariamente escolhida. Alm disso e e minK S(K) = e a matriz P que satisfaz (6.41) dada por (6.28). e 2 Prova: As mesmas condioes de regularidade apresentadas na prova do teorema 6.1 c a respeito das inverses matriciais tambm se aplicam aqui. Como (6.46) fornece o o e menor valor de que satisfaz (6.41) temos o resultado desejado. 2

134

6. Controle por realimentao de Sa ca da

6.6

Notas e Referncias e

Controladores de Ordem Reduzida


O projeto de controladores dinmicos de sa com ordem reduzida, isto , a ora da e dem do controlador nf menor que a ordem do sistema ainda um problema no e e a completamente resolvido na literatura. Veja por exemplo (?), (J.C.Geromel, 1999), (A.Trono, 2002).

Controle Multi-objetivo com Realimentao de Sa ca da


O projeto de controladores dinmicos de sa atendendo diferentes especicaes, a da co como, por exemplo, alocaao de plos e H2 H misto, pode ser realizado de maneira c o similar ao caso de realimentao de sa ca da. Uma boa referncia sobre este tema pode e ser encontrada em (Scherer et al., 1997).

6.7

Exerc cios

E 4.1 Refaa os Exemplos 4.5 e 4.6 considerando uma realimentaao dinmica de c c a sa da. Compare os resultados.

Referncias Bibliogrcas e a
Anderson, B. D. and Moore, J. (1979). Optimal Filtering, Prentice Hall, Englewood Clis, New Jersey. A.Trono (2002). Robust, stable and reduced order dynamic output feedback controllers with guaranteed h2 performance, IEEE Conference on Decision and Control, Las Vegas, pp. 3470 3475. Boyd, S., Ghaoui, L. E., Feron, E. and Balakrishnan, V. (1994). Linear Matrix Inequalities in Systems and Control Theory, SIAM books. Burl, J. B. (1999). Linear Optimal Control: H2 and H Methods, Addison-Wesley. Chilali, M. and Gahinet, P. (1996). H Design with Pole Placement Constraints: An LMI Approach, IEEE Transactions on Automatic Control 41(3): 358367. Chilali, M., Gahinet, P. and Apkarian, P. (1999). Robust Pole Placement in LMI Regions, IEEE Transactions on Automatic Control 44(12): 22572270. Colaneri, P., Geromel, J. C. and Locatelli, A. (1997). Control Theory and Design: An RH 2 -RH Viewpoint, Academic Press. Crusius, C. A. R. (1996). Formulaao LMI para problemas de performance e robustez. c Dissertao de Mestrado, DAS, UFSC, Florianpolis, SC. ca o C.Scherer (1997). Mixed H2 /H control for time varying and linear parametrically varying systems, Int. Journal of Robust and Nonlinear Control 6: 929952, 1996. de Oliveira, J. (1998). Controle Robusto de Sistemas Lineares com Parmetros Vaa riantes no Tempo: Tcnicas de Anlise e S e a ntese. Exame de Qualicao, DAS, ca UFSC, Florianpolis, SC. o de Oliveira, M. C., Geromel, J. C. and Bernussou, J. (1999). An LMI optimization approach to multiobjective controller design for discrete-time systems, Proceedings of the 38th IEEE Conference on Decision and Control, Phoenix, pp. 36113616. de Oliveira, M. C. and Skelton, R. (2001). Stability tests for constrained linear systems, in S. O. R. Moheimani (ed.), Lecture Notes in Control and Information Science, Springer-Verlag. Doyle, J. C., Packard, A. and Zhou, K. (1991). Review of LFTs, LMIs and , Proceeding of the 30th Conference on Decision and Control, Brighton, pp. 12271232.

136

Referncias Bibliogrcas e a

Friedland, B. (1986). Control System Design: an Introduction to State Space Methods, McGraw-Hill. Ghaoui, L. E. and Niculescu, S. (2000). Advances in Linear Matrix Inequations Methods in Control, SIAM. Greeen, M. and Limebeer, D. J. N. (1995). Linear Robust Control, Prentice-Hall. Gutman, S. and Jury, E. I. (1981). A General Theory for Matrix Root Clustering in Subregions of the Complex Plane, IEEE Transactions on Automatic Control 26: 853863. H.Hindi (2004). A tutorial on convex optimization, Proceedings of American Control Conference, Vol. ThP01.1, Boston, pp. 32523265. J.C.Geromel, J.Bernussou, M. O. (1999). h2 norm optimization with constrained dynamic output feedback controllers: decentralized and reliable control, IEEE Transactions on Automatic Control 44(7): 14491454. Johansson, K. H. (2000). The quadruple-tank process: A multivariable laboratory process with an adjustable zero, IEEE Tansactions on Control Systems Technology 8(3): 456465. Kalman, R. E. (1960). A New approach to linear ltering and prediction problems, Transactions of the ASME Journal of Basic Engineering 82: 3445. Kalman, R. E. and Bucy, R. S. (1961). New results in linear ltering and prediction problems, Transactions of the ASME Journal of Basic Engineering 83: 95107. Khalil, H. K. (1996). Nonlinear Systems, Prentice Hall. Luenberger, D. (1966). Observers for multivariables systems, IEEE Transactions on Automatic Control 11: 190197. Mackenroth, U. (2004). Robust Control Systems, Springer Verlag, Berlin. Ogata, K. (1993). Engenharia de Controle Moderno, segunda edio, Prentice Hall do ca Brasil. Peaucelle, D. (2000). Formulation Gnric de Probl`mes en Analyse et Commande Roe e e buste par des Fonctions de Lyapunov Dpendent des Param`tres. Th`se, Rapport e e e N. 00304, LAAS, Toulouse, France. R.T.Stefani, C.J.Savant, B.Shahian and G.H.Hostetter (1994). Design of Feedback Control Systems, Saunders College Publishing. Scherer, C., Gahinet, P. and Chilali, M. (1997). Multiobjective Output-Feedback Control via LMI Optimization, IEEE Transactions on Automatic Control 42: 896911. T.Kailath (1980). Linear Systems, Prentice Hall. Zhou, K. (1998). Essentials of Robust Control, Prentice Hall.

Vous aimerez peut-être aussi