Académique Documents
Professionnel Documents
Culture Documents
C ENTRO DE T ECNOLOGIA
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE P ROGRAMA DE P S -G RADUAO EM E NGENHARIA E LTRICA
Sumrio i
Lista de Tabelas v
1 Introduo 1
2 Reviso Bibliogrfica 3
3 Referencial Terico 7
3.1 Controle Adaptativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.1.1 Histrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.1.2 Estrutura do Controlador . . . . . . . . . . . . . . . . . . . . 8
3.1.3 Controle Adaptativo Direto/Indireto . . . . . . . . . . . . . 9
3.2 Desacoplamento de Sistemas . . . . . . . . . . . . . . . . . . . . . . 10
3.2.1 Desacoplador Ideal . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2.2 Desacoplador Simplificado . . . . . . . . . . . . . . . . . . . 12
3.2.3 Desacoplador Invertido . . . . . . . . . . . . . . . . . . . . . 12
3.3 MRAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.4 Controlador auto-ajustvel GMV . . . . . . . . . . . . . . . . . . . . 16
3.4.1 Mtodo dos Mnimos Quadrados Recursivo . . . . . . . . . 17
3.4.2 Implementao do controlador GMV . . . . . . . . . . . . . 19
4 Metodologia 23
4.1 Sistema de Tanques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Desacoplador Invertido . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2.1 Desacoplador Invertido Chaveado . . . . . . . . . . . . . . . 29
i
5 Resultados 33
5.1 Sistema Desacoplado . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.2 Controlador MRAC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.3 Controlador GMV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.4 Saturao do Sinal de Controle . . . . . . . . . . . . . . . . . . . . . 49
6 Concluses 61
Referncias Bibliogrficas 62
iii
5.8 Resposta do sistema com o controlador GMV . . . . . . . . . . . . 45
5.9 Resposta do sistema para os instantes iniciais da simulao . . . . 46
5.10 Sinal de Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.11 Resposta do sistema com desacoplador amenizando o acoplamento
entre as variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.12 Comportamento das estimativas dos parmetros do sistema (m-
todo dos mnimos quadrados) . . . . . . . . . . . . . . . . . . . . . 49
5.13 Desempenho do sistema para os controladores com saturao no
sinal de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.14 Resposta do sistema para o controlador MRAC anti-windup . . . . 52
5.15 Comparativo entre os controladores GMV e MRAC anti-windup . . 54
5.16 Sinal de controle para o controlador GMV . . . . . . . . . . . . . . 55
5.17 Sinal de controle para o controlador MRAC anti-windup . . . . . . 55
5.18 Comparativo entre os controladores GMV e MRAC . . . . . . . . . 57
5.19 Comparativo entre os controladores GMV e MRAC . . . . . . . . . 58
5.20 Sinal de controle para o controlador MRAC . . . . . . . . . . . . . . 59
5.21 Sinal de controle para o controlador GMV . . . . . . . . . . . . . . 60
Lista de Tabelas
v
Lista de Abreviaturas e Smbolos
Introduo
Reviso Bibliogrfica
linear tem recebido grande ateno especialmente nas ltimas duas dcadas. Esse
tipo de estrutura apresenta uma arquitetura de controle simples de implementar,
sendo capaz de utilizar informaes conhecidas do sistema, mas ao mesmo tempo
no depender fortemente dessas informaes para apresentar um desempenho
aceitvel. Um comparativo entre as metodologias adaptativas e os controladores
clssicos exposto, sendo as estratgias de controle clssicas insuficientes para
atingir as especificaes de desempenho associadas ao modelo de referncia. Em
relao as tcnicas adaptativas, elas se mostraram bem eficientes na compensao
das dinmicas no-lineares, principalmente quando o sistema submetido a
variaes nos parmetros durante os testes.
Em (CARVALHO; HEMERLY; RIBEIRO, 2008), o mtodo de realimentao de
sada em conjunto com redes neurais aplicado em um modelo de helicptero
com dois graus de liberdade. O objetivo do trabalho a validao de uma das
estratgias de controle apresentadas por (CARVALHO; HEMERLY, 2008) com
dados experimentais reais. O controle do sistema MIMO simplificado em uma
estrutura composta por dois sistemas SISO para os dois eixos de movimento
da planta. Um modelo de referncia utilizado em conjunto com a tcnica de
linearizao entrada-sada. Sendo essa uma estratgia voltada para sistemas
SISO, e por se tratar de um problema MIMO, o uso de um elemento adaptativo
(rede neural multicamadas) faz com que os efeitos das dinmicas no-lineares
de cada canal sejam compensados, assim como o acoplamento entre as variveis.
Os resultados experimentais obtidos foram satisfatrios para a validao da
estratgia de controle.
(COLN; ROSA, 2012) traz a aplicao de um controlador do tipo self-tuning
regulator (STR) em uma planta didtica de trs tanques comunicantes, sendo
o objetivo controlar o nvel de dois desses tanques. Trata-se de um sistema
multivarivel com a presena de no-linearidades do tipo no suave, onde a
configurao do sistema pode ser modificada por meio de vlvulas, alterando a
dinmica do sistema quando desejado. O mtodo de estimao utilizado foi o de
mnimos quadrados recursivo normalizado e com fator de esquecimento. O autor
optou por no realizar uma anlise multivarivel do sistema, e sim considerar
cada um dos tanques de interesse como um sistema SISO, deixando a cargo do
controlador adaptativo compensar as alteraes na dinmica do sistema. Uma
srie de resultados apresentada, verificando o comportamento da sada da
planta com alteraes no fator de esquecimento, na taxa de aprendizagem e com
a adio de distrbios.
5
Referencial Terico
3.1.1 Histrico
Pesquisas na rea de controle adaptativo tiveram incio na dcada de cin-
quenta, tendo como motivao o projeto de pilotos automticos para aeronaves
que operavam em diversas velocidades e altitudes. Concluiu-se que um con-
trolador de ganhos constantes no era suficiente para resolver o problema em
questo, e foi adotada como primeira soluo o controle por escalonamento de
ganho (Gain Scheduling). Em seguida, as primeiras tentativas com esquemas por
modelo de referncia e mtodos de auto-sintonia (Self Tunning) dos parmetros
dos controladores foram propostos. Assim como as regras de sensibilidade e a
regra do "M.I.T", que apresentavam um bom desempenho sobre certas restries.
Em 1958, Kalman apresentou o conceito de um controlador auto-ajustvel com a
identificao dos parmetros de uma planta linear (SASTRY; BODSON, 1989).
Nos anos 60, haviam mais pesquisas na rea de controle que contriburam
8 CAPTULO 3. REFERENCIAL TERICO
gg12
!
1 11
D (s) = (3.4)
gg22
21
1
g12 g21
!
g11 g22 0
Q(s) = G (s).D (s) = g12 g21 (3.5)
0 g22 g11
gg12 g11
gq11
! !
12
1
D ( s ) 1 = Q ( s ) 1 G ( s ) = 11
= q11
gg21
22
1
g21
q22
g22
q22
gg12
!
1
Q ( s ) 1 G ( s ) = 11
gg21
22
1
3.3 MRAC
Inicialmente apresentado no trabalho de (WHITAKER; YAMRON; KEZER,
1958), em estudos no campo da aviao. Os controladores MRAC tratam proble-
mas do tipo servo atravs de um modelo de referncia que especifica o comporta-
mento a ser seguido pela planta. Tal comportamento pode ser atingido atravs
14 CAPTULO 3. REFERENCIAL TERICO
y = ay + bu (3.7)
ym = am ym + bm um (3.8)
u = 1 r 2 y (3.9)
y = ay + b(1 r 2 y)
y = ( a + b2 )y + b1 r (3.10)
3.3. MRAC 15
bm
1 = (3.11)
b
am a
2 = (3.12)
b
Para aplicar a regra do MIT, definimos o erro de estimao e e a seguinte
funo objetivo J:
e = y ym (3.13)
1
J ( 1 , 2 ) = e2 (3.14)
2
A fim de realizarmos a estimao dos parmetros do controlador, devemos
minimizar a funo objetivo na direo negativa de seu gradiente. Sendo o
ganho adaptativo e o vetor de parmetros do controlador, temos:
J e
= = e (3.15)
A equao (3.15) apresenta a regra do MIT. A taxa de convergncia das
estimativas dos parmetros do controlador est diretamente relacionada ao ganho
adaptativo . Quanto maior o valor de , maior a velocidade que as estimativas
convergem, porm para valores muito elevados o comportamento das estimativas
e
torna-se imprevisvel. A derivada parcial denomida derivada de sensibilidade
do sistema. Tal derivada expressa como o erro e influenciado pelo vetor .
Decorre da equao (3.10) que a sada do sistema em malha fechada dada por:
b1
y= r (3.16)
p + a + b2
sendo p = d/dt o operador diferencial. As equaes de sensibilidade (3.17) e
(3.18) so obtidas atravs das derivadas parciais do erro de estimao em relao
aos parmetros do controlador 1 e 2 :
e b b
= r r (3.17)
1 p + a + b2 p + am
e b2 1 b b
= r = y y (3.18)
2 ( p + a + b2 )2 p + a + b2 p + am
16 CAPTULO 3. REFERENCIAL TERICO
b
0 = (3.21)
am
am
1 = 0 r e (3.22)
p + am
am
2 = 0 y e (3.23)
p + am
n on o
u(0) u(1) ... u( N ) y(0) y(1) ... y( N ) (3.24)
Temos que:
y = x + e (3.26)
N
J= e2 (k) = eT e = (y x )T (y x ) (3.27)
k =1
J
=0
=
(3.28)
(y T y y T x T x T y + T x T x )
=0
=
Resultando em:
2x T y + 2x T x = 0
(3.29)
= ( x T x )1 x T y
..
y (0) ... y (1 n ) . u (0) ... u (1 m )
y (1) .. e (1)
y (1) ... y (2 n ) . u (1) ... u (2 m )
y (2) .. .. .. .. .. e (2)
..
. . . . .
..
= +
. .. .
y ( N ) y ( N 1) ... y( N n) . u ( N 1) ... u( N m)
e( N )
..
y ( N + 1)
... ... ... . ... ... ...
e ( N + 1)
.
y( N ) ... y( N + 1 n) .. u( N + 1) ... u( N + 1 m)
Y( N ) X(N) E( N )
... = ... + ...
y ( N + 1) x T ( N + 1) y ( N + 1)
(3.30)
3.4. CONTROLADOR AUTO-AJUSTVEL GMV 19
T 1 T
N +1 = ( X N +1 X N +1 ) X N +1 YN +1
YN
T 1 T
N +1 = ( X N +1 X N +1 ) X N +1 ...
y N +1
1 (3.31)
X N Y N
T .. T ... x
h i h i
N +1 = X N . x N +1 ... N +1 ...
XN
x TN +1 y N +1
T
N +1 = ( X N X N + x N +1 x TN +1 )1 [ X N
T
YN + x N +1 y N +1 ]
T
PN +1 = ( X N X N + x N +1 x TN +1 )1 (3.32)
PN +1 = [ I (1 + x TN +1 PN x N +1 )1 PN x N +1 x TN +1 ] PN (3.33)
K N = (1 + x TN +1 PN x N +1 )1 PN x N +1
N +1 = N + K N (y N +1 x TN +1 N ) (3.34)
PN +1 = [ I K N x TN +1 ] PN
Resultando em:
Minimizando J (3.39):
J
=0
u(k )
J
= 2[(1 a)y(k) + ay(k 1) + bu(k) yre f (k + 1)] + 2u(k) = 0
u(k)
u(k )(b2 + ) = b[( ay(k ) y(k) ay(k 1) + yre f (k + 1)]
b
u(k) = [( ay(k) y(k) ay(k 1) + yre f (k + 1)]
( b2 + )
(3.40)
Como u(k ) = u(k ) u(k 1), chegamos a expresso do sinal de controle
aplicado a cada intervalo de tempo, onde os parmetros do sistema a e b pelo
princpio de equivalncia a certeza (SIMON, 1956) (THEIL, 1957) devem ser
substituidos pelas estimativas obtidas atravs do mtodo dos mnimos quadrados:
" #
1 ( ay(k) y(k) ay(k 1) + yre f (k + 1)
u(k) = + u ( k 1) (3.41)
1+ b
b
Metodologia
p
qi2 = Km2 Vp2 + a1 2gL1 (4.4)
p
qo2 = a2 2gL2 (4.5)
a p a2 p Km2
L2 = 1 2gL1 2gL2 + Vp2 (4.6)
A2 A2 A2
4.1. SISTEMA DE TANQUES 25
Tanque 3
p
qi3 = Km3 Vp3 + a2 2gL2 (4.7)
p
qo3 = a3 2gL3 (4.8)
a2 p a3 p Km3
L3 = 2gL2 2gL3 + Vp3 (4.9)
A3 A3 A3
Sendo,
At - rea do tanque
Lt - nvel
g acelerao da gravidade
r r
a g a2 g Km2
L2 = 1 L1 L2 + Vp2 (4.11)
A2 2Lo1 A2 2Lo2 A2
r r
a2 g a3 g Km3
L3 = L2 L3 + Vp3 (4.12)
A3 2Lo2 A3 2Lo3 A3
Atribuindo valores s constantes do sistema de acordo com o manual de
referncia dos tanques (QUANSER, ) para t=1,2,3 :
26 CAPTULO 4. METODOLOGIA
Kmt = 16.5cm3 /s
at = 0.1781cm2
At = 60cm2
g = 978.07cm/s2
L3 Vp3
G11 (s) G12 (s) G13 (s) Vp1
Lt = G (s)Vpt = G21 (s) G22 (s) G23 (s) Vp2 (4.13)
0.275
s+0.01695 0 0
0.004662 0.275
G (s) =
s2 +0.0339s+0.0002874 s+0.01695 0
7.903 105 0.004662 0.275
s3 +0.05s2 +0.0008s+4.87210 6 s2 +0.0339s+0.0002874 s+0.01695
Sendo D (s) uma matriz nxn com os elementos do desacoplador e Q(s) uma
matriz nxn com as funes de transferncia do sistema desacoplado.
Figura 4.2: Representao de D(s) pelas matrizes Dd (s) e Do (s) (GARRIDO; VZQUEZ;
MORILLA, 2011)
g12 g13
1 do12 do13 1 g11 g11
g21 g23
do21 1 do23 = 1 (4.20)
g22 g22
g31 g32
do31 do32 1 g33 g33 1
do12 = 0 (4.21)
do13 = 0 (4.22)
4.2. DESACOPLADOR INVERTIDO 29
Resultados
Figura 5.1: Comparativo para o sistema em malha aberta com desacoplador e sem desacoplador
Z
ISE = e(t)2 dt
0
Z
I AE = |e(t)| dt (5.1)
0
Z
ITAE = t|e(t)| dt
0
A tabela 5.1 exibe os valores das mtricas do erro de rastreamento no tanque
3 para o sistema com o desacoplador chaveado e para o sistema com o desaco-
plador no ponto de operao 15cm. O desacoplador chaveado, como esperado,
proporciona um melhor desempenho ao sistema, visto que os ndices devem ser
minimizados. Sendo assim, esta ser a estratgia utilizada para as simulaes
apresentadas nas prximas sees.
Figura 5.2: Comparativo para o sistema em malha aberta entre o desacoplador PO 15 e o desaco-
plador chaveado
1
Gm (s) = (5.2)
s+1
A constante de tempo deve ser um valor no muito alto, pois consequen-
temente tornaria lento o desempenho do controlador. Assim como no pode
ser um valor muito pequeno, pois tende a gerar um sinal de controle elevado.
Aps a realizao de alguns testes, a constante de tempo = 1s foi atribuda. Tal
constante resulta em um tempo de estabilizao do sistema de aproximadamente
4 = 4s para um critrio de erro de 2%.
Por tratarmos de uma planta cujos parmetros so conhecidos, podemos
calcular os parmetros do controlador a partir dos da planta:
bm 1
1 = = = 3.6364 (5.3)
b 0.275
am a 1 0.01695
2 = = = 3.5793 (5.4)
b 0.275
Foram considerados os seguintes valores iniciais das estimativas 1 e 2 :
1inicial = 1, 5 (5.5)
2inicial = 1, 5 (5.6)
vezes para os critrios IAE e ITAE e 40 vezes para o critrio ISE. Uma comparao
entre o desacoplador projetado no ponto de operao 15cm e o desacoplador
chaveado pode ser realizada, mostrando que o segundo minimiza os ndices
principalmente em relao ao segundo tanque. A figura 5.6 apresenta o sinal de
controle no teste realizado para o sistema com desacoplamento.
=0 (5.14)
Figura 5.7: Resposta do sistema com o controlador GMV para diferentes perodos de amostragem
um saturador ao sinal de controle para limitar seus valores, estudo que ser
demonstrado na seo 5.4.
Figura 5.11: Resposta do sistema com desacoplador amenizando o acoplamento entre as variveis
48 CAPTULO 5. RESULTADOS
0.2729
G (z) = (5.15)
z 0.9844
A funo de transferncia discreta (5.14) representa o comportamento dos
3 tanques para o sistema desacoplado, visto que G11 = G22 = G33 (4.13). Apesar
de (4.13) definir a modelagem para o sistema linearizado em torno do ponto de
operao 15cm, a variao dos parmetros quando o sistema linearizado em
torno de outros pontos de operao pequena. Portanto comparando a equao
(5.14) com os parmetros a serem estimados a e b da equao (3.35), conclumos
que os valores reais de 1 e 2 correspondem a:
1inicial = 0 (5.18)
5.4. SATURAO DO SINAL DE CONTROLE 49
2inicial = 0 (5.19)
Figura 5.12: Comportamento das estimativas dos parmetros do sistema (mtodo dos mnimos
quadrados)
Figura 5.13: Desempenho do sistema para os controladores com saturao no sinal de controle
com uma lei anti-windup para sistemas assintoticamente estveis. A idia consiste
em no levar em considerao as variaes nas estimativas para os seguintes casos:
Se
am am
u > umax e e < 0 , ou u < umin e e >0 (5.20)
p + am p + am
Fazer
1 = 0 2 = 0 (5.21)
Seno
am am
1 = 0 r e 2 = 0 y e (5.22)
p + am p + am
Foi realizada uma alterao nos ganhos adaptativos dos tanques 1 e 2 para que
as estimativas apresentem uma convergncia mais rpida, visto que a estratgia
anti-windup no atualiza as estimativas em momentos que o sinal de controle
esteja saturado.
10 tanque1 = 0.1
20 tanque1 = 0.1
(5.23)
10 tanque2 = 0.2
20 tanque2 = 0.2
0.1
Gm (s) = (5.24)
s + 0.1
56 CAPTULO 5. RESULTADOS
bm 1
1real = = = 0.363 (5.25)
b 0.275
am a 1 0.01695
2real = = = 0.302 (5.26)
b 0.275
10 tanque1 = 2 (5.29)
20 tanque1 = 2 (5.30)
10 tanque2 = 2 (5.31)
20 tanque2 = 2 (5.32)
10 tanque3 = 2 (5.33)
20 tanque3 = 2 (5.34)
Concluses
HASSAN, M. Y. Notes of lecture course in adaptive control for the 4th class of
control engineering in the control and systems engineerings. Notas de Aula. 2002.
63
64 REFERNCIAS BIBLIOGRFICAS
Funes de Transferncia do
Desacoplador Chaveado
0.01142s 0.0004742
do21 1 = (B.1)
0.275s2 + 0.02284s + 0.0004742
0.01142s 0.0002738
do21 2 = (B.2)
0.275s2 + 0.01801s + 0.0002738
0.01142s 0.0002121
do21 3 = (B.3)
0.275s2 + 0.01653s + 0.0002121
0.01142s 0.0001792
do21 4 = (B.4)
0.275s2 + 0.01574s + 0.0001792
68APNDICE B. FUNES DE TRANSFERNCIA DO DESACOPLADOR CHAVEADO
0.006593s 0.0002738
do21 5 = (B.5)
0.275s2 + 0.01801s + 0.0002738
0.006593s 0.0001581
do21 6 = (B.6)
0.275s2 + 0.01319s + 0.0001581
0.006593s 0.0001224
do21 7 = (B.7)
0.275s2 + 0.0117s + 0.0001224
0.006593s 0.0001035
do21 8 = (B.8)
0.275s2 + 0.01091s + 0.0001035
0.005107s 0.0002121
do21 9 = (B.9)
0.275s2 + 0.01653s + 0.0002121
0.005107s 0.0001224
do21 10 = (B.10)
0.275s2 + 0.0117s + 0.0001224
0.004316s 0.0001792
do21 13 = (B.13)
0.275s2 + 0.01574s + 0.0001792
B.2. ELEMENTO D32 69
0.004316s 0.0001035
do21 14 = (B.14)
0.275s2 + 0.01091s + 0.0001035
0.01142s 0.0004742
do32 1 = (B.17)
0.275s2 + 0.02284s + 0.0004742
0.01142s 0.0002738
do32 2 = (B.18)
0.275s2 + 0.01801s + 0.0002738
0.01142s 0.0002121
do32 3 = (B.19)
0.275s2 + 0.01653s + 0.0002121
0.01142s 0.0001792
do32 4 = (B.20)
0.275s2 + 0.01574s + 0.0001792
0.006593s 0.0002738
do32 5 = (B.21)
0.275s2 + 0.01801s + 0.0002738
70APNDICE B. FUNES DE TRANSFERNCIA DO DESACOPLADOR CHAVEADO
0.006593s 0.0001581
do32 6 = (B.22)
0.275s2 + 0.01319s + 0.0001581
0.006593s 0.0001224
do32 7 = (B.23)
0.275s2 + 0.0117s + 0.0001224
0.006593s 0.0001035
do32 8 = (B.24)
0.275s2 + 0.01091s + 0.0001035
0.005107s 0.0002121
do32 9 = (B.25)
0.275s2 + 0.01653s + 0.0002121
0.005107s 0.0001224
do32 10 = (B.26)
0.275s2 + 0.0117s + 0.0001224
0.004316s 0.0001792
do32 13 = (B.29)
0.275s2 + 0.01574s + 0.0001792
0.004316s 0.0001035
do32 14 = (B.30)
0.275s2 + 0.01091s + 0.0001035
B.3. ELEMENTO D31 71