Académique Documents
Professionnel Documents
Culture Documents
Director de Tesis:
Dr. Wen Yu Liu
Mxico, D.F.,
1
Resumen
El objetivo del presente trabajo de tesis, es realizar un anlisis de estabilidad de
distintos controladores utilizados en robots manipuladores..
Dentro de las principales contribuciones del presente trabajos e encuentran: realizar
una prueba de estabilidad asinttica semiglobal de un controlador PID con fines de uso
industriales, diseo de un controlador Neuronal-PID para uso en la industria as como su
prueba de estabilidad asinttica semiglobal y finalmente realizar el diseo de un mtodo
iterativo de sintonizacin para un controlador PID para control de robots utilizados en la
industria.
Una forma de minimizar el error en estado estable respecto a incetidumbres en el
control de robots, es incrementando la
Abstract
The objective of this thesis is to perform a stability analysis on different controllers
used in robot manipulators.
Within the contributions of this thesis are: proof semiglobal asymptotic stability of a
PID controller with industrial use, the design of a Neural-PID controller with semi-global
asymptotic stability condition, which is industrially applicable in robot control and finally
the desing a new iterative tuning method of PID control for robot manipulators.
In order to minimize steady-state error with respect
to uncertainties in robot
control, the integral gain of PID control should be increased. Another method is to add a
compensator to PD control, such as neural compensator, but the derivative gain of this PD
control should be large enough. These two approaches deteriorate transient performances.
In
this thesis,
selection methods for the gains of the linear PID control. A experimental study on a robot
manipulator with two degrees of freedom, in the laboratory of experimental services
department Automatic Control, what the technical aspects of this section are corroborated.
On the other hand to address a new iterative tuning method of PID control for robot
manipulators. Presented in the last section a tuning method uses several properties of the
robot control, such as any PD control can stabilize a robot in regulation case, the closedloop system of PID control can be approximated by a linear system, the control torque to
the robot manipulator is linearly independent of the robot dynamic.
other PID tuning methods, this novel method is simple, systematic, and stable. The
transient properties of this PID control are better than the other normal PID controllers.
This method is a new systematic tuning method for PID control is proposed. To validate
the theoretical aspects, these are applied to the robot of two degrees of freedom above.
Agradecimientos
A mi asesor:
Dr. Wen Yu Liu.
Quien no solamente me ayudo tcnicamente, si no que adems me brindo el apoyo de
amigo y hermano en estos momentos tan importantes de mi vida, agradezco su sabidura a
pesar de que a veces me sealaba la luna y yo solamente miraba el dedo, le agradezco su
paciencia, su disposicin de ser gua y por ser un ejemplo a seguir.
A los Investigadores:
Dr. Moiss Bonilla Estrada
Dr. Alejandro Justo Malo Tamayo
Dr. Julio Cesar Tovar Rodrguez.
Dr. Floriberto Ortz Rodrguez.
Por haber aceptado ser miembros del jurado y por sus valiosos comentarios y sugerencias
referentes al presente trabajo de tesis.
A mi familia
A pesar de que jams podrn leer estas lneas quiero agradecer a mi bebe y a mi madre que
su partida me hizo ms fuerte y su estancia en esta vida me lleno de amor y dicha le
agradezco profundamente a mi madre por sus brazos clidos y esa enseanza de lucha
infinita.
A Sonia y Constanza quienes me llenan de amor y le ponen ese brillo a mi maana todos
los das.
A todos mis hermanos, sobrinos, cuados y suegros por todo su cario
A mis amigos.
Chino, Armando, Canul, Samy, Jesica, Gil, Lyapu, Rouss, Charly, Roger, Coqueto, Nio,
Mago, Julio, Beto, Omar, Ru, Caguaman, Carlitos, Hussain, Sureshs 1 y 2.
Por sus consejos, apoyo, confianza y amistad durante todos estos aos.
A CONACyT.
Por haberme otorgado la beca para poder realizar mis estudios de doctorado.
Al CINVESTAV.
Por el apoyo econmico a congresos y de extensin, por su excelente trato y relacin tan
clida con sus estudiantes.
ndice general
1. Introduccin
1.1. Motivacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Estructura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4. Publicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2. Preliminares
10
13
15
2.2.1. Cinemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
22
23
27
29
30
32
43
43
ii
NDICE GENERAL
3.2. Control Estable PD con compensacin por gravedad . . . . . . . . . . . . . .
45
48
56
62
3.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
69
4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
71
80
83
4.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
89
5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
92
95
97
107
ndice de guras
2.1. Cinemtica inversa y cinemtica directa . . . . . . . . . . . . . . . . . . . .
10
14
15
16
19
31
33
34
35
36
37
40
55
3.2. Plataforma Experimental para un Robot de dos Grados de Libertad. Laboarotorio experimental Dpto. Control Automtico-CINVESTAV . . . . . . . . . .
63
64
66
iv
NDICE DE FIGURAS
3.6. Respuesta del Controlador PD mas trmino de gravedad (PD+G) . . . . . .
67
68
84
4.2. Respuesta al escaln unitario de las leyes de control clsicas PD y PID del
robot de dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . .
85
4.3. Seguimiento de trayectoria del Robot del Controlador Neuronal PD y Controlador Neuronal PID al escaln unitario
. . . . . . . . . . . . . . . . . . .
86
87
92
97
Captulo 1
Introduccin
Un Robot manipulador bsicamente es un brazo mecnico operado mediante una accin
de control, de modo que para efectos de la teora de control automtico sirve como objeto de
estudio para probar algunas leyes o algoritmos de control sobre su dinmica la cul puede
estar denida sobre dos espacios: espacio articular (Q) y espacio de tarea, en el primero
se hace una descripcin de la conguracin o movimiento de un robot en trminos de las
posiciones de todas sus articulaciones y esta formado por los valores qi 2 R, de modo que se
puede describir un conjunto del tipo Q = q1
q2
:::
qn
Rn donde n es la dimensin
del espacio y corresponde al nmero de articulaciones del Robot. El espacio de tarea del
robot esta denido como el conjunto de todas las coordenadas espaciales que puede alcanzar
el efector nal a partir de la posicin de los ngulos de giro en las articulaciones mediante
el mapeo cinemtico directo h : Q ! W . Donde W
Rm y m
6 satisfacen W =
fh (q) : q 2 Qg de tal forma que la dimensin del espacio de tarea puede ser mximo 6 y es
el nmero de variables xi 2 R necesarias para denir la tarea del Robot. As el espacio queda
2 Rm
describe la
Introduccin
B
;
Kv
Existen varios mtodos para minimizar el error en estado estable respecto a incertidumbres en el control de robots, uno es utilizando controladores con la ley de control Proporcional
Integral Derivativo (P ID) en el cul se incrementa la ganancia integral al hacer el error casi
cero. Otro mtodo es utilizando controladores P D en combinacin con un compensador neuronal (P D +N N ) con la condicin para una ganancia derivativa sucientemente grande, este
mtodo puede extenderse a controladores P ID ms una compensacin neuronal (P ID+N N )
1.1 Motivacin
1.1.
Motivacin
Los controladores P ID (proporcional-integral-derivativo) se utilizan ampliamente en robots manipuladores industriales. En ausencia del conocimiento de la dinmica del robot el
control PID puede ser una buena eleccin para el seguimiento de trayectoria, ya que el controlador es libre de modelo, y sus parmetros se pueden ajustar fcilmente y por separado
[3][6]. Las ventajas del controlador P ID sobre los otros es que estos son simples y tienen
signicados fsicos muy claros. Sin embargo, las ganancias del controlador P ID deben ser sintonizados para garantizar un buen desempeo, as como, aumento de tiempo, sobreimpulso,
tiempo de establecimiento y el error de estado estacionario.
Bsicamente el proceso de ajuste de ganancias de P ID puede clasicarse en cinco categoras:
1. Modelo basado en sintonizacin analtica. De acuerdo con las relaciones analticas entre
Introduccin
el modelo y el objetivo de control, las ganancias del controlador P ID se calculan a
partir de algunas ecuaciones algebraicas [8][11][28].
2. Mtodos heursticos. Estos mtodos combinan varias tcnicas, tales como la experiencia
prctica [73][12], sintonizacin manual [6] e inteligencia articial [60][40][32].
3. Mtodos en dominio de la frecuencia. En estos mtodos las Frecuencias Caractersticas
son fciles de obtener para sistemas lineales. Cuando el proceso es controlado por un
sistema lineal, el controlador PID puede ser sintonizado en dominio de la frecuencia
[57].
4. Mtodos de optimizacin. El Controlador P ID se transforma en una forma especial de
control ptimo. En este mtodo el problema de sintonizacin del controlador P ID se
convierte en un problema de optimizacin numrica fuera de lnea [39].
5. Mtodos Adaptable Estn basados en tcnicas de control adaptable e identicacin
paramtrica en lnea, las ganancias del controlador P ID estn sintonizados como un
proceso de ajuste automtico [67].
El problema de los mtodos de sintonizacin anteriores es que no se pueden aplicar
1.1 Motivacin
Introduccin
1.2.
Objetivos
1.3 Estructura
1.3.
Estructura
La estructura siguiente del presente trabajo tesis consta de seis captulos, en el primer
capitulo se da una introduccin del trabajo haciendo un esbozo sobre de la motivacin
de ste y los distintos objetivos a cubrir . El capitulo 2 pone en contexto el trabajo de
tesis, primero se hace una descripcin breve sobre la cinemtica y dinmica de los robots
manipuladores en el espacio articulado, posteriormente se da una descripcin bsica sobre
la conguracin y uso de la redes neuronales. En el capitulo 3 se realiza una prueba de
estabilidad asinttica semiglobal para un controlador PID y posteriormente los resultados
tericos se aplican a un robot manipulador de dos grados el cul se encuentra en el laboratorio
de servicios experimentales del departamento de control automtico. En el capitulo 4 se
estudia la estructura del controlador neuronal PID realizando un estudio sobre la historia y
avances en este tema una vez entendida la estructura se lleva a cabo su respectivo anlisis de
estabilidad concluyendo con estabilidad asinttica semiglobal, posteriormente se propone un
control neuronal con velocidades no medibles y en la parte nal de este capitulo se realiza
una implementacin en laboratorio sobre los resultados tericos derivados de este estudio.
La parte nal de anlisis de este trabajo de tesis es el capitulo 5, en el se propone un nuevo
mtodo de sintonizacin de controladores PID para el control de Robots en lazo cerrado,
primero se realiza un estudio para determinar las condiciones bajo las cuales el control PD
es estable, posteriormente se realiza un anlisis para sintonizar el controlador PID en lazo
cerrado obteniendo un mtodo de ajuste para ganancias PID y determinando las condiciones
de estabilidad para las ganancias del controlador PID, luego estos resultados tericos se
prueban sobre un robot de dos grados de libertad ubicado en el laboratorio de servicios
experimentales del departamento de control automtico.
1.4.
Publicaciones
Revista
1. Roberto Carmona and Wen Yu, Robust Adaptive Control via Neural Linearization
Introduccin
and Compensation, Journal of Control Science and Engineering, Vol.2012, Article ID
867178, doi:10.1155/2012/867178, 2012.
2. Wen Yu, Roberto Carmona, A novel PID tuning method for robot control, Industrial
Robot, Vol.40, No.6, 578-582, 2013 (Impact Factor: 0.69)
Congreso
1. Roberto Carmona, Yu, Wen, PID control for robot manipulators with neural compensation, 2012 World Automation Congress (WAC12), Puerto Vallarta, Mexico, ID.20977,
2012
2. Wen Yu and Roberto Carmona Rodriguez, Task-space PID Control of Robot Manipulators with Explicit Conditions, 2013 American Control Conference (ACC13), Washington DC, USA, 4970-4976, 2013.
Captulo 2
Preliminares
2.1.
X = h (q) con X 2 Rm que representa el vector de variables en el Espacio Tareas. Por su parte
la Cinemtica inversa determina el valor de las articulaciones a partir de las coordenadas del
espacio de tareas del modo: q = f (X) de manera que se dene como el mapeo f : W ! Q .
En esencia el problema de la cinemtica inversa consiste en que: dada la posicin y
orientacin nal del efector nal del manipulador, se tiene que determinar el valor en las
articulaciones para alcanzar la posicin y orientacin del efector nal, es decir; dado el espacio
de referencia del manipulador en posicin y orientacin se debe determinar la relacin que
este guarda con la articulacin mediante un mapeo inverso, tal y como se muestra en la
Figura 2.1.
10
Preliminares
2.1.1.
Dinmica Inversa
Un modelo dinmico de un robot puede ser descrito mediante la siguiente ecuacin [59]:
M (q) q + C (q; q)
_ q_ + B q_ + g (q) = u
(2.1)
(2.2)
donde:
h (q; q)
_ = C q_ + F + g
F (q)
_ = B q_
Luego un controlador acorde a la dinmica inversa puede ser descrito de la siguiente
forma:
u = M v + h (q; q)
_
(2.3)
fM v + h (q; q)
_
11
h (q; q)g
_
(2.4)
q = v
De donde se obtiene un doble integrador que tiene la forma siguiente:
v=
K0 q
(2.5)
K1 q_ + r
Ahora si aplicamos las ecuaciones (2.5) a (2.4), entonces el sistema en lazo cerrado es:
q + K1 q_ + K0 q = r
Dada una trayectoria deseada q d and q_d para el sistema en lazo cerrado:
r = qd + K1 q_d + K0 q d
Entonces el error de trayectoria puede considerarse por:
q + K1 q_ + K0 q = r = qd + K1 q_d + K0 q d
(
q
qd ) + K1 (q_
q_d ) + K0 (q
qd) = 0
(2.6)
e + K1 e_ + K0 e = 0
Donde las matrices de ganancia son:
K0 = diag a21
a2n ;
K1 = diag [2a1
2an ]
De modo que se obtiene un sistema en lazo cerrado globalmente desacoplado, con cada
respuesta de la articulacin igual a las respuesta de un sistema crticamente amortiguado de
segundo orden cuya frecuencia natural esta dada por ai : La frecuencia natural ai determina
la velocidad de respuesta de la junta o equivalentemente la razn del decaimiento del error
de trayectoria.
Una forma alternativa para describir la dinmica de un manipulador puede ser realizada
por (2.7).
q = M
[u
h (q; q)]
_ = v (t)
(2.7)
12
Preliminares
Suponiendo que tenemos actuadores capaces de producir directamente una aceleracin comandada (ms que por la produccin de una fuerza o par), entonces la dinmica del manipulador verica que:
u = M v + h (q; q)
_
=)
q = M
[u
= M
h (q; q)]
_
h (q; q)]
_
= v
Cuando se tienen incertidumbres, una forma de representar la dinmica del manipulador
es:
M (q) q + C (q; q)
_ q_ + B q_ + g (q) = u
la cul puede ser escrita alternativamente por:
M q + h (q; q)
_ =u
donde:
h (q; q)
_ = C^ q_ + F^ + g^ + d (q; q)
_
^ (q; q)
= h
_ + d (q; q)
_
=)
^ (q; q)
h
_ = h (q; q)
_
d (q; q)
_
(2.8)
13
^ (q; q)
M q + h (q; q)
_ = u = Mv + h
_
M q + h (q; q)
_ = M v + (h (q; q)
_
d (q; q))
_
M q = M v + (h (q; q)
_
d (q; q))
_
q = M
q = v
[M v
1
h (q; q)
_
d (q; q)]
_
d (q; q)
_
(2.9)
q = v
Con la consideracin:
2.1.2.
=M
d:
M (q) q + C q; q q + G (q) + F q =
Donde q 2 <n denota las posiciones de las articulaciones, q 2 <n denota las velocidades
es la matriz
La dinmica para un robot manipulador descrita por (2.10) tiene las siguientes propiedades:
Propiedad 1. La matriz de inercia es simtrica y denida positiva, es decir;
m1 kxk2
xT M (x1 )x
m2 kxk2 ; 8x 2 Rn
2C(q; q) x = 0
14
Preliminares
n
P
k=1
Ck;ij (q) =
@Bij
@qk
@Bjk
@qi
@Bik
@qj
; kc = 12 maxn
n
P
q2R k=1
Rn .
Ck (q)qk ; C(q; q)
Si denimos:
x1 = q
x2 = q
Y adems consideramos el error de trayectoria como:
x1 = x1
xd1
x2 = x2
xd2
Kp (q
=
qd)
Kp x 1
Kd (q
q )
Kd x 2
(2.11)
Entonces el sistema en lazo cerrado del Robot manipulador puede representarse grca-
15
Figura 2.3: Dinmica de un Robot manipulador en lazo cerrado con el ngulo de giro deseado
q d sobre las articulaciones
2.2.
2.2.1.
Para validar los resultados tericos obtenidos en la plataforma de pruebas del laboratorio,
vamos a realizar un anlisis sobre la cinemtica y dinmica para el Robot de dos grados
de libertad, es importante destacar que este mismo anlisis es necesario para validar los
resultados tericos de los siguientes captulos.
Un robot de dos grados de libertad con articulaciones giratorias es bsicamente un par
de eslabones unidos y actuados por un par de motores tal y como se muestra en la Figura
2.4.
Este mtodo fue propuesto por Denavit y Hartenberg en 1955 [15] y describe una forma
sistemtica las coordenadas fSig correspondientes a cada eslabn i en una cadena cinemtica
y esta compuesto de las cuatro transformaciones bsicas dependientes de las caractersticas
geomtricas de los eslabones siguientes:
1. Rotacin sobre el eje zi
un ngulo i:
1
i.
16
Preliminares
5. Situar el origen del sistema de la base fS0 g en cualquier punto del eje z0 . Los ejes x0
e y0 se sitan de modo que formen un sistema de giro derecho con el eje z0 .
17
y zi .
y zn .
10. Obtener i como el ngulo necesario para girar alrededor del eje zi
para que xi
xi sean paralelos.
11. Obtener di como la distancia sobre xi para desplazar el nuevo sistema fSi 1 g para que
su origen coincida con fSi g.
12. Elegir ai como la distancia medida sobre el eje xi que hay que desplazar el nuevo
sistema fSi 1 g para que su origen coincida con el sistema fSi g.
13. Elegir
como el ngulo de debemos girar sobre el eje xi , para que le nuevo sistema
i 1
Ai denidas por:
1 0 0 ai
32
76
6
0 1 0 0 7
76 0 c i
6
0 0 1 0 7
54 0 s i
0 0 0 1
0 0
s
c
i
i
7
0 7
7
0 7
5
1
18
Preliminares
Donde Rotz; i signica que se realiza una rotacin un ngulo
sobre el eje zi .
15. Obtener la matriz de transformacin que relaciona el sistema de la base con el extremo
del Robot mediante la matriz denida por:
T0i = A1 A2
Ai =
"
R0i oi0
0
2 R4
Para el caso de un robot de dos grados de libertad la matriz que dene la posicin y
orientacin de este, esta dada por:
T02 = A1 A2
16. La matriz T dene la orientacin y posicin del extremo a la base en funcin de las n
posiciones de las articulaciones.
De acuerdo al mtodo de D-H para el robot manipulador de dos grados de libertad se
tiene el origen del la base del marco de referencia es o1 y o2 para el eslabn 2. Y su descripcin
geomtrica se puede observar en la Figura 2.5.
En este mtodo los parmetros ( i ; di ; ai ;
i)
sobre el eje zi 1 .
i
19
Figura 2.5: Descripcin de parmetros de D-H para un robot de dos grados de libertad
Por otro lado el Jacobiano geomtrico de un Robot manipulador esta dado por:
J0n = [Jv ; J! ]T
v0n = Jv q_
! n0 = J! q_
Donde Jv ; J! 2 R3
Velocidad Angular
Po la propiedad de antisimetra de matrices se tiene S T + S = 0;
! n0 = ! 10 + R01 ! 21 +
R0n 1 ! nn
+ R0n 1 q_n k
Se puede denir:
zi
= R0i k
dR
d
= SR ( ) y
20
Preliminares
Tal que zi
la base del marco de referencia esta dada por los primeros tres elementos de la
+ o0i
Donde oi esta dado por los primeros tres elementos de la cuarta columna de T0i :
Si la j
Jvn ] ;
Jvi = zi
(oj
oi 1 )
2
7
6
7 = ab sin n;con:
representa el producto cruz de los vectores a b = 6
a
a
a
1
2
3
5
4
b1 b2 b3
n como vector unitario perpendicular al plano que contiene a los vectores a y b en la direccin
Donde
n
1X
i=1
! i0
1
Ii ! i0 = q_T
2
"
n
X
i=1
J!Ti Ii J!i q_
21
n
X
mi ghi0
i=1
Dado que los primeros dos trminos de entrada de la ltima columna de T0i son la componentes x; y del punto ai = lci en el marco de referencia:
hi0 = yi en oi0
T0i = A1 A2
Ai =
"
R0i oi0
0
@L
=
@q
L = K
K = KT + KR
Luego si se denine:
D = fdij g = KT + KR
Entonces la ecuacin dinmica es:
M (q) q + C (q; q)
_ q_ +
(2.12)
(q) =
Donde:
M (q) = D (q)
(q) = [ 1 ;
n]
C (q; q)
_ = fckj g ;
ckj =
i =
Pn
@V
@qi
k; j = 1
Y como ya sabemos los trminos cijk indican los smbolos de Christoel del siguiente tipo:
cijk =
1
2
@dkj @dki
+
@qi
@qj
@dij
@qk
22
Preliminares
2.2.2.
=)
x_ =
l1 sin q1 q_1
y_ = l1 cos q1 q_1
x_ = J q_ =
"
l1 s1 0
l1 c1
q_
=)
x_ =
l1 sin q1 q_1
I11
6
I=6
4 0
0
0
I22
0
23
7
0 7
5
I33
2.2.3.
l1
q1
l2
q2
24
Preliminares
De donde podemos determinar las matrices de localizacin A1 correspondiente al primer
c q1
6
6 sq1
A1 = 6
6 0
4
0
sq1 0 l1 cq1
c q1
0
0
c q2
sq2 0 l2 cq2
7
6
6
0 l1 sq1 7
7 ; A2 = 6 s q 2
7
6 0
1
0 5
4
0
1
0
c q2
0
0
T01
Usando c1 c2
cq1
sq1 0 l1 cq1
6
6 sq1
= A1 = 6
6 0
4
0
7
0 l2 sq2 7
7
1
0 7
5
0
1
7
0 l1 sq1 7
7
1
0 7
5
0
1
c q1
0
0
c q1 c q2
sq1 sq2
6
6 c q1 sq2 + c q2 sq1
= A 1 A2 = 6
6
0
4
0
2
c12
s12 0 l1 c1 + l2 c12
6
6 s12 c12 0 l1 s1 + l2 s12
=6
6 0
0
1
0
4
0
0
0
1
T02
c q1 sq2
c q1 c q2
sq1 sq2
0
0
6 7
7
z0 = 6
4 0 5;
1
7
0 l1 sq1 + l2 cq1 sq2 + l2 cq2 sq1 7
7
7
1
0
5
0
1
7
7
7
7
5
l2 sq1 sq2
l1 c1
6
7
7
o1 = 6
l
s
4 1 1 5
0
6 7
7
z1 = 6
4 0 5;
1
25
l1 c1 + l2 c12
6
7
7
o2 = 6
l
s
+
l
s
1
1
2
12
4
5
0
La primer columna del Jacobiano para el primer eslabn la podemos elegir como:
2
3
i
j k
6
7
7 = l1 s1 i+l1 c1 j
z0 (o1 o0 ) = det 6
0
0
1
4
5
l1 c1 l1 s1 0
Luego
2 3 el segundo eslabn no afecta al primer eslabn, por lo que la segunda columna es
0
6 7
6 0 7 ; de modo que para el efecto de la velocidad lineal del primer eslabn se tiene lo
4 5
0
siguiente:
3
2
l1 s1 0
7
6
7
Jvc1 = 6
l
c
0
1
1
5
4
0
0
Luego observamos que la primera columna para el
2
i
j
6
z0 (o2 o0 ) = det 6
0
0
4
l1 c1 + l2 c12 l1 s1 + l2 s12
6
Jvc2 = 6
4
(l1 s1 + l2 s12 )
l1 c1 + l2 c12
0
l2 s12
7
l2 c12 7
5
0
l2 s12 i
26
Preliminares
Jvc2
6
=6
4
lc2 s12
7
lc2 c12 7
5
0
l1 c1 + lc2 c12
0
Dado que:
J!T1 I1 J!1
1X T T
q_ J!i Ii J!i q_
=
2 i=1
n
! i0 = J! q;
_
Entonces tenemos:
Ii ! i0
J!i = [z0 ; z1 ; zi 1 ]
3
32
3T 2
0 0 0
I1x 0
0
0 0 0
7
76
7 6
6
7
76
7 6
= 6
4 0 0 0 5 4 0 I1y 0 5 4 0 0 0 5
1 0 0
0
0 I1z
1 0 0
2
3
I1z 0 0
6
7
7
= 6
0
0
0
4
5
0 0 0
2
0 0 0
3T 2
I2x
6
7 6
7 6 0
J!T2 I2 J!2 = 6
0
0
0
5 4
4
1 1 0
0
I2z I2z 0
I2z I2z 0
0
0
I2y
0
32
0 0 0
7
76
6 0 0 0 7
0 7
54
5
I2z
1 1 0
I1
"
1 0
0 0
+ I2
27
"
1 1
1 1
#!
q_
V2 = m2 gh2
c q1
6
6 sq1
= A1 = 6
6 0
4
0
2
c12
s12
6
6 s12 c12
T02 = 6
6 0
0
4
0
0
T01
sq1 0 l1 cq1
c q1
0
0
0
0
1
0
7
0 l1 sq1 7
7
1
0 7
5
0
1
3
l1 c1 + l2 c12
7
l1 s1 + l2 s12 7
7
7
0
5
1
Donde los primeros trminos de la ltima columna de T0n son las componentes x; y de l2 en
el marco de referencia.
h1 = l1 sq1 = l1 sin q1
h2 = l1 sin q1 + l2 sin (q1 + q2 )
2.2.4.
Ecuacin de Euler-Lagrange
@L
= ;
@q
L=K
V;
K = KT + KR
Podemos considerar la matriz de inercia D (q) ; usando c21 + s21 = 1; c12 c1 + s12 s1 = c2 ;
28
Preliminares
1 0
"
1 1
"
d11 d22
cijk =
@dkj @dki
+
@qi
@qj
1
2
@dij
@qk
cijk = cjik
1
2
@d11
@q1
@d11
@q1
@d11
@q1
=0
c121 =
1
2
@d21
@q2
@d12
@q2
@d12
@q1
m2 l1 lc2 s2
c221 =
1
2
@d12
@q2
@d12
@q2
@d22
@q1
m2 l1 lc2 s2
c112 =
1
2
@d21
@q1
@d21
@q1
@d11
@q2
= m2 l1 lc2 s2
c122 =
1
2
@d22
@q1
@d21
@q2
@d21
@q2
=0
c222 =
1
2
@d22
@q2
@d22
@q2
@d22
@q2
=0
Y si consideramos que en la dinmica del Robot descrita por (2.12) el vector de compensacin por gravedad es el siguiente
@V
@q1
@V
@q2
(q) = [ 1 ;
T
2]
con:
(q) =
29
T02
c q1 c q2
sq1 sq2
6
6 c q1 sq2 + c q2 sq1
= A1 A2 = 6
6
0
4
0
Usando: c1 c2
c q1 sq2
c q1 c q2
sq1 sq2
0
0
l2 sq1 sq2
7
0 l1 sq1 + l2 cq1 sq2 + l2 cq2 sq1 7
7
7
1
0
5
0
1
2.2.5.
(2.13)
Cinemtica Inversa
30
Preliminares
y
x2 + y 2 l12
cos q2 =
2l1 l2
Entonces el ngulo de giro del segundo eslabn es:
p
sin q2 =
q2 = tan
=D
D2
l22
1 D2
D
y
x
tan
l2 sin q2
l1 + l2 cos q2
q=
"
q1
q2
=4
tan
y
x
tan
tan
l2 sin q2
l1 +l2 cos q2
1 D2
D
De donde podemos observar que estos dependen directamente de la conguracin geomtrica del Robot.
2.2.6.
(q) =
La cul para un Robot de dos grados de libertad es descrita por la Figura 2.6, adems
de aqu podemos observar sus parmetros fsicos de acuerdo a las siguientes componentes:
M (q) =
"
M11 M12
M21 M22
; C(q; q)
_ =
"
C11 (q; q)
_ C12 (q; q)
_
C21 (q; q)
_ C22 (q; q)
_
"
1
2
31
Figura 2.6: Diagrama esquematico de Robot de dos grados de libertad para obtencin de
parmetros geometricos
(q) =
"
1 (q)
2 (q)
"
(q) = (q) =
"
sen(q1 ) sen(q1 + q2 )
0
sen(q1 + q2 )
#"
(m1 lc2 + m2 l1 )g
m2 lc2 g
(q) = (q) =
"
#"
g
g
32
Preliminares
De forma general los parmetros geomtricos los podemos ordenar de la forma siguiente:
2
2
+ 2m2 l1 lc2 cos(q2 ) + I1 + I2
+ m2 l12 + m2 lc2
M11 (q) = m1 lc1
2
M12 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M21 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M22 (q) = m2 lc2
+ I2
C11 (q; q)
_ =
C12 (q; q)
_ =
C21 (q; q)
_ = m2 l1 lc2 sen(q2 )q_1
C22 (q; q)
_ = 0
g1 (q) = [m1 lc1 + m2 l1 ]gsen(q1 ) + m2 glc2 sen(q1 + q2 )
g2 (q) = m2 glc2 sen(q1 + q2 )
2.3.
33
paralelos distribuidos, formados por una nica unidad de procesamiento, la cul tiene la
natural de almacenar el conocimiento experimental y tener ese conocimiento disponible para
usar.
De acuerdo a la denicin anterior las redes neuronales tienen un arreglo de elementos
bsicos de procesamiento con capacidad de entrenamiento (Figura 2.8) y computo paralelo,
este entrenamiento consiste en el ajuste de algunos parmetros (win ;
i)
con el n de que la
salida de la red alcance algn grado de precisin a partir de las variables de entrada mediante
el ajuste paramtrico.
El conocimiento en una red neuronal articial viene del medio ambiente mediante un
proceso de aprendizaje en la que los pesos sinpticos sirven para almacenar el conocimiento
adquirido. En el proceso de reconocimiento de patrones un modelo neuronal ampliamente
aplicado es el perceptrn, cuyo modelo matemtico consta de tres elementos bsicos descritos
a continuacin e ilustrados en la Figura 2.9.
1. Un conjunto de sinapsis o uniones caracterizadas por un peso. Se denota regularmente
que xj es la entrada de la sinapsis j que esta conectada a la neurona k; xj es multiplicada
por el peso sinptico wkj :
34
Preliminares
2. Operador lineal, es decir la suma de las seales de entrada multiplicadas por sus pesos
sinpticos respectivos.
3. Funcin de Activacin para limitar la salida de la neuronal f (z).
El tipo de estructura mas simple que existe en las redes neuronales es la llamada FeedForward ilustrada en la Figura 2.10, en la cual la salida de una red neuronal depende nicamente
de sus entradas y no existe conexin de la salida de las neuronas con su entrada, el ujo de
la informacin es hacia un solo sentido y las neuronas se actualizan siempre al mismo tiempo
y no dependen de seales en instantes anteriores de tiempo se dice que es una red neuronal
esttica porque la respuesta de la red neuronal es invariante en el tiempo y este es del tipo
de Red Neuronal Articial utilizada en el presente trabajo.
Existen tres tipos de redes neuronales estticas: las redes de una sola capa, las redes neuronales mlticapa y las redes neuronales de funciones radiales bsicas. Las redes neuronales
estticas son muy tiles en los problemas de clasicacin de patrones y aproximacin de
funciones porque construyen funciones no lineales entre el espacio de entrada al espacio de
35
salida de las variables involucradas. Una red neuronal con conexiones hacia adelante con una
capa oculta no lineal y una capa de salida lineal puede aproximar cualquier funcin con el
grado de precisin que se desee. Es la forma mas simple de redes neuronales feedforward,
tiene solo una capa de neuronas, el perceptrn es la red neuronal de una capa mas difundida,
el cual consiste en una sola neurona y se ilustra en la Figura 2.8.
Usualmente el umbral (w0 ) es tratado como un peso sinptico conectado al valor jo
1;
(2.14)
j=1
(2.15)
Las redes neuronales multicapa tienen las siguientes tres caractersticas que las distinguen:
36
Preliminares
'i ( i ) =
1
(1 + e
yj (k);
(2.16)
37
donde:
dj es la salida deseada.
yj es la salida de la red neuronal
k indica el elemento del arreglo de entrada.
El error cuadrtico medio instantneo se escribe como:
1X
"(k) =
ej (k)
2 j=1
l
(2.17)
"av
N
1 X
=
"(k);
N k=1
(2.18)
Usando N ejemplos, que forman una epoca."av representa la funcin de costo a minimizar en
el aprendizaje, de modo que el objetivo del proceso de aprendizaje es ajustar los parmetros
libres de la red, para minimizar el valor de "av . Para hacer eso el algoritmo back propagation
aplica una correccin
38
Preliminares
(2.19)
(2.20)
wji (k) aplicado a los pesos sinpticos wji (k) se dene por la regla
delta:
wji (k) =
@"(k)
@wij (k)
(2.21)
Un inconveniente de las redes neuronales MLP es que su entrenamiento es lento, la minimizacin del ndice del error cuadrtico de salida requiere de comparar en varias ocasiones el
conjunto de datos de entrenamiento con la respuesta de la red neuronal. Las redes neuronales
con funciones de base radial (RBR) son una alternativa a las redes neuronales MLP, en el
contexto de que las RBF las capas ocultas estn conformadas por un conjunto de funciones
que constituyen una base para el problema de clasicacin. La justicacin matemtica la
establece el teorema de Cover (Cover, 1965), se basa en que un problema de clasicacin es
ms probable que sea linealmente separable si se transforma en otro de dimensin mayor.
Las funciones de base radial fueron introducidas primero para la solucin de problemas
de interpolacin multivariable. El trabajo pionero en este tema fue Powell, 1985. Broomhead
y Lowe en 1988, exploraron por primera vez el uso de las redes neuronales con funciones
de base radial para poder realizar una clasicacin no lineal. A diferencia de la disposicin
que se tiene en las funciones de activacin de la red MLP que permite construir modelos de
entrenamiento mediante el algoritmo de back-propagation, las nuevas redes con funciones de
base radial construyen sus modelos con funciones de activacin que son diferente tanto en
la capa oculta como en la capa de salida, es decir; una red RBR est diseada con neuronas
en la capa oculta activadas mediante funciones radiales de carcter no lineal con sus centros
propios y en la capa de salida mediante funciones lineales.
La estructura de las redes de base radial presenta tres capas bien denidas:
39
F (x) =
N
X
wi ' (kx
i=1
xi k)
(2.22)
mente no lineales, conocidas como funciones radiales bsicas, y k k denota la norma que
usualmente es la Euclideana, los datos conocidos xi 2 Rm0 ; i = 1; 2; :::; N son tomadas para
40
Preliminares
r2
2 2
1
;
(r 2 +c2 )1=2
; para algn
En general una red RBR tiene un mejor desempeo con un mayor volumen de datos
de entrenamiento que su contraparte la red MLP, presentan una arquitectura simplicada
con una capa oculta, su entrenamiento es rpido y se puede realizar una combinacin de
diferentes paradigma de aprendizaje.
Un problema en las Redes Neuronales Estticas es el almacenamiento de informacin
temporal, esto se realiza incluyendo retardos en las entradas y las salidas, sin embargo,
es una representacin limitada, ya que solo puede almacenar un nmero nito de entradas
previas, una alternativa para solucionar este tipo de problemas es el uso de Redes Neuronales
en Diferenciales (DNN) para tiempo continuo y para tiempo discreto utilizamos el nombre
de Redes Neuronales Recurrentes (RNN) y cuyo estudio detallado escapa de los alcances del
presente trabajo, a lo cu solo se mencionaran algunas caracteristicas bsicas. Debtro de las
tareas para este tipo de redes son: La prediccin de series, la identicacin y el control de
sistemas dinmicos.
Una de las primeras estructuras de una red neuronal retroalimentada fue propuesta por
41
Hopeld y usa su red para describir redes de circuitos elctricos, ver [24]. Existen dos versiones
de la red neuronal de Hopeld:
La red neuronal discreta de Hopeld la cul se representa por el modelo matemtico
siguiente:
xi (k + 1) = sgn
Donde:
xi es el estado de la i
"
n
X
j=1
esima neurona,
n es el nmero de neuronas,
ui es la entrada a la i
esima neurona,
es el umbral de la i
esima neurona.
(2.23)
42
Preliminares
Captulo 3
PID estable en el espacio articular
3.1.
Introduccin
44
asegurar la estabilidad asinttica del controlador PID el mtodo mas simple es convertir el
controlador lineal PID a uno no lineal. Por ejemplo el error de posicin ha sido modicado
en un controlador no lineal en el trabajo de [4]; Por su parte en los trabajos de [36] y [60] el
trmino integral fue saturado por una funcin no lineal; en el trabajo de [2] se opta por una
saturacin a la entrada, En el trabajo de [1] se realiza una transformacin de un observador
no lineal a una forma de control PID. Por otro lado la prueba de estabilidad asinttica semiglobalmente fue realizada en el trabajo de [49] gracias a la adicin de un trmino integral
extra al ltro de posicin. En [30] y [51] un control PID fue modicado en un forma de
variacin estructural con un controlador PID mediante deslizamiento de supercie. Por su
parte [34] se obtuvieron condiciones de estabilidad asinttica global gracias a la adicin de
trminos proporcional y derivativos en el controlador lineal PID. A pesar de que los controladores industriales PID han sido utilizados ampliamente, existen pocos trabajos referentes
a las condiciones explcitas y anlisis de estabilidad. Pocos trabajos se han realizado sobre
el controlador PID lineal utilizando la dinmica en una forma desacoplada y no lineal tal
como en el trabajo de [54], aun as este controlador PID no puede garantizar la estabilidad
asinttica. Para las condiciones sucientes de estabilidad de un controlador PID lineal puede
consultarse el trabajo de Kelly [37] el cul esta basado en un anlisis de Lyapunov. Con frecuencia estas condiciones no son explcitas y las ganancias no se pueden elegir directamente,
para ello se ha utilizado el mtodo un tanto complejo [38].
En esta seccin del trabajo de tesis se propone un anlisis de Lyapunov novedoso para
el controlador lineal PID en el cul las condiciones sucientes de estabilidad asinttica son
simples y explcitas, donde las ganancias del controlador lineal PID pueden seleccionarse
bajo estas condiciones directamente.
Cuando las mediciones de velocidad no estn disponibles es necesario utilizar un observador de velocidad, es decir; un ltro de posicin para lo cus en el siguiente trabajo se
realiza una prueba la estabilidad asinttica para el control lineal PID con observador propuesto, este anlisis proporciona condiciones explcitas para elegir las ganancias del control
lineal PID as como los parmetros del observador de velocidad.
Posteriormente se utilizar un robot manipulador de dos grados de libertad para veri-
45
car las condiciones de sintonizacin del controlador PID, se propone adems un mtodo
sistemtico para mejorar el ndice de desempeo. Los resultados experimentales muestran
que la metodologa propuesta es una herramienta analtica para el diseo de controladores
que por su constitucin son ajustados experimentalmente.
3.2.
xT M (x1 )x
m2 kxk2 ; 8x 2 Rn
siguiente relacin:
xT M (q)
Donde C(q; x)y = C(q; y)x; C(q; q) =
n
P
2C(q; q) x = 0
Ck (q)qk ; C(q; q)
k=1
Ck;ij (q) =
@Bij
@qk
@Bjk
@qi
@Bik
@qj
; kc = 12 maxn
n
P
q2R k=1
Rn .
Denamos:
x1 = q;
x2 = q
xd1 ;
x2 = x2
Kd (q
q )=
xd2
Kp (q
qd)
Kp x 1
Kd x 2
(3.1)
46
Kp (q
qd)
Kd (q
q ) = P D1
(3.2)
(3.3)
VP D =
(3.4)
La cul no es nica, luego de las propiedades de simetra y antisimetra menicionadas anteriormente se tiene:
q_T M (q)
2C(q; q) q_ = 0
q_T K1 q_ + (G + F )T K1 1 (G + F )
Con K1 como matriz denida positiva. Luego si obtenemos la derivada de la funcin candidata de Lyapunov (3.3):
V PD =
q_T Kd q_ + q_T (G + F )
q_T (Kd
K1 ) q_ + d
(3.5)
47
Donde:
(g + f )T K1 1 (g + f )
K1 )
converge a d:
Kp x 1
(3.6)
Kd x2 + G (q)
(3.7)
Cx2
(3.8)
G+
(3.9)
0; V1
0:
F+ )=
xT2 Cx2
xT2 Kp x1
xT2 Kd x2
xT2 Kp x1
xT2 Kd x2 + xT2 Kp x1 =
xT2 Kd x2
(3.10)
48
3.3.
M (q) q + C (q; q)
_ q_ + g (q) = u
dada por los tres elementos de la cuarta columna de la matriz de transformacin homognea.
Adems el modelo del robot satisface las siguientes propiedades:
P1. La matriz de inercia M (q) es simtrica y denida positiva y satisface:
0<
Donde
fM g y
fM (q)g
kM k
fM (q)g
>0
(3.12)
kc kqk
_ 2;
kc > 0
(3.13)
2C (q; q)
_ es antisimtrica, es decir.
i
2C (q; q)
_ x=0
(3.14)
M_ (q) = C (q; q)
_ + C (q; q)
_T
(3.15)
M_ (q)
con
g (y)k
kg kx
yk
(3.16)
49
De modo que el objetivo de control es evaluar el par sobre cada articulacin tal que los
desplazamientos tiendan asintticamente a una constante de desplazamiento deseada en cada
articulacin.
Dada una constante de posicin deseada q d 2 Rn ; la condicin para la estabilidad as-
inttica semiglobal para el robot es disear una entrada de control de par u sobre (3.11)
que haga que el error de regulacin q~ = q d
cambio q~ ! 0; cuando las condiciones iniciales son arbitrariamente grandes sobre el dominio
Rt
de atraccin. La ley clsica de control PID esta denida por u = Kp q~ + Ki 0 q~ ( ) d + Kd q~;
donde las constantes Kp ; Ki ; Kd son las constantes proporcional, integral y derivativas del
controlador respectivamente. Dada las condiciones: q_d = 0; y q~ =
q;
_ la ley de control PID
(3.17)
Kd q_ +
_ = Ki q~
(0) =
(3.18)
(3.19)
Aqu necesitamos que el control lineal (3.17) este en una forma desacoplada, es decir; requerimos que Kp ; Ki y Kd sean matrices diagonales denidas positivas. De modo que la dinmica
del manipulador en lazo cerrado (3.11) sea:
M (q) q + C (q; q)
_ q_ + g (q) = Kp q~
Kd q_ +
_ = Ki q~
De donde el punto de equilibrio es
Kd q_ + ~ + g q d
Para el anlisis de estabilidad del control lineal PID se presenta el siguiente teorema.
(3.20)
50
Teorema 3.1 Dada la dinmica del Robot (3.11) controlada por el controlador lineal PID
(3.17), entonces el sistema en lazo cerrado (3.20) es semiglobalmente asintticamente estable
en el punto de equilibrio.
T
g q d ; q~; q~
x=
=0
Donde
m (M ) m (Kp )
(Kp )
(Ki )
(Kd )
3
k
2 g
m (Kp )
(3.21)
M (M )
(M )
(3.22)
Donde ku = m nq fU (q)g ; U (q) esta denida en (3.11), ku se agrega de modo que V (0) = 0:
y
0: Es fcil encontrar V1 = 21 sT
3
: Entonces
V2
1
2
(3.23)
q~T M q_ + 12 q_T M q_
Kp 1 g q d
ku + 2 q~T Kd q~
V4 = U (q)
0; s = q~; g q d
0:
1
3
(Ki 1 )
m
m (Kp )
(Kp ) k~
qk
3
~
m (Kp )
!2
"
1
K
3 p
3Kp 1
Cuando
m (M ) m (Kp )
M (M )
1
2
V3
q
1
3
51
1
3
(M )
M
Ki
m
(M ) kqk
_
3
2
(Kp )
1
2
1
3
(Kp ) k~
qk
(M )
(M ), entonces existe
(Kp )
!2
(M )
Ki
(3.24)
(Kp )
0: Usando
d
U
dt
d
g
dt
qd = 0 y
d
dt
q~T g q d
T
+ ~ Ki 1 ~ + q~ ~ + q~T ~
(3.25)
Dado que q~ g q d =
(3.26)
Ahora para los ltimos dos trminos de la derivada de la funcin de Lyapunov (3.25). de la
condicin (3.15) tenemos que.
q~T M q_ = q~T C q_ + q~T C T q_
52
q~T C q_
q_T M q,
_ si usamos (3.13) y (3.16) entonces los ltimos dos trminos de la
Donde q~ M q_ =
g (q)
(3.27)
q~T Kp q~ + kc k~
q k kqk
_ + kg k~
qk
q~T ~
q_T (Kd
[
[
m
m
(Kd )
(Kp )
M
M
q~T ( Kp
kc k~
q k) q_
Ki
kg ) q~
kc k~
q k] kqk
_
(M )
kg ] k~
q k2
(Ki )
Luego s:
M
k~
qk
(M )
kc
Y adems:
m
(Kd )
(Kp )
(1 + ) M (M )
1
M (Ki ) + kg
Y el error de regulacin k~
q k decrece. Luego de (3.24), s:
q
p
1
(M
)
m
m (Kd )
M (M ) +
3
m
(Kp )
1
3
Ki
Entonces:
V_
(Kp )
(Kp )
(Ki ) + kg
(3.28)
53
Ki
radio
1
M (Ki )
de
q~ : k~
qk
(M )
=
kc
de radio
>0
como:
n
h
i
o
= x (t) = q~; q;
_ ~ 2 R3n : V_ = 0
q~ = q_ = 0
para todo t
0, es necesario y suciente
0.
0.
Entonces concluimos primero que del sistema en lazo cerrado (3.20), si la solucin x (t) 2
para todo t
todo t
cul x (t) 2
para todo t
0.
1
m
Ki
(Kp )
(M )
kc
(Ki )
(Kp )
(3.29)
54
(Kp ) > kg ;
(Kd ) >
2
M
(M )
m (M )
(Ki )
kg
m (Kp )
M
Las cules no son explcitas y su regin de atraccin para la estabilidad asinttica semiglobal
es:
k~
qk
1
kc
(Kd )
(Kp ) kg
M (Ki )
(M )
(3.30)
Esto signica que para ganancias integrales pequeas en el controlador PID e incluso para
el controlador PD (Ki = 0) podemos asegurar estabilidad asinttica. Por lo que si comparamos (3.30) con las cotas obtenidas en (3.29) de nuestro mtodo, podemos ver que nuestros
resultados son mejores en el sentido de estabilidad.
En la literatura podemos ver que sin el vector de fuerzas gravitacionales g (q) en la
dinmica de un robot (3.11) un control PD con alguna ganancia positiva puede hacer que
el sistema en lazo cerrado sea asintticamente estable. Entonces el objetivo principal de la
accin integral sobre la dinmica de un robot manipulador es la de cancelar el par gravitacional. Con el n de disminuir la ganancia integral se aplica un estimado de gravedad en el
control (3.17). De modo que el control PID con una compensacin aproximada de gravedad
55
g^ (q) es el presentado por 3.31 y grcamente se puede representar por la Figura (3.1).
u = Kp q~
Kd q_ + g^ (q) + ;
_ = Ki q~
Si denimos
g~ (q) = kg (q) g^ (q)k
Z T
g~ (q) dq
U~ (q) =
0
U~ (0) = 0;
g~ (y)k
k~g kx
yk
(3.31)
56
n
o
~
~
Donde ku = m nq U (q) : El teorema anterior tambin es correcto para un control PID
con una compensacin aproximada de gravedad (3.31). Y la condicin para las ganacias del
control PID de (3.21) son:
(Kp )
(Ki )
3~
kg
2
3
2
k~g
=
3.4.
kg
r
k~g
M (M )
(M )
3
(Kp )
En contraste con los altos grados de precisin de los enconders pticos para medicin de
velocidad respecto los tacmetros, estos ltimos son bastante imprecisos e inexactos especcamente para ciertos intervalos de tiempo. Una estrategia de diseo en controladores PID
para medicin de velocidades es proponer un observador de estado para estimar la velocidad.
En el controlador PI2 D [49] se agrega un trmino integral al controlador lineal PID integral
(3.33) con lo cul se prueba estabilidad asinttica semiglobal.
Para un diseo alternativo de observadores se pueden utilizar los ltros de posicin de
cero y primer orden para estimar la velocidad en las articulaciones [59].
Donde
(s) =
bi s
qi (s) ;
s + ai
i=1
(3.32)
diagonales A y B del tipo A = diag fai g, B = diag fbi g ; que satisfacen las condiciones
ai > 0; bi > 0: La funcin de transferencia del ltro (3.32) puede representarse po una
ecuacin en espacio de estados. De modo que podemos considerar el controlador lineal PID
57
(3.17) siguiente.
u = Kp q~
_ = Ki q~;
x_ =
Kd +
(0) =
(3.33)
A (x + Bq)
= x + Bq
Donde Kp ; Ki y Kd son matrices de coecientes constantes, diagonales y denidas positivas
y los trminos ai y bi en el ltro (3.32) deben de ser constantes positivas.
El sistema en lazo cerrado del robot (3.11) es:
_ = Ki q~;
q_ = M
_ =
A + B q_
C (q; q)
_ q_
Kd + ~ + g q d
g (q) + Kp q~
(3.34)
i
h
Donde el punto de equilibrio de (3.34) es considerado como: ~; ; q_ = [0; 0; 0] :
Para el anlisis de estabilidad se presenta el siguiente teorema.
Teorema 3.2 Dada la dinmica del Robot (3.11) controlada por el controlador lineal PID
(3.33) donde las matrices A, B satisfacen:
M (A)
2
m (A)
Con
(Kd )
(B)
1
4
(B
I)
m (B)
M (B)
m (M )
2
M (M )
(Kd )
1
2
(3.35)
(A)
en el punto de equilibrio.
T
x=
g q
; q~; q~
=0
(M )
kc
(B
I)
1
2
(A) +
k k
58
1
2
(Kp )
kg +
+ 1+2
2
m (Kd )
M
Donde
(Kp )
M
2
(Ki ) +
(A 1 BKi )
(Kd ) + 2 M (A 1 Ki )]
1K + 1
i) 2
M (A
M (Kp )+ (M )
2 M
kg + 21
(Ki )
m (AB
M (M ) M (A)
(3.36)
I) 1
(Kp )
ku
T
Kp g q + 2 ~ Ki 1 ~
q
T
+~
q T (I + A B) ~ + 21 T B 1 Kd
M q_ +
T
+~
q g q
Donde
d T
+ 23 g
1
q~T M q_
T
A 1~
(3.37)
1 T
q~ Kp q~
2
V1 = 61 q~T Kp q~ + q~T g q d + 23 g q d
T
V2 = 16 q~T Kp q~ + q~T ~ + 2 ~ Ki 1 ~
Kp 1 g q d
V3 = 61 q~T Kp q~
V4 =
V5 =
1 T
4
1 T
4
q~T M q_ + 14 q_T M q_
T
(B 1 Kd ) + T A 1 ~ + ~ (A 1 B) ~
T
(B 1 Kd )
M q_ + 14 q_T M q_
Entonces:
V3
1
2
1
2
0:
(M ) kqk
_
(M )
r
1
3
(Kp ) k~
qk
!2
59
B 1
1
M (B)
(AB)
B
(A)
A 1
M (A)
2
m (A)
(B 1 Kd ) m ((A 1 B))
m (B)
m (Kd )
M (B)
m
V4
(B 1 Kd ) k k2
+2
M
2
(A 1 ) k k ~
((A 1 B)) ~ ]
(M )
(B)
(M )
Entonces:
V5 =
Como V6
1 1
2 2
Kd B
+2
1
M q_ + q_T M q_
2
1
6
(B)
m (Kp ) m (M )
2
M (M )
1
4
(Kd )
M (A)
2
m (A)
m (M )
2
M (M )
(Kd )
m (B)
M (B)
(3.38)
60
T
+ ~ Ki 1 ~
q~ M q_ + q~T M q_ + q~T M q
(3.39)
+q~ (I + A B) ~ + q~T (I + A 1 B) ~ + _ T (B 1 Kd )
1
_ T M q_ +
M q_ +
M q + _ T A 1 ~ +
A 1~
q_T Kd + q_T ~ + q~T ~: Y el
f~
q T Kp q~ q_T M q_ + q~T C T q_ + q~T g q d
g (q)
2
T
T
T~
q~ Kd g
q~ Kp q~ + kg k~
q k + q_T M q_
+~
q
+ q~T C T q_
q~T ~ + q~T Kd
Usando _ =
A + B q;
_ y q~ =
(3.40)
q;
_ los trminos del octavo al dcimo de (3.39) son:
AB 1 Kd
(3.41)
q_T BM q_
AM q_
T
Kp q~ +
C q_
T~
Kd
T
T
C T q_ +
g qd
C T q_
g (q)
(3.42)
Usando (3.13):
q~T C T q_
kc k q~
C q_
k kqk
_ 2
Luego si usamos ~ = Ki q~ y _ = A + B q;
_ los ltimos dos trminos de (3.39) son
T
1 ~
T
1
q_ A B
A Ki q~: Si combinamos las ecuaciones anteriores tenemos:
V_
q_T BM q_
AB 1 Kd
+ kg k~
q k2 + q_T M q_ + kc k q~
+~
q T Ki q~ + q~T A 1 BKi q~ +
+~
q T ( Kd
Kp
T~
q~T Kp q~
k kqk
_ 2
q k2
Kd + 21 kg k k2 + 12 kg k~
A 1 Ki ) + q_T AM
(3.43)
0; necesitamos:
(BM
(AB 1 Kd
( Kp
Donde Ke = Kd
61
kc k q~
M)
1
k
2 g
Kd )
1
2 (M )
(AM )
(M )
1
M (Ke ) + 2
M
2
1+2
kg + 2 M (Ke )
2
A 1 BKi )
Ki
A 1 Ki : Usando
Kp
k+
(A)
(B)
(3.44)
(AM )
(AB)
(A)
(B) ; donde
i puede ser "m.o "M ", la ltima condicin de (3.44) puede reemplazarse por:
1
kc
q~
(B
I)
(A) +
1
2 (M )
(M )
M
(B)
(M )
(A + B)
(A)
(A) +
(B) ; la
[(AB
1
k
2 g
1
k
2 g
+
+
I) Kd ]
1
2
1
2
(Ke ) +
(Ke ) +
1
I) m (Kd )
m (AB
(M )
M (M ) M (A)
2
(M )
M (AM )
2
(3.45)
(Ki ) +
(A 1 BKi ) +
1+2
2
kg +
( Kp )
(Ki )
(A Ki )] +
1
2
(Kp )
(Ki ) + ;
= 1[
(A 1 BKi ) + 1+2
kg + 2
2
(Kp )
M Ki )
(Kd ) +
y son anes.
Estas condiciones pueden establecerse cuando los valores de Ki no son grandes. La segunda
condicin de (3.36) y la tercer condicin de (3.35) no son anes. Primero tomemos
tan
pequea como sea posible y Kp tan grande como sea posible de tal forma que Ki no sea
grande. Estas consideraciones son razonables para nuestro control real. Si seleccionamos
B =
1
:
2
requiere
(AB
1
m
I) >
1
;
2
entonces existe un
A ( A + I)
1
2
y un
62
3.5.
Resultados experimentales
A continuacin se muestran una serie de resultados para evaluar el desempeo del controlador propuesto (3.31) sobre un robot planar de dos grados de libertad. Estos experimentos
se realizaron en el laboratorio de servicios experimentales del Departamento de Control
Automtico. La estructura bsica de la plataforma se muestra en la Figura 3.2. En esta
plataforma se utiliza un par de motores de escobillas de CD de la marca Litton C34-L80W40. Para los cuales se utilizan un par de amplicadores de potencia de 24 a 90 DC de
Copley Controls Logosol DC Servo Amplier LS-5Y. Por otro lado la Arquitectura esta
compuesta basicamente de dos etapas a saber [45][55].
La primera, Es la programacin y manejo de datos la cul utiliza un servidor para programacin y manejo de datos basandose en Matlab. Ademas del programa Wincon que realiza
la compilacin y transferencia del cdigo del algoritmo generado en Matlab en tiempo real.
La segunda etapa es el control en la que se utiliza una computadora (cliente) mediante
una red de comunicacin ethernet, en la cul el Wincon se utiliza para correr el cdigo
generado por el servidor.
Finalmente la adquisicin de datos se realiza mediante una tarjeta Servotogo la cul
maneja decodicadores pticos y voltajes analgicos.
Los dos teoremas de este capitulo son sucientes para proporcionar las condiciones de los
valores mnimos de las ganancias proporcionales y derivativas as como el mximo valor para
las ganancias integrales. Debido a que el robot descrito en (3.3) solo tiene dos articulaciones
giratorias, podemos elegir las relaciones
(M )
Los lmites inferior y superior de los valores caractersticos de la matriz de inercia M (q)
son elegidos de acuerdo a
(M ) = 3;
=
M (Ki )
m (Kp )
(Ki )
(Kp ).
7
;
12
= 0;08; A = diag(30); =
tal que B = diag(17;58). La velocidad
18s
q (s). A n de satisfacer las condiciones de
en las articulaciones es estimada por e
q_ (s) = s+30
los teoremas anteriores podemos elegir las ganancias del controlador lineal PID de la forma
63
Figura 3.2: Plataforma Experimental para un Robot de dos Grados de Libertad. Laboarotorio
experimental Dpto. Control Automtico-CINVESTAV
siguiente:
Kp = diag [150; 150]
(3.46)
Ki = diag [2; 1]
Kd = diag [330; 330]
Cuando la dinmica del robot (3.11) es inestable en lazo abierto, es peligroso enviar los
comandos de avance al robot. En esta seccin proponemos un nuevo mtodo de ajuste en
lazo cerrado. El controlador lineal P ID0 ; con las ganancias en (3.46) puede garantizar la
estabilidad en lazo cerrado considerando la compensacin por gravedad, de esta forma el
sistema en lazo cerrado es:
M (q) q + C (q; q)
_ q_ + g~ (q) = P ID0
g^ (q)
(3.47)
@
Donde los trminos aproximados de gravedad se obtienen de: g^ (q) = @q
U (q) ; donde para el
P2
robot de dos grados de libertad tenemos U = i=1 mi ghi ; hi = yi con h1 = l1 sq1 = l1 sin q1
64
0;93
;
60s2 +9s+1
G2 =
1
;
20s2 +3s+1
para
aproximar las respuestas del robot en lazo cerrado. Las respuestas al escaln unitario se
muestran en la Figura 3.4.
Para implementar el nuevo controlador P ID1 para el sistema en lazo cerrado (3.47)
usamos:
M (q) q + C (q; q)
_ q_ + g~ (q)
(3.48)
Donde la respuesta escaln (regulacin) del robot es similar al sistema lineal en lazo cer2
Tm1 +0;1 m
:
0;8Tm1 m
5Tm1 m
;
Km Tm3
Ti = 2Tm1
m;
dos Ziegler-Nichols [73] y Cohen-Coon [12]. Estas reglas estn disponibles para procesos
de control, y nuestras reglas son bien aplicadas a sistemas mecnicos. Dado que el control PID en este apartado del presente trabajo de tesis es lineal, entonces el par nal es
u = P ID1 + P ID0
65
Figura 3.4: Respuesta aproximada al escaln unitario en el robot de dos grados de libertad
66
2
2
M11 (q) = m1 lc1
+ m2 l12 + m2 lc2
+ 2m2 l1 lc2 cos(q2 ) + I1 + I2
2
M12 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M21 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M22 (q) = m2 lc2
+ I2
C11 (q; q)
_ =
C12 (q; q)
_ =
C21 (q; q)
_ = m2 l1 lc2 sen(q2 )q_1
C22 (q; q)
_ = 0
g1 (q) = [m1 lc1 + m2 l1 ]gsen(q1 ) + m2 glc2 sen(q1 + q2 )
g2 (q) = m2 glc2 sen(q1 + q2 )
con m1 = m2 = 1kg; l1 = l2 = 30cm ) lc1 = lc2 = 15cm; este comportamiento se puede
3.6 Conclusiones
67
muestran que es posible alcanzar la referencia escaln unitario bajo la premisa de utilizar un
controlador que garantice la estabilidad asinttica semiglobal.
3.6.
Conclusiones
En este apartado de la presente tesis podemos observar que al aplicar una ley de control
clsica P D al robot de dos grados de libertad no se alcanza la referencia al escaln unitario,
por otro lado al adicionar un trmino de gravedad al controlador P D, es decir; aplicar una ley
de control u = P D + G(q) provoca en la dinmica del controlador incertidumbres difciles
de estabilizar debido a la inercia que se gana en el movimiento del robot, para corregir
este problema se utiliza un controlador lineal clsico P ID sobre un robot manipulador,
la contribucin terica en este apartado es que las condiciones de estabilidad semiglobal
asinttica son ms sencillas de obtener respecto a otros trabajos y estas condiciones nos
permiten obtener un mtodo explcito para la eleccin de ganancias P ID. Entonces las
aportaciones tcnicas de esta seccin del presente trabajo de tesis es que el mtodo sistemtico
de ajuste para controladores P ID propuesto esta basado en un anlisis de estabilidad, el
68
Figura 3.7: Comparacin entre distintos mtodos de ajuste para controladores PID
Captulo 4
Controlador neuronal PID
4.1.
Introduccin
70
et al [4]; En el trabajo de Sun et al [60] el trmino integral entra en saturacin mediante una
funcin no lineal; Respecto a la saturacin de entrada podemos consultar el trabajo de [2];
En otros trabajos como el de Ortega se agrega un trmino para el ltrado de la posicin [49];
Por su parte en los trabajos de [51] y [16] se combinaron tcnicas de control neuronal con las
tcnicas de control PID clsico. Solo pocos investigadores han trabajado con controladores
PID lineales. La estabilidad de controladores lineales PID fue probada en el trabajo [54],
donde la dinmica del robot fue reescrita en un acoplador lineal y un sistema no lineal, por
su parte Kelly [35] demostr la estabilidad asinttica del controlador PID bajo condiciones
de ganacias del controlador no explcitas.
Un modelo basado en compensador con PID es un mtodo de control alternativo [59],
tal y como el propuesto por compensacin adaptable por gravedad [64], La compensacin
basada en Lyapunov [17], compensacin deseada por gravedad [35], y PD mas medicin
de posicin [50]. Todos necesitan informacin de la estructura y trminos gravitatorios del
robot. Algunos controladores PD no lineales pueden alcanzar la estabilidad asinttica, por
ejemplo el control PD con ganancias variantes en el tiempo [53], control PD con ganancias
no lineales [47] y control PD con compensacin por modos deslizantes [51]. Debido a que
estos controladores son complejos presentan algunas desventajas respecto a los controladores
PID lineales.
Una compensacin inteligente para un control PD no necesita un modelo matemtico,
este es conocido como compensador libre de modelo, dentro de este grupo se encuentran: los
compensadores difusos [43], los controles difusos [23], compensadores neuronales [41] y compensadores neuro-difusos [10][19]. La idea bsica de estos controladores es el uso de un ltro
de error de seguimiento basado en el anlisis de Lyapunov [40]. Para un algoritmo de ajuste
de pesos apropiados son muy similares los mtodos de control adaptable [29], la derivada
de la funcin de Lyapunov es negativa siempre y cuando el error de seguimiento ltrado
esta fuera de una bola de radio
B
;
Kv
desconocidas, Kv es la derivada de la ganancia en el control PD. Estos controladores neuronales PD son acotados uniformemente y los errores de seguimiento se hacen mas pequeos
conforme aumenta la ganancia Kv : El costo de elegir Kv sucientemente grande es que el
71
Es bien conocido en la literatura que un mtodo simple para decrecer el error de trayectoria es agregando una ganancia intergral, es decir; convertir el controlador neuronal PD
a un controlador neuronal PID. Entonces nos surge una pregunta: por qu no agregar un
integrador en vez de aumentar la ganancia derivada en el control PD neuronal?.
Existen dos enfoques diferentes para combinar el controlador PID con el control inteligente tal y como lo hace el control neuronal. El primer enfoque es que las redes neuronales
son formadas dentro de una estructura PID [14][56][65]. Para una adecuada actualizacin
de leyes, los parmetros de los controladores PID se cambian de manera que el sistema en
lazo cerrado sea estable. La dicultad para implementarlos industrialmente radica que las
ganancias (pesos) de la accin PID son variantes en el tiempo.
El segundo mtodo para las tcnicas de control inteligente es; el ajuste de parmetros de
los controladores PID, tales como: sintonizacin difusa [46], sintonizacin neuronal [26][68]
y sintonizacin experta [33].
Los controladores industriales son PID lineales, sin embargo la estabilidad del sistema en
lazo cerrado no est garantizada. El control PID neural de este trabajo supera las desventajas
anteriores. Se trata de un controlador PID industrial lineal mas un compensador neural. El
principal obstculo de este controlador PID neuronal es difcil anlisis terico de estabilidad.
Incluso para PID lineal, no es fcil de demostrar estabilidad asinttica [35].
4.2.
(4.1)
72
C (q; q)
_ = fckj g representa la fuerza centrpeta, G (q) es un vector de pares gravitacionales,
F (q)
_ representa la friccin. Todos los trminos M (q) ; C q; q ; G (q) y F (q)
_ son desconocidos. u 2 Rn es la entrada de control y el trmino de la friccin F (q)
_ es representado por
el modelo de friccin de Coulomb siguiente:
(4.2)
F (q)
_ = Kf 1 q_ + Kf 2 tanh (kf 3 q)
_
Donde kf 3 es una constante positiva sucientemente grande tal que tanh (kf 3 q)
_ puede aproximarse a sign (q)
_ ; Kf 1 y Kf 2 son coecientes positivos para este trabajo se utiliza un modelo
simple para representar la friccin similar a los utilizados en [40] y [35],
(4.3)
F (q)
_ = Kf 1 q_
f q; q = W
(4.4)
(q; q) + (q)
c es el peso estimado,
Donde W es una constante de pesos desconocida, W
q; q
es la
0.
con una capa oculta con sus respectivos pesos y algunas neuronas ocultas.
h i
h i
c (V^ q q ); f (q) = W (V q q ) +
f^ q; q = W
q; q
c 2 Rn
Donde W
; V^ 2 Rm
(4.5)
oculta. A n de simplicar el anlisis terico, primero utilizaremos una red lineal en los
73
parmetros (4.4), posteriormente mostraremos que la red neuronal multicapa (4.5) puede
aplicarse bien al control de robots manipuladores. La dinmica de robots (4.1) tiene algunas
propiedades estandar [59] las cuales pueden usarse para demostrar estabilidad.
P1. La matriz de inercia M (q) es simtrica y denida positiva:
0<
Donde
fM g y
fM (q)g
kM k
fM (q)g
>0
(4.6)
kC (q; q)
_ qk
_
y M_ (q)
(4.7)
kc > 0
2C (q; q)
_ es antisimtrica, es decir;.
h
i
xT M_ (q) 2C (q; q)
_ x=0
(4.8)
M_ (q) = C (q; q)
_ + C (q; q)
_T
(4.9)
por lo tanto:
q; q es Lipschitz sobre q y q
k kx
(y)k
(4.10)
yk
(q; q) +
(4.11)
q; q
@U
@q
Kf 1 q 0
1p
W
2
74
Donde
Rt
1p
2
(q) =
k = Kf 1 m n fqt g
1p
W
2
Kf 1 q0
(4.13)
Dado una constante de posicin deseada q d 2 Rn ; el objetivo del control del robot (4.1)
(4.14)
Por otro lado sabemos que el control industrial PID tiene la siguiente estructura:
Z t
u = Kp q~ + Ki
q~ ( ) d + Kd q~
(4.15)
0
Donde Kp ; Ki y Kd son las ganancias proporcional, integral y derivativa del controlador PID.
Cuando desconocemos la dinmica f q; q
(4.16)
(4.17)
El control (4.17) evita el problema del integrador en (4.15). A diferencia del controlador PID
industrial, estos no pueden alcanzar la estabilidad asinttica. La condicin de estabilidad
para un controlador PID neuronal (4.16) es que krk >
B
;
Kv
de disminuir krk, Kd tiene que crecer. Esto provoca un problema de ajuste de tiempo. La
estabilidad asinttica (r ! 0) necesita que Kv ! 1:
75
En este trabajo se agrega un integrador dentro del control PID neuronal (4.16), este es
muy similar a los controladores industriales PID (4.15),
Z t
u = Kp q~ + Kd q~ + Ki
q~ ( ) d + f^
(4.18)
q;
_ la ley de control PID puede expresarse
c (q; q)
Kd q_ + + W
(0) =
(4.19)
Aqu necesitamos de la parte del control PID (4.19) este desacoplada, es decir; Kp ; Ki y Kd
son denidas positivas. El sistema en lazo cerrado del robot (4.1) es:
M (q) q + C (q; q)
_ q_ + f~ q; q
(4.20)
= Kp q~ Kd q_ +
_ = Ki q~
Donde f~ = f
f^
f~ = W
~ =W
Con W
(q) + (q)
c (q) = W
~ (q) + (q)
W
(4.21)
matricial siguiente:
6
7 6
d 6
6 q~ 7 = 6
6
dt 4 5 6
4 qd + M
q~
El punto de equilibrio de (4.22) es
d
q = 0; el punto de equilibrio es
qd :
Ki q~
q_
0
~ (q) +
C q_ + W
1@
Kp q~ + Kd q_
q; q
7
7
1 7
7
7
A 5
(4.22)
q d ; 0 como
76
qd
(4.23)
q; q
(4.24)
~ = Ki q~
El siguiente teorema nos permite inducir un anlisis de estabilidad para el control neuronal PID. Este teorema nos da las condiciones para elegir las ganancias del controlador PID
as como las condiciones para entrenar el compensador neuronal para la obtencin de los
pesos (4.19). Adems de quenos da las condiciones para que el control neuronal PID (4.19)
lleve el error q~ a cero.
Teorema 4.1 Dada la dinmica del Robot (4.1) controlada por el control neuronal PID
(4.19), el sistema en lazo cerrado (4.24) es semiglobalmente asintticamente estable en el
T
punto de equilibrio x =
Donde
m (M ) m (Kp )
; q~; q~
(Kp )
(Ki )
(Kd )
(4.25)
M (M )
(M )
es ajustado por
^ =
W
Donde
(M )
Ki
(4.26)
3
1
(Kp )
(4.27)
77
(M )
n max jmij j
i;j
: Una constante
(4.28)
puede selec-
cionarse tal que sea micho mas grande que todos los elementos.
Comentario 4.2 La diferencia principal entre el control neuronal PID respecto a otros con-
(Ki )
(Kp )
(4.29)
Comentario 4.3 Si la funcin desconocida f (q) es estimada por una red neuronal multicapa
(4.5). Entonces el error (4.21) se transforma en:
h i
h i
c (V^ q q )
f~ = f f^ = W (V q q ) +
q; q
W
h i
h i
h i
~
^
^
= W (V q q ) W (V q q ) + W (V q q ) +
q; q
h i
h i
~ (V^ q q ) + W 0 V~ q q + 1 +
=W
q; q
h
h i
h ii
h i
~
c 0 V~ q q + 1 q; q
=W
(V^ q q ) + 0 V~ q q + W
(4.31)
78
Donde
(q) =
q; q ;
h io
V qq
0~
(4.32)
~ = Ki q~
Si la funcin de Lyapunov (3.37) se considera como:
1
Vm = V + tr Ve T Kv 1 Ve
2
(4.33)
h i
~ (q q q )
V m = V_ q_T W
h ii
h
h i
0~
T ~
^
+q_ W (V q q ) + V q q + tr Ve T Kv 1 Ve
(4.34)
Kw
h i
(V^ q q ) +
c 0 q (q_ + q~)
Kv W
h io
V q q (q_ + q~)T
0~
(4.35)
79
ndice de diseo en un amplio espectro de procesos [6]. Para este trabajo se utilizar el
algoritmo de integracin condicional. El trmino integral esta limitado a seleccionar el valor:
Z t
u = Kp q~ + Kd q~ + sat Ki
q~ ( ) d ; max + f^
(4.36)
0
si kxk <
max
max
precarga [57]. Ahora el controlador lineal PID se vuelve un controlador PID no lineal. La
estabilidad semiglobal asinttica ha sido anlizada por [2]. Cuando
de todos los actuadores de las articulaciones,
ks
max
max
max
es el mximo par
= ks maxi umax
; umax
= max (jui j) ;
i
i
kG (q)k
Donde G (q) es el par gravitacional del robot (4.1), G es la cota superior de G (q) : ks es un
factor de diseo en el caso en el que no todos los trminos del controlador PID estn sujetos
a saturacin (4.36), ks puede seleccionarse como ks = 41 :
Siguiendo el proceso de (4.4) a (4.13), El controlador neuronal PID contra la prdida de
integral (4.36) requiere que se cumpla la siguiente condicin:
max
(q; q) +
W
Donde
3
q; q
(q; q) +
(4.37)
q; q
q; q son denidas en
(4.4).
Podemos ver que la primer condicin adicional para el control neuronal para la prdida
de integral es que el estimador neuronal debe estar acotado. Mientras que el controlador
neuronal PID solamente necesita que el estimador neuronal satisfaga la condicin de Lipschitz
(4.10).
80
max )
tan pequea
como sea posible. Una buena estructura para el estimador neuronal puede hacer que el
trmino W
(q; q) sea tan pequeo. Existen varios mtodos que pueden utilizarse para
encontrar una buena red neuronal, tales como algoritmos genticos [5] y [62]. Adems de
la estructura de optimizacin y condiciones iniciales para el algoritmo de entrenamiento
tipo gradiente (4.26) tambin se afecta la cota superior del estimador neuronal : Donde
^ y V^ en (4.35) no afectan la propiedad de estabilidad,
las condiciones iniciales para W
^ (0) y V^ (0). Si dejamos que
Disearemos un mtodo para encontrar el mejor valor para W
^ (0) = W0 ; V (0) = V0 ; el algoritmo (4.35) puede hacer la identicacin del error, es decir;
W
^ (t) y V^ (t) harn la identicacin del error tan pequeo que de los valores de W0 y V0 :
W
^ (0) y V^ (0) son seleccionados de acuerdo a los siguientes pasos:
Donde W
^ (0) = W0 ; V^ (0) = V0 :
1. Iniciar con alguna condicin inicial para W
2. Realizar el entrenamiento con (4.35) hasta T0
^ (T0 ) y V^ (T0 )
3. Si en el error de regulacin se tiene que k~
q (T0 )k < k~
q (0)k ; Dejamos a W
^ (0) y V^ (0), es decir; W
^ (0) = W
^ (T0 ) ; V^ (0) = V^ (T0 ) ; vamos al paso
como nuevos W
dos y repetimos el proceso de entrenamiento.
^ (T0 ) y V^ (T0 )
k~
q (0)k, paramos el proceso de identicacin, ahora W
^ (0) y V^ (0).
son los valores nales para W
4. Ahora si k~
q (T0 )k
4.3.
81
Donde
(s) =
bi s
qi (s) ;
s + ai
i=1
(4.38)
(s) es una estimacin de q_i ; ai y bi son los elementos sobre la diagonal principal de
las matrices A y B, es decir; A = diag fai g, B = diag fbi g ; ai > 0; bi > 0: La funcin de
(4.39)
c (q)
Kd + + W
(0) =
A (x + Bq)
(4.40)
= x + Bq
Donde Kp ; Ki y Kd son matrices diagonales denidas positivas, ai y bi en (4.38) son constantes positivas.
Por otro lado el sistema en lazo cerrado del robot (4.1) es:
3
2
2 3
Ki q~
7
6
7
7 6
A
+
B
q
_
d 6
6 7=6
"
# 7
6
~ (q)
dt 4 5 4
C (q; q)
_ q_ W
(q) 7
5
1
M
q_
+Kp q~ Kd + ~ + q d
h
i
Donde el punto de equilibrio de (4.41) es ~; ; q_ = [0; 0; 0] :
(4.41)
PID con el observador de velocidad (4.38). Este teorema tambin permite el algoritmo de
entrenamiento para los pesos sinpticos de la red neuronal y el mtodo de seleccin explcita
de las ganancias en el control PID.
82
en:
c (q; v)
f^ q; q = W
(4.42)
c (V^ [q; v]
f^ q; q = W
Teorema 4.2 Dada la dinmica del robot (4.1) controlada por el controlador neuronal PID
(4.40), si A y B del observador de velocidad (4.38) satisfacen:
M (A)
2
m (A)
Donde
(Kd )
(B)
1
4
(B
I)
m (B)
M (B)
m (M )
2
M (M )
(Kd )
1
2
(4.43)
(A)
es una constante de diseo positiva, y si las ganancias del control PID (4.40)
satisfacen:
m
1
2
(Kp )
"
(Kp )
M (Ki ) +
k +
+ 1+2
2
(Kd )
(Ki )
1
M (Kd ) + 2 M (A Ki )
1K + 1
i) 2
M (A
M (Kp )+ (M ) M (M )
2 m (AB 1 I) 1
kg + 21
1
M (A BKi )
(4.44)
M (A)
(Kp )
Kw (q; )
q~ +
+B
( _ + Av)
(4.45)
q d ; q~; q~
x=
(4.46)
=0
En el dominio de atraccin:
k~
qk
(M )
kc
(B
I)
1
2
(A) +
k k
(4.47)
83
Comentario 4.4 Las condiciones (4.43) y (4.44) nos dicen como elegir las ganancias del
controlador PID. La primera condicin de (4.44):
m
(Kp )
"
(Ki ) +
1
M (A BKi ) +
+2
M
m
(Kd ) +
(Kp )
1
2
3
1+2
2
kg
1
2
(4.48)
(Kp )
(A 1 Ki )
y Kp tan grande como sea posible. Tal que Ki no sea grande. Estas condiciones son razonables
para nuestro control real. Si seleccionamos B = A + I; de la tercer condicin de (4.43),
1
:
2
1>
y una
A ( A + I)
m
1
(AB
I) >
1
;
2
entonces existe
4.4.
Resultados Experimentales
m a sa (K g )
C e ntro o f M a sa (m )
L o n g itu d (m )
O se t d e la a rtic u la c i n (m )
0.15
0.3
0.3
0.15
0.3
Los dos teoremas mencionados en este capitulo del presente trabajo son sucientes para
elegir los mnimos valores de las ganancias proporcional y derivativa, as como la mxima
84
ganancia integral. Vamos a utilizar los valores de la tabla 1 y (4.28) para estimar los valores
mximos y mnimos para los valores propios de la matriz de inercia M (q) ; y kg en (4.10).
Seleccionemos
3
(M ) < 3;
(Kp ) se satisface
M (Ki )
m (Kp )
tal que
7
;
12
(Ki )
tal que B =
diag(17;58): Las velocidades de las articulaciones son estimadas por los ltros:
e
q_ (s) =
bs
18s
q (s) =
q (s)
s+a
s + 30
(4.49)
(4.50)
1 a 1: La funcin de activacin de
85
(qi
mi )2 =100 ;
i = 1; 2
(4.51)
Donde mi es seleccionada aleatoriamente de 0 a 2: Los pesos son actualizados por (4.45) con
Kw = 10:
Para corroborar los datos experimentales, primero se realizaron las simulaciones correspondientes a la respuesta escaln unitario del Robot manipulador utilizando las leyes de
control clsicas PD y PID observando los resultados de la Figura 4.2.
Figura 4.2: Respuesta al escaln unitario de las leyes de control clsicas PD y PID del robot
de dos grados de libertad
Posteriormente se implementaron estas leyes de control clsico a su versin por compesacin por gravedad y controlador neuronal PD y PID respectivamente cuyos resultados se
muestran en la Figura 4.3.
Finalmente estos resultados del controlador neuronal PID se muestran en la Figura 4.4,
indicado como ontrol Neuronal PID". Vamos a comparar nuestro controlador neuronal con
otros controladores utilizados sobre Robots. Primero utilizamos un controlador lineal PID
(4.15), las ganancias del controlador PID son las mismas que en (4.50), este resultado se
86
Figura 4.3: Seguimiento de trayectoria del Robot del Controlador Neuronal PD y Controlador
Neuronal PID al escaln unitario
presenta en la Figura 4.4. Dado que el error en estado estable es demasiado grande, entonces
la ganancia integral es seleccionada como:
Ki = diag [50; 20]
(4.52)
El resultado del control se muestra en la Figura 4.4 indicada como Controlador lineal PD,
cabe mencionar que si hay un incremento de Ki entonces el sistema en lazo cerrado es
inestable. Entonces utilizamos el compensador neuronal para reemplazar al integrador. A n
de disminuir el error en estado estable las ganancias derivativas pueden decrecer como:
Kd = diag [970; 900]
(4.53)
El resultado de este controlador se muestra en la Figura 4.4 indicada como "PD Neuronal".
donde observamos que la respuesta se hace lenta.
Claramente el controlador neuronal PID puede compensar incetidumbres, tales como:
friccin, pares gravitacionales y algunas otras incertidumbres del robot. Como el controlador
lineal PID no tiene compensacin tiene que incrementar su ganancia integral para cancelar
las incertidumbres.
4.5 Conclusiones
87
4.5.
Conclusiones
88
mtodo explcito para seleccionar las ganancias PID. Al aplicar nuestro controlador neuronal al robot de dos grados de libertad se valida la ley de control neuronal PID propuesta
tericamente.
Captulo 5
Nuevo mtodo de Sintonizacin de
controladores PID
5.1.
Introduccin
Como se ha mencionado en los captulos anteriores los controladores PID (proporcionalintegral-derivativo) se utilizan ampliamente en robots manipuladores industriales. Ya sabemos que en ausencia del conocimiento del robot el control PID puede ser el mejor controlador,
ya que es libre de modelo, y sus parmetros se pueden ajustar fcilmente y por separado [3][6].
Las ventajas del controlador PID sobre los otros es que estos son simples y tienen signicados
fsicos muy claros. Sin embargo, las ganancias del controlador PID deben ser sintonizados
para garantizar un buen desempeo, as como, aumento de tiempo, sobreimpulso, tiempo de
establecimiento, y el error de estado estacionario.
Desde los orgenes del controlador lineal PID, el principal estudio sobre la sintonizacin
PID se enfocado en sistemas lineales [48]. Donde bsicamente el proceso de ajuste de ganancias de PID puede clasicarse en cinco categoras:
1. Modelo basado en sintonizacin analtica. De acuerdo con las relaciones analticas entre
el modelo y el objetivo de control, las ganancias de PID se calculan a partir de algunas
ecuaciones algebraicas [8][11][28].
90
5.1 Introduccin
91
Los mtodos anteriores necesitan un completo conocimiento del modelo del robot, es muy
comn que se pierdan los signicados fsicos de las ganancias PID en estos mtodos, ya que
estos controladores PID no utilizan las propiedades de los robots.
En el problema de sintonizacin en control PID para robots existen algunas dicultades
de diseo tales como:
El par en cada articulacin afecta a las otras y estos efectos presentan grandes no
linealidades.
El exceso de ganancias simultneas para el problema de sintonizacin en robots mediante los mtodos clsicos [73] o [12]. Por ejemplo, un robot de seis grados de libertad
tiene 18 ganancias a sincronizar. Cuando se sintoniza una ganancia, se requiere el ajuste
de las otras 17 debido al acoplamiento dinmico..
Algunos mtodos no lineales, tales como anlisis de estabilidad, nos permiten obtener
cotas superiores e inferiores para las ganancias del controlador PID. Sin embargo estos
mtodos no garantizan condiciones de desempeo deseado.
En este capitulo del presente trabajo de tesis se utilizan las siguientes tres condiciones
para el control de robots con el n de obtener un mtodo de ajuste de forma sistemtica:
1. En el caso de regulacin, un robot puede ser estabilizado mediante cualquier controlador
PD siempre y cuando las ganancias del controlador PD sean positivas.
2. El comportamiento en lazo cerrado del control PID es similar al comportamiento de
un sistema lineal.
3. El control del par en cada junta es independiente de la dinmica del robot.
El mtodo de ajuste propuesto para este trabajo se muestra en la Figura 5.1. Posteriormente se explicar como funciona cada bloque, tambin se aplicar este mtodo en un brazo
robot de dos grados de libertad. Los resultados experimentales muestran que este mtodo de
sintonizacin PID es simple, sistemtico y ecaz en el control de Robots.
92
5.2.
M (q) q + C q; q q + g (q) + f q =
Donde q 2 <n representa las posiciones en los eslabones, q 2 <n es la velocidad en los
es la matriz de fuerza
Dado que la dinmica del robot no es estable en lazo abierto, es imposible enviar un
comando que ajuste las ganancias del controlador PID para las articulaciones. En este trabajo
se utiliza el siguiente mtodo de sintonizacin en lazo cerrado.
De modo que el error de regulacin del la ley de control PD (3.2) esta acotada en una
bola de radio d. Sin embargo la propiedad de estabilidad no es suciente para el control de
robots. Ya que el error en estado estable causado por los trminos de friccin y gravedad
93
puede ser demasiado grande. Por otro lado la derivada de la ganancia Kd tiene que crecer
para poder disminuir, de este modo el sistema en lazo cerrado se vuelve demasiado lento.
Este asentamiento de tiempo no nos permite incrementar Kd como queramos.
En este trabajo usamos la propiedad de estabilidad del control PD (3.2) para estabilizar
el robot inestable en lazo abierto (5.1). Para alguna Kd ; cuando Kd
(5.2)
En la dinmica de manipuladores con frecuencia suele utilizarse un vector de pares gravitacionales g (q) : Para lo cul la compensacin es un mtodo muy popular para modicar el
control PD (3.2). De este modo un nuevo control PD puede ser:
(5.3)
= P D1 + g^ (q)
Donde g (q) = g^ (q) + g~ (q) ; g^ (q) y g~ (q) son el estimado de gravedad y el error aproximado
respectivamente. En este caso (3.5) la funcin de Lyapunov se convierte en:
q_T (Kd
V PD
K1 ) q_ + d1
d1
Normalmente d1 << d; dado que g~ es el estimado del error de gravedad. Entonces el sistema
estable en lazo cerrado (5.2) se transforma en:
M (q) q + C q; q q + g (q) + f q = P D1 + g^
(5.4)
Dado que el control PD (5.3) no puede garantizar que el error en estado estable se
haga cero. Podemos agregar un trmino integrador, el cul es una herramienta efectiva para
eliminar el error en estado estable. De esta forma el control PD (5.3) se transforma en la ley
de control PID siguiente:
= Kp q~ + Ki
q~ ( ) d + Kd
d~
q
= P ID2
dt
(5.5)
94
P D1 = P ID2
(5.6)
Cuando aplicamos una compensacin por gravedad al sistema en lazo cerrado (5.4), este se
convierte en:
M (q) q + C q; q q + g (q) + f q
(5.7)
P D1 = g^ (q)
Luego si aplicamos un control PID y la compensacin por gravedad al sistema en lazo cerrado
(5.4) tenemos:
M (q) q + C q; q q + g (q) + f q
P D1 = P ID2 + g^ (q)
(5.8)
= P ID2 + P D1 + g^ (q)
De las ecuaciones (5.6) a (5.9), podemos ver que el control de par del robot manipulador
es linealmente independiente de la dinmica del robot (5.1). Para el caso general, si ajustamos
controladores PID m veces, estos se pueden expresar como:
M (q) q + C (q; q)
_ q_ + g (q) + f q =
m
X
P IDj + g^ (q)
j=1
Donde:
m
X
j=1
P IDj =
m
X
j=1
Kp;j q~ +
m
X
j=1
Ki;j
q~ ( ) d +
m
X
j=1
Kd;j
d~
q
dt
(5.10)
95
Vemos que PD1 es un PID especial con Ki = 0: Esta propiedad nos permite iniciar un control
PID con pequeas ganancias, tal que el sistema en lazo cerrado es estable. As podemos usar
alguna otra regla de ajuste para obtener nuevas ganacias PID independientemente. De esta
forma las ganancias nales del controlador PID son la suma de todos los controladores
(ganancias).
5.3.
(5.11)
Obviamente esta es una sobresimplicacin del modelo y el trmino dependiente de la velocidad C (q; q)
_ q_ que representa las fuerzas centrpetas y de Coriolis puede despreciarse para
pequeas velocidades. As podemos usar el esquema de linealizacin siguiente [21]:
A
q + Bq = u
Donde A = M (q) jq=q0 ; B =
@g(q)
@q
(5.12)
(5.13)
96
Donde:
A = M (q) jq=q0 ;
@ [g (q) + C (q; q)]
_
jq=q0 ;
B =
@q
@C (q; q)
_
D =
jq=q0
@ q_
En este trabajo podemos utilizar un mtodo de identicacin basado en una linealizacin,
para cada articulacin, un modelo lineal tpico es un sistema de primer orden con retardo
como el presentado a continuacin:
Gp =
Km
e
1 + Tm s
tm s
(5.14)
tm s
(5.15)
tm s
La respuesta a este modelo de segundo orden es similar con movimientos mecnicos. Si existe
un sobre impulso, podemos agregar un cero negativo, de modo que tenemos lo siguiente
(5.15):
qi (s)
Km (1 + Tm3 s)
=
e
(1 + Tm1 s) (1 + Tm2 s)
i (s)
tm s
Las seales de entrada para el ajuste del controlador PID son escalones repetidos.
(5.16)
97
5.4.
Ajuste PD/PID
Dado que el robot puede aproximarse por un sistema lineal, algunas reglas de sintonizacin se pueden aplicar algunas reglas de ajuste al sistema en lazo cerrado. Primero
daremos algunas reglas para el ajuste del control PD, cuando cada articulacin puede aproximarse por un sistema de primer orden.
Gp =
Km
e
1 + Tm s
tm s
(s) = Kc 1 +
1
+ Td s E (s) = Gc (s) E (s) = P ID2
Ti s
Dentro de los mtodos de ajuste PID mas populares se encuentran los mtodos de ZieglerNichols [73] y [12] Cohen-Coon, ver Tabla 1.
98
Ti
Sintonizacin de Ziegler-Nichols
a KTmm m
0;5
Mtodo Cohen-Coon
Tm
Km m
Nuestro Mtodo
Tm2
Km
4
3
Td
m
4Tm m
11Tm +2 m
4Tm
Tm1
Kc
Ti
Td
5Tm1 m
Km Tm3
Tm2
Km
Tm2
Km
Tm1 +0;1 m
0;8Tm1 m
Tm1
Tm1
Ti
Sintonizacin Ziegler-Nichols
a KTmm m ;
Mtodo de Cohen-Coon
Tm
m
Km m 4Tm
Tm2
Km
Nuestro Mtodo
Td
0;5
m
m (32Tm +6 m )
13Tm +8
Tm2
4Tm m
11Tm +2 m
Tm1
Kc
Ki
es la
99
Kd
Kc
eleccin de las ganancias del control PID del modelo de segundo orden se puede utilizar la
Tabla 4 siguiente.
Kc
Ti
Td
5Tm1 m
Km Tm3
Tm2
Km
20 m Tm
Km
2Tm1
Tm1 +0;1 m
0;8Tm1 m
Tm2
Tm1
15
2
Tm
10
m Tm
De la referencia (5.25) podemos observar que las ganancias del control PID son linealmente independientes y las podemos modicar directamente. De este modo podemos incluir
un nuevo controlador PID denotado por PID3 ; Para ajustar las ganancias PID podemos
utilizar la Tabla 5.
Tabla 5. Ajuste PID (P ID3 )
Kp "
Ki "
Kd "
Pico
Decrece
Crece
Pequea
Decrece
Pequea
Decrece
Pequea
Crece
Crece
Crece
Decrece
Crece
Decrece
Grande
Decrece
Menor
Decrece
Empeora
Empeora
Mejora
(5.17)
100
5.5.
El controlador PID lineal comn no considera algn componente de la dinmica del robot
dentro de esta ley. Con el n de asegurar la estabilidad asinttica del control PID, el enfoque
ms simple es modicar el control PID lineal en uno no lineal. En [54] la dinmica del robot
es reescrita como un sistema lineal desacoplado y acotado, este controlador lineal PID no
puede garantizar la estabilidad asinttica. En [37] se presentan las condiciones sucientes
de estabilidad para el controlador PID lineal utilizando un anlisis basado en Lyapunov, sin
embargo estas condiciones no son explcitas, de modo que el control PID no puede utilizar
estas condiciones directamente, necesitando un procedimiento de ajuste un complicado como
el usado en [38].
La ley de control PID dada por (5.5) puede expresarse mediante las siguientes ecuaciones:
= Kp e + Kd e_ + = P ID4
_ = Ki e;
(0) =
(5.18)
En la discusin anterior solo hemos considerado PID4 sin considerar PD1 ; PID2 y PID3 : El
sistema en lazo cerrado del robot (5.2) puede considerarse como:
M (q) q + C (q; q)
_ q_ + g (q) = Kp q~
De donde podemos ver que el punto de equilibrio es
Kd q_ + ;
_ = Ki q~
Kd q_ + ~ + g q d
(5.19)
101
En [68] se ha probado que la dinmica del robot controlada por el controlador PID lineal
(5.18) del sistema en lazo cerrado (5.19) es semiglobalmente asintticamente estable sobre
T
el equilibrio x =
Donde
g q
m (M ) m (Kp )
; q~; q~
(Kp )
(Ki )
(Kd )
3
kg ;
2
(5.20)
(Kp )
;
M (M )
+ M (M )
m
; kg satisfacen kg (q1 )
g (q2 )k
(5.21)
(5.22)
kg kq1
q2 k :
Las tres matrices de ganancias del control PID lineal (5.18) pueden elegirse directamente de las condiciones (5.20). De (5.10) sabemos que el control PID con compensacin
por gravedad (5.17) es:
=
3
X
j=1
5.6.
Resultados Experimentales
Masa (kg)
Centro (m)
Longitud (m)
1.5
0.15
0.3
1.5
0.15
0.3
102
Primero utilizaremos las siguientes ganancias del controlador PD1 con el n de estabilizar
el robot manipulador
Kp1 = diag [150; 150]
(5.23)
bs
18s
q (s) =
q (s)
s+a
s + 30
cerrado del robot mediante el controlador PD1 . Donde la respuesta del sistema en lazo
cerrado de las respuesta al escaln unitario de los dos eslabones se muestra en la Figura 5.3
de la eleccin de G1 =
0;93
;
60s2 +9s+1
G2 =
1
.
20s2 +3s+1
Con el n de ajustar las ganancias PID del sistema lineal, podemos reescribir el controlador PID (5.5) como:
P IDt = Kc
1
q~ +
Ti
Kd
Kc
q~ ( ) d + Td q~
0
Kc
Ki
20 m Tm
;
Km
Ti = 15
m Tm ;
Td =
Tm2
10
(5.24)
Para ajustar los parmetros del controlador PID. Esta regla es similar a la utilizada en [28] y
[11], en este caso Kc =
5Tm1 m
;
Km Tm3
Ti = 2Tm1
m;
Td =
Tm1 +0;1 m
:
0;8Tm1 m
103
Figura 5.3: Respuesta aproximada al escaln unitario en el robot de dos grados de libertad
Tm
Km m
4
3
4Tm
; Ti =
m (32Tm +6 m )
;
13Tm +8 m
Td =
4Tm m
:
11Tm +2 m
m;
Td = 0;5
para sistemas mecnicos. Luego de la regla (5.24), podemos elegir las ganancias para el
controlador PID2 siguientes:
Kp2 = diag [90; 30]
Ki2 = diag [1; 2]
(5.25)
(5.26)
104
Figura 5.4: Controlador u = P D1 + g^ (q) + P ID2 sobre el robot manipulador de dos grados
de libertad
(5.27)
La condicin de estabilidad (5.20) nos proporciona las condiciones sucientes para elegir el
valor mnimo de la ganancia proporcional y de la ganancia derivativa as como nos da las
condiciones sucientes para elegir la mxima ganancia integral. Con lo cul tenemos que la
ley de control nal (5.27) satisface las condiciones (5.20) la cul se ilustra en la Figura 5.5.
Luego para el control nal del robot agregamos un nuevo controlador PID, de modo el
control de fuerza denido por la Figura 5.1 presenta la estructura
P ID4 + g^(q) cuyo comportamiento es ilustrado en la Figura 5.6.
= P D1 +P ID2 +P ID3 +
5.7 Conclusiones
105
Figura 5.5: Controlador P IDf = P D1 + g^ (q) + P ID2 + P ID3 sobre el robot manipulador
de dos grados de libertad
5.7.
Conclusiones
106
Captulo 6
Conclusiones Finales
Primero al utilizar un mtodo basado en la estabilidad de Lyapunov del capitulo 3 al
controlador PID lineal clsico sobre el robot manipulador nos permite determinar las condiciones de estabilidad semiglobal y asinuttica, cabe mencionar que estas condiciones son ms
sencillas de obtener respecto a otros trabajos adems de que estas condiciones nos permiten
obtener un mtodo explcito para la eleccin de ganancias PID. Es importante mencionar
que al aplicar este mtodo a la planta en lazo cerrado se garantizara siempre su estabilidad.
Por otro lado el controlador neuronal PID propuesto en el capitulo cuatro resuelve el
problema de eleccin de ganancias integral y derivativa grandes en el controlador lineal
PID y el controlador neuronal PD. Se pueden alcanzar las propiedades de los controladores
industriales PID as como los compensadores neuronales probando estabilidad asinttica
semiglobal. Cuando las velocidades de las articulaciones de los robots manipuladores no
estn disponibles, se asegura la estabilidad asinttica con el ltro de posicin. Las condiciones
de estabilidad nos dan un mtodo explcito para seleccionar las ganancias PID. Al aplicar
nuestro controlador neuronal al robot de dos grados de libertad se valida la ley de control
neuronal PID propuesta tericamente.
En el capitulo cinco se propone un nuevo mtodo de ajuste sistemtico para controladores
PID el cul pudo aplicarse al robot manipulador de dos grados de libertad mejorando el
ndice de desempeo original. Como este controlador usa las propiedades de la dinmica de
108
Conclusiones Finales
los robots manipuladores el proceso de ajuste se hace mas amigable en aplicaciones reales.
Lo novedoso de este enfoque es el uso de respuestas escaln unitario para sistemas en lazo
cerrado bajo la ley de control PD as como la separacin del vector de par de las articulaciones
en varios controladores PID independientes.
Bibliografa
[1] ALVAREZ- Ramirez J., I.Cervantes, R.Kelly, "PID regulation of robot manipulators:
stability and performance", Systems & Control Letters, Vol.41, 73-83, 2000.
[2] ALVAREZ-Ramirez J., R.Kelly, I.Cervantes, "Semiglobal stability of saturated linear
PID control for robot manipulators", Automatica, vol.39,989-995, 2003.
[3] ANG K.H., Chong, G. and Li, Y., "PID Control System Analysis, Design, and Technology", IEEE Trans. Control System Technology, vol. 13, no. 4, pp. 559576, 2005.
[4] ARIMOTO S., "Fundamental problems of robot control: Part I, Innovations in the realm
of robot servo-loops", Robotica, vol.13, No.1, 1927, 1995.
[5] ARIFOVICA J., R.Gencay, "Using genetic algorithms to select architecture of a feedforward articial neural network", Physica A, Vol.289, 574-594, 2001.
[6] ASTROM Karl J., T. Hagglund, "PID Controllers: Theory, Design and Tuning", ISA
Press, Research Triangle Park, North Carolina, 1995.
[7] ASTROM K.J. and Hagglund, T., Revisiting the ZieglerNichols step response method
for PID control", Journal of Process Control, 14, pp.635650, 2004.
[8] CHANG P.H. and Jung J.H., "A systematic method for gain selection of robust PID
control for nonlinear plants of second-order controller canonical form", IEEE Trans.
Control System Technology, vol. 17, no. 2, pp. 473483, 2009.
110
BIBLIOGRAFA
[9] CHANG W.D., Hwang, R.C. and Hsieh, J.G., .A self-tuning PID control for a class of
nonlinear systems based on the Lyapunov approach", Journal of Process Control, 12,
pp.233242, 1986.
[10] CHEN C., "Dynamic Structure Neural-Fuzzy Networks for Robust Adaptive Control of
Robot Manipulators", IEEE Trans. Industrial Electronics, VOL. 55, NO. 9, 3402-3414,
2008.
[11] CHIEN I. L., P.S.Fruehauf, "Consider IMC tuning to improve controller performance",
Chemical Engineering Progress, 33-41, 1990.
[12] COHEN G.H., G.A. Coon, "Theoretical consideration of retarded control", Trans.
ASME, 75, 827834, 1953.
[13] COMINOS P. and Munro N., "PID controllers: recent tuning methods and design to
specications", IEE Proceedings -Control Theory and Applications, 149 (1), pp.4653,
2002.
[14] CONG S. and Y. Liang, "PID-Like Neural Network Nonlinear Adaptive Control for
Uncertain Multivariable Motion Control Systems", IEEE Trans. Ind. Electron., vol. 56,
no. 10, pp. 3872-3879, 2009.
[15] DENAVIT J., R. S. Hartenberg, .A Kinematic Notation for Lower-Pair Mechanisms
Based on Matrices", Journal of Applied Mechanics, junio 1995.
[16] DIERKS T., S.Jagannathan, "Neural Network Output Feedback Control of Robot Formations", IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.40, No.4,
383-399, 2010.
[17] DUPREE K., C-H.Liang, G.Hu, W. E.Dixon, "Adaptive Lyapunov-Based Control of
a Robot and MassSpring System Undergoing", IEEE Transactions on Systems, Man,
and Cybernetics, Part B, Vol.38, No.4, 1050-1061, 2008.
BIBLIOGRAFA
111
[18] EMILIA G., A.Marra, E.Natale, "Use of neural networks for quick and accurate autotuning of PID controller", Journal Robotics and Computer-Integrated Manufacturing,
Volume 23 Issue 2, 170-179, 2007.
[19] ER M.J. and Y.Gao, "Robust Adaptive Control of Robot Manipulators Using Generalized Fuzzy Neural Networks", IEEE Trans. Industrial Electronics, VOL. 50, NO. 3,
620-628, 2003.
[20] GOLDENBERG A. A. and Bazerghi, A., "Synthesis of robot control for assembly
processes", Mech. Machine Theory, 21(1), pp.43-62, 1986.
[21] GOLLA D.F., Garg S.C. and Hughes P.C., "Linear state-feedback control of manipulators", Mech.Machine Theory, 16, pp.93-103, 1981.
[22] GUTIERREZ L.B. and F. L. Lewis, "Implementation of a neural net tracking controller for a single exible link: comparisonwith PD and PID controllers", IEEE Trans.
Industrial Electronics, VOL. 45, NO. 2, 307-318, 1998.No.1, 131-147, 2002.
[23] HARINATH E.,G.Mann, "Design and Tuning of Standard Additive Model Based Fuzzy
PID Controllers for Multivariable Process Systems", IEEE Transactions on Systems,
Man, and Cybernetics, Part B, Vol.38, No.8, 667-674, 2008.
[24] HAYKIN S. "Neural Networks, A Comprehensive Foundation",2a Edicin, Prentice
Hall, 1999.
[25] HERR H., "Exoskeletons and orthoses: classication, design challenges and future directions", Journal of Neuro Engineering and Rehabilitation, 6(21) pp.1023-1031, 2009.
[26] HO S-J., L-S.Shu, S-Y.Ho, "Optimizing Fuzzy Neural Networks for Tuning PID Controllers Using an Orthogonal Simulated Annealing Algorithm OSA", IEEE Trans. Fuzzy
Syst., Vol.14, NO. 3, 421-434, 2006.
[27] HOGAN N., "Impedance control: An approach to manipulation, PartsIIII", ASME J.
Dynam. Syst., Meas., Contr., vol. 107, pp. 1-24, 1985.
112
BIBLIOGRAFA
[28] HUANG H.-P., J.-C.Jeng, K.-Y.Luo, .A uto-tune system using single-run relay feedback
test and model-based controller design", Journal of Process Control, 15, 713-727, 2005.
[29] IOANNOU P.A. and J.Sun, "Robust Adaptive Control, Prentice-Hall", Inc, Upper Saddle
River: NJ, 1996.
[30] JAFAROV E. M., M. N. A. Parlak, and Y. Istefanopulos, .A New Variable Structure
PID-Controller Design for Robot Manipulators", IEEE Transactions on Cntrol Systems
Technology, Vol.13, No.1, 122-130, 2005.
[31] JIN Y., "Decentralized Adaptive Fuzzy Control of Robot Manipulators", IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.28, No.1, 47-57, 1998.
[32] JUANG, J.G., Huang, M.T. and Liu, W.K., "PID control using presearched genetic
algorithms for a MIMO system", IEEE Trans. Syst., Man, Cybern. C, Appl. Rev., vol.
38, no.5, pp.716-727, 2008.
[33] KARRAY F. , W. Gueaieb, S. Al-Sharhan, "The Hierarchical Expert Tuning of PID
Controllers Using Tools of Soft Computing", IEEE Transactions on Systems, Man, and
Cybernetics, Part B, Vol.35, No.6, 1283-1294, 2005.
[34] KASAC J., B.Novakovic, D.Majetic, and D.Brezak, "Global Positioning of Robot Manipulators With Mixed Revolute and Prismatic Joints", IEEE Transactions on Automatic Control, Vol.51, No.6, 1035-1040, 2006.
[35] KELLY R., "PD control with desired gravity compensation of robotic manipulators: A
review", International Journal of Robotics Research, Vol. 16, No.5, pp. 660672 , 1997.
[36] KELLY R., "Global Positioning of Robot Manipulators via PD Control Plus a Class of
Nonlinear Integral Actions", IEEE Transactions on Automatic Control, Vol.43, No.7,
934-938, 1998.
[37] KELLY R., V.Santibez, L.Perez, "Control of Robot Manipulators in Joint Space",
Springer-Verlag London, 2005.
BIBLIOGRAFA
113
[38] KELLY R, "A tuning procedure for stable PID control of robot manipulators", Robotica,
13, pp.141-148, 1995.
[39] KRISTIANSSON B. and Lennartsson, B., "Robust and optimal tuning of PI and PID
controllers", IEE Proceedings-Control Theory and Applications, 149 (1), pp.17-25, 2002.
[40] LEWIS, F.L., Liu, K. and Yesildirek, A., "Neural net robot controller with guaranteed
tracking performance", IEEE Trans. Neural Networks, vol. 6, no. 3, pp. 703715, 1995.
[41] LEWIS, F.L., Dawson, D.M. and Abdallah, C.T., "Robot Manipulator Control: Theory
and Practice", Marcel Dekker, Inc, New York, NY 10016, 2004.
[42] LEWIS F.L., "Nonlinear Network Structures for Feedback Control", Asian Journal of
Control, vol. 1, no. 4, pp.205228,1999.
[43] LI H-X., L.Zhang, K-Y.Cai, G.Chen, "An Improved Robust Fuzzy-PID Controller With
Optimal Fuzzy Reasoning", IEEE Transactions on Systems, Man, and Cybernetics, Part
B, Vol.35, No.6, 1283-1294, 2005.
[44] LI C.J., "An e cient method for linearization of dynamic models of robot manipulators", IEEE Transactions on Robotics and Automation, Volume: 5 Issue: 4, pp.397-408,
1989.
[45] LORETO Gomez Gerardo, "Visual Servoing con compensacin utilizando Redes Neuronales"(Tesis de Maestra). Departamento de Control Automtico, CINVESTAV-IPN,
Junio 2002.
[46] MANN G. K. I., B-G. Hu, R.G. Gosine, "Two-Level Tuning of Fuzzy PID Controllers",
IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.31, No.2, 263-269,
2001.
[47] NUNES E.V. L., L.Hsu, F.Lizarralde, .A rbitrarily small damping allows global output
feedback tracking of a class of Euler-Lagrange systems", 2008 American Control Conference,, Seattle, USA, 378-382, 2008
114
BIBLIOGRAFA
[48] ODWYER A., "Handbook of PI and PID Controller Tuning Rules", Imperial College
Press, London , 2006.
[49] ORTEGA R., A.Loria, R.Kelly, "A Semiglobally Stable Output Feedback PI2 D Regulator for Robot Manipulators", IEEE Transactions on Automatic Control, Vol.40, No.0,
1432-1436, 1985.
[50] PADEN B., R.Panja, "Globally asymptotically stable PD+ controller for robot manipulators", International Journal of Control, Vol. 47, No. 6, 16971712 , 1988.
[51] PARRA-Vega, S.Arimoto, Y.-H.Liu,G.Hirzinger, P.Akella, "Dynamic Sliding PID Control for Tracking of Robot Manipulators: Theory and Experiments", IEEE Transactions
on Robotics and Automation, Vol.19, No.6, 967-976, 2003.
[52] POZNYAK A., E.N. Sanchez, W.Yu,."Dierential Neural Networks for Robust Nonlinear Control, Identication, State Estimation and Trajectory Tracking", World Scientic
Publishing, 2001.
[53] QU Z., D.M. Dawson, S. Y. Lim, J.F. Dorsey, "A New Class of Robust Control Laws for
Tracking of Robots", International Journal of Robotics Research, Vol. 13, No.4, 355363
, 1994.
[54] Rocco, P., "Stability of PID control for industrial robot arms", IEEE Transactions on
Robotics and Automation, Vol.12, No.4 , pp.606-614, 1996.
[55] SALDAA S. S., "Diseo, construccin y control de un prototipo de cadena cinematica
abierta experimental de dos grados de libertad"(Tesis de Maestra), Departamento de
Control Automtico, CINVESTAV-IPN, Junio 1999.
[56] SCOTT G.M., J. W.Shavlik, W. H. Ray, "Rening PID Controllers Using Neural Networks", Neural Computation, Vol. 4, No. 5, 746-757, 1992.
[57] SHINSKEY F.G., "Process Control Systems - Application, Design and Tuning",
McGraw-Hill Inc., New York , 1996.
BIBLIOGRAFA
115
[58] SLOTINE J. J., W.Li, .A daptive manipulator control: A case study", IEEE Transactions
on Automatic Control, Vol.33, No.11, 9951003, 1988.
[59] SPONG M. Vidyasagar and S. Hutchinson. "Robot Modeling and Control". John Wiley
and Sons, 2006.
[60] SUN D., S.Hu, X.Shao, and C.Liu, "Global Stability of a Saturated Nonlinear PID
Controller for Robot Manipulators", IEEE Transactions on Cntrol Systems Technology,
Vol.17, No.4, 892-899, 2009.
[61] SUN Y.L. and Er, M.J., "Hybrid fuzzy control of robotics systems", IEEE Trans. Fuzzy
Systems, vol. 12, no. 6, pp.755-765, 2004.
[62] SUZUKI K., I.Horina and N.Sugie, .A Simple Neural Network Pruning Algorithm with
Application to Filter Synthesis", Neural Processing Letters, Vol.13, 43-53, 2001.
[63] SWARP, A. and Gopal, M., "Comparative study on linearized robot models", Journal
of Intelligent and Robotic Systems, Volume 7, Number 3, pp.287-297, 1993
[64] TOMEI P., "Adaptive PD Controller for Robot Manipulators", IEEE Transactions on
Robotics and Automation, VoL. 7, No. 4 , 565-570,1991.
[65] UANG H. J. and C. C. Lien, "Mixed H2/H1 PID tracking control design for uncertain
spacecraft systems using a cerebellar model articulation controller", IEE Proceedings Control Theory and Applications,, vol. 153, no. 1, pp. 113, 2006.
[66] VISIOLI A. , "Modied anti-windup scheme for PID controllers", IEE Proc.-Control
Theory Appl., Vol.161, No 1., 49-54, 2003.
[67] WANG Q.G., Zhang, Y. and Guo, X., "Robust closed-loop identication with application to auto-tuning", Journal of Process Control, 11, pp. 519-530, 2001
[68] YU D-Li, T. K. Chang, D-W.Yu, "Fault Tolerant Control of Multivariable Processes
Using Auto-Tuning PID Controller", IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.35, No.1, 32-43, 2005.
116
BIBLIOGRAFA
[69] YU W. and Rosen J., .A Novel Linear PID Controller for an Upper Limb Exoskeleton",
49th IEEE Conference on Decision and Control, CDC10, Atlanta, USA, pp.3548-3553.
[70] YU W. and Li X, .A Systematic Tunning Method of PID Controller for Robot Manipulators", 9th IEEE International Conference on Control & Automation, ICCA11, Santiago
Chile, pp.274-279.
[71] Alexander S.Poznyak, Wen Yu, Edgar N. Sanchez, Jose P. Perez, Nonlinear Adaptive
Trajectory Tracking Using Dynamic Neural Networks, IEEE Transactions on Neural
Networks, Vol.10, No.6, 1402-1411,1999.
[72] Xiaoou Li and Wen Yu, Anti-swing control for an overhead crane with fuzzy compensation, Intelligent Automation and Soft Computing, Vol.18, No.1,1-11, 2012
[73] ZIEGLER J. G. and Nichols N. B., .O ptimum settings for automatic controllers", Trans.
ASME, vol 64, pp.759-768.