Vous êtes sur la page 1sur 124

CENTRO DE INVESTIGACION Y DE ESTUDIOS

AVANZADOS DEL INSTITUTO POLITECNICO


NACIONAL
UNIDAD ZACATENCO
Departamento de Control Automtico

Anlisis de estabilidad en controladores PID y


neuronales PID sobre robots

Tesis que presenta:


M. en C. Roberto Carmona Rodrguez 1

Para obtener el grado de:


Doctor en Ciencias
En la Especialidad de
Control Automtico

Director de Tesis:
Dr. Wen Yu Liu

Mxico, D.F.,
1

Becario del CONA CyT

Diciembre del 2013

Resumen
El objetivo del presente trabajo de tesis, es realizar un anlisis de estabilidad de
distintos controladores utilizados en robots manipuladores..
Dentro de las principales contribuciones del presente trabajos e encuentran: realizar
una prueba de estabilidad asinttica semiglobal de un controlador PID con fines de uso
industriales, diseo de un controlador Neuronal-PID para uso en la industria as como su
prueba de estabilidad asinttica semiglobal y finalmente realizar el diseo de un mtodo
iterativo de sintonizacin para un controlador PID para control de robots utilizados en la
industria.
Una forma de minimizar el error en estado estable respecto a incetidumbres en el
control de robots, es incrementando la

ganancia integral en un controlador PID. Otro

mtodo puede ser agregar a un controlador PD un compensador neuronal, el inconveniente


es que la accin derivativa del controlador PD puede incrementarse. En este trabajo de tesis
se propone un controlador neuronal PID y se prueba su estabilidad asinttica semiglobal.
Posteriormente los resultados tericos se verifican experimentalmente en un robot de dos
grados de libertad ubicado en el laboratorio de servicios experimentales del departamento
de control automtico.
En la ultima seccin de este trabajo de tesis se propone un nuevo mtodo de ajuste
iterativo de controladores PID para robots manipuladores, el cual utiliza distintas
propiedades de la dinmica de robots, este controlador es sistemtico, simple para uso
industrial, adems de que presenta mejoras respecto a un controlador clsico PID, estos
datos se corroboran experimentalmente en un robot de dos grados de libertad.

Abstract
The objective of this thesis is to perform a stability analysis on different controllers
used in robot manipulators.
Within the contributions of this thesis are: proof semiglobal asymptotic stability of a
PID controller with industrial use, the design of a Neural-PID controller with semi-global
asymptotic stability condition, which is industrially applicable in robot control and finally
the desing a new iterative tuning method of PID control for robot manipulators.
In order to minimize steady-state error with respect

to uncertainties in robot

control, the integral gain of PID control should be increased. Another method is to add a
compensator to PD control, such as neural compensator, but the derivative gain of this PD
control should be large enough. These two approaches deteriorate transient performances.
In

this thesis,

the popular neural PD is extended to neural PID control. The semiglobal

asymptotic stability of the neural PID control is proven. The

conditions give explicit

selection methods for the gains of the linear PID control. A experimental study on a robot
manipulator with two degrees of freedom, in the laboratory of experimental services
department Automatic Control, what the technical aspects of this section are corroborated.
On the other hand to address a new iterative tuning method of PID control for robot
manipulators. Presented in the last section a tuning method uses several properties of the
robot control, such as any PD control can stabilize a robot in regulation case, the closedloop system of PID control can be approximated by a linear system, the control torque to
the robot manipulator is linearly independent of the robot dynamic.

Compared with the

other PID tuning methods, this novel method is simple, systematic, and stable. The
transient properties of this PID control are better than the other normal PID controllers.
This method is a new systematic tuning method for PID control is proposed. To validate
the theoretical aspects, these are applied to the robot of two degrees of freedom above.

Agradecimientos
A mi asesor:
Dr. Wen Yu Liu.
Quien no solamente me ayudo tcnicamente, si no que adems me brindo el apoyo de
amigo y hermano en estos momentos tan importantes de mi vida, agradezco su sabidura a
pesar de que a veces me sealaba la luna y yo solamente miraba el dedo, le agradezco su
paciencia, su disposicin de ser gua y por ser un ejemplo a seguir.
A los Investigadores:
Dr. Moiss Bonilla Estrada
Dr. Alejandro Justo Malo Tamayo
Dr. Julio Cesar Tovar Rodrguez.
Dr. Floriberto Ortz Rodrguez.
Por haber aceptado ser miembros del jurado y por sus valiosos comentarios y sugerencias
referentes al presente trabajo de tesis.
A mi familia
A pesar de que jams podrn leer estas lneas quiero agradecer a mi bebe y a mi madre que
su partida me hizo ms fuerte y su estancia en esta vida me lleno de amor y dicha le
agradezco profundamente a mi madre por sus brazos clidos y esa enseanza de lucha
infinita.
A Sonia y Constanza quienes me llenan de amor y le ponen ese brillo a mi maana todos
los das.
A todos mis hermanos, sobrinos, cuados y suegros por todo su cario
A mis amigos.
Chino, Armando, Canul, Samy, Jesica, Gil, Lyapu, Rouss, Charly, Roger, Coqueto, Nio,
Mago, Julio, Beto, Omar, Ru, Caguaman, Carlitos, Hussain, Sureshs 1 y 2.
Por sus consejos, apoyo, confianza y amistad durante todos estos aos.
A CONACyT.
Por haberme otorgado la beca para poder realizar mis estudios de doctorado.
Al CINVESTAV.
Por el apoyo econmico a congresos y de extensin, por su excelente trato y relacin tan
clida con sus estudiantes.

ndice general
1. Introduccin

1.1. Motivacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3. Estructura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.4. Publicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2. Preliminares

2.1. Antecedentes de Robtica en el espacio articular. . . . . . . . . . . . . . . .

2.1.1. Dinmica Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.1.2. Dinmica de un Robot Manipulador Rgido . . . . . . . . . . . . . .

13

2.2. Modelado de un robot de dos grados de libertad . . . . . . . . . . . . . . . .

15

2.2.1. Cinemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

2.2.2. Clculo de cinemtica Directa . . . . . . . . . . . . . . . . . . . . . .

22

2.2.3. Cinemtica para un robot de dos grados de libertad . . . . . . . . . .

23

2.2.4. Ecuacin de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . .

27

2.2.5. Cinemtica Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . .

29

2.2.6. Modelado con compensacin por Gravedad . . . . . . . . . . . . . . .

30

2.3. Redes Neuronales Articiales . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

3. PID estable en el espacio articular


3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43
43

ii

NDICE GENERAL
3.2. Control Estable PD con compensacin por gravedad . . . . . . . . . . . . . .

45

3.3. Estabilidad Asinttica semiglobal de un control PID . . . . . . . . . . . . . .

48

3.4. Control lineal PID con velocidades no medibles . . . . . . . . . . . . . . . .

56

3.5. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

3.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

4. Controlador neuronal PID

69

4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69

4.2. Estabilidad asinttica semiglobal para un controlador neuronal PID . . . . .

71

4.3. Control Neuronal PID con velocidades no medibles . . . . . . . . . . . . . .

80

4.4. Resultados Experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . .

83

4.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

5. Nuevo mtodo de Sintonizacin de controladores PID

89

5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

89

5.2. Sintonizacin PID en lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . .

92

5.3. Linealizacin del sistema en Lazo Cerrado . . . . . . . . . . . . . . . . . . .

95

5.4. Ajuste PD/PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

5.5. Condiciones de Estabilidad para las ganancias PID. . . . . . . . . . . . . . . 100


5.6. Resultados Experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6. Conclusiones Finales

107

ndice de guras
2.1. Cinemtica inversa y cinemtica directa . . . . . . . . . . . . . . . . . . . .

10

2.2. Dinmica de un Robot Manipulador . . . . . . . . . . . . . . . . . . . . . . .

14

2.3. Dinmica de un Robot manipulador en lazo cerrado con el ngulo de giro


deseado q d sobre las articulaciones . . . . . . . . . . . . . . . . . . . . . . . .

15

2.4. Robot de dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . .

16

2.5. Descripcin de parmetros de D-H para un robot de dos grados de libertad .

19

2.6. Diagrama esquematico de Robot de dos grados de libertad para obtencin de


parmetros geometricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

2.7. Forma bsica de una neurona biolgica . . . . . . . . . . . . . . . . . . . . .

33

2.8. Estructura de una neurona articial bsica . . . . . . . . . . . . . . . . . . .

34

2.9. Perceptrn simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

2.10. Red Neuronal Articial FeedForward . . . . . . . . . . . . . . . . . . . . . .

36

2.11. Red neuronal multicapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

2.12. Estructura de una Red Neuronal de funciones de base radial. . . . . . . . . .

40

3.1. Control PID mas compensacin aproximada de gravedad . . . . . . . . . . .

55

3.2. Plataforma Experimental para un Robot de dos Grados de Libertad. Laboarotorio experimental Dpto. Control Automtico-CINVESTAV . . . . . . . . . .

63

3.3. Esquema general de Robot de Dos grados de Libertad . . . . . . . . . . . . .

64

3.4. Respuesta aproximada al escaln unitario en el robot de dos grados de libertad 65


3.5. Respuesta al escaln unitario utilizando un controlador PD . . . . . . . . . .

66

iv

NDICE DE FIGURAS
3.6. Respuesta del Controlador PD mas trmino de gravedad (PD+G) . . . . . .

67

3.7. Comparacin entre distintos mtodos de ajuste para controladores PID . . .

68

4.1. Controlador neuronal PID . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

4.2. Respuesta al escaln unitario de las leyes de control clsicas PD y PID del
robot de dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . .

85

4.3. Seguimiento de trayectoria del Robot del Controlador Neuronal PD y Controlador Neuronal PID al escaln unitario

. . . . . . . . . . . . . . . . . . .

86

4.4. Comparacin de diferentes controladores aplicados al robot de dos grados de


libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

5.1. Esquema de Ajuste PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

5.2. Respuesta al escaln de un sistema lineal . . . . . . . . . . . . . . . . . . . .

97

5.3. Respuesta aproximada al escaln unitario en el robot de dos grados de libertad103


5.4. Controlador u = P D1 +^
g (q)+P ID2 sobre el robot manipulador de dos grados
de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
5.5. Controlador P IDf = P D1 + g^ (q) + P ID2 + P ID3 sobre el robot manipulador
de dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.6. Controlador

= P D1 + g^ (q) + P ID2 + P ID3 + P ID4 sobre el robot manip-

ulador de dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . 106

Captulo 1
Introduccin
Un Robot manipulador bsicamente es un brazo mecnico operado mediante una accin
de control, de modo que para efectos de la teora de control automtico sirve como objeto de
estudio para probar algunas leyes o algoritmos de control sobre su dinmica la cul puede
estar denida sobre dos espacios: espacio articular (Q) y espacio de tarea, en el primero
se hace una descripcin de la conguracin o movimiento de un robot en trminos de las
posiciones de todas sus articulaciones y esta formado por los valores qi 2 R, de modo que se
puede describir un conjunto del tipo Q = q1

q2

:::

qn

Rn donde n es la dimensin

del espacio y corresponde al nmero de articulaciones del Robot. El espacio de tarea del
robot esta denido como el conjunto de todas las coordenadas espaciales que puede alcanzar
el efector nal a partir de la posicin de los ngulos de giro en las articulaciones mediante
el mapeo cinemtico directo h : Q ! W . Donde W

Rm y m

6 satisfacen W =

fh (q) : q 2 Qg de tal forma que la dimensin del espacio de tarea puede ser mximo 6 y es

el nmero de variables xi 2 R necesarias para denir la tarea del Robot. As el espacio queda

denido por X = [x1 ; : : : ; xm ]T ; xi 2 R , el cul en ocasiones de escribe como X = [p; ]T


donde: p 2 Rl describe la posicin del efector nal del robot y
orientacin.

2 Rm

describe la

En el control de robots sobre el espacio articular el esquema ms simple para este n


es el esquema de control Proporcional Derivativo (P D) el cul solo con la eleccin de algu-

Introduccin

na ganancia positiva el controlador puede garantizar la estabilidad [59] en el problema de


regulacin. Si embargo no se puede garantizar la estabilidad asinttica cuando la dinmica
del manipulador incluye: vector de par gravitacional, vector de friccin y de forma general
otras incertidumbres, hasta que se aplica una compensacin con modelo de referencia. Requiriendose as el conocimiento de la dinmica del robot. Por ejemplo en los trabajos de
compensacin adaptable de gravedad de [64][58], compensacin por gravedad deseada [35],
y control P D ms medicin de posicin a [50], podemos ver que estos necesitan informacin
estructural del vector de gravedad en el controlador P D. Por otro lado algunos controladores
P D no lineales tambin pueden alcanzar la estabilidad asinttica tales como: control P D
con ganancias variantes en el tiempo [53], ganancias no lineales [47], y compensacin por
modos deslizantes [51].Una compensacin inteligente para un control P D que no necesita un
modelo matemtico es conocido como compensador libre de modelo, dentro de este grupo
se encuentran: compensadores difusos [43], controles difusos [23], compensadores neuronales
[41] y compensadores neuro-difusos [10][19]. La idea bsica de estos controladores es el uso de
un ltro de error de seguimiento basado en el anlisis de Lyapunov [40]. Para un algoritmo de
ajuste de pesos apropiados son muy similares los mtodos de control adaptable [29], la derivada de la funcin de Lyapunov es negativa siempre y cuando el error de seguimiento ltrado
este fuera de una bola de radio

B
;
Kv

aqu B es el lmite superior de todas las incertidum-

bres desconocidas, Kv es la derivada de la ganancia en el control P D. Estos controladores


neuronales P D estn acotados uniformemente y los errores de seguimiento se hacen ms
pequeos conforme aumenta la ganancia Kv : El costo de elegir Kv sucientemente grande es
que el transitorio se vuelve lento. Solo cuando Kv ! 1; el error de seguimiento converge a
cero [22].

Existen varios mtodos para minimizar el error en estado estable respecto a incertidumbres en el control de robots, uno es utilizando controladores con la ley de control Proporcional
Integral Derivativo (P ID) en el cul se incrementa la ganancia integral al hacer el error casi
cero. Otro mtodo es utilizando controladores P D en combinacin con un compensador neuronal (P D +N N ) con la condicin para una ganancia derivativa sucientemente grande, este
mtodo puede extenderse a controladores P ID ms una compensacin neuronal (P ID+N N )

1.1 Motivacin

el cul garantiza estabilidad asinttica semiglobal.


Existen dos enfoques diferentes para combinar el controlador P ID con el control inteligente. El primer enfoque es que las redes neuronales son formadas dentro de una estructura P ID [14][56][65]. Para una adecuada actualizacin de las leyes, los parmetros de los
controladores P ID se elijen de manera que el sistema en lazo cerrado sea estable. Pero la
dicultad para implementarlos industrialmente radica en que las ganancias (pesos) de la
accin P ID son variantes en el tiempo.
El segundo mtodo utilizando tcnicas de control inteligente es el ajuste de parmetros de
los controladores P ID, tales como sintonizacin difusa [46], sintonizacin neuronal [26][68]
y sintonizacin experta [33]. De modo que para decrecer el error de trayectoria se puede
agregar una ganancia intergral al controlador P D + N N , es decir; convertir el controlador
neuronal P D a un controlador neuronal P ID y aqu debemos de hacernos una una pregunta:
por qu no agregar un integrador en vez de aumentar la ganancia derivada en el control
P D neuronal?.

1.1.

Motivacin

Los controladores P ID (proporcional-integral-derivativo) se utilizan ampliamente en robots manipuladores industriales. En ausencia del conocimiento de la dinmica del robot el
control PID puede ser una buena eleccin para el seguimiento de trayectoria, ya que el controlador es libre de modelo, y sus parmetros se pueden ajustar fcilmente y por separado
[3][6]. Las ventajas del controlador P ID sobre los otros es que estos son simples y tienen
signicados fsicos muy claros. Sin embargo, las ganancias del controlador P ID deben ser sintonizados para garantizar un buen desempeo, as como, aumento de tiempo, sobreimpulso,
tiempo de establecimiento y el error de estado estacionario.
Bsicamente el proceso de ajuste de ganancias de P ID puede clasicarse en cinco categoras:
1. Modelo basado en sintonizacin analtica. De acuerdo con las relaciones analticas entre

Introduccin
el modelo y el objetivo de control, las ganancias del controlador P ID se calculan a
partir de algunas ecuaciones algebraicas [8][11][28].
2. Mtodos heursticos. Estos mtodos combinan varias tcnicas, tales como la experiencia
prctica [73][12], sintonizacin manual [6] e inteligencia articial [60][40][32].
3. Mtodos en dominio de la frecuencia. En estos mtodos las Frecuencias Caractersticas
son fciles de obtener para sistemas lineales. Cuando el proceso es controlado por un
sistema lineal, el controlador PID puede ser sintonizado en dominio de la frecuencia
[57].
4. Mtodos de optimizacin. El Controlador P ID se transforma en una forma especial de
control ptimo. En este mtodo el problema de sintonizacin del controlador P ID se
convierte en un problema de optimizacin numrica fuera de lnea [39].
5. Mtodos Adaptable Estn basados en tcnicas de control adaptable e identicacin
paramtrica en lnea, las ganancias del controlador P ID estn sintonizados como un
proceso de ajuste automtico [67].
El problema de los mtodos de sintonizacin anteriores es que no se pueden aplicar

directamente en controladores P ID en control de robots ya que la dinmica del robot es no


lineal.
Por otro lado el problema de Sintonizacin de controladores P ID en el control de robots
se pueden agrupar en:
1. Mtodos inteligentes. Las tcnicas inteligentes, tales como lgica difusa [60],redes neuronales [40] y algoritmos genticos [32] se utilizan para ajustar las ganancias del controlador P ID de este modo los controladores nales ya no son P ID lineales.
2. Control por Impedancia. La dinmica inversa se aplica para convertir el robot en un
sistema lineal, La idea de la impedancia mecnica se aplic a sintonizar ganancias del
controlador P ID en [27]. Las ganancias del P ID pueden ajustarse en tiempo discreto
por aproximacin de la dinmica inversa [8].

1.1 Motivacin

3. Enfoque de Lyapunov. El enfoque de Lyapunov se utiliz para ajustar el controlador


P ID de manera que el controlador de robot puede seguir un control de linealizacin
[9].
Los mtodos anteriores necesitan un completo conocimiento del modelo del robot, donde
es muy comn que se pierdan los signicados fsicos de las ganancias P ID en estos mtodos,
ya que estos controladores P ID no utilizan las propiedades de los robots.
En el problema de sintonizacin en control P ID para robots existen algunas dicultades
de diseo tales como:
El par que se genera en cada articulacin afecta a las otras y estos efectos presentan
grandes no linealidades.
El exceso de ganancias simultneas para el problema de sintonizacin en robots mediante los mtodos clsicos [73] o [12]. Por ejemplo, un robot de 6 grados de libertad tiene
18 ganancias a sincronizar. Cuando se sintoniza una ganancia, se requiere el ajuste de
las otras 17 debido al acoplamiento dinmico.
Algunos mtodos no lineales, tales como anlisis de estabilidad, nos permiten obtener
cotas superiores e inferiores para las ganancias del controlador PID. Sin embargo estos
mtodos no garantizan condiciones de desempeo deseado.
En este trabajo se utilizan las siguientes tres propiedades siguientes para el control de
robots con el n de obtener un mtodo de ajuste de forma sistemtica:
1. En el caso de regulacin, un robot puede ser estabilizado mediante cualquier controlador
PD siempre y cuando las ganancias del controlador PD sean positivas.
2. El comportamiento en lazo cerrado del control PID es similar al comportamiento de
un sistema lineal.
3. El control del par en cada articulacin es independiente de la dinmica del robot.
Los resultados experimentales muestran que este mtodo de sintonizacin PID es simple,
sistemtico y ecaz en el control de Robots.

Introduccin

1.2.

Objetivos

1. Realizar un anlisis de controladores PID sobre el espacio articulado.


a) Mostrar la estabilidad asinttica semiglobal de un controlador PID.
b) Proponer un controlador lineal PID con velocidades no medibles.
c) Realizar pruebas en laboratorio de la ley de control sobre un Robot de dos grados
de Libertad.
2. Realizar un anlisis de controladores neuronales PID (PID+NN).
a) Probar la estabilidad asinttica semiglobal de un controlador neuronal PID.
b) Proponer un controlador lineal neuronal PID con velocidades no medibles.
c) Realizar pruebas en laboratorio de la ley de control sobre un Robot de dos grados
de libertad.
3. Proponer un mtodo de ajuste sistemtico de control PID con los siguientes pasos:
a) Estabilizar un robot manipulador con un control PD.
b) Agregar una respuesta unitaria al sistema en lazo cerrado del inciso (3.a).
c) Determinar un modelo lineal invariante en el tiempo el cul tenga una respuesta
similar a (3.b).
d) Ajustar las ganancias PD/PID similar al sistema lineal (3.c).
e) Proponer condiciones de estabilidad para las ganancias PID.
f ) Aplicar este mtodo a un Robot de dos grados de libertad, mostrando que el
mtodo de ajuste es efectivo sobre el robot.
4. Comparar el desempeo del controladores propuestos anteriormente.

1.3 Estructura

1.3.

Estructura

La estructura siguiente del presente trabajo tesis consta de seis captulos, en el primer
capitulo se da una introduccin del trabajo haciendo un esbozo sobre de la motivacin
de ste y los distintos objetivos a cubrir . El capitulo 2 pone en contexto el trabajo de
tesis, primero se hace una descripcin breve sobre la cinemtica y dinmica de los robots
manipuladores en el espacio articulado, posteriormente se da una descripcin bsica sobre
la conguracin y uso de la redes neuronales. En el capitulo 3 se realiza una prueba de
estabilidad asinttica semiglobal para un controlador PID y posteriormente los resultados
tericos se aplican a un robot manipulador de dos grados el cul se encuentra en el laboratorio
de servicios experimentales del departamento de control automtico. En el capitulo 4 se
estudia la estructura del controlador neuronal PID realizando un estudio sobre la historia y
avances en este tema una vez entendida la estructura se lleva a cabo su respectivo anlisis de
estabilidad concluyendo con estabilidad asinttica semiglobal, posteriormente se propone un
control neuronal con velocidades no medibles y en la parte nal de este capitulo se realiza
una implementacin en laboratorio sobre los resultados tericos derivados de este estudio.
La parte nal de anlisis de este trabajo de tesis es el capitulo 5, en el se propone un nuevo
mtodo de sintonizacin de controladores PID para el control de Robots en lazo cerrado,
primero se realiza un estudio para determinar las condiciones bajo las cuales el control PD
es estable, posteriormente se realiza un anlisis para sintonizar el controlador PID en lazo
cerrado obteniendo un mtodo de ajuste para ganancias PID y determinando las condiciones
de estabilidad para las ganancias del controlador PID, luego estos resultados tericos se
prueban sobre un robot de dos grados de libertad ubicado en el laboratorio de servicios
experimentales del departamento de control automtico.

1.4.

Publicaciones

Revista
1. Roberto Carmona and Wen Yu, Robust Adaptive Control via Neural Linearization

Introduccin
and Compensation, Journal of Control Science and Engineering, Vol.2012, Article ID
867178, doi:10.1155/2012/867178, 2012.
2. Wen Yu, Roberto Carmona, A novel PID tuning method for robot control, Industrial
Robot, Vol.40, No.6, 578-582, 2013 (Impact Factor: 0.69)
Congreso
1. Roberto Carmona, Yu, Wen, PID control for robot manipulators with neural compensation, 2012 World Automation Congress (WAC12), Puerto Vallarta, Mexico, ID.20977,
2012
2. Wen Yu and Roberto Carmona Rodriguez, Task-space PID Control of Robot Manipulators with Explicit Conditions, 2013 American Control Conference (ACC13), Washington DC, USA, 4970-4976, 2013.

Captulo 2
Preliminares
2.1.

Antecedentes de Robtica en el espacio articular.

En el anlisis de control de robots Manipuladores lo primero que tenemos que tener en


cuenta es: ver si el problema a resolver esta dado en el anlisis de cinemtica directa o
cinemtica inversa.
La Cinemtica Directa bsicamente es un mapeo del espacio articulado al espacio de
tareas del tipo siguiente: h : Q ! W o en forma vectorial lo podemos considerar como:

X = h (q) con X 2 Rm que representa el vector de variables en el Espacio Tareas. Por su parte
la Cinemtica inversa determina el valor de las articulaciones a partir de las coordenadas del
espacio de tareas del modo: q = f (X) de manera que se dene como el mapeo f : W ! Q .
En esencia el problema de la cinemtica inversa consiste en que: dada la posicin y

orientacin nal del efector nal del manipulador, se tiene que determinar el valor en las
articulaciones para alcanzar la posicin y orientacin del efector nal, es decir; dado el espacio
de referencia del manipulador en posicin y orientacin se debe determinar la relacin que
este guarda con la articulacin mediante un mapeo inverso, tal y como se muestra en la
Figura 2.1.

10

Preliminares

Figura 2.1: Cinemtica inversa y cinemtica directa

2.1.1.

Dinmica Inversa

Un modelo dinmico de un robot puede ser descrito mediante la siguiente ecuacin [59]:
M (q) q + C (q; q)
_ q_ + B q_ + g (q) = u

(2.1)

la cul se puede escribir mediante


M q + h (q; q)
_ =u

(2.2)

donde:
h (q; q)
_ = C q_ + F + g
F (q)
_ = B q_
Luego un controlador acorde a la dinmica inversa puede ser descrito de la siguiente
forma:
u = M v + h (q; q)
_

(2.3)

Si se substituye la ecuacin (2.3) en (2.2) y se realiza el lgebra correspondiente, la dinmica


puede ser descrita de la siguiente forma:
M q + h (q; q)
_ = u = M v + h (q; q)
_

2.1 Antecedentes de Robtica en el espacio articular.


q = M

fM v + h (q; q)
_

11
h (q; q)g
_
(2.4)

q = v
De donde se obtiene un doble integrador que tiene la forma siguiente:
v=

K0 q

(2.5)

K1 q_ + r

Ahora si aplicamos las ecuaciones (2.5) a (2.4), entonces el sistema en lazo cerrado es:
q + K1 q_ + K0 q = r
Dada una trayectoria deseada q d and q_d para el sistema en lazo cerrado:
r = qd + K1 q_d + K0 q d
Entonces el error de trayectoria puede considerarse por:

q + K1 q_ + K0 q = r = qd + K1 q_d + K0 q d
(
q

qd ) + K1 (q_

q_d ) + K0 (q

qd) = 0
(2.6)

e + K1 e_ + K0 e = 0
Donde las matrices de ganancia son:
K0 = diag a21

a2n ;

K1 = diag [2a1

2an ]

De modo que se obtiene un sistema en lazo cerrado globalmente desacoplado, con cada
respuesta de la articulacin igual a las respuesta de un sistema crticamente amortiguado de
segundo orden cuya frecuencia natural esta dada por ai : La frecuencia natural ai determina
la velocidad de respuesta de la junta o equivalentemente la razn del decaimiento del error
de trayectoria.
Una forma alternativa para describir la dinmica de un manipulador puede ser realizada
por (2.7).
q = M

[u

h (q; q)]
_ = v (t)

(2.7)

12

Preliminares

Suponiendo que tenemos actuadores capaces de producir directamente una aceleracin comandada (ms que por la produccin de una fuerza o par), entonces la dinmica del manipulador verica que:
u = M v + h (q; q)
_
=)
q = M

[u

= M

[(M v + h (q; q))


_

h (q; q)]
_
h (q; q)]
_

= v
Cuando se tienen incertidumbres, una forma de representar la dinmica del manipulador
es:
M (q) q + C (q; q)
_ q_ + B q_ + g (q) = u
la cul puede ser escrita alternativamente por:
M q + h (q; q)
_ =u
donde:
h (q; q)
_ = C^ q_ + F^ + g^ + d (q; q)
_
^ (q; q)
= h
_ + d (q; q)
_
=)
^ (q; q)
h
_ = h (q; q)
_

d (q; q)
_

Si consideramos que la dinmica inversa de control es considerada como:


^ (q; q)
u = Mv + h
_
Entonces de (2.8) tenemos que la ecuacin en lazo cerrado es la siguiente

(2.8)

2.1 Antecedentes de Robtica en el espacio articular.

13

^ (q; q)
M q + h (q; q)
_ = u = Mv + h
_
M q + h (q; q)
_ = M v + (h (q; q)
_

d (q; q))
_

M q = M v + (h (q; q)
_

d (q; q))
_

q = M

q = v

[M v
1

h (q; q)
_

d (q; q)]
_

d (q; q)
_
(2.9)

q = v
Con la consideracin:

2.1.2.

=M

d:

Dinmica de un Robot Manipulador Rgido

La dinmica de un robot manipulador rgido de n-articulaciones puede ser escrita por la


siguiente ecuacin [59]:
(2.10)

M (q) q + C q; q q + G (q) + F q =

Donde q 2 <n denota las posiciones de las articulaciones, q 2 <n denota las velocidades

de las articulaciones, M (x1 ) 2 <n

es la matriz de inercia, , C(q; q) 2 <n

es la matriz

centrpeta y de coriolis, G(q) 2 < es el vector de gravedad, F 2 R es una matriz diagonal


denida positiva de trminos de friccin (friccin de Coulomb), y
control y se puede representar grcamente en la Figura 2.2.

2 <n es una entrada de

La dinmica para un robot manipulador descrita por (2.10) tiene las siguientes propiedades:
Propiedad 1. La matriz de inercia es simtrica y denida positiva, es decir;
m1 kxk2

xT M (x1 )x

m2 kxk2 ; 8x 2 Rn

Donde m1 y m2 son escalares constantes conocidas y k k denota la norma euclidiana.

Propiedad 2. La matriz de fuerzas centrpetas y de Coriolis es una matriz antisimtrica,

es decir; satisface la siguiente relacin:


xT M (q)

2C(q; q) x = 0

14

Preliminares

Figura 2.2: Dinmica de un Robot Manipulador

Donde C(q; x)y = C(q; y)x; C(q; q) =

n
P

k=1

Ck;ij (q) =

@Bij
@qk

@Bjk
@qi

@Bik
@qj

; kc = 12 maxn

n
P

q2R k=1

Rn .

Ck (q)qk ; C(q; q)

kc q ; C(q; q)q = q C0 (q)q;

kCk (q)k, C0 (q) es una matriz acotada, x; y 2

Si denimos:
x1 = q
x2 = q
Y adems consideramos el error de trayectoria como:
x1 = x1

xd1

x2 = x2

xd2

Entonces podemos usar una ley de control PD de acuerdo a la siguiente expresin:


=

Kp (q
=

qd)

Kp x 1

Kd (q

q )

Kd x 2

(2.11)

Donde Kp y Kd son matrices denidas positivas, simtricas y constantes, y corresponden


a los coecientes proporcionales y derivativos respectivamente, q d 2 <n es la posicin de la
d

articulacin deseada, q 2 <n es la velocidad deseada de la articulacin.

Entonces el sistema en lazo cerrado del Robot manipulador puede representarse grca-

mente en la Figura 2.3.

2.2 Modelado de un robot de dos grados de libertad

15

Figura 2.3: Dinmica de un Robot manipulador en lazo cerrado con el ngulo de giro deseado
q d sobre las articulaciones

2.2.
2.2.1.

Modelado de un robot de dos grados de libertad


Cinemtica

Para validar los resultados tericos obtenidos en la plataforma de pruebas del laboratorio,
vamos a realizar un anlisis sobre la cinemtica y dinmica para el Robot de dos grados
de libertad, es importante destacar que este mismo anlisis es necesario para validar los
resultados tericos de los siguientes captulos.
Un robot de dos grados de libertad con articulaciones giratorias es bsicamente un par
de eslabones unidos y actuados por un par de motores tal y como se muestra en la Figura
2.4.
Este mtodo fue propuesto por Denavit y Hartenberg en 1955 [15] y describe una forma
sistemtica las coordenadas fSig correspondientes a cada eslabn i en una cadena cinemtica
y esta compuesto de las cuatro transformaciones bsicas dependientes de las caractersticas
geomtricas de los eslabones siguientes:
1. Rotacin sobre el eje zi

2. Traslacin sobre el eje zi

un ngulo i:
1

una distancia di , es decir; un vector di = (0; 0; di ).

3. Traslacin sobre el eje xi una distancia ai , es decir; un vector ai = (0; 0; ai ):


4. Rotacin sobre el eje xi un ngulo

i.

16

Preliminares

Figura 2.4: Robot de dos grados de libertad

De modo que la matriz de transformacin es la siguiente.


i 1

Ai = Rotz; i T ransz;di T ransx;ai Rotx;

Para la eleccin de los parmetros es necesario desarrollar un algoritmo de acuerdo a los


siguientes paso:
1. Enumerar los eslabones (de 1 hasta n), jando como eslabn 0 la base ja del robot
2. Enumerar cada articulacin (de 1 hasta n)
3. Localizar el eje de cada articulacin, para este caso como las articulaciones son rotatorias entonces el eje sera su propio eje de giro
4. Para i de 0 a n

1 situar el eje zi sobre el eje de la articulacin i + 1.

5. Situar el origen del sistema de la base fS0 g en cualquier punto del eje z0 . Los ejes x0
e y0 se sitan de modo que formen un sistema de giro derecho con el eje z0 .

2.2 Modelado de un robot de dos grados de libertad


6. Para i de n

17

1 situar el sistema fSi g solidario al eslabn i en la interseccin del eje

zi con la lnea normal comn a zi

y zi . Si los ejes se intersectan se ubica fSi g en el

punto de corte, para ejes paralelos fSi g se ubica en la articulacin i + 1.


7. Situar xi en la lnea normal comn a zi

y zi .

8. Situar yi de modo que forme un sistema dextrgiro con xi y zi .


9. Situar el sistema fSi g en el extremo del robot de modo que zn con la direccin de zn
y xn sea normal a zn

y zn .

10. Obtener i como el ngulo necesario para girar alrededor del eje zi

para que xi

xi sean paralelos.
11. Obtener di como la distancia sobre xi para desplazar el nuevo sistema fSi 1 g para que
su origen coincida con fSi g.

12. Elegir ai como la distancia medida sobre el eje xi que hay que desplazar el nuevo
sistema fSi 1 g para que su origen coincida con el sistema fSi g.
13. Elegir

como el ngulo de debemos girar sobre el eje xi , para que le nuevo sistema

fSi 1 g coincida con fSi g.


14. Obtener la matriz de tranformacin
i 1

i 1

Ai denidas por:

Ai = Rotz; i T ransz;di T ransx;ai Rotx; i


2
32
32
c i
s i 0 0
1 0 0 0
6
76
76
6 s i c i 0 0 76 0 1 0 0 76
6
7
6
76
= 6
76 0 0 1 d 76
0
0
1
0
4
54
i 54
0
0
0 1
0 0 0 1
2
3
C i
C i S i S i S i ai C i
6
7
6 S i
7
C
C
S
C
a
S
i
i
i
i
i
i
7
= 6
6 0
7
S
C
d
4
5
i
i
i
0
0
0
1

1 0 0 ai

32

76
6
0 1 0 0 7
76 0 c i
6
0 0 1 0 7
54 0 s i
0 0 0 1
0 0

s
c

i
i

7
0 7
7
0 7
5
1

18

Preliminares
Donde Rotz; i signica que se realiza una rotacin un ngulo

sobre el eje zi .

15. Obtener la matriz de transformacin que relaciona el sistema de la base con el extremo
del Robot mediante la matriz denida por:

T0i = A1 A2

Ai =

"

R0i oi0
0

2 R4

Para el caso de un robot de dos grados de libertad la matriz que dene la posicin y
orientacin de este, esta dada por:

T02 = A1 A2
16. La matriz T dene la orientacin y posicin del extremo a la base en funcin de las n
posiciones de las articulaciones.
De acuerdo al mtodo de D-H para el robot manipulador de dos grados de libertad se
tiene el origen del la base del marco de referencia es o1 y o2 para el eslabn 2. Y su descripcin
geomtrica se puede observar en la Figura 2.5.
En este mtodo los parmetros ( i ; di ; ai ;

i)

de D-H dependen de las caractersticas

geomtricas de los eslabones y articulaciones y tienen los signicados siguientes:


ai es la distancia entre los ejes zi

di es la distancia entre el origen oi

y zi ; y es medida sobre el eje xi :


1

y la interseccin del eje xi con el eje zi 1 ; medido

sobre el eje zi 1 .
i

es el ngulo formado entre los ejes zi

es el ngulo entre los ejes xi

y zi , medido en el plano normal a xi .

y xi , medidos en el plano normal a zi 1 .

2.2 Modelado de un robot de dos grados de libertad

19

Figura 2.5: Descripcin de parmetros de D-H para un robot de dos grados de libertad

Por otro lado el Jacobiano geomtrico de un Robot manipulador esta dado por:
J0n = [Jv ; J! ]T
v0n = Jv q_
! n0 = J! q_
Donde Jv ; J! 2 R3

y representan la parte lineal y angular en el mapeo de velocidades:

Velocidad Angular
Po la propiedad de antisimetra de matrices se tiene S T + S = 0;
! n0 = ! 10 + R01 ! 21 +

R0n 1 ! nn

Donde k es el eje rotacional.


! n0 = q_1 k + R01 q_2 k

+ R0n 1 q_n k

Se puede denir:
zi

= R0i k

dR
d

= SR ( ) y

20

Preliminares

Tal que zi

la base del marco de referencia esta dada por los primeros tres elementos de la

tercer columna de (k) en T0i : Luego si elegimos ! n0 = [z0 ; z1 ; zn 1 ] q;


_ tal que:
J! = [z0 ; z1 ; zn 1 ]
Posteriormente si se aplica la regla de la cadena, para el efector nal o_ n0 tenemos:
2
3
q
_
1
n
X
6 . 7
@on0
@o0n
n
6
.
o_ 0 =
q_i = [Jv1
Jv n ] 4 . 7
;
J
=
v
i
5
@qi
@qi
i=1
q_n

Luego del paso 15 de la convencin de D-H se tiene que:


#
"
"
n
n
(q)
o
R0n R0i oni + R0i 1 oii
R
0
0
n
i 1 i
n
T0 =
= T0 Ti 1 Ti =
0
1
0
1

+ o0i

Donde oi esta dado por los primeros tres elementos de la cuarta columna de T0i :
Si la j

esima articulacin es de revoluta, la i-sima columna Jv es:


Jv = [Jv1

Jvn ] ;

Jvi = zi

(oj

oi 1 )
2

7
6
7 = ab sin n;con:
representa el producto cruz de los vectores a b = 6
a
a
a
1
2
3
5
4
b1 b2 b3
n como vector unitario perpendicular al plano que contiene a los vectores a y b en la direccin

Donde

dada por la regla de la mano derecha.


Por otro lado sabemos que la energa cintica de traslacin esta dada por:
" n
#
1 T X
T
KT = q_
mi Jvi (q) Jvi (q) q_
2
i=1
Y la energa cintica rotacional esta dada por:
KR =

n
1X

i=1

! i0

1
Ii ! i0 = q_T
2

"

n
X
i=1

J!Ti Ii J!i q_

2.2 Modelado de un robot de dos grados de libertad

21

Adems de que la energa Potencial tiene la forma:


V =

n
X

mi ghi0

i=1

Dado que los primeros dos trminos de entrada de la ltima columna de T0i son la componentes x; y del punto ai = lci en el marco de referencia:
hi0 = yi en oi0
T0i = A1 A2

Ai =

"

R0i oi0
0

Luego de la ecuacin de Euler-Lagrange [59] tenemos:


d @L
dt @ q_

@L
=
@q
L = K

K = KT + KR
Luego si se denine:
D = fdij g = KT + KR
Entonces la ecuacin dinmica es:
M (q) q + C (q; q)
_ q_ +

(2.12)

(q) =

Donde:
M (q) = D (q)
(q) = [ 1 ;

n]

C (q; q)
_ = fckj g ;

ckj =

i =
Pn

@V
@qi

i=1 cijk q_i ;

k; j = 1

Y como ya sabemos los trminos cijk indican los smbolos de Christoel del siguiente tipo:
cijk =

1
2

@dkj @dki
+
@qi
@qj

@dij
@qk

22

Preliminares

2.2.2.

Clculo de cinemtica Directa

De acuerdo a la representacin grca de la Figura 2.4 para el primer eslabn o1 se tiene


el siguiente sistema de coordenadas:
x = l1 cos q1
y = l1 sin q1

=)

x_ =

l1 sin q1 q_1

y_ = l1 cos q1 q_1

La cul puede escribirse en forma matricial como:

x_ = J q_ =

"

l1 s1 0
l1 c1

q_

Por lo que para el efecto de la velocidad lineal se tiene:


"
#
l1 s1 0
Jv1 =
l1 c1 0
Luego considerando para el segundo eslabn o2 tenemos:
x = l1 cos q1 + l2 cos (q1 + q2 )
y = l1 sin q1 + l2 sin (q1 + q2 )

=)

x_ =

l1 sin q1 q_1

a2 sin (q1 + q2 ) (q_1 + q_2 )

y_ = l1 cos q1 q_1 + a2 cos (q1 + q2 ) (q_1 + q_2 )

Cuya representacin matricial es la siguiente:


"
#
l1 s1 l2 s12 l2 s12
x_ = J q_ =
q_
l1 c1 + l2 c12 l2 c12
De este modo el Jacobiano para la velocidad lineal se escribe por:
"
#
l1 s1 l2 s12 l2 s12
Jv =
l1 c1 + l2 c12 l2 c12
Por otro lado para la velocidad angular tenemos que:
! 1 = q_1 k; ! 2 = (q_1 + q_2 ) k

2.2 Modelado de un robot de dos grados de libertad


Si se considera:

I11

6
I=6
4 0
0

0
I22
0

23

7
0 7
5
I33

Entonces el triple producto de ! Ti Ii ! Ti se puede simplicar como I33 veces el cuadrado de la


magnitud de la velocidad
angular.
I33 para los dos eslabones esta denido por I1 e I2 : Dado
"
#
1 1
que (q_1 + q_2 )2 = q_T
q_T ; entonces la energa rotacional es:
1 1
#!
#
"
"
1 1
1 0
1 T
q_
+ I2
q_
I1
2
1 1
0 0
De modo que la representacin del Jacobiano geomtrico para el efecto de la velocidad
angular en el robot de dos grados de libertad tiene la siguiente estructura:
"
#
"
#
1 1
1 0
+ I2
J! = I1
1 1
0 0
Como la energa potencial en el manipulador es la suma de los dos eslabones. En donde
para cada eslabn la energa potencial es su masa multiplicada por la aceleracin de la
gravedad y la distancia al centro de masa, entonces tenemos la siguiente relacin:
V1 = m1 glc1 sin q1
V2 = m2 glc1 l1 [sin q1 + l2 sin (q1 + q2 )]
V = V1 + V2

2.2.3.

Cinemtica para un robot de dos grados de libertad

Podemos encontrar los parmetros siguientes


Parmetros D-H
Eslabn ai di
i

l1

q1

l2

q2

24

Preliminares
De donde podemos determinar las matrices de localizacin A1 correspondiente al primer

eslabn y A2 para localizar el segundo eslabn.


2

c q1

6
6 sq1
A1 = 6
6 0
4
0

sq1 0 l1 cq1
c q1
0
0

c q2

sq2 0 l2 cq2

7
6
6
0 l1 sq1 7
7 ; A2 = 6 s q 2
7
6 0
1
0 5
4
0
1
0

c q2
0
0

Luego para la matriz de transformacin tenemos:

T01

Usando c1 c2

cq1

sq1 0 l1 cq1

6
6 sq1
= A1 = 6
6 0
4
0

7
0 l2 sq2 7
7
1
0 7
5
0
1

7
0 l1 sq1 7
7
1
0 7
5
0
1

c q1
0
0

s1 s2 = c12 = cos ( + ) ; c1 s2 + c2 s1 = s12 = sin ( + )


2

c q1 c q2

sq1 sq2

6
6 c q1 sq2 + c q2 sq1
= A 1 A2 = 6
6
0
4
0
2
c12
s12 0 l1 c1 + l2 c12
6
6 s12 c12 0 l1 s1 + l2 s12
=6
6 0
0
1
0
4
0
0
0
1

T02

Para T01 tenemos:

c q1 sq2

cq2 sq1 0 l1 cq1 + l2 cq1 cq2

c q1 c q2

sq1 sq2
0
0

6 7
7
z0 = 6
4 0 5;
1

7
0 l1 sq1 + l2 cq1 sq2 + l2 cq2 sq1 7
7
7
1
0
5
0
1

7
7
7
7
5

l2 sq1 sq2

l1 c1

6
7
7
o1 = 6
l
s
4 1 1 5
0

2.2 Modelado de un robot de dos grados de libertad


Luego para T02 tenemos:

6 7
7
z1 = 6
4 0 5;
1

25

l1 c1 + l2 c12

6
7
7
o2 = 6
l
s
+
l
s
1
1
2
12
4
5
0

La primer columna del Jacobiano para el primer eslabn la podemos elegir como:
2
3
i
j k
6
7
7 = l1 s1 i+l1 c1 j
z0 (o1 o0 ) = det 6
0
0
1
4
5
l1 c1 l1 s1 0

Luego
2 3 el segundo eslabn no afecta al primer eslabn, por lo que la segunda columna es
0
6 7
6 0 7 ; de modo que para el efecto de la velocidad lineal del primer eslabn se tiene lo
4 5
0
siguiente:
3
2
l1 s1 0
7
6
7
Jvc1 = 6
l
c
0
1
1
5
4
0
0
Luego observamos que la primera columna para el
2
i
j
6
z0 (o2 o0 ) = det 6
0
0
4
l1 c1 + l2 c12 l1 s1 + l2 s12

Jacobiano del segundo eslabn es:


3
k
7
1 7
5 = (l1 c1 + l2 c12 ) j (l1 s1 + l2 s12 ) i
0

Y la segunda columna del Jacobiano para el segundo eslabn es:


2
3
i
j
k
6
7
7 = l2 c12 j
z1 (o2 o1 ) = det 6
0
0
1
4
5
l1 c1 + l2 c12 l1 c1 l1 s1 + l2 s12 l1 s1 0
De modo que:

6
Jvc2 = 6
4

(l1 s1 + l2 s12 )
l1 c1 + l2 c12
0

l2 s12

7
l2 c12 7
5
0

l2 s12 i

26

Preliminares

Del anlisis anterior tenemos para el primer el Jacobiano siguiente:


2
3
lc1 s1 0
6
7
7
Jvc1 = 6
l
c
0
c1
1
4
5
0
0
Para el segundo eslabn tenemos:

Jvc2

(l1 s1 + lc2 s12 )

6
=6
4

lc2 s12

7
lc2 c12 7
5
0

l1 c1 + lc2 c12
0

Luego por denicin la energa rotacional:


1X i
!
KR =
2 i=1 0
n

Dado que:

J!T1 I1 J!1

1X T T
q_ J!i Ii J!i q_
=
2 i=1
n

! i0 = J! q;
_
Entonces tenemos:

Ii ! i0

J!i = [z0 ; z1 ; zi 1 ]
3

32

3T 2

0 0 0
I1x 0
0
0 0 0
7
76
7 6
6
7
76
7 6
= 6
4 0 0 0 5 4 0 I1y 0 5 4 0 0 0 5
1 0 0
0
0 I1z
1 0 0
2
3
I1z 0 0
6
7
7
= 6
0
0
0
4
5
0 0 0
2

0 0 0

3T 2

I2x

6
7 6
7 6 0
J!T2 I2 J!2 = 6
0
0
0
5 4
4
1 1 0
0
I2z I2z 0

I2z I2z 0
0

0
I2y
0

32

0 0 0

7
76
6 0 0 0 7
0 7
54
5
I2z
1 1 0

2.2 Modelado de un robot de dos grados de libertad


De modo que
1
KR = q_T
2

I1

"

1 0
0 0

+ I2

27

"

1 1
1 1

#!

q_

Considerando la energa potencial del manipulador como la suma de la energa potencial de


cada eslabn. Donde para cada eslabn la energa potencial es la masa multiplicada por la
aceleracin de la gravedad y la distancia al centro de masa, de modo que tenemos:
V1 = m1 gh1 ;

V2 = m2 gh2

Con las matrices de orientacin y posicin siguientes:


2

c q1

6
6 sq1
= A1 = 6
6 0
4
0
2
c12
s12
6
6 s12 c12
T02 = 6
6 0
0
4
0
0
T01

sq1 0 l1 cq1
c q1
0
0
0
0
1
0

7
0 l1 sq1 7
7
1
0 7
5
0
1
3
l1 c1 + l2 c12
7
l1 s1 + l2 s12 7
7
7
0
5
1

Donde los primeros trminos de la ltima columna de T0n son las componentes x; y de l2 en
el marco de referencia.
h1 = l1 sq1 = l1 sin q1
h2 = l1 sin q1 + l2 sin (q1 + q2 )

2.2.4.

Ecuacin de Euler-Lagrange

Dada la ecuacin de Euler-Lagrange siguiente:


d @L
dt @ q_

@L
= ;
@q

L=K

V;

K = KT + KR

Podemos considerar la matriz de inercia D (q) ; usando c21 + s21 = 1; c12 c1 + s12 s1 = c2 ;

28

Preliminares

s12 c1 + c12 s1 = c2 de modo que:


"

1 0

"

1 1

"

d11 d22

D (q) = m1 JvTc1 Jvc1 + m2 JvTc2 Jvc2 + I1


+ I2
=
0 0
1 1
d12 d21
#
"
2
2
2
2
m1 lc1 + m2 (l1 + lc2 + 2l1 lc2 cos q2 ) + I1 + I2 m2 (lc2 + 2l1 lc2 cos q2 ) + I2
=
2
2
+ I2
+ 2l1 lc2 cos q2 ) + I2
m2 lc2
m2 (lc2
Si calculamos los smbolos de Christoel con el siguiente algoritmo:

cijk =

@dkj @dki
+
@qi
@qj

1
2

@dij
@qk

cijk = cjik

Entonces para cada trmino se tiene:


c111 =

1
2

@d11
@q1

@d11
@q1

@d11
@q1

=0

c121 =

1
2

@d21
@q2

@d12
@q2

@d12
@q1

m2 l1 lc2 s2

c221 =

1
2

@d12
@q2

@d12
@q2

@d22
@q1

m2 l1 lc2 s2

c112 =

1
2

@d21
@q1

@d21
@q1

@d11
@q2

= m2 l1 lc2 s2

c122 =

1
2

@d22
@q1

@d21
@q2

@d21
@q2

=0

c222 =

1
2

@d22
@q2

@d22
@q2

@d22
@q2

=0

Y si consideramos que en la dinmica del Robot descrita por (2.12) el vector de compensacin por gravedad es el siguiente

@V
@q1
@V
@q2

(q) = [ 1 ;

T
2]

con:

= (m1 lc1 + m2 l1 ) g cos q1 + m2 lc2 g cos (q1 + q2 )


= m2 lc2 g cos (q1 + q2 )

Entonces la ecuacin dinmica se convierte en:


M (q) q + C (q; q)
_ q_ +

(q) =

2.2 Modelado de un robot de dos grados de libertad

29

Podemos considerar los trminos siguientes:


#
"
2
2
2
+ 2l1 lc2 cos q2 ) + I2
+ 2l1 lc2 cos q2 ) + I1 + I2 m2 (lc2
+ m2 (l12 + lc2
m1 lc1
M (q) = D (q) =
2
m2 lc2
+ I2
"
#
hq_2 hq_2 + hq_1
C (q; q)
_ =
; h = m2 l1 lc2 sin q2
hq_1
0
"
#
(m1 lc1 + m2 l1 ) g cos q1 + m2 lc2 g cos (q1 + q2 )
(q) =
m2 lc2 g cos (q1 + q2 )
P
n: De acuerdo al clculo directo tenemos:
ckj = ni=1 cijk q_i ; k; j = 1
x = l1 cos q1 + l2 cos (q1 + q2 )
y = l1 sin q1 + l2 sin (q1 + q2 )
Y por la convencin de D-H se tiene:

T02

c q1 c q2

sq1 sq2

6
6 c q1 sq2 + c q2 sq1
= A1 A2 = 6
6
0
4
0

Usando: c1 c2

c q1 sq2

cq2 sq1 0 l1 cq1 + l2 cq1 cq2

c q1 c q2

sq1 sq2
0
0

l2 sq1 sq2

7
0 l1 sq1 + l2 cq1 sq2 + l2 cq2 sq1 7
7
7
1
0
5
0
1

s1 s2 = c12 = cos ( + ) =; c1 s2 + c2 s1 = s12 = sin ( + ) con lo que

determinamos las coordenadas cartesianas del robot siguientes:


x = l1 c1 + l2 c12 = l1 cos q1 + l2 cos (q1 + q2 )
y = l1 s1 + l2 s12 = l1 sin q1 + l2 sin (q1 + q2 )

2.2.5.

(2.13)

Cinemtica Inversa

Sabemos que la Cinemtica inversa determina el valor de las articulaciones a partir de


las coordenadas (x; y) de (2.13) de modo que el vector q = f (X); con q = [q1 ; q2 ]T , por lo
que si consideramos la ley de csenos:
c 2 = a2 + b 2

2ab cos (a:b)

30

Preliminares

y
x2 + y 2 l12
cos q2 =
2l1 l2
Entonces el ngulo de giro del segundo eslabn es:
p

sin q2 =

q2 = tan

=D

D2

l22

1 D2
D

Y el ngulo de giro del primer eslabn es:


q1 = tan

y
x

tan

l2 sin q2
l1 + l2 cos q2

Con lo que el ngulo de giro de las articulaciones puede calcularse mediante:

q=

"

q1
q2

=4

tan

y
x

tan
tan

l2 sin q2
l1 +l2 cos q2

1 D2
D

De donde podemos observar que estos dependen directamente de la conguracin geomtrica del Robot.

2.2.6.

Modelado con compensacin por Gravedad

Si consideramos la dinmica del Robot manipulador descrita por:


M (q) q + C (q; q)
_ q_ +

(q) =

La cul para un Robot de dos grados de libertad es descrita por la Figura 2.6, adems
de aqu podemos observar sus parmetros fsicos de acuerdo a las siguientes componentes:

M (q) =

"

M11 M12
M21 M22

; C(q; q)
_ =

Donde le vector de pares gravitacionales


decir;

(q) = (q) , por lo que tenemos:

"

C11 (q; q)
_ C12 (q; q)
_
C21 (q; q)
_ C22 (q; q)
_

"

1
2

(q) cumple con la propiedad de linealidad, es

2.2 Modelado de un robot de dos grados de libertad

31

Figura 2.6: Diagrama esquematico de Robot de dos grados de libertad para obtencin de
parmetros geometricos

(q) =

"

1 (q)
2 (q)

"

(m1 lc1 + m2 l1 ) g cos q1 + m2 lc2 g cos (q1 + q2 )


m2 lc2 g cos (q1 + q2 )

La cul por la propiedad de linealidad se puede escribir como:

(q) = (q) =

"

sen(q1 ) sen(q1 + q2 )
0

sen(q1 + q2 )

#"

(m1 lc2 + m2 l1 )g
m2 lc2 g

La cul no es nica ya que otra posibilidad seria considerar:

(q) = (q) =

"

(m1 lc1 + m2 l1 )sen(q1 ) + m2 lc2 sen(q1 + q2 )


m2 lc2 sen(q1 + q2 )

#"

g
g

32

Preliminares

De forma general los parmetros geomtricos los podemos ordenar de la forma siguiente:

2
2
+ 2m2 l1 lc2 cos(q2 ) + I1 + I2
+ m2 l12 + m2 lc2
M11 (q) = m1 lc1
2
M12 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M21 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M22 (q) = m2 lc2
+ I2

C11 (q; q)
_ =

m2 l1 lc2 sen(q2 )q_2

C12 (q; q)
_ =

m2 l1 lc2 sen(q2 )[q_1 + q_2 ]

C21 (q; q)
_ = m2 l1 lc2 sen(q2 )q_1
C22 (q; q)
_ = 0
g1 (q) = [m1 lc1 + m2 l1 ]gsen(q1 ) + m2 glc2 sen(q1 + q2 )
g2 (q) = m2 glc2 sen(q1 + q2 )

2.3.

Redes Neuronales Articiales

Una Red Neuronal Articial (RNA) bsicamente es una sobresimplicacin de como se


organizan las neuronas biolgicas (especcamente las neuronas motoras) las cuales constituyen el sistema nervioso central de los seres humanos [52], por su parte para el caso
de estudio de las RNA la forma de comunicacin es mediante impulsos elctricos llamados
sinapsis. Bsicamente la constitucin de una neurona tiene tres partes esenciales: Cuerpo
celular, Dendrita y Axn y la descripcin grca se hace en la Figura 2.7.
Las RNA se pueden clasicar dentro del grupo de sistemas inteligentes, entre los que se
encuentran: sistemas adaptables, difusos, genticos y todos aquellos que tratan de modelar
el conocimiento y el aprendizaje. El trmino inteligentes esta basada en el echo de que los
sistemas mencionados anteriormente tienen la capacidad de adaptarse a su medio aprender
de l de forma autnoma, formalmente las redes neuronales tienen la siguiente denicin:
Denicin 2.1 [24]. Una Red Neuronal Articial es una gran cantidad de procesadores

2.3 Redes Neuronales Articiales

33

Figura 2.7: Forma bsica de una neurona biolgica

paralelos distribuidos, formados por una nica unidad de procesamiento, la cul tiene la
natural de almacenar el conocimiento experimental y tener ese conocimiento disponible para
usar.
De acuerdo a la denicin anterior las redes neuronales tienen un arreglo de elementos
bsicos de procesamiento con capacidad de entrenamiento (Figura 2.8) y computo paralelo,
este entrenamiento consiste en el ajuste de algunos parmetros (win ;

i)

con el n de que la

salida de la red alcance algn grado de precisin a partir de las variables de entrada mediante
el ajuste paramtrico.
El conocimiento en una red neuronal articial viene del medio ambiente mediante un
proceso de aprendizaje en la que los pesos sinpticos sirven para almacenar el conocimiento
adquirido. En el proceso de reconocimiento de patrones un modelo neuronal ampliamente
aplicado es el perceptrn, cuyo modelo matemtico consta de tres elementos bsicos descritos
a continuacin e ilustrados en la Figura 2.9.
1. Un conjunto de sinapsis o uniones caracterizadas por un peso. Se denota regularmente
que xj es la entrada de la sinapsis j que esta conectada a la neurona k; xj es multiplicada
por el peso sinptico wkj :

34

Preliminares

Figura 2.8: Estructura de una neurona articial bsica

2. Operador lineal, es decir la suma de las seales de entrada multiplicadas por sus pesos
sinpticos respectivos.
3. Funcin de Activacin para limitar la salida de la neuronal f (z).
El tipo de estructura mas simple que existe en las redes neuronales es la llamada FeedForward ilustrada en la Figura 2.10, en la cual la salida de una red neuronal depende nicamente
de sus entradas y no existe conexin de la salida de las neuronas con su entrada, el ujo de
la informacin es hacia un solo sentido y las neuronas se actualizan siempre al mismo tiempo
y no dependen de seales en instantes anteriores de tiempo se dice que es una red neuronal
esttica porque la respuesta de la red neuronal es invariante en el tiempo y este es del tipo
de Red Neuronal Articial utilizada en el presente trabajo.
Existen tres tipos de redes neuronales estticas: las redes de una sola capa, las redes neuronales mlticapa y las redes neuronales de funciones radiales bsicas. Las redes neuronales
estticas son muy tiles en los problemas de clasicacin de patrones y aproximacin de
funciones porque construyen funciones no lineales entre el espacio de entrada al espacio de

2.3 Redes Neuronales Articiales

35

Figura 2.9: Perceptrn simple

salida de las variables involucradas. Una red neuronal con conexiones hacia adelante con una
capa oculta no lineal y una capa de salida lineal puede aproximar cualquier funcin con el
grado de precisin que se desee. Es la forma mas simple de redes neuronales feedforward,
tiene solo una capa de neuronas, el perceptrn es la red neuronal de una capa mas difundida,
el cual consiste en una sola neurona y se ilustra en la Figura 2.8.
Usualmente el umbral (w0 ) es tratado como un peso sinptico conectado al valor jo

1;

la salida del perceptrn es calculado como


n
X
y(k) = '(
wj xj u + w0 );

(2.14)

j=1

Donde w es el vector de los pesos sinapticos para cada k en el espacio n dimensional, la


ecuacin wT u con coordenadas las coordenadas u1 ; u2 ; ::; un :
Este algoritmo esta basado en el mtodo de gradiente descendente, resultando la ley que
actualiza los pesos de la red de la forma:
w(k + 1) = w(k) + e(k)u(k):

(2.15)

Las redes neuronales multicapa tienen las siguientes tres caractersticas que las distinguen:

36

Preliminares

Figura 2.10: Red Neuronal Articial FeedForward

1. La funcin de activacin de cada neurona es suave al contrario de las funciones usadas


en las redes de una sola capa. Usualmente la funcin usada es una funcin tipo sigmoide
la cul esta denida como:

'i ( i ) =

1
(1 + e

2. La red neuronal tiene una o mas capas de neuronas ocultas.


3. Las redes tienen un alto grado de conectividad.
Y se ilustra gracamente en la Figura 2.11.
El algoritmo de aprendizaje utilizado para ajustar los pesos sinpticos del perceptrn
multicapa es el Back Propagation. En el cul el error de la salida de la neurona j de la capa
de salida esta dado como:
ej (k) = dj (k)

yj (k);

(2.16)

2.3 Redes Neuronales Articiales

37

Figura 2.11: Red neuronal multicapa

donde:
dj es la salida deseada.
yj es la salida de la red neuronal
k indica el elemento del arreglo de entrada.
El error cuadrtico medio instantneo se escribe como:
1X
"(k) =
ej (k)
2 j=1
l

(2.17)

Donde l es el nmero de neuronas de la capa de salida. Luego el promedio del error es


obtenido de la suma de "(k) y normalizado con respecto al el nmero de pocas.

"av

N
1 X
=
"(k);
N k=1

(2.18)

Usando N ejemplos, que forman una epoca."av representa la funcin de costo a minimizar en
el aprendizaje, de modo que el objetivo del proceso de aprendizaje es ajustar los parmetros
libres de la red, para minimizar el valor de "av . Para hacer eso el algoritmo back propagation
aplica una correccin

wji (k) al peso sinptico wji (k); el cul es proporcional al gradiente

38

Preliminares

@"(k)=@wij (k) y el clculo de ese gradiente tiene la forma:


@"(k) @ej (k) @yj (k) @vj (k)
@"(k)
=
@wij (k)
@ej (k) @yj (k) @vj (k) @wji (k)

(2.19)

Diferenciando la ecuacin (2.19) tenemos:


@"(k)
=
@wij (k)
El factor de correccin

ej (k)'0j (vj (k))yi (k)

(2.20)

wji (k) aplicado a los pesos sinpticos wji (k) se dene por la regla

delta:
wji (k) =

@"(k)
@wij (k)

(2.21)

Un inconveniente de las redes neuronales MLP es que su entrenamiento es lento, la minimizacin del ndice del error cuadrtico de salida requiere de comparar en varias ocasiones el
conjunto de datos de entrenamiento con la respuesta de la red neuronal. Las redes neuronales
con funciones de base radial (RBR) son una alternativa a las redes neuronales MLP, en el
contexto de que las RBF las capas ocultas estn conformadas por un conjunto de funciones
que constituyen una base para el problema de clasicacin. La justicacin matemtica la
establece el teorema de Cover (Cover, 1965), se basa en que un problema de clasicacin es
ms probable que sea linealmente separable si se transforma en otro de dimensin mayor.
Las funciones de base radial fueron introducidas primero para la solucin de problemas
de interpolacin multivariable. El trabajo pionero en este tema fue Powell, 1985. Broomhead
y Lowe en 1988, exploraron por primera vez el uso de las redes neuronales con funciones
de base radial para poder realizar una clasicacin no lineal. A diferencia de la disposicin
que se tiene en las funciones de activacin de la red MLP que permite construir modelos de
entrenamiento mediante el algoritmo de back-propagation, las nuevas redes con funciones de
base radial construyen sus modelos con funciones de activacin que son diferente tanto en
la capa oculta como en la capa de salida, es decir; una red RBR est diseada con neuronas
en la capa oculta activadas mediante funciones radiales de carcter no lineal con sus centros
propios y en la capa de salida mediante funciones lineales.
La estructura de las redes de base radial presenta tres capas bien denidas:

2.3 Redes Neuronales Articiales

39

1. La capa de nodos de entrada, completamente conectadas a las neuronas de la capa


oculta.
2. La capa oculta de neuronas que proveen una transformacin no lineal activada por las
funciones de base radial.
3. La capa de salida, tambin completamente interconectada a la capa oculta y activada
a travs de una funcin lineal continua.
La construccin de una red RBR requiere de una mayor cantidad de neuronas en los
nodos ocultos que en las redes MLP. Aunque las redes RBR no son comnmente utilizadas
en aplicaciones que impliquen un alto volumen de patrones de entrenamiento, se le reconoce
como una red con una alta eciencia en la fase de entrenamiento. El entrenamiento a diferencia de la red MLP usando el algoritmo de aprendizaje de retro-propagacin, es solamente
hacia adelante, de este modo la salida de una red RBR en general, est inuenciada por una
transformacin no lineal originada en la capa oculta a travs de la funcin de base radial y
una lineal en la capa de salida a travs de la funcin lineal contina. En la Figura 2.12 se
presenta una red RBR, donde xi, son las entradas a la red i = 1,2,...,n; la salida est dada
por y = f (x) ; en donde las i son las funciones de base radial, para este caso son funciones
gaussianas. Si la red neuronal presenta n neuronas en la capa oculta, entonces la salida de
la red neuronal de base radial se expresa de la forma:

F (x) =

N
X

wi ' (kx

i=1

Donde f' (kx

xi k)

(2.22)

xi k) ji = 1; 2; :::; N g es un conjunto de N funciones arbitrarias general-

mente no lineales, conocidas como funciones radiales bsicas, y k k denota la norma que

usualmente es la Euclideana, los datos conocidos xi 2 Rm0 ; i = 1; 2; :::; N son tomadas para

ser los centros de las funciones radiales bsicas.

Algunas de las funciones radiales bsicas mas utilizadas son:

40

Preliminares

Figura 2.12: Estructura de una Red Neuronal de funciones de base radial.

Multi cuadrtica: '(r) = (r2 + c2 )1=2 ; para algn c > 0 y r 2 R


Multi cuadrtica Inversa: '(r) =
Gausiana: '(r) = exp

r2
2 2

1
;
(r 2 +c2 )1=2

; para algn

para algn c > 0 y r 2 R


>0yr2R

En general una red RBR tiene un mejor desempeo con un mayor volumen de datos
de entrenamiento que su contraparte la red MLP, presentan una arquitectura simplicada
con una capa oculta, su entrenamiento es rpido y se puede realizar una combinacin de
diferentes paradigma de aprendizaje.
Un problema en las Redes Neuronales Estticas es el almacenamiento de informacin
temporal, esto se realiza incluyendo retardos en las entradas y las salidas, sin embargo,
es una representacin limitada, ya que solo puede almacenar un nmero nito de entradas
previas, una alternativa para solucionar este tipo de problemas es el uso de Redes Neuronales
en Diferenciales (DNN) para tiempo continuo y para tiempo discreto utilizamos el nombre
de Redes Neuronales Recurrentes (RNN) y cuyo estudio detallado escapa de los alcances del
presente trabajo, a lo cu solo se mencionaran algunas caracteristicas bsicas. Debtro de las
tareas para este tipo de redes son: La prediccin de series, la identicacin y el control de
sistemas dinmicos.
Una de las primeras estructuras de una red neuronal retroalimentada fue propuesta por

2.3 Redes Neuronales Articiales

41

Hopeld y usa su red para describir redes de circuitos elctricos, ver [24]. Existen dos versiones
de la red neuronal de Hopeld:
La red neuronal discreta de Hopeld la cul se representa por el modelo matemtico
siguiente:
xi (k + 1) = sgn
Donde:
xi es el estado de la i

"

n
X

wij xij (k) + ui

j=1

esima neurona,

n es el nmero de neuronas,
ui es la entrada a la i

esima neurona,

es el umbral de la i

esima neurona.

wik es el peso sinptico que conecta la neurona j a la neurona i:

(2.23)

42

Preliminares

Captulo 3
PID estable en el espacio articular
3.1.

Introduccin

Sabemos que el controlador PD es el esquema de control mas simple aplicado en robots


manipuladores ya que tan solo con la eleccin de alguna ganancia positiva el controlador
garantiza la estabilidad [59] para el problema de regulacin. Si embargo no se puede garantizar la estabilidad asinttica cuando la dinmica del manipulador incluye los vectores de par
gravitacional, vector de friccin y de forma general otras incertidumbres sin que se aplique
una compensacin con modelo de referencia. Requiriendo as el conocimiento de la dinmica
del robot. Por ejemplo en los trabajos referentes a: compensacin adaptable de gravedad
[64][58], compensacin por gravedad deseada [35], y control PD mas medicin de posicin
[50], observamos que se requiere informacin estructural del vector de gravedad en el controlador PD. Por otro lado algunos controladores PD no lineales tambin pueden alcanzar
la estabilidad asinttica, tales como: control PD con ganancias variantes en el tiempo [53],
ganancias no lineales [47], y compensacin por modos deslizantes [51].
Desde el punto de vista del control, el error de posicin causado por los pares gravitacionales puede eliminarse introduciendo una componente integral al controlador PD. Esta
tcnica de control PID es utilizada ampliamente en Robots industriales. El controlador lineal
PID tpico no incluye trminos de la dinmica del robot en su ley de control, y con el n de

44

PID estable en el espacio articular

asegurar la estabilidad asinttica del controlador PID el mtodo mas simple es convertir el
controlador lineal PID a uno no lineal. Por ejemplo el error de posicin ha sido modicado
en un controlador no lineal en el trabajo de [4]; Por su parte en los trabajos de [36] y [60] el
trmino integral fue saturado por una funcin no lineal; en el trabajo de [2] se opta por una
saturacin a la entrada, En el trabajo de [1] se realiza una transformacin de un observador
no lineal a una forma de control PID. Por otro lado la prueba de estabilidad asinttica semiglobalmente fue realizada en el trabajo de [49] gracias a la adicin de un trmino integral
extra al ltro de posicin. En [30] y [51] un control PID fue modicado en un forma de
variacin estructural con un controlador PID mediante deslizamiento de supercie. Por su
parte [34] se obtuvieron condiciones de estabilidad asinttica global gracias a la adicin de
trminos proporcional y derivativos en el controlador lineal PID. A pesar de que los controladores industriales PID han sido utilizados ampliamente, existen pocos trabajos referentes
a las condiciones explcitas y anlisis de estabilidad. Pocos trabajos se han realizado sobre
el controlador PID lineal utilizando la dinmica en una forma desacoplada y no lineal tal
como en el trabajo de [54], aun as este controlador PID no puede garantizar la estabilidad
asinttica. Para las condiciones sucientes de estabilidad de un controlador PID lineal puede
consultarse el trabajo de Kelly [37] el cul esta basado en un anlisis de Lyapunov. Con frecuencia estas condiciones no son explcitas y las ganancias no se pueden elegir directamente,
para ello se ha utilizado el mtodo un tanto complejo [38].
En esta seccin del trabajo de tesis se propone un anlisis de Lyapunov novedoso para
el controlador lineal PID en el cul las condiciones sucientes de estabilidad asinttica son
simples y explcitas, donde las ganancias del controlador lineal PID pueden seleccionarse
bajo estas condiciones directamente.
Cuando las mediciones de velocidad no estn disponibles es necesario utilizar un observador de velocidad, es decir; un ltro de posicin para lo cus en el siguiente trabajo se
realiza una prueba la estabilidad asinttica para el control lineal PID con observador propuesto, este anlisis proporciona condiciones explcitas para elegir las ganancias del control
lineal PID as como los parmetros del observador de velocidad.
Posteriormente se utilizar un robot manipulador de dos grados de libertad para veri-

3.2 Control Estable PD con compensacin por gravedad

45

car las condiciones de sintonizacin del controlador PID, se propone adems un mtodo
sistemtico para mejorar el ndice de desempeo. Los resultados experimentales muestran
que la metodologa propuesta es una herramienta analtica para el diseo de controladores
que por su constitucin son ajustados experimentalmente.

3.2.

Control Estable PD con compensacin por gravedad

Para realizar un estudio sobre el comportamiento de la dinmica de un robot manipulador


considerando el trmino de gravedad, primero pondremos en contexto algunas propiedades
indispensables sobre la dinmica.
Propiedad 1. La matriz de inercia es simtrica y denida positiva, es decir; tiene la forma:
m1 kxk2

xT M (x1 )x

m2 kxk2 ; 8x 2 Rn

Donde m1 , m2 son constantes escalares conocidas y k k representa la norma euclidiana.

Propiedad 2. La matriz de fuerzas centrpetas y de coriolis es antisimtrica y satisface la

siguiente relacin:
xT M (q)
Donde C(q; x)y = C(q; y)x; C(q; q) =

n
P

2C(q; q) x = 0

Ck (q)qk ; C(q; q)

k=1

Ck;ij (q) =

@Bij
@qk

@Bjk
@qi

@Bik
@qj

; kc = 12 maxn

n
P

q2R k=1

Rn .

kc q ; C(q; q)q = q C0 (q)q;

kCk (q)k, C0 (q) es una matriz acotada, x; y 2

Denamos:
x1 = q;

x2 = q

Entonces el error de trayectoria lo podemos considerar como:


x1 = x1

xd1 ;

x2 = x2

Kd (q

q )=

xd2

Por lo que el control PD estandar es:


=

Kp (q

qd)

Kp x 1

Kd x 2

(3.1)

46

PID estable en el espacio articular

Luego la ley de control clsica PD industrial puede representarse por:


=

Kp (q

qd)

Kd (q

q ) = P D1

(3.2)

Donde Kp y Kd matrices denidas positivas, simtricas y de coecientes constantes, las


cules corresponden a los trminos proporcional y derivativos respectivamente, q d 2 <n
d

representa la posicin deseada en cada articulacin, q 2 <n es la velocidad deseada en cada

articulacin. En este capitulo primero discutiremos el caso de regulacin donde la posicin


d

es una constante deseada, es decir; q = 0:


En el control de robots las posiciones deseadas en las articulaciones son generadas por
una planicacin de trayectoria [37] la cul se aplica directamente sobre los motores de cada
articulacin. El control por regulacin se utiliza en este sentido para forzar a cada articulacin
a seguir las posiciones deseadas.
Para el anlisis de estabilidad en el control PD, podemos utilizar la funcin candidata de
Lyapunov siguiente:
1
1 T
q_ M q_ + q~T Kp q~
2
2
q~ = q q d

(3.3)

VP D =

(3.4)

La cul no es nica, luego de las propiedades de simetra y antisimetra menicionadas anteriormente se tiene:
q_T M (q)

2C(q; q) q_ = 0

Entonces podemos expresar:


q_T (G + F )

q_T K1 q_ + (G + F )T K1 1 (G + F )

Con K1 como matriz denida positiva. Luego si obtenemos la derivada de la funcin candidata de Lyapunov (3.3):
V PD =

q_T Kd q_ + q_T (G + F )

q_T (Kd

K1 ) q_ + d

(3.5)

3.2 Control Estable PD con compensacin por gravedad

47

Donde:
(g + f )T K1 1 (g + f )

Con d elegida como la cota superior de g + f: Si elegimos Kd > K1 , el error de regulacin q~


esta acotado (estable), y kqk
_ (Kd

K1 )

converge a d:

Luego para el controlador PD con compensacin por gravedad agregamos un trmino de

gravedad G(q) al controlador (3.1) de modo que tenemos lo siguiente:


=

Kp x 1

(3.6)

Kd x2 + G (q)

Entonces la funcin candidata de Lyapunov puede ser:


1
1
V1 = xT2 M x2 + xT1 Kp x1
2
2

(3.7)

Usando la dinmica para el robot de la siguiente forma:


M (q)
q + C(q; q)
_ q_ + G(q) =
De modo que podemos considerar:
M x2 = M (q) q =

Cx2

(3.8)

G+

Luego la derivada de 3.7 es:


1
V 1 = xT2 M x2 + xT2 M x2 + xT2 Kp x1
2

(3.9)

Usando (3.6) y (3.8)


xT2 M x2 = xT2 ( Cx2
Y de la Propiedad 2: xT M (q)
V1 =
Dado que Kd

0; V1

0:

F+ )=

xT2 Cx2

xT2 Kp x1

xT2 Kd x2

2C(q; q) x = 0, la funcin (3.9) se convierte en:

xT2 Kp x1

xT2 Kd x2 + xT2 Kp x1 =

xT2 Kd x2

(3.10)

48

PID estable en el espacio articular

3.3.

Estabilidad Asinttica semiglobal de un control


PID

Primero describamos la dinmica de un robot manipulador a partir de la ecuacin de


Euler-Lagrange siguiente:
(3.11)

M (q) q + C (q; q)
_ q_ + g (q) = u

Donde el vector q 2 R2 representa las posiciones de las articulaciones. M (q) = KT + KR

es conocida como la matriz de inercia, C (q; q)


_ = fckj g representa las fuerzas centrfugas,
Pn
ckj = i=1 cijk q_i ; k; j = 1 n, cijk son los smbolos de Christoel [59], g (q) es un vector
P
@
U (q), U = ni=1 mi ghi ; hi = yi y oi = [xi ; yi ; zi ]T oi esta
de pares gravitacionales, g (q) = @q

dada por los tres elementos de la cuarta columna de la matriz de transformacin homognea.
Adems el modelo del robot satisface las siguientes propiedades:
P1. La matriz de inercia M (q) es simtrica y denida positiva y satisface:
0<
Donde

fM g y

fM (q)g

kM k

fM (q)g

>0

(3.12)

fM g son el mximo y mnimo valor caracterstico de la matriz M:

P2. Para la matriz Centrfuga y de Coriolis C (q; q)


_ ; existe un nmero kc > 0 tal que:
kC (q; q)
_ qk
_
y M_ (q)

kc kqk
_ 2;

kc > 0

(3.13)

2C (q; q)
_ es antisimtrica, es decir.
i
2C (q; q)
_ x=0

(3.14)

M_ (q) = C (q; q)
_ + C (q; q)
_T

(3.15)

M_ (q)

con

P3. El vector de pares gravitacionales g (q) satisface la condicin de Lipschitz


kg (x)

g (y)k

kg kx

yk

(3.16)

3.3 Estabilidad Asinttica semiglobal de un control PID

49

De modo que el objetivo de control es evaluar el par sobre cada articulacin tal que los
desplazamientos tiendan asintticamente a una constante de desplazamiento deseada en cada
articulacin.
Dada una constante de posicin deseada q d 2 Rn ; la condicin para la estabilidad as-

inttica semiglobal para el robot es disear una entrada de control de par u sobre (3.11)
que haga que el error de regulacin q~ = q d

q; tienda a cero q~ ! 0 as como la razn de

cambio q~ ! 0; cuando las condiciones iniciales son arbitrariamente grandes sobre el dominio
Rt
de atraccin. La ley clsica de control PID esta denida por u = Kp q~ + Ki 0 q~ ( ) d + Kd q~;

donde las constantes Kp ; Ki ; Kd son las constantes proporcional, integral y derivativas del
controlador respectivamente. Dada las condiciones: q_d = 0; y q~ =

q;
_ la ley de control PID

puede expresarse mediante las siguientes ecuaciones:


u = Kp q~

(3.17)

Kd q_ +

_ = Ki q~
(0) =

(3.18)
(3.19)

Aqu necesitamos que el control lineal (3.17) este en una forma desacoplada, es decir; requerimos que Kp ; Ki y Kd sean matrices diagonales denidas positivas. De modo que la dinmica
del manipulador en lazo cerrado (3.11) sea:
M (q) q + C (q; q)
_ q_ + g (q) = Kp q~

Kd q_ +

_ = Ki q~
De donde el punto de equilibrio es

; q~; q~ = [ ; 0; 0] : Y cuando el punto de equilibrio esta

dada por la condicin q = q d ; entonces el equilibrio ahora es g q d ; 0; 0 : Con el n de


mover el equilibrio al origen, podemos denir ~ =
g q d . Entonces el sistema en lazo
cerrado con ~ = Ki q~ se transforma en:
M (q) q + C (q; q)
_ q_ + g (q) = Kp q~

Kd q_ + ~ + g q d

Para el anlisis de estabilidad del control lineal PID se presenta el siguiente teorema.

(3.20)

50

PID estable en el espacio articular

Teorema 3.1 Dada la dinmica del Robot (3.11) controlada por el controlador lineal PID
(3.17), entonces el sistema en lazo cerrado (3.20) es semiglobalmente asintticamente estable
en el punto de equilibrio.
T

g q d ; q~; q~

x=

=0

Con la condicin de que las ganancias de control satisfagan:

Donde

m (M ) m (Kp )

(Kp )

(Ki )

(Kd )

3
k
2 g
m (Kp )

(3.21)

M (M )

(M )

; kg satisfacen la condicin de Lipschitz (3.16).

Demostracin. Construyamos una funcin de Lyapunov de la siguiente forma:


V = 21 q_T M q_ + 21 q~T Kp q~ + U (q) ku + q~T g q d + q~T ~
T
T
q~T M q_ + 2 q~T Kd q~
+ 23 g q d Kp 1 g q d + 2 ~ Ki 1 ~

(3.22)

Donde ku = m nq fU (q)g ; U (q) esta denida en (3.11), ku se agrega de modo que V (0) = 0:
y

es una constante denida positiva.

1) Primero vamos a probar que V es una funcin de Lyapunov denida positiva V


P
El trmino 21 q~T Kp q~ puede separarse en cuatro partes y V = 4i=1 Vi
V1 = 61 q~T Kp q~ + q~T g q d + 23 g q d
T
V2 = 16 q~T Kp q~ + q~T ~ + 2 ~ Ki 1 ~
V3 = 61 q~T Kp q~

0: Es fcil encontrar V1 = 21 sT
3

: Entonces

V2

1
2

(3.23)

q~T M q_ + 12 q_T M q_

De ku = m nq fU (q)g ; sabemos que V4


T

Kp 1 g q d

ku + 2 q~T Kd q~

V4 = U (q)

0; s = q~; g q d

0:

1
3

(Ki 1 )
m

m (Kp )

(Kp ) k~
qk

3
~
m (Kp )

!2

"

1
K
3 p

3Kp 1

3.3 Estabilidad Asinttica semiglobal de un control PID


p1

Cuando

m (M ) m (Kp )
M (M )

1
2

V3

Podemos observar que s:

q
1
3

51

1
3

(M )
M

Ki
m

(M ) kqk
_
3
2

(Kp )

1
2

1
3

(Kp ) k~
qk

(M )

(M ), entonces existe

(Kp )

!2

(M )

Ki

(3.24)

(Kp )

Esto signica que s: Kp es sucientemente grande Ki es sucientemente pequea entonces


V q;
_ q~; ~ es denida positiva semiglobalmente.
2) Podemos probar que V_

0: Usando

d
U
dt

(q) = q_T g (q) ;

d
g
dt

qd = 0 y

d
dt

q~T g q d

q~ g q d ; luego la derivada de V esta denida por:


T

V_ = q_T M q + 12 q_T M q_ + q~ Kp q~ + g (q)T q_ + q~ g q d


T

T
+ ~ Ki 1 ~ + q~ ~ + q~T ~

(3.25)

q~ M q_ + q~T M q_ + q~T M q + q~T Kd q~


Usando (3.23), el primer trmino de (3.25) se hace:
q_T g (q)
T

Dado que q~ g q d =

q_T Kd q_ + q_T ~ + q_T g q d

q_T g q d y ~ = Ki q~; el primer trmino de (3.25) es


q_T Kd q_ + q~T ~ + q~T Ki q~

(3.26)

Ahora para los ltimos dos trminos de la derivada de la funcin de Lyapunov (3.25). de la
condicin (3.15) tenemos que.
q~T M q_ = q~T C q_ + q~T C T q_

52

PID estable en el espacio articular

Luego del sistema en lazo cerrado(3.20):


q~T M q =

q~T C q_

q~T g (q) + q~T Kp q~

q~T Kd q_ + q~T ~ + q~T g q d

q_T M q,
_ si usamos (3.13) y (3.16) entonces los ltimos dos trminos de la

Donde q~ M q_ =

derivada de la funcin de Lyapunov (3.25) son:


f~
q T Kp q~ q_T M q_ + q~T C T q_ + q~T g q d
+~
q T ~ q~T Kd qg
_ + q~T Kd q~
q_T M q_

g (q)
(3.27)

q~T Kp q~ + kc k~
q k kqk
_ + kg k~
qk

q~T ~

De 3.25 y (3.27) tenemos que:


V_

q_T (Kd
[
[

m
m

(Kd )

(Kp )

M
M

q~T ( Kp

kc k~
q k) q_

Ki

kg ) q~

kc k~
q k] kqk
_

(M )

kg ] k~
q k2

(Ki )

Luego s:
M

k~
qk

(M )
kc

Y adems:
m

(Kd )

(Kp )

(1 + ) M (M )
1
M (Ki ) + kg

Entonces la derivada de la funcin de Lyapunov satisface:


V_

Y el error de regulacin k~
q k decrece. Luego de (3.24), s:
q
p
1
(M
)
m
m (Kd )
M (M ) +
3
m

(Kp )

1
3

Ki

Entonces:
V_

(Kp )

(Kp )

(Ki ) + kg

(3.28)

3.3 Estabilidad Asinttica semiglobal de un control PID

53

3) Finalmente para demostrar la estabilidad asinttica semiglobal. Usamos la condicin


m

Ki

radio

1
M (Ki )

; (3.28) y (3.21) para las ganacias de control. Denamos una bola

de

> 0 centrada en el origen del espacio de estados del tipo:


M

q~ : k~
qk

(M )
=
kc

Luego si V_ es semidenida negativa en la bola : Entonces existe una bola


centrada en el origen del espacio de estados que satisface que V_
0:

de radio

>0

As el origen del sistema en lazo cerrado (3.20) es estable en el punto de equilibrio.


Cuando el sistema en lazo cerrado es autnomo, podemos utilizar el Teorema de La Salle.
Denamos primero

como:
n
h
i
o
= x (t) = q~; q;
_ ~ 2 R3n : V_ = 0

Para la derivada de la Funcin de Lyapunov (3.25) se cumple que:


V_ = 0
()

q~ = q_ = 0

Entonces para una solucin x (t) contenida en

para todo t

0, es necesario y suciente

que el error de regulacin sea cero es decir; q~ = q_ = 0 para todo t


Por lo tanto tambin se cumple que q = 0 para todo t

0.

0.

Entonces concluimos primero que del sistema en lazo cerrado (3.20), si la solucin x (t) 2

0, entonces g (q) h= g q di = ~ + g q d y ~ = 0. Esto implica que ~ = 0 para


0: De modo que x (t) = q~; q;
_ ~ = 0 2 R3n es solo la condicin inicial en para la

para todo t
todo t

cul x (t) 2

para todo t

0.

Finalmente concluimos que el sistema en lazo cerrado (3.20) es localmente asintticamente

estable, puesto que:

1
m

Ki

(Kp )

La cota superior para k~


q k se puede tomar como:
k~
qk

(M )
kc

(Ki )

(Kp )

(3.29)

54

PID estable en el espacio articular

Con lo cul se establecen las condiciones de estabilidad semiglobal de nuestro controlador,


en el sentido de que el dominio de atraccin puede hacerse arbitrariamente mas grande con
ganancias disponibles. Si incrementamos Kp entonces el dominio de atraccin puede crecer.
Del anlisis de estabilidad anterior, podemos ver que las tres matrices de ganancias del
control lineal PID (3.17) pueden elegirse directamente de las condiciones (3.21). Mientras
que el procedimiento de sintonizacin de los parmetros del controlador PID es mucho mas
simple que en los trabajos realizados por [2][4][36][38][37][47][54]. Este controlador lineal
PID tiene las mismas caractersticas que los controladores industriales con la ventaja que
garantiza la estabilidad asinttica semiglobal. Es interesante observar que las condiciones
sucientes de [37][38] son:
m

(Kp ) > kg ;

(Kd ) >

2
M

(M )
m (M )

(Ki )
kg
m (Kp )
M

Las cules no son explcitas y su regin de atraccin para la estabilidad asinttica semiglobal
es:
k~
qk

1
kc

(Kd )

(Kp ) kg
M (Ki )

(M )

(3.30)

Esto signica que para ganancias integrales pequeas en el controlador PID e incluso para
el controlador PD (Ki = 0) podemos asegurar estabilidad asinttica. Por lo que si comparamos (3.30) con las cotas obtenidas en (3.29) de nuestro mtodo, podemos ver que nuestros
resultados son mejores en el sentido de estabilidad.
En la literatura podemos ver que sin el vector de fuerzas gravitacionales g (q) en la
dinmica de un robot (3.11) un control PD con alguna ganancia positiva puede hacer que
el sistema en lazo cerrado sea asintticamente estable. Entonces el objetivo principal de la
accin integral sobre la dinmica de un robot manipulador es la de cancelar el par gravitacional. Con el n de disminuir la ganancia integral se aplica un estimado de gravedad en el
control (3.17). De modo que el control PID con una compensacin aproximada de gravedad

3.3 Estabilidad Asinttica semiglobal de un control PID

55

g^ (q) es el presentado por 3.31 y grcamente se puede representar por la Figura (3.1).
u = Kp q~

Kd q_ + g^ (q) + ;

_ = Ki q~

Figura 3.1: Control PID mas compensacin aproximada de gravedad

Si denimos
g~ (q) = kg (q) g^ (q)k
Z T
g~ (q) dq
U~ (q) =
0

U~ (0) = 0;

Entonces g~ (q) tambin satisface la condicin de Lipschitz (3.16).


k~
g (x)

g~ (y)k

k~g kx

yk

As la nueva funcin de Lyapunov de la prueba anterior es:


V = 21 q_T M q_ + 21 q~T Kp q~ + U~ (q) k~u + q~T g~ q d + q~T ~
T
T
+ 23 g~ q d Kp 1 g~ q d + 2 ~ Ki 1 ~
q~T M q_ + 2 q~T Kd q~

(3.31)

56

PID estable en el espacio articular

n
o
~
~
Donde ku = m nq U (q) : El teorema anterior tambin es correcto para un control PID
con una compensacin aproximada de gravedad (3.31). Y la condicin para las ganacias del
control PID de (3.21) son:

(Kp )

(Ki )

3~
kg
2
3
2

k~g
=

3.4.

kg
r

k~g
M (M )

(M )
3

(Kp )

Control lineal PID con velocidades no medibles

En contraste con los altos grados de precisin de los enconders pticos para medicin de
velocidad respecto los tacmetros, estos ltimos son bastante imprecisos e inexactos especcamente para ciertos intervalos de tiempo. Una estrategia de diseo en controladores PID
para medicin de velocidades es proponer un observador de estado para estimar la velocidad.
En el controlador PI2 D [49] se agrega un trmino integral al controlador lineal PID integral
(3.33) con lo cul se prueba estabilidad asinttica semiglobal.
Para un diseo alternativo de observadores se pueden utilizar los ltros de posicin de
cero y primer orden para estimar la velocidad en las articulaciones [59].

Donde

(s) =

bi s
qi (s) ;
s + ai

i=1

(3.32)

(s) es un estimado de q_i ; ai y bi son elementos de la diagonal principal de las matrices

diagonales A y B del tipo A = diag fai g, B = diag fbi g ; que satisfacen las condiciones

ai > 0; bi > 0: La funcin de transferencia del ltro (3.32) puede representarse po una
ecuacin en espacio de estados. De modo que podemos considerar el controlador lineal PID

3.4 Control lineal PID con velocidades no medibles

57

(3.17) siguiente.
u = Kp q~
_ = Ki q~;
x_ =

Kd +
(0) =

(3.33)

A (x + Bq)

= x + Bq
Donde Kp ; Ki y Kd son matrices de coecientes constantes, diagonales y denidas positivas
y los trminos ai y bi en el ltro (3.32) deben de ser constantes positivas.
El sistema en lazo cerrado del robot (3.11) es:
_ = Ki q~;
q_ = M

_ =

A + B q_

C (q; q)
_ q_

Kd + ~ + g q d

g (q) + Kp q~

(3.34)

i
h
Donde el punto de equilibrio de (3.34) es considerado como: ~; ; q_ = [0; 0; 0] :
Para el anlisis de estabilidad se presenta el siguiente teorema.

Teorema 3.2 Dada la dinmica del Robot (3.11) controlada por el controlador lineal PID
(3.33) donde las matrices A, B satisfacen:
M (A)
2
m (A)

Con

(Kd )

(B)

1
4

(B

I)

m (B)
M (B)
m (M )
2
M (M )

(Kd )
1
2

(3.35)

(A)

> 0; entonces el sistema en lazo cerrado (3.34) es localmente asintticamente estable

en el punto de equilibrio.
T

x=

g q

; q~; q~

=0

Sobre el dominio de atraccin:


k~
qk

(M )
kc

(B

I)

1
2

(A) +

k k

58

PID estable en el espacio articular

Bajo la condicin de que las ganancias satisfacen:


m

1
2

(Kp )

kg +
+ 1+2
2
m (Kd )
M

Donde

(Kp )

M
2

(Ki ) +

(A 1 BKi )

(Kd ) + 2 M (A 1 Ki )]
1K + 1
i) 2
M (A
M (Kp )+ (M )

2 M
kg + 21

(Ki )

m (AB

M (M ) M (A)

(3.36)

I) 1

(Kp )

(M ) depende del nmero de M:

Demostracin. Primero propongamos la funcin candidata de Lyapunov siguiente:


Vc = 21 q_T M q_ + 12 q~T Kp q~ + U (q)

ku

T
Kp g q + 2 ~ Ki 1 ~
q
T
+~
q T (I + A B) ~ + 21 T B 1 Kd
M q_ +
T

+~
q g q

Donde

d T

+ 23 g
1

q~T M q_
T
A 1~

(3.37)

es una constante de diseo.

1) Primero vamos a demostrar que la funcin V es una funcin de Lyapunov con V


Podemos separar el trmino
P6
ku 0
i=1 Vi ; V6 = U (q)

1 T
q~ Kp q~
2

en tres partes de la forma siguiente y adems V =

V1 = 61 q~T Kp q~ + q~T g q d + 23 g q d
T
V2 = 16 q~T Kp q~ + q~T ~ + 2 ~ Ki 1 ~

Kp 1 g q d

V3 = 61 q~T Kp q~
V4 =
V5 =

1 T
4
1 T
4

q~T M q_ + 14 q_T M q_
T
(B 1 Kd ) + T A 1 ~ + ~ (A 1 B) ~
T

(B 1 Kd )

M q_ + 14 q_T M q_

En este caso V1 y V2 son iguales como en (3.23). Para V3 ; si:


q
1
(Kp ) m (M )
6 m
M

Entonces:
V3

1
2

1
2

0:

(M ) kqk
_

(M )
r

1
3

(Kp ) k~
qk

!2

3.4 Control lineal PID con velocidades no medibles

59

Dado que las cotas


m

B 1
1
M (B)

(AB)
B

(A)

Donde podemos obtener las condiciones:


M

A 1
M (A)
2
m (A)

(B 1 Kd ) m ((A 1 B))
m (B)
m (Kd )
M (B)
m

Con lo cul se satisface:


1 1
[
2 2

V4

(B 1 Kd ) k k2

+2

M
2

(A 1 ) k k ~

((A 1 B)) ~ ]

Dadas las condiciones:


1p
1
m ((B Kd ))
2
1
m (M )
m (Kd ) 2
4
M (M )

(M )

(B)

(M )

Entonces:
V5 =
Como V6

1 1
2 2

Kd B

+2

1
M q_ + q_T M q_
2

0; entonces existen ; A y B tal que:


2
M

1
6

(B)

m (Kp ) m (M )
2
M (M )

1
4

(Kd )

M (A)
2
m (A)
m (M )
2
M (M )

(Kd )

m (B)
M (B)

(3.38)

Esto signica que si Kp es sucientemente grande o Ki es sucientemente pequea, entonces


Vc q;
_ q~; ~ es denida positiva globalmente.

60

PID estable en el espacio articular


2) Ahora para el clculo de la derivada de Vc
T

V_ = q_T M q + 12 q_T M q_ + q~ Kp q~ + g (q)T q_ + q~ g q d


T

T
+ ~ Ki 1 ~

q~ M q_ + q~T M q_ + q~T M q
(3.39)

+q~ (I + A B) ~ + q~T (I + A 1 B) ~ + _ T (B 1 Kd )
1

_ T M q_ +

M q_ +

M q + _ T A 1 ~ +

A 1~
q_T Kd + q_T ~ + q~T ~: Y el

Podemos observar que los primeros seis trminos de (3.39) son


sptimo trmino de (3.39) es:

f~
q T Kp q~ q_T M q_ + q~T C T q_ + q~T g q d
g (q)
2
T
T
T~
q~ Kd g
q~ Kp q~ + kg k~
q k + q_T M q_
+~
q
+ q~T C T q_
q~T ~ + q~T Kd
Usando _ =

A + B q;
_ y q~ =

(3.40)

q;
_ los trminos del octavo al dcimo de (3.39) son:

q_T ~ + q~T Ki q~ + q_T A 1 B ~ + q~T A 1 BKi q~ + q_T Kd

AB 1 Kd

(3.41)

Para el onceavo trmino de (3.39) tenemos:


T

q_T BM q_

AM q_
T

Kp q~ +

C q_
T~

Kd

T
T

C T q_ +

g qd

C T q_

g (q)

(3.42)

Usando (3.13):
q~T C T q_

kc k q~

C q_

k kqk
_ 2

Luego si usamos ~ = Ki q~ y _ = A + B q;
_ los ltimos dos trminos de (3.39) son
T
1 ~
T
1
q_ A B
A Ki q~: Si combinamos las ecuaciones anteriores tenemos:
V_

q_T BM q_

AB 1 Kd

+ kg k~
q k2 + q_T M q_ + kc k q~
+~
q T Ki q~ + q~T A 1 BKi q~ +
+~
q T ( Kd

Kp

T~

q~T Kp q~
k kqk
_ 2

q k2
Kd + 21 kg k k2 + 12 kg k~

A 1 Ki ) + q_T AM

(3.43)

3.4 Control lineal PID con velocidades no medibles


Para asegurar que V_

0; necesitamos:

(BM

(AB 1 Kd

( Kp

Donde Ke = Kd

61

kc k q~

M)

1
k
2 g

Kd )

1
2 (M )

(AM )

(M )
1
M (Ke ) + 2
M
2
1+2
kg + 2 M (Ke )
2

A 1 BKi )

Ki

A 1 Ki : Usando

Kp

k+

(A)

(B)

(3.44)

(AM )

(AB)

(A)

(B) ; donde

i puede ser "m.o "M ", la ltima condicin de (3.44) puede reemplazarse por:
1
kc

q~

(B

I)

Esta es el rea de atraccin, usando

(A) +

1
2 (M )

(M )
M

(B)

(M )

(A + B)

(A)

(A) +

(B) ; la

segunda condicin de (3.44) es:


m

[(AB

1
k
2 g
1
k
2 g

+
+

I) Kd ]

1
2
1
2

(Ke ) +

(Ke ) +

1
I) m (Kd )
m (AB
(M )
M (M ) M (A)
2
(M )
M (AM )
2

(3.45)

La cul es la condicin para Kd en (3.36). La tercer condicin de (3.44) es


M

(Ki ) +

(A 1 BKi ) +

1+2
2

kg +

condicin de Ki en (3.36) se obtiene de

( Kp )

(Ke ) : Esta es la condicin para Kp en (3.36). La


M

(Ki )

(Kp ). Para el resto de la prueba es

lo mismo que en el Teorema 1.


Las condiciones (3.35) y (3.36) nos dicen como elegir las ganancias PID. La primera
condicin de (3.36) es
1
2

(A Ki )] +

1
2

(Kp )

(Ki ) + ;

= 1[

(A 1 BKi ) + 1+2
kg + 2
2

(Kp ). La tercer condicin de (3.36) es

(Kp )

M Ki )

(Kd ) +

y son anes.

Estas condiciones pueden establecerse cuando los valores de Ki no son grandes. La segunda
condicin de (3.36) y la tercer condicin de (3.35) no son anes. Primero tomemos

tan

pequea como sea posible y Kp tan grande como sea posible de tal forma que Ki no sea
grande. Estas consideraciones son razonables para nuestro control real. Si seleccionamos
B =

1
:
2

A + I; de la tercer condicin de (3.35),

requiere

(AB

pequeo tal que

1
m

I) >

1
;
2

entonces existe un

A ( A + I)

La segunda condicin de (3.36)

que satisface la relacin 1 >

1
2

y un

I > 12 . Luego si consideramos A y B, podemos usar

la segunda condicin de (3.36) para seleccionar Kd :

62

PID estable en el espacio articular

3.5.

Resultados experimentales

A continuacin se muestran una serie de resultados para evaluar el desempeo del controlador propuesto (3.31) sobre un robot planar de dos grados de libertad. Estos experimentos
se realizaron en el laboratorio de servicios experimentales del Departamento de Control
Automtico. La estructura bsica de la plataforma se muestra en la Figura 3.2. En esta
plataforma se utiliza un par de motores de escobillas de CD de la marca Litton C34-L80W40. Para los cuales se utilizan un par de amplicadores de potencia de 24 a 90 DC de
Copley Controls Logosol DC Servo Amplier LS-5Y. Por otro lado la Arquitectura esta
compuesta basicamente de dos etapas a saber [45][55].
La primera, Es la programacin y manejo de datos la cul utiliza un servidor para programacin y manejo de datos basandose en Matlab. Ademas del programa Wincon que realiza
la compilacin y transferencia del cdigo del algoritmo generado en Matlab en tiempo real.
La segunda etapa es el control en la que se utiliza una computadora (cliente) mediante
una red de comunicacin ethernet, en la cul el Wincon se utiliza para correr el cdigo
generado por el servidor.
Finalmente la adquisicin de datos se realiza mediante una tarjeta Servotogo la cul
maneja decodicadores pticos y voltajes analgicos.
Los dos teoremas de este capitulo son sucientes para proporcionar las condiciones de los
valores mnimos de las ganancias proporcionales y derivativas as como el mximo valor para
las ganancias integrales. Debido a que el robot descrito en (3.3) solo tiene dos articulaciones
giratorias, podemos elegir las relaciones

(M )

son los ij-simos elementos de la matriz M:

n (maxi;j jmij j) [35]; donde mij

Los lmites inferior y superior de los valores caractersticos de la matriz de inercia M (q)
son elegidos de acuerdo a

como kg = 10: Podemos elegir


Podemos elegir

(M ) = 3;
=

M (Ki )
m (Kp )

(M ) = 1: El valor de kg en (3.16) es elegido

de modo que se satisface

(Ki )

(Kp ).

7
;
12

= 0;08; A = diag(30); =
tal que B = diag(17;58). La velocidad
18s
q (s). A n de satisfacer las condiciones de
en las articulaciones es estimada por e
q_ (s) = s+30
los teoremas anteriores podemos elegir las ganancias del controlador lineal PID de la forma

3.5 Resultados experimentales

63

Figura 3.2: Plataforma Experimental para un Robot de dos Grados de Libertad. Laboarotorio
experimental Dpto. Control Automtico-CINVESTAV

siguiente:
Kp = diag [150; 150]
(3.46)

Ki = diag [2; 1]
Kd = diag [330; 330]

Cuando la dinmica del robot (3.11) es inestable en lazo abierto, es peligroso enviar los
comandos de avance al robot. En esta seccin proponemos un nuevo mtodo de ajuste en
lazo cerrado. El controlador lineal P ID0 ; con las ganancias en (3.46) puede garantizar la
estabilidad en lazo cerrado considerando la compensacin por gravedad, de esta forma el
sistema en lazo cerrado es:
M (q) q + C (q; q)
_ q_ + g~ (q) = P ID0

g^ (q)

(3.47)

@
Donde los trminos aproximados de gravedad se obtienen de: g^ (q) = @q
U (q) ; donde para el
P2
robot de dos grados de libertad tenemos U = i=1 mi ghi ; hi = yi con h1 = l1 sq1 = l1 sin q1

y h2 = l1 sin q1 + l2 sin (q1 + q2 ) por lo que U = m1 gl1 s1 + m2 gl1 s1 + m2 gl2 s1 c2 + m2 gl2 c1 s2 .

64

PID estable en el espacio articular

Figura 3.3: Esquema general de Robot de Dos grados de Libertad

Luego podemos utilizar los siguientes sistemas lineales: G1 =

0;93
;
60s2 +9s+1

G2 =

1
;
20s2 +3s+1

para

aproximar las respuestas del robot en lazo cerrado. Las respuestas al escaln unitario se
muestran en la Figura 3.4.
Para implementar el nuevo controlador P ID1 para el sistema en lazo cerrado (3.47)
usamos:
M (q) q + C (q; q)
_ q_ + g~ (q)

P ID0 + g^ (q) = P ID1

(3.48)

Donde la respuesta escaln (regulacin) del robot es similar al sistema lineal en lazo cer2

rado. Podemos utilizar la siguiente regla de ajuste: Kc = 20KmmTm ; Ti = 15 m Tm ; Td = T10m ;


Rt
P ID1 = Kc q~ + T1i 0 q~ ( ) d + Td q~ ; para ajustar el control P ID1 : Las reglas anteriores
son similares con los sistemas lineales [28][11], en este caso Kc =
Td =

Tm1 +0;1 m
:
0;8Tm1 m

5Tm1 m
;
Km Tm3

Ti = 2Tm1

m;

Existen pequeas diferencias respecto a los mtodos ampliamente usa-

dos Ziegler-Nichols [73] y Cohen-Coon [12]. Estas reglas estn disponibles para procesos
de control, y nuestras reglas son bien aplicadas a sistemas mecnicos. Dado que el control PID en este apartado del presente trabajo de tesis es lineal, entonces el par nal es
u = P ID1 + P ID0

g^ (q) : Despus de un proceso de ajuste las ganancias nales para el

3.5 Resultados experimentales

65

Figura 3.4: Respuesta aproximada al escaln unitario en el robot de dos grados de libertad

control PID son las siguientes:

Kp = diag [320; 280]


Ki = diag [5; 4]
Kd = diag [410; 400]

El primer experimento realizado en esta seccin fue implementar un controlador clsico PD


de donde se obtuvo la respuesta al escaln unitario cuyo comportamiento se muestra en la
Figura 3.5.
Luego se implemento una ley de control Proporcional Derivativa mas el trmino de pares
gravitacionales del tipo u = P D + G(q) considerando los valores siguientes para :

66

PID estable en el espacio articular

Figura 3.5: Respuesta al escaln unitario utilizando un controlador PD

2
2
M11 (q) = m1 lc1
+ m2 l12 + m2 lc2
+ 2m2 l1 lc2 cos(q2 ) + I1 + I2
2
M12 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M21 (q) = m2 lc2
+ m2 l1 lc2 cos(q2 ) + I2
2
M22 (q) = m2 lc2
+ I2

C11 (q; q)
_ =

m2 l1 lc2 sen(q2 )q_2

C12 (q; q)
_ =

m2 l1 lc2 sen(q2 )[q_1 + q_2 ]

C21 (q; q)
_ = m2 l1 lc2 sen(q2 )q_1
C22 (q; q)
_ = 0
g1 (q) = [m1 lc1 + m2 l1 ]gsen(q1 ) + m2 glc2 sen(q1 + q2 )
g2 (q) = m2 glc2 sen(q1 + q2 )
con m1 = m2 = 1kg; l1 = l2 = 30cm ) lc1 = lc2 = 15cm; este comportamiento se puede

observar en la Figura 3.6.

Finalmente utilizamos el mtodo de control propuesto u = P ID0 + G(q) = P ID1 Los


resultados de las diferentes leyes de control para la primer articulacin en la Figura 3.7 nos

3.6 Conclusiones

67

Figura 3.6: Respuesta del Controlador PD mas trmino de gravedad (PD+G)

muestran que es posible alcanzar la referencia escaln unitario bajo la premisa de utilizar un
controlador que garantice la estabilidad asinttica semiglobal.

3.6.

Conclusiones

En este apartado de la presente tesis podemos observar que al aplicar una ley de control
clsica P D al robot de dos grados de libertad no se alcanza la referencia al escaln unitario,
por otro lado al adicionar un trmino de gravedad al controlador P D, es decir; aplicar una ley
de control u = P D + G(q) provoca en la dinmica del controlador incertidumbres difciles
de estabilizar debido a la inercia que se gana en el movimiento del robot, para corregir
este problema se utiliza un controlador lineal clsico P ID sobre un robot manipulador,
la contribucin terica en este apartado es que las condiciones de estabilidad semiglobal
asinttica son ms sencillas de obtener respecto a otros trabajos y estas condiciones nos
permiten obtener un mtodo explcito para la eleccin de ganancias P ID. Entonces las
aportaciones tcnicas de esta seccin del presente trabajo de tesis es que el mtodo sistemtico
de ajuste para controladores P ID propuesto esta basado en un anlisis de estabilidad, el

68

PID estable en el espacio articular

Figura 3.7: Comparacin entre distintos mtodos de ajuste para controladores PID

cul al aplicarse a cualquier planta en lazo cerrado garantiza su estabilidad.

Captulo 4
Controlador neuronal PID
4.1.

Introduccin

Los controladores Proporcional Integral y Derivativo (PID) son usados ampliamente en


robots manipuladores [31]. Cuando de desconoce la dinmica del robot un controlador PID
puede ser el mejor controlador puesto que este es libre de modelo y sus parmetros pueden
ajustarse relativamente fcil e independientemente [59]. Con frecuencia un integrador en un
controlador PID reduce el ancho de banda del sistema en lazo cerrado, con el n de eliminar
el error en estado estable causado por las incertidumbres y el ruido se puede aumentar la
ganancia del integrador, esto nos permite tener un estado deseado sin afectar la estabilidad. Por tales razones algunos robots solo utilizan controladores con accin Proporcional
Derivativa (PD) o PID con ganancias integrales pequeas [40].
Es bien sabido que un controlador PD puede garantizar la estabilidad de un robot manipulador para el caso de regulacin. Con frecuencia la estabilidad asinttica no puede alcanzarce
cuando la dinmica del manipulador contiene vectores de par gravitacional y de friccin. Desde el punto de vista del control, el error en estado estable puede eliminarse introduciendo
una componente integral al controlador PD hacindolo ahora como un controlador PID. A
n de asegurar una estabilidad asinttica en los controladores PID con frecuencia se utiliza
un mtodo para transformarlo de lineal a no lineal. Por ejemplo; en la trabajo de Arimoto

70

Controlador neuronal PID

et al [4]; En el trabajo de Sun et al [60] el trmino integral entra en saturacin mediante una
funcin no lineal; Respecto a la saturacin de entrada podemos consultar el trabajo de [2];
En otros trabajos como el de Ortega se agrega un trmino para el ltrado de la posicin [49];
Por su parte en los trabajos de [51] y [16] se combinaron tcnicas de control neuronal con las
tcnicas de control PID clsico. Solo pocos investigadores han trabajado con controladores
PID lineales. La estabilidad de controladores lineales PID fue probada en el trabajo [54],
donde la dinmica del robot fue reescrita en un acoplador lineal y un sistema no lineal, por
su parte Kelly [35] demostr la estabilidad asinttica del controlador PID bajo condiciones
de ganacias del controlador no explcitas.
Un modelo basado en compensador con PID es un mtodo de control alternativo [59],
tal y como el propuesto por compensacin adaptable por gravedad [64], La compensacin
basada en Lyapunov [17], compensacin deseada por gravedad [35], y PD mas medicin
de posicin [50]. Todos necesitan informacin de la estructura y trminos gravitatorios del
robot. Algunos controladores PD no lineales pueden alcanzar la estabilidad asinttica, por
ejemplo el control PD con ganancias variantes en el tiempo [53], control PD con ganancias
no lineales [47] y control PD con compensacin por modos deslizantes [51]. Debido a que
estos controladores son complejos presentan algunas desventajas respecto a los controladores
PID lineales.
Una compensacin inteligente para un control PD no necesita un modelo matemtico,
este es conocido como compensador libre de modelo, dentro de este grupo se encuentran: los
compensadores difusos [43], los controles difusos [23], compensadores neuronales [41] y compensadores neuro-difusos [10][19]. La idea bsica de estos controladores es el uso de un ltro
de error de seguimiento basado en el anlisis de Lyapunov [40]. Para un algoritmo de ajuste
de pesos apropiados son muy similares los mtodos de control adaptable [29], la derivada
de la funcin de Lyapunov es negativa siempre y cuando el error de seguimiento ltrado
esta fuera de una bola de radio

B
;
Kv

aqu B es el lmite superior de todas las incertidumbres

desconocidas, Kv es la derivada de la ganancia en el control PD. Estos controladores neuronales PD son acotados uniformemente y los errores de seguimiento se hacen mas pequeos
conforme aumenta la ganancia Kv : El costo de elegir Kv sucientemente grande es que el

4.2 Estabilidad asinttica semiglobal para un controlador neuronal PID

71

transitorio se vuelve lento. Solo cuando Kv ! 1; el error de seguimiento converge a cero


[22].

Es bien conocido en la literatura que un mtodo simple para decrecer el error de trayectoria es agregando una ganancia intergral, es decir; convertir el controlador neuronal PD
a un controlador neuronal PID. Entonces nos surge una pregunta: por qu no agregar un
integrador en vez de aumentar la ganancia derivada en el control PD neuronal?.
Existen dos enfoques diferentes para combinar el controlador PID con el control inteligente tal y como lo hace el control neuronal. El primer enfoque es que las redes neuronales
son formadas dentro de una estructura PID [14][56][65]. Para una adecuada actualizacin
de leyes, los parmetros de los controladores PID se cambian de manera que el sistema en
lazo cerrado sea estable. La dicultad para implementarlos industrialmente radica que las
ganancias (pesos) de la accin PID son variantes en el tiempo.
El segundo mtodo para las tcnicas de control inteligente es; el ajuste de parmetros de
los controladores PID, tales como: sintonizacin difusa [46], sintonizacin neuronal [26][68]
y sintonizacin experta [33].
Los controladores industriales son PID lineales, sin embargo la estabilidad del sistema en
lazo cerrado no est garantizada. El control PID neural de este trabajo supera las desventajas
anteriores. Se trata de un controlador PID industrial lineal mas un compensador neural. El
principal obstculo de este controlador PID neuronal es difcil anlisis terico de estabilidad.
Incluso para PID lineal, no es fcil de demostrar estabilidad asinttica [35].

4.2.

Estabilidad asinttica semiglobal para un controlador neuronal PID

Consideremos la dinmica de un robot industrial descrita mediante la siguiente forma de


Lagrange:
M (q) q + C q; q q + G (q) + F (q)
_ =u

(4.1)

72

Controlador neuronal PID

donde q 2 Rn representa las posiciones de los eslabones, M (q) es la matriz de inercia,

C (q; q)
_ = fckj g representa la fuerza centrpeta, G (q) es un vector de pares gravitacionales,

F (q)
_ representa la friccin. Todos los trminos M (q) ; C q; q ; G (q) y F (q)
_ son desconocidos. u 2 Rn es la entrada de control y el trmino de la friccin F (q)
_ es representado por
el modelo de friccin de Coulomb siguiente:

(4.2)

F (q)
_ = Kf 1 q_ + Kf 2 tanh (kf 3 q)
_

Donde kf 3 es una constante positiva sucientemente grande tal que tanh (kf 3 q)
_ puede aproximarse a sign (q)
_ ; Kf 1 y Kf 2 son coecientes positivos para este trabajo se utiliza un modelo
simple para representar la friccin similar a los utilizados en [40] y [35],
(4.3)

F (q)
_ = Kf 1 q_

Cuando G (q) y F (q)


_ son desconocidas, podemos utilizar una red neuronal para aproximarlas como:
f q; q = G (q) + F (q)
_
c (q; q);
f^ q; q = W

f q; q = W

(4.4)

(q; q) + (q)

c es el peso estimado,
Donde W es una constante de pesos desconocida, W

q; q

es la

aproximacin neuronal del error,

es una funcin de activacin, aqu usamos una funcin

Gausiana tal que satisfaga (q; q)

0.

Cuando la velocidad en la articulacin q_ no esta disponible, podemos usar la velocidad


del observador para aproximarla, lo cual sera discutido posteriormente. Esta red lineal en los
parmetros es una red neuronal multicapa simple. De acuerdo a la teora de aproximacin
de funciones, la funcin suave f q; q

puede aproximarse por una red neuronal multicapa

con una capa oculta con sus respectivos pesos y algunas neuronas ocultas.
h i
h i
c (V^ q q ); f (q) = W (V q q ) +
f^ q; q = W
q; q
c 2 Rn
Donde W

; V^ 2 Rm

(4.5)

; m es el nmero de nodos ocultos, V^ es el peso de la capa

oculta. A n de simplicar el anlisis terico, primero utilizaremos una red lineal en los

4.2 Estabilidad asinttica semiglobal para un controlador neuronal PID

73

parmetros (4.4), posteriormente mostraremos que la red neuronal multicapa (4.5) puede
aplicarse bien al control de robots manipuladores. La dinmica de robots (4.1) tiene algunas
propiedades estandar [59] las cuales pueden usarse para demostrar estabilidad.
P1. La matriz de inercia M (q) es simtrica y denida positiva:
0<
Donde

fM g y

fM (q)g

kM k

fM (q)g

>0

(4.6)

fM g son los valores propios mximo y mnimo de la matriz M:

P2. Para la matriz Centrpeta y de Coriolis C (q; q)


_ ; existe un nmero kc > 0 tal que:
kc kqk
_ 2;

kC (q; q)
_ qk
_
y M_ (q)

(4.7)

kc > 0

2C (q; q)
_ es antisimtrica, es decir;.
h
i
xT M_ (q) 2C (q; q)
_ x=0

(4.8)

M_ (q) = C (q; q)
_ + C (q; q)
_T

(4.9)

por lo tanto:

P3. La aproximacin neuronal del error


k (x)

q; q es Lipschitz sobre q y q
k kx

(y)k

(4.10)

yk

De la red neuronal lineal en los parmetros (4.4) podemos aproximarla por:


G (q) + F (q)
_ =W

(q; q) +

(4.11)

q; q

Donde G (q) y F (q)


_ satisfacen la condicin de Lipschitz P3.
A n de simplicar los clculos podemos utilizar un modelo simple para la friccin de la
R
forma (4.3), la mnima cota de
(q) dq puede estimarse como:
Z t
Z t
Z t
Z t
q; q dq =
G (q) dq +
F (q)
_ dq
W (q)dq
(4.12)
0

Donde U (qt ) es la energa potencial del robot,


Gausiana, y se satisface que W
Z t
0

@U
@q

= G (q) : Y el trmino ( ) es una funcin

(q) > 0:para U (qt ) > 0


q; q dq > Kf 1 qt

Kf 1 q 0

1p
W
2

74

Controlador neuronal PID

Donde

Rt

1p
2

erf (q). Cuando el espacio de trabajo (el conjunto de puntos alcanzables


Rt
por el robot), m n fqt g podemos estimar. Y denimos la mnima cota 0 (q) dq como:
0

(q) =

k = Kf 1 m n fqt g

1p
W
2

Kf 1 q0

(4.13)

Dado una constante de posicin deseada q d 2 Rn ; el objetivo del control del robot (4.1)

es disear un par de entrada u en tal que la regulacin del error


q~ = q d

(4.14)

Entonces q~ ! 0 y q~ ! 0 cuando las condiciones iniciales son arbitrariamente grandes en el


dominio de atraccin.

Por otro lado sabemos que el control industrial PID tiene la siguiente estructura:
Z t
u = Kp q~ + Ki
q~ ( ) d + Kd q~
(4.15)
0

Donde Kp ; Ki y Kd son las ganancias proporcional, integral y derivativa del controlador PID.
Cuando desconocemos la dinmica f q; q

en (4.4), una forma de garantizar la esta-

bilidad asinttica es incrementando la ganancia integral Ki . Esto puede causar un sobrepaso,


mala estabilidad. Una compensacin por modelo libre es una solucin alternativa, donde f (q)
es una red neuronal como en (4.4). La ley de control normal PD es [40] :
u = Kp q~ + Kd q~ + f^

(4.16)

c (q; q): Con el error ltrado r = q~ + q~; (4.16) se convierte en:


Donde f^ q; q = W
u = Kv r + f^

(4.17)

El control (4.17) evita el problema del integrador en (4.15). A diferencia del controlador PID
industrial, estos no pueden alcanzar la estabilidad asinttica. La condicin de estabilidad
para un controlador PID neuronal (4.16) es que krk >

B
;
Kv

B como constante [42]. Con el n

de disminuir krk, Kd tiene que crecer. Esto provoca un problema de ajuste de tiempo. La
estabilidad asinttica (r ! 0) necesita que Kv ! 1:

4.2 Estabilidad asinttica semiglobal para un controlador neuronal PID

75

En este trabajo se agrega un integrador dentro del control PID neuronal (4.16), este es
muy similar a los controladores industriales PID (4.15),
Z t
u = Kp q~ + Kd q~ + Ki
q~ ( ) d + f^

(4.18)

Para el caso de regulacin q_d = 0; q~ =

q;
_ la ley de control PID puede expresarse

mediante las siguientes ecuaciones:


u = Kp q~
_ = Ki q~;

c (q; q)
Kd q_ + + W
(0) =

(4.19)

Aqu necesitamos de la parte del control PID (4.19) este desacoplada, es decir; Kp ; Ki y Kd
son denidas positivas. El sistema en lazo cerrado del robot (4.1) es:
M (q) q + C (q; q)
_ q_ + f~ q; q
(4.20)

= Kp q~ Kd q_ +
_ = Ki q~
Donde f~ = f

f^
f~ = W

~ =W
Con W

(q) + (q)

c (q) = W
~ (q) + (q)
W

(4.21)

c: De modo que podemos expresar el sistema en lazo cerrado en su forma


W

matricial siguiente:

6
7 6
d 6
6 q~ 7 = 6
6
dt 4 5 6
4 qd + M
q~
El punto de equilibrio de (4.22) es
d

q = 0; el punto de equilibrio es
qd :

Ki q~
q_
0
~ (q) +
C q_ + W
1@
Kp q~ + Kd q_

q; q

7
7
1 7
7
7
A 5

(4.22)

; q~; q~ = [ ; 0; 0] : Donde el punto de equilibrio q = q d y


q d ; 0; 0 : Vamos a simplicar el punto

q d ; 0 como

76

Controlador neuronal PID


Para mover el punto de equilibrio al origen, denamos:
~=

qd

(4.23)

Entonces la ecuacin nal en lazo cerrado se convierte en:


~ (q; q) +
M (q) q + C (q; q)
_ q_ + W
= Kp q~ Kd q_ + ~ + q d

q; q
(4.24)

~ = Ki q~
El siguiente teorema nos permite inducir un anlisis de estabilidad para el control neuronal PID. Este teorema nos da las condiciones para elegir las ganancias del controlador PID
as como las condiciones para entrenar el compensador neuronal para la obtencin de los
pesos (4.19). Adems de quenos da las condiciones para que el control neuronal PID (4.19)
lleve el error q~ a cero.
Teorema 4.1 Dada la dinmica del Robot (4.1) controlada por el control neuronal PID
(4.19), el sistema en lazo cerrado (4.24) es semiglobalmente asintticamente estable en el
T

punto de equilibrio x =

Donde

m (M ) m (Kp )

; q~; q~

(Kp )

(Ki )

(Kd )

= 0; donde las ganancias satisfacen:


3
k
2
m (Kp )

(4.25)

M (M )

(M )

; k satisface (4.10), y el vector de pesos de la red neuronal (4.4)

es ajustado por
^ =
W
Donde

Kw (q; q) (q_ + q~)T

es una constante de diseo positiva y satisface:


q
1
(M ) m (Kp )
3 m
M

(M )

Ki

(4.26)

3
1

(Kp )

(4.27)

4.2 Estabilidad asinttica semiglobal para un controlador neuronal PID

77

Demostracin. Ver el apndice.


Comentario 4.1 Para el anlisis de estabilidad, observamos que las matrices de ganacias
del control neuronal PID (4.19) pueden elegirse directamente de las condiciones (4.25). El
procedimiento de ajuste de los parmetros del controlador PID es ms simple que en los trabajos de [2][4][35][47][54]. No necesita informacin del modelo. Las cotas superior e inferior
de las ganancias PID necesitan el mximo valor propio de la matriz M en (4.25), esto puede
estimarse sin calcular M: Para un robot con articulaciones solamente de revoluta tenemos
[59]:
M

(M )

n max jmij j

i;j

Donde mij representa el ij-simo elemento de M; M 2 Rn

: Una constante

(4.28)
puede selec-

cionarse tal que sea micho mas grande que todos los elementos.
Comentario 4.2 La diferencia principal entre el control neuronal PID respecto a otros con-

troladores es que la condicin de estabilidad puede cambiarse, requerimos el error de regulacin:


k~
q k < k1

(Ki )

(Kp )

(4.29)

Los otros controladores neuronales PID necesitan:


k2
k~
qk >
(4.30)
Kv
Donde k1 y k2 son constantes positivas. Obviamente, si la condicin inicial no empeora y
satisface (4.29), (4.29) siempre se satisface y k~
q k decrecer a cero. Pero (4.30) no se puede
cumplir cuando k~
q k se hace pequea, de modo que Kv tendr que crecer.

Comentario 4.3 Si la funcin desconocida f (q) es estimada por una red neuronal multicapa
(4.5). Entonces el error (4.21) se transforma en:
h i
h i
c (V^ q q )
f~ = f f^ = W (V q q ) +
q; q
W
h i
h i
h i
~
^
^
= W (V q q ) W (V q q ) + W (V q q ) +
q; q
h i
h i
~ (V^ q q ) + W 0 V~ q q + 1 +
=W
q; q
h
h i
h ii
h i
~
c 0 V~ q q + 1 q; q
=W
(V^ q q ) + 0 V~ q q + W

(4.31)

78

Controlador neuronal PID

Donde

(q) =

q; q ;

es la aproximacin de Taylor del error. Por otro lado la

ecuacin en lazo cerrado(4.24) se convierte en:


n
h i
~
M (q) q + C (q; q)
_ q_ + W
(V^ q q ) +
h i
c 0 V~ q q + 1 q; q
+W
= Kp q~ Kd q_ + ~ + q d

h io
V qq

0~

(4.32)

~ = Ki q~
Si la funcin de Lyapunov (3.37) se considera como:
1
Vm = V + tr Ve T Kv 1 Ve
2

(4.33)

entonces la derivada de (4.33) es:

h i
~ (q q q )
V m = V_ q_T W
h ii
h
h i
0~
T ~
^
+q_ W (V q q ) + V q q + tr Ve T Kv 1 Ve

(4.34)

Y si la regla de entrenamiento (4.26) se cambia a:


c=
W
Vb =

Kw

h i
(V^ q q ) +

c 0 q (q_ + q~)
Kv W

h io
V q q (q_ + q~)T

0~

(4.35)

Por lo que el Teorema 1 se cumple.

Un problema comn del controlador lineal PID (4.18) es la desaparicin de la integral,


donde la tasa de cambio de la integral es mucho mayor que la velocidad del sistema. La salida
del integrador puede sobrepasar el lmite de saturacin del actuador. El actuador puede
operar a este lmite, sin importar la salida del proceso. Esto signica que el sistema funciona
como un lazo abierto en lugar de un lazo retroalimentado. Las soluciones para la prdida
de la integral han sido clasicado principalmente en dos tipos [66]: Integracin condicional
y clculo iterativo. Pero se ha demostrado que ninguno de los mtodos proporciona un buen

4.2 Estabilidad asinttica semiglobal para un controlador neuronal PID

79

ndice de diseo en un amplio espectro de procesos [6]. Para este trabajo se utilizar el
algoritmo de integracin condicional. El trmino integral esta limitado a seleccionar el valor:
Z t
u = Kp q~ + Kd q~ + sat Ki
q~ ( ) d ; max + f^
(4.36)
0

Donde sat [x;

si kxk <

max

: max es un valor preestablecido al trmino


si kxk
max
integral cuando el controlador entra en saturacin. Este enfoque tambin es conocido como
max ]

max

precarga [57]. Ahora el controlador lineal PID se vuelve un controlador PID no lineal. La
estabilidad semiglobal asinttica ha sido anlizada por [2]. Cuando
de todos los actuadores de las articulaciones,
ks

max

1: Una condicin necesaria es que:


3G;

max

max

es el mximo par

= ks maxi umax
; umax
= max (jui j) ;
i
i

kG (q)k

Donde G (q) es el par gravitacional del robot (4.1), G es la cota superior de G (q) : ks es un
factor de diseo en el caso en el que no todos los trminos del controlador PID estn sujetos
a saturacin (4.36), ks puede seleccionarse como ks = 41 :
Siguiendo el proceso de (4.4) a (4.13), El controlador neuronal PID contra la prdida de
integral (4.36) requiere que se cumpla la siguiente condicin:
max

(q; q) +
W

Donde

3
q; q

(q; q) +

(4.37)
q; q

es la cota superior del estimador neuronal, W ; (q; q) y

q; q son denidas en

(4.4).
Podemos ver que la primer condicin adicional para el control neuronal para la prdida
de integral es que el estimador neuronal debe estar acotado. Mientras que el controlador
neuronal PID solamente necesita que el estimador neuronal satisfaga la condicin de Lipschitz
(4.10).

80

Controlador neuronal PID


(o
Cuando umax
i

max )

es un requerimiento fsico para el actuador es decir; no es un

parmetro de diseo. A n de satisfacer la condicin (4.37), podemos hacer

tan pequea

como sea posible. Una buena estructura para el estimador neuronal puede hacer que el
trmino W

(q; q) sea tan pequeo. Existen varios mtodos que pueden utilizarse para

encontrar una buena red neuronal, tales como algoritmos genticos [5] y [62]. Adems de
la estructura de optimizacin y condiciones iniciales para el algoritmo de entrenamiento
tipo gradiente (4.26) tambin se afecta la cota superior del estimador neuronal : Donde
^ y V^ en (4.35) no afectan la propiedad de estabilidad,
las condiciones iniciales para W
^ (0) y V^ (0). Si dejamos que
Disearemos un mtodo para encontrar el mejor valor para W
^ (0) = W0 ; V (0) = V0 ; el algoritmo (4.35) puede hacer la identicacin del error, es decir;
W
^ (t) y V^ (t) harn la identicacin del error tan pequeo que de los valores de W0 y V0 :
W
^ (0) y V^ (0) son seleccionados de acuerdo a los siguientes pasos:
Donde W
^ (0) = W0 ; V^ (0) = V0 :
1. Iniciar con alguna condicin inicial para W
2. Realizar el entrenamiento con (4.35) hasta T0
^ (T0 ) y V^ (T0 )
3. Si en el error de regulacin se tiene que k~
q (T0 )k < k~
q (0)k ; Dejamos a W
^ (0) y V^ (0), es decir; W
^ (0) = W
^ (T0 ) ; V^ (0) = V^ (T0 ) ; vamos al paso
como nuevos W
dos y repetimos el proceso de entrenamiento.
^ (T0 ) y V^ (T0 )
k~
q (0)k, paramos el proceso de identicacin, ahora W
^ (0) y V^ (0).
son los valores nales para W

4. Ahora si k~
q (T0 )k

4.3.

Control Neuronal PID con velocidades no medibles

El controlador PID (4.19) utiliza las velocidades en las articulaciones q:


_ En contraste con
el alto grado de precisin de las mediciones de posicin por encoders pticos, las mediciones
de velocidad por tacmetro son muy imprecisas, especialmente para ciertos intervalos de

4.3 Control Neuronal PID con velocidades no medibles

81

velocidad. Una opcin en el diseo de controladores PID para mediciones de velocidad es


proponer observadores de estado para estimar la velocidad. El observador mas simple puede
ser el de primer orden y el ltro de posicin relativa cero [59]
i

Donde

(s) =

bi s
qi (s) ;
s + ai

i=1

(4.38)

(s) es una estimacin de q_i ; ai y bi son los elementos sobre la diagonal principal de

las matrices A y B, es decir; A = diag fai g, B = diag fbi g ; ai > 0; bi > 0: La funcin de

transferencia (4.38) puede representarse por:


(
x_ = A (x + Bq)
e
q_ = x + Bq

(4.39)

Del controlador PID lineal (4.19) tenemos que:


u = Kp q~
_ = Ki q~;
x_ =

c (q)
Kd + + W
(0) =

A (x + Bq)

(4.40)

= x + Bq
Donde Kp ; Ki y Kd son matrices diagonales denidas positivas, ai y bi en (4.38) son constantes positivas.
Por otro lado el sistema en lazo cerrado del robot (4.1) es:
3
2
2 3
Ki q~
7
6
7
7 6
A
+
B
q
_
d 6
6 7=6
"
# 7
6
~ (q)
dt 4 5 4
C (q; q)
_ q_ W
(q) 7
5
1
M
q_
+Kp q~ Kd + ~ + q d
h
i
Donde el punto de equilibrio de (4.41) es ~; ; q_ = [0; 0; 0] :

(4.41)

El siguiente teorema nos proporciona la estabilidad asinttica del controlador neuronal

PID con el observador de velocidad (4.38). Este teorema tambin permite el algoritmo de
entrenamiento para los pesos sinpticos de la red neuronal y el mtodo de seleccin explcita
de las ganancias en el control PID.

82

Controlador neuronal PID


Cuando las velocidades no estn disponibles, la entrada de la red neuronal se convierte

en:
c (q; v)
f^ q; q = W

(4.42)

c (V^ [q; v]
f^ q; q = W

Teorema 4.2 Dada la dinmica del robot (4.1) controlada por el controlador neuronal PID
(4.40), si A y B del observador de velocidad (4.38) satisfacen:
M (A)
2
m (A)

Donde

(Kd )

(B)

1
4

(B

I)

m (B)
M (B)
m (M )
2
M (M )

(Kd )

1
2

(4.43)

(A)

es una constante de diseo positiva, y si las ganancias del control PID (4.40)

satisfacen:
m

1
2

(Kp )
"

(Kp )

M (Ki ) +

k +
+ 1+2
2

(Kd )

(Ki )

Donde k satisface (4.10),

1
M (Kd ) + 2 M (A Ki )
1K + 1
i) 2
M (A
M (Kp )+ (M ) M (M )
2 m (AB 1 I) 1

kg + 21

1
M (A BKi )

(4.44)
M (A)

(Kp )

(M ) es el nmero de condicin de M; y los pesos de la red

neuronal son ajustados por:


^ =
W

Kw (q; )

q~ +

+B

( _ + Av)

(4.45)

Entonces el sistema en lazo cerrado (4.41) es localmente asintticamente estable en el punto


de equilibrio:
T

q d ; q~; q~

x=

(4.46)

=0

En el dominio de atraccin:
k~
qk

(M )
kc

(B

I)

1
2

(A) +

k k

(4.47)

4.4 Resultados Experimentales

83

Comentario 4.4 Las condiciones (4.43) y (4.44) nos dicen como elegir las ganancias del
controlador PID. La primera condicin de (4.44):
m

(Kp )
"

(Ki ) +

1
M (A BKi ) +

+2

Y la tercer condicin de (4.44)

M
m

(Kd ) +
(Kp )

1
2
3

1+2
2

kg

1
2

(4.48)

(Kp )

(A 1 Ki )

(Ki ) son compatibles. Y pueden establecerse

cuando Ki no es sucientemente grande. La segunda condicin de (4.44) y la tercer condicin


de (4.43) no son directamente compatibles. Primero tomemos

tan pequea como sea posible,

y Kp tan grande como sea posible. Tal que Ki no sea grande. Estas condiciones son razonables
para nuestro control real. Si seleccionamos B = A + I; de la tercer condicin de (4.43),
1
:
2

1>

La segunda condicin de (4.44) necesita que


1
2

y una

pequea, tal que

A ( A + I)

m
1

(AB

I) >

1
;
2

entonces existe

I > 21 . Despus de que A y B

son seleccionadas, podemos usar la segunda condicin de (4.44) para seleccionar Kd :


En esta seccin el algoritmo de control neuronal PID tiene la estructura mostrada den la
Figura 4.1.

4.4.

Resultados Experimentales

En esta seccin aplicaremos el controlador PID neuronal a un robot de dos grados de


libertad sobre la misma plataforma del capitulo 3. Las propiedades del Robot de dos grados
de libertad se muestran en la Tabla 1.
Tabla 4.1. Parmetros del Robot de dos grados de libertad
a rtic u la c i n

m a sa (K g )

C e ntro o f M a sa (m )

L o n g itu d (m )

O se t d e la a rtic u la c i n (m )

0.15

0.3

0.3

0.15

0.3

Los dos teoremas mencionados en este capitulo del presente trabajo son sucientes para
elegir los mnimos valores de las ganancias proporcional y derivativa, as como la mxima

84

Controlador neuronal PID

Figura 4.1: Controlador neuronal PID

ganancia integral. Vamos a utilizar los valores de la tabla 1 y (4.28) para estimar los valores
mximos y mnimos para los valores propios de la matriz de inercia M (q) ; y kg en (4.10).
Seleccionemos
3

(M ) < 3;

(Kp ) se satisface

(M ) > 1; kg = 10: Si elegimos

M (Ki )
m (Kp )

= 0;08; A es elegida como A = diag(30);

tal que

7
;
12

(Ki )

tal que B =

diag(17;58): Las velocidades de las articulaciones son estimadas por los ltros:
e
q_ (s) =

bs
18s
q (s) =
q (s)
s+a
s + 30

(4.49)

Las ganancias PID son elegidas como:


Kp = diag [150; 150]
Ki = diag [2; 1]

(4.50)

Kd = diag [330; 330]


Tal que las condiciones del Teorema 2 se satisfacen. Los elementos iniciales de la matriz de
pesos son W 2 R2

son elegidos aleatoriamente de

1 a 1: La funcin de activacin de

4.4 Resultados Experimentales

85

(4.26) es una funcin Gausiana.


= exp

(qi

mi )2 =100 ;

i = 1; 2

(4.51)

Donde mi es seleccionada aleatoriamente de 0 a 2: Los pesos son actualizados por (4.45) con
Kw = 10:
Para corroborar los datos experimentales, primero se realizaron las simulaciones correspondientes a la respuesta escaln unitario del Robot manipulador utilizando las leyes de
control clsicas PD y PID observando los resultados de la Figura 4.2.

Figura 4.2: Respuesta al escaln unitario de las leyes de control clsicas PD y PID del robot
de dos grados de libertad

Posteriormente se implementaron estas leyes de control clsico a su versin por compesacin por gravedad y controlador neuronal PD y PID respectivamente cuyos resultados se
muestran en la Figura 4.3.
Finalmente estos resultados del controlador neuronal PID se muestran en la Figura 4.4,
indicado como ontrol Neuronal PID". Vamos a comparar nuestro controlador neuronal con
otros controladores utilizados sobre Robots. Primero utilizamos un controlador lineal PID
(4.15), las ganancias del controlador PID son las mismas que en (4.50), este resultado se

86

Controlador neuronal PID

Figura 4.3: Seguimiento de trayectoria del Robot del Controlador Neuronal PD y Controlador
Neuronal PID al escaln unitario

presenta en la Figura 4.4. Dado que el error en estado estable es demasiado grande, entonces
la ganancia integral es seleccionada como:
Ki = diag [50; 20]

(4.52)

El resultado del control se muestra en la Figura 4.4 indicada como Controlador lineal PD,
cabe mencionar que si hay un incremento de Ki entonces el sistema en lazo cerrado es
inestable. Entonces utilizamos el compensador neuronal para reemplazar al integrador. A n
de disminuir el error en estado estable las ganancias derivativas pueden decrecer como:
Kd = diag [970; 900]

(4.53)

El resultado de este controlador se muestra en la Figura 4.4 indicada como "PD Neuronal".
donde observamos que la respuesta se hace lenta.
Claramente el controlador neuronal PID puede compensar incetidumbres, tales como:
friccin, pares gravitacionales y algunas otras incertidumbres del robot. Como el controlador
lineal PID no tiene compensacin tiene que incrementar su ganancia integral para cancelar
las incertidumbres.

4.5 Conclusiones

87

Figura 4.4: Comparacin de diferentes controladores aplicados al robot de dos grados de


libertad

La estructura del compensador neuronal es muy importante, ya que el nmero de nodos


ocultos m en (4.5) constituye un problema estructural de la red neuronal. Es bien sabido
que al incrementar la dimensin de las capas ocultas se puede ocasionar un problema de
superposicin y tener un costo computacional elevado. La mejor dimensin a utilizar, es un
problema abierto sobre el tema de investigacin de redes neuronales.

4.5.

Conclusiones

El controlador neuronal PID propuesto en esta seccin resuelve el problema de eleccin


de ganancias grandes integral y derivativa en el controlador lineal PID y el controlador neuronal PD. Se pueden alcanzar las propiedades de los controladores industriales PID as como
los compensadores neuronales probando estabilidad asinttica semiglobal. Cuando las velocidades de las articulaciones de los robots manipuladores no estn disponibles, se asegura
la estabilidad asinttica con el ltro de posicin. Las condiciones de estabilidad nos dan un

88

Controlador neuronal PID

mtodo explcito para seleccionar las ganancias PID. Al aplicar nuestro controlador neuronal al robot de dos grados de libertad se valida la ley de control neuronal PID propuesta
tericamente.

Captulo 5
Nuevo mtodo de Sintonizacin de
controladores PID
5.1.

Introduccin

Como se ha mencionado en los captulos anteriores los controladores PID (proporcionalintegral-derivativo) se utilizan ampliamente en robots manipuladores industriales. Ya sabemos que en ausencia del conocimiento del robot el control PID puede ser el mejor controlador,
ya que es libre de modelo, y sus parmetros se pueden ajustar fcilmente y por separado [3][6].
Las ventajas del controlador PID sobre los otros es que estos son simples y tienen signicados
fsicos muy claros. Sin embargo, las ganancias del controlador PID deben ser sintonizados
para garantizar un buen desempeo, as como, aumento de tiempo, sobreimpulso, tiempo de
establecimiento, y el error de estado estacionario.
Desde los orgenes del controlador lineal PID, el principal estudio sobre la sintonizacin
PID se enfocado en sistemas lineales [48]. Donde bsicamente el proceso de ajuste de ganancias de PID puede clasicarse en cinco categoras:
1. Modelo basado en sintonizacin analtica. De acuerdo con las relaciones analticas entre
el modelo y el objetivo de control, las ganancias de PID se calculan a partir de algunas
ecuaciones algebraicas [8][11][28].

90

Nuevo mtodo de Sintonizacin de controladores PID


2. Mtodos heursticos. Estos mtodos combinan varias tcnicas, tales como la experiencia
prctica [73][12], sintonizacin manual [6], e inteligencia articial [60][40][32].
3. Mtodos en dominio de la frecuencia. Las Frecuencias Caractersticas son fciles de
obtener para sistemas lineales. Cuando el proceso es controlado por un sistema lineal,
el controlador PID puede ser sintonizado en dominio de frecuencia [57].
4. Mtodos de optimizacin. El Controlador PID se transforma en una forma especial de
control ptimo. El problema de sintonizacin del PID se convierte en un problema de
optimizacin numrica fuera de lnea [39].
5. Mtodos Adaptables. Estn basados en tcnicas de control adaptable e identicacin
paramtrica en lnea, las ganancias del controlador PID estn sintonizados como un
proceso de ajuste automtico [67].
El problema de los mtodos de sintonizacin anteriores es que no se pueden aplicar

directamente en controladores PID en control de robots ya que la dinmica del robot es no


lineal.
Por otro lado el problema de Sintonizacin de controladores PID en el control de robots
se pueden agrupar en:
1. Mtodos inteligentes. Las tcnicas inteligentes, tales como lgica difusa [60],redes neuronales [40] y algoritmos genticos [32] se utilizan para ajustar las ganancias del controlador PID de este modo los controladores nales ya no son PID lineales.
2. Control por Impedancia. La dinmica inversa se aplica para convertir el robot en un
sistema lineal, La idea de la impedancia mecnica se aplic a sintonizar ganancias del
controlador PID [27]. Las ganancias del PID pueden ajustarse en tiempo discreto por
aproximacin de la dinmica inversa [8].
3. Enfoque de Lyapunov. El enfoque de Lyapunov se utiliz para ajustar el controlador
PID de manera que el controlador de robot puede seguir un control de linealizacin [9].

5.1 Introduccin

91

Los mtodos anteriores necesitan un completo conocimiento del modelo del robot, es muy
comn que se pierdan los signicados fsicos de las ganancias PID en estos mtodos, ya que
estos controladores PID no utilizan las propiedades de los robots.
En el problema de sintonizacin en control PID para robots existen algunas dicultades
de diseo tales como:
El par en cada articulacin afecta a las otras y estos efectos presentan grandes no
linealidades.
El exceso de ganancias simultneas para el problema de sintonizacin en robots mediante los mtodos clsicos [73] o [12]. Por ejemplo, un robot de seis grados de libertad
tiene 18 ganancias a sincronizar. Cuando se sintoniza una ganancia, se requiere el ajuste
de las otras 17 debido al acoplamiento dinmico..
Algunos mtodos no lineales, tales como anlisis de estabilidad, nos permiten obtener
cotas superiores e inferiores para las ganancias del controlador PID. Sin embargo estos
mtodos no garantizan condiciones de desempeo deseado.
En este capitulo del presente trabajo de tesis se utilizan las siguientes tres condiciones
para el control de robots con el n de obtener un mtodo de ajuste de forma sistemtica:
1. En el caso de regulacin, un robot puede ser estabilizado mediante cualquier controlador
PD siempre y cuando las ganancias del controlador PD sean positivas.
2. El comportamiento en lazo cerrado del control PID es similar al comportamiento de
un sistema lineal.
3. El control del par en cada junta es independiente de la dinmica del robot.
El mtodo de ajuste propuesto para este trabajo se muestra en la Figura 5.1. Posteriormente se explicar como funciona cada bloque, tambin se aplicar este mtodo en un brazo
robot de dos grados de libertad. Los resultados experimentales muestran que este mtodo de
sintonizacin PID es simple, sistemtico y ecaz en el control de Robots.

92

Nuevo mtodo de Sintonizacin de controladores PID

Figura 5.1: Esquema de Ajuste PID

5.2.

Sintonizacin PID en lazo cerrado

La dinmica de un robot manipulador de n eslabones esta dada por [59]


(5.1)

M (q) q + C q; q q + g (q) + f q =

Donde q 2 <n representa las posiciones en los eslabones, q 2 <n es la velocidad en los

eslabones, M (q) 2 <n

es la matriz de inercia, C(q; q) 2 <n

es la matriz de fuerza

centrpeta y de Coriolis, g(q) 2 <n representa el vector de fuerzas gravitatorias, f 2 Rn

representa los trminos de friccin de Coulomb y

2 <n es un vector de entradas de control.

Dado que la dinmica del robot no es estable en lazo abierto, es imposible enviar un
comando que ajuste las ganancias del controlador PID para las articulaciones. En este trabajo
se utiliza el siguiente mtodo de sintonizacin en lazo cerrado.
De modo que el error de regulacin del la ley de control PD (3.2) esta acotada en una
bola de radio d. Sin embargo la propiedad de estabilidad no es suciente para el control de
robots. Ya que el error en estado estable causado por los trminos de friccin y gravedad

5.2 Sintonizacin PID en lazo cerrado

93

puede ser demasiado grande. Por otro lado la derivada de la ganancia Kd tiene que crecer
para poder disminuir, de este modo el sistema en lazo cerrado se vuelve demasiado lento.
Este asentamiento de tiempo no nos permite incrementar Kd como queramos.
En este trabajo usamos la propiedad de estabilidad del control PD (3.2) para estabilizar
el robot inestable en lazo abierto (5.1). Para alguna Kd ; cuando Kd

K1 > 0 (K1 > 0); el

siguiente sistema en lazo cerrado es estable:


M (q) q + C q; q q + g (q) + f q = P D1

(5.2)

En la dinmica de manipuladores con frecuencia suele utilizarse un vector de pares gravitacionales g (q) : Para lo cul la compensacin es un mtodo muy popular para modicar el
control PD (3.2). De este modo un nuevo control PD puede ser:
(5.3)

= P D1 + g^ (q)

Donde g (q) = g^ (q) + g~ (q) ; g^ (q) y g~ (q) son el estimado de gravedad y el error aproximado
respectivamente. En este caso (3.5) la funcin de Lyapunov se convierte en:
q_T (Kd

V PD

K1 ) q_ + d1

Donde d1 es el lmite superior de:


(~
g + f ) ; (~
g + f )T K1 1 (~
g + f)

d1

Normalmente d1 << d; dado que g~ es el estimado del error de gravedad. Entonces el sistema
estable en lazo cerrado (5.2) se transforma en:
M (q) q + C q; q q + g (q) + f q = P D1 + g^

(5.4)

Dado que el control PD (5.3) no puede garantizar que el error en estado estable se
haga cero. Podemos agregar un trmino integrador, el cul es una herramienta efectiva para
eliminar el error en estado estable. De esta forma el control PD (5.3) se transforma en la ley
de control PID siguiente:
= Kp q~ + Ki

q~ ( ) d + Kd

d~
q
= P ID2
dt

(5.5)

94

Nuevo mtodo de Sintonizacin de controladores PID

Donde Kp ; Ki y Kd son las ganancias proporcional, integral y derivativa respectivamente del


controlador PID. La ganancia del integrador Ki tiene que incrementar cuando el error en
estado estable es grande, esto ocasiona un tiempo de asentamiento grande y lo hace menos
robusto.
Ahora mostraremos que en lazo cerrado PD1 de (3.2), g^ (q) en (5.3) y PID2 en (5.5)
pueden ajustarse independientemente. De (5.4) sabemos que el sistema en lazo cerrado con
PD1 es estable. Cuando aplicamos un control PID al sistema en lazo cerrado (5.4), este se
convierte en:
M (q) q + C q; q q + g~ (q) + f q

P D1 = P ID2

(5.6)

Cuando aplicamos una compensacin por gravedad al sistema en lazo cerrado (5.4), este se
convierte en:
M (q) q + C q; q q + g (q) + f q

(5.7)

P D1 = g^ (q)

Luego si aplicamos un control PID y la compensacin por gravedad al sistema en lazo cerrado
(5.4) tenemos:
M (q) q + C q; q q + g (q) + f q

P D1 = P ID2 + g^ (q)

(5.8)

De esta forma el control total de par del robot es:


(5.9)

= P ID2 + P D1 + g^ (q)

De las ecuaciones (5.6) a (5.9), podemos ver que el control de par del robot manipulador
es linealmente independiente de la dinmica del robot (5.1). Para el caso general, si ajustamos
controladores PID m veces, estos se pueden expresar como:
M (q) q + C (q; q)
_ q_ + g (q) + f q =

m
X

P IDj + g^ (q)

j=1

Donde:

m
X
j=1

P IDj =

m
X
j=1

Kp;j q~ +

m
X
j=1

Ki;j

q~ ( ) d +

m
X
j=1

Kd;j

d~
q
dt

(5.10)

5.3 Linealizacin del sistema en Lazo Cerrado

95

Vemos que PD1 es un PID especial con Ki = 0: Esta propiedad nos permite iniciar un control
PID con pequeas ganancias, tal que el sistema en lazo cerrado es estable. As podemos usar
alguna otra regla de ajuste para obtener nuevas ganacias PID independientemente. De esta
forma las ganancias nales del controlador PID son la suma de todos los controladores
(ganancias).

5.3.

Linealizacin del sistema en Lazo Cerrado

A pesar de que la dinmica del robot presenta grandes no linealidades el comportamiento


en lazo cerrado con una accin de control PD/PID es similar a la respuesta transitoria de un
sistema lineal. Por otro lado despus de aplicar el control PID, cada junta del robot puede
caracterizarse como un sistema simple entrada simple salida (SISO).
Se pueden utilizar varios mtodos para linealizar el modelo de un robot. Si los trminos
de velocidad (C (q; q)
_ q)
_ y gravedad (g (q)) son despreciados en la dinmica no lineal (5.1).
El sistema resultante es el modelo lineal siguiente [20]
M (q) q = u

(5.11)

Obviamente esta es una sobresimplicacin del modelo y el trmino dependiente de la velocidad C (q; q)
_ q_ que representa las fuerzas centrpetas y de Coriolis puede despreciarse para
pequeas velocidades. As podemos usar el esquema de linealizacin siguiente [21]:
A
q + Bq = u
Donde A = M (q) jq=q0 ; B =

@g(q)
@q

(5.12)

jq=q0 ; q0 es un punto de operacin, pero para algunos

experimentos se puede mostrar que a bajas velocidades el trmino C (q; q)


_ no es cero [63].

Los efectos de la gravedad y velocidad son los principales problemas presentes en el


control de robots, adems de que son de las componentes principales de la dinmica de
estos. Cuando el modelo de un robot es completamente conocido, la expansin en series de
Taylor puede aplicarse en [44] sobre el punto de operacin q0 ;as el modelo no lineal (5.1)
puede aproximarse por:
A
q + Dq_ + Bq =

(5.13)

96

Nuevo mtodo de Sintonizacin de controladores PID

Donde:
A = M (q) jq=q0 ;
@ [g (q) + C (q; q)]
_
jq=q0 ;
B =
@q
@C (q; q)
_
D =
jq=q0
@ q_
En este trabajo podemos utilizar un mtodo de identicacin basado en una linealizacin,
para cada articulacin, un modelo lineal tpico es un sistema de primer orden con retardo
como el presentado a continuacin:
Gp =

Km
e
1 + Tm s

tm s

(5.14)

Cuya respuesta esta caracterizada por tres parmetros, la ganancia de la planta Km ; el


retardo de tiempo tm ; y una constante de tiempo Tm . Estos se determinan trazando una
tangente a la respuesta escaln sobre el punto de inexin sin intersectar el eje del tiempo y
el valor del estado estable.
Algunas veces el modelo de primer orden (5.14) no puede describir la dinmica no lineal
del robot completa. Un modelo razonable para el robot es el usado con series de Taylor de
(5.13). Si escribimos el modelo en trminos del dominio de la frecuencia tenemos:
qi (s)
Km
= 2 2
e
Tm s + 2 m Tm s + 1
i (s)

tm s

(5.15)

Tambin lo podemos expresar en la forma factorizada:


qi (s)
Km
=
e
(1 + Tm1 s) (1 + Tm2 s)
i (s)

tm s

La respuesta a este modelo de segundo orden es similar con movimientos mecnicos. Si existe
un sobre impulso, podemos agregar un cero negativo, de modo que tenemos lo siguiente
(5.15):
qi (s)
Km (1 + Tm3 s)
=
e
(1 + Tm1 s) (1 + Tm2 s)
i (s)

tm s

Las seales de entrada para el ajuste del controlador PID son escalones repetidos.

(5.16)

5.4 Ajuste PD/PID

97

Figura 5.2: Respuesta al escaln de un sistema lineal

5.4.

Ajuste PD/PID

Dado que el robot puede aproximarse por un sistema lineal, algunas reglas de sintonizacin se pueden aplicar algunas reglas de ajuste al sistema en lazo cerrado. Primero
daremos algunas reglas para el ajuste del control PD, cuando cada articulacin puede aproximarse por un sistema de primer orden.

Gp =

Km
e
1 + Tm s

tm s

Aqu Km ; Tm y tm son obtenidas de la Figura 5.2.


La ley de control PID lineal en el dominio del tiempo (5.5) puede transformarse al dominio
de la frecuencia por:

(s) = Kc 1 +

1
+ Td s E (s) = Gc (s) E (s) = P ID2
Ti s

Dentro de los mtodos de ajuste PID mas populares se encuentran los mtodos de ZieglerNichols [73] y [12] Cohen-Coon, ver Tabla 1.

98

Nuevo mtodo de Sintonizacin de controladores PID

Tabla 1. Mtodos de Ziegler-Nichols y Cohen-Coon para PI/PD


Kc

Ti

Sintonizacin de Ziegler-Nichols

a KTmm m

0;5

Mtodo Cohen-Coon

Tm
Km m

Nuestro Mtodo

Tm2
Km

4
3

Td
m

4Tm m
11Tm +2 m

4Tm

Tm1

Si cada articulacin es aproximada por un sistema de segundo orden:


qi (s)
Km
= 2 2
ui (s)
Tm s + 2 m Tm s + 1
Existen pocos mtodos para el problema de sintonizacin PD, donde las ganacias para el
control PD son ajustadas de acuerdo a la Tabla 2, la cul muestra nuestro mtodo respecto
a otros dos enfoques.
Tabla 2. Sintonizacin PD para modelos de segundo orden
Mtodo 1
Mtodo 2
Nuestro Mtodo

Kc

Ti

Td

5Tm1 m
Km Tm3
Tm2
Km
Tm2
Km

Tm1 +0;1 m
0;8Tm1 m

Tm1
Tm1

En esta tabla el Mtodo 1 es tomado de [28] y el Mtodo 2 se toma de [11]. Cuando un


controlador PD no produce buenos resultados, un buen mtodo alternativo es utilizar un
control PID, donde las ganacias para el control PID de primer orden pueden elegirse de
acuerdo a la Tabla 3.
Tabla 3. Sintonizacin de modelos de primer orden
Kc

Ti

Sintonizacin Ziegler-Nichols

a KTmm m ;

Mtodo de Cohen-Coon

Tm
m
Km m 4Tm
Tm2
Km

Nuestro Mtodo

Td
0;5

m
m (32Tm +6 m )

13Tm +8

Tm2

4Tm m
11Tm +2 m

Tm1

En la Tabla 3, los trminos Kc = Kp representan la ganancia proporcional, Ti =

Kc
Ki

es la

5.4 Ajuste PD/PID

99

constante de tiempo integral y Td =

Kd
Kc

es la constante de tiempo derivativa. Luego para la

eleccin de las ganancias del control PID del modelo de segundo orden se puede utilizar la
Tabla 4 siguiente.

Tabla 4. Sintonizacin PID para modelo de segundo orden


Mtodo 1
Mtodo 2
Nuestro Mtodo

Kc

Ti

Td

5Tm1 m
Km Tm3
Tm2
Km
20 m Tm
Km

2Tm1

Tm1 +0;1 m
0;8Tm1 m

Tm2

Tm1

15

2
Tm
10

m Tm

De la referencia (5.25) podemos observar que las ganancias del control PID son linealmente independientes y las podemos modicar directamente. De este modo podemos incluir
un nuevo controlador PID denotado por PID3 ; Para ajustar las ganancias PID podemos
utilizar la Tabla 5.
Tabla 5. Ajuste PID (P ID3 )

Kp "
Ki "
Kd "

Pico

Sobreimpulso Asentamiento Error Estado Estabilidad

Decrece

Crece

Pequea
Decrece
Pequea
Decrece

Pequea
Crece

Crece

Crece

Decrece

Crece

Decrece
Grande
Decrece
Menor
Decrece

Empeora
Empeora
Mejora

Despus podemos ajustar el proceso para la ley de control aplicada al Robot


= P D1 + P ID2 + P ID3 + g^ (q)

(5.17)

Con el n de disminuir el error en estado estable, podemos incrementar la ganancia Ki :


Para tener un menor tiempo de asentamiento podemos disminuir Kd : Luego si queremos

100

Nuevo mtodo de Sintonizacin de controladores PID

un Sobreimpulso menor debemos disminuir Kp : A menudo el proceso de ajuste anterior


no es suciente para garantizar la estabilidad del sistema en lazo cerrado. En el siguiente
apartado daremos las condiciones para las cotas para las ganacias del controlador PID que
nos garanticen la estabilidad.

5.5.

Condiciones de Estabilidad para las ganancias PID.

El controlador PID lineal comn no considera algn componente de la dinmica del robot
dentro de esta ley. Con el n de asegurar la estabilidad asinttica del control PID, el enfoque
ms simple es modicar el control PID lineal en uno no lineal. En [54] la dinmica del robot
es reescrita como un sistema lineal desacoplado y acotado, este controlador lineal PID no
puede garantizar la estabilidad asinttica. En [37] se presentan las condiciones sucientes
de estabilidad para el controlador PID lineal utilizando un anlisis basado en Lyapunov, sin
embargo estas condiciones no son explcitas, de modo que el control PID no puede utilizar
estas condiciones directamente, necesitando un procedimiento de ajuste un complicado como
el usado en [38].
La ley de control PID dada por (5.5) puede expresarse mediante las siguientes ecuaciones:
= Kp e + Kd e_ + = P ID4
_ = Ki e;

(0) =

(5.18)

En la discusin anterior solo hemos considerado PID4 sin considerar PD1 ; PID2 y PID3 : El
sistema en lazo cerrado del robot (5.2) puede considerarse como:
M (q) q + C (q; q)
_ q_ + g (q) = Kp q~
De donde podemos ver que el punto de equilibrio es

Kd q_ + ;

_ = Ki q~

; q~; q~ = [ ; 0; 0] : Cuando el punto

de equilibrio satisface q = q d ; entonces tenemos que el equilibrio es g q d ; 0; 0 : Con el n


de mover el punto de equilibrio al origen, podemos denir ~ =
g q d . De modo que la
ecuacin del sistema en lazo cerrado se transforma en ~ = Ki q~;
M (q) q + C (q; q)
_ q_ + g (q) = Kp q~

Kd q_ + ~ + g q d

(5.19)

5.6 Resultados Experimentales

101

En [68] se ha probado que la dinmica del robot controlada por el controlador PID lineal
(5.18) del sistema en lazo cerrado (5.19) es semiglobalmente asintticamente estable sobre
T

el equilibrio x =

Donde

g q

m (M ) m (Kp )

= 0; mostrando que las ganancias de control satisfacen:

; q~; q~

(Kp )

(Ki )

(Kd )

3
kg ;
2

(5.20)

(Kp )
;
M (M )
+ M (M )
m

; kg satisfacen kg (q1 )

g (q2 )k

(5.21)
(5.22)
kg kq1

q2 k :

Las tres matrices de ganancias del control PID lineal (5.18) pueden elegirse directamente de las condiciones (5.20). De (5.10) sabemos que el control PID con compensacin
por gravedad (5.17) es:
=

3
X

P IDj + g^ (q) = P IDf + g^ (q)

j=1

Ahora si aplicamos la condicin (5.20) a PIDf : Y si las ganancias de PIDf no estn en el


limite de (5.20), podemos agregar un nuevo controlador PID, PID4 ; tal que las ganancias
de PIDf +PID4 estn acotadas por (5.20). As el control por par nal del robot es:
= P D1 + P ID2 + P ID3 + P ID4 + g^ (q)
Tal y como se ilustro en la Figura 5.1.

5.6.

Resultados Experimentales

Considerando los parmetros geomtricos del robot dados en la Tabla 1:


Tabla 1. Parmetros del robot de dos grados de libertad
Articulacin

Masa (kg)

Centro (m)

Longitud (m)

1.5

0.15

0.3

1.5

0.15

0.3

102

Nuevo mtodo de Sintonizacin de controladores PID

Primero utilizaremos las siguientes ganancias del controlador PD1 con el n de estabilizar
el robot manipulador
Kp1 = diag [150; 150]

(5.23)

Kd1 = diag [330; 330]


La velocidad en las articulaciones es estimada mediante los ltros estandar siguientes
e
q_ (s) =

bs
18s
q (s) =
q (s)
s+a
s + 30

Luego para la energa potencial consideramos:


U = m1 gl1 s1 + m2 gl1 s1 + m2 gl2 s1 c2 + m2 gl2 c1 s2
De donde la compensacin por gravedad del sistema en lazo cerrado (5.19) se calcula mediante:
@
U (q)
@q
Luego utilizamos la respuesta al escaln unitario para aproximar la respuesta en lazo
g^ =

cerrado del robot mediante el controlador PD1 . Donde la respuesta del sistema en lazo
cerrado de las respuesta al escaln unitario de los dos eslabones se muestra en la Figura 5.3
de la eleccin de G1 =

0;93
;
60s2 +9s+1

G2 =

1
.
20s2 +3s+1

Con el n de ajustar las ganancias PID del sistema lineal, podemos reescribir el controlador PID (5.5) como:
P IDt = Kc

1
q~ +
Ti

Donde Kc = Kp es la ganancia proporcional, Ti =


Td =

Kd
Kc

q~ ( ) d + Td q~

0
Kc
Ki

es una constante integral de tiempo y

es la constante derivativa de tiempo. Si utilizamos la siguiente regla de ajuste:


Kc =

20 m Tm
;
Km

Ti = 15

m Tm ;

Td =

Tm2
10

(5.24)

Para ajustar los parmetros del controlador PID. Esta regla es similar a la utilizada en [28] y
[11], en este caso Kc =

5Tm1 m
;
Km Tm3

Ti = 2Tm1

m;

Td =

Tm1 +0;1 m
:
0;8Tm1 m

Este ajuste varia respecto a las

5.6 Resultados Experimentales

103

Figura 5.3: Respuesta aproximada al escaln unitario en el robot de dos grados de libertad

reglas clsica de Ziegler-Nichols y Cohen-Coon, donde Kc = a KTmm m ; Ti = 2


Kc =

Tm
Km m

4
3

4Tm

; Ti =

m (32Tm +6 m )
;
13Tm +8 m

Td =

4Tm m
:
11Tm +2 m

m;

Td = 0;5

Esta regla de ajuste esta hecha

para sistemas mecnicos. Luego de la regla (5.24), podemos elegir las ganancias para el
controlador PID2 siguientes:
Kp2 = diag [90; 30]
Ki2 = diag [1; 2]

(5.25)

Kd2 = diag [500; 410]


Si utilizamos el vector de pares u = P ID1 + g^ (q) + P ID2 . Podemos observar el resultado
para el primer eslabn en la Figura 5.4.
Despus si realizamos un ajuste las ganancias para el controlador PID3 sern:
Kp3 = diag [5; 4]
Ki3 = diag [32; 28]
Kd3 = diag [5; 4]

(5.26)

104

Nuevo mtodo de Sintonizacin de controladores PID

Figura 5.4: Controlador u = P D1 + g^ (q) + P ID2 sobre el robot manipulador de dos grados
de libertad

Por lo que la ley de control nal ser:

P IDf = P D1 + g^ (q) + P ID2 + P ID3

(5.27)

La condicin de estabilidad (5.20) nos proporciona las condiciones sucientes para elegir el
valor mnimo de la ganancia proporcional y de la ganancia derivativa as como nos da las
condiciones sucientes para elegir la mxima ganancia integral. Con lo cul tenemos que la
ley de control nal (5.27) satisface las condiciones (5.20) la cul se ilustra en la Figura 5.5.
Luego para el control nal del robot agregamos un nuevo controlador PID, de modo el
control de fuerza denido por la Figura 5.1 presenta la estructura
P ID4 + g^(q) cuyo comportamiento es ilustrado en la Figura 5.6.

= P D1 +P ID2 +P ID3 +

5.7 Conclusiones

105

Figura 5.5: Controlador P IDf = P D1 + g^ (q) + P ID2 + P ID3 sobre el robot manipulador
de dos grados de libertad

5.7.

Conclusiones

En este apartado se propone un nuevo mtodo de ajuste sistemtico para controladores


PID. Este mtodo puede ser aplicado bastante bien a robots manipuladores. Usando las
propiedades de la dinmica de los robots manipuladores el proceso de ajuste se hace mas
amigable en aplicaciones reales. Lo novedoso de este enfoque es el uso de respuestas escaln
unitario para sistemas en lazo cerrado bajo la ley de control PD as como la separacin del
vector de par de las articulaciones en varios controladores PID independientes. Finalmente
en la validacin del controlador propuesto de forma terica se obtuvieron buenos resultados
en el robot de dos grados de libertad del laboratorio de pruebas del departamento de control
automtico.

106

Figura 5.6: Controlador


de dos grados de libertad

Nuevo mtodo de Sintonizacin de controladores PID

= P D1 + g^ (q) + P ID2 + P ID3 + P ID4 sobre el robot manipulador

Captulo 6
Conclusiones Finales
Primero al utilizar un mtodo basado en la estabilidad de Lyapunov del capitulo 3 al
controlador PID lineal clsico sobre el robot manipulador nos permite determinar las condiciones de estabilidad semiglobal y asinuttica, cabe mencionar que estas condiciones son ms
sencillas de obtener respecto a otros trabajos adems de que estas condiciones nos permiten
obtener un mtodo explcito para la eleccin de ganancias PID. Es importante mencionar
que al aplicar este mtodo a la planta en lazo cerrado se garantizara siempre su estabilidad.
Por otro lado el controlador neuronal PID propuesto en el capitulo cuatro resuelve el
problema de eleccin de ganancias integral y derivativa grandes en el controlador lineal
PID y el controlador neuronal PD. Se pueden alcanzar las propiedades de los controladores
industriales PID as como los compensadores neuronales probando estabilidad asinttica
semiglobal. Cuando las velocidades de las articulaciones de los robots manipuladores no
estn disponibles, se asegura la estabilidad asinttica con el ltro de posicin. Las condiciones
de estabilidad nos dan un mtodo explcito para seleccionar las ganancias PID. Al aplicar
nuestro controlador neuronal al robot de dos grados de libertad se valida la ley de control
neuronal PID propuesta tericamente.
En el capitulo cinco se propone un nuevo mtodo de ajuste sistemtico para controladores
PID el cul pudo aplicarse al robot manipulador de dos grados de libertad mejorando el
ndice de desempeo original. Como este controlador usa las propiedades de la dinmica de

108

Conclusiones Finales

los robots manipuladores el proceso de ajuste se hace mas amigable en aplicaciones reales.
Lo novedoso de este enfoque es el uso de respuestas escaln unitario para sistemas en lazo
cerrado bajo la ley de control PD as como la separacin del vector de par de las articulaciones
en varios controladores PID independientes.

Bibliografa
[1] ALVAREZ- Ramirez J., I.Cervantes, R.Kelly, "PID regulation of robot manipulators:
stability and performance", Systems & Control Letters, Vol.41, 73-83, 2000.
[2] ALVAREZ-Ramirez J., R.Kelly, I.Cervantes, "Semiglobal stability of saturated linear
PID control for robot manipulators", Automatica, vol.39,989-995, 2003.
[3] ANG K.H., Chong, G. and Li, Y., "PID Control System Analysis, Design, and Technology", IEEE Trans. Control System Technology, vol. 13, no. 4, pp. 559576, 2005.
[4] ARIMOTO S., "Fundamental problems of robot control: Part I, Innovations in the realm
of robot servo-loops", Robotica, vol.13, No.1, 1927, 1995.
[5] ARIFOVICA J., R.Gencay, "Using genetic algorithms to select architecture of a feedforward articial neural network", Physica A, Vol.289, 574-594, 2001.
[6] ASTROM Karl J., T. Hagglund, "PID Controllers: Theory, Design and Tuning", ISA
Press, Research Triangle Park, North Carolina, 1995.
[7] ASTROM K.J. and Hagglund, T., Revisiting the ZieglerNichols step response method
for PID control", Journal of Process Control, 14, pp.635650, 2004.
[8] CHANG P.H. and Jung J.H., "A systematic method for gain selection of robust PID
control for nonlinear plants of second-order controller canonical form", IEEE Trans.
Control System Technology, vol. 17, no. 2, pp. 473483, 2009.

110

BIBLIOGRAFA

[9] CHANG W.D., Hwang, R.C. and Hsieh, J.G., .A self-tuning PID control for a class of
nonlinear systems based on the Lyapunov approach", Journal of Process Control, 12,
pp.233242, 1986.
[10] CHEN C., "Dynamic Structure Neural-Fuzzy Networks for Robust Adaptive Control of
Robot Manipulators", IEEE Trans. Industrial Electronics, VOL. 55, NO. 9, 3402-3414,
2008.
[11] CHIEN I. L., P.S.Fruehauf, "Consider IMC tuning to improve controller performance",
Chemical Engineering Progress, 33-41, 1990.
[12] COHEN G.H., G.A. Coon, "Theoretical consideration of retarded control", Trans.
ASME, 75, 827834, 1953.
[13] COMINOS P. and Munro N., "PID controllers: recent tuning methods and design to
specications", IEE Proceedings -Control Theory and Applications, 149 (1), pp.4653,
2002.
[14] CONG S. and Y. Liang, "PID-Like Neural Network Nonlinear Adaptive Control for
Uncertain Multivariable Motion Control Systems", IEEE Trans. Ind. Electron., vol. 56,
no. 10, pp. 3872-3879, 2009.
[15] DENAVIT J., R. S. Hartenberg, .A Kinematic Notation for Lower-Pair Mechanisms
Based on Matrices", Journal of Applied Mechanics, junio 1995.
[16] DIERKS T., S.Jagannathan, "Neural Network Output Feedback Control of Robot Formations", IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.40, No.4,
383-399, 2010.
[17] DUPREE K., C-H.Liang, G.Hu, W. E.Dixon, "Adaptive Lyapunov-Based Control of
a Robot and MassSpring System Undergoing", IEEE Transactions on Systems, Man,
and Cybernetics, Part B, Vol.38, No.4, 1050-1061, 2008.

BIBLIOGRAFA

111

[18] EMILIA G., A.Marra, E.Natale, "Use of neural networks for quick and accurate autotuning of PID controller", Journal Robotics and Computer-Integrated Manufacturing,
Volume 23 Issue 2, 170-179, 2007.
[19] ER M.J. and Y.Gao, "Robust Adaptive Control of Robot Manipulators Using Generalized Fuzzy Neural Networks", IEEE Trans. Industrial Electronics, VOL. 50, NO. 3,
620-628, 2003.
[20] GOLDENBERG A. A. and Bazerghi, A., "Synthesis of robot control for assembly
processes", Mech. Machine Theory, 21(1), pp.43-62, 1986.
[21] GOLLA D.F., Garg S.C. and Hughes P.C., "Linear state-feedback control of manipulators", Mech.Machine Theory, 16, pp.93-103, 1981.
[22] GUTIERREZ L.B. and F. L. Lewis, "Implementation of a neural net tracking controller for a single exible link: comparisonwith PD and PID controllers", IEEE Trans.
Industrial Electronics, VOL. 45, NO. 2, 307-318, 1998.No.1, 131-147, 2002.
[23] HARINATH E.,G.Mann, "Design and Tuning of Standard Additive Model Based Fuzzy
PID Controllers for Multivariable Process Systems", IEEE Transactions on Systems,
Man, and Cybernetics, Part B, Vol.38, No.8, 667-674, 2008.
[24] HAYKIN S. "Neural Networks, A Comprehensive Foundation",2a Edicin, Prentice
Hall, 1999.
[25] HERR H., "Exoskeletons and orthoses: classication, design challenges and future directions", Journal of Neuro Engineering and Rehabilitation, 6(21) pp.1023-1031, 2009.
[26] HO S-J., L-S.Shu, S-Y.Ho, "Optimizing Fuzzy Neural Networks for Tuning PID Controllers Using an Orthogonal Simulated Annealing Algorithm OSA", IEEE Trans. Fuzzy
Syst., Vol.14, NO. 3, 421-434, 2006.
[27] HOGAN N., "Impedance control: An approach to manipulation, PartsIIII", ASME J.
Dynam. Syst., Meas., Contr., vol. 107, pp. 1-24, 1985.

112

BIBLIOGRAFA

[28] HUANG H.-P., J.-C.Jeng, K.-Y.Luo, .A uto-tune system using single-run relay feedback
test and model-based controller design", Journal of Process Control, 15, 713-727, 2005.
[29] IOANNOU P.A. and J.Sun, "Robust Adaptive Control, Prentice-Hall", Inc, Upper Saddle
River: NJ, 1996.
[30] JAFAROV E. M., M. N. A. Parlak, and Y. Istefanopulos, .A New Variable Structure
PID-Controller Design for Robot Manipulators", IEEE Transactions on Cntrol Systems
Technology, Vol.13, No.1, 122-130, 2005.
[31] JIN Y., "Decentralized Adaptive Fuzzy Control of Robot Manipulators", IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.28, No.1, 47-57, 1998.
[32] JUANG, J.G., Huang, M.T. and Liu, W.K., "PID control using presearched genetic
algorithms for a MIMO system", IEEE Trans. Syst., Man, Cybern. C, Appl. Rev., vol.
38, no.5, pp.716-727, 2008.
[33] KARRAY F. , W. Gueaieb, S. Al-Sharhan, "The Hierarchical Expert Tuning of PID
Controllers Using Tools of Soft Computing", IEEE Transactions on Systems, Man, and
Cybernetics, Part B, Vol.35, No.6, 1283-1294, 2005.
[34] KASAC J., B.Novakovic, D.Majetic, and D.Brezak, "Global Positioning of Robot Manipulators With Mixed Revolute and Prismatic Joints", IEEE Transactions on Automatic Control, Vol.51, No.6, 1035-1040, 2006.
[35] KELLY R., "PD control with desired gravity compensation of robotic manipulators: A
review", International Journal of Robotics Research, Vol. 16, No.5, pp. 660672 , 1997.
[36] KELLY R., "Global Positioning of Robot Manipulators via PD Control Plus a Class of
Nonlinear Integral Actions", IEEE Transactions on Automatic Control, Vol.43, No.7,
934-938, 1998.
[37] KELLY R., V.Santibez, L.Perez, "Control of Robot Manipulators in Joint Space",
Springer-Verlag London, 2005.

BIBLIOGRAFA

113

[38] KELLY R, "A tuning procedure for stable PID control of robot manipulators", Robotica,
13, pp.141-148, 1995.
[39] KRISTIANSSON B. and Lennartsson, B., "Robust and optimal tuning of PI and PID
controllers", IEE Proceedings-Control Theory and Applications, 149 (1), pp.17-25, 2002.
[40] LEWIS, F.L., Liu, K. and Yesildirek, A., "Neural net robot controller with guaranteed
tracking performance", IEEE Trans. Neural Networks, vol. 6, no. 3, pp. 703715, 1995.
[41] LEWIS, F.L., Dawson, D.M. and Abdallah, C.T., "Robot Manipulator Control: Theory
and Practice", Marcel Dekker, Inc, New York, NY 10016, 2004.
[42] LEWIS F.L., "Nonlinear Network Structures for Feedback Control", Asian Journal of
Control, vol. 1, no. 4, pp.205228,1999.
[43] LI H-X., L.Zhang, K-Y.Cai, G.Chen, "An Improved Robust Fuzzy-PID Controller With
Optimal Fuzzy Reasoning", IEEE Transactions on Systems, Man, and Cybernetics, Part
B, Vol.35, No.6, 1283-1294, 2005.
[44] LI C.J., "An e cient method for linearization of dynamic models of robot manipulators", IEEE Transactions on Robotics and Automation, Volume: 5 Issue: 4, pp.397-408,
1989.
[45] LORETO Gomez Gerardo, "Visual Servoing con compensacin utilizando Redes Neuronales"(Tesis de Maestra). Departamento de Control Automtico, CINVESTAV-IPN,
Junio 2002.
[46] MANN G. K. I., B-G. Hu, R.G. Gosine, "Two-Level Tuning of Fuzzy PID Controllers",
IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.31, No.2, 263-269,
2001.
[47] NUNES E.V. L., L.Hsu, F.Lizarralde, .A rbitrarily small damping allows global output
feedback tracking of a class of Euler-Lagrange systems", 2008 American Control Conference,, Seattle, USA, 378-382, 2008

114

BIBLIOGRAFA

[48] ODWYER A., "Handbook of PI and PID Controller Tuning Rules", Imperial College
Press, London , 2006.
[49] ORTEGA R., A.Loria, R.Kelly, "A Semiglobally Stable Output Feedback PI2 D Regulator for Robot Manipulators", IEEE Transactions on Automatic Control, Vol.40, No.0,
1432-1436, 1985.
[50] PADEN B., R.Panja, "Globally asymptotically stable PD+ controller for robot manipulators", International Journal of Control, Vol. 47, No. 6, 16971712 , 1988.
[51] PARRA-Vega, S.Arimoto, Y.-H.Liu,G.Hirzinger, P.Akella, "Dynamic Sliding PID Control for Tracking of Robot Manipulators: Theory and Experiments", IEEE Transactions
on Robotics and Automation, Vol.19, No.6, 967-976, 2003.
[52] POZNYAK A., E.N. Sanchez, W.Yu,."Dierential Neural Networks for Robust Nonlinear Control, Identication, State Estimation and Trajectory Tracking", World Scientic
Publishing, 2001.
[53] QU Z., D.M. Dawson, S. Y. Lim, J.F. Dorsey, "A New Class of Robust Control Laws for
Tracking of Robots", International Journal of Robotics Research, Vol. 13, No.4, 355363
, 1994.
[54] Rocco, P., "Stability of PID control for industrial robot arms", IEEE Transactions on
Robotics and Automation, Vol.12, No.4 , pp.606-614, 1996.
[55] SALDAA S. S., "Diseo, construccin y control de un prototipo de cadena cinematica
abierta experimental de dos grados de libertad"(Tesis de Maestra), Departamento de
Control Automtico, CINVESTAV-IPN, Junio 1999.
[56] SCOTT G.M., J. W.Shavlik, W. H. Ray, "Rening PID Controllers Using Neural Networks", Neural Computation, Vol. 4, No. 5, 746-757, 1992.
[57] SHINSKEY F.G., "Process Control Systems - Application, Design and Tuning",
McGraw-Hill Inc., New York , 1996.

BIBLIOGRAFA

115

[58] SLOTINE J. J., W.Li, .A daptive manipulator control: A case study", IEEE Transactions
on Automatic Control, Vol.33, No.11, 9951003, 1988.
[59] SPONG M. Vidyasagar and S. Hutchinson. "Robot Modeling and Control". John Wiley
and Sons, 2006.
[60] SUN D., S.Hu, X.Shao, and C.Liu, "Global Stability of a Saturated Nonlinear PID
Controller for Robot Manipulators", IEEE Transactions on Cntrol Systems Technology,
Vol.17, No.4, 892-899, 2009.
[61] SUN Y.L. and Er, M.J., "Hybrid fuzzy control of robotics systems", IEEE Trans. Fuzzy
Systems, vol. 12, no. 6, pp.755-765, 2004.
[62] SUZUKI K., I.Horina and N.Sugie, .A Simple Neural Network Pruning Algorithm with
Application to Filter Synthesis", Neural Processing Letters, Vol.13, 43-53, 2001.
[63] SWARP, A. and Gopal, M., "Comparative study on linearized robot models", Journal
of Intelligent and Robotic Systems, Volume 7, Number 3, pp.287-297, 1993
[64] TOMEI P., "Adaptive PD Controller for Robot Manipulators", IEEE Transactions on
Robotics and Automation, VoL. 7, No. 4 , 565-570,1991.
[65] UANG H. J. and C. C. Lien, "Mixed H2/H1 PID tracking control design for uncertain
spacecraft systems using a cerebellar model articulation controller", IEE Proceedings Control Theory and Applications,, vol. 153, no. 1, pp. 113, 2006.
[66] VISIOLI A. , "Modied anti-windup scheme for PID controllers", IEE Proc.-Control
Theory Appl., Vol.161, No 1., 49-54, 2003.
[67] WANG Q.G., Zhang, Y. and Guo, X., "Robust closed-loop identication with application to auto-tuning", Journal of Process Control, 11, pp. 519-530, 2001
[68] YU D-Li, T. K. Chang, D-W.Yu, "Fault Tolerant Control of Multivariable Processes
Using Auto-Tuning PID Controller", IEEE Transactions on Systems, Man, and Cybernetics, Part B, Vol.35, No.1, 32-43, 2005.

116

BIBLIOGRAFA

[69] YU W. and Rosen J., .A Novel Linear PID Controller for an Upper Limb Exoskeleton",
49th IEEE Conference on Decision and Control, CDC10, Atlanta, USA, pp.3548-3553.
[70] YU W. and Li X, .A Systematic Tunning Method of PID Controller for Robot Manipulators", 9th IEEE International Conference on Control & Automation, ICCA11, Santiago
Chile, pp.274-279.
[71] Alexander S.Poznyak, Wen Yu, Edgar N. Sanchez, Jose P. Perez, Nonlinear Adaptive
Trajectory Tracking Using Dynamic Neural Networks, IEEE Transactions on Neural
Networks, Vol.10, No.6, 1402-1411,1999.
[72] Xiaoou Li and Wen Yu, Anti-swing control for an overhead crane with fuzzy compensation, Intelligent Automation and Soft Computing, Vol.18, No.1,1-11, 2012
[73] ZIEGLER J. G. and Nichols N. B., .O ptimum settings for automatic controllers", Trans.
ASME, vol 64, pp.759-768.

Vous aimerez peut-être aussi