Vous êtes sur la page 1sur 132

SEMINARIO

“Lógica difusa, redes neuronales


y control predictivo.
Técnicas modernas de control”
Profesora: Dra. Doris Sáez

OBJETIVOS

Presentar un panorama de los conceptos y herramientas


fundamentales de la teoría de control basada en lógica difusa, redes
neuronales y control predictivo. Destinado a estudiantes de
ingeniería de los últimos años, ingenieros y técnicos con
conocimientos generales de control automático.

CONTENIDOS

I. Introducción

II. Control basado en modelos difusos (2.5 horas)


2.1 Fundamentos de lógica difusa
2.2 Modelos difusos
2.3 Identificación de modelos difusos
2.4 Estrategias de control difuso
2.5 Ejemplos

III. Control basado en redes neuronales (2.5 horas)


3.1 Fundamentos de redes neuronales
3.2 Modelos basados en redes neuronales
3.3 Entrenamiento de redes neuronales
3.4 Estrategias de control basadas en redes neuronales
3.5 Ejemplos
IV. Fundamentos de control predictivo (2.5 horas)
4.1 Modelos predictivos
4.2 Control por matriz dinámica
4.3 Control predictivo generalizado
4.4 Control predictivo con restricciones
4.5 Ejemplos

V. Control predictivo no lineal (2.5 horas)


5.1 Formulación general del problema
5.2 Control predictivo basado en modelos difusos
5.3 Control predictivo basado en redes neuronales
5.4 Ejemplos
SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales


y control predictivo.
Técnicas modernas de control”

Profesora: Dra. Doris Sáez

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
FUNDAMENTOS DE LA LÓGICA DIFUSA

La lógica difusa asocia incertidumbre a la estructura de un conjunto de


datos (Zadeh, 1965). Los elementos de un conjunto difuso son pares
ordenados que indican el valor del elemento y su grado de pertenencia.

Para un conjunto difuso A = {( x, u A ( x)) / x ∈ X} , se tiene que el


elemento x pertenece al conjunto A con un grado de pertenencia uA (x),
que puede variar entre 0 y 1. Por lo tanto, una variable puede ser
caracterizada por diferentes valores lingüísticos, cada uno de los cuales
representa un conjunto difuso.

Por ejemplo, la velocidad puede ser caracterizada por valores lingüísticos


como "Bajo", "Medio" y "Alto", que representan "una velocidad
aproximadamente menor que 40 km/h", "una velocidad cercana a 55
km/h" y "una velocidad sobre 70 km/h aprox." respectivamente. Estos
términos se asocian a conjuntos difusos con funciones de pertenencia
como las mostradas en la siguiente figura.

u
Bajo Medio Alto
1

0.66

0.33

40 45 55 70 Velocidad (km/h)

Por lo tanto, si la velocidad es 45 km/h, existen grados de pertenencia 0.6,


0.3 y 0 a los conjuntos difusos "Bajo", "Medio" y "Alto" respectivamente.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Operaciones básicas de lógica difusa

Dados dos conjuntos difusos A y B en el mismo universo X, con funciones


de pertenencia uA y uB respectivamente, se pueden definir las siguientes
operaciones básicas:

Unión. La función de pertenencia de la unión de A y B se define como:

u A ∪ B = max{(u A (x), u B (x))}

Intersección. La función de pertenencia de la intersección de A y B es:

u A∩ B = min{(u A (x), u B (x))}

Complemento. La función de pertenencia del complemento de A se


define como:

u A (x) = 1 − u A (x)

Producto cartesiano. Dados los conjuntos difusos A1, ..., An con


universos X1, ..., Xn respectivamente, se define el producto cartesiano
como un conjunto difuso en X1×...×Xn con la siguiente función de
pertenencia:

u A1x..xAn (x 1 ,..., x n ) = min{uA1 (x1 ),..., u An (x n )}

según Mamdani (1974)

u A1x..xAn (x 1 ,..., x n ) = u A1 (x1 ) ⋅ u A2 (x 2 ) ⋅⋅⋅ u An (x n )

según Larsen (1980).


Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
MODELOS BASADOS EN LÓGICA DIFUSA

• Modelos difusos lingüísticos

• Modelos difusos de Takagi y Sugeno

MODELOS DIFUSOS LINGÜÍSTICOS

Estos modelos se basan en un conjunto de reglas heurísticas donde las


variables lingüísticas de las entradas y salidas se representan por conjuntos
difusos.

La siguiente figura muestra las principales componentes de un modelo


difuso lingüístico: interfaz de fusificación, base de conocimiento, motor de
inferencia e interfaz de defusificación (Lee, 1990).

Base de
conocimientos
u Interfaz de y
Interfaz de
fusificación defusificación

Motor
inferencia

Interfaz de fusificación. Este elemento transforma las variables de


entrada del modelo (u) en variables difusas. Para esta interfaz se deben
Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
tener definidos los rangos de variación de las variables de entrada y los
conjuntos difusos asociados con sus respectivas funciones de pertenencia.

Base de conocimientos. Contiene las reglas lingüísticas del control y la


información referente a las funciones de pertenencia de los conjuntos
difusos.

Estas reglas lingüísticas, tienen típicamente la siguiente forma:

Si u1 es A y u2 es B entonces y es C

donde A, B y C son los conjuntos difusos de las variables de entrada u1 y


u2, y de la variable de salida y respectivamente.

Existen varias formas de derivar las reglas (Lee, 1990), entre las que
destacan las basadas en:

- La experiencia de expertos y el conocimiento de ingeniería de control.


La base de reglas se determina a partir de entrevistas con el operador o a
través del conocimiento de la dinámica del proceso.

- La modelación del proceso. Los parámetros de la base de conocimiento


se obtienen a partir de datos de entrada y salida del proceso.

Motor de inferencia. Realiza la tarea de calcular las variables de salida a


partir de las variables de entrada, mediante las reglas del controlador y la
inferencia difusa, entregando conjuntos difusos de salida.

Por ejemplo, dada una base de conocimiento con n reglas del tipo:

Si u1 es Ai y u2 es Bi entonces y es Ci
Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
la secuencia de cálculos que realiza el motor de inferencia incluye:

- Determinar el grado de cumplimiento Wi de cada regla a partir de los


grados de pertenencia de las variables de entrada obtenidos en la etapa de
fusificación, es decir,

Wi = min(uAi,uBi)

debido a que las premisas de la reglas están unidos por operadores AND,
definidos como la intersección de conjuntos difusos.

- Para cada regla se tiene una consecuencia "y es Ci", que tiene asociado
una función de pertenencia uCi. Por lo tanto, se tiene un conjunto de salida
C'i, cuya función de pertenencia es:

uC'i = min (Wi,uCi)

donde Wi es el grado de cumplimiento para la regla i.

- Para evaluar el conjunto total de reglas, se unen los conjuntos difusos C'i
resultantes de cada regla, generándose un conjunto de salida con la
siguiente función de pertenencia:

uC' = max( uC' i ) i = 1,..., n

De esta forma, se obtiene una salida difusa del controlador, con una
función de pertenencia uC'.⋅

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Interfaz de defusificación. Este elemento provee salidas discretas y
determinísticas a partir de los conjuntos difusos C' obtenidos como
resultado de la inferencia.

Existen diferentes métodos de defusificación, algunos de los cuales se


describen a continuación:

- Método del máximo. La salida corresponde al valor para el cual la


función de pertenencia uC' alcanza su máximo.

- Media del máximo. La salida es el promedio entre los elementos del


conjunto C' que tienen un grado de pertenencia máximo.

- Centro de área. Genera como salida el valor correspondiente al centro de


gravedad de la función de pertenencia del conjunto de salida C'.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Ejemplo

Reglas Si x es A e y es B entonces z es C

R1 Si x es A1 e y es B2 entonces z es C2
R2

x = 20 y = 26 z?

A1 A2 B1 B2 C1 C2

0 10 100 x -50 26 50 y 0 10 z

C1 C2

0 10 z

C’.
0 40 10 z

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Ejemplo 2 Modelación de las acciones de control de un operador de un
horno cementero.

En la siguiente figura se presenta un diagrama del proceso, donde el


carbón proveniente de un molino, alimenta una tolva y es transportado
hacia el horno. El ventilador primario sirve para mantener la llama en la
zona de cocción.

La mezcla, que permite la formación de los compuestos del cemento, se


desplaza desde la parte posterior del horno (derecha de la figura) en
contracorriente al flujo de calor, calcinándose y cociéndose, hasta
obtenerse el clinker o producto final del horno que pasa posteriormente al
enfriador. El ventilador de inducción sirve para succionar los gases
producidos en la combustión.

CS CO
RT
BF Horno O2
KS Cementero BT
NOx

El diagrama muestra las variables de entrada y de salida del proceso:

- el flujo de alimentación del carbón (CS),


- la velocidad del ventilador de inducción (BF) y
- la velocidad del horno (KS).
Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
- el porcentaje de monóxido de carbono en los gases (CO),
- la temperatura de los gases en la zona intermedia (RT),
- el porcentaje de oxígeno en los gases (O2),
- la temperatura de los gases en la zona posterior (BT) y
- el porcentaje de óxido nitroso en los gases (NOx).

Experimentalmente, se ha comprobado que la dinámica de este sistema es


no lineal, con retardos, fuertes interacciones y muy dependiente de las
condiciones iniciales.

A partir de la experiencia de operadores para hornos cementeros, se


puede deducir, en términos generales, que el flujo de carbón es la variable
manipulada que produce el mayor efecto. Por ejemplo, un aumento de CS
genera:
- una disminución de O2 y CO, y
- un aumento de las temperaturas RT y BT, y del NOx.

Por su parte, un aumento en BF


- aumenta el O2, CO y BT, y
- disminuye RT y NOx.

Al aumentar KS, aumentan RT y BT.

A partir de estas afirmaciones, una regla que representa las acciones de


control del operador puede ser:

Si CO es alto entonces CS aumenta y BF disminuye

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
MODELOS DIFUSOS DE TAKAGI Y SUGENO

Estos modelos se caracterizan por relaciones basadas en reglas difusas,


donde las premisas de cada regla representan subespacios difusos y las
consecuencias son una relación lineal de entrada-salida (Takagi y Sugeno,
1995).

Las variables de entrada en las premisas de cada regla son relacionadas


por operadores "y" y la variable de salida es una combinación lineal de las
variables de estado. Por lo tanto, las reglas del modelo tienen la siguiente
forma:

R i : Si X1 es Al i y K y Xk es Ak i
entonces Yi = p i0 + p1i X1+K+ p ik Xk

donde X1, ..., Xk son las variables de entrada o premisas de las reglas,
A1i, ..., Aki son los conjuntos difusos asociados a las variables de
entrada,
p10 , K , p ik son los parámetros de la regla i, e
Yi es la salida de la regla i.

Por lo tanto, la salida del modelo, Y, se obtiene ponderando la salida de


cada regla por su respectivo grado de cumplimiento Wi, es decir:

M M
Y = ∑ (Wi Yi ) / ( ∑ Wi )
i=1 i =1

donde M es el número de reglas del modelo y Wi se calcula según el


operador intersección.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Ejemplo Modelo difuso de Takagi y Sugeno para un fermentador batch de
alimentación.

La presión en el estanque de fermentación puede ser controlada a través


del cambio de flujo de aire de salida manteniendo constante el flujo de aire
de entrada.

A continuación se presentan la base de reglas del modelo de Takagi y


Sugeno que caracterizan al fermentador.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Funciones de pertenencia del modelo de Takagi y Sugeno
que caracterizan al fermentador

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Método de identificación

Los conjuntos difusos y las funciones de pertenencia se definen a partir de


un conocimiento previo del proceso y los parámetros de las consecuencias
se obtienen por un algoritmo de mínimos cuadrados.

En la siguiente figura se presenta un diagrama del método de


identificación:

Elección de la
estructura del modelo

Identificación de los
parámetros de las premisas

Identificación de los
parámetros de las consecuencias

no ¿Es bueno
el modelo?

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Identificación de los parámetros de las premisas

En esta estructura los conjuntos difusos A1i, ..., Aki y sus respectivas
funciones de pertenencia pueden ser determinadas basándose en un
conocimiento previo del proceso o por métodos más complejos como
“clustering” difuso.

“Clustering” difuso

El número óptimo de reglas y conjuntos difusos del modelo se determina


haciendo una partición del universo de la variable de salida y luego
proyectándolo al espacio de entrada (Sugeno, 1993).

Para obtener los conjuntos difusos de la salida, el criterio utilizado es


minimizar la distancia entre el dato de salida y el centro de cada
conglomerado (“cluster”) difuso.

Luego de un procedimiento iterativo de optimización de las distancias, se


obtiene el número de conjuntos o conglomerados difusos y sus grados de
pertenencia de los datos de salida a cada conjunto.

A continuación, para determinar los parámetros de las funciones de


pertenencia de las premisas, los conjuntos difusos de las variables de salida
son proyectados al espacio de entrada para definir esos conjuntos difusos,
como se muestra en la siguiente figura.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Espacio
B de salida
Y

X2

A
A2 Espacio
de entrada

X1
A1

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Identificación de los parámetros de las consecuencias

En general, los parámetros pi0 , K , pik de las consecuencias se obtienen


por el método de mínimos cuadrados, es decir, se minimiza el índice de
error dado por:
N
e = ∑ ( yp − y$ p )2
2

p= 1

donde yp es la salida real del proceso,


y$ p es la salida del modelo difuso, considerando las mismas
entradas del proceso, y
N es el número de muestras.

Finalmente, con los parámetros óptimos de las consecuencias ya


determinados se puede alterar la estructura del modelo o las funciones de
pertenencia obtenidas, de manera de reducir el índice de error.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
ESTRUCTURA BÁSICA DE UN CONTROLADOR DIFUSO

Estos controladores se basan en un conjunto de reglas heurísticas


donde las variables lingüísticas de las entradas y salidas se representan
por conjuntos difusos

La siguiente figura muestra las principales componentes de un


controlador difuso: interfaz de fusificación, base de conocimiento,
motor de inferencia e interfaz de defusificación (Lee, 1990).

Base de
conocimientos

Interfaz de Interfaz de
fusificación defusificación

Motor
inferencia

Variables Proceso Variables


controladas manipuladas

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
EJEMPLO: CONTROLADOR DIFUSO PARA UNA
LAVADORA.

Objetivo
Seleccionar el tiempo del lavado basándose en la cantidad, tipo y grado
de suciedad de la ropa.

Controlador difuso

Suciedad
Controlador Tiempo de
Tipo de ropa Difuso Lavado

El grado de suciedad de la ropa es determinado por la transparencia del


agua.
El tipo de ropa se determina a partir del tiempo de saturación. En este
caso, el tiempo de saturación se define como el tiempo en que la
transparencia del agua tiende a cero. Por ejemplo, la ropa grasienta
toma mayor tiempo en llegar al tiempo de saturación pues la grasa es
menos soluble.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Funciones de pertenencia

Funciones de pertenencia para la variable “Suciedad”

Funciones de pertenencia para la variable “Tipo de ropa”

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Funciones de pertenencia para la variable “Tiempo de lavado”

Base de reglas
Las reglas del controlador difuso para la lavadora se definen
intuitivamente. Por ejemplo, una regla típica sería:

Si la suciedad es alta y el tipo de ropa es grasiento entonces el tiempo


de lavado debería ser alto.

Diferentes combinaciones de este tipo de reglas y otras condiciones son


necesarias para construir el controlador difuso propuesto.

Reglas del controlador difuso

if dirtness_of_clothes is Large and type_of_dirt is Greasy then wash_time is


VeryLong;
if dirtness_of_clothes is Medium and type_of_dirt is Greasy then wash_time is
Long;
if dirtness_of_clothes is Small and type_of_dirt is Greasy then wash_time is
Long;
Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
if dirtness_of_clothes is Large and type_of_dirt is Medium then wash_time is
Long;
if dirtness_of_clothes is Medium and type_of_dirt is Medium then wash_time is
Medium;
if dirtness_of_clothes is Small and type_of_dirt is Medium then wash_time is
Medium;
if dirtness_of_clothes is Large and type_of_dirt is NotGreasy then wash_time is
Medium;
if dirtness_of_clothes is Medium and type_of_dirt is NotGreasy then wash_time
is Short;
if dirtness_of_clothes is Small and type_of_dirt is NotGreasy then wash_time is
VeryShort

Superficie del controlador difuso

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
CONTROLADORES PI DIFUSOS

La Figura presenta un diagrama de un controlador PI difuso


incremental, donde las entradas son el error e ( k ) = ref − y ( k ) y su tasa
de cambio de ( k ) = e ( k ) − e ( k − 1) , y la salida es el cambio incremental
en la variable manipulada du(k).

e(k)
GE du(k) y(k)
ref
Controlador GU Proceso
GR
de(k)

Los parámetros del controlador son las ganancias GE, GR y GU, que
multiplican a e(k), de(k) y du(k) respectivamente.

En general, estos controladores presentan las siguientes características:


dos o siete conjuntos difusos para las variables de entrada, tres o siete
conjuntos difusos para la variable de salida, funciones de pertenencia
triangulares, fusificación con universos continuos, implicación
utilizando operador min, inferencia basada en implicancia difusa y
defusificación por el método de la media de los máximos modificada.

Este tipo de controlador difuso se deriva a partir del comportamiento


deseado del sistema en lazo cerrado. En la siguiente figura se aprecia la
respuesta típica de un sistema controlado, donde las entradas al
controlador son e(k) y de(k), y la salida es du(k).

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
y(k)

ref

a1 a2 a3 a4

e(k) + - - + tiempo
de(k) - - + +

Analizando en detalle esta respuesta se pueden observar diferentes


situaciones. Considerando el valor de e(k) y el signo de de(k), se tienen
los casos presentados en la tabla 1(a). Además, existen dos tipos de
situaciones especiales, cuando el error e(k) es cero y cuando su tasa de
cambio de(k) es cero. Estas situaciones se muestran en las siguientes
figuras y en las tablas 1(b) y 1 (c).

Tabla 1: Situaciones de las variables e(k) y de(k)

e(k) de(k) e(k) de(k) de(k) e(k)


a1 >0 <0 b1 =0 <<<0 c1 =0 <<<0
a2 <0 <0 b2 =0 <<0 c2 =0 <<0
a3 <0 >0 b3 =0 <0 c3 =0 <0
a4 >0 >0 b4 =0 >0 c4 =0 >0
b5 =0 >>0 c5 =0 >>0
b6 =0 >>>0 c6 =0 >>>0

(a) (b) (c)

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
c1
c2
c3
y(k) b1 y(k)
b2
b3
ref ref
b4 c4
b6
b5 c5
c6

tiempo tiempo
(a) (b)

A partir de estas condiciones, se puede configurar una tabla en función


de las variables de entrada del controlador (ver Tabla 2). En ella se
consideran siete conjuntos difusos NB ("Negative Big"), NM ("Negative
Medium"), NS ("Negative Small"), ZE ("Zero"), PS ("Positive Small"),
PM ("Positive Medium") y PB ("Positive Big") para las variables de
entrada que describen los estados <<<, <<, <, =, >, >> y >>> 0,
respectivamente.

Tabla 2: Diagrama de estados e(k) y de(k).


de(k)
NB NM NS ZE PS PM PB
NB a2 a2 a2 c1 a3 a3 a3
NM a2 a2 a2 c2 a3 a3 a3
NS a2 a2 a2 c3 a3 a3 a3
e(k) ZE b1 b2 b3 ZE b4 b5 b6
PS a1 a1 a1 c4 a4 a4 a4
PM a1 a1 a1 c5 a4 a4 a4
PB a1 a1 a1 c6 a4 a4 a4

Las acciones de control, es decir, los incrementos en la variable


manipulada, se definen a partir de la proposición de MacVicar-Whelan
(1976), como lo muestra la Tabla 3. Por ejemplo, para el elemento de
la tercera fila y sexta columna, la regla de control se interpreta como:
"Si el error es negativo pequeño y la variación incremental del error es

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
positiva mediana, entonces hacer positiva pequeña la variación
incremental en el control".

Tabla 3: Reglas de control PI difuso.


de(k)
NB NM NS ZE PS PM PB
NB NB NB NB NB NM NS ZE
NM NB NB NM NM NS ZE PS
NS NB NM NS NS ZE PS PM
e(k) ZE NM NM NS ZE PS PM PM
PS NM NS ZE PS PS PM PB
PM NS ZE PS PM PM PB PB
PB ZE PS PM PB PB PB PB

El diseño de un controlador difuso PI incluye, además de definir las


reglas de control, determinar las funciones de pertenencia de cada
conjunto difuso. En general, se utilizan funciones triangulares como se
muestran en la siguiente figura, donde el universo varía entre -L y L,
siendo L un factor de escalamiento de las variables.

NB NS NM ZE PS PM PB
1

-L -2L/3 -L/3 O L/3 2L/3 L

Los principales parámetros de sintonía de estos controladores son las


ganancias GE, GR y GU.

Doris Sáez (Marzo, 2002). Apuntes I: Control basado en Modelos Difusos. Seminario AADECA-UBA, Buenos
Aires.
Modelos difusos
Takagi & Sugeno
– Modelos lineales en las consecuencias

u
SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales


y control predictivo.
Técnicas modernas de control”
Profesora: Dra. Doris Sáez

Apuntes II: Control basado en Redes Neuronales

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
REDES NEURONALES

Las redes neuronales constituyen una poderosa herramienta


para modelar sistemas, especialmente no lineales, sean
dinámicos o estáticos.

El cerebro humano es una sistema muy complejo formado


por muchas células llamadas neuronas; se estima que
existen entre 1010 y 1011 de células en el cerebro. Las redes
neuronales artificiales emulan la arquitectura y capacidades
de sistemas neuronales biológicos.

Una esquema simplificado de una neurona se muestra en la


siguiente figura.

Cuerpo celular

Dendrita

Axón

Sinapsis

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
En el cuerpo celular se realizan la mayoría de las funciones
lógicas de la neurona. El axón es el canal de salida final de
la neurona. Las dentritas reciben las señales de entrada de
los axones de otras neuronas y se conectan al cuerpo celular
por medio de las sinapsis.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
-
UBA, Buenos Aires.
REPRESENTACION MATEMATICA
DE UNA NEURONA

En la siguiente figura se observa la estructura de una


neurona artificial con múltiples entradas.

x1
w1
x2 w2

x3 w3 Σ
u
f y
wk
xk wn

θ
xn

En esta estructura, se tiene


n
u = ∑ w i xi
i =1

donde wi son los pesos de la neurona (sinápsis)


xi son las entradas a la neurona
n es el número de entradas a la neurona

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
 n 
y = f ( u ) = f  ∑ w i xi − θ
 i =1 

donde y es la salida de la neurona (axón)


f es la función de activación, correspondiente, en
general, a una función no lineal (cuerpo celular)
θ es el sesgo

En general, se utilizan las siguientes funciones de


activación:

f f f
1 1 1

b x b x b x
-1 -1 -1

Limitador duro Hiperbólica Sigmoidal

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Las redes neuronales son estructuras de procesamiento
formadas por una gran cantidad de neuronas, que operan en
paralelo.

Además, los distintos tipos de redes neuronales se generan a


partir de la interconexión de neuronas.

Las principales redes neuronales que se utilizan para


modelación no lineal son:

• Redes perceptrón multicapa


• Redes recurrentes
• Redes de funciones de base radiales (RBFN)

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
VENTAJAS DE LAS REDES NEURONALES

Las redes neuronales deben su capacidad de procesamiento


de información a su estructura distribuida y paralela, a su
capacidad de apredizaje y por tanto de generalización.

Tareas

- Reconocimiento de patrones
- Memorias asociativas
- Aproximación funcional
- Etc.

Propiedades

- No linealidad. Las neuronas son elementos de proceso


generalmente no lineales. La interconexión de estos
elementos genera estructuras dde transformación de datas
donde este carácter no lineal queda distribuido a lo largo
y ancho de la red.

- Modelado de relaciones de entrada/salida.

- Adaptibilidad. Las redes neuronales son por definición


estructuras adaptivas capaces de ajustar sus pesos, y por

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
tanto su función de transferencia, a cambios en su
entorno.

- Tolerancia ante fallos. Una red neuronal tiene la


capacidad de seguir respondiendo de forma no
catastrófica cuando parte de su estructura no está dañada.
Esto es debido al tratamiento distribuido de la
información y a la redundancia implícita en su estructura.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
PERCEPTRÓN MULTICAPA

El perceptrón multicapa es una estructura jerárquica que


consiste en varias capas de neuronas totalmente
interconectadas, que admiten como entradas las salidas de
los elementos de proceso (neuronas) de la capa anterior.

x1

x2 capa 3

capa 1

capa 2

En las redes perceptrón multicapa se distinguen tres tipos de


capas:

• Capa de entrada. Esta formada por n unidades (siendo n el


número de entradas externas) que se limitan a distribuir
las señales de entrada a la capa siguiente.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
• Capas ocultas. Están formadas por neuronas que no tienen
contacto físico con el exterior. El número de capas ocultas
es variable, pudiendo incluso ser nulo.

• Capa de salida. Está formado por m neuronas (siendo m el


número de salidas externas) cuyas salidas constituyen el
vector de salidas externas del perceptrón multicapa.

Los modelos dinámicos neuronales están dados por:

y( t ) = N( y( t − 1),K, y( t − ny), u ( t − 1),K, u ( t − nu ))

donde N es la red neuronal que puede ser un perceptrón


multicapa, como se muestra en la siguiente figura.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
y(t-1)
.
.
.
y(t-ny)
y(t)
u(t-1)
..
.
u(t-nu)

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Aplicaciones

- Aproximación funcional
- Reconocimiento de patrones
- Filtrado de señales
- Eliminación de ruido
- Segmentación de imágenes y señales
- Control adaptivo
- Compresión de datos
- Etc.

Ventajas

- Capacidad de representación funcional universal. Gran


rapidez de procesamiento. Genera buenas
representaciones internas de las características de los
datos de entrada. Ampliamente estudiada. Es la red
neuronal más aplicada en la práctica

Desventajas

- Tiempo de aprendizaje elevado para estructuras


complejas

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Ejemplo Modelación de la química del agua de una central
térmica utilizando redes neuronales.

Se considera la central térmica a carbón Anllares (350


MW), propiedad de la empresa Unión Eléctrica Fenosa
(UEFSA), España. Esta central tiene en operación un
sistema experto denominado SEQA que permite adquirir
variables relacionadas con las propiedades químicas de los
siguientes flujos del ciclo agua-vapor: vapor condensado,
agua de alimentación, vapor saturado, vapor sobrecalentado
y vapor recalentado.

Vapor
Sobrecalentado

Turbinas
Condensador
Vapor
Saturado
Vapor
Recalentado
Caldera
Vapor
Condensado Agua de
Alimentación

Las propiedades químicas analizadas para los flujos


considerados son: la conductividad catiónica, la
Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
conductividad específica, el pH y el porcentaje de O2. La
utilización de modelos predictivos para estas propiedades
químicas, en el sistema experto SEQA, permite controlar los
problemas de corrosión de componentes presentes en la
producción de energía eléctrica. Especialmente, es
importante la modelación de la conductividad catiónica del
ciclo agua-vapor, debido a que esta propiedad es muy
representativa de las impurezas del agua.
Como ejemplo de la modelación neuronal de las
propiedades químicas del agua, se presentan los resultados
obtenidos para la modelación de la conductividad catiónica
del agua de alimentación (CCaa). Las variables de entrada al
modelo son: la potencia generada de la central (P) y la
conductividad catiónica del condensado (CCcond, flujo
precedente). Los datos son adquiridos con un período de
muestreo de 15 minutos.

El modelo neuronal para la conductividad catiónica del


agua de alimentación está dada por:

CC aa ( k ) = N (CC aa ( k − 1), P( k − 1), P( k − 2 ),


CC cond ( k ), CC cond ( k − 1))

donde N es un perceptrón multicapa con una capa oculta de


neuronas de funciones de activación tangente hiperbólica y
una capa de salida lineal.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
REDES RECURRENTES

Estos modelos son capaces de representar sistemas


realimentados dinámicos no lineales (Narendra, 1990).

x1(t+1)
x1(t)

x2(t)
x2(t+1)
..
. .
.
.
xn(t)
xn(t+1)

z-1

z-1
z-1

Además, se debe mencionar que existen diversos modelos


neuronales que son combinaciones de las redes perceptrón
multicapa y redes recurrentes.
Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
REDES DE FUNCIONES
DE BASE RADIALES (RBFN)

Las redes de funciones de base radiales (RBFN “Radial


Basis Function Networks”) consisten en dos capas (Jang,
1993). Los modelos dinámicos basados en las redes RBFN
están dados por:

y( t ) = N( y( t − 1), K, y( t − ny), u( t − 1), K, u ( t − nu ))

donde N es una red neuronal como se muestra en la


siguiente figura con n = ny + nu.

a1
y(t-1)
..
. v1
any
vny
y(t-ny) ∑ y(t)

u(t-1)
..
. vn
u(t-nu) an

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
La capa oculta esta compuesta por n unidades radiales
totalmente conectadas al vector de entrada. Las funciones de
transferencia de la capa oculta son similares a una función
de densidad gaussiana, es decir:

 x − ri 2

a i = exp − 

 σ 2i 

donde x = [ y( t − 1), K , y( t − ny), u( t − 1), K u( t − nu )] es el vector


de entradas de la red, ri son los centros de las unidades
radiales, σ i representan los anchos.

La salida de la red está dada por:


n
y( t ) = ∑v a i i
i=1

donde vi son los pesos de las unidades radiales.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Ejemplo Modelación neuronal basada en RBFN para un
fermentador batch de alimentación.

La presión en el estanque de fermentación puede ser


controlada a través del cambio de flujo de aire de salida
manteniendo constante el flujo de aire de entrada.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
El modelo de la red está dado por:

y$ ( k + 1) = N( y( k ), u ( k ))

donde y(k) es la presión en el estanque y u(k) es el flujo de


salida. Además, N es una red neuronal lineal/RBF dada por
las siguientes ecuaciones:
n
y( k + 1) = w 0 + ∑ w 1i φ i ri (k ) + w T2 x ( k )
i =1

ri (k ) = x ( k ) − c i

[
x (k ) = y(k ),K, y(k − n y ), u( k ),K, u( k − n u ) ]T

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Aplicaciones

- Aproximación funcional
- Reconocimiento de patrones

Ventajas

Capacidad de representación funcional universal. La


estructura de esta red tiene interpretación directa, lo que
permite realizar una buena inicialización de los pesos de la
red, y extraer conocimiento de las estructuras ajustadas. La
buena inicialización de los pesos acelera el proceso de
aprendizaje.

Desventajas

El procesamiento realizado es algo más complejo que en el


caso del perceptrón multicapa.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
OTROS TIPOS DE REDES

Adaline. Estas neuronas tienen capacidad de aprendizaje


debido a que sus pesos son cambiados adaptivamente de
acuerdo a un algoritmo adaptivo. Sus aplicaciones
principales son: filtrado adaptivo de señales, reconocimiento
de patrones. Son fácilmente implementables en hardware
debido a su sencillez y homogeneidad, sin embargo sólo son
capaces de resolver problemas de clasificación linealmente
separables y llevar a cabo transformaciones lineales.

Mapas autoorganizativos de Kohonen. En este caso, las


neuronas están ordenadas topológicamente. Frente a la
presentación de un patrón n-dimensional de entrada,
compiten lateralmente hasta que sólo una de ellas queda
activa. El objetivo es que patrones de entrada con
características parecidas queden asociados a neuronas
topológicamente cercanas. Sus principales aplicaciones son:
agrupación y representación de datos, compresión de datos y
optimización.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
ENTRENAMIENTO DE REDES NEURONALES

Se entiende por entrenamiento el cálculo de pesos y sesgos


de manera que la red se comporte de una manera deseada.
De acuerdo al tipo de entrenamiento, las redes se pueden
subdividir en dos grandes grupos:

• Redes con entrenamiento supervisado. Estas redes se


entrenan presentando, para cada combinación de entradas,
las salidas que se espera ellas produzcan. Los algoritmos
de entrenamiento calculan pesos y sesgos nuevos de
manera de minimizar el error entre la salida deseada y la
obtenida realmente.

• Redes sin supervisión. Los algoritmos de entrenamiento


calculan nuevos pesos libremente. Estas redes se utilizan
como clasificadores, pues se caracterizan por asociar una
combinación de entradas especifica con una sola salida.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
ALGORITMO DE ENTRENAMIENTO
BACKPROPAGATION

El algoritmo de entrenamiento backpropagation se utiliza


para ajustar los pesos y sesgos de un red, con el fin de
minimizar la suma del cuadrado de los errores de la red.

El algoritmo backpropagation es un método iterativo de


optimización de descenso según el gradiente, cuyos detalles
se presentan a continuación.

Para una neurona j en una capa oculta o en la salida, la


señal de salida es

 n 
o j = f  ∑ w ijo i − b j 
 i =1 

donde f es la función de activación de la neurona


wij son los pesos de las conexiones entre la neurona
considerada, j, y la neurona i, perteneciente a la capa
precedente.
oi es la salida de la neurona i de la capa precedente
bj es el sesgo de la neurona j

En este caso, se considera funciones de activación sigmoide


logarítmicas.
Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Además, se define
n
net j = ∑ w ijo i − b j
i =1

La salida de la neurona j, entonces, está dada por

(
o j = f net j = ) 1
1+ e
− net j

Para el entrenamiento, el valor -bj se considera como un


peso correspondiente a la conexión de la neurona j con una
supuesta neurona de la capa precedente cuya salida es
constante e igual a uno.

El algoritmo de backpropagation permite ajustar los pesos


de la red neuronal con el fin de minimizar el error
cuadrático sobre un conjunto de entradas y salidas asociadas
(patrones) que la red debe ser capaz de aprender para luego
realizar generalizaciones a partir de ellas.

Además, se define como superficie de error a la función


multivariable generada por la expresión del error de ajuste
en términos de los pesos y sesgos de las neuronas de la red.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
El algoritmo backpropagation permite determinar los
valores de los pesos para los cuales la función de error es
mínima. Esto no siempre se logra, convergiendo muchas
veces el algoritmo a mínimos locales, no al mínimo global
buscado, o simplemente no convergiendo.

Se considera una red con M neuronas en la capa de salida y


suponiendo que se dispone de un conjunto de entrenamiento
con P patrones, uno de los cuales, denominado p, tiene
salidas dadas por

[
t p = t p1 , t p 2 ,K , t pM ]
el error cuadrático tiene, para ese patrón, la siguiente
expresión

1 M
(
E p = ∑ t pi − o pi )
2

2 i =1

que corresponde al error tomado para derivar la regla de


optimización.

Los valores tpi representan las salidas deseadas ante las


entradas correspondientes al patrón p. Cuando dicho patrón
es presentado a la red, los pesos se modifican según una

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
regla iterativa derivada del método de optimización según el
gradiente, con lo cual el peso wij según la ecuación

w ij ( h) = w ij ( h − 1) + ∆w ij ( h)

donde h corresponde al contador dentro de una iteración. En


este caso, una iteración se define como la presentación (una
vez) de todos los patrones entrada/salida de los cuales se
dispone para el entrenamiento.

El valor de ∆w ij ( h) se calcula como

 ∂E p   ∂Ep ∂net j 
∆w ij ( h ) = η −  = η − 
(*)
 ∂ w ij   ∂ net j ∂w ij 

donde η es la tasa de aprendizaje (constante de


proporcionalidad) ( 0 < η <1)

En general, los pesos se inicializan entre cero y uno


aleatoriamente.

Se define el parámetro δj como

∂E p ∂E p ∂o j
δj = − =−
∂net j ∂o j ∂net j

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
En las expresión siguientes, el subíndice p se ha omitido por
simplicidad.

Para calcular las derivadas es necesario tener en cuenta que


la función de activación escogida es una sigmoide
logarítmica, cuya derivada es

df ( x ) d  1  1  1 
=   = 1 −  = f ( x )(1 − f ( x ))
dx dx  1 + e− x  1 + e − x  1 + e−x 

Para una neurona j en la capa de salida se tiene, entonces,

( ) (
δ j = t j − oj oj 1 − oj )
Para una neurona en la capa oculta o en la capa de entrada,
se tiene

δ j = o j (1 − o j )∑ (δ k w jk )
k

donde el contador k cubre las neuronas de la capa posterior


a la j.

Entonces, la corrección de los pesos se comienza por la capa


de salida y se propaga hacia atrás hasta llegar a la capa de
entrada.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Con esto, el término (*) se puede expresar como

∆w ij = ηδ joi
Ahora bien, normalmente no se emplea sólo esta expresión
sino que se agrega un término denominado momentum, que
corresponde al cambio anterior en el peso ponderado por el
coeficiente de momentum. Entonces, se tiene

∆w ij = ηδ joi + α∆w ij ( h − 1)
donde α es el coeficiente de momento. Este término permite
suavizar la convergencia del método y ayuda a que la
convergencia de los pesos no se vea demasiado afectada por
irregularidades en la superficie de error.

Considerando los P patrones de que se dispone y con los


cuales se realizará el entrenamiento, la expresión para el
error total, o error de ajuste, es la siguiente

1 M 2
( )
P P
E = ∑ E p = ∑  ∑ t pi − opi 
p =1 p =1  2 i =1 

En general, el entrenamiento se considera acabado cuando el


valor de E es menor o igual que un límite preestablecido.

Doris Sáez (Marzo, 2002). Apuntes II. Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
IDENTIFICACION CON REDES NEURONALES

Modelación directa

d
d’
u yp
Proceso

ym

Algoritmo
de Aprendizaje

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
En este caso, se entrena una red neuronal de manera de
obtener la dinámica directa de la planta.

La red es colocada en paralela a la planta y el error entre el


sistema y las salidas de la red son usados como entrada al
entrenamiento (“Backpropagation”).

Ecuación del sistema no lineal (Proceso)

y p ( t + 1) = f (y p ( t ),K, y p ( t − n + 1), u( t ),K, u (t − n + 1) )

Red neuronal (Modelo)

y m (t + 1) = f̂ (y p ( t ),K, yp ( t − n + 1), u ( t ),K, u( t − n + 1) )

donde f̂ es la relación de entrada – salida dada por la red


neuronal.

Luego de un tiempo adecuado de entrenamiento, se tiene:

ym ≈ yp

De esta manera, la red se independiza de la planta, es decir:

y m ( t + 1) = f̂ (y m ( t),K, y m ( t − n + 1), u( t ),K, u ( t − n + 1) )

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Modelación inversa

ss

r u yp
Proceso
M

Algoritmo
de Aprendizaje

ss es la señal de entrada para el entrenamiento.

Los modelos inversos de la dinámica de la planta juegan un


rol importante en el diseño de control.

La salida yp es usada como entrada a la red neuronal. La


salida de la red u es comparada con la entrada del sistema ss
(señal de entrenamiento) y este error es usado para entrenar
la red.

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Esta estructura claramente tiende a forzar a la red neuronal
a representar la dinámica inversa de la planta.

Modelación inversa especializada

r u yp
Proceso
C

Algoritmo ym
de Aprendizaje
M

En este caso, el modelo red neuronal inverso precede al


sistema y recibe como entrada la referencia deseada de la
salida.

Esta estructura de aprendizaje contiene además un modelo


red neuronal directo (M).
Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
La señal de error para el algoritmo de entrenamiento, en este
caso, es la diferencia entre la señal entrenada ym y la señal
entrenada yp.

Alternativamente, la señal de error puede ser la diferencia


entre r y yp.

La estructura entrada salida de la modelación del sistema


inverso está dada por:

u ( t ) = f −1 (y p ( t ),K , y p ( t + n − 1), r ( t + 1), u ( t − 1),K , u ( t − n + 1) )

Si no se dispone de yp,

u ( t ) = f −1 ( y m ( t),K, y m ( t + n − 1), r ( t + 1), u ( t − 1),K, u ( t − n + 1) )

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
ESTRUCTURAS DE CONTROL
CON REDES NEURONALES

Existen diversas estructuras de control bien establecidas


para sistemas no lineales (Hunt, 1992).

Control supervisor o por operador

Operador u y
Proceso
Humano

Red u y
Proceso
Neuronal

En este caso, se diseña un controlador que imite las acciones


de control del operador humano.

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
El controlador corresponde a una red neuronal que es
entrenada con la información sensioral recibida por el
operador y la salida del proceso.

Control inverso directo

yd y
G-1 G

yd Red y
Planta
Neuronal

En este caso, se utiliza un modelo inverso de la planta talque


el sistema compuesto resulte la identidad entre la salida del
proceso y la salida deseada.

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Control por modelo de referencia

Modelo de
Referencia

yr
+
r u yp er
Proceso -
C

Algoritmo
de Aprendizaje

El funcionamiento deseado del sistema en lazo cerrado es


especificado a través de un modelo de referencia estable, que
se define por el par entrada-salida {r(t),yr(t)}.

El sistema de control pretende llevar a la salida de la planta


yp(t) a la salida del modelo de referencia yr(t)
asintoticamente, es decir:

lim y r ( t ) − y p ( t ) ≤ ε ε≥0
t →∞

En esta estructura, el error entre yr e yp es usado para


entrenar al controlador neuronal.
Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
Control por modelo interno

ys + e r u yp
F Proceso
- C

+
ym
-
M

En este caso, los modelos directo e inverso son utilizados


directamente como elementos dentro del lazo de
retroalimentación.

La diferencia entre la salida del sistema yp y la salida del


modelo ym es utilizada en la retroalimentación.

La retroalimentación es usada por el subsistema controlador


que utiliza un controlador relacionado con el inverso del
sistema.

El subsitema F es usualmente un filtro lineal que introduce


robustez al sistema.

Doris Sáez (Marzo, 2002). Apuntes II: Control basado en Redes Neuronales. Seminario AADECA-
UBA, Buenos Aires.
SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales


y control predictivo.
Técnicas modernas de control”

Profesora: Dra. Doris Sáez

APUNTES III:
FUNDAMENTOS DE CONTROL PREDICTIVO
CONTROL PREDICTIVO BASADO EN MODELOS
(MBPC “Model Based Predictive Control”)

El control predictivo basado en modelos se presenta actualmente


como una atractiva herramienta de control que permite incorporar
criterios operacionales a través de la utilización de una función
objetivo y restricciones para el cálculo de las acciones de control.
Además, estas estrategias de control han alcanzado un nivel muy
significativo de aceptabilidad industrial en aplicaciones prácticas
de control de procesos.

El control predictivo basado en modelos se basa principalmente en


los siguientes elementos:

- El uso de un modelo matemático del proceso que se utiliza


para predecir la evolución futura de las variables controladas
sobre un horizonte de predicción.

- La imposición de una estructura en las variables manipuladas


futuras.

- El establecimiento de una trayectoria deseada futura, o


referencia, para las variables controladas.

- El cálculo de las variables manipuladas optimizando una cierta


función objetivo o función de costos.

- La aplicación del control siguiendo una política de horizonte


móvil.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
ESTRATEGIA DEL MBPC

La metodología de los controladores MBPC consiste en los


siguientes pasos:
u(t+j/t)
u(t)

y(t)
y(t+j/t)

t t+1... t+j ... t+N

1. Las salidas futuras para un horizonte de predicción N son


predichas en cada instante t, usando un modelo del proceso.
Estas salidas predichas y$ ( t + j / t) dependen de los valores
conocidos hasta t (entradas y salidas pasadas) y además
pueden depender de las señales de control futuras u(t+j/t) que
se quieren calcular.

2. Las acciones de control futuras u(t+j/t) son calculadas


optimizando una función objetivo de manera de llevar la
salida del proceso lo más cerca posible de una trayectoria de
referencia dada. Este criterio, generalmente es una función
cuadrática de los errores entre la salida predicha y la
trayectoria de referencia deseada, incluyendo en muchos
casos el esfuerzo de control.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
3. Sólo se aplica u(t/t) al proceso, debido a que en el instante
siguiente t+1 se tienen los valores de todas las variables
controladas hasta t+1 y variables manipuladas hasta t.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
ESTRUCTURA BÁSICA DEL CONTROL MBPC

La figura muestra la estructura básica de las estrategias de control


predictivo basado en modelos. En este caso, se hace uso de un
modelo para predecir las salidas futuras del proceso, basándose
además en los controles futuros o entradas futuras propuestas.
Estas señales son calculadas por un optimizador teniendo en
cuenta una función de costo y restricciones del proceso.

Trayectoria
de referencia
Entradas pasadas
y salidas pasadas
Salidas +
Modelo predichas

Controles
futuros

Errores
Optimizador futuros

Función
Restricciones
de costo

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
ELEMENTOS DEL MBPC

Los elementos principales del control predictivo son:

- Modelos de predicción

- Función objetivo

- Obtención de la ley de control

MODELOS DE PREDICCIÓN

El modelo de predicción debe ser capaz de capturar la dinámica


del proceso para poder predecir las salidas futuras, al mismo
tiempo que debe ser sencillo de usar y comprender, y además
permitir un análisis teórico.

Las estrategias de MBPC utilizan diferentes modelos del proceso


para representar la relación de las salidas con las entradas medibles
(variables manipuladas y perturbaciones medibles). Además, se
considera incluir las entradas no medibles, el ruido y los errores de
modelación (pereturbaciones).

A continuación se presentarán los principales modelos utilizados


para las formulaciones del control predictivo.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
Modelo de respuesta al escalón

y(t)

g1 g2 gi gN
t t+1 t+2 t+N

La salida está dada por:


y( t ) = ∑ g i ∆u ( t − i) + n ( t)
i =1

donde gi son los valores muestreadas cuando el proceso es excitado


con un escalón.

Las perturbaciones se consideran constantes a lo largo del


horizonte de predicción e iguales al valor en el instante t, es decir:

n$ ( t + j / t ) = n$ ( t / t) = y( t ) − y$ ( t / t )

La predicción está dada por:


ŷ( t + j / t ) = ∑ g i ∆u ( t + j − i / t ) + n̂ ( t + j / t)
i =1

Entonces, la predicción está dada por


Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
y$ ( t + j / t )
j ∞
= ∑ g i ∆u( t + j − i / t ) + ∑ g i ∆u( t + j − i) + n$ ( t + j / t )
1
i=144 42444 3 i1 442443
= j+1
acciones de acciones de
control futuras control pasadas

Reemplazando la predicción de la perturbación en esta ecuación y


el modelo para y$ ( t / t) en ella, se tiene:

j ∞
ŷ( t + j / t ) = ∑ g i ∆u ( t + j − i / t ) + ∑ g ∆u (t + j − i)
i
i =1 i = j+1

+ y ( t ) − ∑ g i ∆u ( t − i ) (**)
i =1
Entonces, se define la respuesta libre del sistema como los valores
conocidos hasta el instante t, es decir:

∞ ∞
pj = ∑ g ∆u( t + j − i) + y( t) − ∑ g ∆u( t − i)
i= j+1
i
i =1
i

[ ]
p j = ∑ g j+i − g i ∆u( t − i) + y( t )
i=1

Como g j+i − gi ≈ 0 para i > N, se tiene:

[ ]
N
p j = ∑ g j+i − g i ∆u( t − i) + y( t )
i=1
Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
Por lo tanto, la ecuación (**) se puede reescribir como:

j
y$ ( t + j / t ) = ∑ g i ∆u( t + j − i / t ) + p j
i =1

Entonces, las predicciones en el intervalo N1 y N2 están dadas por:

y$ ( t + N1 / t ) = g1∆u( t + N 1 − 1 / t ) +L+g N1 ∆u( t / t) + p N1


y$ ( t + N1 + 1 / t ) = g1∆u( t + N1 / t ) +L+g N1 +1∆u ( t / t ) + p N1 +1
M
y$ ( t + N 2 / t ) = g1∆u( t + N 2 − 1 / t ) +L+g N2 ∆u( t / t) + p N 2

Matricialmente, y considerando que ∆u( t + j − 1) = 0 para j >


Nu, se tiene:

y$ = G∆u + p

donde

y$ = [ y$ ( t + N1 / t ) y$ ( t + N1 + 1 / t) L y$ ( t + N 2 / t )]
T

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
 g N1 L g1 0 L L 0 
g L L g1 0 L 0 
 N1 +1 
G= M M M M O O 0 
 
 M M M M O O M 
 gN L L L L L g N2 −N u +1 
 2

∆u = [ ∆u( t / t) ∆u( t + 1 / t) L ∆u( t + N u − 1 / t )]


T

[
p = p N1 , p N1+1 ,K, p N2 ]
Una gran ventaja de este método es que no requiere información
previa sobre el proceso, con lo cual el proceso de identificación se
simplifica. Además, permite modelar sistemas complejos como fase
no mínima y sistemas con retardos. Sin embargo, esta
representación sólo es válida para procesos estables.

Modelo función de transferencia

Este modelo está dado por la siguiente ecuación:

A( z −1 ) y( t) = B( z −1 ) u ( t) + n ( t )

A( z −1 ) = 1 + a1z −1 + a 2 z −2 +L+ a na z − na

B( z −1 ) = b1z −1 + b 2 z −2 +L+ b nb z − nb

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
Para calcular la predicción, se considera un modelo ARIMAX:

w ( t)
A( z −1 ) y( t) = B( z −1 ) u (t − d ) + n ( t) = B( z −1 ) u ( t − d) +

B w
yt = ut−d + t
A A∆
B w t+ j
y t+ j = u t− d + j +
A A∆

donde
1 F
= E j + j z− j
{
Ecuación diofántica
A∆ A∆
123
Cuociente
Re sto

( Fj y G j notación en ARMAX)
1
La división se realiza hasta que Ej sea un polinomio de grado
A∆
j −1 , de modo que E jw t+ j tenga los valores futuros de wt, es decir,
w t +1 , w t +2 ,K, w t+ j

Además,

A∆ = 1 − z −1 + a 1z −1 − a 1z −2 +L

entonces A∆ es mónico y por ende Ej es mónico.

Por lo tanto,

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
B F
yt+ j = u t − d + j + E jw t + j + j w t (#)
A 123 A∆
123
( w t +1 , w t +2 ,K)
( w t , w t −1 ,K)

Para la determinación de wt, wt-1, ...., se utiliza el modelo


ARIMAX, es decir

wt
Ay t = Bu t − d +

w t = A∆y t − B∆u t − d

Entonces, reemplazando w t en la ecuación (#), se obtiene:

B F F
yt+ j = ut − d + j + E j w t + j + j A∆y t − j B∆u t − d
A A∆ A∆
yt+ j
B B
= u t − d + j + Fj yt − Fj u t − d + E j w t + j ( j ≥ 1)
A A

Fj es de grado n-1 (n orden del sistema) considerando que Ej tiene


grado j-1 por hipótesis.

A continuación,

B B
yt + j = u t − d + j + E jw t + j + Fjy t − Fj u t − d + j z − j
A A1424 3
u t −d

yt+ j =
B
A
[ ]
u t − d + j 1 − Fjz− j + E jw t + j + Fjy t

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
donde según la ecuación diofántica

Fjz− j = 1 − E jA∆

Entonces,

B
yt+ j = u t − d + jE j∆A + E jw t + j + Fjy t
A

y t + j = BE j∆u t − d + j + E jw t + j + Fjy t

Se define G j ≅ BE j

y t + j = G j∆u t − d + j + E jw t + j + Fjy t

Por lo tanto, la predicción a j pasos de “y” está dada por:

[ ]
E y t + j / t ≡ y$ t + j = G j∆u t − d + j + Fjy t (*)

pues E jw t+ j genera sólo valores futuros de ruido blanco (w t+1, wt+2,


wt+3, ...).

Gj representa los j primeros términos de la respuesta escalón,


entonces g ji = g i para i = 0, 1, 2, ... < j. Es decir,

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
g j0 = g 10 =L = g k 0 =L = g 0
M
g ji = g ji =L = g ki =L = g i

Por lo tanto, se tiene

G1 = g 0 + g1z −1 +L+g n b z − n b
G 2 = g0 + g1z −1 +L+g n b +1z − ( n b +1)
G 3 = g 0 + g1z −1 +L+ g n b + 2 z − ( n b + 2 )

G j = g 0 + g1z −1 +L+ g n b + j −1z −( n b + j−1)

Por otra parte,

y$ t + j = G j∆u t − d + j + Fjy t

y si d = 1, N 1 = 1 y N2 = N, se tiene

y$ t +1 = G1∆u t + F1y t
y$ t + 2 = G 2 ∆u t +1 + F2 y t
M
y$ t + N = G N ∆u t −1+ N + FN y t

A continuación, se agrupan los términos conocidos hasta “t” en el


vector f {∆u t −1 , ∆u t−2 ,..., y t , y t−1 ,...} , es decir

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
[ ]
f t +1 = G 1 ( z −1 ) − g0 ∆u t + F1y t
ft +2 = [G ( z
2
−1
]
) − g1z −1 − g0 ∆u t +1 + F2 y t
M

Entonces, la expresión (*) se puede expresar de manera vectorial


como

y$ = Gu
~+f

donde

y$ ≡ [ y$ t+ , y$ t +2 ,K, y$ t+N ] son las predicciones desde el horizonte


de predicción N 1 = 1 hasta N2 = N.

 g0 0 L L 0
 g g0 L L 0
 1 
 M M O 
G= 
 
 M M 
 
g N −1 gN−2 L g0 N ×N

~u ≡ [∆u t , ∆u t+1 ,..., ∆u t+2 ,...., ∆u t+ N −1 ] son las acciones de


T

control futuras.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
Por lo tanto, Gu ~ contiene términos desconocidos por determinar
{∆u t , ∆u t+1 ,..., ∆u t +N−1} y f agrupa los términos conocidos
{∆u t−1 , ∆u t−2 ,..., y t , y t−1 ,...}
Está representación es también válida para procesos inestables.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
FUNCIÓN OBJETIVO

Los diferentes algoritmos de control predictivo utilizan diferentes


funciones objetivo o de costo para la obtención de la ley de
control.

En primer lugar se considera la función objetivo dada por:

J = [ w( t + 1) − y$ ( t + 1 / t) ]
2

donde w(t+1) es la referencia o salida deseada en el instante t+1 y


y$ ( t + 1 / t) es la salida predicha en el instante t+1.

Nótese que utilizando esta función objetivo y un modelo ARIX, se


obtiene un controlador de varianza mínima.

Para reducir variaciones en la variable manipulada o


sobreactuaciones se puede utilizar la siguiente función objetivo,
que además incluye acción integral.

J = [ w( t + 1) − y$ ( t + 1 / t )] + λ[∆u( t) ]
2 2

A continuación, para incluir algunos sistemas de fase no mínima y


sistemas inestables se utiliza la siguiente función objetivo que
incluye horizontes de predicción y control mayores:

N2 Nu
J= ∑ δ( j)[ w( t + j) − y$ (t + j / t )] + ∑ λ(i)[ ∆u(t + i − 1)]
2 2

j= N1 i=1

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
donde δ(j) y λ(j) son coeficientes que ponderan el
comportamiento futuro,
y$ ( t + j / t) es la salida predicha en el instante t+j,
w ( t + j) representa la trayectoria de referencia deseada,
N1 y N2 son los horizontes mínimo y máximo de predicción,
Nu es el horizonte de control

OBTENCIÓN DE LA LEY DE CONTROL

Para obtener los valores u(t+j/t) es necesario minimizar la función


de objetivo planteada anteriormente. Para ello se calculan los
valores de las salidas predichas y$ ( t + j / t ) en función de los valores
pasados de las entradas y salidas, y de las señales de control
futuras, haciendo uso de un modelo de predicción y luego se
sustituyen estos valores en la función objetivo. La minimización de
esta expresión conduce a los valores buscados.

Además se ha encontrado que una estructuración de la ley de


control produce una mejora en la robustez del sistema. Esta
estructura de la ley de control se basa en el uso del concepto de
horizonte de control (Nu), que consiste en considerar que tras un
cierto intervalo Nu < N2 no hay variación en las señales de control
propuestas, es decir:

∆u( t + j − 1) = 0

para j > Nu.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario
AADECA-UBA, Buenos Aires.
CONTROL POR MATRIZ DINÁMICA
(DMC “Dynamic Matrix Control”)

Este algoritmo utiliza el modelo repuesta al escalón para la


predicción.

Matricialmente, y considerando que ∆u( t + j − 1) = 0 para j >


Nu, se tiene que la predicción está dada por:

y$ = G∆u + p

donde

y$ = [ y$ ( t + N1 / t ) y$ ( t + N1 + 1 / t) L y$ ( t + N 2 / t )]
T

 g N1 L g1 0 L L 0 
g L L g1 0 L 0 
 N1 +1 
G= M M M M O O 0 
 
 M M M M O O M 
 gN L L L L L g N2 −N u +1 
 2

∆u = [ ∆u( t / t) ∆u( t + 1 / t) L ∆u( t + N u − 1 / t )]


T

[
p = p N1 , p N1+1 ,K, p N2 ]
Por otra parte, el controlador por matriz dinámica utiliza la función
objetivo definida en la ecuación (*) con δ = 1, la cual
matricialmente está dada por:
J = [ w − y$ ] [ w − y$ ] + λ∆u T ∆u
T

Reemplazando en esta ecuación la predicción y$ , se tiene

J = [ w − G∆u − p] [ w − G∆u − p] + λ∆u T ∆u


T

Si se define e 0 = w − p , entonces

J = [e0 − G∆u] [e0 − G∆u] + λ∆u T ∆u


T

Minimizando esta función objetivo se obtiene:

[ ]
−1
∆u = G G + λI G Te 0
T

donde sólo se aplica ∆u(t/t) de acuerdo a la estrategia de control de


horizonte móvil definida. Esto es,

∆u( t / t ) = Ke 0
[ ]
−1
donde K es la primera fila de matriz G G + λI
T
G.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
CONTROL PREDICTIVO GENERALIZADO
G.P.C. (“Generalized Predictive Control”)

Para el diseño de Controladores Predictivos Generalizados G.P.C.


se utiliza el siguiente modelo ARIMAX:

A( z −1 ) y t = B( z −1 ) u t − d + n t

C( z −1 ) w t
donde nt =

Predicción óptima

[ ]
y$ t + j = E y t + j / t = G j ∆u t −d + j + Fj y t (*)

con G j = BE j y 1 = A∆E j + z − jFj (Ecuación diofántica)

y si d = 1, N 1 = 1 y N2 = N, se tiene

y$ t +1 = G1∆u t + F1y t
y$ t + 2 = G 2 ∆u t +1 + F2 y t
M
y$ t + N = G N ∆u t −1+ N + FN y t

A continuación, se agrupan los términos conocidos hasta “t” en el


vector f {∆u t −1 , ∆u t−2 ,..., y t , y t−1 ,...} , es decir

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
[ ]
f t +1 = G 1 ( z −1 ) − g0 ∆u t + F1y t
ft +2 = [G ( z
2
−1
]
) − g1z −1 − g0 ∆u t +1 + F2 y t
M

Entonces, la expresión (*) se puede expresar de manera vectorial


como

y$ = Gu
~+f

donde

y$ ≡ [ y$ t+ , y$ t +2 ,K, y$ t+N ] son las predicciones desde el horizonte


de predicción N1 = 1 hasta N 2 = N.

 g0 0 L L 0
 g g0 L L 0
 1 
 M M O 
G= 
 
 M M 
 
g N −1 gN−2 L g0 N ×N

u ≡ [∆u t , ∆u t+1 ,..., ∆u t+2 ,...., ∆u t+ N −1 ] son las acciones de


~ T

control futuras.

Por lo tanto, Gu ~ contiene términos desconocidos por determinar


{∆u t , ∆u t+1 ,..., ∆u t +N−1} y f agrupa los términos conocidos
{∆u t−1 , ∆u t−2 ,..., y t , y t−1 ,...}
Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
Para el cálculo de las acciones de control futuras, el algoritmo de
Control Predictivo Generalizado G.P.C. minimiza la siguiente
función de costos:

∑ [ y$ ] + ∑ λ [ ∆u ]
N2 Nu
2
J= − rt + j
2
t+j i t + i −1
(**)
j= N 1 i =1

En general,

N1 = d (N1 = 1, por defecto)

N2 = 10 o N2 es del orden del tiempo de estabilización (Ts)


del sistema.

Nu = 1 hasta el orden de la planta.

Además, la función de costo definida anteriormente (ecuación (**))


se puede expresar en forma más compacta por

J = ( y$ − r ) T ( y$ − r ) + λ~
u T~
u

donde

y$ = Gu
~+f

r = [ rt +1 , rt +2 ,..., rt + N ] (con N1 = 1, N2 = N)
T

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
 g0 0 L 0 
 g g0 L 0 
 1 
 M M O 
G= 
g N u −1 g N u − 2 L g0 
 M M M 
 
 g N −1 g N − 2 L g N − N u 
N× N u

pues ∆u t + j = 0 para j ≥ Nu.

Entonces,

~ + f − r ) T (Gu
J = ( Gu ~ + f − r ) + λ~
u T~
u

Para la minimización de esta función de costos, se tiene

∂J
~ =0
∂u
Entonces,
~ + f − r ) T G + λ~
( Gu uT = 0

~ + f − r ) + λ~
G T (Gu u=0

G TGu~ + λ~
u = GT (r − f )

Por lo tanto, las acciones de control óptimas están dadas por:

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
u = ( GT G + λI ) −1 G T ( r − f )
~

De este modo, se tiene

 ∆u t  H1T 
 ∆u   T
 t +1  H
=  2 ( r − f )
   M 
   

 t + N u −1   
u

Sin embargo, sólo se utiliza ∆ut, dado que en el siguiente instante


se desplazan los horizontes de predicción y control, siendo posible
calcular una nueva acción de control para ese instante.

La acción de control en “t” está dada por:

∆u t = H1T ( r − f )

−1 T
con H 1T la primera fila de (G G + λI) G
T

∆u t = u t − u t −1

Entonces,

u t = u t −1 + H 1T ( r − f )

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
RESUMEN
CONTROL PREDICTIVO GENERALIZADO (G.P.C.)

Modelo ARIMAX

wt
A( z −1 ) y t = B( z −1 ) u t −d +

Predicción óptima

[ ]
y$ t + j = E y t + j / t = G j ∆u t −d + j + Fj y t

con G j = BE j y 1 = A∆E j + z − jFj (Ecuación diofántica)

Función de costo

∑[ ]
N2 Nu
y$ t + j − rt + j + ∑ λ i [ ∆u t + i − 1 ]
2
J=
2

j= N 1 i =1

con ∆u t + j = 0 para j ≥ Nu.

Acción de control óptima

u t = u t −1 + H 1T ( r − f )

−1 T
con H 1 la primera fila de (G G + λI) G
T T

~ términos desconocidos ∆u t , ∆u t +1 ,..., ∆u t+ N


Gu { u −1
}
f términos conocidos {∆u t−1 , ∆u t −2 ,..., y t , y t−1 ,...}
Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
EJEMPLO DE GPC MULTIVARIABLE

Columna de destilación

Variable manipuladas: Tasa de tiro superior (top draw rate) u1


Tasa de tiro lateral (side draw rate) u2
Reflujo inferior (bottom reflux duty) u3

Variables controladas: Composición producto superior (top


product composition) y1
Compision de producto lateral
(side product composition) y2
Temperatura inferior (Bottom
temperature) y3

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
La dinámica de la planta está descrita por:

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
Los retardos van desde 0 a 28 min.

El modelo discreto con Ts = 4 min, está dado por:

La matriz A(z-1) es una matriz diagonal con los siguientes


elementos:

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
El mínimo retardo de las variables de salida es 27, 14 y 0 min.
Entonces, los mínimos retardos son 6, 3 y 0 (con Ts = 4 min).

Ny = 30 y N u = 5 para todas las variables.

1 0 0  2 0 0 
Q = 0 1 0  R = 0 2 0 
   
0 0 1  0 0 2 

Set points o referencias = 0.5, 0.3 y 0.1 respectivamente.

Prueba realizada: Cambio de set-point de la composición superior


de 0.5 a 0.4

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
Como se observa todas las variables llegan rápidamente al set-
point, sólo la temperatura inferior tiene un overshoot apreciable.

El reflujo superior (upper reflux) es considerado como una


perturbación no medible.

Una perturbación de 0.5 es introducida en el reflujo superior,


manteniendo todas las referencias en cero.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
Como se puede observar la perturbación es rápidamente cancelada.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
CONTROL PREDICTIVO CON RESTRICCIONES

En la práctica, se requiere mantener las variables del proceso en


rangos que aseguren el buen comportamiento de los equipos y
evitar situaciones críticas. Por ejemplo, los actuadores tienen
restricciones de límite y velocidad.

Además, los puntos de operación del proceso están determinados


por objetivos económicos, que usualmente llevan al proceso a
operar cerca de las restricciones.

Los sistemas de control, en especial, los sistemas de control


predictivo se anticipan a estas restricciones y corregir las acciones
de control.

TIPOS DE RESTRICCIONES

Restricciones de rango en las variables manipuladas

u min ≤ u ( t + i − 1) ≤ u máx i = 1, …, Nu.

En general, se pueden saturar las variables manipuladas pero la


solución obtenida no es óptima con respecto a la función objetivo
predictiva.

Ejemplo: Control predictivo N u = 2

u ( t ) < u máx

u ( t + 1) < u máx
Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
u(t+1)

GPC
sin restricciones
umax

u* sin restr.
u* u(t)
umax

En forma matricial, la restricción de rango en las variables


manipuladas está dada por:

1  u(t )  1


1  u ( t + 1)  1
u min   ≤   ≤  u
M  M  M max
   
 
1 u ( t + N u + 1)  1

u min 1 ≤ u ≤ 1u max

o bien en función de ∆u ( t )
Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
1 1 0 0 1
1 1 1  1
[u min − u ( t − 1)]  ≤   ≤  [u − u ( t − 1)]
M M O  M 
max

   
 
1 1 L 1 1  1

[u min − u ( t − 1)]1 ≤ T∆u ≤ 1[u max − u ( t − 1) ]

con ∆u = [∆u ( t ), ∆u ( t + 1),K , ∆u ( t + N u + 1)]


T

Restricciones de variación de las variables manipuladas

Los actuadores generalmente no responden con una rapidez


adecuada, por lo cual es usual que se establezcan restricciones
sobre las variaciones de las variables manipuladas.

∆u min ≤ u ( t + i − 1) ≤ ∆u máx con i = 1,…,N u.

con ∆u min , ∆u máx límites mínimo y máximo para las variaciones de


las acciones de control.

Matricialmente, se tiene

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
1 1 0 L 0 1
1 0 1 M 1
∆u min   ≤   ∆u ≤   ∆u máx
 M  M O 0 M
   
1 0 L 0 1 1

∆u min 1 ≤ I∆u ≤ 1∆u máx

Restricciones de rango en las variables controladas

En muchos procesos productivos, por problemas de seguridad o


costos, se debe limitar las variables controladas a rangos de
operación establecidos.

y min ≤ ŷ( t + j) ≤ y máx j = 1, …, Ny.

Utilizando el predictor del GPC, se tiene:

ŷ = G∆u + f

con ∆u = [∆u ( t ), ∆u ( t + 1), K , ∆u ( t + N u + 1)]


T

[
ŷ = ŷ(t + 1),K ,y(t + N y ) ]T

f agrupa los términos conocidos hasta t.

Matricialmente, las restricciones de rango están dadas por:

y min 1 ≤ G∆u + f ≤ 1y máx


Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
y min 1 - f ≤ G∆u ≤ 1y máx − f

Restricciones de variación en las variables controladas

∆y min ≤ ∆ŷ( t + j) ≤ ∆y máx j = 1, …, Ny.

Matricialmente, expresando estas restricciones en función de ∆u, se


tiene:

 ∆ŷ( t + 1)   ŷ( t + 1) − y( t ) 
 M   M 
∆ŷ =  = 
   
   
 ∆ ŷ ( t + N )
y   ŷ ( t + N y ) − ŷ ( t + N y − 1) 

1   ∆ŷ( t + 1)  1 
− 1 1  M   
0
∆ŷ =     −  y( t )

0 0 O    M
    
 M O 1  ∆ŷ ( t + N y )  0
 ∆ŷ( t + 1) 
 M 
∆ŷ = D   − 1 y (t )
  0
 
∆ŷ( t + N y )

ŷ = G∆u + f
Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
∆ŷ = DG∆u + Df − 10 y( t )

Entonces,

∆y min − Df + 10 y(t) ≤ DG∆u ≤ ∆y máx - Df + 10 y( t)

(A∆u ≤ b )

Restricciones para asegurar el comportamiento monotónico

Algunos sistemas de control presentan oscilaciones en las variables


controladas antes de alcanzar una condición de régimen. En
general, estas oscilaciones no son deseables, pues entre otras
razones pueden dar origen a perturbaciones sobre otros procesos.

Para evitar el comportamiento monotónico y en caso que y(t) ≠


w(t), se tiene:

ŷ( t + j) ≤ ŷ(t + j − 1) si y(t) < w(t)

ŷ( t + j) ≥ ŷ( t + j − 1) si y(t) > w(t)

Matricialmente, se tiene:

0  y ( t )
G∆u + f ≤   ∆u +   si y(t) < w(t)
 
G '  f ' 

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
0  y ( t )
G∆u + f ≥   ∆u +   si y(t) > w(t)
G '  f' 

con G’ se compone de las primeras N-1 filas de G y f’ se compone


de las primeras N-1 componentes de f.

Restricciones para evitar comportamiento de fase no mínima

Existen procesos que presentan un comportamiento de fase no


minima, es decir, cuando son excitados responden inicialmente en
sentido inverso a como lo hacen finalmente.

Para evitar este comportamiento, que en ciertos procesos es muy


perjudicial, se incorporan las siguientes restricciones cuando
y(t)≠w(t).

ŷ( t + j) ≤ y( t ) si y(t) > w(t)

ŷ( t + j) ≥ y( t ) si y(t) < w(t)

Matricialmente,

G∆u + f ≤ 1y( t) si y(t) > w(t)

G∆u + f ≥ 1y( t) si y(t) < w(t)

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
CONDICIONES: CONTROL PREDICTIVO
CON RESTRICCIONES

1.- Si no existen restricciones o si éstas no se consideran, la


minimización de la función objetivo genera una solución
analítica.

2.- Si se consideran restricciones, la solución, en general, se


obtiene utilizando un algoritmo numérico de optimización con
restricciones. Para esta clase de problemas, en que la función
objetivo es cuadrática, se cumple:

• Para que exista solución al problema sin restricciones, la


función objetivo debe ser convexa.
• Para que exista solución al problema de optimización con
restricciones, debe haber al menos un valor para el cual las
variables de optimización cumplan todas las restricciones
impuestas.
• Para asegurar la existencia de una solución única, el
espacio de restricciones debe ser convexo

Cuando se incorporan restricciones lineales, el problema de


optimización para el GPC queda definido por:

Min J = (G∆u + f - r) T (G∆u + f - r) + λ∆u T ∆u

s.a A∆u ≤ b

con A, b determinados de acuerdo al tipo de restricción.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
EJEMPLOS DE RESTRICIONES
EN CONTROL PREDICTIVO

Restricciones en las variables manipuladas

Modelo multivariable

e
A( z −1 ) y = B(z −1 )u +

 y (t ) 
y= 1 
y 2 ( t) 

 u1(t ) 
u= 
u 2 ( t ) 

1 − 1.8629 z −1 + 0.8669 z −2
−1 0 
A(z ) =  −1 −2 
 0 1 − 1 .8695 z + 0. 8737 z 

−1 0.0420 − 0.038 z −1 0.4758 − 0.4559 z −1 


B (z ) =  −1 
0.0582 − 0.054 z 0.1445 − 0.1361z −1 

∆u ≤ 0. 2
− 0.3 ≤ u 1 ≤ 0.3
− 0.3 ≤ u 2 ≤ 0.2

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
Restricciones de comportamiento de fase no mínima

Modelo lineal

1− s
G (s ) =
1+ s

con Ts = 0.3 seg.

−1− 1 + 1.2592 z −1
G( z ) =
1 + 0.7408 z −1
Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
GPC sin restricciones Ny = 30, Nu = 10, λ = 0.1

GPC con restricción de fase no mínima

El sistema obtenido es más lento pero los peaks son eliminados.

Doris Sáez (Marzo, 2002). Apuntes III: Fundamentos de Control Predictivo. Seminario AADECA-UBA,
Buenos Aires.
SEMINARIO AADECA-UBA

“Lógica difusa, redes neuronales


y control predictivo.
Técnicas modernas de control”
Profesora: Dra. Doris Sáez

APUNTES III:
CONTROL PREDICTIVO NO LINEAL

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
CONTROL PREDICTIVO NO LINEAL

Debido a que los procesos reales son no lineales o presentan


diferentes condiciones de operación han surgido diversas
estrategias de control para resolver este tema.

En particular se presentarán, a continuación, estrategias de control


predictivo no lineal.

CONTROL PREDICTIVO
“GAIN SCHEDULED” (Chow, 1995)

Modelo no lineal: Modelo interpolado para describir el


comportamiento no lineal del proceso (Modelo discreto variante
en el tiempo).

( ) ( )
A v( t), z −1 y( t) = B v ( t ), z −1 u ( t − 1)

con v(t) es una variable “scheduling” de la cual dependen los


parámetros de los polinomios A y B.

A continuación, se presentan los pasos de la estrategia de control.

1.- Identificación de una familia de modelos lineales

( ) ( )
A i z −1 y( t ) = B i z −1 u ( t − 1)

2.- Derivación de una ley de control GPC para cada modelo


lineal válido para un punto de operación.

( )
∆u i ( t ) = G T G + λI G T (w − f )

3.- La ley de control global “Gain-sheduling” es obtenida


interpolando los parámetros del controlador entre los puntos
Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
de operación. Generalmente, los puntos de operación
dependen de una variable del proceso v(t).

4.- Para la interpolación se puede utilizar la interpolación de


ganancias y ceros del proceso, obteniendo transiciones
suaves en la respuesta del sistema.

Por ejemplo, la ganancia interpolada K está dada por:

v( t) − v1 ( t )
K(v ( t ) ) = K(v1 ( t ) ) + (K (v1 ( t ) ) − K (v1 ( t ) ))
v 2 ( t ) − v1 ( t )

con v(t) es la variable que determina el punto de operación y vi(t)


son los puntos de operación.

CONTROL PREDICTIVO
CON TRANSFORMACIÓN NO LINEAL (Bosley, 1993)

1.- Modelo no lineal

x& = g ( x , u )

2.- Transformación en variables de estado para convertir el


sistema no lineal en un sistema lineal.

3.- Derivación de un controlador lineal (controlador predictivo)


para el sistema lineal

4.- Transformación inversa para determinar la acción de control

Desventaja: Este método es sólo aplicable a ciertos sistemas no


lineales donde es posible encontrar las respectivas
transformaciones.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
CONTROL DMC LINEAL PONDERADO (Di Marco, 1997)

1.- Modelo no lineal: Suma ponderada de modelos lineales para


representar las diferentes zonas de operación.

n
y ( t) = ∑ w i y i ( t )
i =1

donde n es el número de zonas de operación y yi(t) son los


modelos lineales para cada zona de operación.

Las ponderaciones wi son calculadas en función de la distancia d i


entre un punto de operación genérico (actual) y(t) y un punto de
operación yi (t):

d i−1
wi =
n
n
con d i = y( t ) − y i ( t ) y ∑w =1
∑d −1 i
j i =1
j=1

2.- Derivación de un modelo lineal en cada instante de muestreo.

3.- Derivación de una acción de control DMC para cada instante


de muestreo.

CONTROL DMC NO LINEAL (Di Marco, 1997)

1.- Modelo no lineal: Modelo fenomelógico

2.- Derivación de un modelo lineal por linealización en cada


instante de muestreo.

3.- Derivación de un DMC en cada instante de muestreo.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
CONTROL PREDICTIVO
BASADO EN MODELOS DIFUSOS

Los modelos difusos sirven para representar las no linealidades


del proceso.

A continuación, se presentan las diversas estrategias de control


predictivo difuso.

Cipriano & Ramos (1995)

GPC basado en modelos difusos de Takagi & Sugeno.

Modelo difuso de Takagi & Sugeno

R i : Si y(t - 1) es Ali y K y y(t - ny) es Anyi y


u(t - 1) es B1i y K y u(t - nu) es Bnu i
entonces y i (t) = a 1i y( t − 1) + K + a iny y( t − ny)
+ b1i u ( t − 1) + K + b inu u ( t − nu ) + c i
M

∑w y i i
y( t ) = i =1
M

∑w
i =1
i

Controlador difuso

Para cada regla se deriva un controlador GPC lineal. De esta


manera, el controlador difuso incluye las mismas premisas que el
modelo difuso y las consecuencias están dadas por las acciones de
control resultantes (GPC lineales)
Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
R i : Si y(t - 1) es Ali y K y y(t - ny) es Anyi y
u(t - 1) es B1i y K y u(t - nu) es Bnu i
entonces ∆u i (t) = f i (∆u ( t − 1),K, y ( t ), y( t − 1),K)

con fi es un controlador GPC lineal para la regla i.

Entonces, la acción de control GPC difusa está dada por:

∑ w ∆u ( t)
i i
∆u ( t ) = i =1
M

∑w
i =1
i

Desventajas

Consecuencia del modelo difuso regla Ri:

y i (t) = a 1i y( t − 1) + K + a iny y( t − ny )
+ b1i u ( t − 1) + K + b inu u ( t − nu ) + c i
Para cada regla se minimiza la siguiente función objetivo:

N2 Nu
Ji = ∑ [w(t + j) − ŷ (t + j / t)] + ∑ λ ( j)[∆u(t + j − 1)]
2 2
i
j= N 1 j =1

donde ŷ i ( t + j / t ) es la predicción a j pasos con el modelo lineal


de la regla i.

Se debiese minimizar la siguiente función objetivo:

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
N2 Nu
J= ∑ [w( t + j) − ŷ(t + j / t )] + ∑ λ( j)[∆u( t + j − 1)]
2 2

j= N1 j=1

donde ŷ( t + j / t ) es la predicción a j pasos con el modelo difuso


completo.
y

t t+j u

Sin embargo, la solución del GPC difuso (Cipriano & Ramos,


1995) es una buena aproximación y es de fácil y rápida
implementación.

Roubos (1998)

Controlador predictivo basado en la linealización del modelo


difuso de Takagi & Sugeno

Modelo difuso de Takagi & Sugeno

R i : Si x 1 (t) es Ali y K y x n (t) es An i


entonces x i (t + 1) = A i x ( t ) + B i u ( t ) + C i

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
M
x ( t + 1) = ∑ w i x i ( t + 1)
i =1

con wi es el grado de activación normalizado.

1.- Modelo lineal variante en el tiempo equivalente

x (t + 1) = A ( t ) x ( t ) + B( t ) u ( t ) + C( t )

con A ( t ) = ∑ w i (
i =1
t ) A i

n
B( t) = ∑ w i ( t ) Bi
i =1
n
C( t) = ∑ w i ( t )C i
i =1

2.- En cada instante o período de muestreo, se deriva un modelo


lineal, evaluando las premisas del modelo difuso o grados de
activación.

3.- Para cada modelo lineal resultante se diseña un controlador


predictivo lineal.

4.- En el siguiente instante, se actualiza el modelo lineal

Ventajas: Fácil y rápida implementación.

Desventajas: Solución sub-óptima

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Cipriano & Sáez (1996)

Modelo difuso de Takagi & Sugeno

R i : Si y(t - 1) es Ali y K y y(t - ny) es Anyi y


u(t - 1) es B1i y K y u(t - nu) es Bnu i
ei ( t )
entonces A i ( z −1 ) y i (t) = B i ( z −1 ) u ( t − 1) +

Predictor difuso

Se deriva la predicción lineal para cada modelo lineal de cada


regla:

R i : Si y(t - 1) es Ali y K y y(t - ny) es Any i y


u(t - 1) es B1i y K y u(t - nu) es Bnu i
entonces ŷ i = G i ∆u + f i

donde ŷ i es el vector de predicciones


ŷ i = [ŷ i ( t + N1 ),K , ŷ i ( t + N 2 ) ]
T

Entonces, la predicción global está dada por:

M M

∑ w (t ) ŷ ∑ w (t )[G ∆u + f ]
i i i i i
ŷ = i =1
M
= i =1
M

∑ w (t )
i =1
i ∑ w (t )
i =1
i

con wi(t) es el grado de activación y M es el número de reglas.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Controlador difuso

J = (w − ŷ ) (w − ŷ ) + λ∆u T ∆u
T

con w es el vector de referencias futuras, ŷ es el vector de


predicciones y ∆u es el vector de acciones de control futuras.

Sustituyendo el predictor difuso en la función objetivo se tiene:

T
 M
  M

 ∑ w i ( t ) [G i ∆ u + f ]
i   ∑ w i ( t )[G i ∆u + f ]
i 
J =  w − i =1 M   w − i =1 
   M



∑i =1
w i (t ) 



∑i =1
w i (t ) 

+ λ∆u T ∆u

Min J
∆u

∆u = (G T G + λI) −1 G T (w − f )

con
M M

∑ w ( t )Gi i ∑ w ( t )f
i i
G= i =1
M
f= i =1
M

∑ w (t )
i =1
i ∑ w (t )
i =1
i

Ventajas: Rápida y fácil implementación

Desventajas: Sólo es una mejor aproximación del óptimo global.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Espinosa (1999)

Modelo difuso de Takagi & Sugeno

R i : Si y(t - 1) es Ali y K y y(t - ny) es Anyi y


u(t - 1) es B1i y K y u(t - nu) es Bnu i
ei ( t )
entonces A i ( z −1 ) y i (t) = B i ( z −1 ) u ( t − 1) +

Predictor difuso

ŷ ( t + j) = ŷ libre ( t + j) + ŷ forzado ( t + j)

donde ŷ libre ( t + j) depende de las entradas y salidas pasadas


ŷ forzado ( t + j) depende de las acciones de control futuras

En este caso, se tiene:

ŷ( t + j) = G∆u + ŷ libre ( t + j)

j−1

donde ŷ forzado ( t + j) = G∆u = ∑ ∆u(t + j − i − 1)


i =1

y ŷ libre ( t + j) es calculado por la simulación del modelo difuso


considerando las acciones de control futuras constantes e iguales a
u(t-1).

Luego, la acción de control está dada por:

∆u = (G T G + λI) −1 G T (w − ŷ libre )
Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
donde
ŷ libre ( t + j) = f ( y( t + j − 1),K, y( t + j − ny ),
u ( t + j − 1),K, u ( t + j − nu ))

Babuska (1999), Espinosa & Vandewalle (1998, 1999) y Hadjli


& Wertz (1999)

Linealización multipaso

El modelo difuso es primero linealizado en el instante actual t.


Entonces, la acción de control actual u(t+j) sirve para predecir
ŷ ( t + j) y el modelo no lineal es de nuevo linealizado entorno al
futuro punto de operación. Este procedimiento se repite hasta
t+N2

Modelo difuso

R i : Si y(t - 1) es Ali y K y y(t - ny) es Anyi y


u(t - 1) es B1i y K y u(t - nu) es Bnu i
entonces y i (t) = a 1i y( t − 1) + K + a iny y( t − ny)
+ b1i u ( t − 1) + K + b inu u ( t − nu ) + c i
ny nb
y (t) = ∑ a l y( t − l ) + ∑ b l u ( t − l ) + c ( t )
l =1 l =1

con a l (t) = ∑ w i ( t ) a
i =1
i
l

M
b l (t) = ∑ w i ( t )b il
i =1

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
M
cl (t) = ∑ w i ( t )ci
i =1

Predictor difuso multipaso

ny
ŷ(t + j) = ∑ a l ( t + j) y( t + j − l )
l =1
nb
+ ∑ b l ( t + j) u ( t + j − l) + c( t + j)
l =1
M

con a l (t + j) = ∑ w (t + j)a
i =1
i
i
l

M
b l (t + j) = ∑ w i (t + j)b il
i =1
M
cl (t + j) = ∑ w i (t + j)ci
i =1
w i ( t + j) = f ( ŷ ( t + j − 1),K, ŷ( t + j − ny ),
u ( t + j − 1),K u ( t + j − nu )) = 0

En este caso, el predictor difuso utiliza la predicción ŷ( t + 1)


para obtener ŷ( t + 2) y este procedimiento se repite hasta t+N2.

Solución de controlador difuso

Método del Lagrangiano y condiciones de Kuhn-Tucker


(Solución numérica)
Ventajas: Mejor aproximación del modelo no lineal,
especialmente útil para horizontes de predicción largos.

Desventajas: Mayor esfuerzo computacional.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
CONTROL PREDICTIVO
BASADO EN REDES NEURONALES

En general, los controladores predictivos basado en redes


neuronales presentan el siguiente esquema básico:

r u y
Optimizador Proceso

y
Predictor
M

En este esquema, la obtención de la ley de control con redes


neuronales puede considerar:

1.- Determinar el modelo del sistema con una red neuronal. El


modelo es usado para predecir las salidas futuras de la planta.
Esto permite tratar con procesos no lineales.

2.- Entrenar una red neuronal para que realice la misma tarea que
un controlador predictivo. El entrenamiento se realiza por
simulación fuera de linea. De este modo, se obtiene un
controlador más rápido.

3.- Entrenar una red neuronal de forma que optimice un criterio.


El modelo es evaluado tan solo en la fase de entrenamiento
del controlador.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
A continuación, se presentan algunas estrategias de control
predictivo basado en redes neuronales

Hunt (1992)

yr u’ ym
Optimizador
M
MR
AA
r u yp
Proceso
C

En este caso, una red neuronal predice las respuestas futuras de la


planta sobre un horizonte de tiempo.

Las predicciones alimentan al optimizador de manera de


optimizar el siguiente criterio:

∑ δ( j)[y (t + j) − y ]
N2 Nu
( t + j / t) + ∑ λ (i)[∆u ' ( t + i − 1) ]
2
J= r 2
m
j = N1 i =1

Una alternativa es entrenar una red neuronal C de manera de


imitar la acción de control u’.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Arahal (1997)

GPC basado en respuesta libre (red neuronal) y respuesta forzada.

Modelo Resp. Resp. Modelo ∆u


Neuronal libre forzada Lineal
e - yl
+
u y r
Proceso Optimizador

Se propone dividir la respuesta del sistema en libre y forzada. La


respuesta forzada es debido a la señal de control, el resto se
considera respuesta libre.

Para predecir la respuesta forzada se usará un modelo lineal.

Lpredicción de la respuesta libre se hará en base a un modelo


neuronal, válido para todo rango de operación.

El proceso de optimización puede resolverse analíticamente


puesto que el modelo dependiente de la señal de mando es lineal.

A fin de obtener mejores resultados, el modelo usado para


calcular la respuesta forzada se cambia con el punto de operación.

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Draeger (1995)

DMC basado en redes neuronales

Se considera un modelo lineal respuesta al escalón

ŷ = G∆u + f + d

con G es la matriz con coeficientes de la respuesta al escalon, f es


agrupa los términos conocidos hasta t (respuesta libre) y d es un
vector de perturbaciones.

El vector de perturbaciones será tal que una parte representará la


no linealidad del proceso y la otra parte considera las influencias
desconocidas.

d = d nl + d *

con d* = y − y m

Entonces, la acción de control está dada por:

∆u = (G T G + λI ) −1 G T (r − f − d )

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Modelo
no lineal

f - y
r dnl DMC Proceso
- -

ym
- Modelo Modelo
lineal no lineal -
d*

Modelo
no lineal

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Referencias

Arahal, M., Berenguel, M., Camacho, E. (1997). Nonlinear neural model-based predictive
control of a solar plant. European Control Conference, July 1-4, Brussels, Belgium, TH-E I2,
paper 264.
Babuska, R., Sousa, J., Verbruggen, H. (1999). Predictive control of nonlinear systems based on
fuzzy and neural models. Proceedings of the European Control Conference, ECC’99, August
31- September 3, Karlsruhe, Germany, pp. 667.
Babuska, R. (1998). Fuzzy modeling for control. International series in intelligent technologies,
Kluwer Academic Publishers, Massachusetts, United States of America.
Bosley, J., Edgar, T., Patwardhan, A., Wright, G. (1993). Model - based control: a survey.
AIChE Journal of Process Systems Engineering, Vol. 39, Nº 2, pp. 138-147.
Chow, C., Kuznetsov, A., Clarke, D. (1995). Using multiple models in predictive control.
Proceedings of the 3rd European Control Conference, September 5-8, Rome, Italy, pp. 1732-
1737.
Cipriano, A., Ramos, M. (1995). A fuzzy model based predictive controller and its application
to a mineral flotation plant. Journal A: Benelux Quarterly Journal on Automatic Control, Vol.
36, Nº 2, pp. 29-36.
Cipriano, D. Sáez. (1996). Fuzzy generalized predictive control and its application to an
inverted pendulum. Proceedings of the 22nd Annual International Conference on Industrial
Electronics, Control and Instrumentation, IECON'96, Taipei, Taiwan, August 5-10, pp. 1966-
1971.
Di Marco, R., Semino, D., Brambilla, A. (1997). From linear to nonlinear model predictive
control: comparison of different algorithms. Industrial Engineering Chemistry Research, Vol.
36, pp. 1708-1716.
Draeger, A., Ranke, H., Engell, S. (1994). Neural network based model predictive control of a
continuos neutralization reactor. Proceedings of the third IEEE Conference on Control
Applications, August 24-26, Glasgow, Great Britain, pp. 427-432.
Espinosa, J., Vandewalle, J. (1999). Predictive control using fuzzy models. In: Roy R.,
Furuhashi, T., Pravir K. (eds.) Advances in Soft Computing Engineering Design and
Manufacturing, Springer-Verlag, pp. 187-200.
Espinosa, J., Hadjili, M., Wertz, V., Vandewalle, J. (1999a). Predictive control using fuzzy
models – comparative study. Proceedings of the European Control Conference, ECC’99, August
31- September 3, Karlsruhe, Germany, pp. 273.
Espinosa, J., Vandewalle, J. (1998). Predictive control using fuzzy models applied to a steam
generating unit. Proceedings of the 3rd International FLINS Workshop on Fuzzy Logic and
Intelligent Technologies for Nuclear Science Industrie, September 14-16, Antwerp, Belgium,
pp. 151-160.
Hadjili, M., Wertz, V. (1999). Generalized predictive control using Takagi-Sugeno fuzzy
models. Proceedings of the 1999 IEEE International Symposium on Intelligent Control,
Intelligent Systems & Semiotics, ISIC’99, September 15-17, Cambridge, United States of
America, pp. 405-410.
Hunt, K., Sbarbaro, D. Zbikowski, R. Gawthrop, P. (1992). Neural networks for control
systems: a survey. Automatica, Vol. 28, pp. 1083-1112.
Roubos, J., Babuska, R., Bruijn, P., Verbruggen, H. (1998). Predictive control by local
linearization of a Takagi-Sugeno fuzzy model. Proceedings of IEEE International Conference
on Fuzzy Systems, May 4-9, Anchorage, Alaska, United States of America, pp. 37-42.
Van der Veen, P., Babuska, R., Verbruggen, H. (1999). Comparison of nonlinear predictive
control methods for a waste-water treatment benchmark. Proceedings of the European Control
Conference, ECC’99, August 31- September 3, Karlsruhe, Germany, pp. 268 (5 pages).

Doris Sáez (Marzo, 2002). Apuntes IV: Control Predictivo No Lineal. Seminario AADECA-UBA,
Buenos Aires.
Referencia Seminario

Allgöwer, F., Zheng, A., "Nonlinear Predictive Control", Birkäuser Verlag, 2000.

Babuska, R., "Fuzzy Modelling for Control", KAP, 1998.

Bitmead, R., Gevers, M., Wertz, V., "Adaptive Optimal Control". The Thinking Man's GPC,
Prentice Hall, 1990.

Camacho, E., Bordons, C. "Model Predictive Control", Springer-Verlag, 1998.

Cichocki, A. Unbehauen, R., "Neural networks for Optimization and Signal Processing", John
Wiley & Sons, 1993.

Clarke, D. "Advances in Model Based Predictive Control". Oxford University Press, 1994.

Driankov, D., Hellendoorn, H., Reinfrank, M., "An Introduction to Fuzzy Control" Springer-
Verlag, 1996.

Harris, C., Moore, C., Brown, M. "Intelligent Control Aspects of Fuzzy Logic and Neural Nets",
World Scientific, 1993.

Martín Sánchez, J., Rodellar, J., "Adaptive Predictive Control: From the Concepts to Plant
Optimization", Prentice Hall, 1996.

Reznik, L. "Fuzzy Controllers", Newnes, 1997.

Palm, R., Driankov, D., Hellendoorn, H. "Model Based Fuzzy Control", Springer-Verlag, 1996.

Sáez, D., Cipriano, A., Ordys, A. "Optimization of industrial processes at supervisory level:
Application to control of thermal power plants". Springer-Verlag, 2002.
http://www.amazon.com/exec/obidos/ASIN/1852333863/qid%3D1015435578/ref%3Dsr%5F11%5F0%5F1/103-
2288317-9507007

Yager, R., Filev, D. "Essentials of Fuzzy Modeling and Control", John Wiley & Sons, 1994.

Pag. Web de interés.

Redes Neuronales
http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html

http://hem.hj.se/~de96klda/NeuralNetworks.htm

http://www.gc.ssr.upm.es/inves/neural/ann2/anntutorial.html

Vous aimerez peut-être aussi