Vous êtes sur la page 1sur 29

Control C lN Neuronal l ptimo i i inversoconGradiente G di de d VelocidadparaRegularlaProduccindeMetanoenun ProcesodeDigestinAnaerbica

K.J.Gurubel1,E.N.Snchez1 ,S.CarlosHernndez2 yF.Ornelas1

AMCA2011 CONGRESONACIONAL Saltillo,Coahuila 5 7deOctubre

UnidadGuadalajara 2Cinvestav UnidadSaltillo


1

1Cinvestav

INTRODUCCIN
g g y La digestin anaerbica es un p proceso biolgico en el q que la materia orgnica (sustrato) es degradada por bacterias anaerbicas (biomasa), en ausencia de oxgeno. Tal degradacin produce biogs, que consiste en metano (CH4), dixido de carbono b (CO2), ) y tambin bi se obtienen bi residuos id orgnicos i estables.
y El proceso anaerbico es un proceso complejo y secuencial que

ocurre en cuatro etapas bsicas: Hidrlisis, Acidognesis, Acetognesis y Metanognesis. Cada etapa tiene una dinmica especfica; fi l metanognesis, la i que es la l ms lenta l i impone l la dinmica del proceso y se considera la etapa limitante. Por lo tanto, la fase de metanognesis es la ms importante para el presente estudio. estudio Este proceso es desarrollado en un reactor continuo de tanque agitado con filtro de biomasa.
2

INTRODUCCIN
y Diversos sensores de biogs se han desarrollado para medir el

CH4; sin embargo, las de son b l mediciones d d sustrato y de d la l biomasa b ms restrictivas.


y En E un trabajo t b j previo i se propone un observador b d neuronal l no

lineal en tiempo discreto para sistemas no lineales desconocidos en presencia de perturbaciones externas e incertidumbre de parmetros, para estimar variables bl no medibles. d bl
y Este observador se basa en una red neuronal recurrente de alto

orden d (RHONN por sus siglas (RHONN, i l en ingles) i l ) entrenada t d con un algoritmo de FKE. El objetivo es estimar la concentracin de biomasa, la degradacin del sustrato y el carbono inorgnico en un proceso anaerbico.
3

OBJETIVO
y Para controlar el proceso anaerbico, se propone un

controlador neuronal ptimo inverso con gradiente de velocidad. Este controlador es desarrollado sobre la base del observador neuronal mencionado. La meta del controlador es seguir una trayectoria de referencia de YCH4 y evitar la inhibicin del proceso anaerbico. anaerbico La ley de control calcula la razn de dilucin y la cantidad de bicarbonato requeridos, para seguir la trayectoria de referencia de YCH4.

FENMENOSFISICOQUMICOS
y El modelo propuesto est compuesto por un conjunto de

cinco ecuaciones algebraicas y seis ecuaciones diferenciales ordinarias. El fenmeno fisicoqumico (equilibrio cido b base y conservacin i de d la l materia) i ) son modelados d l d por las l ecuaciones algebraicas.

FENMENOS FISICOQUMICOS
HS + S S 2 = 0 , H + S K a HS = 0 , H + B K b CO 2 d = 0 , B + CO 2 d IC = 0 , B + S Z = 0,

donde HS es el cido actico no ionizado (mol L1), S es el cido actico ionizado (mol L1), H+ es el hidrgeno ionizado (mol L1), ) B es el bicarbonato medido (mol L1), ) CO2d es el dixido de carbn disuelto (mol L1), Ka es una constante de equilibrio cidobase, Kb es una constante de equilibrio entre B y CO2d.
6

MODELOMATEMTICO
y El fenmeno biolgico es modelado por ecuaciones

diferenciales ordinarias , que representa la parte dinmica del proceso como:


dX 1 = ( 1 k d 1 ) X 1 , dt dS 1 = R 6 1 X 1 + D in (S 1 in S 1 ), dt dX 2 = ( 2 k d 2 ) X 2 , dt dS 2 = R 3 2 X 2 + R 4 1 X 1 + D in (S 2 in S 2 ), dt dIC = R 2 R 3 2 X 2 + R 5 1 X 1 R1 R 3 2 X 2 + dt D in (IC in IC ), dZ = D in (Z in Z dt

)
7

MODELOMATEMTICO
donde X1, corresponde a las bacterias hidrolticas, acidognicas y acetognicas y X2, corresponde a las bacterias metanognicas. metanognicas La carga orgnica es clasificada en S1, que modela las molculas complejas y S2 , que representa las molculas transformadas en cido actico. 1 es la razn de crecimiento (tipo Haldane) de X1 (h1), ) 2 es la l razn de d crecimiento i i t (tipo (ti Haldane) H ld ) de d X2 (h1), ) kd1 el ndice de mortalidad de X1 (mol L1), kd2 el ndice de mortalidad de X2 (mol L1), Din la razn de dilucin (h1), S1in la entrada del sustrato rpidamente p degradable g (mol L1), S2in la ( entrada del sustrato lentamente degradable (mol L1), IC carbono inorgnico (mol L1), Z el total de cationes (mol L1), ICin la entrada de carbono inorgnico (mol L1), Zin la entrada de cationes (mol L1), ) es un coeficiente que considera la ley de la presin parcial para el CO2 disuelto, y R1,, R6 son los coeficientes de produccin.

MODELOMATEMTICO
y Finalmente la fase gaseosa es considerada como la salida

del proceso
YCH 4 = R1 R 2 2 X 2 YCO 2 = R 2 R 3 2 X 2

y El crecimiento de la biomasa, la degradacin del sustrato y

YCH4, son buenos indicadores de actividad biolgica d dentro d l reactor. Esas variables del bl pueden d ser usadas d para monitorear el proceso y para disear el control neuronal p inverso con g gradiente de velocidad. ptimo
9

RHONOENTIEMPODISCRETO
y El RHONO en tiempo discreto estima las variables de la etapa

de (X2), d metanognesis: la l biomasa b ) sustrato (S2) y carbono b inorgnico (IC). La propiedad de observabilidad de este proceso de digestin p g anaerbica fue analizado en un trabajo j previo.

E Esquema d del lobservador b d


10

RHONOENTIEMPODISCRETO

X 2 ,k +1

2 = w11 S X 2 ,k + w12 S X 2 ,k + w13 S IC k 2 + w14 S X 2 , k Din ,k + w15 S X 2 ,k IC in ,k + g 1e k , 2

S 2 ,k +1

2 = w21 S S 2 ,k + w22 S S 2 ,k + w23 S IC k 2 + w24 S S 2 ,k Din i , k + w25 S S 2 , k S 2 in i ,k + g 2 ek , 2

IC k +1

2 = w31 S IC k + w32 S IC k + w33 S X 2 ,k 2 + w34 S IC k Din ,k + w35 S IC k IC in ,k + g 3 e k , 2

Estructuradelobservador
11

RHONOENTIEMPODISCRETO
wijij es el respectivo p p ; donde w vector de p pesos adaptado en lnea; X2, S2 S () es la funcin IC son los estados estimados; S() X 2 , S 2 y IC sigmoidal definida como S(x)=atanh(Bx)BB; S ( x ) = tanh( x ) (g1, g2, g3) son las ganancias Luenberger del observador, observador ek es el error de salida, Din, S2in y ICin son definidas como antes.

12

ALGORITMODEENTRENAMIENTOFKE
y En este trabajo, usamos un algoritmo de entrenamiento

basado e en e el FKE desc descrito to po por


wi (k + 1) = wi (k ) + K i (k )e(k ),
K i ( k ) = Pi ( k ) H i ( k ) M i ( k ) Pi ( k + 1) = Pi ( k ) K i ( k ) H i ( k ) Pi ( k ) + Qi ( k )
T

e(k ) = y(k ) y(k )

M i ( k ) = R i ( k ) + H i ( k ) Pi ( k ) H i ( k )
T

, i = 1, 1 K, n
i i

L L k donde e ( k ) p es la estimacin del error de salida y P ( ) i Li es el es la matriz de covarianza del error de prediccin, wi vector de pesos(estados), Li es el numero respectivo de pesos de la red

13

ALGORITMODEENTRENAMIENTOFKE
y p es la salida de la planta, y p es la salida de la red

neuronal, n, es el numero de estados, i es la razn de aprendizaje, K i L p es la matriz de ganancia de Kalman, Qi L L , es la matriz de covarianza del ruido de estimacin, Ri p p, es la covarianza del ruido del error y H i L p es una matriz, dada como sigue: h
i

y (k ) H ij = w k ij ( )

donde i = 1,K, n y j = 1,K, Li .

14

CONTROLNEURONALPTIMOINVERSOCON GRADIENTEDEVELOCIDAD
y Considere un sistema no lineal en tiempo discreto afn

como
x k + 1 = f ( x k ) + g ( x k )u k

y donde xk Rn es el estado del sistema al tiempo k Z+,

u Rm es el control de entrada, f : Rn Rn, g : Rn Rnxm son funciones de mapeo suaves. Se asume f(0)=0 y {g}} = m t rango { xk d 0 . En rango{g}=mparatodax E (Ornelas, (O l 2011), ) se propone una funcin de lyapunov para control en tiempo discreto para asegurar estabilidad del sistema , como
15

CONTROLNEURONALPTIMO INVERSOCON GRADIENTEDEVELOCIDAD


Vc (xk , x ,k ) = 1 (x ,k xk )T Pk (x ,k xk ) 2 Pk = PkT > 0

y Empleando esta funcin en la ley de control, queda de la

siguiente forma
1 1 * uk = R( xk ) + g T ( xk )Pk g ( xk ) g T (xk )Pk g ( xk ) f (xk , x ,k +1 ) 2 2
1

16

CONTROLNEURONALPTIMO INVERSOCON GRADIENTEDEVELOCIDAD


y Pk y R son matrices definidas positivas y simtricas; as la

existencia de la inversa en el control es asegurada. n x , k R+ x es la trayectoria deseada. deseada Para computar Pk , que asegure estabilidad del sistema, usaremos el algoritmo gradiente de velocidad. La ley de control depende de la matriz i Pk en cada d paso de d tiempo. i D fi i Definimos l matriz la i Pk en cada pasa de tiempo k como:
Pk = p k P '

17

CONTROLNEURONALPTIMO INVERSOCON GRADIENTEDEVELOCIDAD


y DondeP= PT >0esunamatrizconstantedadaypk esun

parmetroescalaraserajustadoporelalgoritmogradiente develocidad. velocidad Entonceslaleydecontrolestransformada en:


pk u* = k 2 pk T T ' ' ( ) ( ) ( ) R x g x P g x + k k k g ( x k )P f d ( x k ). 2
1

y Lavariacindinmicadelparmetropk escalculadacomo:
Pk +1 = p k + 8 d ,k f dT ( x k )P ' g ( x k )R ( x k ) g T ( x k ) f dT ( x k )
2

(2 R (x ) + p
k

(x k )P ' g (x k ))

18

CONTROLNEURONALPTIMO INVERSOCON GRADIENTEDEVELOCIDAD


y que es positiva para todo paso de tiempo k si p0>0. Por lo

tanto la positividad de pk es asegurada y el requerimiento Pk=PkT >0 para es garantizado. garantizado Adems, Adems con la funcin de Lyapunov para control (definida anteriormente) y P=pP pk = p ( p p es un valor constante cuando el algoritmo gradiente de velocidad l id d concluye) l ) , la l ley l de d control l es ptima i i inversa en el sentido de que minimiza la variedad funcional dada como
T J = l ( xk ) + u k R ( xk )u k . k =0

19

RHONO COMOSISTEMAAFN
2 f1 X 2,k , ICk = w11S X 2,k + w12S X 2,k + w13S ICk + g1ek , 2 G11( X 2,k ) = w14S X 2,k G12 ( X 2,k ) = w14S X 2,k 2 f 2 S 2,k , ICk = w21S S 2,k + w22S S 2,k + w23S ICk 2

+ w25S S 2,k S2in i ,k + g2ek ,


2

G21(S 2,k ) = w24S S 2,k 2 f 3 X 2,k , ICk = w31S ICk + w32S ICk + w33S X 2,k + g3ek
2

G31(ICk ) = +w34S ICk


2

G32 (ICk ) = w35S ICk


2

20

RHONO COMOSISTEMAAFN
G11 G12 G g (x k ) = 0 21 G31 G32 f1 f (x k ) = f 2 f3 f ref X 2 ref (x ,k +1 ) = S 2 ref IC ref P11 P' = P21 P31 Pk = p k P ' P12 P22 P32 P13 P23 P33 R = 0 .6

f d ( x k ) = f ( x k ) f ref (x ,k +1 )

21

RESULTADOSDESIMULACIN
15 10 5 0 -5 0 500 Tiempo (h) 1000 1500
S 2obs

x 10

-3

10 5 0 -5

x 10

-3

Estimada Sistema

x2obs

Estimada Sistema

500 Tiempo (h)

1000

1500

0.2 0.15 IC o b s 0.1 Estimada Sistema

0.05 0 0 500 Tiempo (h) 1000 1500

La biomasa, sustrato y carbono inorgnico son bien estimados desde el p principio. p As, el RHONO propuesto es una buena alternativa para estimar los estados importantes p del p proceso anaerbico considerado.
22

RESULTADOSDESIMULACIN
El algoritmo de control es probado ante una perturbacin en S2in del 200% en t=200 h, como se muestra en la figura
0.25 x 4 in m e d id a ( m o l/ L ) 0.2

0.15 0.1

0.05

500 Tiempo (h)

1000

1500

A continuacin se muestra el seguimiento de trayectorias para la biomasa, biomasa sustrato, sustrato carbono inorgnico y YCH4
23

RESULTADOSDESIMULACIN
15 10 5 0 -5
-0.01 0 500 Tiempo p ((h))
0.04 0.035 0.03 YCH (m ol/h h) 0.025 0.02 0.015 0.01 0.005 Modelo neuronal Trayectoria de Referencia

x 10

-3

0.02 0.01 0 Modelo neuronal Trayectoria de Referencia

Modelo neuronal Trayectoria de Referencia

S 2 ( m o l/ l )

x 2 (A U )

500 Tiempo (h)

1000

1500

1000

1500

0.2 0.15 I C (m o l/ l) 0.1 Modelo neuronal Trayectoria de Referencia


4

0.05 0 0 500 Tiempo (h) 1000 1500

0 -0.005 0 500 Tiempo (h) 1000 1500

24

RESULTADOSDESIMULACIN
y Las figuras ilustran el desempeo de seguimiento para la

biomasa, como se puede ver el seguimiento de trayectorias es eficiente y el error se acerca a cero en el estado estable. YCH4 es calculada con la ecuacin algebraica descrita anteriormente que est en funcin de los estados observados del sistema, por lo cual el error en el seguimiento es debido al error de seguimiento de los estados observados del sistema. y Los errores de seguimiento son desplegados en la siguiente figura.

25

RESULTADOSDESIMULACIN
IC (mol/l) erro or
x2 (A U ) erro or 0.01 Error X2 0 -0.01

01 0.1 Error IC 0 -0.1

500 Ti Tiempo (h)

1000

1500

500 Tiempo (h)

1000

1500

0.02 Error S2 0 -0.02

YCH4 (mol/h) error

S 2 (mol/l) error

0.05 Error QCH4 0 -0.05

500 Tiempo (h)

1000

1500

500 Tiempo (h)

1000

1500

Estos errores p podran ser debidos a la estructura simple p del observador; es posible que la red neuronal no sea capaz de aprender la dinmica no lineal relacionada con las variables y tambin es posible que las ganancias de la ley de control necesiten ser ajustadas.
26

RESULTADOSDESIMULACIN
y La figura muestra las seales de control para las entradas B

y Din.
02 0.2 0.1

500

Tiempo (h)

1000

1500

0.2

Din

0.1

500

Tiempo (h)

1000

1500

27

CONCLUSIONES
y Un observador neuronal recurrente de alto orden no lineal en tiempo

p p para estimar la concentracin de discreto (RHONO) es empleado biomasa, degradacin del sustrato y carbono inorgnico. Se basa en una red neuronal recurrente de alto orden en tiempo discreto entrenada con un algoritmo basado en un filtro de Kalman extendido (FKE). control neuronal ptimo inverso con gradiente de velocidad. Una vez obtenido el modelo neuronal, una ley de control ptimo inverso, basada en este modelo, modelo es desarrollado. desarrollado La produccin de metano es la trayectoria de referencia objetivo.

y Un modelo matemtico afn es obtenido con el propsito de aplicar

y La meta es forzar al sistema para seguir seales de referencia deseadas. y Los resultados en simulacin ilustran que el controlador propuesto

asegura estabilizacin y seguimiento de trayectorias de un sistema no lineal y minimiza una variedad funcional de costo. costo

28

TRABAJOFUTURO
y Como trabajo futuro se determinarn trayectorias de

referencia ptimas para la produccin de metano.


y El desempeo del RHONO puede agregndole g g ms trminos a la estructura.

ser mejorado

y Esta investigacin ser continuada para evaluar la

aplicacin del observador y la ley de control propuestos en el proceso de tratamiento de aguas residuales.

29

Vous aimerez peut-être aussi