Académique Documents
Professionnel Documents
Culture Documents
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/220136878
CITATION READS
1 2,027
3 authors:
Laura Velez
National University of Colombia
4 PUBLICATIONS 3 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Cashflows: A Package for Investment Modeling and Advanced Engineering Economics using Python View
project
All content following this page was uploaded by Juan David Velásquez on 20 May 2014.
Juan D. Velásquez. Ph.D., Cristian Zambrano. Est. & Laura Vélez. Est.
Facultad de Minas, Universidad Nacional de Colombia
jdvelasq@unal.edu.co; cozambra@unal.edu.co; lauravelez1@gmail.com
Recibido para revisión 01 de abril de 2011, aceptado 28 de junio de 2011, versión final 07 de julio de 2011
Resumen— En este artículo, se describe un paquete para R [8], ya que posee un amplio repertorio de funciones para ese
el pronóstico de series de tiempo usando redes neuronales fin; una recopilación de las principales funciones implementadas
autoregresivas (y perceptrones multicapa imponiendo algunas y paquetes disponibles es presentada [9]. Adicionalmente, el
restricciones al modelo) con función adaptativa de activación. El lenguaje provee mecanismos para crear paquetes instalables en
uso de los paquetes y algunas funcionalidades son ilustrados para
su propio entorno de programación; durante la creación de cada
una serie de tiempo no lineal
paquete, el código fuente es analizado con el fin de verificar unas
Palabras Clave— Redes neuronales artificiales, lenguaje R,
condiciones mínimas de calidad, que incluyen, entre otras, que
predicción. cada función implementada esté adecuada documentada en el
sistema de ayuda. Aunque esta herramienta computacional está
Abstract— In this article, we describe a package for nonlinear diseñada fundamentalmente para el cómputo estadístico, resulta
time series forecasting using autoregressive neural networks (and muy apropiada para la programación de algoritmos de inteligencia
multilayer perceptrons by imposing some restrictions to the model) computacional [10] tales como las redes neuronales artificiales.
with adaptive activation function; The use of the package and some
functionality are illustrated for one nonlinear time series.
Ya se han desarrollado varios esfuerzos encaminados a la
implementación de modelos genericos de redes neuronales en
Keywords— Artificial neural networks, R language, prediction. el lenguaje R:
• En la versión 7.3-1 del paquete ‘nnet’ [11], la función
I. INTRODUCCION del mismo nombre permite crear modelos no lineales de
regresión y clasificación usando redes de propagación hacia
adelante con una sola capa oculta, entre las que se incluyen
Revista Avances en Sistemas e Informática, Vol.8 No.2, julio de 2011 - Medellín. ISSN 1657-7663
178
Revista Avances en Sistemas e Informática, Vol.8 No.2, julio de 2011 - Medellín. ISSN 1657-7663
En esta sección se describe la arquitectura de la red neuronal. El modelo escrito en la Ecuación (1) se reduce a un perceptrón
En un modelo ARNN, la variable dependiente yt es obtenida multicapa imponiendo la restricción: ϕ= 1 ϕ=2 = ϕP .
como una función no lineal de sus P valores pasados yt − p , Igualmente, dicha red neuronal se reduce a un modelo autorregresivo
para p= 1, …, P : imponiendo que H = 0 .
P H P
*
t η + ∑ϕ y
y = p t− p + ∑β hG (ωh + ∑α p ,h yt − p ) (1) III. EL PAQUETE ‘ARNN’
= p 1= h 1 =p 1
donde G(.) es la función sigmoidea adaptativa [19] El paquete ‘arnn’ implementa la red neuronal artificial descrita
definida como: en la sección anterior. Los aportes alcanzados con el desarrollo
de esta herramienta son los siguientes:
M
1 • Es una herramienta de usuario final, por lo que el usuario
G (u ) = (2)
1 + exp ( −u ) no debe preocuparse por los elementos internos de la
implementación.
La arquitectura del modelo es presentada en la Figura 1.
• Las funciones implementadas están debidamente documentadas
Los parámetros del modelo: η ,ϕ p , β h ,ωh ,α p , h y M para
en el sistema de ayuda nativo del entorno. De esta forma, el
i= 1, …, P y h= 1, …, H son estimados minimizando el paquete se integra naturalmente dentro de entorno.
error de regularización:
• Su diseño y arquitectura computacional está basado
profundamente en el paquete ‘forecast’ de Hyndman y
λ E* (3)
Khandakar [20], por lo que sólo fue necesario implementar
En la ecuación (3), λ es un parámetro externo definido las funciones propias del modelo ARNN. El paquete
*
por el usuario; et son los errores entre el pronóstico yt y el ‘forecast’ tiene implementaciones de otros modelos de
valor deseado yt . T es la longitud de la serie de tiempo yt . predicción ampliamente utilizados, por lo que resulta
La última cantidad es función, únicamente, de los parámetros extremadamente fácil contrastar los resultados con los de
del modelo: otros modelos alternativos.
• Finalmente, no hay implementaciones de modelos ARNN
H P P H
con funciones adaptativas de activación.
E* =η + ∑ ( β h + ωh ) + ∑ ϕ + ∑∑ α p ,h (4)
El paquete consta de dos funciones principales: ‘arnn’ para
h 1
= p 1
= p 1=
= h 1
crear y estimar el modelo y ‘forecast’ para pronosticar varios
periodos adelante.
Para ejemplificar el uso de la implementación realizada
se usará la serie del número de usuarios autenticados en un
servidor de internet cada minuto durante cien minutos. Esta
179
ARNN: Un paquete para la predicción de series de tiempo usando redes neuronales autorregresivas
– Velásquez et ál
serie de tiempo se encuentra disponible en el entorno R bajo ‘fo El paquete también permite calcular el pronóstico varios
la variable ‘WWWusage’. periodos adelante. Para modelos no lineales, este tipo de
pronóstico debe realizarse mediante simulación numérica ya
En este caso particular se desean usar las primeras que no existen expresiones exactas analíticas. Este proceso es
80 observaciones para la estimación del modelo descrito a continuación.recast’ permite que se usen muchas de
y las 20 restantes para evaluar su capacidad de las funciones de este último. Por ejemplo, los estadísticos del
predicción. Una red neuronal que use los primeros error de ajuste pueden calcularse directamente usando la función
‘accuracy’ del paquete ‘forecast’:
cuatro rezagos de la serie como entrada y dos neu-
ronas en su capa oculta puede ser creada mediante > accuracy(fit)
ME RMSE MAE
una simple llamada a la función ‘arnn’; el código -3.149810e-08 2.966540e+00 2.303534e+00
es presentado a continuación: MPE MAPE MASE
-7.280844e-02 1.930014e+00 5.651527e-01
> ### separa la muestra de estimación
> x <- ts(WWWusage[1:80], s = 1, f = 1)
> ### crea el modelo El pronóstico un periodo adelante puede calcularse para toda
> fit <- arnn(x=x, lags=1:4, H=2) la serie con el fin de evaluar el ajuste del modelo en la región de
> fit predicción extrapolativa por fuera de la muestra de calibración
de los parámetros. De esta forma, el siguiente código permite
Method: arnn realizar esta tarea sin recalcular los parámetros:
Call: fit1 = arnn(x=WWWusage, model = fit)
arnn(x=x, lags=1:4, H = 2) > accuracy(fitted(fit1)[76:96], WWWusage[81:100])
ME RMSE MAE MPE MAPE
Parameters: 7.529124 9.895523 8.236415 4.458222 4.776821
M Wio[1] Wio[2] Wio[3]
3.97025 2.05758 -1.66205 0.89724
Wio[4] Wih[1,1] Wih[2,1] Wih[3,1] Igualmente, graficar el valor real de la serie y el pronóstico un
-0.32474 -0.91562 -0.91428 -0.90899 periodo adelante es directo; por ejemplo, el gráfico presentado
Wih[4,1] Wih[1,2] Wih[2,2] Wih[3,2] en la Figura 2 se obtuvo con los siguientes comandos:
-0.90471 -0.90472 -0.90193 -0.89894
Wih[4,2] Wbh[1] Wbh[2] Who[1] > plot(WWWusage,lwd=2)
-0.89309 -0.00732 -0.00677 -29.53962 > lines(fitted(fit1),col=’red’,lwd=2)
Who[2] Wbo > grid()
-29.4484 4.20615