Aplicación de Tecnicas de

PROYECTO FIN DE CARRERA
APLICACIN DE TECNICAS DE
CUANTIZACIN VECTORIAL A LA
PREDICCIN DE SERIES
TEMPORALES

AUTOR: AINHOA FERNNDEZ LPEZ

MADRID, Junio 2005
UNIVERSIDAD PONTIFICIA COMILLAS

ESCUELA TCNICA SUPERIOR DE INGENIERA (ICAI)
INGENIERO EN ELECTRNICA Y AUTOMATICA INDUSTRIAL

RESUMEN

Ainhoa Fernndez Lpez - 1 -

RESUMEN
TITULO: APLICACIN DE TCNICAS DE CUANTIZACIN VECTORIAL A LA PREDICCION
DE SERIES TEMPORALES.
AUTORA: AINHOA FERNNDEZ LPEZ.
DIRECTORES: J UAN LUS ZAMORA MACHO Y FIDEL FERNNDEZ BERNAL
IAEI. DEPARTAMENTO DE ELECTRNICA Y AUTOMTICA. ETSI. UPCO

Obj et i vo:
El objetivo consiste en identificar en una serie temporal,
mediante cuantizacin vectorial, pautas o patrones de comportamiento
que se repiten con cierta frecuencia en el tiempo de tal manera que
se pueda predecir el valor futuro de la serie mediante la
extrapolacin del patrn de comportamiento identificado. La
prediccin consiste en emplear toda la informacin disponible hasta
la muestra actual k (en realidad una ventana de datos de dimensin
finita N) para poder obtener con la mayor exactitud posible el valor
de la seal n muestras ms adelante (vase Figura 1). Se utilizar
como serie temporal la cotizacin incremental en tanto por ciento de
un valor burstil entendida como el beneficio o perdida en % de una
operacin de compra-venta a corto plazo. La correcta prediccin de
los valores futuros de la serie temporal permitira tomar
decisiones sobre la conveniencia o no de realizar en la muestra
actual una inversin en el valor burstil considerado.
n
N
k

Figura 1_Identificacin de patrones de comportamiento y prediccin de una serie temporal

RESUMEN


Descr i pci n del al gor i t mo de pr edi cci n:

Las tcnicas de cuantizacin vectorial tienen como finalidad
codificar un conjunto extenso de vectores, utilizando exclusivamente
otro conjunto reducido de vectores denominados vectores de
referencia o centroides. De esta forma a un vector cualquiera de
datos se le asocia el centroide para el cual la distancia eucldea
entre ambos vectores es mnima. El criterio usado para definir los
vectores de referencia es minimizar el error de distorsin definido
como la suma de las distancias eucldeas de los vectores
pertenecientes al conjunto original con respecto a sus centroides.
El valor de prediccin asignado a cada centroide se
corresponde con el valor medio de los valores futuros asociados a
todos aquellos vectores de datos que en la fase de entrenamiento
tenan a dicho centroide como el ms prximo.

Est r at egi a de opt i mi zaci n:

La estrategia que se ha seguido consiste en predecir cada mes
de datos durante un ao con un conjunto de centroides entrenados con
un cierto nmero de meses previos, uno, dos, tres o cuatro meses.

Cr i t er i os de opt i mi zaci n- Como criterio de optimizacin
bsico se emplea el beneficio acumulado que se calcula de la
siguiente forma: se toma en cada instante el valor de prediccin y
se comprueba si dicho valor supera un cierto umbral de beneficio
para inversin. En dicho caso se acumula el valor real ya sea
beneficio o prdida como inversin realizada. Otros criterios
utilizados para optimizar son: El beneficio por operacin, el
porcentaje de aciertos y fallos, el NMSE (error cuadrtico medio
normalizado) que corresponde con la diferencia entre el valor real y
el valor predicho de la serie temporal.

Los par met r os que se han modi f i cado dur ant e el pr oceso de
opt i mi zaci n-
Nmero mximo de centroides
Nmero de meses de entrenamiento antes de realizar la prediccin
con cada nuevo mes.

RESUMEN


Frecuencia de corte del filtro (antes de realizar el
entrenamiento los datos de la serie temporal se filtran para
conservar nicamente las dinmicas relevantes para la prediccin)

Resul t ados:

A continuacin se comparan los resultados obtenidos para cada
una de las soluciones ptimas en funcin del criterio de
optimizacin seguido. Para el criterio del MSE la mejor solucin es
la de 20 centroides con un mes de entrenamiento, mientras que para
el resto de criterios la mejor solucin es la de 30 centroides
entrenados con 3 meses.
En la Figura 2 se pueden observar los beneficios acumulados para
las dos soluciones ptimas y en la Tabla 1 se pueden comparar los
resultados obtenidos en cada criterio por cada una de estas
soluciones.

MSE_PRED Tasa de Beneficio Operaciones Beneficio por operacin
Centr 20 1.0707 50.8792 -87.0737 724 0.12
Centr 30 1.0930 61.9469 462.5647 1243 0.37
Tabla 1_Resultados ptimos para cada crit erio de optimizacin

Figura 2_Beneficio acumulado

Tras el estudio exhaustivo de todas las combinaciones posibles
se ha llegado a la conclusin de que para esta serie temporal
concreta los resultados ms ptimos se obtienen con 30 centroides
entrenados con 3 meses de datos.

SUMMARY


SUMMARY
TI TLE: APPLICATION OF TECHNIQUES OF VECTORIAL CUANTIZACIN
TO THE PREDICTION OF TEMPORARY SERIES.
AUTHOR: AINHOA FERNNDEZ LPEZ.
DIRECTORS: J UAN LUS ZAMORA MACHO Y FIDEL FERNNDEZ BERNAL
IAEI. DEPARTAMENTO DE ELECTRNICA Y AUTOMTICA. ETSI. UPCO

Obj ect i ve:
The objective consists on identifying, by means of vectorial
cuantizacin, guidelines or behaviour patterns that repeat with
certain frequency in the time in such a way that you can calculate
the prediction of the future value of the series by means of the
pattern's of identified behaviour extrapolation. Prediction consists
of using all the information available until present sample k (in
fact one window of data of finite dimension N) to be able to obtain
with the greater possible exactitude the value of signal n samples
advanced more (it see Figure 1). Temporary series will be used in
the short term as the incremental quotation in percentage of a
stock-exchange value understood as the lost benefit or in % of an
operation of transaction. The correct prediction of the future
securities of the temporary would allow making decisions about the
convenience or not of carrying out in the current sample a sale and
purchase operation for the considered market value.
n
N
k

Figure 1_Identificacin of behaviour patterns and prediction of a temporary series

SUMMARY


Descr i pt i on of t he pr edi ct i on al gor i t hm:

The techniques of vectorial cuantizacin have like purpose of
codifying an extensive set of vectors, using exclusively another
reduced set of denominated vectors reference vectors or centroides.
Of this form to a vector anyone of data is associated the centroide
to him for which the Euclidean distance between both vectors is
minimum. The used criterion to define the reference vectors is to
diminish the error of distortion defined as the sum of the Euclidean
distances of the vectors pertaining to the original set with respect
to its centroides.
The value of prediction assigned to each centroide corresponds
with the average value of the associated future values to all those
vectors of data that in the phase of training they had to centroide
saying like next.

St r at egy of opt i mi zat i on:

The strategy that has been followed consists of predicting
every month of data during a year with a set of centroides trained
with a certain number of previous months, one, two, three or four
months.
Cr i t er i a of opt i mi zat i on - As criterion of basic optimization
is used the undivided profit that calculates of the following form:
we took a determined value from the estimation signal and see if
this value surpasses a benefit threshold, in this case the real
value or benefit or loss like made investment are accumulated. Other
used criteria to optimize are: The benefit by operation, the
percentage of successes and failures, the NMSE (standardized average
quadratic error).

Par amet er s t hat have been modi f i ed-
Maximum number of centroides
Cut-off frequency of the filter (Before making the
training the data of the temporary series have been
filtered to conserve solely dynamic the excellent ones
for the future estimation)

SUMMARY


Number of months of training before making the
prediction with every new month.

Resul t s:

Next the results obtained for each one of the optimal
solutions based on the followed criterion of optimization are
compared. For the criterion of the MSE the best solution is the one
of 20 centroides with a month of training, whereas for the rest of
criteria the best solution is the one of 30 centroides trained with
3 months.
In Figure 2 the undivided profits for the two optimal
solutions can be observed and in Table 1 the results obtained in
each criterion by each one of these solutions can be compared.

MSE_PRED Tasa de Beneficio Operaciones Beneficio por operacin
Centr 20 1.0707 50.8792 -87.0737 724 0.12
Centr 30 1.0930 61.9469 462.5647 1243 0.37
Table 1 _ Optimal results for each criterion of optimization.

Figure 2_Acumlate Beneficio

After the exhaustive study of all the possible combinations
one has reached the conclusion that for this temporary series it
makes specific the most optimal results are obtained with 30
centroides trained with 3 months of data.

UNIVERSIDAD PONTIFICIA COMILLAS
ESCUELA TCNICA SUPERIOR DE INGENIERA (ICAI)
INGENIERO EN ELECTRNICA Y AUTOMATICA

PROYECTO FIN DE CARRERA

Aplicacin de Tcnicas de Cuantizacin
Vectorial a la prediccin de series
temporales

Directores: Juan Lus Zamora Macho
Fidel Fernndez Bernal

Autora: Ainhoa Fernndez Lpez Madrid, Junio 2005

Memoria.ndice:


NDICE:
PRLOGO: ......................................................................................................................................................- 1 -
CAPTULO 1 INTRODUCCIN .......................................................................................................- 3 -
1 UN POCO DE HISTORIA........................................................................................................................ - 4 -
2 ESTUDIO DE LOS TRABAJOS Y TECNOLOGAS EXISTENTES........................................................- 12 -
2.1 ANLISIS DE SERIES TEMPORALES........................................................................................- 12 -
2.2 PREDICCIN...................................................................................................................................- 28 -
3 MOTIVACIN DEL PROYECTO..............................................................................................................- 34 -
4 OBJETIVOS............................................................................................................................................- 36 -
4.1 CUANTIZACIN VECTORIAL.....................................................................................................- 37 -
4.2 PREDICCIN...................................................................................................................................- 38 -
5 METODOLOGA / SOLUCIN DESARROLLADA...................................................................................- 38 -
6 RECURSOS / HERRAMIENTAS EMPLEADAS........................................................................................- 39 -
CAPTULO 2 CUANTIZACIN VECTORIAL..........................................................................- 43 -
1 TCNICA DE CUANTIZACIN VECTORIAL......................................................................................- 44 -
1.1 ALGORITMO NEURAL-GAS .....................................................................................................- 45 -
1.2 DIFERENCIAS CON OTROS ALGORITMOS DE CUANTIZACIN....................................- 50 -
2 ALGORITMO NEURAL-GAS DESARROLLADO................................................................................- 51 -
2.1 DIAGRAMA DE FLUJO.................................................................................................................- 53 -
2.2 SINTESIS DEL ALGORITMO.......................................................................................................- 55 -
2.3 INICIALIZACIN ............................................................................................................................- 63 -
2.4 PREPARACIN ...............................................................................................................................- 64 -
2.5 ENTRENAMIENTO .........................................................................................................................- 67 -
2.6 ACTUALIZACIN DE CENTROIDES ........................................................................................- 69 -
2.7 ACTUALIZACIN DE PREDICCIONES....................................................................................- 71 -
2.8 CALCULO DEL ERROR ACTUAL...............................................................................................- 75 -
2.9 CALCULO DEL NMERO DE CENTROIDES .........................................................................- 77 -
CAPTULO 3 APLICACIN A LA PREDICCIN DE SERIES TEMPORALES ..........- 82 -
1 SERIE TEMPORAL...............................................................................................................................- 83 -

Memoria.ndice:


2 PREDICCIN DE SERIES TEMPORALES...........................................................................................- 86 -
2.1 Prediccin mediante modelos lineales. ........................................................................................- 92 -
2.2 Prediccin mediante filtro autoregresivo adaptativo................................................................- 94 -
2.3 Prediccin mediante aproximacin funcional local y lineal....................................................- 96 -
2.4 Redes funcionales de base radial ..................................................................................................- 98 -
2.5 Prediccin usando probabilidades de Markov en mapas autoorganizados..........................- 99 -
2.6 Mapas autoorganizados recurrentes con modelos lineales locales..................................... - 101 -
2.7 Prediccin basada en los vectores de datos ms cercanos................................................... - 104 -
2.8 Red neuronal perceptrn multicapa (MLP) ............................................................................. - 105 -
2.9 Razonamiento inductivo borroso................................................................................................ - 108 -
3 ALGORITMO DE PREDICCIN DESARROLLADO................................................................................- 117 -
3.1 Prediccin con promediado de los datos mediante modelo lineal....................................... - 117 -
3.2 SINTESIS DEL ALGORITMO.................................................................................................... - 118 -
3.3 PREDICCIN................................................................................................................................ - 120 -
3.4 GUARDA DE LOS RESULTADOS ............................................................................................ - 121 -
CAPTULO 4 RESULTADOS OBTENIDOS ............................................................................ - 122 -
1 NDICES ANALIZADOS......................................................................................................................- 123 -
1.1 RECTA DE REGRESIN ............................................................................................................ - 123 -
1.2 COEFICIENTE DE CORRELACIN ....................................................................................... - 127 -
1.3 NMSE.............................................................................................................................................. - 132 -
1.4 TASA DE ACIERTO Y FALLO................................................................................................... - 133 -
1.5 BENEFICIO ACUMULADO...................................................................................................... - 134 -
2 NMERO MXIMO DE CENTROIDES 20............................................................................................- 135 -
2.1 CENTROIDES DEFINITIVOS.................................................................................................... - 135 -
2.2 NMSE.............................................................................................................................................. - 136 -
2.3 COEFICIENTES DE CORRELACIN- RECTA DE REGRESIN..................................... - 137 -
2.4 TASAS DE ACIERTO ................................................................................................................... - 139 -
3.2 NMSE.............................................................................................................................................. - 151 -
3.4 TASAS DE ACIERTO ................................................................................................................... - 154 -
Memoria.ndice:


4.2 NMSE.............................................................................................................................................. - 166 -
4.4 TASAS DE ACIERTO ................................................................................................................... - 169 -
5 AVANCE EN OTRAS DIRECCIONES...................................................................................................- 184 -
5.1 OPCIN DE 30 CENTROIDES-4 MESES DE ENTRENAMIENTO................................... - 185 -
6 MODIFICACIN DEL TAMAO DE LA VENTANA Y DE LA CONFIGURACIN DEL FILTRO......- 193 -
7 MODIFICACIN DEL MTODO DE ELIMINACIN DE CENTROIDES............................................- 204 -
8 COMPROBACIN CON DIFERENTES DATOS.....................................................................................- 207 -
CAPTULO 5 CONCLUSIONES .................................................................................................. - 211 -
BIBLIOGRAFA:....................................................................................................................................... - 217 -
PLIEGO DE CONDICIONES:............................................................................................................... - 218 -
1 CONDICIONES GENERALES..............................................................................................................- 218 -
2 CONDICIONES ECONMICAS.............................................................................................................- 219 -
3 CONDICIONES TCNICAS Y PARTICULARES.................................................................................- 220 -
PRESUPUESTO ......................................................................................................................................... - 222 -
Memoria.


Parte I MEMORIA
Memoria.Prlogo:


PRLOGO:
Cuando hablamos de una secuencia de valores observados a lo
largo del tiempo, y por tanto ordenados cronolgicamente, la
denominamos, en un sentido amplio, serie temporal. Resulta difcil
imaginar una rama de la ciencia en la que no aparezcan datos que
puedan ser considerados como series temporales.
El anlisis de series temporales se usa hoy da con profusin
en muchas reas de la ciencia, fundamentalmente en fsica,
ingeniera y en economa.
Los objetivos del anlisis de series temporales son diversos,
pudiendo destacar el anlisis la prediccin, el control y la
simulacin de procesos.
Denominamos anlisis a la exploracin automtica de grandes
bases de datos para extraer informacin til y no evidente.
Denominamos prediccin a la estimacin de valores futuros de
la variable en funcin del comportamiento pasado de la serie. Este
objetivo se emplea ampliamente en el campo de la ingeniera y de la
economa.
En la teora de control de procesos, se trata de seguir la
evolucin de una variable determinada con el fin de regular su
valor.
Memoria.Prlogo:


La simulacin se emplea en investigacin aplicada, cuando el
proceso es muy complejo para ser estudiado de forma analtica.
Las tcnicas de cuantizacin vectorial, tambin denominadas de
clustering, tienen como finalidad codificar un conjunto extenso de
vectores utilizando exclusivamente un conjunto reducido de vectores
de referencia o centroides. El criterio usado para definir los
vectores de referencia es minimizar el error de distorsin o
reconstruccin definido como la suma de las distancias eucldeas de
los vectores pertenecientes al conjunto original con respecto a sus
correspondientes vectores de referencia.
En este Proyecto se aplicar la cuantizacin vectorial a la
prediccin de una serie temporal entendida como una sucesin de
nmeros reales indexados por un ndice entero (nmero de muestra)
para la que se desconocen las seales de entrada que la generan.
Utilizaremos como serie temporal, una serie financiera,
concretamente la cotizacin incremental en % de un valor burstil.
El objetivo consiste en identificar, mediante cuantizacin
vectorial, pautas o patrones de comportamiento que se repiten con
cierta frecuencia en el tiempo de tal manera que se pueda calcular
la prediccin del valor futuro de la serie mediante la extrapolacin
del patrn de comportamiento identificado. La correcta prediccin de
los valores futuros de la serie temporal permitira llevar a cabo la
toma de decisiones.

Memoria.Introduccin


Captulo 1 INTRODUCCIN

A lo largo de este captulo se pretende hacer una
introduccin al tema en que se ha basado este proyecto de fin de
carrera.
Se incluir desde una exposicin del estado del arte
actualmente, las motivaciones por las que se ha escogido este
proyecto hasta la metodologa, recursos y herramientas utilizadas
para su desarrollo.
El objetivo de este proyecto se podra dividir en dos partes
diferenciadas aunque complementarias la una con la otra:
El anlisis de series temporales mediante tcnicas de
cuantizacin vectorial.
Aplicacin de la cuantizacin vectorial a la prediccin
de los valores futuros de una serie temporal.
Por este motivo en la introduccin se intentar tratar los dos
temas por separado, aunque esto no ser posible siempre debido a la
interconexin existente entre ellos.

Memoria.Introduccin


1 Un poco de historia
La metodologa actual para analizar series temporales es, como
suele ocurrir en estadstica, la confluencia de varias lneas de
trabajo desarrolladas en distintos campos cientficos. En el caso de
las series temporales pueden identificarse cinco campos de trabajo
principales:
El primero tiene sus races en los estudios de series
astronmicas y climticas, que dio lugar a la teora de
procesos estocsticos estacionarios, desarrollada por los
matemticos Kolmogorov, Wiener y Cramer en la primera mitad
del siglo XX.
El segundo, es el desarrollo de los mtodos de alisado,
inventados por investigadores operativos para prever series de
produccin y ventas en la dcada 1960-70, aprovechando las
facilidades de clculo aportadas por los primeros ordenadores.
El tercero, la teora de prediccin y control de sistemas
lineales, desarrollada en ingeniera de control y automtica
en los aos 70, y estimulada por el desarrollo de la
ingeniera aeronutica y espacial.
El cuarto, es la teora de procesos no estacionarios y no
lineales, desarrollada por estadsticos y econmetras en los
ltimos veinte aos del siglo XX.
Finalmente, el ltimo campo son los modelos multivariantes y
los mtodos de reduccin de la dimensin en sistemas
dinmicos, que se encuentra todava en fase de desarrollo.
Memoria.Introduccin


De esta forma, los mtodos disponibles en la actualidad para
el anlisis de las series temporales son deudores de las
investigaciones de matemticos, estadsticos, ingenieros, fsicos y
economistas durante el siglo XX para resolver problemas de
prediccin y control de variables y sistemas dinmicos.
Las primeras series temporales estudiadas correspondan a
datos astronmicos y meteorolgicos. El matemtico Laplace (1749-
1827), profesor de Napolen que le hizo ministro del interior,
analiz en 1823 el efecto de las fases de la luna sobre las mareas y
los movimientos de aire en la tierra. Para estudiar este segundo
efecto, consider la relacin entre las fases de la luna y la
presin baromtrica, utilizando una serie de ocho aos de tres
medidas diarias de la presin baromtrica en Pars. Laplace ajust
una funcin sinusoidal a los datos, pero sus resultados no fueron
correctos porque no tuvo en cuenta la dependencia temporal de las
observaciones. Despus de la invencin del mtodo de mnimos
cuadrados por Gauss y Legandre a principios del siglo XIX, se
realizan diversos ajustes de funciones sinusoidales a datos
astronmicos para detectar las posibles periodicidades. Un avance
importante en esta direccin fue debido a Arthur Schuster (1851
1934), fsico britnico que propuso en 1898 representar la amplitud
de la onda ajustada a datos de espectros fsicos en funcin de la
frecuencia utilizada, y bautiz este grfico como periodograma. La
fundamentacin matmatica del periodograma proviene de los trabajos
del matemtico francs J. B. Fourier (1768-1830), que demostr a
principios del siglo XIX que toda funcin peridica puede
representarse como suma de funciones sinusoidales. El descubrimiento
Memoria.Introduccin


del concepto de regresin por F. Galton (1822-1911), primo de Darwin
e investigador muy destacado en muchos campos, y del coeficiente de
correlacin por K. Pearson (1857-1936) permiten la utilizacin de
estas ideas para analizar la evolucin de una serie temporal. El
estadstico britnico, G. U. Yule (1871-1951), introductor del
coeficiente de correlacin mltiple y de los coeficientes de
autocorrelacin parcial, extendi estas ideas a las series
temporales proponiendo los procesos autorregresivos en 1927 para
explicar la serie de manchas solares. En ese mismo ao, el
estadstico ruso E. E. Slutsky (1880- 1948) descubri que al tomar
promedios mviles en una serie se generan artificialmente
periodicidades y estudi los procesos de media mvil para
representar los ciclos econmicos.
Estos avances llevan a la formalizacin del concepto de serie
temporal como proceso estocstico estacionario, debida al gran
matemtico ruso A.N. Kolmogorov (1903-1987), que es tambin el
creador de la fundamentacin axiomtica de la probabilidad y los
procesos estocsticos. Adems, Komogorov extiende el anlisis de su
compatriota Markov (1856-1922), y estudia los procesos cuyo
comportamiento futuro conocido el presente no depende del pasado,
que se conocen en la actualidad como procesos markovianos. La
primera solucin general al problema de la interpolacin y la
prediccin de series temporales para procesos estacionarios fue
debido a Norbert Wiener (1894 -1964) en el MIT en Boston (EE.UU.) y
a A.N. Kolmogorov (1903-1987) en Mosc (Rusia) entre 1939 y 1942.
Como estos descubrimientos se consideraron de gran importancia
militar se mantuvieron en secreto durante la segunda guerra mundial
Memoria.Introduccin


y no se difundieron en la comunidad cientfica hasta los aos 50. La
generalizacin del anlisis de Fourier para representar procesos
estacionarios es debida al matemtico sueco Crmer (1893-1985). Un
estudiante suyo, Herman Wold (1908- 1992), encontr en su tesis
doctoral en 1938 la representacin general de un proceso
estacionario como una media mvil infinita. En los aos posteriores
a la segunda guerra mundial el estadstico britnico M. S.
Bartlett (1910-2002) estudia las propiedades mustrales de las
autocorrelaciones de procesos estacionarios, cuyas bases estableci
en 1946. Adems, los trabajos de Bartlett y del estadstico
estadounidense John Tukey (1915-2000), al que debemos enormes
contribuciones en otros muchos campos, sentaron las bases del
anlisis espectral moderno. Bartlett introdujo la idea fundamental
de suavizar el periodograma y Tukey, desde los laboratorios de la
compaa telefnica Bell en Estados Unidos, inventa con J. W. Cooley
la transformada rpida de Fourier para calcular de forma efectiva el
espectro (Cooley y Tukey, 1965). Otras contribuciones importantes al
campo espectral son debidas al estadounidense E. Parzen (1929 -),
que desarroll la estimacin consistente del espectro mediante
ventanas, al japons H. Akaike (1919 -), que propuso la estimacin
del espectro ajustando modelos AR largos, y al britnico P. Whittle
(1929 ), que introduce los procedimientos de estimacin de mnimos
cuadrados basados en el espectro.
Paralelamente a esta primera lnea de trabajo, la aparicin
del ordenador impulsa el desarrollo de mtodos de prediccin para
series reales no estacionarias basados en mtodos heursticos. Holt
Memoria.Introduccin


(1957) y Winters (1960) introducen los mtodos de alisado
exponencial que tienen mucha repercusin en las aplicaciones
prcticas de la prediccin. La unin de los mtodos de alisado y los
procesos estocsticos se establece con el trabajo de Muth (1960),
que demostr que los mtodos de alisado eran ptimos para un tipo
especial de proceso ARIMA, y, sobre todo, por las investigaciones en
los aos 60 de los britnicos G. E. P. Box (1919 -) y G. Jenkins
(1933- 1982) que estudian el problema de la prediccin y control de
series temporales industriales. Fruto de sus investigaciones es su
clebre libro (Box and Jenkins, 1970)
1
que marca un hito en el
anlisis de las series temporales al presentar una metodologa
unificada para estudiar series estacionarias y no estacionarias,
estacionales o no y aplicar estos modelos en la prctica. Adems,
estos autores desarrollaron los fundamentos estadsticos de los
sistemas de control.
Paralelamente al trabajo estadstico de Box y Jenkins en los
aos 60 los matemticos e ingenieros desarrollan un enfoque general
para modelar, prever y controlar sistemas dinmicos lineales. Este
enfoque explica la evolucin de las variables observadas en funcin
de unas variables no observadas que caracterizan la dinmica del
sistema y que se denominan variables de estado. R. Kalman (1930 -) y
Busy presentan en 1962 un procedimiento mnimo cuadrtico general
para estimar las variables de estado y prever las observaciones
futuras en sistemas lineales, hoy conocido como el filtro de Kalman.
Este algoritmo generaliza resultados previos que haban aparecido
para resolver casos particulares y se introduce en la estadstica
gracias a los trabajos de Harrison y Stevens (1976), que presentan
Memoria.Introduccin


una forma alternativa de modelar las series temporales mediante la
formulacin en el espacio de los estados y el enfoque Bayesiano. El
enfoque en el espacio de los estados ha sido continuado por M. Aoki
(1987) y los britnicos M. West (vase West y Harrison, 1989) y A.
Harvey (vase por ejemplo, Harvey, 1989) y sus colaboradores.
Estos modelos aparecieron como una forma alternativa de modelar
series temporales contrapuesta a los modelos ARIMA propuestos por
Box y Jenkins, pero en la actualidad se reconoce el carcter
complementario de ambas formulaciones. El ajuste de modelos
autoregresivos a series reales plante el problema de cmo
seleccionar el orden del modelo. H. Akaike (1919-), el ms clebre
estadstico japons, plantea con toda generalidad este problema y
proporciona una solucin elegante y simple utilizando conceptos de
teora de la informacin, el criterio AIC (Akaike,1976). Su trabajo,
realizado inicialmente para resolver un problema de series
temporales, ha tenido una influencia enorme en todas las reas de la
estadstica.
Una de las contribuciones fundamentales de Box y Jenkins fue
la introduccin de los procesos integrados que se convierten en
estacionarios tomando diferencias. Sin embargo, la teora de estos
procesos se desarrolla posteriormente, en los aos 80 y 90. Un
avance significativo para desarrollar la teora de series no
estacionarias aparece en la tesis de J. Dickey dirigida por W.
Fuller, que desarrolla la teora de proceso integrados de primer
orden y propone un contraste de races unitarias (Dickey y Fuller,
1981). Esta teora se ha extendido mucho en la ltima dcada del
Memoria.Introduccin


siglo XX principalmente en el campo de la econometra. El estudio de
procesos no estacionarios vectoriales lleva al concepto de
cointegracin, que se define como la presencia de combinaciones
lineales de series no estacionarias que forman un proceso
estacionario. Esta posibilidad fue inicialmente estudiada por Box y
Tiao (1977), en un trabajo pionero de gran importancia, y
establecida por Granger and Engle en 1987, en una contribucin con
gran impacto en la economa y que ha valido a estos autores la
concesin del Premio Nobel de Economa en 2003. Adems, R. Engle
(1943-) introduce en 1999 el modelo ARCH, cuya varianza futura vara
en funcin de los valores pasados de la serie y que ha sido
generalizado por numerosos autores. Otra lnea importante en los
aos 80 y 90 es el estudio de modelos no lineales, donde
resaltaremos el trabajo de H. Tong, con los autorregresivos por
umbrales, Priestley con sus modelos generales, los bilineales de
Granger at al, y los modelos de memoria larga introducidos en los
aos 60 para datos hidrolgicos por Mandelbrot y sus colaboradores.
Un caso especial de no linealidad es la presencia de valores
atpicos. Fox (1974) introdujo los dos tipos bsicos de atpicos en
series estacionarias, y G. Tiao (1933-) y R. Tsay (1951-) y sus
colaboradores han propuesto mtodos eficientes de modelar series con
atpicos.
El estudio de las relaciones dinmicas entre series se ha
movido con cierto retraso respecto a los anlisis univariantes. La
introduccin de retardos en las relaciones dinmicas entre dos
series es debida a R. A. Fisher que estudi en 1923 la relacin
entre la lluvia y la produccin de trigo en la estacin agraria de
Memoria.Introduccin


Rothamsted en Inglaterra. Para representar los posibles retardos
introdujo por primera vez lo que hoy conocemos como una ecuacin de
regresin dinmica. Paralelamente, Irving Fisher en 1925 introdujo
los retardos para describir las relaciones entre variables
econmicas. La generalizacin de estas ideas para contruir funciones
polinmicas de retardos que pueden estimarse por mnimos cuadrados
es debida a Shirley Almon, en 1965. Un trabajo pionero sobre las
series temporales multivariantes fue debido a Quenouilli (1924-
1973), que desarroll mtodos muy avanzados para su poca para el
estudio de series multivariantes. Hannan (1980) estudia las series
temporales multivariantes y Hannan y Deistler (1988) en el espacio
de los estados. Zellner y Palm (1974) relacionan la teora de
modelos ARMA vectoriales con los modelos economtricos dinmicos
desarrollados aos antes. En 1980 Tiao y Box proponen un mtodo
general para construir modelos ARIMA vectoriales y en los ltimos
veinticinco aos se han hecho avances importantes en los
procedimientos para reducir la dimensin de vectores de series y
modelar la dependencia entre ellos.

Memoria.Introduccin


2 Estudio de los trabajos y tecnologas
existentes

2. 1 ANLI SI S DE SERI ES TEMPORALES

2.1.1 Redes Neuronales
El enfoque de la reconstruccin conduce a buenos resultados si
en verdad existe un sistema simple que detectar y modelizar. Si, por
el contrario, el sistema es complejo, bien por su elevado nmero de
grados de libertad, o bien por ser estocstico, no existe este
sistema simple subyacente y fallar el enfoque de la reconstruccin
del espacio de estados. En estos casos, los usuales, cuando se
trabaja con series temporales econmicas, se aplican el enfoque de
redes neuronales. A pesar de la dificultad de su interpretacin, su
buen funcionamiento justifica su amplia difusin y aplicacin en
campos muy diversos. Debido al xito conseguido por la utilizacin
de redes neuronales en el manejo de series temporales econmicas, se
ha considerado interesante dedicar, aunque sea brevemente, unas
lneas a su definicin y manejo.
Las redes neuronales (ver [Jungeilges, 1996]
2
) son una clase
de modelos no lineales inspirados por la arquitectura neuronal del
cerebro. Nacieron en el campo de la inteligencia artificial como un
intento de modelizar la capacidad de aprendizaje de los sistemas
Memoria.Introduccin


biolgicos neuronales mediante la modelizacin de la estructura del
cerebro.
A finales de la dcada de los ochenta comienzan a aplicarse en
economa las tcnicas de Redes Neuronales Artificiales (RNA) que se
venan aplicando en distintos campos medicina, lingstica,
defensa...- con bastante xito y que pretenden emular la forma en
que el cerebro humano procesa la informacin, en las que no es
necesario especificar la forma funcional entre inputs y outputs -
free-model- y permiten plantear una gran variedad de modelizaciones
arquitecturas- aprovechando su gran flexibilidad.
As, las RNA los modelos matemticos que representan- pueden
ser consideradas como herramientas vlidas en Estadstica ms
concretamente, para clasificacin, reduccin de dimensin, y
modelizacin y prediccin, tanto de series temporales como de
modelos causales (Swanson y White,1995)
3
.
Son modelos no-lineales inspirados en las redes de neuronas
biolgicas. Se discutir su estructura con un poco ms de detalle.
Esta estructura cerebral se compone de un gran nmero de
neuronas con un elevado nmero de interconexiones entre ellas,
activndose una neurona si la seal total recibida de todas las
neuronas que conectan con ella excede un cierto nivel, que se conoce
como nivel de activacin.
En la Figura 1 se muestran las distintas partes de una neurona
humana.
Memoria.Introduccin


Figura 1_Neurona humana

En general, una neurona enva su salida a otras por su axn.
El axn lleva la informacin por medio de diferencias de potencial,
u ondas de corriente, que depende del potencial de la neurona.
La neurona recoge las seales por su sinpsis sumando todas
las influencias excitadoras e inhibidoras. Si las influencias
excitadoras positivas dominan, entonces la neurona da una seal
positiva y manda este mensaje a otras neuronas por sus sinpsis de
salida.
En este sentido la neurona puede ser modelada como una simple
funcin escaln f().
Como se muestra en la Figura 2, la neurona se activa si la
fuerza combinada de la seal de entrada es superior a un cierto
nivel, en el caso general el valor de activacin de la neurona viene
dado por una funcin de activacin f().
Memoria.Introduccin


Figura 2_Funcionamiento de la neurona

Una red neuronal artificial es un modelo de computacin
inspirado en nuestros conocimientos sobre neurociencia, es decir, el
estudio de las neuronas de nuestro sistema nervioso, aunque sin
tratar de ser biolgicamente realistas en detalle.
Las redes neuronales reflejan la idea de entender el proceso
de aprendizaje como un procedimiento estadstico de tipo recursivo.
Son modelos de tipo entrada-salida (input-output) puesto que, dado
un vector input x, la red produce un vector output y y g(x), ?,
estando la funcin g determinada por una estructura neuronal.
Las redes neuronales nacieron para el reconocimiento de
patrones, donde una coleccin de figuras se presenta a la red y la
tarea de la misma es asignar la figura que entra a una o ms clases.
En los ltimos aos estos modelos han experimentado un gran
desarrollo gracias al descubrimiento de su excelente comportamiento
en problemas de reconocimiento de patrones, prediccin y
clasificacin, entre otros y tambin se utilizan en la regresin no
Memoria.Introduccin


lineal, pretendiendo encontrar una interpolacin suave entre dos
puntos. En estos dos casos toda la informacin relevante se presenta
a la red simultneamente mientras que, en la prediccin de series
temporales se procesa la informacin de patrones que evolucionan en
el tiempo.
Estos modelos son capaces de cierto tipo de aprendizaje a
travs de una interaccin con su entorno por medio de un proceso
que, como hemos dicho antes, puede considerarse como un
procedimiento estadstico de estimacin recursiva.
Estn siendo aplicados a numerosas reas tan diferentes como
la psicologa, la computacin, la gentica, la lingstica y la
ingeniera debido a su capacidad para resolver una gran diversidad
de problemas como la descodificacin de lenguajes, reconocimiento de
caracteres escritos a mano, descodificacin de sucesiones genticas
proteicas en definitiva, aplicando este tipo de tcnicas se
resuelven problemas relacionados con el reconocimiento de patrones,
clasificacin, deteccin de no linealidad y prediccin no lineal.
Pero algo que dejan claro todos estos autores es que a pesar de que
las redes neuronales son un concepto relativamente novedoso, los
mtodos que aplican son mtodos estadsticos conocidos desde
principios de la dcada de los cincuenta.
Las redes neuronales intentan solucionar el llamado problema
inverso de ajustar una funcin no lineal utilizando para ello los
valores sucesivos de una serie temporal observada.
Memoria.Introduccin


Las ventajas que presentan sobre otros mtodos son
principalmente dos:
Los desarrollos recientes en la literatura de redes neuronales
artificiales proporcionan los fundamentos tericos para la
universalidad de redes feedforward, como aproximaciones a
funciones ya que redes feedforward con un nmero arbitrario de
neuronas pueden aproximar cualquier funcin uniformemente
continua, as como tambin la derivada de una funcin
arbitraria.
Para el ajuste utilizan un nmero de parmetros que aumenta
linealmente con el orden de aproximacin, mientras que la
mayora de los modelos utilizan el crecimiento con respecto al
orden de aproximacin suele ser exponencial.
Como ya se mencion anteriormente, una red neuronal es una
estructura de interconexiones, compuesta por una serie de capas,
cada una de ellas formada por neuronas, de manera que cada una de
ellas alimenta a todas las neuronas de la capa siguiente (la misma
estructura que veamos en el cerebro). Cada una de las neuronas
proporciona una salida u output que es el resultado que proporciona
una funcin, llamada funcin de activacin, a la suma de sus inputs
multiplicados por unas ponderaciones o pesos. Estas ponderaciones se
ajustan conforme a un algoritmo de aprendizaje especificado con el
que se pretende minimizar la funcin de coste calculada a partir del
error cometido si se compara la salida de la red con el valor real.
Para especificar una red neuronal se necesitan los siguientes
elementos:
Memoria.Introduccin


Su arquitectura de interconexiones dependientes de unos pesos
o ponderaciones, con neuronas organizadas en distintas capas.
Las funciones de activacin que relacionan el output de una
neurona con su input.
La funcin de coste que evala la salida de la red.
Un algoritmo de entrenamiento que cambia los parmetros de
interconexin (llamados pesos) para minimizar la funcin de
coste.
Trabajando con una red lineal, si los valores de entrada
(inputs) son los valores retardados de una serie temporal y la
salida es la prediccin para el siguiente valor, la red ser
equivalente al uso de un modelo autorregresivo, de manera que los
pesos al final del proceso igualarn los coeficientes del modelo
especificado. Por este motivo las redes lineales son igual de
limitadas que los modelos autorregresivos y las redes neuronales con
capacidad interesante de adaptacin o imitacin son precisamente las
no lineales. As, la idea clave responsable de la potencia y
popularidad de las redes es la insercin de una o ms capas ocultas
no lineales entre el input y el output. Estas no linealidades
permiten la interaccin entre los inputs y por tanto permiten
ajustar funciones ms complicadas y as mejorar la capacidad de
prediccin.
En la estructura de la red es fundamental la eleccin del
nmero de capas ocultas, del nmero de nodos o neuronas de dichas
capas y del nmero de unidades de entrada. En cuanto al nmero de
capas ocultas, en general es suficiente trabajar con una aunque en
Memoria.Introduccin


determinados problemas es ms til trabajar con dos. Para determinar
el nmero de nodos de la capa oculta se utilizan argumentos
heursticos que lo relacionan con el nmero de inputs, nunca
superando el doble de ellos. De todos modos, como muestran algunos
estudios, el nmero de nodos de la capa oculta tiene un efecto sobre
la prediccin, aunque no verdaderamente significativo, siendo sta
mucho ms sensible a la eleccin del nmero de nodos de entrada. ya
que dicho nmero contiene informacin importante acerca de la
complejidad de la estructura de la red. Este nmero suele ser
escogido en funcin de los resultados de diseos experimentales,
escogindose normalmente el mejor diseo en funcin del Criterio de
Informacin de Akaike o de Schwartz.
Las redes neuronales artificiales son mecanismos matemticos
que aprenden a reconocer o clasificar patrones y, tal como lo hace
nuestro propio cerebro, dicho aprendizaje no descansa sobre un
modelo preconcebido sino que busca las correlaciones existentes
entre las variables del problema que se est estudiando.

Una arquitectura tpica de dichas redes es similar a la
representada en la Figura 3. Las neuronas (o unidades) estn
agrupadas en capas. Existe una primera capa por la que entra la
informacin, una o varias capas ocultas que la procesan, y una capa
de salida que proporciona los resultados de la red. Durante la fase
de entrenamiento se le presenta a la red un conjunto de posibles
valores de entrada juntamente con sus resultados de salida deseados,
y el algoritmo de back-propagation busca automticamente las
Memoria.Introduccin


correlaciones entre dichas entradas y sus salidas respectivas.
Cuando el aprendizaje ha finalizado, la red puede ser aplicada sobre
datos que no ha visto previamente, realizando sus propias
predicciones.

Figura 3_Red Neuronal
Existe una amplia aplicacin en el campo de la prediccin de
series temporales econmicas. En concreto, se pueden citar ejemplos
en mercados financieros ([Trippi y Turban, 1993]
4
, y [Gately,
1996]
5
), prediccin en mercados burstiles ([Yoon y Swales, 1991]
6
,),
prediccin de bancarrotas y fallos de mercados.

2.1.2 Cuantizacin vectorial

El anlisis de series temporales basado en cuantizacin
vectorial (clustering) es la denominacin de un grupo de tcnicas
multivariantes cuyo principal propsito es agrupar objetos basndose
en las caractersticas que poseen.
Memoria.Introduccin


Estas tcnicas se pueden clasificar en:
Medidas de similitud
La representacin grafica de los datos est basada en
distancias (similitudes) y algoritmos que permiten dividir los datos
en grupos.
Son en general medidas subjetivas del parecido entre elementos
de una base de datos compleja.
Para agrupar objetos se utiliza algn tipo de distancia.
Cuando es posible representar los objetos por medio de medidas
p_dimensionales razonables, se comparan pares de objetos simplemente
en base a la presencia ausencia de unas caractersticas
Para agrupar variables se utilizan coeficientes de correlacin
o medidas similares de asociacin
Mtodos jerrquicos
Los mtodos jerrquicos consisten en la construccin de
estructuras rgidas en forma de rbol a partir de una medida de
similitud.
Se utilizan, bsicamente, dos mtodos:
Mtodos aglomerativos: Cada objeto se incluye en un nico
grupo propio. En pasos sucesivos los objetos, o grupos de objetos,
ms similares van juntndose constituyen nuevos conglomerados hasta
llegar a un nico cluster final que los contiene a todos.
Memoria.Introduccin


Mtodos divisivos: Se empieza con un gran conglomerado que
contiene todos los objetos. En pasos siguientes, se van
subdividiendo los conglomerados ms diferentes en clusters
sucesivamente ms pequeos, hasta que cada objeto queda situado en
un grupo con ese elemento nicamente.
Un resultado tpico de este tipo de clustering es un rbol
jerrquico (dendrograma) como el que puede observarse en la Figura 4
Elemento 1

Elemento 2

Elemento 3

Elemento 4

Elemento 5
Figura 4_a. Cluster Mtodo Jerrquico aculumativo

Elemento 1

Elemento 2

Elemento 3

Elemento 4

Elemento 5
Figura 4_b. Cluster Mtodo Jerrquico divisivo

Memoria.Introduccin


Mtodos no jerrquicos (k_means)
En los mtodos no jerrquicos se parte de un conjunto inicial
de clusters elegidos al azar, que son representantes de todos ellos
y que se irn cambiando de modo iterativo.
Se usa el mtodo de las k-medias (k-means). Este mtodo
permite asignar a cada observacin el cluster que se encuentra ms
prximo, en relacin a un centroide (media).
Se pueden resumir en los siguientes pasos:
a. Se toman al azar k cluster iniciales.
b. Se calculan las distancias de todas las
observaciones a los centroides de los clusters, y
las observaciones se asignan a los clusters que
estn ms prximos. Se vuelven a recalcular los
centroides de los k clusters despus de las
reasignaciones de los elementos.
c. Se repiten los dos pasos anteriores hasta que no
se produzca ninguna reasignacin, es decir, hasta
que los elementos se estabilicen en algn grupo.
Problemas que surgen al fijar los k clusters iniciales
a. Si dos centroides iniciales caen por casualidad en
un nico cluster (natural), entonces los clusters
que resultan estn poco diferenciados entre s.
b. Si aparecen outliers, se obtiene, por lo menos, un
cluster con sus objetos muy dispersos.
Memoria.Introduccin


c. Si se imponen previamente k clusters pueden
originarse grupos artificiales o bien se pueden
juntar grupos distintos
Mapas autoorganizados (SOM, Self-Organizing Maps)
El mtodo de las SOM (redes auto-organizativas) est
relacionado con el mtodo de las k-means y ha sido aplicado, por
ejemplo, a datos sobre la expresin de mRNA de ciclos celulares
El SOM es un conjunto de k nodos con una topologa sencilla
(por ejemplo una retcula de dimensin dos o una malla) y una
distancia d (N
1
, N
2
) entre nodos.
Es un mtodo ms estructurado que el mtodo de las k-means, ya
que los centroides son nodos de la retcula.
Los nodos se entrenan de forma iterativa en un espacio de
dimensin q (por ejemplo un espacio de expresin de genes donde la
coordenada i-sima representa el nivel de expresin de la i-sima
muestra).
El problema que presenta esta tcnica es que el investigador
tiene que especificar a priori el nmero de clusters, la topologa
del retculo, su dimensin y el nmero de clusters en cada
dimensin. La definicin de la malla puede influir en la formacin
de los clusters.

Memoria.Introduccin


Neural-gas
Este proyecto usar para la identificacin el mtodo de
cuantizacin vectorial basado en Neural-gas, por este motivo aqu no
se profundizara en el mtodo y solo se darn unos breves apuntes de
sus bases de funcionamiento.
El algoritmo Neural-gas es el ms comnmente empleado para
realizar la cuantizacin vectorial de un conjunto de vectores V. Se
parte de un conjunto de R vectores seleccionados aleatoriamente de V
como vectores de referencia iniciales. El algoritmo modifica los
vectores de referencia a medida que procesa los nuevos vectores de
datos que le van llegando. El procedimiento consta de dos fases:
ordenacin y actualizacin de vectores de referencia:
a. Ordenar los primeros F vectores de referencia de
menor a mayor distancia al vector v, generando un
vector I de ndices y otro D de distancias.
b. Una vez realizada la ordenacin de los vectores de
referencia segn la distancia al vector V,
mediante una regla de adaptacin para el vector de
referencia R
i

Los aspectos ms importantes que hay que analizar en la
cuantizacin vectorial para determinar su influencia en el resultado
final son: la inicializacin de los vectores de referencia, el
nmero de ellos y la seleccin y tamao del conjunto de
entrenamiento o aprendizaje. De menor importancia parecen ser los
Memoria.Introduccin


valores de los parmetros involucrados en el proceso de
actualizacin de los vectores de referencia.

2.1.3 Multidimentional Scaling (MDS)

Las tcnicas MDS empezaron a desarrollarse a finales de los
sesenta en el rea de la psicofsica para analizar las percepciones
fsicas entre distintos individuos, desde un punto de vista
estadstico se interpretan como anlisis multivariables. Por ejemplo
las variables estadsticas pueden representar un hiperplano en el
cual se encuentren distribuidos los conceptos y seran las tcnicas
MDS las encargadas de buscar una proyeccin de las variables en un
espacio de dos o tres dimensiones con la menor perdida de
informacin posible.
Las tcnicas de MDS tratan sobre el siguiente problema: Para
un conjunto de similitudes observadas (o distancias) entre cualquier
par de objetos de un total de N objetos, encontrar una
representacin grfica de stos en unas pocas dimensiones, de modo
que sus posiciones casi se ajusten a las similitudes (o distancias)
originales.
Con N objetos, se buscan representaciones geomtricas en
q <(N-1) dimensiones, de modo que el ajuste entre posiciones
originales y posiciones en las q dimensiones sea el ms preciso
posible. Lo anterior se mide mediante un ndice denominado stress.
Se trata de minimizar el stress para un nmero fijo de q de
Memoria.Introduccin


dimensiones, mediante un proceso iterativo basado en la maximizacin
de la funcin de stress ecuacin (1): Mtodos del Gradiente.
La matriz de distancia. Esta matriz es simtrica y se definir
como:

La fila i y la columna j de la matriz hace referencia a los
conceptos ci y cj .

(1)
Donde d(i,j,p) es la distancia entre los conceptos i y j en el
mapa temtico y p es el periodo.
Si se usan distancias (o similitudes), se tiene el llamado
escalamiento multidimensional mtrico.
Si se usan rangos (orden de las observaciones), en vez de
distancias, se tiene el MDS no mtrico.
Las tcnicas de MDS estn relacionadas con el Anlisis de
Componentes Principales y el Anlisis de Cluster: Estos usan una
matriz: en el primer caso, de covarianzas o de correlaciones y en el
Memoria.Introduccin


segundo, de similitudes (o distancias), y generan un espacio con el
mnimo nmero de dimensiones posible donde se representan los datos.
Las tcnicas de Anlisis de Cluster y el MDS comparten las
siguientes caractersticas:
Investigar la estructura de un conjunto de variables.
El punto de partida es una matriz de proximidad.
La representacin grfica que se obtiene se puede interpretar
como distancias
2. 2 PREDI CCI N

La prediccin de una serie temporal consiste en emplear toda
la informacin disponible hasta la muestra actual k (en realidad una
ventana de datos de dimensin finita N) para poder obtener con la
mayor exactitud posible el valor de la seal n muestras ms adelante
la ecuacin (2):
( ) ( ) ( ) ( ) ( )
, 1 , , 1
k
y k n y k y k y k N + + F L

(2)
En la Figura 5 se muestra grficamente en que consiste la
prediccin de un valor futuro en una serie temporal
Memoria.Introduccin


Figura 5_Prediccin de una serie temporal

La funcin escalar Fk() de variable vectorial permite realizar
la prediccin requerida, de tal manera que cualquier mtodo de
prediccin consiste bsicamente en la definicin de dicha funcin.
Ntese que dicha funcin puede variar con el tiempo si eso
contribuye a mejorar la precisin de la prediccin. Por lo tanto,
cualquier algoritmo de prediccin constar de dos fases:
a. La identificacin de la funcin Fk() ms adecuada en la
muestra actual.
b. La aplicacin de dicha funcin para estimar el valor futuro de
la serie temporal.
A continuacin se ponen de manifiesto y se explican algunas de
las tcnicas utilizadas hoy en da para realizar predicciones de
series temporales.

Memoria.Introduccin


2.2.1 Prediccin mediante convolucin a partir de un filtro FIR.

En este caso, se considera que la prediccin, ecuacin (3) se
obtiene mediante la convolucin de la ventana de N datos ms
recientes con la respuesta a un pulso de un filtro FIR (Finite
Impulse Response) de N muestras con n retardos (la respuesta al
pulso es nula desde la muestra 0 hasta la muestra n-1):
( ) ( ) ( )
1
T
0
( ) .
N
k k k k k
i
y k n h n i y k i
+ +
h y F y

(3)
Siendo
( ) ( )
T
1
k
y k y k N + 1
]
y L
el vector que contiene la ventana
de datos ms recientes de la serie temporal, y
( ) ( )
T
1
k k k
h n h n N + 1
]
h L
el vector que contiene las muestras de
la respuesta al pulso del filtro FIR utilizado en el instante actual
k. Ntese que el filtro es adaptativo (cambia con el tiempo) y que
las n primeras muestras (desde 0 hasta n-1) de su respuesta al pulso
son nulas.
La adaptacin temporal de la respuesta al pulso del filtro se
realiza resolviendo en cada muestra el siguiente problema de mnimos
cuadrados lineales:
Memoria.Introduccin


( )
( )
( )
( )
( )
( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
[ ]
T
1
1 1
1 1 1 2
1 1 1 2
k k n k n k n m k k
e k y k y k n y k n y k n N
e k m y k m y k n m y k n m y k n m N

+ 1 1 1
1 1 1

1 1 1

1 1 1
1 1 1
+ + + +
1 1 1
] ] ]
Y y y y e y L
6447448 6447448 64444444444447444444444 8
L
L
M M M M O M
L
( )
( )
( )
( ) ( ) ( )
T
1 1 .
1
1
k k k
k
y k n y k n y k n m
k
k
k
h n
h n
h n N
+ 1
]
1
1
+
1
1
1
+
1
]
y Y h
h
L
644444444444444474444444444444448
444 6447448
M

El objetivo es minimizar la norma cuadrtica del vector de
errores de prediccin ek. Esto se consigue si el vector de errores
de prediccin se hace ortogonal a cada uno de los vectores columna
de la matriz de regresores Yk:
( )
T T T T
. . . . . 0
k k k k k k k k k k
Y e Y y y Y y Y Y h

2.2.2 Prediccin con promediado de los datos mediante modelo lineal.

Al realizar la prediccin mediante la convolucin con la
respuesta al pulso de un filtro FIR, las muestras de la respuesta al
pulso del filtro pueden ser vistas como una secuencia de pesos a
aplicar a las muestras pasadas de la serie para estimar su valor
futuro ecuacin (4)
( ) ( )
1
T
0
( ) .
N
i k k k k
i
y k n a y k i
a y F y
(4)

Memoria.Introduccin


Donde
[ ]
T
1 2 N
a a a a L
es el vector de pesos a aplicar.
Parece razonable tener en cuenta estos pesos en el proceso de
cuantizacin vectorial con el fin de calcular las distancias
considerando la importancia real de cada muestra en la prediccin.
El vector de pesos ms apropiado se determina a partir de todo
el registro de datos de la serie temporal mediante mnimos cuadrados
lineales.

2.2.3 Prediccin mediante redes funcionales.

Las redes funcionales (RBFN, Radial-Basis Function Networks)
constituyen otra clase de aproximacin funcional no lineal empleada
para prediccin de series temporales. La ms empleada es la red
funcional gaussiana definida por la ecuacin (5):
( ) ( )
2
2
1
k i
i
R
k k i
i
y k n e

y w
F y

(5)

Siendo yk el vector de los N datos ms recientes, wi cada uno
de los R vectores de referencia obtenidos por cuantizacin vectorial
(centroides), si la desviacin estndar de las distancias en cada
regin de generada por cada centroide (regin de Voronoi) y ?i un
factor de promediado.
Memoria.Introduccin


La diferencia fundamental con los mtodos de aproximacin
funcional descritos hasta ahora es que en los casos anteriores se
aplicaba una funcin especfica en cada regin de Voronoi, mientras
que en este caso las funciones gaussianas asignadas a cada regin se
solapan para generar una funcin global ms suave.

2.2.4 Prediccin mediante aproximacin funcional local y lineal.

En esta tcnica se realizan simultneamente la actualizacin
de los vectores de referencia y de la funcin de prediccin.
Consideraremos cada secuencia de N datos consecutivos y ms
recientes de la serie temporal como el vector de datos vk, actual
perteneciente al conjunto de vectores V que deseamos cuantizar.
Por lo tanto en cada nueva muestra se definir dicho vector y
se emplear para actualizar los vectores de referencia wi de las
regiones de Voronoi Vi, segn el algoritmo neural-gas.
El objetivo es no slo actualizar los vectores de referencia
en cada nueva muestra, sino tambin la funcin lineal de prediccin
fi(), la cual tiene la estructura que se muestra en la ecuacin (6):

( ) ( )
T
.
i i i i
y y + f v a v w

(6)

Memoria.Introduccin


3 Motivacin del proyecto

Si definimos una ser i e t empor al como una sucesin de nmeros
reales indexados por un ndice entero (nmero de muestra) para la
que se desconocen las seales de entrada que la generan, resulta
difcil imaginar una rama de la ciencia en la que no aparezcan datos
que puedan ser considerados como series temporales.
Si, conocidos los valores pasados de la serie, no fuera
posible predecir con total certeza el prximo valor de la variable,
decimos que la serie es no determinista o aleatoria, y lgicamente
es de stas de las que se ocupa el cuerpo de doctrina denominado
"anlisis de series temporales" y al que posteriormente dedicaremos
una breve introduccin.
Los objetivos del anlisis de series temporales son diversos,
pudiendo destacar la prediccin, el control de un proceso, la
simulacin de procesos.
Denominamos pr edi cci n a la estimacin de valores futuros de
la variable en funcin del comportamiento pasado de la serie. Este
objetivo se emplea ampliamente en el campo de la ingeniera y de la
economa. As por ejemplo, la prediccin mediante modelos basados en
la teora de series temporales, puede servir para una buena
planificacin de recursos energticos, en funcin de la demanda que
se espera en el futuro, prevista por el modelo. Otro de los campos
en los que se aplica la prediccin mediante series temporales es el
de la meteorologa o en la prediccin de otros fenmenos naturales.
Memoria.Introduccin


Evidentemente aunque el valor futuro de una serie temporal no
sea predecible con total exactitud, para que tenga inters su
estudio, el resultado tampoco puede ser completamente aleatorio,
existiendo alguna regularidad en cuanto a su comportamiento en el
tiempo, lo que har posible su modelado y por ende, en su caso, la
prediccin. La bsqueda de regularidades y de patrones ha sido
siempre una de las tareas bsicas de la ciencia, y muchas veces se
descubren simetras que sirven de fundamento para la prediccin del
comportamiento de los fenmenos, incluso antes de que se entienda la
razn o causa que justifica esa regularidad. Esto ocurri, por
ejemplo, con el sistema peridico de los elementos, descrito por
Mendeleiev (1834-1907), quien organiz de forma muy correcta los
elementos qumicos en base a las simetras observadas entre ellos,
antes de que se comprendiese la razn de esas simetras o
periodicidad, razones que luego se fundamentaron sobre todo en
trabajos de Schrdinger (1887-1961) y Pauli (1900-1958).
vectores utilizando exclusivamente un conjunto reducido de vectores
de referencia o centroides.
Existen diferentes algoritmos de cuantizacin vectorial como
k-means, mapas autoorganizados (SOM, Self-Organizing Maps) o neural-
gas. El algoritmo neural-gas es el ms comnmente empleado para
realizar la cuantizacin vectorial de un conjunto de vectores. Se
parte de un conjunto reducido de vectores seleccionados
aleatoriamente del conjunto original como vectores de referencia
Memoria.Introduccin


iniciales. El algoritmo modifica los vectores de referencia a medida
que procesa los nuevos vectores de datos que le van llegando con el
fin de minimizar el error de distorsin.

4 Objetivos

El objetivo del anlisis de series temporales es doble. Por un
lado se busca explicar las variaciones observadas en la serie en el
pasado, tratando de determinar si responden a un determinado patrn
de comportamiento. Y por otro, si se consigue definir ese patrn o
modelo, se intentar predecir el comportamiento futuro de la misma.
Para alcanzar este doble objetivo se utiliza una metodologa
bastante consolidada, segn la cual se admite que la serie temporal
es una funcin del tiempo: yt = f(t). Bajo este esquema, la serie
sera una variable dependiente y el tiempo una independiente o
explicativa. Sin embargo, es necesario dejar bien claro que el
tiempo, en si, no es una variable explicativa, es simplemente el
soporte o escenario en el que se realiza o tiene lugar la serie
temporal. El tiempo no sirve para explicar el comportamiento de la
serie. A esta forma de abordar el estudio de una serie temporal se
le conoce como enfoque clsico, frente al causal, segn el cual,
cualquier serie, como variable que es, puede ser explicada por otra
u otras series.
Memoria.Introduccin


El objetivo fundamental consistir en identificar, mediante
cuantizacin vectorial, pautas o patrones de comportamiento que se
repiten con cierta frecuencia en el tiempo.

Posteriormente se aplicarn estos patrones de comportamiento
de tal manera que se pueda calcular la prediccin del valor futuro
de la serie mediante la extrapolacin del patrn identificado.
La correcta prediccin de los valores futuros de la serie
temporal permitira llevar a cabo la toma de decisiones.

4. 1 CUANTI ZACI N VECTORI AL

El anlisis de series temporales basado en cuantizacin
vectorial (clustering) tiene como principal propsito agrupar
objetos basndose en las caractersticas que poseen.

Memoria.Introduccin


La identificacin de pautas conlleva:
Reduccin o simplificacin estructural de los datos (con
perdida mnima de informacin)
Clasificacin y agrupamientos
Estudio de las dependencias entre variables

4. 2 PREDI CCI N
El objetivo consiste en emplear toda la informacin disponible
hasta la muestra actual (en realidad una ventana de datos de
dimensin finita N) para obtener la mejor prediccin posible de la
seal n muestras ms adelante
( )
y k n +
y poder as tomar una
decisin, en la muestra actual k, sobre las acciones a realizar en
el futuro, ecuacin (7):
( ) ( ) ( ) ( ) ( )
, 1 , , 1
k

(7)
5 Metodologa / Solucin desarrollada

Dentro de todas las posibles opciones se ha optado por
realizar el anlisis de la serie temporal mediante tcnicas de
cuantizacin vectorial y ms concretamente mediante el algoritmo de
Neural-gas.
Memoria.Introduccin


Para realizar la prediccin se ha optado por generar una
funcin de prediccin que asigna a cada centroide un valor de
prediccin esttica que es la media ponderada de todos los valores
reales futuros de los vectores asociados a la regin de Voronoi
generada por dicho centroide en el proceso de entrenamiento.
Partiendo de un registro de N datos de una serie temporal la
metodologa de trabajo seguida consiste en:
a. Seleccionar solo la parte que se va a analizar.
b. Rellenar, si es que existen, los huecos temporales para
as poder trabajar con una seal continua
c. Dividir esta seal en dos partes; una para entrenar el
algoritmo y otra para comprobar el funcionamiento del
mismo.
d. Desarrollar el algoritmo de la cuantizacin vectorial y
la funcin de prediccin.
e. Implementar dichos algoritmos y Analizar los resultados.

6 Recursos / herramientas empleadas

Para la realizacin de este proyecto se utilizar como serie
temporal para aplicar los mtodos de prediccin que se evaluarn la
cotizacin incremental y(k) en % de un valor burstil definida como
se muestra en la ecuacin (8):
Memoria.Introduccin


( ) ( )
( ) 100
( )
A A
A
y k y k n
y k
y k n

(8)
Siendo yA(k) la cotizacin absoluta de ese valor y n el nmero
de muestras de separacin entre las operaciones de compra y venta.
Si se hubiera realizado la compra de cualquier nmero de ttulos del
valor burstil considerado en la muestra k-n y se vendieran en la
muestra actual k, la cotizacin incremental representara el
beneficio (>0) o prdida (<0) porcentual de dicha operacin de
compraventa.
Para el anlisis de series temporales es imprescindible tener
acceso a un paquete estadstico capaz de realizar los clculos
necesarios. Desgraciadamente no existe, que se sepa, un programa que
permita aplicar todos los mtodos existentes y en las distintas
aplicaciones se deberan utilizar programas distintos, que se
comentan a continuacin en orden creciente de complejidad.

Un programa muy simple que permite realizar el anlisis
univariante bsico de una serie temporal es Statgraphics.
Proporciona las herramientas bsicas pero no permite realizar la
estimacin mximo verosmil exacta, ni el tratamiento de atpicos.
Programas algo ms generales son Minitab, que es tambin muy
simple de usar, y SPSS, que tiene una complejidad similar y, en
trminos generales, mejores algoritmos de clculo. Estos programas
Memoria.Introduccin


permiten construir modelos univariantes pero no incluyen tratamiento
de atpicos ni modelos no lineales. Un programa ms completo es S-
plus, que incluye muchas posibilidades de anlisis ms sofisticados
y que puede programarse, lo que le hace ms flexible. El programa R
es muy similar al S-plus y puede obtenerse gratuitamente de la red
en la direccin http://www.r-project.org/
21
. El programa TSW est
basado en los programas TRAMO y SEATS desarrollados por Gmez y
Maravall y permite hacer anlisis muy completos de series temporales
univariantes. Incluye muchas capacidades, como la seleccin
automtica de modelos, el tratamiento de atpicos y est
especialmente diseado para analizar muchas series econmicas. Puede
obtenerse gratuitamente en la direccin
http://www.bde.es/servicio/software/softwaree.htm.
22
El programa
Eviews es tambin fcil de utilizar, incluye modelos univariantes y
multivariantes y esta orientado hacia la econometra.
Finalmente, el programa SCA es el ms completo, pero no es
cmodo de usar y tiene unas capacidades grficas limitadas, aunque
incluye excelentes algoritmos para la estimacin mximo verosmil,
el tratamiento de atpicos y la modelizacin multivariante.
Los programas Mat l ab y Gauss son ms bien lenguajes de
programacin muy flexibles con muchas subrutinas estadsticas.
Tienen la ventaja de ser muy fciles de programar, pero son menos
adecuados que los anteriores para hacer anlisis rutinario de series
temporales.

Memoria.Introduccin


En este proyecto se ha optado por la utilizacin del programa
Matlab, esto ha sido motivado por la flexibilidad que este programa
presenta a la hora de programar subrutinas y debido tambin a la
necesidad de poder utilizar el algoritmo aplicado a la prediccin de
series temporales

Memoria.Cuantizacin vectorial


Captulo 2 CUANTIZACIN VECTORIAL
Despus de haber sido expuestas las diferentes tcnicas de
cuantizacin vectorial, en este captulo se pretende dar a conocer
la tcnica de cuantizacin vectorial basada en Neural-gas que es
la tcnica en la cual se ha basado el proyecto.
A lo largo del captulo se presentar la finalidad, la
metodologa y las bases que definen el algoritmo de Neural-gas,
as como los factores que se deben tener en cuenta a la hora de
realizar su programacin y posterior implantacin, prestando una
atencin especial a la inicializacin de los vectores de referencia.
Tambin se desglosarn las distintas fases que debe recorrer
el algoritmo para su correcta ejecucin.
Por ltimo se realizar una breve comparacin entre los
distintos mtodos basados en cuantizacin vectorial existentes y se
expondrn las principales ventajas de la aplicacin de tcnicas de
Neural-gas



1 Tcnica de Cuantizacin vectorial.

vectores,
N
X V , utilizando exclusivamente un conjunto reducido de
vectores ) (
1 R
w w W , R i X w
N
i
1 , , denominados vectores de
referencia o centroides. De esta forma, un vector cualquiera de
datos V v se describe mediante el vector W w
v i

) (
para el cual la
distancia eucldea entre ambos vectores

N
j
j v i j v i v i
w v w v w v d
1
2
) (
2
) ( ) (
) ( ) , ( es mnima. Mediante este
procedimiento se divide el conjunto de vectores origen V en R
particiones Vi, denominadas regiones de Voronoi, a cada una de las
cuales le corresponde un vector de referencia wi, ecuacin (9):

{ } i i j
j V v V v w v w

[9]

El criterio usado para definir los vectores de referencia es
minimizar el error de distorsin o reconstruccin del conjunto V a
partir del conjunto W, definido como la suma de las distancias
eucldeas de los vectores pertenecientes a V con respecto a sus
correspondientes vectores de referencia en W.



1. 1 ALGORI TMO NEURAL- GAS

Existen diferentes algoritmos de cuantizacin vectorial como
k-means, mapas autoorganizados (SOM, Self-Organizing Maps) o Neural-
gas. El algoritmo neural-gas es el ms comnmente empleado para
realizar la cuantizacin vectorial de un conjunto de vectores V. Se
parte de un conjunto de R vectores seleccionados aleatoriamente de V
como vectores de referencia iniciales. El algoritmo modifica los
vectores de referencia a medida que procesa los nuevos vectores de
datos que le van llegando. El procedimiento consta de dos fases:
ordenacin y actualizacin de vectores de referencia:

1.1.1 Fase de ordenacin

A veces no se actualizan todos los vectores de referencia,
sino nicamente un nmero F<R, con el fin de reducir la carga
computacional, por lo que nicamente se deben ordenar los F vectores
de referencia ms prximos al vector v que se procesa en cada
momento. Para realizar esta ordenacin de forma rpida se emplea el
mtodo PDE (Partial Distance Elimination) que consta de los
siguientes pasos:
1) Ordenar los primeros F vectores de referencia de menor a mayor
distancia al vector v, generando un vector I de ndices y otro D
de distancias.



2) For p = F+1 to R, do
a) Hacer
( )
min ( )
, ( )
F
d d F
I
v w D
. Hacer d = 0.
b) For j = 1 to N, do
i) Hacer
2
( )
j pj
d d v w +

ii) If
min
d d

Ir a 2) para procesar el siguiente valor de p.
c) Hacer I(F) = p y D(F) = d
d) Reordenar I y D a partir de las nuevas distancias.

Para realizar la ordenacin de los pasos 1) y 2.d) de un
vector D de dimensin F de menor a mayor generando el
correspondiente vector de ndices I, se puede usar el siguiente
algoritmo:
1) Inicializar i = 1.
2) While i<F
a) If D(i)>D(i+1)
i) Intercambiar de posicin D(i) y D(i+1) y tambin I(i) e
I(i+1)
ii) Hacer i = 1
b) Else i = i+1



En Matlab lo ms prctico es usar las funciones norm y sort,
ya que son funciones built-in (programadas en C) que se ejecutan muy
rpidamente.

1.1.2 Fase de actualizacin de los vectores de referencia

Una vez realizada la ordenacin de los vectores de referencia
segn la distancia al vector v, la regla de adaptacin para el
vector de referencia wi (suponiendo que l indica su posicin tras la
ordenacin) es la ecuacin (10):
( )
}
( )
1
. .
h l
l
i i
e
w v w

(10)
siendo
( ) h l
la denominada funcin de vecindad y
un factor
de escala para la correccin. La funcin de vecindad tiene por
objeto incrementar la correccin de los vectores ms cercanos. La
correccin decrece exponencialmente a medida que aumenta la posicin
del vector de referencia en la ordenacin establecida por distancias
con una constante de tiempo en posiciones definida por el parmetro.
Tanto el factor de escala
como el parmetro
se ajustan con el
paso de muestras con el fin de reducir las correcciones a medida que
el volumen de entrenamiento o aprendizaje se incrementa con unos
valores finales de saturacin. Las funciones de adaptacin empleadas


en funcin del nmero de muestras k son las mostradas en la ecuacin
(11):
max max
( ) ( )
k k
k k
f f
i i
i i
k k

_ _

, ,

(11)

A partir de k = kmax se estabiliza la adaptacin de estos
parmetros. Valores tpicos para los parmetros anteriores son:
( ) max 3,10 , 0.0001, 0.99, 0.001
i f i f
R
. La seleccin de kmax
depende del problema abordado (tpicamente entre 8000 y 40000).
Para reducir la carga computacional, se puede truncar el
nmero de vectores de referencia a corregir en cada paso,
modificando la funcin de vecindad de la forma que se muestra en la
ecuacin (12):
( )
1
1
0 en otro caso
l
e l r
h l

'

(12)

Un valor razonable para el parmetro r (determina el nmero de
vectores de referencia que se corrigen en cada paso) es 6. El nmero
F de vectores de referencia que se ordenan en la primera fase del
algoritmo coincide con el entero ms prximo menor o igual a 1+r
.


1.1.3 Aspectos fundamentales a considerar

Los aspectos ms importantes que hay que analizar en la
cuantizacin vectorial para determinar su influencia en el resultado
final son:
la inicializacin de los vectores de referencia
el nmero de ellos y la seleccin y tamao del conjunto
de entrenamiento o aprendizaje.
De menor importancia parecen ser los valores de los
parmetros involucrados en el proceso de actualizacin
de los vectores de referencia

I ni ci al i zaci n de l os vect or es de r ef er enci a
Hay varios mtodos propuestos para inicializar los vectores de
referencia. El ms simple consiste en seleccionar aleatoriamente los
vectores de referencia entre el conjunto de datos garantizando la
ausencia de solapes (no deben compartir muestras). Otro mtodo ms
sofisticado es aquel que busca la mxima dispersin inicial entre
los vectores de referencia. Para ello se siguen los siguientes
pasos:
1. Seleccionar un vector (punto en
N
V
) aleatoriamente del
conjunto de datos.
2. Buscar el punto en el conjunto de datos que guarda la mxima
distancia con el punto inicial seleccionado. Este punto ser
el primer vector de referencia.


3. Buscar el punto en el conjunto de datos que guarda la mxima
distancia con el ms cercano de los vectores de referencia
encontrados hasta ese momento. Aadirlo al conjunto de
vectores de referencia iniciales.
4. Repetir el paso previo hasta que se completen los R vectores
de referencia iniciales.

1. 2 DI FERENCI AS CON OTROS ALGORI TMOS DE CUANTI ZACI N

La diferencia fundamental con el algoritmo k-means es que en
este ltimo slo se modifica el vector de referencia ms prximo, es
decir
tiende a infinito en la funcin de vecindad. Esta

simplificacin del algoritmo tiene el inconveniente de que el
resultado final de la cuantizacin depende significativamente del
conjunto inicial de vectores de referencia, ya que aumenta
considerablemente el riesgo de alcanzar un mnimo local en la
optimizacin del error de distorsin o reconstruccin.
En el caso de los mapas autoorganizados (SOM) cada vector de
referencia wi es asignado inicialmente a una ubicacin concreta.
Cada vez que un nuevo vector de datos v se procesa, se actualizan el
vector de referencia ms prximo y sus adyacentes en la ordenacin
preestablecida, con una correccin de magnitud decreciente con la
diferencia de posiciones entre el vector de referencia predominante
y el resto. La correccin aplicada a cada vector de referencia es la
ecuacin (13):


( )
( ) ( )
( )
,
. .
h i i
i i
i i
e

v
v
w v w
678

(13)
Como se puede apreciar, este algoritmo de cuantizacin es muy
similar al algoritmo neural-gas, con la excepcin de que se elimina
la ordenacin de los vectores en cada paso recurriendo a un mapa de
ordenacin preestablecido. Este mapa podra incluso incluir ms de
una dimensin en cuyo caso se utilizaran distancias eucldeas
aplicadas sobre ndices para calcular la actualizacin de los
centroides del mapa.

2 Algoritmo Neural-gas desarrollado.

En este apartado se va a proceder a la explicacin de las
distintas subrutinas de las que consta el algoritmo desarrollado
para la identificacin y prediccin de series temporales.
A lo largo del apartado se expondrn las siguientes ideas:
Definicin de las distintas rutinas existentes en el
programa
Explicacin de las acciones llevadas a cabo por cada
rutina


Definicin de las variables ms significativas dentro de
cada rutina
Interconexin existente entre las distintas rutinas

No se pretende documentar el cdigo fuente, el cual constar
en su totalidad en el anexo I, pero si dar una explicacin del
algoritmo.



2. 1 DI AGRAMA DE FLUJ O

Figura 6_Diagrama de flujo



La Figura 6 muestra el diagrama de flujo del algoritmo, en l
se puede ver el recorrido a lo largo de las diferentes rutinas de
que consta el programa.
El programa comienza inicializando todas sus variables, a
continuacin prepara los datos y las rutinas para comenzar con el
proceso de entrenamiento.
Si todava le quedan datos por analizar (B1>0) entonces entra
en la rutina de entrenamiento en caso contrario salva los datos y se
queda a la espera de una nueva inicializacin.
Desde la rutina de entrenamiento se tiene acceso a la
actualizacin de los centroides y posteriormente a la actualizacin
de la prediccin y por ltimo al clculo del error cometido con los
nuevos valores.
Despus de calcular el error si la mejora es mayor del 1%
sobre el error (mejora> lim) se retorna a una nueva actualizacin
tanto de los centroides como de su valor de prediccin; En caso
contrario (mejora< lim) el algoritmo se encuentra ante pos posibles
situaciones:
Situacin 1.- Se encuentra deshabilitada la opcin de aumentar
el nmero de centroides (mod=0). En esta situacin el programa
continua, dando por buenos los centroides definidos en la anterior
rutina, y comienza el proceso de prediccin.

Situacin 2.- Se encuentra habilitada la opcin de aumentar el
nmero de centroides (mod=1). En esta situacin en funcin del error
cometido el programa recalcula el nmero de centroides y regresa
al entrenamiento de los mismos llegado a un punto de error
razonable el programa continua, dando por buenos los centroides
definidos en la anterior rutina, y comienza el proceso de
prediccin.
Por ltimo el programa guarda los resultados obtenidos en la
prediccin y regresa a preparar los siguientes datos.



2. 2 SI NTESI S DEL ALGORI TMO

Se dispone de una serie temporal constituida por los valores
de cotizacin de un valor burstil, tomados cada 5 minutos a lo
largo de tres aos y medio. Utilizaremos como serie temporal para
aplicar los mtodos de prediccin que se evaluarn en el proyecto la
cotizacin incremental y(k) en % de un valor burstil definida como,
ecuacin (14):
( ) ( )
( ) 100
( )
A A
A
y k y k n
y k
y k n

(14)
Siendo yA(k) la cotizacin absoluta de ese valor y n el nmero
de muestras de separacin entre las operaciones de compra y venta.
Si se hubiera realizado la compra de cualquier nmero de ttulos del
valor burstil considerado en la muestra k-n y se vendieran en la
muestra actual k, la cotizacin incremental representara el
beneficio (>0) o prdida (<0) porcentual de dicha operacin de
compraventa.
Debido a que la serie la temporal inicial de la que se va a
obtener la seria que se va a utilizar es una serie real, est puede
no ser una serie continua, es decir aunque los datos hayan sido
tomados cada 5 minutos puede darse el caso de que en el momento de
la adquisicin el valor carezca de cotizacin, por este motivo
pueden aparecer a lo largo de la serie huecos de informacin.


Este hecho afectara en gran manera a la hora de generar la
serie temporal a analizar. Por otro lado, a la hora de obtener
resultados, estos no seran del todo fiables pues no se podra
cuantificar el efecto de los posibles huecos existentes a lo largo
de la serie.
Por este motivo antes de comenzar a programar el algoritmo de
cuantizacin y posteriormente su aplicacin a la prediccin se
realizar un tratamiento de la serie temporal para eliminar los
posibles huecos.
Este proceso consiste en recorrer los incrementos temporales a
lo largo de la serie temporal asegurando que siempre dentro de un
mismo da, desde las 09:05 de la maana hasta las 17:30 de la tarde,
estos incrementos son slo de 5 minutos. En caso contrario existe un
hueco de cotizacin, este hueco deber rellenarse bien con el mismo
valor que tena en la muestra anterior, bien con el valor que tiene
la muestra siguiente o bien con un valor medio entre los dos
valores. Para la realizacin de este proyecto se ha optado por
rellenar los posibles huecos con el mismo valor que se tenia en el
instante anterior.
Una vez rellenados todos los posibles huecos se procede a la
implantacin del algoritmo de cuantizacin. Este algoritmo tiene dos
partes:
En la primera parte, denominada entrenamiento, se realiza el
aprendizaje, en ella se buscan los patrones de comportamiento,


se generan las regiones de Voronoi asociadas a cada centroide
y se le asigna a cada centroide su valor de prediccin.
En la segunda parte, denominada prediccin, se comprueba el
correcto o incorrecto funcionamiento de los resultados
obtenidos en la primera parte del algoritmo.
El algoritmo se pondr en prueba primero con los datos
pertenecientes al ltimo ao y posteriormente con los resultados
obtenidos como ptimos para estos datos se repetir el ensayo con
los datos de los otros dos aos para as determinar si se pueden
realmente dar validez a los resultados obtenidos o si por el
contrario se deben desestimar.
El programa tiene diferentes variantes:
1. Entrenar con 1 mes y predecir con el siguiente.
2. Entrenar con 2 meses y predecir con el siguiente.
3. Entrenar con X meses y predecir con el siguiente.
4. Fijar el nmero de centroides con un mximo que puede ser
variable.
5. Permitir el programa que aumente el nmero de centroides hasta
donde considere necesario.
Las diferentes variantes del programa slo afectan a la manera
de inicializacin de los parmetros, por ello la explicacin del
algoritmo de inicializacin se comentar explicando cada opcin
mientras que el resto se explicarn de forma general


El algoritmo del Neural-gas es el algoritmo comnmente
empleado para realizar la cuantizacin vectorial de un conjunto de
vectores V. Se parte de un conjunto de R vectores seleccionados
aleatoriamente de V como vectores de referencia iniciales. El
algoritmo modifica los vectores de referencia a medida que procesa
los nuevos vectores de datos que le van llegando.
Por este motivo lo primero que se debe realizar es la
creacin de una matriz B en la cual las columnas representarn al
conjunto de vectores V. Para ello se dispone de los datos relativos
a los ltimos trece meses, previamente seleccionados del registro
inicial. Se entrenar con un ao completo y siempre debe haber un
mes para predecir con cada mes de entrenamiento. Por este motivo se
debern seleccionar los trece primeros si el programa se encuentra
en la opcin de entrenar con un mes y predecir con el siguiente.
En caso de estar en la opcin de entrenar con X meses y
predecir con el siguiente, se pretender que los meses que se
utilizan para la prediccin sean siempre los mismos
independientemente de la variante del programa en la que se
encuentre, por este motivo en esta opcin se seleccionarn los trece
ltimos meses del registro y los (X-1) anteriores; de esta forma el
algoritmo siempre comienza a predecir en el mismo mes. La Figura 7
es una explicacin grafica que aclara lo aqu expresado.


Figura 7_ Grafico del avance de las diferentes variantes del programa

Por otra parte se deber determinar el tamao de los vectores
N a analizar y en funcin de este tamao se ira generando la matriz.
La Figura 8 representa grficamente la generacin de la matriz B

Figura 8_Seleccin de los vectores de la matriz B

[ ] vectorj vector vector vector B ... ... 3 2 1



Una vez generada la matriz se seleccionarn al azar, de entre
todos los vectores existentes, los c centroides iniciales, estos
centroides iniciales no deben tener solape entre ellos, es decir, no
deben compartir ningn valor de la serie temporal. Debido a que los
vectores tienen solape, para la eleccin de los centroides se
realizar un sorteo entre los 100 primeros vectores, de que saldr
el primer centroide. El resto de los centroides se escogern
sumndole a est primero tantas posiciones como longitud tenga cada
vector (por ejemplo si se suponen los vectores de 100 datos cada uno
y el primer centroide es el nmero 23, el siguiente ser el 123, el
siguiente en 223 y as sucesivamente).
El procedimiento consta de dos fases: ordenacin y
actualizacin de vectores de referencia:
La ordenacin consiste en recorrer todos los vectores y
ordenar todos los centroides para cada vector en funcin de la
distancia existente entre ellos, generando de esta manera una nueva
matriz en la que aparecern por columnas los ndices de los
centroides del ms cercano al ms lejano con respecto al vector
correspondiente a dicha columna. Esta ordenacin es fundamental a la
hora de realizar la actualizacin de los centroides porque la
modificacin de los centroides se realizar en funcin de la
distancia al vector, aplicando la ecuacin (15):



( )
}
( )
1
. .
h l
l
i i
e
w v w

max max
( ) ( )
k k
k k
f f
i i
i i
k k

_ _

, ,

(15)
Siendo
( ) h l
la denominada funcin de vecindad y
un factor
de escala para la correccin. La funcin de vecindad tiene por
objeto incrementar la correccin de los vectores ms cercanos. La
correccin decrece exponencialmente a medida que aumenta la posicin
del vector de referencia en la ordenacin establecida por distancias
con una constante de tiempo en posiciones definida por el parmetro
. Tanto el factor de escala
como el parmetro
se ajustan con
el paso de muestras con el fin de reducir las correcciones a medida
que el volumen de entrenamiento o aprendizaje se incrementa con unos
valores finales de saturacin.
A partir de k = kmax se interrumpe la adaptacin de estos
parmetros.
Cada uno de estos centroides define una regin de Voronoi. A
cada una de estas regiones pertenecen los vectores que tienen como
ms prximo al centroide que genera dicha regin.
Con el valor real de prediccin de cada uno de estos vectores
se generar el valor de prediccin asociado a cada regin o
centroide. Para poder averiguar a que regin pertenece cada vector
se debern volver a ordenar los centroides por distancias.


El valor de prediccin asociado a cada centroide ser igual al
valor medio de todos los valores reales de prediccin de todos los
vectores asociados a la regin de Voronoi generada por dicho
centroide.
Con los centroides actualizados y las predicciones asignadas
se comprueba el error que se est cometiendo comparando el valor
real de cada vector con el valor que le sera asignado con la
prediccin. Este es un proceso iterativo de tal forma que este error
cometido se comparar con el error cometido anteriormente y si la
mejora que se produce es mayor del 1% sobre el error se vuelve al
comienzo de la actualizacin y se recorren de nuevo todos los datos
para intentar continuar mejorando el resultado; en caso contrario se
da por vlido el resultado y se continuara con el siguiente
registro (mes2, mes3) as hasta llegar al final del ao.



2. 3 I NI CI ALI ZACI N

Como prcticamente todos los programas de ordenador est
consta de una primera rutina que inicializa todos los parmetros que
posteriormente se van a utilizar a lo largo de todo el programa.
En esta rutina se inicializan tanto los parmetros fijos como
los que se podrn variar para realizar los diferentes estudios.
A ella se vuelva cada vez que se termina la ejecucin del
programa.



2. 4 PREPARACI N

Debido a que el algoritmo de identificacin es un proceso
iterativo se debern preparar los datos a analizar en cada
iteracin. Esto es exactamente lo que realiza esta rutina. Mientras
todava no se ha alcanzado el final de los datos esta rutina avanza
en cada iteracin a lo largo del registro total de datos preparando
los elementos necesarios para dicha iteracin.
Avanza a lo largo del registro total de datos (13 meses)
seleccionando en cada pasada que datos se utilizarn para entrenar
el algoritmo (c_close_entr), cuales para comprobar prediciendo el
error cometido (c_close_pr) y cuales no se utilizarn.
La serie temporal a analizar se genera a partir de los datos
disponibles, como el valor incremental en % de dichos datos
separados una distancia N.
A partir de los datos designados para realizar el
entrenamiento se generarn los vectores de tamao igual a ventana


los cuales sern la base del anlisis y de los que se obtendrn los
vectores de referencia.
Se generar por otra parte un vector adicional en el que
guardarn los valores reales futuros a N hacia delante de cada uno
de los vectores.
Para eliminar la componente de ruido de la seal se proceder
al paso del filtro en los dos sentidos a cada columna nueva que
entra a la matriz y el vector final de valores de salida reales.
Cuando comienza el proceso se genera una matriz de centroides
iniciales aleatoria mediante un proceso de sorteo entre los 100
primeros vectores de la matriz. Esta eleccin aleatoria solo tiene
lugar en la primera pasada del algoritmo es decir en el resto de
veces el algoritmo comienza con los centroides dados como ptimos en
el proceso anterior.
Se desordena la matriz de vectores a analizar para que as la
informacin que el algoritmo debe aprender le llegue de forma
desorganizada.
El programa regresa a esta rutina siempre desde el final del
proceso y si todava le faltan datos por analizar comienza de nuevo
si no es as calcula el error total cometido y se queda en espera de
nueva orden.



El MSE ser uno de los ndices para determinar la validez del
algoritmo y en funcin de l se valorarn las ventajas e
inconvenientes de la utilizacin de cada una de las diferentes
posibilidades o configuraciones de prueba del proceso.
El mse normalizado se define como la raz cuadrada del
cuadrado del error normalizado dividido por la raz cuadrada del
cuadrado del valor real normalizado, expresado en la ecuacin (16)
( )
( )
d
N
k
d
N
k
N
real valor
N
error
NMSE
d
d
1
2
1
2

(16)



2. 5 ENTRENAMI ENTO

Este programa es el ncleo de todo el algoritmo desde el que
se distribuye el proceso. Es aqu donde se dirigir el discurrir del
programa, en funcin de las inicializaciones realizadas previamente,
de las sucesivas mejoras aportadas por las rutinas y del error
cometido.
Este programa se mantiene activo mientras la mejora en el
error cometido en la prediccin realizada sobre los datos de
entrenamiento es mayor del 1%.
Lo primero que se realiza es la ordenacin de todos los
centroides con respecto a todos los vectores mediante el criterio de
proximidad, esta proximidad se refiere a la norma cuadrtica
existente entre los vectores, la cual se calcula como la distancia
ms comn en la recta real R dada por d(x,y) = |x-y|. A esta
distancia se le llama distancia eucldea.
De esta manera se genera una matriz (i x j) en la que aparecen
en cada columna (j) todos los centroides ordenados de menor a mayor


distancia con respecto al vector (j). As por ejemplo el elemento
(1x5) corresponde con el centroide ms prximo al vector 5.
Una vez generada la matriz se llama a las funciones que
actualizaran tanto los centroides actuales como los valores de la
prediccin asociados a dichos centroides. Posteriormente a travs de
la funcin error_act se calcular el nuevo error cometido en la
prediccin de los valores futuros de los datos usados para el
entrenamiento.
En el caso de que estuviera habilitada la opcin de aumentar
el nmero de centroides se realizara la llamada a la funcin
calculo_centr encargada de ello; en el caso contrario con los
centroides actualmente considerados como ptimos se pasara
directamente a predecir el valor futuro de los datos reservados para
esto.
A continuacin se salvaran los datos y el programa volvera a
preparacin a buscar nuevos datos para seguir mejorando los
resultados.



2. 6 ACTUALI ZACI N DE CENTROI DES

Esta rutina junto con la siguiente (actualizacin de
predicciones) constituye el ncleo de este proyecto. Es aqu donde
realmente se aplican las tcnicas de cuantizacin vectorial, es aqu
donde se programa el algoritmo del neural-gas y es aqu donde
realmente se puede ver funcionamiento.
Se Calculan los parmetros que actualizan cada centroide;
estos parmetros son funcin del nmero de actualizaciones que hayan
sufrido los centroides antes, o lo que es lo mismo del nmero del
vector; es decir el primer vector modificar ms a los centroides
que el vector nmero 5 y este a su vez lo har ms que el vector
nmero 300.
La expresin que define la actualizacin de los centroides, o
lo que es lo mismo el incremento del valor de los centroides es la
ecuacin (17):


( )
}
( )
1
. .
h l
l
i i
e
w v w ) ( ) ( ant w w act w
i i i
+
max max
( ) ( )
k k
k k
f f
i i
i i
k k

_ _

, ,

(17)
Donde
centr Incr con e correspond w
E con e correspond
L con e correspond
i
_



2. 7 ACTUALI ZACI N DE PREDI CCI ONES

Esta rutina junto con la anterior (actualizacin de
centroides) constituye el ncleo de este proyecto. En esta rutina de
lleva a cabo el calculo y posteriormente la asignacin del valor de
prediccin asociado a cada centroide.
Teniendo en cuenta que antes de acceder a esta rutina los
centroides han sido modificados se deber volver a calcular la
distancia de cada vector a cada centroide y se debern volver a
ordenar de menor a mayor distancia, sin embargo en esta ocasin ya
no tiene importancia la matriz que nos proporcionaba esta ordenacin
sino que ahora solo es necesaria conocer cual es el centroide ms
prximo a cada vector.
La actualizacin del valor de la prediccin asociado a cada
nuevo centroide en funcin del valor real de cada uno de los
vectores asociados a la regin de Vorinoi definida por dicho


centroide se realiza por medio de una prediccin con promediado de
los datos pasados mediante un modelo lineal, ecuacin (18).
( ) ( )
1
T
0
( ) .
N
i k k k k
i
y k n a y k i
a y F y

(18)
A cada centroide se le asigna como valor de prediccin la
media del valor de todos los valores futuros reales (target)
correspondientes a los vectores que tienen a dicho centroide como el
ms prximo.
Puede darse la situacin de que alguna de las regiones de
Voronoi definida por algn centroide no tenga asociado ningn
centroide o que tenga asociados menos del 10% del total de los
centroides. Esta es una regin de Voronoi poco significativa y que
aporta poca informacin al proceso de aprendizaje por este motivo
ser una regin a eliminar.
Con estas dos rutinas se quedan perfectamente definidas todas
las regiones de Voronoi y tambin los valores de prediccin
asociados a cada una de ellas:
Con la rutina de actualizacin de centroides se ha generado el
centroide que define cada una de las distintas regiones de
Voronoi, as como los vectores de entrenamientos asociados a
cada una de ellas, quedando determinado el nmero de regiones
necesarias para que todos los vectores queden asociados a


alguna regin prxima a ellos. Esto queda reflejado en la
Figura 9 :

Por otro lado con la rutina de actualizacin de predicciones,
utilizando como informacin el valor futuro de los vectores
usados durante el entrenamiento, se define el valor de
prediccin asociado a cada centroide, el cual ser el mismo
que le ser asignado a los vectores que en el futuro se
encuentren asociados a dicha regin. Esto queda reflejado en
la Figura 10:

Figura 9_Representacin de regiones de Voronoi



Figura 10_Representacin del valor de prediccin



2. 8 CALCULO DEL ERROR ACTUAL

En esta rutina se calcula el error que se esta cometiendo en
la prediccin de los valores futuros de cada vector como el cuadrado
de la diferencia entre el valor asignado y el valor real futuro que
tuvo el vector. Debido a que puede haber habido centroides que hayan
desaparecido por tener asociados a ellos menos del 10% de los
vectores existentes, se deben volver a asociar los vectores en las
regiones de Voronoi para as evitar que pudiera haber algn vector
asociado a alguna regin ya inexistente.
Una vez conocidas las regiones a las que esta asociado cada
vector se calcula el error que se cometera asignndole como valor
de prediccin el definido para su regin de Voronoi. Este error es
el cuadrado de la diferencia entre el valor real y el de prediccin
La mejora que se ha producido con las nuevas actualizaciones
se obtiene a travs del error normalizado, ecuacin (19):


Nd
k e
) (

(19)
Si esta es un mejora apreciable, es decir si todava se
producen mejoras del 1% sobre el error cometido, se vuelven a
entrenar los datos para permitir nuevas actualizaciones tanto de los
centroides como de las predicciones asociadas a cada centroide.
En la Figura 11 se puede observar el clculo del error
cometido al obtener el valor de prediccin por medio de una
aproximacin funcional

Figura 11_Representacin del error cometido



2. 9 CALCULO DEL NMERO DE CENTROI DES

A este programa solo se accede cuando esta habilitada la
opcin de aumentar el nmero de centroides y en ese caso el programa
multiplicar por dos el nmero de centroides existentes hasta que el
error cometido en la prediccin de entrenamiento sea menor de 0.55
llegados a este punto se aplicar Bolzano.
2.9.1 Aplicacin de Bolzano.

Enunci ado del Teor ema

Si f(x) es una funcin continua en el intervalo [a, b], y si,
adems, en los extremos del intervalo la funcin f(x) toma valores
de signo opuesto (f(a) * f(b) < 0), entonces existe al menos un
valor c (a, b) para el que se cumple: f(c) = 0.
Es decir: si una funcin es continua en un intervalo cerrado y
acotado [a, b], y los valores en los extremos del intervalo tienen


signos distintos, entonces podemos asegurar la existencia de al
menos una raz de la funcin en el intervalo abierto (a, b).
Ejemplo1: La funcin que aparece representada en la Figura 12
es continua en el intervalo [3, 6.2] y f(3) < 0 mientras que f(6.2)
>0. Como se cumplen las hiptesis del teorema de Bolzano queda
garantizada la existencia de al menos un valor c en el que f(c) = 0,
es decir en el que la grfica corta al eje de abscisas. En este
ejemplo concreto existen exactamente tres valores (c1, c2 y c3) que
cumplen la tesis del teorema. (A los valores c1, c2 y c3 se les
llama races o ceros de la funcin f(x) en el intervalo en
cuestin). (La funcin representada es: f(x) = sen(2x) - 2cos(x/3))

Figura 12_Funcin para representar el teorema de Bolzano

Mt odo de Bi secci n
El teorema de Bolzano tiene una interesante aplicacin en la
localizacin de las races o ceros de una funcin continua. Consiste
en lo siguiente: buscamos por tanteo dos valores "a" y "b" para los


que la funcin tome signos opuestos. Si conseguimos encontrar dos
valores que cumplan la condicin anterior, por ejemplo f(a) < 0 y
f(b) > 0, y, adems, la funcin es continua en I = [a, b], queda
garantizada por el teorema de Bolzano la existencia en el intervalo
(a, b) de al menos una raz. Si ahora tomamos el punto medio del
intervalo (x = (a + b)/2) la funcin en ese punto puede tomar el
valor 0, en cuyo caso ya tendramos localizada una raz, o bien en
(a + b)/2 toma un valor positivo o negativo.
Si f((a + b)/2) < 0, nos fijaramos ahora en el intervalo
I1 =[(a + b)/2, b] en el que la funcin es continua y en cuyos
extremos toma valores de signos opuestos. El teorema de Bolzano
garantiza as la existencia de al menos una raz en ese intervalo I1
de longitud la mitad de la longitud del intervalo inicial. (Si f((a
+ b)/2)>0 I1=[a, (a +b)/2].
Se repite el mismo proceso con el intervalo I1, con lo que
vamos obteniendo intervalos cada vez ms pequeos, dentro de los
cuales sabemos que existe una raz. Podemos as hallar el valor de
esa raz con la aproximacin deseada. Esto queda reflejado en la
Figura 13.



1FBDQWN
1FBDFWN
1FBDQWN
1 FBDFWN

Figura 13_Iteraciones con Bolzano

Demost r aci n
Conoci mi ent os pr evi os necesar i os par a ent ender l a demost r aci n:
1. La demostracin que expondremos aqu hace uso de la
"conservacin del signo de las funciones continuas" (Si una
funcin es continua en x = c y f(c)
0 entonces existe un
intervalo (c -
, c +
) en el que la funcin tiene el mismo

signo que f(c)).
2. Se utilizan tambin los conceptos de cota superior de un
conjunto y de extremo superior de un conjunto.
3. Tambin se utiliza el "axioma del supremo" de los nmeros
reales: Todo subconjunto no vaco de los nmeros reales que
est acotado superiormente, posee extremo superior.

Demost r aci n:


Supongamos que f(a) < 0 y f(b) > 0. Sea T el conjunto formado
por todos los valores "x" del intervalo [a, b] para los que f(x) <
0. El conjunto T est acotado superiormente por "b" y, adems, no es
vaco ya que "a" pertenece a T. Por ello el conjunto T tiene un
extremo superior c. Se cumple que f(c) = 0.
Vemoslo:
Si f(c) > 0, entonces por la propiedad de la "conservacin del signo
de las funciones continuas" existira un intervalo (c -
, c +
)
en el que la funcin sera tambin positiva. En este caso existiran
valores menores que "c" que serviran de cota superior de T y por
ello "c" no sera el extremo superior de T como hemos supuesto.
Si f(c) < 0, entonces existira un intervalo (c -
, c +
) en el
que la funcin sera negativa y por tanto existiran valores de "x"
a la derecha de "c" para los que la funcin sera negativa y por
tanto "c" no sera el extremo superior de T.
Por tanto f(c) tiene que tomar el valor cero: f(c) = 0.
Si f(a) > 0 y f(b) > 0 el razonamiento es similar.

Memoria.Aplicacin a la prediccin de series temporales


Captulo 3 APLICACIN A LA PREDICCIN DE
SERIES TEMPORALES
Como ya se explic en la introduccin este proyecto podra
dividirse en dos secciones: Una las tcnicas de cuantizacin
vectorial y otra su aplicacin a la prediccin de series temporales.
Una vez explicadas las tcnicas de cuantizacin vectorial se
pasar al anlisis de su aplicacin a la prediccin de series
temporales.
Se definir en primer lugar que se entiende exactamente por
predecir, que tipo de serie temporal ser la utilizada para realizar
la prediccin as como el mtodo de generacin de dicha serie
temporal y que ndice ser el empleado para valorar la fiabilidad de
la prediccin realizada para posteriormente exponer los diferentes
mtodos de prediccin.
Simplificando mucho el concepto de prediccin se podra
entender como la adivinacin de los valores futuros de la serie
temporal; Para cada uno de los diferentes mtodos de prediccin se
analizar como dan respuesta a esta cuestin.
Antes de meternos en trminos de prediccin de series
temporales es importante saber que es una serie temporal y las
diferentes clasificaciones que de ellas existen para poder entender
la dificultad de la prediccin.


1 Serie temporal.
Hasta ahora todas las variables que se han estudiado tenan en
comn que, por lo general, nunca han estado fechadas, es decir no
estaban vinculadas al tiempo en forma alguna y menos explcitamente.
Se trataba de datos de corte transversal o atemporales. Sin embargo
es muy frecuente, especialmente en el mbito econmico y en general
en las ciencias sociales, que las observaciones de los caracteres de
una poblacin se realicen ligadas al tiempo o fechadas en instantes
determinados del tiempo. As, por ejemplo, una de los caracteres de
una empresa susceptible de ser observado puede ser su volumen de
ventas y podemos estar interesados en estudiar el comportamiento y
evolucin temporal de esa caracterstica de la empresa. En este caso
esa observacin se realizar de forma repetida durante una serie de
momentos del tiempo. Esa observacin repetida en el tiempo da lugar
a una serie temporal. En este sentido diremos que una serie
temporal, cronolgica, histrica o de tiempo es una sucesin de
observaciones cuantitativas de un fenmeno ordenadas en el tiempo.

Figura 14_Ejemplo de series temporales


El anlisis de series temporales, desde el punto de vista de
su comportamiento, tanto pasado como futuro, requiere el uso de
nuevas tcnicas, pues las presentadas hasta el momento, aunque le
son aplicables, no cubren las necesidades que surgen en el
tratamiento de este tipo de datos.
Desde el momento que los valores de una serie temporal van
ligados a instantes del tiempo, Figura 14, entonces, podemos decir
que el anlisis de una serie implica el manejo conjunto de dos
variables, siendo una de ellas nuestra serie temporal y la otra los
intervalos o instantes del tiempo sobre los cuales se han realizado
las observaciones.
Hay que sealar que esa observacin sincronizada de la
variable en el tiempo implica que los valores de la misma han de
estar perfectamente ordenados, de igual modo que los intervalos del
tiempo lo estn. Esas observaciones de una variable cuantitativa
pueden estar referidas, como ya se ha sealado, a un instante del
tiempo o a un intervalo del mismo, dando lugar a dos tipos de
magnitudes. En el primer caso hablaremos de magnitudes stocks o
niveles. En el segundo se habla de flujos.
La diferencia entre una y otra es que la primera no es sumable
para los distintos instantes de un intervalo, pues se incurrira en
duplicaciones de los valores de esa magnitud. En cambio, el segundo
tipo de magnitud si es sumable o acumulable a lo largo de un periodo
o intervalo de tiempo. Para este segundo tipo, los intervalos para
los que se acumulan deben ser siempre de igual amplitud. Es decir,
si se dan datos de ventas de una empresa, estos debern ser siempre


mensuales, trimestrales, etc, pero lo que no nunca deber hacerse es
intentar trabajar con una serie que mezcle datos semanales con
mensuales o referidos a cualquier otro periodo temporal.
Este requisito lleva implcita la idea de homogeneidad. Para
que el anlisis de una serie temporal nos conduzca a conclusiones
acertadas no basta con utilizar las tcnicas apropiadas, sino que
ser imprescindible que esos datos sean comparables y no lo sern
nunca si no son homogneos. Si cada ao cambia la metodologa de
observacin, se cambian las definiciones, se modifica la poblacin
de referencia, etc, el resultado ser una serie temporal compuesta
por un conjunto de valores no comparables porque son muy
heterogneos. Esta falta de homogeneidad se pierde, de una forma
natural, con el transcurso del tiempo, de manera que cuando las
series son muy largas no hay garanta de que los datos iniciales y
finales sean comparables.
Pero esta necesidad de que las series no sean muy largas, para
que sus datos no pierdan la deseable homogeneidad, entra en
contradiccin con el objetivo ms elemental de la estadstica que es
el de detectar regularidades en los fenmenos de masas.
Lo que se pretende con una serie es describir y predecir el
comportamiento de un fenmeno que cambia en el tiempo. Esas
variaciones que experimenta una serie temporal pueden ser de
naturaleza doble. Por un lado las variaciones pueden ser evolutivas
o estacionarias. Diremos que las variaciones son evolutivas cuando
el valor medio de la serie cambia, no permanece fijo a lo largo del
tiempo, mientras que las variaciones estacionarias son aquellas en


las su valor medio no cambia, aunque sufra oscilaciones en torno a
ese valor medio fijo o constante (Esta forma de definir una serie
estacionaria es solo una aproximacin al concepto de la misma. No
basta con que el valor medio no cambie a lo largo del tiempo.
Tambin es preciso que la variabilidad de la misma sea constante).
Esta clasificacin de las variaciones de una serie permite
hablar de series evolutivas y estacionarias.

2 Prediccin de series temporales.

Figura 15_Serie de cotizaciones



Figura 16_Serie de cotizaciones incrementales

La Figura 15 muestra la serie temporal dada por las cotizaciones
de un valor burstil y la Figura 16 muestra la conversin de dicha
serie en cotizaciones incrementales.
Utilizaremos como serie temporal para aplicar los mtodos de
prediccin que se evaluarn en el proyecto la cotizacin incremental
y(k) en % de un valor burstil definida como la ecuacin (20):
( ) ( )
( ) 100
( )
A A
A
y k y k n
y k
y k n

(20)
Siendo yA(k) la cotizacin absoluta de ese valor en la muestra
actual k, y n el nmero de muestras de separacin entre las
operaciones de compra y venta. Si se hubiera realizado la compra de
cualquier nmero de ttulos del valor burstil considerado en la
muestra k-n y se vendieran en la muestra actual k, la cotizacin
incremental y(k) representara el beneficio (>0) o prdida (<0)
porcentual de dicha operacin de compraventa.


El objetivo consiste en emplear toda la informacin disponible
hasta la muestra actual (en realidad una ventana de datos de
dimensin finita N) para obtener la mejor prediccin posible de la
cotizacin incremental n muestras ms adelante
( )
y k n +
y poder as
tomar una decisin sobre la conveniencia o no de realizar en la
muestra actual k una operacin de compraventa para el valor
considerado en la ecuacin (21):
( ) ( ) ( ) ( ) ( )
, 1 , , 1
k

(21)

La funcin escalar Fk() de variable vectorial permite realizar
la prediccin requerida, de tal manera que cualquier mtodo de
prediccin consiste bsicamente en la definicin de dicha funcin.
Ntese que dicha funcin puede variar con el tiempo si eso
contribuye a mejorar la precisin de la prediccin. Por lo tanto,
cualquier algoritmo de prediccin constar de dos fases:
La identificacin de la funcin Fk(.) ms adecuada en la
muestra actual
La aplicacin de dicha funcin para estimar el valor
futuro de la serie temporal.

La funcin Fk(.) puede ser local o global:

Un modelo de prediccin global utiliza una nica funcin
para caracterizar todos los datos medidos.


Un modelo de prediccin local aplica funciones
especficas a diferentes regiones del conjunto de datos.

Los modelos de prediccin globales se clasifican en lineales
(modelos autoregresivos AR y autoregresivos de media mvil ARMA) y
no lineales (modelos autoregresivos no lineales NAR). Los modelos
lineales son ampliamente utilizados por su simplicidad, sin embargo
sus resultados son pobres en la prediccin de series temporales de
estructura compleja. La alternativa es la aplicacin de modelos de
prediccin no lineales: redes neuronales artificiales (perceptrones
multicapa, redes funcionales de base radial, mapas autoorganizados,
etc.), modelos de lgica borrosa y muchos otros. La gran ventaja de
estos modelos no lineales es su gran flexibilidad para modelar
series temporales complejas aunque para ello requieren de
optimizaciones y procesos de aprendizaje complicados con gran carga
computacional. Adems, es necesario seleccionar su estructura ms
adecuada lo cual supone una complicacin adicional por el nmero de
parmetros involucrados.
Los modelos de prediccin locales generan la prediccin
buscando en el registro disponible segmentos de datos de aspecto
similar (ms prximos) al segmento de datos ms reciente mediante
cuantizacin vectorial. La prediccin ms simple consistira en la
media, quizs promediada en funcin de la distancia a cada segmento,
de los valores n muestras ms adelante correspondientes a todos los
segmentos similares localizados (modelo local de promediado). No


obstante, tambin es comn utilizar modelos locales de naturaleza
lineal para realizar la prediccin.
La prediccin anterior se denomina prediccin directa para
distinguirla de la denominada prediccin iterativa. En este ltimo
caso se opta por construir un modelo de prediccin vlido nicamente
una muestra hacia delante para luego obtener las predicciones a ms
largo plazo mediante sucesivas iteraciones del modelo anterior
sustituyendo los datos futuros necesarios por sus correspondientes
predicciones. La experiencia ha demostrado que la prediccin
iterativa funciona mejor a corto plazo sin necesidad de utilizar
modelos no lineales complejos, aunque la acumulacin de errores en
las sucesivas predicciones compromete la precisin de las
predicciones a medio y largo plazo. En el caso de que se requiera la
prediccin de todas las muestras hasta un horizonte determinado, la
prediccin iterativa es ms eficiente computacionalmente hablando si
se emplean modelos globales (se usa el mismo modelo para la
prediccin de todas las muestras), mientras que la prediccin
directa es aconsejable si se opta por utilizar modelos locales (la
fase de clustering es comn a las predicciones para todas las
muestras).
Para evaluar la calidad de la prediccin se emplea
frecuentemente el denominado error cuadrtico medio normalizado
(NMSE) calculado como la ecuacin (22):


( )
( )
2
1
2
1
( ) ( )
( )
d
d
N
k
N
k
y k y k
NMSE
y k y

(22)
Siendo Nd el nmero de datos considerados e
y
el valor medio
de dichos datos. Tambin se usa frecuentemente el NRMSE que es la
raz cuadrada del anterior.
Otro criterio ms sofisticado para evaluar el error de
prediccin errotot consiste en evaluar conjuntamente cuatro
componentes del error, ecuacin (23): el error en la prediccin del
valor medio errmean, el error en la prediccin de la desviacin
estndar errstd y los errores absoluto errabs y de similaridad
errsim:
( )
( )
( ) ( ) ( )
25 mean
max , ,
max , ,
mean
std
err
err
y y
tot abs sim
y y
y y
err err k err k
eps
y y eps

_

+ + +

,
644474448
644474448
( ) ( ) ( ) ( ) ( ) ( )
max min
max , min , y y k y k y y k y k

( )
( )
( )
( )
( )
( )
min min
max min max min
max , max ,
norm norm
y k y y k y
y k y k
y y eps y y eps

( ) ( ) ( )
abs norm norm
err k y k y k



( )
( ) ( ) ( )
( ) ( ) ( )
min ,
1
max , ,
norm norm
sim
norm norm
y k y k
err k
y k y k eps

(23)

2. 1 PREDI CCI N MEDI ANTE MODELOS LI NEALES.

Los modelos ms simples que se pueden emplear para la
prediccin de una serie temporal son los model os l i neal es gl obal es
aut or egr esi vos ( AR) . En este tipo de modelos, la prediccin ) ( n k y +

se calcula como una combinacin lineal de los valores ms recientes
de la serie temporal, ecuacin (24)

( ) ( )
T
1
( 1) .
N
i k k k
i
y k n a y k i
+ +
a y F y

(24)

En este modelo se denomina regresor al vector
[ ]
T
k
N k y k y y ) 1 ( )... ( + que contiene los valores pasados de la serie
temporal, mientras que
T
N
a a a ] ... [
1
es el denominado vector de
parmetros. El vector de parmetros a se obtiene resolviendo el
siguiente problema de regresin lineal mediante mnimos cuadrados
lineales, ecuacin (25):



( )
( )
( )
( )
( )
( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
}
T
1

1
2
1 1
1 1 1 2
1 1
N N N n d
d d d d d N
e n N y n N y N y N y a
e n N y n N y N y N y a
e N y N y N n y N n y N n N a
+
1
]
+ + 1 1 1 1
1 1 1 1
+ + + + +
1 1 1 1

1 1 1 1
1 1 1 1
+
1 1 1 1 ] ] ] ]
y
Y y y y
y
e
a
L
6447448 6447448 64444444444744444444448
L
L
M M M M O M M
L
( ) ( ) ( )
T
1 .
d
y n N y n N y N 1 + + +
]
Y a L
6444444444447444444444448

(25)

Siendo Nd el nmero total de datos disponibles. El objetivo es
minimizar la norma cuadrtica del vector de errores de prediccin e.
Esto se consigue si el vector de errores de prediccin se hace
ortogonal a cada uno de los vectores columna de la matriz de
regresores Y, ecuacin (26):

( )
T T T T
. . . . . 0 Y e Y y y Y y Y Y a

y despejando a, resulta :

( )
1
T T
. .
a Y Y Y y

(26)
Otro modelo lineal muy utilizado es el denominado model o ARMA
( Aut o- Regr essi ve Movi ng- Aver age) en el que la prediccin depende no
slo de los valores pasados de la serie temporal sino tambin de los
errores de prediccin cometidos en muestras anteriores, ecuacin
(27):


( ) ( )
( ) 1
1 1
( 1) ( 1) ( 1)
k i
N M
i i
i i
y k n a y k i c y k i y k i
+

+ + + + +

64444744448

(27)

La nica ventaja de los modelos ARMA es que pueden conseguir
resultados similares a los modelos AR con menor nmero de parmetros
(menor nmero de coeficientes ai y ci), aunque la determinacin de
estos parmetros requiere de un algoritmo iterativo ms complejo.
Ambos modelos pueden incluir adems un trmino constante
y

(relacionado con el valor medio de la serie) que habra que estimar
junto con el resto de parmetros, ecuacin (28):

( ) ( )
( ) 1
1 1
( 1) ( 1) ( 1)
k i
N M
i i
i i
y k n y a y k i c y k i y k i
+

+ + + + + +

64444744448

(28)

2. 2 PREDI CCI N MEDI ANTE FI LTRO AUTOREGRESI VO ADAPTATI VO.
En este caso, se considera que la prediccin ) ( n k y +
se
obtiene mediante un f i l t r o aut or egr esi vo ( AR) aplicado a los N datos
ms recientes, ecuacin (29):

( ) ( )
T
1
( 1) .
N
ki k k k k
i
y k n a y k i
+ +
a y F y

(29)


Siendo [ ]
T
k
N k y k y y ) 1 ( )... ( + el vector que contiene la
ventana de datos ms recientes de la serie temporal, y
T
N
a a a ] ... [
1

el vector que contiene los coeficientes del filtro utilizado en el
instante actual k. Ntese que el filtro es adaptativo (el vector de
coeficientes del filtro cambia con el tiempo). Este modelo es, por
lo tanto, una variante adaptativa del modelo lineal global AR
propuesto en la seccin 2. El modelo ARMA presentado en dicha
seccin admite tambin, de manera anloga, una variante adaptativa.
Igual que se coment en dicha seccin, el modelo podra incluir
tambin un trmino independiente
k
y que se puede interpretar como
la media mvil de la serie, ecuacin (30):

( ) ( )
T
1
( 1) .
N
k ki k k k k k
i
y k n y a y k i y
+ + + +
a y F y

(30)

La adaptacin temporal del filtro AR se realiza resolviendo en
cada muestra el siguiente problema de regresin mediante mnimos
cuadrados lineales, tal como se explic en la seccin 2:
( )
( )
( )
( )
( )
( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
[ ]
T
1
1 1
1 1 1 2
1 1 1 2
k k n k n k n m k k
e k m y k m y k n m y k n m y k n m N

+ 1 1 1
1 1 1

1 1 1

1 1 1
1 1 1
+ + + +
1 1 1
] ] ]
Y y y y e y L
6447448 6447448 64444444444447444444444 8
L
L
M M M M O M
L
}
( ) ( ) ( )
T
1 1 .
1
2
k k k
k
y k n y k n y k n m
k
k
kN
a
a
a
+ 1
]
1
1
1
1
1
1
]
y Y a
a
L
64444444444444744444444444448
444
M



Y despejando ak, resulta
( )
1
T T
. .
k k k k k
a Y Y Y y
. En realidad, si m = N se
trata de resolver un sistema de ecuaciones, ya que el nmero de
ecuaciones e incgnitas coinciden. Sin embargo, si m > N (mayor
nmero de ecuaciones que de incgnitas) se obtiene la solucin que
minimiza la norma cuadrtica del error de prediccin.

Por ltimo, es posible aplicar el algoritmo neural-gas para
cuantizar el conjunto de vectores formado por los sucesivos vectores
de coeficientes del filtro con el fin potenciar la tendencia global
y reducir la influencia de las dinmicas locales. En este caso, se
utilizara el vector de referencia ms prximo para realizar la
prediccin ) ( n k y +
en cada muestra. Hay que evaluar si este ltimo

filtrado mediante cuantizacin vectorial realmente mejora la
precisin de la prediccin.

2. 3 PREDI CCI N MEDI ANTE APROXI MACI N FUNCI ONAL LOCAL Y
LI NEAL.

Consideraremos cada secuencia de N datos consecutivos y ms
recientes de la serie temporal como el vector de datos vk, actual
perteneciente al conjunto de vectores V que deseamos cuantizar,
ecuacin (31):
( ) ( )
T
1
k k
y k y k N + 1
]
v V v L

(31)



Por lo tanto en cada nueva muestra se definir dicho vector y
se emplear para actualizar los vectores de referencia wi de las
regiones de Voronoi Vi, segn el algoritmo neural-gas definido en la
seccin 2. De esta forma construiremos una funcin global de
prediccin a partir de funciones locales lineales fi(.) definidas
para cada regin de Voronoi, ecuacin (32):

( ) ( )
k k i k k i
F v f v v V

(32)
El objetivo no es slo actualizar los vectores de referencia
en cada nueva muestra, sino tambin la funcin lineal fi(.) que
corresponda a la regin de Voronoi donde se encuadre el nuevo vector
de datos vk (o las funciones de las regiones ms prximas). Las
funciones lineales que se manejan en cada regin de Voronoi tienen
la siguiente estructura, ecuacin (33):
( ) ( )
T
.
i i i i
y y + f v a v w

(33)
donde
i
y
es un parmetro escalar y ai es un vector de parmetros de
dimensin N. La actualizacin de estos parmetros en cada paso se
realiza de forma similar a como se hace en el caso de los vectores
de referencia wi, ecuacin (34):

( )
}
( )
1
. .
h l
l
i
y e y y



( )
}
( ) ( ) ( )
1
. . . .
h l
l
i i i i
e y y
a a v w v w

(34)
Valores tpicos para los parmetros son:

( ) max 6, 10 , 0.05, 0.5, 0.05
i f i f
R

2. 4 REDES FUNCI ONALES DE BASE RADI AL

Las redes funcionales (RBFN, Radial-Basis Function Networks)
constituyen otra clase de aproximacin funcional no lineal empleada
para prediccin de series temporales. La ms empleada es la red
funcional gaussiana definida por la ecuacin (36):
( ) ( )
2
2
1
k i
i
R
k k i
i
y k n e

y w
F y

(36)
Siendo yk el vector de los N datos ms recientes, wi cada uno
de los R vectores de referencia obtenidos por cuantizacin
vectorial, ?i la desviacin estndar de las distancias en cada
regin de Voronoi y ?i un factor de promediado.
La diferencia fundamental con los mtodos de aproximacin
funcional descritos hasta ahora es que en los casos anteriores se


aplicaba una funcin especfica en cada regin de Voronoi, mientras
que en este caso las funciones gaussianas asignadas a cada regin se
solapan para generar una funcin global ms suave.

2. 5 PREDI CCI N USANDO PROBABI LI DADES DE MARKOV EN MAPAS
AUTOORGANI ZADOS

Supongamos que se desea predecir, dado
( ) ( )
T
1
k
y k y k N + 1
]
y L
, los n valores futuros de la serie
temporal agrupados en el vector
( ) ( )
T
1
k
y k y k n + + 1
]
y L
. El
planteamiento en este caso consiste en considerar los vectores
e
k k
y y
como vectores estocsticos y aproximar las funciones de
densidad de probabilidad
( )
k
f y
y
( )
k k
f y y
a partir de sendos mapas
autoorganizados. La prediccin, basada en la funcin de densidad de
probabilidad condicionada
( )
k k
f y y
, se puede determinar o bien
mediante una decisin de mxima verosimilitud (MLP, Maximum
Likelihood Prediction) optando por la prediccin ms probable, o
bien mediante una seleccin aleatoria de
k
y
en funcin de las
probabilidades condicionadas o de transicin (RMP, Random Markov
Predictor). Para predicciones a corto plazo MLP ofrece mejores
resultados, mientras que para generar secuencias futuras de mayor
duracin RMP suele proporcionar estimaciones ms precisas. Ntese
que este planteamiento estocstico del problema de prediccin se

Ainhoa Fernndez Lpez - 100
-

fundamenta en la estacionariedad de la serie temporal (media y
funcin de autocovarianza constantes).
La funcin de densidad de probabilidad
( )
k
f y
se aproxima a
partir de un mapa autoorganizado (tcnica de clustering descrita
anteriormente) en el que se asocia cada vector
k
y
a su
correspondiente regin de Voronoi para posteriormente calcular la
probabilidad de cada regin como el cociente entre el nmero de
vectores asignados a esa regin y el nmero total de vectores del
conjunto de entrenamiento. De esta forma la probabilidad se
concentra en los centroides wi de cada regin de Voronoi.
Para aproximar la funcin de densidad de probabilidad
condicionada
( )
k k
f y y
se sigue un procedimiento similar. En cada
regin de Voronoi se define un nuevo mapa autoorganizado interno
asociado a los vectores
k
y
relacionados con dicha regin (aquellos
para los que su correspondiente vector
k
y
pertenece a esa regin).
A continuacin se aproxima la funcin de densidad de probabilidad
condicionada concentrando la probabilidad en los centroides del mapa
autoorganizado interno, de forma similar a como se hizo en el paso
previo. La dimensin de cada mapa autoorganizado interno (nmero de
particiones) se define de forma proporcional a la probabilidad
asociada a la regin de Voronoi donde se define.

-

Una vez definidos todos los mapas autoorganizados internos, la
prediccin se genera clasificando cada nuevo vector
k
y
en su
correspondiente regin de Voronoi y, o bien asignando como
prediccin el centroide de mayor probabilidad condicionada en su
mapa autoorganizado interno (MLP), o bien seleccionando un centroide
aleatoriamente en dicho mapa interno atendiendo a su distribucin de
probabilidad condicionada (RMP).
Con este planteamiento estocstico es posible disponer de una
estimacin del error de prediccin que se comete en cada regin de
Voronoi promediando, con las probabilidades condicionadas, las
distancias euclideas de los diferentes centroides al de mxima
probabilidad condicionada de su mapa autoorganizado interno.

2. 6 MAPAS AUTOORGANI ZADOS RECURRENTES CON MODELOS
LI NEALES LOCALES
La tcnica de prediccin habitual, como se ha expuesto en las
secciones anteriores, consiste en clasificar la serie temporal de
datos en conjuntos locales (cuantizacin vectorial) para los que se
estiman sus correspondientes modelos lineales con los que realizar
la prediccin de valores futuros. Tpicamente, la cuantizacin se
realiza mediante la aplicacin de ventanas que segmentan la serie de
datos original en vectores de entrada para su posterior agrupacin
en regiones mediante algoritmos de cuantizacin como k-means, mapas
autoorganizados (SOM, Self-Organizing Maps) o neural-gas. Con este

-

procedimiento, se pierde el contexto temporal entre vectores de
datos consecutivos. Una forma de remediar esto consiste en tener en
cuenta en la actualizacin del modelo la correlacin temporal entre
vectores consecutivos (recurrencia).
En el algoritmo de entrenamiento del RSOM (Recurrent Self-
Organizing Map) se procesa simultneamente un conjunto de r vectores
de entrada consecutivos
{ }
1 2 k r k r k + +
y y y L
, siendo
( ) ( )
T
1
i
y i y i N + 1
]
y L
. La correccin en los vectores de
referencia correspondiente a este conjunto de vectores se calcula
recurrentemente de la siguiente forma, ecuacin (37):
( ) ( ) ( ) ( ) ( ) ( ) 1 1 1, , 0 0
i i k r l i i
l l l l r
+
+ w w y w w L

(37)
Se trata de un promediado mediante un filtro de primer orden
con factor de filtrado
entre 0 y 1. Al final de cada paso l en el

clculo recurrente de las correcciones de los vectores de
referencia, se identifica el vector de referencia con la correccin
de menor mdulo:
( ) ( ) { }
min
b i i
l l w w

A continuacin, el mapa es actualizado mediante la regla
habitual expresada en la ecuacin (38):

-

( ) ( )
( )
}
( )
,
1 . .
h i b
i b
i i i
l l e l
+ + w w w

(38)
Siendo
(.) h
la funcin de vecindad y
un factor de escala
para la correccin, que se determinan de forma similar a como se
describi en la seccin 2.2.
La construccin de los modelos de prediccin lineales locales
se realiza mediante mnimos cuadrados lineales usando los vectores
de datos ms cercanos a cada vector de referencia en el mapa. La
regresin lineal resultante es la siguiente, ecuacin (39):

( )
( )
( )
( )
( )
( )
( ) ( )
( ) ( )
( ) ( )
T
1 2
1 1 1
1 1 1 1 1
2 2 2 1 2
1
1 1
1 1
1 1
i
i i i i i i
m i i
i iN
i iN
m m m i m iN
e i y i n y i w y i N w
1
1

1
]
+ + 1 1 1
1 1 1
+ +
1 1 1

1 1 1
1 1 1
+ +
1 1 1
] ] ]
Y
y w y w y w
e y
L
L
64748 64748 6444444447444444 8
L
L
M M M M O M
L
}
( ) ( ) ( )
T
1 2
.
2
i m i i
i
y i n y i n y i n
i
i
iN
y
a
a
1 + + +
]
1
1
1
1
1
1
]
y Y ?
?
L
644444444474444444448
44
M

(39)
Siendo los instantes i
1
, , i
m
aqullos para los cuales el
vector de datos construido a partir de las N muestras ms recientes
de la serie temporal se encuadra en la regin i cuyo vector de
referencia es wi. El vector estimado de parmetros correspondientes

-

al modelo lineal para la regin i vendra dado por la resolucin del
problema de mnimos cuadrados, ecuacin (40):
( )
1
T T
. .
i i i i i
? Y Y Y y

(40)

2. 7 PREDI CCI N BASADA EN LOS VECTORES DE DATOS MS
CERCANOS
Existe una variante en los mtodos de clustering aplicados a
la prediccin en la cual se prescinde de la definicin inicial de
centroides o vectores de referencia. En lugar de realizar una etapa
previa de aprendizaje con un conjunto de datos inicial para definir
las regiones de Voronoi y clasificar posteriormente los nuevos
vectores disponibles, se opta por integrar ambas etapas
prescindiendo de la particin del espacio inicial en regiones de
Voronoi. Se trata de buscar en el conjunto de datos disponible los k
vectores ms prximos al nuevo vector de datos (k-Nearest Neighbor
Algorithm) evitando la presencia de solapes entre los vectores
seleccionados para evitar que sean prximos en el tiempo (k-Nearest
Trajectory Algorithm).
La prediccin se calcula como la media ponderada de los
valores n muestras ms adelante correspondientes a los vectores
seleccionados. La funcin de peso ms comnmente empleada es la
ecuacin (41):

-

2
2
2
1
i
k
d
d
_

,

(41)
Siendo di la distancia del vector en la posicin i y dk la
distancia del vector en la posicin k en la ordenacin por cercana
al vector considerado en la muestra actual.
Este mtodo implica una nueva ordenacin del conjunto de datos
en cada nueva muestra lo que puede incrementar considerablemente la
carga computacional requerida.

2. 8 RED NEURONAL PERCEPTRN MULTI CAPA ( MLP)
Una red neuronal bsica consta de varias capas de neuronas
(tambin denominadas unidades de procesamiento o nodos) y se aplica
a la aproximacin de funciones no lineales como se requiere en el
problema de prediccin.
Los valores de entrada se alimentan a las neuronas de la capa
de entrada donde se procesan y envan a las neuronas de la
denominada capa oculta. Un procesado similar se realiza en las
neuronas de la capa oculta para generar las seales que se envan a
las neuronas de la capa de salida que proporcionan la salida o
salidas de la red. Cada neurona de la capa oculta est conectada a
todas las neuronas de la capa de entrada y a todas las neuronas de

-

la capa de salida. Cada una de esas conexiones lleva asignada un
peso (valor real) que determina la fortaleza de la conexin. Dada
una neurona cualquiera j en la capa l, su salida
l
j
x
se determina
aplicando la denominada funcin de activacin f(.) a la combinacin
lineal de las entradas a la neurona
1 l
i
x

(salidas de las neuronas de
la capa anterior l-1) multiplicadas por sus correspondientes pesos
1 l
ji
w
, ecuacin (42):
1
1 1
1
l
j
l
s
N
l l l
j ji i
i
x f w x
64748

(42)
Siendo Nl el nmero de neuronas en la capa l y
l
j
s
la entrada a
la funcin de activacin de la neurona j en la capa l. Las funciones
de activacin tpicamente empleadas son las siguientes:
Funcin binaria:
( )
1 0
0/ 1 0
s
f s
s

'
<

Sigmoide:
( )
1
1
s
f s
e
+

Tangente hiperblica:
( )
s s
s s
e e
f s
e e
+


-

La funcin de activacin ms utilizada es la sigmoide debido a
la sencillez en la evaluacin de su derivada (
( ) ( ) ( ) ( )
'
1 f s f s f s
),
aunque tiene el inconveniente de que su valor est comprendido entre
0 y 1 por lo que no se puede usar en las neuronas de salida si la
red debe aproximar valores negativos. En este ltimo caso se suele
usar la tangente hiperblica como funcin de activacin.
Modificando los pesos de las conexiones entre neuronas de
manera apropiada se consigue que la red 'aprenda' la relacin entre
el vector de entradas y el vector de salidas. El procedimiento
mediante el cual se modifican los pesos a partir de un conjunto de
datos de entrada y salida se denomina algoritmo de aprendizaje o
entrenamiento. Este algoritmo de aprendizaje debe ser capaz de
generalizar la relacin entrada - salida, es decir captar las
caractersticas generales del conjunto datos empleados en el
entrenamiento prescindiendo de sus caractersticas peculiares
(sobreaprendizaje u overfitting). Para evaluar el aprendizaje de la
red se emplea un conjunto de datos de validacin diferentes de los
utilizados durante la fase de entrenamiento.
Aunque la red bsica consta de una nica capa oculta, es
posible encontrar redes neuronales con varias capas ocultas para
aproximaciones funcionales complejas.


-

2. 9 RAZONAMI ENTO I NDUCTI VO BORROSO

El razonamiento inductivo borroso (FIR, Fuzzy Inductive
Reasoning) es un mtodo de prediccin que no requiere presuponer
estructura alguna para el modelo de prediccin y que se puede
emplear indistintamente para la prediccin de series temporales
monovariables o multivariables. El mtodo genera un modelo de tipo
cualitativo entre las muestras pasadas (entradas) y la prediccin
futura (salida) mediante la bsqueda de la mquina de estados finita
y borrosa que mejor representa la relacin entre las entradas y la
salida.
El primer paso del mtodo consiste en la conversin de las
variables de valor real de la serie temporal en variables
cualitativas equivalentes (borrosificacin o recodificacin). El
intervalo de posible valores de cada variable de la serie temporal
se discretiza en un nmero finito de conjuntos borrosos, asociando a
cada uno de ellos una funcin de pertenencia de tipo gaussiana
centrada en el punto medio del mismo. As, a cada valor real se le
hacen corresponder tres variables: el conjunto borroso al que
pertenece (nmero entero: 1, 2 ,3, ...), el grado de pertenencia a
dicho conjunto (valor entre 0.5 y 1) y la situacin con respecto al
punto central del conjunto borroso (-1 si est a la izquierda, 0 si
est en el centro y 1 si est a la derecha). El conjunto ptimo de
conjunto borrosos est entre 3 y 5. El grado de pertenencia al
conjunto borroso dominante se calcula de la siguiente forma
expresada en la ecuacin (43):

-

( )
2
i i
k x
i
Memb e

(43)
Donde x es valor real que se borrosifica, i es el ndice del
conjunto borroso asignado al valor real, ?i es el valor central de
dicho conjunto borroso (coincide con la media aritmtica de los
valores frontera con los conjuntos borrosos vecinos) y ki es el
parmetro de forma de la funcin de pertenencia del conjunto borroso
(vale 1 en el punto central y 0.5 en los puntos frontera con los
conjuntos borrosos vecinos).
Las tres variables cualitativas anteriores se almacenan en
tres matrices donde cada columna representa cada una de las
variables registradas en la serie temporal y cada fila representa
una muestra distinta. En la conversin descrita no se pierde ninguna
informacin, ya que es posible reconstruir el valor real original a
partir de las variables cualitativas asociadas (desborrosificacin o
regeneracin).
Para que la prediccin sea efectiva, durante la etapa de
entrenamiento (modelado cualitativo) se debe contar con un nmero de
datos al menos cinco veces el nmero de posibles estados
(resultantes de la combinacin de conjuntos borrosos asociados a
cada variable de la serie temporal). El paso previo del modelado
cualitativo consiste en definir las variables de entrada para el
modelo cualitativo de prediccin, es decir qu retardos se
consideran en las variables de la serie temporal a la hora de

-

predecir los valores futuros que interesen. Este se puede realizar
mediante una exploracin exhaustiva entre todas las combinaciones de
variables y retardos que se consideren. La medida de entropa de
Shannon es empleada como criterio de seleccin entre las
posibilidades exploradas para determinar el grado de incertidumbre
en la prediccin del estado de la salida. La entropa de Shannon
relativa a un estado i correspondiente a una combinacin de entradas
se calcula mediante, ecuacin (44):
( ) ( )
2
log
i
o
H p o i p o i

(44)
Donde p(o/i) es la verosimilitud (ocurrencia del resultado o
relativa a cualquier otro resultado) de un cierto estado de la
salida o, condicionado a que ha acontecido el estado de entradas i.
La entropa total de la combinacin de entradas considerada resulta:
m i i
i
H p H

Donde pi es la verosimilitud de cada estado de la entrada. La
mxima entropa posible Hmax se obtiene cuando todas las
verosimilitudes son iguales, mientras que la entropa vale 0 si la
relacin entre los estados de la entrada y de la salida es
completamente determinista. La reduccin total de entropa

-

normalizada Hr (medida de calidad de la prediccin entre 0 y 1 para
la combinacin de entradas considerada) se define como, la ecuacin
(45):
max
1
m
r
H
H
H

(45)
Sin embargo esta medida de calidad presenta un problema, ya
que si incrementa considerablemente el nmero de entradas a
considerar en el modelo cualitativo de prediccin, el nmero de
posible estados de la entrada (combinaciones de los conjuntos
borrosos asociados a cada variable) crece exponencialmente, con lo
que la frecuencia de observacin de cada estado decrece
drsticamente. Rpidamente se puede llegar a una situacin absurda
donde el modelo se vuelva completamente determinista porque cada
estado se observa una nica vez, aunque la prediccin puede ser
desatrosa porque estadsticamente el entrenamiento deja de ser
representativo del futuro comportamiento de la serie. Para evitar
esta situacin se modifica la medida de calidad mediante el ratio de
observacin OR definido como, ecuacin (46):

5 4 3 2 1
5 4 3 2
5
x x x x x
leg
n n n n n
OR
n
+ + + +

(46)


-

Siendo nix (i = 1, 2, 3, 4) el nmero de estados de la entrada
observados i veces, n5x el nmero de estados de la entrada
observados 5 o ms veces y nleg el nmero total de estados de la
entrada. Si cada estado de la entrada se observa al menos 5 veces,
OR es igual a 1. La medida de calidad definitiva Q empleada para
evaluar el poder de prediccin de cada combinacin de entradas se
calcula como el producto de las medidas de calidad anteriores,
.
r
Q H OR
.
Una vez que la combinacin ptima de entradas se ha
determinado, se forma la denominada matriz de entrada - salida que
contiene tantas columnas como suma de entradas y salidas se emplen
y tantas filas como muestras. Esta matriz contiene los estados de
las entradas y salidas para cada muestra (ndices enteros asignados
a los conjuntos borrosos predominantes en cada muestra para las
variables de entrada y de salida. Sendas matrices similares a sta
pueden formarse con las otras propiedades cualitativas definidas en
el proceso de borrosificacin: el grado de pertenencia y la
situacin con respecto al punto central del conjunto borroso. Este
modelo cualitativo es el que se utiliza para prediccin de la
salida.
Una vez que se dispone de una nuevo estado de la entrada, se
asocia un vector de posicin a la nueva entrada y a cada estado de
entrada en la matriz de entrada salida (histrico) mediante un
proceso de desborrosificacin normalizada, que consta de los
siguientes pasos:

-

a. Cada gaussiana (funcin de pertenencia a cada conjunto
borroso) se normaliza al intervalo [-0.5 0.5], lo cual
implica
0
i

. De esta forma, ki se puede calcular como:
2
0.5
0.5 4ln0.5
i
k
i
e k

b. La funcin de pertenencia normalizada y la abcisa x
correpondiente resultan:
( )
( )
2
4l n0. 5
ln
4ln0.5
x i
i i
Memb
Memb e x side

Siendo sidei la situacin con respecto al punto central del
conjunto borroso.
Usando esta desborrosificacin normalizada, el valor de
posicin posi asociado a un conjunto de tres variables cualitativas
{ } , ,
i i i
class Memb side
ser, ecuacin (47):
( ) ln
.
4ln0.5
i
i i i
Memb
pos class side +

(47)
El vector de posicin posi asociado con un estado de entrada
est formado por los valores de posicin de las variables
individuales contenidas en la entrada. Si definimos como posin el
vector de posicin del nuevo estado de entrada y como
j
in
pos
el
vector de posicin del estado de entrada en la fila j de la matriz

-

entrada salida, la distancia entre el estado de entrada actual y
cada entrada histrica viene dada por la ecuacin (48):
j j
in in in
dis pos pos

(48)
Empleando esta distancia, se asigna a la salida predicha el
conjunto borroso y la variable de situacin de la salida en el
vector de entradas ms prximo en el histrico al vector de entradas
actual. La prediccin del grado de pertenencia de la salida predicha
se calcula a partir de la media ponderada de los grados de
pertenencia de las salidas asocidas a los 5 vectores de entrada ms
proximos en el histrico, ecuacin (49):
( )
( )
( )
( )
5
1
5
5
1
5
1
1
max ,
max ,
max ,
max ,
n
in
n
j
in
j j j
o rel o rel
n
j
in
n
i
i in
dis eps
dis eps
Memb w Memb w
dis eps
dis eps

(49)
El ltimo paso consiste en la desborrosificacin o
regeneracin de la salida predicha, utilizando la funcin inversa
que se emple en el proceso de borrosificacin o recodificacin
descrito previamente.

-

Al utilizar el mtodo FIR para la la prediccin de una serie
temporal, es muy importante suministrar no slo la prediccin para
la variable de salida, sino tambin una medida de la confianza en
dicha prediccin. Se han propuesto dos medidas de confianza
asociadas al mtodo FIR: la medida de proximidad y la medida de
similaridad.
La medida de proximidad se calcula como el producto de las
medidas de calidad asociadas a la distancia promediada entre la
nueva entrada y las 5 entradas ms prximas y a la distancias entre
s de las 5 salidas correspondientes a las 5 entradas ms prximas,
ecuacin (50).
.
in out
prox prox prox
conf conf conf

( )
max
5
1
2
1
1
1
conf
in
in
conf
in
d
j j
rel
j
prox
n
i
i
d
d
conf
n
64748
1442443

max
5 5
1 1
1
1
conf
out
j
out
out
out
conf
out
d
dis
pos
j i i j
rel rel
j i
prox
out
d
pos pos
conf
n

6444447444448
644474448
64748
123

(50)

-

La medida de similaridad requiere de una renormalizacin
previa de las componentes de los vectores de posicin de la entrada
y de la salida, ecuacin (51):
1 1 1
1 1 1
j j
j j i i
i i
i i out
p p p
q q q
n n n

(51)
Mientras que las posiciones pi se encuentran en el intervalo
[1, ni], las posiciones normalizadas qi se encuentran en el
intervalo [0 1]. Una vez realizada esta renormalizacin, la medida
de confianza de similaridad resulta, ecuacin (52):
( )
( )
( )
( )
5
1 1
min , min ,
1
max , max ,
j
in
j j
i out
sim
sim sim
j j
n
i i out
j
sim rel
j j
j i
i i out
q q q q
conf
n q q q q

,

644474448
64748 6447448

(52)
La medida de similaridad es ms sensible al error de
prediccin que la medida de proximidad. Esto resulta razonable si se
tiene en cuenta que la medida de similaridad encierra mayor
informacin que la medida de proximidad sobre la diferencia
cualitativa entre una nueva entrada y las entradas ms prximas en
el histrico.


-

3 Algoritmo de prediccin desarrollado

3. 1 PREDI CCI N CON PROMEDI ADO DE LOS DATOS MEDI ANTE
MODELO LI NEAL

Al realizar la prediccin mediante un filtro AR, los
coeficientes del filtro pueden interpretarse como una secuencia de
pesos a aplicar a las muestras pasadas de la serie para estimar su
valor futuro, ecuacin (35):

( ) ( )
T
1
( 1) .
N
i k k k
i
y k n a y k i
+ +
a y F y

(35)

Donde
T
N
a a a a ] [
2 1
es el vector de pesos a aplicar.
Parece razonable tener en cuenta estos pesos en el proceso de
cuantizacin vectorial con el fin de calcular las distancias
considerando la importancia real de cada muestra en la prediccin.
Por lo tanto, el conjunto de vectores V sobre el que se realiza la
cuantizacin vectorial mediante el algoritmo neural-gas sera el
siguiente:
[ ]
{ }
T
1
( ) ( ) ( 1)
k N
y k a y k n a y k n N + V v L


-

El vector de pesos ms apropiado se determina a partir de todo
el registro de datos de la serie temporal mediante mnimos cuadrados
lineales tal como se describi en la seccin 2. Una vez determinados
los vectores de referencia o centroides se asignara el ms
apropiado en cada muestra usando nicamente las N ltimas muestras
del vector de datos (el valor futuro de la serie temporal se
desconoce). La prediccin se obtendra de la primera muestra del
vector de referencia asignado.
Otra estrategia de promediado consiste en utilizar una ventana
de pesos exponencial decreciente (se da ms peso a la muestra ms
reciente) de la forma
1 i
i
a

con
entre 0 y 1. En este caso

conviene tambin aplicar un peso al valor de y(k+n) y optimizar este
peso y
durante el proceso de aprendizaje.

3. 2 SI NTESI S DEL ALGORI TMO

Con los centroides definidos tanto en nmero como en magnitud
quedan definidas las regiones de Voronoi generadas por dichos
centroides.
El valor de prediccin asociado a cada regin de Voronoi se ha
calculado en la rutina de entrenamiento utilizando para ello un
mtodo basado en el promediado de datos mediante modelo lineal, es
decir, se ha calculado el valor medio de todos los valores de

-

prediccin reales de aquellos vectores cercanos a cada regin de
Voronoi.
Con los valores de prediccin asociados a cada regin de
Voronoi queda definida toda la informacin aportada por el algoritmo
de cuantizacin vectorial, ahora quedar comprobar como funcionan
los resultados obtenidos por el algoritmo de cuantizacin vectorial
sobre datos diferentes a los del entrenamiento
El algoritmo de prediccin imita las acciones realizadas por
la rutina que dentro de la cuantizacin vectorial calcula el error
cometido.
Es decir segn le llegan nuevos datos genera el vector de
anlisis correspondiente, busca la regin de Voronoi ms prxima al
vector y le asigna el dato el valor de prediccin de dicha regin.
Espera hasta que aparece el valor futuro del dato y calcula el error
que se ha cometido.
El algoritmo guardar todos los valores de prediccin junto
con todos los valores reales para posteriormente poder buscar
ndices de comportamiento y conclusiones.

-

3. 3 PREDI CCI N

Lo primero es la generacin de la matriz de vectores a
analizar mediante el mismo sistema que se utilizo para la generacin
de la matriz de vectores a analizar en el proceso de entrenamiento
del algoritmo.
Los datos se van filtrando segn iran llegando por que aunque
sean datos guardados en un histrico se pretende simular una
prediccin real.
Se ordenan los vectores en busca de la regin de Voronoi a la
que estarn asociados, ser aquella regin definida por el centroide
ms cercano al vector
A cada regin le haba sido asignado un valor de prediccin
esttico, este ser el valor de prediccin asignado a cada vector
asociado.
Con este valor y el valor de prediccin real se calcula el
error cometido.

-

3. 4 GUARDA DE LOS RESULTADOS

Se guardan los centroides finales que ha calculado el
algoritmo, tanto el nmero como la magnitud de los mismos. Se
guardan tambin los valores de prediccin asociados a cada uno de
los centroides.
Se guardan: los valores futuros reales de los datos utilizados
durante el entrenamiento del algoritmo, los valores futuros
predichos por el algoritmo para los datos utilizados en el
entrenamiento y por ltimo se guardan tambin los errores cometidos
durante el entrenamiento.
Se guardan: los valores futuros reales de los datos utilizados
durante la prediccin del algoritmo, los valores futuros predichos
por el algoritmo para los datos utilizados en la prediccin y por
ltimo se guardan tambin los errores cometidos durante la
prediccin.

Memoria.Resultados Obtenidos

-

Captulo 4 RESULTADOS OBTENIDOS
En este captulo se tratarn de evaluar los resultados
obtenidos por el algoritmo desarrollado.
Para ello se han probado, en los datos correspondientes al
ltimo ao del que se dispone informacin, diferentes versiones, en
las cuales se han ido modificando:

El nmero de centroides mximo (20, 30, 40).
El nmero de meses para el entrenamiento (1, 2, 3)

Una vez determinada la combinacin con la que el error
cometido sera el menor y el beneficio obtenido sera el mayor, se
comprobar que el resultado obtenido se mantiene para los datos de
los dos otros aos de los que se dispone informacin.
Posteriormente se intentar ver como afecta a esta combinacin
la modificacin en los parmetros:

Tamao de los vectores (N = 50, N = 125),
Configuracin del filtro (Wm = 0.5, Wm = 0.1)


-

Por ltimo se realizar un cambio en la manera de eliminar
aquellos centroides que su regin de Voronoi tiene asociados menos
del 10% de los vectores que deberan tocarle si el reparto de
vectores fuera equitativo.
Se mostrarn en tablas los errores cometidos por el algoritmo
as como las varianzas estadsticas de los modelos y las tasas de
acierto y fallo y de los mismos.
Se mostrarn por medio de graficas los beneficios acumulados
de cada variante, una nube puntos que relacionar los valores
predichos por el algoritmo con los valores reales y una recta de
regresin que dar la inclinacin de los resultados.

1 ndices analizados
1. 1 RECTA DE REGRESI N
Si utilizamos un sistema de coordenadas cartesianas para
representar la distribucin bidimensional, obtendremos un conjunto
de puntos conocido con el diagrama de dispersin, cuyo anlisis
permite estudiar cualitativamente, la relacin entre ambas variables
tal como se ve en la Figura 17. El siguiente paso, es la
determinacin de la dependencia funcional entre las dos variables x
e y que mejor ajusta a la distribucin bidimensional. Se denomina
regresin lineal cuando la funcin es lineal, es decir, requiere la

-

determinacin de dos parmetros: la pendiente y la ordenada en el
origen de la recta de regresin, y=ax+b.
Si esa relacin se expresa mediante una funcin lineal, su
grfica correspondera a una recta.
En el caso que nos ocupa nos interesa la recta que mejor "se
ajuste" a los puntos de la nube de puntos de la variable. Dicha
recta se denomina: recta de regresin.
En la Figura 17 se muestra la recta de regresin. En este caso
se supone que represente cmo depende el peso de una persona de su
talla. Dependencia directa - Pendiente de la recta positiva -
Funcin creciente.

Figura 17_Ejemplo recta de regresin

-

La regresin nos permite adems, determinar el grado de
dependencia de las series de valores X e Y, prediciendo el valor y
estimado que se obtendra para un valor x que no est en la
distribucin.

Determinar la ecuacin de la recta que mejor ajusta a los
datos representados en la figura. Se denomina error ei a la
diferencia yi-y, entre el valor observado yi, y el valor ajustado y=
axi+b, tal como se ve en la Figura 18. El criterio de ajuste se toma
como aqul en el que la desviacin cuadrtica media sea mnima, es
decir, debe de ser mnima la suma


-

Figura 18_ Clculo de recta de regresin

El extremo de una funcin: mximo o mnimo se obtiene cuando
las derivadas de s respecto de a y de b sean nulas. Lo que da lugar
a un sistema de dos ecuaciones con dos incgnitas del que se despeja
a y b.


-

1. 2 COEFI CI ENTE DE CORRELACI N
Una vez observado que en una variable bidimensional existe una
cierta dependencia entre las dos caractersticas o variables que la
forman (nube de puntos y covarianza), podemos precisar el grado de
dicha dependencia.
Si los puntos de la nube estuvieran todos sobre la recta de
regresin se dira que existe una dependencia funcional.
Si los puntos no estn todos sobre la recta de regresin se
dice que entre las variables hay una cierta correlacin
lineal. Este es el caso que nos ocupa. Para cuantificar el
grado de dicha correlacin se usa el:
Coeficiente de correlacin de Pearson. Si le llamamos r, su
valor:

El signo del coeficiente de correlacin es el mismo que el de
la covarianza y puede deducirse que el valor del mismo esta
comprendido entre -1 y 1.
Se pueden deducir las siguientes conclusiones relativas al
coeficiente de correlacin (r):
Su signo es el mismo de la covarianza, luego si r es positivo
la dependencia es directa y si es negativo inversa.

-

Si r se acerca a -1 o a +1, la dependencia lineal es fuerte
Si r se acerca a 0 la dependencia lineal es dbil
El coeficiente de correlacin posee las siguientes
caractersticas:
El valor del coeficiente de correlacin es independiente de
cualquier unidad usada para medir las variables.
El valor del coeficiente de correlacin se altera de forma
importante ante la presencia de un valor extremo, como sucede
con la desviacin tpica. Ante estas situaciones conviene
realizar una transformacin de datos que cambia la escala de
medicin y modera el efecto de valores extremos (como la
transformacin logartmica).
El coeficiente de correlacin mide solo la relacin con una
lnea recta. Dos variables pueden tener una relacin
curvilnea fuerte, a pesar de que su correlacin sea pequea.
Por tanto cuando analicemos las relaciones entre dos variables
debemos representarlas grficamente y posteriormente calcular
el coeficiente de correlacin.
El coeficiente de correlacin no se debe extrapolar ms all
del rango de valores observado de las variables a estudio ya
que la relacin existente entre X e Y puede cambiar fuera de
dicho rango.

-

La correlacin no implica causalidad. La causalidad es un
juicio de valor que requiere ms informacin que un simple
valor cuantitativo de un coeficiente de correlacin (5).
Para poder interpretar con mayor facilidad el coeficiente de
correlacin muestral se exponen varias nubes de observaciones y el
ajuste lineal obtenido:
Figura 19: Existe una dependencia funcional lineal, las
observaciones estn sobre la recta de regresin.
r = R
2
= 1
Recta de regresin: y = x

Figura 19_Dependencia funcional lineal

Figura 20: La relacin lineal entre las variables es muy pequea
y no parece que exista otro tipo de relacin entre ellas, la nube de
puntos indica que las variables son casi independientes.

-

r = 0'192
R
2
= 0'037
Recta de regresin: y = 6'317 + 0'086x.

Figura 20_Observaciones casi independientes .

Figura 21: Existe una dependencia funcional entre las
observaciones pero no de tipo lineal, por tanto la correlacin es
muy pequea
r = 0'391
R
2
= 0'153
Recta de regresin: y = 32'534 - 1'889x.

-

Figura 21_ Existe una relacin cuadrtica.

Figura 22: La nube de datos se ajusta razonablemente a una recta
con pendiente positiva.
r = 0'641
R
2
= 0'410
Recta de regresin: y = -3' 963 + -1'749x.

Figura 22_Relacin estocstica lineal.


-

Figura 23: Existe una fuerte dependencia lineal negativa entre
las dos variables y la correlacin es muy alta (prxima a 1).
r = 0'924
R
2
= 0'846
Recta de regresin: y = -2'528 - 2'267x

Figura 23_Fuerte relacin estocstica lineal.

1. 3 NMSE

Para evaluar la calidad de la prediccin se emplea
frecuentemente el denominado error cuadrtico medio normalizado
(NMSE) calculado como:
( )
( )
1
1
( ) ( )
( )
d
d
N
k
N
k
y k y k
NMSE
y k y


-

Siendo Nd el nmero de datos que se predicen e
y
el valor
medio de los datos considerados.

1. 4 TASA DE ACI ERTO Y FALLO

Se presentarn como una serie de tablas en las que se puede
observar la tasa de acierto y de fallo. El formato es el siguiente

1 Real + 2 Real -
1 Predicho + + / + + / -
2 Predicho - - / + - / -

En la casilla (1,1) aparecer el % de veces que el algoritmo
predice un beneficio positivo y la realidad lo confirma.
En la casilla (1,2) aparecer el % de las veces que el
algoritmo predice un beneficio positivo y la realidad lo desmiente.
En la casilla (2,1) aparecer el % de veces que el algoritmo
predice un beneficio negativo y la realidad lo desmiente.
En la casilla (2,2) aparecer el % de las veces que el
algoritmo predice un beneficio negativo y la realidad lo confirma.

La prediccin se considera positiva si el valor esta por
encima de un determinado umbral.
El valor real se considera positivo siempre que esta por
encima de 0.

-

Cuanto mayor sea el porcentaje de la diagonal principal mayor
ser la tasa de acierto del algoritmo y mejor por tanto la
prediccin.

1. 5 BENEFI CI O ACUMULADO

El beneficio acumulado responde a la formula:

Z = cumsum ((x> umbral). * y)

Si x es el valor de prediccin asignado a cada vector e y es
el valor real futuro de cada vector la formula acumula el beneficio
real cada vez que el algoritmo predice positivo.
Por otra parte sera interesante conocer el nmero de
operaciones necesarias para alcanzar cada uno de los beneficios.
Esto se consigue acumulando la cantidad de veces que el algoritmo
predice positivo.

Op = cumsum (x> umbral);

Como ya se menciono anteriormente prediccin positiva quiere
decir prediccin por encima de un valor umbral.


-

2 Nmero mximo de centroides 20
2. 1 CENTROI DES DEFI NI TI VOS
En la Figura 24, Figura 25 y Figura 26 se muestran los centroides
definitivos cuando se parte de un mximo de 20 centroides y se esta
entrenando con 1, 2 y 3 meses respectivamente.

Figura 24_Centroides definitivos para 1 mes

Figura 25_Centroides definitivos para 2 meses

-


2. 2 NMSE

En la Tabla 1 se muestran los errores cuadrticos medios
normalizados cometidos por el algoritmo en la prediccin de los
valores futuros de los datos usados durante el entrenamiento cuando
se han fijado un mximo de 20 centroides.

MSE_ENTR 1 mes 2 meses 3 meses

20

0.9334

0.9237

0.8873
Tabla 1_MSE de entrenamiento

valores futuros cuando se han fijado un mximo de 20 centroides.

-

MSE_PRED 1 mes 2 meses 3 meses

20

1.0707

1.0913

1.0895
Tabla 2_ MSE de prediccin

2. 3 COEFI CI ENTES DE CORRELACI N- RECTA DE REGRESI N

La Tabla 3 muestra los coeficientes de correlacin lineal que
relacionan los valores futuros reales de los datos de prediccin con
los valores predichos para esos mismos datos por el algoritmo.

r 1 mes 2 meses 3 meses

20

-0.0178

-0.0266

0.0074
Tabla 3_Coeficientes de correlacin lineal

La Figura 27 muestra la nube de punto que relaciona los
valores predichos con los valores reales junto con la recta de
regresin obtenida por mnimos cuadrados cuando se entrena un mes


-

Figura 27_nube de puntos entrenando un mes

regresin obtenida por mnimos cuadrados cuando se entrenan dos
meses

Figura 28_ nube de puntos entrenando dos meses


-

regresin obtenida por mnimos cuadrados cuando se entrenan tres
meses

Figura 29_ nube de puntos entrenando tres meses

2. 4 TASAS DE ACI ERTO

La Tabla 4 muestra las tasas de acierto (negro) y las tasas de
fallo del algoritmo entrenado con 1, 2 y 3 meses. Se ha considerado
la prediccin positiva con un umbral de 0.


-

Umbral 0 1 mes 2 meses 3 meses

20

51.6877 48.3123
47.7798 52.2202

50.5442 49.4558
50.5903 49.4097

52.1410 47.8590
50.4553 49.5447

Tabla 4_Tasas de acierto y fallo con umbral 0

En la Tabla 5 se ha considerado la prediccin positiva con un
umbral de 1.


20

46.6851 53.3149
50.1428 49.8572

45.1591 54.8409
50.9098 49.0902

50.8792 49.1208
51.2629 48.7371

Tabla 5_ Tasas de acierto y fallo con umbral 1

umbral de 1.5.

Umbral 1.5 1 mes 2 meses 3 meses

20

47.0356 52.9644
50.1041 49.8959

46.8193 53.1807
50.6950 49.3050

50.1425 49.8575
51.2843 48.7157

Tabla 6_ Tasas de acierto y fallo con umbral 1.5

En la Tabla 7Tabla 6 se ha considerado la prediccin positiva
con un umbral de 2.


-

Umbral 2 1 2 3

20

41.7910 58.2090
50.1089 49.8911

46.7116 53.2884
50.6664 49.3336

58.0769 41.9231
51.1620 48.8380



A continuacin se muestran unas graficas en las que se pueden
observar los beneficios finales acumulados por cada una de las
variantes de prediccin. Tambin queda reflejado el nmero de
operaciones necesarias para alcanzar dicho beneficio, es decir el
nmero de veces que el algoritmo da una prediccin positiva

Umbr al 0

La Figura 30 muestra el beneficio acumulado (B = - 536. 4949)
junto con la cantidad de operaciones necesarias para alcanzar dicho
beneficio (Op = 10383) cuando el algoritmo entrena con un mes y
tiene un umbral de 0.


-

Figura 30_Beneficio acumulado entrenando con un mes con umbral de 0

La Figura 31 muestra el beneficio acumulado (B = -313.7100)
beneficio (Op = 10383) cuando el algoritmo entrena con dos meses y

Figura 31_ Beneficio acumulado entrenando con dos meses con umbral de 0

-

La Figura 32 muestra el beneficio acumulado (B = 331.1780)
beneficio (Op = 11350) cuando el algoritmo entrena con tres meses y

Figura 32_ Beneficio acumulado entrenando con tres meses con umbral de 0

Umbral 1

beneficio (Op = 724) cuando el algoritmo entrena con un mes y tiene
un umbral de 1.

-

Figura 33_ Beneficio acumulado entrenando con un mes con umbral de 1


Figura 34_Beneficio acumulado entrenando con dos meses con umbral de 1

-


Figura 35_Beneficio acumulado entrenando con tres meses con umbral de 1

Umbr al 1. 5
un umbral de 1.5

-

Figura 36_ Beneficio acumulado entrenando con un mes con umbral de 1.5

tiene un umbral de 1.5

Figura 37_ Beneficio acumulado entrenando con dos meses con umbral de 1.5


-


Figura 38_ Beneficio acumulado entrenando con tres meses con umbral de 1.5

Umbr al 2
un umbral de 2

-

Figura 39_ Beneficio acumulado entrenando con un mes con umb ral de 2

tiene un umbral de 2


-






-




-

3. 2 NMSE


MSE_ENTR 1mes 2 meses 3 meses
30 0.8972 0.8990 0.8946


30 1.0930 1.1516 1.0898

-



r 1 2 3
30 -0.0028 -0.0691 0.0483


meses

-


meses

Figura 47_ nube de puntos entrenando t res meses

-

A continuacin se presentan una serie de tablas en las que se
puede observar la tasa de acierto y de fallo. El formato es el
siguiente
Real + Real -
Predicho +

+ / + + / -
Predicho -

- / + - / -

encima de 0.
La Tabla 11 muestra las tasas de acierto (negro) y las tasas
de fallo del algoritmo entrenado con 1, 2 y 3 meses. Se ha
considerado la prediccin positiva con un umbral de 0.


30

47.0363 52.9637
52.8152 47.1848

48.1383 51.8617
52.7832 47.2168

53.7315 46.2685
48.9445 51.0555


umbral de 1.


-


30

47.8627 52.1373
50.1990 49.8010

48.4043 51.5957
50.6752 49.3248

61.9469 38.0531
50.6635 49.3365


umbral de 1.5.
Umbral 1.5 1 2 3

30

57.0281 42.9719
49.8960 50.1040

45.3936 54.6064
50.6999 49.3001

60.5784 39.4216
50.9782 49.0218


con un umbral de 2.

Umbral 2 1 2 3

30

65.2174 34.7826
49.9116 50.0884

44.0351 55.9649
50.7263 49.2737

60.0719 39.9281
51.0304 48.9696



-



Umbr al 0

La Figura 48 muestra el beneficio acumulado (B = -13981) junto
con la cantidad de operaciones necesarias para alcanzar dicho



-





-


Umbr al 1
La Figura 51 muestra el beneficio acumulado (B = 87.5140) junto
un umbral de 1.


-




-


Umbr al 1. 5
un umbral de 1.5


-





-


Umbr al 2
un umbral de 2


-





-






-




-


4. 2 NMSE


MSE_ENTR 1 mes 2 meses 3 meses
40 0.9072 0.8513 0.8826



-

40 1.0758 1.1884 1.0854


r 1 mes 2 meses 3 meses
40 0.0201 -0.0652 0.0342



-

meses


meses

-

Figura 65_ nube de puntos entrenando tres meses


A continuacin se presentan una serie de tablas en las que se
puede observar la tasa de acierto y de fallo. El formato es el
siguiente
Real + Real -
Predicho + + / + + / -
Predicho - - / + - / -

encima de 0.
La Tabla 18 muestra las tasas de acierto (negro) y las tasas
de fallo del algoritmo entrenado con 1, 2 y 3 meses. Se ha
considerado la prediccin positiva con un umbral de 0.

-


40

50.0106 49.9894
50.0820 49.9180

46.4843 53.5157
54.4330 45.5670

51.6724 48.3276
50.8215 49.1785


umbral de 1.


40

55.7841 44.2159
49.7539 50.2461

43.7585 56.2415
51.0063 48.9937

57.8406 42.1594
50.7879 49.2121


umbral de 1.5.


40

59.4444 40.5556
49.9007 50.0993

44.6126 55.3874
50.8567 49.1433

59.3664 40.6336
50.9873 49.0127


con un umbral de 2.


-


40

75.6098 24.3902
49.9119 50.0881

46.2121 53.7879
50.7414 49.2586

58.2857 41.7143
51.1333 48.8667




Umbr al 0



-




-



Umbr al 1

un umbral de 1.

-




-



Umbr al 1. 5

un umbral de 1.5


-




-



Umbr al 2

un umbral de 2


-





-



Una vez obtenidos los resultados aportados por las diferentes
variantes se debern valorar los mismos para as poder saber cual de
ellas es la optimo o si conviene continuar aumentando o el nmero de
centroides o el nmero de meses con los que el algoritmo entrena.

Se realizar una comparativa entre las variantes analizadas
para ello se tendr en cuenta:


-

Como se puede apreciar en la Tabla 22 el error cuadrtico
medio normalizado en la prediccin no tiene una tendencia
clara a mejorar en ninguna de las posibles direcciones. Por
este motivo este no es un ndice con el que se pueda llegar a
ningn tipo de conclusin objetiva ni con el que se pueda
decidir cual de las variantes es mejor o peor.

20 1.0707 1.0913 1.0895
30 1.0930 1.1516 1.0898
40 1.0758 1.1884 1.0854
Tabla 22_ Comparativa de MSE

A continuacin se muestran las tasas de acierto y error de las
variantes. La diagonal principal representa los aciertos y la
otra diagonal los fallos, esto quiere decir que aquellas
opciones que tengan menor la diagonal principal sern
consideradas no validas y aparecern en las tablas en color
azul.
Por otra parte solo se realizarn inversiones en caso de que
el valor de prediccin sea positivo, por este motivo dentro de
los resultados con la diagonal mayor sern mejores cuanto
mayor sea este dato. Este valor aparecer en cada tabla en
rojo


-


20

51.6877 48.3123
47.7798 52.2202

50.5442 49.4558
50.5903 49.4097

52.1410 47.8590
50.4553 49.5447

30

47.0363 52.9637
52.8152 47.1848

48.1383 51.8617
52.7832 47.2168

53.7315 46.2685
48.9445 51.0555

40

50.0106 49.9894
50.0820 49.9180

46.4843 53.5157
54.4330 45.5670

51.6724 48.3276
50.8215 49.1785


20

46.6851 53.3149
50.1428 49.8572

45.1591 54.8409
50.9098 49.0902

50.8792 49.1208
51.2629 48.7371

30

47.8627 52.1373
50.1990 49.8010

48.4043 51.5957
50.6752 49.3248

61.9469 38.0531
50.6635 49.3365

40

55.7841 44.2159
49.7539 50.2461

43.7585 56.2415
51.0063 48.9937

57.8406 42.1594
50.7879 49.2121


20

47.0356 52.9644
50.1041 49.8959

46.8193 53.1807
50.6950 49.3050

50.1425 49.8575
51.2843 48.7157

30

57.0281 42.9719
49.8960 50.1040

45.3936 54.6064
50.6999 49.3001

60.5784 39.4216
50.9782 49.0218

40

59.3664 40.6336
50.9873 49.0127

44.6126 55.3874
50.8567 49.1433

59.4444 40.5556
49.9007 50.0993


-


20

41.7910 58.2090
50.1089 49.8911

46.7116 53.2884
50.6664 49.3336

58.0769 41.9231
51.1620 48.8380

30

65.2174 34.7826
49.9116 50.0884

44.0351 55.9649
50.7263 49.2737

60.0719 39.9281
51.0304 48.9696

40

75.6098 24.3902
49.9119 50.0881

46.2121 53.7879
50.7414 49.2586

58.2857 41.7143
51.1333 48.8667

A continuacin se muestran los beneficios acumulados para cada
una de las opciones. Aquellos beneficios negativos sern
consideradas variantes no validas y aparecern en las tablas
en color azul.
Umbral 0 1 2 3
20 -536.4949 -313.7100 331.1780
30 -1.3981e+003 -1.4377e+003 789.2458
40 -392.6302 -1.7765e+003 66.8206
Umbral 1
20 -87.0737 -682.0748 -129.0396
30 87.5140 -385.3801 462.5647
40 201.9459 -447.5819 302.0668
Umbral 1.5
20 -49.1939 -407.1582 -194.8215
30 150.9451 -406.1124 271.2630
40 131.5363 -320.2341 171.9206
Umbral 2
20 -59.5641 -195.2661 32.9148
30 147.6452 -410.4148 232.8122
40 82.2317 -271.9556 107.8418

-

Con estos datos se puede se obtiene la Tabla 23 se muestra una
comparativa de los mximos beneficios obtenidos por cada variante
junto con la tasa de acierto de cada uno de ellos.

A la vista de los datos se observa:

Los mximos beneficios se obtienen poniendo un mximo de 30
centroides, entrenando el algoritmo con 3 meses y colocando un
umbral de 0.
La mxima tasa de acierto de obtiene poniendo un mximo de 40
centroides, entrenando el algoritmo con 3 meses y colocando un
umbral de 2.
La segunda mejor tasa de acierto coincide con el segundo mejor
beneficio al poner un mximo de 30 centroides, entrenar con 3
meses y colocar un umbral de 1.

Con todo esto y las graficas de evolucin de los beneficios se
considera que la mejor y ms fiable opcin corresponde a 30
centroides, 3 meses de entrenamiento y de umbral.


-

Umbral 0 Beneficio / 3 Tasa de acierto / 3
20 331.1780 52.1410
30 789.2458 53.7315
40 66.8206 51.6724
30 462.5647 61.9469
40 302.0668 57.8406
Umbral 1.5 Beneficio / 3 Tasa de acierto / 3
30 271.2630 60.5784
40 171.9206 59.4444
20 32.9148 58.0769
30 232.8122 60.0719
40 107.8418 75.6098
Tabla 23_ Comparativa de beneficios con tasas de acierto

5 Avance en otras direcciones

Una vez determinada la mejor combinacin posible se intentar
mejorarla avanzando en las tres direcciones indicadas en la Figura
78. Se compararn los nuevos resultados con los aportados en la
opcin de 30 centroides, 3 meses y umbral de 1 para poder realizar
esto se obtendrn los nuevos datos colocndoles un umbral de 1.


-

Figura 78_ Esquema de evolucin

5. 1 OPCI N DE 30 CENTROI DES- 4 MESES DE ENTRENAMI ENTO

En la Figura 79, se muestran los centroides definitivos cuando
se parte de un mximo de 30 centroides y se esta entrenando con 4
meses.



-

En la Tabla 24 se muestra una comparativa de los ndices
relevantes entre los obtenidos con la opcin de 30 centroides, 3
meses y umbral de 1 con los obtenidos con la opcin de 30
centroides, 4 meses de entrenamiento y umbral de 1.

Puede intuirse que esta nueva opcin no mejora los resultados
de la primera aunque para confirmar esta hiptesis en la Figura 80
se muestran los beneficios acumulados por las dos opciones y por
ltimo en la Figura 81 se muestran las dos nubes puntos generadas
por los datos predichos y reales de las dos opciones junto con las
rectas de regresin que mejor aproximan por mnimos cuadrados dichas
nubes de puntos.

MSE pred MSE entr
Tasa acierto y
fallo
Coef.Correlacin
30-3
1.0898 0.8946
61.9469 38.0531
50.6635 49.3365
0.0483
30-4
1.1275 0.8912
53.1250 46.8750
50.5034 49.4966
0.0245
Tabla 24_ Comparativa de ndices significativos


-


Figura 81_ Nubes de puntos con rectas de regresin.



-

meses.


nubes de puntos.


-

MSE pred MSE entr
Tasa acierto y
fallo
Coef.Correlacin
30-3
1.0898 0.8946
61.9469 38.0531
50.6635 49.3365
0.0483
20-4
1.0872 0.9381
44.6830 55.3170
50.8662 49.1338
0.0171




-



meses.



-

nubes de puntos.

MSE pred MSE entr
Tasa acierto y
fallo
Coef.Correlacin
30-3
1.0898 0.8946
61.9469 38.0531
50.6635 49.3365
0.0483
40-4
1.1212 0.8602
48.0263 51.9737
50.7729 49.2271
0.0171


-




-

6 Modificacin del tamao de la ventana y de la
configuracin del filtro.
Una vez comprobado que la opcin de 30 centroides, 3 meses de
entrenamiento y umbral de 1 es la que mejores resultados ofrece se
pasar a modificar el resto de parmetros del algoritmo; es decir se
probar a modificar:
El tamao de la ventana (tamao del vector).
Los parmetros que definen el filtro.

Fi l t r os anal gi cos But t er wor t h

No toda la informacin contenida en la serie temporal es
informacin relevante que el algoritmo deba aprender por ello se
pasar un filtro a la seal antes de entrar en el proceso de
entrenamiento.
En Matlab podemos encontrar la instruccin Butter, este
comando disea filtros Butterwoth pasa-bajas, pasa-altas, pasa-
bandas y rechaza bandas tanto en forma digital como analgica. Este
filtro se caracteriza por una respuesta plana en la banda de
transicin.
En el dominio analgico tenemos dos opciones:
La instruccin para generar un filtro del grado que el usuario
desee, as como la manipulacin de la frecuencia de
corte.(esta instruccin genera los polos y ceros necesarios)

-

El comando para que a partir del grado, tipo y
amortiguamiento, se obtengan los polos, zeros y ganancia que
pueda tener el filtro.

Ambas opciones generan los coeficientes de s de la funcin de
transferencia:

En este caso se utilizar la instruccin:

[B, A] = BUTTER (N, Wn)

Donde N corresponde al grado del polinomio que define al
filtro y Wn nos da la frecuencia de corte del filtro.

A continuacin se muestran las graficas que corresponden a las
respuestas en frecuencia y respuestas a un pulso de los tres filtros
probados.
En la Figura 88 se puede observar que al llegar a 12.5Hz de
frecuencia se encuentra el primer polo y se empieza a atenuar las
frecuencias arriba de ste punto. Por otra parte se puede observar
que a partir de 12.5 Hz la seal se empieza a atenuar por lo cual
las frecuencias mayores a sta se filtrarn. Es importante notar que
la banda de paso es lineal y plana caracterstica de un filtro
butterworth.

-

Figura 88_Respuesta en frecuencia para Wm= 0.5
que a partir de 1.25 Hz la seal se empieza a atenuar por lo cual
las frecuencias mayores a sta se filtrarn. Es importante notar que
la banda de paso es lineal y plana caracterstica de un filtro
butterworth.


-

que a partir de 2.5 Hz la seal se empieza a atenuar por lo cual las
frecuencias mayores a sta se filtrarn. Es importante notar que la
banda de paso es lineal y plana caracterstica de un filtro
butterworth.


En la Figura 91 podemos observar el efecto del filtro, aunque
aqu no a parecen las frecuencias, se puede ver que hay un rango en
donde la seal puede pasar sin ser atenuada, este ejemplo nos ayuda
a visualizar por donde se encuentra las frecuencias de corte y qu
tipo de filtro es.

-

Figura 91_ Respuesta temporal

Est udi o de l as modi f i caci ones
La Figura 92 muestra los beneficios acumulados y la nube de
puntos ajustada por una recta de regresin de los resultados
obtenidos por la variante de 30 centroides, 3 meses y umbral de 1.
Estos resultados sern la base para comparar las posibles mejoras
debidas a las modificaciones realizadas sobre los parmetros

Figura 92_Resultados por el modelo 30-3
Wn = 0.5
Wn = 0.05
Wn = 0.1

-

En la Figura 93 y Figura 94 se muestran los centroides definitivos
cuando se parte de un mximo de 30 centroides y se esta entrenando
con 3 meses para una ventana de 50 y otra de 125 respectivamente.

Figura 93_Centroides definitivos para ventana de 50 datos

Figura 94_Centroides definitivos para ventana de 125 datos

-

En la Figura 95 y Figura 96 se muestran los centroides definitivos
cuando se parte de un mximo de 30 centroides y se esta entrenando
con 3 meses para un filtro con una frecuencia de corte de Wn = 0.5 y
otra de Wm = 0.1 respectivamente.

Figura 95_Centroides definitivos para una Wm = 0.5

Figura 96_Centroides definitivos para una Wm = 0.1

-

La Tabla 27 muestra los MSE cometidos tanto durante el
entrenamiento como en la prediccin por las diferentes
modificaciones del algoritmo.
Se observa que los errores cuadrticos no se ven realmente
afectados por las modificaciones realizadas, sin embargo como ya se
ha mencionado con anterioridad estos ndices por si solo no eran
realmente significativos.

MSE_PRED MSE_ENTR
30-3 1.0898 0.8946
V=125 1.1012 0.8832
V =50 1.0649 0.8998
Wm = 0.5 1.0885 0.9004
Wm = 0.1 1.0894 0.9008
Tabla 27_ MSE normalizados

En las Figura 97 y Figura 98 se reflejan las nubes de puntos
generadas entre los valores de prediccin dados por el algoritmo (x)
y los valores reales asociados a cada vector (y), junto con las
recta de regresin que mejor se ajustan a dichas nubes de puntos.
La Figura 97 corresponde a las nubes de puntos generadas al
modificar el tamao de las ventanas y la Figura 98 corresponde a las
nubes de puntos generadas al modificar la frecuencia del filtro.


-

Figura 97_ Nube de puntos con recta de regresin

Figura 98_ Nube de puntos con recta de regresin

La Figura 99 refleja los beneficios acumulados generados al
modificar el tamao de las ventanas y la Figura 100 refleja los
beneficios acumulados generados al modificar la frecuencia del
filtro.

-



La Tabla 28 muestra una comparativa de los ndices ms
significativos, del estudio de los resultados se puede deducir que
tanto los cambios en el tamao de la ventana como las modificaciones
de los parmetros no filtro no varan significativamente los
resultados obtenidos por el algoritmo.


-

Se puede suponer por tanto que estas variaciones son debidas a
la arbitrariedad de la eleccin de los centroides iniciales, de la
ordenacin cronolgica de los vectores durante el entrenamiento y en
parte tambin al azar.

Tasa de acierto y
fallo

Beneficio
acumulado

Correlacin

30-3

61.9469 38.0531
50.6635 49.3365

462.5647

0.0483

V=125

62.3256 37.6744
50.3323 49.6677

321.0752

0.0175

V =50

58.0624 41.9376
50.9420 49.0580

418.8521

0.0271

Wm = 0.5

61.1411 38.8589
50.6823 49.3177

426.3321

0.0226

Wm = 0.1

55.4645 44.5355
50.8195 49.1805

402.0929

0.0301
Tabla 28_ndices significativos


-

7 Modificacin del mtodo de eliminacin de
centroides.
Hasta el momento los centroides que tenan asociados a su
regin de Voronoi menos del 10% de todos los vectores que deberan
tocarle si el reparto hubiera salido equitativo eran eliminados en
cada actualizacin de los centroides. Esto implica que en la
siguiente actualizacin los vectores que se haban quedado sin
asociar a ningn centroide se unan al nuevo ms prximo. De esta
forma tanto el valor de los centroides como la prediccin asociada a
ellos se ven afectados por vectores cada vez menos prximos.
Otra posibilidad es la de actualizar todos los centroides
hasta que el error cometido no disminuya y entonces, justo antes de
entrar en la prediccin, eliminar aquellos centroides que tengan
asociados menos del 10% de los vectores. De esta forma el valor de
los centroides y la prediccin asociada a ellos se habrn generado
tan solo por aquellos vectores ms prximos a cada centroide.
En este apartado se tratar de averiguar que favorece ms a la
prediccin.
En la primera opcin es posible que se cometan ms errores
pero en la segunda opcin es posible que sean de mayor magnitud.

En la Figura 101 se muestran los centroides definitivos cuando se
parte de un mximo de 30 centroides y se esta entrenando con 3 meses
pero se eliminan los centroides sobrantes solo una vez despus de
toda la actualizacin de los mismos.


-

Figura 101_Centroides definitivos para cambio en la eliminacin

En la Tabla 29 se pueden ver los ndices estudiados en todos los
casos. Puede verse que la tasa de aciertos disminuye con la segunda
versin de eliminacin de centroides y an as el beneficio
acumulado aumenta. Esto puede observarse tambin en la Figura 102,
puede apreciarse tambin como la subida en la acumulacin de
beneficios en esta segunda versin tiene dos escalones y un socavn
mientras para la primera versin la subida era casi continua.

La Figura 103 muestra la nube de puntos que relaciona los
valores reales con los de prediccin, se sigue apreciando como la
mayora de los puntos estn alrededor del 0.


-

MSE_Entr MSE_Pred
Tasa de acierto
y fallo
Beneficio
acumulado
Correlacin

V.I 0.894 1.0898
61.9469
38.0531
462.5647
0.0483

V.II 0.8709 1.1047
57.2387
42.7613
498.9083
0.0134


-

Figura 103_Nube de puntos con recta de regresin

8 Comprobacin con diferentes datos.

Por ltimo se tratar de demostrar que los resultados
aportados por la opcin de 30 centroides, 3 meses de entrenamiento y
umbral de 1 no han sido totalmente fruto del azar. Para ello se
realizar la prediccin con los datos correspondientes al segundo
ao y con los datos correspondientes al tercer ao.

En la Figura 104 y Figura 105 se muestran los centroides
entrenando con 3 meses para los datos correspondientes al segundo
periodo de tiempo y para los del tercer periodo respectivamente.


-

Figura 104_Centroides definitivos para 2 ao

Figura 105_ Centroides definitivos para 3
er
ao
En la Figura 106 se reflejan las nubes de puntos generadas
entre los valores de prediccin dados por el algoritmo (x) y los
valores reales asociados a cada vector (y), junto con las recta de
regresin que mejor se ajustan a dichas nubes de puntos.

-

La figura de la derecha corresponde a las nubes de puntos
generadas por los datos correspondientes al segundo periodo de
tiempo mientras que la figura de la izquierda corresponde a las
nubes de puntos generadas por los datos correspondientes al tercer
periodo de tiempo.
Puede apreciarse en las graficas que el reparto de los puntos
en la nube se mantiene, igual que en estudio realizado para los
datos procedentes del primer periodo de tiempo, en torno al 0.

La Figura 107 refleja los beneficios acumulados generados por
el algoritmo para el segundo y tercer periodo de tiempo.
Puede apreciarse en las graficas que la evolucin de los
beneficios acumulados es menos estable que para los datos
procedentes del primer periodo de tiempo, aunque evolucionan hacia
los mismo valores finales.
En el caso del ao 2 los beneficios acumulados tienen un punto
en el que superan a los otros dos aos aunque luego la cada los
vuelve a acercar al resto de aos

Figura 106_Nube de puntos con recta de regresin

-

En la Tabla 30 se muestra una comparativa de todos los ndices
estudiados para cada ao.
Puede apreciarse que tanto la tasa de acierto como el
beneficio acumulado son muy parecidos para los dos aos. Tambin se
mantiene casi constante el MSE de prediccin aunque como ya se haba
deducido antes este no es un ndice significativo para el algoritmo

MSE_Entr MSE_Pred
Tasa de acierto
y fallo
Beneficio
acumulado
Correlacin

Ao 1 0.8946 1.0898
61.9469
38.0531
462.5647
0.0483
Ao 2 0.8913 1.0812
53.6993
46.3007
408.5675
0.0096
Ao 3 0.8515 1.2357
55.2372
44.7628
356.7317

0.0264
Memoria.Conclusiones

-

Captulo 5 CONCLUSIONES

En este ltimo captulo se realizar una recopilacin de la
informacin obtenida a partir de los experimentos desarrollados para
con ello obtener algn tipo de conclusin.
Se abarcar tanto a los centroides, a los meses de
entrenamiento, al filtro como a las diferentes versiones del mismo
mtodo.
Se intentarn valorar el mtodo de cuantizacin vectorial, su
aplicacin a la prediccin de series temporales y concretamente a la
prediccin de esta serie temporal generada para este estudio.
Para poder obtener conclusiones a partir de unos experimentos
realizados lo primero es saber si los resultados obtenidos e ndices
estudiados en ellos son significativos y aportan la suficiente
informacin.
A continuacin se realizar un breve estudio de la relevancia
de dichos ndices:
Los cambios sufridos en el NMSE debidos a las modificaciones
del algoritmo no son un ndice relevante, esto es debido a que no
tienen una tendencia clara y que por tanto no aportan ninguna

-

informacin sobre las ventajas e inconvenientes de usar una variante
u otra.
Los Coeficiente de correlacin lineal obtenidos para cada una
de las posibles opciones son muy bajos es decir son valores muy
prximos a 0, con esto tan solo se puede concluir que la relacin
existente entre las predicciones y los valores reales no es una
relacin lineal, pero no se puede afirmar por ello que no tengan
correlacin.
A partir de las Nube de puntos obtenidas se puede observar que
aunque las predicciones no son del todo correctas tampoco presentan
en general desviaciones demasiado significativas, es decir los
valores se encuentran en torno al cero y en alguna de las versiones
incluso existen ms puntos en la parte que corresponde a prediccin
positiva con realidad positiva que en cualquiera de los otros
cuadrantes.
La Tasa de acierto y fallo si es un ndice que permite
discernir entre una versin mala y otra buena debido a que
claramente quedan reflejadas aquellas opciones que fallan ms veces
de las que aciertan.
El Beneficio acumulado en relacin con el nmero de
operaciones necesarias para l es un ndice determinante debido a
que por lgica no es lo mismo acumular 100 con 1000 operaciones que
acumular 100 con 50 operaciones o acumular 150 con 1000 operaciones.
Por otra parte ya no es importante el beneficio final acumulado sino

-

tambin la estabilidad de la evolucin del mismo, pues siempre ser
mejor una versin que aunque no obtenga tanto beneficio como otra
tenga una evolucin generalmente en alza y con cuantos menos picos
mejor.
No se ha valorado la posibilidad de realizar la prediccin
utilizando otro de los mtodos existentes para ello. Esto podra
quedar como una posible ampliacin del proyecto.
Una vez conocidos los ndices que realmente aportan
informacin y el tipo de informacin aportada se pasar a analizar
las conclusiones obtenidas a partir de dichos ndices:
a. Importancia de inicializar los centroides a valor cero para
correcta para la identificacin, esto es debido a que en
principio se carece de cualquier tipo de informacin acerca
del comportamiento de la serie y por tanto la mejor forma de
inicializar los centroides es por defecto en un valor nulo.

b. Importancia de determinar el nmero mximo de centroides para
cada aplicacin debido a que puede darse el caso de que al
comenzar con ms de los necesarios el algoritmo tienda al
sobre-aprendizaje o que si parte de menos de los becarios
pueda no ser capaz de identificar correctamente por falta de
opciones.
En este caso concreto su valor ptimo son un mximo de 30
centroides a partir de los cuales el algoritmo va eliminando
aquellos centroides que en principio no forman un grupo de

-

informacin relevante hasta alcanzar un valor ptimo de 13
centroides significativos los cuales sern usados para la
prediccin.

c. Importancia de la cantidad de datos necesarios para entrenar
para tener una correcta identificacin debido a que si los
datos son insuficientes el algoritmo tendr un aprendizaje
deficiente y si son demasiados el algoritmo puede sufrir
sobre-aprendizaje lo cual puede ser desfavorable a la hora de
la identificacin del siguiente dato entrante y por tanto de
su prediccin.

En este caso concreto el algoritmo obtiene su mejor respuesta
cuando entrena con la cantidad de datos correspondientes a 3 meses.

d. Importancia de la eliminacin de los centroides poco
significativos en el aprendizaje. Como ya se mencion con
anterioridad se han probado dos sistemas y una variante de uno
de ellos: Uno consiste en ir eliminando progresivamente estos
centroides en cada proceso de actualizacin de sus valores y
de sus predicciones y otro mtodo consiste en actualizar por
completo todos los valores de los centroides y de sus valores
de prediccin asociados a los mismos; la variante consiste en
lugar de eliminar estos centroides asignarles un valor de
prediccin igual a 0. Para cada uno de los mtodos las
consecuencias son:


-

_ En el mtodo I: Se reutilizan aquellos vectores que en
principio podran ser considerados como raros para
ponderar el valor de prediccin y el valor que define
cada una de las regiones de Voronoi asociadas a cada
centroide.

_ En el mtodo II: Se eliminan los centroides que tienen
asociados a si mismos los vectores considerados raros
de esta forma cuando en la prediccin aparece algn dato
raro este ser asociado al centroides menos lejano y
por tanto a su valor de prediccin

_ En el mtodo III: No se eliminan los centroides con
vectores raros sino que se les asigna un valor de
prediccin igual a 0 en este caso cada vector ira
asociado a su centroides ms prximo.

En este caso concreto parece que lo ms apropiado es el mtodo
I en el cual se cometen ms cantidad de errores pero de menor
magnitud que en los otros dos casos.

e. Importancia insignificante en los resultados obtenidos de
modificacin del filtro. Estas variaciones se pueden apreciar
en los centroides obtenidos pues en funcin de la Wm del
filtro presentan mayor o menor cantidad de ruido, pero este
efecto es no valorable a la hora de ver la prediccin.


-

f. El mtodo de cuantizacin vectorial funciona correctamente, es
decir partiendo de un valor aleatorio para los centroides
estos en cada actualizacin modifican dicho valor para con
ello reducir la distancia a los vectores ms prximos.

g. La funcin de prediccin, debido a su simplicidad, tan solo es
capaz de alcanzar un nmero limitado de aciertos y con ello un
beneficio acumulado limitado.

Con todo esto se puede concluir que este es un mtodo de
identificacin de series temporales muy eficiente y que su
aplicacin a la prediccin de series temporales es un mtodo con
mucho potencial aunque todava es un mtodo algo inmaduro.

Memoria.Bibliografa:

-

BIBLIOGRAFA:
1. Time Series Analysis: Forecasting & Control: Box and Jenkins
2. The Robustness of Model Selection Rules: Jungeilges Jochen A. (1996)
3. Prediccin series de tiempo econmicas usando especificaciones
flexibles versus fijas y modelos econmicos lineales versus
nolineles: Swanson y White (1995)
4. Neural Networks in Finance and Investing: Trippi y Turban (1993)
5. Neural Networks for Financial Forecasting: Edward Gately (1996)
6. Predicting Stock Price Performance. A Neural Network Approach:
Yoon Y. y Swales G. (1991)
7. A Comparison of Disriminant Analysis versus Artificial Neural
Network: Yoon Y., Swales G. y Margavio T.H. (1993)
8. http://www.r-project.org/
9. http://www.bde.es/servicio/software/softwaree.htm
10. Study of the quality of representation of bidimensional
objects with Growing Neural Gas depending on the learning
paameters: Flrez F., Garca Chamizo J.M, Garca J., Hernndez A.
11. Characterization and sntesis of abjects using growing neural
gas: Garca J., FLrez F., Garca J.M., Hernndez A.
12. Introduction to Time Series and Forecasting: Brockwell Peter J.,
Davis Richard A.
13. Vector Quantization and Signal Compression: Gersho A .y Gray R.
14. Time in self-organizing maps: An overview of models.
International Journal of Computer Research: Barreto G. and Araujo A.
15. The GSOM-algorithm for growing hypercubical output spaces in
elforganizing maps: Bauer H. U. and Villmann T. (1997)
16. Neuralgas network for vector quantization and its
application to time-series prediction. Martinez T., Berkovich S. and
Schulten K.
Recursive self-organizing maps. Neural Networks: Voegtlin T. (2002)
Memoria.Pliego de condiciones:

-

PLIEGO DE CONDICIONES:
1 Condiciones Generales.
Las condiciones y clusulas que se establecen en este
contrato, tratan sobre la contratacin, por parte de la persona
fsica o jurdica de los derechos sobre las conclusiones de la
investigacin que sobre el mtodo de identificacin y prediccin de
series temporales aplicado a las cotizaciones burstiles se ha
realizado en este proyecto.
El cumplimiento de estas condiciones obliga a las dos partes,
y son las que a continuacin se exponen:
Las dos partes se comprometen desde la fecha de la firma del
contrato a cumplir todo lo que a continuacin se estipula.
En el caso de reclamacin o discrepancia en lo concerniente al
cumplimiento de lo pactado por cualquiera de las partes, una
vez agotada cualquier va de entendimiento se tramitar el
asunto por la va de lo legal.
El vendedor queda obligado a facilitar a la otra parte
cualquier informacin que contribuya a mejorar la instalacin
y funcionamiento del sistema, siempre que se le requiera para
ello.


-

El comprador a su vez, queda obligado a explicar al fabricante
todas las caractersticas del sistema en que va a funcionar el
mtodo desarrollado, con el objeto de facilitar su
instalacin, quedando el proveedor libre de responsabilidad
sobre cualquier defecto que surja por el incumplimiento de
dicha obligacin.
El plazo de entrega ser de tres meses a partir de la fecha de
la firma del contrato.
Si la entrega se retrasa ms de los tres meses acordados, el
comprador podr rescindir el contrato, sindole retribuidas
todas las cantidades abonadas.
Queda fijado el plazo de un ao de garanta a partir de la
fecha de entrega del sistema. La garanta queda anulada al
expirar el plazo o si se demuestra que el sistema ha sido
objeto de manipulacin indebida.

2 Condiciones Econmicas
El valor de venta quedar fijado de comn acuerdo por ambas
partes.
Los plazos para los pagos sern los siguientes:
o 25% a la firma del contrato.
o 50% a la entrega del producto.
o 25% a los dos meses.

-

Cualquier demora en el pago de lo estipulado sufrir un
recargo del 10% sobre la cantidad retenida.
Los gastos de envo y embalaje sern a cargo del vendedor.
El vendedor acepta la responsabilidad sobre cualquier defecto
o avera causadas durante el transporte.
Hasta la expiracin del plazo de garanta, la totalidad de los
gastos ocasionados por reparaciones corrern a cargo del
vendedor.

3 Condiciones Tcnicas y Particulares
Los mdulos de software y hardware empleados en el desarrollo
del proyecto han de cumplir con la reglamentacin sobre estos
existentes en Espaa.
El teclado empleado ser en espaol.
Las condiciones ambientales en el lugar en que funcione el
mtodo habrn de ser las adecuadas para el sistema sobre el
que corre el mtodo programado.
La alimentacin empleada por el PC o sistema sobre el que
corra el programa habr de ser de 220 V y 50 Hz. sta habr de
estar sometida a la reglamentacin sobre calidad del servicio
incluida en la Ley.
El sistema operativo empleado por el PC, en caso de utilizar
ste, ser el entorno Windows, preferiblemente NT.

-

El equipo sobre el que se instale el mtodo habr de ser un PC
o sistema procesador; ste habr de contar con las siguientes
caractersticas:
o Microprocesador Pentium 500 MHz o superior.
o Tarjeta grfica (VGA).
o Unidad de disco.
o Monitor de 15 pulgadas.
o Memoria RAM de 128 Mb.

Memoria.Presupuesto

-

PRESUPUESTO
Esta seccin trata de cuantificar el esfuerzo realizado
durante las distintas fases del proyecto e intenta darle una
proyeccin econmica.
Se han identificado las siguientes tareas:
1. Investigacin y documentacin-------------- 100 horas
2. Programacin algoritmo--------------------- 300 horas
3. Desarrollo de la programacin-------------- 120 horas
4. Validacin de resultados------------------- 100 horas
5. Pruebas con datos reales------------------- 100 horas
720 Horas
Precio hora / ingeniero superior 8 .
Coste humano 720 * 8 = 5760
Coste licencia software Matlab 6.5 --- 2404.45
Coste material
o Equipo informtico ------- 3000
o Material de trabajo ------ 1000

Valor total 12164,45 .

Parte II ANEXOS

Anexos.I Rellena huecos


I RELLENA HUECOS
clear
fichero_aux = ['BBVA_4'];
fichero_aux = cellstr(fichero_aux);

for num_fich = 1:size(fichero_aux,1)

fichero = char(fichero_aux(num_fich));
%fichero1 = ['..\..\proyecto\aino\' fichero];
fichero1 = [fichero];
eval (['load ' fichero1])

%Cont ador de muest r as
cont_aux = 2;
c_close_aux(1) = c_close(1);
fecha_aux(1,:) = fecha(1,:);
hora_aux(1,:) = hora(1,:);
Nm = length(c_close);
sprintf ('Numero de muestras a evaluar: %d\n',Nm);

for cont = 2:Nm
if (rem(cont,100) == 0)
disp(['Estoy en la muestra:' num2str(cont) '/'
num2str(Nm)]);
end



%Anal i za l as hor as.
%Hor a act ual en mi nut os desde l as 0: 00
time_0 = str2num(hora(cont,1:2))*60
+str2num(hora(cont,3:4))
%Hor a ant er i or en mi nut os desde l as 0: 00
time_1 = str2num(hora(cont-1,1:2))*60
+str2num(hora(cont-1,3:4))
%I ncr ement o del t i empo en mi nut os
time_inc = time_0-time_1;

%Cor r ecci n por cambi o de d a;
%Consi der andose el i nt er val o de 9: 00 a 17: 30
if time_inc<0
time_inc = time_0 - (9*60) + (17*60+30) - time_1;
end

%Cl cul o de huecos
n_huecos = floor(time_inc/5);

%Rel l eno de l os huecos
if n_huecos == 1
hora_aux(cont_aux,:) = hora(cont,:);
fecha_aux(cont_aux,:) = fecha(cont,:);
c_close_aux(cont_aux) = c_close(cont);
cont_aux = cont_aux+1;



elseif n_huecos > 1

if n_huecos < 100
c_close_aux(cont_aux:cont_aux+n_huecos-1) =
c_close(cont)*ones(n_huecos,1);
time = time_1;
a = n_huecos;

while a > 0
if time+5 > (17*60+30);
fecha_aux(cont_aux,:) = fecha(cont,:);
time = 9*60;
h = floor(time/60);
minut = rem(time,60);
hora_aux(cont_aux,:) = sprintf
('%02d%02d00',h, minut)
fecha(cont-1,:) = fecha(cont,:);
else
fecha_aux(cont_aux,:) = fecha(cont-1,:);
time = time+5;
h = floor(time/60);
minut = rem(time,60);
hora_aux(cont_aux,:) = sprintf
('%02d%02d00',h, minut)
end
a=a-1;
cont_aux=cont_aux+1;
end



elseif n_huecos >100
disp(['Numero de huecos demasiado grande'])
end
end
end
end

c_close=c_close_aux(:);
fecha=fecha_aux;
hora=hora_aux;

comando=['save BBVA_f c_close hora fecha'];
eval(comando);

Anexos.II Algoritmo desarrollado


II ALGORITMO DESARROLLADO



1 INICIALIZACIN

1.1 Inicializaciones susceptibles de cambio

Regi st r o Es el nmero total de meses que se ha utilizado para
realizar el entrenamiento

registro = 13; Vale 13 si se esta entrenando de mes en mes
% registro = 14; Vale 14 si se esta entrenando de dos meses
en dos meses
% registro = 15; Vale 15 si se esta entrenando de tres meses
en tres meses

Pasada_pr corresponde a la diferencia de meses entre el
entrenamiento y la prediccin y posteriormente se convierte en el
contador que indica el nmero de registros que se han analizados ya.

pasada_pr = 0; Vale 0 si estamos entrenando de mes en mes
% pasada_pr = 1; Vale 1 si estamos entrenando de dos meses en
dos meses



% pasada_pr = 2; Vale 2 si estamos entrenando de tres meses
en tres meses

Fi l t r o son los parmetros que definen el filtro:

Nm = 4; Nm define el orden del polinomio denominador
del filtro
Wm = 0.05; Wm define la frecuencia de corte del filtro

Modi f i ca habilita o deshabilita la posibilidad de aumentar el
numero de centroides, en funcin del error cometido, a partir de los
fijados inicialmente. El programa siempre podr decidir que el
nmero de centroides sea menor del fijado como partida.

% modifica = 1; Vale 1 si permite que se aumente el numero
de centroides
modifica = 0; Vale 0 si no permite que se aumente el
numero de centroides

f i j a_cent r oi des define, cuando el programa no permite el
aumento en los centroides, el nmero mximo de centroides con los
que el algoritmo puede predecir.

fija_centroides = 1 Vale 1 si se mantiene como mximo el
nmero de 20 centroides iniciales
% fija_centroides = 1.5 Vale 1.5 si se mantiene como mximo el



% fija_centroides = 20 Vale 2 si se mantiene como mximo el

Cent r oi des definen el nmero inicial de centroides, este valor
debe ser mltiplo de meses*20 para poder fijar con la misma regla la
separacin entre los centroides (sep_centr) y la separacin
existente entre cada uno de ellos; distancia que debe haber entre
los vectores para sacar los centroides (este es el mnimo valor que
evita el solape)

% num_centr = meses * 20 * fija_centroides;
% sep_centr = 101 / fija_centroides;

Vent ana determina el tamao de la ventana de datos considerada
como un vector de estudio.

Ventana = 100;

1.2 Inicializaciones necesarias en preparacin

Cont ador es que definen el punto exacto en el que se encuentra
el proceso y evitan sobre-escrituras.

pasada = 0; Define el nmero de meses que ya han sido
analizados



B2 = 12; Define el nmero de meses de entrenamiento
que le faltan al proceso para llegar al
final
B1 = 11; Define el nmero de meses de prediccin que
le faltan al proceso para llegar al final

1.3 Inicializaciones necesarias en entrenamiento

load BBVA_f; Carga el fichero donde estn guardados los
datos a analizar
N=50; N define numero de muestras hacia delante
para el que se pretende realizar la
prediccin.

Dat os define el nmero de datos correspondiente a cada mes y
el nmero de datos a analizar en cada mes. Este nmero no coincide
debido a que en el proceso de entrenamiento se debern dejar sin
analizar los N ltimos datos de cada mes para as poder tener un
valor de prediccin para todos los datos si analizados.

datos_mes=22*12*8.5; datos_mes corresponde con el numero de
datos por mes
Datos=datos_mes-N; Datos corresponde con el numero de datos
total a analizar; -N para que quede el
valor de prediccin del ultimo vector



C_cl ose representa la variable que guarda los datos de la
serie temporal a analizar. De todos estos datos se irn analizando
sucesivamente series de X elementos de los cuales una parte se usar
para el entrenamiento del algoritmo y la otra se utilizar para
realizar la prediccin.

c_close = fliplr(c_close);
Se le da la vuelta a los datos de la
variable para utilizar de esta forma los
datos ms recientes

c_close = c_close(1:end-(datos_mes*registro));
c_close = fliplr(c_close);
Seleccin de los datos que sern usados
para el entrenamiento del algoritmo

[B,A]=butter(Nm,Wm);
Creacin del filtro de orden 4 que se le
pasara a la seal para eliminar el ruido

1.4 Inicializaciones necesarias en actualizacin de centroides

Par met r os utilizados para el algoritmo de actualizacin de
los centroides son los siguientes.

Ef = 0.001; Corresponde con
f



Ei = 0.99; Corresponde con
i

Lf = 0.0001; Corresponde con
f

Li = 10; Corresponde con
i

Km = 40000;
Lim = 1; Delimita la mejora mnima en % que debe
producirse con cada actualizacin de los
centroides para que se repita otra nueva
actualizacin
( )
}
( )
1
. .
h l
l
i i
e
= w v w
max max
( ) ( )
k k
k k
f f
i i
i i
k k

= =

1.5 Inicializaciones necesarias en actualizacin de predicciones

centr_aux=[]; Vector auxiliar que salvara los centroides
durante el proceso de poda (eliminacin de
aquellos centroides que no tienen prximos
menos del 10% de todos los vectores)

1.6 Inicializaciones necesarias para calcular el nmero de centroides

A este programa slo se acceder en el caso de que la variable
modifica este puesta a valor 1. En esta situacin estara habilitado
el aumento del nmero de centroides en funcin del error cometido
durante el entrenamiento en la prediccin de los valores futuros.
Este aumento no ser en ningn caso incontrolado e indefinido por



ello se han definido dos variables que sern usadas en caso de que
el programa acceda a esta subrutina.

centr_max=num_centr*16*2;
Determina el mximo aumento posible en el
nmero de centroides.
f=1; Dispositivo seuelo que en el caso de
encontrarse con valor 1 indicara que no
habido un error menor a 0.5 antes.
En la explicacin de la propia rutina se
aclarar el uso de este seuelo.

1.7 Inicializaciones necesarias en preparacin

Durante el transcurso de esta rutina no se ha utilizado
ninguna variable nueva por ello no es necesaria la inicializacin
especifica de sus variables.

1.8 Inicializaciones necesarias en guarda datos

Se inicializan en este apartado todas la variables que la
rutina guarda datos va a ir salvando. Esta inicializacin se hace
como matrices vacas debido a que ms que una inicializacin podra
definirse como declaracin de las variables.



Valores de las actualizaciones

centr_fin=[];
pred=[];
Se recogern en estas dos variables los
centroides dados por el algoritmo como
definitivos tanto su nmero como su valor y
tambin se recogern el valor de las
predicciones asociadas a cada uno de los
centroides.

Valores del entrenamiento

target_real_entr=[];
target_pred_entr=[];
error1_entr=[];
Se recogern en estas variables los valores
reales futuros para cada vector a analizar y
los valores dados por el algoritmo de
prediccin as como el error al cuadrado de
los errores cometidos con la prediccin.
Todos estos datos son los obtenidos en el
proceso de entrenamiento del algoritmo.



Valores de la prediccin

target_real_pred=[];
target_pred_pred=[];
error_pred=[];
Se recogern en estas variables los valores
reales futuros para cada vector a analizar y
los valores dados por el algoritmo de
prediccin as como el error al cuadrado de
los errores cometidos con la prediccin.
Todos estos datos son los obtenidos en el
proceso de prediccin del algoritmo.



2 PREPARACIN

c_close_entr=c_close(1+(pasada*datos_mes):end-(datos_mes*B2));
c_close_pr=c_close((datos_mes)*(pasada_pr+1)+1:end-(datos_mes*B1));

Avanza a lo largo del registro total de
datos seleccionando en cada pasada que datos
se utilizarn para entrenar el algoritmo
(c_close_entr), cuales para comprobar
prediciendo el error cometido (c_close_pr) y
cuales no se utilizarn.

c_close_entr = 100*(c_close_entr(N+1:end)-c_close_entr(1:end-))./
c_close_entr(1:end-N)

c_close_pr = 100*(c_close_pr(N+1:end)-c_close_pr(1:end-N))./
c_close_pr(1:end-N);



La serie temporal a analizar se genera a
partir de los datos disponibles, como el
valor incremental en % de dichos datos
separados una distancia N.

2.1 Generacin de la matriz de vectores a estudiar.

c_close_aux1 = [];
target1 = [];
tope = Datos-(ventana+N-1);
for a = 1:tope
col = c_close_entr(a:a+(ventana-1));
col = filtfilt(B,A,col);
c_close_aux1 = [c_close_aux1,col];
target1 = [target1, c_close_entr(a+(ventana+N-1))];
end

target1 = filtfilt(B,A,target1);
A partir de los datos designados para
realizar el entrenamiento se generarn los
vectores de tamao igual a ventana los
cuales sern la base del anlisis y de los
que se obtendrn los vectores de referencia.
Generacin de un vector adicional en el que
guardarn los valores reales futuros a N
hacia delante de cada uno de los vectores.
Paso del filtro en los dos sentidos a cada



columna nueva que entra a la matriz y el
vector final de valores de salida reales
para as eliminar la componente de ruido de
la seal.

2.2 Generacin de la matriz de centroides iniciales.

if veces >0
centr = centr_def;
veces = 0;
else
[xord,Ind] = sort(rand(50,1));
r = (0:floor(sep_centr):a);
r = r(1:num_centr);
centr = c_close_aux1(:,Ind(1)+r);
[xord,Ind] = sort(rand(size(centr,2),1));
centr = centr(:,Ind);
centr=centr(:,1:num_centr);
Cuando comienza el proceso se genera una
matriz de centroides iniciales aleatoria
mediante un proceso de sorteo entre los 100
primeros vectores de la matriz. Esta
eleccin aleatoria solo tiene lugar en la
primera pasada del algoritmo es decir en el
resto de veces el algoritmo comienza con los
centroides dados como ptimos en el proceso
anterior.



2.3 Desordenacin de las matrices.

[xord,Ind] = sort(rand((a),1));
c_aux = c_close_aux1(:,Ind);
target = target1(Ind);
Se desordena la matriz de vectores a
analizar para que as la informacin que el
algoritmo debe aprender le llegue de forma
desorganizada.

El programa regresa a esta rutina siempre desde el final del
proceso y si todava le faltan datos por analizar comienza de nuevo
si no es as calcula el error total cometido y se queda en espera de
nueva orden.

2.4 Calculo del MSE.

El MSE ser uno de los ndices para determinar la validez del
algoritmo y en funcin de l se valorarn las ventajas e
inconvenientes de la utilizacin de cada una de las diferentes
posibilidades o configuraciones de prueba del proceso.

w = sqrt(sum(target_real_pred).^2/size(target_real_pred,2));
e_pred = sqrt(sum(error_pred)/size(target_real_pred,2));
mse_pred_norm = e_pred/w

w1 = sqrt(sum(target_real_entr).^2/size(target_real_entr,2));
e_entr = sqrt(sum(error1_entr)/size(target_real_entr,2));



mse_entr_norm = e_entr/w1

comand4 = ['save mse mse_entr_norm mse_pred_norm'];
eval(comand4)
El mse normalizado se define como la raz
cuadrada del cuadrado del error normalizado
dividido por la raz cuadrada del cuadrado
del valor real normalizado
( )
( )
d
N
k
d
N
k
N
real valor
N
error
NMSE
d
d
=
=
=
1
2
1
2



3 ENTRENAMIENTO

while mejora > lim
e_ant = e_act;
for r = 1:a
sep = [];
r1 = 1;
for r1 = 1:num_centr
dist = [c_aux(:,r)-centr(:,r1)];
sep = [sep;norm(dist)];
end
[sep,Indic] = sort(sep);

Se realiza la ordenacin de todos los
centroides con respecto a todos los vectores
mediante el criterio de proximidad, esta
proximidad se refiere a la norma cuadrtica
existente entre los vectores, la cual se
calcula como la distancia ms comn en la
recta real R dada por d(x,y) = |x-y|. A esta
distancia se le llama distancia eucldea.



De esta manera se genera una nueva matriz (i
x j) en la que aparecen en cada columna (j)
todos los centroides ordenados de menor a
mayor distancia con respecto al vector (j).
As por ejemplo el elemento (1x5)
corresponde con el centroide ms prximo al
vector 5.

actualiza_centroides
actualiza_prediccion
error_act
end
error = e_act_def

Una vez generada la matriz se llama a las
funciones que actualizaran tanto los
centroides actuales como los valores de la
prediccin asociados a dichos centroides.
Posteriormente a travs de la funcin
error_act se calcular el nuevo error
cometido en la prediccin de los valores
futuros de los datos usados para el
entrenamiento.



if modifica == 1
calculo_centr
end
predice
salva

En el caso de que estuviera habilitada la
opcin de aumentar el nmero de centroides
se realizara la llamada a la funcin
calculo_centr encargada de ello; en el caso
contrario con los centroides actualmente
considerados como ptimos se pasara
directamente a predecir el valor futuro de
los datos reservados para esto.
A continuacin se salvaran los datos y el
programa volvera a preparacin a buscar
nuevos datos para seguir mejorando los
resultados.



4 ACTUALIZACIN DE CENTROIDES

Vector = r+V*Datos;
E = Ei*(Ef/Ei)^(vector/km);
L = Li*(Lf/Li)^(vector/km);
Calculo de los parmetros que actualizan
cada centroide; estos parmetros son funcin
del nmero de actualizaciones que hayan
sufrido los centroides antes, o lo que es lo
mismo del nmero del vector; es decir el
primer vector modificar ms a los
centroides que el vector nmero 5 y este a
su vez lo har ms que el vector nmero 300.
for q = 1:num_centr
d = Indic(q);
Incr_centr = E*exp(-(q-1)/L)*(c_aux(:,r)-centr(:,d));
centr(:,d) = centr(:,d) + Incr_centr;
end



Este bucle for esta incluido dentro de un
bucle for anterior; en el primero de va
pasando por todos y cada uno de los vectores
mientras que en este segundo se va pasando
por todos los centroides.
d corresponde con la posicin que ocupa el
centroide (q) en la columna (j) de la matriz
de ordenacin, de tal forma que el centroide
no se vera igualmente modificado por todos
los vectores sino que le afectaran ms
cuanto ms prximo se encuentre a ellos.
La expresin que define la actualizacin de
los centroides, o lo que es lo mismo el
incremento del valor de los centroides es:
( )
}
( )
1
. .
h l
l
i i
e
= w v w ) ( ) ( ant w w act w
i i i
+ =
max max
( ) ( )
k k
k k
f f
i i
i i
k k

= =

Donde
centr Incr con e correspond w
E con e correspond
L con e correspond
i
_



5 ACTUALIZACIN DE PREDICCIONES

for r = 1:a
sep = [];
dist = [c_close_aux1(:,r)-centr(:,r1)];
end
contador(Indic(1)) = contador(Indic(1))+1;
sum_ac(Indic(1)) = sum_ac(Indic(1))+target1(r);
end
yi_aux = sum_ac./contador;
centr_aux = centr;



Teniendo en cuenta que antes de acceder a
esta rutina los centroides han sido
modificados se deber volver a calcular la
distancia de cada vector a cada centroide y
se debern volver a ordenar de menor a mayor
distancia, sin embargo en esta ocasin ya no
tiene importancia la matriz que nos
proporcionaba esta ordenacin sino que ahora
solo es necesaria conocer cual es el
centroide ms prximo a cada vector.
La actualizacin del valor de la prediccin
asociado a cada nuevo centroide en funcin
del valor real de cada uno de los vectores
asociados a la regin de Vorinoi definida
por dicho centroide se realiza por medio de
una prediccin con promediado de los datos
pasados mediante un modelo lineal.
( ) ( )
1
T
0
( ) .
N
i k k k k
i
y k n a y k i
=
+ = = =
a y F y

A cada centroide se le asigna como valor de
prediccin la media del valor de todos los
valores futuros reales (target)
correspondientes a los vectores que tienen a
dicho centroide como el ms prximo.



for elimina = 1:(num_centr-1)
if contador(elimina) < 0.1*(a/num_centr)
yi_aux = yi_aux(:,[1:(elimina-1) (elimina+1):end]);
centr_aux = centr_aux(:,[1:(elimina-1) (elimina+1):end])
end
end
if contador(num_centr)>0.1*(a/num_centr)
yi_aux = yi_aux;
centr_aux = centr_aux;
else
yi_aux = yi_aux(1:end-1);
centr_aux = centr_aux(:,1:end-1);
end
yi = yi_aux;
centr = centr_aux;
num_centr_act = size(centr,2)
Puede darse la situacin de que alguna de
las regiones de Voronoi definida por algn
centroide no tenga asociado ningn centroide
o que tenga asociados menos del 10% del
total de los centroides. Esta es una regin
de Voronoi poco significativa y que aporta
poca informacin al proceso de aprendizaje
por este motivo ser una regin a eliminar.



6 CALCULO DEL ERROR ACTUAL

for r = 1:a
sep = [];
dist = [c_close_aux1(:,r)-centr(:,r1)];
end
d = Indic(1);
y_pr(r) = yi(d);
e(r) = (y_pr(r)-target1(r))^2;
end
Debido a que puede haber habido centroides
que hayan desaparecido por tener asociados a
ellos menos del 10% de los vectores
existentes, se deben volver a asociar los
vectores en las regiones de Voronoi para as



evitar que pudiera haber algn vector
asociado a alguna regin ya inexistente.
Una vez conocidas las regiones a las que
esta asociado cada vector se calcula el
error que se cometera asignndole como
valor de prediccin el definido para su
regin de Voronoi. Este error es el cuadrado
de la diferencia entre el valor real y el de
prediccin

e_act = sqrt(sum(e)/a)
mejora = 100*(e_ant-e_act)/e_ant
if mejora > lim
centr_def = centr;
e_act_def = e_act;
error_entr = e;
end
La mejora que se ha producido con las nuevas
actualizaciones se obtiene a travs del
error normalizado (
Nd
k e
) (
)
Si esta es un mejora apreciable, es decir si
todava se producen mejoras del 1% sobre el
error cometido, se vuelven a entrenar los
datos para permitir nuevas actualizaciones
tanto de los centroides como de las
predicciones asociadas a cada centroide.



7 CALCULO DEL NMERO DE CENTROIDES

if num_centr < centr_max
if f ==1
if e > 0.55
num_centr_ant = num_centr;
num_centr = num_centr*2
sep_centr_ant = sep_centr;
sep_centr = sep_centr/2
else
f=0;
num_centr_ant=num_centr;
num_centr=num_centr/2
sep_centr_ant=sep_centr;
sep_centr=sep_centr*2
end

Si el seuelo f esta todava con valor 1
quiere decir que an no se ha obtenido nunca



un error de prediccin durante el
entrenamiento menor de 0.55.
Ahora el programa se puede encontrar con dos posibles
situaciones:
El error actual es > 0.55 en cuyo caso se seguir
multiplicando por dos el nmero de centroides.
El error actual es < 0.55 en cuyo caso se pondr el seuelo a
0 y se dividir el nmero de centroides por dos.

if e > 0.55
sep_centr1 = sep_centr-floor(abs(sep_centr-
sep_centr_ant)/2)
sep_centr = sep_centr1
num_centr = floor(1+((a-99)/floor(sep_centr)))
if num_centr_ant-num_centr = = 0
num_centr = num_centr
w = ' se_acabo'
else
preparacion
end
Si ya ha habido alguna vez un error menor de
0.55 la siguiente vez el algoritmo tiene el
seuelo a 0 y comienza con la aplicacin de



Bolzano para el clculo del nuevo nmero de
centroides.

else
sep_centr1 = sep_centr+floor(abs(sep_centr-
sep_centr_ant)/2);
sep_centr = sep_centr1
num_centr = floor(1+((a-99)/floor(sep_centr)))
if num_centr_ant-num_centr == 0
num_centr = num_centr
w =' se_acabo'
else
preparacion
end
end



8 PREDICCIN

centr=centr_def;
c_close_p=[];
v_real=[];

for v=1:size(c_close_pr,1)-(ventana+N)
p= c_close_pr(v:v+(ventana-1));
p=filtfilt(B,A,p);
c_close_p=[c_close_p,p];
v_real=[v_real, c_close_pr(v+(ventana+N-1))];
end
Generacin de la matriz de vectores a
analizar mediante el mismo sistema que se
utilizo para la generacin de la matriz de
vectores a analizar en el proceso de
entrenamiento del algoritmo.
Los datos se van filtrando segn iran
llegando por que aunque sean datos guardados
en un histrico se pretende simular una
prediccin real.
Indices=[];



for v=1:size(c_close_p,2)
separacion=[];
v1=1;
for vs=1:num_centr
dist=[c_close_p(:,v)-centr(:,vs)];
separacion=[separacion;norm(dist)];
end
[separacion,I]=sort(separacion);
Indices=[Indices,I];
Se ordenan los vectores en busca de la
regin de Voronoi a la que estarn
asociados, ser aquella regin definida por
el centroide ms cercano al vector

d=I(1);
y_pred(v)=yi(d);
error_comet(v)=(y_pred(v)-v_real(v))^2;
v(v)=v_real(v)^2;
end
A cada regin le haba sido asignado un
valor de prediccin esttico, este ser el
valor de prediccin asignado a cada vector
asociado.
Con este valor y el valor de prediccin real
se calcula el error cometido.



9 GUARDA DE LOS RESULTADOS

9.1 Valores de las actualizaciones

centr_fin = [centr_def];
pred = [pred,yi];
Se guardan los centroides finales que ha
calculado el algoritmo, tanto el nmero como
la magnitud de los mismos. Se guardan
tambin los valores de prediccin asociados
a cada uno de los centroides.

9.2 Valores del entrenamiento

target_real_entr = [target_real_entr,target1];
target_pred_entr = [ target_pred_entr,y_pr];
error1_entr = [error1_entr, error_entr];
Se guardan: los valores futuros reales de
los datos utilizados durante el
entrenamiento del algoritmo, los valores
futuros predichos por el algoritmo para los



datos utilizados en el entrenamiento y por
ltimo se guardan tambin los errores
cometidos durante el entrenamiento.
9.3 Valores de la prediccin

target_real_pred = [target_real_pred,v_real];
target_pred_pred = [target_pred_pred,y_pred];
error_pred = [error_pred,error_comet];
Se guardan: los valores futuros reales de
los datos utilizados durante la prediccin
del algoritmo, los valores futuros predichos
por el algoritmo para los datos utilizados
en la prediccin y por ltimo se guardan
tambin los errores cometidos durante la
prediccin.

t = num2str(pasada)
comand1 = ['save resul_actu_' t ' centr_fin pred'];
comand2 = ['save resul_pred_' t ' target_real_pred target_pred_pred
error_pred'];
command3 = ['save resul_entr_' t ' target_real_entr target_pred_entr
error_pred'];

eval(comand1)
eval(comand2)
eval(comand3)

Anexos.III Calculo de resultados


III CALCULO DE RESULTADOS
1 CARGA DE LOS RESULTADOS
1.1 Bsqueda de la mayor variante

load ('mse_303.mat')

load ('pred_303.mat')



load ('actu_303.mat')

1.2 Avance en otras direcciones






1.3 Comprobacin de los resultados

load ('mse_cp.mat')
load ('mse_v125.mat')
load ('mse_v50.mat')
load ('mse_wm05.mat')
load ('mse_wm01.mat')
load ('mse_2year.mat')
load ('mse_3year.mat')

load ('pred_cp.mat')
load ('pred_v125.mat')
load ('pred_v50.mat')
load ('pred_wm05.mat')
load ('pred_wm01.mat')
load ('pred_2year.mat')
load ('pred_3year.mat')

load ('actu_cp.mat')
load ('actu_v125.mat')
load ('actu_v50.mat')
load ('actu_wm05.mat')
load ('actu_wm01.mat')
load ('actu_2year.mat')
load ('actu_3year.mat')



1.4 Calculo de MSE

B_pred = [mse_pred_201,mse_pred_202,mse_pred_203;
mse_pred_301,mse_pred_302,mse_pred_303;
mse_pred_401,mse_pred_402,mse_pred_403]
B_pred = [mse_pred_204,mse_pred_304,mse_pred_404]
B_pred = [mse_pred_303,mse_pred_cp;
mse_pred_v125,mse_pred_v50;
mse_pred_wm05,mse_pred_wm01;
mse_pred_2year,mse_pred_3year]

B_entr= [mse_entr_201,mse_entr_202,mse_entr_203;
mse_entr_301,mse_entr_302,mse_entr_303;
mse_entr_401,mse_entr_402,mse_entr_403]
B_entr = [mse_entr_204,mse_entr_304,mse_entr_404]
B_entr = [mse_entr_303,mse_entr_cp;
mse_entr_v125,mse_entr_v50;
mse_entr_wm05,mse_entr_wm01;
mse_entr_2year,mse_entr_3year]

1.5 Transformacin de los datos a coordenadas cartesianas

x_303=targetp_303;
x_201=targetp_201;
x_202=targetp_202;
x_203=targetp_203;



x_301=targetp_301;
x_302=targetp_302;
x_401=targetp_401;
x_402=targetp_402;
x_403=targetp_403;

x_204=targetp_204;
x_304=targetp_304;
x_404=targetp_404;

x_cp=targetp_cp;
x_125=targetp_v125;
x_50=targetp_v50;
x_05=targetp_wm05;
x_01=targetp_wm01;
x_2=targetp_2year;
x_3=targetp_3year;

y_303=targetr_303;
y_201=targetr_201;
y_202=targetr_202;
y_203=targetr_203;
y_301=targetr_301;
y_302=targetr_302;
y_401=targetr_401;
y_402=targetr_402;
y_403=targetr_403;



y_204=targetr_204;
y_304=targetr_304;
y_404=targetr_404;

y_cp=targetr_cp;
y_125=targetr_v125;
y_50=targetr_v50;
y_05=targetr_wm05;
y_01=targetr_wm01;
y_2=targetr_2year;
y_3=targetr_3year;

1.6 Generacin de las rectas de regresin

A_303= [x_303; ones(size(x_303))]';
A_201= [x_201; ones(size(x_201))]';
A_202= [x_202; ones(size(x_202))]';
A_203= [x_203; ones(size(x_203))]';
A_301= [x_301; ones(size(x_301))]';
A_302= [x_302; ones(size(x_302))]';
A_401= [x_401; ones(size(x_401))]';
A_402= [x_402; ones(size(x_402))]';
A_403= [x_403; ones(size(x_403))]';

A_204= [x_204; ones(size(x_204))]';
A_304= [x_304; ones(size(x_304))]';
A_404= [x_404; ones(size(x_404))]';



A_cp= [x_cp; ones(size(x_cp))]';
A_125= [x_125; ones(size(x_125))]';
A_50= [x_50; ones(size(x_50))]';
A_05= [x_05; ones(size(x_05))]';
A_01= [x_01; ones(size(x_01))]';
A_2= [x_2; ones(size(x_2))]';
A_3= [x_3; ones(size(x_3))]';

p_303=A_303\y_303';
Y_303=A_303*p_303;
p_201=A_201\y_201';
Y_201=A_201*p_201;
p_202=A_202\y_202';
Y_202=A_202*p_202;
p_203=A_203\y_203';
Y_203=A_203*p_203;
p_301=A_301\y_301';
Y_301=A_301*p_301;
p_302=A_302\y_302';
Y_302=A_302*p_302;
p_401=A_401\y_401';
Y_401=A_401*p_401;
p_402=A_402\y_402';
Y_402=A_402*p_402;
p_403=A_403\y_403';
Y_403=A_403*p_403;



p_204=A_204\y_204';
Y_204=A_204*p_204;
p_304=A_304\y_304';
Y_304=A_304*p_304;
p_404=A_404\y_404';
Y_404=A_404*p_404;

p_cp=A_cp\y_cp';
Y_cp=A_cp*p_cp;
p_125=A_125\y_125';
Y_125=A_125*p_125;
p_50=A_50\y_50';
Y_50=A_50*p_50;
p_05=A_05\y_05';
Y_05=A_05*p_05;
p_01=A_01\y_01';
Y_01=A_01*p_01;
p_2=A_2\y_2';
Y_2=A_2*p_2;
p_3=A_3\y_3';
Y_3=A_3*p_3;

1.7 Coeficientes de Correlacin

c_303=xcorr(x_303,y_303);
c_201=xcorr(x_201,y_201);
c_202=xcorr(x_202,y_202);



c_203=xcorr(x_203,y_203);
c_301=xcorr(x_301,y_301);
c_302=xcorr(x_302,y_302);
c_401=xcorr(x_401,y_401);
c_402=xcorr(x_402,y_402);
c_403=xcorr(x_403,y_403);

c_204=xcorr(x_204,y_204);
c_304=xcorr(x_304,y_304);
c_404=xcorr(x_404,y_404);

c_cp=xcorr(x_cp,y_cp);
c_125=xcorr(x_125,y_125);
c_50=xcorr(x_50,y_50);
c_05=xcorr(x_05,y_05);
c_01=xcorr(x_01,y_01);
c_2=xcorr(x_2,y_2);
c_3=xcorr(x_3,y_3);

C_303=corrcoef(x_303,y_303)





C_cp=corrcoef(x_cp,y_cp)

1.8 Tasas de acierto y fallo

umbral=1;
umbral=0;
umbral=1.5;
umbral=2;

T_303=zeros(2,2);
T_303(1,1)=sum((x_303>=umbral).*(y_303>=0))/sum((x_303>=umbral))*100
T_303(2,2)=sum((x_303<umbral).*(y_303<0))/sum((x_303<umbral))*100
T_303(1,2)=sum((x_303>=umbral).*(y_303<0))/sum((x_303>=umbral))*100
T_303(2,1)=sum((x_303<umbral).*(y_303>=0))/sum((x_303<umbral))*100
T_303



T_201=zeros(2,2);
T_201

T_202=zeros(2,2);
T_202

T_203=zeros(2,2);
T_203

T_301=zeros(2,2);
T_301



T_302=zeros(2,2);
T_302

T_401=zeros(2,2);
T_401

T_402=zeros(2,2);
T_402

T_403=zeros(2,2);
T_403



T_204=zeros(2,2);
T_204

T_304=zeros(2,2);
T_304

T_404=zeros(2,2);
T_404

T_cp=zeros(2,2);
T_cp(1,1)=sum((x_cp>=umbral).*(y_cp>=0))/sum((x_cp>=umbral))*100;
T_cp(2,2)=sum((x_cp<umbral).*(y_cp<0))/sum((x_cp<umbral))*100;
T_cp(1,2)=sum((x_cp>=umbral).*(y_cp<0))/sum((x_cp>=umbral))*100;
T_cp(2,1)=sum((x_cp<umbral).*(y_cp>=0))/sum((x_cp<umbral))*100;
T_cp



T_125=zeros(2,2);
T_125

T_50=zeros(2,2);
T_50(1,1)=sum((x_50>=umbral).*(y_50>=0))/sum((x_50>=umbral))*100;
T_50(2,2)=sum((x_50<umbral).*(y_50<0))/sum((x_50<umbral))*100;
T_50(1,2)=sum((x_50>=umbral).*(y_50<0))/sum((x_50>=umbral))*100;
T_50(2,1)=sum((x_50<umbral).*(y_50>=0))/sum((x_50<umbral))*100;
T_50

T_05=zeros(2,2);
T_05

T_01=zeros(2,2);
T_01



T_2=zeros(2,2);
T_2

T_3=zeros(2,2);
T_3

1.9 Acumulacin de Beneficios

z303=cumsum((x_303>umbral).*y_303);
op303=cumsum(x_303>umbral);
b303=z303(end)
stairs(z303)
title('beneficio 30-3')
figure

b201=z201(end)
stairs(z201)



figure

b202=z202(end)
stairs(z202)
figure

b203=z203(end)
stairs(z203)
figure

b301=z301(end)
stairs(z301)
figure

b302=z302(end)
stairs(z302)



figure

b401=z401(end)
stairs(z401)
figure

b402=z402(end)
stairs(z402)
figure

b403=z403(end)
stairs(z403)
figure

b204=z204(end)
stairs(z204)



figure

b304=z304(end)
stairs(z304)
figure

b404=z404(end)
stairs(z404)
figure

zcp=cumsum((x_cp>umbral).*y_cp);
opcp=cumsum(x_cp>umbral);
bcp=zcp(end)
stairs(zcp)
title('beneficio cp')
figure

b125=z125(end)



stairs(z125)
title('beneficio ventana 125')
figure

b50=z50(end)
stairs(z50)
title('beneficio ventana 50')
figure

b05=z05(end)
stairs(z05)
title('beneficio Wm 0.5')
figure

b01=z01(end)
stairs(z01)
title('beneficio Wm 0.1')
figure

b2=z2(end)



stairs(z2)
title('beneficio ao 2')
figure

b3=z3(end)
stairs(z3)
title('beneficio ao 3')

1.10 Dibuja grficas

plot(x_303,y_303, 'x')
hold
plot(x_303,Y_303, 'r')
title('nube 30-3 con recta de regresion')
figure

plot(x_201,y_201, 'x')
hold
plot(x_201,Y_201, 'r')
figure

plot(x_202,y_202, 'x')
hold
plot(x_202,Y_202, 'r')



figure

plot(x_203,y_203, 'x')
hold
plot(x_203,Y_203, 'r')
figure

plot(x_301,y_301, 'x')
hold
plot(x_301,Y_301, 'r')
figure

plot(x_302,y_302, 'x')
hold
plot(x_302,Y_302, 'r')
figure

plot(x_401,y_401, 'x')
hold
plot(x_401,Y_401, 'r')
figure



plot(x_402,y_402, 'x')
hold
plot(x_402,Y_402, 'r')
figure

plot(x_403,y_403, 'x')
hold
plot(x_403,Y_403, 'r')
figure

plot(x_204,y_204, 'x')
hold
plot(x_204,Y_204, 'r')
figure

plot(x_304,y_304, 'x')
hold
plot(x_304,Y_304, 'r')
figure

plot(x_404,y_404, 'x')
hold
plot(x_404,Y_404, 'r')



figure

plot(x_cp,y_cp, 'x')
hold
plot(x_cp,Y_cp, 'r')
title('nube cp con recta de regresion')
figure

plot(x_125,y_125, 'x')
hold
plot(x_125,Y_125, 'r')
title('nube v = 125 con recta de regresion')
figure

plot(x_50,y_50, 'x')
hold
plot(x_50,Y_50, 'r')
title('nube v = 50 con recta de regresion')
figure

plot(x_05,y_05, 'x')
hold
plot(x_05,Y_05, 'r')
title('nube Wm = 0.5 con recta de regresion')
figure



plot(x_01,y_01, 'x')
hold
plot(x_01,Y_01, 'r')
title('nube Wm = 0.1 con recta de regresion')
figure

plot(x_2,y_2, 'x')
hold
plot(x_2,Y_2, 'r')
title('nube ao 2 con recta de regresion')
figure

plot(x_3,y_3, 'x')
hold
plot(x_3,Y_3, 'r')
title('nube ao 3 con recta de regresion')

Aplicación de Tecnicas de

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Aplicación de Tecnicas de

Transféré par

Droits d'auteur :

Formats disponibles

PROYECTO FIN DE CARRERA

la denominada funcin de vecindad y

tiende a infinito en la funcin de vecindad. Esta

la denominada funcin de vecindad y

. Tanto el factor de escala

) en el que la funcin tiene el mismo

en cada muestra. Hay que evaluar si este ltimo

entre 0 y 1. Al final de cada paso l en el

entre 0 y 1. En este caso

durante el proceso de aprendizaje.

Vous aimerez peut-être aussi