Vous êtes sur la page 1sur 128

UNIVERSIDAD PONTIFICIA COMILLAS

ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA (ICAI)


INGENIERO EN INFORMÁTICA

PROYECTO FIN DE CARRERA

MÉTODOS DE PREDICCIÓN PARA LOS


MERCADOS DE DIVISAS

DIRECTOR Prof. Dr. Carlos Maté Jiménez

AUTOR Gabriel Gómez Rojo

MADRID, Junio de 2007


Autorizada la entrega del proyecto del alumno:

GABRIEL GÓMEZ ROJO

El Director del Proyecto

PROF. DR. CARLOS MATÉ JIMÉNEZ

Fdo.: ……………. Fecha: 27/06/2007

Vº Bº del Coordinador de Proyectos

PROF. DR. MIGUEL ÁNGEL SANZ BOBI

Fdo.: ……………. Fecha: 27/06/2007

1
UNIVERSIDAD PONTIFICIA COMILLAS

ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA (ICAI)


INGENIERO EN INFORMÁTICA

PROYECTO FIN DE CARRERA

MÉTODOS DE PREDICCIÓN PARA LOS


MERCADOS DE DIVISAS

DIRECTOR Prof. Dr. Carlos Maté Jiménez

AUTOR Gabriel Gómez Rojo

MADRID, Junio de 2007

2
MÉTODOS DE PREDICCIÓN PARA LOS MERCADOS DE DIVISAS
Autor: Gómez Rojo, Gabriel
Director: Maté Jiménez, Carlos
Entidad colaboradora: ICAI – Universidad Pontifica de Comillas

RESUMEN DEL PROYECTO


Los mercados de divisas ejercen una gran influencia en la economía
internacional actualmente. De forma adicional, son el mayor mercado financiero del
mundo y un gran vehículo de especulación. Predecir su comportamiento futuro aporta
importantes ventajas competitivas a los actores del mercado pero es una tarea compleja
en la que se están vertiendo continuamente grandes esfuerzos de investigación sin
obtener resultados definitivos. En este proyecto se ha buscado un enfoque original al
problema de su predicción y se han desarrollado tres modelos diferentes, el último de
ellos con resultados muy positivos.

Los tipos de cambio y los mercados de divisas son influidos por un amplio rango
de factores macroeconómicos, a la vez que repercuten en ellos: las variaciones del
comercio internacional, los cambios en los tipos de interés y la inflación son los
principales. Según la hipótesis del mercado eficiente, la mayor parte de la información
sobre este entorno macroeconómico está ya contenida en la serie temporal de los tipos
de cambio, lo que dificulta la predicción hasta el punto que numerosos estudios han
reconocido la aleatoriedad de los tipos de cambio, apuntando al paseo aleatorio como
modelo muy difícil de batir en la predicción del mercado de divisas.

Sin embargo, el uso de algunos modelos de predicción resulta particularmente


prometedor. Las redes neuronales han tenido gran auge en los últimos años y se han
obtenido resultados positivos en la predicción de tipos de cambio. Esto es debido a las
especiales características de esta técnica, ya que las redes neuronales son capaces de
generalizar, responden bien a series con ruido, capturan no-linealidades y son
autoadaptativas. Así pues, los tres modelos de este proyecto han hecho uso de un tipo de
red neuronal, el perceptrón multicapa, caracterizado por su versatilidad y practicidad.

3
El primer modelo de predicción desarrollado lleva a cabo una estrategia de tipo
“divide y vencerás” para afrontar el problema. La serie a predecir es descompuesta en
diferentes subtendencias, cada una de ellas representando los diferentes horizontes
temporales de los inversores del mercado. Se entrena una red neuronal para cada una de
las subtendencias para que ésta se especialice en su serie particular y aprenda los
patrones propios de la subtendencia que se le ha asignado. La misión de cada una de
estas redes neuronales es realizar la predicción de su subtendencia para que luego se
realice el sumatorio de todas las predicciones obteniendo una predicción final del tipo
de cambio. El resultado obtenido para este modelo ha sido mixto: las subtendencias son
predichas con precisión pero al realizar la combinación final el error de precisión se ve
fuertemente amplificado, obteniéndose un error final elevado. Esto es debido a que
existe una fuerte correlación entre los errores de las predicciones de las subtendencias,
lo que hace que la combinación amplifique el error final. Estudiar las causas de esta
correlación se propone como desarrollo futuro.

El segundo modelo de predicción consiste en buscar autocorrelaciones en la


serie de máximos, mínimos y cierres de tipos de cambio y utilizar los períodos más
autocorrelacionados como entradas para un perceptrón multicapa. Estas
autocorrelaciones son buscadas también en los cuadrados de la serie, buscando así
períodos con fuerte autocorrelación de la volatilidad. Adicionalmente se buscan mejoras
en la predicción usando diferentes funciones de entrenamiento para las redes
neuronales. Cada una de las arquitecturas que obtiene buenos resultados es al final
combinada con las otras mediante una regresión múltiple. Este modelo obtiene una
precisión mejor que la obtenida por el modelo benchmark.

El último modelo intenta capturar dos aspectos de los tipos de cambio,


volatilidad y direccionalidad, respectivamente mediante dos aproximaciones diferentes:
modelos ARCH y redes neuronales. Hay enorme literatura acerca de la bondad de los
modelos ARCH para predecir la volatilidad, y en particular el modelo GARCH(1,1) ha
sido loado como imbatible en los tipos de cambio. Así pues, se realiza una predicción
de los intervalos de máximo y mínimo diario de la serie de tipos de cambio usando
GARCH(1,1) para predecir la amplitud del intervalo y un perceptrón multicapa para
predecir el valor del centro del intervalo. De esta manera se obtienen predicciones de
máximos y mínimos diarios con alta precisión; los resultados no sólo superan la

4
precisión del modelo de referencia sino que también superan la precisión de variados
modelos exitosos publicados.

Utilizando este último modelo de predicción, se ha desarrollado una aplicación


para el software matemático MATLAB que permite visualizar 5 tipos de cambio
diferentes y calcular sus predicciones obtenidas mediante el modelo explicado. Esta
aplicación descarga en tiempo real los datos de los tipos de cambio por Internet de la
plataforma FXTrade de OANDA, a través de la API de Java cedida gratuitamente por
Olsen and Associates para los fines de investigación de este proyecto.

Por último, de la investigación realizada en este proyecto, se puede concluir que


la serie de cierres muestra una gran aleatoriedad, que en los modelos de predicción debe
primar la parsimonia (en particular, las arquitecturas de redes neuronales deben ser tan
sencillas como sea posible) y que, aún siendo la predicción de tipos de cambio un
problema complicado, pueden obtenerse buenos resultados combinando múltiples
modelos que capturen diferentes aspectos del comportamiento del mercado. Una única
aproximación nunca debería bastar.

5
FORECASTING METHODS FOR THE FOREIGN EXCHANGE
MARKETS

ABSTRACT
In the current global economy, foreign exchange markets play a prominent and
relevant role. Additionally they are the largest financial markets of the world and a big
destination for speculators. Foreign exchange rate forecasting provides important
competitive advantages for all the market players, currently being a challenging task for
both academic researchers and business practitioners. In this paper three different
original forecasting models are developed, the last of them achieving an interesting
predictive accuracy.

Exchange rates and foreign exchange markets are influenced by a wide range of
macroeconomic factors and vice versa: international trade variations, interest rate
changes and inflation rates are the main ones. Following the efficient market
hypothesis, most of the information of this macroeconomic environment is already
contained in the exchange rate time series, making difficult its prediction. Many
researchers have found exchange rates as random, pointing to the random walk as an
unbeatable forecasting model.

However, some forecasting models are particularly promising. Artificial neural


networks have gained considerable attention in the last years and positive accuracy
results have been obtained using them in prediction models of exchange rates. This is
due to the special characteristics of this technique: neural networks are good
generalizing, perform well in noisy environments, capture non-linearities and are self-
adaptive. Thus, the three models introduced in this paper have made use of a class of
neural network, the multi-layer perceptron, characterized by its versatility and practical
features.

The first forecasting model developed in this project applies a “divide and
conquer” strategy to face the problem. The time series to be predicted is decompounded
in several sub-trends, each of them representing different time horizons of the market
players. A neural network is trained for each of the sub-trends, so each network
specializes in its own series and learns the individual patterns of its assigned sub-trend.

6
The mission of each one of this neural networks is to predict its sub-trend as better as
possible; later the summatory of the individual predictions will be calculated, providing
a final forecast of the exchange rate series. Mixed results have been obtained with this
model: the sub-trends are predicted accurately but, when the predictions are combined,
the accuracy errors are severely amplified, resulting in a high final predictive error.
Further research in the causes of this correlation is suggested as future development.

The second forecasting model uses as inputs for several multi-layer perceptrons
the most autocorrelated delayed periods of the time series and the time series squared,
so effects of volatility are observed. Additionally several different training functions are
used for each group of neural networks. Then the top performing neural networks are
combined with a multiple regression, obtaining satisfactory accuracy for daily
maximum, minimum and close values of the USD/JPY exchange rate.

The last model intends to capture two key aspects of exchange rates, volatility
and direction. This is made through two different approaches respectively: ARCH
models and neural networks. There is huge literature about the optimum results of
ARCH models predicting volatility and, specially, GARCH(1,1) has been acclaimed as
unbeatable for exchange rates. Therefore, it is made a prediction of the daily maximum
and minimum interval of the time series using GARCH(1,1) to predict the interval
width and a multi-layer perceptron to predict the value of the interval center. This way,
a highly accurate forecast of daily maximums and minimums is obtained: the results are
not only better than the benchmark model but also improves the accuracy of other
successful models published.

Using this last forecasting model, a graphic user interface for the mathematical
software MATLAB is developed, allowing to show 5 different exchange rates and
calculate their predictions, obtained through the explained model. This application
downloads in real time through the Internet the currency quotes from the FXTrade
platform of OANDA, using the JAVA API provided free of cost by Olsen and
Associates for the research purposes of this project.

Finally, from the research made in this paper, it can be concluded that the close
series shows a high random component, that an approach to forecasting models should

7
rely on parsimony (particularly, the neural networks architectures should be as simple
as possible) and that, although the exchange rate forecasting is a complex problem,
good results can be obtained combining multiple models that capture different aspects
of the market behaviour. One individual approach alone should always be avoided.

8
Agradecimientos
A mi director, por el continuo apoyo
para sacar adelante este proyecto.

Y a mi familia y amigos, por estar siempre junto


a mí en los otros proyectos de mi vida.

9
Índice

I. OBJETIVOS
1. Introducción y motivación del proyecto................................... 14
2. Objetivos................................................................................. 15

II. DESARROLLO TEÓRICO E IMPLANTACIÓN


1. Introducción a los tipos de cambio.......................................... 17
1.1 Los tipos de cambio........................................................... 17

1.2 Tipos de cambio fijos, flexibles y dirigidos.............................. 20


1.3 Efectos de las variaciones del comercio sobre el tipo de
cambio................................................................................. 21
1.4 Los tipos de cambio y la paridad del poder adquisitivo. La
influencia de la inflación........................................................... 23
1.5 Tipos de cambio y tipos de interés. Bonos nacionales frente a
bonos extranjeros. ................................................................. 25

2. Los mercados de divisas......................................................... 28


2.1 Características y funcionamiento......................................... 28

2.2 Tipos de operaciones......................................................... 29


2.3 Magnitud del mercado y datos cuantitativos............................... 33
3. Redes neuronales artificiales en la predicción de tipos de
cambio................................... ..................................................... 35
3.1 Introducción................................... ................................. 35

3.2 Elección de información de entrada...................................... 36

3.3 Preparación de los datos.................................................... 37


3.4 Topologías de redes neuronales................................................. 38
3.5 Comparación del rendimiento con otros métodos de predicción. 41
4. Modelo de predicción mediante descomposición en
subtendencias............................................................................. 44

10
4.1 Introducción................................................................................. 44
4.2 Método de descomposición......................................................... 45
4.3 Aplicación de redes neuronales.................................................. 51
4.4 Resultados y conclusiones.......................................................... 53
5. Combinación de modelos de predicción de valores extremos 56
5.1 Introducción: análisis estadístico de precios máximos, mínimos
y de cierre.......................................................................................... 56
5.2 Predicciones basadas en retrasos consecutivos......................... 61
5.3 Predicciones basadas en retrasos con altos coeficientes de
autocorrelación.................................................................................. 64
5.4 Mejoras mediante la función de entrenamiento cuasi-
newtoniana BFGS............................................................................. 68
5.5 Combinación de predicciones – Conclusiones............................ 70
6. Modelo de predicción de centro y radio.................................. 73
6.1 Características de la distribución y volatilidad de las series
financieras......................................................................................... 73
6.2 Modelos de heteroscedasticidad condicional.............................. 75
6.3 Análisis de intervalo..................................................................... 78
6.4 Predicción del radio mediante la volatilidad................................ 79
6.5 Combinación de predicciones de radio mediante EWMA........... 81
6.6 Predicción del centro mediante perceptrón multicapa................. 83
6.7 Resultados y conclusiones de la predicción del intervalo........... 83
7. Interfaz de usuario para predicción......................................... 85
7.1 Entorno de programación............................................................ 85
7.2 Módulos de la aplicación............................................................. 85
7.3 Instalación y lanzamiento de la aplicación.................................. 86
7.4 Uso de la aplicación.................................................................... 87
7.5 Correcto funcionamiento y resolución de problemas.................. 92

III. Planificación y presupuesto


1. Planificación............................................................................ 96
2. Presupuesto del proyecto....................................................... 97
2.1 Costes de ingeniería.................................................................... 97

11
2.2 Inversiones y costes materiales.................................................. 98
2.3 Servicios y mantenimiento anual................................................. 98
2.4 Presupuesto final......................................................................... 99
3. Herramientas utilizadas en el desarrollo del proyecto............. 100

IV. Conclusiones y desarrollos futuros


1. Conclusiones.................................................................. 102
2. Desarrollos futuros......................................................... 104

V. Bibliografía........................................................................... 105

VI. Apéndices
A. Análisis estadístico de las series de tipos de cambio............. 111
A.1 Serie de máximos 112
A.2 Serie de mínimos 117
A.3 Serie de cierres 122
B. Muestra de predicciones y valores observados...................... 127

12
I. Objetivos

13
1. Introducción y motivación del pro-
yecto

Al realizar transacciones internacionales como pueden ser compra-venta


de bienes, servicios o activos financieros, es probable que nuestra moneda
local sea diferente de la divisa de nuestra contraparte en el extranjero. Ello
hace necesario cambiar una moneda por otra para poder llevar a cabo la
transacción. El mercado de divisas es el lugar en el que se intercambian
monedas de distintos países, estableciéndose cotizaciones para cada una de
ellas según la oferta y la demanda. Dada su repercusión en las transacciones
internacionales, los mercados de divisas tienen un papel muy relevante en la
economía mundial.

El comportamiento de dichos mercados tiene un cierto grado de


incertidumbre que añade riesgo adicional a las transacciones internacionales,
aumentando además su coste. Conseguir predicciones fiables supondría una
importante ventaja para comerciantes e inversores internacionales, bancos
centrales, instituciones financieras y en definitiva cualquier operador del
mercado.

El proyecto tiene la intención de cubrir los métodos utilizados


actualmente y en el pasado, entendiendo su comportamiento y fiabilidad en los
diversos mercados y llegando a conclusiones sobre la utilidad práctica de
dichos métodos. Una vez repasado el estado del arte de los sistemas de
predicción actuales, se diseñará y desarrollará un método básico de predicción
para los mercados de divisas basado en un enfoque original, estudiándose la
viabilidad de incluir técnicas de inteligencia artificial.

14
2. Objetivos

1. Revisar el estado del arte y realizar documentación de los siguientes


elementos: mercados de divisas, métodos de predicción y software para
predicción en los mercados de divisas. Especialmente, hay que valorar la
ubicación de MATLAB en este contexto.

2. Revisar el estado del arte y realizar documentación de los métodos de


predicción para datos de tipo intervalo.

3. Construir una herramienta para realizar predicciones en los mercados de


divisas que utilice como entrada el histórico de un mercado y proceda a
predecir el intervalo de variación de la divisa a analizar durante un determinado
período, evaluando la exactitud de esas predicciones.

4. Encontrar la manera más eficiente de diseñar la interfaz del sistema.

5. Encontrar la manera más eficiente de ofrecer el sistema a potenciales


clientes a partir de las pruebas que se realicen con la aplicación.

15
II. Desarrollo teórico e
implantación
16
1. Introducción a los tipos de cambio

Esta introducción pretende exponer de forma resumida los conceptos


básicos necesarios para comprender el significado, funcionamiento y
relevancia de los mercados de divisas, pues son la razón de ser de este
proyecto.

Se comentará la influencia de los mercados de divisas en el comercio


exterior, la inflación, los mercados financieros, los tipos de interés y viceversa.
También se explicarán las diversas formas en las que las divisas cotizan y
cómo se intercambian las monedas en el mercado.

Con ello, se intenta ofrecer una visión general del comportamiento de los
tipos de cambio flexibles para crear la base de conocimiento necesaria para la
comprensión de la motivación de este proyecto y de los diferentes métodos de
predicción que serán estudiados más adelante.

1.1 Los tipos de cambio

Cuando son realizadas transacciones de comercio interior dentro de una


misma nación o un área de unión monetaria, tanto el comprador como el
vendedor de la mercancía desean habitualmente realizar la transacción en una
misma moneda. Es por ello por lo que simplemente intercambian de forma
directa la moneda del comprador por la mercancía del vendedor. Esto es así
porque las dos partes usan mayoritariamente para sus relaciones económicas
en el día a día una misma y única moneda.

Sin embargo, la situación es distinta en el comercio exterior.


Normalmente, dos individuos de diferentes países con voluntad de llevar a
cabo un intercambio comercial se encontrarán con el problema de que sus
monedas son completamente distintas y habitualmente, tendrán diferente valor.
Un importador ruso de coches alemanes encontrará que, comúnmente, cuando
desee adquirir coches en Alemania el vendedor querrá ser pagado en euros

17
mientras que él posee rublos rusos. Para poder realizar la transacción, el
importador ruso deberá cambiar sus rublos por euros. Para ello deberá
comprar euros con su moneda y utilizarlos posteriormente para realizar la
transacción comercial. Así pues, se podría definir el tipo de cambio como el
precio de una moneda expresado en otra, es decir, la cotización de una
divisa expresado en términos de otra moneda.

Normalmente se suele expresar en los mercados poniendo la


denominación de la divisa de la que se quiere dar el precio partida por la
denominación de la divisa que se usa como base y acompañado de la
cotización propiamente dicha. Las denominaciones de las divisas usadas se
basan en una denominación de 3 siglas estipulada por el estándar ISO 4217
para cada moneda. Para el caso del euro, la denominación ISO es EUR. Así
pues si se quiere expresar el tipo de cambio del euro respecto al dólar
americano (USD en la nomenclatura ISO), se usaría 1,2573 EUR/USD, lo que
significa que hacen falta 1,2573$ para adquirir 1€.

A continuación se muestra un cuadro de los tipos de cambio del jueves,


19 de octubre de 2006:
Thu Oct 19 06:00:15 2006
Currency Bid Offer Time
EUR/USD 1.2573 1.2574 Thu Oct 19 06:00:12 2006
USD/JPY 118.60 118.62 Thu Oct 19 06:00:14 2006
GBP/USD 1.8693 1.8696 Thu Oct 19 06:00:14 2006
USD/CAD 1.1353 1.1357 Thu Oct 19 06:00:05 2006
USD/CHF 1.2644 1.2647 Thu Oct 19 05:59:56 2006
EUR/JPY 149.13 149.15 Thu Oct 19 06:00:12 2006
EUR/GBP 0.6724 0.6726 Thu Oct 19 06:00:14 2006
EUR/CHF 1.5898 1.5900 Thu Oct 19 06:00:12 2006
GBP/CHF 2.3637 2.3643 Thu Oct 19 06:00:14 2006
GBP/JPY 221.72 221.78 Thu Oct 19 06:00:14 2006
.

Tabla 1.1.1 – Ejemplo de tipos de cambio

18
Es útil conocer las equivalencias ISO de las diferentes monedas pues es
la manera estándar de referirse a ellas en los mercados, y en este proyecto se
referenciarán de la misma forma. Seguidamente se muestra una lista de las
divisas más populares y sus equivalencias de códigos ISO con los nombres
comunes de las diferentes monedas:

Código ISO Nombre común


EUR Euro
USD Dólar americano
JPY Yen japonés
GBP Libra británica
CHF Franco suizo
CAD Dólar canadiense
AUD Dólar australiano
NZD Dólar neozelandés
SEK Corona sueca
CZK Corona checa
PLN Zloty polaco
HKD Dólar hongkonés
MXN Peso mexicano
ARS Peso argentino
THB Baht tailandés
SGD Dólar de Singapur
ZAR Rand sudafricano
HUF Forint húngaro
NOK Corona noruega
Tabla 1.1.2 – Equivalencias ISO de divisas populares

El lugar en el que se intercambian unas monedas por otras es el


denominado mercado de divisas, que será motivo de estudio más adelante.

19
1.2 Tipos de cambio fijos, flexibles y dirigidos

Una vez conocido el significado del tipo de cambio, se debe comprender


cómo se forma la cotización de las diferentes divisas.

La forma más sencilla y utilizada mayoritariamente en los últimos tres


siglos (excluyendo el período más reciente) es el tipo de cambio fijo. En él, los
gobiernos fijan el precio de su moneda de forma directa. Según Samuelson
[SAMU48] el más importante ha sido históricamente el patrón oro, mediante el
que las naciones fijaron el precio de su moneda basado en cantidad de oro
durante casi todo el período entre 1717 y 1933. De esta forma cada moneda
equivalía a una cantidad fija de oro asignada por el gobierno, de manera que el
cambio entre las diferentes divisas era relativamente sencillo pues sólo había
que calcular cuánto oro representaba la cantidad determinada de moneda que
se quería cambiar. Con el patrón oro, la oferta monetaria de un país dependía
de las reservas de oro que poseía esa nación pues toda la moneda era
convertible en oro en el banco central.

Después de las guerras mundiales y la Gran Depresión se consideró


que el patrón oro era demasiado rígido. En 1944 se creó el sistema de Bretton
Woods, que estableció una paridad para cada moneda fijada tanto en dólares
como en oro, con la característica destacable de posibilitar que los tipos de
cambio fueran fijos pero ajustables. Después de tres décadas de éxito, en 1971
la situación de patrón dólar se hace insostenible para Estados Unidos y
abandona el sistema de Bretton Woods, lo que dio paso al sistema de tipos de
cambio flexibles o flotantes.

Los tipos de cambio flexibles consisten en dejar fluctuar libremente las


monedas bajo la influencia de las fuerzas del mercado: la oferta y demanda
marcan la cotización de la divisa. Las tres principales regiones que utilizan
básicamente el tipo de cambio flexible son Estados Unidos, Europa y Japón.
Una demanda masiva de euros provocará que el euro se aprecie frente otras
divisas mientras que una salida a gran escala de capitales de Japón causará la
depreciación de su moneda. Multitud de factores diversos intervienen en la

20
formación de la oferta y demanda de una divisa, lo que hace muy compleja la
predicción de su cotización en un momento dado. Es por ello por lo que este
proyecto se va a centrar en encontrar una posible solución a la predicción de
los tipos de cambio flexibles.

Por último, en la economía mundial también podemos encontrar los tipos


de cambio dirigidos, en los que el tipo de cambio es determinado
mayoritariamente por las fuerzas del mercado pero el gobierno tutela la
cotización según su propio interés nacional comprando o vendiendo moneda o
modificando su oferta monetaria.

1.3 Efectos de las variaciones del comercio


sobre el tipo de cambio

Las variaciones del comercio exterior influyen muy directamente sobre el


tipo de cambio de los países envueltos en las diferentes transacciones. A su
vez, los tipos de cambio influyen de forma recíproca sobre el comercio exterior,
pudiendo causar variaciones y ajustes en la demanda de exportaciones o
importaciones.

Cuando un país exporta bienes o servicios a otra nación aumenta la


demanda de su moneda, pues el país importador necesita adquirir la moneda
local para pagar las mercancías al país de origen. Ello presiona al alza el tipo
de cambio del país que exporta. Por otro lado, aumenta la oferta de la divisa
del país importador, pues está vendiendo su moneda, presionando así a la baja
la cotización de su divisa.

Como ejemplo se puede tomar la importación a Estados Unidos de


aparatos electrónicos japoneses. Cuando los ciudadanos de Estados Unidos
compran aparatos japoneses, deben cambiar dólares americanos por yenes
para poder pagar en Japón, alimentando la demanda de yenes y a su vez la
oferta de dólares. Si la oferta y demanda exterior de Estados Unidos y Japón
es estable, el tipo de cambio no variará pues se mantendrá en el punto de

21
equilibrio de oferta y demanda. Pero si hubiera un descenso en la demanda de
aparatos electrónicos japoneses por parte de Estados Unidos causado, por
ejemplo, por el atractivo de un producto sustitutivo más barato como pueden
ser aparatos electrónicos chinos, la curva de demanda se desplazaría. Estados
Unidos cambiaría menos yenes por dólares. Así pues, el tipo de cambio del yen
frente al dólar descendería, depreciándose el yen y aumentando el precio de
los dólares en yenes. Como se puede ver, la variación del comercio ha
repercutido en el tipo de cambio.

Figura 1.3.1 – Variación en la demanda

Si el dólar siguiera subiendo frente al yen, puede que el yen se


depreciara por debajo de unos niveles que pudieran ser considerados de
equilibrio. En ese momento, los aparatos electrónicos japoneses volverían a
ser atractivos para el consumidor americano, lo que empujaría las
importaciones americanas de aparatos japoneses. De esta forma, el tipo de
cambio habría provocado una variación del comercio exterior.

En definitiva, el tipo de cambio se ve afectado entre otros factores


por las variaciones del comercio y se ajustará hasta encontrar un punto de
equilibrio.

22
1.4 Los tipos de cambio y la paridad del poder
adquisitivo. La influencia de la inflación

Es una idea de aceptación extendida entre los economistas que los tipos
de cambio, a pesar de sus fuertes variaciones en el corto plazo respondiendo a
diversos hechos como la política monetaria, los acontecimientos políticos y los
cambios sobre expectativas futuras, en el largo plazo son sin embargo
determinados principalmente por los precios relativos de los bienes en los
diferentes países.

Una de las importantes implicaciones de esta idea es la teoría


denominada PPA (paridad del poder adquisitivo). Aunque esta teoría ha sido
enunciada de una u otra forma a lo largo de toda la historia de la economía,
Gustav Cassel [CASS23] es reconocido como el padre de esta teoría en
tiempos modernos, desarrollándola en 1923 en su artículo Tract on Monetary
Reform. Según esta teoría, el tipo de cambio de una nación ajustará el coste de
adquisición de los bienes comerciados dentro de sus fronteras con el coste
total de adquisición en el extranjero (incluyendo transporte y/o otros costes
asociados).

Para entender la PPA, como ejemplo, se puede suponer una cesta de


bienes no diferenciables como alimentos, combustible, herramientas, etc... que
cuesta 2.500 dólares en Estados Unidos y 25.000 pesos mexicanos en México.
Si suponemos la misma calidad para los bienes a un lado y a otro de la frontera
y el tipo de cambio estuviera a 50 pesos por dólar, los individuos
estadounidenses adquirirían los bienes en México pues esta cesta les costaría
500 $, que es una cantidad sensiblemente inferior a los 2.500 $ que les
costaría en su país.

De esta forma, se produciría un flujo de capitales de Estados Unidos a


México, incrementándose la demanda de pesos mexicanos a cambio de
dólares. Ello haría que la cotización del peso en dólares subiera, es decir, que
el peso se apreciara con respecto al dólar. Como consecuencia, para los

23
compradores estadounidenses los precios de los bienes mexicanos estarían
subiendo, aunque los precios nominales en pesos no variaran. Este proceso se
produciría hasta que los precios para los compradores estadounidenses fueran
similares a los de su país, por lo que pararía cuando el tipo de cambio bajara
hasta los 10 pesos por dólar (10 USD/MXN).

Un interesante índice de las diferentes divisas basado en la PPA es el


Índice Big Mac elaborado anualmente por The Economist. Este índice, recoge
los diferentes precios de la hamburguesa Big Mac de la cadena de
restaurantes McDondald’s en diferentes países. La idea es que al ser los
ingredientes de la hamburguesa los mismos y disponer la mayoría de los
países de producción de dichos ingredientes, el Big Mac debería ser un buen
índice de comparativa de PPA. La siguiente tabla muestra el Índice Big Mac
junto con ciertos valores explicativos:

The Hamburger Standard (based on March 25, 2006 BigMac Prices)

Actual Over(+) / Under(-) Purchasing


Country BigMac Price Exchange Rate Valuation against Power Price
in Local in US 1 USD = the dollar, %

Currency dollars
United States $3.10 3.10 1.00 - -
Argentina Peso 7.00 2.2609 3.0961 -27.0049 2.26
Australia A$3.25 2.4777 1.3117 -19.9512 1.05
Brazil Real6.40 2.9835 2.1451 -3.9672 2.06
Britain £1.94 3.6535 1.8832‡ 17.7024 0.625
Canada C$3.52 3.1306 1.1244 1.3874 1.14
China Yuan10.50 1.3284 7.9045 -57.113 3.39
Euro area 2.94 3.7182 0.7907 20.4478 0.9524
Hong Kong HK$12.00 1.542 7.782 -50.2699 3.87
Hungary Forint 560 2.7134 206.384 -12.2994 181
Indonesia Rupiah14,600 1.5958 9149.13 -48.5197 4,710
Japan ¥250 2.1049 118.769 -32.1372 80.6
Malaysia M$5.50 1.4926 3.6848 -51.9648 1.77
Mexico Peso29.0 2.696 10.7565 -13.0758 9.35
New Zealand NZ$4.45 2.9201 1.5239 -5.5056 1.44
Poland Zloty6.50 2.1188 3.0678 -31.547 2.10
Russia Rouble48.00 1.79 26.8157 -42.198 15.5
Singapore s$3.60 2.2945 1.569 -26.0676 1.16
South Africa Rand13.95 1.8502 7.5399 -40.3175 4.50

24
South Korea Won2,500 2.597 962.649 -16.2727 806
Sweden Skr33.0 4.5265 7.2904 45.3967 10.6
Switzerland SFr6.30 5.002 1.2595 61.1751 2.03
Taiwan NT$75.00 2.2533 33.2838 -27.292 24.2
Thailand Baht60.0 1.6198 37.0411 -47.6257 19.4
‡ Dollars per pound

Tabla 1.4.1 – Índice Big Mac

También según la PPA se establece que el diferencial de inflación


entre diferentes monedas es causa de variaciones en el tipo de cambio,
depreciándose la moneda del país con más inflación frente a la moneda del de
menos inflación en un valor anual cercano al diferencial de la inflación entre los
dos países. Así pues si en un país la inflación es del 8% y en otra nación la
inflación es del 2%, el tipo de cambio del país con más inflación debería
depreciarse a un ritmo del 6% anual con respecto a la moneda del otro país.
Un ejemplo es el caso de España en los años 80 y 90, en los que la peseta fue
devaluada en sucesivas ocasiones por el gobierno a causa de la fuerte
inflación en relación con nuestros vecinos europeos.

Como advertencia, se debe saber que la PPA es sólo una aproximación


y se debe de tener en cuenta a título orientativo, como una regla flexible,
aunque es una buena guía para el largo plazo. Hay muchos factores que
influyen de forma inmediata sobre el tipo de cambio a corto plazo, incluyendo la
especulación en los mercados y que los movimientos financieros pueden
superar a los momentos comerciales en el corto plazo.

1.5 Tipos de cambio y tipos de interés. Bonos


nacionales frente a bonos extranjeros.

La deuda pública (que en este proyecto por motivos de simplificación


será referida como “bonos” a pesar de la multitud de variantes que ofrece) es
considerada como una inversión sin riesgo. Por ello, el tipo de interés que
ofrecen los bonos nacionales es tenido en cuenta como el coste de oportunidad
del dinero.

25
¿Pero qué pasa en una economía abierta global en la que los inversores
tienen acceso también a bonos de otros países? En ese caso, las posibilidades
de inversión aumentan considerablemente y los agentes buscarán el mercado
que ofrezca la máxima rentabilidad, teniendo en cuenta también la variación en
el tipo de cambio. Por ello, para que se den condiciones de equilibrio, tanto los
bonos nacionales como los bonos extranjeros deben tener la misma
rentabilidad total esperada, lo que implica que debe cumplirse la siguiente
relación para mantener el equilibrio, siendo i el tipo de interés nacional, i * el tipo
de interés extranjero, E el tipo de cambio y Ee el tipo de cambio esperado:

it = i*t + (Eet+1 – Et)/Et,

Esta relación indica que el tipo de interés nacional debe ser igual al tipo
extranjero más la depreciación esperada de la moneda nacional con respecto a
la divisa extranjera. La relación anterior puede expresar el tipo de cambio
actual en función del tipo de cambio esperado y de los tipos de interés,
quedando de la siguiente manera:

E = Eet+1 / (1 + i – i*)

De esta forma se concluye que una variación en los tipos de interés,


ya sea el nacional o el extranjero, afecta al tipo de cambio. Un aumento de
los tipos de interés locales o disminución de los tipos de interés extranjeros,
provocará una apreciación de la moneda nacional, mientras que en el caso
inverso la divisa local se depreciará.

Como ejemplo, si los tipos de interés en Estados Unidos y en Europa


son iguales, según la relación el tipo de cambio EUR/USD se mantendrá
estable, siendo E = Ee.

Si se produjera una subida de tipos de interés en Estados Unidos, los


inversores europeos encontrarían más atractivos los bonos americanos, ya que
obtendrían más interés por su dinero en ese país que en Europa. Por ello, se

26
produciría un flujo de capital a Estados Unidos desde Europa, vendiendo los
inversores sus euros por dólares. Este hecho empujaría la cotización del dólar
al alza pues aumenta su demanda e incrementa la oferta de euros,
depreciándose el euro respecto al dólar, o lo que es lo mismo,
desencadenando la apreciación del dólar.

Esta apreciación del dólar continuará hasta que se halla cubierto el


diferencial de tipos de interés entre las dos regiones, de forma que si todo lo
demás permanece constante en el largo plazo se alcance de nuevo el
equilibrio.

27
2. Los mercados de divisas

2.1 Características y funcionamiento

Como se ha podido leer anteriormente, en los mercados de divisas


(también conocido como FOREX o FX, acrónimo de Foreign Exchange) se
intercambia una moneda a cambio de otra, casándose la oferta con la
demanda. Al precio al que dos monedas son intercambiadas se le denomina
tipo de cambio y en el caso de los tipos de cambio flotantes, éste varía
constantemente movido por las fuerzas del mercado.

El mercado de divisas es un mercado OTC (over-the-counter), es decir,


un mercado descentralizado, no regulado, en el que las transacciones son
bilaterales y no en la forma contraparte-mercado-contraparte. Esto quiere decir
que no hay un único lugar en el que se intercambian divisas, sino que lo que es
llamado mercado de divisas es en realidad un conglomerado de operadores del
mercado interconectados unos con otros a través de una plataforma
interbancaria. No hay una única cotización para un par de divisas, sino multitud
de ellas ya que estas cotizaciones serán ofrecidas por multitud de contrapartes
a las que se está conectado. En la práctica los arbitrajistas acaban explotando
la mayor parte de posibles diferencias entre cotizaciones, haciendo que la
mayoría de contrapartes disfruten de cotizaciones muy similares.

No hay un lugar específico en el que se desarrolle toda la actividad del


mercado de divisas pero sí que hay ciertas plazas financieras con relativa
importancia en el volumen de operaciones. Según el Triennial Central Bank
Survey [TRIE05] las más importantes según el porcentaje de operaciones del
total son:

- Londres: 31%
- Nueva York: 19%
- Tokio: 8%
- Singapur: 5%

28
- Frankfurt: 5%
- Hong Kong: 4%
- Sidney: 3%
- Zurich: 3%

Otra característica importante del mercado de divisas es que opera las


24 horas del día y 365 días al año, aunque durante sábados y domingos la
actividad es muy limitada. La siguiente figura, obtenida a través de la
plataforma de divisas OANDA, muestra una gráfica OHLC del tipo de cambio
EUR/USD entre el 19 de septiembre y el 27 de octubre de 2006, marcando
entre líneas amarillas la actividad del fin de semana:

Figura 2.1.1 – Gráfico de OANDA. Entre barras amarillas los fines de semana.

2.2 Tipos de operaciones

Dependiendo de las necesidades que deseemos cubrir, hay diferentes


tipos de operaciones en el mercado de divisas.

29
Estas operaciones las podemos dividir en operaciones OTC y
operaciones en mercados de derivados. Los derivados reciben este nombre
porque son contratos sobre un subyacente (en este caso, las monedas) del que
dependen o derivan y no se opera de forma directa sobre el mercado de
divisas. Algunas otras características de los mercados de derivados son:

- Los contratos se operan en mercados centralizados y organizados. El más


importante en el caso de futuros sobre divisas es el CME (Chicago Mercantile
Exchange) y en el caso de las opciones de divisas el CBOT (Chicago Board Of
Trade).

- Las operaciones son del tipo contraparte-mercado-contraparte y existe la


figura de cámara de compensación, que liquida diariamente las pérdidas y
ganancias y elimina el riesgo de impago de las contrapartes. Para ello se
solicitan unas garantías (depósitos que avalen a cada una de las contrapartes)
que deben estar cubiertas permanentemente. En caso de que en algún
momento no se pueda cumplir con la garantía la operación es cerrada por la
cámara de compensación, liquidando las pérdidas o ganancias.

- Se manejan lotes o contratos de tamaño normalizado.

- Las fechas de vencimiento de los contratos son también normalizadas, siendo


mensuales o trimestrales y son establecidas por la autoridad del mercado.

A continuación se explica los tipos de operaciones que pueden llevarse


a cabo en el mercado de divisas:

Operaciones OTC:

- A plazo o forward: el comprador y el vendedor acuerdan llevar a cabo una


transacción en una fecha futura, por un precio y cantidad de mutuo acuerdo.
Esta operación al ser OTC es totalmente flexible en el tiempo y la cantidad,
pero con riesgo de impago. Operaciones de este tipo suelen ser llevadas a

30
cabo normalmente por operadores comerciales/financieros que desean eliminar
el riesgo de tipo de cambio en el futuro. Ejemplo:

El comerciante A en Europa desea comprar al comerciante B en Japón una


mercancía que debe pagar a 120 días por un total de 1.000.000 de yenes que
al tipo de cambio de ese momento supone 10.000 euros. El comerciante A no
quiere correr el riesgo de que el yen se aprecie en ese período y que acabe
pagando una cantidad superior a los 10.000 euros. Por ello acude a los
mercados con un contrato a plazo de 120 días y cantidad 10.000 euros por
1.000.000 de yenes. Independientemente de las variaciones del tipo de cambio
en ese período, el comerciante A recibirá 1.000.000 de yenes por sus 10.000
euros al cabo de 120 días, evitando correr el riesgo del tipo de cambio.

- Swap: en esta transacción dos contrapartes intercambian divisas y acuerdan


el intercambio a la inversa en una fecha futura. Este tipo de operaciones es
común entre los operadores especuladores. Ejemplo:

Un especulador alemán prevé una caída de la corona sueca frente al euro


durante el próximo mes mientras que un especulador en Suecia opina que el
euro se depreciará frente a la corona sueca también durante el próximo mes.
Los dos especuladores acuerdan entre ellos un intercambio de las coronas del
sueco por los euros del alemán y realizar el intercambio inverso dentro de 30
días. Una vez que el alemán tiene coronas suecas las cambia inmediatamente
en el mercado por euros (haciendo la operación contraria el sueco) y conserva
su dinero en euros hasta que pasan los 30 días. En ese momento deberá
devolver a su contraparte sueco sus coronas, por lo que cambia de nuevo
euros por coronas en el mercado, devolviéndole exactamente la misma
cantidad de coronas que le había proporcionado la contraparte 30 días atrás. Si
la corona se ha depreciado entonces el especulador alemán habrá necesitado
menos euros que los que recibió hace 30 días para devolver la misma cantidad
de coronas, obteniendo así un beneficio económico. Viceversa en el caso del
especulador sueco.

31
- Al contado o spot: es la forma más clásica, involucrando el cambio de una
divisa por otra en el plazo de 2 días. Este plazo de entrega es un remanente
del pasado, en el que 2 días era el plazo que tardaba en cambiar los fondos de
un banco a otro. Las operaciones de este tipo pueden ser llevadas a cabo por
cualquier tipo de operador, ya sea comercial/financiero o especulador. Para las
operaciones de especulación actualmente no se respeta el plazo de 2 días de
entrega sino que diariamente se cierra la posición y se reabre inmediatamente
durante otras 24 horas, pudiéndose alargar de forma artificial la operación por
tiempo ilimitado. Un ejemplo de operación especulativa podría ser el siguiente:

Un operador especulador español predice una depreciación del dólar


australiano frente al yen. Sin embargo el operador carece de yenes o dólares
australianos, y aunque los tuviera lo que desea es beneficiarse de la forma más
óptima de la variación en el tipo de cambio AUD/JPY que predice. Para llevar a
cabo la operación, solicita lo que podría llamarse un préstamo de 100.000
dólares australianos. Estando el tipo de cambio a 80 AUD/JPY cambia sus
dólares australianos por yenes, recibiendo un total de 8.000.000 de yenes. Al
cabo de unos días el tipo de cambio baja hasta 78,05 AUD/JPY. El especulador
considera que se han cumplido sus expectativas y decide cerrar la operación,
por lo que cambia sus 8.000.000 de yenes por aproximadamente 102.500
dólares australianos después de aplicar el tipo de cambio del momento. En ese
instante amortiza el préstamo de 100.000 AUD que tenía, recogiendo un
beneficio de 2.500 AUD (menos los costes de operación). Como se ha podido
ver, en este tipo de operación, el especulador se puede beneficiar de las
variaciones en cualquier tipo de cambio sin ni siquiera disponer de ninguna de
las divisas involucradas. Actualmente la operación al contado es
probablemente la más popular entre los especuladores en el OTC y será la que
se utilice a lo largo de este proyecto para simulaciones de especulación.

Operaciones en mercados de derivados

- Futuros: son similares a la operación a plazo pero con la diferencia de que


son contratos normalizados y se operan en mercados organizados. Entre los
especuladores es de popularidad equivalente a las operaciones spot o al

32
contado. Diferencias adicionales a las ya explicadas en el modo de operar spot
vs. futuros son los plazos de la operación (en futuros normalmente un máximo
de 3 meses mientras que en spot los plazos son virtualmente ilimitados
mediante el mecanismo explicado anteriormente) y la forma en la que se
cobra/deduce el interés (en spot el interés se cobra o deduce diariamente
mientras que en los futuros el diferencial de tipos de interés viene incluido en la
cotización del contrato, no deduciéndose ni cobrándose en ningún momento
interés).

- Opciones: son un derecho a comprar o vender en un plazo específico una


determinada divisa a un precio estipulado previamente. Por este derecho se
paga una prima. Algunas de las posibilidades de uso más populares son: como
seguro de tipo de cambio para comerciantes, como herramienta de cobertura a
inversores y como instrumento de especulación directa. C. Maté y A. Oliva
[MATE03] exponen métodos para calcular los precios de las opciones
financieras según la volatilidad.

2.3 Magnitud del mercado y datos cuantitativos

Según el Triennial Central Bank Survey (B.I.S., 2005) [TRIE05] el


mercado de divisas tuvo un volumen medio diario de 1,9 billones de USD
durante 2004, lo que le convierte en el mercado con mayor volumen de negocio
del mundo.

Figura 2.3.1 – Volumen diario en miles de millones de USD

33
Según el citado estudio, en el 89% de las operaciones estuvo
involucrado el USD, seguido por el EUR con el 37%, el yen con el 20% y la
libra con el 17%. Hay que tener en cuenta que el USD ejerce de “moneda
puente” en la mayoría de los tipos de cambios. Es decir, si un comerciante
desea intercambiar pesos mexicanos por yenes, deberá cambiar primero sus
pesos por dólares y luego sus dólares por yenes. Según Wikipedia [WIKI07]
sólo hay una excepción a este uso del USD como moneda puente que es el
caso del tipo de cambio EUR/JPY, en el que el tipo de cambio es directo entre
euros y yenes. Otras fuentes bien informadas aseguran que también existen
los tipos de cambio directos en el caso de EUR/GBP y EUR/CHF.

De acuerdo con el artículo de The Wall Street Journal Europe (2/9/06 p.


20) [WALLS06] los mayores operadores del mercado de divisas durante 2005
fueron:

Puesto Nombre % de volumen total


1 Deutsche Bank 17.0
2 UBS 12.5
3 Citigroup 7.5
4 HSBC 6.4
5 Barclays 5.9
6 Merrill Lynch 5.7
7 J.P. Morgan Chase 5.3
8 Goldman Sachs 4.4
9 ABN AMRO 4.2
10 Morgan Stanley 3.9
Tabla 2.3.2 – Principales bancos por volumen de negociación

34
3. Redes neuronales artificiales en la
predicción de tipos de cambio

Este capítulo está basado en el artículo Forecasting foreign exchange


rates with artificial neural networks: a review de W. Huang, K. K. Lai, Y.
Nakamori y Shouyang Wang [HUAN04]. Se realizará una breve revisión sobre
el uso de redes neuronales artificiales en la predicción de tipos de cambio. Se
estudiarán los variados resultados obtenidos por distintos investigadores y se
llegará a conclusiones sobre la utilidad y criticidad del uso de esta herramienta
para el propósito de este proyecto.

3.1 Introducción

Como se explicó en anteriores capítulos, los tipos de cambio están


correlacionados con multitud de factores que interactúan de forma altamente
compleja. Las series temporales de los tipos de cambio muestran alta
volatilidad, ruido y no-linealidad; Fang et al. [FANG94] demostraron estructuras
fractales en la formación de precios del mercado de futuros de divisas. Por ello,
se ha investigado ampliamente la aplicación a la predicción de los mercados de
divisas de modelos no-lineales, entre los que se encuentran las redes
neuronales artificiales.

Algunos modelos paramétricos no-lineales como el modelo de varianza


aleatoria autorregresiva (ARV) aplicado por So et al. [SOLA99], el de
heteroscedasticidad condicional autorregresiva (ARCH) por Hsieh [HSIE91],
dinámica del caos por Peel y Yadav [PEEL95], han sido probados. Aunque
estos modelos pueden alcanzar buenos resultados en determinadas
circunstancias, su rendimiento no es satisfactorio en otras situaciones. Esto es
debido a que estos modelos están restringidos a ser útiles en unos
determinados patrones no-lineales, sin ser lo suficientemente generales para
capturar todas las no-linealidades de la serie de datos.

35
Sin embargo, las redes neuronales artificiales son útiles a la hora de
encontrar soluciones precisas en un entorno caracterizado por información
parcial, compleja, ruidosa o irrelevante. Algunas de las características que
hacen a las redes neuronales especialmente prácticas para este propósito son:

- Son autoadaptativas.
- Son capaces de generalizar.
- Son no-lineales.

Es por ello por lo que se ha dedicado multitud de recursos de


investigación al uso de redes neuronales en la predicción de los tipos de
cambio. En este capítulo se expondrán algunos de los resultados y enseñanzas
obtenidos en el pasado.

3.2 Elección de información de entrada

Generalmente, se puede escoger entre dos tipos de entradas a tener en


cuenta. El primero son datos de entrada de tipo fundamental. Estos datos son
factores económicos exógenos a la cotización de la divisa como pueden ser el
producto interior bruto, el índice de precios al consumo, la balanza comercial, el
tipo de interés, etc... El segundo tipo de datos de entrada son los datos de
carácter técnico. Estos datos son los que pueden ser directamente extraídos
(endógenos) del mercado de divisas: los máximos y mínimos del día, las series
de cotizaciones de la divisa al cierre, la media móvil de la cotización,
volúmenes de operaciones, el índice de fuerza relativa, volatilidad, etc...

En el caso de las redes neuronales, en la mayoría de las ocasiones se


utilizan entradas univariable, dependientes de la serie temporal, siendo así
entradas de tipo técnico. Para ello se elige un determinado número de periodos
que se van a introducir como entradas, creando una ventana móvil que se va
desplazando por la serie temporal. Uno de los problemas encontrados es como
seleccionar el tamaño apropiado de la ventana móvil; algunos autores realizan
experimentos para resolver esta tarea mientras otros usan ideas empíricas
intuitivas. Según Huang et al. [HUAN04], la ausencia de un método sistemático

36
para el diseño de las redes neuronales es probablemente la principal causa de
las inconsistencias encontradas en los diferentes trabajos de investigación
sobre predicción del mercado de divisas usando redes neuronales.

3.3 Preparación de los datos

La dedicación empleada a la preparación de los datos es de importancia


decisiva en la posterior velocidad de aprendizaje y calidad de las predicciones
de la red neuronal. Algunas de las preguntas iniciales a responder son:

1.- ¿Hay suficientes datos disponibles? ¿Contienen los datos la información


adecuada?
2.- ¿Cubren los datos disponibles el rango deseado?
3.- ¿Hay casos marginales que no están cubiertos por los datos?
4.- ¿Contienen los datos información irrelevante?
5.- ¿Existen combinaciones o transformaciones de las variables que
describirían el problema de una forma más eficiente que las variables
individuales en sí mismas?

Una vez resueltas estas cuestiones, puede que sea necesario


transformar o normalizar los datos. En otras investigaciones se han utilizado
variadas transformaciones de los datos para este propósito. Tenti [TENT96]
normaliza las entradas a media cero y dos desviaciones típicas. En el estudio
de Hu et al. [HUTS99], todas las entradas son normalizadas linealmente a [0,1].
Lisi y Schiavo [LISI99] escalan linealmente la diferencia de los logaritmos de
los datos en el rango [0,2, 0,8] para adaptarlos a la función sigmoidal de
activación.

Sin embargo, no hay consenso acerca de qué tipo de normalización


debe ser utilizada. Tampoco, si quiera, acerca de si se debe usar
normalización, pues los pesos de los arcos podrían contrarrestar el escalado.
Shanker et al. [SHAN96] hallaron que la normalización no mejora los resultados
cuando el tamaño de la muestra es suficientemente grande. Zhang y Hu

37
[ZHAN98] tampoco encontraron diferencias significativas entre el uso de datos
normalizados y datos originales.

Habitualmente el conjunto de datos es dividido en dos, el conjunto de


entrenamiento y el conjunto de prueba. El conjunto de entrenamiento es usado
para el ajuste de la red neuronal mientras que el conjunto de prueba se utiliza
para comprobar la capacidad predictiva de ésta.

En otras ocasiones se usa un tercer conjunto, denominado conjunto de


validación. Yao et al. [YAOT00] sugieren el uso de los conjuntos de
entrenamiento, validación y prueba, conteniendo respectivamente el 70%, el
20% y el 10% de los datos.

Otro de los factores a tener en cuenta es el tamaño de la muestra. Para


averiguar qué tamaño era óptimo para el entrenamiento, Zhang y Hu [ZHAN98]
usaron dos tamaños de muestra diferentes para el entrenamiento. Finalmente
concluyeron que el tamaño de muestra superior obtenía resultados mejores
que el tamaño de muestra pequeño. Sin embargo, Kang [KANG91] encontró en
otra investigación que no son necesarias muestras grandes para obtener un
buen rendimiento. Walczak [WALC01] obtuvo como conclusión que
generalmente 2 años de muestras son suficientes en series financieras.

3.4 Topologías de redes neuronales

3.4.1 Feedforward

En este tipo de redes neuronales, las conexiones no forman ciclos.


La arquitectura de este tipo más popular es probablemente el perceptrón
multicapa (MLP). Las principales características responsables de su
popularidad son:

- Es relativamente fácil de implementar.


- Genera respuestas a velocidad razonable.
- Teóricamente es capaz de aproximar cualquier función no-lineal.

38
- Su velocidad de entrenamiento es aceptable comparada con otras redes más
complejas.

El MLP está formado por tres capas: capa de entrada, capa oculta y
capa de salida. La capa oculta está formada por un número de neuronas
arbitrario y puede ser a su vez dividida en más capas. Cada una de las capas
tiene conexiones con la siguiente capa, pero no entre neuronas de la misma
capa. El flujo de datos va desde la capa de entrada hasta la capa de salida.

capa de entrada capa de salida

capa oculta

Figura 3.4.1 – Perceptrón multicapa

No hay un método preciso para escoger la estructura exacta del


perceptrón multicapa por lo que debe ser utilizado un método de prueba y error
o de cruce-validación. En este proyecto se estudiará el uso de algoritmos
genéticos para la elección del tipo de estructura del perceptrón multicapa.

Otras arquitecturas de tipo feedforward útiles para la predicción son:

39
- Redes de función de base radial (RBFN): estas redes usan una función
gaussiana en las neuronas de la capa oculta. Generalmente tienen un tiempo
de entrenamiento reducido, requiriendo menor tamaño muestral, y, a diferencia
del perceptrón multicapa, no se bloquean en mínimos locales.

- Redes neuronales de regresión general (GRNN): son redes con memoria


basadas en estimaciones de funciones de masa de probabilidad. Tienen cuatro
capas: capa de entrada, capa de patrón, capa sumatoria y capa de salida. Las
GRNN muestran buen rendimiento en entornos ruidosos con suficientes datos.
Como desventajas, tienen ciertos problemas con datos irrelevantes, necesitan
tamaño muestral elevado y necesitan almacenar todas las muestras para la
predicción.

3.4.2 Retroalimentación

En las redes neuronales retroalimentadas se forman ciclos en las


conexiones, de forma que los nexos no tienen porqué seguir una jerarquía
específica. En este tipo de redes, cada vez que se introduce una entrada, la
red neuronal debe iterar hasta generar la salida, siendo un proceso
potencialmente lento.

Las redes neuronales recurrentes pueden aprender patrones temporales


extremadamente complejos, lo que es de gran utilidad para predicciones del
mercado de divisas. Sin embargo, requieren un elevado número de
conexiones, gran cantidad de memoria y un prolongado tiempo de
entrenamiento debido a su poco ágil tiempo de respuesta.

40
Figura 3.4.2 – Red neuronal recurrente.
Fuente: Bryan Davis http://plaza.ufl.edu/badavis/EEL6586/NeuralNetworks.html

3.5 Comparación del rendimiento con otros


métodos de predicción

A continuación se muestran los conclusiones alcanzadas por distintos


investigadores acerca del uso de redes neuronales en la predicción de tipos de
cambio.

Algunos de los estudios que alcanzaron conclusiones positivas sobre el


uso de redes neuronales fueron:

- Weigend et al. [WEIG92]: el tipo de cambio estudiado fue DEM/USD. Usando


un MLP obtuvieron mejores resultados que el modelo de paseo aleatorio.

41
- Wei y Jiang [WEIJ95]: mediante el uso de un MLP obtuvieron mejores
resultados que mediante modelos AR(p), ARMA(p, q) y ARIMA(p, d, q) para el
tipo de cambio GBP/USD.

- Lisi y Schiavo [LISI99]: en términos de error cuadrático medio normalizado, el


MLP se comportó mejor que el modelo caótico y el de paseo aleatorio, para un
conjunto de 4 divisas.

- Yao y Tan [YAOT00]: obtuvieron mucho mejores resultados mediante MLP


que mediante ARIMA en 5 divisas.

- Leung et al. [LEUN00]: usando GRNN obtuvieron mejores resultados que el


modelo de paseo aleatorio y que funciones paramétricas de transferencia
multivariación.

Seguidamente se enuncian algunos estudios en los que las redes


neuronales obtuvieron resultados pobres o mixtos:

- Episcopos y Davis [EPIS96]: en su estudio, redes de tipo MLP obtuvieron


resultados similares que el modelo EGARCH, aunque superaron los resultados
del paseo aleatorio.

- Hu y Tsoukalas [HUTS99]: obtuvieron resultados mixtos comparando MLP


con modelos MAV, GARCH, EGARCH, IGARCH, OLS y AVE para un variado
grupo de divisas. Las redes neuronales no siempre se comportaron mejor que
otros modelos.

- Kuan y Liu [KUAN95]: usaron MLP y RNN contra el modelo de paseo


aleatorio, obteniendo resultados mixtos.

- Billio, Sartore y Toffano [BILL00]: en su estudio compararon redes


neuronales, lógica borrosa, modelos GARCH, regimen cambiante y dinámica

42
del caos para la predicción de DEM/USD. Todos los modelos tuvieron
comportamiento similar al paseo aleatorio excepto el de lógica borrosa.

Después de revisar la literatura sobre el uso de redes neuronales en la


predicción de tipos de cambio podemos concluir que las redes neuronales son
una técnica a tener en cuenta a la hora de realizar predicciones, con resultados
similares o superiores a otras técnicas. Por ello, se aplicará su uso en este
proyecto.

43
4. Modelo de predicción mediante
descomposición en subtendencias

A lo largo de este capítulo se describirá un modelo de predicción basado


en redes neuronales que utiliza la descomposición en subtendencias como
característica original. Se expondrán sus fundamentos básicos así como sus
resultados y conclusiones.

4.1 Introducción

En los mercados financieros actúan una variedad de agentes con


diferentes horizontes temporales. Cada uno de ellos se ve influido de forma
distinta por las noticias o por la propia cotización, reaccionando de forma
diferente ante los estímulos. Las motivaciones de los movimientos a muy corto
plazo suelen ser diferentes a las motivaciones de los movimientos a largo
plazo. Por ello, en este proyecto se ha decidido crear un modelo que
descomponga la serie principal en diferentes subtendencias que representen
de forma esquemática los horizontes temporales de los actores del mercado e
intentar predecir de forma individual cada una de ellas para obtener finalmente
una predicción global al combinarlas.

Las ventajas que se esperan obtener mediante un modelo de este tipo


son las siguientes:

- Mejor ajuste específico, causando una mejora en el ajuste global. Es una


estrategia de tipo “divide y vencerás”. Al entrenarse una red neuronal distinta
para cada una de las subtendencias, se espera obtener una especialización
que mejore significativamente los resultados globales. Es de esperar que los
patrones para cada subtendencia sean distintos; la misión de cada una de las
redes neuronales entrenadas es aprender estos patrones encontrados en su
subtendencia para conseguir un resultado superior al aprendizaje que podría

44
llevar a cabo una red neuronal general trabajando sobre la serie temporal
global.

- Reducción del error global al combinarse los errores aleatorios de las


subtendencias. Siendo los errores de las predicciones aleatorios y teniendo las
diferentes subtendencias baja correlación entre ellas (como se demostrará más
adelante), es de esperar que los errores de sus predicciones tengan también
baja correlación unos con otros. Esto facilitaría una reducción del error
combinado respecto al error global que cabría esperar.

Los resultados que se exponen a lo largo de este capítulo son referentes


a la puesta en práctica de este modelo con la cotización del tipo de cambio
EUR/USD en períodos de 60 minutos desde 2003 hasta 2007. Estos datos han
sido extraídos de la base de datos de Visual Chart.

4.2 Método de descomposición

La realización de la descomposición se ha fundamentado en algunas de


las ideas básicas de conocidos y efectivos métodos de descomposición de
series temporales como el método del Censo II. Este método fue desarrollado
por la Oficina del Censo de los Estados Unidos con Julius Shiskin [SHIS57]
como principal contribuidor y es ampliamente reconocido.

El método del Censo II actúa descomponiendo los datos originales en


una serie ciclo-tendencia, una componente estacional y un error. Sin embargo,
en el caso de datos financieros, es común en la literatura proponer modelos de
predicción que actúen directamente sobre los valores de las series financieras,
sin realizar transformación alguna para obtener estacionalidades de la serie. La
mayoría de los modelos discutidos en el capitulo 3 así lo hacían. Esto es
debido a que las series financieras, entre las que se incluyen los tipos de
cambio, carecen de estacionalidad alguna ya que, según la teoría del mercado
eficiente [FAMA70], de poder encontrarse algún tipo de estacionalidad, ésta
sería explotada inmediatamente por los agentes del mercado incluyéndola

45
instantáneamente en el precio de los activos. Es por ello por lo que
habitualmente se trabaja sobre los datos “crudos”.

Una de las principales diferencias del método de descomposición


aplicado aquí frente a otros métodos es que no se busca descomponer en una
serie ciclo-tendencia, una componente estacional y un error, si no
descomponer en una serie ciclo-tendencia y sucesivas subtendencias
operando sobre la tendencia principal. El proceso es recursivo y acaba cuando
la última subtendencia tiene un horizonte temporal de un período.

El algoritmo es el siguiente:

- Paso 1: Un alisado exponencial simple es aplicado a los datos originales para


obtener la serie ciclo-tendencia (o T1 en el modelo desarrollado en este
capítulo). El alisado exponencial es un método de suavizado para series
temporales derivado de la media móvil. Se basa en el principio de que en
predicción las observaciones más recientes son las que mejor servirán de guía
para el futuro. Así pues, va reduciendo el peso de las observaciones a medida
que son más antiguas, implicando una reducción exponencial de los pesos en
el tiempo. Siendo Yt el dato observado en el período t y Ft el valor del
suavizado exponencial en t, la estimación de Ft+1 se calcula como:

Ft+1 = Ft + α(Yt – Ft),

donde α es una constante entre 0 y 1 que determina el peso que tendrán las
observaciones recientes. A menor α el suavizado será mayor.

Para el cálculo de la serie ciclo-tendencia, se debe escoger un valor de


α suficientemente pequeño como para recoger únicamente las características
a largo plazo de la serie temporal. El valor de α escogido las pruebas
realizadas con la serie EUR/USD 60 min. fue de 0,00133.
En la siguiente figura se muestra en rojo la serie original utilizada y en
azul la serie ciclo-tendencia calculada:

46
Figura 4.2.1 - EUR/USD 60 min. 2003-2007 y alisado exponencial α=0.00133 (Τ1)

- Paso 2: Es calculada la diferencia entre el ciclo-tendencia y los datos


originales, refiriéndonos a ella como D1. Para otras series económicas podría
ser más recomendable calcular el ratio entre los datos originales y el ciclo-
tendencia en lugar de la diferencia; para los tipos de cambio esto no es crítico
ya que estos suelen oscilar en un rango limitado lo que hace que la diferencia
entre los datos sea aceptable.

- Paso 3: En este paso se calcula el alisado exponencial de la serie resultante


en el paso 2, que denominaremos T2. Esta vez el valor de α debe ser superior
al utilizado en el paso 1, pues se desea obtener las características de la serie a
un plazo menor.

En el modelo desarrollado en este capítulo se ha escogido como


proporción entre los diferentes valores de α usados para el cálculo de cada una
de las subtendencias un valor aproximado de Φ2, siendo Φ el número áureo:

αn = Φ2 αn-1

47
La razón para escoger esta proporción es que el número áureo es
frecuentemente utilizado en el análisis técnico de los mercados como
referencia para proporciones temporales y de precios. De cualquier forma, la
elección de la proporción entre los diferentes valores de α usados en este
método de descomposición requiere experimentación.

La siguiente figura muestra en rojo la diferencia entre los datos


originales y T1, denominada D1, y el alisado exponencial de ésta con α =
0,0035 (T2):

Figura 4.2.2 – D1 y T2 (α = 0.0035)

- Paso 4: Se calcula la diferencia entre D1 y T2 , siendo ésta D2.

- Paso 5: Se halla T3, que es el alisado exponencial simple de D2 utilizando un


valor de α aproximadamente Φ2 veces superior al valor de α usado en el
calculo de la subtendencia anterior.

- Paso 6: Los pasos 4 y 5 pueden ser repetidos, descomponiendo en nuevas


subtendencias, mientras el valor de αn cumpla la relación:

48
Φ2 αn < 1

En el caso desarrollado en este capítulo, se calculó hasta T7, quedando


un residuo final D7. A continuación se muestra en 3 gráficos los resultados
obtenidos, con las 7 tendencias calculadas y el residuo final.

Figura 4.2.3

49
Figura 4.2.4

Figura 4.2.5

50
4.3 Aplicación de redes neuronales

Una vez que la serie ha sido descompuesta, la próxima tarea es estudiar


una forma adecuada de predecir cada una de las subtendencias. En este caso
se escogió usar redes neuronales por sus ventajosas características ya
explicadas en anteriores capítulos.

El siguiente paso es escoger la topografía y parámetros más adecuados


para nuestras redes neuronales, además de determinar si es necesaria alguna
transformación en los datos y elegir un tamaño para el conjunto de pruebas. En
el modelo desarrollado se ha usado una red neuronal para cada subtendencia
pero todas ellas con las misma configuración. De cualquier manera, esta clase
de modelo permitiría configuraciones más especializadas para cada una de las
subtendencias.

La pregunta inicial a responder es qué tipo de red neuronal se va a


utilizar. En este caso se ha utilizado el perceptrón multicapa por su versatilidad
y sencillez. Más adelante se pretende estudiar también la aplicación de las
redes de función de base radial debido a su capacidad para evitar mínimos
locales.

Una nueva pregunta que puede plantearse es, ¿qué tipo de entrada
recibirá de la red neuronal?

La primera decisión tomada al respecto ha sido la elección de un modelo


univariable. Como ha sido descrito por Huang et al. [HUAN04], gran parte de
los modelos de predicción del mercado de divisas son univariables, recibiendo
como entrada los datos retrasados de la serie a predecir. Esto es debido a que
la cotización de las divisas incluye ya toda la información necesaria para su
estudio según la hipótesis del mercado eficiente de E. Fama [FAMA70].

Seguidamente, se ha optado por un número de valores de entrada


reducido. A cada red neuronal se le pasarán únicamente los 5 últimos valores
de su subtendencia. Esta elección es debido al deseo de que la red neuronal

51
generalice al máximo posible. Incluir excesivos valores puede ser
contraproducente para nuestro interés.

Otra cuestión relevante a decidir es el número de neuronas que


formarán la capa o capas ocultas. De nuevo, un número pequeño de neuronas
servirá mejor a nuestros propósitos ya que de lo contrario se corre riesgo de
sobreajuste. Después de realizar pruebas con topografías de 6, 24 y 150
neuronas en la capa oculta, distribuídas en 1, 2 y 3 capas, se obtuvieron los
mejores resultados en términos de error cuadrado medio con 6 neuronas en 1
única capa oculta.

Tanto las neuronas de la capa oculta como la de salida, usan como


función de transferencia la tangente hiperbólica sigmoidal ya que pruebas con
otras funciones de transferencia dieron resultados insatisfactorios.

Figura 4.3.1

La siguiente pregunta a responder sería, ¿es necesaria alguna


transformación o normalización de los datos de entrada? Shanker et al.
[SHAN96] investigaron la efectividad de métodos de normalización lineales y
estadísticos, encontrando que no necesariamente desembocaban en
resultados superiores. El Shazly et al. [ELSH97] aplicaron normalización y
transformaciones a los datos para después descartarlos. Zhang y Hu [ZHAN98]
no encontraron significativas diferencias entre los resultados usando datos
normalizados y datos originales. Adicionalmente, todas las entradas que
recibirán las redes tendrán valores estacionarios próximos a 0, excepto T1 ya
que es la serie ciclo-tendencia. Por ello se ha descartado realizar
transformaciones o normalizaciones en D7 y T2 a T7. Para el caso de T1 sin

52
embargo sí que se hará una pequeña transformación que consiste en calcular
la diferencia de un valor con el anterior y utilizar el resultado como entrada.

Por último, una de las elecciones que generó diferencias más notables
en los resultados fue la elección de la función de entrenamiento. Las siguientes
funciones fueron probadas:

- Descenso del gradiente.


- Descenso del gradiente con ritmo de aprendizaje adaptativo.
- Descenso del gradiente con momento.
- Descenso del gradiente con ritmo de aprendizaje adaptativo y momento.
- BFGS Cuasi-Newtoniana.
- Regularización bayesiana.
- Gradiente conjugado con reinicios de Powell-Beale.
- Gradiente conjugado con actualizaciones de Fletcher-Reeves.
- Gradiente conjugado con actualizaciones de Polak-Ribiere.
- Levenberg-Marquardt.
- Secante de un paso.
- Entrenamiento de orden incremental aleatorio.
- Retropropagación resistente.

De entre ellas, la función de entrenamiento de Levenberg-Marquardt


obtuvo los mejores resultados, conjugando el error medio cuadrado más bajo
con una buena velocidad de entrenamiento.

4.4 Resultados y conclusiones

Una vez entrenadas las redes neuronales con el conjunto de


entrenamiento, se analizan a continuación los resultados.

El método para calcular la bondad de la predicción escogido es el error


medio absoluto. Esto es debido a la relación directa que tiene con el retorno
esperado de las predicciones si se operara en el mercado usándolas como
directriz. Es común en la literatura usar este error como estimador de la bondad

53
de la predicción. Algunos otros trabajos que lo usan son entre otros los de Billio
et al. [BILL00]

Como referencia a superar su error, se comparará con el modelo del


paseo aleatorio, del que algunos estudios, como los de Meese y Rogoff
[MEES83], han demostrado su dificultad para ser superado.

La siguiente tabla muestra el error medio absoluto de cada una de las


redes neuronales, registrado en 1000 períodos, prediciendo individualmente la
tendencia en la que está especializada:

Tendencia E.M.A. Paseo aleatorio E.M.A. Red neuronal Reducción


T2 2.6229e-005 3.0566e-006 88%
T3 4.3889e-005 6.6982e-006 85%
T4 6.5105e-005 1.6515e-005 75%
T5 1.2448e-004 4.0213e-005 68%
T6 1.9178e-004 9.4219e-005 51%
T7 2.7094e-004 1.9432e-004 28%
D7 6.7791e-004 5.2050e-004 23%
Tabla 4.4.1

Como se puede observar, los resultados son ampliamente satisfactorios


a la hora de predecir las subtendencias de forma individual.

El siguiente paso es hallar el sumatorio de las predicciones y calcular el


error medio absoluto global de la superpredicción. Aquí sin embargo nos
encontramos un resultado ciertamente sorprendente: el error medio absoluto
del paseo aleatorio es inferior al error de la superpredicción.

E.M.A. paseo aleatorio global = 8.0982e-004


E.M.A. superpredicción = 8.5938e-004

El resultado es ciertamente inesperado. Buscando las razones para que


se produzca este incremento en el error al realizar el sumatorio, es encontrada

54
una fuerte correlación entre los errores de las predicciones individuales, lo que
hace que al sumarlas se amplifique el error final.

Correlación
Error P7 – Error P8 0.9689
Error P6 – Error P7 0.9830
Error P5 – Error. P6 0.9887
Error P4 – Error P5 0.9958
Error P3 – Error P4 0.9971
Error P2 – Error P3 0.8856

No están todavía claras las causas de esta elevada correlación, que


merece un estudio en mayor profundidad y requiere experimentación.

55
5. Combinación de modelos de pre-
dicción de valores extremos

En este capítulo se expondrá el desarrollo llevado a cabo hasta alcanzar


una conclusión positiva sobre un modelo de predicción de cierres, máximos y
mínimos del tipo de cambio USD/JPY en períodos de un día.

5.1 Introducción: análisis estadístico de precios


máximos, mínimos y de cierre

Desde el influyente trabajo de Meese y Rogoff [MEES83], es


ampliamente aceptado que los precios de cierre o retornos de los tipos de
cambio siguen un modelo de paseo aleatorio. Sin embargo, la predicción de
máximos y mínimos en un determinado período ha recibido inferior atención a
pesar de ostentar utilidad práctica.

La predicción de máximos y mínimos está relacionada con la forma en la


que los operadores del mercado realizan operaciones basadas en el análisis
técnico. Las predicciones podrían ser utilizadas como puntos de referencia
para soportes y resistencias usados por los operadores. Por otro lado, desde
un punto de vista econométrico, las series de máximos y mínimos tienen
características particulares que hacen que no encajen de forma ortodoxa con
los modelos habituales. Representan valores extremos alcanzados a lo largo
del día y son observadas en períodos no equidistantes. Por ello, según Billio et
al. [BILL00], pueden ser caracterizadas por familias no-estándar de
distribuciones de probabilidad dimensional finita, lo que justifica el uso de
modelos no-lineales, como son las redes neuronales.

56
Función de Autocorrelación (ACF)
Uno de los estadísticos que más información aporta para identificar
posibles modelos de predicción para una serie es la función de autocorrelación
(ACF).

Si comparamos Yt (el valor observado en t) con Yt-1 observaremos como


de relacionados están dos valores consecutivos de una serie. Si calculamos la
correlación entre una serie y ella misma con un retraso de un período, estamos
hallando su autocorrelación a un período. La fórmula es la siguiente:

∑ (Y − Y )(Yt t −k −Y )
rk = t = k +1
n

∑ (Y − Y )
t =1
t
2

Ecuación 5.1.1

Si realizamos la autocorrelación con retrasos 1, 2, 3... y tantos períodos


como queramos, con todos estos valores juntos tenemos la función de
autocorrelación (ACF).

Esta función nos ayuda a ver si valores previos de la serie contienen


información relevante sobre el siguiente valor o si, por el contrario, los valores
pasados carecen de relación con los valores futuros. Debido a que la
distribución de los coeficientes de autocorrelación se aproxima a una curva
normal con media cero y error estándar 1/ n , a menudo se utiliza el valor

±1,96 / n como referencia (conocido como valor crítico) para considerar


autocorrelaciones relevantes, lo que significa que el 95% de los coeficientes de
autocorrelación deberían de estar dentro de esos límites si fuera una serie
aleatoria.

Es habitual dibujar la función de autocorrelación en un correlograma en


el que se grafica con líneas verticales los coeficientes de autocorrelación para
cada retraso y con dos líneas horizontales el valor de referencia positivo y
negativo para considerar las correlaciones relevantes. A continuación se puede

57
observar el correlograma del precio de cierre del USD/JPY en períodos de un
día durante los 20 primeros retrasos:

Figura 5.1.2 – ACF de CIERRES de USD/JPY (períodos de un día)

En esta figura se puede ver que ningún retraso de los precios de cierre
tiene una correlación elevada como para poder ser suficientemente interesante
para explicar el próximo valor.

A continuación se muestra la ACF (con hasta 20 retrasos) de los valores


máximos diarios:

Figura 5.1.3 – ACF de MÁXIMOS de USD/JPY (períodos de un día)

58
En este caso sí hay una correlación suficientemente fuerte con la serie
retrasada un período, lo que da una idea de que se encontrará información
valiosa en el primer retraso para hacer predicciones del próximo valor.

Seguidamente, se continúa dibujando la ACF de los precios mínimos


diarios, con 20 retrasos:

Figura 5.1.4 – ACF de MÍNIMOS de USD/JPY (períodos de un día)

En esta función de autocorrelación, no hay un único valor destacado


sino hasta 3 coeficientes de autocorrelación que sobrepasan los valores
críticos y que por lo tanto deben ser tenidos en cuenta a la hora de establecer
un modelo de predicción. Se recuerda que los valores críticos representan un
intervalo en el que deberían de estar el 95% de los coeficientes si la serie fuera
ruido blanco; en este caso no se alcanza esa cifra sino únicamente el 85%, lo
que hace pensar que, en la serie de mínimos, hay información importante del
futuro que se puede extraer del pasado.

Función de autocorrelación parcial (PACF)

En el caso de que haya una autocorrelación entre el valor en t y en t-1,


también podría caber esperar que hubiera algún tipo de relación entre t-1 y t-2,
así como entre todos los períodos que tuvieran el mismo único retraso de

59
diferencia entre sí. Es por ello por lo que se usa la función de autocorrelación
parcial (PACF), que nos permite medir el grado de asociación entre Yt y Yt-k
cuando los efectos de los retrasos 1, 2, 3, ... , k – 1 son eliminados.

A continuación se puede observar la PACF de la serie de mínimos que


se ha estudiado anteriormente:

Figura 5.1.4 – PACF de MÍNIMOS de USD/JPY (períodos de un día)

Como se puede deducir del correlograma, hay información adicional


sobre el futuro más allá del primer retraso. Particularmente significativos son
los retrasos 3 y 11.

Tests de portmanteau: Ljung-Box-Pierce

Los tests de portmanteau son un método para comprobar si un conjunto


de coeficientes de autocorrelación son significativamente diferentes al conjunto
que cabría esperar de una serie de ruido blanco.

Uno de estos tests es el que está basado en el estadístico Q de Box-


Pierce, después revisado por Ljung y Box [LJUN78]. Siendo rk los coeficientes
de autocorrelación, L el máximo retraso, y N el número de valores observados,
el estadístico Q se desarrolla como sigue:

60
Ecuación 5.1.5

Aunque originalmente se concibió para probar que los residuos de un


modelo de predicción eran ruido blanco y no se podía mejorar el modelo,
también puede ser utilizado para probar si una serie puede ser predecible. Si la
serie es ruido blanco, el estadístico Q tiene una distribución chi cuadrado con
(L - m) grados de libertad, siendo m el número de parámetros en el modelo (en
el caso de que no se haya probado ningún modelo, 0).

En el caso de la serie de cierres para 20 retrasos y el 1% de


significación, se acepta la hipótesis nula, ya que el estadístico Q es igual a
22,6761 mientras que el valor crítico basado en la distribución chi cuadrado es
37,5662.

Sin embargo, para la serie de máximos con los mismos parámetros se


rechaza la hipótesis nula, siendo Q 59,4729 frente al mismo valor crítico.

En el caso de la serie de mínimos el estadístico Q es aún superior,


69,6126, rechazándose de nuevo la hipótesis nula y denotando una mayor
información sobre el próximo valor mínimo en los 20 primeros retrasos que en
el caso de la serie de máximos.

Conclusión del análisis estadístico de los máximos, mínimos y cierres

Como ha sido revelado con las diferentes herramientas utilizadas, se


puede concluir que el pasado de la serie de cierres del USD/JPY contiene poca
información sobre el futuro. Sin embargo la situación es más esperanzadora
para las series de máximos y mínimos. Principalmente en el caso de los
mínimos los retrasos anteriores parecen ser especialmente relevantes.

61
5.2 Predicciones basadas en retrasos
consecutivos

Usando como entradas los valores de retornos diarios retrasados de las


series de cierres, máximos y mínimos, se ha construido dos grupos de
perceptrones multicapa: el primero recibe como entradas los 5 últimos retrasos
de la serie mientras que el segundo recibe los 20 últimos retrasos, todos ellos
consecutivos.

En estas redes neuronales se ha usado una capa oculta con 5 neuronas


y una neurona en la capa de salida, la función de entrenamiento de Levenberg-
Marquardt y 250 épocas para el aprendizaje.

Los datos utilizados han sido los valores normalizados de retornos de


cierre, máximo y mínimo diario del tipo de cambio USD/JPY desde el 5-Ene-
1998 hasta 28-Feb-2007, haciendo un total de 2380 períodos de operativa. La
forma de calcular el retorno diario es la siguiente:
Yt − Yt −1
rett =
Yt −1

Como conjunto de entrenamiento se ha usado aproximadamente los primeros


dos tercios de los datos (1600 períodos). El conjunto de validación son los
siguientes períodos.

5.2.1 – 5 retrasos inmediatos como entrada

En el apartado anterior se ha podido ver como en la serie de cierres no


había ningún coeficiente de autocorrelación notable en los primeros 20
retrasos, en la de máximos era notable el coeficiente del retraso 1 y en la de
mínimos alcanzaban los valores críticos los retrasos 1, 3 y 11. Por ello, se ha
decidido entrenar 3 perceptrones multicapa que reciben como entradas cada
uno los 5 primeros retrasos de cada serie, ya que en esos retrasos hay 0

62
autocorrelaciones relevantes en los cierres, 1 en los máximos y 2 en los
mínimos.

Como medición de la precisión se ha usado el error absoluto medio


(siendo EAMT el valor para el conjunto de entrenamiento y EAMV para el
conjunto de validación ) y el porcentaje de aciertos de la dirección del
movimiento (δT y δV). A continuación se muestra una tabla con comparaciones
de estos valores normalizados para las predicciones de las redes neuronales
(P) y la predicción del paseo aleatorio (RW) usado como referencia.

Pcierres RWcierres Pmáximos RWmáximos Pmínimos RWmínimos


EAMT 0,0800 0,0837 0,0708 0,0741 0,0523 0,0545
EAMV 0,0676 0,0673 0,0613 0,0608 0,0417 0,0419
δT 52,405 49,52 55,39 55,65 56,43 54,33
δV 47,95 48,37 50,86 52,985 54,77 53,78
Tabla 5.2.1 – Precisión de predicciones con 5 retrasos

Como podemos observar, solamente en el caso de la predicción de


mínimos se obtienen resultados consistentemente mejores que los del paseo
aleatorio.

5.2.2 – 20 retrasos inmediatos como entrada

Cuando son estudiados los 20 primeros retrasos en las respectivas ACF,


se puede observar que en el caso de los mínimos hay 3 coeficientes, en vez de
2 como anteriormente, que superan el valor crítico, mientras que en los cierres
y los máximos se mantiene el mismo número de autocorrelaciones relevantes
que las ya encontradas en los 5 primeros retrasos. También hay que tener en
cuenta que algunos coeficientes de los 20 primeros retrasos en estas series, a
pesar de no alcanzar los valores críticos, sí se aproximan bastante por lo que
es posible que el perceptrón multicapa encuentre nuevas relaciones y
patrones.

De la misma forma que en el modelo anterior, a continuación se


muestran las mediciones de precisión de las nuevas predicciones basadas en

63
perceptrones multicapa que reciben como entrada esta vez los 20 últimos
retrasos:

Pcierres RWcierres Pmáximos RWmáximos Pmínimos RWmínimos


EAMT 0,0733 0,0837 0,0637 0,0741 0,0460 0,0545
EAMV 0,0724 0,0673 0,0668 0,0608 0,0437 0,0419
δT 58,76 49,52 59,14 55,65 57,32 54,33
δV 47,87 48,37 50,26 52,985 50,5 53,78
Tabla 5.2.2 – Precisión de predicciones con 20 retrasos

Como puede observarse en los resultados, aunque las predicciones


dentro del conjunto de entrenamiento son francamente mejores que las
conseguidas mediante el paseo aleatorio o las redes neuronales con 5
entradas, fuera de muestra la precisión se reduce dramáticamente. Para
ninguna de las series se consigue una mejora consistente respecto al paseo
aleatorio. Puede ser concluido que hay un cierto sobreajuste en las
predicciones debido al aumento del número de entradas.

Podemos deducir, como se enunció en el capítulo 2, que no siempre es


positivo para la precisión añadir más datos de entrada en las redes neuronales,
si no que pocos datos pero con altos coeficientes de autocorrelación son más
adecuados

5.3 Predicciones basadas en retrasos con altos


coeficientes de autocorrelación

A raíz de la conclusión obtenida en el apartado anterior, una


aproximación distinta al problema ha sido buscada a través de un cambio en la
selección de entradas para las redes neuronales. En vez de utilizar entradas
formadas por los retrasos inmediatamente anteriores al período a predecir, se
ha realizado una selección de los retrasos con mayores coeficientes de
autocorrelación en un horizonte de 300 períodos en un modelo y de 150
períodos en el otro.

64
5.3.1 – Predicción basada en ACF

El primer modelo consiste en buscar los 3 retrasos con mayor valor en la


ACF de 300 períodos de su serie. En los correlogramas se ha utilizado como
valores críticos +/-3σ, implicando una confianza del 99,74%.

A continuación son mostradas a título orientativo las funciones ACF de


las serie de máximos, mínimos y cierres a 300 períodos:

Figura 5.3.1 – ACF de MÁXIMOS (izq.) y MÍNIMOS (dcha.)

Figura 5.3.2 – ACF de CIERRES

En el caso de la serie de cierres, fueron elegidos los retrasos 93, 115 y 263
como entradas. Sólo este último sobrepasa el valor crítico.

En los máximos, las entradas seleccionadas fueron los retrasos 1, 94 y


248. Tanto el retraso 1 como el 94 son significativos con respecto al valor
crítico.

En la serie de mínimos, los tres retrasos seleccionados como entradas


sobrepasan el valor crítico. Estos fueron el 1, 3 y 40.

65
Después del entrenamiento, se obtuvieron los siguientes resultados del
análisis de precisión:

Pcierres RWcierres Pmáximos RWmáximos Pmínimos RWmínimos


EAMT 0,0827 0,0837 0,0720 0,0741 0,0522 0,0545
EAMV 0,0674 0,0673 0,0612 0,0608 0,0415 0,0419
δT 53,09 49,52 56,21 55,65 56,28 54,33
δV 54,01 48,37 52,71 52,985 55,91 53,78
Tabla 5.3.3 – Precisión de predicciones basadas en ACF

Comparando estos resultados con los de la tabla 5.2.1, que era la que
mejores resultados había arrojado hasta el momento, se puede observar que
para todas las series se ha conseguido una mejora consistente en las
predicciones del conjunto de validación. Especialmente interesante es la
mejora en la predicción de dirección del movimiento de la serie de cierres, que
supera ampliamente a la predicción del paseo aleatorio. El error absoluto
medio también se ha visto reducido para todas las series, aunque sólo la
predicción de mínimos obtiene un error inferior al del paseo aleatorio. Esto
coincide con los resultados de la predicción del apartado 5.2.1.

5.3.2 – Predicción basada en PACF de cuadrados

En este modelo se buscan los 5 retrasos con mayor coeficiente en la


PACF de los 150 primeros períodos del cuadrado de las series. Se usa la
PACF en vez de la ACF ya que se ha percibido influencia de las
autocorrelaciones en los valores inmediatamente próximos a un retraso con
alto coeficiente de autocorrelación. El objetivo de este modelo es realizar
predicciones teniendo en cuenta relaciones en la volatilidad de la serie.

A continuación se grafican las funciones de autocorrelación parcial con


los valores críticos en +/-3σ (99,74% de confianza):

66
Figura 5.3.4 – PACF de los cuadrados de MÁXIMOS (izq.) y MÍNIMOS (dcha.)

Figura 5.3.5 – PACF de los cuadrados de CIERRES

En todas las funciones de autocorrelación parcial hay valores


fuertemente destacados de los cuáles se eligieron los 5 con mayor valor
absoluto. En el caso de la serie de cierres fueron elegidos los retrasos 1, 2, 68,
80 y 128. En el de la serie de máximos 1, 21, 59, 80 y 101. Y en la de mínimos
1, 18, 80, 81 y 128.

En la siguiente tabla se puede ver la precisión de las predicciones


obtenidas mediante este modelo:

Pcierres RWcierres Pmáximos RWmáximos Pmínimos RWmínimos


EAMT 0,0809 0,0837 0,0709 0,0741 0,0525 0,0545
EAMV 0,0674 0,0673 0,0619 0,0608 0,0418 0,0419
δT 52,53 49,52 54,78 55,65 55,65 54,33
δV 52,84 48,37 53,6 52,985 53,71 53,78
Tabla 5.3.5 – Precisión de predicciones basadas en PACF de cuadrados

Se puede observar que los resultados son mixtos comparándolos con


las predicciones anteriores. El δV de Pmáximos es el mejor conseguido hasta el
momento. En el caso de Pcierres este valor es sensiblemente superior al del
paseo aleatorio pero inferior al mejor conseguido hasta el momento (el del
apartado 5.3.1). El EAMV es el mejor conseguido hasta el momento en la serie
de cierres, mientras que en los demás es mejorable.

67
La principal ventaja de estas predicciones es que aportan una
aproximación distinta al estar basadas en relaciones de la volatilidad, lo que
puede resultar útil en un modelo de combinación de predicciones.

5.4 Mejoras mediante la función de entrena-


miento cuasi-newtoniana BFGS
Aunque la función de entrenamiento de Levenberg-Marquardt ha
obtenido habitualmente los mejores resultados tanto en velocidad como
precisión en los perceptrones multicapa entrenados hasta el momento en este
proyecto, se han conseguido mejoras en algunos de los anteriores modelos
usando la función de entrenamiento cuasi-newtoniana BFGS (en honor a
Broyden, Fletcher, Goldfarb y Shanno).

El paso básico del método de Newton es:

Ecuación 5.4.1

siendo el vector de pesos actuales, el gradiente actual y la matriz


hessiana del índice de rendimiento con los pesos actuales de la red neuronal.
Debido al coste computacional de la matriz hessiana, son usados los métodos
cuasi-newtonianos que aproximan el valor de la matriz hessiana iterando. Éste
es el caso de la función de entrenamiento BFGS.

5.4.1 – Mejoras en el modelo de 5 retrasos inmediatos

A continuación se muestran las mejoras en la precisión conseguidas en


las series de cierres y mínimos (no ha habido mejoras para la serie de
máximos) mediante BFGS respecto al algoritmo de Levenberg-Marquardt. Para
una mejor comprensión los errores han sido multiplicados por 10.000.

Pcierres Pmínimos
Nuevo Anterior Nuevo Anterior
EAMT 821,92 800,5 521,64 522,82
EAMV 671,90 676,42 415,23 416,77

68
δT 50,09 52,405 56,86 56,43
δV 53,36 47,95 56,07 54,77
Tabla 5.4.2

En el caso de las nuevas predicciones de cierres, se puede observar


que incluso por primera vez se supera consistentemente los resultados del
paseo aleatorio (ver tablas de los anteriores apartados). También se observa
una mejora en la capacidad de generalización de la red neuronal, ya que
aunque en el conjunto de entrenamiento se obtienen peores resultados que
con la anterior función, los resultados son más estables en la validación.

5.4.2 – Mejoras en la predicción basada en la ACF


En la serie de máximos se han conseguido mejoras significativas,
mostrándose el siguiente cuadro comparativo:

Pmáximos
Nuevo Anterior
EAMT 723,85 720,46
EAMV 605,87 612,31
δT 56,06 56,21
δV 54,47 52,71
Tabla 5.4.3

También aquí por primera vez es conseguida una mejora significativa en


todas las mediciones con respecto al paseo aleatorio.

5.4.3 – Mejoras en la predicción basada en la PACF de los cuadrados

Pcierres Pmáximos
Nuevo Anterior Nuevo Anterior
EAMT 797,55 809,5 728,25 709,06
EAMV 671,93 674,47 607,69 619,14
δT 52,49 52,53 52,89 54,78
δV 50,19 52,84 51,89 53,6
Tabla 5.4.4

En este caso, aunque haya habido una reducción en la precisión de la


predicción de dirección del movimiento, sí se ha conseguido un aumento de la
precisión en criterios de error absoluto medio, consiguiéndose en este modelo
un error menor al del paseo aleatorio para las series de cierres y máximos.

69
5.5 Combinación de predicciones – Conclusiones
Tras observar las correlaciones entre los errores de los distintos
modelos se pudo comprobar como probablemente al combinar las predicciones
se obtendrían resultados superiores. Es por ello por lo que se estudió de forma
exhaustiva las posibles combinaciones a realizar, de las que se mostrarán en
este apartado las que obtuvieron los resultados óptimos.

Para ello se ha tenido en cuenta no sólo las posibles combinaciones de


modelos sino también los resultados de aplicar una combinación de tipo lineal
(una regresión múltiple) confrontada con una de tipo no-lineal como es una red
neuronal.

En el cálculo de las combinaciones se ha usado para la estimación de


los parámetros, en el caso de la regresión, o el entrenamiento de la red
neuronal el conjunto de los 1600 primeros valores, anteriormente utilizado para
el entrenamiento, y para la medición de la precisión, los valores restantes (el
conjunto de validación).

5.5.1 – Combinación de predicciones de cierres

En la serie de cierres los mejores resultados han sido obtenidos


mediante una regresión múltiple entre las predicciones realizadas en los
apartados 5.3.1, 5.4.1 y 5.4.3:

Pcierres = 0.0020 + 0.9657·P5.3.1 + 0.2620·P5.4.1 + 0.8665·P5.4.3


Ecuación 5.5.1

En la siguiente tabla se muestra la comparación de la precisión obtenida


con respecto a la mejor predicción anterior (la predicción del apartado 5.4.1)

Pcierres
Combinación Mejor Anterior
EAMT 791,90 821,92
EAMV 671,84 671,90
δT 53,74 50,09
δV 55,27 53,36
Tabla 5.5.1

70
5.5.2 – Combinación de predicciones de máximos

En esta serie también se han obtenido los mejores resultados mediante


un método lineal, una regresión múltiple entre las predicciones de los
apartados 5.4.2 y 5.4.3:

Pmáximos = 0.0008 + 0.6816·P5.4.2 + 0.7103·P5.4.3


Ecuación 5.5.2

La mejor predicción hasta el momento había sido la calculada en el


apartado 5.4.2. En la siguiente tabla puede ser observado como la regresión
múltiple obtiene una mayor precisión:

Pmáximos
Combinación Mejor Anterior
EAMT 717,66 723,85
EAMV 603,44 605,87
δT 56,33 56,06
δV 55,78 54,47
Tabla 5.5.2

5.5.3 – Combinación de predicciones de mínimos

A diferencia de las anteriores series, la serie de mínimos ha sido mejor


predicha mediante una combinación no-lineal de predicciones realizada a
través de un perceptrón multicapa de 5 neuronas en una única capa oculta y
una neurona en la capa de salida.

Las entradas que recibe la red neuronal son las predicciones para el
siguiente período calculadas mediante los modelos de los apartados 5.3.1,
5.4.1 y un modelo como el del apartado 5.3.2 pero con función de
entrenamiento BFGS que no ha sido descrito en el apartado 5.4 ya que no
obtenía mejoras significativas con respecto a su predecesor entrenado con la
función Levenberg-Marquardt.

71
A continuación se muestran los datos de precisión comparados con los
obtenidos en el modelo del apartado 5.4.1 (hasta ahora la predicción óptima):

Pmínimos
Combinación Mejor Anterior
EAMT 513,72 521,64
EAMV 414,04 415,23
δT 57,16 56,86
δV 56,38 56,07
Tabla 5.5.3

72
6. Modelo de predicción de centro y
radio

Los valores extremos de un período de una serie temporal pueden ser


tratados como datos de tipo intervalo los cuáles pueden ser definidos por un
centro y un radio. Este enfoque ha obtenido buenos resultados en la predicción
de series temporales, como se puede ver en Muñoz, Maté, Arroyo y Sarabia
[MUÑO07]. Las dos variables centro y radio pueden ser predichas mediante
modelos diferentes que mejor capturen sus características propias. En este
capítulo se explicará el desarrollo de un modelo de predicción que combinando
modelos de heteroscedasticidad condicional autorregresiva y redes neuronales
obtiene mejoras significativas en la predicción.

6.1 Características de la distribución y volatilidad


de las series financieras

Las series financieras tienen características especiales que hacen que


sean necesarios modelos específicos para explicar su comportamiento
estadístico.

Una de sus principales características es que la distribución de sus


retornos observados tiene escaso apuntamiento o kurtosis. Comparándola con
una distribución gaussiana se verifica un ensanchamiento de las colas,
aumentando la probabilidad de observar valores extremos.

73
Figura 6.1.1 – Efecto de ensanchamiento de colas

Otras características especiales son las referentes a la volatilidad de la


serie. En este caso, volatilidad significa la varianza condicional de los retornos
del activo subyacente. La volatilidad es una medida importante para la
evaluación del riesgo del activo. Algunas de sus características principales
según Tsay [TSAY02] son:

- Clustering o agrupamiento: fuertes movimientos tienden a ser seguidos


de fuertes movimientos, y cambios débiles tienden a ser seguidos de
movimientos débiles. Una manifestación cuantitativa de este hecho es
que aun siendo los retornos incorrelacionados entre sí, sus cuadrados
suelen mostrar una correlación positiva que decrece en el tiempo como
se puede observar en la siguiente figura:

Figura 6.1.2 – PACF de los retornos diarios al cuadrado de USD/JPY

74
- La volatilidad evoluciona en el tiempo de una forma continua.
Habitualmente los saltos en volatilidad son atípicos.
- La volatilidad no diverge a infinito. Suele variar en un rango más o
menos fijo, lo cual quiere decir estadísticamente hablando que a
menudo la volatilidad es estacionaria.

Para contemplar estas características, en 1982 Engle desarrolló el


modelo de heteroscedasticidad condicional autorregresiva (ARCH)
[ENGL82], al que le siguieron varios modelos adicionales que introdujeron
diferentes mejoras.

6.2 Modelos de heteroscedasticidad condicional

6.2.1 El modelo ARCH

La idea básica del modelo ARCH [ENGL82] es que el retorno at

corregido por la media es serialmente incorrelacionado pero dependiente, y


que la dependencia de at puede ser descrita por una función cuadrática simple
de sus valores pasados. Un modelo ARCH(m) contempla que
at = σ t ε t ,
σ t2 = α 0 + α1at2−1 + ... + α m at2− m ,
donde {ε t } es una secuencia de variables aleatorias independientes e

idénticamente distribuidas (iid) con media 0 y varianza 1 (habitualmente se


considera que sigue una distribución normal o t-Student).

A través de las ecuaciones del modelo se puede observar que grandes


variaciones pasadas al cuadrado implicarán una elevada varianza condicional,
tal como se ha descrito anteriormente que reaccionan los mercados. Esta
característica es similar al clustering o agrupamiento de volatilidad.

Por otro lado, de acuerdo a Tsay [TSAY02], para estudiar el


comportamiento de las colas, es necesario que el cuarto momento de at sea

finito. Asumiendo la normalidad de εt se tiene

75
E (at4 | Ft −1 ) = 3[ E (at2 | Ft −1 )]2 = 3(α 0 + α1at2−1 )2

siendo Ft-1 el conjunto de información disponible en el período t-1.

Por tanto,
E (at4 ) = E[ E (at4 | Ft −1 )] = 3E (α 0 + α1at2−1 )2 = 3E[α 02 + 2α 0α1at2−1 + α12 at4−1 ]

Si at es estacionaria de cuarto orden con m4 = E (at4 ) , entonces

 α 
m4 = 3[α 02 + 2α 0α1Var (at ) + α12 m4 ] = 3α 02  1 + 2 1  + 3α12 m4
 1 − α1 

Por lo que,
3α 02 (1 + α1 )
m4 =
(1 − α1 )(1 − 3α12 )

lo que implica que, si el cuarto momento de at es positivo, α1 debe satisfacer la

1
condición 0 ≤ α12 < ; y que la kurtosis incondicional de at es
3
E (at4 ) 3α 02 (1 + α1 ) (1 − α1 ) 2 1 − α12
= × = 3 >3
[Var (at )]2 (1 − α1 )(1 − 3α12 ) α 02 1 − 3α12

Por ello, el exceso de kurtosis de at es positivo y la distribución de la

cola de at es más abultada que la que cabría esperar de una distribución

normal. De esta forma los modelos ARCH se ajustan más a la realidad de las
series financieras, recogiendo así otra de las características vistas en el
apartado 6.1.

6.2.2 El modelo GARCH

A pesar de que el modelo ARCH es sencillo, a menudo requiere muchos


parámetros para describir con aceptable precisión la volatilidad de algunos
activos financieros. Ello conduce a modelos ARCH de orden elevado que
complican el cálculo con numerosos parámetros. Por ello se desarrollaron
modelos adicionales que cubrían las debilidades de ARCH. Uno de los más

76
prácticos es GARCH (heteroscedasticidad condicional autorregresiva
generalizada), resultado de los estudios de Bollerslev [BOLL86].

GARCH asume que la volatilidad puede ser descrita por un modelo


ARMA (media móvil autorregresiva) de la siguiente forma

at = σ t ε t ,
m s
σ t2 = α 0 + ∑ α i at2−i + ∑ β jσ t2− j
i =1 j =1

para un modelo GARCH(m,s).

Sin embargo, especificar el orden de un modelo GARCH no es sencillo.


En la práctica se utilizan solamente modelos GARCH de orden bajo como
GARCH(1,1), GARCH(1,2) y GARCH(2,1). La estimación de los parámetros del
modelo se suele hacer por máxima verosimilitud.

6.2.3 Otros modelos de la familia ARCH

A lo largo de los años diferentes investigadores han ido desarrollando


nuevos modelos de tipo ARCH para contemplar características adicionales de
las series temporales financieras. Un breve resumen con otros 3 modelos
adicionales, según Maté y Oliva [MATE03] es mostrado a continuación:

Modelo Autores Año Especificación de la varianza Contribución


principal
IGARCH Engle y 1989 σ t2 = α 0 + β1σ t2−1 + (1 − β1 )Yt −21 Persistencia en
Bollerslev la varianza
condicional.
Modelo clave en
la métrica del
riesgo.
EGARCH Nelson 1991 ln(σ t2 ) = (1 − α1 )α 0 + α1 ln(σ t2−1 ) + g (ε t −1 ) Para procesos
no normales.
Carácter
asimétrico.
Recoge el efecto

77
apalancamiento.
GJR- Glosten et 1993 σ t2 = α 0 + βσ t2−1 + αε t2−i + αt −iε t2−i Diferenciación
GARCH al. del parámetro en
subida y en
bajada. Mayor
robustez a datos
extremos.

Aunque estos modelos son útiles en determinadas circunstancias, el


modelo GARCH(1,1) ha mostrado gran persistencia en muchas series
temporales a pesar de su simplicidad. Particularmente para tipos de cambio
Hansen y Lunde [HANS05] estudiaron cual sería el modelo de la familia ARCH
que mejor predicción de la volatilidad tendría; su conclusión es contundente: de
330 modelos diferentes, GARCH(1,1) era el que mejor resultados obtenía
siempre para tipos de cambio.

6.3 Análisis de intervalo

El análisis de intervalo es un área introducida por Moore en 1966


[MOOR66], la cual asume que las observaciones de los datos en el mundo real
o sus estimaciones son habitualmente incompletas o inciertas, por lo que no
representan los datos reales de forma exacta. Por ello para obtener precisión
los datos deben ser representados como intervalos que comprenden los
valores reales. Algunos estudios, como Muñoz et al. [MUÑO07], han mostrado
que el uso de datos de tipo intervalo en la predicción de series temporales es
prometedor.

Un intervalo puede ser representado por su límite superior e inferior, de


la forma A = [a L , aU ] , o de forma equivalente, por su punto medio y radio, como

a L + aU a L − aU
A = a C , a R , donde aC = y aR = .
2 2

78
En el caso del mercado de divisas, el límite superior e inferior de un
intervalo diario corresponderían con el máximo y el mínimo diario alcanzado. El
modelo que se expone en este capítulo busca predecir ese intervalo en la
forma centro y radio.

6.4 Predicción del radio mediante la volatilidad

El tamaño del intervalo de cotización (o radio) de una serie financiera


está directamente relacionado con su volatilidad implícita. En la siguiente figura
se grafica el radio de los intervalos diarios de la serie USD/JPY frente a σt de la
misma serie:

Figura 6.4.1 – Radio vs. Sigma

Como se puede observar en la figura, el radio del intervalo se podría


definir como una medida tosca de la volatilidad (y viceversa).

Según Hansen y Lunde [HANS05], GARCH(1,1) es insuperable para


predecir la volatilidad de los tipos de cambio, por lo que se ha optado por este
popular modelo para hacer las predicciones de la volatilidad. Hay literatura
enorme acerca de la bondad de las predicciones de volatilidad de modelos de

79
la familia ARCH. Es por ello por lo que se ha considerado un modelo popular
como GARCH(1,1) que en numerosas ocasiones ha sido demostrado ser una
opción adecuada para series financieras debido, entre otras cosas, a su
parsimonia.

Siendo el radio φt del intervalo, calculado de la siguiente forma:


φt = (Ymax-Ymin)/2,
se ha obtenido un ratio κ, entre el radio y el valor de sigma a lo largo de la serie
estudiada del USD/JPY con el valor que sigue:

κ= ∑φ t
= 5,8879
∑σ t

Una vez halladas las predicciones de la volatilidad para cada período,


estas son corregidas con el factor κ para obtener así una predicción del radio.
El resultado es el siguiente:

Figura 6.4.2 – Radio (rojo) vs. Predicción radio con garch (azul)

Para medir la bondad de esta predicción se ha usado la U-Theil,


calculada de la siguiente forma:

80
2
 Yˆ − Y 
∑  t +1 Y t +1 
U=  t 
2
 Yt +1 − Yt 
∑ Y 
 t 
Si el valor de U es mayor que 1, la precisión es peor que la de la
predicción consistente en usar el último valor observado como próximo valor
predicho (conocida también como predicción ingenua o predicción del paseo
aleatorio). Si es inferior a 1 entonces la precisión supera a la predicción del
paseo aleatorio por lo que es un buen modelo.

En este caso se han obtenido las siguientes medidas de precisión:

MAE (error abso- MSE (error cua- U-Theil


luto medio) drático medio)
Predicción GARCH 0,1976 0,0965 0,8367
Paseo aleatorio 0,2543 0,1378 1
Tabla 6.4.3 – Precisión de la predicción del radio

Según se puede contemplar en la tabla, la predicción GARCH nos es útil


para predecir el valor del radio en el siguiente período ya que se obtiene una
precisión sensiblemente superior a la obtenida mediante el modelo de paseo
aleatorio.

6.5 Combinación de predicciones de radio


mediante EWMA

Habitualmente modelos diferentes tienen comportamientos mejores


comparados unos con otros en diferentes instantes de una serie temporal. Una
buena forma de aprovecharse de esa situación es ponderar más un modelo
cuando está en “buena racha” y reducir su ponderación cuando otro modelo
está obteniendo mejores resultados. Esta es la idea básica de Shin y Sohn
[SHIN07], que desarrollan un sistema de combinación de predicciones que
pondera éstas según el rendimiento reciente que hayan tenido. Basándose en
este sistema de combinación, se ha combinado una predicción del radio
mediante GARCH con otra mediante redes neuronales.

81
Para realizar la combinación se deseaba tener más en cuenta la
precisión que cada uno de los dos modelos estaba obteniendo recientemente
que su precisión histórica. Por ello se ha utilizado un alisado exponencial o
media móvil exponencial (EWMA, exponentially weighted moving average) del
error porcentual absoluto (APE, average percentual error):

EWMAi ,t = λ APE + (1 − λ ) EWMAi ,t −1

en el que λ debe ser calculado por experimentación (a mayor λ más


ponderación tendrá la precisión reciente).

Una vez calculado el EWMA de cada modelo, se debe asignar los pesos
w que va a tener cada predicción de la siguiente manera:

EWMAi−,t1
wi ,t = N

∑ EWMA
i =1
−1
i ,t

siendo N el número total de predicciones a combinar, en este caso 2.

Por último, las predicciones se combinan según el valor de los pesos


calculados:
N
Yˆcombinada = ∑ wi ,t yˆti
i =1

De esta forma, el modelo que obtiene mejores rendimientos recientes es


favorecido frente al que obtiene resultados más mediocres, consiguiéndose
una óptima combinación dinámica según las circunstancias.

En la siguiente tabla se puede comparar la precisión obtenida por el


modelo GARCH individual frente a la precisión obtenida mediante la
combinación basada en EWMA:
MAE MSE U-Theil

Predicción GARCH 0,1976 0,0965 0,8367


Predicción 0,1914 0,0859 0,7897
combinada EWMA
Tabla 6.5.1 – Precisión de la predicción GARCH frente a la combinación

82
Como se puede observar, se obtiene una mejora significativa de la
precisión. Especialmente relevante es la reducción de la U-Theil.

6.6 Predicción del centro mediante perceptrón


multicapa

Para la predicción del centro se ha seguido una aproximación similar al


problema a la de anteriores capítulos. Al perceptrón multicapa se le pasa como
entradas los retornos diarios del centro del intervalo de cotización. En este
caso recibe los retrasos 1, 3 y 40 de los centros, aunque la aplicación
desarrollada al final de este proyecto hace predicciones también recibiendo los
5 últimso retrasos inmediatos de la serie de centros.

A continuación se muestran datos sobre la precisión de la predicción en


el conjunto de validación:

MAE MSE U-Theil


Predicción centro 0,3609 0,2100 0,9538
Paseo aleatorio 0,3780 0,2308 1
Tabla 6.6.1 – Precisión de la predicción del centro

6.7 Resultados y conclusiones de la predicción


del intervalo
Uniendo la predicción del centro y el radio de los apartados anteriores,

se obtiene la predicción del intervalo en la forma A = a C , a R . Si pasamos


estos valores a la forma A = [a L , aU ] , se obtiene la predicción del máximo y
mínimo diario. Calcular la precisión de estas predicciones se puede hacer por
alguno de los métodos habituales para predicciones de valores puntuales. A
continuación se muestra una tabla con la precisión de la predicción de
máximos:

83
MAE MSE U-Theil
Predicción 0,3736 0,2312 0,879
máximos
Paseo aleatorio 0,4094 0,2992 1
Tabla 6.7.1 – Precisión de la predicción de máximos

Como se puede observar, este modelo obtiene una precisión superior a


la de los modelos mostrados anteriormente en este proyecto. Más aún, la U-
Theil obtenida es significativamente mejor a la de varios modelos de predicción
publicados en diferentes artículos. Seguidamente se muestra una tabla
comparativa:

Predicción Meade Shin & Sohn Fernández-


centro-radio [MEAD02] [SHIN07] Rodríguez et
GARCH+RN al. [FERN99]*
U 0,8790 0,9886 0,9633 0,811 , 0,908
Tabla 6.7.2 – Comparativa U-Theil

En el caso de la predicción de Fernández-Rodríguez se muestran dos


valores: el mejor y el siguiente mejor. Se debe tener en cuenta que el estudio
versaba sobre 9 tipos de cambio dirigidos (y no en libre flotación), los cuales
además todos han desaparecido, y que, aunque uno de los tipos de cambio
(florines holandeses, sustituido por el euro hace 8 años) obtuvo una medida de
U-Theil muy buena, el siguiente tipo de cambio mejor obtuvo un valor muy
superior, y tres tipos de cambio a los que se les aplicó el mismo modelo
obtuvieron U-Theil mayores que 1.

Otro artículo interesante para comparar es Billio et al. [BILL00] ya que se


centra también en la predicción de valores extremos diarios. Sin embargo este
artículo no muestra como medida de precisión la U-Theil y sólo muestra
información sobre el error medio absoluto (MAE). Por ello para la comparación
se ha calculado una U-Theil modificada denominada U*, hallada de la siguiente
forma:

84
MAEP
U* =
MAERW

El resultado es el siguiente:

Predicción centro- Billio et al. (2000)


radio GARCH+RN
U* 0,9126 0,9481
Tabla 6.7.3 – Comparativa U*

De nuevo se puede observar como el modelo desarrollado en este


capítulo obtiene mejores resultados.

En el Apéndice B se ha construido una tabla con los valores predichos y


los observados de una muestra que comprende los últimos 30 días del histórico
de USD/JPY utilizado para las pruebas de este modelo. De este modo el lector
puede comprobar con datos reales la bondad de las predicciones.
Adicionalmente se muestra una figura a continuación con la evolución de una
U-Theil a 60 días durante los 800 días de cotización del conjunto de validación
(de 2-3-2004 a 26-2-2007), pudiéndose observar la fiabilidad a lo largo del
periodo:

Figura 6.7.4 – Evolución de U-Theil a 60 días durante el período de validación

85
A la vista de los resultados obtenidos, puede concluirse que combinando
dos modelos distintos para contemplar dos características específicas de los
tipos de cambio, en este caso volatilidad (el radio, predicho con GARCH) y
dirección del movimiento (el centro, predicho con redes neuronales), se
consiguen resultados muy superiores a los obtenidos mediante un enfoque
menos completo.

86
7. Interfaz de usuario para el modelo
de predicción

Se ha programado una interfaz gráfica para MATLAB para aplicar el


modelo de predicción desarrollado en el capítulo 6. Aunque el modelo está
pensado y sólo da predicciones precisas a un día (el día actual), la aplicación
también muestra predicciones a 5 días (el día actual más 4 días posteriores),
pero se debe tener en cuenta que éstas carecen de garantías de precisión. A
continuación se documenta su funcionamiento.

7.1. Entorno de programación

La interfaz ha sido desarrollada mediante el potente lenguaje


matemático MATLAB y el lenguaje multiplataforma JAVA. La parte gráfica se
ha construido mediante el entorno de desarrollo GUIDE de MATLAB.

7.2. Módulos de la aplicación

• Archivo principal para la conexión al servidor de cotizaciones y


lanzamiento de interfaces y módulos de predicción: prediccion.m
• Código MATLAB para el cálculo de predicciones:
o Predeurus1d.m, predusdjp1d.m, predusdch1d.m, predgbpus1d.m,
predeurgb1d.m
• Ficheros MATLAB para la administración de las interfaces gráficas:
o Welcome.m
o Predgui.m
• Ficheros MATLAB de estructura y disposición de las ventanas gráficas:
o Welcome.fig
o Predgui.fig
• Paquete JAVA de la API de OANDA:
o Oanda_fxtrade.jar

87
• Archivo de variables de MATLAB con la red neuronal ya entrenada lista
para ser usada por la aplicación: redes1dcentroradio.mat

7.3. Instalación y lanzamiento de la aplicación

Los pasos a seguir para la instalación de la aplicación son los siguientes:

1. Descomprimir el fichero prediccion.zip en un directorio a la elección del


usuario. Ej.: c:\prediccion
2. Arrancar MATLAB.
3. Seleccionar como directorio de trabajo el que contiene los ficheros de la
aplicación. Ej.:

4. Escribir en la línea de comandos de MATLAB el comando “prediccion”.

Nota: la versión de MATLAB debe contener las toolbox de GARCH, Neural


Network y Financial.

88
7.4. Uso de la aplicación

Después de la pantalla de bienvenida, la aplicación arranca mostrando


los últimos 260 días de cotización de los tipos de cambio EUR/USD y
USD/JPY:

Los gráficos mostrados para las cotizaciones son del tipo HLC (high,
low, close), en color azul. Este tipo de gráfico muestra para cada período una
barra vertical cuyo límite superior es el máximo del día, el inferior es el mínimo
y una pequeña barra horizontal intermedia es el cierre.

Se puede interactuar con las siguientes secciones:

Currencies

Muestra los posibles tipos de cambio a graficar y el número de períodos


a ser mostrados. Se pueden graficar simultáneamente hasta 5 tipos de cambio.
Estos aparecerán en el panel derecho de gráficos al pulsar el botón “Show”.

89
El número de períodos máximos a seleccionar es 260.

El usuario debe tener en cuenta que cada vez que se presione el botón
“Show” el panel de gráficos se borrará, eliminándose los gráficos de
predicciones si los hubiera, y mostrando únicamente los gráficos de las divisas
seleccionadas.

Forecasting models

Presionando el botón “Calculate” la aplicación calculará las predicciones


de máximos y mínimos históricas, las del día de hoy y las de los 4 días
siguientes (aunque hay que tener en cuenta que sólo los predicciones del día
de hoy son fiables, pues son las únicas que obtienen medidas de precisión
buenas), de las divisas que se muestran en ese momento en el panel de
gráficos. Estas predicciones están basadas en el modelo de predicción
GARCH+RN para centro y radio desarrollado en este proyecto. El cálculo
puede tardar unos minutos, dependiendo del número de divisas seleccionadas.
Los resultados se graficarán en el panel de gráficos, mostrándose con una
línea verde la predicción de máximos y con una línea roja la predicción de
mínimos. En el título de cada gráfico se muestran además los valores
numéricos de las predicciones para el día de hoy, especificándose con una
eme mayúscula (“M”) el máximo y una eme minúscula (“m”) el mínimo.

A continuación se muestra el resultado del cálculo de la predicción para


EUR/USD y USD/JPY:

90
En esta misma sección se puede observar también un menú
despegable. Este menú está pensado para futuras ampliaciones y el usuario no
le debe prestar mayor atención.

Calculate accuracy ranking (all rates)

Pulsando este botón el sistema realizará cálculos sobre la precisión de


las predicciones en los 5 tipos de cambio mostrados y seguidamente mostrará
un ránking con los valores de U-Theil calculados para las predicciones a un
día (el día actual), obtenidos para las 5 divisas, ordenados de menor a mayor.
Estos valores de U-Theil son para las predicciones de los últimos 30 días, y no
para el período seleccionado o el histórico completo. Es así pues un indicador
de en qué divisas están haciéndose más aciertos en las últimas semanas.

Se debe tener en cuenta que el cálculo puedo durar unos minutos. A


continuación se muestra el resultado que mostraría:

91
7.5. Correcto funcionamiento y resolución de
problemas

Se debe tener en cuenta que para ejecutar la aplicación se requiere


conexión a Internet, pues las cotizaciones son descargadas en tiempo real a
través del servidor externo de Olsen and Associates (oanda.com).

Cuando en la línea de comandos de MATLAB se ejecuta el comando


“prediccion” en la ventana de comandos se irá mostrando el estado de la
conexión con oanda.com. Cuando la conexión se realiza con éxito, los
mensajes mostrados serán como los siguientes:

NET: 13:10:49 fxclient.login(): new session. logging in...


NET: 13:10:49 login(): PROXY - creating new Net Connection...
NET: 13:10:49 login(): host: fxgame-api.oanda.com
NET: 13:10:49 login(): port: 80
NET: 13:10:49 login(): PROXY - creating new Net Connection... Done!
NET: 13:10:49 login(): opening secure connection...
NET: 13:10:49 login(): opening secure connection... Done!
NET: 13:10:49 login(): making login request for user gabro84...

92
NET: 13:10:49 SecureConnection.write(): New session, begin key
negotiations...
NET: 13:10:50 SecureConnection.write(): New session, key negotiation
complete!
NET: 13:10:50 login(): making login request... Done!
INF: 13:10:50 login(): creating rate table...
INF: 13:10:50 login(): creating rate table... Done!
Descargando histórico de cotizaciones...

Estos mensajes se mostrarán en color negro. Sin embargo, si ocurren


errores en la conexión, puede que se muestren los siguientes mensajes en
color rojo:

NET: 10:42:17 fxclient.login(): new session. logging in...


NET: 10:42:17 login(): PROXY - creating new Net Connection...
NET: 10:42:17 login(): host: fxgame-api.oanda.com
NET: 10:42:17 login(): port: 80
NET: 10:42:17 login(): PROXY - creating new Net Connection... Done!
NET: 10:42:17 login(): opening secure connection...
NET: 10:42:19 login(): opening secure connection... Done!
NET: 10:42:19 login(): making login request for user gabro84...
NET: 10:42:19 SecureConnection.write(): New session, begin key
negotiations...
***: 10:42:40 SecureConnection.open(): caught:
java.net.ConnectException: Connection timed out: connect
***: 10:42:40 dorpc(): caught: java.net.ConnectException: Connection
timed out: connect
NET: 10:42:40 logging out
***: 10:42:40 fxclient.login(): caught:
com.oanda.fxtrade.api.SessionDisconnectedException: Connection timed
out: connect
INF: 10:42:40 session.destroy()
??? Java exception occurred:
com.oanda.fxtrade.api.SessionDisconnectedException: Connection timed
out: connect

at com.oanda.fxtrade.api.e.a(Unknown Source)

at com.oanda.fxtrade.api.FXClient.login(Unknown Source)
.

Error in ==> prediccion at 14


fxclient.login('gabro84', 'upcomillas');

En ese caso se debe comprobar si la conexión a Internet funciona


adecuadamente. Si ésta funciona correctamente, puede que el servidor de
oanda.com esté ocupado y esté rechazando nuestra conexión. Para
solucionarlo simplemente intentar de nuevo ejecutar el comando “prediccion”,
tantas veces como sea necesario hasta conseguir conexión con oanda.com.

93
Por último, una vez obtenida la conexión, es posible que tras un tiempo
de inactividad, la conexión con oanda.com se pierda. Los mensajes que se
mostrarán en la ventana de comandos serán similares a los siguientes:

***: 13:13:43 SecureConnection.open(): caught:


java.net.ConnectException: Connection timed out: connect
***: 13:13:43 dorpc(): caught: java.net.ConnectException: Connection
timed out: connect
NET: 13:13:43 logging out
INF: 13:13:43 User.destroy()
INF: 13:13:43 Account.destroy()
INF: 13:13:43 RateTable.destroy()

De nuevo en este caso para solucionarlo, se debe reiniciar la aplicación


ejecutando otra vez el comando “prediccion”.

94
III. Planificación y
presupuesto

95
1. Planificación

A continuación se muestra el diagrama GANT de la planificación del


proyecto:

1. Revisión del estado del arte y documentación sobre tipos de cambio y


mercados de divisas.

2. Revisión del estado del arte y documentación sobre métodos de predicción.


Análisis y estudio estadístico de series de tipos de cambio.

3. Desarrollo del modelo de predicción basado en descomposición en


subtendencias (capítulo II-4).

3. Desarrollo del modelo de predicción de combinación de redes neuronales


para predicción de valores extremos basado en autocorrelaciones
significativas en las series (capítulo II-5).

4. Desarrollo del modelo de predicción de centro y radio basado en GARCH y


redes neuronales (capítulo II-6).

5. Implantación de la interfaz gráfica.

6. Documentación de los modelos de predicción

96
2. Presupuesto del proyecto

El presupuesto de este proyecto ha sido desglosado según tres tipos de


costes, que serán descritos en los siguientes apartados. Estos costes son:

• Costes de ingeniería
• Inversiones y costes materiales
• Servicios y mantenimiento anual

2.1 Costes de ingeniería

Para valorar los costes de ingeniería se debe tener en cuenta que la


naturaleza del proyecto exige conocimientos multidisciplinares amplios. Estos
conocimientos están englobados en la denominada ingeniería financiera, que,
según Wikipedia [WIKI07] engloban matemáticas financieras, métodos
numéricos y simulación informática, además de profundización en teoría
económica. Adicionalmente se requieren también conocimientos específicos de
inteligencia artificial, propios de la ingeniería superior en informática. Es por ello
por lo que ha sido estimado un coste de 45€ por hora de trabajo.

El tiempo empleado en el proyecto se muestra a continuación:

• Documentación preliminar: 50 horas.


• Entrevistas: 20 horas.
• Análisis de los datos: 50 horas.
• Desarrollo y programación: 300 horas.
• Pruebas y depuración: 150 horas.
• Documentación: 50 horas.

97
El total de horas trabajadas es 620 horas, equivalente a
aproximadamente 77 días laborables con jornadas de 8 horas.

Por ello, el coste final de ingeniería asciende a 27.900€.

2.2 Inversiones y costes materiales

Las inversiones son principalmente dos: el equipo informático y el


software matemático MATLAB. Dada la alta carga computacional, para el
equipo informático es necesaria una elevada velocidad de proceso y es
recomendable disponer de suficiente memoria RAM para operar con vectores y
matrices de gran tamaño.

• Dell Precision 390, Intel Core Duo E6600, 2 GB RAM: 1.349€


• MATLAB: 2.000€
o Statistics toolbox: 1.100€
o Neural network toolbox: 1.100€
o GARCH toolbox: 1.100€

Total inversiones y costes materiales: 6.649€

2.3 Servicios y mantenimiento anual

El principal coste anual será el derivado del uso del servicio API de
OANDA (Olsen and Associates). Adicionalmente se ofertará un servicio de
mantenimiento de la herramienta de predicción.

• API de OANDA: 500€/mes


• Mantenimiento de la aplicación de predicción: 300€/mes

Total servicios y mantenimiento anual: 9.600€/año

98
2.4 Presupuesto final

La suma de los anteriores apartados genera un presupuesto total de


44.549€.

99
3. Herramientas utilizadas en el
desarrollo del proyecto

Se ha hecho uso de las siguientes herramientas:

- El software matemático MathWorks MATLAB v. 7.1.0.246 y las toolbox que


continúan: GARCH toolbox, Artificial Neural Network toolbox y Financial
toolbox.

- Bases de datos de históricos de cotizaciones de divisas, a destacar la base


de datos de VCG VisualChart v. 3 de la que el alumno es suscriptor.

- Hojas de cálculo Microsoft Excel v. 9.0.2812 para el tratamiento de los


históricos de cotizaciones.

- La plataforma de operaciones FXTrade de Olsen And Associates Ltd.


(OANDA) para reproducir condiciones de operativa real en los mercados. La
plataforma FXTrade es una de las más potentes del mercado, ofreciendo
acceso directo al mercado interbancario, con operativa en 33 pares de divisas
además del mercado al contado de oro y plata, todo ello en tiempo real.
OANDA cedió gratuitamente su API (que habitualmente tiene un coste de
$600/mes) para los fines de investigación de este proyecto.

- JAVA v. 1.4.1.

100
IV. Conclusiones y
desarrollos futuros
101
1. Conclusiones

El estudio realizado en este proyecto comprende tres modelos originales


diferentes que obtienen variados resultados. Son el resultado de una
profundización en el estado del arte de la predicción de tipos de cambio. A
pesar de la consideración habitual de que los tipos de cambio siguen un
modelo de paseo aleatorio difícilmente batible, al menos uno de los modelos ha
sido capaz de obtener resultados consistentes y generalizados tanto para
distintos tipos de cambio como para diferentes períodos de actuación.

Algunas de las conclusiones que pueden ser extraídas son:

1. Los precios de cierre diarios de las series de tipos de cambio tienen una
elevada componente de aleatoriedad. No así los valores extremos del
día, los máximos y mínimos diarios. Difícilmente se obtienen
autocorrelaciones significativas en la serie de cierres mientras que
sucede lo contrario en los máximos y mínimos. Esto provoca que sea
más plausible obtener información sobre el futuro observando las series
de máximos y mínimos que la de cierres.
2. La parsimonia es clave a la hora de obtener un modelo de predicción
preciso capaz de generalizar. Aplicado a las redes neuronales esto
significa utilizar arquitecturas lo más sencillas posibles, con un número
reducido de entradas. En cuanto a la familia ARCH, el modelo
GARCH(1,1) es de los más sencillos posibles y sin embargo a menudo
es el que mayor precisión obtiene, habiendo incluso estudios que lo
califican contundentemente como insuperable para los tipos de cambio.
3. Las series temporales financieras como son los tipos de cambio son
complejas y habitualmente hay aspectos que no pueden ser capturados
por un único modelo. Es útil, y casi se puede decir que obligatorio,
utilizar más de un modelo de predicción para aproximar los diferentes
aspectos de las series financieras. Seguidamente se pueden combinar
los distintos modelos con un método dinámico como el basado en
EWMA del capítulo 6.

102
4. La predicción de datos de tipo intervalo es prometedora y aporta un
enfoque relativamente poco explorado en la predicción de tipos de
cambio. El modelo desarrollado en el capítulo 6 es un ejemplo de
aumento considerable de la precisión mediante el uso de intervalos
expresados en forma de centro y radio.
5. Mediante la interfaz de usuario creada para facilitar el uso del modelo de
predicción de centro y radio, se pueden realizar predicciones en otros
tipos de cambio a parte del estudiado en esta memoria, obteniéndose
precisión satisfactoria. Esto demuestra una capacidad generalizadora
del modelo muy práctica.

103
2. Desarrollos futuros

1. Respecto al modelo del capítulo 4, una tarea interesante sería


profundizar en el estudio de las causas de la correlación entre los
errores de las predicciones de las diferentes subtendencias. En este
proyecto no se ha encontrado una explicación sencilla a esta
correlación; teniendo en cuenta que la correlación entre las
subtendencias es cercana a 0, no es trivial acceder a una conclusión
sobre el motivo por el que la correlación entre los errores de sus
predicciones es próxima a 1.
2. En el modelo del capítulo 6, aunque la predicción de los radios se hace
mediante combinación de dos modelos, la predicción de los centros se
hace usando exclusivamente una red neuronal. Utilizar modelos
adicionales de predicción para el centro posiblemente mejore la
precisión.
3. Es habitual encontrar correlaciones entre los diferentes tipos de cambio
por lo que se debería valorar la posibilidad de mejorar las predicciones
mediante modelos que contemplen más tipos de cambio
simultáneamente. El uso de GARCH multivariante sería una opción a
valorar para aumentar la precisión de las predicciones de radio del
capítulo 6.
4. Contemplar medidas adicionales de valoración de los modelos. Hay
extensa literatura sobre este tema.
5. La interfaz gráfica creada para MATLAB actualmente sólo realiza
predicciones con el modelo del capítulo 6. Sin embargo está pensada
para trabajar con varios modelos de predicción y ampliarla sería
relativamente sencillo.

104
V. Bibliografía
[BILL00] Billio M., Sartore D., Toffano C., Combining forecasts: some
results on exchange and interest rates, The European Journal of
Finance, 6, (2000) 126

[BLAN04] Blanchard, O.: Macroeconomics. Pearson Prentice Hall, New


Jersey. 2004.

[BOLL86] Bollerslev T. 1986. Generalized autoregressive heteroskedasticity.


Journal of Econometrics 31: 307–327.

[CASS23] Cassel, G.: Tract on Monetary Reform. London: T. F.


Unwin. 1923.

[ELSH97] M. R. El Shazly and H. E. El Shazly, Comparing the forecasting


performance of neural networks and forward exchange rates,
Journal of Multinational Financial Management 7 (1997) 345–356.

[ENGL82] Engle RF. 1982. Autoregressive conditional heteroskedasticity


with estimates of the variance of U.K. inflation. Econometrica 45:
987–1007.

[EPIS96] A. Episcopos and J. Davis, Predicting returns on Canadian


exchange rates with artificial neural networks and EGARCHM-M
model, Neural Computing and Application 4 (1996) 168–174.

[FAMA70] E. F. Fama,Efficient Capital Markets: A Review of Theory and


Empirical Work. The Journal of Finance, Vol. 25, No. 2, Papers
and Proceedings of the Twenty-Eighth Annual Meeting of the
American Finance Association New York, N.Y. December, 28-30,
1969 (May, 1970), pp. 383-417.

105
[FANG94] Fang, H., Lai, K.S. y Lai, M.: Fractal Structure in currency Future
Price Dynamics. 169-181. 1994

[FERN99] Fernández-Rodríguez, F., Sosvilla-Rivero, S. and Andrada-Félix,


J. Exchange-rate forecasts with simultaneous nearest-neighbour
methods: evidence from the EMS. International Journal of
Forecasting 15, 383-392. (1999).

[HANS05] Hansen, P.R. and Lunde, A. A forecast Comparison of volatility


models does anything beat a GARCH(1,1)? Journal of Applied
Econometrics 20: 873–889 (2005).

[HSIE91] Hsieh, D. A., 1991. Chaos and nonlinear dynamics: Application to


financial markets. Journal of Finance 46 (5), 1839–77.

[HUAN04] W. Huang, K. K. Lai, Y. Nakamori y Shouyang Wang: International


Journal of Information Technology & Decision Making, Vol. 3, No.
1 (2004) 145-165

[HUTS99] M. Y. Hu and C. Tsoukalas, Combining conditional volatility


forecasts using neural networks: An application to the EMS
exchange rates, Journal of International Financial Markets,
Institutions and Money 9 (1999) 407–422.

[KANG91] S. Kang, An investigation of the use of feedforward neural network


for forecasting, PhD Thesis, Kent State University, Kent, OH
44240, USA, (1991).

[KUAN95] C. M. Kuan and T. Liu, Forecasting exchange rates using


feedforward and recurrent neural networks, Journal of Applied
Econometrics 10 (1995) 347–364.

106
[LEUN00] M. T. Leung, A. S. Chen and H. Dauk, Forecasting exchange rate
using general regression neural networks, Computer and
Operations Research 27 (2000) 1093–1110.

[LISI99] F. Lisi and PA. Schiavo, "A comparison between neural networks
and chaotic models for exchange rate and predictions",
Computational Statistics & Data Analysis, 30, 87-102, (1999).

[LJUN78] Ljung, G.M. and Box, G.E.P.. On a measre of lack of fit in time
series models, Biometrika, 65, 297-303.

[MATE03] Maté, C y Olivas, A: II," Anales de Mecánica y Electricidad. vol.


LXXX, no. I, pp. 56-64, January 2003

[MEAD02] Meade, N. A comparison of the accuracy of short term foreign


exchange forecasting methods. International Journal of
Forecasting 18, 67-83. (2002).

[MEES83] Meese, R. A. and Rogoff, K. S., Empirical exchange rate models


of the seventies: Do they fit out of sample?, Journal of
International Economics 14, (1983) 3-24.

[MOOR66] Moore, R. E. Interval Analysis. Prentice-Hall: Englewood Cliffs,


NJ, 1966.

[MUÑO07] Muñoz A., Maté, C., Arroyo, J. and Sarabia, A. iMLP: Applying
Multi-Layer Perceptrons to Interval-Valued Data. Neural
Processing Letters, Volume 25, Number 2 / Pages 157-169. April,
2007.

[PEEL95] Peel, D. A. y Yadav, P.: Empirical Economics.

[SAMU48] Samuelson, P.A. y Nordhaus, W.D.: Economics. McGraw Hill,


1948.

107
[SHAN96] M. Shanker, M. Y. Hu and M. S. Hung, E_ect of data
standardization on neural network training, Omega 24(4) (1996)
385–397.

[SHIN07] Shin, H. W. and Sohn, S.Y. Application of an EWMA combining


technique to the prediction of currency exchange rates. IIE
Transactions 39, 639-644. (2007).

[SHIS57] Shiskin J., Electronic computers and business indicators, National


Bureau of Economic Research, Ocassional Paper 57.

[SOLA99] So M. K. P., Lam K., Li W. K., Forecasting exchange rate volatility


using autoregressive random variance model, Applied Financial
Economics

[TENT96] Tenti, P: Forecasting Foreign Exchange Rates Using Recurrent


Neural Networks. Applied Artificial Intelligence 10(6): 567-582
(1996)

[TRIE05] Triennial Central Bank Survey. Bank for International Settlements.


Basel, Switzerland. 2005.

[TSAY02] Tsay, R.S. Analysis of Financial Time Series. John Wiley and
Sons, New Jersey. 2002.

[WALC01] S. Walczak, An empirical analysis of data requirements for


financial forecasting with neural networks, Journal of Management
Information System 17(4) (2001) 203–222.

[WALLS06] The Wall Street Journal Europe (2/9/06 p. 20).

[WEIG92] A. S. Weigend, B. A. Huberman and D. E. Rumelhart, Predicting


sunspots and exchange rates with connectionist networks, in

108
Nonlinear Modeling and Forecasting, eds. M. Casdagli and S.
Eubank (Addison-Wesley, Redwood City, CA, 1992), pp. 395–432.

[WEIJ95] W. X. Wei and Z. H. Jiang, Artificial neural network forecasting


model for exchange rate and empirical analysis, Forecasting 2
(1995) 67–69.

[WIKI07] Wikipedia: The Free Encyclopedia


http://www.wikipedia.com

[YAOT00] J. T. Yao and C. L. Tan, A case study on using neural networks to


perform technical forecasting of forex, Neurocomputing 34 (2000)
79–98.

[ZHAN98] G. Zhang and M. Y. Hu, Neural network forecasting of the British


Pound/US Dollar exchange rate, Journal of Management Science
26(4) (1998) 495–506.

109
VI. Apéndices

110
Apéndice A
Análisis estadístico de las series de
tipos de cambio

En este apéndice se muestra el análisis estadístico de las series de


máximos, mínimos y cierres diarios de EUR/USD, USD/JPY, USD/CHF,
GBP/USD, EUR/GBP. Los datos utilizados son valores observados entre 5-1-
1998 y 30-5-2007. La información se muestra en tablas comparativas para
facilitar su manejo. El software utilizado para esta tarea ha sido StatGraphics
de StatPoint Inc.

La información mostrada en cada apartado es la siguiente:


• Resumen estadístico
• Percentiles
• Gráficas:
o Histograma de frecuencias
o Traza de densidad
o Box-Whisker
o Gráfica de probabilidad normal
o Gráfica de cuantiles
o Simetría respecto a la mediana

111
A.1 Análisis de máximos diarios

Resumen estadístico

Máximos
EUR/USD USD/JPY USD/CHF GBP/USD EUR/GBP
Media 1,14168 117,301 1,43918 1,6718 0,660158
Desviación 0,137247 8,88714 0,182467 0,162863 0,0321826
típica
Coeficiente 12,0215% 7,57637% 12,6786% 9,74181% 4,87499%
de varia-
ción
Mínimo 0,8326 102,19 1,1374 1,3802 0,5789
Máximo 1,3681 147,65 1,8313 2,0132 0,7254
Rango 0,5355 45,46 0,6939 0,633 0,1465
Coeficiente -13,0631 14,8615 6,62386 3,56342 -6,03637
de simetría
Kurtosis -9,34041 5,31318 -11,7963 -10,2636 -10,5969

Percentiles

Máximos
EUR/USD USD/JPY USD/CHF GBP/USD EUR/GBP
1,0% 0,8565 103,2 1,1588 1,4137 0,5924
5,0% 0,884 105,37 1,2058 1,4296 0,6081
10,0% 0,9117 106,46 1,2269 1,4481 0,6147
25,0% 1,06 109,75 1,2723 1,559 0,6302
50,0% 1,1684 117,69 1,4052 1,647 0,6695
75,0% 1,2523 121,66 1,59825 1,8149 0,6867
90,0% 1,2993 129,48 1,7046 1,8978 0,6973
95,0% 1,3253 134,15 1,7401 1,9473 0,7038
99,0% 1,352 144,2 1,8006 1,988 0,7151

112
Histogramas y trazas de densidad

Máximos
Tipo de Histograma Traza de densidad
cambio
Histogram Density Trace
600 3

500 2,5
frequency

400 2

density
EUR/USD 300 1,5

200 1

100 0,5

0 0
0,8 1 1,2 1,4 1,6 0,83 0,93 1,03 1,13 1,23 1,33 1,43

_HIGH_ _HIGH_

Histogram Density Trace


800 0,04

600 0,03
frequency

density
USD/JPY 400 0,02

0,01
200

0
0
100 110 120 130 140 150
99 109 119 129 139 149 159
_HIGH_ _HIGH_

Histogram Density Trace


500 2

400 1,6
frequency

density

300 1,2
USD/CHF 200 0,8

100 0,4

0 0
1,1 1,3 1,5 1,7 1,9 1,1 1,3 1,5 1,7 1,9
_HIGH_ _HIGH_

Histogram Density Trace


500 2

400 1,6
frequency

density

300 1,2
GBP/USD 200 0,8
100 0,4
0 0
1,3 1,5 1,7 1,9 2,1 1,3 1,5 1,7 1,9 2,1
_HIGH_ _HIGH_

113
Histogram Density Trace
500 12
10
400

frequency
8

density
300
EUR/GBP 200
6
4

100 2
0
0 0,57 0,61 0,65 0,69 0,73
0,57 0,6 0,63 0,66 0,69 0,72 0,75
_HIGH_
_HIGH_

Gráficas de Box-Whisker y probabilidad normal

Máximos
Tipo de Box-Whisker Probabilidad normal
cambio
Box-and-Whisker Plot Normal Probability Plot
99,9
99

percentage
95
80

EUR/USD 50
20
5
1
0,1
0,83 0,93 1,03 1,13 1,23 1,33 1,43 0,83 0,93 1,03 1,13 1,23 1,33 1,43

_HIGH_ _HIGH_

Box-and-Whisker Plot Normal Probability Plot


99,9
99
percentage

95
80

USD/JPY 50
20
5
1
0,1
100 110 120 130 140 150
100 110 120 130 140 150 _HIGH_
_HIGH_

Box-and-Whisker Plot Normal Probability Plot


99,9
99
percentage

95
80

USD/CHF 50
20
5
1
0,1
1,1 1,3 1,5 1,7 1,9
1,1 1,3 1,5 1,7 1,9
_HIGH_
_HIGH_

114
Box-and-Whisker Plot Normal Probability Plot
99,9
99

percentage
95
80
50
GBP/USD 20
5
1
0,1
1,3 1,5 1,7 1,9 2,1

1,3 1,5 1,7 1,9 2,1 _HIGH_


_HIGH_

Box-and-Whisker Plot Normal Probability Plot


99,9
99

percentage
95
80
50

EUR/GBP 20
5
1
0,1
0,57 0,61 0,65 0,69 0,73
_HIGH_
0,57 0,61 0,65 0,69 0,73
_HIGH_

Gráficas de cuantiles y simetría

Máximos
Tipo de Cuantiles Simetría
cambio
Quantile Plot Symmetry Plot
distance above median

1 0,4
0,8
proportion

0,3
0,6

EUR/USD 0,4 0,2

0,2 0,1
0
0,83 0,93 1,03 1,13 1,23 1,33 1,43 0
0 0,1 0,2 0,3 0,4
_HIGH_
distance below median

Quantile Plot Symmetry Plot


distance above median

1 30

0,8 25
proportion

20
0,6

USD/JPY 0,4
15
10
0,2
5
0
0
100 110 120 130 140 150
0 5 10 15 20 25 30
_HIGH_ distance below median

115
Quantile Plot Symmetry Plot

distance above median


1 0,5

0,8 0,4

proportion
0,6 0,3
USD/CHF 0,4 0,2

0,2 0,1

0 0
1,1 1,3 1,5 1,7 1,9 0 0,1 0,2 0,3 0,4 0,5
_HIGH_ distance below median

Quantile Plot Symmetry Plot

distance above median


1 0,4

0,8 0,3
proportion
0,6
GBP/USD 0,4
0,2

0,1
0,2
0
0
0 0,1 0,2 0,3 0,4
1,3 1,5 1,7 1,9 2,1
distance below median
_HIGH_

Quantile Plot Symmetry Plot

distance above median


1 0,1

0,8 0,08
proportion

0,6 0,06
EUR/GBP 0,4 0,04

0,2 0,02

0 0
0,57 0,61 0,65 0,69 0,73 0 0,02 0,04 0,06 0,08 0,1
_HIGH_ distance below median

116
A.2 Análisis de mínimos diarios
Resumen estadístico
Mínimos
EUR/USD USD/JPY USD/CHF GBP/USD EUR/GBP
Media 1,13223 116,108 1,42451 1,65882 0,65508
Desviación 0,137408 8,7194 0,180071 0,161579 0,0328143
típica
Coeficiente 12,1361% 7,5097% 12,641% 9,74057% 5,00921%
de varia-
ción
Mínimo 0,8227 101,26 1,1286 1,3682 0,5679
Máximo 1,3615 146,03 1,8121 2,0011 0,7204
Rango 0,5388 44,77 0,6835 0,6329 0,1525
Coeficiente -13,0679 13,9958 6,58981 3,63222 -6,72863
de simetría

Kurtosis -9,38539 4,18776 -11,8729 -10,0532 -10,4749

Percentiles

Mínimos
EUR/USD USD/JPY USD/CHF GBP/USD EUR/GBP
1,0% 0,847 102,12 1,1474 1,4004 0,5842
5,0% 0,8766 104,16 1,1936 1,4197 0,6014
10,0% 0,9009 105,46 1,2168 1,4366 0,6093
25,0% 1,0488 108,75 1,25925 1,5483 0,6247
50,0% 1,1566 116,5 1,38735 1,635 0,6645
75,0% 1,2442 120,43 1,5822 1,7989 0,6824
90,0% 1,2907 127,83 1,6841 1,8838 0,6927
95,0% 1,3153 132,71 1,7215 1,9315 0,699

99,0% 1,3428 141,42 1,7821 1,9768 0,7085

117
Histogramas y trazas de densidad

Mínimos
Tipo de Histograma Traza de densidad
cambio

Histogram Density Trace


600 3
500 2,5
frequency

400 2

density
EUR/USD 300 1,5
200 1
100 0,5
0 0
0,79 0,99 1,19 1,39 1,59 0,82 0,92 1,02 1,12 1,22 1,32 1,42
_LOW_ _LOW_

Histogram Density Trace


600 0,04
500
0,03
frequency

400

density
USD/JPY 300 0,02
200
0,01
100
0 0
99 109 119 129 139 149 100 110 120 130 140 150
_LOW_ _LOW_

Histogram Density Trace


600 2
500 1,6
frequency

400
density

1,2
USD/CHF 300
0,8
200
100 0,4

0 0
1 1,2 1,4 1,6 1,8 2 1,1 1,3 1,5 1,7 1,9
_LOW_ _LOW_

Histogram Density Trace


500 2

400 1,6
frequency

density

300 1,2
GBP/USD 200 0,8

100 0,4

0 0
1,3 1,5 1,7 1,9 2,1 1,3 1,5 1,7 1,9 2,1
_LOW_ _LOW_

118
Histogram Density Trace
500 10

400 8

frequency

density
300 6
EUR/GBP 200 4
100 2
0 0
0,56 0,59 0,62 0,65 0,68 0,71 0,74
0,56 0,59 0,62 0,65 0,68 0,71 0,74
_LOW_ _LOW_

Gráficas de Box-Whisker y probabilidad normal

Mínimos
Tipo de Box-Whisker Probabilidad normal
cambio

Box-and-Whisker Plot Normal Probability Plot


99,9
99
95

percentage
80
EUR/USD 50
20
5
1
0,1
0,82 0,92 1,02 1,12 1,22 1,32 1,42 0,82 0,92 1,02 1,12 1,22 1,32 1,42
_LOW_ _LOW_

Box-and-Whisker Plot Normal Probability Plot


99,9
99
percentage

95
80
USD/JPY 50
20
5
1
0,1
100 110 120 130 140 150 100 110 120 130 140 150
_LOW_ _LOW_

Box-and-Whisker Plot Normal Probability Plot


99,9
99
percentage

95
80
USD/CHF 50
20
5
1
0,1
1,1 1,3 1,5 1,7 1,9 1,1 1,3 1,5 1,7 1,9
_LOW_ _LOW_

119
Box-and-Whisker Plot Normal Probability Plot
99,9
99

percentage
95
80
GBP/USD 50
20
5
1
0,1
1,3 1,5 1,7 1,9 2,1 1,3 1,5 1,7 1,9 2,1
_LOW_ _LOW_

Box-and-Whisker Plot Normal Probability Plot


99,9
99

percentage
95
80
EUR/GBP 50
20
5
1
0,1
0,56 0,59 0,62 0,65 0,68 0,71 0,74 0,56 0,59 0,62 0,65 0,68 0,71 0,74
_LOW_ _LOW_

Gráficas de cuantiles y simetría

Mínimos
Tipo de Cuantiles Simetría
cambio
Quantile Plot Symmetry Plot
distance above median

1 0,4

0,8 0,3
proportion

0,6
EUR/USD 0,4
0,2

0,1
0,2

0 0
0,83 0,93 1,03 1,13 1,23 1,33 1,43 0 0,1 0,2 0,3 0,4

_HIGH_ distance below median

Quantile Plot Symmetry Plot


distance above median

1 30

0,8 25
proportion

20
0,6
USD/JPY 0,4
15
10
0,2
5
0 0
100 110 120 130 140 150 0 5 10 15 20 25 30
_LOW_ distance below median

120
Quantile Plot Symmetry Plot

distance above median


1 0,5

0,8 0,4

proportion
0,6 0,3
USD/CHF 0,4
0,2
0,2
0,1
0
0
1,1 1,3 1,5 1,7 1,9
0 0,1 0,2 0,3 0,4 0,5
_LOW_
distance below median

Quantile Plot Symmetry Plot

distance above median


1 0,4

0,8
0,3
proportion

0,6
GBP/USD 0,4
0,2

0,2 0,1

0 0
1,3 1,5 1,7 1,9 2,1 0 0,1 0,2 0,3 0,4
_LOW_ distance below median

Quantile Plot Symmetry Plot

distance above median


1 0,1

0,8 0,08
proportion

0,6 0,06
EUR/GBP 0,4 0,04
0,2 0,02
0 0
0,56 0,59 0,62 0,65 0,68 0,71 0,74 0 0,02 0,04 0,06 0,08 0,1
_LOW_ distance below median

121
A.3 Análisis de cierres diarios
Resumen estadístico

Cierres
EUR/USD USD/JPY USD/CHF GBP/USD EUR/GBP
Media 1,13704 116,722 1,43165 1,66558 0,657578
Desviación 0,137305 8,80939 0,181306 0,162314 0,0325322
típica
Coeficiente 12,0757% 7,54732% 12,6642% 9,74517% 4,94727%
de varia-
ción
Mínimo 0,8282 101,59 1,1303 1,3731 0,5733
Máximo 1,3646 147,16 1,8191 2,0088 0,7221
Rango 0,5364 45,57 0,6888 0,6357 0,1488
Coeficiente -13,0753 14,3553 6,59492 3,60583 -6,43504
de simetría

Kurtosis -9,35821 4,7359 -11,8365 -10,1758 -10,5098

Percentiles
Cierres
EUR/USD USD/JPY USD/CHF GBP/USD EUR/GBP
1,0% 0,8529 102,6 1,1524 1,4075 0,5886
5,0% 0,8808 104,79 1,1989 1,4252 0,6042
10,0% 0,9064 105,93 1,2221 1,4428 0,612
25,0% 1,0537 109,25 1,26665 1,5538 0,6276
50,0% 1,1614 117,17 1,39475 1,6403 0,6669
75,0% 1,2482 121,09 1,58825 1,807 0,6844
90,0% 1,2951 128,72 1,6941 1,8925 0,695
95,0% 1,3205 133,45 1,7307 1,9415 0,7014

99,0% 1,3468 142,57 1,7929 1,9831 0,7116

122
Histogramas y trazas de densidad

Cierres
Tipo de Histograma Traza de densidad
cambio
Histogram Density Trace
600 3
500 2,5
frequency

400 2

density
EUR/USD 300
200
1,5
1
100 0,5
0 0
0,8 1 1,2 1,4 1,6 0,82 0,92 1,02 1,12 1,22 1,32 1,42
_CLOSE_ _CLOSE_

Histogram Density Trace


800 0,04

600 0,03
frequency

density
USD/JPY 400 0,02

200 0,01

0 0
99 109 119 129 139 149 159 100 110 120 130 140 150
_CLOSE_ _CLOSE_

Histogram Density Trace


600 2
500 1,6
frequency

400
density

1,2
USD/CHF 300
200
0,8

100 0,4

0 0
1 1,2 1,4 1,6 1,8 2 1,1 1,3 1,5 1,7 1,9
_CLOSE_ _CLOSE_

Histogram Density Trace


500 2

400 1,6
frequency

density

300 1,2
GBP/USD 200 0,8
100 0,4
0 0
1,3 1,5 1,7 1,9 2,1 1,3 1,5 1,7 1,9 2,1
_CLOSE_ _CLOSE_

123
Histogram Density Trace
500 12

400 10

frequency
8

density
300
EUR/GBP 200
6
4
100
2
0 0
0,56 0,59 0,62 0,65 0,68 0,71 0,74 0,57 0,61 0,65 0,69 0,73
_CLOSE_ _CLOSE_

Gráficas de Box-Whisker y probabilidad normal

Cierres
Tipo de Box-Whisker Probabilidad normal
cambio

Box-and-Whisker Plot Normal Probability Plot


99,9
99

percentage
95
80
50
20
EUR/USD 5
1
0,1
0,82 0,92 1,02 1,12 1,22 1,32 1,42
_CLOSE_
0,82 0,92 1,02 1,12 1,22 1,32 1,42
_CLOSE_

Box-and-Whisker Plot Normal Probability Plot


99,9
99
percentage

95
80
USD/JPY 50
20
5
1
0,1
100 110 120 130 140 150 100 110 120 130 140 150
_CLOSE_ _CLOSE_

Box-and-Whisker Plot Normal Probability Plot


99,9
99
percentage

95
80

USD/CHF 50
20
5
1
0,1
1,1 1,3 1,5 1,7 1,9 1,1 1,3 1,5 1,7 1,9
_CLOSE_ _CLOSE_

124
Box-and-Whisker Plot Normal Probability Plot
99,9
99

percentage
95
80
50
GBP/USD 20
5
1
0,1
1,3 1,5 1,7 1,9 2,1

1,3 1,5 1,7 1,9 2,1 _CLOSE_


_CLOSE_

Box-and-Whisker Plot Normal Probability Plot


99,9
99

percentage
95
80
50
EUR/GBP 20
5
1
0,1
0,57 0,61 0,65 0,69 0,73
0,57 0,61 0,65 0,69 0,73 _CLOSE_
_CLOSE_

Gráficas de cuantiles y simetría

Cierres
Tipo de Cuantiles Simetría
cambio
Quantile Plot Symmetry Plot
distance above median

1 0,4

0,8
0,3
proportion

0,6
EUR/USD 0,4
0,2

0,1
0,2

0 0
0,82 0,92 1,02 1,12 1,22 1,32 1,42 0 0,1 0,2 0,3 0,4
_CLOSE_ distance below median

Quantile Plot Symmetry Plot


distance above median

1 30

0,8 25
proportion

20
0,6
USD/JPY 0,4
15
10
0,2 5

0 0
100 110 120 130 140 150 0 5 10 15 20 25 30

_CLOSE_ distance below median

125
Quantile Plot Symmetry Plot

distance above median


1 0,5

0,8 0,4

proportion
0,6 0,3
USD/CHF 0,4 0,2

0,2 0,1

0 0
1,1 1,3 1,5 1,7 1,9 0 0,1 0,2 0,3 0,4 0,5
_CLOSE_ distance below median

Quantile Plot Symmetry Plot

distance above median


1 0,4

0,8
0,3
proportion

0,6
GBP/USD 0,4
0,2

0,2 0,1

0 0
1,3 1,5 1,7 1,9 2,1 0 0,1 0,2 0,3 0,4
_CLOSE_ distance below median

Quantile Plot Symmetry Plot

distance above median


1 0,1

0,8 0,08
proportion

0,6 0,06
EUR/GBP 0,4 0,04
0,2 0,02
0
0
0,57 0,61 0,65 0,69 0,73
0 0,02 0,04 0,06 0,08 0,1
_CLOSE_ distance below median

126
Apéndice B
Muestra de valores observados y predichos
según el modelo de predicción de centro y radio

A continuación se expone una muestra del histórico utilizado para el


modelo del capítulo 6 con las predicciones y medidas de precisión obtenidas
para la muestra, consistente en los 30 días de cotización del USD/JPY desde
16-1-2007 hasta 26-2-2007.

Predicción Error Predicción


Máximo del día máximo GARCH+ Error^2 ingenua Error p. Error^2 p.
Fecha observado GARCH+RN RN GARCH+RN máximo ingenua Ingenua
20070116 120,77 120,6864 -0,0836 0,00698896 120,61 -0,16 0,0256
20070117 120,88 120,8713 -0,0087 7,569E-05 120,77 -0,11 0,0121
20070118 121,59 121,0046 -0,5854 0,34269316 120,88 -0,71 0,5041
20070119 121,48 121,5176 0,0376 0,00141376 121,59 0,11 0,0121
20070122 121,79 121,7253 -0,0647 0,00418609 121,48 -0,31 0,0961
20070123 121,75 121,956 0,206 0,042436 121,79 0,04 0,0016
20070124 121,79 121,774 -0,016 0,000256 121,75 -0,04 0,0016
20070125 121,3 121,5281 0,2281 0,05202961 121,79 0,49 0,2401
20070126 121,65 120,9755 -0,6745 0,45495025 121,3 -0,35 0,1225
20070129 122,19 122,007 -0,183 0,033489 121,65 -0,54 0,2916
20070130 122 122,2821 0,2821 0,07958041 122,19 0,19 0,0361
20070131 121,74 122,0641 0,3241 0,10504081 122 0,26 0,0676
20070201 120,91 121,4062 0,4962 0,24621444 121,74 0,83 0,6889
20070202 121,54 120,7149 -0,8251 0,68079001 120,91 -0,63 0,3969
20070205 121,17 121,6884 0,5184 0,26873856 121,54 0,37 0,1369
20070206 120,57 121,0128 0,4428 0,19607184 121,17 0,6 0,36
20070207 120,81 120,5279 -0,2821 0,07958041 120,57 -0,24 0,0576
20070208 121,44 120,8827 -0,5573 0,31058329 120,81 -0,63 0,3969
20070209 122,09 121,5988 -0,4912 0,24127744 121,44 -0,65 0,4225
20070212 122,05 122,1575 0,1075 0,01155625 122,09 0,04 0,0016
20070213 121,86 122,2795 0,4195 0,17598025 122,05 0,19 0,0361
20070214 121,37 121,7882 0,4182 0,17489124 121,86 0,49 0,2401
20070215 120,75 121,2656 0,5156 0,26584336 121,37 0,62 0,3844
20070216 119,57 120,1374 0,5674 0,32194276 120,75 1,18 1,3924
20070219 119,73 119,5427 -0,1873 0,03508129 119,57 -0,16 0,0256
20070220 120,35 120,0279 -0,3221 0,10374841 119,73 -0,62 0,3844
20070221 121,19 120,5315 -0,6585 0,43362225 120,35 -0,84 0,7056
20070222 121,64 121,0575 -0,5825 0,33930625 121,19 -0,45 0,2025
20070223 121,63 121,9235 0,2935 0,08614225 121,64 0,01 0,0001
20070226 121,07 121,7267 0,6567 0,43125489 121,63 0,56 0,3136
Suma Suma
error^2 5,52576493 error^2 7,5572

U-Theil 0,855097713

127

Vous aimerez peut-être aussi