Vous êtes sur la page 1sur 52

Una estrategia de arbitraje estadístico.

Tesis

Premio Nacional BMV

Presenta:

El Quant

Mexico D.F. 2012.

1
Índice

1. Introducción……………………………………………………………………………….. 4

2. El modelo…………………………………………………………………………………… 6
6
2.1. Introducción al modelo. ………………………………………………………………………
2.2. Un análisis cuantitativo de los factores de riesgo y neutralidad al mercado…… 7

2.3. Un poco de teoría de componentes principales………………………………….. 9

2.4. Uso de componentes principales como factores de riesgo………………………. 10


12
2.5. Introducción a la teoría del cálculo estocástico. ……………………………………………
15
2.6. El modelo para el residual. …………………………………………………………………

3. La estrategia………………………………………………………………………………. 18
18
3.1. Reversión a la media pura. ………………………………………………………………

3.2. Reversión a la media con la desviación . ………………………………………………


19

4. Los parámetros. ………………………………………………………………………….. 20

5. El portafolio. ………………………………………………………………………………. 23

6. Los datos. …………………………………………………………………………………. 25


26
6.1. Un análisis exploratorio a los datos. …………………………………………………………
30
6.2. El primer eigenportafolio. ………………………………………………………………………

7. Los resultados……………………………………………………………………………… 31

7.1. Sin considerar la desviación . ……………………………………………………………


31

7.2. Considerando la desviación . ……………………………………………………………


34

37
7.3. Los parámetros en el tiempo. …………………………………………………………………
39
8. Algunos comentarios sobre la implementación. ………………………………………………

9. Conclusiones. …………………………………………………………………………….. 40

10. Los algoritmos. …………………………………………………………………………… 41

10.1 Los principales. ……………………………………………………………………… 41

10.2 Los auxiliares. ………………………………………………………………………. 47

Referencias. …………………………………………………………………………………… 53

2
1 Introducción.

La finalidad del arbitraje es aprovechar errores de los mercados para generar ganancias. En el

arbitraje puro no existe riesgo. Un ejemplo típico es si existieran dos bancos donde la tasa de

interés de préstamo de uno sea menor a la tasa de interés de rendimientos que da el otro.
Como uno podría aprovechar esto es pidiendo un préstamo en el primer banco y depositándolo

en el otro. Al final del periodo paga el préstamo y aún tendrá un excedente de dinero generado

por los intereses del otro banco. Es obvio que en la realidad este tipo de casos no suceden.

El arbitraje estadístico ocurre cuando se pretende aprovechar lo que se creen errores de


valuación en los mercados y se espera que se generen ganancias. Es claro que en el arbitraje

estadístico existe el riesgo ya que está basado en especulaciones. En este trabajo se explorará

una estrategia de arbitraje estadístico desarrollada por Avellaneda, M. y Lee, J-H. (2010), se

simulará su desempeño en el mercado de capitales de México y se analizarán los resultados.

La aportación de este tipo de estrategias a los mercados es que por su naturaleza agilizan la

correcta valuación de las acciones, ya que aprovechan los errores de valuación, e incentivan a
que el mercado sea más completo (más acciones y más instrumentos) y más líquido.

Este trabajo está estructurado de la siguiente forma. Consta de 10 capítulos:

 El primer capítulo es esta introducción.

 En el segundo capítulo se desarrolla el modelo que se usará para modelar los

mercados. Primeramente se muestra el modelo en el cual una acción es explicada por

factores de riesgo. Luego se da una propiedad de independencia con el mercado de los

factores de riesgo. En la tercera parte se introduce teoría de componentes principales


ya que éstas se usarán como factores de riesgo. En la cuarta parte se explica cómo se

usan las componentes principales como factores de riesgo. En la quinta parte se

muestra un resultado de cálculo estocástico que se usará en del desarrollo del modelo

del residual en la sexta parte.

 En el tercer capítulo se explica cómo se aplicará la estrategia basada en este modelo.

Consta de dos partes, uno en el que considera una componente idiosincrática de cada

3
acción y otro en el que no.

 El cuarto capítulo explica cómo se estiman los parámetros necesarios para aplicar el

modelo.
 El quinto capítulo explica como se manejará el portafolio de inversión en el que se usa

esta estrategia de arbitraje estadístico.

 En el sexto capítulo se muestran los datos que se usarán para experimentar la

estrategia y también se incluyen un análisis exploratorio de los datos y un análisis al

primer eigenportafolio.

 El séptimo capítulo se muestran los resultados de aplicar la estrategia. Consta de dos


partes, los resultados cuando se considera la componente idiosincrática de las acciones

y los resultados cuando no se considera.

 En el octavo capítulo se dan algunas observaciones de la implementación real de este

portafolio de inversión.

 El noveno capítulo incluye las conclusiones.

 En el décimo capítulo se muestran los algoritmos que se usaron para simular la


estrategia con los datos.

En este trabajo se reúnen conocimientos de programación, economía, estadística y

matemáticas para crear una estrategia de inversión en la BMV que dé rendimientos atractivos y

bajo riesgo. Los conceptos que se usan de estadística y matemáticas no son de fácil
comprensión y se requiere conocimientos avanzados en ambas áreas. Por este punto este tipo

de estrategias no están muy exploradas en México ya que el capital humano que se requiere es

muy especializado. Como las estrategias de arbitraje estadístico agilizan la correcta valuación

de los instrumentos financieros es importante fomentar su uso en México.

4
2 El modelo.

2.1 Introducción al modelo.

“Pairs trading” se considera el predecesor de las estrategias de arbitraje estadístico. La idea

básica es que si y son los precios de dos acciones de emisoras pertenecientes a la misma

industria, o que tienen características similares (un buen ejemplo serían acciones de la misma

empresa que emiten en diferentes países), uno espera que los rendimientos de las dos

acciones se comporten de manera similar. Esta situación se podría modelar a partir de la

siguiente ecuación que relaciona los precios a los tiempos y ; , , y :

ln = ( − )+ ln + , (1)

o en su forma diferencial respecto a t

= + + (2)

donde es un proceso de reversión a la media al que se le llamará el residual. En muchos

casos de interés es muy pequeño comparado con los cambios en el residual por lo que

puede ser ignorado. Esto significa que un portafolio corto-largo sobre estas acciones tenderá a

un equilibrio estadístico. La estrategia que se sigue de esta ecuación es ir un peso largo en la

acción y pesos corto en la acción si es negativo, y viceversa, ir un peso corto en la

acción y pesos largo en la acción si es positivo.

Existe la posibilidad que se espere que una acción dé mejores rendimientos que la otra durante

un periodo de tiempo largo. En esta estrategia no se considerarán esos escenarios.

“Pairs trading” generalizado es analizar las acciones por grupos en vez de por parejas. La idea

es esperar que una acción se comportará de manera similar a un grupo de acciones con

5
características similares.

La estrategia consistirá en un portafolio corto-largo en acciones dependiendo del tamaño y el

signo del residual respecto a las acciones que la están explicando. Es decir, si para una acción

con comportamiento similar a un grupo de acciones , ocurre que el residual es positivo

entonces se tiene que ir corto, e irse largo en caso que el residual sea negativo.

Por lo tanto, el análisis de residuales será de gran importancia en la estrategia. Las señales de

entrada y salida de posiciones de las acciones serán dadas por los residuales del valor de

equilibrio de la acción dado por el grupo de acciones que la explican. La descomposición de la

acción se ve de la siguiente forma:

()
= + + , (3)
=1

( )
donde los términos ,= 1… representan factores de riesgo asociados con el mercado en
consideración. La pregunta que surge de esta ecuación es la siguiente: ¿Qué constituye un

buen conjunto de factores de riesgo? En esta tesis se explora el uso de componentes

principales para construir el conjunto de factores de riesgo.

En la siguiente sección se presenta una definición de portafolio neutral al mercado

2.2 Un análisis cuantitativo de los factores de riesgo y neutralidad al

mercado.

Sean { } los rendimientos de las acciones en periodos de un día (de cierre a cierre). Sea

el rendimiento de un portafolio de mercado (por ejemplo el IPC). Entonces para cada acción se

puede escribir:


= + . (4)

6
Esta ecuación define un modelo de regresión lineal simple sobre los rendimientos de la acción

que contiene un componente sin correlación con el mercado llamado al que le designamos

como rendimiento idiosincrático. De la misma forma podemos considerar una generalización de

este modelo usando varios factores de riesgo ( ), resultando el modelo de regresión lineal

múltiple definido por la siguiente ecuación:


= + . (5)

Un portafolio se dice ser neutral al mercado si la cantidad de pesos { } que se invierten en


cada acción cumplen la siguiente propiedad:

= = 0 = 1,2, … , . (6)

Los coeficientes corresponden a las betas de los portafolios, o a las proyecciones de los

rendimientos de los portafolios en los diferentes factores. De estas dos últimas ecuaciones se

sigue lo siguiente:


= +


= +
=1


= (7)
=1

7
Por lo tanto un portafolio neutral al mercado sólo es afectado por los rendimientos

idiosincráticos.

2.3 Un poco de teoría de componentes principales.

Como se usarán componentes principales como factores de riesgo, en este capítulo se explica

un poco de teoría de componentes principales.

Sea la matriz de datos centrados con n variables se desea encontrar un conjunto más

pequeño de vectores ortogonales { } , ≤ que resuma en mayor porcentaje los datos


(es decir, explique la mayor varianza posible en los datos). Es decir, para el primer vector se

quiere que:

= max [ ] (8)
‖ ‖

y
= max [ ] . (9)
‖ ‖

Ya teniendo , para encontrar los siguientes vectores se extrae la varianza explicada de la

matriz , en general para encontrar el vector k-ésimo se extraen los k-1 vectores anteriores
definiendo

= − . (10)

Entonces para encontrar el vector

= max
‖ ‖ (11)

y
= max . (12)
‖ ‖

8
Si se desea explicar un porcentaje de varianza fijo p entonces se busca un conjunto { } tal

que ∑ ≥ pero ∑ < .

2.4 Uso de componentes principales como factores de riesgo.

Para obtener las componentes principales como factores de riesgo inicialmente se usa la matriz

de precios diarios S de las N acciones a lo largo de M días. Por simplicidad del modelo se
ignorará la existencia de ciclos, es decir, se ignora la posibilidad de un comportamiento

intrínseco distinto de una temporada del año (como podría ser Diciembre) al resto del año. Se

obtiene la matriz de rendimientos de la siguiente forma:

,
, = , (13)
,

donde , es el precio de la acción al tiempo y , es el rendimiento de la acción al

tiempo . Como hay acciones más volátiles que otras se estandariza la matriz de rendimientos.

, −
, = (14)

donde

1
= , (15)

1
= , − . (16)
−1

Entonces los elementos de la matriz de correlación se definen como

9
1
, = , , ,
−1 (17)

donde , están en la posición( , ) de la matriz.

Se hace el análisis de componentes principales sobre la matriz de correlación y ordenamos los

eigenvectores por el orden de sus eigenvalores de manera decreciente:

≥ ≥ ≥ ⋯ ≥ ≥ 0 , (18)

y denotamos sus correspondientes eigenvectores por

( ) ( ) ( ) ( )
= , ,…, = 1, … , . (19)

La cantidad de varianza explicada por cada eigenvalor irá decreciendo, por lo que sólo hay

interés en considerar los eigenvalores que sean significativos. Interesa usar los primeros m

eigenvalores (con sus respectivos eigenvectores) hasta el punto que el resto se puedan
considerar como solamente “ruido”. Se pueden hacer dos enfoques en este tema, usar un

número fijo de eigenvalores, o, usar la cantidad necesaria de eigenvalores para explicar al

menos un porcentaje fijo de varianza.

Sean , , … , < los eigenvalores significativos en el sentido previamente explicado.


A cada uno de estos eigenvalores le corresponde un “eigenportafolio” en el cual la cantidad de

pesos invertida en cada acción se le asigna de la siguiente manera:

( )
( )
= = 1, … , , (20)

por lo que los rendimientos de los eigenportafolios se obtienen como:

( )

, = , = 1, … , . (21)

10
Es fácil ver que los eigenportafolios no están correlacionados entre sí, ya que los

eigenvectores, resultantes del análisis de componentes principales, son ortogonales.

El primer eigenvector está asociado al portafolio del mercado (IPC) en el sentido que los
( )
coeficientes , = 1, … , conservan el mismo signo que los rendimientos promedio del IPC

en el periodo y, a largo plazo, son positivos. Como la cantidad de pesos invertida en cada
( )
( )
acción es de = se observa que es inversamente proporcional a la volatilidad de las

acciones. Esto implica que empresas más grandes tienen mayor peso ya que por lo general las
grandes empresas tienen menor volatilidad en sus acciones. Por lo tanto, este primer

eigenportafolio se comporta similar a un portafolio de mercado (IPC).

2.5 Introducción a la teoría de cálculo estocástico.

En esta sección se resume el capítulo 3.2 de Financial Calculus. An introduction to Derivative

Pricing con el fin de mostrar un resultado que será de ulitidad para la sección siguiente.

Un proceso =( | ≥ 0) es un movimiento Browniano si y sólo si:

 es continuo y = 0.
 ~ (0, ).
 El incremento − ~ (0, ) y si [ , ] ∩ [ , ] = ∅ entonces − y

− son variables aleatorias independientes.

Un proceso de difusión que es de interés en esta tesis es un proceso = ( | ≥ 0) tal que


puede ser escrito de la siguiente forma:

= + + , (22)

11
donde y son funciones continuas tales que

( + | |) < ∞ . (23)

La forma diferencial de este proceso de difusión es

= + . (24)

Si se deseara evaluar la integral ∫ ( ) no es suficiente la integral de Riemman-Stieltjes ya


que si se asume que

( ) = 2 ⟹ = 2 . (25)

Ahora la pregunta es cómo integrar ∫ . Considerando la partición para alguna

n entonces podríamos aproximar la integral por la siguiente suma:

( + 1)
= − . (26)

Nótese que las diferencias dentro del paréntesis son incrementos de un movimiento Browniano,

que por definición tienen media 0 y también se sabe que hay independencia en los incrementos

con el valor en ese punto. Esto implica que todo el término dentro de la sumatoria es de media

0. Aquí hay una contradicción ya que se sabe que la media de es porque esa es la

varianza del movimiento Browniano. Por lo tanto,

12
( ) ≠ 2 . (27)

Es claro ahora que para evaluar la integral ∫ ( ) se deben usar otros medios. Ahora se
intenta aproximar mediante la siguiente suma:

( − 1)
( ) ≈ − . (28)

Usando la misma partición .

Sea
( − 1)

(29)
, = .

Nótese que , es una muestra de variables aleatorias independientes idénticamente

distribuidas donde , ~ (0,1) por lo que la aproximación ahora es

,
( ) ≈ . (30)

,
Por la ley de los grandes números ∑ ⟶ 1 . Por lo tanto,

( ) = (31)

o en su forma diferencial:

( ) = . (32)

Este último resultado servirá para hacer un cálculo en el siguiente capítulo ya que se
presentará la necesitad de integrar una función como ésta.

13
2.6 El modelo para el residual.

Se usará un modelo de tiempo continuo para los precios de las acciones ( ), … , ( ) donde
es el tiempo medido en años desde un punto arbitrario de la base de datos. Basado en el

modelo de varios factores de riesgo, se asume que los rendimientos de las acciones cumplen

con las ecuaciones diferenciales estocásticas siguientes:

( )
= + , ( ) + ( ) (33)
( )

Una forma de estimar los parámetros de esta ecuación es usando el método de mínimos

cuadrados en una discretización de (33). Los estimadores de las ′ son:

( , )
, = , (34)
( )

por lo que la componente idiosincrática de los rendimientos está dada por:

+ ( ) . (35)

Aquí representa la desviación de la componente idiosincrática, i.e., es la diferencia de


los rendimientos en relación a los factores de riesgo en el periodo de observación. El término

( ) se asume que es un proceso estacionario. Usando pruebas estadísticas se puede


probar la hipótesis de que las acciones de interés satisfacen este supuesto.

La idea fundamental de este trabajo es aprovechar este comportamiento para construir una
estrategia de inversión y un portafolio que produzca rendimientos atractivos.

Ahora, es necesario considerar un modelo para el residual ( ), el cual en este trabajo se


considera como un proceso de difusión Ornstein – Uhlembeck definido por la siguiente

ecuación:

( ) = − ( ) + ( ), > 0 . (36)

14
Este proceso es estacionario y autorregresivo. En particular, este proceso cumple con lo

siguiente:
[ ( ) ] = 0 (37)

[ ( ) | ( ) , ≤ ] = − ( ) (38)

La esperanza condicional que se utiliza como el pronóstico de los rendimientos diarios es

proporcional al término − ( ), que además determina su signo ya que > 0.

Los parámetros de la ecuación diferencial estocástica , , y son específicos para

cada acción. Se supone que varían lentamente en el tiempo de interés y que los parámetros

son constantes en una ventana de 60 días, por lo que los parámetros se estiman utilizando

periodos de esa longitud.

Si se asume que los parámetros del modelo son constantes, entonces se puede obtener la

ecuación integral del proceso del residual como:

( ) = − ( ) + ( ).

⇒ ( )+ ( ) = + ( ).

⇒ ( ( )+ ( ) ) = + ( )
∆ ∆ ∆
⇒ ( ( ) ) = + ( )

( ∆ ∆ ( ∆ )
⇒ + ∆ ) = ( ) + (1 − ) + ( ) (39)

Ahora dejando ∆ tender a infinito se observa que

lim [ ( + ∆ )]
∆ →

∆ [ ( )] + ∆ ( ∆ )
= lim − lim + lim ( )
∆ → ∆ → ∆ →

15
y


[ ( ) + ∆ ] = ( ∆ )
( )


( ∆ )
=

( ∆ )
1
=
2
∆ →
(1 − ∆ ) ⎯⎯⎯⎯
=
2 2

Por lo tanto, ( ) tiene una distribución de probabilidad a largo plazo Normal con

[ ( ) ] = (40)

[ ( ) ] = (41)
2

Al parámetro se le llama la velocidad de reversión a la media. Si ≫ 1 significa que la

acción tiene una reversión a la media rápida lo que hace que el efecto de desvío sea

despreciable. En nuestra estrategia, para ser consistentes con el método de estimación, nos

interesarán las acciones tales que:

1
= ≪ . (42)

Ya que sólo se desea considerar acciones cuyo tiempo esperado de reversión a la media sea
menor al tiempo de estimación.

16
3 La estrategia.

Se considera un periodo de estimación de 60 días, i.e. = 60⁄260. Esta ventana de


estimación se incorpora al ciclo de ganancias de una empresa (es decir, es menor a un

trimestre), por lo que se espera que se refleje el modelo en ventanas de ese periodo. Por eso

se elige acciones de reversión rápida a la media ( ≪ ) .

3.1 Reversión a la media pura.

En esta sección se enfoca únicamente en el proceso ( ) ignorando el desvío . Sabemos


que la desviación estándar de equilibro es

, = = . (43)
2 2

Con esto se define la variable s-score como:

( ) − (44)
= .
,

Esta es una variable de posición, nos indica hacia dónde y en qué proporción está alejada la

acción de su punto de equilibrio teórico. Por esto mismo, ésta es la variable señal.

Las reglas básicas de la estrategia son las siguientes:

 Abrir largo si <− ̅


 Abrir corto si >+ ̅
 Cerrar largo si <+ ̅
 Cerrar corto si >−

17
donde abrir largo significa comprar un peso de la acción i y vender (o irse corto) en los factores

de riesgo con , pesos en cada factor de riesgo .

3.2 Reversión a la media con desviación .

En la estrategia anterior se ignora la desviación, es decir, se asume que la desviación es


despreciable en comparación a la reversión a la media. Ahora incorporando la desviación al

valor esperado condicional se obtiene que:

[ + ( ) | ( ) , ≤ ] = + − ( )

= + − ( )

= − , (45)

Esto sugiere que la nueva variable señal a la cual se denominará como s-score modificada sea:

, = − = − . (46)
, ,

Las reglas de la estrategia son las mismas, es decir:

 Abrir largo si , <− ̅


 Abrir corto si , >+ ̅
 Cerrar largo si , <+ ̅
 Cerrar corto si , >−

Se observa que si la desviación es positiva implica que la s-score modificada es menor al

s-score. Es decir, si la desviación es positiva se espera que la acción este desviada


positivamente en esa proporción del punto de equilibrio inicial. Y de forma análoga cuando la

desviación es negativa. También se puede ver que si la s-score es cero entonces la estrategia

se reduce a observar las desviaciones de cada acción, es decir, se reduce a una estrategia de

“momentum”.

18
4 Los parámetros.

Ya se mencionó que

( , )
, = , (47)
( )

por lo que las ′ se calculan con la covarianza y la varianza muestrales. Para calcular las
desviaciones se utiliza el estimador de la constante de un modelo de regresión lineal múltiple

por mínimos cuadrados ordinarios:

( ) ( )
= 260 − , . (48)
( ) ( )

La forma de estimar estos parámetros es bastante intuitiva. El problema es calcular los

parámetros del proceso de difusión de Ornstein – Uhlembeck , y ya que éste es un


modelo en tiempo continuo y solamente tenemos observaciones en tiempo discreto.

Para poder estimar los parámetros , y se discretiza el proceso, donde

( ∆ ∆ ( ∆ )
+ ∆ ) = ( ) + (1 − ) + ( ) (49)

cambia a

= + + = 1, … ,60 , (50)

donde se distribuye (0, [ ]).

Es decir, para estimar estos parámetros se usarán únicamente los últimos 60 días de

observaciones. Entonces tenemos que

19

= (1 − ) , (51)


= (52)

[ ] = (1 − ∆ ) . (53)
2

Para estimar , y [ ] se usa la función de máxima verosimilitud, que es equivalente en


este caso a estimar por regresión lineal con mínimos cuadrados ordinarios sobre las

observaciones. Se eliminan las acciones que tengan una que contenga al 1 en su intervalo

de confianza para asegurar que la acción se modele como se desea. Entonces despejando de

las ecuaciones (51), (52) y (53) se obtiene:

= −260 ∙ log( ) , (54)

= , (55)
1−

[ ]∙2 (56)
= ,
1−

[ ]
, = . (57)
1−

Para calcular el s-score que se definió como

( ) − (58)
=
,

Se usa

20
− −
= . (59)
,

Es decir, mide qué tan desviado está de su predicción. Se usa esta versión de s-score ya que

se encontró que funciona mejor que la original.

21
5 El portafolio.

Hasta ahora solamente se han discutido los tiempos de entrada y de salida de cada posición,

pero no se ha dicho nada de los montos. ¿Se entra con el mismo monto a cada posición?

Mientras se está en una posición, ¿se mantiene el monto de entrada fijo? ¿Se mantiene todo el
capital invertido en las acciones o se tiene una porción bajo una tasa libre de riesgo? Ya dada

una estrategia, encontrar cuál es la forma óptima de manejar un portafolio es un tema más

extenso que el presente trabajo.

Con el fin de ilustrar el funcionamiento de la estrategia a lo largo del periodo y de no


profundizar en el manejo del portafolio se maneja de la siguiente forma:

 Se mantiene todo el capital invertido a menos que no haya posición activa, de ser ese el

caso, no hay capital invertido.


 Se invierte en cada posición 1 proporción del capital, siendo el número de

posiciones que se mantiene.

 Se actualizan diariamente los montos invertidos en cada una de las acciones según lo

que la estrategia establece como monto óptimo.

Expresando esto en forma matemática. Sea ∈ ℤ , siendo el número total de acciones en

consideración, tal que

1 , < − ̅
= 0 − ̅ < , < + ̅ (60)
−1 , > + ̅

Es decir, es un indicador de posición en cada acción.

Sea el vector ∈ ℝ de los rendimientos de cada acción al tiempo ,

22
,
= . (61)
,

Sea la matriz de las betas al tiempo

ℬ , = , , (62)

y sea ∈ ℝ donde es el número de eigenportafolios en uso,

= .

Entonces el rendimiento diario del portafolio al tiempo se puede calcular como

∙ ( − ℬ ∙ )
= . (63)
‖ ‖

ya que representa el rendimiento promedio diario de las posiciones que se mantienen al

tiempo .

23
6 Los datos.

Se usarán 40 acciones que cotizan en la BMV que cumplen cierto criterio de liquidez para

asegurar que pueda funcionar la estrategia. Las acciones que se utilizaron son los siguientes:

Tabla 1 Acciones en consideración


Nombre de accion Emisora Industria
1 AC Arca Continal, S.A.B. de C.V. Consumo Frecuente
2 ALFA 'A' Alfa, S.A.B. de C.V. Industrial
3 ALSEA Alsea, S.A.B. de C.V. Consumo No Basico
4 AMX 'L' America Movil, S.A.B. de C.V. Telecomunicaciones
5 ARA Consorcio Ara, S.A.B. de C.V. Industrial
6 ASUR 'B' Grupo Aeroportuario del Sureste Industrial
7 AUTLAN 'B' Compañía Minera Autlan, S.A.B. de C.V. Materiales
8 AZTECA CPO T.V. Azteca, S.A.B. de C.V. Telecomunicaciones
9 BACHOCO 'B' Industrias Bachoco, S.A.B. de C.V. Consumo Frecuente
10 BIMBO 'A' Grupo Bimbo, S.A. de C.V. Consumo Frecuente
11 CEMEX 'CPO' Cemex S.A.B. de C.V. Materiales
12 CICSA 'B1' Carso Infraestructura y Construcción, S.A.B. de C.V. Industrial
13 CIE 'B' Corporacion Internacional de entretenimiento, S.A.B. de C.V. Consumo No Basico
14 COMERCI 'UBC' Controladora Comercial Mexicana, S.A.B. de C.V. Consumo Frecuente
15 ELEKTRA Grupo El ektra, S.A. de C.V. Consumo No Basico
16 FEMSA 'UBD' Fomento Economico Mexicano, S.A.B. de C.V. Consumo Frecuente
17 GCARSO 'A1' Grupo Carso, S.A.B. de C.V. Industrial
18 GEO 'B' Corporacion GEO, S.A.B. de C.V. Industrial
19 GFINBUR 'O' Grupo Fi nanciero Inbursa, S.A.B. de C.V. Servicios Financi eros
20 GFNORTE 'O' Grupo Fi nanciero Banorte, S.A.B. de C.V. Servicios Financi eros
21 GMEXICO 'B' Grupo Mexi co, S.A.B. de C.V. Materiales
22 GMODELO 'C' Grupo Modelo, S.A.B. de C.V. Consumo Frecuente
23 GRUMA 'B' Gruma, S.A.B. de C.V. Consumo Frecuente
24 HOGAR 'B' Consorcio Hogar, S.A.B. de C.V. Industrial
25 HOMEX Desarrolladora Homex, S.A.B. de C.V. Industrial
26 ICA Empresas ICA, S.A.B. de C.V. Industrial
27 IDEAL 'B-1' Impulsora del Desarrollo y el Empleo en America Latina, S.A.B. de C.V. Industrial
28 COCA-COLA FEMSA 'L' Coca - Cola FEMSA, S.A.B. de C.V. Consumo Frecuente
29 MEXCHEM Mexichem, S.A.B. de C.V. Materiales
30 PAPPEL Bio Pappel, S.A.B. de C.V. Materiales
31 PE&OLES Industrias Peñoles, S.A.B. de C.V. Materiales
32 PINFRA Promotora y operadora de Infraestructura, S.A.B. de C.V. Industrial
33 SARE 'B' SARE Holdings, S.A.B. de C.V. Industrial
34 SIMEC 'B' Grupo Si mec, S.A.B. de C.V. Materiales
35 SORIANA 'B' Organización Soriana, S.A.B. de C.V. Consumo Frecuente
36 TELMEX 'L' Telefonos de Mexico, S.A.B. de C.V. Telecomunicaciones
37 TLEVISA CPO Grupo Televisa, S.A.B. Telecomunicaciones
38 URBI URBI Desarrol los Urbanos, S.A.B. de C.V. Industrial
39 VITRO 'A' Vitro, S.A.B. de C.V. Materiales
40 WALMEX 'V' Wal - Mart de Mexico, S.A.B. de C.V. Consumo Frecuente
Escriba aquí la ecuación.

24
El criterio de liquidez que se usa es que el precio de la acción tenga variación diaria (o casi

diaria), lo que asegura que hubo compra-venta diaria. Una consecuencia de buscar las

acciones de mayor liquidez es que la mayoría de ellas forma parte del IPC, aunque hay
acciones del IPC que no están en la base y hay acciones fuera del IPC que entraron en la

base.

Los datos que se utilizaron en esta tesis son datos diarios de cierre de cada acción del 19 de

diciembre del 2005 al 13 de marzo del 2012.

6.1 Un análisis exploratorio de los datos.

Antes de empezar a aplicar esta estrategia de arbitraje estadístico se hará un breve análisis

exploratorio de los datos con el fin de familiarizarse más con ellos.

Uno de los temas de interés para poder aplicar la estrategia es saber el número de

componentes principales que se deben usar. Como se mencionó previamente hay dos formas

de acercarse a esta cuestión:

 Usar un número fijo de componentes principales que se consideren suficientemente


explicativas.

 Usar el número mínimo necesario de componentes principales para explicar cierto

porcentaje fijo de varianza.

A continuación se presenta una gráfica del número de componentes principales necesarias


para explicar 55% de varianza a través del tiempo.

25
Gráfica (1) Número de componentes necesarias para explicar 55% de la varianza

núme

ro de

comp

onent

es

Tiempo en días

Es claro que la moda de la mínima cantidad de componentes necesarias para explicar el 55%

de la varianza es de 10 componentes, y también se podría esperar que la mediana esté

cercana a este número por lo que se puede observar de la gráfica(1). Por esto mismo se
utilizaron 10 componentes principales de manera fija a lo largo de la aplicación de la estrategia

de inversión.

26
En la siguiente gráfica se observa cómo se comporta el porcentaje de varianza que explica

cada una de las componentes principales a través del tiempo.

Gráfica (2) Varianza explicada por cada componente principal a través del tiempo

Var.

explic

ada
de

cada

C.P.

Tiempo en días

Se puede ver que la primera componente principal tiene un dominio sobre las demás, tan solo

la primera componente explica alrededor del 30% en la mayor parte del tiempo, es decir, para

explicar el 25% faltante se necesitan en promedio 9 componentes más. También se puede ver

que la segunda componente resalta sobre las demás en ciertos periodos. Por esto mismo el

interés de saber qué acciones son las principales participantes en estas dos componentes.

La gráfica(3) es una gráfica de dispersión sobre las primeras dos componentes principales de

las acciones con mayor participación en ellas en cada tiempo del periodo.

27
Gráfica (3) Principales acciones graficadas sobre las primeras componentes

principales en diferentes tiempos

Segu

nda

comp

onent

princi

pal

Primera componente principal

-Negro es ICA -Cian es CIE


-Verde es AMX -Magenta es COMERCI
-Amarillo es GEO -Azul es PAPPEL
-Rojo es CEMEX

Se observa que hay cierta simetría en la primera componente, el lado derecho son periodos en

los que hubo crecimiento en el IPC y el lado izquierdo cuando decreció (causado por la crisis

económica del 2008 en las que hubo fuertes caídas del IPC). Las acciones con mayor fuerza

en la primera componente (ICA, AMX, GEO Y CEMEX) se mantienen con una fuerza
relativamente constante respecto a ésta a lo largo del tiempo, su nivel en valor absoluto

siempre es mayor a .15 y menor a .25 . En cambio, las acciones con mayor fuerza respecto a la

segunda componente (CIE, COMERCI y PAPPEL) tienen una fuerza con mucha variación, por

ejemplo, en el caso de CIE llega a tener una fuerza de 0 a una fuerza superior a 0.4 .

28
6.2 El primer eigenportafolio.

Como se vio previamente la primera componente principal explica alrededor del 30% de la
varianza, por eso mismo interesa observar cómo se comporta el primer eigenportafolio.

Gráfica (4) IPC y el Primer Eigenportafolio

Dese

mpeñ

o de

los

portaf

olios

Tiempo en días

Rojo - IPC Azul - 1er Eigenportafolio

En la gráfica se puede observar claramente que existe una correlación positiva alta entre el IPC

y el primer eigenportafolio. La interpretación de esto es que el mejor índice para resumir el

mercado de México es el IPC. También hay una clara separación después de la crisis, esta

separación probablemente es causada por que en esta tesis no se consideraron las acciones
que entraron al IPC después de la fecha inicial.

29
7 Los resultados.

Algo que no se desarrolla en el artículo de Avellaneda, M. y Lee, J-H. (2010). es la elección de

las parámetros de señalamiento de decisión ̅ , ̅ , ̅ y ̅ . De la elección de estos


parámetros dependerá el funcionamiento de la estrategia.

En esta tesis no se intentará encontrar un conjunto óptimo para estos parámetros pero se

ilustrará como se comporta la estrategia con diferentes conjuntos.

7.1 Sin considerar la desviación .

En la próxima tabla se presentan los rendimientos promedio diarios y anuales del portafolio con

diferentes conjuntos de parámetros sin considerar las desviaciones .


Tabla 2.1 Cojunto de Estrategias Tabla 2.2 Cojunto de Estrategias
al cl ac cc rd ra al cl ac cc rd ra
1 0.5 1 0.5 0.00000 0.00 2 0.5 2 0.5 0.0007 0.19
1 0.75 1 0.75 0.00000 0.00 2 0.5 2 0.75 0.0007 0.19
1 1 1 1 0.00010 0.03 2 0.5 2 1 0.0004 0.11
1 1.25 1 1.25 0.00010 0.03 2 0.75 2 0.5 0.0005 0.13
1 1.5 1 1.5 0.00010 0.03 2 0.75 2 0.75 0.0004 0.11
1.25 0.5 1.25 0.5 0.00020 0.05 2 0.75 2 1 0.0003 0.08
1.25 0.75 1.25 0.75 0.00010 0.03 2 1 2 0.5 0.0004 0.11
1.25 1 1.25 1 0.00010 0.03 2 1 2 0.75 0.0004 0.11
1.25 1.25 1.25 1.25 0.00010 0.03 2 1 2 1 0.0003 0.08
1.25 1.5 1.25 1.5 0.00010 0.03 2.25 0.5 2.25 0.5 0.0009 0.25
1.5 0.5 1.5 0.5 0.00030 0.08 2.25 0.5 2.25 0.75 0.0011 0.32
1.5 0.75 1.5 0.75 0.00010 0.03 2.25 0.5 2.25 1 0.0008 0.22
1.5 1 1.5 1 0.00020 0.05 2.25 0.75 2.25 0.5 0.0007 0.19
1.5 1.25 1.5 1.25 0.00000 0.00 2.25 0.75 2.25 0.75 0.0008 0.22
1.5 1.5 1.5 1.5 0.00010 0.03 2.25 0.75 2.25 1 0.0005 0.13
1.75 0.5 1.75 0.5 0.00020 0.05 2.25 1 2.25 0.5 0.0008 0.22
1.75 0.75 1.75 0.75 0.00010 0.03 2.25 1 2.25 0.75 0.0009 0.25
1.75 1 1.75 1 0.00000 0.00 2.25 1 2.25 1 0.0005 0.13
1.75 1.25 1.75 1.25 -0.00010 -0.02 2.5 0.5 2.5 0.5 0.0003 0.08
1.75 1.5 1.75 1.5 0.00000 0.00 2.5 0.5 2.5 0.75 0.0007 0.19
2 0.5 2 0.5 0.00070 0.19 2.5 0.5 2.5 1 0.0001 0.03
2 0.75 2 0.75 0.00040 0.11 2.5 0.75 2.5 0.5 -0.0003 -0.07
2 1 2 1 0.00030 0.08 2.5 0.75 2.5 0.75 0 0.00
2 1.25 2 1.25 0.00000 0.00 2.5 0.75 2.5 1 0 0.00
2 1.5 2 1.5 0.00000 0.00 2.5 1 2.5 0.5 -0.0003 -0.07
2.25 0.5 2.25 0.5 0.00090 0.25 2.5 1 2.5 0.75 -0.0002 -0.05
2.25 0.75 2.25 0.75 0.00080 0.22 2.5 1 2.5 1 -0.0001 -0.02
2.25 1 2.25 1 0.00050 0.13 0 0 0 0 0 0.00
2.25 1.25 2.25 1.25 0.00010 0.03
2.25 1.5 2.25 1.5 0.00000 0.00

30
En estas tablas se presentan los parámetros de entrada al, cl, ac y cc que abrevian abrir largo,

cerrar largo, abrir corto y cerrar corto respectivamente. Y se presentan también rd y ra que son

los rendimientos diarios promedio y los rendimientos anuales promedio que generó la
simulación de la estrategia con esos parámetros. En la tabla 2.1 se presenta un grupo de

estrategias donde al es igual a ac y cl es igual a cc. En la tabla 2.2 es un conjunto de

estrategias donde solamente al es igual a ac.

Observaciones:

 Lo primero que se observa, y que alegra ver, es que en la gran mayoría de los casos los

rendimientos son positivos.

 Se observa también que los parámetros de abrir posición, ̅ y ̅ , tienen un efecto

positivo mientras más alejados de 0 se elijan, aunque si se eligen demasiado lejos (2.5)
el efecto es negativo.

 Por el otro lado, los parámetros ̅ y ̅ funcionan mejor para valores cercanos a 0.

La forma en la que se interpreta el segundo y el tercer punto es que la forma en que mejor

funciona la estrategia es ser ambicioso con las variables de entrada y esperar a que la acción
se desvíe mucho de su punto de equilibrio, y ser seguro con las variables de salida y dejar la

posición en el momento que se haya acumulado un ingreso suficiente.

Con el fin de analizar más de cerca el comportamiento de distintos conjuntos de parámetros se

ilustra cómo se comporta el portafolio a lo largo del tiempo con distintos conjuntos de
parámetros de entrada al, cl, ac y cc.

31
Gráfica (5) Rendimientos de estrategias

Dese

mpeñ

o de
las

estrat

egias

Tiempo en años

Azul – [2.25, .5, 2.5, .75] [1.75, 1.5, 1.75, 1.5]

Cian – [2.25, .75, 2.5, .5] Magenta - [1.75, 1.5, 1.75, 1.5]

Verde - [2, .75, 2, .5] Rojo - [1.75, 1.25, 1.75, 1.25]

Observaciones:

 Pre-crisis: Se puede ver que inicialmente tienen un comportamiento similar aunque las

estrategias más agresivas empiezan mejor.

 Crisis: Todas las estrategias tienen una caída al momento de iniciar la crisis, pero en el

momento que ya existe suficiente información de cómo se están comportando las

acciones a lo largo de la crisis se empieza un mar de oportunidades que dependiendo

de la agresividad de la estrategia, depende qué tanto logra aprovechar estas

oportunidades de arbitraje.

 Post-crisis: Las estrategias vuelven a tener un comportamiento similar, pero se observa

que las estrategias más agresivas empiezan a tener mayores pérdidas, y las más

conservadores llegan a tener ganancias. Probablemente ya hay desequilibrios tan

32
grandes en estos periodos por lo que ya no hay tantas oportunidades de entrada para

las estrategias más agresivas.

De esto se puede deducir que si se deseara elegir los parámetros de una forma teórica óptima

uno de los principales factores que se deben considerar es la volatilidad del mercado.

7.2 Considerando la desviación .

Es natural esperar que la estrategia considerando la desviación tenga un mejor desempeño

ya que ésta se considera cuál es la tendencia de la acción. El problema que se podría

presentar es que más que encontrar tendencias, lo único que genere es “ruido” que perjudique

a las predicciones.

A continuación se presenta el mismo conjunto de estrategias que se usó previamente pero

ahora considerando la desviación .

33
Tabla 3.1 Cojunto de Estrategias Tabla 3.2 Cojunto de Estrategias
al cl ac cc rd ra al cl ac cc rd ra
1 0.5 1 0.5 -0.0001 -0.02 2 0.5 2 0.5 0.0008 0.22
1 0.75 1 0.75 0.0000 0.00 2 0.5 2 0.75 0.0007 0.19
1 1 1 1 0.0001 0.03 2 0.5 2 1 0.0004 0.11
1 1.25 1 1.25 0.0001 0.03 2 0.75 2 0.5 0.0005 0.13
1 1.5 1 1.5 0.0001 0.03 2 0.75 2 0.75 0.0005 0.13
1.25 0.5 1.25 0.5 0.0002 0.05 2 0.75 2 1 0.0003 0.08
1.25 0.75 1.25 0.75 0.0001 0.03 2 1 2 0.5 0.0000 0.00
1.25 1 1.25 1 0.0001 0.03 2 1 2 0.75 0.0002 0.05
1.25 1.25 1.25 1.25 0.0001 0.03 2 1 2 1 0.0001 0.03
1.25 1.5 1.25 1.5 0.0001 0.03 2.25 0.5 2.25 0.5 0.0012 0.35
1.5 0.5 1.5 0.5 0.0003 0.08 2.25 0.5 2.25 0.75 0.0014 0.42
1.5 0.75 1.5 0.75 0.0001 0.03 2.25 0.5 2.25 1 0.0008 0.22
1.5 1 1.5 1 0.0001 0.03 2.25 0.75 2.25 0.5 0.0009 0.25
1.5 1.25 1.5 1.25 0.0000 0.00 2.25 0.75 2.25 0.75 0.0010 0.29
1.5 1.5 1.5 1.5 0.0001 0.03 2.25 0.75 2.25 1 0.0005 0.13
1.75 0.5 1.75 0.5 0.0002 0.05 2.25 1 2.25 0.5 0.0009 0.25
1.75 0.75 1.75 0.75 0.0001 0.03 2.25 1 2.25 0.75 0.0010 0.29
1.75 1 1.75 1 0.0001 0.03 2.25 1 2.25 1 0.0006 0.16
1.75 1.25 1.75 1.25 -0.0001 -0.02 2.5 0.5 2.5 0.5 0.0007 0.19
1.75 1.5 1.75 1.5 0.0000 0.00 2.5 0.5 2.5 0.75 0.0007 0.19
2 0.5 2 0.5 0.0008 0.22 2.5 0.5 2.5 1 0.0007 0.19
2 0.75 2 0.75 0.0005 0.13 2.5 0.75 2.5 0.5 -0.0001 -0.02
2 1 2 1 0.0001 0.03 2.5 0.75 2.5 0.75 0.0000 0.00
2 1.25 2 1.25 0.0001 0.03 2.5 0.75 2.5 1 0.0004 0.11
2 1.5 2 1.5 0.0001 0.03 2.5 1 2.5 0.5 -0.0001 -0.02
2.25 0.5 2.25 0.5 0.0012 0.35 2.5 1 2.5 0.75 0.0000 0.00
2.25 0.75 2.25 0.75 0.0010 0.29 2.5 1 2.5 1 0.0004 0.11
2.25 1 2.25 1 0.0006 0.16
2.25 1.25 2.25 1.25 0.0002 0.05
2.25 1.5 2.25 1.5 0.0000 0.00

Al comparar estas tablas con las tablas 2.1 y 2.2, se observa que en la primera columna en la

mayoría de los casos conviene ignorar la desviación ya que en tan solo 8 de las 30 estrategias

conviene considerar . Por el otro lado, en la segunda columna en las que pertenece las
mejores estrategias en tan solo 3 de los 28 casos no conviene ignorar .

El comportamiento general de las estrategias es similar en ambos casos como se muestra en la

gráfica 6 en la que se compara el uso de la desviación usando tres estrategias diferentes.

34
Gráfica (6) Desviación v.s. No desviación

Dese

mpeñ

o de

las

estrat

egias

Tiempo en días

Rojo - sin desviación Azul - con desviación

En ambos casos, el comportamiento antes de la crisis es casi idéntico. A lo largo de la crisis,

que es el momento de toma de oportunidades, las estrategias que consideran la tendencia de

las acciones generan mejores resultados.

35
7.3 Los parámetros en el tiempo.

Dado que la estrategia parece tener buen funcionamiento, es de interés saber si efectivamente
el modelo se está cumpliendo. Por eso mismo se grafican los parámetros de América Movil (la

acción más importante) a través del tiempo.

Gráfica (7) Kappa de América Móvil vs Tiempo

Kapp

Tiempo en días

Se desea que 1 = ≪ 1 = 60⁄260 por lo que se desea que kappa sea mayor a 8.6
para que tenga una rápida reversión a la media. Es claro que para esta acción, efectivamente
se cumple esto.

36
Gráfica (8) Mu y sigmaEq de América Móvil vs Tiempo

Pará

metro

Tiempo en días
Rojo - Mu Verde - SigmaEq

En esta gráfica se observa que efectivamente, la media del residual es cercana a 0 a lo largo
de todo el periodo. También se observa que la sigmaEq (sigma de equilibrio) es mayor en los

tiempo de crisis y se reduce en los tiempos siguientes (post-crisis).

37
8 Algunos comentarios sobre la implementación.

Si se deseara implementar esta estrategia de arbitraje en la vida real se deben considerar los

siguientes puntos:

 La estrategia necesita entrar en posiciones sobre índices que no existen. Como no sería

costeable crear índices para implementar la estrategia, entonces se debe usar otro

método. Para poder replicar artificialmente los índices es necesario entrar en posición

en cada una de las acciones en consideración, en apalancamientos precisos que serían

el monto de la acción por el peso en la componente principal.

 El modelo pide un apalancamiento preciso en cada componente, pero esto tal vez no

sea posible de implementar. Estos errores de precisión afectarían el portafolio de

manera negativa.

 La estrategia también pide entrar en posición en cada uno de los eigenportafolios con

un monto igual a su respectiva para cada acción en la que hay posición activa. No es

posible invertir el monto que uno quiera en una emisora ya que cada acción tiene un
precio, entonces para poder aproximar las proporciones de estas ′ de la mejor

manera posible, se debe invertir grandes cantidades de dinero.

 Por último, se debe considerar que hay un retraso de tiempo del momento en el que se

sabe que se debe entrar en alguna posición al momento que efectivamente se entró. En
ese diferencial de tiempo también se generó un diferencial de precio. Esto podría

afectar de manera negativa al desempeño del portafolio.

38
9 Conclusiones.

Esta estrategia de arbitraje estadístico parece funcionar en México en este periodo ya que en la

gran mayoría de las diferentes selecciones de parámetros los rendimientos fueron positivos y,

en los casos que fueron negativos los rendimientos eran muy cercanos a cero.

Las acciones que se consideraron son las mismas durante todo el periodo, si en la

implementación se consideran las acciones nuevas que forman parte del IPC se conseguiría

mayor información del mercado, por lo que se esperaría que la estrategia funcione mejor.

La selección de parámetros de señalamiento parece que puede valer un trabajo entero. La

estrategia parece funcionar bien en tiempos de crisis y no tan bien en tiempos estables por lo

que sería natural pensar que la estrategia es dependiente de la volatilidad del mercado. Lo que

se intuye de los datos es que esta selección de parámetros debe de estar relacionada

directamente con la volatilidad del mercado. Sería posible implementar una estrategia donde
los parámetros de señalamiento sean dinámicos dependientes de la volatilidad y tal vez otros

factores. Se esperaría que esta implementación afecte positivamente a la estrategia.

En general se concluye que esta es una estrategia que vale la pena explorar más a detalle para

considerar que se use con dinero real.

39
10 Los algorimtos.

10.1 Los principales.

function[g]=EstrategiaAE(al,cl,ac,cc,X,mod)
%Este algoritmo simula como se comportaría la estrategia en el periodo.
%Los parámetros de entrada es la matriz X de precios de acciones a lo largo
% del tiempo siendo cada columna una acción.
% al, cl , ac, cc son los parámetros de abrir(o cerrar) largo(o corto)
% mod es uno si se considera la desviación y 0 si no se considera.

%Matriz de rendimientos
[a,b] = size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j) = log(X(i+1,j)/X(i,j));
end
end

%La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo


%el mismo indice de tiempo que la matriz de rendimientos R.
%Notese que las primeras 260 observaciones seran igual a cero.
F=zeros(a-1,10);
rendF=zeros(a-1,10);

%DXt es la matriz de todos los residuales


DXt = zeros(a-1,b);

%Posicion es el vector que indica que posición se tiene sobre cada accion,
%1 es "abierto largo", -1 es "abierto corto", 0 es sin posicion
posicion = zeros(1,b);

rend = 0;
rendv = zeros(a-1-260,1);

ing=1;
for t=261:a-1
%Se calculan los residuales y se actualizan las matricez F y rendF y se
%extrae la matriz de betas y el vector de alfas
[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b);

%rend = rend*(1+(posicion*((R(t,:)')-betas*(rendF(t,:)'))));

%Contador de en cuantas posiciones hay posicion


cont = 0;
for k = 1:b
if posicion(1,k)==0
cont = cont + 1;

40
end
end
cont = b-cont;

if cont > 0
rend = posicion*((R(t,:)')-betas*(rendF(t,:)'));
if abs(rend) > 1
rend = abs(rend)/rend;
end
rend = rend/cont;
rendv(t-260,1) = rend;
end

%Esta función regresa un vector de señales de cada acción que indica


%que se debe hacer.

posicion = senal(posicion,DXt,t,b,al,cl,ac,cc,alfas,mod);

ing=ing*(1+rend);
if rend < 0
plot(t,ing,'red')
hold on
else
plot(t,ing,'red')
hold on
end
t

end
g=mean(rendv);

41
function[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b)
%Esta función regresa el vector de residuales del proceso de difusión de O-U
%sumados con el "dift" alfa
%Actualiza los retornos de F
%Actualiza los rendimientos de F
%Regresa la matriz de betas al tiempo t
%Regresa el vector de algas al tiempo t

%F es un vector con los factores de riesgo. Cada uno formado por cada
%componente principal
Ft = zeros(1,10);

%F es un vector con los factores de riesgo. Cada uno formado por cada
%componente principal
rendFt = zeros(1,10);

%Sigmas es el vector de las desviaciones estandar del forex en el periodo


sigmas = zeros(b,1);

%betas es la matriz de las betas, el renglon es la accion y la columna el


%factor de riesgo
betas = zeros(b,10);

%alfas es un vector vectical


alfas = zeros(b,1);

[coeff,score,vars] = PCA(R,t);

%A es la sección de R de interés
A = zeros(260,b);
for i=1:260
for j=1:b
A(i,j) = R(i+t-260,j);
end
end
%Se calculas las sigmas
for i=1:b
sigmas(i,1) = sqrt(var(A(:,i)));
end

%Se calcula el rendimiento y el retorno de F


for j=1:10
inversion = 0;
for i=1:b
Ft(1,j)=Ft(1,j) + coeff(i,j)*(1/sigmas(i,1))*R(t,i);
inversion = inversion + coeff(i,j)*(1/sigmas(i,1));
end
rendFt(1,j) = (Ft(1,j))/inversion;
end

%Se actualiza la matriz F


F(t,:) = Ft;
rendF(t,:) = rendFt;

42
%Se toma la parte de F de interés "B"
B = zeros(260,10);
for i = 1:260
for j = 1:10
B(i,j) = F(t-260+i,j);
end
end

%Se calculan las betas con las covarianzas


for i=1:b
for j=1:10
c = cov(A(:,i),B(:,j));
betas(i,j) = c(1,2)/(var(B(:,j)));
end
end

%Se crea el vector de residuales


dXt = zeros(1,b);
for i=1:b
dXt(1,i) = R(t,i)-betas(i,:)*Ft';
end
DXt(t,:) = dXt;

%Se calcula cada alfa para cada accion


for i=1:b
alfas(i,1) = 260*(mean(A(:,i))-betas(i,:)*(mean(B))');
end

43
function[posicion] = senal(posicion,DXt,t,b,al,cl,ac,cc,alfas,mod)
%Esta función indica que acción se debe hacer sobre la acción al tiempo t
siv = zeros(1,b);
for i = 1:b
%v es la serie de tiempo de los residuales de la accion i
v = zeros(60,1);

%v1 es el vector retrazado un tiempo


v1 = zeros(60,1);

for j = 1:60
v(j) = DXt(t-60+j-1,i);
v1(j) = DXt(t-60+j-2,i);
end

%Se calculan los parámetros del proceso autoregresivo


c = cov([v v1]);

p2 = c(2,1)/var(v1);
p1 = mean(v)-p2*mean(v1);

%rar son los residuales del proceso autoregresivo


rx = zeros(60,1);
for j = 1:60
rx(j) = v(j) - p1 - p2*v1(j);
end

%vx es la varianza de los residuales


vx = var(rx);

%Se calculan los parámetros de el O-U


kappa = -log(p2)*260;
m = p1/(1 - p2);
sigmaEq = sqrt(vx/(1-p2*p2));
%si = (DXt(t,i)-m)/sigmaEq;
si = (DXt(t,i)-p1-p2*DXt(t-1,i))/sigmaEq;

%Se calcula s-mod si asi se indica


if mod == 1
si = si - alfas(i,1)/(kappa*sigmaEq);
end
siv(1,b) = si;

%Se analiza que hacer con la posición


%Para las acciones en las que hay posicion no aplican filtros

if posicion(1,i) == 1
if si > cl
posicion(1,i) = 0;
end
end

if posicion(1,i) == -1
if si < -cc
posicion(1,i) = 0;

44
end
end

%fil es una variable que indica cuantos filtros pasó la acción


fil = 0;

%Primer filtro, que el intervalo de confianza de p2 no incluya el 1


sp2 = sqrt(vx/(var(v)*59));
low = p2 - sp2*tinv(.97,58);
high = p2 + sp2*tinv(.97,58);

if low > 1 || high < 1


fil = fil + 1;
end

%Segundo filtro, que el tiempo de reversión a la media sea


%suficientemente rápido

if kappa > 8.66666


fil = fil + 1;
end

if low < 0 && high > 0


fil = fil + 1;
end

%Se analiza entrar a algún tipo de posición


if posicion(1,i) == 0 && fil ==3
if si < -al
posicion(1,i) = 1;
end
if si > ac
posicion(1,i) = -1;
end
end
end

function[coeff,score,vars] = PCA(X,t)

45
%esta funcion regresa las componentes principales que corresponden a las
%observaciones de hace un año a la fecha.
[a,b]=size(X);
A=zeros(260,b);
for i=1:260
for j=1:b
A(i,j) = X(i+t-261,j);
end
end
%Se estandariza la matriz
Z = zscore(A);
[coeff,score,latent] = princomp(Z);
vars = latent./sum(latent);
end

10.2 Los auxiliaries.

%Analisis exploratorio

[a,b]=size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j)=log(X(i+1,j)/X(i,j));
end
end

suma=0;
suma2=0;
%suma3 es para ver cuantas componentes se necesitan para acumular 55% de
%variaza explicada
suma3=0;
%vec es el vector promedio de los coeffs
% vec = zeros(b,10);
% Z = zscore(R);
% [coeffs,score,latent] = princomp(Z);

for t=261:a-1
[coeff,score,vars] =PCA(R,t);
suma=suma + vars(1);
suma2=suma2 + vars(2);
s=0;
q=1;
while s < .55
s = s + vars(q);
q = q + 1;
end
suma3 = suma3 + q;

%Grafica de dispersion sobre las 2 primeras componentes principales


plot(coeff(26,1),coeff(26,2),'black');

46
hold on
plot(coeff(4,1),coeff(4,2),'green');
plot(coeff(18,1),coeff(18,2),'yellow');
plot(coeff(11,1),coeff(11,2),'red');
plot(coeff(13,1),coeff(13,2),'cyan');
plot(coeff(14,1),coeff(14,2),'magenta');
plot(coeff(30,1),coeff(30,2),'blue');

%grafica a lo largo del tiempo de cuantas componentes se necesitan para


%explicar 55%
plot(t,q);
hold on

%grafica de varianza explicada de las primeras 6 componentes


%principales
plot(t,vars(1),'black');
hold on
plot(t,vars(2),'blue');
plot(t,vars(3),'cyan');
plot(t,vars(4),'magenta');
plot(t,vars(5),'red');
plot(t,vars(6),'yellow');

t
end
suma/(a-1)
suma2/(a-1)
suma3/(a-1)

%Esta rutina genera la gráfica del primer eigenportafolio contra el IPC

%Matriz de rendimientos
[a,b]=size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j)=log(X(i+1,j)/X(i,j));
end
end

%La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo


%el mismo indice de tiempo que la matriz de rendimientos R.
%Notese que las primeras 260 observaciones seran igual a cero.
F=zeros(a-1,10);

47
rendF=zeros(a-1,10);
rend=1;
DXt = zeros(a-1,b);
for t=261:a-1
[DXt,F,rendF,betas] = CalculaResiduales(DXt,R,F,rendF,t,b);

rend=rend*(1+rendF(t,1));
%Grafica del Primer Eigenportafolio
plot(t,rend,'blue');
hold on
%Grafica del IPC
plot(t,IPC(t,1)/IPC(261,1),'red');
t
end

%Este algoritmo trata de buscar un buen conjunto de parametros de entrada y


%salida del algoritmo Estrategia
Est = zeros(30,5);
cont = 0
%a es abrir posicion
%c es cerrar posicion
a=1;
for i = 1:6
c=.5;
for j=1:5
pars =[a c a c];
r = EstrategiaAE(pars(1,1),pars(1,2),pars(1,3),pars(1,4),X,1);
cont = cont + 1
Est(cont,:)=[pars r];
c = c + .25;
end
a = a + .25;
end
Est

%Segundo algoritmo de búsqueda de parámetros de entrada y salida del


%algoritmo Estrategia

48
Est = zeros(28,5);
%a es abrir posicion
%c es cerrar posicion
cont = 0
a=2;
for i = 1:3
cl=.5;
for j=1:3
cc=.5;
for k=1:3
pars =[a cl a cc];
r = EstrategiaAE(pars(1,1),pars(1,2),pars(1,3),pars(1,4),X,1);
cont = cont + 1
Est(cont,:)=[pars r];
cc=cc+.25;
end
cl = cl + .25;
end
a = a + .25;
end
Est

%Esta rutina grafica los parametros kappa, simga y mu de America Movil


[a,b] = size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j) = log(X(i+1,j)/X(i,j));
end
end

%La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo


%el mismo indice de tiempo que la matriz de rendimientos R.
%Notese que las primeras 260 observaciones seran igual a cero.
F=zeros(a-1,10);
rendF=zeros(a-1,10);

%DXt es la matriz de todos los residuales


DXt = zeros(a-1,b);

%Posicion es el vector que indica que posición se tiene sobre cada accion,

rend = 0;
rendv = zeros(a-1-260,1);

ing=1;
for t=261:a-1
%Se calculan los residuales y se actualizan las matricez F y rendF y se
%extrae la matriz de betas y el vector de alfas

49
[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b);

%Esta función regresa un vector de señales de cada acción que indica


%que se debe hacer.

[kappa,m,sigmaEq]=grafica(DXt,t,b,alfas);
plot(t,kappa,'blue')
hold on
plot(t,m,'red')
hold on
plot(t,sigmaEq,'green')

end

function [kappaa,mm,sigmaa]=grafica(DXt,t,b,alfas)
siv = zeros(1,b);
for i = 1:b
%v es la serie de tiempo de los residuales de la accion i
v = zeros(60,1);

%v1 es el vector retrazado un tiempo


v1 = zeros(60,1);

for j = 1:60
v(j) = DXt(t-60+j-1,i);
v1(j) = DXt(t-60+j-2,i);
end

%Se calculan los parámetros del proceso autoregresivo


c = cov([v v1]);

p2 = c(2,1)/var(v1);
p1 = mean(v)-p2*mean(v1);

%rar son los residuales del proceso autoregresivo


rx = zeros(60,1);
for j = 1:60
rx(j) = v(j) - p1 - p2*v1(j);
end

%vx es la varianza de los residuales

50
vx = var(rx);

%Se calculan los parámetros de el O-U


kappa = -log(p2)*260;
m = p1/(1 - p2);
sigmaEq = sqrt(vx/(1-p2*p2));
sigma = sigmaEq*sqrt(2*kappa);

if i == 4
kappaa=kappa;
mm=m;
sigmaa=sigmaEq;
end
%si = (DXt(t,i)-m)/sigmaEq;
si = (DXt(t,i)-p1-p2*DXt(t-1,i))/sigmaEq;

%Se calcula s-mod si asi se indica

siv(1,b) = si;

end

51
Referencias

Avellaneda, M. y Lee, J-H. (2010). Statistical Arbitrage in the U.S. Equity Markets. Quantitative

Finance, vol. 10, no. 7, pp 761 – 782.

Baxter, M. y Rennie, A. (1998) Financial Calculus. An introduction to Derivative Pricing.

Cambridge: Cambridge University Press.

Montgomery, Peck and Vining. (2006). Introduction to linear regression analysis.

52

Vous aimerez peut-être aussi