Académique Documents
Professionnel Documents
Culture Documents
ASIGNATURA
ESTADÍSTICA INFERENCIAL II
GEG-0908
CARRERA:
GRADO Y GRUPO:
505 “D”
DOCENTE:
1
INTRODUCCIÓN
Los métodos de análisis de series de tiempo consideran el hecho que los datos tomados
en diversos periodos de tiempo pueden tener algunas características de autocorrelación,
tendencia o estacionalidad que se debe tomar en cuenta.
Aplicación: la aplicación de estos métodos tiene dos propósitos: comprender las fuerzas de
influencia en los datos y descubrir la estructura que produjo los datos observados. Ajustar
el modelo y proceder a realizar pronósticos, monitoreo, retroalimentación y control en
avance.
1
3. ANÁLISIS DE SERIES DE TIEMPO
El análisis de series de tiempo trata del estudio del comportamiento de una serie de tiempo
utilizando como fuente de información los valores pasados de la propia serie.
La metodología que se sigue para hacer este análisis es la aportada por los investigadores
Box y Jenkins, por lo que se conoce este tipo de análisis de series temporales como análisis
de Box Jenkins. También se puede encontrar con la denominación de modelos ARIMA.
Definiciones:
Proceso Estocástico: llamamos proceso estocástico a una sucesión de variables aleatorias
{Yt} donde t = -.....-1, 0, 1, 2,
Ruido Blanco: Es una sucesión de variables aleatorias con esperanza cero, igual varianza
e independientes en el tiempo {et}
Paseo Aleatorio: llamamos paseo aleatorio a un proceso estocástico {Yt} cuyas primeras
diferencias forman un proceso ruido blanco. Yt-Yt-1 =et D Yt = et
Un proceso estocástico es estacionario en sentido estricto si para toda m-tupla (t1,...tm) y
todo entero k, el vector de variables Yt1,...,Ytm) tiene la misma distribución de probabilidad
conjunta que el vector (Yt1+k,...,Ytm+k).
La función de autocorrelación:
Se define la Autocovarianza para el retardo k:
2
independientes del subíndice t, es decir, que estos coeficientes son constantes a lo largo
del tiempo y dependen solo de la longitud del retardo k.Para procesos reales se cumple
además:
k= -k ; k= -k; 0=1; [ k] 1
Ergocidad: las series temporales que se manejan en econometría están constituidas por
observaciones históricas, es decir, no proceden de la experimentación y por tanto, son
irrepetibles.
Una serie temporal puede contemplarse como una sola prueba de un experimento aleatorio
multivariante y constituye lo que se denomina una realización del proceso.
Los procesos que cumplen tales condiciones se denominan ergódicos.
Para hacer inferencias estadísticas en problemas donde interviene una solo variable
aleatoria es necesario recurrir a la repetición de experimentos.
Cuando un proceso estocástico cumple ciertas condiciones, es posible estimar
consistentemente sus características a partir de una realización del mismo. Los procesos
que cumplen tales condiciones se denominan ergódicos.
Un proceso estocástico estacionario es ergódico en la media, , si es posible estimar
consistentemente este parámetro haciendo uso de la media muestral temporal:
.
Análogamente, la función de autocorrelación muestral se podrá calcular como:
ARMA(p,q)
Xt = 1et-1 + 1et-2 + 1et- 3 .... + 1et--q = 1et-i
ARIMA(p,d,q)
Xt = 1Zt-1 + 2Zt-2 + 3Zt-3 ....+ pZt-p + 1et-1 + 1et-2 + 1et- 3 .. + 1et--q
4
Donde Zt es la diferencia de orden d de Xt
0
k 0
k
-1 -1
+1 +1
k 5 0
k
0
-1 -1
Si las autocorrelaciones parciales decaen exponencialmente hacia cero entonces el
modelo es un MA(q) y el orden q es determinado por el numero de autocorrelaciones
totales significativamente diferentes de cero.
Autocorrelación
+1 +1
k
0 0
-1 -1
Autocorrelación
+1
+1
k 0
k
0
-1 -1
6
Cuando las autocorrelaciones totales y las autocorrelaciones parciales ambas decaen en
forma exponencial hacia cero, el modelo es de la forma ARMA(p,q).
Los ordenes p y q son determinadas con el numero de autocorrelaciones parciales y
autocorrelaciones totales respectivamente, significativamente distintas de cero.
Autocorrelación
Autocorrelacion Parcial
+1 +1
k
0 0
-1 -1
7
Si alguna de estas pruebas indica un modelo inadecuado, se identifica un nuevo
modelo, se estiman sus parámetros y se diagnostica, estos pasos se repiten hasta
conseguir un modelo tentativo que no repruebe ninguna de las pruebas estadísticas.
Prueba Box-Pierce
La prueba Box-Pierce es una prueba de bondad de ajuste de las autocorrelaciones de los
residuales.
Si las autocorrelaciones de los residuales están distribuidos según una distribución normal,
entonces los cuadrados de estas autocorrelaciones debe seguir una distribución ji cuadrado
con k-p-q grados de libertad.
8
El valor de la observación que se obtiene en la etapa i-ésima depende linealmente de las
últimas p observaciones, más un error aleatorio representado por ei.
Los residuales ei son normales de media cero y varianza desconocida; estos residuales
son independientes entre sí y de las variables yi del proceso.
Ajuste del modelo
Tal como ha quedado especificado, el modelo AR(p) tiene p+2 parámetros a estimar a partir
de los datos observados:
9
Estimación de la varianza
Independencia:
Para contrastar que los residuales son independientes se plantea la hipótesis nula
H0: los k primeros coeficientes de correlación son nulos:
el cual se distribuye como una distribución , siendo (r1, r2, ..., rk) las correlaciones
correspondientes a los k primeros retardos.
El valor k elegido para la realización del test es el entero más próximo a 10 log10(n-p). El
contraste se realiza para un nivel de significación del 5%.
10
3.1 COMPONENTES DE UNA SERIE DE TIEMPO
11
PIB REAL 1985-2006
14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82
400.00
350.00
300.00
250.00
200.00
150.00
100.00
50.00
0.00
1 22 43 64 85 106 127 148 169 190 211 232 253 274 295 316
12
DEL MERCADEO Y COMERCIALIZACIÓN, POR SUS IMPLICACIONES DE CORTO
PLAZO.
900
800
700
600
500
400
300
200
100
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Consumo privado/PIB
120.00
100.00
80.00
60.00
40.00
20.00
0.00
1965
1967
1969
1971
1973
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
1995
1997
1999
2001
13
¿CÓMO ENTRAN LOS COMPONENTES EN LA SERIE1?
14
3.2 METODOS DE MINIMOS CUADRADOS
Existen numerosas leyes físicas en las que se sabe de antemano que dos magnitudes x e
y se relacionan a través de una ecuación lineal
y = ax + b
l = (1/K)F
15
n Σx i y i Σx i Σy i
a
(1)
n Σx i2 Σx i
2
Σy i a Σx i
b (2)
n
n ε
Δa
2
n
n
n Σ x i2 Σ x i
1 1
(3)
ε
Δb
n
La pendiente de la recta se escribirá a a , y la ordenada en el origen b Δb .
16
Ejemplo: Supongamos un muelle sometido a tracción, se ha cargado el muelle con
diferentes pesos (F, variable independiente o y ) y se han anotado los alargamientos (l
variable dependiente o x)
Cargas Lecturas
sucesivas F(yi) sucesivas (xi)
L
gramos mm
200 60
400 120
500 150
700 210
900 260
1000 290
n 6
xi 1090
xi2 236300
yi 3700
yi2 2750000
xiyi 806000
0,2
17
Redondeando en la forma usual b = -18,42 ± 0,08 mm; a =3,50 ± 0,00 mm/Kp
No se debe olvidar que se persigue el valor de la constante elástica del muelle:
F
Ka
l
18
3.3 METODOS DE PROMEDIOS MÓVILES
MÉTODOS
Promedio móvil:
Ejemplo:
19
1 Open worksheet EMPLOY.MTW.
2 Seleccionar Stat > Time Series > Moving Average.
3 En Variable, seleccionar Metals. En MA length, poner 3.
4 Seleccionar Center the moving averages.
5 Seleccionar Generate forecasts, y poner 6 en Number of forecasts. Click OK.
Data Metals
Length 60
NMissing 0
Moving Average
Length 3
Accuracy Measures
MAPE 1.55036
MAD 0.70292
MSD 0.76433
Forecasts
20
64 49.2 47.4865 50.9135
Moving Average
48
Length 3
Accuracy Measures
Metals
46 MAPE 1.55036
MAD 0.70292
MSD 0.76433
44
42
40
1 7 14 21 28 35 42 49 56 63
Index
Interpretación de resultados
Se obtiene la gráfica de serie de tiempo mostrando los valores observados y estimados (un
periodo adelante), además de los seis pronósticos. Note que el patrón de datos estimados
va detrás del patrón de datos.
21
3.4 METODOS DE SUAVIZACIÓN EXPONENCIAL
Los métodos de suavizamiento exponencial han sido utilizados con éxito a través de los
años en muchos problemas de pronóstico. Fueron sugeridos en 1957 por C.C. Holt para su
aplicación en series de tiempo sin tendencia ni estacionalidad. Posteriormente el mismo
ofreció un procedimiento que manejara tendencias. Después Winters en 1965 generalizó el
método para incluir estacionalidad, de ahí el nombre de “Método de Holt Winters”.
Suaviza los datos por medio de la fórmula de pronóstico de ARIMA de un paso adelante
ARIMA (0,1,1). Este modelo trabaja mejor sin uno de los componentes de tendencia o
estacionalidad. El componente simple dinámico en un modelo de promedio móvil es el nivel.
22
3.4 MÉTODO DE SUAVIZAMIENTO EXPONENCIAL SIMPLE
Los valores suavizados (estimados) se obtienen ya sea con un peso óptimo generado o con
un peso específico manual.
2. Los valores suavizados son los valores Y estimados por ARIMA, pero desplazados en
una unidad de tiempo.
Valor inicial suavizado = [Valor suavizado del periodo 2 - (dato en periodo 1)] / (1-)
Peso especificado
1. Se usa el promedio de los primeros seis (o N si N<6) observaciones para el valor inicial
suavizado (en tiempo uno).
Valor suavizado en tiempo t = (dato en periodo t)] + (1-) (valor suavizado en periodo t-1)
Donde es el peso.
23
Por ejemplo:
Length 60
Smoothing Constant
Alpha 1.04170
Accuracy Measures
MAPE 1.11648
MAD 0.50427
MSD 0.42956
Forecasts
24
Single Exponential Smoothing Plot for Metals
52 Variable
Actual
Fits
50 Forecasts
95.0% PI
Smoothing Constant
48
Alpha 1.04170
Accuracy Measures
Metals
46 MAPE 1.11648
MAD 0.50427
MSD 0.42956
44
42
40
1 7 14 21 28 35 42 49 56 63
Index
Interpretación de resultados
Se obtiene la gráfica de serie de tiempo mostrando los valores observados y estimados (un
periodo adelante), además de los seis pronósticos. Note que el patrón de datos estimados
va detrás del patrón de datos.
Se indica la constante de suavizamiento (peso) utilizada y las medidas MAPE, MAD y MSD
de 1.12, 0.70 y 0.76 con un mejor ajuste que en el método de promedio móvil con valores
1.55, 0.70 y 0.76 respectivamente.
25
3.5 TENDENCIAS NO LINEALES
Un supuesto en muchas técnicas de series de tiempo es que los datos son estacionarios,
donde su media, variancia y autocorrelación no cambia en el tiempo, tampoco se presentan
patrones de estacionalidad, sin embargo en la práctica si se presentan estos patrones de
tendencia y de estacionalidad y es necesario contar con modelos que las consideren.
Tendencias: Si los datos muestran una tendencia, se pueden ajustar los datos con algún
tipo de curva o recta y modelar los residuales. Como el propósito del ajuste es simplemente
remover la tendencia a largo plazo, una línea recta es suficiente.
Por ejemplo:
26
Removiendo la tendencia a largo plazo, los residuales quedan como sigue:
Estacionalidad: son fluctuaciones periódicas, por ejemplo cuando hay picos de ventas en la
navidad y después declinan. La serie de tiempo de ventas mostrarán un incremento durante
septiembre a diciembre y una declinación durante enero y febrero.
27
2. Diagramas de caja múltiples
28
3. Gráfica de estacionalidad por subserie
29
EJEMPLO:
Se desea predecir la tasa de empleo para los siguientes 12 meses en base a datos
colectados durante los últimos 60 meses. Como los datos tienen una tendencia que se
ajusta bien con un modelo de tendencia cuadrática y tiene un componente estacional se
utilizan los residuos del ejemplo del análisis de tendencias para combinar el análisis de
tendencias y descomposición para pronosticar.
Additive Model
Data RESI1
Length 60
NMissing 0
Accuracy Measures
MAPE 881.582
MAD 2.802
MSD 11.899
Seasonal Indices
Period Index
30
1 -8.4826
2 -13.3368
3 -11.4410
4 -5.8160
5 0.5590
6 3.5590
7 1.7674
8 3.4757
9 3.2674
10 5.3924
11 8.4965
12 12.5590
Forecasts
Period Forecast
61 -8.4826
62 -13.3368
63 -11.4410
64 -5.8160
65 0.5590
66 3.5590
67 1.7674
68 3.4757
69 3.2674
70 5.3924
71 8.4965
72 12.5590
31
Time Series Decomposition Plot for RESI1
Additive Model
20 Variable
Actual
Fits
Trend
10 Forecasts
Accuracy Measures
MAPE 881.582
MAD 2.802
RESI1
0 MSD 11.899
-10
-20
1 7 14 21 28 35 42 49 56 63 70
Index
En esta gráfica se muestran los residuos sin tendencia cuyo ajuste es adecuado, excepto
que al inicio del periodo anual los valores son subestimados y al final del periodo anual los
valores son sobreestimados, también es evidente en la gráfica de abajo donde los residuos
son mayores al principio y menores al final de la serie.
10
10
0 0
-10
-10
-20
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
5
8
0
4
-5
0
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
32
Component Analysis for RESI1
Additive Model
Original Data
10
Data
-10
-20
1 6 12 18 24 30 36 42 48 54 60
Index
10
0
-10
-20
1 6 12 18 24 30 36 42 48 54 60
Index
1. Una gráfica de serie de tiempo mostrando los datos originales con la línea de
tendencia ajustada, valores estimados y pronósticos
2. Un análisis de componentes con gráficas separadas para la serie, datos sin
tendencia, datos ajustados con estacionalidad y los datos ajustados
estacionalmente y sin tendencias (los residuos).
3. Un análisis estacional, mostrando los índices estacionales y la variación porcentual
dentro de cada estación respecto a la suma de la variación por estación y gráficas
de caja de los residuos por periodo estacional.
33
3.7 APLICACIONES
La aplicación de estos métodos tiene dos propósitos: comprender las fuerzas de influencia
en los datos y descubrir la estructura que produjo los datos observados. Ajustar el modelo
y proceder a realizar pronósticos, monitoreo, retroalimentación y control en avance.
34
CONCLUSIÓN
Las series de tiempo ayudan a describir, explicar, predecir y controlar aquellos procesos
que de alguna manera se presentan en el tiempo, si bien ay que recordar que la observación
se da de manera ordenada en el tiempo por lo que su aplicación se refleja de manera
concreta en diferentes áreas científicas y sociales ayudando a pronosticar eventos futuros
o a tomar decisiones importantes de diferentes tipos.
35
BIBIOLGRAFÍA
http://ciberconta.unizar.es/leccion/seriest/100.htm
http://personal.us.es/aggonzalez/Docencia/Problemas_Resueltos_2.pdf
https://www.google.com.mx/search?biw=1920&bih=925&q=tendencias+no+lineales+.doc&
oq=TENDENCIAS+NO&gs_l=psy-
ab.3.0.35i39k1j0l3.289740.291260.0.292164.13.10.0.0.0.0.252.1372.0j3j4.7.0.dummy_ma
ps_web_fallback...0...1.1.64.psy-ab..6.7.1371...0i67k1j0i131k1.0.98ycMaqw_tc
http://www.monografias.com/trabajos31/series-tiempo-internet/series-tiempo-
internet.shtml#Conclusiones
36