Académique Documents
Professionnel Documents
Culture Documents
9/14/2006
Pronósticos Automáticos
Resumen
El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores
futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de
datos numéricos secuenciales tomados en intervalos igualmente espaciados, generalmente
sobre un periodo de tiempo o espacio. Desemejante al procedimiento de pronósticos se
espera que el usuario seleccione el modelo del pronóstico a utilizar, este procedimiento
contiene muchos modelos y selecciona al mejor modelo posible según criterios
especificados. El criterio disponible para la sección del modelo incluye el Criterio de
Información Ataide (AIC), el Criterio Hannan-Quinn (HQC), y el Criterio Schwarz-
Bayesian (SBC). Este criterio selecciona con el cuadrado medio del error más pequeño,
sujeto a una penalización para el número de parámetros desconocidos que se necesitan
estimar.
Month Traffic
(Mes) (Trafico)
1/68 73.637
2/68 77.136
3/68 81.481
4/68 84.127
5/68 84.562
6/68 91.959
7/68 94.174
8/68 96.087
9/68 88.952
10/68 83.479
11/68 80.814
12/68 77.466
1/69 75.225
… …
Los datos fueron obtenidos de una publicación del Golden Gate Bridge.
Entrada de Datos
La caja de dialogo para la entrada de datos solicita el nombre de la columna que
contienen los datos de la serie de tiempo:
• Ajustar los Días: Una variable numérica con n observaciones es utilizada para
normalizar las observaciones originales, por ejemplo el número de días trabajados en
un mes. Las observaciones en la columna Datos pueden ser divididos por estos
valores antes de dibujar un grafico o calcular un análisis. Debe haber suficientes
entradas en esta columna para cubrir tanto los datos observados como el número de
periodos en los cuales se solicitan los pronósticos.
En el ejemplo actual, los datos de trafico son mensuales empezando en Enero, 1968, y se
tiene una estacionalidad de s = 12. Un m = 24 observaciones al final de la serie de tiempo
con propósitos de retención para la validación, mientras los pronósticos pueden generarse
de los siguientes 36 meses.
• Modelos Incluidos: Especifica el modelo que se debe estimar sobre los datos. Estos
son los modelos de los cuales el “mejor” será seleccionado. La descripción de cada
modelo puede encontrarse en la documentación de “Pronósticos”. Para varios
modelos, opciones adicionales son proporcionadas:
AIC = 2 ln(RMSE ) +
2c
(1)
n
donde RMSE es la raíz del cuadrado medio del error durante el periodo de estimación, c
es el número de coeficientes estimados en el modelo estimado, y n es el tamaño de
muestral utilizado para estimar el modelo. Nótese que AIC es una función de la varianza
de los residuos del modelo, penalizado por el número de parámetros estimados. En
general, el modelo que será seleccionado minimiza el cuadrado medio del error sin usar
también muchos coeficientes (relativo a la cantidad de datos disponibles).
Criterio de Hannan-Quinn
El Criterio Hannan Quinn (HQC) es calculado por
2 p ln(ln(n) )
HQC = 2 ln(RMSE ) + (2)
n
p ln(n )
SBIC = 2 ln(RMSE ) + (3)
n
Una vez más, la penalización para el número de parámetros estimados es diferente que
para los otros criterios.
Resumen de Pronósticos
Diferenciación no estacional de orden: 1
Diferenciación estacional de orden: 1
Modelo de pronóstico seleccionado: ARIMA(0,1,2)x(2,1,2)12
Número de pronósticos generados: 36
Número de periodos retenidos para validación: 24
Periodo de Periodo de
Estadístico Estimación Validación
RMSE 2.0522 1.55727
MAE 1.35877 1.16503
MAPE 1.49719 1.18882
ME -0.0402442 0.0221547
MPE -0.0732127 0.00847592
Al buscar en los modelos, el procedimiento intenta todos los modelos activados sobre la
caja de dialogo de Opciones del Análisis. Nota: excepto para el Suavizamiento
Exponencial Winter y los modelos ARIMA, los datos estaciónales primero serán ajustados
estacionalmente antes de aplicar pronósticos.
Una vez que se generan los pronósticos, la estacionalidad se desarrolla de nuevo para
crear los pronósticos finales.
Para los datos Golden Gate Bridge, se selecciona el procedimiento con un modelo
ARIMA (0,1,2)x(2,1,2)12. Note que todos los coeficientes del modelo son
estadísticamente significativos. Como podemos apreciar en el grafico sobre la estimación
y los pronósticos, los resultados son satisfactorios:
Time Sequence Plot for Traffic
ARIMA(0,1,2)x(2,1,2)12
123
actual
113 forecast
95.0% limits
Traffic
103
93
83
73
1/68 1/72 1/76 1/80 1/84 1/88
Comparación de Modelos
El panel de Comparación de Modelos despliega información sobre los modelos que
mejor se ajustan por cada tipo solicitado. La sección inferior resume los datos y listas de
los modelos estimados:
Comparación de Modelos
Variable de datos: Traffic
Número de observaciones = 168
Indice Inicial = 1/68
Intervalo de Muestra = 1.0 mes(es)
Longitud de la estacionalidad = 12
Número de periodos retenidos para validación: 24
Modelos
(A) Caminata aleatoria
(B) Media constante = 93.153
(C) Tendencia lineal = 66.5074 + 0.0923593 t
(D) Tendencia cuadrática = 41.5321 + 0.269169 t + -0.000306429 t^2
(E) Tendencia exponencial = exp(4.24508 + 0.000997307 t)
(F) tendencia curtva-S = exp(4.8175 + -80.4029 /t)
(H) Suavización exponencial simple con alfa = 0.7835
(I) Suavización exp. De Brown con alfa = 0.3388
Ajuste matemático: Box-Cox con potencia = 0.0 y adendo = 0.0
(J) Suavización exp. De Holt con alfa = 0.7613 y beta = 0.0143
(K) Suavización exp. cuadrática de Brown con alfa = 0.1791
(L) Suavización exp. de Winter con alfa = 0.5165, beta = 0.02, gama = 0.5
(M) ARIMA(0,1,2)x(2,1,2)12
(N) ARIMA(2,0,2)x(1,1,2)12 con constante
(O) ARIMA(1,1,1)x(2,1,2)12 con constante
(P) ARIMA(1,1,2)x(1,1,2)12
(Q) ARIMA(1,0,0)x(0,1,1)12 con constante
Los cinco modelos ARIMA en la lista poseen el mejor ajuste, entre docenas que fueron
estimadas.
La siguiente sección resume el desarrollo de cada modelo durante la estimación del
periodo:
Periodo de Estimación
Modelo RMSE MAE MAPE ME MPE AIC
(A) 2.15723 1.32165 1.458 -0.00150458 -0.0242249 1.68591
(B) 5.0849 3.86344 4.251 0.00537199 -0.292675 3.41922
(C) 3.24619 2.41982 2.66084 0.00022691 -0.120425 2.53552
(D) 3.22054 2.34518 2.57551 0.000060774 -0.116781 2.53354
(E) 3.25935 2.44179 2.68339 0.0548011 -0.0613545 2.54361
(F) 3.19448 2.34628 2.5743 0.0524653 -0.0587977 2.5034
(G) 2.48865 1.6626 1.82416 0.255358 0.232329 1.81704
(H) 2.91786 2.07536 2.27504 0.882328 0.869531 2.29448
(I) 2.65308 1.7498 1.92949 0.141644 0.126127 2.10422
(J) 2.96059 1.93325 2.13122 -0.316974 -0.389177 2.32355
(K) 2.56768 1.71834 1.89248 -0.0438619 -0.0727782 2.03878
(L) 3.04 1.96053 2.16142 -0.361903 -0.481662 2.22372
(M) 2.0522 1.35877 1.49719 -0.0402442 -0.0732127 1.52116
(N) 2.03378 1.25306 1.38098 0.0884528 0.0582524 1.53091
(O) 2.04984 1.33781 1.47744 0.0450175 0.0131063 1.53275
(P) 2.06766 1.28876 1.42164 -0.0258518 -0.0589859 1.53617
(Q) 2.11182 1.35568 1.49186 0.135221 0.102928 1.53677
La ultima columna hacia la derecha muestral los valores del criterio seleccionado para
cada uno de los modelos. En la muestra de los datos, el modelo ARIMA (2,0,1)x(2,1,1)12
(Modelo M) es el mejor, aunque otros modelo ARIMA diferentes son muy cercanos.
La salida también demuestra que tan bien estuvo cada modelo durante el periodo de
validación de los pronósticos con las observaciones que fueron retenidas para la
estimación del proceso:
Periodo de Validación
Modelo RMSE MAE MAPE ME MPE
(A) 2.72132 1.42365 1.46028 0.00416832 -0.00391219
(B) 35.7947 5.74478 5.79108 5.74478 5.79108
(C) 6.17679 2.06352 2.09452 -2.01854 -2.04853
(D) 2.49534 1.38226 1.41552 -0.368482 -0.386012
(E) 7.17915 2.2584 2.29013 -2.25692 -2.28857
(F) 2.80136 1.41307 1.4416 -0.748106 -0.767949
(G) 2.18546 1.30179 1.32752 0.136708 0.130939
(H) 2.56813 1.36359 1.40201 0.542393 0.537291
(I) 2.46638 1.39127 1.4176 0.374832 0.376192
(J) 4.15101 1.66548 1.70837 1.02078 1.01629
(K) 2.90303 1.44906 1.4631 0.424273 0.437374
(L) 4.15181 1.73076 1.76437 0.987824 0.953436
(M) 2.4251 1.16503 1.18882 0.0221547 0.00847592
(N) 2.09206 1.18016 1.22359 -0.3114 -0.330986
(O) 2.62911 1.13357 1.15323 0.301173 0.292195
(P) 2.0961 1.18316 1.22549 -0.0621341 -0.0776316
(Q) 2.26482 1.25482 1.29717 -0.260738 -0.278414