Vous êtes sur la page 1sur 9

STATGRAPHICS – Rev.

9/14/2006

Pronósticos Automáticos

Resumen
El procedimiento de Pronósticos Automáticos esta diseñado para pronosticar valores
futuros en datos de una serie de tiempo. Una serie de tiempo consiste en un conjunto de
datos numéricos secuenciales tomados en intervalos igualmente espaciados, generalmente
sobre un periodo de tiempo o espacio. Desemejante al procedimiento de pronósticos se
espera que el usuario seleccione el modelo del pronóstico a utilizar, este procedimiento
contiene muchos modelos y selecciona al mejor modelo posible según criterios
especificados. El criterio disponible para la sección del modelo incluye el Criterio de
Información Ataide (AIC), el Criterio Hannan-Quinn (HQC), y el Criterio Schwarz-
Bayesian (SBC). Este criterio selecciona con el cuadrado medio del error más pequeño,
sujeto a una penalización para el número de parámetros desconocidos que se necesitan
estimar.

Puesto que la salida de este procedimiento es similar al procedimiento Pronósticos, este


documento destacará solamente los aspectos únicos del procedimiento de Pronósticos
Automáticos. Para una discusión detallada de todas las tablas, consulte la documentación
de Pronósticos.

Ejemplo StatFolio: autocast.sgp

Datos del Ejemplo:


El archivo golden gate.sf6 contiene volúmenes mensuales de trafico en Golden Gate
Bridge en San Francisco para un periodo de n = 168 meses desde Enero, 1968 hasta
Diciembre, 1981. La tabla de abajo muestra una lista parcial de los datos de este archivo:

Month Traffic
(Mes) (Trafico)
1/68 73.637
2/68 77.136
3/68 81.481
4/68 84.127
5/68 84.562
6/68 91.959
7/68 94.174
8/68 96.087
9/68 88.952
10/68 83.479
11/68 80.814
12/68 77.466
1/69 75.225
… …

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 1


STATGRAPHICS – Rev. 9/14/2006

Los datos fueron obtenidos de una publicación del Golden Gate Bridge.

Entrada de Datos
La caja de dialogo para la entrada de datos solicita el nombre de la columna que
contienen los datos de la serie de tiempo:

• Datos: Contiene la columna numérica con n observaciones numéricas igualmente


espaciadas.

• Intervalo de Muestreo: Define el intervalo entre observaciones sucesivas. Por


ejemplo, los datos del Golden Gate Bridge fueron recolectados una vez cada mes,
empezando en Enero, 1968.

• Estacionalidad: La longitud de la estacionalidad es s, si la hay. Los datos son


estaciónales si existen un patrón que se repite en un periodo fijo. Por ejemplo, los
datos mensuales como el trafico sobre Golden Gate Bridge tienen una estacionalidad
de s = 12. Los datos de horas que se repiten cada día tienen una estacionalidad de s =
24. Si no se ingresa nada, se asume que los datos tienen estacionalidad (s=1).

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 2


STATGRAPHICS – Rev. 9/14/2006

• Ajustar los Días: Una variable numérica con n observaciones es utilizada para
normalizar las observaciones originales, por ejemplo el número de días trabajados en
un mes. Las observaciones en la columna Datos pueden ser divididos por estos
valores antes de dibujar un grafico o calcular un análisis. Debe haber suficientes
entradas en esta columna para cubrir tanto los datos observados como el número de
periodos en los cuales se solicitan los pronósticos.

• Selección: La selección de un conjunto en los datos.

• Numero de Pronósticos: Número de periodos que continúan al final de los datos


para los cuales se desean los pronósticos.

• Retención para Validación: Número de periodos m al final de la serie con


propósitos de retención para la validación. Los datos en estos periodos no pueden
utilizarse para estimar el modelo de pronósticos. Sin embargo, se calculan estadísticas
que describen que tan bueno es el modelo estimado para poder pronosticar estas
observaciones.

En el ejemplo actual, los datos de trafico son mensuales empezando en Enero, 1968, y se
tiene una estacionalidad de s = 12. Un m = 24 observaciones al final de la serie de tiempo
con propósitos de retención para la validación, mientras los pronósticos pueden generarse
de los siguientes 36 meses.

Opciones del Análisis


El modelo estimado por el procedimiento Pronósticos Automáticos es controlado por la
caja de dialogo de Opciones del Análisis:

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 3


STATGRAPHICS – Rev. 9/14/2006

• Modelos Incluidos: Especifica el modelo que se debe estimar sobre los datos. Estos
son los modelos de los cuales el “mejor” será seleccionado. La descripción de cada
modelo puede encontrarse en la documentación de “Pronósticos”. Para varios
modelos, opciones adicionales son proporcionadas:

Modelo Walk Aleatorio – Valida si se incluye constante para considerar un


modelo que contenga una constante así como una sin constante.

Modelo de Medias Móviles – Seleccione el orden de valores máximo a considerar.


Los modelos se estimarán a partir de 2 valores o más a través del número que se
indique.

ARIMA con términos AR – Específica el orden máximo p de los términos auto-


regresivos en el modelo.

ARIMA con términos MA – Específica el orden máximo q de los términos de


medias móviles en el modelo. Se puede elegir solo considerar modelos de la
forma q = p – 1.

ARIMA con Diferenciación – Específica el orden máximo de diferenciación d.


Seleccione Incluir constante para considerar que el modelo incluya un termino
constante cuando la diferenciación se desarrolla.

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 4


STATGRAPHICS – Rev. 9/14/2006

• Criterio de Información: El criterio utilizado para seleccionar el mejor modelo.

• Transformación: Antes de ajustar un modelo, los datos pueden transformarse usando


algunas de las operaciones indicadas.

El procedimiento estima cada uno de los modelos seleccionados y selecciona el modelo


que encuentra el valor más pequeño sobre la selección del criterio. Son tres criterios a
elegir de:

Criterio de Información Akaike


El Criterio de Información Akaike (AIC) es calculado por

AIC = 2 ln(RMSE ) +
2c
(1)
n

donde RMSE es la raíz del cuadrado medio del error durante el periodo de estimación, c
es el número de coeficientes estimados en el modelo estimado, y n es el tamaño de
muestral utilizado para estimar el modelo. Nótese que AIC es una función de la varianza
de los residuos del modelo, penalizado por el número de parámetros estimados. En
general, el modelo que será seleccionado minimiza el cuadrado medio del error sin usar
también muchos coeficientes (relativo a la cantidad de datos disponibles).

Criterio de Hannan-Quinn
El Criterio Hannan Quinn (HQC) es calculado por
2 p ln(ln(n) )
HQC = 2 ln(RMSE ) + (2)
n

Este criterio utiliza diferentes penalizaciones para el número de parámetros estimados.

Criterio de Información Schwarz-Bayesian


El Criterio de Información Schwarz-Bayesian (SBIC) es calculado por

p ln(n )
SBIC = 2 ln(RMSE ) + (3)
n

Una vez más, la penalización para el número de parámetros estimados es diferente que
para los otros criterios.

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 5


STATGRAPHICS – Rev. 9/14/2006

Resumen del Análisis


La salida de Resumen del Análisis calcula un pronóstico estándar para cualquier modelo
que tenga el valor más pequeño del criterio especificado.

Pronósticos Automáticos - Traffic


Datos/Variable: Traffic (Golden Gate Bridge Traffic Volume)

Número de observaciones = 168


Indice Inicial = 1/68
Intervalo de Muestra = 1.0 mes(es)
Longitud de la estacionalidad = 12

Resumen de Pronósticos
Diferenciación no estacional de orden: 1
Diferenciación estacional de orden: 1
Modelo de pronóstico seleccionado: ARIMA(0,1,2)x(2,1,2)12
Número de pronósticos generados: 36
Número de periodos retenidos para validación: 24

Periodo de Periodo de
Estadístico Estimación Validación
RMSE 2.0522 1.55727
MAE 1.35877 1.16503
MAPE 1.49719 1.18882
ME -0.0402442 0.0221547
MPE -0.0732127 0.00847592

Resumen de Modelo ARIMA


Parámetro Estimado Error Estd. t Valor-P
MA(1) 0.242799 0.0877347 2.76742 0.006367
MA(2) 0.238687 0.0869116 2.74632 0.006770
SAR(1) -1.04978 0.13349 -7.86407 0.000000
SAR(2) -0.0556194 0.119539 -0.465283 0.642408
SMA(1) -0.243651 0.0819685 -2.97249 0.003446
SMA(2) 0.899649 0.0464212 19.3801 0.000000
Pronóstico Histórico: sí
Varianza estimada de ruido blanco = 4.37813 con 149 grados de libertad
Desviación estándar estimada de ruido blanco = 2.0924
Número de iteraciones: 17

Al buscar en los modelos, el procedimiento intenta todos los modelos activados sobre la
caja de dialogo de Opciones del Análisis. Nota: excepto para el Suavizamiento
Exponencial Winter y los modelos ARIMA, los datos estaciónales primero serán ajustados
estacionalmente antes de aplicar pronósticos.

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 6


STATGRAPHICS – Rev. 9/14/2006

Una vez que se generan los pronósticos, la estacionalidad se desarrolla de nuevo para
crear los pronósticos finales.

Para los datos Golden Gate Bridge, se selecciona el procedimiento con un modelo
ARIMA (0,1,2)x(2,1,2)12. Note que todos los coeficientes del modelo son
estadísticamente significativos. Como podemos apreciar en el grafico sobre la estimación
y los pronósticos, los resultados son satisfactorios:
Time Sequence Plot for Traffic
ARIMA(0,1,2)x(2,1,2)12
123
actual
113 forecast
95.0% limits
Traffic

103

93

83

73
1/68 1/72 1/76 1/80 1/84 1/88

Comparación de Modelos
El panel de Comparación de Modelos despliega información sobre los modelos que
mejor se ajustan por cada tipo solicitado. La sección inferior resume los datos y listas de
los modelos estimados:
Comparación de Modelos
Variable de datos: Traffic
Número de observaciones = 168
Indice Inicial = 1/68
Intervalo de Muestra = 1.0 mes(es)
Longitud de la estacionalidad = 12
Número de periodos retenidos para validación: 24

Modelos
(A) Caminata aleatoria
(B) Media constante = 93.153
(C) Tendencia lineal = 66.5074 + 0.0923593 t
(D) Tendencia cuadrática = 41.5321 + 0.269169 t + -0.000306429 t^2
(E) Tendencia exponencial = exp(4.24508 + 0.000997307 t)
(F) tendencia curtva-S = exp(4.8175 + -80.4029 /t)
(H) Suavización exponencial simple con alfa = 0.7835
(I) Suavización exp. De Brown con alfa = 0.3388
Ajuste matemático: Box-Cox con potencia = 0.0 y adendo = 0.0
(J) Suavización exp. De Holt con alfa = 0.7613 y beta = 0.0143
(K) Suavización exp. cuadrática de Brown con alfa = 0.1791
(L) Suavización exp. de Winter con alfa = 0.5165, beta = 0.02, gama = 0.5
(M) ARIMA(0,1,2)x(2,1,2)12
(N) ARIMA(2,0,2)x(1,1,2)12 con constante
(O) ARIMA(1,1,1)x(2,1,2)12 con constante
(P) ARIMA(1,1,2)x(1,1,2)12
(Q) ARIMA(1,0,0)x(0,1,1)12 con constante

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 7


STATGRAPHICS – Rev. 9/14/2006

Los cinco modelos ARIMA en la lista poseen el mejor ajuste, entre docenas que fueron
estimadas.
La siguiente sección resume el desarrollo de cada modelo durante la estimación del
periodo:

Periodo de Estimación
Modelo RMSE MAE MAPE ME MPE AIC
(A) 2.15723 1.32165 1.458 -0.00150458 -0.0242249 1.68591
(B) 5.0849 3.86344 4.251 0.00537199 -0.292675 3.41922
(C) 3.24619 2.41982 2.66084 0.00022691 -0.120425 2.53552
(D) 3.22054 2.34518 2.57551 0.000060774 -0.116781 2.53354
(E) 3.25935 2.44179 2.68339 0.0548011 -0.0613545 2.54361
(F) 3.19448 2.34628 2.5743 0.0524653 -0.0587977 2.5034
(G) 2.48865 1.6626 1.82416 0.255358 0.232329 1.81704
(H) 2.91786 2.07536 2.27504 0.882328 0.869531 2.29448
(I) 2.65308 1.7498 1.92949 0.141644 0.126127 2.10422
(J) 2.96059 1.93325 2.13122 -0.316974 -0.389177 2.32355
(K) 2.56768 1.71834 1.89248 -0.0438619 -0.0727782 2.03878
(L) 3.04 1.96053 2.16142 -0.361903 -0.481662 2.22372
(M) 2.0522 1.35877 1.49719 -0.0402442 -0.0732127 1.52116
(N) 2.03378 1.25306 1.38098 0.0884528 0.0582524 1.53091
(O) 2.04984 1.33781 1.47744 0.0450175 0.0131063 1.53275
(P) 2.06766 1.28876 1.42164 -0.0258518 -0.0589859 1.53617
(Q) 2.11182 1.35568 1.49186 0.135221 0.102928 1.53677

La ultima columna hacia la derecha muestral los valores del criterio seleccionado para
cada uno de los modelos. En la muestra de los datos, el modelo ARIMA (2,0,1)x(2,1,1)12
(Modelo M) es el mejor, aunque otros modelo ARIMA diferentes son muy cercanos.

La salida también demuestra que tan bien estuvo cada modelo durante el periodo de
validación de los pronósticos con las observaciones que fueron retenidas para la
estimación del proceso:

Periodo de Validación
Modelo RMSE MAE MAPE ME MPE
(A) 2.72132 1.42365 1.46028 0.00416832 -0.00391219
(B) 35.7947 5.74478 5.79108 5.74478 5.79108
(C) 6.17679 2.06352 2.09452 -2.01854 -2.04853
(D) 2.49534 1.38226 1.41552 -0.368482 -0.386012
(E) 7.17915 2.2584 2.29013 -2.25692 -2.28857
(F) 2.80136 1.41307 1.4416 -0.748106 -0.767949
(G) 2.18546 1.30179 1.32752 0.136708 0.130939
(H) 2.56813 1.36359 1.40201 0.542393 0.537291
(I) 2.46638 1.39127 1.4176 0.374832 0.376192
(J) 4.15101 1.66548 1.70837 1.02078 1.01629
(K) 2.90303 1.44906 1.4631 0.424273 0.437374
(L) 4.15181 1.73076 1.76437 0.987824 0.953436
(M) 2.4251 1.16503 1.18882 0.0221547 0.00847592
(N) 2.09206 1.18016 1.22359 -0.3114 -0.330986
(O) 2.62911 1.13357 1.15323 0.301173 0.292195
(P) 2.0961 1.18316 1.22549 -0.0621341 -0.0776316
(Q) 2.26482 1.25482 1.29717 -0.260738 -0.278414

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 8


STATGRAPHICS – Rev. 9/14/2006

El modelo ARIMA seleccionado posee un buen desarrollo, especialmente sobre MAPE


con aproximadamente 1.2%, aunque podría cambiarse por otros modelos ARIMA con
respecto a RMSE.

© 2006 por StatPoint, Inc. Pronósticos Automáticos - 9

Vous aimerez peut-être aussi