Vous êtes sur la page 1sur 9

Anlisis y prediccin de los comportamientos de ventas de Productos electrnicos, para el equipamiento del hogar y tecnolgicos utilizando modelos ARIMA

y mtodo de la suavizacin exponencial de Winter. Analysis and prediction of the sales performance of Electronic Products, for home equipment and tech by using ARIMA and Holt-Winters Approach to exponential smoothing. Patricio Abarca Donoso y Emilio Carrasco Cabrera

Resumen: En este trabajo se analiza el comportamiento mensual de ventas de una lnea de producto del comercio al por menor dentro del pas durante los aos 2009 al 2014. Se estudi y realizo el pronstico del comportamiento de ventas de Productos electrnicos, para el equipamiento del hogar y tecnolgicos para el resto del ao 2014 bajo el enfoque de modelos ARIMA y a travs del uso de las funciones de autocorrelaciones (FAC) y funciones de autocorrelaciones parciales (FAP) de los residuos, lo cual fue comparado con el enfoque de prediccin de suavizacin exponencial de Winter. Los datos presentados fueron extrados de la pgina web del Instituto Nacional de Estadsticas (INE) y a travs del ndice de ventas de comercio al por menor (IVCM). Para lograr realizar este estudio se utiliz el software estadstico Statgraphics. Palabras Clave: Comportamiento de ventas, pronstico, ARIMA, Residuos, Suavizacin exponencial de Winter, INE, Statgraphics.

Abstract: In this case we analyze the monthly sales performance of a product line of retail commerce in Chile during the years 2009 to 2014. We study and do the forecast the performance of performance sales of Electronic Products, for home equipment and tech for the rest of the year 2014 under the approach of ARIMA models and through the use of the functions of autocorrelations (FAC) and functions of partial autocorrelations (FAP) of the residues, which was compared with the Holt-Winters Approach to exponential smoothing. The data presented were extracted from the website of the National Statistics Institute (INE) and through the sales index of retail trade (IVCM). To achieve this study the Statgraphics statistical software was used.

Keywords: Sales performance, forecast, ARIMA, Residues, INE, Holt-Winters Approach to exponential smoothing, Statgraphics

Introduccin El presente documento tiene por objeto analizar la evolucin de las ventas del comercio minorista a travs del ndice de Ventas del Comercio al por Menor (IVCM). El IVCM es un ndice que se publica con 30 das de retraso y es representativo a nivel nacional. El periodo base es el ao 2005. La estructura del IVCM se determina partir de la clasificacin de las actividades realizadas por el comercio al por menor, para lo cual se consideran las caractersticas que presenta este sector en el pas y la necesidad de construir un ndice comparable a nivel nacional e internacional. El marco de referencia de la estructura del IVCM corresponde al clasificador internacional de actividades CIIU Rev. 3 en sus divisiones 50 y 52, el cual permite establecer que una empresa se clasifica en una actividad a partir de las lneas de productor que ella comercializa. La estructura del IVCM se construye agrupando lneas de productos en subclases de comercio, ellas en clases de comercio, y estas ltimas en tipos de comercio. Nos enfocaremos directamente en la lnea de productos electrnicos para el equipamiento del hogar y tecnolgicos. El ndice promedio por ao nos da cuenta de la tendencia que siguen los datos recopilados en la investigacin. IVCM promedio 2009 2010 2011 2012 100,00 128,49 156,39 179,41

Datos y mtodos La informacin utilizada corresponde a los ndices de ventas mensuales de productos electrnicos, para el equipamiento del hogar y tecnolgicos correspondientes al comercio minorista. Los datos corresponden al periodo desde enero del ao 2009 hasta diciembre del ao 2013, los datos fueron obtenidos de la pgina web del Instituto nacional de Estadsticas (INE) de nuestro pas, el ndice de Ventas de Comercio al por Menor (IVCM) tiene por objetivo estimar en el corto plazo la evolucin de la actividad econmica del comercio minorista, a travs de las ventas de las empresas que se clasifican dentro de esta actividad y que adems operan dentro del territorio nacional, este ndice se publica los ltimos 5 das de casa mes, la informacin del mes anterior. Los datos utilizados se muestran a continuacin: 2009 2010 2011 2012 2013 Ene 81,28 95,11 123,50 147,22 172,74 Feb 75,96 87,00 116,91 142,84 163,26 Mar 92,96 109,38 150,75 173,04 199,84 Abr 88,44 124,50 146,02 167,36 192,48 May 102,65 141,87 158,66 177,28 210,26 Jun 93,07 125,92 151,41 178,57 202,04 Jul 96,03 127,19 155,54 177,14 205,74 Ago 101,15 123,99 146,91 175,04 204,40 Sep 90,58 110,60 138,88 156,51 176,11 Oct 98,78 129,98 152,51 165,37 193,06 Nov 103,34 133,93 160,95 181,85 214,10 Dic 175,76 232,44 274,58 310,72 345,96 Ver anexo 1 sobre clculo del ndice de Ventas de Comercio al por Menor (IVCM). Anlisis de datos La totalidad de 60 datos correspondientes a 5 aos de 12 meses cada uno han sido agrupados en una serie de tiempo en la cual se logra apreciar un notorio crecimiento.

2013 206,67 Tabla IVCM promedio por ao. A continuacin se proceder a pronosticar los ndices mensuales de ventas de productos electrnicos para el equipamiento del hogar y tecnolgicos en Chile por los mtodos de modelos ARIMA y por una suavizacin exponencial de Winter para el ao 2014.

Se exigen dos supuestos bsicos: 1.-Estacionariedad de 2.- Estacionariedad de la media. la varianza.

El proceso de obtencin del modelo ARIMA consta de 3 partes: Identificacin, Estimacin y Diagnostico. La primera consiste en examinar la Funcin de Autocorrelaciones (FAC) y la Funcin de Autocorrelaciones Parciales (FACP) de la Serie de Tiempo. Para lograr el anlisis de forma correcta de los datos y para poder predecir de buena forma el comportamiento durante los 12 meses del ao 2014 se utiliz un modelo autorregresivo integrado de medias mviles (ARIMA) el cual corresponde a un modelo estadstico que utiliza variaciones y regresiones para poder encontrar patrones y as poder realizar una prediccin a futuro. El modelo ARIMA (p,d,q) est compuesto de 3 parmetros los cuales son nmeros enteros no negativos que indican el orden de las componentes de las que est hecho el modelo. El parmetro p corresponde a la parte autorregresiva del modelo, el parmetro q corresponde a la parte de medias mviles y finalmente el parmetro d tiene relacin con la parte de diferenciacin del modelo. Existe un caso en que la serie de tiempo puede presentar estacionalidad o variacin estacional (variacin peridica y predecible de un periodo inferior o igual a un ao), entonces hablamos de un modelo SARIMA (Seasonal Autoregressive Integrated Moving Average). El orden del modelo ahora posee cuatro parmetros adicionales a los del modelo ARIMA los cuales son (P,D,Q) y s que denota el nmero de periodos por ciclo. Luego la notacin es la siguiente ARIMA (p,d,q)(P,D,Q)S . El modelo ARIMA tiene supuestos que deben cumplirse; los errores aleatorios son normalmente independientes e idnticamente distribuidos con media cero y varianza constante. Adems tambin el modelo presenta restricciones para la parte autorregresiva y tambin de medias mviles. Luego se procede a estimar los parmetros, una vez analizadas FAC y FACP, y as obtener un posible modelo ARIMA que se ajuste de buena manera. Por ltimo, el diagnostico consiste en estimar los residuos de la FAC y la FACP. Estos, segn las pruebas pertinentes, deben pertenecer a un intervalo de confianza (relativamente cercano a cero), es decir, no deben ser significativos. Si podemos probar eso estaramos ad portas de encontrar un modelo valido. Luego los pronsticos calculados tienen validez ya que el modelo encontrado se ajustaba de buena manera. Resultados La grfica de la serie de tiempo mostrada en la imagen anterior muestra clara tendencia y tambin estacionalidad, lo cual adems se ve reflejado en la FAC de la ST a continuacin.

Para el trabajo que se debe hacer con la seria y para su posterior anlisis es necesario tal como describimos anteriormente que la ST no presente problemas de media o varianza. Problema de la varianza: Para detectar la existencia de problemas en la varianza construimos un grfico Rangos-Medias.

Transformacin Raz:

Al examinar el grfico de rangos-medias pudiesen observarse ciertas particularidades que pudiesen ayudarme a elegir una transformacin; examinaremos 2 transformaciones y veremos cual trae consigo mejores resultados. Transformacin de Logaritmo Natural: Si bien a simple vista en los grficos de las ST pareciera resultar como solucin a nuestro problema de la varianza al observar los grficos rangos-medias observamos que la transformacin en raz nos entrega una posible mejor transformacin puesto que los datos se ordenan de menor manera, si bien son muy pocos puntos por la baja cantidad de datos si evidencia de alguna forma que transformacin puede llegar a ser mejor. Problema de la media: Anteriormente detectamos que no haba Estacionariedad en la media, para solucionar esto se aplic una diferenciacin no estacional: Yt = Yt Yt-1 sobre ambas transformaciones; Logaritmo Natural y Raz Cuadrada.

Diferenciacin no estacional sobre transformacin de Logaritmo Natural

Ambas diferenciaciones sobre las transformaciones me entregan grficos de ST, FAC y FAP parecidas pero como la diferenciacin sobre la transformacin de raz cuadrada tiene 2 auto correlaciones parciales significativas menos que la diferenciacin sobre la transformacin del logaritmo natural. Al observar la FAC(la cual denota la parte MA) se puede ver que el grafico corta en un residuo significativo al principio (rk=1), o sea que se puede estimar que el modelo ser MA(1) correspondiente a la parte regular de medias mviles. Tambin podemos ver otro rk significativo en el rk=12 por lo que podramos sospechar un SMA(1) en la parte estacional. Luego al observar la FAP (funcin de la parte autorregresiva) podemos ver 2 rk significativos por los que pudisemos sospechar un AR(1) y adems un decrecimiento lento en los primeros trminos y luego un rk significativo para el rk=12, por lo tanto adems se puede estimar que el modelo en la parte estacional se ajuste con un SAR(1). Diferenciacin no estacional sobre transformacin de Raz Cuadrada De esta forma proponemos un ARIMA el cual arroja los siguientes resultados:

Es fcil apreciar que en la FAC existen 2 de 19 residuos de la auto correlacin que son estadsticamente significativos lo que podra implicar que los residuos pueden no ser completamente aleatorios y en la FAC otros 2 de 19 residuos de auto correlacin parcial que tambin lo son por lo tanto el modelo ARIMA no es vlido.

De esta forma proponemos un ARIMA el cual arroja los siguientes resultados:

Luego de notar que posiblemente la diferenciacin sobre la transformacin de la raz cuadrada era mejor que la sobre la transformacin del logaritmo natural, observamos que la autocorrelacion nmero 12 es significativa y asumiendo que probablemente la numero 24 tambin pudiese serlo realizamos una diferenciacin estacional a la ST de la forma: Yt = Yt Yt-12

Notamos que ninguno de los 24 coeficientes los residuos de la FAC ni de la FAP son estadsticamente significativos, implicando que la ST bien puede ser completamente aleatoria y que el modelo es uno de los posibles que sirven para ajustar la ST. Al darse cuenta de que la diferenciacin estacional me ayuda a reducir la cantidad de residuos significativos, tomamos nuestro SARIMA estimado pero ahora incluiremos la diferenciacin estacional (asumiendo que adems del 12 el 24 tambin tuviese rk significativos)

Se prob validez del modelo ARIMA(2,1,1)(1,1,1)12 a travs del resumen estadstico entregado por el software Statgraphics.

Los valores-P en la salida del programa nos indican que todos los valores son significativos (>0,05), con esto podemos utilizar el modelo ARIMA propuesto y realizar pruebas de normalidad, homocedasticidad e independencia de los residuos para determinar si podemos aceptarlo como vlido.

El valor-P de la prueba de aleatoriedad para los residuos de Box-Pierce entrega un valor de 0,516246 con lo que no podemos rechazar la hiptesis nula de que las autocorrelaciones son cero, por lo cual todas estas estn dentro del intervalo de confianza y son relativamente cercanas a cero. Tambin se realiza la prueba de normalidad de Smirnov-Kolmogorov, la cual entrega datos a continuacin:

Respecto a la prueba de homocedasticidad tenemos como hiptesis nula la igualdad de varianzas, y como no podemos rechazarla se acepta la igualdad de varianzas. Luego de todo el proceso que realizamos, pudimos obtener los pronsticos para un ao despus de nuestro ltimo ao que tenamos como dato. Los pronsticos se muestran a continuacin:

El valor-P entregado es mayor de =0,05 (95% confianza) por lo que no podemos rechazar la hiptesis nula, por lo tanto los residuos provienen de una distribucin Normal.

Comparacin Se realiz mediante el mtodo de suavizacin exponencial de Winter en Statgraphics otro pronstico con el fin de comparar la precisin que esta entrega con la del modelo ARIMA, esto se hizo de forma automtica con los datos transformados por la raz cuadrada de la ST y optimizando los parmetros del mtodo los resultados fueron los siguientes.

Para lograr la correcta generacin de pronsticos se ajust un modelo ARIMA a la ST y adems se realiz una suavizacin exponencial de Winter a manera de comparar. Para el ajuste del ARIMA primero debi identificarse el modelo ms adecuado, esto implico detectar problemas en la estacionariedad en media y la varianza, luego se debieron eliminar estos problemas va transformaciones y diferenciaciones de la ST. Luego se estimaron los parmetros del modelo para finalmente realizar la validacin de todos los supuestos de forma adecuada. Es importante decir que la ST se ajust a un modelo ARIMA y para la comparacin con la suavizacin exponencial de Winter se usaron los parmetros = 0,3895; =0,0935 ; =0,5524

El detalle de los pronsticos se presenta a continuacin:

Es evidente que los pronsticos que entrega el mtodo de la suavizacin exponencial de Winter difieren de los obtenidos con el modelo ARIMA ajustado anteriormente, es importante a la hora del anlisis la precisin con la que son obtenidos en los datos. Conclusiones En nuestro trabajo se analiz una serie de tiempo de ventas de Productos electrnicos, para el equipamiento del hogar y tecnolgicos que corresponden a una lnea del comercio minorista en Chile, a partir de estas series se generaron pronsticos para el ao presente.

Finalmente, el modelo que mejor pronostic los valores futuros de la serie de tiempo fue el modelo ARIMA estimado, debido a que las medidas de desempeo son menores a las de la suavizacin exponencial de Winter. El modelo ARIMA presenta un mejor desempeo pues el error cuadrtico medio (RMSE) es menor al de Winter. Eso s es importante destacar que la tendencia y estacionalidad tambin fueron capturadas por la suavizacin exponencial de Winter por lo tanto tambin se considera un mtodo valido, adems de la notoria mayor rapidez con la que se obtuvo tambin es vlido para realizar pronsticos de forma rpida y eficiente.

Referencias

Vous aimerez peut-être aussi