Vous êtes sur la page 1sur 18

UNA METODOLOGA DE SERIES DE TIEMPO PARA EL REA DE LA SALUD CASO PRCTICO Len Daro Bello Parias1 Sandra Martinez

z Calle2 RESUMEN En los ltimos aos las series de tiempo han tenido desarrollos y aplicaciones importantes en el rea de la salud, por ello, el presente artculo muestra una metodologa ensayada en estudios anteriores, donde se esbozan los pasos en el anlisis de series de tiempo para un enfoque clsico. El objetivo permite identificar un buen modelo de pronstico usando tcnicas de suavizacin: Exponencial, Simple, Holt y Winter. Adems se realiza la validacin de los supuestos de los residuales logrando dar confiabilidad a los resultados del modelo encontrado. Para ejemplarizar el procedimiento se utilizaron los datos del nmero de consultas externas realizadas en la IPS de la Universidad de Antioquia durante abril de 2001 y septiembre de 2005.

Palabras clave Series de tiempo, estacionalidad, aleatoriedad, tendencia, consulta externa.

ABSTRACT In the last years the series of time have had developments and important applications in the area of the health, for that reason, the present article shows a methodology tried in previous studies, where the passages in the analysis of series

1 2

Docente Facultad Nacional de Salud Pblica Estudiante de sptimo semestre de Gerencia en Sistemas de Informacin en Salud.

of time for a classic approach are outlined. The objective allows to identify a good model of smoothing prognosis being used technical: Exponential, Simple, Holt and Winter. In addition the validation of the assumptions of the residual ones is made managing to give trustworthiness to the results of the found model. In order to give example the procedure the data of the number of external consultations made in the IPS of the University of Antioquia were used during April of 2001 and September of 2005.

Key words. Series of time, station, randomness, tendency, consult external. INTRODUCCIN Una serie de tiempo es el conjunto de datos numricos que se obtienen en perodos regulares a travs del tiempo, tambin se conoce como series temporales o series cronolgicas. La unidad de tiempo puede ser: hora, da, mes, trimestre, ao o

cualquier perodo que se pueda considerar de inters.

La suposicin bsica que soporta el anlisis de series temporales es que los factores que han ocasionado patrones o tendencias en el pasado y en el presente continuarn hacindolo, ms o menos de la misma forma en el futuro. Por lo tanto, los principales objetivos del anlisis de series temporales consisten en identificar y aislar tales factores de influencia con el propsito de realizar proyecciones, es decir, estimar los valores futuros de la variable en estudio.

Las series de tiempo poseen caractersticas diferentes de la mayora de mtodos estadsticos utilizados para tratar temas referentes al rea de la salud. Por ejemplo, en la estadstica Paramtrica se asume que los datos provienen de observaciones independientes del fenmeno de inters. Situacin poco probable en datos provenientes de series de tiempo. El incremento o disminucin de algunas enfermedades se pueden ver afectadas por el incremento o disminucin de la poblacin (desplazamiento, violencia), por lo tanto, a medida que se avanza en el tiempo, es probable que se incremente o disminuya el nmero de personas afectadas dado el aumento de la poblacin o que se disminuya debido al desarrollo cientfico y tecnolgico, es decir, los datos estn influenciados por el pasado. Adems, puede suceder que algunos brotes o epidemias sean recurrentes en periodos similares cada ao, debido entre otras situaciones por los cambios climticos, cambio de dietas alimenticias y/o situaciones folclricas y culturales.

Es importante mencionar que existe el enfoque de los modelos ARIMA (Procesos Autorregresivos integrados con promedios mviles), los cuales requieren de una mayor conceptualizacin estadstica, sin embargo, lo expuesto en ste artculo, tambin es til como metodologa para identificar si esos procesos son estacionarios en media y en varianza, lo cual se requiere para identificar el orden de los parmetros que se utilizan en dichos mtodos.

Adems, para eventos no muy cambiantes como suele ocurrir en el rea que nos ocupa, mortalidad y morbilidad en eventos como: suicidios, diferentes tipos de cncer, accidentalidad por diversos motivos, los datos bien sea en casos y an en

tasas, no son voltiles y por lo tanto, los mtodos clsicos ajustan de una manera adecuada, as se demostr en el estudio realizado para la Secretara Distrital de Santa F de Bogot en el ao 20023

La serie con la cual se desarrolla la metodologa propuesta, as como algunos elementos que se deben considerar previamente para garantizar un buen anlisis es el nmero de consultas externas realizadas en la Institucin Prestadora de Servicios de Salud de la Universidad de Antioquia (IPS Universitaria) entre abril de 2001 y septiembre de 2005, datos obtenidos mensualmente.

En la IPS Universitaria, la consulta externa, conformada por consulta mdica general, especializada, subespecializada, atencin domiciliaria y procedimientos teraputicos; constituye uno de los servicios de mayor demanda dentro de la

asistencia prestada por dicha entidad; la poblacin a la cual se le brinda el servicio esta conformada por los afiliados al programa de salud (trabajadores de la Universidad), a los estudiantes de la institucin, y desde hace algunos aos este, entre otros servicios, tambin se presta tanto a usuarios de otras EPS como a personas particulares. Dicha ampliacin de cobertura, ha venido generando una serie de cambios en la dinmica de la prestacin de los servicios, en especial de consulta externa, por lo cual se quiere observar que tanto ha cambiado el comportamiento de dicha variable a travs del tiempo. El software utilizado para el caso prctico fue el SPSS versin 11.0.

Docentes Grisales R, Hugo. Bello P, Len Daro, Hincapi Doraceli- Estudiantes: Lpez Ana Maria y Hoyos Catalina.

CONSIDERACIONES PREVIAS SOBRE UNA SERIE DE DATOS

Consistencia: An considerando que algunas series tienen problemas de calidad del dato, valga decir, subregistro, muestreo insuficiente y dems, el hecho de que la manera de recolectar el dato sea invariable en el tiempo, puede garantizar una buena descripcin de la serie. Lo anterior, tiene que ver con los mecanismos de notificacin, los cuales pueden cambiar la forma de captura de la informacin.

Comparabilidad: Tener presente los posibles cambios que se originan a travs del tiempo, por ejemplo, cuando se involucra la variable nmero de poblacin, es necesario obtener una medida de relacin respecto a ese cambio de volumen.

PASOS EN EL ANALISIS DE UNA SERIE DE TIEMPO: Enfoque clsico. 1. Determinar si la secuencia de datos forman una serie no aleatoria. Una manera emprica de identificar aleatoriedad es mediante el grfico de secuencia, si ste muestra una tendencia hacia arriba o hacia abajo, indica no aleatoriedad, como en ste caso. Para verificar dicha percepcin se realiza la prueba de rachas. Con lo anterior, se determina la dependencia o no de las serie. En caso de que no sea aleatoria, la serie se conoce como ruido blanco o caminata aleatoria y por ende no tiene las componentes de tendencia, estacionalidad ni ciclos. Para el caso prctico el valor del sig. en la prueba de rachas es 0.000 > 0.05, por lo tanto se concluye que la serie no es aleatoria.

2. Anlisis exploratorio de datos. Es vital determinar la existencia de valores atpicos, extremos y valores perdidos antes de tratar de modelar la serie. Para ello se tienen las siguientes herramientas: Grfico de secuencias. Grfico de Caja y Sesgo. Clculo de estadsticas descriptivas.

Para la variable consultas externas, el grfico de secuencia es: Consultas externas realizadas por la IPS Universitaria entre abril de 2001 y septiembre de 2005.

En el grfico anterior se aprecia que la serie presenta una tendencia negativa durante el perodo analizado, siendo ms pronunciada en el ao 2003, a partir de ese ao, el nmero de consultas se mantiene estable. No se identifican valores

perdidos, ni atpicos o extremos. Para el propsito que se busca, es indiferente trabajar con casos o tasas, debido a que el comportamiento en ambos casos es similar.

La estacionalidad no es fcil de intuir segn la figura, por lo tanto, se requiere de mtodos para ello (ndices estacinales).

De otro lado es importante calcular algunas medidas resumen con el fin de confrontar lo encontrado en el grfico, adems, de profundizar en el conocimiento de la serie en aspectos importantes como: La variabilidad de los datos y la forma de los mismos. Las medidas de resumen para la variable consultas externas desde abril de 2001 hasta septiembre de 2005 mes a mes fueron los siguientes:

En promedio se presentaron aproximadamente 6177 consultas externas por mes, con una variabilidad moderadamente alta (1746), es decir, el nmero de consultas externas varia aproximadamente un 28% (coeficiente de variacin) mes a mes. El 50% de los meses se presentaron, en ese perodo 6110 consultas externas o

menos. El menor nmero de consultas externas realizadas en la IPS en un mes, y a su vez uno de los valores ms frecuentes es 2853 .

3. Identificacin de las componentes de una serie. Con el fin de identificar si se realizan pruebas paramtricas o no paramtricas para determinar la presencia de la tendencia, es necesario validar los siguientes supuestos: Aleatoriedad y Normalidad, teniendo en cuenta el perodo estacional de la serie, para este caso se trabaja anualmente, es decir, se validarn los supuestos para cada ao. En algunos casos, no es necesario comparar los promedios para cada ao, ya que se puede partir la serie en varios tramos y comparar dichos promedios, esa particin se puede hacer teniendo en cuenta el grfico de secuencias.

Para la serie que se est analizando los resultados arrojados por SPSS son:

Aleatoriedad Sig. 2001 2002 2003 2004 2005 1.000 0.364 0.034 1.000 1.000

Normalidad Sig. 0.569 0.240 0.858 0.927 0.010

Con respecto a la normalidad se observa que solo para el ao 2005, el nmero de consultas externas no se comporta de manera normal, por lo tanto se puede aplicar la prueba de ANOVA (Anlisis de varianza). En cuanto a la aleatoriedad el nmero de consultas en el ao 2003, muestra una tendencia persistente a la disminucin, y

por ende no cumpli el supuesto de aleatoriedad, sin embargo esto no impide la validez de la prueba de ANOVA.

3.1. Tendencia: Movimiento general o persistente a travs del tiempo, movimiento hacia arriba o hacia abajo del largo plazo. Se presenta por cambios en tecnologa, avances cientficos, incrementos en la poblacin, etc. Para identificar la existencia o no de tendencia en una serie, se realiza la prueba de Anova con respecto a los aos, para determinar si los promedios de consultas externas por ao presentan o no diferencias.

Para el caso prctico, el sig en la prueba de Anova con respecto a los aos es 0.000 < 0.05, lo que significa que al menos uno de los promedios de consultas externas por ao es diferente, lo que confirma que la serie presenta tendencia tal como se haba observado en el grfico.

3.2 Estacionalidad: Fluctuaciones peridicas bastante regulares que se presenta dentro de cada perodo de 12 meses, ao tras ao. Se presenta por condiciones climatolgicas, costumbres sociales y religiosas entre otras razones. Para identificar la existencia o no de estacionalidad en una serie, se puede realizar la prueba de Anova con respecto a los meses, para determinar si los promedios de consultas externas por mes presentan o no diferencias; o probar los ndices estacinales para observar si existen valores que se encuentren por fuera del rango de 90 110.

ndices estacinales: Seasonal index Period (* 100) 1 108.434 2 109.102 3 101.940 4 102.519 5 107.203 6 109.353 7 105.347 8 100.074 9 74.481 10 80.496 11 98.024 12 103.028 De acuerdo con los ndices estacinales se determina que la serie si presenta estacionalidad, pues existen ndices que se encuentran por fuera del rango 90 y 110, el cual es un criterio emprico, pero reconocido en la literatura de series de tiempo para determinar la estacionalidad de una serie. As, por ejemplo, en los meses de septiembre se presenta una marcada disminucin de 25.519% con respecto al promedio de consultas mensuales, mientras que en los meses de febrero y junio se incrementa el nmero de consultas externas. 3.3 Cclica: Oscilaciones repetidas hacia arriba y hacia abajo, no con la misma duracin no por los mismo perodos. Por lo general se presenta por decisiones polticas que impactan los eventos a largo plazo, por lo tanto, en el rea de la salud, es poco probable encontrar series que permitan un anlisis de ciclos. En este caso se tienen datos para 4 aos, lo que indica que sta serie no presenta la componente cclica.

3.4 Irregular: Comportamiento no sistemtico. Fluctuaciones aleatorias sin ningn patrn definido. Todas las series la poseen.

Se concluye que la serie presenta las componentes de tendencia, estacionalidad y variacin irregular. Con estos elementos se puede identificar el modelo.

4. Identificacin del modelo. Existen diferentes procedimientos para encontrar un modelo que permita pronosticar los valores de una serie, entre ellos: Mtodos de suavizacin, modelos mnimos cuadrticos y modelos ARIMA. Para el caso que nos ocupa, el nmero de consultas externas no es muy cambiante, por lo tanto, se utilizan los modelos de suavizacin.

4.1 Suavizado exponencial simple: es una tcnica til para suavizar una serie de tiempo por lo tanto proporciona una impresin de los movimientos o patrones generales de los datos. Adems, el mtodo de suavizado exponencial puede utilizarse para obtener predicciones a corto plazo. Esta tcnica supera al mtodo de promedios mviles en el sentido que no elimina valores como si es el caso anterior. Adems, le da mayor ponderacin a los ltimos valores de la serie y menos peso a los primeros valores. Esta herramienta de anlisis predice un valor basndose en el pronstico del perodo anterior. El suavizado exponencial simple, es apropiado cuando las series a predecir son no estacinales y no tienen una tendencia constante ni ascendente ni descendente.

4.2 Suavizado exponencial de HOLT: es una extensin del planteamiento de suavizado exponencial, la diferencia radica en que el procedimiento de suavizado exponencial proporciona una visin de los movimientos a largo plazo sin tener en cuenta la estacionalidad ni la tendencia, mientras que Holt permite pronosticar la tendencia. Para utilizar el mtodo de Holt para prediccin, suponemos que todos los movimientos de tendencia futuros continuarn a partir del ltimo nivel suavizado. 4.3 Suavizado exponencial de WINTER: Modela el nivel general de la serie, la tendencia y la estacionalidad, por ello se requiere estimar la componente estacional, por medio de lo que se conoce como ndices Estacinales, los cuales sirven para ajustar el modelo.

Para encontrar el modelo adecuado de la serie en estudio, se recurri al Suavizado Exponencial de Winter, dado que la serie presenta estacionalidad y tendencia. En ste caso se requieren 3 constantes de suavizacin, a saber: The SSE is: Alpha .6000000 Gamma Delta .000000 .2000000 SSE 38822536.774

Donde Alpha modela el nivel general de la serie, Gamma la tendencia y Delta la estacionalidad. SSE, es la suma de cuadrados del error, luego el modelo que tenga un menor valor de SSE, es el que se prefiere. Se corrieron varios modelos (constantes diferentes) y el que mejor se ajust a los datos fue: Alpha = 0.6, Gamma = 0.0 y Delta = 0.2

5. Anlisis de Residuales: Es necesario validar los supuestos de aleatoriedad y normalidad de los residuales para determinar si el modelo encontrado es o no el adecuado para realizar pronsticos. La aleatoriedad de los residuales se puede determinar por medio de la prueba de Rachas, y la normalidad mediante la prueba de Smirnov Kolmogorv.

Para el caso de los residuales de la serie de consultas externas los resultados son los siguientes: Aleatoriedad Prueba de Rachas Sig. Mayor de 0.05 Por lo tanto se cumple. En la prueba de Rachas se cumple Normalidad Prueba de Smirnov Kolmogorov Sig. Menor de 0.05, por lo tanto no se cumple. aleatoriedad para los residuales, pero la

normalidad no, no obstante, si se realiza la prueba por ao, estos se comportan de manera normal.

Dado lo anterior, se debe de buscar otro modelo mnimo cuadrticos, como los ofrecidos por el programa SPSS, donde se destacan logartmico, logstico y exponencial entre otros.

Luego de los ensayos de rigor, se encontr que el ajuste exponencial, diferente al suavizado exponencial, permite una buena aproximacin a los datos de consulta externa. Los residuales de ste ltimo modelo cumplen aleatoriedad y normalidad por ao. En ambos casos, se cumplieron los mismos supuestos. Otros modelos, por lo tanto, podrn cumplir las mismas condiciones, e incluso mejores. Por lo tanto, es prudente tener en cuenta a los expertos en la temtica especfica, para darle contexto a las proyecciones meramente estadsticas.

5. Pronsticos. Con la ayuda del Programa SPSS, observamos la forma de presentar la informacin segn el procedimiento. Para el ajuste exponencial, se observa cmo la proyeccin va disminuyendo de una manera leve, adems, se presentan dos bandas construidas por los lmites de los intervalos de confianza, dando un rango de posibilidades donde deber estar la demanda de consultas externas en la IPS universitaria.

Figura 1: Proyeccin mtodo exponencial, consultas externas, 2001-2005

Figura 2: Proyeccin mtodo suavizacin exponencial, consultas externas, 2001-2005

Para el suavizado exponencial, se aprecia que el pronostico est fuertemente influenciado por el ltimo mes (septiembre 2005), sin embargo, el modelo parece ajustar bien los datos. La situacin es, a medida que lleguen nuevos datos, estos se introduzcan a la base de datos para robustecer el modelo. En cualquier caso, no es prudente realizar proyecciones a ms de 6 meses.

Los pronsticos para ambos modelos son: Suavizado Exponencial Mtodo exponencial

Fecha

Oct-05 Nov-05 Dec 2005 Jan 2006 Feb-06 Mar-06 Apr 2006 May-06 Jun-06

3589 3400 2468 2599 3071 3140 3144 3164 2891

4035 3979 3924 3869 3816 3763 3710 3659 3608

Como ya se mencion, el darle contexto a los valores encontrados es fundamental. Conclusiones Existen diferentes metodologas para abordar una serie de tiempo, sin embargo, se sugiere que la seleccin del mtodo sea lo ms prctica y entendible posible. La ayuda de los programas de software permite explorar e implementar el procedimiento de ensayo error, es decir, permite ensayar varias hiptesis para luego escoger la que cumpla un mayor nmero de supuestos y adems, entregue valores razonables para el evento en estudio. La discrecionalidad de los expertos en el tema, no se puede dejar de lado, es ms, deben refinar los pronsticos entregados por los procedimientos estadsticos y darles la cuota de racionalidad al nmero.

Referencias

1. Bello L. Estadstica como apoyo a la investigacin. 1a ed. Medelln: L. Vieco e Hijas Ltda. 2005. 2. Aguirre J. Introduccin al Tratamiento de Series de Tiempo, Aplicacin a las Ciencias de la Salud. Ediciones Diaz de Santos S.A. Ao 1994. 3. Newbold P. Estadstica para los Negocios y la Economa. 4a ed. Ao 1998. 4. Da Silva M. Revista Coyuntura Colombiana, volumen 14, N 1, 1997, (Deteccin de valores atpicos). 5. Daz A. Diseo estadstico de experimentos. Editorial Universidad de Antioquia. Medelln 1999. 6. Manson R. Lind D. Estadstica para Administracin y Economa. 7a ed. Ediciones Alfaomega. Ao 1992. 7. Statgraphis. Series Temporales. (Sitio de Internet) Disponible en:

http://www.statgraphics.net/Producto/MdlSeriesTemp.htm. Consultado: 25 de octubre de 2005. 8. Asociacin de la Sociedad Espaola de Hipertensin. (Sitio de Internet) Disponible en: http://www.seh-lelha.org/tseries.htm. Consultado: 25 de octubre de 2005. 9. Secretarias De Salud Departamentales/Municipales. (Sitio de Internet) Disponible en: http://www.col.ops-oms.org/iah/lisnalsds.htm .

Consultado: 17 de noviembre de 2005. 10. Areyano M. Introduccin al Anlisis Clsico de Series de Tiempo.

11. (Sitio

de

Internet)

Disponible

en: Consultado:

http://ciberconta.unizar.es/LECCION/seriest/000F2.HTM 17 de noviembre de 2005. 12. Bolivar M. Estadstica. (Sitio de Internet)

Disponible

en:

http://www.monografias.com/trabajos14/estadistica/estadistica.shtml#m a. Consultado: 25 de noviembre de 2005.

Vous aimerez peut-être aussi