Vous êtes sur la page 1sur 18

UNA METODOLOGA DE SERIES DE TIEMPO PARA EL REA DE LA SALUD

CASO PRCTICO

Len Daro Bello Parias1


Sandra Martinez Calle2

RESUMEN

En los ltimos aos las series de tiempo han tenido desarrollos y aplicaciones

importantes en el rea de la salud, por ello, el presente artculo muestra una

metodologa ensayada en estudios anteriores, donde se esbozan los pasos en el

anlisis de series de tiempo para un enfoque clsico. El objetivo permite identificar

un buen modelo de pronstico usando tcnicas de suavizacin: Exponencial, Simple,

Holt y Winter. Adems se realiza la validacin de los supuestos de los residuales

logrando dar confiabilidad a los resultados del modelo encontrado. Para ejemplarizar

el procedimiento se utilizaron los datos del nmero de consultas externas realizadas

en la IPS de la Universidad de Antioquia durante abril de 2001 y septiembre de 2005.

Palabras clave

Series de tiempo, estacionalidad, aleatoriedad, tendencia, consulta externa.

ABSTRACT

In the last years the series of time have had developments and important

applications in the area of the health, for that reason, the present article shows a

methodology tried in previous studies, where the passages in the analysis of series

of time for a classic approach are outlined. The objective allows to identify a good

1
Docente Facultad Nacional de Salud Pblica
2
Estudiante de sptimo semestre de Gerencia en Sistemas de Informacin en Salud.
model of smoothing prognosis being used technical: Exponential, Simple, Holt and

Winter. In addition the validation of the assumptions of the residual ones is made

managing to give trustworthiness to the results of the found model. In order to give

example the procedure the data of the number of external consultations made in the

IPS of the University of Antioquia were used during April of 2001 and September of

2005.

Key words.

Series of time, station, randomness, tendency, consult external.

INTRODUCCIN

Una serie de tiempo es el conjunto de datos numricos que se obtienen en perodos

regulares a travs del tiempo, tambin se conoce como series temporales o series

cronolgicas. La unidad de tiempo puede ser: hora, da, mes, trimestre, ao o

cualquier perodo que se pueda considerar de inters.

La suposicin bsica que soporta el anlisis de series temporales es que los factores

que han ocasionado patrones o tendencias en el pasado y en el presente

continuarn hacindolo, ms o menos de la misma forma en el futuro. Por lo tanto,

los principales objetivos del anlisis de series temporales consisten en identificar y

aislar tales factores de influencia con el propsito de realizar proyecciones, es decir,

estimar los valores futuros de la variable en estudio.


Las series de tiempo poseen caractersticas diferentes de la mayora de mtodos

estadsticos utilizados para tratar temas referentes al rea de la salud. Por ejemplo,

en la estadstica Paramtrica se asume que los datos provienen de observaciones

independientes del fenmeno de inters. Situacin poco probable en datos

provenientes de series de tiempo. El incremento o disminucin de algunas

enfermedades se pueden ver afectadas por el incremento o disminucin de la

poblacin (desplazamiento, violencia), por lo tanto, a medida que se avanza en el

tiempo, es probable que se incremente o disminuya el nmero de personas

afectadas dado el aumento de la poblacin o que se disminuya debido al desarrollo

cientfico y tecnolgico, es decir, los datos estn influenciados por el pasado.

Adems, puede suceder que algunos brotes o epidemias sean recurrentes en

periodos similares cada ao, debido entre otras situaciones por los cambios

climticos, cambio de dietas alimenticias y/o situaciones folclricas y culturales.

Es importante mencionar que existe el enfoque de los modelos ARIMA (Procesos

Autorregresivos integrados con promedios mviles), los cuales requieren de una

mayor conceptualizacin estadstica, sin embargo, lo expuesto en ste artculo,

tambin es til como metodologa para identificar si esos procesos son estacionarios

en media y en varianza, lo cual se requiere para identificar el orden de los

parmetros que se utilizan en dichos mtodos.

Adems, para eventos no muy cambiantes como suele ocurrir en el rea que nos

ocupa, mortalidad y morbilidad en eventos como: suicidios, diferentes tipos de

cncer, accidentalidad por diversos motivos, los datos bien sea en casos y an en
tasas, no son voltiles y por lo tanto, los mtodos clsicos ajustan de una manera

adecuada, as se demostr en el estudio realizado para la Secretara Distrital de

Santa F de Bogot en el ao 20023

La serie con la cual se desarrolla la metodologa propuesta, as como algunos

elementos que se deben considerar previamente para garantizar un buen anlisis es

el nmero de consultas externas realizadas en la Institucin Prestadora de Servicios

de Salud de la Universidad de Antioquia (IPS Universitaria) entre abril de 2001 y

septiembre de 2005, datos obtenidos mensualmente.

En la IPS Universitaria, la consulta externa, conformada por consulta mdica

general, especializada, subespecializada, atencin domiciliaria y procedimientos

teraputicos; constituye uno de los servicios de mayor demanda dentro de la

asistencia prestada por dicha entidad; la poblacin a la cual se le brinda el servicio

esta conformada por los afiliados al programa de salud (trabajadores de la

Universidad), a los estudiantes de la institucin, y desde hace algunos aos este,

entre otros servicios, tambin se presta tanto a usuarios de otras EPS como a

personas particulares. Dicha ampliacin de cobertura, ha venido generando una

serie de cambios en la dinmica de la prestacin de los servicios, en especial de

consulta externa, por lo cual se quiere observar que tanto ha cambiado el

comportamiento de dicha variable a travs del tiempo. El software utilizado para el

caso prctico fue el SPSS versin 11.0.

3
Docentes Grisales R, Hugo. Bello P, Len Daro, Hincapi Doraceli- Estudiantes: Lpez Ana Maria y Hoyos Catalina.
CONSIDERACIONES PREVIAS SOBRE UNA SERIE DE DATOS

Consistencia: An considerando que algunas series tienen problemas de calidad

del dato, valga decir, subregistro, muestreo insuficiente y dems, el hecho de que la

manera de recolectar el dato sea invariable en el tiempo, puede garantizar una

buena descripcin de la serie. Lo anterior, tiene que ver con los mecanismos de

notificacin, los cuales pueden cambiar la forma de captura de la informacin.

Comparabilidad: Tener presente los posibles cambios que se originan a travs del

tiempo, por ejemplo, cuando se involucra la variable nmero de poblacin, es

necesario obtener una medida de relacin respecto a ese cambio de volumen.

PASOS EN EL ANALISIS DE UNA SERIE DE TIEMPO: Enfoque clsico.

1. Determinar si la secuencia de datos forman una serie no aleatoria.

Una manera emprica de identificar aleatoriedad es mediante el grfico de

secuencia, si ste muestra una tendencia hacia arriba o hacia abajo, indica no

aleatoriedad, como en ste caso. Para verificar dicha percepcin se realiza la prueba

de rachas. Con lo anterior, se determina la dependencia o no de las serie. En caso

de que no sea aleatoria, la serie se conoce como ruido blanco o caminata aleatoria y

por ende no tiene las componentes de tendencia, estacionalidad ni ciclos.

Para el caso prctico el valor del sig. en la prueba de rachas es 0.000 > 0.05, por lo

tanto se concluye que la serie no es aleatoria.

2. Anlisis exploratorio de datos.


Es vital determinar la existencia de valores atpicos, extremos y valores perdidos

antes de tratar de modelar la serie. Para ello se tienen las siguientes

herramientas:

- Grfico de secuencias.

- Grfico de Caja y Sesgo.

- Clculo de estadsticas descriptivas.

Para la variable consultas externas, el grfico de secuencia es:

Consultas externas realizadas por la IPS Universitaria entre abril de 2001 y

septiembre de 2005.

En el grfico anterior se aprecia que la serie presenta una tendencia negativa

durante el perodo analizado, siendo ms pronunciada en el ao 2003, a partir de

ese ao, el nmero de consultas se mantiene estable. No se identifican valores

perdidos, ni atpicos o extremos. Para el propsito que se busca, es indiferente


trabajar con casos o tasas, debido a que el comportamiento en ambos casos es

similar.

La estacionalidad no es fcil de intuir segn la figura, por lo tanto, se requiere de

mtodos para ello (ndices estacinales).

De otro lado es importante calcular algunas medidas resumen con el fin de

confrontar lo encontrado en el grfico, adems, de profundizar en el conocimiento de

la serie en aspectos importantes como: La variabilidad de los datos y la forma de los

mismos.

Las medidas de resumen para la variable consultas externas desde abril de 2001

hasta septiembre de 2005 mes a mes fueron los siguientes:

En promedio se presentaron aproximadamente 6177 consultas externas por mes,

con una variabilidad moderadamente alta (1746), es decir, el nmero de consultas

externas varia aproximadamente un 28% (coeficiente de variacin) mes a mes. El

50% de los meses se presentaron, en ese perodo 6110 consultas externas o

menos. El menor nmero de consultas externas realizadas en la IPS en un mes, y a

su vez uno de los valores ms frecuentes es 2853 .


3. Identificacin de las componentes de una serie.

Con el fin de identificar si se realizan pruebas paramtricas o no paramtricas para

determinar la presencia de la tendencia, es necesario validar los siguientes

supuestos: Aleatoriedad y Normalidad, teniendo en cuenta el perodo estacional de

la serie, para este caso se trabaja anualmente, es decir, se validarn los supuestos

para cada ao. En algunos casos, no es necesario comparar los promedios para

cada ao, ya que se puede partir la serie en varios tramos y comparar dichos

promedios, esa particin se puede hacer teniendo en cuenta el grfico de

secuencias.

Para la serie que se est analizando los resultados arrojados por SPSS son:

Aleatoriedad Normalidad

Sig. Sig.

2001 1.000 0.569


2002 0.364 0.240
2003 0.034 0.858
2004 1.000 0.927
2005 1.000 0.010

Con respecto a la normalidad se observa que solo para el ao 2005, el nmero de

consultas externas no se comporta de manera normal, por lo tanto se puede aplicar

la prueba de ANOVA (Anlisis de varianza). En cuanto a la aleatoriedad el nmero

de consultas en el ao 2003, muestra una tendencia persistente a la disminucin, y

por ende no cumpli el supuesto de aleatoriedad, sin embargo esto no impide la

validez de la prueba de ANOVA.


3.1. Tendencia: Movimiento general o persistente a travs del tiempo, movimiento

hacia arriba o hacia abajo del largo plazo. Se presenta por cambios en tecnologa,

avances cientficos, incrementos en la poblacin, etc.

Para identificar la existencia o no de tendencia en una serie, se realiza la prueba de

Anova con respecto a los aos, para determinar si los promedios de consultas

externas por ao presentan o no diferencias.

Para el caso prctico, el sig en la prueba de Anova con respecto a los aos es 0.000

< 0.05, lo que significa que al menos uno de los promedios de consultas externas

por ao es diferente, lo que confirma que la serie presenta tendencia tal como se

haba observado en el grfico.

3.2 Estacionalidad: Fluctuaciones peridicas bastante regulares que se presenta

dentro de cada perodo de 12 meses, ao tras ao. Se presenta por condiciones

climatolgicas, costumbres sociales y religiosas entre otras razones.

Para identificar la existencia o no de estacionalidad en una serie, se puede realizar

la prueba de Anova con respecto a los meses, para determinar si los promedios de

consultas externas por mes presentan o no diferencias; o probar los ndices

estacinales para observar si existen valores que se encuentren por fuera del rango

de 90 110.

ndices estacinales:
Seasonal
index
Period (* 100)
1 108.434
2 109.102
3 101.940
4 102.519
5 107.203
6 109.353
7 105.347
8 100.074
9 74.481
10 80.496
11 98.024
12 103.028

De acuerdo con los ndices estacinales se determina que la serie si presenta

estacionalidad, pues existen ndices que se encuentran por fuera del rango 90 y 110,

el cual es un criterio emprico, pero reconocido en la literatura de series de tiempo

para determinar la estacionalidad de una serie.

As, por ejemplo, en los meses de septiembre se presenta una marcada disminucin

de 25.519% con respecto al promedio de consultas mensuales, mientras que en los

meses de febrero y junio se incrementa el nmero de consultas externas.

3.3 Cclica: Oscilaciones repetidas hacia arriba y hacia abajo, no con la misma

duracin no por los mismo perodos. Por lo general se presenta por decisiones

polticas que impactan los eventos a largo plazo, por lo tanto, en el rea de la salud,

es poco probable encontrar series que permitan un anlisis de ciclos.

En este caso se tienen datos para 4 aos, lo que indica que sta serie no presenta la

componente cclica.
3.4 Irregular: Comportamiento no sistemtico. Fluctuaciones aleatorias sin ningn

patrn definido. Todas las series la poseen.

Se concluye que la serie presenta las componentes de tendencia, estacionalidad y

variacin irregular. Con estos elementos se puede identificar el modelo.

4. Identificacin del modelo.

Existen diferentes procedimientos para encontrar un modelo que permita

pronosticar los valores de una serie, entre ellos: Mtodos de suavizacin,

modelos mnimos cuadrticos y modelos ARIMA. Para el caso que nos ocupa, el

nmero de consultas externas no es muy cambiante, por lo tanto, se utilizan los

modelos de suavizacin.

4.1 Suavizado exponencial simple: es una tcnica til para suavizar una

serie de tiempo por lo tanto proporciona una impresin de los movimientos o

patrones generales de los datos. Adems, el mtodo de suavizado exponencial

puede utilizarse para obtener predicciones a corto plazo. Esta tcnica supera al

mtodo de promedios mviles en el sentido que no elimina valores como si es el

caso anterior. Adems, le da mayor ponderacin a los ltimos valores de la serie y

menos peso a los primeros valores.

Esta herramienta de anlisis predice un valor basndose en el pronstico del

perodo anterior. El suavizado exponencial simple, es apropiado cuando las series a

predecir son no estacinales y no tienen una tendencia constante ni ascendente ni

descendente.
4.2 Suavizado exponencial de HOLT: es una extensin del planteamiento de

suavizado exponencial, la diferencia radica en que el procedimiento de suavizado

exponencial proporciona una visin de los movimientos a largo plazo sin tener en

cuenta la estacionalidad ni la tendencia, mientras que Holt permite pronosticar la

tendencia.

Para utilizar el mtodo de Holt para prediccin, suponemos que todos los

movimientos de tendencia futuros continuarn a partir del ltimo nivel suavizado.

4.3 Suavizado exponencial de WINTER: Modela el nivel general de la serie,

la tendencia y la estacionalidad, por ello se requiere estimar la componente

estacional, por medio de lo que se conoce como ndices Estacinales, los cuales

sirven para ajustar el modelo.

Para encontrar el modelo adecuado de la serie en estudio, se recurri al Suavizado

Exponencial de Winter, dado que la serie presenta estacionalidad y tendencia. En

ste caso se requieren 3 constantes de suavizacin, a saber:

The SSE is: Alpha Gamma Delta SSE


.6000000 .000000 .2000000 38822536.774

Donde Alpha modela el nivel general de la serie, Gamma la tendencia y Delta la

estacionalidad. SSE, es la suma de cuadrados del error, luego el modelo que tenga

un menor valor de SSE, es el que se prefiere.

Se corrieron varios modelos (constantes diferentes) y el que mejor se ajust a los

datos fue: Alpha = 0.6, Gamma = 0.0 y Delta = 0.2


5. Anlisis de Residuales:

Es necesario validar los supuestos de aleatoriedad y normalidad de los residuales

para determinar si el modelo encontrado es o no el adecuado para realizar

pronsticos.

La aleatoriedad de los residuales se puede determinar por medio de la prueba de

Rachas, y la normalidad mediante la prueba de Smirnov Kolmogorv.

Para el caso de los residuales de la serie de consultas externas los resultados son

los siguientes:

Aleatoriedad Normalidad

Prueba de Rachas Sig. Mayor de 0.05 Prueba de Smirnov Kolmogorov Sig.


Por lo tanto se cumple. Menor de 0.05, por lo tanto no se cumple.

En la prueba de Rachas se cumple aleatoriedad para los residuales, pero la

normalidad no, no obstante, si se realiza la prueba por ao, estos se comportan de

manera normal.

Dado lo anterior, se debe de buscar otro modelo mnimo cuadrticos, como los

ofrecidos por el programa SPSS, donde se destacan logartmico, logstico y

exponencial entre otros.


Luego de los ensayos de rigor, se encontr que el ajuste exponencial, diferente al

suavizado exponencial, permite una buena aproximacin a los datos de consulta

externa.

Los residuales de ste ltimo modelo cumplen aleatoriedad y normalidad por ao.

En ambos casos, se cumplieron los mismos supuestos. Otros modelos, por lo tanto,

podrn cumplir las mismas condiciones, e incluso mejores. Por lo tanto, es prudente

tener en cuenta a los expertos en la temtica especfica, para darle contexto a las

proyecciones meramente estadsticas.

5. Pronsticos.

Con la ayuda del Programa SPSS, observamos la forma de presentar la

informacin segn el procedimiento. Para el ajuste exponencial, se observa cmo

la proyeccin va disminuyendo de una manera leve, adems, se presentan dos

bandas construidas por los lmites de los intervalos de confianza, dando un rango

de posibilidades donde deber estar la demanda de consultas externas en la IPS

universitaria.
Figura 1: Proyeccin mtodo Figura 2: Proyeccin mtodo
exponencial, consultas suavizacin exponencial,
externas, 2001-2005 consultas externas, 2001-2005

Para el suavizado exponencial, se aprecia que el pronostico est fuertemente

influenciado por el ltimo mes (septiembre 2005), sin embargo, el modelo parece

ajustar bien los datos.

La situacin es, a medida que lleguen nuevos datos, estos se introduzcan a la base

de datos para robustecer el modelo. En cualquier caso, no es prudente realizar

proyecciones a ms de 6 meses.

Los pronsticos para ambos modelos son:

Suavizado Mtodo exponencial


Fecha Exponencial
Oct-05 3589 4035
Nov-05 3400 3979
Dec 2005 2468 3924
Jan 2006 2599 3869
Feb-06 3071 3816
Mar-06 3140 3763
Apr 2006 3144 3710
May-06 3164 3659
Jun-06 2891 3608

Como ya se mencion, el darle contexto a los valores encontrados es fundamental.

Conclusiones

Existen diferentes metodologas para abordar una serie de tiempo, sin

embargo, se sugiere que la seleccin del mtodo sea lo ms prctica y

entendible posible.

La ayuda de los programas de software permite explorar e implementar el

procedimiento de ensayo error, es decir, permite ensayar varias hiptesis para

luego escoger la que cumpla un mayor nmero de supuestos y adems,

entregue valores razonables para el evento en estudio.

La discrecionalidad de los expertos en el tema, no se puede dejar de lado, es

ms, deben refinar los pronsticos entregados por los procedimientos

estadsticos y darles la cuota de racionalidad al nmero.

Referencias
1. Bello L. Estadstica como apoyo a la investigacin. 1a ed. Medelln: L.

Vieco e Hijas Ltda. 2005.

2. Aguirre J. Introduccin al Tratamiento de Series de Tiempo, Aplicacin

a las Ciencias de la Salud. Ediciones Diaz de Santos S.A. Ao 1994.

3. Newbold P. Estadstica para los Negocios y la Economa. 4a ed. Ao

1998.

4. Da Silva M. Revista Coyuntura Colombiana, volumen 14, N 1, 1997,

(Deteccin de valores atpicos).

5. Daz A. Diseo estadstico de experimentos. Editorial Universidad de

Antioquia. Medelln 1999.

6. Manson R. Lind D. Estadstica para Administracin y Economa. 7a ed.

Ediciones Alfaomega. Ao 1992.

7. Statgraphis. Series Temporales. (Sitio de Internet) Disponible en:

http://www.statgraphics.net/Producto/MdlSeriesTemp.htm. Consultado:

25 de octubre de 2005.

8. Asociacin de la Sociedad Espaola de Hipertensin. (Sitio de Internet)

Disponible en: http://www.seh-lelha.org/tseries.htm. Consultado: 25

de octubre de 2005.

9. Secretarias De Salud Departamentales/Municipales. (Sitio de Internet)

Disponible en: http://www.col.ops-oms.org/iah/lisnalsds.htm.

Consultado: 17 de noviembre de 2005.

10. Areyano M. Introduccin al Anlisis Clsico de Series de Tiempo.


11. (Sitio de Internet) Disponible en:

http://ciberconta.unizar.es/LECCION/seriest/000F2.HTM Consultado:

17 de noviembre de 2005.

12. Bolivar M. Estadstica. (Sitio de Internet) Disponible en:

http://www.monografias.com/trabajos14/estadistica/estadistica.shtml#m

a. Consultado: 25 de noviembre de 2005.

Vous aimerez peut-être aussi