Vous êtes sur la page 1sur 11

Revista Peruana de Reumatologa : Volumen 1 N 1, Ao 1995 LIMA-PERU

Tema de Revisin
Aspectos de la Investigacin Epidemiolgica
Pedro Mendoza Arana*

La Epidemiologa puede ser definida corno el estudio de la distribucin, frecuencia y


determinantes de los problemas de salud en una poblacin. Su unidad de inters por lo tanto
no es el individuo sino las poblaciones, y para estudiarlas ha desarrollado un equipamiento
instrumental para el diseo y anlisis de investigaciones que puede ser de mucha utilidad a
diversas especialidades mdicas. Ciertamente, la acepcin que empleamos de poblacin en
este artculo, se acerca ms a la acepcin estadstica, es decir, al conjunto de unidades de
observacin de inters del investigador. As, los pacientes de psoriasis podrn constituir para
nosotros una poblacin, dentro de la cual una sub-poblacin podr ser, por ejemplo, la de
quienes desarrollan compromiso articular.
El propsito de este trabajo, as como de un artculo complementario centrado en la
Estadstica, es el de brindar conceptos esenciales de Epidemiologa a colegas interesados en la
investigacin clnica y epidemiolgica. Aunque los conceptos son aplicables a cualquier
especialidad, este artculo ha sido redactado pensando en reumatlogos, lo cual se refleja en
los ejemplos empleados (a) . No varnos a cubrir in extenso los diversos tpicos posibles, sino
a describir brevemente los conceptos esenciales y de mayor uso que se encuentran con
frecuencia al intentar interpretar estudios en la literatura, o al pensar uno mismo sus propios
protocolos de investigacin.
Por ello, vamos a seguir un esquema de abordaje que es el que podemos poner en prctica al
analizar un posible protocolo de investigacin propio o publicado.

Correspondencia: Pedro Mendoza Arana, Apartado 310-038


Lima 31 Per

Rev. Per Reum. 1995; 1(1):35-39

I Diseos Bsicos de Investigacin Epidemiolgica.


Un Diseo es un modelo de explicacin que relaciona variables y que contiene una
estrategia para el anlisis de datos. En Epidemiologa tenemos tres diseos
esenciales:
- Estudios Transversales (<<Cross-Sectional Studies>>)
- Estudios de Casos y Controles (<<Case-Control Studies>>)
- Estudios de Cohortes (<<Cohort Studies>>)
Estos nombres enfatizan una tipologa de diseo basada en la relacin entre las
variables que se exploran, una de las cuales ser Ilamada <<variable explica>> o
<<variable independiente>>, y la otra <<Variable
(a) Los ejemplos empleados no implican un respaldo a sus conclusiones o al estudio en su conjunto, sino que se
han empleado para graficar aspectos puntuales de los respectivos estudios.

de desenlace>> o <<variable dependiente>>, entendiendo que entre ambas existe


una relacin posiblemente causal o de determinacin de la primera (explicativa o
independiente) hacia la segunda (de desenlace o dependiente).
Ntese que no nos referimos a la forma como se colectan los datos, que a veces
denominamos <<prospectiva>> o <<retrospectiva>>, trminos que inducen a
confusin y que se prefiere no emplear. Tcnicamente, y de contar con bases de
datos completas, uno podra hacer estudios de cohortes con datos revisados en
forma <<retrospectiva>>, as como estudios de casos y controles en forma
<<prospectiva>>.
Una Cohorte se define como <<un grupo que comparte una experiencia comn>>
(1). As, en los estudios de cohortes partimos de uno o ms grupos expuestos a un

factor determinado, sea este un diagnstico comn, una exposicin a radiacin, un


tratamiento, etc., y lo seguimos para ver un cambio asociado o desenlace: Mejora,
remisin de sntomas, etc.
En un estudio de Casos y Controles partimos de este ltimo, es decir, del desenlace,
y vemos qu factor asociado lo antecedi. En lenguaje epidemiolgico, derivado de
estudios etiolgicos, a los presuntos factores que se exploran se les denomina
<<Exposicin>>, y por tanto, se exploran diferencias en la Exposicin entre los
Casos y los Controles.
Un ejemplo de este diseo es el estudio de Silman et a (9) que compara el inicio de
la AR en el periodo postpartum inmediato (0-3 meses). Sus casos son 88 mujeres de
18-40 aos y sus controles 144 mujeres mujeres sanas de la misma edad a las que
se les asign un inicio de AR presunto en forma aleatoria para efectos de control.
Finalmente, en un estudio transversal vemos la asociacin de factores coexistentes
en un determinado momento en nuestra poblacin. Como ejemplo mencionemos un
estudio en pacientes con AR para valorar la asociacin entre Factor Reumatoideo y
antgeno DR4. Partiramos de Casos (Pacientes con AR y FR+), y Controles
(Pacientes con AR y FR-), exploraramos la presencia de antgenos DR4 en ambos
grupos. En situaciones como esta, por ejemplo cuando se explora la asociacin entre
variables coexistentes pero que son parte de la constitucin de individuo, la
distincin entre un estudio de Casos y Controles y uno Transversal puede ser muy
sutil.
Los estudios de prevalencia son tambin ejemplo tpicos de diseos transversales,
en los cuales no se explora asociaciones entre variables sino la presencia o ausencia
de una sola variable en la poblacin.
El Estudio de Cohortes, a su vez, tiene a1gunas variantes:
Estudio de Cohorte Unica
Estudio de Cohortes Concurrentes
Estudio Aleatorio Controlado
El Estudio de Cohorte Unica puede emplearse, por ejemplo, para caracterizar la
historia de una enfermedad (<<estudios de seguirniento>>), como es el caso del
estudio de van der Heide (10) que siguen durante tres aos pacientes con AR inicial
mediante evaluaciones radiolgicas para valorar la progresin del dao articular.
Tambin se emplea a veces para valorar la eficacia de intervenciones mediante
mediciones antes-despus. Un ejemplo reciente es el estudio de Weinblatt (11), que
hacen un seguimiento de una cohorte de 26 pacientes de Artritis Reumatoide en
tratamiento con Metotrexate durante 84 meses. Ntese que este diseo sera mucho
ms debil metodolgicamente que uno comparativo, pero a veces por
consideraciones logsticas o ticas es el nico viable.
En el Diseo de Cohortes Concurrentes se tienen dos o ms grupos de pacientes que
se siguen en paralelo, y que han sido sometidos a diversos tratamientos. En este

caso, una cohorte se denomina <<activa>>, y la otra <<control>>. No obstante,


uno no puede garantizar la comparabilidad de los grupos. La forma de hacer esto es
asignar a los pacientes en forma aleatoria o <<randomizada>> a cada grupo. Esta
es la caracterstica definitoria del Estudio Clnico Controlado, llamado tambin
Estudio Aleatorio Controlado o RCT (<<Randomized Controlled Trial>>). Se
denomina adems Estudio Controlado por la existencia de un grupo <<Control>>,
ya sea que no se est tratando, o que se trate con placebo. Cuando el placebo no es
una alternativa tica, se puede usar un estudio comparativo con el <<mejor
tratamiento actua>> o el protocolo aceptado como norma.
Un ejemplo de RCT es el estudio cle Kloppenburg et al (1994), que emplea un
estudio comparativo de Minociclina versus Placebo en pacientes con ARactiva, o el
estudio de Landewe et al (1994), que comparan Cloroquina"versus" Ciclofosfamida
a dosis bajas en AR temprana. Como vemos, en el primer caso el estudio se controla
con placebo, y en el segundo se comparan dos medicamentos.
2. Eleccin de la Muestra: Poblacin de Referencia.
Tamao Muestral.
Una muestra es un conjunto de sujetos o unidades de observacin que reune
caractersticas que la hacen representativa de la poblacin que nos interesa
estudiar, y que Ilamaremos poblacin objetivo, o poblacin de referencia, y a la cual
esperamos aplicar las conclusiones o inferencias que hagamos en nuestra muestra.
La definicin cuidadosa de nuestra Poblacin y Muestra constituye un aspecto
importante de la investigacin.
Por ejemplo, si nuestra muestra comprende slo pacientes con un Tiempo de
Enfermedad menor de cinco aos, entonces los resultados del estudio podremos
aplicarlos slo a una poblaci6n de caractersticas similares, es decir, un Tiempo de
Enfermedad menor de cinco aos.
Es por ello que la representatividad de la muestra es un aspecto crucial en la
investigacin. Para asegurar esta representatividad debemos recurrir siempre que
sea posible a mtodos aleatorios o <<randomizados>>. La randomizacin puede
darse en dos momentos: En la extraccin de la muestra, y en la asignacin de
individuos a grupos.
El primero es el caso de las denominadas <<muestras aleatorias>> o <<muestras
probabilsticas>>. Esto quiere decir que cada uno de los individuos en la poblacin
tiene las mismas probabilidades de resultar elegido en la muestra. El muestreo
probabilstico puede ser:
-

Muestreo
Muestreo
Muestreo
Muestreo

Aleatorio simple
sistemtico
Estratificado
por Conglomerados

Y el muestreo no probabilstico puede ser:


- Muestreo Secuencial

- Muestreo por Cuotas


Una vez elegido el diseo de la investigacin, el segundo paso es la definicin del
tamao muestral. El tamao muestral depende del diseo empleado, y en cada uno
de ellos de los siguientes factores:
a. Estudios Transversales
Este es el caso tpico de las encuestas de prevalencia. En este caso requerimos
cuatro datos importantes:
- Frecuencia esperada del fenmeno (P)
- Precisin deseada para la estimacin (D)
- Nivel de Confianza (Z)
- Tamao de la Poblacin (POP)
Estas variables se relacionan segn las frmulas siguientes:
Para poblacin infinita S = Z.Z(P(l -P)VD.D
Para poblacin finita SS = S/1 +(S/POP)
As por ejemplo, para un fenmeno cuya frecuencia esperada es de un 15 %, y
dndonos una precisin relativa de 20 % (es decir, +/- 3 % con respecto a nuestro
valor estimado de 15 %), con lo cual nuestro valor podra oscilar entre 12 y 18 %, y
con un nivel de confianza de 80 % , requeriramos un tamao muestral de 233
encuestas vlidas. El tamao poblacional tiene un impacto mnimo en el tamao
muestral, y para efectos prcticos las ms de las veces podemos asumir que es
poblacin infinita, en cuyo caso las frmulas no lo toman en cuenta.
Por ejemplo, en el Hospital Cayetano Heredia, (2) estudian la incidencia de
reumatismos extraarticulares en Brucellosis, y reportan un 14.3 % de Reumatismos
Extra-Articulares entre 342 casos de Brucellosis. Si este hubiera sido el valor
esperado, una muestra aleatoria de la misma magnitud hubiera satisfecho el criterio
que mencionamos.
El nivel de confianza, en cambio, s afecta los clculos en forma importante. As,
para un fenmeno de prevalencia esperada de 10%, con un margen de 20 % (8-12
%) y poblacin infinita, los tamaos muestrales segn nivel de confianza van como
siguen:
Nivel de Confianza
80%

Tamao Muestral
369

90%

608

95%

864

99%

1,491

La eleccin del tamao muestral a utilizar dependerder de un balance entre nuestro


requerimiento tcnico y nuestras posibilidades logsticas y se obtencin de
pacientes o sujetos para el muestreo. En ese sentido, los tamaos muestrales
sugeridos son los mnimos. Si uno puede superarlos, la precisin de las estimaciones
aumentar. Por ejemplo, el Equipo del Servicio de Reumatologa del HN Guillermo
Almenara, para estimar la prevalencia del Sndrome de Hipermotilidad Articular del
Adulto, emple el clculo antes descrito. Los autores (8) evaluaron 430 sujetos,
superando su muestra sugerida en casi 20 %.
As pues, el dato capital es la frecuencia esperada. Esta puede provenir de la
literatura, de estudios previos, de fuentes de estadsticas de rutina, o de criterio de
expertos. Por ejemplo, presentamos los datos para tres frecuencias posibles,
manteniendo fijos los dems criterios:
Frecuencia Esperada
3%

Tamao Muestral
1,326

10%

369

15%

233

Los tamaos muestrales se pueden calcular en textos especiales dados los valores
antes mencionados como por ejemplo el texto de Lwanga y Lemeshow (7) o
mediante programas de cmputo como la opcin Statcalc de Epi Info (CDC, Atlanta,
1994).
b. Estudios de Cohortes o de Caso-Control
En estos casos, adems de los datos antes mencio nados, requerimos saber la
magnitud de la diferencia esperada como el dato crucial. En forma consistente con el
caso anterior, a diferencias menores, requeriremos muestras mayores.
Supongamos un estudio en el cual ponemos a prue ba un medicamento para el cual
esperamos una eficacia de 50 % para provocar remisin de sntomas en un
seguirniento de 4 semanas, comparado con placebo, para el cual estimamos una
eficacia de 30 %. En un caso as, se requerir una muestra de 103 pacientes en cada
grupo, totalizando 206, dados un poder de prueba de 80 %, y un nivel de confianza
de 95%.
Llegados a este punto, expliquemos a qu nos referimos con <<poder de prueba>>

y <<nivel de confianza>>. El Poder de una Prueba se define como la probabilidad de


que este rinda un resultado significativo cuando la magnitud de la diferencia es la
especificada o esperada. En nuestro ejemplo, que si la diferencia es realmente de 50
% a 30 %, nuestra prueba lo detectar en un 80 % de casos (4).
El Nivel de Confianza, se define como la capacidad de una prueba para rechazar
correctamente una hiptesis nula verdadera, y por lo tanto es un valor
complementario al llamado Nivel de Significacin o Nivel Alfa, que es la probabilidad
de aceptar (incorrectamente) una hiptesis nula verdadera. El Nivel de Significancia
aceptable se ha fijado por convencin en 5 % y por lo tanto el Nivel de Confianza
consiguiente (1-alfa) es de 95 % en forma habitual.
Para aclarar estos conceptos con nuestro ejemplo anterior, recordemos que la teora
estadstica se basa en la llamada hiptesis nula, es decir, asumir que en tanto no se
dernuestre lo contrario se asume que cualquier diferencia observada entre dos
grupos podra ser fruto simplemente del azar o de una variacin aleatoria. Si es as,
nuestra hiptesis nula dira que ambos, placebo y medicamento, tienen la misma
eficacia, es decir, que no existe diferencia. Al fijar nuestro Nivel de Significacin en
5% (y por tanto el de Confianza en 95 %) lo que estamos haciendo es exigir a la
diferencia que sea de magnitud tal, que su resultado sea explicable por azar con una
probabilidad (valor-p) de menos del 5 % o 0.05.
Si bien es usual emplear grupos del mismo tamao, esto no es imprescindible. Se
admite una proporcin de 1:2 1:3 en ambos sentidos, es decir, tambin de 2:1
3:1. As, si nos es difcil conseguir 103 Casos, podramos trabajar no con
proporciones de 1:1 sino de 2:1, empleando 78 casos y 156 controles. Como vemos,
en este caso el total sube a 234, es decir, 30 sujetos ms (5).
3. Concepto de Confusores. Fuentes y Control.
Los Factores de Confusin, o <<Confusores>>, como los llamaremos en este
artculo, son aquellas variables asociadas en forma independiente a aquellas
variables de nuestro inters, y que por lo tanto pueden sugerir asociaciones que
resulten espreas. Ejemplo clsicos de tales factores son la Edad, el Sexo, el Tiempo
de Enfermedad, etc. (6)
La forma de defenderse de la presencia de Confusores es doble. Por un lado,
medirlos, para poder hacer luego anlisis estratificados, y por otro lado muestrear
en forma estratificada segn el factor confusor. Por ejemplo, si en un estudio en
pacientes 1picos una variable importante a medir es el dao renal, el tiempo de
enfermedad podra ser un confusor.
Para evitarla, podemos hacer muestras en dos o tres estratos, segn tiempo de
enfermedad, o si el grupo es pequeo, al menos medir la variable para poder luego
ajustar en el momento del anlisis estadstico.
4. Concepto de Sesgo. Tipos principales y control.
El Sesgo (<<Bias>>) se define corno <<cualquier efecto en cualquier momento de
la investigacin, tendiente a producir resultados que se aparten sistemticamente
del valor real>>. Se reconocen ms de cincuenta variedades de sesgo (3), pero los

tipos principales se pueden clasificar en dos grupos: Sesgos de Seleccin y Sesgos


de Medicin.
Los Sesgos de Seleccin se producen en la etapa de diseo y coleccin de la
muestra, por incluir unos individuos y no otros, por lo cual nuestra muestra difiere
significativamente de la poblacin objetivo. Los estudios de Casos y Controles son
particularmente vulnerables a este sesgo en la etapa de coleccin de los controles,
pero tambin los estudios de cohortes cuando se parte de sub-poblaciones que
pueden diferir significativamente de la poblacin objetivo, como por ejemplo de un
determinado hospital o servicio, o al emplear voluntarios.
Los sesgos de Medicin ocurren en la etapa de coleccin de datos, y pueden surgir
desde la entrevista, el tiempo de recuerdo al que se invoca, errores en la
estructuracin del cuestionario, sesgos al cuantificar o tomar medidas de un
investigador a otro, etc.
Para defenderse de los Sesgos, la nica manera es estar conciente de su existencia y
ser cuidadosos en el diseo de la investigacin, el muestreo, la representatividad de
la muestra, y la calidad y estandarizacin de los instrumentos de recoleccin de
datos y calibracin o estandarizacin de criterios cuando los investigadores o
medidores son varios. El hacer <<ciegos>> a los pacientes y a los investigadores
respecto de su pertenencia a los grupos es, justamente, un mecanismo para
protegerse del sesgo de medicin o de respuesta que podra darse en estos casos.
5.Asociacin Estadstica: Odds Ratio, Riesgo Relativo
Los valores de probabilidad o valores <<p>>, que habitualmente empleamos en las
pruebas de significacin estadstica, implican la probabillidad de error tipo I, es
decir, de que las diferencias que observamos sean fruto del azar. Este tema ser
desarrollado en el prximo artculo.
No obstante, para interpretar la importancia de una asociacin, no es suficiente con
conocer el valor <<p>>, sino con disponer de valores que permitan ponderar la
fuerza de la asociacin estadstica encontrada. Dos de estas medidas son el Odds
Ratio y el Riesgo Relativo.
Ambas se derivan de resultados ordenados en una tabla tetracrica o de dos por
dos, como la siguiente:
Problema
Si

No

Total

Si

a+b

No

c+d

Total

a+c

b+d

a+b+c+d

Factor Explorado

El Odds Ratio (OR) es una medida empleada en estudios transversales o de Casos y


Controles. Uno se sus nombres en espaol es Razn de Productos Cruzados, lo cual
describe su proceso de cculo:

OR= a.d / b.c


Por ejemplo,en un estudio en pacientes con LES para ver el compromiso
neurolgico, se explor la asociacin entre Convulsiones y IgG anti Cardiolipina,
segn la siguiente tabla:
Problema (Conclusiones)
Si

No

Total

Si

28

33

No

16

147

163

Total

21

175

196

Factor Explorado
(IgC a CL)

El cual se valorara de la siguiente manera:


OR = 5 x 147 / 16 x 28 = 1.64
Valores de OR=1 se consideran como sinnimo de <<No Asociacin>>, mientras
que valores mayores de 1 implican asociacin, la cual ser ms fuerte a mayor valor
del OR: No obstante, es importante estar concientes del concepto de Intervalo de
Confianza, es decir, del rango dentro del cual cae este valor,por ser en s mismo una
estimacin del presunto valor real.
En este ejemplo, al calcular el Intervalo de Confianza al 95% (IC95), tenemos que
este va de 0.48 5.20. Como el IC95 incluye a 1 , conclumos que es posible que la
asociacin sea inexistente, es decir, fruto del azar.
As, en el estudio de Silman (9) antes mencionado, el OR para el inicio de AR en el
postpartum inmediato es de 5.6 (IC95=1.8-17.6). En este caso, como el lmite
inferior del IC no incluye la unidad, consideraramos esta asociacin como vlida
segn este criterio
Esto se correlaciona con un valor-p alto. As, en el estudio de Silman (9) antes
mencionado, el OR para el inicio de AR en el postpartum inmediato es de 5.6
(IC95=1.8-17.6). En este caso, como el lmite inferior del IC no incluye la unidad,
consideraramos esta asociacin como vlida segn este criterio.
Esto se correlaciona con un valor p-alto. As, el valor-p calculado para esta tabla
segn este criterio.
Esto se correlaciona con un valor-p alto. As, el valor-p calculado para esta tabla
segn la Prueba Exacta de Fisher sera el siguiente p=0.36.
En estudios de cohortes, y slo en ellos, es legtimo el clculo del Riesgo Relativo
(RR), que expresa la relacin el Riesgo entre los Expuestos (Factor Explorado
Positivo) dividido entre el Riesgo entre los No Expuestos (Factor Explorado
Negativo). En trminos de nuestra tabla de dos por dos:
a / (a+b)
RR = ---------------------b / (b+d)

Al igual que en el OR, la fuerza de la asociacin ser mayor a mayor valor del RR.
Otro concepto interesante aplicable por igual al RR y al OR es el del llamado
<<efecto protector>>, que es el caso de valores de OR o de RR menores de 1 y que
pueden llegar a tender a cero.
El estudio de los Factores de Riesgo es importante por el inters de identificar
factores susceptibles de control que nos permitan modificar el curso de la
enfermedad. La identificacin de factores no modificables, Ilamados mejor
<<Marcadores de Riesgo>>, tales como la edad, el sexo, etc. tiene un valor de
identificacin pero no de intervencin modificatoria.
No obstante, para aquellos factores que esperamos modificar, hace falta considerar,
adems del Riesgo Relativo (RR), el llamado Riesgo Atribuible en Poblacin (RAP),
que es el resultado de considerar no slo el Riesgo Relativo de un factor
determinado, sino su frecuencia en la poblacin o grupo de inters. As, factores de
RR muy alto, pero muy poco frecuentes, resultan con RAP bajos, pues son tan pocos
los individuos afectados por 1, que su reduccin no afectar significativamente el
problema en el total de pacientes, mientras factores con RR moderados pero alta
frecuencia pueden tener RAP altos y por tanto ser mejores puntos a ser
considerados en programas de intervencin.
El RAP se calcula de la siguiente manera:
RAP= F(RR-1)/[ 1 +F(RR- 1)] x100
donde F es la frecuencia del Factor en la poblacin y RR el Riesgo Relativo. Como
ilustracin comparemos los efectos hipotticos de corregir dos factores de riesgo,
uno con RR= .
12 y Frecuencia = 5 % y uno con RR = 5 y con Frecuencia = 30 %. As,
reemplezando en la frmula anterior tenemos: Para el primer caso:
RAP = 0.05 (12 -1)/[l +0.05(12 - 1)] x 100
= 35.48 %
y en el segundo:
RAP = 0.3 ( 5 - 1)/ [1 + 0.3 (5 - 1) ] x 100
= 54.5 %
Es decir, si logramos desaparecer el primer factor, nuestro problema se reducira en
un 35 %, mientras
que en el segundo lo reduciramos en un 55 %.
Estos aspectos (OR y RR) son muy importantes y ayudan a estimar mejor la
significancia clnica y de
salud pblica de los resultados de una investigacin, que no necesariamente se
relacionan con los de sig

nificacin estadstica.
Una vez descartada la presencia de sesgos y confusores en una investigacin, el
paso siguiente consistir en evaluar las pruebas de significacin estadstica
empleadas. Esto ser examinado en el prximo artculo.

Ver Referencias

Regresar

Vous aimerez peut-être aussi