Académique Documents
Professionnel Documents
Culture Documents
INFERENCIA ESTADSTICA
INTRODUCCIN
Una parte esencial al planificar un estudio es decidir cuntas personas sern necesarias
incluir para contestar el objetivo principal, con una alta probabilidad de detectar como
estadsticamente significativo un efecto, si este existe, y por lo tanto, estar razonablemente
seguro que ese beneficio no existe si no se encuentra en el estudio.
Esta unidad versar sobre los conceptos y consideraciones necesarias a la hora de hacer
los clculos.
Aprenderemos a obtener el tamao muestral necesario para:
Finalmente describiremos un mtodo grafico fcil y practico para obtener tanto el tamao
muestral como el poder de un estudio.
Esperamos que esta unidad les resulte comprensible, amena y sobre todo til en la diaria
que desarrollan.
Empecemos...
Por qu es importante definir de antemano el tamao necesario de la muestra?
Es importante conocer el tamao muestral para garantizarnos que el objetivo del estudio
puede ser adecuadamente respondido con la real cantidad de personas que se necesitan. Es
comn ver trabajos que no refieren el tamao muestral para contestar la hiptesis pudiendo
ocurrir:
En el caso en que la muestra sea pequea que no podamos detectar una diferencia o
que obtengamos un estimador impreciso. Este escenario nos conducir a una prdida
de recursos debido a que los resultados no son concluyentes.
En el caso de que la muestra sea grande por dems, tambin perderemos tiempo,
dinero y otros recursos, por sobre utilizacin.
Nmero de
personas sin
parasitemia a las
36 hs
Tasa de
respuesta
Cloroquina
184
129
70%
Droga Nueva
103
80
78%
Droga
Tipo de estudio
Una sola muestra
Comparacin de dos o ms muestras
Estudio longitudinal
Outcome primario
Media
Proporcin
Tiempo de sobrevida
Datos ordinales, etc
Magnitud
Tamao de
muestra
requerido
Pequeo
Difcil de obtener
significancia
Grande
Grande
Fcil de obtener
significancia
Pequea
Bajo
Identificacin poco
probable
Pequea
Alto
Identificacin del
impacto ms
probable
Grande
Pequeo
Dificil de detectar
Grande
Grande
Fcil de identificar
pequea
Valor de p
Poder
Efecto
Impacto
Las formulas sern ms o menos complejas pero siempre requeriremos preguntar los
cinco puntos que definimos arriba y siempre podrn calcularse con alguno de los mtodos
que describiremos a continuacin.
Como este es un curso destinado a personas relacionadas con la salud, vamos a aprender
primero qu nos pide el Epi Info para hacer este clculo y luego detallaremos la frmula que hay
por detrs.
Puede ocurrir que no sepamos cul es el tamao del total de la poblacin que queremos
muestrear, pero por suerte, esto no es un gran problema, se dice que la poblacin es infinita (el
Epi Info por default deja 999.999) si por el contrario sabemos cul es nuestro universo a
muestrear entonces la poblacin se considera finita. En el Epi Info debern ingresar el nmero
correspondiente al tamao de esa poblacin.
Las formulas que veremos ms adelante son levemente distintas si la poblaciones es finita
a si no lo es.
En la siguiente pantalla elijan la opcin Simple size & power apretando la letra S del
teclado o bajando con la flecha abajo del teclado y apretando ENTER.
2-
3-
Uno de los limites del Intervalo de confianza (el superior o el inferior) que
aceptan en su estudio: en este caso vamos a poner el inferior: 14.4%. Presionen
ENTER para pasar al siguiente punto)
4-
Y obtenemos la pantalla con el clculo del tamao muestral para los distintos intervalos de
confianza.
En la imagen, hemos remarcado el valor que corresponde a un error alfa del 5%= 2013
personas.
Veamos qu pasa si escriben como peor escenario al lmite superior del IC del 95%:
Apretamos F10 para volver a la pantalla anterior y cambiar en el punto 3 al lmite superior
de 17,60.
Como ven con cualquiera de los dos lmites del Intervalo de Confianza que escriban, el
clculo arroja el mismo nmero de personas. Esto es as porque la amplitud del error de una
proporcin es simtrica tanto para arriba como para abajo del estimador.
Tamao muestral
Tamao de la poblacin.
Valor correspondiente en la distribucin de Gauss a 1,96 para =0,05 y 2,58 para =0,01.
Error de estimacin que se acepta cometer. Por ejemplo, para un precisin absoluta del 10%, que
corresponde a cometer un error del 1.6% en la prevalencia introduciremos en la frmula el valor 0,016.
Si queremos hacer el clculo rpidamente, por ejemplo durante la consulta de algn amigo
que sabe que estn avanzados en este curso, utilicen la frmula simplificada (la primera):
n = 3.8416 x0.1344 /0.0162 = 2013
3.8416 es 1.96 al cuadrado, y es un dato que deben recordar,
0.1344 es p x (1-p) y el dato de p deber decirlo su amigo.
El error de estimacin tambin lo deber decir su amigo, luego lo debers llevar a
proporcin y elevar al cuadrado.
10
Ejercicio:
El ministro de salud quiere conocer la prevalencia de tuberculosis en una regin.
Respuesta 5:_____________
=1.96 x sd/ n
e x n =1.96 x sd
n
=1.96 x sd /e
=1.962 x sd2 / e2
11
Como pueden observar en esta frmula, (y en todas las que encuentren con clculo por
precisin) NO necesitan incluir el tamao del efecto buscado, en el ejemplo descrito, no es
necesario indicar las horas promedio que suponen que trabajan las mujeres de tareas domsticas.
Esto es as por que lo que define el numero necesario que van a necesitar es justamente el ms
menos con el que se pretende tener el dato. Sin embargo, el valor promedio de las horas que
trabajan estas mujeres es necesario conocerlo para decidir la precisin absoluta o relativa.
Ejercicio:
La unidad de nutricin esta interesada en poder determinar con una buena precisin el consumo
calrico promedio de la poblacin mayor de 80 aos. Tienen datos de una muestra de poblacin
general en donde se reporto un consumo promedio de 2300 kcal y un desvio estndar de los
datos de 250 kcal/da. Consideran que la precisin de estimacin de la media debe ser de +- 50
kcal/da.
Calcule el tamao muestral necesario para que el intervalo de confianza del 95% del
estimador muestral tenga una precisin de ms menos 50 kcal/da.
Respuesta 6:_____________
12
13
En el segundo caso aceptan que el parmetro se encuentre entre 4.5 por mil a 5.5 por mil.
Precisin absoluta de ms menos 0.5.
La frmula para el clculo del nmero necesario para cualquier tasa, indicando la precisin
relativa es:
N = Z 2 / e2
Para el ejemplo, recuerden que dijimos un error del 5% y una precisin relativa de 0.1
(en proporcin) o 10% (en porcentaje):
N= 1.962 x 0.12
N= 3.8416 x 0.01
N= 384
La utilidad de estas tablas con la precisin relativa es que nos evita de indicar cul es el
desvo estndar esperado. Para la tabla del ejemplo bastante cuesta suponer la tasa
como para que nos pidan el desvo estndar de la tasa!!.
1234-
El principal concepto del clculo muestral por este mtodo es que se pretende tener alta chance
de detectar, como estadsticamente significativa, un efecto clnicamente significativo cuando ste
realmente exista, y a la vez se pretende concluir con una alta certeza que este efecto no existe si
no lo encontramos con el tamao muestral calculado.
14
El principal concepto del clculo muestral por este mtodo es que se pretende tener poder de
detectar, como estadsticamente significativa a un nivel de significancia predeterminado (error
alpha), una mnima diferencia cuando sta realmente exista (hiptesis alternativa
verdadera), y a la vez se pretende un bajo error beta de que esta diferencia no existe si no la
encontramos con el tamao muestral calculado.
El clculo muestral basado en el poder de un estudio utiliza entonces la frmula del test de
hiptesis y a diferencia del mtodo anterior que peda la precisin deseada, en este mtodo se
requiere definir de antemano el error beta.
A mayor poder del estudio, ms seguros estaremos pero requeriremos mayor nmero de
personas, como veremos ms adelante. Para poder hacer concordar la significancia clnica con la
estadstica necesitaremos un poder por encima del 80%.
estos
conceptos
utilizando
como
ejemplo
la
comparacin
de
dos
Este seria el caso de querer estudiar una droga que previene la tuberculosis en paciente
con HIV. En el estudio lo que se pretende comprar es el porcentaje de pacientes que desarrollaron
la tuberculosis comparando pacientes tratados vs. Placebo.
Primero que nada debern poder definir cul es la menor diferencia que consideran
clnicamente importante entre ambos tratamientos. Esto es a veces muy difcil de definir en la
prctica. Los expertos en el tema debern decir de alguna manera cuando el beneficio otorgado
por una nueva droga justifique su uso frente a la vieja. Supongamos que para el ejemplo anterior
la proporcin de pacientes con TBC en el grupo placebo esta estimada en 0.15 y en el grupo
tratado en 0.05. Calcularemos el tamao necesario para tener un poder del 90% de detectar un
efecto que sea significativo aceptando un 5% de error.
En los clculos del tamao muestral basados en el poder, necesitamos incluir los valores de
z1 y z2 que corresponden al nivel de significancia de alpha y de 1-poder (beta) requeridos.
Utilizamos la siguiente frmula:
N = 2 x(Z1+Z2)2 x P x (1-P)
(p1-p2)2
Siendo:
Z1: valor de z que corresponde al nivel de significancia alpha
Z2: valor de z que corresponde a beta
P: el promedio de ambas proporciones
P1: el valor de la proporcin de uno de los grupos.
P2: el valor de la proporcin del otro grupo.
15
La siguiente tabla muestra los valores ya calculados para (z1+ z2)2 que se usan en los
clculos basados en el poder. Durantes los ejercicios esta tabla les ser de utilidad.
Tabla de valores de la distribucin normal para (z1+ z2)2 para uso en las formulas de
clculo muestral basadas en el poder. En el interior de la tabla esta el valor de: (z1+ z2)2
para los valores de z1 y de z2 indicados en la fila y columna respectivamente
Beta
0.05
0.1
0.2
0.5
(z2)
(1.96)
(1.64)
(0.84)
(0.00)
0.1
(1.64)
10.75
8.53
6.15
2.69
0.05
(1.96)
12.96
10.50
7.84
3.84
0.02
(2.33)
15.76
13.03
10.04
5.43
0.01
(2.58)
17.81
14.90
11.70
6.66
Alfa (z1)
Ejercicio:
Tabla 1
Total de personas
tratadas
Nmero de personas
sin parasitemia a las
36 hs
Tasa de respuesta
Cloroquina
184
129
70%
Droga Nueva
103
80
78%
Droga
Los investigadores del estudio de la Tabla 1, donde se compar una nueva droga contra la malaria
con la Cloroquina, luego de ver que la diferencia encontrada les resulta clnicamente significativa
pero no alcanzaron significancia estadstica, pretenden continuar el estudio. Le preguntan a Ud:
cul sera el tamao muestral necesario para encontrar que esa diferencia es
estadsticamente significativa con un poder de 0.8 y un nivel del significancia del
5%?
Respuesta 7:_____________
16
Trabajemos con el siguiente ejemplo: En el grupo tratado con la droga A se espera que la
presin final promedio del grupo sea de 135 mm Hg mientras que la tratada con la droga B se
espera que sea 140 mm Hg. El desvo estndar es de 10 mm Hg. Pretendemos que nuestro
estudio tenga un poder del 80% y un nivel de confianza del 95%.
Despejemos la siguiente frmula:
N = (Z1+Z2)2 x (sd2+sd2)
(X1 X2)2
N = 7.84 x (102 +102) = 63
(140-135)2
Se necesitarn 63 pacientes por grupo.
NOMOGRAMA
El nomograma es una forma grfica y simple de obtener tanto el nmero muestral
necesario como el poder que alcanz un estudio con un determinado nmero de personas. Es
muy simple de usar, todos los clculos estn basados en la diferencia estandarizada.
17
18
La lnea roja cruza la diagonal por el valor de 700 personas, esto es el total requerido, es
decir 350 nios en cada rama debern seguirse un ao.
19
En el ejemplo:
p1= 0,30; p2=0,15; P = (0,30 + 0,15)/2 = 0,225
diferencia estandarizada=
0,30 0,15
=0.36
20
CONSEJOS PRCTICOS
En esta unidad describimos una introduccin a cmo calcular el tamao de los estudios que
requieran conocer una determinada proporcin o media, y de los que requieran comparar dos
proporciones o dos medias.
Aplica para cualquier tipo de clculo que los mismos deban realizarse varias veces,
variando a distintos escenarios, esto es cambiando el poder, el nivel de confianza o la estimacin
del resultado, para poder decidir finalmente la factibilidad del estudio en funcin de los recursos.
Adems deben considerar qu otros factores pueden influenciar y para controlarlos es
necesario mayor nmero a muestrear por ejemplo:
Estos dos aspectos podrn considerarse a la hora del diseo y sobremuestrar por ejemplo
un 10% si es lo que esperamos que ser nuestra tasa de no respuesta, PERO hacer esto SI nos
garantizar que nuestro resultado tendr el poder que deseamos y NO garantizar el control de
los sesgos de seleccin que podamos introducir.
mltiples resultados
confundidores e interacciones que debamos medir.
diseo de clusters
diseos macheados.
Estos son otros ejemplos en donde el tamao muestral ser mayor, y est fuera del
alcance de esta unidad conocer las frmulas correspondientes de ajuste.
MUESTREO PROBABILSTICO
Daremos una breve introduccin a los tipos de muestreo probabilsticos, sin entrar en
las distintas tcnicas de muestreo.
Un mtodo de seleccin es considerado probabilstico cuando otorga una probabilidad
conocida de integrar la muestra a cada elemento de la poblacin, y dicha probabilidad no es nula
para ningn elemento.
Los mtodos de muestreo no probabilsticos no garantizan la representatividad de la
muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la poblacin.
Entre los mtodos de muestreo probabilsticos ms utilizados en investigacin
encontramos:
21
Veremos una taba con las caractersticas, sus ventajas e inconvenientes de los
distintos tipos de muestreo probabilstico
CARACTERISTICAS
VENTAJAS
o
Sencillo y de fcil
comprensin.
Clculo rpido de medias
o
y varianzas.
Se basa en la teora
estadstica, y por tanto
existen paquetes
informticos para analizar
los datos
Requiere que se
posea de antemano un
listado completo de
toda la poblacin.
Cuando se trabaja con
muestras pequeas es
posible que no
represente a la
poblacin
adecuadamente.
o
Conseguir un listado de los N
o
elementos de la poblacin
Determinar tamao muestral n.
Definir un intervalo k=N/n.
o
Elegir un nmero aleatorio, r,
entre 1 y k (r=arranque
aleatorio).
Seleccionar los elementos de la
lista.
o
Fcil de aplicar.
No siempre es necesario
tener un listado de toda
la poblacin.
Cuando la poblacin est
ordenada siguiendo una
tendencia conocida,
asegura una cobertura de
unidades de todos los
tipos.
Si la constante de
muestreo est
asociada con el
fenmeno de inters,
las estimaciones
obtenidas a partir de
la muestra pueden
contener sesgo de
seleccin
o
En ciertas ocasiones resultar
conveniente estratificar la muestra
segn ciertas variables de inters.
Para ello debemos conocer la
composicin estratificada de la
poblacin objetivo a muestrear.
o
Una vez calculado el tamao
muestral apropiado, este se
o
reparte de manera proporcional
entre los distintos estratos
definidos en la poblacin usando
una simple regla de tres.
Aleatorio simple
Sistemtico
o
o
o
Estratificado
Conglomerados
INCONVENIENTES
Se ha de conocer la
distribucin en la
poblacin de las
variables utilizadas
para la estratificacin.
El error estndar es
mayor que en el
muestreo aleatorio
simple o estratificado.
El clculo del error
estndar es complejo.
22
RESUMIENDO:
Hay muchas formas de calcular el tamao de una muestra, como hemos visto a lo largo de
esta clases. Pueden utilizar:
Segn el tipo de estudio y objetivo del mismo utilizaran todos o algunas de estos datos.
Comprendiendo esto podrn calcular los tamaos de las muestras necesarias para la gran mayora
de los estudios que Uds. Planeen; o cuando se trate de diseos muy complicados sabrn que
datos darle al Sper experto en estadstica para que el lo calcule!!!
23
Respuesta 2:
El test estadstico aumenta a medida que el tamao muestral aumenta, correspondiendo
entonces a un nivel de significancia ms alto. (es ms significante y su correspondiente p-valor es
ms bajo).
Respuestas 3:
1- 1 El IC del 95% va entre -3% y 18% y puede ser interpretado como que la tasa de
respuesta con la nueva droga puede ser 3% ms baja que la de la cloroquina o un 18%
mayor. El cero puede ser un valor probable, lo que sugiere que ambas tasas de
respuesta pueden ser iguales, no existiendo diferencia de efecto en la poblacin.
2- 2 El p valor muestra que no hay diferencia en el porcentaje de respuesta entre las dos
drogas a un nivel de significancia del 5%. La diferencia observada del 8% pudo ser
obtenida por azar de muestreo.
Respuestas 4:
1- El principal objetivo es determinar si la nueva droga es mejor que la cloroquina.
2- El principal resultado a medir es la eliminacin de la parasitemia a las 36 hs.
3- El mtodo estadstico es la comparacin de dos proporciones.
4- Una estimacin aproximada de los resultados es que un 70% de los pacientes en el
grupo cloroquina eliminarn la parasitemia a las 36 hs.
5- El menor efecto que se pretende detectar es una diferencia entre las drogas del 5%,
porque se asume que una diferencia de esa magnitud es clnicamente importante.
24
Respuesta 5:
Ejercicio:
El ministro de salud quiere conocer la prevalencia de tuberculosis en una regin.
Respuesta 6:
Ejercicio:
La unidad de nutricin esta interesada en poder determinar con una buena precisin el consumo
calrico promedio de la poblacin mayor de 80 aos. Tienen datos de una muestra de poblacin
general en donde se reporto un consumo promedio de 2300 kcal y un desvo estndar de los
datos de 250 kcal/da. Consideran que la precisin de estimacin de la media debe ser de +- 50
kcal/da.
Calcule el tamao muestral necesario para que el intervalo de confianza del 95%
del estimador muestral tenga una precisin de ms menos 50 kcal/da.
Respuesta: 1.962 x 2502 / 502 = 96
Respuesta 7:
Ejercicio:
Tabla 1
Total de personas
tratadas
Tasa de respuesta
Cloroquina
184
129
70%
Droga Nueva
103
80
78%
Droga
Los investigadores del estudio de la Tabla 1, donde se compar una nueva droga contra la malaria
con la Cloroquina, luego de ver que la diferencia encontrada les resulta clnicamente significativa
pero no alcanzaron significancia estadstica, pretenden continuar el estudio. Le preguntan a Ud:
cul sera el tamao muestral necesario para encontrar que esa diferencia es
estadsticamente significativa con un poder de 0.8 y un nivel del significancia del
5%?
Respuesta :
Utilizamos la siguiente formula:
N = 2 x(Z1+Z2)2 x P x (1-P)
(p1-p2)2
P= (0.70+0.78)/2 = 0.74
N= 2 x 7.84 x 0.74 x 0.26 = 471 por rama
0.0064
25