Vous êtes sur la page 1sur 10

Captulo

Enfoque prctico de los


elementos necesarios
para la estimacin del
tamao de la muestra
Arturo Reding Bernal
Juan Carlos Lpez Alvarenga

Introduccin
Las exigencias en la investigacin actual han creado la necesidad de profundizar en muchos aspectos estadsticos. Es prctica comn pedir a los alumnos de maestra y doctorado
que calculen el tamao de la muestra del estudio que realizan. Para ello deben escoger las
variables que han utilizado para la hiptesis de trabajo y deben diferenciar las variables de
respuesta (dependientes) y las predictoras (independientes).
Para realizar un clculo adecuado del tamao de muestra, el investigador debe
conocer con amplitud las variables que debe analizar. Cada variable tiene su propia
distribucin probabilstica y algunas cuentan con formas muy particulares. Por ejemplo,
las concentraciones en suero de triglicridos y leptina tienen distribuciones sesgadas
a la derecha (consltese el captulo 15, El sesgo en la investigacin) y es comn que la
desviacin estndar tenga un valor muy parecido al promedio respectivo. La transformacin logartmica es muy utilizada con estas variables. Este conocimiento contribuye a
que los clculos se hagan de manera adecuada con los logaritmos y no con las variables
originales.
Estas tcnicas estadsticas para la investigacin se utilizan en casi todas las reas del
conocimiento, con un auge importante en salud. Existen varias razones para seleccionar
una muestra; el objetivo fundamental es hacer inferencias estadsticas (estimaciones de
uno o ms parmetros acerca de una poblacin finita de inters). Esta poblacin es la
que se desea investigar y a la que se le denomina poblacin de inters, poblacin blanco o poblacin diana. Para que la extrapolacin (inferencia estadstica) tenga validez, la
muestra debe ser representativa y la representatividad alude a que el estimador muestral
de las variables de inters debe tener una distribucin con comportamiento similar a las

66

Metodologa de la investigacin, bioestadstica y bioinformtica en ciencias mdicas y de la salud

de la poblacin de las que proviene.1 Para cumplir con este supuesto de representatividad
es deseable que la muestra sea probabilstica y para calcular su tamao se deben tomar
en cuenta varios factores: estructura de la hiptesis, error tipo I (error alfa), error tipo II
(error beta), poder estadstico deseado, variabilidad, prdidas en el seguimiento del estudio, diferencia clnicamente significativa y tipo de estudio epidemiolgico utilizado en
determinada investigacin.

Aspectos bsicos en el proceso de muestreo


Poblacin es el conjunto total de elementos del que se puede seleccionar la muestra y est
conformado por elementos denominados unidades de muestreo o unidades muestrales, con
cierta ubicacin en espacio y tiempo. A estas unidades se les llama elementales si son el
objeto ltimo del que se pretende obtener informacin y no elementales si estn constituidas por grupos de unidades elementales.1 Las unidades de muestreo pueden ser individuos,
familias, compaas, etctera.2

Muestra de la poblacin de inters


Es deseable que la poblacin de inters se encuentre registrada en un medio fsico, conocido como marco de muestreo o marco muestral. ste puede ser un directorio, un mapa, un
listado, un archivo o cualquier otro material aceptable, que contenga todas las unidades de
muestreo debidamente identificadas y actualizadas,3,4,5 porque la muestra se obtiene de l.
Se dice que se cuenta con un marco utilizable cuando los elementos de ste coinciden con
la poblacin de inters.3
La informacin de una poblacin se obtiene mediante censos o mtodos de muestreo. En un censo se registran las caractersticas de inters de todos los elementos de la
poblacin. En este caso, se conoce perfectamente la distribucin de las variables de inters
y no es necesario hacer inferencia estadstica, porque el parmetro se calcula de manera
directa. Sin embargo, el censo es muy costoso; por ello, el investigador opta por recurrir a
una muestra. Una muestra no es ms que un subconjunto de la poblacin que se obtiene
mediante un proceso o estrategia de muestreo.1,3
Este captulo se concentra sobre todo en el diseo y la determinacin del tamao
de la muestra para lograr representatividad o validez externa en las conclusiones (gura
7-1).
Por la forma como se seleccionan las unidades de muestreo, una muestra puede ser no
probabilstica o probabilstica. En una muestra de este ltimo tipo, la seleccin de sus elementos se realiza mediante cuotas, criterios o a conveniencia del investigador. En este tipo
de muestreo, las unidades tienen distintas probabilidades de ser seleccionadas y, por tanto,
no se puede determinar la validez ni la confianza de los resultados y tampoco se pueden
analizar los errores cometidos en la estimacin ni fijar los tamaos de muestra. Un caso
muy comn son las encuestas de opinin, que casi siempre tienen poca credibilidad (por
ello, se les conocen como muestras errticas o circunstanciales).1,4
Un muestreo es probabilstico cuando cada elemento de la poblacin tiene una probabilidad conocida mayor que cero de ser seleccionado en alguna muestra y el proceso
de seleccin de los elementos se realiza mediante mecanismos aleatorios, lo que permite
medir y controlar los errores del muestreo.1,3,4

Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra

Poblacin
de inters

Muestra
probabilstica

Estimador
muestral

67

Extrapolacin

Parmetro
de la
poblacin

Representatividad:
Distribucin de frecuencias similar
entre la muestra y la poblacin

Figura 7-1. Representatividad de una muestra probabilstica.

Muestras para estudios clnicos controlados.


Cul es la diferencia?
Un aspecto diferente del muestreo es el caso de los estudios clnicos para determinar la
eficacia y seguridad de algn medicamento, en comparacin con los tratamientos estndar
o placebo. En ellos, el inters no reside en sacar inferencias sobre una poblacin blanco en
un sentido expuesto, sino en contrastar hiptesis sobre un tratamiento (o una maniobra)
que interesa al investigador. Por tanto, el muestreo suele ser a conveniencia.
Una vez que se ha seleccionado a los sujetos de estudio, se hace una aleatorizacin
para asignar el tratamiento que recibe cada uno. En este caso es adecuado que la aleatorizacin se haga por bloques aleatorios. Si el investigador conoce de antemano la existencia
de factores que modifican la variable dependiente, es recomendable hacer estratos para
controlar a la variable confusora y, en este caso, cada estrato se aleatoriza en forma independiente para lograr grupos balanceados en el tratamiento.
Obsrvese que lo que se prueba es la efectividad de los tratamientos, reflejada en las
variables dependientes escogidas por el investigador. El componente probabilstico est en
la asignacin aleatoria del tratamiento y no en la seleccin de los sujetos que participan
en el estudio.

Factores para la determinacin del tamao de la muestra


En la investigacin clnica y epidemiolgica existen factores que condicionan el tamao
de la muestra; pueden ser de orden logstico o estadstico. Entre los de orden logstico se
encuentran las limitantes financieras de un estudio determinado, o la disponibilidad de pacientes en un estudio de enfermedades poco frecuentes.6 Por otra parte, los factores de orden
estadstico que determinan el tamao de muestra se mencionan a continuacin.

68

Metodologa de la investigacin, bioestadstica y bioinformtica en ciencias mdicas y de la salud

Hiptesis

De acuerdo con el tipo de estudio de investigacin, tal vez sea necesario formular una o
ms hiptesis. Si se trata de un estudio de tipo descriptivo, esto no es necesario, porque
slo se busca una caracterizacin de la poblacin de inters. En cambio, en los estudios de
tipo comparativo, en que se emplean pruebas de significacin estadstica, s es necesario
establecer una o ms hiptesis. Por lo general, en la formulacin de una hiptesis el investigador plantea a priori el posible resultado, mientras que con los estudios descriptivos se
pueden establecer propuestas de hiptesis a posteriori. En ambos casos, es necesario contrastar las hiptesis y determinar si se aceptan o se rechazan. Para realizar este contraste,
las hiptesis toman el nombre de nula (H0) o alternativa (H1). En casi todos los casos, la
hiptesis que el investigador desea probar se plantea en la hiptesis alternativa; es decir, el
investigador espera que se rechace la hiptesis nula (cuadro 7-1).
El tipo de contraste de hiptesis puede ser unilateral (una cola) o bilateral (dos
colas). Una hiptesis unilateral se plantea cuando se especifica la direccin de la asociacin (mayor o menor) de las variables; en la hiptesis bilateral, se puede afirmar la existencia de asociacin entre las variables, pero no se especifica la direccin. Por lo general,
se recomienda que el contraste de hiptesis sea bilateral, porque ofrece la estimacin ms
robusta, a pesar de que el tamao de muestra es ms grande. El contraste unilateral slo
debe utilizarse cuando existe evidencia suficiente para limitar las hiptesis a una direccin
(una cola).2 Aunque esto es posible, la mayora de los revisores de protocolos de investigacin tiene la costumbre de exigir contrastes a dos colas. Cabe mencionar que el valor de
Z de una distribucin normal cambia dependiendo del tipo de contraste de hiptesis. As,
para la probabilidad de aceptada, en un contraste unilateral, se tendra Z y para el bilateral se tendra Z/2. En cuanto al valor correspondiente a la probabilidad de aceptada
en ambos contrastes es Z.6
Error tipo I o error

En un contraste de hiptesis, al valor (error tipo I) se le conoce como la probabilidad de


que se rechace H0 (se acepte H1) cuando H0 es cierta. Es decir, P(aceptar H1|H0 es cierta) = .
Al valor (1 )*100 se le conoce como el nivel de confianza de la prueba. El costo para
el investigador de reducir el error tipo I y, por tanto, de tener un mayor nivel de confianza
en los resultados requiere un tamao de muestra mayor. Entonces, el valor de vara de-

Cuadro 7-1.

Posibles errores en el contraste de hiptesis.

Decisin

Realidad

H0 es cierta

H1 es cierta

Se acepta H0

(error tipo II)

Se acepta H1

(error tipo I)

Al valor (error tipo I) se le conoce como la probabilidad de que se rechace H0


(se acepte H1) cuando H0 es cierta. Al valor se le conoce como la probabilidad
de que se acepte H0 cuando es falsa (H1 es cierta).

Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra

69

pendiendo del nivel de confianza que se quiera para la prueba; el criterio ms usado en la
literatura biomdica consiste en aceptar un riesgo de < 0.05.
Error tipo II o error

A la probabilidad de que se acepte H0 cuando es falsa (H1 es cierta) se le conoce como error
tipo II o error , es decir: P(aceptar H1|H0 es cierta) = . Al igual que con el error tipo I,
cuanto menor sea la probabilidad de cometer el error tipo II mayor debe ser el tamao de
muestra requerido. El valor de tolerable de mayor aceptacin en la comunidad cientfica
va de 0.1 a 0.2; incluso se ha insistido en que el error debe ser igual que el error .
Poder estadstico

En el contraste de hiptesis, el poder o la potencia estadstica equivale a la probabilidad de


aceptar H1 cuando es cierta. Se define como 1 . Es decir,
Poder estadstico = P (aceptar H1|H1 es cierta) = 1
Este concepto est vinculado muy de cerca con el error tipo II y su valor depende del
error tipo II que se acepte. De esta manera, si = 0.2, se tiene una potencia de 1 = 0.8.
En trminos porcentuales, se dice que la prueba tiene una potencia de 80%. Si se quisiera
un poder estadstico mayor, se necesitara una muestra de mayor tamao. En general, el
poder estadstico mnimo aceptado en la literatura biomdica es de 80%. Cuando el poder
es menor a esta cifra, algunos autores, como Henneckens,7 sugieren que estos trabajos no se
tomen como concluyentes cuando no se haya podido rechazar la hiptesis nula (cuando
se haya aceptado la hiptesis alternativa).
Variabilidad

Es la dispersin esperada de los datos. La variabilidad se evala dependiendo de la variable de inters. Si stas son continuas, el tamao de muestra est determinado por la
variable con el mayor coeficiente de variacin [CV(Y )=(SY /Y )], donde SY es la desviacin estndar y Y es la media. Cuanto mayor sea el CV, el tamao de muestra es mayor.
Por otra parte, cuando las variables de inters son categricas, debe utilizarse la estimacin de la proporcin que ms se acerque a 0.5. En caso de que existan hiptesis con
ambos tipos de variables, el tamao de muestra se debe calcular de acuerdo con la variable categrica, porque sto garantiza una mayor cantidad de elementos o individuos y,
por tanto, resultados ms robustos.6 Por lo general, la variabilidad se obtiene de estudios
previos reportados o de estudios piloto. Por medio de la estadstica, se ha demostrado
que cuanto ms agrupados estn los valores alrededor de un eje central, la variabilidad
es menor y, por tanto, el tamao de muestra tambin resulta menor.2
Prdidas en el seguimiento del estudio

Durante la realizacin del estudio, puede haber prdidas de los sujetos bajo anlisis por
diversas razones, como retiros del estudio (drop-outs). Por ello, se debe predecir la cantidad

70

Metodologa de la investigacin, bioestadstica y bioinformtica en ciencias mdicas y de la salud

esperada de prdidas y contemplar un aumento en el tamao de muestra en esta proporcin, porque el tamao mnimo de muestra necesario para obtener resultados estadsticamente significativos est pensado de acuerdo con el nmero de sujetos al final del estudio
y no en los incluidos al principio.6
Diferencia clnicamente signicativa

La magnitud de la diferencia del efecto que se desea detectar entre los grupos evaluados
es la condicionante ms importante para el clculo del tamao de la muestra. Muchas
veces, la obtencin de una diferencia estadsticamente significativa no resulta clnicamente significativa. Por ejemplo, tal vez exista diferencia estadsticamente significativa
al comparar el efecto de dos medicamentos. El investigador clnico o epidemilogo debe
determinar si la magnitud de esa diferencia es clnicamente relevante, sin importar que
haya resultado estadsticamente significativa. Este criterio es slo clnico. Cuanto mayor
sea la diferencia de esta magnitud, menor es el tamao de muestra requerido; en cambio,
si se desea detectar diferencias pequeas, el tamao de la muestra debe ser mayor. No
obstante, cualquier diferencia de relevancia clnica, tambin debe ser estadsticamente
significativa.

Tamaos de muestra de acuerdo con distintos


diseos de muestreo
Para determinar el tamao de muestra, no basta con tomar en cuenta los factores expuestos en la seccin anterior, tambin hay que considerar el tipo de diseo empleado en la
investigacin. Existen diseos de tamao fijo (los ms usados en estudios clnicos y epidemiolgicos) y variable. En los primeros, la estimacin del tamao de muestra se fija desde
el inicio de la investigacin; en los estudios de tamao variable, el nmero de sujetos se va
incrementando hasta obtener un tamao predeterminado (diseo secuencial) o el diseo
experimental que involucra un solo caso.
En este captulo slo se hace referencia a diseos de tamao fijo y se muestra el clculo
para determinar el tamao de muestra de una proporcin, un promedio, una diferencia de
proporciones y una diferencia de promedios.
Clculo del tamao de muestra de una media

El intervalo de confianza para estimar la media poblacional a partir de una muestra es


IC =
donde
( y
n

s=

i =1

es la media estimada a partir de la muestra y = Za/2 * ns , donde, a su vez,


y)
y Z es el valor del eje de las abscisas de la funcin normal estndar en que
2

n 1

/2

se acumula la probabilidad de (1 ). Cuando n es muy pequea, Z/2 podra sustituirse


por t(n1),/2. Entonces, al despejar n se tiene n =

Z2 a/2*S 2

. En muestras finitas donde la


2
poblacin es inferior a un milln, la frmula para el clculo del tamao de la muestra se

Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra

71

n
suele multiplicar por el factor de correccin por finitud 1
, quedando la estimacin

del tamao de muestra como n =

Z2 /2*S 2

* 1 n . En general, el error de estimacin o

error absoluto () se obtiene de una muestra piloto o de estudios de investigacin previos.


2

Clculo para determinar el tamao de muestra de una proporcin

El tamao de muestra de una proporcin se calcula mediante


n=
donde

= Z

22

p(1 p ) ,
n

Z2 /2* p(1 p)

n
N

y se le conoce como precisin del muestreo o error de la estima-

cin. 1 n es el factor de correccin por finitud de la poblacin, que suele aplicarse


N

cuando sta es inferior a un milln de elementos.6 En este caso, p es la proporcin esti-

mada del parmetro poblacional y Z/2 es el valor del eje de las abscisas de la funcin
normal estndar en donde se acumula la probabilidad de (1 ). En general, el error de
estimacin () se obtiene de una muestra piloto o de estudios anteriores. En caso de que
no se pueda determinar esta proporcin, se toma p = 0.5, porque este valor garantiza el
mayor tamao de muestra. El nivel de confianza (1 )*100 que suele utilizarse en estas
pruebas, por lo general es de 95%. El intervalo de confianza para una proporcin queda
definido como
IC = p = p Z 2 *

p 1 p

).

Clculo para el tamao de muestra de la diferencia


de dos medias independientes

La frmula para el clculo de muestra de la diferencia de dos medias es

nc = ne =

2* S 2
* Z 2 * Z
D2

donde nc es el tamao de muestra para el grupo de referencia y ne lo es para el grupo con


una intervencin alternativa; D = (Mc Me) (donde Mc es la media del primer grupo y
Me es la del segundo); S2 es la varianza de ambas distribuciones, que se suponen iguales;
Z es el valor del eje de las abscisas de la funcin normal estndar en donde se acumula
la probabilidad de (1 ). Esta frmula para estimar nc = ne se emplea cuando se trata
de un contraste de hiptesis bilateral; en caso de un contraste unilateral, se sustituye Z/2
con Z.

72

Metodologa de la investigacin, bioestadstica y bioinformtica en ciencias mdicas y de la salud

Clculo para el tamao de muestra de la comparacin de dos medias


pareadas (medidas repetidas) en un solo grupo

La frmula del tamao de muestra para cada uno de los grupos que habr de compararse es

nc = ne =

Z + Z
2

*S2

d2

donde d es el promedio de las diferencias individuales entre los valores basales y posteriores, S2 es la varianza de ambas distribuciones, que se suponen iguales, Z/2 es el valor del
eje de las abscisas de la funcin normal estndar en donde se acumula la probabilidad de
(1 ) para un contraste de hiptesis bilateral y Z es el valor del eje de las abscisas de la
funcin normal estndar, en donde se acumula la probabilidad de (1 ).6
Clculo para el tamao de muestra de la comparacin de dos medias
pareadas (medidas repetidas) en dos grupos distintos de sujetos

Este diseo se utiliza cuando se quiere comparar el cambio entre una medida basal y otra
posterior de dos grupos distintos de sujetos. Es posible que exista una correlacin entre
ambas medidas; en este caso, se corrige por el coeficiente de correlacin (), que, al igual
que la desviacin estndar, se estima a partir de pruebas piloto o de experiencias previas.
La frmula para la estimacin del tamao de muestra de los grupos es
2

nc = ne =

2* Z + Z *(1 )* S 2
| M de M dc |2

donde Mdc es la diferencia entre los valores iniciales y los finales en el grupo de los controles y Mde es la diferencia entre los valores iniciales y finales en el grupo con tratamiento.6
Clculo para estimar el tamao de muestra de la diferencia de dos proporciones

La frmula para estimar el tamao de muestra para la diferencia de dos proporciones es


nc = ne =

p1 (1 p1 ) + p2 (1 p2 )

(p p )
1

* Z 2 + Z

donde p1 es la proporcin del primer grupo, p2 es la del segundo grupo a comparar y


(p1 p2) es la diferencia de las proporciones entre los grupos en estudio, Z/2 es el valor del
eje de las abscisas de la funcin normal estndar en donde se acumula la probabilidad de
(1 ) para un contraste de hiptesis bilateral y Z es el valor del eje de las abscisas de la
funcin normal estndar en donde se acumula la probabilidad de (1 ).
Clculo para el tamao de muestra de la comparacin de
dos proporciones independientes

Cuando se tiene una tabla de contingencia de dos por dos y las condiciones se cumplen
para aplicar una prueba 2, se puede utilizar esta aproximacin para el clculo del tamao

Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra

73

de la muestra de la comparacin de proporciones independientes. Siguiendo este planteamiento, la frmula que Marragat y colaboradores proponen para la diferencia de proporciones independientes es

nc = ne =

* 2* P * Q + Z * Pc * Qc + Pe * Qe

( Pe Pc )2

donde P es la proporcin media de la proporcin de eventos de inters del grupo control


(c) y el grupo en tratamiento (e), Q = 1 P, Pc es la proporcin de eventos de inters en el
grupo control, Qc = 1 Pc, Pe es la proporcin de eventos de inters en el grupo expuesto
o en tratamiento, Qe = 1 Pe y (Pe Pc) es la diferencia de las proporciones entre el grupo
control y la proporcin del grupo de expuestos.6
Clculo para el tamao de muestra en que se tiene una hiptesis de bioequivalencia
y se quiere demostrar la hiptesis nula en la comparacin de dos proporciones

En este caso, la frmula para el clculo del tamao de muestra del grupo control y del
expuesto es
2
Pc * Qc * Z 2 + Z
nc = ne =
2
( Pc Pe )
donde Pc es la estimacin de la proporcin de eventos de inters en el grupo control,
Qc = 1 Pc y Pe es la proporcin de eventos de inters en el grupo tratado, Z/2 es el valor
del eje de las abscisas de la funcin normal estndar en dnde se acumula la probabilidad
de (1 ) para un contraste de hiptesis bilateral y Z es el valor del eje de las abscisas de
la funcin normal estndar en dnde se acumula la probabilidad de (1 ).6
En la actualidad, con el uso de internet se facilita la obtencin del tamao de muestra
empleando programas en lnea u otros que se descargan. La diversidad es tal que se puede obtener el tamao especfico de una muestra para el diseo de experimentos y de los
factores determinantes para el tamao de muestra. Entre los programas ms usuales en
la epidemiologa estn EPIDAT, GPOWER y EPIINFO, que pueden obtenerse sin costo.

Referencias
1.

2.

Cid Cid A.I., Delgado Manrquez C.A., Leguey Galn S. Muestreo en poblaciones nitas. En:
Leguey Galn S (coord). Introduccin al muestreo en poblaciones nitas. Madrid, Espaa: ENE,
Nuevas estructuras, 1999.
Prez Medina A., Gmez Restrepo C., Snchez Pedraza R., Dennis R., Ruiz Morales A. Seleccin de la muestra y factores determinantes para el clculo de su tamao. En: Ruiz Morales
A., Gmez Restrepo C., Lendoo Trujillo D. (ed). Investigacin clnica: Epidemiologa clnica
aplicada. Bogot, Colombia: Centro Editorial Javeriano, ceja, 2001.

74

3.

4.
5.
6.

7.

Metodologa de la investigacin, bioestadstica y bioinformtica en ciencias mdicas y de la salud

Mndez Ramrez I., Eslava Gmez G., Romero Mares P. Conceptos bsicos de muestreo (serie monogrca), Mxico, D.F.: Instituto de Investigaciones en Matemticas Aplicadas y en Sistemas,
Universidad Nacional Autnoma de Mxico, 2004, Vol 12, Nm. 27.
Martnez Bencardino C. Estadstica y muestreo, 12a. ed. Bogot, Colombia: Ecoe Ediciones, 2005.
Cochran W.G. Sampling Techniques, 3a. ed. Nueva York: John Wiley & Sons, 1977.
Marrugat J., Vila J., Pavesi M., Sanz F. Estimacin del tamao de muestra en la investigacin clnica y epidemiolgica, Unidad de Lpidos y Epidemiologa Cardiovascular. Barcelona, Espaa:
Instituto Municipal de Investigacin Mdica (imim), Medicina Clnica, 1998;111:267-276.
Henneckens C.H., Mayrent S.L. Epidemiology in Medicine. Boston: Little Brown and Company, 1987.

Vous aimerez peut-être aussi