Vous êtes sur la page 1sur 7

Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y Portugal

Sistema de Informacin Cientfica

Sara Aguilar-Barojas Frmulas para el clculo de la muestra en investigaciones de salud Salud en Tabasco, vol. 11, nm. 1-2, enero-agosto, 2005, pp. 333-338, Secretara de Salud del Estado de Tabasco Mxico
Disponible en: http://www.redalyc.org/articulo.oa?id=48711206

Salud en Tabasco, ISSN (Versin impresa): 1405-2091 revista@saludtab.gob.mx, imbio_c@imbiomed.com.mx Secretara de Salud del Estado de Tabasco Mxico

Cmo citar?

Fascculo completo

Ms informacin del artculo

Pgina de la revista

www.redalyc.org
Proyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

ARTICULO DE REVISION

Frmulas para el clculo de la muestra en investigaciones de salud


Sara Aguilar-Barojas (1)
quimsarai@hotmail.com

RESUMEN En la investigacin en salud, es muy difcil estudiar a toda la poblacin que presenta la variable de inters, por lo que es necesario realizar un muestreo que resulte representativo de la poblacin objetivo. El clculo de la muestra permite responder a la pregunta del investigador de cuntos individuos se deben considerar para estudiar un parmetro con un grado de confianza determinado? o cuntos individuos se deben estudiar para detectar en los resultados de los dos grupos, una diferencia que sea estadsticamente significativa? El artculo realiza las consideraciones previas sobre la profundidad del estudio y las variables. Presenta las frmulas para calcular muestras con variables cualitativas y cuantitativas para estudios descriptivos y explicativos. En estos ltimos, cuando se utilizan las pruebas de contrastacin de hiptesis ms comunes, como son la Chi cuadrada, la t de student y el coeficiente de correlacin de Pearson. Palabras claves: clculo de muestra, frmulas, muestra representativa, investigacin en salud.

INTRODUCCIN Cuando se desea realizar un estudio, lo que se desea compartir con la comunidad mdica son: 1) observaciones realizadas en la prctica cotidiana, 2) datos especficos del expediente clnico en grupos de pacientes con alguna caracterstica en comn 3) diferencias que se consideran importantes al comparar grupos de pacientes. En cualquiera de estos tres casos, el clculo del tamao de la muestra apoya al objetivo de cualquier investigacin, el cual puede ser de dos tipos: a) estimar un parmetro, o b) contrastar una hiptesis. Entonces, el clculo permite responder a cualquiera de las siguientes preguntas: cuntos individuos se deben considerar para estimar un parmetro con un grado de confianza determinado? o cuntos individuos se deben estudiar para detectar en los resultados de los dos grupos, una diferencia que sea estadsticamente significativa? El resultado del clculo de una muestra debe considerarse como orientativo, ya que se fundamenta en supuestos que pueden ser incorrectos y que en el momento de introducirlos numricamente en las frmulas, afectan la viabilidad del estudio, el costo y hasta los aspectos ticos. Por otro lado, un estudio con una muestra insuficiente, puede afectar la precisin y la sensibilidad para detectar diferencias entre los grupos y conducir a conclusiones falsas.1 Existen, por lo menos cuatro razones para estudiar muestras, en vez de poblaciones: 1) Las muestras pueden estudiarse con ms rapidez que las poblaciones. 2) Es menos costoso estudiar una muestra que una poblacin. 3) En la mayor parte de las situaciones el estudio de la poblacin entera es imposible. 4) Los resultados de una muestra son ms precisos que los derivados de poblaciones. Esto es por la calidad de los datos, la capacitacin de quien recoge los datos; la estimacin del error en los parmetros resultantes y la homogeneidad de las muestras.

SUMMARY In health research, is very difficult to study all the population that has the interesting attribute, so that, is necessary to make a sampling representative of the target population. The sample calculation let answer the research question about, how many persons we must considerate for study a parameter with a specific grade of confidence? Or how many persons we must study for detect in the results of the two groups, a difference significative statistically? The article do the previously considerations about the depth of the study and the attributes. It presents the formulas for calculate the sample with qualitative and quantitative attributes for descriptive and explicative research. In the last one, for use the tests for contrast the hypothesis must common, like chi square, t of student and the correlation coefficient of Pearson. Keywords: sample calculation, formulas, representative sample, health research.

(1)

Profesora de bioestadstica en la DACS-UJAT. Coordinadora de la Red Estatal de Laboratorios, Secretara de Salud del estado de Tabasco.

ARTICULO DE REVISION

En la investigacin mdica, incluir ms sujetos de estudio, no es sinnimo de mejor estudio. Por esta razn, se debe de planear el tamao apropiado de la muestra antes de iniciarlo. Este proceso se conoce como la determinacin de la fuerza o potencia del estudio (1-) cuya definicin es la capacidad de un estudio para identificar una diferencia de un tamao 2 dado, si en realidad la diferencia existe. El tamao de la muestra dar la fuerza o potencia del estudio (1-), sobre todo en el caso de que se vaya a contrastar una hiptesis y se pueda cometer cualquiera de los dos tipos de errores, el tipo I, que consiste en rechazar una hiptesis nula, cuando es cierta y el II en aceptarla cuando es falsa. Un buen clculo de muestra nos protege de ignorar una diferencia significativa entre los dos grupos y, por lo tanto, de cometer el error tipo II. Es importante recordar que la Hiptesis Nula (Ho) es un enunciado que afirma que no hay diferencia entre el valor XA del grupo A y el valor XB del grupo B. Mientras que la Hiptesis alternativa (H1) es un enunciado en desacuerdo con la hiptesis nula, que enuncia: si hay diferencia entre el valor XA del grupo A y el valor X B del grupo B. I.- CONSIDERACIONES PREVIAS El tamao de la muestra necesario depender bsicamente del nivel de la investigacin y las variables insertadas en el objetivo de la investigacin. a)
l

Los estudios clnicos son estudios descriptivos a partir de la prctica cotidiana, revisiones de expedientes o ambos. En caso de que establecer una serie de tiempo no sea suficiente, se requiere calcular una muestra para una sola poblacin. En estudios epidemiolgicos pueden ser encuestas de cualquier tipo. Tambin se requiere muestra.
l

Nivel III, de correlacin. Buscan las relaciones o asociaciones entre los factores estudiados. Son estudios observacionales, estudian dos poblaciones y verifican hiptesis. Clculo de la muestra: Los estudios clnico-epidemiolgicos son casos y controles y de cohorte, que s requieren de calcular muestra en las poblaciones para establecer de antemano su potencia.

Nivel IV, explicativos. Buscan establecer las causas de las asociaciones. Son estudios cuasiexperimentales o experimentales, comparan dos poblaciones y verifican hiptesis. Clculo de la muestra: Los estudios epidemiolgicos son intervenciones en poblaciones con seguimiento de la cohorte y son altamente exigentes en los valores que se introducen para el clculo de la muestra para las dos poblaciones que se van a comparar. Los estudios clnicos son ensayos aleatorizados, casi siempre para probar la efectividad de un tratamiento. Tambin son altamente exigentes en los valores que se introducen para el clculo de la muestra para las dos poblaciones, los que recibirn el tratamiento y los controles. Los experimentos puros se realizan en laboratorios de investigacin en animales y se calcula el nmero de repeticiones que se tienen que realizar. A pesar de que son los ms poderosos, por el riguroso control de las variables confusionales, se utilizan pocos sujetos de estudio. En este tipo de diseos a medida que las repeticiones aumentan, las estimaciones de las medias observadas, se hacen ms precisas. Ambas se influyen mutuamente, de tal forma que, a mayor nmero de repeticiones 3 mayor grado de precisin y viceversa.

.- Con respecto al nivel de la investigacin Nivel I, de tipo exploratorias. Son investigaciones que responden preguntas sencillas para determinar si hay o no hay tal o cual caracterstica. Aqu solo se van a estimar parmetros de la poblacin, su presencia y magnitud. Son estudios observacionales de una poblacin. Clculo de la muestra: Los estudios exploratorios de tipo clnico pueden ser series de casos, donde no se requiere clculo de la muestra, pues se presentan todos los casos que se hayan tenido. En estudios epidemiolgicos, pueden ser clculos de prevalencia, encuestas de opinin, encuestas serolgicas. En este caso se calcula una muestra para una sola poblacin.

Nivel II, de tipo descriptivo. En estos estudios se trata de realizar una descripcin detallada de las caractersticas que presenta el sujeto en estudio. Son estudios observacionales en un solo tipo de poblacin. Clculo de la muestra:

b) .- Con respecto a la variable insertada en el objetivo general.

ARTICULO DE REVISION

An cuando varios autores mencionan que hay que tomar 4 en cuenta los objetivos de la investigacin, para no confundir al lector es mejor precisar que es con respecto al objetivo general, sin tomar en cuenta los objetivos especficos. Ese objetivo general, que se desprendi de una pregunta de investigacin, lleva insertada la variable de inters. Hay que determinar si es una variable cualitativa, con escala nominal u ordinal, o cuantitativa con escala discreta o continua. En las variables cualitativas hay dos tipos de posibilidades: a) nominales, que pueden ser dicotmicas o multicotmicas y b) ordinales. En ambos casos los resultados se expresan como porcentajes o tasas, datos que se introducen en la frmula para el clculo de la muestra. En variables cuantitativas tambin hay dos tipos de posibilidades: a) discretas, cuando los resultados se expresan numricamente, pero no aceptan fracciones, por ejemplo, nmero de dientes, nmero de hijos, etc. y b) continuas, cuando los resultados numricos s aceptan fracciones, como peso, estatura, todos los parmetros de qumica sangunea, etc. En ambos casos los resultados se resumen en forma de medias y varianzas, mismas que se introducen en la frmula del clculo de la muestra. Es importante destacar, que las variables cuantitativas son ms poderosas para el anlisis estadstico y no hay que convertirlas en cualitativas. Por ejemplo, para la variable obesidad, es mejor analizar el ndice de masa corporal, que es la razn peso/talla, de tipo continua, que escoger la escala de obeso y no obeso. II.- CLCULO DEL TAMAO DE LA MUESTRA Para el clculo de la muestra debe conocerse: La variabilidad del parmetro que se desea estudiar (p, q, S). Aunque esto parezca paradjico, ya que de eso se trata precisamente la investigacin, hay que conocer, cmo se presenta en la poblacin la variable que se quiere estudiar. La primera reflexin que asalta al investigador es: si supiera cmo se presenta, no estara diseando una investigacin para conocerla, cmo me piden eso? Si se trata de variables cualitativas, se necesita conocer el porcentaje con que se presenta la variable en la poblacin. Por ejemplo, si deseamos conocer la presencia de hbito tabquico en los mdicos, debemos saber qu porcentaje de mdicos fuman (p) y qu porcentaje no fuman (q) justamente en la poblacin que deseamos estudiar. Si es una variable cuantitativa, cul es la desviacin estndar (S) con que se presenta en la poblacin. Por ejemplo, si queremos realizar una investigacin para establecer los picogramos sricos de nicotina en los fumadores, debemos precisar la media que esperamos encontrar y su desviacin estndar. Como

se puede apreciar, el que nos pidan los datos de algo que an no estudiamos, resulta sumamente confuso. Sin embargo, s hay solucin a este problema. Estos datos se pueden obtener de tres formas: 1) de estudios reportados en revistas, con una poblacin parecida o similar a la que queremos estudiar; 2) con un estudio piloto de 25 sujetos, o 3) si no se pude lo anterior, se asigna la mxima probabilidad con que se puede presentar la variable en cuestin, que es, en variables cualitativas del 50% y en el caso de variables cuantitativas se determina la diferencia entre el mximo y el mnimo valor esperable, se divide entre cuatro y, por lo tanto, se tiene una cierta aproximacin al 5 valor de la desviacin estndar. El nivel de confianza deseado (Z). Indica el grado de confianza que se tendr de que el valor verdadero del parmetro en la poblacin se encuentre en la muestra calculada. Cuanta ms confianza se desee, ser ms elevado el nmero de sujetos necesarios. Se fija en funcin del inters del investigador. Los valores ms comunes son 99% 95% o 90%. Hay que precisar que los valores que se introducen en la frmula son del clculo del rea de la curva normal para esos porcentajes sealados: % Error 1 5 10 Nivel de Confianza 99 % 95 % 90 % Valor de Z calculado en tablas 2.58 1.96 1.645

A veces se afirma errneamente, por ejemplo, que un nivel de confianza al 95%, con relacin a la media muestral, da la amplitud dentro de la cual se encontrar el 95% de futuras medias muestrales. Esto es incorrecto, ya que la distribucin de medias muestrales se centra en la media poblacional y no en la media muestral particular. La mayora de este tipo de afirmaciones son desorientadoras e incorrectas.3 Lo que s se puede afirmar es que se tiene el 95% de probabilidad de que el valor verdadero de lo que se est estudiando en la poblacin, se encuentre en la muestra calculada. La precisin absoluta (d) . Es la amplitud deseada del intervalo de confianza a ambos lados del valor real de la diferencia entre las dos proporciones (en puntos porcentuales). Su uso es para dejar margen al error aleatorio exigido en el modelo lineal aditivo, el cual expresa que la observacin i-sima es una observacin de la media , pero est sujeta a un error de muestreo i (psilon sub i). El 3 modelo lineal aditivo ms simple es: Yi= + i Cuanta ms precisin se desee, ms estrecho ser este

ARTICULO DE REVISION

intervalo y ms sujetos sern estudiados. Se fija previamente tomando en cuenta la finalidad de la investigacin. En algunos casos puede requerirse una gran precisin, mientras que en otros, solo se desea conocer aproximadamente entre qu valores se encuentra el parmetro, se requiere menor precisin y, por lo tanto, menos sujetos de estudio. Las precisiones absolutas comnmente utilizadas son: la mayor de 0.1; una media 0.05 y la ms pequea de 0.01. El tamao de la muestra es especialmente sensible a la precisin que se elija. % 90 95 99 Valor d 0.1 0.05 0.001

TIPO CUALITATIVO: En las investigaciones donde la variable principal es de tipo cualitativo, que se reporta mediante la proporcin del fenmeno en estudio en la poblacin de referencia, la muestra se calcula a travs de las frmulas: a) Para poblacin infinita (cuando se desconoce el total de unidades de observacin que la integran o la poblacin es mayor a 10,000): n= Z2 pq d2

La precisin tambin puede expresarse de forma relativa () con respecto a la estimacin. La diferencia con la absoluta es que esta ltima se expresa en puntos porcentuales, mientras que la relativa es en porcentaje y los ms comunes son: 10%, 20%, 25% y el 50%.4 III.- FORMULAS PARA CALCULAR LA MUESTRA EN ESTUDIOS DESCRIPTIVOS A) PARA ESTUDIOS CUYA VARIABLE PRINCIPAL ES DE TIPO CUANTITATIVO 6 a) Para una poblacin infinita (cuando se desconoce el total de unidades de observacin que la integran o la poblacin es mayor a 10,000): n= Z2 S2 d2

b) Para poblacin finita (cuando se conoce el total de unidades de observacin que la integran): n= N Z2 pq d (N - 1) + Z2 pq
2

Donde: p = proporcin aproximada del fenmeno en estudio en la poblacin de referencia q = proporcin de la poblacin de referencia que no presenta el fenmeno en estudio (1 -p). La suma de la p y la q siempre debe dar 1. Por ejemplo, si p= 0.8 q= 0.2 Z, N y d se explicaron en el prrafo anterior. IV) FRMULAS PARA CALCULAR LA MUESTRA EN ESTUDIOS EXPLICATIVOS Los conceptos presentados al inicio de esta revisin con respecto a los errores tipo I y tipo II y el poder de la prueba, son esenciales para una clara comprensin del problema del tamao de la muestra. Al escoger un tamao de muestra para detectar una diferencia en la variable que se quiere estudiar al comparar dos grupos, se debe admitir la posibilidad de un error tipo I o un error de tipo II y calcular el tamao de muestra en consecuencia.3 Adems de los elementos para calcular la muestra en los estudios descriptivos ya mencionados, se deben conocer otros datos que intervienen en el clculo del nmero de 1 sujetos necesarios para contrastar una hiptesis, como son: 1. Si la hiptesis que se quiere contrastar es uni o bilateral. 2. Cul es el riesgo que el investigador acepta de cometer error tipo 3. El riesgo aceptado de cometer un error (potencia 1-) 4. Cul es la magnitud mnima de la diferencia o asociacin que se considera importante detectar. 5. Cul es la variabilidad de respuesta en el grupo de

b) Para una poblacin finita (cuando se conoce el total de unidades de observacin que la integran): n= N Z2S2 d (N-1) + Z2S2
2

Donde: n = tamao de la muestra N = tamao de la poblacin Z = valor de Z crtico, calculado en las tablas del rea de la curva normal. Llamado tambin nivel de confianza. S2 = varianza de la poblacin en estudio (que es el cuadrado de la desviacin estndar y puede obtenerse de estudios similares o pruebas piloto) d = nivel de precisin absoluta. Referido a la amplitud del intervalo de confianza deseado en la determinacin del valor promedio de la variable en estudio. B) PARA ESTUDIOS CUYA VARIABLE PRINCIPAL ES DE

ARTICULO DE REVISION

referencia. 6. Otros factores: Prueba estadstica que se usar en el anlisis Tipos especiales de diseo del estudio Comparacin de dos o ms grupos Grupos de tamao diferente Equivalencia de las intervenciones Estratificacin por las caractersticas basales Mltiples variables de respuesta Porcentaje de prdidas y abandonos esperados A) CLCULO DE MUESTRA PARA PRUEBA DE 7 HIPTESIS EN UNA PROPORCIN DE POBLACIN El objetivo de estos estudios es someter a pruebas de hiptesis que la proporcin de sujetos de una poblacin que posee cierta caracterstica es igual a un valor determinado y se utiliza la prueba de Chi cuadrada (2) Informacin necesaria y notacin: a) Valor de prueba de la proporcin en caso de hiptesis nula Po b) Valor previsto de la proporcin de la poblacin Pa c) Nivel de significacin 100% d) Potencia de la prueba (1-)100% e) Hiptesis alternativa: Prueba unilateral: Pa > Po o Pa< Po o bien: Prueba bilateral: Pa Frmula para prueba unilateral

d) Potencia de la prueba e) Hiptesis alternativa

(1-)100% Prueba bilateral: Pa

? Po

( Z + Z ) n=

C) CLCULO DE MUESTRA PARA PROBAR HIPTESIS EN ESTUDIOS QUE COMPARAN DOS MEDIAS2 Una frmula semejante puede usarse para calcular el tamao de muestras para comparar las medias de dos grupos independientes. Se deben cumplir dos premisas: las desviaciones estndar de las dos poblaciones son iguales y los tamaos de muestras son iguales en los dos grupos. La contrastacin de las hiptesis tambin se puede realizar con una t de student para dos medias. Informacin necesaria y notacin: a) Valor de la diferencia entre medias que tiene significado (1 - o precisin relativa) b) Valor previsto de las desviaciones estndar de las dos poblaciones c) Nivel de significacin 100% d) Potencia de la prueba (1-)100% e) Hiptesis alternativa Prueba bilateral: Pa

? Po

? Po

Z 1(1 1) + Z 0 (1 0 ) n= 1 0

( Z + Z ) n= 2

B) CLCULO DE MUESTRA PARA PROBAR HIPTESIS EN ESTUDIOS QUE COMPARAN LA MEDIA DE UNA SOLA MUESTRA CONTRA OTRA MEDIA YA ESTABLECIDA 7 El objetivo de estos estudios es comparar una media de una poblacin contra otra media estandarizada, como puede ser el de otra poblacin, sin que el investigador haya calculado esta ltima. La contrastacin de la hiptesis puede realizarse mediante una t de student Informacin necesaria y notacin: a) Valor de la diferencia entre medias que tiene significado (1 - o precisin relativa) b) Valor previsto de la desviacin estndar de la poblacin c) Nivel de significacin 100%

D) CLCULO DE MUESTRA PARA PRUEBA DE HIPTESIS EN ESTUDIOS DE CASOS Y CONTROLES 4 Este tipo de muestras permite que se calcule la probabilidad de la presencia del fenmeno mediante el odds ratio, razn de momios o razn de productos cruzados. Informacin necesaria y notacin: a)Hay que conocer dos de los siguientes parmetros: l Probabilidad prevista de exposicin para las personas con la enfermedad [a/(a+b)] P1* l Probabilidad prevista de exposicin para las personas sin la enfermedad [c/(c+d)] P2* l Razn de probabilidad prevista OR b) Nivel de confianza (1-)100% c) Precisin relativa

ARTICULO DE REVISION

Frmula:

Frmula:

n = Z 21 a / 2

1 1 + * * * * P1 (1 P1 ) P2 (1 P2 )

] [

N=

( Z + Z ) 0.5 ln [(1 + r ) /(1 r )] + 3

[log e(1-)]

V.- CONSIDERACIONES FINALES E) CLCULO DE MUESTRA PARA PROBAR HIPOTESIS EN ESTUDIOS DE COHORTES 4 Este clculo de muestra permite realizar el clculo de un riesgo relativo con precisin relativa especfica. Informacin necesaria y notacin: a) Deben conocerse dos de los siguientes parmetros: l Probabilidad prevista de enfermedad en las personas expuestas al factor investigado P1 l Probabilidad prevista de enfermedad en las personas no expuestas al factor investigado P2 l Riesgo relativo previsto RR b) Nivel de confianza (1) 100% c) Precisin relativa Frmula: En la planificacin de un estudio de investigacin, es fundamental decidir sobre el tamao de la muestra de la poblacin objeto de estudio. La respuesta a la pregunta Qu tamao de muestra necesito? depender bsicamente del alcance del estudio, las variables y el plan de anlisis. Si no se toman en cuenta estos aspectos, el investigador no podr decidir la frmula que utilizar y los datos que deber incluir en ella. Adems, deber estar lo suficientemente familiarizado con el c omportamiento de la variable en la poblacin en estudio para que pueda establecer su variabilidad, decidir el nivel de confianza con el que puede trabajar y el grado de precisin ms apropiado. Todas las frmulas presentadas, se pueden establecer con ayuda de una calculadora manual, computadora, tablas ya calculadas o con programas de estadstica como SPSS o Minitab. Finalmente, una vez que se ha obtenido el tamao de la muestra, es necesario analizar las dificultades operativas, la disponibilidad de tiempo y recursos para que verdaderamente sea viable aplicarla, de lo contrario, por muy bien calculada que est la muestra, ser imposible llevarla a la realidad, lo que podra invalidar las conclusiones del estudio.

Z 21 a / 2

(1 p1 ) (1 p2 ) p + p 1 2
[log e(1-)]
2

F) CLCULO DE MUESTRA PARA ASOCIAR DOS VARIABLES CUANTITATIVAS UTILIZANDO EL COEFICIENTE DE CORRELACIN DE PEARSON1 La asociacin entre dos variables cuantitativas requiere habitualmente la utilizacin del coeficiente de correlacin r de Pearson. Informacin necesaria y notacin: a) Valor del coeficiente de correlacin que se supone existe en la poblacin r b) Valor previsto de la desviacin estndar de la poblacin c) Nivel de significacin 100% d) Potencia de la prueba (1-)100% e) logaritmo natural o neperiano ln

REFERENCIAS 1.- Argimn J, Jimnez J. Mtodos de investigacin. Madrid: Ediciones Harcourt;2000. 2.- Dawson B, Trapp R. Bioestadstica mdica. 3 ed. Mxico, D.F.: El Manual Moderno;2002. 3.- Steel R, Torrie J. Bioestadstica: principios y procedimientos. Bogot: McGraw-Hill Latinoamericana;1980. 4.- Lwanga S K, Lemeshow S. Determinacin del tamao de las muestras en estudios sanitarios. Ginebra: Organizacin Mundial de la salud;1991. 5.- Milton S. Estadstica para Biologa y Ciencias de la Salud. 3 ed. Madrid: McGraw Hill-Interamericana;2001. 6.- Montesano JR. Manual del protocolo de investigacin. Mxico, D.F.: Editorial Auroch;1999. 7.- Norman G, Streiner D. Bioestadstica. Madrid: Harcourt Brace;1996.

Vous aimerez peut-être aussi