Vous êtes sur la page 1sur 8

7

MUESTREO

La manera usual de realizar un estudio del comportamiento de variables en una poblacin es tomando muestras de individuos o unidades experimentales pertenecientes a ella. A partir de los datos registrados en estas unidades es posible, luego, realizar inferencias sobre el conjunto total, la poblacin. Una condicin que debe reunir una muestra para realizar esas inferencias es ser representativa. Esto significa que en ella deben estar representadas todas las condiciones presentes en la poblacin y que pueden influir en el dato a partir del cual se evala la variable de inters. La representatividad de una muestra se garantiza por la forma de seleccin de sus componentes. Este tema se trata en el estudio de las tcnicas de investigacin; la aplicacin de las tcnicas estadsticas presupone que la muestra es representativa. Una vez decidido cmo se va a asegurar la representatividad, se debe garantizar que, dentro de la poblacin definida o den-

tro de un estrato o subconjunto de ella, la seleccin se realice en forma aleatoria. Esta condicin significa que, durante el procedimiento, cada uno de los integrantes de la poblacin tiene la misma probabilidad de ser seleccionado. A lo largo de este captulo se analizar el comportamiento de las muestras tomadas en esas condiciones en su relacin con los parmetros de la poblacin de origen. En primer lugar, se examinar la situacin para variables descritas mediante datos numricos y luego se harn algunas apreciaciones para el caso de los datos nominales. Al igual que frente a otras situaciones, los datos ordinales pueden considerarse como categricos, al igual que los nominales, o, cuando se trata de puntajes o ndices razonablemente estandarizados, tratarlos como numricos, aun cuando en realidad no lo sean.

MUESTRAS CON DATOS NUMRICOS


Supngase que se est frente a una poblacin hipottica y pequea de cuatro indivi-

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.

48

INTRODUCCIN A LA ESTADSTICA EN CIENCIAS DE LA SALUD

duos (N = 4) en la que los que la componen tienen los siguientes datos numricos para una determinada variable: a = 4; b = 3; c = 3; d = 2. Esos valores se incluyen en la primera fila del cuadro 7-1. La media aritmtica () en ese conjunto es 3. Si se supone que alguien est interesado en el valor de ese parmetro, aunque no tiene acceso a la poblacin sino solo a algunos de sus integrantes, necesitara trabajar a partir de una muestra. Se ver a continuacin la situacin que se planteara al utilizar para la tarea una muestra de tamao 2 (n = 2). Se entender que esta situacin se presenta a manera de ejemplo, ya que las poblaciones que presentan un inte-

rs real son de tamaos notoriamente mayores. Para seleccionar en forma aleatoria dos unidades de las cuatro de la poblacin, podran colocarse cuatro bolillas identificadas con las respectivas letras en un bolillero y, por sorteo, retirar dos. Debe destacarse que en este caso no se est cumpliendo en su totalidad el requisito de aleatoriedad. En efecto, la posibilidad de seleccin de la primera bolilla ha sido de uno en cuatro (P = 1/4) mientras que en la segunda, de uno en tres (P = 1/3). Para trabajar de manera realmente aleatoria es necesario obtener la muestra con reemplazo. Esto significa que cada uni-

CUADRO 7-1. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIN HIPOTTICA DE DATOS NUMRICOS
Poblacin: Muestra (n = 2) a=4 b=3 a=4 c=3 a=4 d=2 b=3 c=3 b=3 d=2 c=3 d=2 Suma Media 18,00 3,00 2,50 2,50 3,00 3,00 3,00 a=4 b=3 Media 3,50 c=3 Muestra (n = 3) a=4 b=3 c=3 a=4 b=3 d=2 a=4 c=3 d=2 b=3 c=3 d=2 Suma Media 3,00 12,00 2,67 3,00 3,00 d=2 Media 3,33 =3

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.

CAPTULO 7 | MUESTREO

49 1

dad se debe seleccionar, registrar el dato en ella y luego incorporarla nuevamente a la poblacin para mantener constantes las posibilidades de seleccin. Este mecanismo, que hace posible que una misma unidad sea seleccionada ms de una vez, no es el que se aplica en las situaciones reales y obliga a algunas modificaciones en los procedimientos que se describirn ms adelante. No obstante, esas modificaciones tienen un peso significativo en los resultados solo cuando el tamao de la muestra supera el 10% del tamao de la poblacin, lo que rara vez sucede en las investigaciones reales. Por este motivo, se trabajar aqu asumiendo aleatoriedad aun cuando no sea real, por seleccionar una muestra que, en el ejemplo, tiene un tamao (2), que representa la mitad del tamao de la poblacin (4). Segn el ejemplo, puede verse en la primera columna del cuadro 7-1 la composicin de las seis posibles muestras que pueden obtenerse en las condiciones planteadas. Al calcularse en cada una de esas muestras el estadstico de tendencia central media aritmtica (recurdese que un estadstico se calcula en una muestra, mientras que un parmetro lo es en una poblacin), se obtienen los resultados que se muestran en la segunda de las columnas del cuadro. De esos resultados surge que en dos de ) las muestras el valor del estadstico (x coincide con el parmetro de la poblacin ( = 3); en otras dos al estadstico le correspondi un valor mayor que el del parmetro; y en otras dos un valor menor. Una primera conclusin que puede extraerse es que puede producirse una estimacin correcta, una sobreestimacin o una subestimacin, al estimar la media aritmtica de una poblacin a travs de la

media aritmtica de una muestra. Esto no depende de una forma de trabajar correcta, sino tan solo de la mayor o menor suerte que se tenga en la seleccin aleatoria de la muestra. La media aritmtica de las muestras tomada de una poblacin vara. Por otro lado, en la ltima fila del cuadro puede verse que la media aritmtica, el promedio, de las medias aritmticas de las muestras obtenidas es 3 (el valor de su suma, 18, dividido por la cantidad de muestras totales, 5), valor que corresponde al del parmetro de la poblacin ( = 3). Una segunda conclusin es que, debido a que el valor de la media aritmtica de la muestra tomada de una poblacin vara, aunque a veces se lo estima bien, y otras se sobreestima o se subestima el parmetro, en promedio se lo estima bien. Puede expresarse que, en promedio, la media aritmtica del conjunto de medias aritmticas de muestras de una poblacin es igual a la media aritmtica parmetro de la poblacin de la cual se tomaron las muestras. Vase ahora en las columnas tercera y cuarta del cuadro lo que sucede al tomar muestras de tamao tres (n = 3) de la misma poblacin hipottica. Tambin en este caso, en promedio, se estima bien, pero la magnitud de la sobreestimacin o de la subestimacin es menor que cuando las muestras son de menor tamao. En efecto, cuando n = 2 el error de estimacin fue de 0,50 en ms o en

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.

14

13

12

11

10

50

INTRODUCCIN A LA ESTADSTICA EN CIENCIAS DE LA SALUD

menos, mientras que cuando n = 3 fue de 0,33. Una tercera conclusin es que la magnitud del error que puede cometerse al estimar la media aritmtica de una poblacin a partir del correspondiente estadstico disminuye al aumentar el tamao de la muestra utilizada. Por ltimo, vanse en el cuadro 7-2 los resultados de repetir el procedimiento en otra poblacin de tamao 4, aunque con

integrantes: a = 5; b = 3; c = 3; d = 1. La media aritmtica () en este conjunto es tambin 3, aunque su dispersin es mayor. Esto puede visualizarse a partir del rango o recorrido que es 4 (5 1), mientras que es 2 (4 2) en la poblacin del primer ejemplo de este captulo. Las conclusiones ya extradas se aplican a esta nueva situacin, aunque, al comparar los resultados de las dos tablas, puede observarse que para un mismo tamao de

CUADRO 7-2. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIN HIPOTTICA DE DATOS NUMRICOS
Poblacin: Muestra (n = 2) a=5 b=3 a=5 b=3 Media 4,00 c=3 Muestra (n = 3) a=4 b=3 c=3 a=5 c=3 4,00 a=4 b=3 d=2 a=5 d=1 3,00 a=4 c=3 d=2 b=3 c=3 3,00 b=3 c=3 d=2 b=3 d=1 c=3 d=1 Suma Media 18,00 3,00 2,00 2,00 Suma Media 12,00 3,00 2,33 3,00 3,00 d=1 Media 3,67 =3

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.

CAPTULO 7 | MUESTREO

51 1

muestra la magnitud del error que puede cometerse en la estimacin es mayor en este caso. Una cuarta conclusin es, por lo tanto, que la magnitud del error que puede cometerse al estimar la media aritmtica de una poblacin a partir del correspondiente estadstico aumenta al aumentar la dispersin de la poblacin de la que se toma la muestra.

ca (recurdese lo analizado en el cap. 5) por lo que es til extraer la correspondiente raz cuadrada y as llegar al valor de lo que se denomina error estndar. En frmula: Error estndar = / n Es decir, el error estndar puede calcularse al dividir el valor de la desviacin estndar de la poblacin por la raz cuadrada del tamao de la muestra utilizada. Obsrvese que existen dos situaciones en las cuales la posibilidad de error es nula (error estndar igual a 0). Una de ellas se produce cuando en la poblacin original no existe dispersin, o sea, que todos sus datos son iguales. Al ser el numerador 0, el cociente tambin es 0, ya que este valor divido por cualquier otro arroja ese resultado. La segunda situacin se verifica cuando la muestra tomada es infinitamente grande, es decir, cuando se evaa a la totalidad de la poblacin; en este caso, el denominador es infinito y el resultado de dividir cualquier valor por infinito es 0. Como se comprender, se trata de dos situaciones inexistentes en la realidad de la investigacin. En los datos numricos es prcticamente imposible evitar alguna dispersin, porque no todos los individuos de una poblacin se comportan exactamente igual, o porque es casi imposible no cometer algn error en la recoleccin de datos. Por otro lado, las poblaciones de inters son de tamao demasiado grande como para que sea posible trabajar con todos sus integrantes. Debe hacerse una consideracin adicional. Cuando, como en los ejemplos con que se ha trabajado, las muestras se obtuvieron

Los resultados de la supuesta experiencia descrita en los ejemplos planteados lleva a expresar que: La magnitud del error posible al estimar la media aritmtica de una poblacin a partir de la media aritmtica de una muestra tomada aleatoriamente de ella aumenta al incrementar la dispersin de la poblacin y al disminuir el tamao de la muestra, y disminuye al reducir la dispersin de la poblacin y aumentar el tamao de la muestra. Expresado en trminos matemticos, puede decirse que la magnitud del error es directamente proporcional a la dispersin de la poblacin de origen de la muestra e inversamente proporcional al tamao de esta. As, al ser la variancia la medida democrtica de la dispersin, puede resumirse este enunciado mediante la siguiente frmula: Magnitud del error = 2 / n El resultado de la frmula est en una escala diferente de la de la media aritmti-

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.

14

13

12

11

10

ERROR ESTNDAR

52

INTRODUCCIN A LA ESTADSTICA EN CIENCIAS DE LA SALUD

sin reemplazo, la frmula para el clculo del error estndar debe modificarse al multiplicarla por un factor de correccin. Sin embargo, ese factor de correccin genera un valor de error estndar que puede considerarse que afecta los resultados de anlisis posteriores solo cuando el tamao de la muestra supera alrededor del 10% del volumen de la poblacin respectiva. Esta situacin es casi inexistente en las investigaciones en las ciencias de la salud, por lo que, en el trabajo habitual, no se tiene en cuenta y se aplican la tcnicas estadsticas como si las muestras hubieran sido obtenidas con reemplazo.

DISTRIBUCIN DE MEDIAS ARITMTICAS DE MUESTRAS


El error estndar representa una medida de la dispersin de la distribucin de los valores de las medias de muestras tomadas de una poblacin, de la misma manera que la desviacin estndar lo es de la dispersin de los datos originales. Para que este valor adquiera significado en su relacin con la medida de tendencia central la media aritmtica es necesario establecer, emprica o matemticamente, cul es la forma de distribucin de la variable: en el caso que nos ocupa, el valor de la media aritmtica de las distintas muestras tomadas de la poblacin. La distribucin de los valores de las medias aritmticas de las muestras tomadas en una poblacin es gaussiana, aun cuando la distribucin de los datos de la poblacin no tenga esa caracterstica. Esto permite aplicar a la distribucin de las medias de muestras los conceptos y

procedimientos basados en la ecuacin correspondiente a esa distribucin, analizados en el captulo anterior, con la salvedad de que en lugar del valor de la desviacin estndar debe tenerse en cuenta el del error estndar. En funcin de lo enunciado, puede decirse que, de todas las muestras tomadas aleatoriamente a partir de una poblacin, el 95% tiene valores de media aritmtica comprendidos entre poco menos de dos errores estndar (exactamente, 1,96) por debajo y por encima de la media aritmtica de la correspondiente poblacin. Por ejemplo, si de una poblacin con = 1.000 y = 40 se toman muestras con n = 25, puede esperarse que de modo aproximado el 95% de ellas tengan valores para su estadstico media aritmtica entre 984 y 1.016. Esto es porque el error estndar en esta situacin es 8 (40 dividido raz cuadrada de 25) y dos veces 8 es 16.

Se puede tambin decir que, al tomar una muestra al azar, es poco probable (P < 0,05) que su media aritmtica est alejada de la media de la poblacin ms de dos errores estndar.

Tnganse presente estos conceptos para encarar la tarea que se plantea en los captulos siguientes. Asimismo, mantngase presente que, desde la ecuacin matemtica, cualquier valor de media aritmtica de una muestra es posible, ya que la ecuacin gaussiana genera una lnea en forma de campana que cubre un rea que se extiende desde el valor de infinito negativo hasta el infinito positivo.

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.

CAPTULO 7 | MUESTREO

53 1

MUESTRAS CON DATOS NOMINALES


Al tomar muestras de poblaciones de datos nominales, la situacin es equivalente a la ya descrita para los datos numricos. Considrese una poblacin hipottica de 8 individuos de los cuales 4 (P = 0,5 o 50%) estn en la categora enfermos. Los resultados posibles al tomar muestras de tamao cuatro (n = 4) se muestran en el cuadro 7-3. Tal como en los casos anteriores, al estimar el parmetro con el valor del estadstico en ocasiones se acierta y en otras se sobreestima o subestima, aunque, en promedio, se estima bien. Tambin en este caso la magnitud del error posible en la estimacin es inversa-

P (1 P) / n Esto es la raz cuadrada del resultado del producto de la proporcin en una categora (0,5 en la categora enfermos en el ejemplo) por la que no est en la categora (1 P; 0,5 en el ejemplo) dividido por el tamao de la muestra (4 en el ejemplo).
5 14 13 250,0 50,0 12 0,0 11 10 9 8 7 6

CUADRO 7-3. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIN HIPOTTICA DE DATOS NOMINALES
Poblacin: Enfermos = 4 Muestra A 4 enfermos 0 sanos B 3 enfermos 1 sano C 2 enfermos 2 sanos D 1 enfermo 3 sanos E 0 enfermo 4 sanos Suma % promedio Sanos = 4 P = 0,5 Tasa = 50% % enfermos 100,0

75,0

50,0

25,0

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.

mente proporcional al tamao de la muestra: a mayor tamao de muestra menor error posible. La diferencia estriba en que la distribucin no es en este caso gaussiana, sino que puede ser descrita con otro tipo de ecuacin, conocida como binomial, y el valor del error estndar es la raz cuadrada del valor obtenido de:

54

INTRODUCCIN A LA ESTADSTICA EN CIENCIAS DE LA SALUD

Ntese que, tambin en este caso, el tamao de la muestra es el denominador para el clculo del error estndar. Por ello, al igual que con las muestras de datos numricos, la magnitud del error posible aumenta al disminuir el tamao de la muestra o disminuye con su aumento.

SNTESIS CONCEPTUAL
Cuando se toman muestras de un conjunto de datos numricos, la media aritmtica vara entre las muestras, aunque el dato estadstico del conjunto de todas las posibles es, en promedio, igual al parmetro de la poblacin de la que fueron obtenidas. La distribucin de las medias aritmticas de esas muestras toma una forma asimilable a la distribucin gaussiana, con una medida dispersin cuantificable mediante el error estndar. Los valores estadsticos de muestras de conjuntos de datos nominales varan con una distribucin descrita por la denominada distribucin binomial. Tanto en el caso de datos numricos como en el de datos nominales, el valor del error estndar es inversamente proporcional al tamao de las muestras.

en saliva tiene un valor de media aritmtica de 5,6 mg/100 mL, con una desviacin estndar de 0,9 mg/100 mL. Es poco probable o no (P < 0,05) que la media aritmtica de una muestra de tamao 100 tenga un valor de 5,3 mg/100 ml? Es poco probable, ya que este valor est alejado de la media de la poblacin, 0,30, ms de dos errores estndar. El error estndar en este caso es 0,09 (0,9 dividido raz cuadrada de 100), que multiplicado por 2 es 0,18. Y si la muestra hubiera tenido un tamao igual a 20? El valor obtenido no sera poco probable, ya que en este caso el error estndar sera de 0,20 (0,9 dividido raz cuadrada de 20), que multiplicado por 2 es 0,40, valor menor que 0,30.

7.2
En una poblacin de adultos jvenes la estatura media (media aritmtica) es 1,70 m y la desviacin estndar 0,24 m. Menor o mayor a qu valor debe ser la media aritmtica de una muestra de tamao 64 tomada de esa poblacin para poder considerarse que se est frente a una situacin poco probable (P < 0,05)? El error estndar de la distribucin de las medias de muestras de ese tamao tomadas de esa poblacin es 0,03 (0,24 dividido raz cuadrada de 64). Los valores 1,64 y 1,76 estn dos errores estndar alejados de la media. Por lo tanto, cuando la media de la muestra obtenida sea menor o mayor, respectivamente, que esos dos valores, se estar frente a una situacin poco probable.

EJEMPLOS 7.1
En una poblacin de adultos sin manifestaciones de presencia de clculos sobre sus superficies dentarias el contenido de calcio

Introduccin a la Estadstica en Ciencias de la Salud. Macchi. 2013. Editorial Mdica Panamericana.