1. Explicar la razn por qu, con frecuencia, una muestra es la nica forma viable para conocer algo sobre una poblacin. 2. Describir mtodos para seleccionar una muestra. 3. Definir un error de muestreo. 4. Definir y construir una distribucin muestral de la media de la muestra. 5. Comprender y explicar el teorema central del lmite. 6. Definir el error estndar de la media. 7. Aplicar el teorema central del lmite para calcular probabilidades de seleccionar posibles medias mustrales de una poblacin especfica.
Muestreo Objetivo: Explicar la razn por qu, con frecuencia, una muestra es la nica forma viable para conocer algo sobre una poblacin. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una poblacin), se selecciona una muestra, entendiendo por tal una parte representativa de la poblacin. El muestreo es por lo tanto una herramienta de la investigacin cientfica, cuya funcin bsica es determinar que parte de una poblacin debe examinarse, con la finalidad de hacer inferencias sobre dicha poblacin. La muestra debe lograr una representacin adecuada de la poblacin, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha poblacin que son importantes para la investigacin. Para que una muestra sea representativa, y por lo tanto til, debe de reflejar las similitudes y diferencias encontradas en la poblacin, es decir ejemplificar las caractersticas de sta.
Los errores ms comunes que se pueden cometer son: 1.- Hacer conclusiones muy generales a partir de la observacin de slo una parte de la Poblacin, se denomina error de muestreo. 2.- Hacer conclusiones hacia una Poblacin mucho ms grandes de la que originalmente se tom la muestra. Error de Inferencia. En la estadstica se usa la palabra poblacin para referirse no slo a personas si no a todos los elementos que han sido escogidos para su estudio y el trmino muestra se usa para describir una porcin escogida de la poblacin.
TIPOS DE MUESTREO Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y mtodos de muestreo no probabilsticos. I. Muestreo probabilstico Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser seleccionadas. Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de muestreo probabilsticos encontramos los siguientes
tipos: Describir mtodos para seleccionar una muestra.
1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente: a).- se asigna un nmero a cada individuo de la poblacin y b).- a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande. 2.- Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k. El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. 3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades,...).
4.- Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo por reas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos.
Nmeros Aleatorios con excel La funcin ALEATORIO (RAND en la versin en ingls) de Excel genera nmeros aleatorios. Esta funcin no tiene argumentos y es recalculada nuevamente cada vez que se produce un cambio en la hoja, excepto que el modo de clculo sea "manual". Los nmeros que produce ALEATORIO (RAND) van de del 0 al 1. En esta hoja usamos la frmula =ALEATORIO() en el rango A2:A11
Si queremos producir una serie de nmeros aleatorios enteros, debemos combinar la funcin ALEATORIO con la funcin REDONDEAR (ROUND), o con alguna otra funcin de este tipo como REDONDEAR.MAS o REDONDEAR.MENOS. En esta hoja, usamos la frmula combinada =REDONDEAR(ALEATORIO()*100,0) para producir nmeros aleatorios entre 0 y 100
Si queremos producir nmeros aleatorios que se encuentren en un rango entre dos nmeros, digamos entre 12 y 88, podemos usar la frmula Con esta tcnica podemos generar, por ejemplo, nmeros aleatorios para la lotera.
Problemas del Libro Pagina 272 15 ed. Pagina 267 13 ed.
1.- La siguiente lista incluye las tiendas de Marcos Pizza en el condado de Lucas. Tambin se indica si la tienda es propiedad de alguna corporacin (C) o del administrador (A). Se seleccionar e inspeccionar una muestra de cuatro establecimientos en relacin con la conveniencia para el cliente, la seguridad, la higiene y otras caractersticas.
a) Los nmeros aleatorios seleccionados son 08, 18, 11, 02, 41 y 54. Qu tiendas se eligieron?
b) Utilice la tabla de nmeros aleatorios para seleccionar su propia muestra de establecimientos.
c) Una muestra consta de cada sptimo establecimiento. El nmero 03 es el punto de partida. Qu establecimientos se incluirn en la muestra?
d) Suponga que una muestra consta de tres establecimientos, de los cuales dos son propiedad corporativa y uno del administrador. Seleccione una muestra adecuada. Solucin
a. 303 Louisiana, 5155 S. Main, 3501 Monroe, 2652 W. Central
b. La Respuesta variara para cada alumno (usar Excel)
c. 630 Dixie Hwy, 835 S. McCord Rd., 4624 Woodville Rd.
d. Respuesta variara segn cada alumno
2. La siguiente lista incluye hospitales localizados en las regiones de Cincinnati (Ohio) y la regin norte de Kentucky. Tambin indica si se trata de un hospital general mdico o quirrgico (M/Q), o de especialidades (E). Interesa calcular el promedio de enfermeras que trabaja mediotiempo en los hospitales del rea.
a) Se va a seleccionar de forma aleatoria una muestra de cinco hospitales. Los nmeros aleatorios son: 09, 16, 00, 49, 54, 12 y 04. Qu hospitales se incluyen en la muestra?
b) Utilice una tabla de nmeros aleatorios para formar su propia muestra de cinco hospitales.
c) Una muestra incluir cada quinto establecimiento. Se selecciona 02 como punto de partida. Qu hospitales se incluirn en la muestra?
d) Una muestra consta de cuatro hospitales mdicos o quirrgicos y un hospital de especialidades. Seleccione una muestra adecuada.
Solucion
a. Childrens Hospital Medical Center, St. Francis-St. George Hospital, Bethesda North, Good Samaritan Hospital, Mercy Hospital-Hamilton
b. La Respuesta depende de cada alumno (con excel)
c. Jewish Hospital-Kenwood, Mercy Hospital-Anderson, Good Samaritan Hospital, St. Elizabeth Medical Center-North unit, Emerson Behavioral Service, Shriners Burns Institute
d. Depende de cada alumno.
Error Muestral Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media poblacional , entonces la media muestral, como medida, conlleva algn error. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una poblacin con media = 15 : si la media de la muestra es x = 12, entonces a la diferencia observada se le denomina el error muestral. Una media muestral x puede pensarse como la suma de dos cantidades, la media poblacional y el error muestral; si e denota el error muestral, entonces:
Ejemplo Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y 6, para simular una poblacin "grande" de manera que el muestreo pueda realizarse un gran nmero de veces, supondremos que ste se hace con reemplazo, es decir, el nmero elegido se reemplaza antes de seleccionar el siguiente, adems, se seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccion primero 4 y despus 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamao 2 que es posible seleccionar con reemplazo y tambin contiene las medios mustrales y los correspondientes errores mustrales. La media poblacional es igual a = (2+4+6)/3 = 4. Ver la tabla en la siguiente pgina. La media de la coleccin de medias mustrales es 4, la media de la poblacin de la que se extraen las muestras.
Si
denota la media de todas las medias mustrales entonces tenemos:
x = (3+4+3+4+5+5+2+4+6)/9 = 4 La suma de los errores mustrales es cero. e 1 + e 2 + e 3 + . . . + e 9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0 Muestras ordenadas X= media Error muestral e = x - (2,2) 2 2 4 = -2 (2,4) 3 3 4 = -1 (2,6) 4 4 4 = 0 (4,2) 3 3 4 = -1 (4,4) 4 4 4 = 0 (4,6) 5 5 4 = 1 (6,2) 4 4 4 = 0 (6,4) 5 5 4 = 1 (6,6) 6 6 4 = 2
En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de todos los errores mustrales es cero.
Ejemplos: captulo 8 pagina 278 15 ed. Prob. # 5. Una poblacin consta de los siguientes cuatro valores: 12, 12, 14 y 16.
a) Enumere todas las muestras de tamao 2 y calcule la media de cada muestra.
b) Calcule la media de la distribucin muestral de la media y la media de la poblacin. Compare los dos valores.
c) Compare la dispersin en la poblacin con la de las medias de las muestras.
b. (12 13 14 13 14 15) / 6 13.5 X =(12 + 12 + 14 + 16)/4 = 13.5
c. hay ms dispersin con los datos de la poblacin comparadas con las medias la mustrales varan de 12 a 15 mientras que la poblacin varia de 12 a 16.
# 6. Una poblacin consta de los siguientes cinco valores: 2, 2, 4, 4 y 8.
a) Enumere todas las muestras de tamao 2 y calcule la media de cada muestra.
b) Calcule la media de la distribucin muestral de las medias y la media de la poblacin. Compare los dos valores. c) Compare la dispersin en la poblacin con la de las medias de las muestras.
c. son iguales. La dispersin de las poblacin es ms grande que la de la media de la muestra. La poblacin vara de 2 a 8, mientras que la media de la muestral vara de 2 a 6.