Académique Documents
Professionnel Documents
Culture Documents
Vamos a ampliar en este captulo lo que ya vimos al principio de Estadstica Descriptiva, incluyendo ahora la definicin de algunas tcnicas de muestreo y de las nociones suficientes para ser capaces de decidir cul es la tcnica de muestreo ms adecuada a cada situacin. Imagina por ejemplo que tu clase ha sido seleccionada como la muestra de una poblacin. El estudio que se vaya a realizar podra ser de diferentes temas, como los siguientes: La opinin sobre la posibilidad de organizar movidas alternativas en tu ciudad, y sobre las propuestas de actividades a realizar en dicha movida. Un sondeo sobre la valoracin de los diferentes lideres polticos. La opinin sobre el destino de un posible viaje de fin de curso de los alumnos de tu nivel. Crees que tu clase sera una buena muestra para cualquiera de estos casos? La respuesta es que, por ejemplo, para el segundo caso, los alumnos de una clase no son la muestra adecuada. Para el primer caso, es razonable pensar que pueden aportar informacin interesante, aunque la muestra puede resultarpequea y podra faltarle informacin (chicos de otras edades, de otros barrios...), mientras que para el tercer caso, la muestra puede ser muy adecuada. Es por tanto muy importante la eleccin de una tcnica de muestreo que nos asegure que la muestra escogida es adecuada para el estudio que queremos realizar.
1. Error de sesgo o de seleccin: si alguno de los miembros de la poblacin tiene ms probabilidad que otros de ser seleccionados. Imagina que queremos conocer el grado de satisfaccin de los clientes de un gimnasio y para ello vamos a entrevistar a algunos de 10 a 12 de la maana. Esto quiere decir que las personas que vayan por la tarde no se vern representadas por lo que la muestra no representara a todos los clientes del gimnasio. Una forma de evitar este tipo de error es tomar la muestra de manera que todos los clientes tengan la misma probabilidad de ser seleccionados. 2. Error o sesgo por no respuesta: es posible que algunos elementos de la poblacin no quieran o no puedan responder a determinadas cuestiones. O tambin puede ocurrir, cuando tenemos cuestionarios de tipo personal, que algunos miembros de la poblacin no contesten sinceramente. Estos errores son, en general, dificiles de evitar, pero en el caso de la sinceridad, se suelen incorporar cuestiones (preguntas filtro) para detectar si se esta contestando sinceramente. Despus de lo que acabamos de ver, podemos decir que una muestra es sesgada cuando no es representativa de la poblacin.
Estas entrevistando? Y a la hora de obtener conclusiones sobre la poblacin a cuntos alumnos de la poblacin total representa cada uno de los de la muestra? Para calcular la proporcin de alumnos que estamos entrevistando, dividimos el tamao de la muestra entre el de la poblacin: 28/560 = 0,05, lo que quiere decir que estamos pasando la encuesta al 5% de la poblacin. Ahora vamos a calcular a cuantos individuos representa cada uno de los elementos de la muestra. Hacemos la divisin contraria, dividimos el nmero de individuos de la poblacin entre los de la muestra: 560/28 = 20, lo que querra decir que cada uno de los elementos de la muestra representa a 20 alumnos del CES. Los dos conceptos que acabamos de ver tienen la siguiente definicin formal: 1. Factor de elevacin: es el cociente entre el tamao de la poblacin y el tamao de la muestra, N/n. Representa el nmero de elementos que hay en la poblacin por cada elemento de la muestra. 2. Factor de muestreo: es el cociente entre el tamao de la muestra y el tamao de la poblacin n/N . Si se multiplica por 100, obtenemos el porcentaje de la poblacin que representa la muestra.
Cuando un elemento es seleccionado, y hemos medido las variables necesarias para el estudio y puede volver a ser seleccionado, se dice que hacemos un muestreo aleatorio con re emplazamiento o reposicin. Generalmente recibe el nombre de muestreo aleatorio simple. En caso de que el elemento no vuelva a formar parte de la poblacin de manera que no puede volver a ser seleccionado se dice que se ha obtenido la muestra mediante un muestreo aleatorio sin reposicin o re emplazamiento. En algunos libros, este mtodo recibe tambin el nombre de muestreo irrestrictamente aleatorio.
Para nuestro ejemplo al elegir la muestra entre los 560 alumnos del CES, si vamos a preguntar por el hecho de que posean internet en casa, no nos interesa preguntarle dos veces a la misma persona, luego una vez elegido un elemento de la muestra no queremos volverlo a seleccionar. Realizariamos pues un muestreo aleatorio sin reposicin o sin re emplazamiento. Aunque los dos mtodos son diferentes, cuando el tamao de la poblacin es infinito, o tan grande que puede considerarse infinito, ambos mtodos nos llevaran a las mismas conclusiones. Sin embargo, si la fraccin de muestreo n/N es mayor que 0,1 (muestreamos ms del 10% de la poblacin) la diferencia entre las conclusiones que se obtienen pueden ser importantes.
Al preguntar en nuestro ejemplo si los alumnos tienen o no internet en casa, nos interesa conocer tanto el nmero de alumnos que tiene internet como la proporcin que eso supone dentro del centro. Estos dos valores, igual que la media para otros casos (por ejemplo si preguntamos por la altura), son los parmetros ms calculados y que habitualmente queremos estimar. Para el caso del muestreo aleatorio tanto con reposicin como sin reposicin, estos estimadores vienen dados por las expresiones:
. La proporcin seria la media de una variable que toma valores cero o uno. En las anteriores expresiones: Xi es el valor de la variable que estamos estudiando. N es el tamao poblacional. n es el tamao muestra. Pi es una variable que toma los valores 0 o 1. La estimacin del error para estos estimadores seria: Total: Para el muestreo con reposicin:
Consideramos que tenemos la poblacin de tamao N dividida en k su poblaciones de tamaos N1,N2, . . . ,Nk. Dichas subpoblaciones son disjuntas y cumplen que N1 +N2 + +Nk = N. Cada una de las subpoblaciones se denomina estratos. Si deseamos obtener una muestra de tamao n de la poblacin inicial, seleccionamos de cada estrato una muestra aleatoria de tamao ni de manera que n1 + n2 + + nk = n. Qu ventajas e inconvenientes presenta el muestreo estratificado? Las vemos a continuacin. Ventajas: Podemos tener informacin con ms precisin dentro de las subpoblaciones sobre el carcter astica objeto del estudio. Podemos aumentar la precisin de los estimadores de las caractersticas de toda la poblacin
Inconvenientes: La eleccin del tamao de las muestras dentro de cada estrato para que el total sea n. La divisin en estratos en algunas poblaciones puede no ser sencilla.
En general, el muestreo estratificado proporciona mejores resultados que el muestreo aleatorio, mientras ms diferentes sean los estratos entre si y ms homogneos internamente. Podemos considerar 3 mtodos para distribuir el tamao de la muestra entre los estratos: 1. Proporcionalmente al tamao de cada estrato, es decir, si tomamos el estrato j-eximo de tamao Ni , entonces una muestra de dicho estrato ser a de tamao n (Ni/N), siendo N el total de la poblacin y n el tamao de la muestra. 2. Proporcionalmente a la variabilidad de la caracterstica que estamos considerando en cada estrato. Por ejemplo, si conocemos que la varianza en la altura de los alumnos es de 15 cm y en las alumnas es de 5 cm, la proporcin de los alumnos es 3 a 1 y la muestra deber guardar esa proporcin. 3. Se asigna el mismo tamao a cada estrato. Como consecuencia se favorece a los estratos ms pequeos y se perjudica a los grandes en cuanto a precisin. Para el caso del muestreo estratificado, los principales estimadores vendran dados por las siguientes expresiones:
donde Xh es la media muestra de la variable X en el estrato h. Nh es el tamao del estrato h. N es el tamao poblacional. nh es el tamao muestra en el estrato h. n es el tamao muestra. bPh es la proporcin muestra de la variable en el estrato h. y la estimacin del error que cometemos al estimar los parmetros poblacionales viene dado por: Total:
, Con
Media:
Proporcion:
donde Xi es el total de la variable X en el conglomerado i. Xi es la media muestra de la variable X en el conglomerado i. N es el nmero de conglomerados de la poblacin. M es el tamao poblacional. n es el nmero de conglomerados de la muestra. Mi es el tamao del conglomerado i. Ai es el total de una variable A, que toma el valor 0 o 1 en el conglomerado i, y la estimacin de los errores que cometemos al hacer estas estimaciones son los siguientes:
Seleccionar una muestra sistemtica equivale a seleccionar al azar un nico conglomerado. Para ello es necesario que cada uno de los conglomerados definidos tenga una composicin similar a la poblacin. Tambin puede considerarse como un caso particular de muestreo estratificado con un nmero de estratos igual a n, cada uno de ellos con v elementos de manera que en cada estrato se elige un nico elemento. En el muestreo estratificado el elemento seleccionado en cada estrato es aleatorio, mientras que en el sistemtico se elige de forma aleatoria al primer elemento quedando los restantes determinados por el factor v. Los estimadores para este tipo de muestreo son:
unidades (bloques de casas) llamadas secundarias, que se dividen en las casas concretas. La muestra se tomara: 1. Seleccionando una muestra estratificada, de cada estrato (barrios), se toma al menos uno. 2. Se eligen al azar varios bloques de casas dentro de cada barrio seleccionado. 3. Se toman aleatoriamente una o varias casas dentro de los bloques seleccionados.