Vous êtes sur la page 1sur 7

Tcnicas de Muestreo

Si la poblacin que deseamos muestrear tiene N elementos y la muestra escogida n


elementos, entonces se llama:

1. Fraccin de muestreo=n/N cociente entre el tamao muestral y el de la


poblacin.
2. Factor de elevacin =N/n inverso de la fraccin de muestreo, es la
cantidad de elementos de la poblacin representados por cada elemento de la
muestra.

Ejemplo:

Poblacin: N=10000 personas

Muestra: n=500 personas.

Fraccin de muestreo=n/N = 500/10000=0,05 se muestrea al 5% de la poblacin

Factor de elevacin =N/n= 10000/500= 20 cada persona en la muestra


representa a 20 de la
poblacin.

Parmetro poblacional: Es un valor que indica cierta caracterstica de la poblacin


(se podra calcular si se conocieran todos los valores de la poblacin).

Ejemplo: La media y la varianza poblacional. Proporcin.

Estimacin: Llamaremos estimacin a un valor calculado a partir de la muestra que


proporciona informacin acerca del valor de un parmetro.

Ejemplo: la media muestral es un estimador de la media poblacional.

Al tomar una muestra estamos ante el riesgo de que la misma no sea representativa
de la poblacin. Se dice en esos casos que la muestra est sesgada.

Un sesgo posible es el llamado sesgo de seleccin. Se produce cuando los individuos


de la poblacin no tienen la misma probabilidad de ser elegidos. Por ejemplo:
encuesta telefnica domiciliaria en horario de trabajo. Una persona que trabaja afuera
no tiene la misma probabilidad de ser elegida que la que no lo hace.

Otro sesgo que puede darse es el llamado sesgo de no-respuesta. Un ejemplo de


este tipo de sesgo es la negativa a responder determinadas preguntas o incluso la
encuesta completa.

Una forma de estar alertas y ver si estamos ante una muestra sesgada si se trata de
una encuesta, es la de incluir en el cuestionario preguntas sobre caractersticas
globales, como por ejemplo, edad, sexo, situacin laboral, nivel de instruccin, etc. De
esta forma, podremos contrastar estas caractersticas de los seleccionados con las de
la poblacin objetivo.

1
En este curso slo veremos cmo estimamos la media de una variable cuantitativa y
la proporcin para el caso de una variable cualitativa. Los estimadores que

utilizaremos sern entonces X y ^p para la media y la proporcin


respectivamente.

Para algunos clculos que vamos a realizar tambin es necesario conocer unos valores
llamados factores de correccin. Con ellos lo que se consigue es tener ms o menos
certeza (confianza se dice en trminos estadsticos) sobre la probabilidad de que la
estimacin est prxima al verdadero valor del parmetro. Estos valores son:

1- 0,99 0,95 0,90 0,80 0,60 0,50


z/2 2,576 1,960 1,645 1,282 0,842 0,674

Observemos que cuanta ms confianza queremos, es decir cuanto mayor es 1-, ms


grande es el valor del factor de correccin.

Estudiemos ahora diferentes tipos de muestreo, sus caractersticas, ventajas y


desventajas.

MUESTREO ALEATORIO SIMPLE

Este mtodo consiste en hacer una seleccin aleatoria de los elementos de la muestra
de entre los elementos de la poblacin, se puede realizar slo si se cuenta con un
listado de todos los elementos de la poblacin.

Este procedimiento nos asegura que todos los elementos de la poblacin tienen la
misma probabilidad de ser elegidos.

Existen dos casos:

1- Muestreo con reposicin: En este caso, la seleccin se hace de a uno en uno y


cada elemento seleccionado es devuelto, de manera que tiene la posibilidad de
ser nuevamente elegido, de esta manera la poblacin no cambia con el
muestreo.

2- Muestreo sin reposicin: En este caso, no se repone el elemento seleccionado


de manera que es imposible que un elemento sea seleccionado ms de una
vez. Cuando la poblacin es grande respecto de la muestra ambos
procedimientos son equivalentes.

Observacin: Se recomienda siempre el muestreo sin reposicin (en muchos casos


es costoso tomar una medicin de un elemento y no tendra mucho sentido medir dos
veces el mismo elemento), aunque haya que utilizar el factor de correccin.

Ejemplo 1: Un colegio tiene 320 alumnos en total, de nivel primario y secundario. Se


desea obtener una muestra aleatoria simple (sin reposicin) de 60 alumnos.

2
- Se hace una sola lista de todos los alumnos numerados del 1 al 320.
- Se eligen al azar 60 nmeros del 1 al 320.
- La muestra estar formada por los 60 alumnos a los que les correspondan los 60
nmeros obtenidos
- La fraccin de muestreo ser: n/N=60/320=0.1875
- El factor de elevacin es: N/n=320/60=5.33. Esto significa que cada elemento de
la muestra est representando a 5 elementos de la poblacin. En otras palabras,
hay 5 elementos de la poblacin que tienen un comportamiento similar a cada
elemento de la muestra)

Observacin: Si tengo N y conozco la fraccin de muestreo puedo calcular n.

Ejemplo 2: Un libro contiene ecuaciones y figuras. Se desea tomar una muestra


aleatoria simple de las pginas del libro con fraccin de muestreo 0.05. Utilice la
calculadora para seleccionar los nmeros aleatorios.

a) Estime el nmero total de ecuaciones del libro.

b) Estime el nmero total de figuras del libro.

N=340 f = 0.05 n= 340*0.05=17

Cmo selecciono 17 pginas al azar? Usando tablas de dgitos aleatorios o


calculadora o computadora.

Un dgito aleatorio es un nmero elegido al azar del intervalo (0, 1).

Una tabla de dgitos aleatorios la pueden encontrar en la Pgina 380 del texto. Para
usarla debemos agrupar los nmeros que aparecen en cada bloque segn la mayor
posicin decimal del tamao poblacional. Por ejemplo, si consideramos que tenemos
una poblacin de 10000 individuos, podemos asignar a cada uno de ellos los nmeros
del 0 al 9999, luego agrupamos los nmeros aleatorios de la tabla en bloques de 4
cifras. As el primer nmero aleatorio ser 0380, el segundo 7732, etc. Hacemos esto
tantas veces como sea el tamao muestral. Luego elegimos los individuos que tengan
cada uno de estos rtulos asignados.

Para usar la calculadora en general debemos encontrar la tecla con la funcin RAN
(proviene de random, aleatorio en ingls). Estos son nmeros se denominan pseudo-
aleatorios, ya que su valor est generado a partir de una semilla. Tiene la limitacin
de la cantidad de dgitos y la ventaja de su inmediatez.

En computadora, podemos utilizar Excel. En Datos, Anlisis, Anlisis de datos, elegir


Generacin de nmeros aleatorios.

Una vez que tenemos los individuos seleccionados es hora de hacer la estimacin.

Si ahora queremos asegurarnos que nuestra estimacin de la media o la proporcin se


encuentran entre dos valores predeterminados, digamos c con una probabilidad
tambin determinada, digamos 1-, entonces debemos realizar los siguientes clculos:

Para determinar el tamao muestral:

3
NA
n= 2 2
c
( )
( N 1 )
z 2
+A donde A= si estimamos una media

1
A= si estimamos

una proporcin.

Cmo obtenemos A? Por informacin previa o muestra piloto.

Ejemplo:

Se desea estimar la proporcin de hogares que cuentan con un determinado


electrodomstico. Los datos son y los requisitos:

N=50000 c= 0,01 1-=0,95 Hace dos aos el 40% de los hogares


tena el producto.

Esto nos dice que la poblacin bajo estudio es de 50000 hogares, que se quiere que la
estimacin de la proporcin sea tal que la verdadera proporcin se encuentre en el
intervalo - 0,01 y + 0,01 con probabilidad igual a 0,95 (o 95% de chance)

El clculo del tamao de la muestra es:

50000 x 0,4 (10,4)


n= =7784
0,01 2
( 500001 ) ( )
1,96
+ 0,4(10,4)

Se necesita encuestar 7784 hogares de los 50000 para tener una estimacin de la
proporcin que cumpla los requisitos.

MUESTREO SISTEMTICO

Es otro tipo de muestreo posible y se puede realizar si se cuenta con un listado de los
elementos. Entonces se divide el listado en (aproximadamente) k = [N/n] partes. El
muestreo sistemtico consiste en seleccionar aleatoriamente un elemento del primer
conjunto, llamemos n1 al lugar que ocupa en la lista, luego se seleccionan los
elementos que ocupen los lugares n1 + k, n1 + 2k, n1 + 3k hasta completar la lista.

Si el orden de los elementos de la lista no est relacionado con la variable a estudiar,


este criterio es equivalente al Muestreo aleatorio simple, y es ms sencillo.

En el ejemplo anterior:

- Se hace una lista de todos los alumnos numerados del 1 al 320.


- Se calcula k = [N/n]=[320/60]=[5.3]=5

4
- Se elije un nmero al azar entre 1 y 5, supongamos que sale 3, los siguientes
alumnos se obtendrn sumando 5 hasta completar los 60 alumnos.
- Los alumnos seleccionados en la muestra sern:
3, 8, 13, 18, 23,, 298.

MUESTREO ESTRATIFICADO

Se realiza cuando se cuenta con informacin adicional. Esta informacin la


proporciona una variable que divide a los elementos de la poblacin en clases o
estratos. stos son subconjuntos de la poblacin tales que dentro de cada estrato los
elementos son homogneos respecto de la variable de inters y entre estratos los
elementos son muy diferentes.

Obs: En este caso tengo dos variables en juego, la variable de inters y la variable de
estratificacin.

En el ejemplo anterior:

Seguimos pensando en un colegio que tiene 320 alumnos de los cuales quiero elegir
60. Una variable de estratificacin puede ser el nivel, entonces podemos pensar en
dos estratos:
Estrato 1= Nivel primario
Estrato2 = Nivel secundario.

O tambin podemos pensar en estos estratos:


Estrato 1= Nivel Primario y mujer
Estrato 2= Nivel Primario y varn
Estrato 3= Nivel Secundario y mujer
Estrato 2= Nivel Secundario y varn

El muestreo estratificado consiste hacer un muestreo aleatorio simple dentro de cada


estrato.

El tamao de cada muestra se puede elegir segn

- El tamao del estrato o


- De la variabilidad dentro de cada estrato (si es que se cuenta con esta
informacin desde el principio).

El muestreo estratificado es ms eficiente que el muestreo aleatorio simple en el


sentido que con la misma cantidad de datos se obtiene mayor precisin (menor
varianza de los estimadores).

El tamao muestral en cada estrato se puede tomar proporcional al tamao del


estrato, es decir: Si N = N 1+N2+ + Nk donde Ni es el tamao del estrato i-simo y k
es la cantidad de estratos, entonces se puede tomar n i = n.(Ni/N) donde ni es la
muestra del estrato i-simo.

5
En el ejemplo anterior:

Para dos estratos: Supongamos que el Nivel primario tiene N 1= 130 alumnos y el Nivel
secundario N2= 190, entonces los tamaos muestrales sern:

n1= 60*(140/320)=24.3 24

n2= 60*(180/320)=35.6 36

Para 4 estratos: Necesitamos la informacin de cuntas mujeres y cuntos varones


hay en cada nivel educativo. Supongamos que en el primario hay 60 mujeres y 70
varones, y en el secundario 90 mujeres y 100 varones. Los tamaos muestrales sern:

n1= 60*(60/320)=11.2 11

n2= 60*(70/320)=13.2 13

n3= 60*(90/320)=16.9 17

n2= 60*(100/320)=18.8 19

Tambin es recomendable tomar el tamao muestral proporcional a la varianza de la


variable de inters en el estrato, si es que se cuenta con esa informacin desde el
principio.

Al igual que con el muestreo aleatorio simple, es posible que queramos que la
estimacin del parmetro poblacional cumpla con algunos requerimientos. Hablamos
de que la estimacin sea tal que el parmetro desconocido est en un intervalo de
amplitud 2c con una probabilidad tambin de 1-. Para conseguirlo tenemos que
calcular:

Tamao muestral sobre toda la poblacin:


k

N 2i A i / v i Ni
i=1
n= k v i=
c
2 k donde es la cantidad de estratos, N y
N2
( )
z 2
+ N i A i
i=i

Ai
en cada estrato.

Tamao muestral de cada estrato:


ni=n v i

Los estimadores que utilizaremos son:


k
ni
Para la media: Y = wi y i donde w i=
i=1 n

6
k

Para la proporcin: ^p= wi ^p i


i=1

Observacin: Estamos diciendo el aporte de la media de cada estrato a la estimacin


de la media global es proporcional al tamao muestral del estrato, que a su vez es
proporcional al tamao del estrato.

Ejemplo: Consideremos una poblacin divida en dos estratos (varones-mujeres,


Boca_River, etc) Se desea estimar la media del ingreso. Considere c = 0,02 y 1-
=0,90.

IMPORTANTE: la variable de inters no es la misma que la estratificadora.

Los datos son:

Poblacin Muestra
Estratos Ni wi ni Y i

A 2500 0,053 92
B 45000 0,947 12
Total 47500 1

Importante: para poder obtener los tamaos muestrales segn el valor de c y de 1-

pedidos, necesitamos conocer los valores


A i , es decir necesitamos tener una idea

de cunto es la variabilidad de cada estrato. Para ello necesitamos informacin previa


o bien realizar una muestra piloto.

Ejercicio: Considere que se estima que la varianza en el estrato A es de 100 y en el


estrato B es 1 y calcule el tamao muestral total n y los tamaos muestrales ni de
cada estrato segn las frmulas correspondientes. Luego considere que se realiza el

muestreo que se obtuvieron los valores de Y i que se muestran en la tabla. Calcule

la media muestral global Y .

Vous aimerez peut-être aussi