Vous êtes sur la page 1sur 15

TEMA 4.

Técnicas de muestreo

Nota para el profesor: se sugiere que los temas contengan: (Contenido, objetos y materiales
multimedia, actividades y por último, algún examen o quiz)

Introducción al tema

CONTENIDO:

El principal objetivo de la mayoría de los estudios, análisis o investigaciones, es hacer generalizaciones acertadas
con base en muestras de poblaciones de las que se derivan tales muestras. Obsérvese la palabra “acertadas”
porque no es fácil responder cuándo y en qué condiciones las muestras permiten tales generalizaciones. Por
ejemplo, si queremos calcular la cantidad de dinero promedio que una persona gasta en unas vacaciones,
¿tomaríamos como una muestra las cantidades que gastan los pasajeros de primera clase de un crucero de cuatro
días; o trataríamos de estimar o pronosticar el precio al mayoreo de todos los productos agrícolas únicamente con
base en el precio de los espárragos frescos? Es obvio que no, pero saber a qué vacacionistas y qué productos
agrícolas debemos incluir en las muestras no es algo intuitivo ni evidente.

No usa Usa Fecha de entrega:

Nota para el profesor: llenar el recuadro con la Introducción al tema.

4.1 Tipos de muestreo

CONTENIDO:

Población:
Conjunto completo de sujetos, objetos o datos que comparten una característica. En un
experimento, la población es el grupo más grande de individuos del cual se pueden tomar los
sujetos que participarán en dicho estudio.

Muestra:
Subconjunto extraído de la población y que idealmente debe ser representativa de la población
a la que representa.

1
Poblaciones finitas e infinitas:
Una población es finita si consta de un número finito o fijo de elementos, medidas u
observaciones. Como ejemplos, son los gastos realizados por un turista en un destino. A
diferencia de las poblaciones finitas, una población infinita, al menos hipotéticamente,
contienen una infinidad de elementos. Este es el caso, por ejemplo, cuando observamos un
valor de una variable aleatoria continua y hay una infinidad de resultados distintos.

Existen dos métodos para seleccionar muestras de poblaciones:


• El muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como
recurso en el proceso de selección).
• Cuando este último cumple con la condición de que todos los elementos de la población tienen
alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada
sujeto de la población es conocida de antemano, recibe el nombre de muestreo probabilístico.
• El muestreo determinístico define el tamaño y selección de la muestra bajo aspectos subjetivos
(criterio personal del investigador, conveniencia, entre otros); en este tipo de muestreo los
resultados no pueden generalizarse a la población objeto de estudio, son válidos
exclusivamente para el conjunto de elementos en muestra. Una muestra seleccionada por
muestreo de juicio puede basarse en la experiencia de alguien con la población. Algunas veces
una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una
muestra aleatoria más adelante.

Muestreo probabilístico:

Las técnicas de muestreo probabilístico son aquellas en las que se determina al azar los individuos que
constituirán la muestra.
Estas técnicas nos sirven cuando se desean generalizar los resultados que se obtienen a partir de la
muestra hacia toda la población.
Lo anterior se dice dado que se supone que el proceso aleatorio permitirá la obtención de una muestra
representativa de la población.
Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la
probabilidad de extracción de cualquiera de las muestras posibles.
Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar
por él.
En este caso se habla de muestras probabilísticas, pues no es en rigor correcto hablar de muestras

2
representativas dado que, al no conocer las características de la población, no es posible tener certeza
de que tal característica se haya conseguido.

Los muestreos probabilísticos pueden ser con o sin reemplazo.


Con reemplazo:
Son aquellos en los que una vez que ha sido seleccionado un individuo (y estudiado) se le toma en
cuenta nuevamente al elegir el siguiente individuo a ser estudiado.
En este caso cada una de las observaciones permanece independiente de las demás, pero con
poblaciones pequeñas (un grupo de escuela de 30 alumnos, por ejemplo) tal procedimiento debe ser
considerado ante la posibilidad de repetir observaciones.
En el caso de poblaciones grandes no importa tal proceder, pues no afecta sustancialmente una
repetición a las frecuencias relativas.

Sin reemplazo:
Son los que una vez que se ha tomado en cuenta un individuo para formar parte de la muestra, no se le
vuelve a tomar en cuenta nuevamente.
En este caso, y hablando específicamente para el caso de poblaciones pequeñas, las observaciones son
dependientes entre sí, pues al no tomar en cuenta nuevamente el individuo se altera la probabilidad
para la selección de otro individuo de la población.
Para el caso de las poblaciones grandes (por ejemplo la población de un país) dicha probabilidad para la
selección de un individuo se mantiene prácticamente igual, por lo que se puede decir que existe
independencia en las observaciones.

Tipos de muestreo probabilístico:

Muestreo aleatorio simple


Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n
elementos que contiene la muestra.

Muestreo aleatorio sistemático


Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta
completar la muestra.

Ejemplo:
Si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25
elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A
continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4,
y a partir de él obtenemos los restantes elementos de la muestra.
2, 6, 10, 14, ... , 98

Muestreo aleatorio estratificado

3
Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de
cada estrato proporcional al número de componentes de cada estrato. Dentro de cada estrato se suele
usar la técnica de muestreo sistemático, una de las técnicas de selección más usadas en la práctica.
Adicionalmente, se debe mencionar que en el muestreo estratificado, con frecuencia los resultados se
requieren para ciertos estratos de la población y las cotas de error deseados se establecen para cada
uno de ellos; en este caso, se debe calcular por separado el tamaño en cada grupo y el tamaño de
muestra final será la suma de las establecidas para cada estrato.

Ejemplo:
En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay
200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.
Se estiman las proporciones y se multiplica por el número de la muestra:
(200/600)*20 = 6.66 aproximado a 7
(150/600)*20 = 5
(150/600)*20 = 5
(100/600)*20 = 3.33 aproximado a 3.

Por lo tanto se tomaran 7 trabajadores de la sección A, 5 de la B, 5 de la C y 3 de la sección D, para


tener un total de una muestra de 20 elementos.

La distribución proporcional implica que los tamaños de las muestras de estratos diferentes son
proporcionales a los tamaños de los estratos. En general, si dividimos una población de tamaño N en k
estratos de tamaño y tomamos una muestra de tamaño n1 del primer estrato, una muestra de tamaño
n2 del segundo estrato,…, y una muestra de tamaño nk del k estrato, decimos que la población es
proporcional si estas muestras cumplen con la proporción que cada estrato representa de la población
N.
Tamaños de muestra para la distribución proporcional:
Ni
ni  .n para i= 1,2, …, y k
N
Donde n= n1+n2+…n es el tamaño total de la muestra. Cuando es necesario, usamos los números
enteros más próximos a los valores obtenidos por medio de esta fórmula.

Ejemplo:
Se debe tomar una muestra estratificada de tamaño n= 60 de una muestra de tamaño N=4000, que
consta de tres estratos de tamaño N1=2000, N2=1200 y N3=800.
¿Si la distribución debe ser proporcional, cuán grande debe ser la muestra tomada de cada estrato?

4
Solución:
Sustituyendo en la formula obtenemos:
2000 1200 800
n1  .60  30 n2  .60  18 n3  .60  12
4000 4000 4000

Muestreo por conglomerados


En este tipo de muestreo, se divide a la población total en un número determinado de subdivisiones
relativamente pequeñas y se seleccionan al azar algunas de estas subdivisiones o conglomerados para
incluirlos en la muestra general. Si los conglomerados son subdivisiones geográficas, como en el
ejemplo anterior, este muestreo también se le puede denominar muestreo por áreas.

Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la
muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas.
El primer método funciona mejor cuanto más homogénea es la población respecto del estrato,
aunque más diferentes son éstos entre sí.
En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad,
aunque deben ser muy parecidos entre sí.

Observaciones:

4.1 Actividad

CONTENIDO:

En cada uno de los siguientes casos define qué tipo de muestreo sería el adecuado a utilizar.

1) Un periódico obtiene una muestra de la opinión (a favor o en contra) sobre un tema de actualidad de
3000 internautas que quisieron responder a una encuesta publicada en su página web.

5
2) Se dispone de un directorio o lista de los 2000 bares y restaurantes de una gran ciudad, se elige uno
al azar y a partir de este primer seleccionado y contando de 25 en 25 se ha ido seleccionando una
muestra de 80 bares y restaurantes.
3) Para investigar el impacto de la crisis en las empresas valencianas, tenemos una lista numerada con
los nombres de las 169.000 empresas de la provincia de Valencia. El ordenador elige de forma aleatoria
una muestra de 100 de esas empresas.
4) Para seleccionar una muestra 100 de hogares que residen en municipios de menos de 1000
habitantes en la provincia de Valencia, se eligen al azar 10 municipos con menos de 1000 habitantes de
la provincia de Valencia y en cada municipio seleccionado se selecciona una muestra aleatoria de 10
hogares.
5) En una encuesta durante las elecciones, se elige al azar 2 mesas electorales y se analizan todos los
votos emitidos de las mesas seleccionadas.
6) En la Encuesta Nacional de Ocupación y Empleo se entrevistan durante 4 trimestres seguidos a un
individuo para después ser sustituido en el quinto trimestre.
7) Para analizar los hábitos de lectura de los estudiantes de la Universidad Anáhuac, un equipo de
sociólogos dispone de una muestra de estudiantes seleccionados aleatoriamente en cada uno de sus 3
campus (Burjassot, Blasco Ibáñez y Tarongers) de forma que, en cada campus el número de estudiantes
seleccionados al azar para la muestra es proporcional al total de alumnos matriculados en dicho
campus.

Tipo de actividad: Individual Grupal


Comunicación (blog, foro, wiki,
Actividad o
Herramienta de Bb: diario, chat, aula virtual, grupos de
SafeAssigment
trabajo)

¿Qué debo hacer? Lee los conceptos de los diferentes tipos de muestreo y asigna uno a cada situación
que se presenta.

Recomendaciones:

¿Cómo lo entrego? En una hoja solo menciona los tipos de muestreo.

¿Cuándo lo entrego?

Archivo adjunto (opcional) Nombre de archivo:

Nota para el profesor: llenar el recuadro por cada actividad planeada para el tema. Es importante
cuestionarse sobre la función pedagógica de cada herramienta, sus lineamientos, retroalimentación y
calificación

Observaciones:

6
4.2 Parámetros y estimadores

CONTENIDO:

Si a partir de la población se realizan mediciones entonces se obtienen parámetros poblacionales.

En todos nuestros estudios vamos a limitarnos a una muestra del universo.

Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra podemos
calcular un estadístico (media, desviación típica, proporción, ...) que variará de una a otra.

Así obtenemos una distribución del estadístico que se llama distribución de probabilidad muestral.

En una población cuya distribución es conocida pero desconocemos algún parámetro, podemos estimar
dicho parámetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona
información sobre el valor del parámetro. Estadístico: Son los datos o medidas que se obtienen sobre
una muestra y por lo tanto un estimador de los parámetros.

Parámetro: Se llama parámetros poblacionales a cantidades que se obtienen a partir de las


observaciones de la variable y sus probabilidades y que determinan perfectamente la distribución de
esta, así como las características de la población, por ejemplo: La media, μ, la varianza σ

Ejemplo:
Por ejemplo la media muestral es un estimador de la media poblacional, la proporción observada en la
muestra es un estimador de la proporción en la población.

Una estimación es puntual cuando se obtiene un sólo valor para el parámetro.


Los estimadores puntuales más probables en este caso son los estadísticos obtenidos en la
muestra, aunque es necesario cuantificar el riesgo que se asume al considerarlos. Las dos
medidas fundamentales de esta distribución son la media que indica el valor promedio del
estimador y la desviación estándar, también denominada error típico de estimación, que indica
la desviación promedio que podemos esperar entre el estimador y el valor del parámetro.
Una estimación por intervalos es más útil.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al
parámetro que se está estimando.

7
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero
valor del parámetro.
Se indica por 1- y habitualmente se da en porcentaje (1-)100%.
Hablamos de nivel de confianza y no de probabilidad ya que una vez extraída la muestra, el
intervalo de confianza contendrá al verdadero valor del parámetro o no, lo que sabemos es que
si repitiésemos el proceso con muchas muestras podríamos afirmar que el (1-) porciento de
los intervalos así construidos contendría al verdadero valor del parámetro.

Cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto
de estudio y sólo tenemos que estimar los parámetros que la determinan, estamos en un problema de
inferencia estadística paramétrica; por el contrario, cuando no se conoce la forma funcional de la
distribución que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia
estadística no paramétrica. El curso se limita a problemas de inferencia estadística paramétrica, donde
la variable aleatoria objeto de estudio sigue una distribución normal, y sólo se estimarán los
parámetros que la determinan, la media y la desviación típica.

Observaciones:

4.3 Estimación de la muestra

CONTENIDO:
Para presentar la idea de cómo se toma una muestra de un población finita, primero se identifican
cuántas muestras diferentes de tamaño n podemos tomar de una población finita de tamaño N.
Refiriéndonos a la regla para el número de combinaciones de n objetos tomando

æ N ö
ç ÷
è n ø

Con base en el resultado de æç N ö÷ muestras distintas de tamaño de n de una población finita de


è n ø
tamaño de N, presentaremos la siguiente definición de una muestra aleatoria de una población finita:

8
Una muestra de tamaño de n de una población finita de tamaño de N es una variable aleatoria si se
æ ö
selecciona de manera tal que cada una de las ç N ÷ muestras posibles tiene la misma probabilidad, de
è n ø
1 ser seleccionada.
 
N
 
n

Ejemplo 1

¿Cuántas muestras distintas de n podemos tomar de una población finita de tamaño N, cuando

a) n= 2 y N=12;
b) n=3 y N=100?

Solución

12  12 11
(a) Hay     66 muestras distintas.
2 2!
100  100  99  98
(b) Hay     161,700 muestras distintas.
 3  3!

Ejemplo 2:

Si la población consiste en los N=5 elementos a,b,c,d y e (que podrían ser los ingresos anuales de cinco
æ ö
turistas, los pesos de cinco viajes o los precios de cinco artículos), hay ç 5 ÷ = 10 muestras posibles
è 3 ø
de tamaño n=3. Estas constan de los elementos abc, abd, abe, acd, ace, ade, bcd, bce, bde y cde. Si
1
seleccionamos estas muestras de tal forma que cada muestra tenga una probabilidad de de ser
10
seleccionada, decimos que ésta es una muestra aleatoria.

Tamaño de la muestra

Una muestra es la colección de elementos extraídos de un universo, y que contienen las características
más relevantes de este.

Si se tienen un universo homogéneo (o universo delimitado homogéneo) se empleara únicamente una

9
muestra para realizar el proceso; en cambio, si el universo es heterogéneo (o universo delimitado
heterogéneo) se empleara un numero de muestras que mínimo deben ser 5 y máximo 20 (5≤ n, ≤20).

En cualquiera de los casos que se presente, y por considerarse adecuada para su uso en la
administración turística, se empleara la siguiente formula probabilística de aproximación a la
distribución normal para determinar el tamaño adecuado de la(s) muestra(s):

Para universo finito:

z 2 pq
n E2
1  z 2 pq 
1   2  1
N E 

Para universo infinito:

Considerando que el límite de 1/N, cuando N tiende a infinito es cero.

z 2 pq
n
E2

Donde:

z= valor estándar de normalización correspondiente a la confiabilidad o confianza, £, que se


tenga de la información a recopilar mediante del proceso de muestreo y de la muestra misma.

p= parte proporcional del universo o población que cumple con la característica principal, base,
de la investigación por muestreo.

q= parte proporcional del universo o población que no cumple con la característica principal,
base, de la investigación por muestreo.

E= máximo error proporcional absoluto permitido a los resultados del muestreo, respecto a los
que arrojaría el análisis de todo el universo (o universo delimitado).

10
En este tipo de muestreo, y contrario a la creencia de que el tamaño de muestra debe guardar
cierta proporción con el tamaño de la población, los aspectos que se involucran en el cálculo
están relacionados con la característica a estudiar, el nivel de precisión y confianza que se
desea lograr, el esquema de muestreo que se sigue para obtener la información, así como el
dominio de estudio o área a la que se desea brindar la información.

 Cuando una característica se presenta con frecuencia en la población, el tamaño


de muestra es menor que el requerido para una característica extraña o poco común;
pues en éste último caso, se necesita entrevistar a una gran parte de la población para
obtener algunos casos que presenten la característica de interés.
 La variabilidad de la característica a estudiar también se involucra, pues se requiere
un tamaño de muestra mayor para indicadores que toman un número infinito de
valores como ingreso por trabajo (que va desde 0 por trabajador familiar sin pago,
hasta lo que gana el director de alguna compañía) a lo que se requiere para
indicadores que toman valores más acotados como estatura al nacer.
 El nivel de precisión está relacionado tanto con el error permitido (la distancia
entre la estimación y el valor “real”) como con la confianza con que se va a ofrecer
este resultado; por ejemplo, si se desea obtener resultados con 95% de confianza y un
error máximo de 8%, significa que de 100 muestras sólo 5 tendrían un error mayor al 8
por ciento.
 En el caso de las distintas subdivisiones territoriales (o dominios de estudio) indicadas
por el desglose geográfico, se debe hacer un cálculo por separado para cada una de
ellas; el tamaño de muestra final será la suma de los tamaños de muestra de
cada subdivisión.

Ejemplo 1:

El gerente de un restaurante desea conocer el ingreso promedio por comanda emitida a la hora de la
comida. Cuenta con 850 comandas anteriores. Desea conocerlo a partir del análisis de una muestra.

De qué tamaño debe ser la muestra de comandas si desea confiabilidad del 90% y un máximo error
proporcional absoluto del 5%

Solución:

En esta situación se tiene que £= 90% =0.9 y E= 5%=0.05.

Como no se indica alguna particularidad en el contenido de las comandas (por ejemplo con aperitivo, o
con postre, o con otros elementos adicionales) se fijan los valores de p y q en 50% cada uno (p = q =
50% = 0.5), lo que traerá como consecuencia obtener el máximo tamaño de muestra para este
ejercicio.

11
Así, si £=90%, por áreas bajo la curva normal (Anexo), se sabe que z= 1.645 (el valor de £ dividido entre
dos se encuentra en el cuerpo de la tabla entre 1.64 y 1.65 de z, si se toma la media da 1.645)

Como N= 850 y es menor a 1000, se empleara la formula para universo finitos.

Al sustituir se tiene:

z 2 pq (1.645) 2 (0.5)(0.5) 270.6025 270.6025


 
E 2 (0.05) 2 1.317179 1.317179
n   210
1  z 2 pq  1  (1.645) 2 (0.5)(0.5) 
1   2  1 1  2
 1
N E  850  ( 0.05 ) 

Por lo que, si redondea a la decena inmediata superior para facilitar el muestreo, deberá seleccionar
210 comandas al azar.

Ejemplo 2:

El administrador de un hotel desea conocer las características típicas del turista que visita el destino
donde se encuentra ubicado el hotel. De qué tamaño debe ser la muestra si el 10% de los turistas se
hospedan en el hotel, y desea una confiabilidad del 95% y un máximo error del 10%, al aplicar el
cuestionario.

Solución:

Al identificar los elementos se tiene:

N= tamaño del universo infinito (ya que se proporciona el tamaño de este)

£= 95%, por áreas bajo la curva normal z= 1.96

p= 10% de turistas que se hospedan en el hotel

q= 90% de turistas que no se hospedan en el hotel

E= 10% de máximo error proporcional absoluto permitido.

Con la fórmula para el tamaño muestra adecuado para universo infinito se tiene:

z 2 pq (1.96) 2 (0.1)( 0.9)


n 2   34.6
E (0.1) 2

12
Se aplicaran 40 cuestionarios (se redondeó ala decena inmediata superior para facilitar el análisis y
reducir el error proporcional.)

Es común que en encuestas de propósitos múltiples se desee brindar información de distintos


indicadores, de esta manera es necesario calcular un tamaño de muestra para cada uno y elegir el
tamaño de muestra mayor, ya que éste cubrirá las especificaciones de precisión de todos los
indicadores. Sin embargo, este tamaño de muestra puede resultar muy costoso, entonces se debe
tomar la decisión de no incluir algunas variables en la encuesta, o bien, admitir para ellas un error de
estimación más alto que para el resto. Considerando todo lo anterior se debe elegir la expresión
matemática que permita calcular el tamaño de muestra. (véase documento de INEGI, 2010). Si se
emplea un muestreo estratificado o por conglomerados, la selección debe realizarse de manera
independiente en cada estrato o conglomerado, se debe verificar que el número de unidades de
muestreo seleccionadas por grupo coincida con el tamaño de muestra total.

Observaciones:

4.2 Actividad

CONTENIDO:

En un a hoja en excel captura los datos de los dos ejemplos para estimar el tamaño de la muestra finita
y muestra infinita. Cambia el error muestral y ve la relación que tiene con el tamaño de la muestra sí
como el nivel de significancia Z utilizado.

Tipo de actividad: Individual Grupal


Comunicación (blog, foro, wiki,
Actividad o
Herramienta de Bb: diario, chat, aula virtual, grupos de
SafeAssigment
trabajo)

13
¿Qué debo hacer? Desarrolla una fórmula en excel que te permita estimar el tamaño de la muestra de
los ejemplos anteriores.

Recomendaciones:

¿Cómo lo entrego? En una hoja de excel con las fórmulas correspondientes.

¿Cuándo lo entrego?

Archivo adjunto (opcional) Nombre de archivo:

Nota para el profesor: llenar el recuadro por cada actividad planeada para el tema. Es importante
cuestionarse sobre la función pedagógica de cada herramienta, sus lineamientos, retroalimentación y
calificación

Conclusión del tema

CONTENIDO:
Muchas veces es imposible tener los datos de toda una población por lo que se debe realizar un
muestreo, el cual responde a dos cuestiones, de qué tamaño debe ser la muestra es decir el número de
elementos seleccionados y por otro lado cómo debo seleccionar los elementos. Para la primer cuestión
es importante definir si la población es finita o infinita y se escoge la fórmula adecuada, mientras que
para la segunda cuestión, existen los diversos tipos de muestreo probabilísticos.

Observaciones:

Bibliografía recomendada para el tema

14
CONTENIDO:
Ibarra, Mario. (1998). Estadística para la Administración Turística. México: Editorial Diana.

Freunn, John y Simon, Gary. (1994). Estadística Elemental. México: Prentice Hall Hispanoamaericana,
S.A.

Pliego, Javier. (2004). Estadística Económica y Empresarial. Madrid: International Thomson Editores
Spain, S.A.

Spiegel, Murray. (1991). Estadística. España: McGraw-Hill, Inc.

Anderson, David, Sweeney, Dennis y Williams, Thomas. (2003). Essentials of Statistics for Business and
Economics. United States of America: Thomson.

Observaciones:

15