Académique Documents
Professionnel Documents
Culture Documents
Contenidos
Unidad 2
Inferencia Estadística
Contenidos Unidad 2
TEMA 1: “MUESTREO”
1.1.- Definición
Se denomina muestreo a la operación de seleccionar la muestra de la población a investigar. El
principio fundamental que guía el muestreo estadístico es que todos los sujetos de la población
tengan la misma probabilidad de ser seleccionados, de esta manera se logran las muestras
estadísticas que es lo fundamental para hacer inferencia estadística.
A continuación, mencionaremos algunas ventajas de trabajar con muestras.
Es más rápido, ya se estudian menos sujetos
Es más económico por que se necesitan menores recursos
Al ser menos los objetos de estudio, se les puede estudiar detalladamente
A continuación, mencionaremos algunas desventajas de trabajar con muestras.
Todo trabajo con muestras está sujeto a incertidumbre (Error)
El trabajo con muestras requiere personal especializado
Si la muestra no está bien seleccionada, se puede llegar a resultados incorrectos
Para los efectos de inferencia estadística es imprescindible que la muestra sea aleatoria no hay
posibilidad de inferir en forma valida, es decir, solo es posible realizar inferencias validas sobre la
base de muestras aleatorias.
1.2.- Algunos tipos de muestreo
Ejercicio 1:
Se ha de estudiar un grupo de personas que son en total 25 mujeres y 15 hombres que trabajan en
cinco secciones de una empresa. Si se quiere seleccionar al azar un grupo de 8 personas.
a).- Muestreo aleatorio simple: consiste en asignar una identidad, generalmente un número, a cada
uno de los elementos de la población. Se sortean los seleccionados mediante un mecanismo
aleatorio, es decir, a través de un método independiente del operador.
En el caso se tiene que:
Se coloca el nombre de cada uno de ellos en papelitos en una caja y luego se extraen 8
papelitos.
A cada persona se le otorga un número entero del 1 a 40 a cada uno de ellos. Los
seleccionados se pueden obtener de papelitos dentro de una caja, con una tómbola o
empleando números al azar originados en un programa computacional.
b).- Muestreo estratificado: consiste en seleccionar la muestra con una composición referida a una
característica conocida en la población.
En el caso mencionado podemos estratificar por género.
Inferencia Estadística
1
Como las mujeres representan el 62,5 % del total se calcula la proporción de la muestra que le
corresponde. En este caso es el 62,5% de 8 es 5 y el 37,5% de 8 son hombres. Por lo tanto, se
seleccionaron 5 mujeres y 3 hombres.
c).- Muestreo por conglomerados: cuando los elementos a seleccionar están distribuidos en grupos
más o menos homogéneos (conglomerados), se puede seleccionar a alguno de ellos y luego elegir la
muestra solo de dos conglomerados seleccionados.
En el caso mencionado se pueden seleccionar aleatoriamente algunas de las cinco secciones, luego
se selecciona dentro de ellas a ocho trabajadores requeridos, en forma proporcional al tamaño de
cada conglomerado independiente del género.
Ejercicio 2:
En una planta donde se procesan alimentos se llenan miles de cajas de detergente todos los días.
Si la maquinaria no trabaja de manera adecuada, se tendrán cajas con mayor o menor cantidad de
detergentes. Sera muy lento, costoso y poco eficiente supervisar y pesar cada caja, por lo que el
gerente de operaciones debe planear que se tome una muestra de las cajas y tomar decisiones
sobre la posibilidad de que el proceso de llenado esté bajo control y funcionando bien.
Cada vez que se selecciona una muestra de cajas para pesarlas, debe tomarse una decisión en
relación a la posibilidad de que esa muestra con media ̅ se haya obtenido al azar de una población
cuya media verdadera µ sea, por ejemplo, 368 gramos. Con base en esta evaluación, se tomará una
decisión con respecto a continuar con el proceso de producción o detener el equipo y repararlo.
Para darle respuesta a la petición del gerente de operaciones estudiaremos la distribución de
medias muestrales.
1.3.- Distribución muestral de medias
Se tiene una variable numérica X, con media µ y varianza , se extraen muestras de tamaño
La media muestral ̅ se distribuye normalmente con una media que es µ y una desviación
estándar ̅ √ , este valor se conoce como el error estándar de la media.
√
Para comprender de mejor forma explicaremos el concepto del error muestral de la media o
estándar de la media ̅ .
Inferencia Estadística
2
1.4.- Error estándar de la media
El error estándar de la media ̅ es igual a la desviación estándar de la población ơ dividido entre la
raíz cuadrada del tamaño de la muestra n.
̅
√
̅
√
Si n = 100 cajas y ơ=15, reemplazando los valores en la fórmula ̅
√
̅
√
Se observa que un incremento de 4 veces en el tamaño de la muestra, de 25 a 100, reduce el error
estándar de la media a la mitad de 3 a 1.5 esto muestra que al tomar muestras más grandes se
obtiene una variabilidad menor en las medias muéstrales.
Para calcular probabilidades con la media muestral se tiene que estandarizar.
1.5.- Puntaje Z para la distribución muestral de las medias
El valor de Z es igual a la diferencia entre la media muestral ̅ y la media de la población µ, dividida
entre entre el error estándar de la media ̅ .
̅ ̅
̅
√
Ahora ya estamos en condiciones de responder la pregunta de las cajas de detergentes
Se selecciona una muestra de 25 cajas para pesarlas, debe tomarse una decisión en relación a la
posibilidad de que esa muestra con media ̅ se haya obtenido al azar de una población cuya media
verdadera µ sea, por ejemplo, 368 gramos y la desviación estándar de 15 gramos.
¿Cuál es la probabilidad de obtener una media muestral menor que 365 gramos?
Solución
Lo primero es anotar los datos se obtiene lo siguiente.
n = 25 cajas, ơ=15 y µ=368
̅ ) , para calcular esta probabilidad se tiene que estandarizar
Inferencia Estadística
3
̅
, reemplazando los valores se tiene que.
√
√
, para calcular este valor utilizaremos la simetría de la curva normal quedando
, este valor se busca en la tabla N° 2 como lo vimos en la unidad anterior
quedando lo siguiente
0,1587
Por lo tanto, un 15,87% de todas las medias posibles de tamaño 25 tendrán una media menor que
365 gramos.
Ejercicio 3
Se tiene una máquina de llenado para vaciar 500 gr. de cereal en una caja de cartón. Supone que la
cantidad de cereal que se coloca en cada caja es una variable aleatoria normalmente distribuida con
media de 500 gr., y desviación estándar igual a 20 gr.
Para verificar que el peso promedio de cada caja se mantiene en 500 gr., se toma una muestra
aleatoria de 25 de éstas en forma periódica y se pesa el contenido de cada caja. El gerente de la
planta ha decidido detener el proceso y encontrar la falla cada vez que el valor promedio de la
muestra sea mayor de 510gr. O menor de 490gr. Obtener la probabilidad de detener el proceso.
Solución
Podemos darnos cuenta que la decisión del gerente de la planta depende del valor promedio de la
muestra definiendo la variable se tiene que:
̅ : Peso promedio de cada caja de cereal
Obteniendo los datos se tiene que:
n = 25 cajas, ơ= 20 gr y µ= 500gr
Gráficamente el gerente de la planta detiene el proceso si ocurre lo siguiente que son las áreas de
los extremos.
Inferencia Estadística
4
Para responder esta pregunta estandarizaremos los valores para tener los puntajes Z
√
Esto queda gráficamente de la siguiente forma:
Inferencia Estadística
5
• MATERIALES DE APOYO
Para complementar los contenidos vistos en este tema, les invitamos a revisar el siguiente material
de apoyo:
Tipos de muestreo
https://www.youtube.com/watch?v=viyYsnR6FQA
Muestreo 03 Distribución de la media muestral ejercicio
https://www.youtube.com/watch?v=5xhkVFiYpYU
Muestreo 05 Distribución de la media muestral ejercicio
https://www.youtube.com/watch?v=m3MdEMmxJVU
Inferencia Estadística
6
TEMA 2: “INTERVALOS DE CONFIANZA PARA LA MEDIA (Ơ CONOCIDA)”
En la figura la confianza esta dada por el área achurada bajo la curva, mientras que la
significación se divide en la cola superior e inferior de la curva normal.
Al disminuir la confianza del intervalo se hace más preciso (menor longitud), pero aumenta
la probabilidad de error α se tiene más precisión, pero menos confianza
Inferencia Estadística
7
Al aumentar la confianza del intervalo se hace menos preciso (mayor longitud), pero
disminuye la probabilidad de error α se tiene más confianza, pero menos precisión.
2.2.- Cálculo del intervalo de confianza para la media µ
Este método consiste en determinar la media muestral ̅ y obtener un intervalo de confianza,
sumándole y restándole a la media un cierto error de investigación “e” quedando lo siguiente:
̅
El error es igual a ̅
Ahora para comprender mejor el intervalo de confianza para la media veremos los siguientes
ejemplos:
Ejemplo 1
Un fabricante de Papel para impresoras tiene un proceso de producción que opera en forma
continua durante todo el turno de producción. Se espera que el papel tenga una longitud promedio
Inferencia Estadística
8
de 11 pulgadas y se sabe que la desviación estándar es 0,02 de pulgada. De manera periódica, se
seleccionan muestras para determinar si la longitud promedio de la hoja todavía es 11 pulgadas o si
algo va mal en el proceso de producción y cambió. Se toma una muestra aleatoria de 100 hojas y se
obtiene la longitud promedio es 10,998 pulgadas.
a) Establece una estimación de un intervalo del 95% de confianza de la longitud promedio del papel.
b) Establece una estimación de un intervalo del 99% de confianza de la longitud promedio del papel.
Solución
Lo primero es darse cuenta que el problema nos entrega la desviación estándar de la población que
es ơ= 0,02 pulgadas
Luego se toma una muestra n = 100 hojas y de ella se obtiene la media muestral ̅ = 10,998
pulgadas
Calcularemos el error estándar de la media ̅ ; ̅ pulgadas.
√ √
;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más
La longitud promedio del papel se encuentra entre 10,9941 pulgadas y 11,0019 pulgadas con un
95% de confianza.
Como 11 es el valor que indica que el proceso de producción funciona como debe estar incluido en
el intervalo, no hay razón para pensar que algo está mal en el proceso.
b) Para responder esta pregunta tenemos que notar que solo varía el percentil que en este caso es
El percentil del 99% es = 2,58
Inferencia Estadística
9
;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más
La longitud promedio del papel se encuentra entre 10,9928 pulgadas y 11,0032 pulgadas con un
99% de confianza.
Como 11 es el valor que indica que el proceso de producción funciona como debe estar incluido en
el intervalo, no hay razón para pensar que algo está mal en el proceso.
Ejemplo 2
Los datos que a continuación se dan son los pesos en gramos del contenido de 16 cajas de cereal
que se seleccionaron de un proceso de llenado con el propósito de verificar el peso promedio:
506,508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. Si el peso de cada caja
es una variable aleatoria normal con una desviación estándar de 5g, obtener los intervalos de
confianza estimados del 90%, para la media de llenado de este proceso.
Solución
Lo primero que tenemos que hacer en este caso es calcular el valor del peso promedio de las 16
cajas.
Se tienen que sumar el peso de cada una de ellas y de divide por el número total de las cajas.
̅
̅ g
Este problema nos entrega la desviación estándar de la población que es ơ= 5g
Luego se toma una muestra n = 16 cajas y de ella se obtiene la media muestral ̅ 503,75g
Inferencia Estadística
10
Tenemos todos los datos se reemplazan en la fórmula ̅ ̅
;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más
El peso promedio de las cajas de cereal se encuentra entre 501,688 g y 505,813 g con un 90% de
confianza.
2.3.- Determinación del tamaño de la muestra para la media
El tamaño de la muestra n es igual al producto del cuadrado del valor de Z
Por la varianza , dividido entre el cuadrado del error de muestreo.
Ejemplo
Un grupo de consumidores desea estimar el monto de las facturas de energía eléctrica para el mes
de Julio para las viviendas unifamiliares en una gran ciudad. Con base en estudios realizados en
otras ciudades, se supone que la desviación estándar de 25 dólares.
El grupo desea estimar el monto promedio para julio dentro de dólares del promedio verdadero
con un 99% de confianza.
a) ¿Qué tamaño de la muestra necesita?
b) si desea el 95% de confianza. ¿Qué tamaño de la muestra requiere?
Solución
a) Lo primero que se tiene que anotar son los datos.
La desviación estándar de la población ơ = 25, el valor del error de investigación e = 5 ambos valores
en dólares y el valor del percentil Z para una confianza de 99% es 2,58
Reemplazando estos valores en la fórmula
, se tiene que.
= 167 viviendas
b) Para responder esta pregunta solo cambia el nivel de confianza es decir el valor del percentil Z
para una confianza del 95% es 1,96
Reemplazando estos valores en la fórmula:
, se tiene que.
Inferencia Estadística
11
= 97 viviendas
Donde:
̅ Proporción muestral =
Inferencia Estadística
12
El error es igual a ̅
Para comprender mejor el intervalo de confianza para la proporción veremos los siguientes
ejemplos:
Ejemplo 1:
Un fabricante asegura a una compañía que le compra un producto en forma regular, que el
porcentaje de artículos defectuosos no es mayor del 5%. La compañía decide comprobar la
afirmación del fabricante seleccionando, de su inventario, 200 unidades de este producto y
probándolas. ¿Deberá sospechar la compañía de la afirmación del fabricante si se descubren 19
unidades defectuosas en la muestra? (con un 95% de confianza)
Solución
Lo primero que se tiene que calcular es la proporción muestral ( ̅ , para esto se tomó una muestra
de tamaño n = 200 unidades y de esas 19 son defectuosas que son casos favorables
̅ , el valor de ̅ ̅ con estos valores y la muestra se
calcula el error estándar de la proporción.
̅ ̅
̅ √ , reemplazando los valore en la fórmula se tiene que.
̅ ̅
̅
√ √
;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más
Inferencia Estadística
13
Ejemplo 2:
El departamento de estudios de un municipio obtuvo una muestra aleatoria de sus familias
registrando el monto del ingreso mensual, obteniendo los siguientes resultados:
Nº de Familias 14 22 28 18 8
Si se decide dar un subsidio especial a todas aquellas familias que tengan un ingreso mensual
inferior a los 340 miles de pesos. Construya un intervalo de confianza del 99% y comente que
proporción de familias recibirían este subsidio.
Solución
Lo primero que se tiene que calcular es la proporción muestral ( ̅ , para esto se tomó una muestra
de tamaño n = 90 familias
Los casos favorables que tienen un ingreso menor de $340.000 son 64 familias.
̅ , el valor de ̅ ̅ con estos valores y la muestra se
calcula el error estándar de la proporción.
̅ ̅
̅ √ , reemplazando los valore en la fórmula se tiene que.
̅ ̅
̅
√ √
;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más.
Inferencia Estadística
14
El porcentaje de Familias que recibirá este subsidio se encuentra entre un 58,8% y un 83,4% del
total de familias del municipio con un nivel de confianza del 99%
2.5.- Determinación del tamaño de la muestra para una proporción
El tamaño de la muestra n es igual al cuadrado del valor Z multiplicado por la proporción verdadera
P, multiplicada por el valor de q = 1-p, dividido entre el cuadrado del error de muestreo e.
Ejemplo 1:
Se desea hacer un estudio con un 95% de confianza para saber qué % de la población cree
realmente en los noticieros de la televisión. Se tiene dato, por un estudio previo, que ese % llega al
67,8% ¿Cuál es el tamaño más adecuado de la muestra para este estudio, si desea un error de no
más del 8%?
Solución
Como podemos ver se tienen datos históricos de la proporción de la población que cree realmente
en los noticieros de la televisión (P)
P = 0,678, el valor de q = 1- 0,678 = 0,322
Se tiene que el valor de investigación “e” es igual a 8%, e = 0,08
El valor del percentil Z es 1,96
Reemplazando este valor en la fórmula de n se tiene que:
personas
Inferencia Estadística
15
ahorradores
• MATERIALES DE APOYO
Para complementar los contenidos vistos en este tema, les invitamos a revisar el siguiente material
de apoyo:
Intervalo de confianza para la media con varianza conocida
https://www.youtube.com/watch?v=N36TGN8k2tY
Intervalo de confianza para la proporción 1
https://www.youtube.com/watch?v=CxMfm4xNDLY
Intervalo de confianza para una proporción
https://www.youtube.com/watch?v=z8haqTmi2u8
Tamaño de la muestra para estimar la media
https://www.youtube.com/watch?v=2gmRBxVQXnU
Inferencia Estadística
16