Vous êtes sur la page 1sur 17

En el siguiente documento

revisaremos los conceptos básicos


del muestreo, distribución
muestral de la media y de la
proporción estos estadísticos se
utilizarán para estimar los
parámetros de la población a
través de los intervalos de
confianza para la media y la
proporción respectivamente.

Contenidos
Unidad 2
Inferencia Estadística
Contenidos Unidad 2

TEMA 1: “MUESTREO”

1.1.- Definición
Se denomina muestreo a la operación de seleccionar la muestra de la población a investigar. El
principio fundamental que guía el muestreo estadístico es que todos los sujetos de la población
tengan la misma probabilidad de ser seleccionados, de esta manera se logran las muestras
estadísticas que es lo fundamental para hacer inferencia estadística.
A continuación, mencionaremos algunas ventajas de trabajar con muestras.
 Es más rápido, ya se estudian menos sujetos
 Es más económico por que se necesitan menores recursos
 Al ser menos los objetos de estudio, se les puede estudiar detalladamente
A continuación, mencionaremos algunas desventajas de trabajar con muestras.
 Todo trabajo con muestras está sujeto a incertidumbre (Error)
 El trabajo con muestras requiere personal especializado
 Si la muestra no está bien seleccionada, se puede llegar a resultados incorrectos
Para los efectos de inferencia estadística es imprescindible que la muestra sea aleatoria no hay
posibilidad de inferir en forma valida, es decir, solo es posible realizar inferencias validas sobre la
base de muestras aleatorias.
1.2.- Algunos tipos de muestreo
Ejercicio 1:
Se ha de estudiar un grupo de personas que son en total 25 mujeres y 15 hombres que trabajan en
cinco secciones de una empresa. Si se quiere seleccionar al azar un grupo de 8 personas.
a).- Muestreo aleatorio simple: consiste en asignar una identidad, generalmente un número, a cada
uno de los elementos de la población. Se sortean los seleccionados mediante un mecanismo
aleatorio, es decir, a través de un método independiente del operador.
En el caso se tiene que:
 Se coloca el nombre de cada uno de ellos en papelitos en una caja y luego se extraen 8
papelitos.
 A cada persona se le otorga un número entero del 1 a 40 a cada uno de ellos. Los
seleccionados se pueden obtener de papelitos dentro de una caja, con una tómbola o
empleando números al azar originados en un programa computacional.
b).- Muestreo estratificado: consiste en seleccionar la muestra con una composición referida a una
característica conocida en la población.
En el caso mencionado podemos estratificar por género.

Inferencia Estadística
1
Como las mujeres representan el 62,5 % del total se calcula la proporción de la muestra que le
corresponde. En este caso es el 62,5% de 8 es 5 y el 37,5% de 8 son hombres. Por lo tanto, se
seleccionaron 5 mujeres y 3 hombres.
c).- Muestreo por conglomerados: cuando los elementos a seleccionar están distribuidos en grupos
más o menos homogéneos (conglomerados), se puede seleccionar a alguno de ellos y luego elegir la
muestra solo de dos conglomerados seleccionados.
En el caso mencionado se pueden seleccionar aleatoriamente algunas de las cinco secciones, luego
se selecciona dentro de ellas a ocho trabajadores requeridos, en forma proporcional al tamaño de
cada conglomerado independiente del género.
Ejercicio 2:
En una planta donde se procesan alimentos se llenan miles de cajas de detergente todos los días.
Si la maquinaria no trabaja de manera adecuada, se tendrán cajas con mayor o menor cantidad de
detergentes. Sera muy lento, costoso y poco eficiente supervisar y pesar cada caja, por lo que el
gerente de operaciones debe planear que se tome una muestra de las cajas y tomar decisiones
sobre la posibilidad de que el proceso de llenado esté bajo control y funcionando bien.
Cada vez que se selecciona una muestra de cajas para pesarlas, debe tomarse una decisión en
relación a la posibilidad de que esa muestra con media ̅ se haya obtenido al azar de una población
cuya media verdadera µ sea, por ejemplo, 368 gramos. Con base en esta evaluación, se tomará una
decisión con respecto a continuar con el proceso de producción o detener el equipo y repararlo.
Para darle respuesta a la petición del gerente de operaciones estudiaremos la distribución de
medias muestrales.
1.3.- Distribución muestral de medias
Se tiene una variable numérica X, con media µ y varianza , se extraen muestras de tamaño

En cada una de las muestras se calcula la media aritmética ̅ ̅ ̅


Cada una de estas medias no tienen por qué ser iguales, aunque provengan de la misma población,
si se extraen todas las muestras posibles de una población, se comprueba que las medias
muéstrales son diferentes.
Podemos establecer lo siguiente:
 Las medias muéstrales constituyen una variable aleatoria.
 Como la media muestral es una variable aleatoria entonces tiene un valor esperado y una
varianza

 Las medias muéstrales se distribuyen normalmente con media µ y Varianza

 La media muestral ̅ se distribuye normalmente con una media que es µ y una desviación
estándar ̅ √ , este valor se conoce como el error estándar de la media.

 Esto queda expresado de la siguiente forma ̅ ̅

Para comprender de mejor forma explicaremos el concepto del error muestral de la media o
estándar de la media ̅ .

Inferencia Estadística
2
1.4.- Error estándar de la media
El error estándar de la media ̅ es igual a la desviación estándar de la población ơ dividido entre la
raíz cuadrada del tamaño de la muestra n.

̅

Al aumentar el tamaño de la muestra, el error estándar de la media disminuye en un factor igual a la


raíz cuadrada del tamaño de la muestra.
¿En que afecta al error estándar de la media si se aumenta el tamaño de la muestra de 25 a 100
cajas?, si se sabe que la desviación estándar es igual a 15
Solución
Si n = 25 cajas y ơ=15, reemplazando los valores en la fórmula ̅

̅

Si n = 100 cajas y ơ=15, reemplazando los valores en la fórmula ̅

̅

Se observa que un incremento de 4 veces en el tamaño de la muestra, de 25 a 100, reduce el error
estándar de la media a la mitad de 3 a 1.5 esto muestra que al tomar muestras más grandes se
obtiene una variabilidad menor en las medias muéstrales.
Para calcular probabilidades con la media muestral se tiene que estandarizar.
1.5.- Puntaje Z para la distribución muestral de las medias
El valor de Z es igual a la diferencia entre la media muestral ̅ y la media de la población µ, dividida
entre entre el error estándar de la media ̅ .
̅ ̅
̅

Ahora ya estamos en condiciones de responder la pregunta de las cajas de detergentes
Se selecciona una muestra de 25 cajas para pesarlas, debe tomarse una decisión en relación a la
posibilidad de que esa muestra con media ̅ se haya obtenido al azar de una población cuya media
verdadera µ sea, por ejemplo, 368 gramos y la desviación estándar de 15 gramos.
¿Cuál es la probabilidad de obtener una media muestral menor que 365 gramos?
Solución
Lo primero es anotar los datos se obtiene lo siguiente.
n = 25 cajas, ơ=15 y µ=368
̅ ) , para calcular esta probabilidad se tiene que estandarizar

Inferencia Estadística
3
̅
, reemplazando los valores se tiene que.


, para calcular este valor utilizaremos la simetría de la curva normal quedando
, este valor se busca en la tabla N° 2 como lo vimos en la unidad anterior
quedando lo siguiente
0,1587
Por lo tanto, un 15,87% de todas las medias posibles de tamaño 25 tendrán una media menor que
365 gramos.
Ejercicio 3
Se tiene una máquina de llenado para vaciar 500 gr. de cereal en una caja de cartón. Supone que la
cantidad de cereal que se coloca en cada caja es una variable aleatoria normalmente distribuida con
media de 500 gr., y desviación estándar igual a 20 gr.
Para verificar que el peso promedio de cada caja se mantiene en 500 gr., se toma una muestra
aleatoria de 25 de éstas en forma periódica y se pesa el contenido de cada caja. El gerente de la
planta ha decidido detener el proceso y encontrar la falla cada vez que el valor promedio de la
muestra sea mayor de 510gr. O menor de 490gr. Obtener la probabilidad de detener el proceso.
Solución
Podemos darnos cuenta que la decisión del gerente de la planta depende del valor promedio de la
muestra definiendo la variable se tiene que:
̅ : Peso promedio de cada caja de cereal
Obteniendo los datos se tiene que:
n = 25 cajas, ơ= 20 gr y µ= 500gr
Gráficamente el gerente de la planta detiene el proceso si ocurre lo siguiente que son las áreas de
los extremos.

Inferencia Estadística
4
Para responder esta pregunta estandarizaremos los valores para tener los puntajes Z


Esto queda gráficamente de la siguiente forma:

El , utilizando la propiedad de la simetría se tiene que este valor se


busca en la tabla N° 2
El es igual al son simétricas
Como puede ocurrir una cosa o la otra se tiene que sumar ambas áreas
0,0062+0,0062 = 0,0124
La probabilidad de que el gerente de la planta detenga el proceso es de un 1,24%

Inferencia Estadística
5
• MATERIALES DE APOYO
Para complementar los contenidos vistos en este tema, les invitamos a revisar el siguiente material
de apoyo:
Tipos de muestreo
https://www.youtube.com/watch?v=viyYsnR6FQA
Muestreo 03 Distribución de la media muestral ejercicio
https://www.youtube.com/watch?v=5xhkVFiYpYU
Muestreo 05 Distribución de la media muestral ejercicio
https://www.youtube.com/watch?v=m3MdEMmxJVU

Inferencia Estadística
6
TEMA 2: “INTERVALOS DE CONFIANZA PARA LA MEDIA (Ơ CONOCIDA)”

2.1.- Intervalos de confianza para la Media (ơ Conocida)


Como sabemos la media muestral se distribuye normalmente con media µ y desviación estándar ̅
(Error estándar de la media). Es posible usar el modelo normal para establecer un intervalo de
confianza (I.C) dentro del cual se encuentra la media poblacional µ
Para entender de mejor forma el intervalo definiremos algunos conceptos:
a).- Nivel de significación (α)
Es el riesgo de error que asume el investigador para hacer inferencia, este error tiene que estar
presente en toda investigación.
Los valores de α usuales son 0,1; 0,05 y 0,01, lo que en porcentaje corresponde a 10%, 5% y 1%
respectivamente.
b).- Nivel de confianza
Es el grado de confianza que el investigador quiere dar a su estimación. Se expresa en probabilidad
o en porcentaje.
Los valores usuales son:

En la figura la confianza esta dada por el área achurada bajo la curva, mientras que la
significación se divide en la cola superior e inferior de la curva normal.
 Al disminuir la confianza del intervalo se hace más preciso (menor longitud), pero aumenta
la probabilidad de error α se tiene más precisión, pero menos confianza

Inferencia Estadística
7
 Al aumentar la confianza del intervalo se hace menos preciso (mayor longitud), pero
disminuye la probabilidad de error α se tiene más confianza, pero menos precisión.
2.2.- Cálculo del intervalo de confianza para la media µ
Este método consiste en determinar la media muestral ̅ y obtener un intervalo de confianza,
sumándole y restándole a la media un cierto error de investigación “e” quedando lo siguiente:
̅

El error de investigación “e” depende de dos factores:


a) La confianza que desea tener (90%, 95%, 99%)
Esto se representa mediante los percentiles de la curva normal Z,

Para un intervalo de confianza del 90%: = 1,65

Para un intervalo de confianza del 90%: = 1,96

Para un intervalo de confianza del 90%: = 2,58

b) El error muestral de la media ( ̅ )


Como vimos anteriormente el valor de ̅

El error es igual a ̅

Reemplazando estos valores en ̅ se tiene que


̅ ̅ , esta fórmula nos permite determinar el intervalo de confianza de la media
con varianza conocida.
̅ ̅

Ahora para comprender mejor el intervalo de confianza para la media veremos los siguientes
ejemplos:
Ejemplo 1
Un fabricante de Papel para impresoras tiene un proceso de producción que opera en forma
continua durante todo el turno de producción. Se espera que el papel tenga una longitud promedio

Inferencia Estadística
8
de 11 pulgadas y se sabe que la desviación estándar es 0,02 de pulgada. De manera periódica, se
seleccionan muestras para determinar si la longitud promedio de la hoja todavía es 11 pulgadas o si
algo va mal en el proceso de producción y cambió. Se toma una muestra aleatoria de 100 hojas y se
obtiene la longitud promedio es 10,998 pulgadas.
a) Establece una estimación de un intervalo del 95% de confianza de la longitud promedio del papel.
b) Establece una estimación de un intervalo del 99% de confianza de la longitud promedio del papel.
Solución
Lo primero es darse cuenta que el problema nos entrega la desviación estándar de la población que
es ơ= 0,02 pulgadas
Luego se toma una muestra n = 100 hojas y de ella se obtiene la media muestral ̅ = 10,998
pulgadas
Calcularemos el error estándar de la media ̅ ; ̅ pulgadas.
√ √

El percentil del 95% es = 1,96

Tenemos todos los datos se reemplazan en la fórmula ̅ ̅

;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más

gráficamente se tiene que

La longitud promedio del papel se encuentra entre 10,9941 pulgadas y 11,0019 pulgadas con un
95% de confianza.
Como 11 es el valor que indica que el proceso de producción funciona como debe estar incluido en
el intervalo, no hay razón para pensar que algo está mal en el proceso.
b) Para responder esta pregunta tenemos que notar que solo varía el percentil que en este caso es
El percentil del 99% es = 2,58

Tenemos todos los datos se reemplazan en la fórmula ̅ ̅

Inferencia Estadística
9
;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más

gráficamente se tiene que

La longitud promedio del papel se encuentra entre 10,9928 pulgadas y 11,0032 pulgadas con un
99% de confianza.
Como 11 es el valor que indica que el proceso de producción funciona como debe estar incluido en
el intervalo, no hay razón para pensar que algo está mal en el proceso.
Ejemplo 2
Los datos que a continuación se dan son los pesos en gramos del contenido de 16 cajas de cereal
que se seleccionaron de un proceso de llenado con el propósito de verificar el peso promedio:
506,508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. Si el peso de cada caja
es una variable aleatoria normal con una desviación estándar de 5g, obtener los intervalos de
confianza estimados del 90%, para la media de llenado de este proceso.
Solución
Lo primero que tenemos que hacer en este caso es calcular el valor del peso promedio de las 16
cajas.
Se tienen que sumar el peso de cada una de ellas y de divide por el número total de las cajas.
̅

̅ g
Este problema nos entrega la desviación estándar de la población que es ơ= 5g
Luego se toma una muestra n = 16 cajas y de ella se obtiene la media muestral ̅ 503,75g

Calcularemos el error estándar de la media ̅ ; ̅ g.


√ √

El percentil del 90% es = 1,65

Inferencia Estadística
10
Tenemos todos los datos se reemplazan en la fórmula ̅ ̅

;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más

El peso promedio de las cajas de cereal se encuentra entre 501,688 g y 505,813 g con un 90% de
confianza.
2.3.- Determinación del tamaño de la muestra para la media
El tamaño de la muestra n es igual al producto del cuadrado del valor de Z
Por la varianza , dividido entre el cuadrado del error de muestreo.

Ejemplo
Un grupo de consumidores desea estimar el monto de las facturas de energía eléctrica para el mes
de Julio para las viviendas unifamiliares en una gran ciudad. Con base en estudios realizados en
otras ciudades, se supone que la desviación estándar de 25 dólares.
El grupo desea estimar el monto promedio para julio dentro de dólares del promedio verdadero
con un 99% de confianza.
a) ¿Qué tamaño de la muestra necesita?
b) si desea el 95% de confianza. ¿Qué tamaño de la muestra requiere?
Solución
a) Lo primero que se tiene que anotar son los datos.
La desviación estándar de la población ơ = 25, el valor del error de investigación e = 5 ambos valores
en dólares y el valor del percentil Z para una confianza de 99% es 2,58
Reemplazando estos valores en la fórmula

, se tiene que.

= 167 viviendas

b) Para responder esta pregunta solo cambia el nivel de confianza es decir el valor del percentil Z
para una confianza del 95% es 1,96
Reemplazando estos valores en la fórmula:

, se tiene que.

Inferencia Estadística
11
= 97 viviendas

2.4.- Cálculo del intervalo de confianza para la proporción P


Este método consiste en determinar la proporción muestral ̅ y obtener un intervalo de confianza,
sumándole y restándole a la Proporción un cierto error de investigación “e” quedando lo siguiente.
̅
Donde:
P: Proporción de la población
̅ : Proporción muestral
e: Error de investigación

El error de investigación “e” depende de dos factores:


1) La confianza que desea tener (90%, 95%, 99%)
Esto se representa mediante los percentiles de la curva normal Z,

Para un intervalo de confianza del 90%: = 1,65

Para un intervalo de confianza del 90%: = 1,96

Para un intervalo de confianza del 90%: = 2,58

2) El error estándar muestral de la proporción ( ̅ )


̅ ̅
el valor de ̅ √

Donde:
̅ Proporción muestral =

̅ ̅ , ya que la población es binomial


n: Tamaño de la muestra

Inferencia Estadística
12
El error es igual a ̅

Reemplazando estos valores en ̅ se tiene que


̅ ̅ , esta fórmula nos permite determinar el intervalo de confianza de la
proporción.
̅ ̅

Para comprender mejor el intervalo de confianza para la proporción veremos los siguientes
ejemplos:
Ejemplo 1:
Un fabricante asegura a una compañía que le compra un producto en forma regular, que el
porcentaje de artículos defectuosos no es mayor del 5%. La compañía decide comprobar la
afirmación del fabricante seleccionando, de su inventario, 200 unidades de este producto y
probándolas. ¿Deberá sospechar la compañía de la afirmación del fabricante si se descubren 19
unidades defectuosas en la muestra? (con un 95% de confianza)
Solución
Lo primero que se tiene que calcular es la proporción muestral ( ̅ , para esto se tomó una muestra
de tamaño n = 200 unidades y de esas 19 son defectuosas que son casos favorables
̅ , el valor de ̅ ̅ con estos valores y la muestra se
calcula el error estándar de la proporción.
̅ ̅
̅ √ , reemplazando los valore en la fórmula se tiene que.

̅ ̅
̅
√ √

El nivel de confianza es del 95% lo que da un valor de de 1,96

Reemplazando estos valores en la fórmula ̅ ̅ , se tiene que

;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más

El porcentaje de piezas defectuosas en la compañía se encuentra entre un 5,44% y un 13,56% del


total con un nivel de confianza del 95%
De acuerdo a este intervalo se tiene que sospechar de la afirmación que hizo el fabricante

Inferencia Estadística
13
Ejemplo 2:
El departamento de estudios de un municipio obtuvo una muestra aleatoria de sus familias
registrando el monto del ingreso mensual, obteniendo los siguientes resultados:

Ingreso (miles de pesos) 280-300 300-320 320-340 340-360 360-380

Nº de Familias 14 22 28 18 8

Si se decide dar un subsidio especial a todas aquellas familias que tengan un ingreso mensual
inferior a los 340 miles de pesos. Construya un intervalo de confianza del 99% y comente que
proporción de familias recibirían este subsidio.
Solución
Lo primero que se tiene que calcular es la proporción muestral ( ̅ , para esto se tomó una muestra
de tamaño n = 90 familias
Los casos favorables que tienen un ingreso menor de $340.000 son 64 familias.
̅ , el valor de ̅ ̅ con estos valores y la muestra se
calcula el error estándar de la proporción.
̅ ̅
̅ √ , reemplazando los valore en la fórmula se tiene que.

̅ ̅
̅
√ √

El nivel de confianza es del 99% lo que da un valor de de 2,58

Reemplazando estos valores en la fórmula ̅ ̅ , se tiene que:

;
Para obtener el lado izquierdo se utilizará el menos y para el lado derecho el signo más.

Inferencia Estadística
14
El porcentaje de Familias que recibirá este subsidio se encuentra entre un 58,8% y un 83,4% del
total de familias del municipio con un nivel de confianza del 99%
2.5.- Determinación del tamaño de la muestra para una proporción
El tamaño de la muestra n es igual al cuadrado del valor Z multiplicado por la proporción verdadera
P, multiplicada por el valor de q = 1-p, dividido entre el cuadrado del error de muestreo e.

Ejemplo 1:
Se desea hacer un estudio con un 95% de confianza para saber qué % de la población cree
realmente en los noticieros de la televisión. Se tiene dato, por un estudio previo, que ese % llega al
67,8% ¿Cuál es el tamaño más adecuado de la muestra para este estudio, si desea un error de no
más del 8%?
Solución
Como podemos ver se tienen datos históricos de la proporción de la población que cree realmente
en los noticieros de la televisión (P)
P = 0,678, el valor de q = 1- 0,678 = 0,322
Se tiene que el valor de investigación “e” es igual a 8%, e = 0,08
El valor del percentil Z es 1,96
Reemplazando este valor en la fórmula de n se tiene que:

personas

Se requiere la muestra de tamaño 131


Ejemplo 2:
El gerente de un banco desea 90% de confianza de tener un resultado correcto dentro de de
la proporción de población real de ahorradores que tienen cuentas de ahorro y de cheques en
blanco.
¿De cuántos ahorradores debe ser su muestra?
Solución
Como podemos ver no se tienen datos históricos de la proporción de la población de Ahorradores
que tienen cuenta de ahorro y cheques en blanco.
Cuando ocurre esto se le asigna a P el valor de 0,5
P = 0,5, el valor de q = 1- 0,5 = 0,5
Se tiene que el valor del error de investigación “e” es igual a e = 0,05
El valor del percentil Z es 1,65
Reemplazando este valor en la fórmula de n se tiene que:

Inferencia Estadística
15
ahorradores

• MATERIALES DE APOYO
Para complementar los contenidos vistos en este tema, les invitamos a revisar el siguiente material
de apoyo:
Intervalo de confianza para la media con varianza conocida
https://www.youtube.com/watch?v=N36TGN8k2tY
Intervalo de confianza para la proporción 1
https://www.youtube.com/watch?v=CxMfm4xNDLY
Intervalo de confianza para una proporción
https://www.youtube.com/watch?v=z8haqTmi2u8
Tamaño de la muestra para estimar la media
https://www.youtube.com/watch?v=2gmRBxVQXnU

Inferencia Estadística
16

Vous aimerez peut-être aussi