Vous êtes sur la page 1sur 33

UNIDAD IV:

TEMA No.8: NOCIONES DE


INFERENCIA ESTADÍSTICA
La Estadística Inferencial, es una parte de la Estadística, que
proporciona la teoría necesaria para afirmar algo de la
población o tomar decisiones generales a partir de los datos
de una muestra.
Esto quiere decir que es necesario trabajar con una muestra y
para ello hay que hacer un muestreo.
Muestreo.- es el estudio de las relaciones existentes entre
una población y muestras extraídas de la misma. Permite
estimar características desconocidas de la población (media,
varianza, etc.) a partir del conocimiento de las características
muestrales (media, varianza, etc.)
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 1
El muestreo hace uso de la inferencia estadística al
determinar características de la población, basados en la
información hallada en la muestra.
Necesidades y Ventajas del Muestreo:
- El estudio se realiza con mayor rapidez (menor tiempo).
- El costo para obtener la muestra es menor, que cuando se trabaja
con la población.
- El error obtenido es menor, ya que el personal quien hace el
levantamiento de la información es capacitado.
Tipos de Muestreo: El tipo de muestreo está condicionado a
menudo por el universo y la información que se disponga
sobre el mismo, por el presupuesto disponible, el modelo de
cuestionario y el grado de precisión deseado al hacer las
estimaciones.
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 2
El tipo o método de muestreo es el conjunto de reglas que
hay que tener en cuenta para seleccionar los elementos
muestrales. Los métodos de muestreo, se agrupan en:
Muestreo Probabilístico y Muestreo No Probabilístico.

Muestreo Probabilístico: se da cuando las unidades de la


muestra se seleccionan mediante un procedimiento aleatorio
o al azar. Son muestreos científicos y permiten:
- Acotar los errores cometidos.
- Estimar parámetros poblacionales.
- Evaluar con intervalos de confianza la precisión de los
estimadores.
- Hacer inferencia estadística.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 3


Algunos de estos métodos:
• Muestreo aleatorio simple: Es cuando la muestra se
obtiene unidad a unidad y cada unidad tiene la misma
probabilidad de ser seleccionada. A partir del marco
muestral se van seleccionando los elementos que van a
formar parte de la muestra. Como los elementos en el
marco muestral están debidamente numerados, los
elegidos corresponden a los #s obtenidos mediante una
tabla de #s aleatorios o mediante un software.
• Muestreo aleatorio sistemático: Consiste en ordenar las
unidades muestrales de forma aleatoria y en irlas
seleccionando de (k) en (k), tomando como origen una
de ellas, que es seleccionada a su vez aleatoriamente.
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 4
Se tiene: N = nk
- N y n se determinan anticipadamente,
- Luego se calcula k
N
 k
n
• Muestreo aleatorio estratificado:
En los muestreos dirigidos a estimar datos económicos o
sociológicos, se aumenta la eficiencia realizando
previamente una estratificación de la población.

En general, decimos que este tipo de muestreo se aplica


cuando en la población se observan elementos los cuales
se pueden agrupar debido a una característica común

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 5


• Muestreo por conglomerados:
Un conglomerado es un subconjunto de elementos
poblacionales que se encuentran agrupados sin que
intervenga el criterio del investigador.
Un conglomerado consta de elementos heterogéneos,
tantos como existan en la población, mientras que los
distintos conglomerados son aproximadamente
homogéneos entre sí.
Muchas veces, los conglomerados son áreas geográficas
que representan la misma diversidad poblacional.

Muestreo No Probabilístico: principales tipos de


muestreo no probabilístico:

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 6


- El muestreo sin norma. Cuando la elección de los
entrevistados se deja a la comodidad del encuestador, de
forma que en dicha selección prime la rapidez y la
reducción de costos.
- El muestreo de conveniencia. Cuando la muestra se
obtiene conforme a la conveniencia del investigador.
- El muestreo de bola de nieve. Cuando se ubican
unidades poblacionales o muestrales de difícil
localización, y luego se les pide información para
localizar otras unidades semejantes.
Es importante tener en cuenta que con ninguno de los
muestreos no probabilísticos se podrá acotar los errores
estadísticos cometidos ni la precisión de las estimaciones
de los parámetros poblacionales.
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 7
TAMAÑO DE MUESTRA(muestreo aleatorio simple)

Al realizar un muestreo, una de las primeras preguntas que


debe contestar el investigador, es sobre el tamaño de
muestra, para estimar con ella una característica poblacional
con una precisión deseada.

La precisión deseada se determina con el margen de error


permitido en la estimación y con un coeficiente de confianza
que garantice que la estimación está dentro del margen
permitido de error, para esto es necesario conocer la
desviación estándar de la población, o por lo menos
estimarla.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 8


En una investigación, existen una cantidad de parámetros a
estimar, se suele elegir el parámetro más importante o los
más importantes, y el mayor tamaño muestral obtenido.

Para hallar el tamaño de muestra, hay una fórmula


simplificada, que se utiliza frecuentemente, en la estimación
de proporciones con muestreo aleatorio simple y cuando se
pueda aproximar la población a una distribución normal,
supuestos que pueden extenderse a múltiples situaciones.

z 2 2
n 2
e

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 9


Ejem.:
Una universidad realiza una encuesta del ingreso económico
mensual de los últimos graduados de su escuela de
Arquitectura. De estudios anteriores se tiene la desviación
estándar del ingreso económico mensual de la población de
estos graduados, es $1500.00. Cuál será el tamaño de
muestra que se debe considerar para estimar el ingreso
mensual promedio de los últimos graduados dentro de más y
menos $500.00 del verdadero ingreso mensual, con un nivel
de confianza del 95%? n  z 22 2
e
  1500
z
e  500
n? n
e  500 ( 1.96 ) ( 1500 )
 n
500
l .c .  0.95% n  35
34.57  n
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 10
Ejercicios:
1.Un agente de compras de calculadoras electrónicas de mano, está
interesado en determinar a un nivel de confianza del 95 %
(dentro de un error de 0.04) la proporción de calculadoras
defectuosas. Conservadoramente (es decir, tratando de
conseguir el mayor tamaño de muestra) ¿Cuántas calculadoras
debe probar para encontrar la proporción de defectuosas?
2.La población de cierto almacén está conformada por 8000
artículos. Se conoce la desviación estándar del consumo anual,
su valor es 1500 soles. El error máximo con que se desea
trabajar al hacer un muestreo es de 200 soles, con una
probabilidad de estar dentro de este error de 0.95. ¿Cuál deberá
ser el tamaño de la muestra a extraer?
Nota: Cuando la población es finita, se refina el tamaño de muestra
con la siguiente fórmula. nN
nf 
n  ( N  1)
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 11
ESTIMACIÓN
Es una aproximación a un valor real desconocido.
Objetivo de la Estimación.- Introducir métodos que
permitan estimar con precisión razonable la media de la
población. Calcular la media exacta no es posible, pero se
hará un estimado y se presentará el error que
probablemente acompañe a este estimado.
Estimador.- Es una estadística muestral. Usada para estimar
un parámetro de la población.
Estimado.- Es el valor específico que toma el estimador o la
estadística muestral.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 12


Tipos de estimadores.-
Estimador Puntual: Proporciona un único # para estimar un
parámetro desconocido de la población.
La media muestral x es el mejor estimador puntual de la
media poblacional μ.
x
x Nos proporciona un solo valor.
i

n Estimador de la media poblacional μ.

s 2

 (x  x)2
i
Nos proporciona un solo valor
Estimador de la varianza poblacional σ2
n 1
Estimador por Intervalos: Proporciona un rango de valores
entre los cuales se desea que esté el parámetro de la
población. Ejem.: Cuando estimamos la edad de una persona.
Para muestras grandes: ¿Cómo hallamos un intervalo de confianza para
la media poblacional μ con varianza σ2 conocida?
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 13
INTERVALO DE CONFIANZA PARA LA MEDIA y LA
PROPORCION POBLACIONALES
Intervalo de Confianza para la media μ de una
población normal con varianza σ2 conocida.

• El problema es hallar L1, L2 / P(L1< μ <L2)=δ


• Sea X una v.a. con μ desconocida y σ2 conocida
• Sea x1, x2, …, xn una m.a. de tamaño n
• Sea x : media muestral
• Por el Teorema del Límite Central:
x
Z ~ N (0,1) n  30
 n

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 14


• Una vez determinada la prob. δ se pueden hallar los
límites z1, z2 / P(-z0< Z <z0)=δ
• Una forma simple de escoger z1 y z2 es:

Luego de multiplicar por el denominador:

Luego de restar x y multiplicar por -1:

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 15


Estas demostraciones se hacen suponiendo poblaciones
infinitas o muestreo con reposición de poblaciones finitas.

Cuando la población es finita, se usa el factor de corrección


para poblaciones finitas: N  n
N 1

Cuando se construye el intervalo de confianza para la


media poblacional y se desconoce la varianza poblacional,
esta varianza se estima con s2:

donde: S
( x i  x )2
n1

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 16


Uso de la distribución t-student:

Cuando la muestra es pequeña (n<30) y la varianza σ2 es


desconocida, el intervalo para estimar la media poblacional
con coeficiente de confiabilidad δ, es:

Donde σ 2 se estima con la varianza muestral s2 y se utiliza


la distribución t con n-1 grados de libertad, quedando:

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 17


Ejem.:

Construir un intervalo de confianza del 95% para estimar la


media poblacional de una variable, a partir de una muestra de
tamaño 64 extraída de una población con . La media
muestral resultó ser .

I .C .  ?
l .c . : 95%
n  64
  10
x  48.5

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 18


Intervalo de Confianza para la Proporción
Poblacional.-

Para estimar la proporción poblacional, hay que tener en


cuenta que de acuerdo a la distribución muestral de
proporciones, para una población infinita: p̂    p
 p(1  p )
 p̂  
n n

Y como la estadística p̂ tiene una distribución


asintóticamente normal, se llega al intervalo:
P  (p̂ 
p̂(1  p̂)
z , p̂ 
p̂(1  p̂)
z )
con probabilidad δ.
o o
n n

Si la población es finita, se aplica el factor de corrección


por finitud.
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 19
Ejercicios
1. En una encuesta de opinión, 320 estudiantes de la Facultad de
Educación de una universidad nacional declararon estar a
favor del candidato inscrito con el No. 1 para ser elegido
rector en las siguientes elecciones.
a) Hallar un intervalo de confianza, al nivel del 95%,
b)Hallar un intervalo de confianza, al nivel del 99%,
para estimar la proporción a favor de dicho candidato.
La muestra fue de 400 estudiantes.

2. Un departamento de servicio social desea estimar el ingreso


medio anual de 700 familias que viven en un sector de clase
media. Se toma una m.a. simple de 50 familias y se encuentra
una media de $ 11800 y una desviación estándar de $ 950.
Cuál es para ud. el intervalo estimado del ingreso anual medio
de las 700 familias considerando un 90% de confianza?
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 20
PRUEBA DE HIPOTESIS
ESTADISTICA
Hipótesis Estadística. Es un supuesto o conjetura
acerca de alguna población en estudio que puede ser
o no cierta.
Es la transformación de la hipótesis de investigación
en parámetros estadísticos.
Prueba de Hipótesis Estadística. Es un procedimiento
que facilita decidir si una hipótesis se acepta o se
rechaza. Si el valor obtenido en la muestra difiere
significativamente del valor planteado en la hipótesis,
se rechaza esta hipótesis, pero si la diferencia es
pequeña no se rechaza.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 21


Elementos de una Prueba de Hipótesis Estadística

Las Hipótesis:
- Hipótesis Nula (Ho): Suele plantearse como lo contrario a
la hipótesis de investigación. Es decir, se plantea para
refutar o negar lo que afirma la hipótesis de investigación.
Es la suposición que se va a probar, es donde se indica el
valor hipotético del parámetro.
- Hipótesis Alternativa (H1): Es la suposición que constituye
una alternativa a la hipótesis nula, es decir, es la hipótesis
que seria aceptada si se rechazara la hipótesis nula.

Observamos que lo que se afirma en la hipótesis alternativa


es la conclusión a la que se desea o se espera llegar.
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 22
Tipos de Errores:
El procedimiento de decisión está sujeto a dos tipos de
errores. Estos errores son inherentes a todo tipo de decisión
donde se presentan 2 posibles resultados.
- Error Tipo I: es el error que se comete al rechazar la
Hipótesis Nula Ho cuando ésta es cierta. La probabilidad
de cometer este error tipo I se denota por α (nivel de
significación).
Si α = probabilidad de error tipo I
1- α= nivel de confianza de la prueba
- Error Tipo II: Es el error que se comete al no rechazar la
Hipótesis Nula Ho cuando ésta es falsa. La probabilidad
de cometer este error tipo II se denota por β.
Si β = probabilidad de error tipo II
1- β = potencia de la prueba.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 23


Estadística de Prueba:
La decisión de aceptar o rechazar Ho esta determinada por
la información contenida en la muestra, la cual es tomada
de la población en estudio. Esto se debe a que los valores
muestrales se usan para calcular la variable de decisión. A
esta variable se le llama estadística de prueba.
Región de Rechazo:
Esta determinada por la hipótesis alternativa (H1). Si la
estadística de prueba toma un valor que cae en la región de
rechazo, entonces se rechaza Ho y H1 es aceptada. Pero, si
cae fuera de la región de rechazo, entonces se acepta la
hipótesis nula o se dice que no hay evidencia para
rechazarla.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 24


Prueba de Hipótesis para la Media
Si se tiene:
Ho: μ = 44
H1: μ ≠ 44
Se trata de una hipótesis bilateral por que la región de
rechazo está distribuida a ambos lados en el gráfico.
Si se tiene:
Ho: μ ≥ 44
H1: μ < 44
Se trata de una hipótesis unilateral, por que la región de
rechazo está a un lado del gráfico.
Si se tiene:
Ho: μ ≤ 44
H1: μ > 44
Se trata de una hipótesis unilateral por que la región de
rechazo está a un lado del gráfico.
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 25
Ejemplo:

En una cadena de agencias de viajes, se considera que se


tiene un buen grupo de profesionales que pueden ocupar
un cargo de alta exigencia, solamente si muestran una
evaluación promedio igual a 20 en una prueba
psicológica. Bajo estas consideraciones y sabiendo que la
desviación estándar poblacional de los puntajes es 4.5.
Cree ud. que la cadena de agencias de viajes tiene
actualmente un buen grupo de profesionales apto para
ocupar tal cargo, si una muestra de 200 trabajadores
mostró un puntaje promedio de 18.545? Usar un nivel de
significación de 0.05.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 26


Solución:
1º. Se plantean las hipótesis:
Ho: μ = 20
H1 : μ ≠ 20
2º. Se determina el nivel de significación:
α = 0.05, (según lo indicado en el problema), es decir que la
probabilidad que tenemos de equivocarnos al rechazar Ho siendo
cierta es 0.05.

3º. Se identifica la estadística de prueba:


Si suponemos que la población de la muestra sigue una distribución
normal y además se conoce la varianza, entonces la estadística de
prueba para Ho es:

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 27


4º. Región de Rechazo:
Está determinada por la hipótesis alternativa, como ésta es bilateral,
entonces la región de rechazo se encuentra a ambos lados debajo de
la curva.

Por lo tanto, la región de rechazo (como observamos en el gráfico)


es: (- ∞, - 1.96) U (1.96, + ∞)

5º. Decisión:
Se rechaza Ho al 5% de significación.

6º. Interpretación:
Este no es un buen grupo de trabajo, no es apto para desempeñar el
cargo de alta exigencia.

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 28


Ejercicios

1. El Director General de un Centro Pre-universitario, sabe que


los estudiantes de todos sus locales, obtienen al final del ciclo
de preparación anual, un puntaje promedio de 130 y una
desviación estándar de 6 puntos. Con el fin de mejorar la
calidad académica y aumentar la cantidad de ingresantes a las
universidades, aprueba la implementación de un nuevo sistema
de enseñanza. Luego de aplicado el sistema, con la intención
de ver el resultado al finalizar el ciclo de preparación anual, se
escoge una muestra aleatoria de 90 estudiantes encontrándose
un puntaje promedio 139.
¿Constituyen estos resultados evidencia suficiente para afirmar
que el nuevo sistema de enseñanza ha sido efectivo? Usar

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 29


2. En una ciudad se ha presentado una denuncia donde se
afirma que cierto laboratorio ha modificado la cantidad
del contenido de un envase de suero, cuyo contenido
reglamentario es 32 onzas
Para determinar la veracidad de esta denuncia se ha
muestreado 15 envases, obteniéndose los datos
presentados a continuación:
No. Envase 1 2 3 4 5 6 7
Cont. (onz.) 32.2 32.0 32.2 31.9 31.8 31.9 31.8

No. Envase 8 9 10 11 12 13 14 15
Cont. (onz.) 32.0 31.8 31.9 31.7 31.8 31.9 32.0 32.2
Si se considera un nivel de significación del 10%:
a) Plantear las hipótesis adecuadas
b) Grafique la curva señalando la región de rechazo
c) ¿Constituyen los datos de la muestra evidencia
suficiente para acepta la denuncia presentada?

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 30


Prueba de Hipótesis para la Proporción
Las pruebas de hipótesis de proporciones poblacionales se
realizan en forma similar a la utilizada para las medias
poblacionales. Pueden efectuarse pruebas unilaterales o
bilaterales, dependiendo de la pregunta que se plantee.
Las tres formas de una prueba de hipótesis acerca de una
proporción poblacional son las siguientes:
Prueba Unilateral Prueba Bilateral
a la Izquierda: A la derecha:
Ho : π ≥ P o Ho: π ≤ Po Ho: π = Po
H1: π < Po H 1 : π > Po H1 : π ≠ P o

Región de Región de Región de Región de Región de Región de Región de


Rechazo No Rechazo No Rechazo Rechazo Rechazo No Rechazo Rechazo
α 1-α 1-α α α/2 1 -α α/2

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 31


Ejercicios:
1.En una ciudad, históricamente el 20% de alumnos que estudian
en zonas urbanas abandonan sus estudios al culminar el 3er. año
de primaria. Ante esta situación el gobierno, con el afán de
mejorar la situación de la población estudiantil, invierte en
infraestructura y capacitación docente en las mencionadas zonas.
Después de 4 años de haber iniciado las mejoras, se toma una
muestra aleatoria de 200 estudiantes y se encuentra que 20 de
ellos habían abandonado los estudios al culminar el 3er. año de
primaria. ¿Qué puede decir de los logros del gobierno?
2.Una encuesta realizada entre 80 estudiantes, arroja una
proporción de 0.40 de respuestas favorables respecto de la
utilidad del curso de Liderazgo. Algunos profesores con años de
servicio en la enseñanza afirman que la proporción real es 0.55.
Qué puede decir de la veracidad de la afirmación de estos
profesores? Considerar 0.95 de confiabilidad.
Lic. Mary Yris MIRANDA R. Introducción a la Estadística 32
Gracias

Lic. Mary Yris MIRANDA R. Introducción a la Estadística 33