Vous êtes sur la page 1sur 88

1

Est i mac i n por


I nt er val o
2
La estimacin puntual generalmente difiere del verdadero valor del
parmetro. En muchos casos esto no es suficiente; se requiere de un
rango de posibles valores donde se cree el parmetro de inters
estar con una alta confianza. Sea un parmetro de inters y un
estimador puntual de .
Una estimacin de por intervalos es un intervalo real de la forma:
donde l y u dependende y de la distribucinde
Se denomina tambin
INTERVALO ALEATORIO
los extremos son v.a.
) ,..., , (
2 1 n
X X X u ) ,..., , (
2 1 n
X X X l
3
Para una m.a. dada el intervalo (l, u) es llamado intervalo de
confianza al 100(1-)% para . l y u son llamados limites de
confianza (inferior y superior respectivamente) y 1 - es llamado
coeficiente de confianza. Este intervalo se conoce como IC
Bilateral, pero tambin es posible calcular IC unilaterales:
a) Por su extremo o cota se clasificanen:
b) Por la reginque estimanse clasificanen:
I.C hacia la derecha
I.C hacia la izquierda
En un IC bilateral la longitud u - l es una medida de la calidad de
la informacin obtenida. El semiintervalo - l u - se conoce
como Precisin del Estimador. Lo ideal es tener IC angostos con
una alta confianza.
4
Mtodo general para obtener intervalos de confianza
Sea X
1
, X
2
,..., X
n
una m.a. de una distribucin que depende de un
parmetro . Supongamos que existe una funcin
(es decir, una funcin de la muestra y del parmetro denominado
pivote) cuya distribucin no depende de ni de ningn otro
parmetro desconocido. Entonces, existen dos valores a y b tales
que:
a partir de esta expresin, es posible obtener un intervalo de confianza
para .
son los lmites de confianza, y para una
muestra en particular se obtiene el I. C.
5
Distribucin
muestral del
pivote
pivote
6
7
Representacin de 100 intervalos
de confianza para la media de
una poblacin N(,
2
), con
muestras del mismo tamao n y
coeficientede confianza del 0.95.
Si los intervalos de confianza
mostrados son del 95% significa
que si se construye un gran
nmero de ellos, el 95% de ellos
contendra la media
Est i mac i n de I nt er val os
Enlaprcticaseobtienesolamenteunamuestray secalcula
conellaunintervalo deconfianzadicho intervalo contieneo
no contiene a , no es razonable asignar una probabilidad a
esteevento.
Laproposicinadecuadaesqueel intervalocontienea conunaconfianza
del 95%.
Lalongituddel intervalo deconfianza(u-l) es unamedidadelacalidaddela
informacin obtenida en la muestra, al semi intervalo u-, o -l se le llama
Precisindel estimador.
Qu significado tiene un intervalo grande?
sdeseable que sea grande o que sea pequeo?
Qu relacin tiene con el valor de 1-?
9
usar
10
Ejemplo:
Una muestra aleatoria de 36 cigarrillos de una marca determinada dio
un contenido promedio de nicotina de 3 miligramos. Suponga que el
contenido de nicotina de estos cigarrillos sigue una distribucin normal
conuna desviacin estndar de 1 miligramo.
a) Obtenga e interprete un intervalo de confianza del 95% para el
verdadero contenido promedio de nicotina en estos cigarrillos.
b) El fabricante garantiza que el contenido promedio de nicotina es de
2,9 miligramos, qu puede decirse de acuerdo con el intervalo
hallado?
11
Solucin
a)
Interpretacin:
Tenemos una certeza del 95% de que el verdadero
contenido promedio de nicotina se halla entre
267 y 333 miligramos
b) Como 29 se encuentra en el intervalo hallado no
podemos descartarlo como valor posible del parmetro
12
Ejemplo:
Solucin
13
Solucin
14
usar
b)
15
Ejemplo:
16
Solucin
El redondeo
puede
afectar la
precisin de
los
resultados
17
18
vemos como, efectivamente, cuando
aumenta el nivel de confianza aumenta la
amplituddel intervalo.
19
Ejemplo:
El tiempo (en minutos) que tardaron 15 operarios para
familiarizarse con el manejo de una mquina moderna
adquirida por la empresa fue: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8,
2.9, 5.6, 5.2, 3.7, 3, 3.6, 2.8, 4.8. Suponga que los tiempos
se distribuyen normalmente.
a) Determine e interprete un intervalo del 95% de confianza
para el verdadero tiempo promedio.
b) El instructor considera que el tiempo promedio requerido
por la poblacin de trabajadores que recibe instruccin
sobre esta mquina es superior a 5 minutos, qu se puede
decir de acuerdo con el intervalo hallado?
20
Solucin
a)
Interpretacin:
Tenemos un 95% de certeza de que el verdadero
tiempo promedio que requieren los operarios para
familiarizarse con la mquina est entre 326 y 434
minutos.
b) La apreciacin del instructor no parece ser correcta
ya que el promedio 5 minutos est fuera del intervalo
hallado (aunque debera analizarse con un I.C. unilateral)
21
22
23
Ejemplo
En un estudio sobre los prstamos realizados por dos entidades financieras a
sus clientes, se toma una muestra aleatoria de 6 prstamos de la primera
entidad observando que el importe medio es de 9972 nuevos soles y una
desviacin tpica de 7470 nuevos soles. Una muestra aleatoria, independiente
de la anterior, de tamao 9, de prstamos de la segunda entidad muestra un
importe medio de 2098 nuevos soles y una desviacin tpica de 10834 nuevos
soles. Admitiendo que las dos distribuciones poblacionales de prstamos son
normales con la misma varianza, obtener al nivel del 95 % un intervalo de
confianza para la diferencia entre sus medias poblacionales.
24
Solucin
25
Observemos que este intervalo incluye el cero, lo cual podemos
interpretarlo como que no existe diferencia significativa entre los importes
medios de los prestamos de ambas entidades financieras al 95 % de
confianza.
26
27
Supongamos que una mquina automtica de envasado de un producto
qumico est preparada para depositar 8 c.c. de producto en cada frasco de la
cadena de envasado. Antes de proceder a una revisin y ajuste de la mquina
se toma una muestra aleatoria de 4 frascos observando que la cantidad,
medica en c.c. depositada de producto qumico en cada frasco ha sido:
Despus de revisada y ajustada la mquina se vuelve a tomar otra muestra
aleatoria de 5 frascos, observando que las cantidades depositadas de
producto qumico han sido:
Suponemos que las distribuciones del contenido de producto qumico en los
frascos son normales y que la varianza poblacional vara cuando la mquina
se revisa y se ajusta. Obtener un intervalo de confianza al nivel de confianza
del 98%para la diferenciade las medias poblacionales.
Ejemplo
28
Solucin
29
30
31
Ejemplo
La tabla siguiente muestra el consumo de gasolina por 1000 km de una
muestra aleatoria de 10 automviles con dos carburantes X e Y. Si
admitimos que los consumos de gasolina se distribuyen normalmente,
obtener un intervalo de confianza al nivel del 99 % para la diferencia de las
medias poblacionales.
32
Solucin
Con la
informacin de la
tabla podemos
obtener las
diferencias y
luego la media y
la varianza de las
diferencias di en
el consumo de
gasolina.
33
34
35
36
Ejemplo:
Un ingeniero de control de la calidad midi el espesor de la pared
de 25 botellas de vidrio de 2 litros. La media muestral result 4.05
m.m. y la desviacin tpica 0.08 mm. Obtener un intervalo de
confianza al 90% para la variabilidad del espesor de la pared de
las botellas
Solucin
37
38
Ejemplo:
Unacompaafabricapiezasparaturbinas. Tienedosprocesosdistintos
para hacer el esmerilado de las piezas y ambos procesos producen
terminados conlamismarugosidadpromedio. El ingeniero del proceso
deseaseleccionar el proceso con lamenor variabilidad en larugosidad
de la superficie. Para ello toma una muestra de 12 piezas del primer
proceso, obteniendo una desviacin estndar muestral s
1
= 5.1
micropulgadas, luego toma una muestra de 15 piezas del segundo
proceso, obteniendo s
2
=4.7. Puede elegir el primer proceso con una
confianzadel 90%detener menor variabilidadenlarugosidad?
39
Solucin:
Suponiendo que los dos procesos son Normales e independientes.
UsandolatablaF, obtenemosf
0.95
=2.7386yf
0.05
=0.3898, por lotanto,
Haciendooperaciones:
Como el intervalo incluye la unidad, no se puede concluir que los
procesos tengan variabilidad significativamente diferente con una
confianzadel 90%
) 7386 . 2 ( ) 3898 . 0 (
2
2
2
2
2
1
2
2
7 . 4
1 . 5
7 . 4
1 . 5

23 . 3 46 . 0
2
2
2
1

40
Ejemplo:
Se piensa que la concentracin del ingrediente activo de un
detergente lquido para ropa est afectado por el tipo de catalizador
utilizado en el proceso de fabricacin. Por experiencias anteriores
se supone que la desviacin estndar de la concentracin activa es
de 3 g/l, sin importar el tipo de catalizador utilizado. Se toman 10
observaciones con cada catalizador y se obtienen los siguientes
datos:
Obtn un intervalo de confianza al 90% para el cociente de
varianzas?. Puede suponerse la misma variabilidad en la
concentracin con el empleo de ambos catalizadores?.
41
Solucin
42
Observacin
reemplazando en
el denominador
del pivote p por
su estimador.
Usar
43
Intervalos de confianza unilaterales
44
En una eleccin los votantes deben elegir entre dos candidatos A y B.
Un estudio reciente revel que 1400 personas de un total de 2500
seleccionadas aleatoriamente, tienen preferencia por el candidato A.
a) Obtener un intervalo de confianza al 99% para la verdadera
proporcin de votantes a favor del candidato A. Con base en este
resultado, podra usted afirmar que es probable que A gane la
eleccin? Por qu?
b) Supngase que se selecciona aleatoriamente una muestra de 225
personas con la misma proporcin muestral a favor del candidato A.
Son los resultados diferentes a los del literal a)?
c) En este caso, son razonables las suposiciones para los intervalos
de confianza aproximados del 99%?
Ejemplo:
45
Solucin
La proporcin muestral est dada por:
Y como el tamao de la muestra es mayor a 30, entonces:
46
47
c) Es claro que la distribucin de Xi no es en realidad Bernoulli lo
cual se debe a que en la prctica la seleccin no se hace con
reposicin. Sin embargo, dado que el tamao de la poblacin se
puede suponer grande en relacin a la muestra, la probabilidad de
que se encueste dos o ms veces a una misma persona se puede
suponer despreciable.
En cuanto a la aproximacin por medio de la normal, es razonable
dado que cumple las condiciones de muestra grande.
48
Ejemplo
En Lima se toma una muestra aleatoria de 100 votantes y se encuentra que 25
de ellos estn a favor de un candidato al Congreso. En Arequipa se toma una
muestra aleatoria de 100 votantes y se encuentra que 45 de ellos estn a favor
del candidato. Estimar con un intervalo de 95% de confianza la diferencia de
proporciones.
49
Solucin
Por conveniencia especificamos:
50
Ejemplo
Un ingeniero analiza la resistencia a la compresin del concreto con una
desviacin estndar de 31.62 psi. De una m.a. de 49 especimenes se obtuvo
una resistencia promedio de 3250 psi Construya un I.C al 95% para la
resistenciamedia a la compresinde este concreto.
51
Solucin
Suponga que X
1
,,X
49
es una m.a que representa las resistencias a la
compresin de 49 especimenes de este concreto y suponga que E[Xi]
= y V[Xi] =
2
, i =1,,49. Un I. C. aproximado al 100(1-)% para es:
Donde
52
Tenemos
53
APLICACIN DE LA DESIGUALDAD DE CHEBYCHEV
PARA LA OBTENCIN DE INTERVALOS DE CONFIANZA
54
55
En una central telefnica se seleccionan 150 llamadas telefnicas,
observndose que el tiempo medio que tardan en descolgar el telfono los
receptores de esas llamadas era de 2 segundos, con una desviacin tpica de
0,6segundos. Se pide, para un nivel de confianza del 99%:
1. Sin hacer ninguna hiptesis sobre la poblacin de llamadas telefnicas,
obtener un intervalo de confianza para el tiempo medio que tardan los
usuarios en descolgar el telfono, suponiendo que la desviacin tpica
poblacional es 0,6.
2. Suponiendo que la poblacinde llamadas telefnicas sigue una distribucin
normal con desviacin tpica 0,6, obtener un intervalo de confianza para el
tiempo medio que tardanlos usuarios en descolgar el telfono.
3. Idemal caso anterior pero sin conocer la desviacintpica de la poblacin.
Ejemplo
56
Solucin
57
58
59
Determinacin del tamao de muestra n para
estimar la media poblacional (N infinito)
E = eslamitaddel anchodel intervalodeconfianza
(producto del coeficientey el error estndar) y sedenominaerror
mximodeestimacinE.
n
z
/2 - 1

Dado un valor de error y un cierto nivel de confianza, podemos


estimar cul serael tamaodelamuestra
Anlogamente ocurre para el caso en que no es conocida, y
tendramos:
60
Ejemplo
Se desea estudiar la variable altura de los individuos de
una poblacin, considerando que sta es una variable
que se distribuye de modo gaussiana. Para ello se
tom una muestra de 25 individuos (que podemos
considerar piloto), que ofreci los siguientes resultados:
Calcular el tamao que debera tener una muestra para
que se obtuviese un intervalo de confianza para la
media poblacional con un nivel de confianza al 99% y
conuna precisin de E=1 cm.
61
Solucin
Eneste caso se obtiene:
Por tanto, si queremos realizar un estudio con toda la
precisin requerida en el enunciado se debera tomar
una muestra de 694 individuos. Esto es una indicacin
de gran utilidad antes de comenzar el estudio. Una vez
que el muestreo haya sido realizado, debemos confirmar
que el error para el nivel de significacin dado es inferior
o igual a 1 cm, utilizando la muestra obtenida.
62
Una tienda de donas se interesa en estimar su volumen de ventas
diarias. Supngase que el valor de la desviacin estndar es de
$50.
a) Si el volumen de ventas se encuentra aproximado por una
distribucin normal, cul debe ser el tamao de la muestra para
que con una probabilidad de 0.95 la media muestral se encuentre a
no ms de $20 del verdadero volumen de ventas promedio?
b) Si no es posible suponer que la distribucin es normal, obtener el
tamao necesario de la muestra para la pregunta anterior.
Ejemplo
63
Solucin
64
Determinacin del tamao de muestra n para
estimar la media poblacional (N finito)
E= eslamitaddel anchodel intervalode
confianza (producto del coeficiente y el error estndar) por el
factor de correccin para poblacin finita y se denomina error
mximodeestimacinE.
1 n
z
/2 - 1

N
n N

Dadounvalor deerror yunciertonivel deconfianza, podemos


estimar cul serael tamaodelamuestra
) 1 (
2 2 2
2 / 1
2 2
2 / 1
+
=

N E z
N z
n

65
Ejemplo
Inters: Conocer el salario semanal promedio de
trabajadores en una zona de cierto distrito de Lima (se
asume que son 1800 trabajadores).
El estudio queremos realizarlo mediante una muestra y
necesitamos calcular el tamao de muestra n, considerando
un grado de confianza del 95%. Los resultados de un estudio
preliminar proporciona un promedio de 210 nuevos soles y
una desviacin estndar de 30 nuevos soles semanal. Con
un error relativo del 6%, obtener el tamao de n.
66
Solucin
Definicin de error relativo:
Er = (E/media)*100 E = (Er*media)/100
Por consiguiente:
E= (6*210)/100 =12.6
Grado de confianza 95%, nos indica que Z=1.96.
Reemplazando valores en la formula se tiene:
n=[(1.96)
2
(30)
2
(1800)]/[1.96
2
(30)
2
+(12.6)
2
(1799)] =22
Por tanto, n=22 se requiere como mnimo 22 trabajadores.
67
Determinacin del tamao de muestra n para
estimar la proporcin poblacional (N infinito)
E= eslamitaddel anchodel intervalodeconfianza
(producto del coeficiente y el error estndar) y se denomina
error mximodeestimacinE.
n

z
/2 - 1
q p

Dadounvalor deerror yunciertonivel deconfianza, podemos


estimar cul serael tamaodelamuestra
2
2
2 / 1

E
q p z
n

=
68
Observacin:
Si se desconoce el valor de p, se
debe utilizar p =0.5.
Se utilizarn diferentes valores y
se sustituirn en la formula para
observar los diferentes tamaos
de muestras. El nivel de
confianza que se utilizar es del
95% con un error de estimacin
de 0.30.
69
Ejemplo
Para poder controlar la fabricacin de un producto se toman 85
muestras de un determinado componente y se concluye que 10 de
ellos no cumplen las especificaciones. Cul debera ser el tamao
de la muestra si se quiere que el error cometido al estimar la
proporcin sea menor de 0.05 con una probabilidad 0.95?.
Solucin
70
71
Ejemplo
72
Solucin
73
Determinacin del tamao de muestra n para
estimar la proporcin poblacional (N finito)
E = eslamitaddel anchodel intervalode
confianza (producto del coeficiente y el error estndar) y se
denominaerror mximodeestimacinE.
1 n

z
/2 - 1

N
n N q p

Dadounvalor deerror yunciertonivel deconfianza, podemos


estimar cul serael tamaodelamuestra
) 1 (


2 2
2 / 1
2
2 / 1
+
=

N E q p z
q p N z
n

74
Ejemplo
El Director de un Colegio Nacional desea calcular la proporcin de los
1000 alumnos de ltimo ao que piensan seguir estudios en la
universidad. Qu tamao debe tener la muestra que necesita tomar el
director si su estimacin debe estar a 0,04 del valor verdadero. con 99%
de confianza?
El ao anterior, el 70% de los alumnos encuestados dijeron que tenan
planeado seguir estudios en la universidad.
75
76
Clculo del Tamao de la Muestra para Estimar
la Diferencia de Medias
Si se recuerda a la distribucin muestral de diferencia de medias se tiene
que error esta dado por:
En esta ecuacin se nos pueden presentar dos casos:
- Los tamaos de muestra son iguales.
- Los tamao de muestra son diferentes.
Para el primer caso no se tiene ningn problema, se eleva al cuadrado la
ecuaciny se despeja n ya que n
1
es igual a n
2
.
77
Para el segundo caso se pondr una n en funcin de la otra. Este caso se
utiliza cuando las poblaciones son de diferente tamao y se sabe que una
es K veces mayor que la otra.
78
Ejemplo
Un director de personal quiere comparar la efectividad de dos mtodos de
entrenamiento para trabajadores industriales a fin de efectuar cierta operacin
de montaje. Se divide un nmero de operarios en dos grupos iguales: el
primero recibe el mtodo de entrenamiento 1, y el segundo, el mtodo 2. Cada
uno realizar la operacin de montaje y se registrar el tiempo de trabajo. Se
espera que las mediciones para ambos grupos tengan una desviacin estndar
aproximadamente de 2 minutos. Si se desea que la estimacin de la diferencia
en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95, cuntos trabajadores se tienen que incluir en cada
grupo de entrenamiento?
Solucin
Se tiene que:
1
=
2
=2 y =0.95 Z
0.975
=1.96
Cada grupo debe contener aproximadamente 31 empleados.
79
Clculo del Tamao de la Muestra para Estimar
la Diferencia de Proporciones
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que
error esta dado por:
En esta ecuacinse nos puedenpresentar dos casos:
- Los tamaos de muestra son iguales.
- Los tamao de muestra son diferentes.
Para el primer caso no se tiene ningn problema, se eleva al cuadrado la
ecuaciny se despeja n ya que n
1
es igual a n
2
.
80
Para el segundo caso se pondr una n en funcin de la otra. Este caso se
utiliza cuando las poblaciones son de diferente tamao y se sabe que una es
K veces mayor que la otra.
81
Ejemplo
Una compaa de productos alimenticios contrat a una empresa de
investigacin de mercadotecnia, para muestrear dos mercados, I y II, a fin de
comparar las proporciones de consumidores que prefieren la comida
congelada de la compaa con los productos de sus competidores. No hay
informacin previa acerca de la magnitud de las proporciones P
1
y P
2
. Si la
empresa de productos alimenticios quiere estimar la diferencia dentro de
0.04, con una probabilidad de 0.95, cuntos consumidores habr que
muestrear en cada mercado?
Solucin
Se tendr que realizar encuestas a 1201 consumidores de cada mercado
para tener una estimacin con una confianza del 95% y un error mximo de
0.04.
82
Ejercicio
Para calibrar un nuevo aparato de medida, un investigador realiz 15
mediciones, en las que obtuvo los siguientes errores:
-0.10 -0.15 0.00 0.50 0.10 -0.20 -0.15 0.20 0.25 0.30 -0.45 -0.40
0.35 0.25 -0.50
Suponiendoque los errores se distribuyensegnuna ley normal,
(a) calcula un intervalo de confianza del error medio de medida con
coeficientede confianza 0,99.
(b) Sabiendo que la desviacin tpica del error es menor o igual a 0,4,
cuntas medidas sern necesarias para obtener con probabilidad 99% una
estimacin del error medio de medida con un error mximo menor o igual a
0,1?
(c) Suponiendo que un aparato de medida se considera admisible si la
desviacin tpica de los errores de medida que produce es menor o igual que
0,3, determina si dicho aparato puede ser admisible al nivel de confianza del
99%.
I nt er val os de Tol er anc i a
Concepto
En ocasiones no nos interesaestimar algn parmetro, sino establecer un rango
en dondesepuedeesperar quecaigan observaciones (datos) individuales en un
proceso.
Larespuestaes muy sencillasi seconoceladistribucin y los parmetros dela
poblacin, por ejemplo, si se obtuvo una muestra aleatoria de una poblacin
Normal con media y varianza
2
conocidas, se esperar que el 95% de los
datoscaernentreloslmites
1.96
A este intervalo se le llama intervalo de tolerancia y si y son conocidos la
coberturadel 95%esexacta
Si y son desconocidos a veces se puede determinar una
constantek tal quelos lmites constituyan un intervalo de
tolerancia para una distribucin normal. En este caso los lmites
del intervalo son variables aleatorias y la proporcin de datos
cubiertapor el intervalonoesexacta.
A medida que n tiende a infinito la longitud de un intervalo de
confianzatiendeacero.
A medida que n tiende a infinito la longitud de un intervalo de
toleranciatiendeal valor quetendrasi seconocierantodos los
parmetrosdelapoblacin.
Observaciones
85
Resumen de intervalos de confianza
Ot r os i nt er val os de Conf i anza
Resumen de intervalos de confianza
Parmetros de inters Suposiciones
La media
Dist. Muestral Normal (o n grande)
2
conocida

2
desconocida (Dist. Muestral t)
La varianza
2
Dist. Normal (Dist. Muestral Chi
2
)
Proporcin p Dist. Muest. Normal (N grande, p alejado de 0 y de 1)
Cociente de varianzas

1
2
/
2
2
Dos poblaciones Normales e independientes (Dist.
Muestral tipo F)
Diferencia de medias

2
Distribuciones
normales,

1
2
y
2
2
conocidas

1
2
=
2
2
desconocidas (Dist muest t)

1
2

2
2
desconocidas (Dist muest t)
Diferencia entre dos
proporciones p
1
-p
2
Dist. Muestral Normal (n
1
y n
2
grandes, p
1
y p
2
alejados de 0 y de 1)
Otras... (Ver libros de estadstica)
87
88