Académique Documents
Professionnel Documents
Culture Documents
confianza
Asignatura: Estadística II
1
Ejercicios propuestos ................................................................................................................ 41
Intervalo de confianza para el cociente de varianzas ....................................................................... 43
Ejemplos resueltos ........................................................................................................................ 45
Ejercicios propuestos .................................................................................................................... 47
Intervalo de confianza para la diferencia de proporciones .............................................................. 48
Ejercicios resueltos ........................................................................................................................ 50
Ejercicios propuestos .................................................................................................................... 52
2
Apuntes de intervalo de confianza
En una población cuya distribución es conocida, pero desconocemos algún
parámetro, podemos estimar dicho parámetro a partir de una muestra
representativa.
¿Qué es un estimador?
Un estimador es un valor que puede calcularse a partir de los datos muestrales y
que proporciona información sobre el valor del parámetro, Por ejemplo, la media
muestral es un estimador de la media poblacional, la proporción observada en la
muestra es un estimador de la proporción en la población.
Una estimación de intervalo de 𝜃 es un intervalo de la forma 𝜃̂1 < 𝜃 < 𝜃̂2 , donde 𝜃̂1
y 𝜃̂2 son valores de variables aleatorias apropiadas. Por “apropiada” queremos decir
3
¿Qué es un intervalo de confianza?
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la
muestra, que posiblemente incluya el valor de un parámetro de población
desconocido. Debido a su naturaleza aleatoria, es poco probable que dos muestras
de una población en particular produzcan intervalos de confianza idénticos. Sin
embargo, si usted repitiera muchas veces su muestra, un determinado porcentaje
de los intervalos de confianza resultantes incluiría el parámetro de población
desconocido. Este parámetro será habitualmente una proporción en el caso de
variables dicotómicas, y la media para distribuciones normales.
Dado un nivel de confianza, 1 , se llama valor crítico 2 z al valor que en una N
4
Es decir:
5
Intervalo de confianza para la media poblacional
Dada una variable aleatoria con distribución Normal N (μ, σ), el objetivo es la
construcción de un intervalo de confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.
Sabemos, por el teorema central del límite, que la media muestral 𝑥̅ tiene una
𝜎
distribución normal 𝑁 (𝜇, ).
√𝑛
𝑥̅ −𝜇
Por tanto, la variable tipificada 𝑧 = 𝜎 se distribuye según una normal N (0,1).
⁄ 𝑛
√
6
Por lo tanto, debe verificarse:
𝑥̅ − 𝜇
𝑃 (−𝑧𝛼⁄2 ≤ 𝜎 ≤ 𝑧𝛼⁄2 ) = 1 − 𝛼
⁄ 𝑛
√
Multiplicando cada termino de las desigualdades por 𝜎⁄ , se obtiene:
√𝑛
𝑃 (−𝑧𝛼⁄2 𝜎⁄ ≤ 𝑥̅ − 𝜇 ≤ 𝑧𝛼⁄2 𝜎⁄ ) = 1 − 𝛼
√𝑛 √𝑛
Si se resta 𝑥̅ a cada uno de los términos, resulta:
7
Ejemplos resueltos
1) Un equipo de profesores de educación física está interesado en conocer el
número promedio de flexiones continuadas que realizan sus alumnos. Para
ello, seleccionan una muestra aleatoria de 80 estudiantes, cuyos resultados
figuran en la siguiente tabla:
N° de 35 41 45 46 48 50 52 53 54 56 60
flexiones
N° de 5 6 5 2, 10 15 6 11 10 5 5
alumnos
Hallar el nivel de confianza al 95%
Datos:
Calculamos el valor crítico para el nivel de confianza del 95%. Y buscamos ahora
en la tabla el valor de Z que deja a la izquierda una probabilidad de 0,95,
obteniendo (aprox.):
𝑍1−𝛼 = 𝑍1−0,05 = 𝑍0,975 = 1,96
2 2
n°= 80
𝑥̅ = 49,78
𝛼 = 2,75
Sustituyendo en la formula del intervalo de confianza:
𝐼 = [𝑥̅ −𝑧1−𝛼⁄ 𝜎⁄ ; 𝑥̅ + 𝑧1−𝛼⁄ 𝜎⁄ ]
2 √𝑛 2 √𝑛
2,75 2,75
𝐼 = [49,78 − 1,96 ∗ ; 49,78 + 1,96 ∗ ]
√80 √80
𝐼 = [49,18 ; 50,38]
∴ El número promedio de flexiones continuadas que realizan sus alumnos con un
intervalo de confianza para el 95% será: 𝐼𝐶95 = [49,18 ; 50,38].
8
pueden afirmar con probabilidad de 0,99 acerca del error máximo de su
estimación?
Datos:
n = 150
𝜎 = 6.2
𝑍1−𝛼 = 𝑍1−0,01 = 𝑍0,995 = 2,58
2 2
𝐸𝐸 = 𝑧1−𝛼⁄2 ∗ 𝜎⁄
√𝑛
𝐸𝐸 = 𝑧1−0,01⁄ ∗ 6,2⁄
2 √150
𝐸𝐸 = 2,58 ∗ 6,2⁄
√150
𝐸𝐸 = 1,306067931
Así, los expertos en eficiencia pueden afirmar con probabilidad de 0,99 que su
error será menor que 1,306067931
9
Ejercicios propuestos
1) Un meso terapeuta desea estimar, con el 95% de confianza, la media de fuerza
máxima de un músculo particular en cierto grupo de personas. Se inclina a
suponer que los valores de dicha fuerza muestran una distribución
aproximadamente normal con una varianza de 121. Una muestra de 24
individuos que participaron en el experimento proporcionó una media de 84.6.
2) Suponga que un investigador, interesado en obtener una estimación del nivel
promedio de alguna molécula proteica en cierta población de seres humanos,
toma una muestra de 25 individuos, determina el nivel de la molécula proteica
en cada uno de ellos, y calcula la media de la muestra 𝑥̅ = 34. Además, que la
variable de interés sigue una distribución normal, con una varianza de 39. Se
desea estimar el valor de µ.
3) Si se puede realizar la hipótesis de que el consumo de combustible sigue una
distribución normal, veamos el intervalo de confianza para la media al 95%,
suponiendo conocida la varianza (igual a 7684,3 𝑙 2 ). Se recoge una muestra
aleatoria simple de tamaño 20, y se obtiene una media muestral de 3937,9 𝑙.
4) El tiempo de renovación de un teléfono móvil, expresado en años, se puede
aproximar mediante una distribución normal con desviación típica 0,4 años. Se
toma una muestra aleatoria simple de 100 usuarios y se obtiene una media
muestral igual a 1,5 años. Determínese un intervalo de confianza al 95% para
el tiempo medio de renovación de un teléfono móvil.
5) En una población normal con varianza conocida se ha tomado una muestra de
tamaño 49 votantes para escoger a un tesorero y se ha calculado su media: x
=4,2. Determine la varianza de la población sabiendo que el intervalo de
confianza al 95% para la media poblacional es (3.64, 4.76).
10
Caso 2: intervalo de confianza para la media de una distribución normal de varianza
desconocida.
𝑝 (−𝑡𝛼 ≤ 𝑡 ≤ 𝑡𝛼 ) = 1 − 𝛼
2 2
𝑥̅ −𝜇 𝑥̅ −𝜇
Como 𝑡 = 𝑠 , será 𝑝 (−𝑡𝛼 ≤ 𝑠 ≤ 𝑡𝛼 ) = 1 − 𝛼
⁄ 𝑛 2 ⁄ 𝑛 2
√ √
obtiene: 𝑝 (𝑥̅ − 𝑡𝛼 𝑠⁄ ≤ 𝜇 ≤ 𝑥̅ + 𝑡𝛼 𝑠⁄ ) = 1 − 𝛼
2 √𝑛 2 √𝑛
𝐼 = (𝑥̅ − 𝑡𝛼 𝑠⁄ ; 𝑥̅ + 𝑡𝛼 𝑠⁄ )
2 √𝑛 2 √𝑛
11
Ejemplos resueltos
1) Se trata de hallar un intervalo de confianza del 95% para cubrir la vida media de
una población de lámparas halógenas a partir de los resultados que se han
obtenido en una muestra de 20 lámparas, cuyos periodos de duración
(expresados en horas) han sido:
480 345 427 386 432 429 378 440 434 503
436 451 466 394 422 412 507 433 480 429
Se supone que la duración de las lámparas sigue una distribución normal, pero se
desconocen la media y la varianza de la población.
Por ejemplo: Es decir se dice que de una población de 100 lámparas halógenas se
escogen una muestra de 20 lámparas halógenas.
𝑥̅ = 434,2
𝑠 = 40,63
𝑥̅ − 𝜇
𝑡=𝑠
⁄ 𝑛
√
Sigue una distribución de Student con 19 g.l. El nivel 𝛼 = 0,05 proporciona en las
tablas un valor critico 𝑡𝑜,𝑜25 = 2,093.
40,63 40,63
𝐼 = (434,2 − 2,093 ∗ ; 434,2 + 2,093 ∗
√20 √20
12
2) Un psicólogo escolar quiere estimar la media de tiempo de reacción a un
determinado estimulo de los alumnos de 1° de primaria. Para ello ha elegido una
muestra de 35 niños obteniendo un tiempo medio de 1,12 minutos y una
desviación típica de 0,21 minutos. Hallar el intervalo de confianza para el tiempo
medio de reacción con un nivel de significación del 8%.
(𝑥̅ − 𝑧𝛼 𝑠⁄ ; 𝑥̅ + 𝑧𝛼 𝑠⁄ )
2 √𝑛 2 √𝑛
Datos
n = 35
𝑠 = 0,21
𝑥̅ = 1,12
𝑍1−𝛼 = 𝑍1−0,08 = 𝑍0,96 = 1,75
2 2
Calculamos el valor crítico para el nivel de confianza del 92% (pues 𝛼 = 0,08)
luego:
(𝑥̅ − 𝑧𝛼 𝑠⁄ ; 𝑥̅ + 𝑧𝛼 𝑠⁄ )
2 √𝑛 2 √𝑛
𝐼 = (1,06 ; 1,18)
13
Ejercicios propuestos
1) Se utilizaron dos grupos de estudiantes, uno de los grupos es de un colegio
particular para aplicar el experimento y el otro grupo de un colegio municipal
como control. El grupo con el que se experimentó recibió una hora de charla por
partes de un trabajador de una universidad para informales sobre sus carreras y
el modo de postulación. El grupo de control no recibió esta charla. Para evaluar
el esfuerzo de cada estudiante por estudiar, matemática, lenguaje, ciencias y
historia dentro del entorno educacional universitaria, se utilizó una lista de cotejo
para la evaluación de postulación que incluye criterios de referencia. Una tarea
bien hecha recibió una calificación de 1. El grupo de control, formado por 15
individuos, alcanzo una calificación media de 15.9 en la evaluación, con una
desviación estándar de 3.681. Se supone que el grupo de control se comportó
como una muestra aleatoria extraída de una población similar de individuos. Se
pretende utilizar los datos de la muestra para estimar la calificación media para
la población.
14
4) Se desea estimar la concentración media de amilasa en suero de una población
sana. Las mediciones se efectuaron en una muestra de 15 individuos
aparentemente saludables. La muestra proporcionó una media de 96
unidades/100ml y una desviación estándar de 35 unidades/100ml. La varianza
se desconoce.
5) Se ha obtenido una muestra de 15 vendedores de una Editorial para estimar el
valor medio de las ventas por trabajador en la Empresa. La media y varianza de
la muestra (en miles de euros) son 5 y 2, respectivamente.
a) Intervalo de confianza para la venta media por trabajador en la Editorial al 90
%.
b) Intervalo de confianza para la varianza de las ventas por trabajador en la
Editorial al 90 %.
15
Intervalo de confianza para la varianza
La varianza poblacional suele ser desconocida. Para estimarla, se utiliza la cuasi
varianza muestral, que es un estimador insesgado de la varianza de la población. Si
se pretende hallar un intervalo de confianza para la varianza, cuando la muestra se
obtiene a partir de una población normal, sabemos que el estadístico
(𝑛 − 1)𝑠 2
𝑥=
𝜎2
2 2 2
𝑝 = (𝑥1− 𝛼⁄ < 𝑥 < 𝑥𝛼⁄ ) = 1 − 𝛼
2 2
Siendo 𝑥𝛼2⁄ el valor de la 𝑥 2 con n-1 g.l. que deja un área de 𝛼⁄2 unidades a la
2
derecha y 𝑥1−2 𝛼
𝛼⁄ el valor de la 𝑥 con n-1 g.l., que deja un área de 1 − ⁄ a la
2
2 2
izquierda.
(𝑛−1)𝑠2
Sustituyendo el valor de 𝑥 2 , resulta: 𝑝 = (𝑥1−
2
𝛼⁄ < < 𝑥𝛼2⁄ ) = 1 − 𝛼
2 𝜎2 2
2 1 1 1
𝑝 = (𝑥1− 𝛼⁄ ∗ 2
< 2 < 𝑥𝛼2⁄ ∗ )= 1−𝛼
2 (𝑛 − 1)𝑠 𝜎 2 (𝑛 − 1)𝑠 2
(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
𝐼=( ; 2 )
𝑥𝛼2⁄ 𝑥1−𝛼⁄
2 2
16
Ejemplos resueltos
1) En una prueba efectuada a 25 animales de una determinada especie, cuya
población está distribuida normalmente, se obtuvo una media de 82 y una
desviación típica muestral de 0,85. Vamos a construir un intervalo de
confianza del 90% para la varianza de la población.
Datos:
𝑠 2 = 0,852 = 0,7225
𝛼 𝛼
𝛼 = 0,10 ; = 0,0 5 𝑦 1 − 2 = 0,95
2
2 2
𝑥0,05;24 = 36,415 𝑦 𝑥0,95;24 = 1,3848
24 ∗ 0,7225 24 ∗ 0,7225
𝐼=( ; )
36,415 13,848
𝐼 = (0,47 ; 1,25)
𝐼 = (0,68 ; 1,11)
17
2) En 16 vueltas de trote, el consumo de energía de una persona experimental
tuvo una desviación estándar de 3.4. Construir un intervalo de confianza del
95% para la varianza y para la desviación estándar esperadas de la energía
de la persona.
Datos:
Suponiendo que los datos pueden considerarse como una muestra aleatoria tomada
de una población normal, usamos n = 16 y s=3.4. Ahora necesitamos los valores de
Chi cuadrada para el caso específico.
15 ∗ (3.4)2 15 ∗ (3,4)2
𝐼=( < 𝜎2 < )
32,8 4,6
Es decir:
18
Ejercicios propuestos
1) Una muestra de 26 personas seleccionadas al azar de una población de un
barrio tiene una media salarial de 1800 euros y una varianza de 6 10.000 euros.
Estime la varianza salarial en el barrio a un nivel confianza de 90.
2) Se desea estimar la demanda diaria de un producto que registra una empresa.
Para ello se seleccionan 10 días al azar con los siguientes valores en miles 35,
44, 38, 55, 33, 56, 67, 45, 48, 40. Obtenga el intervalo de confianza para la
varianza un nivel de confianza del 90 %.
3) Una agencia de alquiler de automóviles necesita estimar el número medio de
kilómetros diarios que realiza su flota de automóviles; a tal fin, a lo largo de
varios días, se anotan los recorridos de cien vehículos de su flota y obtiene que
la media muestral es de 165km/día y que la desviación muestral es 6km/día.
Hallar un intervalo de confianza al 90 % para la varianza de dicha distribución.
4) Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de
pasto distribuidas por cierta empresa: 46.4, 46.1, 45.8, 47.0, 46.1. 45.9, 45.8,
46.9, 45.2 y 46.0. Calcule un intervalo de confianza del 95% para la varianza
de todos los pesos de este tipo de paquetes de semillas de pasto distribuidos
por la empresa. Suponga una población normal.
5) Los datos adjuntos sobre voltaje de ruptura de circuitos eléctricamente
sobrecargados se tomaron de un diagrama de probabilidad normal que apareció
en un artículo “. La linealidad del diagrama apoyó de manera firme la suposición
de que el voltaje de ruptura está aproximadamente distribuido en forma normal.
1470 1510 1690 1740 1900 2000 2030 2100 2190
2200 2290 2380 2390 2480 2500 2580 2700
19
Intervalo de confianza para la proporción
Sea p la proporción de “éxitos” en una población, donde éxito identifica a un
individuo u objeto que tiene una propiedad específica (p. ej., individuos que se
graduaron en una universidad, computadoras que no requieren servicio de garantía,
etc.). Una variable aleatoria de n individuos que tiene que ser seleccionada y X es el
número de éxitos en la muestra.
El porcentaje de productos defectuosos de unos procesos de manufactura es el
barómetro más importante para medir la calidad del proceso para manufacturar un
producto dado, ya que un artículo puede estar defectuoso o no, el número de
unidades defectuosas es una variable aleatoria binomial, si se supone una
probabilidad constante e independencia. En una muestra aleatoria de tamaño n el
parámetro p que representa la proporción de artículos defectuosos es desconocido.
Se desea determinarse un intervalo de confianza para p. A pesar de que es posible
determinar intervalo de confianza exactos para p, se optara por un intervalo de
confianza basado en una muestra grande. La razón de esta decisión tiene sus raíces
en el teorema 5.1 el cual establece que:
Teorema 5.1: Sea X una variable aleatoria binomial con media no y desviación
estándar √𝑛𝑝(1 − 𝑝). La distribución de la variable aleatoria tiende al normal
estándar conforme el número de ensayos independientes 𝑛 → ∞.
𝑋−𝑛𝑝
𝑌=
√𝑛𝑝(1−𝑝)
Donde q=1-p
20
Dando un nivel de confianza, 1 − 𝛼, y haciendo lo mismo que en el caso de la media,
se obtiene el siguiente intervalo de confianza para la proporción de la población:
𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝐼 = (𝑝̂ − 𝑧𝛼⁄2 ∗ √ , 𝑝̂ + 𝑧𝛼⁄2 ∗ √ )
𝑛 𝑛
𝑝̂𝑞̂
En cuanto al error: 𝐸𝐸 = 𝑧𝛼⁄2 ∗ √ 𝑛
2
𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂ 𝐸𝐸 𝑝̂ 𝑞̂ 𝐸𝐸
𝐸𝐸 = 𝑧𝛼⁄2 ∗ √ → √ = → =( ) →
𝑛 𝑛 𝑧𝛼⁄2 𝑛 𝑧𝛼⁄2
𝑝̂ 𝑞̂ 𝑧𝛼⁄2 2
𝑛= 2 → 𝑛 = 𝑝̂ 𝑞̂ ∗ ( )
𝐸𝐸
𝐸𝐸
(𝑧 )
𝛼⁄
2
21
Ejemplos resueltos
1) En una muestra aleatoria de n = 500 familias que tienen contratado vtr en la
ciudad de Santiago, chile, se encuentra que x = 340 están suscritas a Netflix.
Calcule un intervalo de confianza del 95% para la proporción real de familias
que tienen contratado vtr en esta ciudad y están suscritas Netflix.
Datos:
La estimación puntual de 𝑝 𝑒𝑠 𝑝̂ = 340⁄500 = 0,68. Si usamos la tabla normal
encontramos que 𝑧0,025 = 1,96. Por lo tanto, el intervalo de confianza del 95%
para p es
𝑝̂ 𝑞̂ 𝑝̂ 𝑞̂
𝐼 = (𝑝̂ − 𝑧𝛼⁄2 ∗ √ , 𝑝̂ + 𝑧𝛼⁄2 ∗ √ )
𝑛 𝑛
𝐼 = (0,639 ; 0,7209)
∴ la proporción real de familias que tienen contratado vtr en esta ciudad y están
suscritas a Netflix se encuentra entre los 0,639 y 0,7209 con un nivel de confianza
del 95%.
22
2) Tomando al azar una muestra de 300 personas mayores de 15 años en una
gran ciudad, que se encuentra que 104 de ella leían el periódico
habitualmente. Hallar, con un nivel de confianza del 90% un intervalo para
estimar la proporción de lectores de periódico entre los habitantes de esa
ciudad mayores de 15 años.
Datos:
104
La proporción muestral es: 𝑝̂ = 300 = 0,347
𝑝̂∗𝑞̂ 𝑝̂∗𝑞̂
Luego sustituyendo en la fórmula: 𝐼 = (𝑝̂ − 𝑧𝛼⁄2 ∗ √ , 𝑝̂ + 𝑧𝛼⁄2 ∗ √ )
𝑛 𝑛
∴ Los lectores de periódico entre los habitantes de esa ciudad mayores de 15 años
se encuentran entre los 0,302 y 0,392 con un nivel de confianza del 90%.
23
Ejercicios propuestos
1) Un fabricante asegura, a una compañía que le compra un producto en forma
regular, que el porcentaje de productos no defectuosos es mayor del 45%. La
compañía decide comprobar la afirmación del fabricante seleccionando, de su
inventario 300 unidades de este producto y probándolas. ¿Deberá sospechar la
compañía de la afirmación del fabricante si se descubren un total de 34 unidades
no defectuosas en la muestra?
2) Una empresa dedicada a la venta de palomitas compra el maíz directamente a
los agricultores. Antes de efectuar la compra, un agente de la compañía quiere
estimar la probabilidad de que el grano de maíz se abra al freírlo. Ha realizado
un estudio sobre una pequeña muestra de 60 granos, de los que 48 sea abrían.
¿Cuántos granos deberá examinar para estar seguro al nivel del 90% de que el
error que cometa no superará el 1%?
3) ¿De qué tamaño habría que elegir una muestra para estimar la proporción de
alumnos del instituto que le gusta el futbol con un nivel de confianza del 95% y
un error inferior a 0,05, si una muestra de 10 alumnos, 6 de ellos respondieron
que le gustaba el futbol?
4) Se pregunto a 80 pacientes si habían sufrido algún trastorno tras seguir un
tratamiento, de los cuales 60 dijeron que no. La muestra es grande y no
esperamos que el porcentaje real en caso de haber sido extendido a muchos mas
pacientes sea muy diferente. Por lo tanto, el error estándar es:
24
Intervalo de confianza para las diferencias de medias
Si tenemos dos poblaciones con medias 𝜇1 𝑦 𝜇2, varianzas 𝜎1 𝑦 𝜎2, respectivamente,
el estadístico que da un estimador puntual de la diferencia entre 𝜇1 𝑦 𝜇2 es 𝑥̅1 − 𝑥̅2 .
Por lo tanto, para obtener una estimación puntual de 𝜇1 − 𝜇2 , se seleccionan dos
muestras aleatorias independientes, una de cada población, de tamaños 𝑛1 𝑦 𝑛2 , se
calcula 𝑥̅1 − 𝑥̅ 2 , la diferencia de las medias muestrales. Evidentemente, debemos
considerar la distribución muestral de 𝑥̅1 − 𝑥̅2 .
Teorema: si 𝑥̅1 − 𝑥̅2 son las medias de dos muestras aleatorias independientes
de tamaño 𝑛1 𝑦 𝑛2 tomadas de poblaciones que tienen varianzas conocidas
𝜎12 𝑦𝜎22 , respectivamente, entonces el intervalo de confianza para 𝜇1 − 𝜇2 :
25
Ejemplos resueltos
1) Construya un intervalo de confianza del 94% para la diferencia real entre las
duraciones de dos marcas de focos, si una muestra de 40 focos tomada al azar
de la primera marca dio una duración media de 418 horas, y una muestra de 50
focos de otra marca dieron una duración media de 402 horas. Las desviaciones
estándares de las dos poblaciones son 26 horas y 22 horas, respectivamente.
Datos:
262 222
𝐼 = ((418 − 402) − 1,88 ∗ √ + ≤ 𝜇1 − 𝜇2
40 50
262 222
≤ 418 − 402) + 1,88 ∗ √ + )
40 50
𝐼 = (6,3 ≤ 𝜇1 − 𝜇2 ≤ 25,7)
26
2) Se llevo a cabo un experimento donde se compararon dos tipos de motores, el
A y el B. Se midió el rendimiento de combustible en millas por galón. Se realizaron
50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina utilizada
y las demás condiciones se mantuvieron constantes. El rendimiento promedio de
gasolina para el motor A fue de 36 millas por galón y el promedio para el motor
B fue de 42 millas por galón. Calcule un intervalo de confianza del 96% sobre
𝜇1 − 𝜇2 , donde 𝜇1 𝑦 𝜇2 corresponden a la media de la población del rendimiento
de millas por galón para los motores A y B, respectivamente. Suponga que las
desviaciones estándar de la población son 6 y 8 para los motores A y B,
respectivamente.
Datos:
La estimación puntual de 𝜇1 − 𝜇2 es 𝑥̅1 − 𝑥̅ 2 = 42 - 36 = 6. Si usamos α = 0.04,
obtenemos 𝑧0,02 = 2.05 de la tabla normal. Por lo tanto, sustituyendo en la
formula anterior, el intervalo de confianza del 96% es
64 36 64 36
𝐼 = (42 − 36 − 2,05 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ 42 − 36 + 2,05 ∗ √ + )
75 50 75 50
𝐼 = (3,43 ≤ 𝜇1 − 𝜇2 ≤ 8,57)
27
Ejercicios propuestos
1) El gasto diario en llamadas telefónicas de dos departamentos X e Y de una
misma empresa sigue una distribución normal, con gasto medio desconocido
en ambos. Sin embargo, se conocen las desviaciones típicas, que son 100 y
110 céntimos de euro para X e Y, respectivamente. La dirección ha observado
que una muestra aleatoria de 20 días, el gasto medio diario en llamadas
realizadas por el departamento X ha sido de 1100 céntimos, y de 1400 en el
departamento Y. obtener un intervalo de confianza para la diferencia de
gastos entre ambos departamentos.
28
vida útil respectiva de 1230 horas y 1190 horas; ¿es acertada la decisión del
consumidor si decide adquirir la marca a? Aplique el nivel de confianza del
95% y suponga que las dos poblaciones tienen distribución normal con
desviaciones estándar respectivamente de 120 y 160 horas.
4) El salario diario promedio para una muestra de 𝑛1 = 30 empleados de una
empresa manufacturera grande es 𝑥1 = $28000 con una desviación estándar
de 𝑠1 = $1400, en otra empresa grande, una muestra aleatoria de 𝑛2 = 40
empleados tiene un salario promedio diario de 𝑥2 = $27000, con desviación
estándar muestral de 𝑠2 = $1000. El intervalo de confianza del 99% para
estimar las diferencias entre los niveles diarios de salarios en las dos
empresas es:
29
Intervalo de confianza para la diferencia de media con varianza desconocidas pero
iguales, 𝜎12 = 𝜎22 = 𝜎 2
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadística para verificar si éstas son iguales o diferente s. Para hacerlo debemos hace
r uso de la distribución F, bien sea mediante el cálculo de la probabilidad de que la
muestra tomada provenga de dos poblaciones con varianzas iguales, o mediante el uso
de un intervalo de confianza para la relación de dos varianzas, según se estudiará más
adelante. Como se desconocen las varianzas de la población, se usa n las varianzas de
las muestras como estimadores. El procedimiento por seguir para el cálculo del intervalo
de confianza para la diferencia de dos medias será el siguiente:
c) Donde 𝑠𝑝 es un estimador combinado de las 𝑠 2 , “mejor” que 𝑠12 , 𝑠22 por separado,
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22
donde 𝑠𝑝2 = 𝑛1 +𝑛2 −2
Teorema: Si 𝑥1 , 𝑥2 , 𝑠12 , 𝑠22 son las medias y las varianzas de dos muestras aleatorias de
tamaños 𝑛1 , 𝑛2 , respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas pero iguales, entonces un intervalo de
confianza para la diferencia entre medias 𝜇1 − 𝜇2 :
30
Ejercicios resueltos
1) La siguiente tabla representa los resultados de dos muestras aleatorias para
comprar el contenido de nicotina de dos marcas de cigarrillos.
Marca A Marca B
𝑛𝑖 10 8
𝑥̅𝑖 3,1 2,7
𝑠𝑖 0,5 0,7
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de
poblaciones normales con varianzas desconocidas e iguales, construya su intervalo
de confianza del 95% para la diferencia real de nicotina de las dos marcas.
Datos: Como la varianza son iguales, calculamos 𝑠𝑝2 que este dado por:
𝑠𝑝 = 0,596
1 1 1 1
𝐼 = 𝑥̅1 − 𝑥̅2 − 𝑡 ∗ 𝑠𝑝 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ 𝑥̅1 − 𝑥̅2 + 𝑡 ∗ 𝑠𝑝 ∗ √ +
𝑛1 𝑛2 𝑛1 𝑛2
1 1
𝐼 = 3,1 − 2,7 − 2,21 ∗ 0,596 ∗ √ + ≤ 𝜇1 − 𝜇2
10 8
1 1
≤ 3,1 − 2,7 + 2,21 ∗ 0,596 ∗ √ +
10 8
𝐼 = −0,2 ≤ 𝜇1 − 𝜇2 ≤ 1,0
∴ La diferencia real de nicotina de las dos marcas esta entre -0,2 y 1,0 con 95%
31
2) Queremos estudiar la influencia que puede tener el tabaco con el peso de los
niños al nacer. Para ello se consideran dos grupos de mujeres embarazadas
(unas que fuman y otras que no) y se obtienen los siguientes datos sobre el
peso X, de sus hijos:
34 ∙ 0,52 + 27 ∙ 0,82
𝑠̂ 2 =
60
𝑠̂ 2 = 0,49
𝑠̂ = 0,6473
Con lo cual se puede decir que un intervalo de confianza para el peso esperado
en que supera un hijo de madre no fumadora al otro de madre fumadora está
comprendido con un nivel de confianza del 95% entre los 0,068Kg y los 0,731Kg.
32
Ejercicios propuestos
1) Se piensa que los estudiantes de licenciatura de contaduría pueden superar
un mayor salario promedio al egresar de la licenciatura, que el que esperan
los estudiantes de administración. Recientemente se obtuvieron muestras
aleatorias de ambos grupos de un área geográfica relativamente homogénea,
proporcionando los datos que se encuentran en la siguiente tabla:
Contadores Administradores
$16300 $13200
$18200 $15100
$17500 $13900
$16100 $14700
$15900 $15600
$15400 $15800
$15800 $14900
$17300 $18100
$14900 $15600
$15100 $15300
$16200
$15200
$15400
$16600
Determinar un intervalo de confianza unilateral inferior del 90% para la diferencia
entre los entre los salarios promedios para los estudiantes de contaduría y los de
administración 𝜇𝐴 − 𝜇𝑀 al egresar de la licenciatura (suponga que las varianzas
𝜎𝐴2 𝑦 𝜎𝑀
2
son iguales).
33
2) En el artículo “Estructura comunitaria de los macroinvertebrados como un
indicador de la contaminación de minas acidas”, publicado en el Journal of
Environmental Pollution, se informa sobre una investigación realizada en Cane
Creek, Alabama, para determinar la relación entre parámetros fisicoquímicos
seleccionados y diversas mediciones de la estructura de la comunidad de
macroinvertebrados. Una faceta de la investigación consistió en evaluar la
efectividad de un indice numérico de la diversidad de especies para indicar la
degradación del agua debida al desagüe acido de una mina.
Conceptualmente, un indice elevado de la diversidad de especies
macroinvertebradas debería indicar un sistema acuático no contaminado;
mientras que un indice bajo de esta diversidad indicaría un sistema acuático
contaminado.
Se eligieron 2 estaciones de muestreo independientes para este estudio: una
que se localiza corriente abajo del punto de descarga acida de la mina y la
otra ubicada corriente arriba. Para 12 muestras mensuales reunidas en la
estación corriente abajo el indice de diversidad de especies tuvo un valor
medio de 𝑥̅1 = 3.11 y una desviación estándar de 𝑠̂1 = 0.771; mientras que 10
muestras reunidas mensualmente en la estación corriente arriba tuvieron un
valor medio del indice 𝑥̅2 = 2.04 y una desviación estándar de 𝑠̂2 = 0,448.
Calculemos un intervalo de confianza del 90% para la diferencia entre las
medias de la población de los dos sitios, suponiendo que las poblaciones se
distribuyen de forma aproximadamente normal y que tienen varianzas
iguales.
3) El agente de una cadena de restaurantes va a decidir adquirir entre dos
variedades de arroz A y B. Para tomar la decisión estadística comparando la
calidad, se escogieron dos muestras aleatorias independientes de 10 bolsas
de arroz de un kilo cada una de las dos variedades de arroz y se observaron
los siguientes porcentajes de granos quebrados por kilo:
34
1 2 3 4 5 6 7 8 9 10
Variedades: A 6 5 6 7 4 7 6 4 3 6
Variedades: B 7 6 7 9 5 8 7 6 10 8
35
Intervalo de confianza para la diferencia de media con varianza desconocidas pero
diferentes, 𝜎12 ≠ 𝜎22 ≠ 𝜎 2
a) El estadístico usado como estimador puntual de la diferencia de medias 𝜇1 −
𝜇2 , será 𝑥̅1 − 𝑥̅2 , que es un estimador suficiente
b) La variable aleatoria asociada con el estimador será la variable t definida
𝑥̅ 1 −𝑥̅ 1 −(𝜇1 −𝜇2 )
como: 𝑡 =
𝑠 2𝑠 2
√ 1+ 2
𝑛1 𝑛2
𝑠2 𝑠 2 2
( 1+ 2)
𝑛1 𝑛2
Los grados de libertad están dados por: 𝑣 = 2 2
𝑠2 𝑠2
( 1) ( 2)
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1
( ) ( )
Nota:
El valor obtenido se redondea al entero más próximo.
Si llevamos a cabo un cálculo de intervalo de confianza para diferencia
de medias, suponiendo que las varianzas no son iguales, en el dado
caso que, si lo fueran, perderíamos muy poco, y el intervalo obtenido
sería un poco conservador.
El caso de que supongamos que las varianzas son iguales siendo que
no lo son, nos produce un error mayor que pueda ser considerable por
lo que una sugerencia es usar diferentes como la regla general.
36
Ejemplos resueltos
1) Cierto metal se produce, por lo común, mediante un proceso estándar. Se
desarrolla un nuevo proceso en el que se añade una aleación a la producción
del metal. Los fabricantes se encuentran interesados en estimar la verdadera
diferencia entre las tensiones de ruptura de los metales producidos por los
dos procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de
estos se somete a una tensión hasta que se rompe.
La siguiente tabla muestra las tensiones de ruptura de los ejemplares en
kilogramos por centímetro cuadrado:
Proceso 446 401 476 421 459 438 481 411 456 427 459 445
estándar
Proceso 462 448 435 465 429 472 453 459 427 468 452 447
nuevo
2
𝑠2 𝑠2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2
𝑠2 2 2
𝑠
( 1) ( 2)
𝑛1 𝑛2
(𝑛 ) + (𝑛 )
1 −1 2 −1
37
2
24.82 14.92
( + )
12 12
𝑣= 24.8 2 14.9 2
= 18
( ) ( )
12 12
( 12−1 ) + ( 12−1 )
Por lo tanto:
14,92 24,82
(451,4 − 443,3) − 2,10√ + ≤ 𝜇1 − 𝜇2
12 12
14,92 24,82
≤ (451,4 − 443,3) + 2,10 √ +
12 12
25,65 ≤ 𝜇1 − 𝜇2 ≤ 9,49
∴ por lo tanto, la verdadera diferencia entre las tensiones de ruptura de los
metales producidos por los dos procesos se encuentra entre los valores
25,65 ; 9,49 con un intervalo de confianza del 95%.
Y para 99% de confianza con 𝑡1 = 2,88; 𝑡2 = −2,88
14,92 24,82
(451,4 − 443,3) − 2,88√ + ≤ 𝜇1 − 𝜇2
12 12
14,92 24,82
≤ (451,4 − 443,3) + 2,88√ +
12 12
−32,16 ≤ 𝜇1 − 𝜇2 ≤ 15,99
38
2) El Departamento de zoología de Virginia Tech llevo a cabo un estudio para
estimar la diferencia en la cantidad de orto fosforo químico medido en dos
estaciones diferentes del rio James. El orto fosforo se mide en miligramos por
litro. Se reunieron 15 muestras de la estación 1 y 12 muestras de la estación
2. Las 15 muestras de la estación 1 tuvieron un contenido promedio de orto
fosforo de 3.84 miligramos por litro y una desviación estándar de 3.07
miligramos por litro; en tanto que las 12 muestras de la estación 2 tuvieron
un contenido promedio de 1.49 miligramos por litro y una desviación estándar
de 0.80 miligramos por litro. Calcule un intervalo de confianza de 95% para
la diferencia en el contenido promedio verdadero de orto fosforo en estas dos
estaciones. Suponga que las observaciones provienen de poblaciones
normales con varianzas diferentes.
n Media S
15 3,84 3,07
12 1,49 0,80
Queremos obtener un intervalo de confianza del 95% para 𝜇1 − 𝜇2 .
Como se suponen varianzas de la población diferentes, solo podemos calcular
un intervalo de confianza aproximado del 95% basado en la distribución t con
v grados de libertad, donde
2
𝑠2 𝑠2
(𝑛1 + 𝑛2 )
1 2
𝑣= 2
𝑠2 𝑠 2 2
( 1) ( 2)
𝑛1 𝑛2
(𝑛 ) + (𝑛 )
1 −1 2 −1
3,07^2 0,80^2 2
( + )
15 12
𝑣= 3,07^2 2 0,80^2 2
= 16,3 ≈ 16
( 15 ) ( 12 )
( 15−1 )+ ( 12−1 )
39
Si usamos 𝛼 = 0,05, en la tabla encontramos que 𝑡0,025 = 2,120 𝑝𝑎𝑟𝑎 𝑣 = 16
grados de libertad. Por lo tanto, el intervalo de confianza del 95% para 𝜇1 −
𝜇2 es
40
Ejercicios propuestos
1) Se lleva a cabo un estudio para comparar los montos de los préstamos
personales realizadas por dos entidades financieras A y B. con este fin se
tomaron 9 y 8 préstamos al azar de cada banco resultando los siguientes
montos en miles de soles:
1 2 3 4 5 6 7 8 9
Variedad: A 12 28 10 25 24 19 22 33 17
Variedad: B 16 20 16 20 16 17 15 21
41
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de
forma aproximadamente normal para la marca A y para la marca B. Asuma
que las dos varianzas poblacionales son distintas.
4) Los pesos de 4500 estudiantes de bachillerato de una ciudad están
distribuidos normalmente con una media de 56,5 kg y una varianza de 2,5
kg. Si se seleccionan 40 muestras con reposición de 20 estudiantes cada una,
hallar la media y varianza de las distribuciones de las medias muestrales con
varianza desconocida y diferentes.
42
Intervalo de confianza para el cociente de varianzas
La necesidad de disponer de métodos estadísticos para comparar las varianzas de
dos poblaciones es evidente a partir del análisis de una sola población.
Frecuentemente se desea comparar la precisión de un instrumento de medición con
la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la
forma en que varia el procedimiento para calificar de un profesor universitario con
la de otro.
𝑠12
𝑠22
Y si es casi igual a 1, se tendrá poca evidencia para indicar que 𝜎12 𝑦 𝜎22 no son
𝑠12
iguales. Por otra parte, un valor muy grande o muy pequeño para , proporcionara
𝑠22
𝑠12
𝜎12 𝑠12 ∙ 𝜎22 𝑠1 2 𝜎2 2
𝐹= 𝑠22
= 2 2 =( ) ∙( )
𝑠2 ∙ 𝜎1 𝑠2 𝜎1
𝜎22
43
El caso de la distribución la F, para un nivel de confianza (por ejemplo, de 95%)
requiere calcular los grados de libertad del numerador y del denominador, este
ejemplo son 30 y 24 respectivamente
𝜎 2 𝑠 2
Despejando: (𝜎2 ) = (𝐹𝑠1 )
1 2
Esto nos permite calcular la probabilidad de que el cociente se encuentre entre dos
𝑠 2
valores de F. Para construir el intervalo de confianza empleamos entonces (𝐹𝑠1 ) <
2
𝑠 2 𝑠 2
(𝐹𝑠1 ) < (𝐹𝑠1 )
2 2
En este caso se requiere calcular los grados de libertad del numerador que son 𝑛1 −
1 (recordando que se toma a 𝑛1 como el tamaño de la muestra de la varianza mas
grande) y los del denominador que son 𝑛2 − 1.
44
Ejemplos resueltos
1) Un fabricante de automóviles pone a prueba dos nuevos métodos de
ensamblaje de motores respecto al tiempo en minutos. Los resultados se
muestran en la tabla siguiente:
Método 1 Método 2
𝑛1 = 31 𝑛2 = 31
𝑠12 = 50 𝑠22 = 24
𝜎12
Construir un intervalo de confianza del 90% para 𝜎22
Solución:
𝑠12 𝜎2 𝑠2
Sabemos que < 𝜎12 < 𝑠12
𝐹𝑠22 2 2
Tomamos a 𝑠12 como numerador porque es el valor más grande. Los valores
de F requieren los grados de libertad del numerador
𝑛1 − 1 = 30 y del denominador 𝑛2 − 1 = 24.
𝑠12 𝜎12 𝑠12
< <
𝐹𝑠22 𝜎22 𝑠22
50 𝜎12 50
< 2<
1,94 ∙ 24 𝜎2 0,53 ∙ 24
𝜎2
Por lo tanto: 1,07 < 𝜎12 < 3,93
2
45
2) Una empresa fabrica propulsores. A los ingenieros les gustaría saber cuál de
dos procesos tiene la menor rugosidad en las superficies. Para ellos se toman
muestras aleatorias de cada proceso.
Proceso 1 Proceso 2
𝑛1 = 16 𝑛2 = 4,7
𝑠12 = 12 𝑠22 = 5,1
Solución:
Por lo que el intervalo de confianza para el cociente de varianzas estará dado
por
𝑠12 𝜎12 𝑠12
< <
𝐹𝑠22 𝜎22 𝑠22
5,12 𝜎12 5,12
< <
0,368 ∙ 4,72 𝜎22 2,51 ∙ 4,72
𝜎12
0,469 < < 3,2
𝜎22
Y para las desviaciones estándar (calculamos la raíz cuadrada):
𝜎12
0,68 < < 1,79
𝜎22
∴ Como el intervalo de confianza incluye el valor de uno, no se puede concluir
que exista alguna diferencia entre la variabilidad de los dos procesos (es decir,
el intervalo de confianza incluye la posibilidad de que las dos desviaciones
estándar sean iguales, por lo que el cociente sería igual a uno).
46
Ejercicios propuestos
1) Para probar el gasto de combustible de dos marcas de coches A y B
seleccionan al azar 9 coches de la marca A, que proporcionan a una media
de 18 Km. Recorridos por cada litro de combustible, con una cuasi varianza
1,1 km. Por litro, y otros 12 coches de la marca B, que proporcionan una
media de 15 Km. Recorridos por litro, con una cuasi varianza de 2,9 Km por
litro. Si se supone que la distancia recorrida por cada litro de combustible
sigue una distribución normal en ambas marcas, hallar un intervalo de
confianza para el cociente de varianzas.
2) Se extraen dos muestras aleatorias de tamaños 10 y 15, de dos poblaciones
distribuidas normalmente y con la misma varianza. Si 𝑠12 es la cuasi varianza
de la primera muestra, y 𝑠22 es la cuasi varianza de la segunda, hallar la
𝑠12
probabilidad de que el cociente de cuasi varianza sea menor que 5.
𝑠22
3) Las siguientes son las capacidades calóricas del carbón de dos minas (en
millones de calorías por tonelada):
Mina A 8,500 8,330 8,480 7,960 8,030
Mina B 7,710 7,890 7,920 8,270 7,860
Suponga que los datos constituyen una muestra aleatoria independientes de
poblaciones normales con varianzas iguales, construya un intervalo de
confianza del 90% para la razón de las varianzas de las dos poblaciones
muestreadas.
4) Doce arboles adultos de cítricos de cierta variedad, escogidos aleatoriamente,
tienen una media de la altura de 13,8 pies con una desviación estándar de
1,2 pies, y 15 árboles adultos de cítricos de otra variedad, escogidos
aleatoriamente, tienen una media de la altura de 12,9 pies con una desviación
estándar de 1,5 pies. Suponga que las muestras aleatorias se seleccionaron
de poblaciones normales con varianzas iguales, construya un intervalo de
confianza del 98% para la razón de las varianzas de las dos poblaciones
muestreadas
47
Intervalo de confianza para la diferencia de proporciones
Consideremos ahora dos poblaciones formadas por individuos que presentan un
carácter dicotómico, y sean 𝑝1 𝑦 𝑝2 las probabilidades respectivas de que se presente
la modalidad A del carácter dicotómico en dichas poblaciones.
Si el tamaño de las muestras es mayor que 30, el estadístico 𝑝̂1 − 𝑝̂ 2 sigue una
𝑝1 (1−𝑝1 ) 𝑝2 (1−𝑝2 )
distribución normal 𝑁 (𝑝1 − 𝑝2 , √ + )
𝑛1 𝑛2
48
Teorema: Si 𝑥1 es una variable aleatoria binomial con los parámetros 𝑛1 y 𝑝̂1,
𝑥2 es una variable aleatoria binomial con los parámetros 𝑛2 y 𝑝̂ 2 , 𝑛1 𝑦 𝑛2 son
𝑥 𝑥
grandes, y 𝑝̂1 = 𝑛1 y 𝑝̂2 = 𝑛2 , entonces
1 2
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
(𝑝̂1 − 𝑝̂2 ) − 𝑧𝜎⁄ ∙ √ + < 𝑝1 − 𝑝2
2 𝑛1 𝑛2
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
< (𝑝̂1 − 𝑝̂ 2 ) + 𝑧𝜎⁄2 ∙ √ +
𝑛1 𝑛2
49
Ejercicios resueltos
1) Para conocer la eficacia de una vacuna anticatarral, se suministra esta a una
muestra aleatoria de 50 personas. Se observa que solo 4 de ella se han
acatarrado.
Se seleccionan asimismo otra nueva muestra de 50 personas a quienes no se
les suministrara la vacuna, observando que 9 de ellas se han acatarrado.
Se trata de hacer una estimación de la diferencia de proporciones de
individuos vacunados y no vacunados de la población que sufren un catarro.
Solución:
El número de personas vacunadas sigue una binomial B(𝑝1 , 𝑛1 ) y el de
personas no vacunadas sigue una binomial B(𝑝2 , 𝑛2 ).
𝑝̂1 es un estimador de 𝑝1 y 𝑝̂ 2 es un estimador de 𝑝2 , por lo que estimación
9 4 5 1
de 𝑝1 − 𝑝2 es 𝑝̂1 − 𝑝̂2 = 50 − 50 = 50 = 10
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝜎𝑝1∙𝑝2 = (√ + )
𝑛1 𝑛2
9 9 4 4
(1 − 50) (1 − 50)
𝜎𝑝1 ∙𝑝2 = (√50 + 50
)
50 50
50
2) Si 132 de 200 votantes hombres y 90 de 159 votantes de mujeres están a
favor de cierto candidato que hace campaña para gobernar de Illinois,
encuentre un intervalo de confianza del 99% para la diferencia entre las
proporciones reales de votantes hombres y votantes mujeres que están a
favor del candidato.
Solución:
132 90
Sustituimos 𝑝̂1 = 200 = 0,66, 𝑝̂2 = 150 = 0,60 y 𝑧0,005 = 2,575 en la formula del
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
(𝑝̂1 − 𝑝̂2 ) − 𝑧𝜎⁄ ∙ √ + < 𝑝1 − 𝑝2
2 𝑛1 𝑛2
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
< (𝑝̂1 − 𝑝̂ 2 ) + 𝑧𝜎⁄2 ∙ √ +
𝑛1 𝑛2
0,66(0,34) 0,60(0,40)
(0,66 − 0,60) − 2,575 ∙ √ + < 𝑝1 − 𝑝2
200 150
0,66(0,34) 0,60(0,40)
< (0,66 − 0,60) + 2,575 ∙ √ +
200 150
51
Ejercicios propuestos
1) Se considera hacer un cierto cambio en el proceso de fabricación de partes
componentes. Para determinar si el cambio en el proceso da como resultado
una mejora, se toman muestras de partes fabricadas con el proceso nuevo y
con el actual. Si se encuentra que 75 de 1500 artículos manufacturados con
el proceso actual están defectuosos y 80 de 2000 manufacturados con el
proceso nuevo también lo están, calcule un intervalo de confianza del 90%
para la diferencia verdadera en la proporción de partes defectuosas entre el
proceso actual y el nuevo.
2) Entre 500 solicitudes de licencias de matrimonio escogidas aleatoriamente en
un año dado, hubieron 40 en que la mujer era al menos un año mayor que
el hombre, y entre 400 solicitudes de licencias de matrimonio escogidas
aleatoriamente seis años después, hubieron 68 en los cuales la mujer era al
menos un año mayor que el hombre. Construya un intervalo de confianza del
99% para la diferencia entre las verdaderas proporciones correspondientes
de solicitudes de licencias de matrimonio en que la mujer es al menos un año
mayor que el hombre.
3) Se cree que la osteoporosis está relacionada con el sexo. Para ello se elige
una muestra de 100 hombres de más de 50 años y una muestra de 200
mujeres en las mismas condiciones. Se obtiene que 10 hombres y 40 mujeres
con algún grado de osteoporosis. ¿Qué podemos concluir con una confianza
del 95 %?
52