Académique Documents
Professionnel Documents
Culture Documents
RESUMEN
Los intervalos de confianza es una de las herramientas básicas del análisis estadístico. Esta temática se aborda en los curso de
fundamentación estadística de los programas de pregrado e incluso en los programas de fundamentación media de algunos países.
En este trabajo se presenta los intervalos de confianza para media, diferencia de medias, varianza, cociente de varianza. Por
simplicidad se trabaja el caso de estimación por intervalo para la media (𝜇) asumiendo muestras de distribuciones binomial y
normal.
Un estimador puntual utiliza un estadístico para estimar Un intervalo de confianza tiene un límite inferior de
el parámetro en un solo valor o punto, para ello se confianza (LIC) y un límite superior de confianza (LSC)
selecciona una muestra (n) y se encuentra la media (𝑋̅) , estos límites se hallan calculando primero la media
este valor sirve como una estimación puntual para la muestra, , luego se suma una cierta cantidad a para
media poblacional. obtener el LSC y la misma cantidad se resta de para
obtener el LIC. En este punto es importante aquella
Una estimación por intervalo especifica el rango dentro regla empírica que el 95.5% de todas las medias
del cual está el parámetro desconocido, tal intervalo va muéstrales caen dentro de dos errores estándar de la
acompañado con frecuencia de una afirmación sobre el media poblacional, entonces la media poblacional está a
nivel de confianza que se da en su actitud. Por tanto se máximo dos errores estándar del 95.5% de todas las
llama intervalo de confianza. Y para el presente trabajo medias muéstrales, por tanto al comenzar cualquier
se busca aplicar los conceptos básicos de los intervalos media muestral, si se pasa de dos errores estándar por
de confianza de diferencia de medias, varianza y encima de dicha media y dos errores estándar por debajo
cociente de varianza para aplicarlas en un estudio de ella se puede tener un 95.5% de confianza en que el
realizado a una muestra específica.
1
intervalo resultante contenga la media poblacional Para hallar la varianza de la distribución t es:
desconocida.
Valor alfa: Se denomina valor alfa a la probabilidad de 𝑛−1
𝜎2 =
error o la probabilidad de que un intervalo dado no 𝑛−3
contenga la media poblacional desconocida. Intervalos de confianza para la diferencia de medias
𝑉𝑎𝑙𝑜𝑟 𝑎𝑙𝑓𝑎 = 1 − coeficiente de confianza Sean 𝑥11 , 𝑥12 ,…, 𝑥1𝑛1 una muestra aleatoria de
𝑛1 observaciones tomadas de una primera población con
valor esperado 𝜇1 , y 𝜎 21 y 𝑥21 , 𝑥22 ,…, 𝑥2𝑛2 una
Intervalos de confianza para media poblacional – muestra aleatoria de 𝑛2 observaciones tomada de la
Muestras grandes segunda población con valor esperado μ2 y Si 𝒙̅1 y 𝒙̅ 2
son las medias muéstrales, la estadística 𝒙̅1 - 𝒙̅ 2 es un
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria grande (n > 30) de
estimador puntual de
una población estándar 𝜎, por lo que 𝑋̅ es
𝜇1 −𝜇2 , y tiene una distribución normal si las dos
aproximadamente normal. Entonces un intervalo de
poblaciones son normales, o aproximadamente normal si
confianza 100(1 - 𝛼) % para 𝜇 es:
cumple con las condiciones del teorema del límite
central (tamaños de muestras relativamente grandes).
• Intervalo de confianza para estimar 𝝁
Por lo tanto:
cuando 𝝈 es conocido
̅1 − 𝒙̅ 2 − (𝜇1 − 𝜇2 )
𝒙
̅ ± 𝒛𝜶 𝝈𝒙
𝝁=𝑿 𝑧=
⁄ 𝟐
𝜎12 𝜎22
√ +
Donde 𝜎𝑥 = 𝜎 ⁄√𝑛. Cuando el valor de 𝜎 es 𝑛1 𝑛2
desconocido, se puede sustituir por la desviación
estándar muestral s. Intervalos de confianza para diferencias de medias
con varianzas conocidas pera diferentes (𝝈𝟐 𝟏 ≠ 𝝈𝟐 𝟐
• Intervalo de confianza para estimar 𝝁 )
cuando σ es desconocido
En el evento probable que σ sea desconocida, la desviación Si las varianzas poblacionales son conocidas y
estándar de la muestra debe sustituirse: diferentes, los pasos a seguir para encontrar el intervalo
de confianza son los siguientes:
a) El estadístico usado como estimador puntual de la
𝑆
̅ ± 𝒁𝒔𝒙 ; Donde 𝑆𝑥 =
𝝁= 𝒙 diferencia de medias 𝜇1 −𝜇2 será igual a T= 𝒙̅1 -
√𝑛
̅2
𝒙
Intervalos de confianza para la media poblacional con b) La variable aleatoria asociada con el estimador
muestras pequeñas será la variable normal estándar dada por:
𝒔
̅± 𝒕
𝝁= 𝒙
√𝒏
2
Intervalos de confianza para diferencia de medias 3 ANALISIS Y RESULTADOS
para varianzas desconocidas e iguales (𝝈𝟐 𝟏 = 𝝈𝟐 𝟐 Para la mejor comprensión y ampliación de los
=𝝈𝟐 𝟑 ). temáticos intervalos de confianza se decide proponer
una serie de ejercicios con situaciones específicas para
Cuando las varianzas de la población son desconocidas, así aplicar cada una de las ecuaciones anteriormente
se usan las varianzas de la muestra de la muestra como explicadas.
estimadores. El procedimiento a seguir para el cálculo
del intervalo de confianza para la diferencia de dos Ejercicio 1. Intervalo de confianza para
medias es el siguiente: muestras grandes (Estimación de 𝝁 cuando
a. El estadístico usado como estimador puntual de es conocido)
la diferencia de medias 𝜇1 −𝜇2 será 𝒙̅1 - 𝒙̅ 2 . Consideremos el caso de un promotor inmobiliario
b. La variable aleatoria asociada al estimador se quien intenta construir un gran centro comercial. Puede
denota con la letra t. /en el caso de muestras estimar en el área el ingreso promedio por familia como
pequeñas) indicador de las ventas esperadas. Una muestra de 𝑛 =
100 familias de una media de 𝑥̅ = 𝑈𝑆$35,500. Se
̅1 − 𝒙̅ 2 − (𝜇1 − 𝜇2 )
𝒙 asume que la desviación estándar poblacional es 𝜎 =
𝑡= 𝜎
1 1 𝑈𝑆$7,200. Dado que 𝜎𝑥̅ = , se estima un intervalo
𝑠𝑝 √ + √100
𝑛1 𝑛2 del 95%
c. Para calcular el intervalo de confianza se debe
tener en cuenta el nivel de confianza que se 7,200
Como I.C. para estimar 𝜇 = 35,500 ± (1.96)
quiere considerar y los grados de libertad que √100
se calculan : = 34,088.80 ≤ 𝜇 ≤ 36,911.20
c. Los intervalos de confianza están dados por el Los resultados son tanto buenos como malos. Las
siguiente teorema: ventajas son que el intervalo del 95% es más estrecho y
𝑠12 𝑠22 ofrece mayor precisión. Un intervalo amplio no es
( 𝒙̅1 - 𝒙̅ 2 ) - t √ + ≤ 𝜇1 −𝜇2 ≤ 𝒙̅1 - 𝒙̅ 2 +
𝑛1 𝑛2 especialmente útil. Revelaría muy poco si el profesor le
𝑠12 𝑠22 pidiera que la media del siguiente examen estuviera
t√ + entre 0 y el 100%. Entre más estrecho sea el intervalo,
𝑛1 𝑛2
más significativo es.
d. Los grados de libertad están dados por la
siguiente ecuación: La desventaja es que el señor Gerber ahora está el 95%
seguro de que el intervalo contiene en realidad 𝜇.
2 Aunque el intervalo es más preciso (más estrecho), la
𝑠2 𝑠2
( 1 + 2) probabilidad de que contenga 𝜇 se ha reducido del 99 al
𝑛1 𝑛2
𝑣= 2 95%. El señor Gerber tuvo que abandonar algo de
(𝑠1 ⁄𝑛1 )2 (𝑠22 ⁄𝑛2 )2
+ confianza y ganar más precisión.
𝑛1 − 1 𝑛2 − 1
3
6.3≤ 𝜇1 −𝜇2 ≤ 25.7
Ejercicio 3. Intervalos de confianza para la
media en el caso de muestras pequeñas – la Ejercicio 5. Intervalos de confianza para la
distribución t diferencia de medias. (cuando las varianzas
El contrato laboral realizado entre United Auto Workers son desconocidas pero iguales)
(UAW) y Ford Motor Company (FMC) requirió que la
producción promedio para una sección de producción se La siguiente tabla presenta los resultados de 2 muestras
realizara a 112 unidades por mes, por empleado. aleatorias para comparar el contenido de nicotina de 2
Surgieron desacuerdos entre UAW y FMC respecto a si marcas de cigarrillos.
se mantenía este estándar o no. El contrato laboral
específico que si los niveles de producción promedio se Marca A Marca B
reducían por debajo de cantidad estipulada de 𝜇 = 112, 𝑛𝑖 10 8
a FMC se le permitiría tomar “acciones correctivas”. 𝑥̅𝑖 3.1 2.7
Debido al costo implicado, solo se evaluaran 20 𝑠𝑖 0.5 0.7
trabajadores, resultando una media de 102 unidades. Se
asume que se encuentro una desviación estándar de 8.5 Suponiendo que los conjuntos de datos provienen de
unidades y que los niveles de producción están muestras tomadas al azar de poblaciones normales con
distribuidos normalmente. ¿Un intervalo de confianza de varianzas desconocidas e iguales, construya un intervalo
90% tiene a sugerir una contravención del contrato de confianza del 95% para la diferencia real de nicotina
laboral, permitiendo así una acción correctiva? de las 2 marcas.
Con un nivel de confianza del 90 % y n – 1 19 g.I., la
tabla F da un valor t de 1.729. Solucion: Como las varianzas son iguales, calculamos
𝑠𝑝2 que está dado por:
𝑠
I.C. para estimar 𝜇 = 𝑥̅ ± 𝑡
√𝑛
8.5 (9)0.52 + (7)0.72
= 102 ± (1.729) 𝑠𝑝2 = = 0.355
√20 16
= 102 ± 3.29
98.71 ≤ 𝜇 ≤ 105.29 𝑠𝑝 = 0.596
El nivel de producción promedio de 112 unidades, El intervalo de confianza del 95% está dado por
especificados en el contrato laboral, no está dentro del (t(0.025,g.I. 16)=2.21):
intervalo de confianza.
1 1 1 1
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − 𝑠𝑝 √ + ≤ 𝜇1 − 𝜇2 ≤ ̅̅̅
𝑥1 − 𝑥
̅̅̅2 + 𝑡 𝑠𝑝 √ +
𝑛1 𝑛2 𝑛1 𝑛2
Ejercicio 4. Intervalos de confianza para la
diferencia de medias. (cuando las varianzas
1 1
son conocidas pero diferentes) 3.1 − 2.7 − 2.21(0.596)√ + ≤ 𝜇1 − 𝜇2 ≤ 3.1 − 2.7 +
10 8
1 1
Construya un intervalo de confianza del 94% para la 2.21(0.596)√ +
10 8
diferencia real entre las duraciones de dos marcas de
focos, si una muestra de 40 focos tomada al azar de la −0.2 ≤ 𝜇1 − 𝜇2 ≤ 1.0
primera marca dio una duración media de 418 horas, y
una muestra de 50 focos de otra marca dieron una
duración media de 402 horas. Las desviaciones Ejercicio 6. Intervalos de confianza para la
estándares de las dos poblaciones son 26 horas y 22 diferencia de medias. (cuando las varianzas
horas, respectivamente. son desconocidas y diferentes)
Tenemos que: 𝒙 ̅1 = 418, 𝒙̅2 = 402, 𝜎1 = 26, 𝜎2 =22,
𝑛1 = 40, 𝑛2 = 50, con 𝑧 = 1.88. El intervalo de Cierto metal se produce, por lo común, mediante un proceso
confianza es, entonces: estándar. Se desarrolla un nuevo proceso en el que se añade
una aleación a la producción del metal. Los fabricantes se
𝜎12 𝜎22 𝜎12 𝜎22
encuentran interesados en estimar la verdadera diferencia entre
̅1 - 𝒙
(𝒙 ̅2 ) - Z √ + ≤ 𝜇1 −𝜇2 ≤ 𝒙
̅1 - 𝒙
̅2 + Z √ + las tensiones de la ruptura de los metales producidos por los 2
𝑛1 𝑛2 𝑛1 𝑛2
procesos. Para cada metal se seleccionan 12 ejemplares y cada
uno de estos se somete a una tensión hasta que se rompe.
262 222
(418 - 402) - 1.88 √ + ≤ 𝜇1 −𝜇2 ≤ (418 - 402) +
40 50
262 222
1.88 √ +
40 50
Entonces:
4
1 1 1 1
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − 𝑡√ + ≤ 𝜇1 − 𝜇2 ≤ ̅̅̅
𝑥1 − ̅̅̅
𝑥2 + 𝑡 √ +
𝑛1 𝑛2 𝑛1 𝑛2
14.92 24.82
La siguiente tabla muestra las tensiones de ruptura de los (451.4 − 443.3) − 2.10√ + ≤ 𝜇1 − 𝜇2
ejemplares en kilogramos por centímetro cuadrado: 12 12
14.92 24.82
≤ (451.4 − 443.3) + 2.10√ +
12 12
Proc 4 4 4 4 4 4 4 4 4 4 4 4
eso 4 0 7 2 5 3 8 1 5 2 5 4
está 6 1 6 1 9 8 1 1 6 7 9 5 −25.65 ≤ 𝜇1 − 𝜇2 ≤ 9.49
ndar
Proc 4 4 4 4 4 4 4 4 4 4 4 4 𝑡1 = 2.88, 𝑡2 = −2.88
eso 6 4 3 6 2 7 5 5 2 6 5 4
nuev 2 8 5 5 9 2 3 9 7 9 2 7
o
Solucion
n Media S
12 443.3 24.8
12 451.4 14.9
14.92 24.82
95% de confianza (451.4 − 443.3) − 2.88√ + ≤ 𝜇1 − 𝜇2
12 12
2 −32.16 ≤ 𝜇1 − 𝜇2 ≤ 15.99
𝑠2 𝑠2
( 1 ⁄𝑛1 + 2 ⁄𝑛2 )
𝑣= 2 2 = 18
𝑠2 𝑠2
[( 1 ⁄𝑛1 ) /(𝑛1 − 1)] + [( 2 ⁄𝑛2 ) /(𝑛2 − 1)]