Vous êtes sur la page 1sur 5

INTERVALOS DE CONFIANZA

Lina Guzmán seña, María Klaudia Paternina, Yesit Méndez Tapia


Lina_guzman30@hotmail.com, Klaudia4010@gmail.com, Yesit910@gmail.com

RESUMEN
Los intervalos de confianza es una de las herramientas básicas del análisis estadístico. Esta temática se aborda en los curso de
fundamentación estadística de los programas de pregrado e incluso en los programas de fundamentación media de algunos países.
En este trabajo se presenta los intervalos de confianza para media, diferencia de medias, varianza, cociente de varianza. Por
simplicidad se trabaja el caso de estimación por intervalo para la media (𝜇) asumiendo muestras de distribuciones binomial y
normal.

PALABRAS CLAVE: Intervalos de confianza, Varianza, Media, cociente de varianza.

Abstract 2 MARCO TEÓRICO


Confidence intervals is one of the basic tools of
statistical analysis. This subject is addressed in Intervalos de confianza
the course of statistical foundation of the
undergraduate programs and even in the Un intervalo de confianza es un rango de valores,
derivado de los estadísticos de la muestra, que
average foundation programs of some countries.
posiblemente incluya el valor de un parámetro de
In this paper we present the confidence intervals población desconocido. Debido a su naturaleza aleatoria,
for mean, difference of means, variance, and es poco probable que dos muestras de una población en
quotient of variance. particular produzcan intervalos de confianza idénticos.
Sin embargo, si usted repitiera muchas veces su muestra,
1 INTRODUCCIÓN un determinado porcentaje de los intervalos de confianza
resultantes incluiría el parámetro de población
Actualmente se debe estar bien informado de que las desconocido.
poblaciones son generalmente muy grandes como para
ser medidas en su totalidad. Su tamaño requiere que se Un intervalo de confianza tiene un límite inferior de
seleccionen muestras, las cuales se pueden utilizar más confianza (LIC) y un límite superior de confianza
tarde para hacer inferencias. Para estudios estadísticos (LSC). Estos límites se hallan calculando primero la
de gran magnitud es necesario estimar la media media muestral. 𝑋̅ . Luego se suma una cierta cantidad a
poblacional con la media de una muestra representativa. 𝑋̅ para obtener el LSC, y la misma cantidad se resta de
Hay por lo menos dos tipos de estimadores que se 𝑋̅ para obtener el LIC.
utilizan más comúnmente para este propósito: un
estimador puntual y un estimador por intervalo. El fundamento de un intervalo de confianza

Un estimador puntual utiliza un estadístico para estimar Un intervalo de confianza tiene un límite inferior de
el parámetro en un solo valor o punto, para ello se confianza (LIC) y un límite superior de confianza (LSC)
selecciona una muestra (n) y se encuentra la media (𝑋̅) , estos límites se hallan calculando primero la media
este valor sirve como una estimación puntual para la muestra, , luego se suma una cierta cantidad a para
media poblacional. obtener el LSC y la misma cantidad se resta de para
obtener el LIC. En este punto es importante aquella
Una estimación por intervalo especifica el rango dentro regla empírica que el 95.5% de todas las medias
del cual está el parámetro desconocido, tal intervalo va muéstrales caen dentro de dos errores estándar de la
acompañado con frecuencia de una afirmación sobre el media poblacional, entonces la media poblacional está a
nivel de confianza que se da en su actitud. Por tanto se máximo dos errores estándar del 95.5% de todas las
llama intervalo de confianza. Y para el presente trabajo medias muéstrales, por tanto al comenzar cualquier
se busca aplicar los conceptos básicos de los intervalos media muestral, si se pasa de dos errores estándar por
de confianza de diferencia de medias, varianza y encima de dicha media y dos errores estándar por debajo
cociente de varianza para aplicarlas en un estudio de ella se puede tener un 95.5% de confianza en que el
realizado a una muestra específica.

1
intervalo resultante contenga la media poblacional Para hallar la varianza de la distribución t es:
desconocida.
Valor alfa: Se denomina valor alfa a la probabilidad de 𝑛−1
𝜎2 =
error o la probabilidad de que un intervalo dado no 𝑛−3
contenga la media poblacional desconocida. Intervalos de confianza para la diferencia de medias

𝑉𝑎𝑙𝑜𝑟 𝑎𝑙𝑓𝑎 = 1 − coeficiente de confianza Sean 𝑥11 , 𝑥12 ,…, 𝑥1𝑛1 una muestra aleatoria de
𝑛1 observaciones tomadas de una primera población con
valor esperado 𝜇1 , y 𝜎 21 y 𝑥21 , 𝑥22 ,…, 𝑥2𝑛2 una
Intervalos de confianza para media poblacional – muestra aleatoria de 𝑛2 observaciones tomada de la
Muestras grandes segunda población con valor esperado μ2 y Si 𝒙̅1 y 𝒙̅ 2
son las medias muéstrales, la estadística 𝒙̅1 - 𝒙̅ 2 es un
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria grande (n > 30) de
estimador puntual de
una población estándar 𝜎, por lo que 𝑋̅ es
𝜇1 −𝜇2 , y tiene una distribución normal si las dos
aproximadamente normal. Entonces un intervalo de
poblaciones son normales, o aproximadamente normal si
confianza 100(1 - 𝛼) % para 𝜇 es:
cumple con las condiciones del teorema del límite
central (tamaños de muestras relativamente grandes).
• Intervalo de confianza para estimar 𝝁
Por lo tanto:
cuando 𝝈 es conocido
̅1 − 𝒙̅ 2 − (𝜇1 − 𝜇2 )
𝒙
̅ ± 𝒛𝜶 𝝈𝒙
𝝁=𝑿 𝑧=
⁄ 𝟐
𝜎12 𝜎22
√ +
Donde 𝜎𝑥 = 𝜎 ⁄√𝑛. Cuando el valor de 𝜎 es 𝑛1 𝑛2
desconocido, se puede sustituir por la desviación
estándar muestral s. Intervalos de confianza para diferencias de medias
con varianzas conocidas pera diferentes (𝝈𝟐 𝟏 ≠ 𝝈𝟐 𝟐
• Intervalo de confianza para estimar 𝝁 )
cuando σ es desconocido

En el evento probable que σ sea desconocida, la desviación Si las varianzas poblacionales son conocidas y
estándar de la muestra debe sustituirse: diferentes, los pasos a seguir para encontrar el intervalo
de confianza son los siguientes:
a) El estadístico usado como estimador puntual de la
𝑆
̅ ± 𝒁𝒔𝒙 ; Donde 𝑆𝑥 =
𝝁= 𝒙 diferencia de medias 𝜇1 −𝜇2 será igual a T= 𝒙̅1 -
√𝑛
̅2
𝒙

Intervalos de confianza para la media poblacional con b) La variable aleatoria asociada con el estimador
muestras pequeñas será la variable normal estándar dada por:

Sea 𝑋1 , … , 𝑋𝑛 una muestra pequeña (n < 30) de una ̅1 − 𝒙̅ 2 − (𝜇1 − 𝜇2 )


𝒙
población normal con media 𝜇, para calcular el 𝑧=
estadístico t es: 𝜎12 𝜎22
√ +
𝑛1 𝑛2
c) Si 𝒙̅1 - 𝒙̅ 2 son las medias de dos muestras
𝑋̅ − 𝜇
𝑡= aleatorias independientes de tamaño 𝑛1 −
𝑠⁄√𝑛 𝑛2 tomadas de poblaciones que tienen varianzas
conocidas, entonces el intervalo de confianza para
Tiene una distribución t de student con n – 1 grados de 𝜇1 −𝜇2 .
libertad, denotada por 𝑡𝑛−1 . Cuando n es grande, la 𝜎12 𝜎22
distribución de la cantidad (𝑋̅ − 𝜇) / (𝑠⁄√𝑛) es muy cercana a
( 𝒙̅1 - 𝒙̅ 2 ) - Z √ + ≤ 𝜇1 −𝜇2 ≤ 𝒙̅1 - 𝒙̅ 2 + Z
𝑛1 𝑛2
la curva normal, de esta forma la curva normal puede usarse en 𝜎12 𝜎22
lugar de la t de student. √ +
𝑛1 𝑛2

Intervalo de confianza para estimar 𝜇:

𝒔
̅± 𝒕
𝝁= 𝒙
√𝒏

2
Intervalos de confianza para diferencia de medias 3 ANALISIS Y RESULTADOS
para varianzas desconocidas e iguales (𝝈𝟐 𝟏 = 𝝈𝟐 𝟐 Para la mejor comprensión y ampliación de los
=𝝈𝟐 𝟑 ). temáticos intervalos de confianza se decide proponer
una serie de ejercicios con situaciones específicas para
Cuando las varianzas de la población son desconocidas, así aplicar cada una de las ecuaciones anteriormente
se usan las varianzas de la muestra de la muestra como explicadas.
estimadores. El procedimiento a seguir para el cálculo
del intervalo de confianza para la diferencia de dos  Ejercicio 1. Intervalo de confianza para
medias es el siguiente: muestras grandes (Estimación de 𝝁 cuando
a. El estadístico usado como estimador puntual de es conocido)
la diferencia de medias 𝜇1 −𝜇2 será 𝒙̅1 - 𝒙̅ 2 . Consideremos el caso de un promotor inmobiliario
b. La variable aleatoria asociada al estimador se quien intenta construir un gran centro comercial. Puede
denota con la letra t. /en el caso de muestras estimar en el área el ingreso promedio por familia como
pequeñas) indicador de las ventas esperadas. Una muestra de 𝑛 =
100 familias de una media de 𝑥̅ = 𝑈𝑆$35,500. Se
̅1 − 𝒙̅ 2 − (𝜇1 − 𝜇2 )
𝒙 asume que la desviación estándar poblacional es 𝜎 =
𝑡= 𝜎
1 1 𝑈𝑆$7,200. Dado que 𝜎𝑥̅ = , se estima un intervalo
𝑠𝑝 √ + √100
𝑛1 𝑛2 del 95%
c. Para calcular el intervalo de confianza se debe
tener en cuenta el nivel de confianza que se 7,200
Como I.C. para estimar 𝜇 = 35,500 ± (1.96)
quiere considerar y los grados de libertad que √100
se calculan : = 34,088.80 ≤ 𝜇 ≤ 36,911.20

 Ejercicio 2. Intervalo de confianza cuando 𝝈


g.i. = 𝑛1 + 𝑛2 − 2
es desconocida

Gerry Gerber, CPA, acaba de registrar las declaraciones


Intervalos de confianza para diferencia de medias con
varianzas desconocidas y diferentes (𝝈𝟐 𝟏 ≠ 𝝈𝟐 𝟐 )
de impuestos de sus clientes. Desea estimar la cantidad
promedio que deben al Servicio de Renta Interna. De los
clientes que selecciono en su muestra, la cantidad
a. El estadístico usado como estimador puntual promedio que se adeudaba era de US$652.68. Ya que la
de la diferencia de medias 𝜇1 −𝜇2 será 𝒙̅1 - desviación estándar de todos sus clientes 𝜎 es
̅2.
𝒙 desconocida, Gerber debe estimar 𝜎 con la desviación
estándar de la muestra de 𝛿 = 𝑈𝑆$217.43. Si se desea
b. La variable asociada al estimador será la un nivel del 99% de confianza, el valor de Z apropiado
variable t es 2.58 (0.99/2=0.4950). De la tabla Z, un área de
0.4950 revela que Z = 2.58.
̅1 − 𝒙̅ 2 − (𝜇1 − 𝜇2 )
𝒙
𝑡= I.C. para estimar 𝜇 = 𝑥̅ ± 𝑍𝑠𝑥̅
𝑠2 𝑠2 = 𝑈𝑆$652.68 ± 2.58
𝑈𝑆$217.43
√ 1 + 2 √50
𝑛1 𝑛2
= 𝑈𝑆$573.35 ≤ 𝜇 ≤ 732.01

c. Los intervalos de confianza están dados por el Los resultados son tanto buenos como malos. Las
siguiente teorema: ventajas son que el intervalo del 95% es más estrecho y
𝑠12 𝑠22 ofrece mayor precisión. Un intervalo amplio no es
( 𝒙̅1 - 𝒙̅ 2 ) - t √ + ≤ 𝜇1 −𝜇2 ≤ 𝒙̅1 - 𝒙̅ 2 +
𝑛1 𝑛2 especialmente útil. Revelaría muy poco si el profesor le
𝑠12 𝑠22 pidiera que la media del siguiente examen estuviera
t√ + entre 0 y el 100%. Entre más estrecho sea el intervalo,
𝑛1 𝑛2
más significativo es.
d. Los grados de libertad están dados por la
siguiente ecuación: La desventaja es que el señor Gerber ahora está el 95%
seguro de que el intervalo contiene en realidad 𝜇.
2 Aunque el intervalo es más preciso (más estrecho), la
𝑠2 𝑠2
( 1 + 2) probabilidad de que contenga 𝜇 se ha reducido del 99 al
𝑛1 𝑛2
𝑣= 2 95%. El señor Gerber tuvo que abandonar algo de
(𝑠1 ⁄𝑛1 )2 (𝑠22 ⁄𝑛2 )2
+ confianza y ganar más precisión.
𝑛1 − 1 𝑛2 − 1

3
6.3≤ 𝜇1 −𝜇2 ≤ 25.7
 Ejercicio 3. Intervalos de confianza para la
media en el caso de muestras pequeñas – la  Ejercicio 5. Intervalos de confianza para la
distribución t diferencia de medias. (cuando las varianzas
El contrato laboral realizado entre United Auto Workers son desconocidas pero iguales)
(UAW) y Ford Motor Company (FMC) requirió que la
producción promedio para una sección de producción se La siguiente tabla presenta los resultados de 2 muestras
realizara a 112 unidades por mes, por empleado. aleatorias para comparar el contenido de nicotina de 2
Surgieron desacuerdos entre UAW y FMC respecto a si marcas de cigarrillos.
se mantenía este estándar o no. El contrato laboral
específico que si los niveles de producción promedio se Marca A Marca B
reducían por debajo de cantidad estipulada de 𝜇 = 112, 𝑛𝑖 10 8
a FMC se le permitiría tomar “acciones correctivas”. 𝑥̅𝑖 3.1 2.7
Debido al costo implicado, solo se evaluaran 20 𝑠𝑖 0.5 0.7
trabajadores, resultando una media de 102 unidades. Se
asume que se encuentro una desviación estándar de 8.5 Suponiendo que los conjuntos de datos provienen de
unidades y que los niveles de producción están muestras tomadas al azar de poblaciones normales con
distribuidos normalmente. ¿Un intervalo de confianza de varianzas desconocidas e iguales, construya un intervalo
90% tiene a sugerir una contravención del contrato de confianza del 95% para la diferencia real de nicotina
laboral, permitiendo así una acción correctiva? de las 2 marcas.
Con un nivel de confianza del 90 % y n – 1 19 g.I., la
tabla F da un valor t de 1.729. Solucion: Como las varianzas son iguales, calculamos
𝑠𝑝2 que está dado por:
𝑠
I.C. para estimar 𝜇 = 𝑥̅ ± 𝑡
√𝑛
8.5 (9)0.52 + (7)0.72
= 102 ± (1.729) 𝑠𝑝2 = = 0.355
√20 16
= 102 ± 3.29
98.71 ≤ 𝜇 ≤ 105.29 𝑠𝑝 = 0.596

El nivel de producción promedio de 112 unidades, El intervalo de confianza del 95% está dado por
especificados en el contrato laboral, no está dentro del (t(0.025,g.I. 16)=2.21):
intervalo de confianza.
1 1 1 1
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − 𝑠𝑝 √ + ≤ 𝜇1 − 𝜇2 ≤ ̅̅̅
𝑥1 − 𝑥
̅̅̅2 + 𝑡 𝑠𝑝 √ +
𝑛1 𝑛2 𝑛1 𝑛2
 Ejercicio 4. Intervalos de confianza para la
diferencia de medias. (cuando las varianzas
1 1
son conocidas pero diferentes) 3.1 − 2.7 − 2.21(0.596)√ + ≤ 𝜇1 − 𝜇2 ≤ 3.1 − 2.7 +
10 8
1 1
Construya un intervalo de confianza del 94% para la 2.21(0.596)√ +
10 8
diferencia real entre las duraciones de dos marcas de
focos, si una muestra de 40 focos tomada al azar de la −0.2 ≤ 𝜇1 − 𝜇2 ≤ 1.0
primera marca dio una duración media de 418 horas, y
una muestra de 50 focos de otra marca dieron una
duración media de 402 horas. Las desviaciones  Ejercicio 6. Intervalos de confianza para la
estándares de las dos poblaciones son 26 horas y 22 diferencia de medias. (cuando las varianzas
horas, respectivamente. son desconocidas y diferentes)
Tenemos que: 𝒙 ̅1 = 418, 𝒙̅2 = 402, 𝜎1 = 26, 𝜎2 =22,
𝑛1 = 40, 𝑛2 = 50, con 𝑧 = 1.88. El intervalo de Cierto metal se produce, por lo común, mediante un proceso
confianza es, entonces: estándar. Se desarrolla un nuevo proceso en el que se añade
una aleación a la producción del metal. Los fabricantes se
𝜎12 𝜎22 𝜎12 𝜎22
encuentran interesados en estimar la verdadera diferencia entre
̅1 - 𝒙
(𝒙 ̅2 ) - Z √ + ≤ 𝜇1 −𝜇2 ≤ 𝒙
̅1 - 𝒙
̅2 + Z √ + las tensiones de la ruptura de los metales producidos por los 2
𝑛1 𝑛2 𝑛1 𝑛2
procesos. Para cada metal se seleccionan 12 ejemplares y cada
uno de estos se somete a una tensión hasta que se rompe.
262 222
(418 - 402) - 1.88 √ + ≤ 𝜇1 −𝜇2 ≤ (418 - 402) +
40 50
262 222
1.88 √ +
40 50

Entonces:

4
1 1 1 1
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − 𝑡√ + ≤ 𝜇1 − 𝜇2 ≤ ̅̅̅
𝑥1 − ̅̅̅
𝑥2 + 𝑡 √ +
𝑛1 𝑛2 𝑛1 𝑛2

14.92 24.82
La siguiente tabla muestra las tensiones de ruptura de los (451.4 − 443.3) − 2.10√ + ≤ 𝜇1 − 𝜇2
ejemplares en kilogramos por centímetro cuadrado: 12 12

14.92 24.82
≤ (451.4 − 443.3) + 2.10√ +
12 12
Proc 4 4 4 4 4 4 4 4 4 4 4 4
eso 4 0 7 2 5 3 8 1 5 2 5 4
está 6 1 6 1 9 8 1 1 6 7 9 5 −25.65 ≤ 𝜇1 − 𝜇2 ≤ 9.49
ndar
Proc 4 4 4 4 4 4 4 4 4 4 4 4 𝑡1 = 2.88, 𝑡2 = −2.88
eso 6 4 3 6 2 7 5 5 2 6 5 4
nuev 2 8 5 5 9 2 3 9 7 9 2 7
o

Si se supone que el muestreo se llevó a cabo sobre 2


distribuciones normales e independientes, obtener los
intervalos de confianza estimados 95% y 99% para la
diferencia entre los dos procesos. Interprete los
resultados.

Solucion

Calculamos los valores que necesitamos.

n Media S
12 443.3 24.8
12 451.4 14.9

14.92 24.82
95% de confianza (451.4 − 443.3) − 2.88√ + ≤ 𝜇1 − 𝜇2
12 12

𝑡1 = 2.10, 𝑡2 = −2.10 14.92 24.82


≤ (451.4 − 443.3) + 2.88√ +
12 12

2 −32.16 ≤ 𝜇1 − 𝜇2 ≤ 15.99
𝑠2 𝑠2
( 1 ⁄𝑛1 + 2 ⁄𝑛2 )
𝑣= 2 2 = 18
𝑠2 𝑠2
[( 1 ⁄𝑛1 ) /(𝑛1 − 1)] + [( 2 ⁄𝑛2 ) /(𝑛2 − 1)]