Vous êtes sur la page 1sur 23

DISTRIBUCION MUESTRAL DE DIFERENCIA

DE MEDIAS
Varianza Poblacional Conocidas
En muchas situaciones surge la necesidad de comparar la medias muestrales de dos poblaciones, por
ejemplo, supongamos que se esta interesado en comparar los tiempos medios de duración de dos
artefactos eléctricos . La fabricación de ambas marcas de artefactos se realiza por compañías distintas y
con diferentes procesos de fabricación. Por tanto, los artefactos producidos por cada compañía tendrá
una distribución diferente, una de la otra, en los tiempos de duración.
Varianza Poblacional Conocidas

𝒙𝟏 tiempo de duracion de la primera marca y se admite que sigue una distribución 𝑁(𝜇𝟏 , 𝜎1 2 )
𝒙2 tiempo de duracion de la primera marca y se admite que sigue una distribución 𝑁(𝜇2 , 𝜎2 2 )
Se selecciona una muestra de 𝑛1 de la primera marca de artefactos y 𝑛2 para a segunda marca
Los estadísticos medias muestrales de ambas muestras 𝒙𝟏 y 𝒙2

𝛻𝑥ҧ = 𝒙𝟏 − 𝒙2
Varianza Poblacional Conocidas
Sean dos poblaciones con medias 𝜇1 y 𝜇2 y varianzas 𝜎 21 y 𝜎 2 2 respectivamente, supuestas conocidas,
entonces, la variable aleatoria 𝑥ҧ1 − 𝑥ҧ2 tienes las siguientes propiedades:
𝜇𝑋ത1−𝑋ത2 = 𝐸 𝑥ҧ1 − 𝑥ҧ2 = 𝐸(𝑥ҧ1 ) − 𝐸 𝑥2 = 𝜇1 − 𝜇2
𝜎2 1 𝜎2 2
𝜎2 𝑋ത1 −𝑋ത2 = 𝑉 𝑥ҧ1 − 𝑥ҧ2 = 𝑉 𝑥ҧ1 − 𝑉 𝑥ҧ2 = 𝑛1
+ 𝑛2
Para 𝑛1 y 𝑛2 suficientemente grandes, la variable aleatoria:
𝛻𝑥ҧ − (𝜇1 − 𝜇2 )
𝑍=
𝜎 21 𝜎 2 2
𝑛 + 𝑛 1 2
tiene aproximadamente distribuciones normales N(0,1)
Varianza Poblacional Conocidas
El precio de venta de una casa nueva en Huaraz se distribuye
Normal con media $ 450000 y desviación típica de $ 64000, en
cambio en Independencia se distribuye Normal con media $
40000 y desviación típica de $ 36000. Si se toma una muestra
aleatoria de 100 casas nuevas en Huaraz y 120 en Independencia
¿Cual es la probabilidad de que el precio promedio de venta sea
mayor en Huaraz que en Independencia? Consideremos a Huaraz
la población 1 y a Independencia al la población 2, entonces
Varianza poblacional desconocidas
Sea 𝑋1 la medida de una muestra aleatoria de tamaño n1 extraída de la población normal
N (𝜇1 , 𝜎1 2 ), y sea 𝑋2 la media de otra muestra aleatoria de tamaño n2 extraída de la
población normal N (𝜇2 , 𝜎2 2 ), independiente de la anterior.
A. VARIANZAS POBLACIONALES IGUALES
𝜎12 = 𝜎22 = 𝜎 2
En este caso, la variable aleatoria 𝑋1 − 𝑋2 tiene distribución normal
𝜎12 𝜎22
𝑁 𝜇1 + 𝜇2 , +
𝑛1 𝑛2

Y la variable aleatoria estándar:

𝑋1 −𝑋2 − 𝜇1 −𝜇2 𝑋1 −𝑋2 − 𝜇1 −𝜇2


𝑍= =
𝜎1 2 𝜎2 2 𝜎 1 1
+𝑛 +
𝑛1 𝑛2
𝑛1 2
Varianza poblacional desconocidas
VARIANZAS POBLACIONALES IGUALES
Tiene distribución normal N (0,1). Por otra parte,

𝑛1 −1 𝑆መ12 𝑛2 −1 𝑆መ22 𝑛1 −1 𝑆መ12 𝑛2 −1 𝑆መ22


~ 𝑋2 𝑛1 − 1 , 𝑦 ~ 𝑋2 𝑛2 − 1 , 𝑦 𝑉 = + ~ 𝑋 2 (𝑛1 + 𝑛2 −
𝜎12 𝜎22 𝜎12 𝜎22
Varianza poblacional desconocidas
VARIANZAS POBLACIONALES IGUALES
Tiene distribución t-student con n1+n2-2 grados de libertad
Donde, 𝑆መ𝐶2 la varianza común, tiene la expresión:
𝑛1 −1 𝑆መ12 + 𝑛2 −1 𝑆መ22
𝑆መ𝐶2 =
𝑛1 +𝑛2 −2
Varianza poblacional desconocidas
B. VARIANZAS POBLACIONALES DIFERENTES
𝜎12 ≠ 𝜎22
En este caso la variable aleatoria:

𝑋1 −𝑋2 − 𝜇1 −𝜇2
𝑇= ,
෡2 𝑆
𝑆 ෡2
𝐶+ 𝐶
𝑛1 𝑛2
Varianza poblacional desconocidas
VARIANZAS POBLACIONALES DIFERENTES
Tiene distribución t-student con g grados de libertad, donde,

2
෡2
෡2 𝑆
𝑆1+ 2
𝑛1 𝑛2
𝑔= 2 2
෡2
𝑆 ෡2
𝑆
1 2
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1

Si g no es un número entero se redondea al entero más cercano.


Ejemplo:
Dos amigos A y B juegan "cara" o "sello" con una moneda. Suponga que en este juego, cada
uno lanza la moneda 35 veces y que uno de ellos gana si obtiene 7 caras más que el otro.
Calcular la probabilidad de que B gane el juego.
Solución:
Sea X el número de caras que saca el jugador A en las 35 tiradas y sea Y el número de caras que
saca el jugador B en las 35 tiradas, entonces, cada variable tiene distribución B (35,0.5), donde
p=0.5 es la probabilidad de obtener cara en cada tirada de los jugadores A y B respectivamente.
El jugador B gana el juego si saca 7 caras más que A o si su proporción de caras es 7/35=0.2 más
que A. Luego, la probabilidad de que B gane el juego es:
𝑃 𝑃ത2 − 𝑃ത1 > 0.2 = 1 − 𝑃 𝑃ത2 − 𝑃ത1 > 0.2 = 0.0475 , donde:
0.2−(0.5−0.5)
𝑃 𝑃ത2 − 𝑃ത1 > 0.2 = 𝑃 𝑍 ≤ = 𝑃 𝑍 ≤ 1.67 = 0.9525
(0.5(0.5) (0.5(0.5)
+
35 35
INTERVALO DE ESTIMACIÓN DE LA
DIFERENCIA DE MEDIAS POBLACIONALES
VARIANZA CONOCIDA
A. DE DOS POBLACIONES CON VARIANZAS CONOCIDAS
Si ഥ
X1 y ഥ
X2 son los valores de las medias de dos muestras aleatorias independientes de tamaños
n1 y n2 seleccionadas respectivamente de despoblaciones cuyas distribuciones son no normales
con varianzas σ12 y σ22 supuestas desconocidas, entonces, siempre que los tamaños de las
muestras sean grandes (𝑛1 ≥ 30 y 𝑛1 ≥ 30), los parámetros 𝜎1 𝑦 𝜎2 se estiman puntualmente
por 𝑆መ1 𝑦 𝑆መ2 . El intervalo de confianza del (l - α) xl00% para 𝜇1 − 𝜇2 esentonces:

ഥ X2 − 𝑍0 𝑆መ12 /𝑛1 + 𝑆መ22 /𝑛2 ≤ 𝜇1 − 𝜇2 ≤ ഥ


X1 − ഥ X2 + 𝑍0 𝑆መ12 /𝑛1 + 𝑆መ22 /𝑛2
X1 − ഥ
Ejemplo
Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos
marcas de focos, si una muestra de 40 focos tomada al azar de la primera mara dio una duración
media de 418 horas,y una muestra de 50 focos de otra marca dieron una duración media de 402
horas. La desviación estándares de las dos poblaciones son 26 horas y 22 horas, respectivamente.
Solución:
Tenemos que X₁ = 418, X₂ = 402, S²₁=26, S²₂= 22 , n₁=40, n₂=50, z=1.88
El intervalo de confianza es:

ഥ X2 − 𝑍0 𝑆መ12 /𝑛1 + 𝑆መ22 /𝑛2 ≤ 𝜇1 − 𝜇2 ≤ ഥ


X1 − ഥ X2 + 𝑍0 𝑆መ12 /𝑛1 + 𝑆መ22 /𝑛2
X1 − ഥ

262 222 262 222


418 − 402 − 1.88 + ≤ µ₁−µ₂ ≤ 418 − 402 − 1.88 +
40 50 40 50

6.3 ≤ µ₁−µ₂ ≤25.7


DE DOS POBLACIONES CON VARIANZA
DESCONOCIDAS
En esta sección se verá el caso en donde se tienen dos poblaciones con medias y varianzas
desconocidas, y se desea encontrar un intervalo de confianza para la diferencia de dos medias X₁ -
X₂ Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el intervalo de
confianza de la distribución normal. Sin embargo, cuando se toman muestras pequeñas se supone
que las poblaciones de interés están distribuidas de manera normal, y los intervalos de confianza se
basan en la distribución t.
A. DOS POBLACIONES NORMALES CON VARIANZAS DESCONOCIDAS SUPUESTAS IGUALES: (Σ²₁ = Σ²₂ = Σ²)
En este caso, la obtención de la estadística de pivote es como sigue.
Si X₁ y X₂son las medias y s12 y s22 las varianzas de dos muestras aleatorias independientes de tamaño
n1 y n2, respectivamente, tomadas de dos poblaciones normales con varianzas desconocidas pero
iguales, entonces un intervalo de confianza del 100(1 - ⍺) por ciento para la diferencia entre medias
es:
1 1
µ ₁ − µ ₂ = (𝑋₁ − 𝑋 ₂) ± 𝑡𝑆⍴ + 𝑛₂
𝑛₁
DE DOS POBLACIONES CON VARIANZA DESCONOCIDAS
DOS POBLACIONES NORMALES CON VARIANZAS DESCONOCIDAS SUPUESTAS IGUALES: (Σ²₁ =
Σ²₂ = Σ²)

En donde:
𝑆² ₁ n ₁−1 +𝑆 2₂(𝑛 ₂−1)
𝑆²⍴ =
𝑛₁+n₂−2

Es el estimador combinado de la desviación estándar común de la población con n1+n2 – 2


grados de libertad.
Ejemplo
Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en
cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento
queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez
muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de
5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una
desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido de manera normal.
Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por
otra parte, supóngase que las dos poblaciones normales tienen la misma desviación estándar.
Solución:
El estimador combinado de la desviación estándar es:
Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41
Expresión que se reduce a – 0.72 µ₁ - µ₂ 6.72
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente, para este nivel confianza, no puede
concluirse la existencia de una diferencia entre las medias.
DE DOS POBLACIONES CON VARIANZA
DESCONOCIDAS
B. DOS POBLACIONES CON VARIANZAS DESCONOCIDAS PERO DIFERENTES

Consideremos ahora el problema de encontrar una estimación por intervalos de µ₁ - µ₂cuando


no es probable que las varianzas poblacionales desconocidas sean iguales. La estadística que se
usa con más frecuencia en este caso es:
(𝑋 ₁ −𝑋 ₂) −(µ ₁ −µ ₂)
𝑡= 2
𝑆² ₁
ൗn ₁+𝑆 ₂ൗ𝑛 ₂

que tiene aproximadamente una distribución t con “r” grados de libertad, donde:
2
(𝑆² ₁ൗn ₁+𝑆 ₂ൗ𝑛 ₂)2
𝑟= 21 2
[ (𝑆 ൘n ₁)2 /(n ₁−1) ]+[(𝑆 ₂ൗ𝑛 ₂)2 /(𝑛 ₂−1) ]
DE DOS POBLACIONES CON VARIANZA DESCONOCIDAS
DOS POBLACIONES CON VARIANZAS DESCONOCIDAS PERO DIFERENTES

Como “r” rara vez es número entero, lo redondeamos al número entero más cercano menor.
Esto es si el valor de “r” es de 15.9 se redondeará a 15.
Al despejar la diferencia de medias poblacionales de la fórmula de T nos queda:

𝑆² ₁ 𝑆² ₂
µ ₁ − µ ₂ = (𝑋₁ − 𝑋 ₂) ± 𝑇 +
𝑛₁ 𝑛₂
Ejemplo
El departamento de zoología de la Universidad de Virginia llevó a cabo un estudio para estimar
la diferencia en la cantidad de ortofósforo químico medido en dos estaciones diferentes del río
James. El ortofósforo se mide en miligramos por litro. Se reunieron 15 muestras de la estación 1
y se obtuvo una media de 3.84 con una desviación estándar de 3.07 miligramos por litro,
mientras que 12 muestras de la estación 2 tuvieron un contenido promedio de 1.49 con una
desviación estándar 0.80 miligramos por litro. Encuentre un intervalo de confianza de 95% para
la diferencia del contenido promedio real de ortofósforo en estas dos estaciones, suponga que
las observaciones vienen de poblaciones normales con varianzas diferentes.
Ejemplo
Solución
Datos: Estación 1 Estación 2
n1 = 15 n2 = 12

S1= 3.07 S2 = 0.80

Primero se procederá a calcular los grados de libertad:


Al usar ⍺=0.05, encontramos en la tabla con 16 grados de libertad que el valor de t es 2.120, por
lo tanto:
que se simplifica a:
0.60 µ₁ - µ₂ 4.10
Por ello se tiene una confianza del 95% de que el intervalo de 0.60 a 4.10 miligramos por litro
contiene la diferencia de los contenidos promedios reales de ortofósforo para estos dos lugares.

Vous aimerez peut-être aussi