Vous êtes sur la page 1sur 9

8/6/2015 127.0.0.

1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

Inferencia basada en dos muestras
En Estadística I vimos intervalos de confianza y test de hipótesis para una sola media μ, una sola
proporción p y una sola varianza σ2. Aquí ampliaremos estos conceptos para el caso de dos
poblaciones distintas.

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 1/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

Puebas z e intervalos de confianza para una diferencia entre dos medias poblacionales

Analizaremos las inferencias relacionadas con la diferencia μ1 ­ μ2 entre las medias de dos
poblaciones distintas. Podría ser probar la hipótesis μ1 ­ μ2 = 0 o lo que es lo mismo μ1 = μ2. También
podríamos estimar μ1 ­ μ2 al calcular un intervalo de confianza de 95%.

Suposiciones básicas:

X1, ..., Xm es una muestra aleatoria de una población con media μ1 y varianza σ12.
Y1, ..., Yn es una muestra aleatoria de una población con media μ2 y varianza σ22.
Las muestras X e Y son independientes entre si.

El estimador natural de μ1 ­ μ2 es  , la diferencia entre las medias muestrales. La estadística de
prueba resulta de estandarizar el estimador, así que se requiere expresiones para el valor esperado y
la desviación estándar de  . 

Proposición: El valor esperado de   es μ1 ­ μ2, así que   es un estimador insesgado


de μ1 ­ μ2. La desviación estándar de   es:

luego la estandarización pasa a ser:

luego el problema resulta una vez tenemos el test estadístico lo mismo que hicimos para una sola
población:
 

y para los valores de la probabilidad de error de tipo II tenemos:

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 2/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

Muestras grandes:

Si las muestras son lo suficientemente grandes, podemos suponer comportamiento normal utilizando
las varianzas muestrales en lugar de las varianzas poblacionales (m y n > 40). 

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 3/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

Prueba t para dos muestras e intervalo de confianza

Supondremos que las muestras X1, ..., Xm  y  Y1, ..., Yn  provienen de poblaciones normales y que
ambas son independientes entre si. De esta manera el estadístico:

tiene aproximadamente una distribución t con ν grados de libertad estimados mediante la fórmula:

donde ν se redondea al entero inferior

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 4/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

Análisis de pares de datos

Para el caso en que se tiene n individuos y se hacen dos observaciones de cada individuo u objeto, lo
cual da como resultado pares de valores.

Suposiciones: Los datos consisten en n pares seleccionados de forma independiente (X1,
Y1), (X2, Y2), ..., (Xn, Yn), con E(Xi) = µ1 y  E(Yi) = µ2. Sea D1 = X1 ­ Y1, D2 = X2 ­ Y2, ..., Dn = Xn ­ Yn,
por lo cual las Di son las diferencias de los pares. Entonces se supone que las Di están distribuidas
normalmente, con media  µD y σD2.

El inconveniente con los pares de datos es que las observaciones X e Y no suelen ser independientes
y hay que utilizar otra método de análisis del usado previamente. Pero los Di si son independientes
con lo cual se puede resolver para el caso de una prueba de una sola muestra. 

µD = µ1 ­ µ2 = Δ0    un estadístico t y ν = n ­1

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 5/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

Inferencias en relación con una diferencia entre proporciones poblacionales

Se supondrá que se tienen muestras con m individuos y X representa a los individuos que presentan
una dada caracterítica. Lo mismo para la otra muestra con n individuos con Y que tienen una
característica. El estimador que tomaremos será p1 ­ p2 y será la diferencia entre las proporciones
muestrales X/m ­ Y/n. Con   = X/m y   = Y/n, el estimador de p1 ­ p2 se puede expresar como 
 ­  .

Consideraremos muestras grandes por lo que podemos estimar las distribuciones de X e Y como
normales por lo que analizaremos los casos donde queremos analizar que la diferencia entre las
proporciones sea nula, p1 ­ p2 = 0, o lo que es lo mismo p1 = p2. Luego usamos el estadístico 

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 6/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

El intervalo de confianza viene dado por

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 7/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

Inferencias relacionadas con dos varianzas poblacionales

Distribución F

La distribución F tiene dos parámetros, ν1 y ν2. El primero es el número de grados de libertad del
numerador y el segundo del denominador. siendo ambos enteros positivos. Esta función está
relacionada con el cociente de dos variables cuyas distribuciones χ2. 

Propiedad: 

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 8/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/

http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 9/9

Vous aimerez peut-être aussi