Académique Documents
Professionnel Documents
Culture Documents
1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
Inferencia basada en dos muestras
En Estadística I vimos intervalos de confianza y test de hipótesis para una sola media μ, una sola
proporción p y una sola varianza σ2. Aquí ampliaremos estos conceptos para el caso de dos
poblaciones distintas.
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 1/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
Puebas z e intervalos de confianza para una diferencia entre dos medias poblacionales
Analizaremos las inferencias relacionadas con la diferencia μ1 μ2 entre las medias de dos
poblaciones distintas. Podría ser probar la hipótesis μ1 μ2 = 0 o lo que es lo mismo μ1 = μ2. También
podríamos estimar μ1 μ2 al calcular un intervalo de confianza de 95%.
Suposiciones básicas:
X1, ..., Xm es una muestra aleatoria de una población con media μ1 y varianza σ12.
Y1, ..., Yn es una muestra aleatoria de una población con media μ2 y varianza σ22.
Las muestras X e Y son independientes entre si.
El estimador natural de μ1 μ2 es , la diferencia entre las medias muestrales. La estadística de
prueba resulta de estandarizar el estimador, así que se requiere expresiones para el valor esperado y
la desviación estándar de .
luego la estandarización pasa a ser:
luego el problema resulta una vez tenemos el test estadístico lo mismo que hicimos para una sola
población:
y para los valores de la probabilidad de error de tipo II tenemos:
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 2/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
Muestras grandes:
Si las muestras son lo suficientemente grandes, podemos suponer comportamiento normal utilizando
las varianzas muestrales en lugar de las varianzas poblacionales (m y n > 40).
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 3/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
Prueba t para dos muestras e intervalo de confianza
Supondremos que las muestras X1, ..., Xm y Y1, ..., Yn provienen de poblaciones normales y que
ambas son independientes entre si. De esta manera el estadístico:
tiene aproximadamente una distribución t con ν grados de libertad estimados mediante la fórmula:
donde ν se redondea al entero inferior
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 4/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
Análisis de pares de datos
Para el caso en que se tiene n individuos y se hacen dos observaciones de cada individuo u objeto, lo
cual da como resultado pares de valores.
Suposiciones: Los datos consisten en n pares seleccionados de forma independiente (X1,
Y1), (X2, Y2), ..., (Xn, Yn), con E(Xi) = µ1 y E(Yi) = µ2. Sea D1 = X1 Y1, D2 = X2 Y2, ..., Dn = Xn Yn,
por lo cual las Di son las diferencias de los pares. Entonces se supone que las Di están distribuidas
normalmente, con media µD y σD2.
El inconveniente con los pares de datos es que las observaciones X e Y no suelen ser independientes
y hay que utilizar otra método de análisis del usado previamente. Pero los Di si son independientes
con lo cual se puede resolver para el caso de una prueba de una sola muestra.
µD = µ1 µ2 = Δ0 un estadístico t y ν = n 1
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 5/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
Inferencias en relación con una diferencia entre proporciones poblacionales
Se supondrá que se tienen muestras con m individuos y X representa a los individuos que presentan
una dada caracterítica. Lo mismo para la otra muestra con n individuos con Y que tienen una
característica. El estimador que tomaremos será p1 p2 y será la diferencia entre las proporciones
muestrales X/m Y/n. Con = X/m y = Y/n, el estimador de p1 p2 se puede expresar como
.
Consideraremos muestras grandes por lo que podemos estimar las distribuciones de X e Y como
normales por lo que analizaremos los casos donde queremos analizar que la diferencia entre las
proporciones sea nula, p1 p2 = 0, o lo que es lo mismo p1 = p2. Luego usamos el estadístico
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 6/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
El intervalo de confianza viene dado por
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 7/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
Inferencias relacionadas con dos varianzas poblacionales
Distribución F
La distribución F tiene dos parámetros, ν1 y ν2. El primero es el número de grados de libertad del
numerador y el segundo del denominador. siendo ambos enteros positivos. Esta función está
relacionada con el cociente de dos variables cuyas distribuciones χ2.
Propiedad:
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 8/9
8/6/2015 127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/
http://127.0.0.1:51236/temp_print_dirs/eXeTempPrintDir_fEacZ0/Clase_3/ 9/9