Académique Documents
Professionnel Documents
Culture Documents
El test de locacin de muestra nica por el cual se comprueba si la media de una poblacin
distribuida normalmente tiene un valor especificado en una hiptesis nula.
El test de locacin para dos muestras, por el cual se comprueba si las medias de dos poblaciones
distribuidas en forma normal son iguales. Todos estos test son usualmente llamados test t de Student, a pesar
de que estrictamente hablando, tal nombre slo debera ser utilizado si las varianzas de las dos poblaciones
estudiadas pueden ser asumidas como iguales; la forma de los ensayos que se utilizan cuando esta asuncin se
deja de lado suelen ser llamados a veces como prueba t de welch Estas pruebas suelen ser comnmente
nombradas como pruebas t desapareadas o de muestras independientes, debido a que tienen su aplicacin mas
tpica cuando las unidades estadsticas que definen a ambas muestras que estn siendo comparadas no se
superponen.
El test de hiptesis nula por el cual se demuestra que la diferencia entre dos respuestas medidas en
las mismas unidades estadsticas es cero. Por ejemplo, supngase que se mide el tamao del tumor de un
paciente con cncer. Si el tratamiento resulta efectivo, lo esperable seria que el tumor de muchos pacientes
disminuyera de tamao luego de seguir el tratamiento. Esto con frecuencia es referido como prueba t de
mediciones apareadas o repetidas.
El test para comprobar si la pendiente de una regresin lineal difiere estadsticamente de cero.
Desapareada
Las pruebas t desapareadas o de muestras independientes, se utilizan cuando se obtienen dos grupos de
muestras aleatorias, independientes e idnticamente distribuidas a partir de las dos poblaciones a ser
comparadas. Por ejemplo, supngase que estamos evaluando el efecto de un tratamiento mdico, y reclutamos
a 100 sujetos para el estudio. Luego elegimos aleatoriamente 50 sujetos para el grupo en tratamiento y 50
sujetos para el grupo de control. En este caso, obtenemos dos muestras independientes y podramos utilizar la
forma desapareada de la prueba t. La eleccin aleatoria no es esencial en este caso, si contactamos a 100
personas por telfono y obtenemos la edad y gnero de cada una, y luego se utiliza una prueba t bimuestral
para ver en que forma la media de edades difiere por gnero, esto tambin sera una prueba t de muestras
independientes, a pesar de que los datos son observacionales.
Apareada
Las pruebas t de muestras dependientes o apareadas, consisten tpicamente en una muestra de pares de valores
con similares unidades estadsticas, o un grupo de unidades que han sido evaluadas en dos ocasiones
diferentes (una prueba t de mediciones repetitivas). Un ejemplo tpico de prueba t para mediciones repetitivas
sera por ejemplo que los sujetos sean evaluados antes y despus de un tratamiento.
Una prueba 't basada en la coincidencia de pares muestrales se obtiene de una muestra desapareada que luego
es utilizada para formar una muestra apareada, utilizando para ello variables adicionales que fueron medidas
conjuntamente con la variable de inters.
La valoracin de la coincidencia se lleva a cabo mediante la identificacin de pares de valores que consisten
en una observacin de cada una de las dos muestras, donde las observaciones del par son similares en
trminos de otras variables medidas. Este enfoque se utiliza a menudo en los estudios observacionales para
reducir o eliminar los efectos de los factores de confusin.
Clculos
Las expresiones explcitas que pueden ser utilizadas para obtener varias pruebas t se dan a continuacin. En
cada caso, se muestra la frmula para una prueba estadstica que o bien siga exactamente o aproxime a una
distribucin t de Student bajo la hiptesis nula. Adems, se dan los apropiados grados de libertad en cada
caso. Cada una de estas estadsticas se pueden utilizar para llevar a cabo ya sea una prueba de una cola o
prueba de dos colas.
Una vez que se ha determinado un valor t, es posible encontrar un valor o asociado utilizando para ello una
tabla de valores de distribucin t de Student. Si el valor p calulado es menor al lmite elegido por significancia
estadstica (usualmente a niveles de significancia 0,10; 0,05 o 0,01), entonces la hiptesis nula se rechaza en
favor de la hiptesis alternativa.
donde es la media muestral, s es la desviacin estndar muestral y n es el tamao de la muestra. Los grados
de libertad utilizados en esta prueba se corresponden al valor n 1.
donde xi, i = 1, ..., n son conocidos, y son desconocidos, y i es el error aleatorio en los residuales que se
encuentra normalmente distribuido, con un valor esperado 0 y una varianza desconocida 2,
e Yi, i = 1, ..., n son las observaciones.
Se desea probar la hiptesis nula de que la pendiente es igual a algn valor especificado 0 (a menudo toma
Luego
tiene una distribucin t con n 2 grados de libertad si la hiptesis nula es verdadera. El error estndar de la
pendiente:
Luego
Para esta ecuacin, la diferencia entre todos los pares tiene que ser calculada. Los pares se han formado ya sea
con resultados de una persona antes y despus de la evaluacin o entre pares de personas emparejadas en
Ejemplo de pares emparejados
Par
Nombre
Edad
Test
Juan
35
250
Joana
36
340
Jaimito
22
460
Jesica
21
200
grupos de significancia (por ejemplo, tomados de la misma familia o grupo de edad: vase la tabla). La media
(XD) y la desviacin estndar (sD) de tales diferencias se han utilizado en la ecuacin. La constante 0 es
diferente de cero si se desea probar si la media de las diferencias es significativamente diferente de 0. Los
grados de libertad utilizados son n 1.
Nombre
Test 1
Test 2
Miguel
35%
67%
Melanie
50%
46%
Melisa
90%
86%
Michell
78%
91%
Condiciones:
Diferencias:
La distribucin t student es menor en la media y mas alta en los extremos que una distribucin normal.
Tiene proporcionalmente mayor parte de su rea en los extremos que la distribucin normal.
Nivel de significacin:
Grados de libertad:
Existe una distribucin t para cada tamao de la muestra, por lo que Existe una distribucin para cada uno de
los grados de libertad.
Dentro de una muestra para distribucin t student los grados de libertad se calculan de la siguiente manera:
GL=n 1
EJEMPLO
Con un nivel de significancia de 5% se selecciona de manera aleatoria tres paquetes de
croquetas (bultos) alimento para perros, de cada uno de los cinco pedidos. Al pesar los 15
paquetes se obtiene la media de = 49.4 y una desviacin estndar de S2 = 1.2
DISTRIBUCIN F DE SNEDECOR
Es una distribucin de probabilidad de gran aplicacin en la inferencia estadstica ,
fundamentalmente en la contrastacin de la igualdad de varianzas de dos poblaciones
normales, y , fundamentalmente en el anlisis de la varianza , tcnica que permite detectar
la existencia o inexistencia de diferencias significativas entre muestras diferentes y que es,
por tanto esencial , en todos aquellos casos en los que se quiere investigar la relevancia de
un factor en el desarrollo y naturaleza de una caracterstica.
La distribucin se plantea partiendo de dos variables X e Y tales que :
la funcin gamma
de Euler
la media de la distribucin es
cuando n> 4
Lgicamente si
su inversa
Luego
luego
una
.
.
dado que:
siendo una
luego una :
una