Académique Documents
Professionnel Documents
Culture Documents
Prueba de Normalidad
Supuestos de las pruebas paramétricas
• 1. Normalidad. Las observaciones se extraen de poblaciones distribuidas
según la Normal para cada grupo. Pruebas de bondad de ajuste.
• 2. Homocedasticidad. Las varianzas de los diferentes grupos tienen que ser
iguales. Homogeneidad de varianzas. El numerador y el denominador de la
prueba F son estimaciones de la misma varianza poblacional. Prueba de
Levéne. Supuesto de esfericidad respecto a la homogeneidad de varianzas -
covarianzas según la prueba de Mauchley.
• 3. Respecto a los errores:
• 1. Los errores son independientes entre sí.
• 2. Se distribuyen según una Normal dentro de cada población del grupo
N(0, σ2). Es decir, con media cero y varianzas equivalentes.
• 3. La ecuación estructural del modelo refleja una composición aditiva de
las fuentes de variación.
• Cuando se tengan unos datos hay que comprobar en primer
lugar los supuestos de las pruebas paramétricas. En concreto
se analizará en primer lugar si los datos de la variable tienen
una distribución normal. Para ello se utilizarán gráficos y
pruebas de contraste de la normalidad.
Test de prueba
• a. Test de los rangos signos de Wilcoxon para una muestra. Contrasta la
mediana de la muestra con la mediana poblacional. También permite
contrastar la mediana de dos muestras pareadas.
• b. Test U de Mann-Whitney para muestras independientes
PRUEBAS DE NORMALIDAD
• 1.-Pruebas gráficas basadas en gráficos de normalidad como Q-Q plots.
• 2.-Test de Kolmogorov –Smirnov de bondad de ajuste. Es válido sólo para
variables aleatorias continuas.
• 3.- Test de Test de Lillefors Lillefors. Es el Test de Kolmogorov –Smirnov, con la
corrección de Lillefors. Sus valores son menores que los de Kolmogorov.
• 4.-Prueba de Shapiro-Wilks.
DECISIÓN
Cuando se ejecutan las pruebas con el SPSS se obtiene el valor del
estadístico y el valor p de probabilidad del contraste. Se rechaza H0 si el
valor p de probabilidad es menor que el nivel de significación elegido
para ejecutar la prueba de contraste estadístico.
PLANTEAMIENTO DE LA HIPÓTESIS
• Ho: Las tallas y los pesos de los recién nacidos en el Hospital María
Auxiliadora siguen una distribución normal.
• Ha: Las tallas y los pesos de los recién nacidos en el Hospital María
Auxiliadora no siguen una distribución normal.
• Nivel de significancia: α=0.05
• Tamaño de muestra: n= 30
• normalidad.sav
Como el tamaño de la muestra es menor a 50 utilizamos Shapiro-Wilk para la
toma de decisiones: P-valor=0.191 es mayor que 0.05, podemos afIrmar que las
tallas y los pesos de los recién nacidos en el HMA SE DISTRIBUYEN
NORMALMENTE.
Analizando la normalidad en el gráfico de cajas y bigotes
PRUEBA
PARAMÉTRICA T-
TEST PARA UNA Y
DOS MUESTRAS
Equipo de docentes del Curso de
Métodos Estadísticos
MOTIVACIÓN
• Se utiliza en muestras de 30 o
menos elementos.
• La desviación estándar de la
población no se conoce
PROPIEDADES
Tiene forma de campana y es simétrica, al igual
Distribución t’student que la distribución normal. Sin embargo, la
distribución t tiene mas área en las colas y menos
en el centro. Debido a que se usa S en vez de .
(Ver la Figura Nº 3)
La distribución t es bastante sensible con
respecto al tamaño de la muestra, sin embargo
esta sensibilidad disminuye en el caso de
tamaños muéstrales grandes.
La distribución t presenta un área ( probabilidad)
mayor en los extremos que la distribución normal.
Esto significa, para un nivel de confianza dado, el
valor t será un poco mayor que el correspondiente
a Z.
t’student El aspecto interesante de la distribución t es que
Normal no es una de tipo estandarizado, en caso de cada
tamaño de la muestra existe una distribución t
diferente,
Hay una tabla para los valores t al igual que para
los valores z, para utilizarla debemos conocer el
nivel de confianza y los grados de libertad.
GRADOS DE LIBERTAD
• g.l. = n – 1
T-STUDENT
T-Student
Datos independientes…
t(1 ,n 1)
t ( 0.95 , 10 ) = 1.833
SIGNIFICANCIA ESTADÍSTICA
tObtenido = Cálculo a partir de los datos de la
muestra.
tCrítico = Valor de tabla con n-1 grados de libertad
Relación mejorada:
x o t(1 ,n 1)
to
s
n
Ejemplo
-1,054
R.R R.R
1)
H0: = 165 t= - 2.201 t=2.201
H1: ≠ 165
5) Decisión: Como el valor calculado de
2) t=-1,054, cae en la región de
α = 0,05
aceptación, por lo tanto se acepta la
Ho.
X 157,58 165
3)
t -1,054
S 24,39 ~ 6) Conclusión: Se concluye que la media
n 12 de los niveles de colesterol es de 165.
DIFERENCIA DE DOS MEDIAS
POBLACIONALES
1) Planteamiento de la Hipótesis
t ( 1-/2, n1+n2 )
t ( 1-, n1+n2 )
es la varianza mancomunada
ESTADÍSTICO DE PRUEBA
Si definimos que α=0,05 el p-valor obtenido en la prueba es inferior a este valor, por lo que
podemos rechazar la hipótesis nula de que no existen diferencias entre las medias de
creatinina sérica según el género.
Coincidiendo con el resultado del contraste de hipótesis obtenemos un intervalo de
confianza al 95% que no incluye el 0 [0,04-0,66], por lo que aceptamos la existencia de
diferencias en los niveles de creatinina sérica según el género de los pacientes.