Vous êtes sur la page 1sur 28

Prueba de Normalidad. Hipótesis. Supuestos.

Prueba estadística: Kolmogorov Smirnov o


Shapiro Wilk.

Equipo de docentes del Curso de


Métodos Estadísticos Sesión 2
Motivación

Un investigador sostiene que la distribución de las tallas Y LOS


PESOS de los recién nacidos en el hospital maría auxiliadora tiene
un comportamiento normal.

1. Es la distribución normal de las tallas y los pesos de los recién


nacidos
2. Cuanto debe de ser eñ tamaño de la muestra para poder aplicar
un determinado estadístico y probar la normalidad de la distribución.

Prueba de Normalidad
Supuestos de las pruebas paramétricas
• 1. Normalidad. Las observaciones se extraen de poblaciones distribuidas
según la Normal para cada grupo. Pruebas de bondad de ajuste.
• 2. Homocedasticidad. Las varianzas de los diferentes grupos tienen que ser
iguales. Homogeneidad de varianzas. El numerador y el denominador de la
prueba F son estimaciones de la misma varianza poblacional. Prueba de
Levéne. Supuesto de esfericidad respecto a la homogeneidad de varianzas -
covarianzas según la prueba de Mauchley.
• 3. Respecto a los errores:
• 1. Los errores son independientes entre sí.
• 2. Se distribuyen según una Normal dentro de cada población del grupo
N(0, σ2). Es decir, con media cero y varianzas equivalentes.
• 3. La ecuación estructural del modelo refleja una composición aditiva de
las fuentes de variación.
• Cuando se tengan unos datos hay que comprobar en primer
lugar los supuestos de las pruebas paramétricas. En concreto
se analizará en primer lugar si los datos de la variable tienen
una distribución normal. Para ello se utilizarán gráficos y
pruebas de contraste de la normalidad.

Actuaciones: toma de decisiones


ACTUACIONES
1) Si se acepta la normalidad de las observaciones entonces s e
aplicará aplicará el contraste contraste paramétrico paramétrico
adecuado para la hipótesis hipótesis.
2) Si se rechaza la normalidad de las observaciones entonces se optará
por aplicar pruebas no paramétricas donde los test se plantean
sobre la mediana de la distribución:

Test de prueba
• a. Test de los rangos signos de Wilcoxon para una muestra. Contrasta la
mediana de la muestra con la mediana poblacional. También permite
contrastar la mediana de dos muestras pareadas.
• b. Test U de Mann-Whitney para muestras independientes
PRUEBAS DE NORMALIDAD
• 1.-Pruebas gráficas basadas en gráficos de normalidad como Q-Q plots.
• 2.-Test de Kolmogorov –Smirnov de bondad de ajuste. Es válido sólo para
variables aleatorias continuas.
• 3.- Test de Test de Lillefors Lillefors. Es el Test de Kolmogorov –Smirnov, con la
corrección de Lillefors. Sus valores son menores que los de Kolmogorov.
• 4.-Prueba de Shapiro-Wilks.

DECISIÓN
Cuando se ejecutan las pruebas con el SPSS se obtiene el valor del
estadístico y el valor p de probabilidad del contraste. Se rechaza H0 si el
valor p de probabilidad es menor que el nivel de significación elegido
para ejecutar la prueba de contraste estadístico.
PLANTEAMIENTO DE LA HIPÓTESIS
• Ho: Las tallas y los pesos de los recién nacidos en el Hospital María
Auxiliadora siguen una distribución normal.
• Ha: Las tallas y los pesos de los recién nacidos en el Hospital María
Auxiliadora no siguen una distribución normal.
• Nivel de significancia: α=0.05
• Tamaño de muestra: n= 30
• normalidad.sav
Como el tamaño de la muestra es menor a 50 utilizamos Shapiro-Wilk para la
toma de decisiones: P-valor=0.191 es mayor que 0.05, podemos afIrmar que las
tallas y los pesos de los recién nacidos en el HMA SE DISTRIBUYEN
NORMALMENTE.
Analizando la normalidad en el gráfico de cajas y bigotes
PRUEBA
PARAMÉTRICA T-
TEST PARA UNA Y
DOS MUESTRAS
Equipo de docentes del Curso de
Métodos Estadísticos
MOTIVACIÓN

Cuando se desea comprobar si los valores de


una característica que es posible cuantificar
(como podría ser la edad o la cifra de tensión
arterial, entre otras) difieren al agruparlas en dos
o más grupos (por ejemplo según género, o por
diagnóstico de hipertensión arterial) hablaremos
de comparación de medias.
CONDICIONES

• Se utiliza en muestras de 30 o
menos elementos.
• La desviación estándar de la
población no se conoce
PROPIEDADES
 Tiene forma de campana y es simétrica, al igual
Distribución t’student que la distribución normal. Sin embargo, la
distribución t tiene mas área en las colas y menos
en el centro. Debido a que se usa S en vez de .
(Ver la Figura Nº 3)
 La distribución t es bastante sensible con
respecto al tamaño de la muestra, sin embargo
esta sensibilidad disminuye en el caso de
tamaños muéstrales grandes.
 La distribución t presenta un área ( probabilidad)
mayor en los extremos que la distribución normal.
Esto significa, para un nivel de confianza dado, el
valor t será un poco mayor que el correspondiente
a Z.
t’student  El aspecto interesante de la distribución t es que
Normal no es una de tipo estandarizado, en caso de cada
tamaño de la muestra existe una distribución t
diferente,
 Hay una tabla para los valores t al igual que para
los valores z, para utilizarla debemos conocer el
nivel de confianza y los grados de libertad.
GRADOS DE LIBERTAD

• Dentro de una muestra para


distribución t student los grados de
libertad se calculan de la siguiente
manera:

• g.l. = n – 1
T-STUDENT

T-Student
Datos independientes…

No se puede asignar los dos tratamientos a la muestra

¡NOTA! Condición indispensable: que las unidades de las


variables sean homogéneas
USO DE LA TABLA-T

La tabla de distribución t es mas


compacta que z y muestra las áreas y
valores de t para unos cuantos
porcentajes exclusivamente
(10%,5%,2% y 1%)
CONDICIONES

t(1 ,n 1)

t ( 0.95 , 10 ) = 1.833
SIGNIFICANCIA ESTADÍSTICA
tObtenido = Cálculo a partir de los datos de la
muestra.
tCrítico = Valor de tabla con n-1 grados de libertad

Relación mejorada:

Si |tObtenido |  |tCrítico|, entonces se rechaza la


hipótesis nula (Ho); y por lo tanto, se acepta la
hipótesis alterna H1.
PRUEBA DE HIPÓTESIS: MEDIA POBLACIONAL
CONDICIONES
H 0 :   0 H 0 :   0 H 0 :   0
H a :   0 H a :   0 H a :   0

- Cuando :  no es conocida y n<30


x o t(1 ,n 1)
to 
s
n
Ejemplo

1) Los siguientes valores son los niveles de colesterol


(mg/dl) de una muestra de 12 pobladores que habitan en
una localidad de la sierra.
183 152 178 157 194 163
144 114 178 152 118 158
¿Puede concluirse de que la media de los niveles de
colesterol en la población de la que se extrajo la muestra
es diferente de 165 mg/dl ?. Utilice un nivel de significación
de 0.05. Suponga que los niveles de colesterol siguen una
distribución normal.
Hipótesis: La media de los niveles de t

colesterol en la población es diferente (1  ; n  1)
de 165 2
t  1,796
(0,975;11)
Sea,  : Media de los niveles de
colesterol en la población.
4)
Datos:
n=12 R.A

-1,054
R.R R.R
1)
H0:  = 165 t= - 2.201 t=2.201

H1:  ≠ 165
5) Decisión: Como el valor calculado de
2) t=-1,054, cae en la región de
α = 0,05
aceptación, por lo tanto se acepta la
Ho.
X   157,58  165
3)
t   -1,054
S 24,39 ~ 6) Conclusión: Se concluye que la media
n 12 de los niveles de colesterol es de 165.
DIFERENCIA DE DOS MEDIAS
POBLACIONALES
1) Planteamiento de la Hipótesis

2) Fijar el nivel de significación


α = 0.01, 0.05, ó 0.10 (el más utilizado es 0.05)

3) Determinar la función de prueba o estadística de prueba


4) Establecer las regiones de Rechazo (R.R) y de Aceptación (R.A.)
5) Decisión: decidir si el valor calculado pertenece o no a la
región de rechazo R.R.
6) Conclusión: expresar la conclusión en términos del problema
de investigación.
ESTADÍSTICO DE PRUEBA

Con varianzas desconocidas, suponiendo =  22

t ( 1-/2, n1+n2 )
t ( 1-, n1+n2 )
es la varianza mancomunada
ESTADÍSTICO DE PRUEBA

Con varianzas desconocidas, suponiendo ≠  22

Estadístico: que se distribuye


como una t-Student
con g.l. grados de
libertad :
Prueba de LEVENE

El test de la razón de varianzas o test de Levene permite decidir


si la varianza en ambos grupos es o no la misma.
H0 : σ1 = σ2
H0 : σ1 ≠ σ2

Si su p-valor es menor a 0,05, rechazaremos la hipótesis nula y


supondremos que la variabilidad en ambos grupos es
sustancialmente distinta (varianzas no homogéneas). Por lo
tanto, el estadístico a calcular, variará ligeramente en función
de las variabilidades muestrales.
EJEMPLO

Se desea comprobar si la función renal en pacientes hipertensos


realmente está más afectada en hombres que en mujeres. Por
ello, se ha realizado un estudio en el que se han seleccionado
para participar un total de 50 pacientes hipertensos, 24
hombres y 26 mujeres, y se les ha analizado los valores de
creatinina sérica. Se han comparado los valores de creatinina
sérica entre hombres y mujeres mediante la prueba t de
Student, dado que se cumplen los requisitos mínimos básicos
para su aplicación.
En el SPSS
En el SPSS
H0: 1 = 2
H1: 1 ≠ 2

Si definimos que α=0,05 el p-valor obtenido en la prueba es inferior a este valor, por lo que
podemos rechazar la hipótesis nula de que no existen diferencias entre las medias de
creatinina sérica según el género.
Coincidiendo con el resultado del contraste de hipótesis obtenemos un intervalo de
confianza al 95% que no incluye el 0 [0,04-0,66], por lo que aceptamos la existencia de
diferencias en los niveles de creatinina sérica según el género de los pacientes.

Vous aimerez peut-être aussi