Académique Documents
Professionnel Documents
Culture Documents
1 (ANOVA simple)
EJERCICIO 1.
Planteamiento
Variable cuantitativa: Fondos
Variable cualitativa/Factor: Regin
HO: centro= norte= sur
H1: alguna sea
Statgraphics
Comparacin/Anlisis de la Varianza/ANOVA simple
Fondos
Regin
Centros<>MADRID
Solucin
p-valor = 0.0074 Como es menor que (0.04), rechazamos H0; por tanto podemos
afirmar que s hay diferencias significativas entre el tamao de las colecciones en
funcin de la regin en que se encuentre la biblioteca.
EJERCICIO 2.
Los requisitos del modelo ANOVA son:
1.- Normalidad en cada nivel del factor.
2.- Homocedasticidad (igualdad de varianzas en todos los niveles del factor).
3.- Independencia de las observaciones.
Estos requisitos se traducen en que los residuos son una variable aleatoria, de
distribucin normal y media cero.
En la prctica, vamos a comprobar: (1) normalidad de los residuos; (2)
homocedasticidad; (3) aleatoriedad de los residuos (salvo que los datos hayan sido
reordenados, y en consecuencia se haya perdido el orden en que fueron recogidos).
(1) Normalidad de los residuos.
Desde la ventana de ANOVA, Botn Guardar Resultados + Residuos. Con esto, los
residuos se incorporan a la hoja de datos. Para contrastar su normalidad, Descripcin +
Distribuciones + Ajuste de distribuciones; Datos= fondos. El contraste que estamos
realizando es
HO: variable RESIDUOS es normal
H1: variable RESIDUOS no es normal
EJERCICIO 3.
Desde el anlisis de ANOVA simple Icono amarillo Contraste Mltiple de Rango
a) Entre qu niveles del factor se observan diferencias significativas? Entre Sur, por un
lado, y Centro y Norte, por otro.
b) Qu grupos homogneos podramos establecer?
Podramos establecer dos grupos homogneos:
1. Sur
2. Centro y Norte.
c) Da una estimacin puntual y un intervalo LSD para la media de cada grupo.
Desde el anlisis de ANOVA simple Icono amarillo Tabla de medias
Estimacin por
intervalos
MEDIAS
Estimacin puntual
Sur
73680,4
[64081,5
83279,3]
Norte
108146
[95910,1
120383,0]
Centro
98481,1
[86944,6
110018,0]
EJERCICIO 4
Dentro del anlisis del ANOVA , botn amarillo + tabla de medias. Se recuerda que el
efecto de un nivel se calcula restando la media total a la media de cada nivel. As, se
tiene:
Centro= 8169,6
Norte= 17834,5
Sur= - 16631,1
La media global es 90311,5
El error experimental es la raz cuadrada del cuadrado medio residual o intra-grupos
(SCR); podemos encontrar el valor de SCR en la tabla de ANOVA; en este caso, su
valor es 5,69029E8. La raz cuadrada de este valor arroja un valor para el error
experimental de 23854,328.
EJERCICIO 5.
Desde el anlisis de ANOVA simple
SCT = SCR + SCE
2,21049E10 = 1,53638E10 + 674107 E9
(674107 E9 2,21049E10) x 100 = 30,49 %
EJERCICIO 6
La biblioteca de Cuenca produce un residuo de - 4477,11
Mayor residuo: buscamos el mayor residuo en valor absoluto. Para ello, por ejemplo
vamos a Descripcin + Datos Numricos + Identificacin de valores atpicos. Ah
vemos que el mayor residuo, en valor absoluto, es de 468526; vemos que corresponde
al dato nmero 13, es decir, Gerona.
EJERCICIO 7.
Planteamiento
Se trata del mtodo de Kruskal-Wallis (contraste sobre la igualdad de medianas)
H0= M centro=M norte=M sur
H1 = alguna M sea
Desde el anlisis de ANOVA simple Icono amarillo Contraste de KruskalWallis. Obtenemos un p-valor =0,0124217 menor que (0.04), y en consecuencia
rechazamos H0. Por lo tanto, el contraste est avalando la existencia de diferencias
significativas entre los tamaos medios de las colecciones de las bibliotecas de las
distintas regiones.
EJERCICIO 8
VARIABLE RESPUESTA: GASTOS
FACTOR: REGIN
Planteamiento
H0: centro= norte= sur
H1: alguna es distinta
El contraste de ANOVA proporciona un p-valor de 0,1883 > 0,04; por lo tanto,
aceptamos la hiptesis nula y decimos que no hay diferencias significativas entre las
distintas regiones segn el gasto medio.
COMPROBACION DE LAS HIPOTESIS DEL MODELO:
Normalidad:
Contrastamos la normalidad de los residuos. Hay nicamente un p-valor (el
correspondiente al contraste de curtosis, dentro de los tests de normalidad, que presenta
un valor de 0027) inferior a 004. Podramos aceptar la normalidad (siendo muy
estrictos cabra dudar de la normalidad, pero con seis p-valores aceptando es razonable
aceptar).
Homocedasticidad:
Realizando el contraste de varianza observamos que todos los p_valores son > 0,04 (el
menor es de 044); por lo tanto podemos decir que se cumple el requisito de varianzas
iguales.
Residuos aleatorios
Como en el primer ejercicio, no tiene especial sentido hacerlo.
Dado que se cumplen los requisitos, el resultado del ANOVA es fiable.
EJERCICIO 9.
Desde el anlisis de ANOVA simple Icono amarillo Contraste Mltiple de
Rango
Existe un nico grupo homogneo formado por los tres niveles del factor, que aparecer
alineados: Sur, Norte y Centro. Ello es lgico ya que no aparecan diferencias
significativas entre los distintos niveles del factor (las distintas regiones).
Desde el anlisis de ANOVA simple Icono amarillo Tabla de Medias
MEDIAS
Estimacin puntual
Estimacin por
intervalos
Sur
6642,69
[5406.3 7879.08]
Norte
8459,13
[6883.03 10035.2]
Centro
8930,6
[7520.9 10340.3]
EJERCICIO 10
VARIABLE RESPUESTA: FONDOS2
FACTOR: REGIN
H0: centro= norte= sur
H1: alguna es distinta
Obtenemos un p_valor = 0,9274 > 0,04; por tanto, aceptamos la hiptesis nula y
decimos que no hay diferencias significativas entre las distintas regiones segn el fondo
audiovisual.
Si comprobamos los requisitos se observa que los residuos no son normales, y tampoco
se cumple la homocedasticidad (de hecho, esto se ve bien en el grfico de residuos).
Puesto que dos hiptesis del ANOVA no se estn cumpliendo, recurrimos al contraste de
Kruskal Wallis. En este contraste obtenemos un p_valor=0,55371, mayor por tanto de
0,04, con lo cul concluimos que no hay diferencias significativas entre las distintas
regiones en cuanto al fondo audiovisual.
5