Vous êtes sur la page 1sur 6

Soluciones Prctica 6.

1 (ANOVA simple)
EJERCICIO 1.
Planteamiento
Variable cuantitativa: Fondos
Variable cualitativa/Factor: Regin
HO: centro= norte= sur
H1: alguna sea
Statgraphics
Comparacin/Anlisis de la Varianza/ANOVA simple
Fondos
Regin
Centros<>MADRID
Solucin
p-valor = 0.0074 Como es menor que (0.04), rechazamos H0; por tanto podemos
afirmar que s hay diferencias significativas entre el tamao de las colecciones en
funcin de la regin en que se encuentre la biblioteca.

EJERCICIO 2.
Los requisitos del modelo ANOVA son:
1.- Normalidad en cada nivel del factor.
2.- Homocedasticidad (igualdad de varianzas en todos los niveles del factor).
3.- Independencia de las observaciones.
Estos requisitos se traducen en que los residuos son una variable aleatoria, de
distribucin normal y media cero.
En la prctica, vamos a comprobar: (1) normalidad de los residuos; (2)
homocedasticidad; (3) aleatoriedad de los residuos (salvo que los datos hayan sido
reordenados, y en consecuencia se haya perdido el orden en que fueron recogidos).
(1) Normalidad de los residuos.
Desde la ventana de ANOVA, Botn Guardar Resultados + Residuos. Con esto, los
residuos se incorporan a la hoja de datos. Para contrastar su normalidad, Descripcin +
Distribuciones + Ajuste de distribuciones; Datos= fondos. El contraste que estamos
realizando es
HO: variable RESIDUOS es normal
H1: variable RESIDUOS no es normal

El test chi-cuadrado arroja un p-valor de 06597; el de Kolmogorov-Smirnov, de


09954; y todos los tests de normalidad proporcionan p-valores muy altos (0857,
0896, 0859, 0669); por lo tanto, aceptamos la normalidad de los residuos.
Grficamente, desde la ventana de ANOVA simple botn de Opciones grficas +
Residuo frente a nmero de fila. El grfico es menos claro, pero en cualquier caso no
vemos nada rara que pudiera contradecir la normalidad.
(2) Homocedasticidad.
Desde la ventana de ANOVA simple, botn amarillo + Contraste de varianza. El
contraste que realizamos es:
H0: centro = norte= sur
H1: alguna es distinta
Todos los p-valores son mayores de 004 (036, 039, 056). En consecuencia,
aceptamos la homocedasticidad.
Grficamente, Botn de Opciones Grficas + Residuo frente a nivel de factor. Se
observa que la dispersin es similar en todos los niveles (es decir, en las tres regiones);
es interesante observar que si se incluye MADRID en el estudio, la homocedasticidad se
rompe (se ve muy bien en el grfico).
(3) Independencia de las observaciones
Los datos estn ordenados alfabticamente por provincias, con lo cul previsiblemente
el orden en que han sido recogidos se ha perdido. No tiene por tanto sentido que nos
planteemos esta hiptesis.
Se recuerda no obstante que en general esta hiptesis debe venir garantizada por un
correcto proceso de muestreo y una correcta eleccin del modelo. En cualquier caso, y
siempre que los datos guarden el orden en que hayan sido observados, se puede
contrastar realizando un anlisis de aleatoriedad sobre los residuos.
Por lo tanto, en principio concluimos que las hiptesis se cumplen, y por lo tanto las
conclusiones del ANOVA resultan fiables.

EJERCICIO 3.
Desde el anlisis de ANOVA simple Icono amarillo Contraste Mltiple de Rango
a) Entre qu niveles del factor se observan diferencias significativas? Entre Sur, por un
lado, y Centro y Norte, por otro.
b) Qu grupos homogneos podramos establecer?
Podramos establecer dos grupos homogneos:
1. Sur

2. Centro y Norte.
c) Da una estimacin puntual y un intervalo LSD para la media de cada grupo.
Desde el anlisis de ANOVA simple Icono amarillo Tabla de medias
Estimacin por
intervalos

MEDIAS

Estimacin puntual

Sur

73680,4

[64081,5

83279,3]

Norte

108146

[95910,1

120383,0]

Centro

98481,1

[86944,6

110018,0]

EJERCICIO 4
Dentro del anlisis del ANOVA , botn amarillo + tabla de medias. Se recuerda que el
efecto de un nivel se calcula restando la media total a la media de cada nivel. As, se
tiene:
Centro= 8169,6
Norte= 17834,5
Sur= - 16631,1
La media global es 90311,5
El error experimental es la raz cuadrada del cuadrado medio residual o intra-grupos
(SCR); podemos encontrar el valor de SCR en la tabla de ANOVA; en este caso, su
valor es 5,69029E8. La raz cuadrada de este valor arroja un valor para el error
experimental de 23854,328.

EJERCICIO 5.
Desde el anlisis de ANOVA simple
SCT = SCR + SCE
2,21049E10 = 1,53638E10 + 674107 E9
(674107 E9 2,21049E10) x 100 = 30,49 %

Calcular el porcentaje que


supone SCE respecto a SCT

El porcentaje resultante es elevado; no resulta extrao que el contraste de ANOVA haya


rechazado la igualdad de medias en las tres regiones.

EJERCICIO 6
La biblioteca de Cuenca produce un residuo de - 4477,11

Mayor residuo: buscamos el mayor residuo en valor absoluto. Para ello, por ejemplo
vamos a Descripcin + Datos Numricos + Identificacin de valores atpicos. Ah
vemos que el mayor residuo, en valor absoluto, es de 468526; vemos que corresponde
al dato nmero 13, es decir, Gerona.

EJERCICIO 7.
Planteamiento
Se trata del mtodo de Kruskal-Wallis (contraste sobre la igualdad de medianas)
H0= M centro=M norte=M sur
H1 = alguna M sea
Desde el anlisis de ANOVA simple Icono amarillo Contraste de KruskalWallis. Obtenemos un p-valor =0,0124217 menor que (0.04), y en consecuencia
rechazamos H0. Por lo tanto, el contraste est avalando la existencia de diferencias
significativas entre los tamaos medios de las colecciones de las bibliotecas de las
distintas regiones.

EJERCICIO 8
VARIABLE RESPUESTA: GASTOS
FACTOR: REGIN
Planteamiento
H0: centro= norte= sur
H1: alguna es distinta
El contraste de ANOVA proporciona un p-valor de 0,1883 > 0,04; por lo tanto,
aceptamos la hiptesis nula y decimos que no hay diferencias significativas entre las
distintas regiones segn el gasto medio.
COMPROBACION DE LAS HIPOTESIS DEL MODELO:
Normalidad:
Contrastamos la normalidad de los residuos. Hay nicamente un p-valor (el
correspondiente al contraste de curtosis, dentro de los tests de normalidad, que presenta
un valor de 0027) inferior a 004. Podramos aceptar la normalidad (siendo muy
estrictos cabra dudar de la normalidad, pero con seis p-valores aceptando es razonable
aceptar).
Homocedasticidad:

Realizando el contraste de varianza observamos que todos los p_valores son > 0,04 (el
menor es de 044); por lo tanto podemos decir que se cumple el requisito de varianzas
iguales.
Residuos aleatorios
Como en el primer ejercicio, no tiene especial sentido hacerlo.
Dado que se cumplen los requisitos, el resultado del ANOVA es fiable.

EJERCICIO 9.
Desde el anlisis de ANOVA simple Icono amarillo Contraste Mltiple de
Rango
Existe un nico grupo homogneo formado por los tres niveles del factor, que aparecer
alineados: Sur, Norte y Centro. Ello es lgico ya que no aparecan diferencias
significativas entre los distintos niveles del factor (las distintas regiones).
Desde el anlisis de ANOVA simple Icono amarillo Tabla de Medias
MEDIAS

Estimacin puntual

Estimacin por
intervalos

Sur

6642,69

[5406.3 7879.08]

Norte

8459,13

[6883.03 10035.2]

Centro

8930,6

[7520.9 10340.3]

Error experimental Cuadrado medio intragrupos


9,47218E6= 3.077,69069271

EJERCICIO 10
VARIABLE RESPUESTA: FONDOS2
FACTOR: REGIN
H0: centro= norte= sur
H1: alguna es distinta
Obtenemos un p_valor = 0,9274 > 0,04; por tanto, aceptamos la hiptesis nula y
decimos que no hay diferencias significativas entre las distintas regiones segn el fondo
audiovisual.
Si comprobamos los requisitos se observa que los residuos no son normales, y tampoco
se cumple la homocedasticidad (de hecho, esto se ve bien en el grfico de residuos).
Puesto que dos hiptesis del ANOVA no se estn cumpliendo, recurrimos al contraste de
Kruskal Wallis. En este contraste obtenemos un p_valor=0,55371, mayor por tanto de
0,04, con lo cul concluimos que no hay diferencias significativas entre las distintas
regiones en cuanto al fondo audiovisual.
5

VARIABLE RESPUESTA: PRESTAMOS


FACTOR: REGIN
H0: centro= norte= sur
H1: alguna es distinta
El contraste de ANOVA simple presenta un p_valor = 0,0571 > 0,04; por tanto
aceptamos la hiptesis nula y decimos que no hay diferencias significativas entre las
distintas regiones en cuanto al prstamo.
Si comprobamos los requisitos se observa que falla la hiptesis de homocedasticidad.
Para la hiptesis de normalidad, hay un p-valor que falla, y otro que est prximo al
nivel de significacin. En consecuencia, recurrimos a Kruskal-Wallis y obtenemos un
P-valor = 0,159643, mayor de 0,04. En consecuencia, deducimos que no hay
diferencias significativas entre las distintas regiones en cuanto al prstamo.

Vous aimerez peut-être aussi