Académique Documents
Professionnel Documents
Culture Documents
Anlisis de la varianza
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos
o ms medias, que es necesario porque cuando se quiere comparar ms de dos medias
es incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos
motivos:
En primer lugar, y como se realizaran simultnea e independientemente varios
contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar
aumentara.
Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen
de la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones,
la hiptesis nula es que todas las muestras provienen de la misma poblacin y, sin
embargo, para cada comparacin, la estimacin de la varianza necesaria para el
contraste es distinta, pues se ha hecho en base a muestras distintas.
G.L.
k-1
SS
SSA
MS
SSA /(k-1)
(n-1)k
SSE
SSE /k(n-1)
kn-1
SST
F
MSA /MSE
F se usa para realizar el contraste de la hiptesis de medias iguales. Laregin crtica para
dicho contraste es F > Fa(k-1,(n-1)k)
Algunas propiedades
Es fcil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = k + k - 1 = nk - 1 = GLtotal
No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad,
llamada identidad o propiedad aditiva de la suma de cuadrados:
SST = SSA + SSE
El anlisis de la varianza se puede realizar con tamaos muestrales iguales o distintos,
sin embargo es recomendable iguales tamaos por dos motivos:
1) La F es insensible a pequeas variaciones en la asuncin de igual varianza, si el
tamao es igual.
2) Igual tamao minimiza la probabilidad de error tipo II.
Modelos de Anova
Modelo I o de efectos fijos en el que la H1 supone que las k muestras son muestras de k
poblaciones distintas y fijas.
Modelo II o de efectos aleatorios en el que se supone que las k muestras, se han
seleccionado aleatoriamente de un conjunto de m>k poblaciones.
Un ejemplo de modelo I de anova es el Ejemplo 1, porque en l se asume que existen
cinco poblaciones (sin tratamiento, con poca sal, sin sal, etc.) fijas, de las que se han
extrado las muestras.
Ejemplo1
Donde m es la media global, eij son variables (una para cada muestra) distribuidas
normalmente, con media 0 y varianza s2 (como en el modelo I) y Ai es una variable
distribuida normalmente, independiente de las eij, con media 0 y varianza
La diferencia con respecto al modelo I es que en lugar de los efectos fijos ai ahora se
consideran efectos aleatorios Ai.
Igual que en el modelo I se encuentra que MSE no se modifica en la H1 y que al valor
esperado de MSA se le aade el trmino de componente aadida (que aqu es una
verdadera varianza ya que Ai es una variable aleatoria):
Para llegar a este resultado se utiliza la asuncin de independencia entre Ai y eij y es, por
tanto, muy importante en el modelo y conviene verificar si es correcta en cada caso.
Somnfero
35
32
30
25
30
42
30
15
18
23
Hombre
Mujer
Se trata de un anova de dos factores fijos. Llamamos primer factor a la droga que tiene
dos niveles: placebo y somnfero. El segundo factor es el sexo tambin con 2 niveles:
hombres y mujeres. El tamao de las muestras es n=5.
La tabla de anova es:
Fuente de variacin
Somnfero
Sexo
Interaccin
Error
Total
GL
SS
1 696,2
1 105,8
1
0,2
16 1197,6
19 1999,8
MS
696,2
105,8
0,2
74,85
Conclusiones
La estadstica constituye para el investigador la herramienta que le permitir o le indicara
probar datos numricos a travs del Anlisis de la Varianza (ANOVA) la comparacin de
los conjuntos de datos numricos diferentes, significativos, distintos a otros valores o ms
conjuntos de datos. Lo ms importante, es saber la certeza de los datos que se estudian,
qu tengan la condicin necesaria para tomar la decisin ms idnea. Es por ello, que la
importancia del Anlisis de la Varianza aplicado a la Toma de Decisin a las empresas son
aplicadas para proporcionarle la informacin veraz y precisa para la toma de decisiones,
sobre cualquier proceso dentro de la organizacin.
Bibliografa:
V. Abraira, A. Prez de Vargas Mtodos Multivariantes en Bioestadstica. Ed. Centro de
Estudios Ramn Areces. 1996.