Vous êtes sur la page 1sur 8

Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

2.- Análisis de la Varianza (ANOVA)


Se realiza un ANOVA (Analyse of Variance) cuando se desea hacer extensivo un
contraste de hipótesis a más de dos muestras. Lo primero es siempre escribir el
contraste de hipótesis estadísticas. En este caso debemos contrastar dos de los tres
supuestos que debemos realizar; suponemos normalidad de las poblaciones,
homogeneidad de las varianzas e independencia de las muestras.
El contraste de hipótesis estadísticas en una ANOVA siempre será la siguiente
de la siguiente forma:

𝐻𝑜 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝐾 ; 𝑐𝑜𝑛 𝐾 > 2
𝐻1 : 𝑁𝑜 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.

Si no rechazamos (es decir, aceptamos) la hipótesis nula, podremos deducir que


todas las muestras provienen de una misma población. En caso de que rechacemos la
hipótesis nula, deduciremos que existe más de una población distinta, pero no
podremos especificar cuantas. Para especificar cuantas poblaciones existen debemos
realizar un test múltiple de rango.
Los ANOVA pueden realizarse para un factor, o para varios factores distintos
que puedan influir a nuestra muestra. En este curso solo veremos ANOVA de un factor
y ANOVA de dos factores, tanto con interacción como sin interacción.
Un ANOVA puede ser equilibrado si todas las muestras tienen el mismo tamaño
n, o no equilibrado si el tamaño n de las distintas muestras es diferente.
También puede ser de efectos fijos si se trabaja con todas las poblaciones que
son objeto de estudio, o de efectos aleatorios cuando sólo se ha trabajado con algunas
de las poblaciones que son objeto de estudio, elegidas al azar. En un ANOVA de más de
un factor, puede haber factores de efectos fijos y otros de efectos aleatorios en cuyo
caso se habla de un ANOVA de efectos mixtos.
Para dar los resultados de un ANOVA deben indicarse los valores de la suma de
cuadrados total (SST), del estadístico F (de Fisher) y el p-valor, que se compara
normalmente con el valor de .
Para contrastar que todas las poblaciones son normales, debemos realizar un
test de bondad de ajuste para cada una de las muestras, si estas son por lo menos de
tamaño n=11. Para contrastar que todas las poblaciones tienen homogeneidad de
varianza, debemos realizar un contraste de varianza, en el que utilizaremos como
referencia el estadístico Bartlett B, y el correspondiente p-valor.

A/ ANOVA de un factor en Statgrafic plus 5.1:


Los datos deben introducirse todos en una misma columna, pero ordenados de
tal forma que se correspondan a los códigos de cada muestra que introducimos en la
siguiente columna. Para el ejercicio AV1:

7
Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

Después clicamos en la barra de menú: “Comparación”/”Análisis de la


Varianza”/”ANOVA Simple…”. Introducimos en “Variable Dependiente” la columna de
datos que acabamos de crear, y en “Factor” introducimos la columna con los códigos, y
clicamos aceptar.
En la pantalla de “ANOVA Simple…” clicamos en el botón de “Opciones
Tabulares”, y seleccionamos “Tabla ANOVA”, “Contraste Múltiple de Rango” y
“Contraste de Varianza”.
La pantalla de Contraste de Varianza permite contrastar el supuesto de
homogeneidad de la varianza según el estadístico de Bartlett B y el p-valor
correspondiente. Contrasta las siguientes hipótesis:

𝐻𝑜 : 𝜎1 = 𝜎2 = ⋯ = 𝜎𝐾 ; 𝑐𝑜𝑛 𝐾 > 2
𝐻1 : 𝑁𝑜 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.

De manera que las varianzas serán homogéneas si aceptamos la hipótesis nula.


El test de bondad de ajuste debe realizarse independientemente de los otros
tres. Clicamos en la barra de menú: “Descripción”/”Distribuciones”/”Ajuste de
Distribuciones (Datos no Censurados)”. Introducimos en “Datos” los datos de la
columna de la muestra cuya normalidad deseamos contrastar, y en “(selección)”
introducimos la columna del código, un signo igual, y número del código de la muestra
cuya normalidad deseamos contrastar. Para realizar sucesivos test de bondad de
ajuste, pulsaremos el botón rojo de “Introducir texto” en la pantalla de Datos no
censurados donde directamente podemos modificar el código que estamos
contrastando. Para el ejercicio AV5:

8
Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

Una vez confirmada la normalidad de todas las muestras analizadas, si estas


tienen al menos un tamaño n=11, podemos borrar este análisis.
De manera que sólo podrán considerarse los resultados de la tabla ANOVA
como válidos si aceptamos las hipótesis nulas que consideran la homogeneidad de la
varianza y la normalidad de todas las muestras. Si estos contrastes nos indican lo
contrario debemos indicar que el test ANOVA no es válido para la muestra analizada,
pero aún así, en el examen de este curso, deberá ser realizado igualmente el contraste
ANOVA e interpretados sus resultados.
El resultado obtenido en la ventana de ANOVA es una tabla donde se encuentra
además del p-valor (que nos permite aceptar o rechazar la hipótesis nula) otros
valores, también importantes, que deben ser reflejados en el examen (encuadrados en
rojo). Para el ejercicio AV5:

SST (suma de cuadrados total)

En los casos (como por ejemplo este ejercicio AV5) en los que se produce
rechazo de la hipótesis nula, y por lo tanto se deduce que existe más de una
población, deberá recurrirse a Contraste Múltiple de Rango para saber cuántas
poblaciones existen. Para ello no hace falta realizar un nuevo análisis (recordamos que
en la misma pantalla aparecen las ventanas de “Contraste de Varianza”, “Tabla
ANOVA” y “Contraste Múltiple de Rango” si los seleccionamos en opciones tabulares).

B/ Contraste Múltiple de Rango en Statgrafic plus 5.1:


La ventana de “Contraste Múltiple de Rango” (cuyo gráfico asociado es “Gráfico
de Medias”) nos muestra dos tablas. Para utilizar el estadístico adecuado, debemos
clicar el botón derecho, seleccionar “Opciones de Ventana”, y seleccionar el método
“Scheffe”.
En la tabla superior aparecen los códigos de los datos, las frecuencias de las
muestras, las medias Scheffe y los Grupos homogéneos. En la columna de grupos
homogéneos aparecen las cruces que indican cuales de los grupos pertenecen a una

9
Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

misma población, y cuáles de ellos son distintos. En la tabla inferior aparece la


diferencia entre los códigos, comparándose estos dos a dos. Cuando las diferencias son
significativas, aparece junto a ellas un asterisco (*). Para el mismo ejercicio AV5:

En el caso de este ejercicio AV5, sólo observando los Grupos Homogéneos de la


tabla superior podemos deducir que existen dos poblaciones en cuanto a la longitud
de los sépalos del género Iris. Una población está formada por el grupo 1 (I. setosa) y la
otra por los grupos 2 y 3 (I. versicolor e I. virginica).
Sin embargo en otros ejercicios, como el ejercicio AV2, la tabla superior del
Contraste Múltiple de Rango puede no darnos suficiente información:

En este caso la tabla superior nos indica que puede haber o 2 o 3 poblaciones, y
además se desconoce a qué otros grupos son homogéneos los grupos 3 (R3) y 4 (R4).
Sin embargo en la tabla inferior, donde se comparan los grupos dos a dos, pueden
asociarse los grupos 3 y 4 a otros grupos. Para asociar el grupo 3 a otro con el que

10
Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

coincida en la tabla superior (el 1 o el 4), debemos comprar el valor absoluto de la


diferencia de 1-3 (3,05) y la diferencia de 3-4 (12,33). Observamos que los grupos 1 y 3
están más próximos entre sí que los grupos 3 y 4, y por lo tanto asignamos el grupo 3 a
la población del grupo 1. Procediendo igualmente para el grupo 4, asignamos el grupo
4 a la población del grupo 2. Así deducimos que existen dos poblaciones de regímenes
dados a las ratas; Una formada por los grupos R1 y R3, y otra formada por R2 y R4.
También puede darse el caso en un ANOVA de efectos aleatorios, como en el
ejercicio AV3, en el que rechazamos la hipótesis nula de la ANOVA, pero encontremos
que no hay diferencias significativas entre los grupos por el método de Scheffe. En
este caso deduciremos que existe más de una población, es decir, como mínimo dos,
pero no podemos conocer el número exacto pues las que hemos analizado no son
significativamente diferentes.

C/ ANOVA de dos factores en Statgrafic plus 5.1:


El caso de ANOVA Factorial es muy similar al de ANOVA simple, pero en este
caso se contrastan muestras que se ven influidas por la variación de dos factores, y no
solo uno, es decir, se analiza la acción simultánea de dos factores sobre una variable
respuesta. Cada factor debe ser analizado por separado, pero también se analizará la
interacción entre ambos, por lo que en nuestra tabla ANOVA debemos obtener tres p-
valores. En este caso cada muestra viene definida por dos factores (sean A y B), y
deben resolverse tres contrastes de hipótesis distintos.
Al igual que en el caso anterior, deberá además contrastarse la homogeneidad
de varianza y la normalidad de las poblaciones, y además suponerse la independencia
de las muestras.
Los datos deben introducirse todos en una misma columna, pero ordenados de
tal forma que se correspondan a los códigos de cada muestra para cada factor, que
introducimos en las dos siguientes columnas. Además, en una cuarta columna
introducimos un código especial, que diferencia todas las muestras (si n es superior a
2), que nos permite hacer un contraste de la varianza, entrando como en el caso
anterior en “Comparación”/”Análisis de la Varianza”/”ANOVA Simple…”. Para el
ejercicio AV7:

Después clicamos en la barra de menú: “Comparación”/”Análisis de la


Varianza”/”ANOVA Factorial…”. Introducimos en “Variable Dependiente” la columna

11
Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

de datos que acabamos de crear, y en “Factores” introducimos las dos columnas con
los códigos de los factores A y B juntas, y clicamos aceptar.
En la pantalla de “ANOVA Factorial…” clicamos en el botón de “Opciones
Tabulares”, y seleccionamos “Tabla ANOVA” y “Contraste Múltiple de Rango”.
Se observa que no existe la opción de Contraste de la Varianza, para la cual
debemos recurrir al ANOVA Simple. Para analizar las muestras por separado debemos
introducir los datos en “Datos”, pero además en selección introducimos en “Factor” la
columna del código que diferencia todas las muestras entre sí (cod Bartlett). El
contraste se realiza igual que anteriormente, pero es recomendable eliminar la opción
de Tabla ANOVA en “Opciones Tabulares”, pues este ANOVA Simple puede dar lugar a
confusiones. Por ejemplo, para el ejercicio AV7:

Del mismo modo, con el código cod Bartlett, siempre y cuando cada muestra
tenga al menos un tamaño n=11, realizamos los contrastes de Bondad de Ajuste.
(Todos estos procesos son similares al del ANOVA Simple).
Inicialmente la tabla ANOVA Factorial muestra sólo los dos p-valores que
corresponden a cada uno de los factores. Para que muestre también el p-valor de la
interacción, debe modificarse los datos clicando en el botón derecho sobre la ventana
correspondiente, y seleccionar “Opciones de Análisis”. En “Máximo Orden de
Interacción” debe introducirse 2. Entonces aparece un tercer p-valor en la pantalla,
que corresponde a la Interacción AB (entre ambos factores).

El primer contraste de hipótesis H1 que debe resolverse es de hecho el que


corresponde a la Interacción. El ordenador realiza en este caso el siguiente contraste
de hipótesis:

𝑖 = 1, … , 𝑎
𝐻1 𝑜 : (𝛼𝛽)𝑖𝑗 = 0 ; 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜
𝑗 = 1, … , 𝑏
1
𝐻 1 : 𝑁𝑜 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.

Es decir que contrasta si existe interacción o no existe interacción. De hecho,


según este contraste de hipótesis, si aceptamos la hipótesis nula estamos aceptando
que no existe interacción, mientras que si la rechazamos deduciremos que sí existe
interacción. En caso de que si exista interacción, sólo tendremos en cuenta los otros

12
Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

contrastes de la ANOVA factorial en caso de que estos nos den un rechazo de la


hipótesis nula. No podremos aceptar las hipótesis nulas H20 y H30 de la ANOVA
Factorial habiendo interacción, pues en estos casos el efecto de un factor podría estar
enmascarando al otro. En el caso del ejercicio AV7 no hay interacción, por lo que
podemos analizar los otros dos p-valores independientemente:

El segundo contraste de hipótesis se realiza sobre el factor A (en el ejercicio


AV7 es tocino) y resuelve si hay diferencias significativas entre las muestras del factor
A:

𝐻 2 𝑜 : 𝛼𝑖 = 0 ; 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖 = 1, … , 𝑎
𝐻 2 1 : 𝑁𝑜 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.

Si aceptamos la hipótesis nula aceptamos que no existe diferencia significativa


entre las muestras analizadas, y por lo tanto deduciremos que existe una única
población en el factor A. Esto sólo podrá ser aceptado en caso de que no exista
interacción. Si rechazamos la hipótesis nula deduciremos que existen más de una
población dentro del factor A, y esto se acepta con o sin interacción.
En el ejercicio AV7 rechazamos la hipótesis nula, y podemos deducir que hay
más de una población respecto al tipo de tocino. Además, dado que sólo existen dos
muestras podemos decir que existen dos poblaciones (no puede haber más) sin
necesidad de consultar el “Contraste Múltiple de Rango”.
Si hay más de dos muestras, y son significativamente diferentes, deberá
analizarse el Contraste Múltiple de Rango tal y como se explica anteriormente en B/,
con una diferencia; para seleccionar el factor con el que deseamos realizar el contraste
hay que clicar en la ventana con el botón derecho, seleccionar “Opciones de Ventana”,
y seleccionar el código que corresponde al factor que deseamos analizar.

13
Análisis de la Varianza (ANOVA) Diseño Experimental y Análisis de Datos

El tercer contraste de hipótesis se realiza sobre el factor B (en el ejercicio AV7


es sexo) y resuelve si hay diferencias significativas entre las muestras del factor B:

𝐻 3 𝑜 : 𝛽𝑗 = 0 ; 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑗 = 1, … , 𝑏
𝐻 3 1 : 𝑁𝑜 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.

Si aceptamos la hipótesis nula aceptamos que no existe diferencia significativa


entre las muestras analizadas, y por lo tanto deduciremos que existe una única
población en el factor B. Esto sólo podrá ser aceptado en caso de que no exista
interacción. Si rechazamos la hipótesis nula deduciremos que existen más de una
población dentro del factor B, y esto se acepta con o sin interacción.
En el ejercicio AV7 aceptamos la hipótesis nula, y podemos deducir que hay
sólo una población respecto al sexo de las ratas, es decir, que no se observa ninguna
diferencia entre machos y hembras.

Resolviendo estos contrastes de hipótesis puede contestarse fácilmente a los


problemas propuestos en cada ejercicio. Por ejemplo, para el ejercicio AV7 debemos
responder que sólo existen dos poblaciones implicadas en el experimento; una para el
tocino rancio (ratas que ingieren menos comida) y otra para tocino fresco (ratas que
ingieren más comida).
Supongamos que hubiésemos obtenido un rechazo de H30; entonces
deberíamos hablar de cuatro poblaciones; una para machos y tocino rancio, otra para
machos y tocino fresco, otra para hembras y tocino rancio y otra para hembras y
tocino fresco, las cuatro significativamente distintas.

14

Vous aimerez peut-être aussi