Académique Documents
Professionnel Documents
Culture Documents
Bloques
1
...
...
Y11
Y12
...
Y1j
...
Y1b
Y21
Y22
...
Y2j
...
Y2b
...
...
Yi1
Yi2
Yij
Yib
...
...
Ya1
Ya2
...
Yaj
....
Yab
Y1
Y2
Yi
Ya
Y1 Y2
...
Y j
...
Y b
Media global Y
Medias de
bloques
1.
Medias de
tratamientos
Tratamientos
Modelo y ANOVA: El modelo estndar del diseo de bloques completos aleatorizados es:
Yij i j ij ,
(1)
ij ~ N 0, 2 , i 1, 2, , a j 1, 2, , b ,
iid
i 1
j 1
i j 0
donde es la respuesta promedio global, i es el efecto del i-simo tratamiento o nivel del factor de inters, j es el efecto del j-simo
bloque, ij es el error aleatorio asociado, y Yij es la variable aleatoria que representa la medicin en el bloque j del tratamiento i. Este
modelo asume que no existe interaccin entre el factor de inters y el factor de bloqueo; en muchas situaciones esta presuncin ser
razonable, sin embargo, si se sospecha que hay interaccin, el tamao del bloque deber ser incrementado para permitir estimar estos
efectos.
El ANOVA para el modelo en (1) es similar al que veremos en el caso de dos factores sin interaccin en un diseo completamente
aleatorizado, sin embargo varias diferencias deben ser notadas: Las combinaciones de tratamientos de un modelo de dos factores en un
diseo completamente aleatorizado son asignadas aleatoriamente a las unidades, en cambio en un diseo de bloques, aunque las
observaciones son tomadas sobre todas las combinaciones de tratamientos y bloques, slo los niveles de tratamientos del factor son
asignados aleatoriamente a las unidades experimentales (dentro de cada bloque). Los niveles del factor de bloque representan
agrupamientos intencionales de las unidades experimentales. Esto ltimo desata una controversia sobre si es vlido o no realizar el test
de igualdad de medias de los bloques. Por otra parte considerando al factor de bloqueo como un factor nuisance, no estamos
interesados propiamente en sus medias porque en muchos casos es improbable que si repetimos el experimento podamos usar bloques
idnticos. As que en vez de probar la igualdad de las medias de bloque, ms bien se compara la suma de cuadrados medios debida al
factor de bloqueo con el MSE del modelo para determinar si bloquear fue o no benfico en el experimento.
ANOVA
Fuente de Grados de Suma de
Cuadrados
Valores esperados
F
variacin
libertad
cuadrados
Medios
a
Factor A
MSA=SSA/(a-1)
MSA/MSE
a-1
SSA
Bloques
E MSA 2
MSB=SSB/(b-1)
b-1
(a-1)(b-1)
SSE
Total
ab-1
SST
i 1
a 1
a
SSB
Error
b i2
E MSB 2
MSE=SSE/[(a-1)(b-1)]
E MSE
a i2
i 1
b 1
Frmulas
a
SSA Yi Y b Y abY
2
i 1 j 1
2
i
i 1
i 1 j 1
j 1
i 1 j 1
Yi
i 1 j 1
1
Yij
b j 1
1 a
Y j Yij Media muestral en el bloque j del factor de bloqueo
a i 1
1 a b
Y Yij Media muestral de todas las ab observaciones.
ab i 1 j 1
La hiptesis de inters es:
H 0 : 1 2 a 0
H1 : algn i 0
o bien
H 0 : 1 2 a
H1 : algn i j
(2)
NOTA 2: Si el MSB es considerablemente mayor que el MSE, esto sugiere que la creacin de bloques vali la pena en el sentido de que
sirvi para reducir el tamao del error experimental. De lo contrario, si el MSB es menor que el MSE, entonces la creacin de bloques ha
bajado la potencia de las pruebas de hiptesis y ha incrementado la longitud de los intervalos de confianza para los contrastes de
tratamientos.
NOTA 3: Recuerde que no hay conclusin estadstica acerca de la igualdad de medias de bloques o de significancia de efectos de
bloques; la comparacin meramente se hace como una forma de establecer la utilidad de haber creado bloques en el experimento, y
proporciona informacin adicional para la planeacin futura de experimentos similares.
NOTA 4: Si el MSB es menor que el MSE, no es vlido pretender que el experimento fue diseado como un diseo completamente
aleatorizado y remover los efectos de bloques del modelo. La aleatorizacin no es la correcta para un diseo completamente
aleatorizado.
2.
i j
i j Yi Y j Y .
c
i 1
con
es la media del i-simo nivel del factor de tratamientos, es estimable y su estimador de mnimo cuadrados es
c
i 1
a
0 , donde i
a
ci i ciYi ,
i 1
i 1
2
2
ciYi ci / b . La frmula general para los intervalos de confianza de (1-)100%, para un contraste
i 1
i 1
cuya varianza es V
es
c
i 1
a
a
i 1
Y para la comparacin por el mtodo de Tukey de todos los pares de medias de tratamientos, usando intervalos de confianza del tipo:
i j
Y j q a , a 1 b 1 MSE / b
3.
Chequeo de supuestos del modelo: Como siempre, es necesario corroborar los supuestos acerca de los errores del
modelo: Independencia, normalidad y varianza constante, adems, tambin es importante chequear la forma del modelo (carencia de
ajuste). Los residuales del modelo son calculados como:
4.
Para chequear:
Independencia
Normalidad
Un equipo de mejora investiga el efecto de cuatro mtodos de ensamble A, B, C, y D, sobre el tiempo de ensamble en minutos. En
primera instancia la estrategia experimental fue aplicar cuatro veces los cuatro mtodos de ensamble en orden aleatorio en un diseo
completamente aleatorizado. Sin embargo, los experimentadores se dan cuenta que hay cuatro operadores con distintas destrezas y
consideran que esto puede afectar de manera significativa los tiempos de ensamble, y por ende la comparacin de los mtodos, entonces
debe utilizarse un diseo de bloques completos aleatorizados para controlar activamente en el experimento a los operadores que
realizarn el ensamble. Los datos recolectados en este diseo fueron los siguientes:
Mtodo
A
B
C
D
1
6
7
10
10
2
9
10
16
13
Operador
3
7
11
11
11
4
8
8
14
9
Se desea determinar si existen diferencias entre los cuatro mtodos y cmo se diferencian, adems elegir el mejor mtodo, si lo hay.
Solucin
En primera instancia se construyen los grficos boxplots de los tiempos vs. mtodos y tiempos vs. operadores, usando programa R que
aparece en ANEXO 1.
12
14
16
10
tiempo
12
10
6
tiempo
14
16
mtodo
operador
Se observan diferencias en los tiempos promedios de ensamble entre los cuatro mtodos. A primera vista parece que los dos mejores
mtodos son el A y B. Parece que con el mtodo C los tiempos alcanzados tienen mayor dispersin que en los otros dos casos. Por su
parte, el operador 1 parece tener en promedio el menor tiempo de ensamble, en tanto que los operadores 3 y 4 en promedio y tienen
aproximadamente los mismos tiempos. El operador 2 es ms lento y opera con una mayor variabilidad lo que nos dice que es menos
consistente en sus acciones.
El modelo estadstico es
operadores.
Yij i j ij
i 1
j 1
i j 0 ,
ij ~ N 0, 2
iid
Se construye la tabla ANOVA, y de medias de tratamientos con ayuda del R, los resultados son los siguientes:
ANOVA
Analysis of Variance Table
Response: tiempo
Df Sum Sq Mean Sq F value
Pr(>F)
mtodo
3
61.5
20.5
10.25 0.002919 **
operador
3
28.5
9.5
4.75 0.029846 *
Residuals 9
18.0
2.0
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
MEDIAS DE TRATAMIENTOS
Tabla de medias de tratamientos y sus I.C de 95 %
alfa
0.05
grados de libertad
9
error cuadrtico medio 2
valor crtico t
2.262157
tables.factor.trat.A
tables.factor.trat.B
tables.factor.trat.C
tables.factor.trat.D
ni Medias
LI
LS
4
7.50 5.900413 9.099587
4
9.00 7.400413 10.599587
4 12.75 11.150413 14.349587
4 10.75 9.150413 12.349587
valor P: P f 3 ,9 4.75 0.0298 , que nos indica el bloqueo por operario result til o eficiente para reducir el error experimental y
por tanto un ahorro en cuanto al nmero de rplicas necesarias para deteccin de diferencias entre los mtodos.
Comparemos ahora los tiempos medios de ensamble para los cuatro mtodos mediante el procedimiento de Tukey. SAS da la siguiente
salida:
B-A
C-A
D-A
C-B
D-B
D-C
-4
-2
rstandard(diseo)
-2
-1
1
0
-1
-2
rstandard(diseo)
10
12
14
C
Mtodo
1.0
2
0.5
Sample Quantiles
1
1
0
-1
-2
rstandard(diseo)
1.5
2.0
fitted(diseo)
-2
Operador
-1
Theoretical Quantiles
Adicionalmente, se estimaron los efectos de cada mtodo de ensamble, y sus intervalos de confianza (cuyos niveles de confianza pueden
ser un poco diferentes a los esperados dados los problemas de varianza). Se deja al lector la interpretacin de estos resultados.
EFECTOS DE TRATAMIENTOS
Estimate Std. Error
metodo:efecto
metodo:efecto
metodo:efecto
metodo:efecto
mtodo
mtodo
mtodo
mtodo
A
B
C
D
-2.50
-1.00
2.75
0.75
t value
Pr(>|t|)
lower CI
upper CI
OBTENIENDO EFECTOS DE TRATAMIENTOS, RESULTADOS PARA TEST DE SIGNIFICANCIA Y SUS I.C DEL 95%
library(gmodels)
library(multcomp)
efect.mtodoA=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoB=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoC=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoD=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
rbind(efect.mtodoA,efect.mtodoB,efect.mtodoC,efect.mtodoD)
A"=c(3/4,-1/4,-1/4,-1/4)),conf=0.95)
B"=c(-1/4,3/4,-1/4,-1/4)),conf=0.95)
C"=c(-1/4,-1/4,3/4,-1/4)),conf=0.95)
D"=c(-1/4,-1/4,-1/4,3/4)),conf=0.95)
Niveles
Factor A
Niveles factor B
B1
B2
A1
A1B1
A1B2
A2
A2B1
A2B2
A3
A3B1
A3B2
Yijk i j ij E ijk
Efecto fijo de la interaccin de los
factores A y B en sus niveles i y j,
respectivamente,
sobre
la
respuesta promedio global.
Figura 1
10
Y 122
...
Y 1j2
...
Y 1b2
Y 113
Y 123
...
Y 1j3
...
Y 1b3
...
...
...
...
...
Y 11k
Y 12k
...
Y 1jk
...
Y 1bk
...
...
...
Y 1jn
...
Y 2bn
...
Y 2b1
...
Y 2j2
...
Y 2b2
Y 223
...
Y 2j3
...
Y 2b3
...
Y 2jk
...
Y 2bk
...
...
Y 21n
Y 22n
...
Y 2jn
...
Y 2bn
Y i22
...
Y ij2
...
Y ib2
Y i13
Y i23
...
Y ij3
...
Y ib3
Y i2k
...
Y ijk
...
Y ibk
...
...
Y i1n
Y i2n
...
Y ijn
...
Y ibn
Y aj1
...
Y ab1
Y a12
Y a22
...
Y aj2
...
Y ab2
Y a13
Y a23
...
Y aj3
...
Y ab3
...
...
...
...
Y a1k
Y a2k
...
Y ajk
...
Y abk
...
...
...
Y a21
...
Y a11
...
...
...
...
...
...
Y i1k
...
...
...
Y i12
...
Y ib1
...
...
...
Y ij1
...
...
...
Y i21
...
Y i11
...
...
...
...
...
Y 22k
...
...
Y 21k
...
...
...
Y 222
Y 213
...
Y 212
...
...
Y 2j1
...
Y 221
...
Y 211
...
...
...
Y 12n
...
...
Y 11n
...
...
Y 112
...
Bb
Y 1b1
...
Aa
...
...
...
...
Ai
Niveles factor B
...
Bj
Y 1j1
...
...
Niveles factor A
...
A2
B2
Y 121
...
A1
B1
Y 111
...
Y a1n
Y a2n
...
Y ajn
...
Y abn
Eijk N 0,
iid
1.2.
Yijk i j ij E ijk
Figura 2
Supuestos y restricciones:
1.1.
para todo i, j, k.
i 1
j 1
i 1
ij
j 1
ij
Parmetros del modelo: Efectos de tratamientos: ij i j ij que representa el efecto del tratamiento AiBj
a
i 1 j 1
ij
0.
11
1 b
b j 1 ij
1 a
a i 1 ij
1 a b
1 a
1 b
ab i 1 j 1 ij
b j 1 j
a i 1 i
1.3.
Significado de la interaccin: El que los factores A y B interacten significa que las diferencias entre las medias de
tratamientos segn los niveles de un factor varan (bien sea en dimensin y/o signo) de nivel a nivel del otro factor. Considere por ejemplo
un estudio simple de dos factores en el cual los efectos de sexo (factor A) y edad (factor B) sobre el aprendizaje de una tarea son de
inters, siendo la variable respuesta el tiempo de aprendizaje en minutos. Los datos en las siguientes tablas corresponden a medias
poblacionales por tratamientos y niveles de cada factor ( ij en las celdas, i en las filas y j en las columnas):
gnero
hombre
mujer
media col
medio
13
9
11
edad
viejo
18
14
16
media fila
14
10
12
joven
9
7
8
medio
12
10
11
edad
viejo
14
16
15
media fila
11.67
11.00
11.33
Tabla 3
gnero
hombre
mujer
media col
joven
9
9
9
medio
12
10
11
edad
viejo
18
14
16
joven
9.75
8.25
9.00
medio
12
10
11
edad
viejo
17.25
14.75
16.00
Tabla 2
joven
11
7
9
Tabla 1
gnero
hombre
mujer
media col
Tabla 4
gnero
hombre
mujer
media col
media fila
13
11
12
media fila
13
11
12
12
22
12
Los grficos anteriores son conocidos como grficos de perfiles de medias en los cuales se presentan las medias de tratamiento en
cada uno de los niveles de uno de los factores fijando los niveles del otro factor ubicado en el eje horizontal. En el ejemplo se han
graficado las medias de tratamiento segn Gnero en cada nivel de edad, as las medias 1 j (con Gnero=hombre) son unidas por la
lnea continua en tanto que las medias 2 j (con Gnero=mujer) son unidas por la lnea punteada.
Sea i=1 para gnero hombre, i=2 para Gnero=mujer, j=1 para edad =joven, j=2 para edad=medio y j=3 para edad=viejo. La tabla 1 y su
grfica correspondiente, presentan el caso en el cual los factores no interactan, pues note que las diferencias en las medias ij de
gnero (hombre mujer, es decir 1 j 2 j ) en cada uno de los niveles de edad, es igual a 4 (tambin podra analizarse las diferencias
en las medias ij de edad en cada nivel de gnero y comprobarse que i1 i 2 2 , i1 i 3 7 , y i 2 i 3 5 para i=1,
2). Note adems que la edad tiene el efecto de incrementar los tiempos promedios de aprendizaje de la tarea para cada gnero:
Tabla 1
Edad
Gnero
joven medio viejo
Hombre - mujer 4
4
4
En este caso las diferencias hombre-mujer entre las medias del tiempo de aprendizaje de la tarea aumentan de manera positiva a medida
que el rango de edad es mayor: De acuerdo al ejemplo, cuando los hombres y mujeres son jvenes tienen el mismo tiempo promedio de
aprendizaje en la tarea de inters, pero a medida que envejecen, los tiempos promedios aumentan y a los hombres les toma mayor tiempo
promedio que a las mujeres para aprender y dicha diferencia se amplia con la edad.
Tabla 3
Edad
Gnero
joven medio viejo
Hombre - mujer 2
2
-2
En este caso, hasta una edad media, los hombres en promedio tardan 2 minutos ms que las mujeres en aprender la tarea de inters,
pero a las mujeres viejas les toma en promedio 2 minutos ms que a los hombres viejos en aprender tal tarea; los tiempos promedios para
cada gnero aumentan con la edad. Observe que la interaccin en este caso tuvo el efecto de invertir la direccin de las diferencias entre
las medias de tratamiento.
Tabla 4
Edad
Gnero
joven medio viejo
Hombre - mujer 1.5
2
2.5
En este caso, siempre existe una diferencia positiva en las medias de aprendizaje de los hombres respecto al de las mujeres en cada nivel
de edad, pero adems dichas diferencias aumentan levemente con la edad, a su vez que para cada gnero, los tiempos medios estn
aumentando con la edad. Note que la interaccin se puede catalogar como leve dado que los perfiles de media no son exageradamente
no paralelos.
Diagnstico de la presencia de interaccin: Muestralmente podemos establecer la presencia de interaccin mediante una de las
siguientes formas equivalentes:
Si se observa que los grficos de perfiles de medias muestrales de tratamientos ( Yij ) no son paralelos.
1.4.
Si la diferencia entre las respuestas medias para cualesquiera dos niveles del factor A no es la misma para todos los niveles de B.
Si la diferencia entre las respuestas medias para cualesquiera dos niveles del factor B no es la misma para todos los niveles de A.
Si las medias de tratamientos no son todas iguales a la suma de la media global ms los respectivos efectos principales de los
factores A y B
Encubrimiento o enmascaramiento de efectos principales: Los efectos i y j constituyen los efectos principales del
modelo. Cuando los efectos de interaccin son significativos, pueden encubrir o enmascarar a los efectos principales de uno o de
ambos factores, esto significa que en las pruebas F asociadas a la significancia simultnea de los efectos del respectivo factor, no se
rechaza la hiptesis nula, es decir, se concluye que el factor A, o el B o ambos, no son significativos, cuando ya se ha probado que estos
interactan significativamente.
Pero tenga en cuenta que, en presencia de interaccin significativa, no se puede concluir que alguno o ambos factores son no
significativos a pesar de que el respectivo test de significancia individual para cada factor arroje como resultado la no significancia, porque
tal evento es consecuencia de un encubrimiento debido a la interaccin. Este fenmeno suele suceder en casos donde la interaccin se
13
manifiesta invirtiendo en signo las diferencias en las medias de tratamientos de un factor en cada nivel del otro factor (los perfiles de
medias se cruzan). Como previamente se dijo, para poder aislar o separar correctamente el error experimental del efecto de interaccin es
necesario una estimacin independiente del primero, lo cual se logra mediante el uso de rplicas en cada tratamiento. Para mayor
eficiencia se sugieren diseos balanceados.
1.6
Anlisis de Varianza
Para el ANOVA tendremos en cuenta los siguientes estadsticos muestrales:
Parmetro
Estimador
Y
media global
1
Y
abn i 1 j 1 k 1 ijk
o bien Y
1 a b
Y
ab i 1 j 1 ij
1 a
Y
a i 1 i
1 b
Y j
b j 1
o bien Y
o bien Y
1 n
Y
n k 1 ijk
1 b n
Y
bn j 1 k 1 ijk
Yij
Yi
o bien Yi
1 b
Y
b j 1 ij
1 a n
Y
an i 1 k 1 ijk
1 a
o bien Y j Yij
a i 1
Y j
Suma de cuadrados
debida al error.
g.l=ab(n-1)
En donde:
14
ANOVA
Fuente de
variacin
Grados de
libertad
Suma de
cuadrados
Cuadrados
Medios
SSA
SSA
MSA
a 1
Valores esperados
F0
a 1
Factor A
E MSA bn
2
i 1
2
i
MSA
MSE
a 1
b
b 1
Factor B
SSB
MSB
b 1
SSB
E MSB an
2
MS AB
Interaccin
AB
a 1 b 1
SS(AB)
Error
ab n 1
SSE
Total
abn 1
SST
j 1
2
j
MSB
MSE
b 1
a
i 1 j 1
SS AB
E MS AB 2 n
a 1 b 1
a 1 b 1
MSE
SSE
ab n 1
ij
MS AB
MSE
E MSE 2
SST Yijk Y
i 1 j 1 k 1
a
,
a
i 1 j 1 k 1
a
i 1
SSB Y j Y
i 1 j 1 k 1
a
an Y j Y
j 1
SS AB Yij Yi Y j Y
i 1 j 1 k 1
SSE Yijk Y ij
i 1 j 1 k 1
n Yij Yi Y j Y
i 1 j 1
Hiptesis a probar: En su orden, deben realizarse los siguientes tests, con como nivel de significancia:
Hiptesis
H 0 : 11 12 ab 0
1. Significancia de la interaccin AB
Estadstico de la prueba
H1 : algn ij 0, i 1, 2, a j 1, 2, b
F3
MS AB
F3 f , a 1 b 1 ,ab n1 o si
bajo H 0
MSE
Rechazar H0 si
f a 1 b 1 ,ab n 1
VP P f a 1 b 1 ,ab n 1 F3
Si la interaccin es significativa (es decir, se rechaza H0), proceder con precaucin en la interpretacin de los resultados de los tests de
significancia sobre los efectos principales:
Hiptesis
H 0 : 1 2 a 0
H1 : algn i 0 i 1, 2, , a
MSA
F1
MSE
F1 f ,a 1,ab n1 o si
bajo H 0
Rechazar H0 si
f a 1,ab n 1
VP P f a 1,ab n1 F1
Si no se rechaza H0 bajo interaccin significativa, hay encubrimiento de los efectos principales de este factor por parte de la interaccin.
15
Hiptesis
H 0 : 1 2 b 0
H1 : algn j 0 j 1, 2, , b
MSB
F2
MSE
F2 f ,b 1,ab n 1 o si
bajo H 0
Rechazar H0 si
f b 1,ab n 1
VP P f b 1,ab n1 F2
Si no se rechaza H0 bajo interaccin significativa, hay encubrimiento de los efectos principales de este factor por parte de la interaccin.
Tener presente que: La estimacin de un efecto principal es una diferencia promediada o contraste entre todas las medias de los niveles
del factor correspondiente, por ello al hacer inferencias sobre tales medias con base en las estimaciones de los efectos principales, en
presencia de interaccin, es realizar una generalizacin sobre los niveles del factor, y por tanto dichas inferencias estarn equivocadas.
Una comparacin generalizada entre las medias de un factor tiene sentido si las diferencias existentes entre dichas medias se sostienen
de nivel a nivel del otro factor, es decir, cuando no hay interaccin. De lo contrario, lo mejor es realizar comparaciones y contrastes de
medias de tratamientos ij que ayuden a interpretar los efectos significativos de la interaccin. As ante interaccin, sera ms
conveniente comparar las medias de dicho factor pero en cada uno de los niveles del otro factor. Por ejemplo, suponga un experimento
con a=3 y b=2 en el cual los datos evidencian interaccin significativa pero aparentemente el factor A no es significativo; en este caso
sera conveniente realizar pruebas como las siguientes:
a) Comparar medias de A en el nivel 1 de B
Estadstico de la prueba
Hiptesis
H 0 : 11 21 31
H1 : algn par i1 i1 con i i
a
FA|B1
SS A|B1 / a 1
MSE
bajo H 0
Rechazar H0 si
f a 1,ab n 1
SS A|B1 Yi1 Y1 es la suma de cuadrados debida a las celdas A1B1, A2B1 y A3B1
2
i 1 k 1
Hiptesis
H 0 : 12 22 32
H1 : algn par i 2 i 2 con i i
a
FA|B2
SS A|B2 / a 1
MSE
bajo H 0
Rechazar H0 si
f a 1,ab n 1
i 1 k 1
Tambin, se podran realizar las comparaciones de las medias del factor B en cada nivel de A. Siguiendo el ejemplo con a=3 y b=2, los
tests a realizar seran:
c) Comparar medias de B en el nivel 1 de A
Hiptesis
Estadstico de la prueba
Rechazar H0 si
FB| A > f ,b 1,ab n1 o si
H :
bajo H
0
11
12
FB| A1
H1 : 11 12
b
SS B| A1 Y1 j Y1
j 1 k 1
SS B| A1 / b 1
MSE
f b 1,ab n1
H 0 : 21 22
FB| A2
H1 : 21 22
b
j 1 k 1
Hiptesis
SS B| A2 Y2 j Y2
SS B| A2 / b 1
MSE
bajo H 0
f b 1,ab n1
16
Rechazar H0 si
Hiptesis
H 0 : 31 32
FB| A3
H1 : 31 32
b
SS B| A3 Y3 j Y3
j 1 k 1
SS B| A3 / b 1
Rechazar H0 si
FB| A3 > f ,b 1,ab n 1 o si
bajo H 0
MSE
f b 1,ab n 1
NOTA: Ante interaccin no se recomienda realizar comparaciones de Tukey sobre las medias de cada factor. Tukey podra aplicarse ms
bien a las medias de un factor en cada nivel del otro. Por ejemplo para comparar todas las medias de A en el nivel Bj, es decir las medias
1 j , 2 j , , aj , la mnima diferencia significativa a usar est dada por
MDS A|B j q , a , ab n 1
MSE
,
n
en tanto que para comparar todas las medias de B en el nivel Ai, o sea las medias i1 , i 2 , , ib , la mnima diferencia significativa
a usar est dada por
MDS B| Ai q , b, ab n 1
MSE
.
n
O bien, tambin se puede comparar cualquier subgrupo de medias de tratamientos usando como mnima diferencia significativa a
MDS ij ,m q , m , ab n 1
MSE
,
n
1.7
Estimaciones
Error estndar
SYij
Yij
MSE
n
ij Yij t / 2 ,ab n1 SY
ij
C
i 1 j 1
Estimador
a
W C ijYij con
i 1 j 1
1.8
ij
ij
Error estndar
a
C
i 1 j 1
ij
SW
MSE a b 2
C
n i 1 j 1 ij
C Y
i 1 j 1
ij
ij
t / 2 ,ab n 1 SW
Debemos calcular los residuales de este modelo, los cuales corresponden a E ijk Yijk Yij , tenga en cuenta que los valores
predichos para cada respuesta corresponden a Yijk Yij Con estos datos procedemos a realizar lo siguiente:
Los supuestos sobre los errores son chequeados mediante grficos de residuales, como se resume a continuacin:
17
2.
Para chequear:
Independencia
Normalidad
En caso de que los datos obtenidos presenten evidencia respecto a la no significancia del trmino de interaccin, el modelo factorial debe
replantearse de la siguiente manera: Yijk i j E ijk
2.1
Supuestos y restricciones
iid
i 1
j 1
Obviamente en el ANOVA la suma de cuadrados debida al trmino de error, es diferente en un modelo con interaccin respecto a un
modelo sin interaccin.
2.2
Anova
Grados de
libertad
Suma de
cuadrados
Valores esperados
a 1
Factor A
SSA
MSA
a 1
SSA
E MSA bn
2
i 1
2
i
a 1
MSA
MSE
b 1
Factor B
SSB
Error
SSB
MSB
b 1
MSE
SSE
Total
abn 1
Donde abn a b 1
SSE
E MSB an
2
E MSE 2
SST
Frmulas sumas de cuadrados
SST Yijk Y
i 1 j 1 k 1
a
,
a
i 1 j 1 k 1
a
i 1
SSB Y j Y
i 1 j 1 k 1
a
an Y j Y
j 1
SSE Yijk Yi Y j Y
i 1 j 1 k 1
18
j 1
2
j
b 1
MSB
MSE
2.3
Hiptesis
H 0 : 1 2 a 0
F1
H1 : algn i 0 i 1, 2, , a
MSA
MSE
Rechazar H0 si
F1 f ,a 1, o si
bajo H 0
VP P f a 1, F1
f a 1,
Hiptesis
H 0 : 1 2 b 0
F2
H1 : algn j 0 j 1, 2, , b
MSB
MSE
Rechazar H0 si
F2 f ,b 1, o si
bajo H 0
VP P f b 1, F2
f b 1,
Donde abn a b 1
NOTA: Como no hay interaccin, pueden realizarse los testes de Tukey sobre las medias de cada factor, teniendo en cuenta que para el
caso del factor A la mnima diferencia significativa est dada por
MSE
,
nb
MDS A q , a , abn a b 1
donde q , a , abn a b 1 es el valor crtico del rango estudentizado a usar. Para el caso del factor B la mnima diferencia
significativa est dada por
MDS B q , b, abn a b 1
donde q , b, abn a b 1 es el valor crtico del rango estudentizado a usar.
MSE
,
na
Tambin pueden compararse medias de tratamiento como en el caso con interaccin, slo que debe usarse un rango crtico
estudentizado con abn a b 1 grados de libertad.
2.4
Estimaciones
Interesa estimar medias y efectos principales. Los estimadores para las medias de inters se calculan de la misma manera como se
indic en el modelo con interaccin, a continuacin se dan sus errores estndar e intervalos de confianza junto para los efectos
estimados:
Media Error estndar
Efectos
Error estndar
I.C del (1-)100%
I.C del (1-)100%
muestral
estimados
SY
MSE
abn
Y t / 2 , SY
Yi
SYi
MSE
bn
i Yi t / 2, SY
Y j
SY j
MSE
an
j Y j t / 2, SY
i Yi Y
S i
1
1
MSE
bn
abn
i i t / 2, S
j Y j Y
1
1
MSE
an
abn
i i t / 2 , S
MSE
ij Yij t / 2 , SYij
n
Donde abn a b 1 , los grados de libertad del error en el modelo sin interaccin
Yij
2.5
SYij
Debemos calcular los residuales de este modelo, los cuales corresponden a E ijk Yijk Yi Y j Y , tenga en cuenta que los
valores predichos para cada respuesta corresponden a Yijk Yi Y j Y Con estos datos procedemos a realizar los mismos
anlisis sobre los residuales especificados en el modelo con interaccin.
19
TECNICO
1
62
48
63
57
69
51
57
45
50
39
59
65
55
52
70
MARCA
2
57
45
39
54
44
61
58
70
66
51
58
63
70
53
60
1.
3
59
53
67
66
47
55
58
50
69
49
47
56
51
44
50
Yijk i j ij ijk
donde tomando como factor A: TECNICO y B: MARCA, con niveles a=3 y b=3 respectivamente y n=5,
Yijk es el tiempo de reparacin en la k-sima unidad de la marca j con tcnico i
ij es el efecto de la interaccin del tcnico i con la marca j sobre el promedio global del tiempo de reparacin de una unidad
ijk
ijk ~ N 0 , 2
iid
ij ij 0
ANLISIS DESCRIPTIVO: En primera instancia debemos analizar el grfico de interaccin presentado en la figura 3.
En sta se observa que los perfiles de medias de las marcas no son paralelos, lo cual implica que posiblemente la interaccin entre
tcnicos y marcas es significativa. A nivel del tcnico 1 se observa que su menor tiempo promedio corresponde a la reparacin de
unidades marca 2 y tarda ms con las otras dos marcas; el tiempo promedio de este tcnico con las marcas 2 y 3 es aproximadamente el
mismo. A nivel del tcnico 2 los tiempos promedios de reparacin son distintos para las tres marcas, y el menor tiempo promedio lo
alcanza con la marca 1, en tanto que su mayor tiempo promedio fue con la marca 2. El tcnico 3 present el menor tiempo promedio con
la marca 3, en tanto que con las marcas 1 y 2 tard ms y para estos dos casos los tiempos promedios observados resultaron
aproximadamente iguales. Tambin se observa que los tiempos promedio para la marca 2 con los tcnicos 2 y 3 son muy similares; y los
tiempos promedio para la marca 1 con los tcnicos 1 y 3 son tambin similares entre s. Pero el hecho ms importante a destacar es que
2.
20
cada tcnico es especialista en una marca y que para cada marca slo un tcnico alcanza el mejor (es decir el menor) tiempo promedio.
Si el objetivo del estudio es buscar mejorar el tiempo promedio de reparacin, uno estara tentado a recomendar que los trabajos de
reparacin de unidades de la marca 1 sean asignados al tcnico 2, los de la marca 2 al tcnico 1 y los de la marca 3 al tcnico 3. Sin
embargo, implementar tal medida hara al sistema ineficiente, es como tener una cola en espera de servicio para cada servidor, lo cual
en la teora de colas, no es la mejor disposicin. La administracin del centro de servicio debe ante esta situacin, implementar medidas
correctivas para lograr que todos los tres tcnicos sean igualmente efectivos con cualquiera de las marcas.
Por otra parte, las figuras 1 y 2 muestran que prcticamente los tiempos promedios de reparacin no difieren ni por tcnico ni por marca,
es decir, mirar aisladamente estas dos figuras nos llevara a concluir errneamente que ninguno de los dos factores es significativo!!!. Si
en realidad hay interaccin significativa, entonces lo que vemos en las figuras 1 y 2, es un enmascaramiento de los efectos principales de
cada factor, por parte de la interaccin. Adicionalmente en las figuras 1 y 2 vemos que segn los altos de las cajas, la dispersin de los
tiempos de reparacin puede concebirse aproximadamente constante de nivel a nivel de cada factor.
FIG. 1
FIG. 2
FIG. 3
3.
TEST DE HIPTESIS SOBRE LA INTERACCIN: Con base en la anterior salida SAS, se procede a realizar el
21
sobre la significancia de los efectos principales de cada factor: De hecho, si la interaccin es significativa, entonces los dos factores son
significativos a travs de la interaccin!!!.
4.
TEST DE HIPTESIS SOBRE LOS EFECTOS PRINCIPALES DE CADA FACTOR: Con base en la
son significativos
no difieren significativamente
Al menos dos de las medias de los tiempos de reparacin segn el factor tcnico
H1 : i j
difieren significativamente
H0
Se concluye que con una significancia de 0.05,ante interaccin significativa, los efectos principales del factor TCNICO son
enmascarados por la interaccin y por lo tanto no pueden ser medidos sus efectos principales!!!. Esto quiere decir que no tiene sentido
estimar ni efectos, ni medias para los niveles de TCNICO y tampoco tiene sentido construir I.C, o hacer comparaciones de Tukey o
contrastes con las medias de este factor.
Sobre la significancia de los efectos principales del factor MARCA:
no difieren significativamente
H0
Se concluye que con una significancia de 0.05, ante interaccin significativa, los efectos principales del factor MARCA son enmascarados
por la interaccin y por lo tanto no pueden ser medidos sus efectos principales!!!. Esto quiere decir que no tiene sentido estimar ni
efectos, ni medias para los niveles de MARCA y tampoco tiene sentido construir I.C, o hacer comparaciones de Tukey o contrastes con
las medias de este factor. Lo ms recomendable es realizar contrastes o comparaciones de medias de tratamientos ij o bien comparar
medias de un factor en cada nivel del otro factor.
22
5.
MSE
n
1.1
2.1
3.1
1.2
2.2
3.2
1.3
2.3
3.3
n MediasA.B
LI
LS
5
59.8 53.25889 66.34111
5
48.4 41.85889 54.94111
5
60.2 53.65889 66.74111
5
47.8 41.25889 54.34111
5
61.2 54.65889 67.74111
5
60.8 54.25889 67.34111
5
58.4 51.85889 64.94111
5
56.2 49.65889 62.74111
5
49.6 43.05889 56.14111
En esta tabla puede observarse la similaridad en las estimaciones e I.C para las medias de los tratamientos:
1,1 ,1,3 , 2, 2 , 3,1 , 3, 2 y 1, 2 , 2,1 , 3,3 , lo cual puede verificarse en la figura 3. Podra entonces realizarse
ij
kl
ij
MSE
,
n
y verificar si las medias de tratamientos indicadas resultan iguales, como se muestra en la siguiente salida R. Sin embargo, note que en
este caso no se obtienen diferencias significativas entre tratamientos, no porque no existan tales diferencias, sino porque se pierde
potencia en este procedimiento con un nmero tan grande de comparaciones. Aqu las medias de tratamiento 11 , 12 , 13 , 21 , 22 ,
23 , 31 , 32 , 33 son etiquetadas, respectivamente, como i : j , as, por ejemplo, en la comparacin 2:1 1:1 se hace referencia a
la diferencia de las medias 21 y 11 :
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = tiempo ~ tcnico * marca)
$`tcnico:marca`
diff
lwr
2:1-1:1 -11.4 -26.43865
3:1-1:1
0.4 -14.63865
1:2-1:1 -12.0 -27.03865
2:2-1:1
1.4 -13.63865
3:2-1:1
1.0 -14.03865
1:3-1:1 -1.4 -16.43865
2:3-1:1 -3.6 -18.63865
3:3-1:1 -10.2 -25.23865
3:1-2:1 11.8 -3.23865
upr
3.63865
15.43865
3.03865
16.43865
16.03865
13.63865
11.43865
4.83865
26.83865
p adj
0.2658953
1.0000000
0.2095773
0.9999970
0.9999998
0.9999970
0.9965056
0.4054029
0.2273106
23
-0.6
12.8
12.4
10.0
7.8
1.2
-12.4
1.0
0.6
-1.8
-4.0
-10.6
13.4
13.0
10.6
8.4
1.8
-0.4
-2.8
-5.0
-11.6
-2.4
-4.6
-11.2
-2.2
-8.8
-6.6
-15.63865
-2.23865
-2.63865
-5.03865
-7.23865
-13.83865
-27.43865
-14.03865
-14.43865
-16.83865
-19.03865
-25.63865
-1.63865
-2.03865
-4.43865
-6.63865
-13.23865
-15.43865
-17.83865
-20.03865
-26.63865
-17.43865
-19.63865
-26.23865
-17.23865
-23.83865
-21.63865
14.43865
27.83865
27.43865
25.03865
22.83865
16.23865
2.63865
16.03865
15.63865
13.23865
11.03865
4.43865
28.43865
28.03865
25.63865
23.43865
16.83865
14.63865
12.23865
10.03865
3.43865
12.63865
10.43865
3.83865
12.83865
6.23865
8.43865
1.0000000
0.1487668
0.1771874
0.4316582
0.7366003
0.9999991
0.1771874
0.9999998
1.0000000
0.9999787
0.9928966
0.3552211
0.1130579
0.1359755
0.3552211
0.6555252
0.9999787
1.0000000
0.9994109
0.9710966
0.2460831
0.9998112
0.9825836
0.2867388
0.9999018
0.5990906
0.8715885
6.
CONTRASTE PARA PROBAR SI EL TIEMPO PROMEDIO EMPLEADO PARA REPARAR UN
MICRO DE LA MARCA 2 Y UNO DE LA MARCA 3 ES EL MISMO PARA EL TCNICO 2 Y 3
Se pide comparar el promedio de las medias 22 y 23 es igual al promedio de las medias 32 y 33 . Por tanto el contraste indicado
1
1
22 23 32 33 . El test de hiptesis corresponde a:
2
2
H 0 : 22 23 32 33
H0 : W 0
es W
H1 : W 0
o equivalentemente
H1 : 22 23 32 33
1
1
1
1
1
1
W y22 y23 y32 y33 ~ N W , 2
24
7.
RESULTADOS PARA COMPARAR LAS MEDIAS DE CADA FACTOR EN CADA NIVEL DEL
OTRO FACTOR
7.1
Resultados para comparar las medias del factor tcnico en cada nivel de marca
Efectos Tcnico*Marca sobre respuesta Tiempo particionados por Marca
H 0 : 11 21 31
Df
Sum Sq Mean Sq
F0
P.Value
En Marca1 2 448.9333 224.4667 4.315744 0.020888163
En Marca2 2 581.2000 290.6000 5.587268 0.007703847
En Marca3 2 209.7333 104.8667 2.016236 0.147918236
H 0 : 12 22 32
H 0 : 13 23 33
En la tabla precedente se aprecian los resultados de los testes sobre la igualdad de las medias del factor TCNICO en cada nivel del
factor MARCA, veamos cada una:
Comparacin de las medias de los tcnicos a nivel de la marca 1:
H 0 : 11 21 31
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS A|B1 / MSE 4.32 , F0 ~ f a 1,ab n1 ,
donde MS A|B1 n
y
i 1
i 1
El estadstico para probar esta hiptesis corresponde a: F0 MS A|B 2 / MSE 5.59 , F0 ~ f a 1,ab n1 ,
donde MS A|B 2 n
y
i 1
i 2
El estadstico para probar esta hiptesis corresponde a: F0 MS A|B 3 / MSE 2.02 , F0 ~ f a 1,ab n1 ,
donde MS A|B 3 n
y
i 1
i 3
25
respecto a la ltima; la pregunta es si en trminos prcticos tales diferencias son o no significativas, a pesar que no se encuentra
significancia estadstica!!!
7.2
Resultados para comparar las medias del factor marca en cada nivel de tcnico
H 0 : 11 12 13
Df
Sum Sq Mean Sq
F0
P.Value
En Tcnico1 2 430.5333 215.2667 4.138859 0.02410520
En Tcnico2 2 416.1333 208.0667 4.000427 0.02698640
En Tcnico3 2 396.9333 198.4667 3.815851 0.03140553
H 0 : 21 22 23
H 0 : 31 32 33
En la tabla precedente se aprecian los resultados de los pruebas sobre la igualdad de las medias del factor MARCA en cada nivel del
factor TCNICO, veamos cada una:
Comparacin de las medias de las marcas a nivel del tcnico 1:
H 0 : 11 12 13
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS B|A1 / MSE 4.14 , F0 ~ f b 1,ab n 1 ,
donde MS B| A1 n
y
b
j 1
1 j
y1
y
b
j 1
2 j
y2
El estadstico para probar esta hiptesis corresponde a: F0 MS B|A3 / MSE 3.82 , F0 ~ f b 1,ab n1 ,
26
donde MS B| A3 n
y
b
j 1
3 j y3
8.
8.1
VALIDACIN DE SUPUESTOS
Prueba del supuesto de normalidad para los errores modelo factorial: A partir del valor P de
0.271206 del test de Shapiro Wilk en la figura 7 y del grfico de probabilidad normal con los residuales comunes ijk yijk yij , en la
misma figura, se puede concluir que el supuesto de normalidad para los errores del modelo, es razonable.
Validacin del supuesto de varianza constante con grficos de residuales: En las figuras 4, 5, y 6
se presentan las grficas de residuales estudentizados vs. tcnico, vs. marca y vs. predichos, respectivamente. En estas tres figuras se
observa un residual cortando la banda de +2, indicando un posible outlier. En trminos generales puede considerarse que el supuesto de
varianza constante se cumple aproximadamente.
8.2
Fig. 4
Fig. 5
Fig. 6
Fig. 7
27
28
plot(tiempo~marca)
lines(1:3,mediasmarca,type="b",pch=4,col=2,lty=2)
AJUSTE MODELO ANOVA CON INTERACCIN Y CCULO TABLA ANOVA
modelo=aov(tiempo~tcnico*marca)
anova(modelo)
GRFICOS Y RESULTADOS PARA VALIDACIN DE SUPUESTOS
shapiro.test(residuals(modelo))
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot(fitted(modelo),rstudent(modelo),cex=2,
main="Residuales estudentizados vs. valores ajustados",xlab="Valores ajustados")
abline(h=c(-2,0,2),col=2)
plot(as.numeric(marca),rstudent(modelo),
main="Residuales estudentizados vs. marca",xlab="marca")
abline(h=c(-2,0,2),col=2)
plot(as.numeric(tcnico),rstudent(modelo),cex=2,
main="Residuales estudentizados vs. tcnico",xlab="tcnico")
abline(h=c(-2,0,2),col=2)
qqnorm(residuals(modelo),cex=2)
qqline(residuals(modelo),col=2)
CLCULO DE MEDIAS DE TRATAMIENTOS CON SUS I.C DEL 95%
mismediastratamientosdosfactores(respuesta=tiempo,factorA=tcnico,factorB=marca)
COMPARACIONES MLTIPLES DE TRATAMIENTOS POR TUKEY
PERO NO ES MUY TIL CON MUCHOS TRATAMIENTOS
TukeyHSD(modelo,"tcnico:marca",conf.level=0.95)
EXTRAYENDO EL MSE DEL ANOVA DEL DISEO FACTORIAL Y GRADOS DE LIBERTAD
MSE=anova(modelo)[3][4,]
dftcnico=length(levels(tcnico))-1
dfmarca=length(levels(marca))-1
dferror=anova(modelo)[1][4,]
COMPARACIN DE MEDIAS DE TCNICOS EN CADA NIVEL DE MARCA: Se pide probar que las medias del factor Tcnico
29
H 0 : 31 32 33
Bibliografa
KUELH, R.O. (2001). Diseo de Experimentos. Thomson Learning.
MONTGOMERY, D. C. (2001) Design and analysis of experiments. 5th Edition. John Wiley & Sons.
NETER, N. et. Al. (1996) Applied Linear Statistical Models. Irwin.
30