Dbca y Factoriales Regresión y Diseño

DBCA y Experimentos Factoriales.
Curso: Regresin y Diseo de Experimentos
Prof. Nelfi Gonzlez A. Escuela de Estadstica
PARTE I: DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA) - MODELO DE UN FACTOR

Un experimento puede involucrar uno o ms factores que aunque no son de inters para el experimentador podra tener un efecto sobre la
respuesta. Entre dicho tipo de factores encontramos los factores de bloqueo. Un diseo de bloques es apropiado cuando el objetivo
del experimento es comparar los efectos de diferentes tratamientos promediados sobre un rango de condiciones diferentes. Las unidades
experimentales son agrupadas en conjuntos de tal forma que dos unidades experimentales en el mismo grupo son similares y pueden ser
medidas bajo condiciones experimentales similares, pero dos unidades experimentales en diferentes grupos probablemente ocasionarn
mediciones muy diferentes an cuando sean asignadas al mismo tratamiento. Los grupos de unidades experimentales similares son
llamados bloques, y las condiciones que varan de bloque a bloque forman los niveles del factor de bloqueo. El anlisis de un diseo de
bloques incluye la comparacin de tratamientos aplicados a las unidades experimentales dentro del mismo bloque. As, el propsito de
bloquear es prevenir que diferencias grandes en las unidades experimentales enmascaren las diferencias entre los niveles del factor de
tratamiento, mientras que al mismo tiempo permita que los tratamientos sean examinados bajo diferentes condiciones experimentales.
Los niveles de un factor de bloqueo pueden ser los valores de una covariable que ha sido medida antes del experimento y cuyos valores
son usados para agrupar a las unidades experimentales. Muy a menudo sin embargo, los niveles de un factor de bloqueo son
agrupamientos de caractersticas que no pueden ser medidas convenientemente. Por ej., Agrupar los rangos de tiempo en el mismo da
dentro del mismo bloque, puede asegurar que las condiciones ambientales dentro de un bloque sean bastante similares sin necesidad de
medirlas. Dado que los niveles del factor de bloqueo no necesariamente necesitan ser medidas, el diseo de bloques es muy popular.
Los experimentadores agrcolas pueden saber que parcelas cercanas en un campo son similares, en tanto que las parcelas lejanas no lo
son. Los experimentadores industriales pueden saber que dos unidades producidas por una misma mquina tienen caractersticas
similares, mientras que aquellas producidas por dos mquinas distintas son algo diferentes. Los experimentadores clnicos pueden saber
que las mediciones tomadas sobre el mismo sujeto sern similares, mientras que aquellas tomadas sobre sujetos distintos no lo sern.
Por tanto los bloques pueden ser formados sin conocer los niveles precisos del factor de bloqueo.
ASPECTOS DEL DISEO DE BLOQUES

Tamao de los bloques: Aunque es posible que el nmero de unidades experimentales en cada bloque sea distinto, se examinar slo
diseos de bloques con igual tamao de bloque. Representaremos el nmero de bloques por b; y en este curso consideraremos el caso
de tamao de bloque igual al nmero de niveles a del factor de estudio. Es comn que en experimentos industriales haya una divisin
automtica en bloques de acuerdo al intervalo de tiempo en un da como proteccin contra condiciones experimentales cambiantes. Un
experimento piloto puede ser realizado para determinar la necesidad de bloquear.
NOTA 1: Debe tenerse en cuenta que cuando se bloquea innecesariamente, las pruebas de hiptesis sern menos potentes y los
intervalos de confianza sern ms anchos que los que se obtendran con un diseo completamente aleatorizado.
Una vez se haya determinado el nmero de bloques y se hayan agrupado a las unidades experimentales en tales grupos, a continuacin
se asignan las unidades a los tratamientos. La peor asignacin posible de unidades a tratamientos es asignar todas las unidades de un
bloque a un tratamiento, todas las unidades de otro bloque a otro tratamiento, y as sucesivamente. Esta asignacin no permite en el
anlisis distinguir entre diferencias entre bloques y diferencias entre tratamientos. Los efectos de los tratamientos y los del factor de
bloqueo quedan confundidos (confusin de efectos). La mejor asignacin posible es asignar a cada tratamiento el mismo nmero de
unidades experimentales en cada bloque. Esto puede lograrse slo cuando el tamao del bloque k sea un mltiplo del nmero de niveles
o tratamientos del factor, a. Este diseo es llamado diseo de bloques completos, y el caso especial en cual k=a, es el que se conoce
usualmente como diseo de bloques completos aleatorizados, o simplemente diseo de bloques aleatorizados.
Si el tamao de bloque no es mltiplo de a, entonces el diseo es conocido como un diseo de bloques incompletos. Este nombre es
algunas veces reservado para el diseo en el cual k<a. Estos diseos son ms complicados para analizar que los diseos completos.
EL DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA)

Este diseo con a tratamientos y con N=ab unidades experimentales agrupadas en b bloques de k= a unidades de forma que las
unidades dentro de un bloque son similares y unidades en bloques diferentes son sustancialmente distintas. Las k=a unidades
experimentales en cada bloque son asignadas aleatoriamente a los a tratamientos o niveles del factor de inters de modo que cada
tratamiento es asignado a una unidad por bloque. As, cada tratamiento aparece una vez en cada bloque y n=b veces en el diseo.
Anlisis de diseos de bloques completos aleatorizados
Una tabla de entrada de datos tpica de este modelo es como sigue:
DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos
Bloques
1
...
...
Y11
Y12
...
Y1j
...
Y1b
Y21
Y22
...
Y2j
...
Y2b
...
...
Yi1
Yi2
Yij
Yib
...
...
Ya1
Ya2
...
Yaj
....
Yab
Y1
Y2
Yi
Ya
Y1 Y2
...
Y j
...
Y b
Media global Y
Medias de
bloques
1.
Medias de
tratamientos
Tratamientos
Modelo y ANOVA: El modelo estndar del diseo de bloques completos aleatorizados es:
Yij i j ij ,
(1)
ij ~ N 0, 2 , i 1, 2, , a j 1, 2, , b ,
iid
i 1
j 1
i j 0
donde es la respuesta promedio global, i es el efecto del i-simo tratamiento o nivel del factor de inters, j es el efecto del j-simo
bloque, ij es el error aleatorio asociado, y Yij es la variable aleatoria que representa la medicin en el bloque j del tratamiento i. Este
modelo asume que no existe interaccin entre el factor de inters y el factor de bloqueo; en muchas situaciones esta presuncin ser
razonable, sin embargo, si se sospecha que hay interaccin, el tamao del bloque deber ser incrementado para permitir estimar estos
efectos.
El ANOVA para el modelo en (1) es similar al que veremos en el caso de dos factores sin interaccin en un diseo completamente
aleatorizado, sin embargo varias diferencias deben ser notadas: Las combinaciones de tratamientos de un modelo de dos factores en un
diseo completamente aleatorizado son asignadas aleatoriamente a las unidades, en cambio en un diseo de bloques, aunque las
observaciones son tomadas sobre todas las combinaciones de tratamientos y bloques, slo los niveles de tratamientos del factor son
asignados aleatoriamente a las unidades experimentales (dentro de cada bloque). Los niveles del factor de bloque representan
agrupamientos intencionales de las unidades experimentales. Esto ltimo desata una controversia sobre si es vlido o no realizar el test
de igualdad de medias de los bloques. Por otra parte considerando al factor de bloqueo como un factor nuisance, no estamos
interesados propiamente en sus medias porque en muchos casos es improbable que si repetimos el experimento podamos usar bloques
idnticos. As que en vez de probar la igualdad de las medias de bloque, ms bien se compara la suma de cuadrados medios debida al
factor de bloqueo con el MSE del modelo para determinar si bloquear fue o no benfico en el experimento.
ANOVA
Fuente de Grados de Suma de
Cuadrados
Valores esperados
F
variacin
libertad
cuadrados
Medios
a
Factor A
MSA=SSA/(a-1)
MSA/MSE
a-1
SSA
Bloques
E MSA 2
MSB=SSB/(b-1)
b-1
(a-1)(b-1)
SSE
Total
ab-1
SST
i 1
a 1
a
SSB
Error
b i2
E MSB 2
MSE=SSE/[(a-1)(b-1)]
E MSE
a i2
i 1
b 1
Frmulas
a
SSB Y j Y a Y2j abY2
SSA Yi Y b Y abY
2
i 1 j 1
2
i
i 1
i 1 j 1
j 1
SST Yij Y Yij2 abY2 , SSE SST SSA SSB

a
i 1 j 1
Yi
i 1 j 1
1
Yij
b j 1
Media muestral en el nivel i del factor de tratamientos
1 a
Y j Yij Media muestral en el bloque j del factor de bloqueo
a i 1
1 a b
Y Yij Media muestral de todas las ab observaciones.
ab i 1 j 1
La hiptesis de inters es:
H 0 : 1 2 a 0
H1 : algn i 0
o bien
H 0 : 1 2 a
H1 : algn i j
(2)
En cualquier caso, el estadstico de prueba y su distribucin bajo H0, son:

H0
F MSA / MSE ~ f a 1,( a 1)( b1)
y se rechaza para valores estadsticamente grandes.
NOTA 2: Si el MSB es considerablemente mayor que el MSE, esto sugiere que la creacin de bloques vali la pena en el sentido de que
sirvi para reducir el tamao del error experimental. De lo contrario, si el MSB es menor que el MSE, entonces la creacin de bloques ha
bajado la potencia de las pruebas de hiptesis y ha incrementado la longitud de los intervalos de confianza para los contrastes de
tratamientos.
NOTA 3: Recuerde que no hay conclusin estadstica acerca de la igualdad de medias de bloques o de significancia de efectos de
bloques; la comparacin meramente se hace como una forma de establecer la utilidad de haber creado bloques en el experimento, y
proporciona informacin adicional para la planeacin futura de experimentos similares.
NOTA 4: Si el MSB es menor que el MSE, no es vlido pretender que el experimento fue diseado como un diseo completamente
aleatorizado y remover los efectos de bloques del modelo. La aleatorizacin no es la correcta para un diseo completamente
aleatorizado.
2.
i j
Comparaciones mltiples: Se tiene que el estimador de mnimos cuadrados para
i j Yi Y j Y .
Por tanto cualquier contraste de medias de tratamientos
c
i 1
con
es la media del i-simo nivel del factor de tratamientos, es estimable y su estimador de mnimo cuadrados es
c
i 1
a
0 , donde i
a
ci i ciYi ,
i 1
i 1
2
2
ciYi ci / b . La frmula general para los intervalos de confianza de (1-)100%, para un contraste
i 1
i 1
cuya varianza es V
es
de medias de tratamientos, es:

a
c
i 1
a
a
ciYi t / 2 ,( a 1)( b1) MSE ci2 / b

i 1
i 1
Y para la comparacin por el mtodo de Tukey de todos los pares de medias de tratamientos, usando intervalos de confianza del tipo:
i j
Y j q a , a 1 b 1 MSE / b
3.
Chequeo de supuestos del modelo: Como siempre, es necesario corroborar los supuestos acerca de los errores del
modelo: Independencia, normalidad y varianza constante, adems, tambin es importante chequear la forma del modelo (carencia de
ajuste). Los residuales del modelo son calculados como:
ij Yij Yij Yij Yi Y j Y

Los supuestos sobre los errores son chequeados mediante grficos de residuales, como se resume a continuacin:
4.
Para chequear:
Independencia
Graficar residuales contra:

Orden de las observaciones (segn espacio o tiempo)
Varianza igual y outliers
Valores predichos, niveles del factor de tratamientos,

niveles del factor de bloqueo
Normalidad
Scores normales o test Shapiro Wilk
Ejemplo de un DBCA: Comparacin de cuatro mtodos de ensamble
Un equipo de mejora investiga el efecto de cuatro mtodos de ensamble A, B, C, y D, sobre el tiempo de ensamble en minutos. En
primera instancia la estrategia experimental fue aplicar cuatro veces los cuatro mtodos de ensamble en orden aleatorio en un diseo
completamente aleatorizado. Sin embargo, los experimentadores se dan cuenta que hay cuatro operadores con distintas destrezas y
consideran que esto puede afectar de manera significativa los tiempos de ensamble, y por ende la comparacin de los mtodos, entonces
debe utilizarse un diseo de bloques completos aleatorizados para controlar activamente en el experimento a los operadores que
realizarn el ensamble. Los datos recolectados en este diseo fueron los siguientes:
Mtodo
A
B
C
D
1
6
7
10
10
2
9
10
16
13
Operador
3
7
11
11
11
4
8
8
14
9
Se desea determinar si existen diferencias entre los cuatro mtodos y cmo se diferencian, adems elegir el mejor mtodo, si lo hay.
Solucin
En primera instancia se construyen los grficos boxplots de los tiempos vs. mtodos y tiempos vs. operadores, usando programa R que
aparece en ANEXO 1.
12
14
16
10
tiempo
12
10
6
tiempo
14
16
mtodo
operador
Se observan diferencias en los tiempos promedios de ensamble entre los cuatro mtodos. A primera vista parece que los dos mejores
mtodos son el A y B. Parece que con el mtodo C los tiempos alcanzados tienen mayor dispersin que en los otros dos casos. Por su
parte, el operador 1 parece tener en promedio el menor tiempo de ensamble, en tanto que los operadores 3 y 4 en promedio y tienen
aproximadamente los mismos tiempos. El operador 2 es ms lento y opera con una mayor variabilidad lo que nos dice que es menos
consistente en sus acciones.
El modelo estadstico es
operadores.
Yij i j ij
i=1, 2, 3, 4 para denotar los mtodos A, B, C y D respectivamente, y j=1, 2, 3, 4
representa el efecto sobre el tiempo promedio de ensamble debido al mtodo i-esimo y
operador sobre el tiempo promedio de ensamble.
Restricciones y supuestos son
i 1
j 1
i j 0 ,
ij ~ N 0, 2
iid
Se construye la tabla ANOVA, y de medias de tratamientos con ayuda del R, los resultados son los siguientes:
ANOVA
Analysis of Variance Table
Response: tiempo
Df Sum Sq Mean Sq F value
Pr(>F)
mtodo
3
61.5
20.5
10.25 0.002919 **
operador
3
28.5
9.5
4.75 0.029846 *
Residuals 9
18.0
2.0
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
es el efecto del j-esimo

con los errores
MEDIAS DE TRATAMIENTOS
Tabla de medias de tratamientos y sus I.C de 95 %
alfa
0.05
grados de libertad
9
error cuadrtico medio 2
valor crtico t
2.262157
tables.factor.trat.A
tables.factor.trat.B
tables.factor.trat.C
tables.factor.trat.D
ni Medias
LI
LS
4
7.50 5.900413 9.099587
4
9.00 7.400413 10.599587
4 12.75 11.150413 14.349587
4 10.75 9.150413 12.349587
El test de hiptesis H 0 : 1 2 3 4 0 es rechazado con un valor p de 0.0029 a un nivel de significancia de 0.05, es

decir, los tiempos medios de ensamble no son iguales para todos los mtodos.
Para evaluar la eficiencia del diseo tenemos que la seudo prueba sobre los efectos de bloque (operador) tiene un F0 4.75 y un
valor P: P f 3 ,9 4.75 0.0298 , que nos indica el bloqueo por operario result til o eficiente para reducir el error experimental y
por tanto un ahorro en cuanto al nmero de rplicas necesarias para deteccin de diferencias entre los mtodos.
Comparemos ahora los tiempos medios de ensamble para los cuatro mtodos mediante el procedimiento de Tukey. SAS da la siguiente
salida:
COMPARACIONES TUKEY DE MEDIAS DE TRATAMIENTO

Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = tiempo ~ mtodo + operador)
$mtodo
diff
lwr
upr
p adj
B-A 1.50 -1.6217987 4.621799 0.4758801
C-A 5.25 2.1282013 8.371799 0.0024211
D-A 3.25 0.1282013 6.371799 0.0412298
C-B 3.75 0.6282013 6.871799 0.0195634
D-B 1.75 -1.3717987 4.871799 0.3548246
D-C -2.00 -5.1217987 1.121799 0.2566550
B-A
C-A
Como vemos Tukey define tres grupos de medias que se

traslapan: grupo 1: mtodos C y D, grupo 2: mtodos D y B y grupo
3: mtodos A y B. Hay un problema de potencia del procedimiento
debido a la gran dispersin en los datos en algunos operarios y
mtodos como veremos.
D-A
C-B
D-B
D-C
-4
-2
Differences in mean levels of mtodo
Residuales estandarizados vs. mtodo
Validemos ahora los supuestos de normalidad y de varianza

constante mediante grficos de residuales: La normalidad parece
un supuesto razonable para los errores en este experimento.
Sin embargo, hay problemas con el supuesto de varianza
constante.
Con los mtodos B y C la dispersin de los
residuales es mayor comparativamente a la dispersin en los
mtodos A y D. Con el mtodo A hay menos dispersin. A nivel
del operador 3 la dispersin de los residuales es mayor
aparentemente debido a una observacin que es subestimada.
A pesar de estos inconvenientes es posible llegar a una
conclusin: Elegir como mejor mtodo el A, dado que tiene
menor tiempo promedio observado y menor dispersin (esto
ltimo indica que los operadores con este mtodo son ms
consistentes) .
rstandard(diseo)
Shapiro-Wilk normality test

data: rstandard(diseo)
W = 0.973, p-value = 0.8844
-2
-1
1
0
-1
-2
rstandard(diseo)
Residuales estandarizados vs. valores ajustados
10
12
14
C
Mtodo
Residuales estandarizados vs. operador
Normal Q-Q Plot
1.0
2
0.5
Sample Quantiles
1
-1.5 -1.0 -0.5 0.0
1
0
-1
-2
rstandard(diseo)
1.5
2.0
fitted(diseo)
-2
Operador
-1
Theoretical Quantiles
Adicionalmente, se estimaron los efectos de cada mtodo de ensamble, y sus intervalos de confianza (cuyos niveles de confianza pueden
ser un poco diferentes a los esperados dados los problemas de varianza). Se deja al lector la interpretacin de estos resultados.
EFECTOS DE TRATAMIENTOS
Estimate Std. Error
metodo:efecto
metodo:efecto
metodo:efecto
metodo:efecto
mtodo
mtodo
mtodo
mtodo
A
B
C
D
-2.50
-1.00
2.75
0.75
t value
Pr(>|t|)
lower CI
upper CI
0.6123724 -4.082483 0.002747777 -3.8852827 -1.1147173

0.6123724 -1.632993 0.136904126 -2.3852827 0.3852827
0.6123724 4.490731 0.001508930 1.3647173 4.1352827
0.6123724 1.224745 0.251759476 -0.6352827 2.1352827
ANEXO 1: PROGRAMA R PARA COMPARACIN DE LOS MTODOS DE ENSAMBLE

CREANDO FUNCIN USUARIO mismediastratamientosDBCA()
mismediastratamientosDBCA=function(respuesta,factor.trat,bloque,nivel=95){
modeloanova=aov(respuesta~factor.trat+bloque)
MSE=anova(modeloanova)["Mean Sq"][3,]
df=anova(modeloanova)["Df"][3,]
b=unlist(model.tables(modeloanova,type = "means",cterms="factor.trat")["n"])
alfa=1-nivel/100
alfa.med=(1-(nivel/100))/2
t=qt(alfa.med,df=df,lower.tail=F)
medias.tratam=unlist(model.tables(modeloanova,type
"means",cterms="factor.trat")["tables"])[-1]
interval=cbind(ni=b,Medias=medias.tratam,LI=medias.tratamt*sqrt(MSE/ni),LS=medias.tratam+t*sqrt(MSE/ni))
cat("Tabla de medias de tratamientos y sus I.C de",nivel,"%","\n")
cat("alfa","
",alfa,"\n")
cat("grados de libertad
",df,"\n")
cat("error cuadrtico medio",MSE,"\n")
cat("valor crtico t
",t,"\n","\n")
interval
}
LEYENDO DATOS COMO APARECEN EN TABLA DADA
ensamble=data.frame(mtodo=factor(rep(c("A","B","C","D"),4)),
operador=factor(c(rep(1,4),rep(2,4),rep(3,4),rep(4,4))),tiempo=scan())
6 7 10 10
9 10 16 13
7 11 11 11
8 8 14 9
ensamble
attach(ensamble)
OBTENIENDO BOXPLOTS SEGN BLOQUES Y SEGN FACTOR
mediastrat=sapply(split(tiempo,mtodo),mean)
mediasbloque=sapply(split(tiempo,operador),mean)
nf=layout(cbind(c(1,1),c(2,2)))
plot(tiempo~mtodo)
lines(1:4,mediastrat,col=2,lty=2,type="b",pch=3)
plot(tiempo~operador)
lines(1:4,mediasbloque,col=2,lty=2,type="b",pch=3)
AJUSTANDO EL MODELO ANOVA Y OBTENCIN DE LA TABLA ANOVA
diseo=aov(tiempo~mtodo+operador)
anova(diseo)
OBTENIENDO EFECTOS DE TRATAMIENTOS, RESULTADOS PARA TEST DE SIGNIFICANCIA Y SUS I.C DEL 95%
library(gmodels)
library(multcomp)
efect.mtodoA=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoB=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoC=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoD=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
rbind(efect.mtodoA,efect.mtodoB,efect.mtodoC,efect.mtodoD)
A"=c(3/4,-1/4,-1/4,-1/4)),conf=0.95)
B"=c(-1/4,3/4,-1/4,-1/4)),conf=0.95)
C"=c(-1/4,-1/4,3/4,-1/4)),conf=0.95)
D"=c(-1/4,-1/4,-1/4,3/4)),conf=0.95)
OBTENIENDO LAS MEDIAS DE TRATAMIENTOS CON SUS I.C DEL 95%

mismediastratamientosDBCA(respuesta=tiempo,factor.trat=mtodo,bloque=operador)
INTERVALOS DE TUKEY PARA LAS DIFERENCIAS DE MEDIAS DEL FACTOR DE TRATAMIENTOS
TukeyHSD(diseo,"mtodo",conf.level=0.95)
GRFICOS DE INTERVALOS DE TUKEY
plot(TukeyHSD(diseo,"mtodo",conf.level = 0.95),cex.lab=0.8,las=1)
OBTENIENDO DE GRFICOS PARA VALIDACIN DE SUPUESTOS CON RESIDUOS ESTANDARIZADOS
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot(fitted(diseo),rstandard(diseo),ylim=c(-2.5,2.5),cex=2,
main="Residuales estandarizados vs. valores ajustados")
abline(h=c(-2,0,2),col=2)
plot(as.numeric(mtodo),rstandard(diseo),xlab="Mtodo",ylim=c(-2.5,2.5),cex=2,xaxt="n",
main="Residuales estandarizados vs. mtodo")
axis(1,at=1:4,labels=levels(mtodo))
plot(as.numeric(operador),rstandard(diseo),xlab="Operador",ylim=c(-2.5,2.5),cex=2,xaxt="n",
main="Residuales estandarizados vs. operador")
axis(1,at=1:4,labels=levels(operador))
qqnorm(rstandard(diseo),cex=2)
qqline(rstandard(diseo),col=2)
OBTENIENDO TEST DE NORMALIDAD SOBRE RESIDUALES ESTANDARIZADOS
shapiro.test(rstandard(diseo))
detach(ensamble)
PARTE II: EXPERIMENTOS FACTORIALES

Los experimentos factoriales son aquellos en los cuales el inters se centra en el estudio de los efectos de las combinaciones de dos o
ms factores sobre una variable respuesta. En la prctica cuando el nmero de factores a considerar es mayor que 3, se suelen utilizar
experimentos 2k (k factores con dos niveles cada uno), experimentos 3k (k factores con tres niveles cada uno), experimentos factoriales
fraccionados, etc.
En el curso se ver el caso de dos factores que denominaremos genricamente como A y B. El nmero de niveles del factor A lo
denotaremos por a y el nmero de niveles de B lo denotaremos por b. Adems el diseo ser completamente aleatorizado, es decir, las
unidades experimentales se considerarn homogneas respecto a las caractersticas individuales que pudieran afectar las respuestas a
los tratamientos aplicados.
Definicin: Llamaremos tratamiento a cada combinacin posible entre los niveles de los factores. As, para el caso de dos factores, se tendr un total
de ab posibles tratamientos. Por ejemplo, sea a=3 y b=2:
Niveles
Factor A
Niveles factor B
B1
B2
A1
A1B1
A1B2
A2
A2B1
A2B2
A3
A3B1
A3B2
Cada combinacin AiBj con i=1, 2, 3 y j=1, 2, define

un tratamiento, entonces hay 6 posibles tratamientos
correspondientes a las entradas en esta tabla.
Tipos de experimentos factoriales con dos factores:

1. De efectos fijos: Los a niveles del factor A como los b niveles del factor B son definidos a propsito por el investigador.
2. De efectos aleatorios: Los a niveles del factor A como los b niveles del factor B son elegidos aleatoriamente dentro de una
poblacin de posibles niveles, respectivamente.
3. De efectos mixtos: Uno de los dos factores es de efectos fijos en tanto que el otro es de efectos aleatorios. Dos posibles
modelos pueden postularse en este caso: modelo mixto restringido y modelo mixto no restringido.
En cualquiera de los anteriores casos se debe considerar el fenmeno conocido como interaccin de los factores, es decir, los modelos
deben iniciarse considerando la existencia de interaccin y luego a travs de la evidencia muestral, determinar si dicha interaccin es o no
significativa. Slo si en cada tratamiento se toman rplicas (n>1 observaciones por tratamiento), ser posible estimar y evaluar la
interaccin entre los factores.
MODELO FACTORIAL DOS FACTORES EFECTOS FIJOS DISEO DCA

Consideraremos que a cada tratamiento se asignan en forma completamente aleatorizada, n unidades experimentales obtenindose por
tanto de cada tratamiento n observaciones de la variable respuesta. En total habrn N=abn observaciones de la variable respuesta. Un
tabla de entrada de datos del experimento ser como se presenta en la figura 2, en donde se postula el modelo con interaccin, para la
respuesta k-sima en el tratamiento AiBj (nivel i del factor A combinado con nivel j del factor B), que aparece a continuacin en la figura 1:
1.
Modelo con interaccin:
Error Aleatorio o experimental
Yijk i j ij E ijk
Efecto fijo de la interaccin de los
factores A y B en sus niveles i y j,
respectivamente,
sobre
la
respuesta promedio global.
Media global de la respuesta
Efecto fijo del i-simo nivel del

factor A sobre la respuesta
promedio global.
Efecto fijo del j-simo niveles del

factor B sobre la respuesta
promedio global.
Figura 1
10
Y 122
...
Y 1j2
...
Y 1b2
Y 113
Y 123
...
Y 1j3
...
Y 1b3
...
...
...
...
...
Y 11k
Y 12k
...
Y 1jk
...
Y 1bk
...
...
...
Y 1jn
...
Y 2bn
...
Y 2b1
...
Y 2j2
...
Y 2b2
Y 223
...
Y 2j3
...
Y 2b3
...
Y 2jk
...
Y 2bk
...
...
Y 21n
Y 22n
...
Y 2jn
...
Y 2bn
Y i22
...
Y ij2
...
Y ib2
Y i13
Y i23
...
Y ij3
...
Y ib3
Y i2k
...
Y ijk
...
Y ibk
...
...
Y i1n
Y i2n
...
Y ijn
...
Y ibn
Y aj1
...
Y ab1
Y a12
Y a22
...
Y aj2
...
Y ab2
Y a13
Y a23
...
Y aj3
...
Y ab3
...
...
...
...
Y a1k
Y a2k
...
Y ajk
...
Y abk
...
...
...
Y a21
...
Y a11
...
...
...
...
...
...
Y i1k
...
...
...
Y i12
...
Y ib1
...
...
...
Y ij1
...
...
...
Y i21
...
Y i11
...
...
...
...
...
Y 22k
...
...
Y 21k
...
...
...
Y 222
Y 213
...
Y 212
...
...
Y 2j1
...
Y 221
...
Y 211
...
...
...
Y 12n
...
...
Y 11n
...
...
Y 112
...
Bb
Y 1b1
...
Aa
...
...
...
...
Ai
Niveles factor B
...
Bj
Y 1j1
...
...
Niveles factor A
...
A2
B2
Y 121
...
A1
B1
Y 111
...
Y a1n
Y a2n
...
Y ajn
...
Y abn
Eijk N 0,
iid
1.2.
Respuesta k-sima en el tratamiento AiBj:
Yijk i j ij E ijk
Figura 2
Supuestos y restricciones:
1.1.
para todo i, j, k.
i 1
j 1

i 1
ij

j 1
ij
Parmetros del modelo: Efectos de tratamientos: ij i j ij que representa el efecto del tratamiento AiBj
a
sobre la respuesta promedio global. Note que

i 1 j 1
ij
0.
Medias de tratamientos: ij ij , de donde ij ij .
11
Media del nivel i del factor A: i i , de donde i i . Note que i
1 b
b j 1 ij
Media del nivel j del factor B: j j , de donde j j . Note que j

Media global: Puede ser expresada por cualquiera de las siguientes formas:
Efectos de interaccin: ij ij i j
1 a
a i 1 ij
1 a b
1 a
1 b
ab i 1 j 1 ij
b j 1 j
a i 1 i
1.3.
Significado de la interaccin: El que los factores A y B interacten significa que las diferencias entre las medias de
tratamientos segn los niveles de un factor varan (bien sea en dimensin y/o signo) de nivel a nivel del otro factor. Considere por ejemplo
un estudio simple de dos factores en el cual los efectos de sexo (factor A) y edad (factor B) sobre el aprendizaje de una tarea son de
inters, siendo la variable respuesta el tiempo de aprendizaje en minutos. Los datos en las siguientes tablas corresponden a medias
poblacionales por tratamientos y niveles de cada factor ( ij en las celdas, i en las filas y j en las columnas):
gnero
hombre
mujer
media col
medio
13
9
11
edad
viejo
18
14
16
media fila
14
10
12
joven
9
7
8
medio
12
10
11
edad
viejo
14
16
15
media fila
11.67
11.00
11.33
Tabla 3
gnero
hombre
mujer
media col
joven
9
9
9
medio
12
10
11
edad
viejo
18
14
16
joven
9.75
8.25
9.00
medio
12
10
11
edad
viejo
17.25
14.75
16.00
Tabla 2
joven
11
7
9
Tabla 1
gnero
hombre
mujer
media col
Tabla 4
gnero
hombre
mujer
media col
media fila
13
11
12
media fila
13
11
12
Grficas de medias de tratamientos
12
22
Grfica para tabla 1
Grfica para tabla 2
Grfica para tabla 3
Grfica para tabla 4
12
Los grficos anteriores son conocidos como grficos de perfiles de medias en los cuales se presentan las medias de tratamiento en
cada uno de los niveles de uno de los factores fijando los niveles del otro factor ubicado en el eje horizontal. En el ejemplo se han
graficado las medias de tratamiento segn Gnero en cada nivel de edad, as las medias 1 j (con Gnero=hombre) son unidas por la
lnea continua en tanto que las medias 2 j (con Gnero=mujer) son unidas por la lnea punteada.
Sea i=1 para gnero hombre, i=2 para Gnero=mujer, j=1 para edad =joven, j=2 para edad=medio y j=3 para edad=viejo. La tabla 1 y su
grfica correspondiente, presentan el caso en el cual los factores no interactan, pues note que las diferencias en las medias ij de
gnero (hombre mujer, es decir 1 j 2 j ) en cada uno de los niveles de edad, es igual a 4 (tambin podra analizarse las diferencias
en las medias ij de edad en cada nivel de gnero y comprobarse que i1 i 2 2 , i1 i 3 7 , y i 2 i 3 5 para i=1,
2). Note adems que la edad tiene el efecto de incrementar los tiempos promedios de aprendizaje de la tarea para cada gnero:
Tabla 1
Edad
Gnero
joven medio viejo
Hombre - mujer 4
4
4
Lo anterior se refleja en el grfico de medias a travs de perfiles de medias paralelos.

En las tablas 2 a 4 se presentan casos de interaccin, y en sus grficas respectivas los perfiles de medias son no paralelos. Podemos
ver que en estos casos, las diferencias en las medias ij de gnero (hombre mujer, es decir 1 j 2 j ) en cada uno de los niveles de
edad no son iguales:
Tabla 2
Edad
Gnero
joven medio viejo
Hombre - mujer 0
2
4
En este caso las diferencias hombre-mujer entre las medias del tiempo de aprendizaje de la tarea aumentan de manera positiva a medida
que el rango de edad es mayor: De acuerdo al ejemplo, cuando los hombres y mujeres son jvenes tienen el mismo tiempo promedio de
aprendizaje en la tarea de inters, pero a medida que envejecen, los tiempos promedios aumentan y a los hombres les toma mayor tiempo
promedio que a las mujeres para aprender y dicha diferencia se amplia con la edad.
Tabla 3
Edad
Gnero
joven medio viejo
Hombre - mujer 2
2
-2
En este caso, hasta una edad media, los hombres en promedio tardan 2 minutos ms que las mujeres en aprender la tarea de inters,
pero a las mujeres viejas les toma en promedio 2 minutos ms que a los hombres viejos en aprender tal tarea; los tiempos promedios para
cada gnero aumentan con la edad. Observe que la interaccin en este caso tuvo el efecto de invertir la direccin de las diferencias entre
las medias de tratamiento.
Tabla 4
Edad
Gnero
joven medio viejo
Hombre - mujer 1.5
2
2.5
En este caso, siempre existe una diferencia positiva en las medias de aprendizaje de los hombres respecto al de las mujeres en cada nivel
de edad, pero adems dichas diferencias aumentan levemente con la edad, a su vez que para cada gnero, los tiempos medios estn
aumentando con la edad. Note que la interaccin se puede catalogar como leve dado que los perfiles de media no son exageradamente
no paralelos.
Diagnstico de la presencia de interaccin: Muestralmente podemos establecer la presencia de interaccin mediante una de las
siguientes formas equivalentes:
Si se observa que los grficos de perfiles de medias muestrales de tratamientos ( Yij ) no son paralelos.
1.4.
Si la diferencia entre las respuestas medias para cualesquiera dos niveles del factor A no es la misma para todos los niveles de B.
Si la diferencia entre las respuestas medias para cualesquiera dos niveles del factor B no es la misma para todos los niveles de A.
Si las medias de tratamientos no son todas iguales a la suma de la media global ms los respectivos efectos principales de los
factores A y B
Encubrimiento o enmascaramiento de efectos principales: Los efectos i y j constituyen los efectos principales del
modelo. Cuando los efectos de interaccin son significativos, pueden encubrir o enmascarar a los efectos principales de uno o de
ambos factores, esto significa que en las pruebas F asociadas a la significancia simultnea de los efectos del respectivo factor, no se
rechaza la hiptesis nula, es decir, se concluye que el factor A, o el B o ambos, no son significativos, cuando ya se ha probado que estos
interactan significativamente.
Pero tenga en cuenta que, en presencia de interaccin significativa, no se puede concluir que alguno o ambos factores son no
significativos a pesar de que el respectivo test de significancia individual para cada factor arroje como resultado la no significancia, porque
tal evento es consecuencia de un encubrimiento debido a la interaccin. Este fenmeno suele suceder en casos donde la interaccin se
13
manifiesta invirtiendo en signo las diferencias en las medias de tratamientos de un factor en cada nivel del otro factor (los perfiles de
medias se cruzan). Como previamente se dijo, para poder aislar o separar correctamente el error experimental del efecto de interaccin es
necesario una estimacin independiente del primero, lo cual se logra mediante el uso de rplicas en cada tratamiento. Para mayor
eficiencia se sugieren diseos balanceados.
1.6
Anlisis de Varianza
Para el ANOVA tendremos en cuenta los siguientes estadsticos muestrales:
Parmetro
Estimador
Y
media global
Observacin sobre el estimador

a
media del nivel i del

factor A i
media del nivel j del

factor B j
1
Y
abn i 1 j 1 k 1 ijk
o bien Y
media del tratamiento

AiBj ij
1 a b
Y
ab i 1 j 1 ij
1 a
Y
a i 1 i
1 b
Y j
b j 1
Es decir es el promedio de todas las abn observaciones

Es decir el promedio de las medias muestrales de los ab tratamientos
o bien Y
Es decir es el promedio de las medias muestrales de los a niveles del factor A,
o bien Y
Es decir es el promedio de las medias muestrales de los b niveles del factor B.
1 n
Y
n k 1 ijk
1 b n
Y
bn j 1 k 1 ijk
Yij
Es decir, es el promedio de las observaciones en la celda i,j
Yi
Es decir, es el promedio de las observaciones en la fila i.
o bien Yi
1 b
Y
b j 1 ij
1 a n
Y
an i 1 k 1 ijk
1 a
o bien Y j Yij
a i 1
Y j
Es decir, es el promedio de las medias de las b celdas en la fila i

Es decir, es la media de las observaciones en la columna j
Es decir, es el promedio de las medias de las a celdas en la columna j
El ANOVA descompone la variabilidad total de la siguiente manera:
SST SSA SSB SS AB SSE

Suma de cuadrados
totales, o variabilidad total
g.l=abn-1
Suma de cuadrados
debida al error.
g.l=ab(n-1)
Suma de cuadrados debido a

la interaccin, o variabilidad
debida a la interaccin,
g.l=(a-1)(b-1)
Suma de cuadrados debida al
factor B, o variabilidad debida
al factor B,
g.l=b-1
Suma de cuadrados debida

al factor A, o variabilidad
debida al factor A.
g.l=a-1
En donde:
14
ANOVA
Fuente de
variacin
Grados de
libertad
Suma de
cuadrados
Cuadrados
Medios
SSA
SSA
MSA
a 1
Valores esperados
F0
a 1
Factor A
E MSA bn
2
i 1
2
i
MSA
MSE
a 1
b
b 1
Factor B
SSB
MSB
b 1
SSB
E MSB an
2
MS AB
Interaccin
AB
a 1 b 1
SS(AB)
Error
ab n 1
SSE
Total
abn 1
SST
j 1
2
j
MSB
MSE
b 1
a
i 1 j 1
SS AB
E MS AB 2 n
a 1 b 1
a 1 b 1
MSE
SSE
ab n 1
ij
MS AB
MSE
E MSE 2
Frmulas sumas de cuadrados

a
SST Yijk Y
i 1 j 1 k 1
a
,
a
SSA Yi Y bn Yi Y , mide la variacin entre filas

2
i 1 j 1 k 1
a
i 1
SSB Y j Y
i 1 j 1 k 1
a
an Y j Y
j 1
SS AB Yij Yi Y j Y
i 1 j 1 k 1
SSE Yijk Y ij
i 1 j 1 k 1
, mide la variacin entre columnas

b
n Yij Yi Y j Y
i 1 j 1
, mide la variacin entre celdas
, mide la variacin dentro de celdas.
Hiptesis a probar: En su orden, deben realizarse los siguientes tests, con como nivel de significancia:
Hiptesis
H 0 : 11 12 ab 0
1. Significancia de la interaccin AB
Estadstico de la prueba
H1 : algn ij 0, i 1, 2, a j 1, 2, b
F3
MS AB
F3 f , a 1 b 1 ,ab n1 o si
bajo H 0
MSE
Rechazar H0 si
f a 1 b 1 ,ab n 1
VP P f a 1 b 1 ,ab n 1 F3
Si la interaccin es significativa (es decir, se rechaza H0), proceder con precaucin en la interpretacin de los resultados de los tests de
significancia sobre los efectos principales:
Hiptesis
H 0 : 1 2 a 0
H1 : algn i 0 i 1, 2, , a
2. Significancia de efectos principales de A

MSA
F1
MSE
F1 f ,a 1,ab n1 o si
bajo H 0
Rechazar H0 si
f a 1,ab n 1
VP P f a 1,ab n1 F1
Si no se rechaza H0 bajo interaccin significativa, hay encubrimiento de los efectos principales de este factor por parte de la interaccin.
15
3. Significancia de efectos principales de B

Hiptesis
H 0 : 1 2 b 0
H1 : algn j 0 j 1, 2, , b
MSB
F2
MSE
F2 f ,b 1,ab n 1 o si
bajo H 0
Rechazar H0 si
f b 1,ab n 1
VP P f b 1,ab n1 F2
Si no se rechaza H0 bajo interaccin significativa, hay encubrimiento de los efectos principales de este factor por parte de la interaccin.
Tener presente que: La estimacin de un efecto principal es una diferencia promediada o contraste entre todas las medias de los niveles
del factor correspondiente, por ello al hacer inferencias sobre tales medias con base en las estimaciones de los efectos principales, en
presencia de interaccin, es realizar una generalizacin sobre los niveles del factor, y por tanto dichas inferencias estarn equivocadas.
Una comparacin generalizada entre las medias de un factor tiene sentido si las diferencias existentes entre dichas medias se sostienen
de nivel a nivel del otro factor, es decir, cuando no hay interaccin. De lo contrario, lo mejor es realizar comparaciones y contrastes de
medias de tratamientos ij que ayuden a interpretar los efectos significativos de la interaccin. As ante interaccin, sera ms
conveniente comparar las medias de dicho factor pero en cada uno de los niveles del otro factor. Por ejemplo, suponga un experimento
con a=3 y b=2 en el cual los datos evidencian interaccin significativa pero aparentemente el factor A no es significativo; en este caso
sera conveniente realizar pruebas como las siguientes:
a) Comparar medias de A en el nivel 1 de B
Hiptesis
H 0 : 11 21 31
H1 : algn par i1 i1 con i i
a
FA|B1
SS A|B1 / a 1
MSE
FA|B1 > f ,a 1,ab n1 o si
bajo H 0
Rechazar H0 si
f a 1,ab n 1
P f a 1,ab n 1 FA|B1 <
SS A|B1 Yi1 Y1 es la suma de cuadrados debida a las celdas A1B1, A2B1 y A3B1
2
i 1 k 1
b) Comparar medias de A en el nivel 2 de B

Hiptesis
H 0 : 12 22 32
H1 : algn par i 2 i 2 con i i
a
FA|B2
SS A|B2 / a 1
MSE
FA|B2 > f ,a 1,ab n1 o si
bajo H 0
Rechazar H0 si
f a 1,ab n 1
P f a 1,ab n 1 FA|B2 <
SS A|B2 Yi 2 Y2 es la suma de cuadrados debida a las celdas A1B2, A2B2 y A3B2

2
i 1 k 1
Tambin, se podran realizar las comparaciones de las medias del factor B en cada nivel de A. Siguiendo el ejemplo con a=3 y b=2, los
tests a realizar seran:
c) Comparar medias de B en el nivel 1 de A
Hiptesis
Rechazar H0 si
FB| A > f ,b 1,ab n1 o si
H :
bajo H
0
11
12
FB| A1
H1 : 11 12
b
SS B| A1 Y1 j Y1
j 1 k 1
SS B| A1 / b 1
MSE
f b 1,ab n1
d) Comparar medias de B en el nivel 2 de A

H 0 : 21 22
FB| A2
H1 : 21 22
b
j 1 k 1
P f b 1,ab n 1 FB| A1 <
es la suma de cuadrados debida a las celdas A1B1, A1B2.
Hiptesis
SS B| A2 Y2 j Y2
SS B| A2 / b 1
MSE
FB| A2 > f ,b 1,ab n1 o si
bajo H 0
f b 1,ab n1
16
Rechazar H0 si
P f b 1,ab n1 FB| A2 <
e) Comparar medias de B en el nivel 3 de A

Hiptesis
H 0 : 31 32
FB| A3
H1 : 31 32
b
SS B| A3 Y3 j Y3
j 1 k 1
SS B| A3 / b 1
Rechazar H0 si
FB| A3 > f ,b 1,ab n 1 o si
bajo H 0
MSE
f b 1,ab n 1
P f b 1,ab n 1 FB| A3 <
NOTA: Ante interaccin no se recomienda realizar comparaciones de Tukey sobre las medias de cada factor. Tukey podra aplicarse ms
bien a las medias de un factor en cada nivel del otro. Por ejemplo para comparar todas las medias de A en el nivel Bj, es decir las medias
1 j , 2 j , , aj , la mnima diferencia significativa a usar est dada por
MDS A|B j q , a , ab n 1
MSE
,
n
en tanto que para comparar todas las medias de B en el nivel Ai, o sea las medias i1 , i 2 , , ib , la mnima diferencia significativa
a usar est dada por
MDS B| Ai q , b, ab n 1
MSE
.
n
O bien, tambin se puede comparar cualquier subgrupo de medias de tratamientos usando como mnima diferencia significativa a
MDS ij ,m q , m , ab n 1
MSE
,
n
donde m es el nmero de medias de tratamientos en el subconjunto de inters que se desean comparar.
1.7
Estimaciones
Bajo interaccin, Interesa estimar medias de tratamientos y contrastes de medias de tratamientos.

MEDIA TRATAMIENTO (I,J): ij
Estimador
Error estndar
SYij
Yij
I.C del (1-)100%
MSE
n
Contraste de medias de tratamientos: W
ij Yij t / 2 ,ab n1 SY
ij
C
i 1 j 1
Estimador
a
W C ijYij con
i 1 j 1
1.8
ij
ij
Error estndar
a
C
i 1 j 1
ij
SW
MSE a b 2
C
n i 1 j 1 ij
I.C del (1-)100%
C Y
i 1 j 1
ij
ij
t / 2 ,ab n 1 SW
Validacin de supuestos sobre el trmino de error
Debemos calcular los residuales de este modelo, los cuales corresponden a E ijk Yijk Yij , tenga en cuenta que los valores
predichos para cada respuesta corresponden a Yijk Yij Con estos datos procedemos a realizar lo siguiente:
Los supuestos sobre los errores son chequeados mediante grficos de residuales, como se resume a continuacin:
17
2.
Para chequear:
Independencia
Graficar residuales contra:

Orden de las observaciones (segn espacio o tiempo)
Varianza igual y outliers
Valores predichos, niveles del factor de tratamientos,

niveles del factor A y vs. niveles del factor B
Normalidad
Scores normales o test Shapiro Wilk
Modelo sin interaccin
En caso de que los datos obtenidos presenten evidencia respecto a la no significancia del trmino de interaccin, el modelo factorial debe
replantearse de la siguiente manera: Yijk i j E ijk
2.1
Supuestos y restricciones
Eijk N 0, 2 para todo i, j, k.
iid
i 1
j 1
Obviamente en el ANOVA la suma de cuadrados debida al trmino de error, es diferente en un modelo con interaccin respecto a un
modelo sin interaccin.
2.2
Anova
La descomposicin de la variabilidad total es

Fuente de
variacin
Grados de
libertad
SST SSA SSB SSE , luego:

ANOVA
Cuadrados
Medios
Suma de
cuadrados
Valores esperados
a 1
Factor A
SSA
MSA
a 1
SSA
E MSA bn
2
i 1
2
i
a 1
MSA
MSE
b 1
Factor B
SSB
Error
SSB
MSB
b 1
MSE
SSE
Total
abn 1
Donde abn a b 1
SSE
E MSB an
2
E MSE 2
SST
Frmulas sumas de cuadrados
SST Yijk Y
i 1 j 1 k 1
a
,
a
SSA Yi Y bn Yi Y , mide la variacin entre filas

2
i 1 j 1 k 1
a
i 1
SSB Y j Y
i 1 j 1 k 1
a
an Y j Y
j 1
SSE Yijk Yi Y j Y
i 1 j 1 k 1
, mide la variacin entre columnas
, mide la variacin dentro y entre celdas.
18
j 1
2
j
b 1
MSB
MSE
2.3
Hiptesis a probar: Con como nivel de significancia:

1. Significancia del factor A
Hiptesis
H 0 : 1 2 a 0
F1
H1 : algn i 0 i 1, 2, , a
MSA
MSE
Rechazar H0 si
F1 f ,a 1, o si
bajo H 0
VP P f a 1, F1
f a 1,
2. Significancia del factor B

Hiptesis
H 0 : 1 2 b 0
F2
H1 : algn j 0 j 1, 2, , b
MSB
MSE
Rechazar H0 si
F2 f ,b 1, o si
bajo H 0
VP P f b 1, F2
f b 1,
Donde abn a b 1
NOTA: Como no hay interaccin, pueden realizarse los testes de Tukey sobre las medias de cada factor, teniendo en cuenta que para el
caso del factor A la mnima diferencia significativa est dada por
MSE
,
nb
MDS A q , a , abn a b 1
donde q , a , abn a b 1 es el valor crtico del rango estudentizado a usar. Para el caso del factor B la mnima diferencia
significativa est dada por
MDS B q , b, abn a b 1
donde q , b, abn a b 1 es el valor crtico del rango estudentizado a usar.
MSE
,
na
Tambin pueden compararse medias de tratamiento como en el caso con interaccin, slo que debe usarse un rango crtico
estudentizado con abn a b 1 grados de libertad.
2.4
Estimaciones
Interesa estimar medias y efectos principales. Los estimadores para las medias de inters se calculan de la misma manera como se
indic en el modelo con interaccin, a continuacin se dan sus errores estndar e intervalos de confianza junto para los efectos
estimados:
Media Error estndar
Efectos
Error estndar
I.C del (1-)100%
I.C del (1-)100%
muestral
estimados
SY
MSE
abn
Y t / 2 , SY
Yi
SYi
MSE
bn
i Yi t / 2, SY
Y j
SY j
MSE
an
j Y j t / 2, SY
i Yi Y
S i
1
1
MSE
bn
abn
i i t / 2, S
j Y j Y
1
1
MSE
an
abn
i i t / 2 , S
MSE
ij Yij t / 2 , SYij
n
Donde abn a b 1 , los grados de libertad del error en el modelo sin interaccin
Yij
2.5
SYij
Validacin de supuestos sobre el trmino de error
Debemos calcular los residuales de este modelo, los cuales corresponden a E ijk Yijk Yi Y j Y , tenga en cuenta que los
valores predichos para cada respuesta corresponden a Yijk Yi Y j Y Con estos datos procedemos a realizar los mismos
anlisis sobre los residuales especificados en el modelo con interaccin.
19
Problema sobre un experimento factorial dos factores de efectos fijos en un DCA

El personal de un centro de servicio electrnico incluye tres tcnicos especializados en reparar las tres marcas ms usadas de unidades
de disquetes para micro computadores. Se desea estudiar los efectos del factor TECNICO y del factor MARCA de la unidad de disquete,
sobre el tiempo de servicio dado en minutos. A cada tcnico se le asignaron aleatoriamente cinco trabajos de cada una de las marcas y se
registro el nmero de minutos requerido para completar cada trabajo.
TECNICO
1
62
48
63
57
69
51
57
45
50
39
59
65
55
52
70
MARCA
2
57
45
39
54
44
61
58
70
66
51
58
63
70
53
60
Captulo 19. Problema 16. Pgina 842. (Neter).
1.
3
59
53
67
66
47
55
58
50
69
49
47
56
51
44
50
Las grficas y tablas siguientes representan el anlisis de varianza realizado.

1. Defina claramente el modelo de anlisis de varianza requerido para estudiar
este problema.
2. Haga un anlisis descriptivo de los datos.
3. Determine si la interaccin es significativa. Escriba la expresin empleada para
calcular el valor p. Emplee un nivel de significancia de 0.05 en todas las
pruebas.
4. Discuta la significancia de los efectos principales factores TECNICO y MARCA.
En el caso de indicios de encubrimiento realice pruebas de hiptesis para
confirmarlo y haga las recomendaciones.
5. Construya la tabla de medias por tratamiento.
6. Plantee un contraste para probar si el tiempo promedio empleado para reparar
un micro de la marca 2 y uno de la marca 3 es el mismo para el tcnico 2 y 3.
7. Compare ahora las medias del factor TCNICO en cada nivel del factor
MARCA, y viceversa. Permiten estos resultados tomar decisiones acerca del
problema en cuestin? Cules son las recomendaciones que usted hara si
quiere disminuir el tiempo de servicio del centro de servicios electrnicos.
8. Valide supuestos sobre los errores del modelo (varianza cte. y normalidad)
MODELO: El modelo para el anlisis de varianza corresponde entonces a:
Yijk i j ij ijk
donde tomando como factor A: TECNICO y B: MARCA, con niveles a=3 y b=3 respectivamente y n=5,
Yijk es el tiempo de reparacin en la k-sima unidad de la marca j con tcnico i
es el promedio global del tiempo de reparacin de una unidad

i es el efecto del tcnico i sobre el promedio global del tiempo de reparacin de una unidad
j es el efecto de la marca j sobre el promedio global del tiempo de reparacin de una unidad
ij es el efecto de la interaccin del tcnico i con la marca j sobre el promedio global del tiempo de reparacin de una unidad
ijk
ijk ~ N 0 , 2
iid
es el error aleatorio en la k-sima rplica del tratamiento ij. Supuestos

3
Restricciones para estimacin por mnimos cuadrados:
ij ij 0
ANLISIS DESCRIPTIVO: En primera instancia debemos analizar el grfico de interaccin presentado en la figura 3.
En sta se observa que los perfiles de medias de las marcas no son paralelos, lo cual implica que posiblemente la interaccin entre
tcnicos y marcas es significativa. A nivel del tcnico 1 se observa que su menor tiempo promedio corresponde a la reparacin de
unidades marca 2 y tarda ms con las otras dos marcas; el tiempo promedio de este tcnico con las marcas 2 y 3 es aproximadamente el
mismo. A nivel del tcnico 2 los tiempos promedios de reparacin son distintos para las tres marcas, y el menor tiempo promedio lo
alcanza con la marca 1, en tanto que su mayor tiempo promedio fue con la marca 2. El tcnico 3 present el menor tiempo promedio con
la marca 3, en tanto que con las marcas 1 y 2 tard ms y para estos dos casos los tiempos promedios observados resultaron
aproximadamente iguales. Tambin se observa que los tiempos promedio para la marca 2 con los tcnicos 2 y 3 son muy similares; y los
tiempos promedio para la marca 1 con los tcnicos 1 y 3 son tambin similares entre s. Pero el hecho ms importante a destacar es que
2.
20
cada tcnico es especialista en una marca y que para cada marca slo un tcnico alcanza el mejor (es decir el menor) tiempo promedio.
Si el objetivo del estudio es buscar mejorar el tiempo promedio de reparacin, uno estara tentado a recomendar que los trabajos de
reparacin de unidades de la marca 1 sean asignados al tcnico 2, los de la marca 2 al tcnico 1 y los de la marca 3 al tcnico 3. Sin
embargo, implementar tal medida hara al sistema ineficiente, es como tener una cola en espera de servicio para cada servidor, lo cual
en la teora de colas, no es la mejor disposicin. La administracin del centro de servicio debe ante esta situacin, implementar medidas
correctivas para lograr que todos los tres tcnicos sean igualmente efectivos con cualquiera de las marcas.
Por otra parte, las figuras 1 y 2 muestran que prcticamente los tiempos promedios de reparacin no difieren ni por tcnico ni por marca,
es decir, mirar aisladamente estas dos figuras nos llevara a concluir errneamente que ninguno de los dos factores es significativo!!!. Si
en realidad hay interaccin significativa, entonces lo que vemos en las figuras 1 y 2, es un enmascaramiento de los efectos principales de
cada factor, por parte de la interaccin. Adicionalmente en las figuras 1 y 2 vemos que segn los altos de las cajas, la dispersin de los
tiempos de reparacin puede concebirse aproximadamente constante de nivel a nivel de cada factor.
FIG. 1
FIG. 2
FIG. 3
RESUMEN DEL EXPERIMENTO Y ANOVA

Analysis of Variance Table
Response: tiempo
Df Sum Sq Mean Sq F value
Pr(>F)
tcnico
2
24.58 12.289 0.2363 0.7907788
marca
2
28.31 14.156 0.2722 0.7632826
tcnico:marca 4 1215.29 303.822 5.8415 0.0009941 ***
Residuals
36 1872.40 52.011
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
3.
TEST DE HIPTESIS SOBRE LA INTERACCIN: Con base en la anterior salida SAS, se procede a realizar el
test de hiptesis siguiente:
H 0 : 11 12 33 0 interaccin tcnico marca no es significativa
H1 : algn ij 0 , i 1, 2 , 3 y j 1, 2 , 3 interaccin tcnico marca es significativa

H0
El estadstico de prueba es F0 MS AB / MSE 5.84, F0 ~ f 4 ,36 , y VP P f 4 ,36 5.84 0.0010

Se concluye con una significancia de 0.05 que s hay interaccin significativa entre los factores TCNICO y MARCA, por lo tanto los
efectos de cada factor dependen del otro. Como consecuencia de esto es necesario interpretar con precaucin los resultados de los tests
21
sobre la significancia de los efectos principales de cada factor: De hecho, si la interaccin es significativa, entonces los dos factores son
significativos a travs de la interaccin!!!.
4.
TEST DE HIPTESIS SOBRE LOS EFECTOS PRINCIPALES DE CADA FACTOR: Con base en la
anterior salida R, se procede a realizar los siguientes test de hiptesis:

Sobre la significancia de los efectos principales del factor TCNICO:
H 0 : 1 2 3 0 efectos principales del factor tcnico no son significativos

H1 : algn i 0 , i 1, 2 , 3
algunos efectos principales del tcnico
son significativos
o bien, en trminos de las medias de este factor:
Las medias de los tiempos de reparacin segn el factor tcnico

H 0 : 1 2 =3
no difieren significativamente
Al menos dos de las medias de los tiempos de reparacin segn el factor tcnico
H1 : i j
difieren significativamente
H0
En cualquier caso el estadstico de prueba corresponde a F0 MSA / MSE 0.24, F0 ~ f 2 ,36 y
VP P f 2 ,36 0.24 0.7908
Se concluye que con una significancia de 0.05,ante interaccin significativa, los efectos principales del factor TCNICO son
enmascarados por la interaccin y por lo tanto no pueden ser medidos sus efectos principales!!!. Esto quiere decir que no tiene sentido
estimar ni efectos, ni medias para los niveles de TCNICO y tampoco tiene sentido construir I.C, o hacer comparaciones de Tukey o
contrastes con las medias de este factor.
Sobre la significancia de los efectos principales del factor MARCA:
H 0 : 1 2 3 0 efectos principales del factor marca no son significativos

H1 : algn j 0 , j 1, 2 , 3 algunos efectos principales del factor marca son significativos
o bien, en trminos de las medias de este factor:
Las medias de los tiempos de reparacin segn el factor marca

H 0 : 1 2= 3
no difieren significativamente
Al menos dos de las medias de los tiempos de reparacin segn el factor

H1 : algn par i j
marca difieren significativamente
H0
En cualquier caso el estadstico de prueba corresponde a F0 MSB / MSE 0.27 , F0 ~ f 2 ,36 y
VP P f 2 ,36 0.27 0.7633
Se concluye que con una significancia de 0.05, ante interaccin significativa, los efectos principales del factor MARCA son enmascarados
por la interaccin y por lo tanto no pueden ser medidos sus efectos principales!!!. Esto quiere decir que no tiene sentido estimar ni
efectos, ni medias para los niveles de MARCA y tampoco tiene sentido construir I.C, o hacer comparaciones de Tukey o contrastes con
las medias de este factor. Lo ms recomendable es realizar contrastes o comparaciones de medias de tratamientos ij o bien comparar
medias de un factor en cada nivel del otro factor.
22
5.
Medias de tratamientos tcnico*marca e I.C. del 95%:

La siguiente tabla presenta las medias estimadas yij de cada tratamiento ij, as como los intervalos de confianza que corresponden a
ij yij t0.025 ,ab n 1
MSE
n
Tabla de medias de tratamientos y sus I.C de 95 %

Niveles Factor A 1 2 3
Niveles Factor B 1 2 3
alfa
0.05
grados de libertad
36
error cuadrtico medio 52.01111
valor crtico t
2.028094
1.1
2.1
3.1
1.2
2.2
3.2
1.3
2.3
3.3
n MediasA.B
LI
LS
5
59.8 53.25889 66.34111
5
48.4 41.85889 54.94111
5
60.2 53.65889 66.74111
5
47.8 41.25889 54.34111
5
61.2 54.65889 67.74111
5
60.8 54.25889 67.34111
5
58.4 51.85889 64.94111
5
56.2 49.65889 62.74111
5
49.6 43.05889 56.14111
En esta tabla puede observarse la similaridad en las estimaciones e I.C para las medias de los tratamientos:
1,1 ,1,3 , 2, 2 , 3,1 , 3, 2 y 1, 2 , 2,1 , 3,3 , lo cual puede verificarse en la figura 3. Podra entonces realizarse
contrastes de medias para verificar por ejemplo si 11 13 22 31 32 y otro para determinar si 12 21 33 o un

procedimiento de Tukey sobre las ab 9 medias de tratamientos, para lo cual se puede construir los I.C de Tukey del 95%, as:
ij
kl
ij
ykl q0.05 ab ,ab n 1
MSE
,
n
y verificar si las medias de tratamientos indicadas resultan iguales, como se muestra en la siguiente salida R. Sin embargo, note que en
este caso no se obtienen diferencias significativas entre tratamientos, no porque no existan tales diferencias, sino porque se pierde
potencia en este procedimiento con un nmero tan grande de comparaciones. Aqu las medias de tratamiento 11 , 12 , 13 , 21 , 22 ,
23 , 31 , 32 , 33 son etiquetadas, respectivamente, como i : j , as, por ejemplo, en la comparacin 2:1 1:1 se hace referencia a
la diferencia de las medias 21 y 11 :
Tukey multiple comparisons of means
Fit: aov(formula = tiempo ~ tcnico * marca)
$`tcnico:marca`
diff
lwr
2:1-1:1 -11.4 -26.43865
3:1-1:1
0.4 -14.63865
1:2-1:1 -12.0 -27.03865
2:2-1:1
1.4 -13.63865
3:2-1:1
1.0 -14.03865
1:3-1:1 -1.4 -16.43865
2:3-1:1 -3.6 -18.63865
3:3-1:1 -10.2 -25.23865
3:1-2:1 11.8 -3.23865
upr
3.63865
15.43865
3.03865
16.43865
16.03865
13.63865
11.43865
4.83865
26.83865
p adj
0.2658953
1.0000000
0.2095773
0.9999970
0.9999998
0.9999970
0.9965056
0.4054029
0.2273106
23

1:2-2:1
2:2-2:1
3:2-2:1
1:3-2:1
2:3-2:1
3:3-2:1
1:2-3:1
2:2-3:1
3:2-3:1
1:3-3:1
2:3-3:1
3:3-3:1
2:2-1:2
3:2-1:2
1:3-1:2
2:3-1:2
3:3-1:2
3:2-2:2
1:3-2:2
2:3-2:2
3:3-2:2
1:3-3:2
2:3-3:2
3:3-3:2
2:3-1:3
3:3-1:3
3:3-2:3
-0.6
12.8
12.4
10.0
7.8
1.2
-12.4
1.0
0.6
-1.8
-4.0
-10.6
13.4
13.0
10.6
8.4
1.8
-0.4
-2.8
-5.0
-11.6
-2.4
-4.6
-11.2
-2.2
-8.8
-6.6
-15.63865
-2.23865
-2.63865
-5.03865
-7.23865
-13.83865
-27.43865
-14.03865
-14.43865
-16.83865
-19.03865
-25.63865
-1.63865
-2.03865
-4.43865
-6.63865
-13.23865
-15.43865
-17.83865
-20.03865
-26.63865
-17.43865
-19.63865
-26.23865
-17.23865
-23.83865
-21.63865
14.43865
27.83865
27.43865
25.03865
22.83865
16.23865
2.63865
16.03865
15.63865
13.23865
11.03865
4.43865
28.43865
28.03865
25.63865
23.43865
16.83865
14.63865
12.23865
10.03865
3.43865
12.63865
10.43865
3.83865
12.83865
6.23865
8.43865
1.0000000
0.1487668
0.1771874
0.4316582
0.7366003
0.9999991
0.1771874
0.9999998
1.0000000
0.9999787
0.9928966
0.3552211
0.1130579
0.1359755
0.3552211
0.6555252
0.9999787
1.0000000
0.9994109
0.9710966
0.2460831
0.9998112
0.9825836
0.2867388
0.9999018
0.5990906
0.8715885
6.
CONTRASTE PARA PROBAR SI EL TIEMPO PROMEDIO EMPLEADO PARA REPARAR UN
MICRO DE LA MARCA 2 Y UNO DE LA MARCA 3 ES EL MISMO PARA EL TCNICO 2 Y 3
Se pide comparar el promedio de las medias 22 y 23 es igual al promedio de las medias 32 y 33 . Por tanto el contraste indicado
1
1
22 23 32 33 . El test de hiptesis corresponde a:
2
2
H 0 : 22 23 32 33
H0 : W 0
es W
H1 : W 0
o equivalentemente
Como cada media yij ~ N ij ,
H1 : 22 23 32 33
y todas las medias muestrales de tratamiento son mutuamente independientes, entonces el

n
estimador del contraste de medias
1
1
1
1
1
1
W y22 y23 y32 y33 ~ N W , 2
, para esta prueba se puede construir un

2
2
4n 4n 4n 4n
0.5 y22 y23 0.5 y32 y33 H 0

estadstico t dado por T0
~ t ab n1
1
MSE
n
y se rechazara H0 a un nivel de significancia de 0.05 si T0 t 0.025 ,ab n 1 . Para la prueba en cuestin se tiene que
y22 61.20 , y23 56.20 , y32 60.80 , y33 49.60 , n 5, MSE 52.011111 , luego T0 1.0852 , y
t 0.025 ,36 2.028 , por tanto se concluye que el tiempo promedio empleado para reparar un micro de la marca 2 y uno de la marca 3 es
el mismo para el tcnico 2 y 3.
24
7.
RESULTADOS PARA COMPARAR LAS MEDIAS DE CADA FACTOR EN CADA NIVEL DEL
OTRO FACTOR
7.1
Resultados para comparar las medias del factor tcnico en cada nivel de marca
Efectos Tcnico*Marca sobre respuesta Tiempo particionados por Marca
Resultados del test:
H 0 : 11 21 31
Df
Sum Sq Mean Sq
F0
P.Value
En Marca1 2 448.9333 224.4667 4.315744 0.020888163
En Marca2 2 581.2000 290.6000 5.587268 0.007703847
En Marca3 2 209.7333 104.8667 2.016236 0.147918236
Resultados del test
H 0 : 12 22 32
Resultados del test
H 0 : 13 23 33
En la tabla precedente se aprecian los resultados de los testes sobre la igualdad de las medias del factor TCNICO en cada nivel del
factor MARCA, veamos cada una:
Comparacin de las medias de los tcnicos a nivel de la marca 1:
H 0 : 11 21 31
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS A|B1 / MSE 4.32 , F0 ~ f a 1,ab n1 ,
donde MS A|B1 n
y
i 1
y1 / a 1 es la suma de cuadrados medios debida al factor TCNICO pero correspondiente a

2
i 1
las observaciones con la marca 1. VP P f 2 ,36 4.32 0.0209

Con estos resultados se concluye que a un nivel de significancia de 0.05, con la marca 1 los tcnicos tardan en promedio diferente tiempo
para reparar una unidad (al menos dos de ellos).
H 0 : 12 22 32
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS A|B 2 / MSE 5.59 , F0 ~ f a 1,ab n1 ,
donde MS A|B 2 n
y
i 1

2
i 2

Con estos resultados se concluye que a un nivel de significancia de 0.05, con la marca 2 los tcnicos tardan en promedio diferente tiempo
para reparar una unidad (al menos dos de ellos).
H 0 : 13 23 33
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS A|B 3 / MSE 2.02 , F0 ~ f a 1,ab n1 ,
donde MS A|B 3 n
y
i 1

2
i 3

Con estos resultados se concluye que a un nivel de significancia de 0.05, con la marca 3 los tcnicos tardan en promedio el mismo tiempo
para reparar una unidad. Sin embargo mire en la figura 3 estas tres medias y en el numeral 5.3 los valores de las medias estimadas que
corresponden a y13 58.40 , y23 56.20 , y y33 49.60 , hay una diferencia de 8.8 y 6.6 minutos de las dos primeras medias
25
respecto a la ltima; la pregunta es si en trminos prcticos tales diferencias son o no significativas, a pesar que no se encuentra
significancia estadstica!!!
7.2
Resultados para comparar las medias del factor marca en cada nivel de tcnico
Efectos Tcnico*Marca sobre respuesta Tiempo particionados por Tcnico
Resultados del test
H 0 : 11 12 13
Df
Sum Sq Mean Sq
F0
P.Value
En Tcnico1 2 430.5333 215.2667 4.138859 0.02410520
En Tcnico2 2 416.1333 208.0667 4.000427 0.02698640
En Tcnico3 2 396.9333 198.4667 3.815851 0.03140553
Resultados del test
H 0 : 21 22 23
Resultados del test
H 0 : 31 32 33
En la tabla precedente se aprecian los resultados de los pruebas sobre la igualdad de las medias del factor MARCA en cada nivel del
factor TCNICO, veamos cada una:
Comparacin de las medias de las marcas a nivel del tcnico 1:
H 0 : 11 12 13
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS B|A1 / MSE 4.14 , F0 ~ f b 1,ab n 1 ,
donde MS B| A1 n
y
b
j 1
1 j
y1
/ b 1 es la suma de cuadrados medios debida al factor MARCA pero correspondiente a
las observaciones con el tcnico 1. VP P f 2 ,36 4.14 0.0241

Con estos resultados se concluye que a un nivel de significancia de 0.05, con el tcnico 1 los tiempos promedios de reparacin por
unidad de al menos dos de las tres marcas son diferentes.
H 0 : 21 22 23
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS B| A 2 / MSE 4.00 , F0 ~ f b 1,ab n1 ,

donde MS B|A 2 n
y
b
j 1
2 j
y2

unidad de al menos dos de las tres marcas son diferentes.
H 0 : 31 32 33
H0
El estadstico para probar esta hiptesis corresponde a: F0 MS B|A3 / MSE 3.82 , F0 ~ f b 1,ab n1 ,
26
donde MS B| A3 n
y
b
j 1
3 j y3

unidad de al menos dos de las tres marcas son diferentes. Respecto a la cuestin de si permiten estos resultados tomar decisiones
acerca del problema en cuestin? Cules son las recomendaciones que usted hara si quiere disminuir el tiempo de servicio del centro de
servicios electrnicos: Como se mencion antes, para mejorar los tiempos promedios no es conveniente asignar los trabajos de
reparacin a los tcnicos segn la marca con la cual mostraron mejor desempeo. Es preferible implementar a travs de un
reentrenamiento, una medida correctiva tendiente a minimizar los tiempos con todas las marcas y que los tres tcnicos tengan igual
desempeo.
8.
8.1
VALIDACIN DE SUPUESTOS
Prueba del supuesto de normalidad para los errores modelo factorial: A partir del valor P de
0.271206 del test de Shapiro Wilk en la figura 7 y del grfico de probabilidad normal con los residuales comunes ijk yijk yij , en la
misma figura, se puede concluir que el supuesto de normalidad para los errores del modelo, es razonable.
Validacin del supuesto de varianza constante con grficos de residuales: En las figuras 4, 5, y 6
se presentan las grficas de residuales estudentizados vs. tcnico, vs. marca y vs. predichos, respectivamente. En estas tres figuras se
observa un residual cortando la banda de +2, indicando un posible outlier. En trminos generales puede considerarse que el supuesto de
varianza constante se cumple aproximadamente.
8.2
Fig. 4
Fig. 5
Fig. 6
Fig. 7
27
ANEXO 2: PROGRAMA EN R PARA PROBLEMA DOS FACTORES FIJOS EN UN DCA

DEFINIENDO FUNCIN USUARIO PARA CLCULO DE MEDIAS DE TRATAMIENTOS CON I.C DEL 95%
mismediastratamientosdosfactores=function(respuesta,factorA,factorB,nivel=95){
modeloanova=aov(respuesta~factorA*factorB)
MSE=anova(modeloanova)[3][4,]
dferror=anova(modeloanova)[1][4,]
n=unlist(model.tables(modeloanova,type = "means",cterms="factorA:factorB")["n"])
alfa=1-nivel/100
alfa.med=(1-(nivel/100))/2
t=qt(alfa.med,df=dferror,lower.tail=F)
medias.tratam=sapply(split(respuesta,list(factorA,factorB)),mean)
interval=cbind(n=n,MediasA.B=medias.tratam,LI=medias.tratamt*sqrt(MSE/n),LS=medias.tratam+t*sqrt(MSE/n))
cat("Tabla de medias de tratamientos y sus I.C de",nivel,"%","\n")
cat("Niveles Factor A",levels(factorA),"\n")
cat("Niveles Factor B",levels(factorB),"\n")
cat("alfa","
",alfa,"\n")
cat("grados de libertad
",dferror,"\n")
cat("error cuadrtico medio",MSE,"\n")
cat("valor crtico t
",t,"\n","\n")
interval
}
LECTURA DATOS COMO EN LA TABLA PRESENTADA
reparacin=data.frame(marca=factor(rep(c(1,2,3),15)),
tcnico=factor(c(rep(1,15),rep(2,15),rep(3,15))),tiempo=scan())
62 57 59
48 45 53
63 39 67
57 54 66
69 44 47
51 61 55
57 58 58
45 70 50
50 66 69
39 51 49
59 58 47
65 63 56
55 70 51
52 53 44
70 60 50
reparacin
attach(reparacin)
GRFICOS PARA ANALIZAR LOS DATOS EXPERIMENTALES
mediastcnico=sapply(split(tiempo,tcnico),mean)
mediasmarca=sapply(split(tiempo,marca),mean)
interaction.plot(tcnico,marca,tiempo,type="b",pch=c(1,2,3),col=c("black","blue","red"),
lwd=2)
interaction.plot(marca,tcnico,tiempo,type="b",pch=c(1,2,3),col=c("black","blue","red"),
lwd=2)
plot(tiempo~tcnico)
lines(1:3,mediastcnico,type="b",pch=4,col=2,lty=2)
28
plot(tiempo~marca)
lines(1:3,mediasmarca,type="b",pch=4,col=2,lty=2)
AJUSTE MODELO ANOVA CON INTERACCIN Y CCULO TABLA ANOVA
modelo=aov(tiempo~tcnico*marca)
anova(modelo)
GRFICOS Y RESULTADOS PARA VALIDACIN DE SUPUESTOS
shapiro.test(residuals(modelo))
plot(fitted(modelo),rstudent(modelo),cex=2,
main="Residuales estudentizados vs. valores ajustados",xlab="Valores ajustados")
plot(as.numeric(marca),rstudent(modelo),
main="Residuales estudentizados vs. marca",xlab="marca")
plot(as.numeric(tcnico),rstudent(modelo),cex=2,
main="Residuales estudentizados vs. tcnico",xlab="tcnico")
qqnorm(residuals(modelo),cex=2)
qqline(residuals(modelo),col=2)
CLCULO DE MEDIAS DE TRATAMIENTOS CON SUS I.C DEL 95%
mismediastratamientosdosfactores(respuesta=tiempo,factorA=tcnico,factorB=marca)
COMPARACIONES MLTIPLES DE TRATAMIENTOS POR TUKEY
PERO NO ES MUY TIL CON MUCHOS TRATAMIENTOS
TukeyHSD(modelo,"tcnico:marca",conf.level=0.95)
EXTRAYENDO EL MSE DEL ANOVA DEL DISEO FACTORIAL Y GRADOS DE LIBERTAD
MSE=anova(modelo)[3][4,]
dftcnico=length(levels(tcnico))-1
dfmarca=length(levels(marca))-1
dferror=anova(modelo)[1][4,]
COMPARACIN DE MEDIAS DE TCNICOS EN CADA NIVEL DE MARCA: Se pide probar que las medias del factor Tcnico
son iguales, en cada nivel del factor marca, es decir:

H 0 : 11 21 31 ,
H 0 : 12 22 32 ,
H 0 : 13 23 33
a) AJUSTANDO ANOVA DEL FACTOR TCNICO EN CADA NIVEL DE MARCA
Tcnicos.marca1=anova(aov(tiempo~tcnico,data=reparacin[marca==1,]))
b) SEPARANDO DE CADA ANOVA HALLADA LA INFORMACIN DE Df(tcnico), SS(tcnico) y MS(tcnico)
Comp_tcnicos_en_marca=rbind("En Marca1"=Tcnicos.marca1[1:3][1,],
"En Marca2"=Tcnicos.marca2[1:3][1,],"En Marca3"=Tcnicos.marca3[1:3][1,])
29
c) CALCULANDO LOS F0=MS(Tcnico|Marcaj)/MSE

F0_tcnicos=data.frame(Comp_tcnicos_en_marca[3]/MSE)
names(F0_tcnicos)[1]="F0"
d) CALCULANDO LOS VALORES P PARA PROBAR H0: (tcnico1,marcaj)= (tcnico2,marcaj)= (tcnico3,marcaj)
pv=data.frame("P.Value"=pf(F0_tcnicos[,1],dftcnico,dferror,lower.tail=F))
e) FORMANDO TABLA DE RESULTADOS
Slice_tcnicos_por_marca=cbind(Comp_tcnicos_en_marca,F0_tcnicos,pv)
cat("Efectos Tcnico*Marca sobre respuesta Tiempo particionados por
Marca","\n");Slice_tcnicos_por_marca
COMPARACIN DE MEDIAS DE MARCAS EN CADA NIVEL DE TCNICO: Se pide probar que las medias del factor Marca son
iguales, en cada nivel del factor Tcnico, es decir:

H 0 : 11 12 13 ,
H 0 : 21 22 23 ,
H 0 : 31 32 33
a) AJUSTANDO ANOVA DEL FACTOR MARCA EN CADA NIVEL DE TCNICO

marcas.tec1=anova(aov(tiempo~marca,data=reparacin[tcnico==1,]))
b) SEPARANDO DE CADA ANOVA HALLADA LA INFORMACIN DE Df(marca), SS(marca) y MS(marca)
Comp_marcas_en_Tec=rbind("En Tcnico1"=marcas.tec1[1:3][1,],
"En Tcnico2"=marcas.tec2[1:3][1,],"En Tcnico3"=marcas.tec3[1:3][1,])
c) CALCULANDO LOS F0=MS(marca|Tnicoi)/MSE
F0_marcas=data.frame(Comp_marcas_en_Tec[3]/MSE)
names(F0_marcas)[1]="F0"
d) CALCULANDO LOS VALORES P PARA PROBAR H0: (tcnicoi,marca1)= (tcnicoi,marca2)= (tcnicoi,marca3)
pv=data.frame("P.Value"=pf(F0_marcas[,1],dfmarca,dferror,lower.tail=F))
e) FORMANDO TABLA DE RESULTADOS
Slice_marcas_por_Tcnico=cbind(Comp_marcas_en_Tec,F0_marcas,pv)
cat("Efectos Tcnico*Marca sobre respuesta Tiempo particionados por
Tcnico","\n");Slice_marcas_por_Tcnico
detach(reparacin)
Bibliografa
KUELH, R.O. (2001). Diseo de Experimentos. Thomson Learning.
MONTGOMERY, D. C. (2001) Design and analysis of experiments. 5th Edition. John Wiley & Sons.
NETER, N. et. Al. (1996) Applied Linear Statistical Models. Irwin.
30

Dbca y Factoriales Regresión y Diseño

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Dbca y Factoriales Regresión y Diseño

Transféré par

Droits d'auteur :

Formats disponibles

DBCA y Experimentos Factoriales.

Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

PARTE I: DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA) - MODELO DE UN FACTOR

ASPECTOS DEL DISEO DE BLOQUES

EL DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA)

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

SSB Y j Y a Y2j abY2

SST Yij Y Yij2 abY2 , SSE SST SSA SSB

Media muestral en el nivel i del factor de tratamientos

En cualquier caso, el estadstico de prueba y su distribucin bajo H0, son:

F MSA / MSE ~ f a 1,( a 1)( b1)

y se rechaza para valores estadsticamente grandes.

Comparaciones mltiples: Se tiene que el estimador de mnimos cuadrados para

Por tanto cualquier contraste de medias de tratamientos

de medias de tratamientos, es:

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

ciYi t / 2 ,( a 1)( b1) MSE ci2 / b

ij Yij Yij Yij Yi Y j Y

Graficar residuales contra:

Varianza igual y outliers

Valores predichos, niveles del factor de tratamientos,

Scores normales o test Shapiro Wilk

Ejemplo de un DBCA: Comparacin de cuatro mtodos de ensamble

Prof. Nelfi Gonzlez A. Escuela de Estadstica

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

i=1, 2, 3, 4 para denotar los mtodos A, B, C y D respectivamente, y j=1, 2, 3, 4

representa el efecto sobre el tiempo promedio de ensamble debido al mtodo i-esimo y

operador sobre el tiempo promedio de ensamble.

Restricciones y supuestos son

es el efecto del j-esimo

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

El test de hiptesis H 0 : 1 2 3 4 0 es rechazado con un valor p de 0.0029 a un nivel de significancia de 0.05, es

COMPARACIONES TUKEY DE MEDIAS DE TRATAMIENTO

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

95% family-wise confidence level

Como vemos Tukey define tres grupos de medias que se

Differences in mean levels of mtodo

Residuales estandarizados vs. mtodo

Validemos ahora los supuestos de normalidad y de varianza

Shapiro-Wilk normality test

Residuales estandarizados vs. valores ajustados

Residuales estandarizados vs. operador

Normal Q-Q Plot

-1.5 -1.0 -0.5 0.0

0.6123724 -4.082483 0.002747777 -3.8852827 -1.1147173

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

ANEXO 1: PROGRAMA R PARA COMPARACIN DE LOS MTODOS DE ENSAMBLE

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

OBTENIENDO LAS MEDIAS DE TRATAMIENTOS CON SUS I.C DEL 95%

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

PARTE II: EXPERIMENTOS FACTORIALES

Cada combinacin AiBj con i=1, 2, 3 y j=1, 2, define

Tipos de experimentos factoriales con dos factores:

MODELO FACTORIAL DOS FACTORES EFECTOS FIJOS DISEO DCA