Vous êtes sur la page 1sur 30

DBCA y Experimentos Factoriales.

Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

PARTE I: DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA) - MODELO DE UN FACTOR


Un experimento puede involucrar uno o ms factores que aunque no son de inters para el experimentador podra tener un efecto sobre la
respuesta. Entre dicho tipo de factores encontramos los factores de bloqueo. Un diseo de bloques es apropiado cuando el objetivo
del experimento es comparar los efectos de diferentes tratamientos promediados sobre un rango de condiciones diferentes. Las unidades
experimentales son agrupadas en conjuntos de tal forma que dos unidades experimentales en el mismo grupo son similares y pueden ser
medidas bajo condiciones experimentales similares, pero dos unidades experimentales en diferentes grupos probablemente ocasionarn
mediciones muy diferentes an cuando sean asignadas al mismo tratamiento. Los grupos de unidades experimentales similares son
llamados bloques, y las condiciones que varan de bloque a bloque forman los niveles del factor de bloqueo. El anlisis de un diseo de
bloques incluye la comparacin de tratamientos aplicados a las unidades experimentales dentro del mismo bloque. As, el propsito de
bloquear es prevenir que diferencias grandes en las unidades experimentales enmascaren las diferencias entre los niveles del factor de
tratamiento, mientras que al mismo tiempo permita que los tratamientos sean examinados bajo diferentes condiciones experimentales.
Los niveles de un factor de bloqueo pueden ser los valores de una covariable que ha sido medida antes del experimento y cuyos valores
son usados para agrupar a las unidades experimentales. Muy a menudo sin embargo, los niveles de un factor de bloqueo son
agrupamientos de caractersticas que no pueden ser medidas convenientemente. Por ej., Agrupar los rangos de tiempo en el mismo da
dentro del mismo bloque, puede asegurar que las condiciones ambientales dentro de un bloque sean bastante similares sin necesidad de
medirlas. Dado que los niveles del factor de bloqueo no necesariamente necesitan ser medidas, el diseo de bloques es muy popular.
Los experimentadores agrcolas pueden saber que parcelas cercanas en un campo son similares, en tanto que las parcelas lejanas no lo
son. Los experimentadores industriales pueden saber que dos unidades producidas por una misma mquina tienen caractersticas
similares, mientras que aquellas producidas por dos mquinas distintas son algo diferentes. Los experimentadores clnicos pueden saber
que las mediciones tomadas sobre el mismo sujeto sern similares, mientras que aquellas tomadas sobre sujetos distintos no lo sern.
Por tanto los bloques pueden ser formados sin conocer los niveles precisos del factor de bloqueo.

ASPECTOS DEL DISEO DE BLOQUES


Tamao de los bloques: Aunque es posible que el nmero de unidades experimentales en cada bloque sea distinto, se examinar slo
diseos de bloques con igual tamao de bloque. Representaremos el nmero de bloques por b; y en este curso consideraremos el caso
de tamao de bloque igual al nmero de niveles a del factor de estudio. Es comn que en experimentos industriales haya una divisin
automtica en bloques de acuerdo al intervalo de tiempo en un da como proteccin contra condiciones experimentales cambiantes. Un
experimento piloto puede ser realizado para determinar la necesidad de bloquear.
NOTA 1: Debe tenerse en cuenta que cuando se bloquea innecesariamente, las pruebas de hiptesis sern menos potentes y los
intervalos de confianza sern ms anchos que los que se obtendran con un diseo completamente aleatorizado.
Una vez se haya determinado el nmero de bloques y se hayan agrupado a las unidades experimentales en tales grupos, a continuacin
se asignan las unidades a los tratamientos. La peor asignacin posible de unidades a tratamientos es asignar todas las unidades de un
bloque a un tratamiento, todas las unidades de otro bloque a otro tratamiento, y as sucesivamente. Esta asignacin no permite en el
anlisis distinguir entre diferencias entre bloques y diferencias entre tratamientos. Los efectos de los tratamientos y los del factor de
bloqueo quedan confundidos (confusin de efectos). La mejor asignacin posible es asignar a cada tratamiento el mismo nmero de
unidades experimentales en cada bloque. Esto puede lograrse slo cuando el tamao del bloque k sea un mltiplo del nmero de niveles
o tratamientos del factor, a. Este diseo es llamado diseo de bloques completos, y el caso especial en cual k=a, es el que se conoce
usualmente como diseo de bloques completos aleatorizados, o simplemente diseo de bloques aleatorizados.
Si el tamao de bloque no es mltiplo de a, entonces el diseo es conocido como un diseo de bloques incompletos. Este nombre es
algunas veces reservado para el diseo en el cual k<a. Estos diseos son ms complicados para analizar que los diseos completos.

EL DISEO DE BLOQUES COMPLETOS ALEATORIZADOS (DBCA)


Este diseo con a tratamientos y con N=ab unidades experimentales agrupadas en b bloques de k= a unidades de forma que las
unidades dentro de un bloque son similares y unidades en bloques diferentes son sustancialmente distintas. Las k=a unidades
experimentales en cada bloque son asignadas aleatoriamente a los a tratamientos o niveles del factor de inters de modo que cada
tratamiento es asignado a una unidad por bloque. As, cada tratamiento aparece una vez en cada bloque y n=b veces en el diseo.
Anlisis de diseos de bloques completos aleatorizados
Una tabla de entrada de datos tpica de este modelo es como sigue:

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

Bloques
1

...

...

Y11

Y12

...

Y1j

...

Y1b

Y21

Y22

...

Y2j

...

Y2b

...

...

Yi1

Yi2

Yij

Yib

...

...

Ya1

Ya2

...

Yaj

....

Yab

Y1
Y2

Yi

Ya

Y1 Y2

...

Y j

...

Y b

Media global Y

Medias de
bloques

1.

Medias de
tratamientos

Tratamientos

Modelo y ANOVA: El modelo estndar del diseo de bloques completos aleatorizados es:

Yij i j ij ,

(1)

ij ~ N 0, 2 , i 1, 2, , a j 1, 2, , b ,
iid

i 1

j 1

i j 0

donde es la respuesta promedio global, i es el efecto del i-simo tratamiento o nivel del factor de inters, j es el efecto del j-simo
bloque, ij es el error aleatorio asociado, y Yij es la variable aleatoria que representa la medicin en el bloque j del tratamiento i. Este
modelo asume que no existe interaccin entre el factor de inters y el factor de bloqueo; en muchas situaciones esta presuncin ser
razonable, sin embargo, si se sospecha que hay interaccin, el tamao del bloque deber ser incrementado para permitir estimar estos
efectos.
El ANOVA para el modelo en (1) es similar al que veremos en el caso de dos factores sin interaccin en un diseo completamente
aleatorizado, sin embargo varias diferencias deben ser notadas: Las combinaciones de tratamientos de un modelo de dos factores en un
diseo completamente aleatorizado son asignadas aleatoriamente a las unidades, en cambio en un diseo de bloques, aunque las
observaciones son tomadas sobre todas las combinaciones de tratamientos y bloques, slo los niveles de tratamientos del factor son
asignados aleatoriamente a las unidades experimentales (dentro de cada bloque). Los niveles del factor de bloque representan
agrupamientos intencionales de las unidades experimentales. Esto ltimo desata una controversia sobre si es vlido o no realizar el test
de igualdad de medias de los bloques. Por otra parte considerando al factor de bloqueo como un factor nuisance, no estamos
interesados propiamente en sus medias porque en muchos casos es improbable que si repetimos el experimento podamos usar bloques
idnticos. As que en vez de probar la igualdad de las medias de bloque, ms bien se compara la suma de cuadrados medios debida al
factor de bloqueo con el MSE del modelo para determinar si bloquear fue o no benfico en el experimento.
ANOVA
Fuente de Grados de Suma de
Cuadrados
Valores esperados
F
variacin
libertad
cuadrados
Medios
a
Factor A
MSA=SSA/(a-1)
MSA/MSE
a-1

SSA

Bloques

E MSA 2
MSB=SSB/(b-1)

b-1
(a-1)(b-1)

SSE

Total

ab-1

SST

i 1

a 1
a

SSB

Error

b i2

E MSB 2
MSE=SSE/[(a-1)(b-1)]

E MSE

a i2
i 1

b 1

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

Frmulas
a

SSB Y j Y a Y2j abY2

SSA Yi Y b Y abY
2

i 1 j 1

2
i

i 1

i 1 j 1

j 1

SST Yij Y Yij2 abY2 , SSE SST SSA SSB


a

i 1 j 1

Yi

i 1 j 1

1
Yij
b j 1

Media muestral en el nivel i del factor de tratamientos

1 a
Y j Yij Media muestral en el bloque j del factor de bloqueo
a i 1
1 a b
Y Yij Media muestral de todas las ab observaciones.
ab i 1 j 1
La hiptesis de inters es:

H 0 : 1 2 a 0
H1 : algn i 0

o bien

H 0 : 1 2 a
H1 : algn i j

(2)

En cualquier caso, el estadstico de prueba y su distribucin bajo H0, son:


H0

F MSA / MSE ~ f a 1,( a 1)( b1)

y se rechaza para valores estadsticamente grandes.

NOTA 2: Si el MSB es considerablemente mayor que el MSE, esto sugiere que la creacin de bloques vali la pena en el sentido de que
sirvi para reducir el tamao del error experimental. De lo contrario, si el MSB es menor que el MSE, entonces la creacin de bloques ha
bajado la potencia de las pruebas de hiptesis y ha incrementado la longitud de los intervalos de confianza para los contrastes de
tratamientos.
NOTA 3: Recuerde que no hay conclusin estadstica acerca de la igualdad de medias de bloques o de significancia de efectos de
bloques; la comparacin meramente se hace como una forma de establecer la utilidad de haber creado bloques en el experimento, y
proporciona informacin adicional para la planeacin futura de experimentos similares.
NOTA 4: Si el MSB es menor que el MSE, no es vlido pretender que el experimento fue diseado como un diseo completamente
aleatorizado y remover los efectos de bloques del modelo. La aleatorizacin no es la correcta para un diseo completamente
aleatorizado.

2.

i j

Comparaciones mltiples: Se tiene que el estimador de mnimos cuadrados para

i j Yi Y j Y .

Por tanto cualquier contraste de medias de tratamientos

c
i 1

con

es la media del i-simo nivel del factor de tratamientos, es estimable y su estimador de mnimo cuadrados es

c
i 1
a

0 , donde i
a

ci i ciYi ,
i 1

i 1

2
2
ciYi ci / b . La frmula general para los intervalos de confianza de (1-)100%, para un contraste
i 1
i 1

cuya varianza es V

es

de medias de tratamientos, es:

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos


a

c
i 1

Prof. Nelfi Gonzlez A. Escuela de Estadstica

a
a

ciYi t / 2 ,( a 1)( b1) MSE ci2 / b


i 1

i 1

Y para la comparacin por el mtodo de Tukey de todos los pares de medias de tratamientos, usando intervalos de confianza del tipo:

i j

Y j q a , a 1 b 1 MSE / b

3.

Chequeo de supuestos del modelo: Como siempre, es necesario corroborar los supuestos acerca de los errores del
modelo: Independencia, normalidad y varianza constante, adems, tambin es importante chequear la forma del modelo (carencia de
ajuste). Los residuales del modelo son calculados como:

ij Yij Yij Yij Yi Y j Y


Los supuestos sobre los errores son chequeados mediante grficos de residuales, como se resume a continuacin:

4.

Para chequear:
Independencia

Graficar residuales contra:


Orden de las observaciones (segn espacio o tiempo)

Varianza igual y outliers

Valores predichos, niveles del factor de tratamientos,


niveles del factor de bloqueo

Normalidad

Scores normales o test Shapiro Wilk

Ejemplo de un DBCA: Comparacin de cuatro mtodos de ensamble

Un equipo de mejora investiga el efecto de cuatro mtodos de ensamble A, B, C, y D, sobre el tiempo de ensamble en minutos. En
primera instancia la estrategia experimental fue aplicar cuatro veces los cuatro mtodos de ensamble en orden aleatorio en un diseo
completamente aleatorizado. Sin embargo, los experimentadores se dan cuenta que hay cuatro operadores con distintas destrezas y
consideran que esto puede afectar de manera significativa los tiempos de ensamble, y por ende la comparacin de los mtodos, entonces
debe utilizarse un diseo de bloques completos aleatorizados para controlar activamente en el experimento a los operadores que
realizarn el ensamble. Los datos recolectados en este diseo fueron los siguientes:
Mtodo
A
B
C
D
1
6
7
10
10
2
9
10
16
13
Operador
3
7
11
11
11
4
8
8
14
9
Se desea determinar si existen diferencias entre los cuatro mtodos y cmo se diferencian, adems elegir el mejor mtodo, si lo hay.
Solucin
En primera instancia se construyen los grficos boxplots de los tiempos vs. mtodos y tiempos vs. operadores, usando programa R que
aparece en ANEXO 1.

12

14

16

Prof. Nelfi Gonzlez A. Escuela de Estadstica

10

tiempo

12
10
6

tiempo

14

16

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

mtodo

operador

Se observan diferencias en los tiempos promedios de ensamble entre los cuatro mtodos. A primera vista parece que los dos mejores
mtodos son el A y B. Parece que con el mtodo C los tiempos alcanzados tienen mayor dispersin que en los otros dos casos. Por su
parte, el operador 1 parece tener en promedio el menor tiempo de ensamble, en tanto que los operadores 3 y 4 en promedio y tienen
aproximadamente los mismos tiempos. El operador 2 es ms lento y opera con una mayor variabilidad lo que nos dice que es menos
consistente en sus acciones.
El modelo estadstico es
operadores.

Yij i j ij

i=1, 2, 3, 4 para denotar los mtodos A, B, C y D respectivamente, y j=1, 2, 3, 4

representa el efecto sobre el tiempo promedio de ensamble debido al mtodo i-esimo y

operador sobre el tiempo promedio de ensamble.

Restricciones y supuestos son

i 1

j 1

i j 0 ,

ij ~ N 0, 2
iid

Se construye la tabla ANOVA, y de medias de tratamientos con ayuda del R, los resultados son los siguientes:

ANOVA
Analysis of Variance Table
Response: tiempo
Df Sum Sq Mean Sq F value
Pr(>F)
mtodo
3
61.5
20.5
10.25 0.002919 **
operador
3
28.5
9.5
4.75 0.029846 *
Residuals 9
18.0
2.0
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

es el efecto del j-esimo


con los errores

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

MEDIAS DE TRATAMIENTOS
Tabla de medias de tratamientos y sus I.C de 95 %
alfa
0.05
grados de libertad
9
error cuadrtico medio 2
valor crtico t
2.262157

tables.factor.trat.A
tables.factor.trat.B
tables.factor.trat.C
tables.factor.trat.D

ni Medias
LI
LS
4
7.50 5.900413 9.099587
4
9.00 7.400413 10.599587
4 12.75 11.150413 14.349587
4 10.75 9.150413 12.349587

El test de hiptesis H 0 : 1 2 3 4 0 es rechazado con un valor p de 0.0029 a un nivel de significancia de 0.05, es


decir, los tiempos medios de ensamble no son iguales para todos los mtodos.
Para evaluar la eficiencia del diseo tenemos que la seudo prueba sobre los efectos de bloque (operador) tiene un F0 4.75 y un

valor P: P f 3 ,9 4.75 0.0298 , que nos indica el bloqueo por operario result til o eficiente para reducir el error experimental y
por tanto un ahorro en cuanto al nmero de rplicas necesarias para deteccin de diferencias entre los mtodos.
Comparemos ahora los tiempos medios de ensamble para los cuatro mtodos mediante el procedimiento de Tukey. SAS da la siguiente
salida:

COMPARACIONES TUKEY DE MEDIAS DE TRATAMIENTO


Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = tiempo ~ mtodo + operador)
$mtodo
diff
lwr
upr
p adj
B-A 1.50 -1.6217987 4.621799 0.4758801
C-A 5.25 2.1282013 8.371799 0.0024211
D-A 3.25 0.1282013 6.371799 0.0412298
C-B 3.75 0.6282013 6.871799 0.0195634
D-B 1.75 -1.3717987 4.871799 0.3548246
D-C -2.00 -5.1217987 1.121799 0.2566550

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

95% family-wise confidence level

B-A

C-A

Como vemos Tukey define tres grupos de medias que se


traslapan: grupo 1: mtodos C y D, grupo 2: mtodos D y B y grupo
3: mtodos A y B. Hay un problema de potencia del procedimiento
debido a la gran dispersin en los datos en algunos operarios y
mtodos como veremos.

D-A

C-B

D-B

D-C
-4

-2

Differences in mean levels of mtodo

Residuales estandarizados vs. mtodo

Validemos ahora los supuestos de normalidad y de varianza


constante mediante grficos de residuales: La normalidad parece
un supuesto razonable para los errores en este experimento.
Sin embargo, hay problemas con el supuesto de varianza
constante.
Con los mtodos B y C la dispersin de los
residuales es mayor comparativamente a la dispersin en los
mtodos A y D. Con el mtodo A hay menos dispersin. A nivel
del operador 3 la dispersin de los residuales es mayor
aparentemente debido a una observacin que es subestimada.
A pesar de estos inconvenientes es posible llegar a una
conclusin: Elegir como mejor mtodo el A, dado que tiene
menor tiempo promedio observado y menor dispersin (esto
ltimo indica que los operadores con este mtodo son ms
consistentes) .

rstandard(diseo)

Shapiro-Wilk normality test


data: rstandard(diseo)
W = 0.973, p-value = 0.8844

-2

-1

1
0
-1
-2

rstandard(diseo)

Residuales estandarizados vs. valores ajustados

10

12

14

C
Mtodo

Residuales estandarizados vs. operador

Normal Q-Q Plot

1.0
2

0.5

Sample Quantiles
1

-1.5 -1.0 -0.5 0.0

1
0
-1
-2

rstandard(diseo)

1.5

2.0

fitted(diseo)

-2

Operador

-1

Theoretical Quantiles

Adicionalmente, se estimaron los efectos de cada mtodo de ensamble, y sus intervalos de confianza (cuyos niveles de confianza pueden
ser un poco diferentes a los esperados dados los problemas de varianza). Se deja al lector la interpretacin de estos resultados.

EFECTOS DE TRATAMIENTOS
Estimate Std. Error
metodo:efecto
metodo:efecto
metodo:efecto
metodo:efecto

mtodo
mtodo
mtodo
mtodo

A
B
C
D

-2.50
-1.00
2.75
0.75

t value

Pr(>|t|)

lower CI

upper CI

0.6123724 -4.082483 0.002747777 -3.8852827 -1.1147173


0.6123724 -1.632993 0.136904126 -2.3852827 0.3852827
0.6123724 4.490731 0.001508930 1.3647173 4.1352827
0.6123724 1.224745 0.251759476 -0.6352827 2.1352827

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

ANEXO 1: PROGRAMA R PARA COMPARACIN DE LOS MTODOS DE ENSAMBLE


CREANDO FUNCIN USUARIO mismediastratamientosDBCA()
mismediastratamientosDBCA=function(respuesta,factor.trat,bloque,nivel=95){
modeloanova=aov(respuesta~factor.trat+bloque)
MSE=anova(modeloanova)["Mean Sq"][3,]
df=anova(modeloanova)["Df"][3,]
b=unlist(model.tables(modeloanova,type = "means",cterms="factor.trat")["n"])
alfa=1-nivel/100
alfa.med=(1-(nivel/100))/2
t=qt(alfa.med,df=df,lower.tail=F)
medias.tratam=unlist(model.tables(modeloanova,type
"means",cterms="factor.trat")["tables"])[-1]
interval=cbind(ni=b,Medias=medias.tratam,LI=medias.tratamt*sqrt(MSE/ni),LS=medias.tratam+t*sqrt(MSE/ni))
cat("Tabla de medias de tratamientos y sus I.C de",nivel,"%","\n")
cat("alfa","
",alfa,"\n")
cat("grados de libertad
",df,"\n")
cat("error cuadrtico medio",MSE,"\n")
cat("valor crtico t
",t,"\n","\n")
interval
}
LEYENDO DATOS COMO APARECEN EN TABLA DADA
ensamble=data.frame(mtodo=factor(rep(c("A","B","C","D"),4)),
operador=factor(c(rep(1,4),rep(2,4),rep(3,4),rep(4,4))),tiempo=scan())
6 7 10 10
9 10 16 13
7 11 11 11
8 8 14 9
ensamble
attach(ensamble)
OBTENIENDO BOXPLOTS SEGN BLOQUES Y SEGN FACTOR
mediastrat=sapply(split(tiempo,mtodo),mean)
mediasbloque=sapply(split(tiempo,operador),mean)
nf=layout(cbind(c(1,1),c(2,2)))
plot(tiempo~mtodo)
lines(1:4,mediastrat,col=2,lty=2,type="b",pch=3)
plot(tiempo~operador)
lines(1:4,mediasbloque,col=2,lty=2,type="b",pch=3)
AJUSTANDO EL MODELO ANOVA Y OBTENCIN DE LA TABLA ANOVA
diseo=aov(tiempo~mtodo+operador)
anova(diseo)

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

OBTENIENDO EFECTOS DE TRATAMIENTOS, RESULTADOS PARA TEST DE SIGNIFICANCIA Y SUS I.C DEL 95%
library(gmodels)
library(multcomp)
efect.mtodoA=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoB=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoC=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
efect.mtodoD=fit.contrast(diseo,"mtodo",rbind(":efecto mtodo
rbind(efect.mtodoA,efect.mtodoB,efect.mtodoC,efect.mtodoD)

A"=c(3/4,-1/4,-1/4,-1/4)),conf=0.95)
B"=c(-1/4,3/4,-1/4,-1/4)),conf=0.95)
C"=c(-1/4,-1/4,3/4,-1/4)),conf=0.95)
D"=c(-1/4,-1/4,-1/4,3/4)),conf=0.95)

OBTENIENDO LAS MEDIAS DE TRATAMIENTOS CON SUS I.C DEL 95%


mismediastratamientosDBCA(respuesta=tiempo,factor.trat=mtodo,bloque=operador)
INTERVALOS DE TUKEY PARA LAS DIFERENCIAS DE MEDIAS DEL FACTOR DE TRATAMIENTOS
TukeyHSD(diseo,"mtodo",conf.level=0.95)
GRFICOS DE INTERVALOS DE TUKEY
plot(TukeyHSD(diseo,"mtodo",conf.level = 0.95),cex.lab=0.8,las=1)
OBTENIENDO DE GRFICOS PARA VALIDACIN DE SUPUESTOS CON RESIDUOS ESTANDARIZADOS
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot(fitted(diseo),rstandard(diseo),ylim=c(-2.5,2.5),cex=2,
main="Residuales estandarizados vs. valores ajustados")
abline(h=c(-2,0,2),col=2)
plot(as.numeric(mtodo),rstandard(diseo),xlab="Mtodo",ylim=c(-2.5,2.5),cex=2,xaxt="n",
main="Residuales estandarizados vs. mtodo")
axis(1,at=1:4,labels=levels(mtodo))
abline(h=c(-2,0,2),col=2)
plot(as.numeric(operador),rstandard(diseo),xlab="Operador",ylim=c(-2.5,2.5),cex=2,xaxt="n",
main="Residuales estandarizados vs. operador")
axis(1,at=1:4,labels=levels(operador))
abline(h=c(-2,0,2),col=2)
qqnorm(rstandard(diseo),cex=2)
qqline(rstandard(diseo),col=2)
OBTENIENDO TEST DE NORMALIDAD SOBRE RESIDUALES ESTANDARIZADOS
shapiro.test(rstandard(diseo))
detach(ensamble)

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

PARTE II: EXPERIMENTOS FACTORIALES


Los experimentos factoriales son aquellos en los cuales el inters se centra en el estudio de los efectos de las combinaciones de dos o
ms factores sobre una variable respuesta. En la prctica cuando el nmero de factores a considerar es mayor que 3, se suelen utilizar
experimentos 2k (k factores con dos niveles cada uno), experimentos 3k (k factores con tres niveles cada uno), experimentos factoriales
fraccionados, etc.
En el curso se ver el caso de dos factores que denominaremos genricamente como A y B. El nmero de niveles del factor A lo
denotaremos por a y el nmero de niveles de B lo denotaremos por b. Adems el diseo ser completamente aleatorizado, es decir, las
unidades experimentales se considerarn homogneas respecto a las caractersticas individuales que pudieran afectar las respuestas a
los tratamientos aplicados.
Definicin: Llamaremos tratamiento a cada combinacin posible entre los niveles de los factores. As, para el caso de dos factores, se tendr un total
de ab posibles tratamientos. Por ejemplo, sea a=3 y b=2:

Niveles
Factor A

Niveles factor B
B1
B2
A1

A1B1

A1B2

A2

A2B1

A2B2

A3

A3B1

A3B2

Cada combinacin AiBj con i=1, 2, 3 y j=1, 2, define


un tratamiento, entonces hay 6 posibles tratamientos
correspondientes a las entradas en esta tabla.

Tipos de experimentos factoriales con dos factores:


1. De efectos fijos: Los a niveles del factor A como los b niveles del factor B son definidos a propsito por el investigador.
2. De efectos aleatorios: Los a niveles del factor A como los b niveles del factor B son elegidos aleatoriamente dentro de una
poblacin de posibles niveles, respectivamente.
3. De efectos mixtos: Uno de los dos factores es de efectos fijos en tanto que el otro es de efectos aleatorios. Dos posibles
modelos pueden postularse en este caso: modelo mixto restringido y modelo mixto no restringido.
En cualquiera de los anteriores casos se debe considerar el fenmeno conocido como interaccin de los factores, es decir, los modelos
deben iniciarse considerando la existencia de interaccin y luego a travs de la evidencia muestral, determinar si dicha interaccin es o no
significativa. Slo si en cada tratamiento se toman rplicas (n>1 observaciones por tratamiento), ser posible estimar y evaluar la
interaccin entre los factores.

MODELO FACTORIAL DOS FACTORES EFECTOS FIJOS DISEO DCA


Consideraremos que a cada tratamiento se asignan en forma completamente aleatorizada, n unidades experimentales obtenindose por
tanto de cada tratamiento n observaciones de la variable respuesta. En total habrn N=abn observaciones de la variable respuesta. Un
tabla de entrada de datos del experimento ser como se presenta en la figura 2, en donde se postula el modelo con interaccin, para la
respuesta k-sima en el tratamiento AiBj (nivel i del factor A combinado con nivel j del factor B), que aparece a continuacin en la figura 1:
1.
Modelo con interaccin:
Error Aleatorio o experimental

Yijk i j ij E ijk
Efecto fijo de la interaccin de los
factores A y B en sus niveles i y j,
respectivamente,
sobre
la
respuesta promedio global.

Media global de la respuesta

Efecto fijo del i-simo nivel del


factor A sobre la respuesta
promedio global.

Efecto fijo del j-simo niveles del


factor B sobre la respuesta
promedio global.

Figura 1

10

Y 122

...

Y 1j2

...

Y 1b2

Y 113

Y 123

...

Y 1j3

...

Y 1b3

...

...

...

...

...

Y 11k

Y 12k

...

Y 1jk

...

Y 1bk

...

...

...

Y 1jn

...

Y 2bn

...

Y 2b1

...

Y 2j2

...

Y 2b2

Y 223

...

Y 2j3

...

Y 2b3

...

Y 2jk

...

Y 2bk

...

...

Y 21n

Y 22n

...

Y 2jn

...

Y 2bn

Y i22

...

Y ij2

...

Y ib2

Y i13

Y i23

...

Y ij3

...

Y ib3

Y i2k

...

Y ijk

...

Y ibk

...

...

Y i1n

Y i2n

...

Y ijn

...

Y ibn

Y aj1

...

Y ab1

Y a12

Y a22

...

Y aj2

...

Y ab2

Y a13

Y a23

...

Y aj3

...

Y ab3

...

...

...

...

Y a1k

Y a2k

...

Y ajk

...

Y abk

...

...

...

Y a21

...

Y a11

...

...

...

...

...

...

Y i1k

...

...

...

Y i12

...

Y ib1

...

...

...

Y ij1

...

...

...

Y i21

...

Y i11

...

...

...

...

...

Y 22k

...

...

Y 21k

...

...

...

Y 222

Y 213

...

Y 212

...

...

Y 2j1

...

Y 221

...

Y 211

...

...

...

Y 12n

...

...

Y 11n

...

...

Y 112

...

Bb
Y 1b1

...

Aa

...
...

...

...

Ai

Niveles factor B
...
Bj
Y 1j1
...

...

Niveles factor A

...

A2

B2
Y 121

...

A1

B1
Y 111

...

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Y a1n

Y a2n

...

Y ajn

...

Y abn

Eijk N 0,
iid

1.2.

Respuesta k-sima en el tratamiento AiBj:

Yijk i j ij E ijk

Figura 2

Supuestos y restricciones:

1.1.

Prof. Nelfi Gonzlez A. Escuela de Estadstica

para todo i, j, k.

i 1

j 1


i 1

ij


j 1

ij

Parmetros del modelo: Efectos de tratamientos: ij i j ij que representa el efecto del tratamiento AiBj
a

sobre la respuesta promedio global. Note que


i 1 j 1

ij

0.

Medias de tratamientos: ij ij , de donde ij ij .

11

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

Media del nivel i del factor A: i i , de donde i i . Note que i

1 b

b j 1 ij

Media del nivel j del factor B: j j , de donde j j . Note que j


Media global: Puede ser expresada por cualquiera de las siguientes formas:
Efectos de interaccin: ij ij i j

1 a

a i 1 ij

1 a b
1 a
1 b

ab i 1 j 1 ij
b j 1 j
a i 1 i

1.3.
Significado de la interaccin: El que los factores A y B interacten significa que las diferencias entre las medias de
tratamientos segn los niveles de un factor varan (bien sea en dimensin y/o signo) de nivel a nivel del otro factor. Considere por ejemplo
un estudio simple de dos factores en el cual los efectos de sexo (factor A) y edad (factor B) sobre el aprendizaje de una tarea son de
inters, siendo la variable respuesta el tiempo de aprendizaje en minutos. Los datos en las siguientes tablas corresponden a medias
poblacionales por tratamientos y niveles de cada factor ( ij en las celdas, i en las filas y j en las columnas):
gnero
hombre
mujer
media col

medio
13
9
11

edad
viejo
18
14
16

media fila
14
10
12

joven
9
7
8

medio
12
10
11

edad
viejo
14
16
15

media fila
11.67
11.00
11.33

Tabla 3
gnero
hombre
mujer
media col

joven
9
9
9

medio
12
10
11

edad
viejo
18
14
16

joven
9.75
8.25
9.00

medio
12
10
11

edad
viejo
17.25
14.75
16.00

Tabla 2

joven
11
7
9

Tabla 1

gnero
hombre
mujer
media col

Tabla 4
gnero
hombre
mujer
media col

media fila
13
11
12

media fila
13
11
12

Grficas de medias de tratamientos

12

22

Grfica para tabla 1

Grfica para tabla 2

Grfica para tabla 3

Grfica para tabla 4

12

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

Los grficos anteriores son conocidos como grficos de perfiles de medias en los cuales se presentan las medias de tratamiento en
cada uno de los niveles de uno de los factores fijando los niveles del otro factor ubicado en el eje horizontal. En el ejemplo se han
graficado las medias de tratamiento segn Gnero en cada nivel de edad, as las medias 1 j (con Gnero=hombre) son unidas por la
lnea continua en tanto que las medias 2 j (con Gnero=mujer) son unidas por la lnea punteada.
Sea i=1 para gnero hombre, i=2 para Gnero=mujer, j=1 para edad =joven, j=2 para edad=medio y j=3 para edad=viejo. La tabla 1 y su
grfica correspondiente, presentan el caso en el cual los factores no interactan, pues note que las diferencias en las medias ij de
gnero (hombre mujer, es decir 1 j 2 j ) en cada uno de los niveles de edad, es igual a 4 (tambin podra analizarse las diferencias
en las medias ij de edad en cada nivel de gnero y comprobarse que i1 i 2 2 , i1 i 3 7 , y i 2 i 3 5 para i=1,
2). Note adems que la edad tiene el efecto de incrementar los tiempos promedios de aprendizaje de la tarea para cada gnero:
Tabla 1
Edad
Gnero
joven medio viejo
Hombre - mujer 4
4
4

Lo anterior se refleja en el grfico de medias a travs de perfiles de medias paralelos.


En las tablas 2 a 4 se presentan casos de interaccin, y en sus grficas respectivas los perfiles de medias son no paralelos. Podemos
ver que en estos casos, las diferencias en las medias ij de gnero (hombre mujer, es decir 1 j 2 j ) en cada uno de los niveles de
edad no son iguales:
Tabla 2
Edad
Gnero
joven medio viejo
Hombre - mujer 0
2
4

En este caso las diferencias hombre-mujer entre las medias del tiempo de aprendizaje de la tarea aumentan de manera positiva a medida
que el rango de edad es mayor: De acuerdo al ejemplo, cuando los hombres y mujeres son jvenes tienen el mismo tiempo promedio de
aprendizaje en la tarea de inters, pero a medida que envejecen, los tiempos promedios aumentan y a los hombres les toma mayor tiempo
promedio que a las mujeres para aprender y dicha diferencia se amplia con la edad.

Tabla 3
Edad
Gnero
joven medio viejo
Hombre - mujer 2
2
-2

En este caso, hasta una edad media, los hombres en promedio tardan 2 minutos ms que las mujeres en aprender la tarea de inters,
pero a las mujeres viejas les toma en promedio 2 minutos ms que a los hombres viejos en aprender tal tarea; los tiempos promedios para
cada gnero aumentan con la edad. Observe que la interaccin en este caso tuvo el efecto de invertir la direccin de las diferencias entre
las medias de tratamiento.

Tabla 4
Edad
Gnero
joven medio viejo
Hombre - mujer 1.5
2
2.5

En este caso, siempre existe una diferencia positiva en las medias de aprendizaje de los hombres respecto al de las mujeres en cada nivel
de edad, pero adems dichas diferencias aumentan levemente con la edad, a su vez que para cada gnero, los tiempos medios estn
aumentando con la edad. Note que la interaccin se puede catalogar como leve dado que los perfiles de media no son exageradamente
no paralelos.

Diagnstico de la presencia de interaccin: Muestralmente podemos establecer la presencia de interaccin mediante una de las
siguientes formas equivalentes:

Si se observa que los grficos de perfiles de medias muestrales de tratamientos ( Yij ) no son paralelos.

1.4.

Si la diferencia entre las respuestas medias para cualesquiera dos niveles del factor A no es la misma para todos los niveles de B.
Si la diferencia entre las respuestas medias para cualesquiera dos niveles del factor B no es la misma para todos los niveles de A.
Si las medias de tratamientos no son todas iguales a la suma de la media global ms los respectivos efectos principales de los
factores A y B

Encubrimiento o enmascaramiento de efectos principales: Los efectos i y j constituyen los efectos principales del

modelo. Cuando los efectos de interaccin son significativos, pueden encubrir o enmascarar a los efectos principales de uno o de
ambos factores, esto significa que en las pruebas F asociadas a la significancia simultnea de los efectos del respectivo factor, no se
rechaza la hiptesis nula, es decir, se concluye que el factor A, o el B o ambos, no son significativos, cuando ya se ha probado que estos
interactan significativamente.
Pero tenga en cuenta que, en presencia de interaccin significativa, no se puede concluir que alguno o ambos factores son no
significativos a pesar de que el respectivo test de significancia individual para cada factor arroje como resultado la no significancia, porque
tal evento es consecuencia de un encubrimiento debido a la interaccin. Este fenmeno suele suceder en casos donde la interaccin se

13

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

manifiesta invirtiendo en signo las diferencias en las medias de tratamientos de un factor en cada nivel del otro factor (los perfiles de
medias se cruzan). Como previamente se dijo, para poder aislar o separar correctamente el error experimental del efecto de interaccin es
necesario una estimacin independiente del primero, lo cual se logra mediante el uso de rplicas en cada tratamiento. Para mayor
eficiencia se sugieren diseos balanceados.
1.6
Anlisis de Varianza
Para el ANOVA tendremos en cuenta los siguientes estadsticos muestrales:
Parmetro

Estimador

Y
media global

Observacin sobre el estimador


a

media del nivel i del


factor A i

media del nivel j del


factor B j

1
Y
abn i 1 j 1 k 1 ijk

o bien Y

media del tratamiento


AiBj ij

1 a b
Y
ab i 1 j 1 ij

1 a
Y
a i 1 i
1 b
Y j
b j 1

Es decir es el promedio de todas las abn observaciones


Es decir el promedio de las medias muestrales de los ab tratamientos

o bien Y

Es decir es el promedio de las medias muestrales de los a niveles del factor A,

o bien Y

Es decir es el promedio de las medias muestrales de los b niveles del factor B.

1 n
Y
n k 1 ijk
1 b n

Y
bn j 1 k 1 ijk

Yij

Es decir, es el promedio de las observaciones en la celda i,j

Yi

Es decir, es el promedio de las observaciones en la fila i.

o bien Yi

1 b
Y
b j 1 ij

1 a n
Y
an i 1 k 1 ijk
1 a
o bien Y j Yij
a i 1
Y j

Es decir, es el promedio de las medias de las b celdas en la fila i


Es decir, es la media de las observaciones en la columna j
Es decir, es el promedio de las medias de las a celdas en la columna j

El ANOVA descompone la variabilidad total de la siguiente manera:

SST SSA SSB SS AB SSE


Suma de cuadrados
totales, o variabilidad total
g.l=abn-1

Suma de cuadrados
debida al error.
g.l=ab(n-1)

Suma de cuadrados debido a


la interaccin, o variabilidad
debida a la interaccin,
g.l=(a-1)(b-1)
Suma de cuadrados debida al
factor B, o variabilidad debida
al factor B,
g.l=b-1

Suma de cuadrados debida


al factor A, o variabilidad
debida al factor A.
g.l=a-1

En donde:

14

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

ANOVA
Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Cuadrados
Medios

SSA

SSA
MSA
a 1

Valores esperados

F0

a 1

Factor A

E MSA bn
2

i 1

2
i

MSA
MSE

a 1
b

b 1

Factor B

SSB
MSB
b 1

SSB

E MSB an
2

MS AB
Interaccin
AB

a 1 b 1

SS(AB)

Error

ab n 1

SSE

Total

abn 1

SST

j 1

2
j

MSB
MSE

b 1
a

i 1 j 1
SS AB
E MS AB 2 n
a 1 b 1
a 1 b 1

MSE

SSE
ab n 1

ij

MS AB
MSE

E MSE 2

Frmulas sumas de cuadrados


a

SST Yijk Y
i 1 j 1 k 1
a

,
a

SSA Yi Y bn Yi Y , mide la variacin entre filas


2

i 1 j 1 k 1
a

i 1

SSB Y j Y
i 1 j 1 k 1
a

an Y j Y
j 1

SS AB Yij Yi Y j Y
i 1 j 1 k 1

SSE Yijk Y ij
i 1 j 1 k 1

, mide la variacin entre columnas


b

n Yij Yi Y j Y
i 1 j 1

, mide la variacin entre celdas

, mide la variacin dentro de celdas.

Hiptesis a probar: En su orden, deben realizarse los siguientes tests, con como nivel de significancia:
Hiptesis

H 0 : 11 12 ab 0

1. Significancia de la interaccin AB
Estadstico de la prueba

H1 : algn ij 0, i 1, 2, a j 1, 2, b

F3

MS AB

F3 f , a 1 b 1 ,ab n1 o si

bajo H 0

MSE

Rechazar H0 si

f a 1 b 1 ,ab n 1

VP P f a 1 b 1 ,ab n 1 F3

Si la interaccin es significativa (es decir, se rechaza H0), proceder con precaucin en la interpretacin de los resultados de los tests de
significancia sobre los efectos principales:
Hiptesis

H 0 : 1 2 a 0
H1 : algn i 0 i 1, 2, , a

2. Significancia de efectos principales de A


Estadstico de la prueba

MSA
F1
MSE

F1 f ,a 1,ab n1 o si

bajo H 0

Rechazar H0 si

f a 1,ab n 1

VP P f a 1,ab n1 F1

Si no se rechaza H0 bajo interaccin significativa, hay encubrimiento de los efectos principales de este factor por parte de la interaccin.

15

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

3. Significancia de efectos principales de B


Estadstico de la prueba

Hiptesis

H 0 : 1 2 b 0
H1 : algn j 0 j 1, 2, , b

MSB
F2
MSE

F2 f ,b 1,ab n 1 o si

bajo H 0

Rechazar H0 si

f b 1,ab n 1

VP P f b 1,ab n1 F2

Si no se rechaza H0 bajo interaccin significativa, hay encubrimiento de los efectos principales de este factor por parte de la interaccin.
Tener presente que: La estimacin de un efecto principal es una diferencia promediada o contraste entre todas las medias de los niveles
del factor correspondiente, por ello al hacer inferencias sobre tales medias con base en las estimaciones de los efectos principales, en
presencia de interaccin, es realizar una generalizacin sobre los niveles del factor, y por tanto dichas inferencias estarn equivocadas.
Una comparacin generalizada entre las medias de un factor tiene sentido si las diferencias existentes entre dichas medias se sostienen
de nivel a nivel del otro factor, es decir, cuando no hay interaccin. De lo contrario, lo mejor es realizar comparaciones y contrastes de
medias de tratamientos ij que ayuden a interpretar los efectos significativos de la interaccin. As ante interaccin, sera ms
conveniente comparar las medias de dicho factor pero en cada uno de los niveles del otro factor. Por ejemplo, suponga un experimento
con a=3 y b=2 en el cual los datos evidencian interaccin significativa pero aparentemente el factor A no es significativo; en este caso
sera conveniente realizar pruebas como las siguientes:
a) Comparar medias de A en el nivel 1 de B
Estadstico de la prueba

Hiptesis

H 0 : 11 21 31
H1 : algn par i1 i1 con i i
a

FA|B1

SS A|B1 / a 1
MSE

FA|B1 > f ,a 1,ab n1 o si

bajo H 0

Rechazar H0 si

f a 1,ab n 1

P f a 1,ab n 1 FA|B1 <

SS A|B1 Yi1 Y1 es la suma de cuadrados debida a las celdas A1B1, A2B1 y A3B1
2

i 1 k 1

b) Comparar medias de A en el nivel 2 de B


Estadstico de la prueba

Hiptesis

H 0 : 12 22 32
H1 : algn par i 2 i 2 con i i
a

FA|B2

SS A|B2 / a 1
MSE

FA|B2 > f ,a 1,ab n1 o si

bajo H 0

Rechazar H0 si

f a 1,ab n 1

P f a 1,ab n 1 FA|B2 <

SS A|B2 Yi 2 Y2 es la suma de cuadrados debida a las celdas A1B2, A2B2 y A3B2


2

i 1 k 1

Tambin, se podran realizar las comparaciones de las medias del factor B en cada nivel de A. Siguiendo el ejemplo con a=3 y b=2, los
tests a realizar seran:
c) Comparar medias de B en el nivel 1 de A
Hiptesis
Estadstico de la prueba
Rechazar H0 si
FB| A > f ,b 1,ab n1 o si
H :
bajo H
0

11

12

FB| A1

H1 : 11 12
b

SS B| A1 Y1 j Y1
j 1 k 1

SS B| A1 / b 1
MSE

f b 1,ab n1

d) Comparar medias de B en el nivel 2 de A


Estadstico de la prueba

H 0 : 21 22

FB| A2

H1 : 21 22
b

j 1 k 1

P f b 1,ab n 1 FB| A1 <

es la suma de cuadrados debida a las celdas A1B1, A1B2.

Hiptesis

SS B| A2 Y2 j Y2

SS B| A2 / b 1
MSE

FB| A2 > f ,b 1,ab n1 o si

bajo H 0

f b 1,ab n1

es la suma de cuadrados debida a las celdas A2B1, A2B2.

16

Rechazar H0 si

P f b 1,ab n1 FB| A2 <

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

e) Comparar medias de B en el nivel 3 de A


Estadstico de la prueba

Hiptesis

H 0 : 31 32

FB| A3

H1 : 31 32
b

SS B| A3 Y3 j Y3
j 1 k 1

SS B| A3 / b 1

Rechazar H0 si
FB| A3 > f ,b 1,ab n 1 o si

bajo H 0

MSE

f b 1,ab n 1

P f b 1,ab n 1 FB| A3 <

es la suma de cuadrados debida a las celdas A3B1, A3B2.

NOTA: Ante interaccin no se recomienda realizar comparaciones de Tukey sobre las medias de cada factor. Tukey podra aplicarse ms
bien a las medias de un factor en cada nivel del otro. Por ejemplo para comparar todas las medias de A en el nivel Bj, es decir las medias
1 j , 2 j , , aj , la mnima diferencia significativa a usar est dada por

MDS A|B j q , a , ab n 1

MSE
,
n
en tanto que para comparar todas las medias de B en el nivel Ai, o sea las medias i1 , i 2 , , ib , la mnima diferencia significativa
a usar est dada por

MDS B| Ai q , b, ab n 1

MSE
.
n

O bien, tambin se puede comparar cualquier subgrupo de medias de tratamientos usando como mnima diferencia significativa a

MDS ij ,m q , m , ab n 1

MSE
,
n

donde m es el nmero de medias de tratamientos en el subconjunto de inters que se desean comparar.

1.7

Estimaciones

Bajo interaccin, Interesa estimar medias de tratamientos y contrastes de medias de tratamientos.


MEDIA TRATAMIENTO (I,J): ij
Estimador

Error estndar

SYij

Yij

I.C del (1-)100%

MSE
n

Contraste de medias de tratamientos: W

ij Yij t / 2 ,ab n1 SY

ij

C
i 1 j 1

Estimador
a

W C ijYij con
i 1 j 1

1.8

ij

ij

Error estndar
a

C
i 1 j 1

ij

SW

MSE a b 2
C
n i 1 j 1 ij

I.C del (1-)100%

C Y
i 1 j 1

ij

ij

t / 2 ,ab n 1 SW

Validacin de supuestos sobre el trmino de error

Debemos calcular los residuales de este modelo, los cuales corresponden a E ijk Yijk Yij , tenga en cuenta que los valores
predichos para cada respuesta corresponden a Yijk Yij Con estos datos procedemos a realizar lo siguiente:
Los supuestos sobre los errores son chequeados mediante grficos de residuales, como se resume a continuacin:

17

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

2.

Prof. Nelfi Gonzlez A. Escuela de Estadstica

Para chequear:
Independencia

Graficar residuales contra:


Orden de las observaciones (segn espacio o tiempo)

Varianza igual y outliers

Valores predichos, niveles del factor de tratamientos,


niveles del factor A y vs. niveles del factor B

Normalidad

Scores normales o test Shapiro Wilk

Modelo sin interaccin

En caso de que los datos obtenidos presenten evidencia respecto a la no significancia del trmino de interaccin, el modelo factorial debe
replantearse de la siguiente manera: Yijk i j E ijk

2.1

Supuestos y restricciones

Eijk N 0, 2 para todo i, j, k.

iid

i 1

j 1

Obviamente en el ANOVA la suma de cuadrados debida al trmino de error, es diferente en un modelo con interaccin respecto a un
modelo sin interaccin.

2.2

Anova

La descomposicin de la variabilidad total es


Fuente de
variacin

Grados de
libertad

SST SSA SSB SSE , luego:


ANOVA
Cuadrados
Medios

Suma de
cuadrados

Valores esperados

a 1

Factor A

SSA
MSA
a 1

SSA

E MSA bn
2

i 1

2
i

a 1

MSA
MSE

b 1

Factor B

SSB

Error

SSB
MSB
b 1

MSE

SSE

Total
abn 1
Donde abn a b 1

SSE

E MSB an
2

E MSE 2

SST
Frmulas sumas de cuadrados

SST Yijk Y
i 1 j 1 k 1
a

,
a

SSA Yi Y bn Yi Y , mide la variacin entre filas


2

i 1 j 1 k 1
a

i 1

SSB Y j Y
i 1 j 1 k 1
a

an Y j Y
j 1

SSE Yijk Yi Y j Y
i 1 j 1 k 1

, mide la variacin entre columnas

, mide la variacin dentro y entre celdas.

18

j 1

2
j

b 1

MSB
MSE

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

2.3

Prof. Nelfi Gonzlez A. Escuela de Estadstica

Hiptesis a probar: Con como nivel de significancia:


1. Significancia del factor A
Estadstico de la prueba

Hiptesis

H 0 : 1 2 a 0

F1

H1 : algn i 0 i 1, 2, , a

MSA
MSE

Rechazar H0 si
F1 f ,a 1, o si

bajo H 0

VP P f a 1, F1

f a 1,

2. Significancia del factor B


Estadstico de la prueba

Hiptesis

H 0 : 1 2 b 0

F2

H1 : algn j 0 j 1, 2, , b

MSB
MSE

Rechazar H0 si
F2 f ,b 1, o si

bajo H 0

VP P f b 1, F2

f b 1,

Donde abn a b 1
NOTA: Como no hay interaccin, pueden realizarse los testes de Tukey sobre las medias de cada factor, teniendo en cuenta que para el
caso del factor A la mnima diferencia significativa est dada por

MSE
,
nb

MDS A q , a , abn a b 1

donde q , a , abn a b 1 es el valor crtico del rango estudentizado a usar. Para el caso del factor B la mnima diferencia
significativa est dada por

MDS B q , b, abn a b 1
donde q , b, abn a b 1 es el valor crtico del rango estudentizado a usar.

MSE
,
na

Tambin pueden compararse medias de tratamiento como en el caso con interaccin, slo que debe usarse un rango crtico
estudentizado con abn a b 1 grados de libertad.

2.4

Estimaciones

Interesa estimar medias y efectos principales. Los estimadores para las medias de inters se calculan de la misma manera como se
indic en el modelo con interaccin, a continuacin se dan sus errores estndar e intervalos de confianza junto para los efectos
estimados:
Media Error estndar
Efectos
Error estndar
I.C del (1-)100%
I.C del (1-)100%
muestral
estimados

SY

MSE
abn

Y t / 2 , SY

Yi

SYi

MSE
bn

i Yi t / 2, SY

Y j

SY j

MSE
an

j Y j t / 2, SY

i Yi Y

S i

1
1
MSE

bn
abn

i i t / 2, S

j Y j Y

1
1

MSE

an
abn

i i t / 2 , S

MSE
ij Yij t / 2 , SYij
n
Donde abn a b 1 , los grados de libertad del error en el modelo sin interaccin

Yij

2.5

SYij

Validacin de supuestos sobre el trmino de error

Debemos calcular los residuales de este modelo, los cuales corresponden a E ijk Yijk Yi Y j Y , tenga en cuenta que los
valores predichos para cada respuesta corresponden a Yijk Yi Y j Y Con estos datos procedemos a realizar los mismos
anlisis sobre los residuales especificados en el modelo con interaccin.

19

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

Problema sobre un experimento factorial dos factores de efectos fijos en un DCA


El personal de un centro de servicio electrnico incluye tres tcnicos especializados en reparar las tres marcas ms usadas de unidades
de disquetes para micro computadores. Se desea estudiar los efectos del factor TECNICO y del factor MARCA de la unidad de disquete,
sobre el tiempo de servicio dado en minutos. A cada tcnico se le asignaron aleatoriamente cinco trabajos de cada una de las marcas y se
registro el nmero de minutos requerido para completar cada trabajo.

TECNICO

1
62
48
63
57
69
51
57
45
50
39
59
65
55
52
70

MARCA
2
57
45
39
54
44
61
58
70
66
51
58
63
70
53
60

Captulo 19. Problema 16. Pgina 842. (Neter).

1.

3
59
53
67
66
47
55
58
50
69
49
47
56
51
44
50

Las grficas y tablas siguientes representan el anlisis de varianza realizado.


1. Defina claramente el modelo de anlisis de varianza requerido para estudiar
este problema.
2. Haga un anlisis descriptivo de los datos.
3. Determine si la interaccin es significativa. Escriba la expresin empleada para
calcular el valor p. Emplee un nivel de significancia de 0.05 en todas las
pruebas.
4. Discuta la significancia de los efectos principales factores TECNICO y MARCA.
En el caso de indicios de encubrimiento realice pruebas de hiptesis para
confirmarlo y haga las recomendaciones.
5. Construya la tabla de medias por tratamiento.
6. Plantee un contraste para probar si el tiempo promedio empleado para reparar
un micro de la marca 2 y uno de la marca 3 es el mismo para el tcnico 2 y 3.
7. Compare ahora las medias del factor TCNICO en cada nivel del factor
MARCA, y viceversa. Permiten estos resultados tomar decisiones acerca del
problema en cuestin? Cules son las recomendaciones que usted hara si
quiere disminuir el tiempo de servicio del centro de servicios electrnicos.
8. Valide supuestos sobre los errores del modelo (varianza cte. y normalidad)

MODELO: El modelo para el anlisis de varianza corresponde entonces a:

Yijk i j ij ijk
donde tomando como factor A: TECNICO y B: MARCA, con niveles a=3 y b=3 respectivamente y n=5,
Yijk es el tiempo de reparacin en la k-sima unidad de la marca j con tcnico i

es el promedio global del tiempo de reparacin de una unidad


i es el efecto del tcnico i sobre el promedio global del tiempo de reparacin de una unidad
j es el efecto de la marca j sobre el promedio global del tiempo de reparacin de una unidad

ij es el efecto de la interaccin del tcnico i con la marca j sobre el promedio global del tiempo de reparacin de una unidad
ijk

ijk ~ N 0 , 2
iid

es el error aleatorio en la k-sima rplica del tratamiento ij. Supuestos


3

Restricciones para estimacin por mnimos cuadrados:

ij ij 0

ANLISIS DESCRIPTIVO: En primera instancia debemos analizar el grfico de interaccin presentado en la figura 3.
En sta se observa que los perfiles de medias de las marcas no son paralelos, lo cual implica que posiblemente la interaccin entre
tcnicos y marcas es significativa. A nivel del tcnico 1 se observa que su menor tiempo promedio corresponde a la reparacin de
unidades marca 2 y tarda ms con las otras dos marcas; el tiempo promedio de este tcnico con las marcas 2 y 3 es aproximadamente el
mismo. A nivel del tcnico 2 los tiempos promedios de reparacin son distintos para las tres marcas, y el menor tiempo promedio lo
alcanza con la marca 1, en tanto que su mayor tiempo promedio fue con la marca 2. El tcnico 3 present el menor tiempo promedio con
la marca 3, en tanto que con las marcas 1 y 2 tard ms y para estos dos casos los tiempos promedios observados resultaron
aproximadamente iguales. Tambin se observa que los tiempos promedio para la marca 2 con los tcnicos 2 y 3 son muy similares; y los
tiempos promedio para la marca 1 con los tcnicos 1 y 3 son tambin similares entre s. Pero el hecho ms importante a destacar es que
2.

20

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

cada tcnico es especialista en una marca y que para cada marca slo un tcnico alcanza el mejor (es decir el menor) tiempo promedio.
Si el objetivo del estudio es buscar mejorar el tiempo promedio de reparacin, uno estara tentado a recomendar que los trabajos de
reparacin de unidades de la marca 1 sean asignados al tcnico 2, los de la marca 2 al tcnico 1 y los de la marca 3 al tcnico 3. Sin
embargo, implementar tal medida hara al sistema ineficiente, es como tener una cola en espera de servicio para cada servidor, lo cual
en la teora de colas, no es la mejor disposicin. La administracin del centro de servicio debe ante esta situacin, implementar medidas
correctivas para lograr que todos los tres tcnicos sean igualmente efectivos con cualquiera de las marcas.
Por otra parte, las figuras 1 y 2 muestran que prcticamente los tiempos promedios de reparacin no difieren ni por tcnico ni por marca,
es decir, mirar aisladamente estas dos figuras nos llevara a concluir errneamente que ninguno de los dos factores es significativo!!!. Si
en realidad hay interaccin significativa, entonces lo que vemos en las figuras 1 y 2, es un enmascaramiento de los efectos principales de
cada factor, por parte de la interaccin. Adicionalmente en las figuras 1 y 2 vemos que segn los altos de las cajas, la dispersin de los
tiempos de reparacin puede concebirse aproximadamente constante de nivel a nivel de cada factor.
FIG. 1

FIG. 2

FIG. 3

RESUMEN DEL EXPERIMENTO Y ANOVA


Analysis of Variance Table
Response: tiempo
Df Sum Sq Mean Sq F value
Pr(>F)
tcnico
2
24.58 12.289 0.2363 0.7907788
marca
2
28.31 14.156 0.2722 0.7632826
tcnico:marca 4 1215.29 303.822 5.8415 0.0009941 ***
Residuals
36 1872.40 52.011
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

3.

TEST DE HIPTESIS SOBRE LA INTERACCIN: Con base en la anterior salida SAS, se procede a realizar el

test de hiptesis siguiente:

H 0 : 11 12 33 0 interaccin tcnico marca no es significativa

H1 : algn ij 0 , i 1, 2 , 3 y j 1, 2 , 3 interaccin tcnico marca es significativa


H0

El estadstico de prueba es F0 MS AB / MSE 5.84, F0 ~ f 4 ,36 , y VP P f 4 ,36 5.84 0.0010


Se concluye con una significancia de 0.05 que s hay interaccin significativa entre los factores TCNICO y MARCA, por lo tanto los
efectos de cada factor dependen del otro. Como consecuencia de esto es necesario interpretar con precaucin los resultados de los tests

21

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

sobre la significancia de los efectos principales de cada factor: De hecho, si la interaccin es significativa, entonces los dos factores son
significativos a travs de la interaccin!!!.

4.

TEST DE HIPTESIS SOBRE LOS EFECTOS PRINCIPALES DE CADA FACTOR: Con base en la

anterior salida R, se procede a realizar los siguientes test de hiptesis:


Sobre la significancia de los efectos principales del factor TCNICO:

H 0 : 1 2 3 0 efectos principales del factor tcnico no son significativos


H1 : algn i 0 , i 1, 2 , 3

algunos efectos principales del tcnico

son significativos

o bien, en trminos de las medias de este factor:

Las medias de los tiempos de reparacin segn el factor tcnico


H 0 : 1 2 =3

no difieren significativamente

Al menos dos de las medias de los tiempos de reparacin segn el factor tcnico
H1 : i j

difieren significativamente

H0

En cualquier caso el estadstico de prueba corresponde a F0 MSA / MSE 0.24, F0 ~ f 2 ,36 y

VP P f 2 ,36 0.24 0.7908

Se concluye que con una significancia de 0.05,ante interaccin significativa, los efectos principales del factor TCNICO son
enmascarados por la interaccin y por lo tanto no pueden ser medidos sus efectos principales!!!. Esto quiere decir que no tiene sentido
estimar ni efectos, ni medias para los niveles de TCNICO y tampoco tiene sentido construir I.C, o hacer comparaciones de Tukey o
contrastes con las medias de este factor.
Sobre la significancia de los efectos principales del factor MARCA:

H 0 : 1 2 3 0 efectos principales del factor marca no son significativos


H1 : algn j 0 , j 1, 2 , 3 algunos efectos principales del factor marca son significativos

o bien, en trminos de las medias de este factor:

Las medias de los tiempos de reparacin segn el factor marca


H 0 : 1 2= 3

no difieren significativamente

Al menos dos de las medias de los tiempos de reparacin segn el factor


H1 : algn par i j

marca difieren significativamente

H0

En cualquier caso el estadstico de prueba corresponde a F0 MSB / MSE 0.27 , F0 ~ f 2 ,36 y

VP P f 2 ,36 0.27 0.7633

Se concluye que con una significancia de 0.05, ante interaccin significativa, los efectos principales del factor MARCA son enmascarados
por la interaccin y por lo tanto no pueden ser medidos sus efectos principales!!!. Esto quiere decir que no tiene sentido estimar ni
efectos, ni medias para los niveles de MARCA y tampoco tiene sentido construir I.C, o hacer comparaciones de Tukey o contrastes con
las medias de este factor. Lo ms recomendable es realizar contrastes o comparaciones de medias de tratamientos ij o bien comparar
medias de un factor en cada nivel del otro factor.

22

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

5.

Medias de tratamientos tcnico*marca e I.C. del 95%:


La siguiente tabla presenta las medias estimadas yij de cada tratamiento ij, as como los intervalos de confianza que corresponden a

ij yij t0.025 ,ab n 1

MSE
n

Tabla de medias de tratamientos y sus I.C de 95 %


Niveles Factor A 1 2 3
Niveles Factor B 1 2 3
alfa
0.05
grados de libertad
36
error cuadrtico medio 52.01111
valor crtico t
2.028094

1.1
2.1
3.1
1.2
2.2
3.2
1.3
2.3
3.3

n MediasA.B
LI
LS
5
59.8 53.25889 66.34111
5
48.4 41.85889 54.94111
5
60.2 53.65889 66.74111
5
47.8 41.25889 54.34111
5
61.2 54.65889 67.74111
5
60.8 54.25889 67.34111
5
58.4 51.85889 64.94111
5
56.2 49.65889 62.74111
5
49.6 43.05889 56.14111

En esta tabla puede observarse la similaridad en las estimaciones e I.C para las medias de los tratamientos:
1,1 ,1,3 , 2, 2 , 3,1 , 3, 2 y 1, 2 , 2,1 , 3,3 , lo cual puede verificarse en la figura 3. Podra entonces realizarse

contrastes de medias para verificar por ejemplo si 11 13 22 31 32 y otro para determinar si 12 21 33 o un


procedimiento de Tukey sobre las ab 9 medias de tratamientos, para lo cual se puede construir los I.C de Tukey del 95%, as:

ij

kl

ij

ykl q0.05 ab ,ab n 1

MSE
,
n

y verificar si las medias de tratamientos indicadas resultan iguales, como se muestra en la siguiente salida R. Sin embargo, note que en
este caso no se obtienen diferencias significativas entre tratamientos, no porque no existan tales diferencias, sino porque se pierde
potencia en este procedimiento con un nmero tan grande de comparaciones. Aqu las medias de tratamiento 11 , 12 , 13 , 21 , 22 ,

23 , 31 , 32 , 33 son etiquetadas, respectivamente, como i : j , as, por ejemplo, en la comparacin 2:1 1:1 se hace referencia a
la diferencia de las medias 21 y 11 :
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = tiempo ~ tcnico * marca)
$`tcnico:marca`
diff
lwr
2:1-1:1 -11.4 -26.43865
3:1-1:1
0.4 -14.63865
1:2-1:1 -12.0 -27.03865
2:2-1:1
1.4 -13.63865
3:2-1:1
1.0 -14.03865
1:3-1:1 -1.4 -16.43865
2:3-1:1 -3.6 -18.63865
3:3-1:1 -10.2 -25.23865
3:1-2:1 11.8 -3.23865

upr
3.63865
15.43865
3.03865
16.43865
16.03865
13.63865
11.43865
4.83865
26.83865

p adj
0.2658953
1.0000000
0.2095773
0.9999970
0.9999998
0.9999970
0.9965056
0.4054029
0.2273106

23

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos


1:2-2:1
2:2-2:1
3:2-2:1
1:3-2:1
2:3-2:1
3:3-2:1
1:2-3:1
2:2-3:1
3:2-3:1
1:3-3:1
2:3-3:1
3:3-3:1
2:2-1:2
3:2-1:2
1:3-1:2
2:3-1:2
3:3-1:2
3:2-2:2
1:3-2:2
2:3-2:2
3:3-2:2
1:3-3:2
2:3-3:2
3:3-3:2
2:3-1:3
3:3-1:3
3:3-2:3

-0.6
12.8
12.4
10.0
7.8
1.2
-12.4
1.0
0.6
-1.8
-4.0
-10.6
13.4
13.0
10.6
8.4
1.8
-0.4
-2.8
-5.0
-11.6
-2.4
-4.6
-11.2
-2.2
-8.8
-6.6

-15.63865
-2.23865
-2.63865
-5.03865
-7.23865
-13.83865
-27.43865
-14.03865
-14.43865
-16.83865
-19.03865
-25.63865
-1.63865
-2.03865
-4.43865
-6.63865
-13.23865
-15.43865
-17.83865
-20.03865
-26.63865
-17.43865
-19.63865
-26.23865
-17.23865
-23.83865
-21.63865

14.43865
27.83865
27.43865
25.03865
22.83865
16.23865
2.63865
16.03865
15.63865
13.23865
11.03865
4.43865
28.43865
28.03865
25.63865
23.43865
16.83865
14.63865
12.23865
10.03865
3.43865
12.63865
10.43865
3.83865
12.83865
6.23865
8.43865

Prof. Nelfi Gonzlez A. Escuela de Estadstica

1.0000000
0.1487668
0.1771874
0.4316582
0.7366003
0.9999991
0.1771874
0.9999998
1.0000000
0.9999787
0.9928966
0.3552211
0.1130579
0.1359755
0.3552211
0.6555252
0.9999787
1.0000000
0.9994109
0.9710966
0.2460831
0.9998112
0.9825836
0.2867388
0.9999018
0.5990906
0.8715885

6.
CONTRASTE PARA PROBAR SI EL TIEMPO PROMEDIO EMPLEADO PARA REPARAR UN
MICRO DE LA MARCA 2 Y UNO DE LA MARCA 3 ES EL MISMO PARA EL TCNICO 2 Y 3

Se pide comparar el promedio de las medias 22 y 23 es igual al promedio de las medias 32 y 33 . Por tanto el contraste indicado

1
1
22 23 32 33 . El test de hiptesis corresponde a:

2
2
H 0 : 22 23 32 33
H0 : W 0

es W

H1 : W 0

o equivalentemente

Como cada media yij ~ N ij ,

H1 : 22 23 32 33

y todas las medias muestrales de tratamiento son mutuamente independientes, entonces el


n

estimador del contraste de medias

1
1

1
1
1
1
W y22 y23 y32 y33 ~ N W , 2

, para esta prueba se puede construir un


2
2
4n 4n 4n 4n

0.5 y22 y23 0.5 y32 y33 H 0


estadstico t dado por T0
~ t ab n1
1
MSE
n
y se rechazara H0 a un nivel de significancia de 0.05 si T0 t 0.025 ,ab n 1 . Para la prueba en cuestin se tiene que
y22 61.20 , y23 56.20 , y32 60.80 , y33 49.60 , n 5, MSE 52.011111 , luego T0 1.0852 , y
t 0.025 ,36 2.028 , por tanto se concluye que el tiempo promedio empleado para reparar un micro de la marca 2 y uno de la marca 3 es
el mismo para el tcnico 2 y 3.

24

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

7.
RESULTADOS PARA COMPARAR LAS MEDIAS DE CADA FACTOR EN CADA NIVEL DEL
OTRO FACTOR
7.1
Resultados para comparar las medias del factor tcnico en cada nivel de marca
Efectos Tcnico*Marca sobre respuesta Tiempo particionados por Marca

Resultados del test:

H 0 : 11 21 31

Df
Sum Sq Mean Sq
F0
P.Value
En Marca1 2 448.9333 224.4667 4.315744 0.020888163
En Marca2 2 581.2000 290.6000 5.587268 0.007703847
En Marca3 2 209.7333 104.8667 2.016236 0.147918236

Resultados del test

H 0 : 12 22 32

Resultados del test

H 0 : 13 23 33

En la tabla precedente se aprecian los resultados de los testes sobre la igualdad de las medias del factor TCNICO en cada nivel del
factor MARCA, veamos cada una:
Comparacin de las medias de los tcnicos a nivel de la marca 1:
H 0 : 11 21 31
H0

El estadstico para probar esta hiptesis corresponde a: F0 MS A|B1 / MSE 4.32 , F0 ~ f a 1,ab n1 ,
donde MS A|B1 n

y
i 1

y1 / a 1 es la suma de cuadrados medios debida al factor TCNICO pero correspondiente a


2

i 1

las observaciones con la marca 1. VP P f 2 ,36 4.32 0.0209


Con estos resultados se concluye que a un nivel de significancia de 0.05, con la marca 1 los tcnicos tardan en promedio diferente tiempo
para reparar una unidad (al menos dos de ellos).
Comparacin de las medias de los tcnicos a nivel de la marca 2:
H 0 : 12 22 32
H0

El estadstico para probar esta hiptesis corresponde a: F0 MS A|B 2 / MSE 5.59 , F0 ~ f a 1,ab n1 ,
donde MS A|B 2 n

y
i 1

y2 / a 1 es la suma de cuadrados medios debida al factor TCNICO pero correspondiente a


2

i 2

las observaciones con la marca 2. VP P f 2 ,36 5.59 0.0077


Con estos resultados se concluye que a un nivel de significancia de 0.05, con la marca 2 los tcnicos tardan en promedio diferente tiempo
para reparar una unidad (al menos dos de ellos).
Comparacin de las medias de los tcnicos a nivel de la marca 3:
H 0 : 13 23 33
H0

El estadstico para probar esta hiptesis corresponde a: F0 MS A|B 3 / MSE 2.02 , F0 ~ f a 1,ab n1 ,
donde MS A|B 3 n

y
i 1

y3 / a 1 es la suma de cuadrados medios debida al factor TCNICO pero correspondiente a


2

i 3

las observaciones con la marca 3. VP P f 2 ,36 2.02 0.1479


Con estos resultados se concluye que a un nivel de significancia de 0.05, con la marca 3 los tcnicos tardan en promedio el mismo tiempo
para reparar una unidad. Sin embargo mire en la figura 3 estas tres medias y en el numeral 5.3 los valores de las medias estimadas que
corresponden a y13 58.40 , y23 56.20 , y y33 49.60 , hay una diferencia de 8.8 y 6.6 minutos de las dos primeras medias

25

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

respecto a la ltima; la pregunta es si en trminos prcticos tales diferencias son o no significativas, a pesar que no se encuentra
significancia estadstica!!!

7.2

Resultados para comparar las medias del factor marca en cada nivel de tcnico

Efectos Tcnico*Marca sobre respuesta Tiempo particionados por Tcnico

Resultados del test

H 0 : 11 12 13

Df
Sum Sq Mean Sq
F0
P.Value
En Tcnico1 2 430.5333 215.2667 4.138859 0.02410520
En Tcnico2 2 416.1333 208.0667 4.000427 0.02698640
En Tcnico3 2 396.9333 198.4667 3.815851 0.03140553

Resultados del test

H 0 : 21 22 23

Resultados del test

H 0 : 31 32 33

En la tabla precedente se aprecian los resultados de los pruebas sobre la igualdad de las medias del factor MARCA en cada nivel del
factor TCNICO, veamos cada una:
Comparacin de las medias de las marcas a nivel del tcnico 1:
H 0 : 11 12 13
H0

El estadstico para probar esta hiptesis corresponde a: F0 MS B|A1 / MSE 4.14 , F0 ~ f b 1,ab n 1 ,
donde MS B| A1 n

y
b

j 1

1 j

y1

/ b 1 es la suma de cuadrados medios debida al factor MARCA pero correspondiente a

las observaciones con el tcnico 1. VP P f 2 ,36 4.14 0.0241


Con estos resultados se concluye que a un nivel de significancia de 0.05, con el tcnico 1 los tiempos promedios de reparacin por
unidad de al menos dos de las tres marcas son diferentes.
Comparacin de las medias de las marcas a nivel del tcnico 2:
H 0 : 21 22 23
H0

El estadstico para probar esta hiptesis corresponde a: F0 MS B| A 2 / MSE 4.00 , F0 ~ f b 1,ab n1 ,


donde MS B|A 2 n

y
b

j 1

2 j

y2

/ b 1 es la suma de cuadrados medios debida al factor MARCA pero correspondiente a

las observaciones con el tcnico 2. VP P f 2 ,36 4.00 0.0270


Con estos resultados se concluye que a un nivel de significancia de 0.05, con el tcnico 2 los tiempos promedios de reparacin por
unidad de al menos dos de las tres marcas son diferentes.
Comparacin de las medias de las marcas a nivel del tcnico 3:
H 0 : 31 32 33
H0

El estadstico para probar esta hiptesis corresponde a: F0 MS B|A3 / MSE 3.82 , F0 ~ f b 1,ab n1 ,

26

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

donde MS B| A3 n

y
b

j 1

3 j y3

Prof. Nelfi Gonzlez A. Escuela de Estadstica

/ b 1 es la suma de cuadrados medios debida al factor MARCA pero correspondiente a

las observaciones con el tcnico 3. VP P f 2 ,36 3.82 0.0314


Con estos resultados se concluye que a un nivel de significancia de 0.05, con el tcnico 3 los tiempos promedios de reparacin por
unidad de al menos dos de las tres marcas son diferentes. Respecto a la cuestin de si permiten estos resultados tomar decisiones
acerca del problema en cuestin? Cules son las recomendaciones que usted hara si quiere disminuir el tiempo de servicio del centro de
servicios electrnicos: Como se mencion antes, para mejorar los tiempos promedios no es conveniente asignar los trabajos de
reparacin a los tcnicos segn la marca con la cual mostraron mejor desempeo. Es preferible implementar a travs de un
reentrenamiento, una medida correctiva tendiente a minimizar los tiempos con todas las marcas y que los tres tcnicos tengan igual
desempeo.

8.
8.1

VALIDACIN DE SUPUESTOS
Prueba del supuesto de normalidad para los errores modelo factorial: A partir del valor P de

0.271206 del test de Shapiro Wilk en la figura 7 y del grfico de probabilidad normal con los residuales comunes ijk yijk yij , en la
misma figura, se puede concluir que el supuesto de normalidad para los errores del modelo, es razonable.

Validacin del supuesto de varianza constante con grficos de residuales: En las figuras 4, 5, y 6
se presentan las grficas de residuales estudentizados vs. tcnico, vs. marca y vs. predichos, respectivamente. En estas tres figuras se
observa un residual cortando la banda de +2, indicando un posible outlier. En trminos generales puede considerarse que el supuesto de
varianza constante se cumple aproximadamente.

8.2

Fig. 4

Fig. 5

Fig. 6

Fig. 7

27

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

ANEXO 2: PROGRAMA EN R PARA PROBLEMA DOS FACTORES FIJOS EN UN DCA


DEFINIENDO FUNCIN USUARIO PARA CLCULO DE MEDIAS DE TRATAMIENTOS CON I.C DEL 95%
mismediastratamientosdosfactores=function(respuesta,factorA,factorB,nivel=95){
modeloanova=aov(respuesta~factorA*factorB)
MSE=anova(modeloanova)[3][4,]
dferror=anova(modeloanova)[1][4,]
n=unlist(model.tables(modeloanova,type = "means",cterms="factorA:factorB")["n"])
alfa=1-nivel/100
alfa.med=(1-(nivel/100))/2
t=qt(alfa.med,df=dferror,lower.tail=F)
medias.tratam=sapply(split(respuesta,list(factorA,factorB)),mean)
interval=cbind(n=n,MediasA.B=medias.tratam,LI=medias.tratamt*sqrt(MSE/n),LS=medias.tratam+t*sqrt(MSE/n))
cat("Tabla de medias de tratamientos y sus I.C de",nivel,"%","\n")
cat("Niveles Factor A",levels(factorA),"\n")
cat("Niveles Factor B",levels(factorB),"\n")
cat("alfa","
",alfa,"\n")
cat("grados de libertad
",dferror,"\n")
cat("error cuadrtico medio",MSE,"\n")
cat("valor crtico t
",t,"\n","\n")
interval
}
LECTURA DATOS COMO EN LA TABLA PRESENTADA
reparacin=data.frame(marca=factor(rep(c(1,2,3),15)),
tcnico=factor(c(rep(1,15),rep(2,15),rep(3,15))),tiempo=scan())
62 57 59
48 45 53
63 39 67
57 54 66
69 44 47
51 61 55
57 58 58
45 70 50
50 66 69
39 51 49
59 58 47
65 63 56
55 70 51
52 53 44
70 60 50
reparacin
attach(reparacin)
GRFICOS PARA ANALIZAR LOS DATOS EXPERIMENTALES
mediastcnico=sapply(split(tiempo,tcnico),mean)
mediasmarca=sapply(split(tiempo,marca),mean)
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))
interaction.plot(tcnico,marca,tiempo,type="b",pch=c(1,2,3),col=c("black","blue","red"),
lwd=2)
interaction.plot(marca,tcnico,tiempo,type="b",pch=c(1,2,3),col=c("black","blue","red"),
lwd=2)
plot(tiempo~tcnico)
lines(1:3,mediastcnico,type="b",pch=4,col=2,lty=2)

28

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

plot(tiempo~marca)
lines(1:3,mediasmarca,type="b",pch=4,col=2,lty=2)
AJUSTE MODELO ANOVA CON INTERACCIN Y CCULO TABLA ANOVA
modelo=aov(tiempo~tcnico*marca)
anova(modelo)
GRFICOS Y RESULTADOS PARA VALIDACIN DE SUPUESTOS
shapiro.test(residuals(modelo))
nf=layout(rbind(c(1,1,2,2),c(3,3,4,4)))
plot(fitted(modelo),rstudent(modelo),cex=2,
main="Residuales estudentizados vs. valores ajustados",xlab="Valores ajustados")
abline(h=c(-2,0,2),col=2)
plot(as.numeric(marca),rstudent(modelo),
main="Residuales estudentizados vs. marca",xlab="marca")
abline(h=c(-2,0,2),col=2)
plot(as.numeric(tcnico),rstudent(modelo),cex=2,
main="Residuales estudentizados vs. tcnico",xlab="tcnico")
abline(h=c(-2,0,2),col=2)
qqnorm(residuals(modelo),cex=2)
qqline(residuals(modelo),col=2)
CLCULO DE MEDIAS DE TRATAMIENTOS CON SUS I.C DEL 95%
mismediastratamientosdosfactores(respuesta=tiempo,factorA=tcnico,factorB=marca)
COMPARACIONES MLTIPLES DE TRATAMIENTOS POR TUKEY
PERO NO ES MUY TIL CON MUCHOS TRATAMIENTOS
TukeyHSD(modelo,"tcnico:marca",conf.level=0.95)
EXTRAYENDO EL MSE DEL ANOVA DEL DISEO FACTORIAL Y GRADOS DE LIBERTAD
MSE=anova(modelo)[3][4,]
dftcnico=length(levels(tcnico))-1
dfmarca=length(levels(marca))-1
dferror=anova(modelo)[1][4,]
COMPARACIN DE MEDIAS DE TCNICOS EN CADA NIVEL DE MARCA: Se pide probar que las medias del factor Tcnico

son iguales, en cada nivel del factor marca, es decir:


H 0 : 11 21 31 ,
H 0 : 12 22 32 ,
H 0 : 13 23 33
a) AJUSTANDO ANOVA DEL FACTOR TCNICO EN CADA NIVEL DE MARCA
Tcnicos.marca1=anova(aov(tiempo~tcnico,data=reparacin[marca==1,]))
Tcnicos.marca2=anova(aov(tiempo~tcnico,data=reparacin[marca==2,]))
Tcnicos.marca3=anova(aov(tiempo~tcnico,data=reparacin[marca==3,]))
b) SEPARANDO DE CADA ANOVA HALLADA LA INFORMACIN DE Df(tcnico), SS(tcnico) y MS(tcnico)
Comp_tcnicos_en_marca=rbind("En Marca1"=Tcnicos.marca1[1:3][1,],
"En Marca2"=Tcnicos.marca2[1:3][1,],"En Marca3"=Tcnicos.marca3[1:3][1,])

29

DBCA y Experimentos Factoriales. Curso: Regresin y Diseo de Experimentos

Prof. Nelfi Gonzlez A. Escuela de Estadstica

c) CALCULANDO LOS F0=MS(Tcnico|Marcaj)/MSE


F0_tcnicos=data.frame(Comp_tcnicos_en_marca[3]/MSE)
names(F0_tcnicos)[1]="F0"
d) CALCULANDO LOS VALORES P PARA PROBAR H0: (tcnico1,marcaj)= (tcnico2,marcaj)= (tcnico3,marcaj)
pv=data.frame("P.Value"=pf(F0_tcnicos[,1],dftcnico,dferror,lower.tail=F))
e) FORMANDO TABLA DE RESULTADOS
Slice_tcnicos_por_marca=cbind(Comp_tcnicos_en_marca,F0_tcnicos,pv)
cat("Efectos Tcnico*Marca sobre respuesta Tiempo particionados por
Marca","\n");Slice_tcnicos_por_marca
COMPARACIN DE MEDIAS DE MARCAS EN CADA NIVEL DE TCNICO: Se pide probar que las medias del factor Marca son

iguales, en cada nivel del factor Tcnico, es decir:


H 0 : 11 12 13 ,
H 0 : 21 22 23 ,

H 0 : 31 32 33

a) AJUSTANDO ANOVA DEL FACTOR MARCA EN CADA NIVEL DE TCNICO


marcas.tec1=anova(aov(tiempo~marca,data=reparacin[tcnico==1,]))
marcas.tec2=anova(aov(tiempo~marca,data=reparacin[tcnico==2,]))
marcas.tec3=anova(aov(tiempo~marca,data=reparacin[tcnico==3,]))
b) SEPARANDO DE CADA ANOVA HALLADA LA INFORMACIN DE Df(marca), SS(marca) y MS(marca)
Comp_marcas_en_Tec=rbind("En Tcnico1"=marcas.tec1[1:3][1,],
"En Tcnico2"=marcas.tec2[1:3][1,],"En Tcnico3"=marcas.tec3[1:3][1,])
c) CALCULANDO LOS F0=MS(marca|Tnicoi)/MSE
F0_marcas=data.frame(Comp_marcas_en_Tec[3]/MSE)
names(F0_marcas)[1]="F0"
d) CALCULANDO LOS VALORES P PARA PROBAR H0: (tcnicoi,marca1)= (tcnicoi,marca2)= (tcnicoi,marca3)
pv=data.frame("P.Value"=pf(F0_marcas[,1],dfmarca,dferror,lower.tail=F))
e) FORMANDO TABLA DE RESULTADOS
Slice_marcas_por_Tcnico=cbind(Comp_marcas_en_Tec,F0_marcas,pv)
cat("Efectos Tcnico*Marca sobre respuesta Tiempo particionados por
Tcnico","\n");Slice_marcas_por_Tcnico
detach(reparacin)

Bibliografa
KUELH, R.O. (2001). Diseo de Experimentos. Thomson Learning.
MONTGOMERY, D. C. (2001) Design and analysis of experiments. 5th Edition. John Wiley & Sons.
NETER, N. et. Al. (1996) Applied Linear Statistical Models. Irwin.

30

Vous aimerez peut-être aussi