Vous êtes sur la page 1sur 21

CAPITULO 5 DISEOS FACTORIALES

En los diseos estudiados anteriormente solo se contaba con un factor de inters y, el


objetivo del diseo era determinar si los tratamientos (niveles del factor) conducan a
resultados estadsticamente diferentes. Es decir, si el factor tenia influencia o no sobre
la variable respuesta. En este captulo se estudia el caso ms general en el que se
estudia la forma como influyen varios factores (ms de dos) sobre la variable repuesta.

En general, los diseos factoriales combinan todos los niveles de todos los factores de
inters para determinar si existen diferencias significativas entre los diferentes
tratamientos. Aqu, un tratamiento es un experimento en el cual se fijan los niveles de
los factores en un valor particular y se realiza el experimento. Por ejemplo, si un
ingeniero qumico est interesado en investigar los efectos del tiempo de reaccin y de
la temperatura de reaccin sobre el rendimiento de un proceso, y se consideran
importantes los dos niveles de tiempo (1 y 1.5 horas) y los dos niveles de temperatura
(125 F y 150 F), entonces el experimento factorial consiste en hacer corridas
experimentales para cada una de las cuatro combinaciones posibles de los niveles de
tiempo y temperatura de reaccin.

5.1 Definiciones bsicas
5.1.1 Diseo Factorial
Un diseo factorial es el conjunto de experimentales o tratamientos que se forman
considerando todas las posibles combinaciones de los niveles de los factores. Por
ejemplo si se desean estudiar la forma como influyen dos factores sobre la variable de
inters y se consideran importantes tres niveles para el primer factor y dos para el
segundo, se forma el diseo 3x2, para un total de 6 corridas o tratamientos. El nombre
de diseo factorial establece de manera implcita el nmero de corridas que se deben
realizar de acuerdo a la cantidad de niveles de cada factor que se combinan.
Como un segundo ejemplo suponga que se desea estudiar el efecto de tres factores
sobre la variable respuesta y que se tiene inters en tres niveles para el primer factor,
cuatro para el segundo y cinco para el tercero. Esto da origen a un diseo 3x4x5, es
decir, un total de 60 corridas o tratamientos que resultan de todas las posibles
combinaciones de los niveles de cada factor
5.1.2 Efecto principal y efecto de interaccin
El efecto de un factor se define como el cambio observado en la variable de respuesta
debido a un cambio de nivel de tal factor. En particular los efectos principales son los
cambios en la medida de la variable de respuesta debidos a la accin individual de
cada factor. Matemticamente el efecto principal de un factor es la diferencia entre la
respuesta media observada cuando tal factor estuvo en su nivel alto y la respuesta
media observada cuando el factor estuvo en su nivel bajo.
Vemos esto con un ejemplo sencillo
5.1.2.1 Ejemplo de un diseo sin interaccin entre factores

Suponga que se estudia el efecto de la presin y la temperatura sobre el rendimiento
de un proceso qumico y que resultan importantes dos niveles de cada factor. Los
resultados se muestran en la siguiente tabla

A: Temperatura

Baja Alta
Baja 50 70
B: Presin
Alta 60 80

Tabla 5.1 Ejemplo de un diseo factorial a dos niveles sin interaccin entre factores

Observe que el cambio en la variable respuesta (el rendimiento) debido a la
temperatura (A) es
20
2
60 50
2
80 70
=
+

+
= A (5-1)


Es decir que hay un cambio de 20 unidades en el rendimiento promedio al pasar de la
temperatura baja a la temperatura alta. De la misma forma:
10
2
70 50
2
80 60
=
+

+
= B (5-2)

Que indica que el rendimiento cambia, en promedio, 10 unidades cuando cambia la
presin del nivel bajo al nivel alto.
Note que, en este ejemplo, el efecto de A no depende de B ni el del B depende de A.
Es decir, el rendimiento siempre cambiar 10 unidades al pasar de la presin baja a la
presin alta independientemente de cual sea la presin y que el cambio ser de 20
unidades al pasar de la temperatura baja a la alta independientemente de cual sea la
presin. Siempre que ocurre esto decimos que no existe interaccin entre los dos
factores.
As, el efecto de A en el nivel bajo de B es 20 50 70 = = A y en el nivel alto
20 60 80 = = A que concuerda con el valor promedio obtenido en la ecuacin (5-1)
De igual forma, el efecto de B sobre la variable respuesta en el nivel bajo de A es
10 50 60 = = B y en el nivel alto de A 10 70 80 = = B que concuerda con el valor
medio encontrado en la ecuacin (5-2)
Esto es tpico cuando no existe interaccin entre los factores de inters: su efecto
sobre la variable respuesta es el mismo independientemente del nivel de los otros
factores y por lo tanto es igual al efecto promedio.
En la siguiente figura se muestra esquemticamente el efecto de la temperatura y la
presin sobre el rendimiento.

Figura 5.1 Diseo factorial con dos factores sin interaccin

Las dos figuras dan la misma informacin y en ambas se puede apreciar que no existe
interaccin entre los dos factores de inters. Note que el efecto de la temperatura
sobre el rendimiento siempre es de 20 unidades independientemente de la presin y
que el efecto de la presin siempre es de 10.unidades independientemente de la
temperatura
Una regla que resulta de utilidad a la hora de identificar si existe o no interaccin entre
los factores estudiados en un diseo experimental es observar si en la grfica de los
factores (como la Figura 5.1) las lneas son casi paralelas. Si las lneas se cruzan
entonces es porque existe una interaccin entre los dos factores de inters
Efecto de la presin, B sobre el rendimiento
40
45
50
55
60
65
70
75
80
85
T Baja T Alta
PBaja
PAlta
10 unidades
Efecto de la Temperatura, A sobre el rendimiento
40
45
50
55
60
65
70
75
80
85
PBaja PAlta
T Baja
T Alta
20 unidades
5.1.2.2 Ejemplo de un diseo con interaccin entre factores
En algunos experimentos, la diferencia en la respuesta entre los niveles de un factor
no es la misma para todos los niveles de los otros factores. Cuando esto sucede,
existe una interaccin entre los factores. Por ejemplo, considrense los datos del
mismo problema explicado anteriormente en la sesin 5.1.2.1 pero con los siguientes
datos:

A: Temperatura

Baja Alta
Baja 50 70
B: Presin
Alta 60 40

Tabla 5.2 Ejemplo de un diseo factorial a dos niveles con interaccin entre factores

El efecto de la temperatura se calcula igual que en caso anterior

0
2
60 50
2
40 70
=
+

+
= A (5-3)

Lo que lleva, de manera tentativa, a concluir que el factor A no tiene ningn efecto. Sin
embargo, cuando se examinan los efectos de A para diferentes niveles del factor B, se
observa que ste no es el caso. Observe que el efecto de A en el nivel bajo de B es de
20 50 70 = = A
y en el nivel alto es de
20 60 40 = = A
lo que lleva a un valor promedio de cero.

En este ejemplo se aprecia que el efecto del factor A depende de los niveles del factor
B. Por tanto, el conocimiento de la interaccin AB es ms til que el conocimiento del
efecto principal. Una interaccin significativa puede enmascarar la significancia de los
efectos principales. En consecuencia, cuando la interaccin est presente, los efectos
principales de los factores involucrados en ella tal vez no tengan mucho significado.
Es fcil estimar el efecto de interaccin en experimentos factoriales tales como los
ilustrados en los ejemplos anteriores (Tabla 5.1 y Tabla 5.2). En este tipo de
experimento, cuando ambos factores tienen dos niveles, el efecto de la interaccin AB
es la diferencia entre los promedios de las diagonales. Esto representa la mitad de la
diferencia entre los efectos de A para los dos niveles de B. Por ejemplo, en Tabla 5.1
se tiene que el efecto de la interaccin AB es

0
2
70 60
2
80 50
=
+

+
= AB (5-4)

Por tanto, no hay interaccin entre A y B. En la Tabla 5.2, el efecto de la interaccin
AB es
20
2
70 60
2
40 50
=
+

+
= AB (5-5)

Tal como se mencion, el efecto de interaccin en estos datos es muy grande.

El concepto de interaccin puede ilustrarse de manera grfica en varias formas. La
Figura 5.2 es una grfica de los datos de la Tabla 5.2 contra los niveles de A para los
dos niveles de B.

Figura 5.2 Diseo factorial con dos factores sin interaccin

Ntese que las rectas P
bajo
y P
alto
(o T
bajo
y T
alto
) no son paralelas, lo que indica que
existe interaccin entre los factores Temperatura (A) y Presin (B). Estas grficas
reciben el nombre de grficas de interaccin de dos factores, y a menudo son tiles
para presentar los resultados de los experimentos. Muchos de los paquetes
estadsticos utilizados para el anlisis de datos construyen estas grficas de manera
automtica.
Los experimentos factoriales son la nica manera de descubrir la interaccin
entre las variables.

Efecto de la presin, B sobre el rendimiento
40
45
50
55
60
65
70
75
T Baja T Alta
PBaja
PAlta
Efecto de la Temperatura, A sobre el rendimiento
40
45
50
55
60
65
70
75
PBaja PAlta
T Baja
T Alta
5.2 Experimento factorial Vs mover un factor a la vez.
Uno de los errores comunes en la investigacin es evaluar el efecto de los factores de
manera individual cambiando uno a la vez (y manteniendo los dems constantes) y
observar as el efecto sobre la variable respuesta. Consideremos nuevamente el
ejemplo de rendimiento y suponga que se desean encontrar las condiciones ptimas
(de mayor rendimiento)
En la Figura 5.3 se muestran las curvas de nivel para el rendimiento como una funcin
de la temperatura y la presin.


Figura 5.3 Optimizacin de un proceso moviendo un factor a la vez

La Figura 5.3 cada punto representa una corrida que se realiza en busca del ptimo.
La figura muestra claramente que la direccin del ptimo no concuerda con la
direccin que se obtiene al mover un factor a la vez y que, en general, mover un factor
a la vez no necesariamente lleva al ptimo del proceso.
El enfoque de mover un factor a la vez ha fallado porque no puede detectar la
interaccin entre los dos factores de inters (la temperatura y la presin). Los
experimentos factoriales son la nica manera de detectar las interacciones. Por
otra parte, el mtodo de un factor a la vez es insuficiente, requiere ms
experimentacin que un experimento factorial, y no existe garanta de que produzca
los resultados correctos.
Si no existiera interaccin entre los factores de inters en el experimento, el diseo
factorial y el enfoque de mover un factor a la vez nos llevaran al mismo valor ptimo.
Temperatura
60%
70%
80%
85%
90%
95%
600 500 400 300 200 700 100
10
20
30
40
50
60
70
Presin
Regin del ptimo
Condiciones
Actuales
Direccin del ptimo
Sin embargo, como esto no esta garantizado, y lo usual es que exista interaccin entre
los factores considerados (sobretodo en fenmenos complejos) el procedimiento de
mover un factor a la vez no conduce a resultados correctos.

5.3 Diseos factoriales con dos factores.
Dentro de los diseos factoriales, es el diseo ms sencillo y con el que debemos
empezar para entender los diseos factoriales generales que se vern ms adelante.
En este tipo de experimentos se tienen solo dos factores de inters y se desea
comprobar si stos influyen o no sobre la variable respuesta.

5.3.1 Modelo de efectos fijos
Suponga que se tienen los factores A y B. El factor A tiene a niveles, mientras que el
factor B tiene b niveles. La Tabla 5.3 contiene este experimento factorial con dos
factores. El experimento tiene n rplicas, y cada uno contiene ab combinaciones de
tratamientos. La observacin en la ij-sima celda para la k-sima rplica est denotada
por y
ijk
. Al realizar el experimento, las observaciones abn deben obtenerse con un
orden aleatorio. Por tanto, el experimento factorial con dos factores es un diseo
completamente aleatorizado.

Factor B
1 2 b Totales Promedios
y
111
y
112
y
121
y
122
y
1b1
y
1b2

1
y
11n
y
12n


y
1bn

1
y
1
y
y
211
y
212
y
221
y
222
y
2b1
y
2b2

2
y
21n
y
22n


y
2bn

2
y
2
y
.
.
.
.
.
.
.
.
.
O
.
.
.
.
.
.
.
.
.
y
a11
y
a12
y
a21
y
a22
y
ab1
y
ab2

Factor A
a
y
a1n
y
a2n


y
abn

a
y
a
y
Totales
1
y
2
y
b
y
Promedios
1
y
2
y
b
y

y

y

Tabla 5.3 Arreglo de datos para el diseo factorial con dos factores

En la tabla anterior se ha hecho uso de la notacin de subndice punto. Recuerde
que con esta notacin, cuando aparece un punto en lugar de una letra en el subndice
de la variable respuesta se debe realizar la sumatoria a lo largo de esta letra. As, por
ejemplo

=
n
k
ijk ij
y y
1
. Adems, la barra en la parte superior indica promedio, como por
ejemplo en,
n
y
y
n
k
ijk
ij

=
1

Las observaciones pueden describirse con el modelo estadstico lineal
( )

=
=
=
+ + + + =
n k
b j
a i
Y
ijk ij j i ijk
,..., 2 , 1
,..., 2 , 1
,..., 2 , 1
(5-6)

donde es la media global o la gran media,
i
es el efecto del i-simo nivel del factor
A,
j
es el efecto del j-simo nivel del factor B, ()
ij
es el efecto de la interaccin entre
A y B y
ijk
es un componente de error aleatorio que tiene una distribucin normal con
media cero y varianza
2
.
El objetivo es determinar si no existe efecto de principal de A, B y no hay interaccin
entre ellos.
5.3.2 Hiptesis a evaluar y anlisis de varianza
Cuando existen dos factores de inters las hiptesis estadsticas a probar son las
siguientes:
0 ... :
2 1 0
= = = =
a
H ( A no influye)
0 :
1

i
H al menos para un i
(5-7)
0 ... :
2 1 0
= = = =
b
H (B no influye)
0 :
1

j
H al menos para un j
(5-8)
( ) ( ) ( ) 0 ... :
12 11 0
= = =
ab
H (No hay interaccin)
0 ) ( :
1

ij
H al menos para algn ij
(5-9)

La primeras dos hiptesis [(5-7) y (5-8)] evalan los efectos principales (A y B) y la
ltima [(5-9)] los efectos de interaccin entre los dos factores.
En este caso, se pretende explicar la variabilidad observada en la variable respuesta
en trminos de 4 fuentes posibles de variabilidad: dos factores principales (A y B), su
interaccin y el error aleatorio. Este hecho tambin se ilustra en identidad (5-10):







( )
2
1 1 1
...

= = =

a
i
b
j
n
k
ijk
y y
Medida de
variabilidad
total
=
( )
2
1
... ..

a
i
i
y y bn
Medida de
variabilidad
debida al factor A
+
( )
2
1
... . .

b
j
j
y y an
Medida de
variabilidad
debida al factor B
+
( )
2
1 1
... . . .. .

= =
+
a
i
b
j
j i ij
y y y y n
Medida de variabilidad
debida a la interaccin
entre A y B
+
( )
2
1 1 1
.

= = =

a
i
b
j
n
k
ij ijk
y y
Medida de
variabilidad debida
al error aleatorio
(5-10)

La identidad (5-10) muestra la forma como se puede descomponer la variabilidad total
de la variable respuesta en trminos de los dos factores principales, la interaccin y el
error aleatorio.
El sentido de esta identidad se comprende mejor si se analizan las cantidades
involucrados en cada trmino. Por ejemplo, ( )
2
1
... ..

a
i
i
y y bn involucra la suma de los
cuadrados de las diferencias entre los promedios del primer factor,
i
y y la gran
media,

y ; si esta sumatoria es diferente de cero es precisamente debido al efecto del
primer factor, A. De igual forma, si B no influyera sobre la variable respuesta, entonces
todos los sus promedios serian iguales a la gran media y por lo tanto la cantidad
( )
2
1
... . .

b
j
j
y y an seria igual a cero.

En la en la Tabla 5.4 se destacan en color verde y azul las calidades involucradas en
el clculo de la suma de cuadrados debida al factor A y B respectivamente. Si todos
los valores en verde son aproximadamente iguales entonces la cantidad
( )
2
1
... ..

a
i
i
y y bn es cercana a cero y como consecuencia A no influye sobre la variable
respuesta; si todos los valores en azul son aproximadamente iguales entonces la
cantidad ( )
2
1
... . .

b
j
j
y y an es cercana a cero y por lo tanto B no influye sobre la
variable respuesta.

Factor B
1 2 b Totales Promedios
y
111
y
112
y
121
y
122
y
1b1
y
1b2

1
y
11n
y
12n


y
1bn

1
y
1
y
y
211
y
212
y
221
y
222
y
2b1
y
2b2

2
y
21n
y
22n


y
2bn

2
y
2
y
.
.
.
.
.
.
.
.
.
O
.
.
.
.
.
.
.
.
.
y
a11
y
a12
y
a21
y
a22
y
ab1
y
ab2

Factor A
a
y
a1n
y
a2n


y
abn

a
y
a
y
Totales
1
y
2
y
b
y
Promedios
1
y
2
y
b
y

y

y

Tabla 5.4 Trminos involucrados en la valuacin de los efectos principales en un diseo con dos factores. En
verde el factor A y en azul B

Para comprender mejor porqu el termino ( )
2
1 1
... . . .. .

= =
+
a
i
b
j
j i ij
y y y y n en la ecuacin
(5-10) mide la interaccin entre A y B considere los datos en la celda correspondiente
al nivel i del factor A y el nivel j del factor B en la Tabla 5.3. El resumen de los datos
involucrados en el efecto de interaccin se muestra en la
Tabla 5.5

Factor B
ij
y
i
y
.
.
.
O
.
.
.
Factor A
j
y

y

Tabla 5.5 Trminos involucrados en la evaluacin de los efectos de interaccin en un diseo con dos factores.

Observe que la cantidad dentro de parntesis en la suma de los cuadrados debido a la
interaccin se puede escribir en la forma ( ) ( ) ... . . .. . ... . . .. . y y y y y y y y
j i ij j i ij
= +
La cantidad, .. .
i ij
y y es una medida del efecto de B en el nivel i-simo de A y
... . . y y
j
es una medida del efecto promedio de B para cualquier nivel de A. Si estas
dos cantidades son diferentes es porque el cambio en la variable respuesta debido a B
depende de nivel escogido de A, lo cual indica que existe interaccin entre A y B.
La identidad de la suma de los cuadrados de la ecuacin (5-10) se puede escribir de
manera simblica de la forma:

SC
T

=

SC
A

+

SC
B

+

SC
AB

+

SC
E

Suma de
Cuadrados
totales
=
Suma de
Cuadrados
Factor A
+
Suma de
Cuadrados
Factor B
+
Suma de
Cuadrados
interaccin
+
Suma de
Cuadrados
Error
(5-11)

Adems, tambin se puede demostrar que existen en total abn 1 grados de libertad.
Los efectos principales A y B tienen a b y b 1 grados de libertad, mientras que el
efecto de interaccin AB tiene (a 1) (b 1) grados de libertad. Dentro de cada una de
las ab celdas de la Tabla 5.3 existen n 1 grados de libertad entre las n rplicas, y las
observaciones en la misma celda slo pueden diferir debido al error aleatorio.

Por lo tanto los grados de libertad tambin quedan divididos de acuerdo a la expresin:

SC
T

=

SC
A

+

SC
B

+

SC
AB

+

SC
E


abn-1

= (a 1) + (b 1) + (a-1)(b-1) + ab(n-1)
(5-12)
Dividiendo cada suma de cuadrados entre sus respectivos grados de libertad se
obtienen las respectivas medias de cuadrados. Si las hiptesis dadas anteriormente
para los efectos principales as como la hiptesis del efecto de interaccin [Hiptesis
(5-9)] son todas verdaderas, se puede demostrar que todas las medias de cuadrados
estiman la misma varianza comn,
2
. Por lo tanto, se puede utilizar la distribucin F
para verificar las hiptesis estadsticas en el diseo factorial con dos factores
[Hiptesis de (5-7) y (5-9)].




Los resultados se suelen escribir en una tabla como la siguiente

Fuente de
Variacin
Suma de Cuadrados
Grados
de
libertad
Media de
cuadrados
F0 Valor P
Factor A
abn
y
bn
y
SC
a
i
i
A

=
2
1
2
a-1
1
=
a
SC
MC
A
A

E
A
MC
MC
F =
0

Probabilidad
Factor B
abn
y
an
y
SC
b
j
j
B

=
2
1
2
b-1
1
=
b
SC
MC
B
B

E
B
MC
MC
F =
0

Probabilidad
Interaccin
AB
B A
a
i
b
j
ij
AB
SS SS
abn
y
n
y
SC

=

= =
2
1 1
2

(a-1)(b-1)
) 1 )( 1 (
=
b a
SC
MC
AB
AB

E
AB
MC
MC
F =
0

Probabilidad
Error
B A AB T E
SC SC SC SC SC = ab(n-1)
) 1 (
=
n ab
SC
MC
E
E


Total

= = =

=
a
i
b
j
n
k
ijk T
abn
y
y SC
1 1 1
2
2
abn-1
Tabla 5.6 Tabla ANOVA para un diseo factorial con dos factores

5.3.3 Comparacin de medias
Cuando ambos factores son fijos, las comparaciones entre las medias de cualquier
factor pueden efectuarse mediante el empleo de mtodos de comparacin mltiple,
tales como el mtodo grfico o la prueba de rango mltiple de Duncan. Cuando no hay
interaccin, estas comparaciones pueden realizarse con el empleo de los promedios
por rengln,
i
y o por columna,
j
y . Sin embargo, cuando la interaccin es
significativa, las comparaciones entre las medias de un factor (por ejemplo, A) pueden
verse oscurecidas por la interaccin AB. En este caso, puede aplicarse a las medias
del factor A un procedimiento tal como la prueba de rangos mltiples de Duncan, con
el valor del factor B ubicado en un nivel en particular.


5.3.4 Verificacin de la adecuacin del modelo y de los
supuestos hechos.
Al igual que en los experimentos de un solo factor, los residuos de un experimento
factorial juegan un papel importante en la evaluacin de la adecuacin de un modelo.
Los residuos de un experimento factorial de dos factores son
e
ijk
= y
ijk
- y
ij
(5-13)

Esto es, los residuos son precisamente la diferencia entre las observaciones y los
promedios de celda correspondientes.

5.3.5 Una observacin por celda
En algunos casos donde se tiene un experimento factorial con dos factores, se tiene
slo una rplica esto es, slo una observacin por celda-. En esta situacin, existen
tantos parmetros en el modelo del anlisis de la varianza como observaciones, y en
los grados de libertad del error son cero. Por tanto, no es posible probar hiptesis con
respecto a los efectos principales y a las interacciones, a menos que se hagan
suposiciones con adicionales. Un a de stas es suponer que el efecto de interaccin
es despreciable y utilizar la media de cuadrados de sta como error cuadrtico medio.
De este modo, el anlisis es equivalente al utilizado en el diseo aleatorizado por
bloques. Esta suposicin de no interaccin puede ser peligrosa, y el experimentador
debe examinar con cuidado los datos y los residuos para determinar si existen o no
indicios de interaccin.
5.4 Diseos factoriales con tres factores.
En este diseo se tienen tres factores de inters denotados como A, B y C. Suponga
que se tienen a niveles del factor A, b niveles del factor B, c niveles del factor C y n
replicas. Esto da un total de abcn observaciones, las cuales resultan de todas las
posibles combinaciones de los niveles de cada factor. Por ejemplo, si se tiene 3
niveles de A, 2 niveles de B y 4 niveles de C se obtienen 324 combinaciones
posibles; y si se decide realizar 3 replicas, el total de observaciones ser de 3243 =
72.

En el diseo factorial con tres factores, la variable respuesta, Y se pretende explicar a
partir del modelo:

( ) ( ) ( ) ( )

=
=
=
=
+ + + + + + + + =
n l
c k
b j
a i
Y
ijkl ijk jk ik ij k j i ijkl
,..., 2 , 1
,..., 2 , 1
,..., 2 , 1
,..., 2 , 1
(5-14)

Este modelo incluye, en total, 8 fuentes de variabilidad: tres efectos principales, tres
efectos de interaccin entre dos factores, un efecto de interaccin entre tres factores y
el termino de error aleatorio. El trmino de error aleatorio incluye el efecto de aquellas
variables o factores distintos a los tres factores considerados en el diseo, que
tambin pueden influir sobre la variable respuesta, pero que se espera que su efecto
sea pequeo y aleatorio.
La Tabla 5.7 muestra la tabla del Anlisis de Varianza para los diseos factoriales con
tres factores.
Fuente de
Variacin
Suma de Cuadrados
Grados
de
libertad
Media de
cuadrados
F0 Valor P
Factor A
abcn
y
bcn
y
SC
a
i
i
A
2
1
2

=

=

a-1
1
=
a
SC
MC
A
A

E
A
MC
MC
F =
0

Probabilidad
Factor B
abcn
y
acn
y
SC
b
j
j
B
2
1
2

=

=

b-1
1
=
b
SC
MC
B
B

E
B
MC
MC
F =
0

Probabilidad
Factor C
abcn
y
abn
y
SC
b
k
k
C
2
1
2

=

=

c-1
1
=
c
SC
MC
B
C

E
C
MC
MC
F =
0

Probabilidad
Interaccin
AB
B A
a
i
b
j
ij
AB
SS SS
abn
y
cn
y
SC

=

= =

2
1 1
2

(a-1)(b-1)
) 1 )( 1 (
=
b a
SC
MC
AB
AB

E
AB
MC
MC
F =
0

Probabilidad
Interaccin
AC
C A
a
i
c
k
k i
AC
SS SS
abn
y
bn
y
SC

=

= =

2
1 1
2

(a-1)(c-1) ) 1 )( 1 (
=
c a
SC
MC
AC
AC

E
AC
MC
MC
F =
0

Probabilidad
Interaccin
BC
C B
b
j
c
k
jk
BC
SS SS
abn
y
an
y
SC

=

= =

2
1 1
2

(b-1)(c-1) ) 1 )( 1 (
=
c b
SC
MC
BC
BC

E
BC
MC
MC
F =
0

Probabilidad
Interaccin
ABC
BC AC AB C B
A
a
i
b
j
c
k
ijk
AB
SS SS SS SS SS
SS
abn
y
n
y
SC

=

= = =

2
1 1 1
2

(a-1)(b-1)(c-1)
) 1 )( 1 )( 1 (
=
c b a
SC
MC
ABC
ABC

E
ABC
MC
MC
F =
0

Probabilidad
Error
B A AB T E
SC SC SC SC SC = abc(n-1) ) 1 (
=
n abc
SC
MC
E
E


Total

= = =

=
a
i
b
j
n
k
ijk T
abn
y
y SC
1 1 1
2
2
abcn-1
Tabla 5.7 Tabla ANOVA para un diseo factorial con tres factores

En la tabla de Anlisis de Varianza (Tabla 5.7) se puede apreciar las 7 hiptesis nulas
en tela de juicio: las que evalan los tres efectos principales, los tres de interaccin
binarias y la interaccin entre tres factores. Cada una de estas hiptesis establece que
el efecto correspondiente no es significativo, y se deben rechazar, a favor de la
hiptesis alternativa correspondiente, si su valor P en la tabla ANOVA (Tabla 5.7) es
menor que el nivel de significancia establecido para la prueba (usualmente del 5%).

5.5 Diseos factoriales generales.
Para estudiar el caso general, considere f factores A, B, C,, K con niveles a, b, c,,
k, respectivamente, donde la letra K denota al f-simo o ltimo factor del conjunto a
estudiar, no necesariamente al decimoprimero, que es el lugar de esta letra en el
alfabeto. Con estos niveles y factores se puede construir el diseo factorial general a x
b x x k, que consiste de a x b x k tratamientos o puntos de prueba. Con este diseo
se pueden estudiar f efectos principales, f (f - 1) /2 interacciones dobles, f (f 1)(f
2)/(3 x 2) interacciones triples, y as sucesivamente hasta la nica interaccin de los f
factores (ABC K). El clculo del nmero de interacciones de cierta cantidad m de
factores se hace mediante la operacin combinaciones de f en m ( )
( )! !
!
m f m
f
f
m

=
que cuenta el nmero de maneras diferentes de seleccionar m factores de los f, donde
f! = f x (f 1) xx 2 x 1.

En resumen, con el diseo factorial general descrito se pueden estudiar los siguientes
2
f
1 efectos:
f
f
=
|
|

\
|
1
efectos principales (A, B, K)
2
) 1 (
2

=
|
|

\
| f f
f
interaccin entre dos factores (AB, AC, )
M
f
f
f
=
|
|

\
|
1
interaccin entre f-1 factores (ABCK-1,)
1
1
=
|
|

\
| f
interaccin con todos los factores (ABCK)
(5-15)
Por ejemplo, el diseo factorial 2
5
tiene cinco efectos principales, 10 interacciones
dobles, 10 interacciones triples, cinco interacciones cudruples y una interaccin
quntuple, lo que da un total de 5 +10 +10 +5 +1= 31 efectos. Por su parte, el factorial
3
5
tiene tambin estos 31 efectos, pero al contar con tres niveles en cada factor, cada
efecto principal se puede descomponer en su parte lineal y cuadrtica, y cada
interaccin doble en cuatro componentes, las triples en ocho componentes, as
sucesivamente, las interacciones se parten segn los grados de libertad que tienen
sus sumas de cuadrados. Cabe hacer notar que mientras el diseo factorial 2
5
tiene 32
tratamientos, el factorial 3
5
tiene 243, una cantidad de tratamientos difcil de manejar.
Aun si pudiera correrse, representa una opcin muy ineficaz; adems de que existen
arreglos experimentales ms pequeos y eficientes.

Una fraccin de la tabla de Anlisis de Varianza con la columna de fuente de variacin,
Suma de cuadrados y grados de libertad se muestra en Tabla 5.8

Fuente Variacin Suma de cuadrados Grados de liberta
Efecto A SC
A
a-1
M M M
Efecto k SC
K
k-1
Interaccin AB SC
AB
(a-1) (b-1)
M M M
Interaccin K(k-1) SC
(K-1)K
(l-1) (k-1)
Interaccin ABC SC
ABC
(a-1)(b-1)(c-1)
M M M
Interaccin (K-2)(K-1)K SC
(K-2)(K-1)K
(m-1)(l-1)(k-1)
M M M
Interaccin ABK SC
ABK
(a-1)(b-1)(k-1)
Error SC
E
abcj(n-1)
Total SC
T
(abckn)-1

Tabla 5.8 ANOVA para el diseo factorial general


La columna de la media de cuadrados, el valor F y el valor P de la tabla ANOVA, se
obtienen de manera anloga a como se vio en los diseos con dos o tres factores.
De acuerdo a lo antes dicho, en el factorial general a x b xx k, se pueden plantear
2
f
1 hiptesis que se prueban mediante el anlisis de varianza. Las primeras tres
columnas de este ANOVA se muestran en la Tabla 5.8.

La suma de cuadrados totales est dada por


= = = =

=
a
i
b
j
k
m
n
r
mr ij T
N
y
y SC
1 1 1 1
2
2
,
L
L
L (5-16)

donde N= abc kn es el total de observaciones en el experimento; los subndices k y
m representan al tercero y ltimo factor, respectivamente. Las sumas de cuadrados de
efectos son
N
y
lkn bc
y
SC
a
i
i
A
2
1
2

=

=

L L
L
(5-17)
N
y
lkn ac
y
SC
b
j
j
B
2
1
2

=

=

L
L
L
(5-18)
N
y
lkn ab
y
SC
a
i
k
C
2
1
2

=

=

L L
L
(5-19)
M
N
y
abc
y
SC
k
m
m
K
2
1
2
ln

=

=

L L
L
(5-20)
B A
a
i
b
j
ij
AB
SC SC
N
y
lkn c
y
SC =

= =

2
1 1
2
L
L
L
(5-21)
M
( ) ( ) K k
l
p
k
m
pm
K k
SC SC
N
y
n abc
y
SC =


= =

1
2
1 1
2
1
L
L
L
(5-22)
BC AC B A
a
i
b
j
c
k
ijk
ABC
SC SC SC SC
N
y
lkn
y
SC =

= = =

L
L
L
2
1 1 1
2
(5-23)
M
.
1
2
1 1 1 1
2


= = = =

=
K AB AB A
a
i
b
j
l
p
k
m
pm ij
K AB
SC SC SC
N
y
n
y
SC
L
L
L
L
L L L (5-24)
( )
.
1 K AB ABC K k AB K A T E
SC SC SC SC SC SC SC SC
L
L L L =


(5-25)


En el ANOVA de la Tabla 5.8 para el factorial general a x b xx k se observa la
necesidad de contar con al menos dos rplicas del experimento para poder calcular la
suma de cuadrados del error (SC
E
), y poder completar toda la tabla de ANOVA. Sin
embargo, esta necesidad de rplicas (n2) es para el caso irreal de que interesan los
2
f
1 efectos. Pero resulta que, con excepcin del factorial 2
2
, prcticamente nunca en
un factorial completo interesan todos sus posibles efectos, puesto que en general slo
algunos de ellos estn activos. El principio de Pareto, que en este contexto se llama
tambin principio de esparcidad de efectos, dice que la mayora de la variabilidad
observada se debe a unos pocos de los efectos posibles; por lo comn se debe a
algunos efectos principales e interacciones dobles. En general no influyen las
interacciones de tres o ms factores, por lo que es innecesario gastar recursos
experimentales para estudiar estos efectos.

En resumen, slo en el caso irreal de que todos los posibles efectos en el diseo
factorial general estn activos, es necesario realizar al menos dos rplicas del
experimento. En las situaciones reales se replican al menos dos veces (y no siempre)
slo los diseos factoriales consistentes de 16 o menos puntos de prueba.

5.6 Ejercicios propuestos.
1. A continuacin se muestra parte del ANOVA para un diseo factorial 3 x 5 con dos
rplicas, el factor A con tres niveles y el B con cinco.

F. de variacin
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
Razn F
A 800
B 900
AB 300
Error 400
Total

a. Suponga efectos fijos, anote el modelo estadstico apropiado y formule las
hiptesis a probar para este experimento.
b. Agregue en esta tabla los grados de libertad, el cuadrado medio y la razn F
para cada una de las fuentes de variacin.
c. Explique de manera esquemtica cmo calculara el p-value para A, por
ejemplo.
d. Con la informacin disponible se pueden hacer conjeturas sobre cules de las
fuentes de variacin son significativas estadsticamente? Argumente.

2. En una fbrica de aceites vegetales comestibles la calidad se ve afectada por la
cantidad de impurezas dentro del aceite, ya que stas causan oxidacin, y por ello
repercute a su vez en las caractersticas de sabor y color del producto final. El
proceso de blanqueo que consiste bsicamente en elevar la temperatura del
aceite, agregar cierta cantidad de arcilla (arena), y agitar durante cierto tiempo
para que las impurezas se adhieran a la arcilla; de esta manera al bajar la
temperatura del aceite y dejarlo en reposo, la arcilla junto con las impurezas se
depositen en el fondo del tanque de aceite. Una forma de medir la eficacia del
proceso de blanqueo es midiendo el color del aceite. De acuerdo al mtodo de
medicin que se aplica en esta planta, consideran que a un aceite se le elimin las
suficientes impurezas si el color es mayor a 4.8 (a mayores valores ms claro el
aceite). Cuando los lotes del proceso de blanqueo no cumplen con los
requerimientos de blancura, la solucin del problema implica reprocesos, aumento
del tiempo de ciclo, entre otras cosas. Para generar una primera aproximacin a la
solucin del problema se decide estudiar la temperatura y el porcentaje de arcilla a
nivel laboratorio inicialmente. El diseo y los datos de las pruebas experimentales
se muestran a continuacin.

Porcentaje de arcilla
Temperatura 0.8 0.9 1.0 1.1
90 5.8 5.9 5.4 5.5 4.9 5.1 4.5 4.4
100 5.0 4.9 4.8 4.7 4.6 4.4 4.1 4.3
110 4.7 4.6 4.4 4.4 4.1 4.0 3.7 3.6

a. Construya el modelo estadstico y formule las hiptesis pertinentes.
b. Cul es el nombre del diseo utilizado?
c. Normalmente, a condiciones reales se utiliza 1.1% de arcilla y 100 grados de
temperatura. Por qu cree que se han elegido precisamente los niveles de
prueba para el experimento?
d. Realice un anlisis de varianza para probar las hiptesis y obtenga
conclusiones.
e. Apoyndose en las grficas de efectos, cul es la relacin general entre el
color y los factores controlados en su rango de experimentacin?
f. A partir de la grfica de interacciones, cree que haya un efecto no lineal?
Apoye su respuesta con el anlisis de varianza apropiado.
g. Considerando que el nivel mnimo aceptable de blancura es de 4.8, qu
tratamiento utilizara?
h. Vale la pena ahora plantear el estudio a condiciones reales?
i. Qu cambio le hara al experimento si lo corre a condiciones reales?

3. En un laboratorio de microbiologa se realiza un experimento para investigar si
influye el tipo de verdura (lechuga-L, cilantro-C, zanahoria-Z) y la temperatura (8 y
20C) de almacenamiento en la sobrevivencia del vidrio colerae. Se hicieron varias
rplicas. El porcentaje de sobrevivencia obtenido despus de 24 horas de
inoculado el alimento se muestra a continuacin.

Temperatura
Alimento 20 8
L 13.1 15.0 33.6 35.5 42.0 11.1 12.8 6.2 28.5 41.0 35.9 25.0 23.8 79.0 41.6
C 19.0 19.0 66.6 66.6 11.0 11.0 49.0 49.0 84.3 68.7 68.7 30.5 30.5 11.0 11.0 20.0
Z 1.2 1.2 0.2 0.1 0.3 0.2 0.1 0.4 0.2 0.3 25.8 21.8 16.0 16-0 20.1 15.4 13.3 25.2

a. Seale el nombre del diseo que se ha empleado y formule las hiptesis que
pueden ser apropiadas.
b. Haga un anlisis de varianza e interprtelo con detalle.
c. Verifique el supuesto de igual varianza entre los tratamientos (varianza
constante). Si se cumplen satisfactoriamente?
d. En caso de que no se cumpla el supuesto anterior, cmo afecta esto a sus
conclusiones?
4. Para el caso del problema anterior:
a. Transforme los datos con logaritmos, haga el anlisis de varianza.
b. Verifique supuestos.
c. Cules son las diferencias ms importantes que encontr en los dos anlisis?
Por qu?
d. Con los datos transformados, y en caso de que haya alguna interaccin
relevante, interprtela con detalle.

5. En una empresa alimenticia se desean evaluar cuatro antioxidantes, a travs de su
efecto en un aceite vegetal. El propsito es seleccionar el producto que retrase
ms la oxidacin. Las pruebas se hacen a condiciones de estrs, midiendo como
variable respuesta el ndice de perxidos. Diferentes unidades experimentales se
evalan a diferentes tiempos. Los datos obtenidos se muestran a continuacin (en
el control no se agrega ningn antioxidante)

Tiempo
Producto 4 horas 8 horas 12 horas
Control 3.84, 3.72 27.63, 27.58 39.95, 39.00
A 4.00, 3.91 22.00, 21.83 46.20, 45.60
B 3.61, 3.61 21.94, 21.85 43.58, 42.98
C 3.57, 3.50 20.50, 20.32 45.14, 44.89
D 3.64, 3.61 20.30, 20.19 44.36, 44.02
a. Seale los factores controlados y la variable de respuesta.
b. Formule el modelo estadstico apropiado al problema y la hiptesis estadstica
que se pueden probar.
c. Haga un anlisis de varianza y observe los aspectos ms relevantes.
d. Los supuestos del modelo se cumplen?
e. Considerando que a menor ndice de perxidos mejor es el producto, hay
algn producto que sea mejor estadsticamente?