Manual Taller1 DiseñoExperimentos

UNIVERSIDAD DE SANTIAGO DE CHILE
DEPARTAMENTO DE MATEMÁTICA Y C.C
TALLER I
PRIMER SEMESTRE 2016
Manual
Integrantes: Italo Chiappa

Lautaro Collihuı́n
Andrea Hernández
Alvaro Palma
Profesor: Luis Figueroa
Malen Antillanca
Fecha de entrega: 13 de abril de 2016
Índice general
3
Apéndice A
Diseño y Análisis de Experimentos
La investigación de procesos, en diversas áreas de estudio persiguen descubrir algo respecto a

ese sistema en particular. De esta manera, y de acuerdo al contexto de un experimento, podrı́amos
definirlo como una prueba que se realizan sobre ese fenómeno de investigación. Formalmente, la
experimentación es reiterativa, es decir, se repite una serie de veces el experimento, alterando las
variables que están en juego y determinando cambios que al término de la experiencia se vislumbraron;
La realización del experimento implica la realización de un análisis de los resultados obtenidos, para
posteriormente concluir sobre lo ocurrido. En particular, y de acuerdo al contexto de disciplina en
que enfoquemos la experimentación de fenómenos, podemos desarrollar procesos robustos, esto quiere
decir, que sean afectos por la menor cantidad de variables externas a ellos. Luego, podemos definir
un diseño, como la construcción matemática de un modelo que nos permita comprender, y obtener
información numérica, que será analizada estadı́stica y probabilı́sticamente, con la finalidad de poder
tomar decisiones frente al fenómeno de interés.
Los objetivos principales de este capı́tulo, en primera instancia, persiguen conocer los diseños más
usuales para poder modelar experimentos, sus expresiones matemáticas que cooperan en la medición
de los datos que se dispongan ante un experimento dado, por otro lado, y en segundo lugar, a través
del desarrollo matemático de los diferentes diseños, también se pretende exhibir la base teórica en la
cual se apoya la validación de cualquier proceso y supuesto, en particular enfocado a la ingenierı́a, o a
cualquier disciplina cientı́fica que persiga respuestas ante diversas disyuntivas que requiera contestar.
A.1. Conceptos básicos
1. Unidad Experimental: Es un elemento animado y/o inanimado, seleccionado de forma obje-

tiva, y al que se le modificarán factores o condiciones, con la finalidad de observar las respuestas
posibles. La unidad de medida de cada elemento extraı́do, dependerá única y exclusivamente
5
del investigador.
2. Tratamiento: El tratamiento es el proceso de modificación de factores de uno o más elementos

y/o unidades experimentales, cuyos efectos van a ser medidos y comparados.
3. Aleatorización: Las unidades experimentales se seleccionan aleatoriamente, por lo que la

extracción es imparcial. Esto implica, que se cancelan los efectos de factores externos que
pudiesen afectar al experimento y conlleva a independencia de las variables aleatorias bajo
estudio.
4. Replicación: Es la reiteración con la que se realiza un experimento. Esta repetición, contribuye

a incurrir en mejores estimaciones de los errores experimentales, ası́ como, la estimación del
efecto de los factores.
5. Factores: Son las variables independientes, que pueden influir en la variable de interés. Pode-
mos considerar dos tipos de factores:
Factor tratamiento: Es un factor que nos interesa conocer, dada su influencia sobre la
variable respuesta de un estudio particular.
Factor bloque: es un factor en el que no se está interesado en conocer su influencia en la

respuesta pero se supone que ésta existe y se quiere controlar para disminuir la variabilidad
residual.
6. Niveles: Son los resultados de un factor. Según sean elegidos, ya sea por el experimentador o
escogidos al azar de una amplia población, se denominan factores de efectos fijos o factores de
efectos aleatorios.
7. Diseño balanceado: También llamado diseño equilibrado, es el diseño en el que todos los
tratamientos son asignados a un número igual de unidades experimentales.
A.2. Diseño con un factor
Este diseño consta de un solo factor, también llamada variable explicativa. Esta variable puede ser
fija o aleatoria y comprende k niveles (tratamientos) con k ≥ 2, l. El propósito principal es realizar
contrastes acerca de si los efectos que producen los tratamientos en la variable respuesta son iguales
o no. El modelo de los efectos principal para este tipo de diseño es:
yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.1)

Luego, la notación referida al modelo anterior es:
yij : j-ésima observación, del i-ésimo tratamiento
µ: Media global.
αi : Efecto de la respuesta sobre el i-ésimo tratamiento.
ni : Número de observaciones del i-ésimo tratamiento.
eij : Error experimental de la j-esima observación, sobre el i-ésimo tratamiento.
Además, sabemos que el tamaño poblacional de nuestro experimento denotado por N , se exhibe
Xk
como N = ni
i=1
A.2.1. Diseño con un factor fijo
La docimacia para este tipo de diseño, la vamos a expresar de la siguiente forma:
H0 : α1 = ... = αk = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.2)
Vamos a considerar el modelo de los efectos visto en (A.8). Entonces, los siguientes supuestos para
este tipo de diseño son:
Los errores (ij ): Los errores o residuos son independientes entre sı́ y además se encuentran
iid
normalmente distribuidos. Entonces cov(i , j ) = 0 y ij ∼ N (0, σ2 )
k
X
Factor (αi ): αi = 0
i=1
iid
De acuerdo al supuesto que los yij ∼ N (0, σ 2 ) vamos a estimar los parámetros de interés para
este diseño, entonces, a partir de la suma de los cuadrados del error S expresada como:
k X
X n k X
X n
2
S= (eij ) = (yi j − µ − αi )2 (A.3)
i=1 j=1 i=1 j=1
Entonces, estimaremos los parámetros de interés. No obstante, para un diseño de factor fijo, nos
encontramos con dos posibilidades: balanceado o no balanceado, por ende, la estimación se verá
restringida a estos casos.
Diseño con un factor fijo no balanceado
Este diseño consta de una cantidad de observaciones que irá variando por nivel i. Por lo tanto,
estimando mediante el método de minimos cuadrados, considerando (A.3) obtendremos los siguientes
estimadores:
bi = y.. ∧ α
µ bi = yi. − y.. ∧ b
ij = yij − µ
b−α
bi
Luego, para poder estimar los parámetros de interés, requerimos de:
La media general:
k ni
1 XX
y .. = yij
N i=1 j=1
Media de cada tratamiento:

n
i
1X
y i. = yij
n j=1
Finalmente, descomponemos la suma de cuadrados, para la construcción de nuestra tabla ANOVA.

Entonces,
X ni
k X ni
k X
X ni
k X
X
(yij − y .. )2 = 2
(y i. − y .. ) + (yij − y i. )2
i=1 j=1 i=1 j=1 i=1 j=1
| {z } | {z } | {z }
Suma de cuadrados totales(SCT) Suma de cuadrados del modelo (SCM) Suma de cuadrados del error (SCE)
Por lo tanto, la tabla ANOVA respectiva es:
Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico

SCM M SCM
Modelo k−1 SCM k−1
T = M SCE
SCE
Residuo N −k SCE N −k
SCT
Total N −1 SCT N −1
Observación: El estadı́stico T distribuye Fisher-Snedecor tal que, T ∼ F(k−1;n−k) . Además podemos

SCM SCE
expresar como M SCM = k−1
y M SCE = N −k
.
Finalmente, sea ℵ la región de rechazo con un nivel de significancia α para la dócima que se
exhibe en (A.2), tal que:
ℵ = {Se rechaza H0 | T > F(k−1;N −k) }

Diseño con un factor fijo balanceado
En este diseño, la cantidad de observaciones por nivel observado será la misma. Luego, los estimadores
respectivos son:
b = y.. ∧ α
µ bi = yi. − y.. ∧ b
ij = yij − µ
b−α
bi
Luego, para poder estimar los parámetros de interés, requerimos de:
La media general:
k n
1 XX
y .. = yij
nk i=1 j=1
Media de cada tratamiento:
n n
1X 1X
y i. = yij =⇒ y .j = yij
n j=1 k j=1
La suma de cuadrados se descompone de la misma manera que en el caso anterior, es decir, SCT =
SCM + SCE, no obstante, obtendremos lo siguientes resultados:
k X
X n
SCT = (yij − y .. )2
i=1 j=1
X k
SCM = n (yi. − y .. )2
i=1
k X
X n
SCE = (yij − y .. )2
i=1 j=1
Observación: Al igual que en el caso no-balanceado, la tabla ANOVA y la región de rechazo se

exhiben del mismo modo.
A.2.2. Diseño con un factor aleatorio
Consideremos el siguiente modelo:
yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.4)
Cuyos supuestos, a diferencia del diseño de factor fijo variarán para k niveles, dado esta vez un factor
aleatorio. Entonces:
iid
ij ∼ N (0, σ2 )
iid
αi ∼ N (0, σα2 )
Nota:
1. Cabe destacar que σα2 es la varianza asociada al factor, esta vez de carácter aleatorio.
2. Los estimadores obtenidos en el diseño de factor fijo y la tabla ANOVA son análogos para este
diseño.
A.3. Comparaciones Múltiples y Análisis de contrastes
Las comparaciones múltiples nos permiten comparar tratamientos y hallar diferencias entre ellos;
Este análisis trae implicancias con respecto los efectos significativos que conlleva un tratamiento
particular en mis datos. Por lo tanto, vamos a estudiar distintas metodologı́as para efectuar las
comparaciones respectivas.
A.3.1. Contrastes
Método de Scheffé
Este método es utilizado cuando no se tiene claro el número de comparaciones que se desea rea-
lizar, con esto se puede comparar cualquier contraste o bien posibles contrastes entre medias de
tratamientos. Entonces, considerando una combinación lineal de la forma:
k
X k
X
L
b= ci µi =⇒ ci = 0 (A.5)
i=1 i=1
Luego, la prueba de hipótesis para el método de Scheffé es:

k
X k
X
H0 : ci µi = 0 v/s H1 : ci µi 6= 0
i=1 i=1
En efecto, podemos definir la región de rechazo R con un nivel de significancia α, de la forma:
 v 
 u k 2
X cj 
u
b > t(k − 1)F(k−1;n−k;1−α) M SCE
R = Se rechaza H0 L
 nj  j=1
Finalmente, consideramos un intervalo confidencial (1 − α)100 % de confianza, para L, tal que:

 v 
u k 2
u X cj
IC(L; 1 − α) = L b ± σ t(k − 1)F(k−1;n−k; α ) 
2
j=1
n j
Método de Bonferroni
Este método nos permite realizar a diferencia del método anterior, s contrastes. Es de esta manera,
que esta metodologı́a conlleva la comparación de medias, considerando coeficientes peso cj para cada
una de las medias consideradas. De esta manera, podemos expresar una combinación lineal L cf que
se exhibe como:
k
X k
X
L
cf = cif µi =⇒ cif 6= 0 f = 1, 2, ..., s (A.6)
i=1 i=1
El planteamiento de la prueba de hipótesis para este método es:

k
X k
X
H0 : cif µi = 0 v/s H1 : cif µi 6= 0
i=1 i=1
En efecto, podemos definir la región de rechazo Rf con un nivel de significancia α, de la forma:
 v 
 u k 2
X cjf 
u
cf > t(n − k)F(k−1;n−k;1− α ) M SCE
Rf = Se rechaza H0 L
 2s
nj  j=1
Observación: Notar que basta para alguno de los s contrastes que se rechase H0 , se concluye para
el test, que se rechaza finalmente la hipótesis nula.
A.3.2. Comparaciones de pares de Medias por tratamiento
Método de Tukey
Sirve para probar todas las diferencias de medias de tratamientos de una experiencia. Por ende, es
importante que el número de repeticiones por tratamiento sea constante. Es ası́, como para determinar
si esta diferencia es significativa, postulamos que la prueba de hipótesis bajo este contexto sea:
H0 : µi = µj v/s H1 : ∃ µi 6= µj ∀i 6= j (A.7)
En virtud de (A.7), podemos definir la región de rechazo W con un nivel de significancia α, de la

forma:
( r )
M SCE
W = bj − µ
Se rechaza H0 µ bi > q(k,k(n−1),1−α)
n
Observaciónes:
1. La tabla de valores estudentizados de Tukey con un α nivel de significancia, entrega los valores
de q(k,k(n−1),1−α) .
2. k es la cantidad de comparaciones que realizaremos, con un total de n observaciones
Finalmente, podemos calcular un intervalo (1 − α)100 % de confianza, para µj − µi , de la forma:

r !
M SCE
IC(µj − µi ; 1 − α) = µbj − µbi ± q(k,k(n−1),1−α)
n
A.4. Diseños de bloques completamente aleatorizados
En este diseño, se requiere estudiar la influencia de un factor con k niveles sobre la variable
respuesta, en presencia de un factor bloque controlado con b niveles. Ası́, tenemos el siguiente modelo
de efectos aditivo (sin interacción entre bloque y tratamiento).
yij = µ + αi + βj + ij i = 1, 2, ..., k j = 1, 2, ..., b (A.8)
Notación: µ representa la media global, mientras que αi es el efecto del i-ésimo tratamiento y βj es
el efecto del j-ésimo bloque. Finalmente, ij son los residuos o errores.
De acuerdo a la información anterior, los supuestos de este diseño son:
Los errores (ij ): Los errores o residuos son independientes entre sı́ y además se encuentran
iid
normalmente distribuidos. Entonces cov(i , j ) = 0 y ij ∼ N (0, σ2 )
k
X b
X
Factor Tratamiento y Factor Bloque (αi y βj ): αi = 0 ∧ βj = 0
i=1 j=1
A partir de los supuestos del modelo, vamos a considerar la docimacia para este modelo, la cual
es la misma que para el caso de un diseño con un factor, vale decir, H0 : α1 = ... = αk = 0
Para docimar esta hipótesis, vamos a realizar un análisis de varianza (ANOVA) para concluir
respecto a la hipótesis nula. Se desprende por lo tanto que:

Pk 2 SCTr M SCTr
Tratamientos k−1 i=1 ni (y i. − y .. ) k−1
Fα = M SCE
Pb 2 SCB M SCB
Bloques b−1 j=1 nj (y .j − y .. ) b−1
Fβ = M SCR
SCR
Residuos (b − 1)(k − 1) SCT − SCTr − SCB (b−1)(k−1)
Pk Pb 2 SCT
Total bk − 1 i=1 j=1 (yij − y .. ) bk−1
Observación: El estadı́stico Fα y Fβ distribuyen Fisher-Snedecor tal que, Fα ∼ F(k−1;(b−1)(k−1);1−α) ∧

SCTr SCB
Fβ ∼ F(k−1;(b−1)(k−1);1−α) . Además podemos expresar como M SCTr = k−1
, M SCB = (b−1)(k−1)
y
SCR
M SCR = bk−1
.
Finalmente, sea ℵ la región de rechazo con un nivel de significancia α para la dócima que se
exhibe en (A.8), tal que:
ℵ = {Se rechaza H0 | Fα > F(k−1;(b−1)(k−1);1−α) }
A.5. Diseño de cuadrados latinos
Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes de
variabilidad. En dichos diseños el número de niveles del factor principal tiene que coincidir con el
número de niveles de las dos variables de bloque o factores secundarios y además hay que suponer
que no existe interacción entre ninguna pareja de factores. Supongamos que el número de niveles de
cada uno de los factores es K. El diseño en cuadrado latino utiliza K 2 bloques, cada uno de estos
bloques corresponde a una de las posibles combinaciones de niveles de los dos factores de control. En
cada bloque se aplica un solo tratamiento de manera que cada tratamiento debe aparecer con cada
uno de los niveles de los dos factores de control.
Si consideramos una tabla de doble entrada donde las filas y las columnas representan cada
uno de los dos factores de bloque y las celdillas los niveles del factor principal o tratamientos, el
requerimiento anterior supone que cada tratamiento debe aparecer una vez y sólo una en cada fila y
en cada columna.
Recibe el nombre de cuadrado latino de orden K a una disposición en filas y columnas de K

letras latinas, de tal forma que cada letra aparece una sola vez en cada fila y en cada columna.
Luego, vamos a considerar el modelo aditivo de la forma:


 i = 1, 2, ..., K


yij(h) = µ + τi + βj + γh + ij(h) j = 1, 2, ..., K (A.9)


 h = 1, 2, ..., K
Tal que,
yij(h) : Observación correspondiente a la i-ésima fila, j-ésima columna y h-ésima letra latina.
µ: Representa la media global del diseño

PK
τi : Efecto producido por el i-ésimo nivel del factor fila. Cuya restricción es i=1 τi =0
PK
βj : Efecto producido por el j-ésimo nivel del factor columna. Cuya restricción es j=1 βj = 0
γh : Efecto producido por la h-ésima letra latina. Dichos efectos están sujetos a la restricción
PK
h=1 γh = 0
iid
ij(h) : Es el residuo o factor error, tal que ij(h) ∼ N (0, σ2 )
Estimando por máxima verosimilitud, obtenemos la estimación de los parámetros de nuestro

diseño, entonces:
K X
X K
yij(.)
i=1 j=1
µ
b= = y ... (A.10)
K2
K
X K X
X K
yij(.) yij(.)
j=1 i=1 j=1
τbi = − = y i.. − y ... (A.11)
K K2
K K X
X K
X
yij(.) yij(.)
i=1 i=1 j=1
βbj = − = y .j. − y ... (A.12)
K K2
K
X K X
X K
yij(h) yij(.)
i,j i=1 j=1
γ
bh = − = y ..h − y ... (A.13)
K K2
ijh = yij(h) − y i.. − y .j. − y ..h + 2y ... (A.14)
En virtud de las expresiones anteriores, la descomposición de la suma de cuadrados, se

construye de la forma:
K X
X K K
X K
X
(yij(h) − y ... )2 = K (y i.. − y ... )2 + K (y .j. − y ... )2 +
i=1 j=1 i=1 j=1
| {z } | {z } | {z }
Suma de cuadrados totales(SCT) Suma de cuadrados efecto fila (SCBF) Suma de cuadrados por efecto columna (SCBC)
X K K X
X K
K (y ..h − y ... )2 + (yij(h) − y i.. − y .j. − y ..h + 2y ... )2
h=1 i=1 j=1
| {z } | {z }
Suma de cuadrados por letra latina (SCLL) Suma de cuadrados del error (SCE)
Finalmente, realizaremos el análisis de varianza (ANOVA), para este diseño. La tabla respectiva
es:

SCBF M SCBF
Bloque fila K −1 SCBF K−1
Fα = M SCE
SCBC M SCBC
Bloque columna K −1 SCBC K−1
Fβ = M SCE
SCLL M SCLL
Tratamiento K −1 SCLL (K−1)(K−2)
Fγ = M SCE
SCE
Error (K − 1)(K − 2) SCE (K−1)(K−2)
SCT
Total K2 − 1 SCT K 2 −1
Observación: Los estadı́stico Fα , Fβ y Fγ distribuyen Fisher-Snedecor tal que, Fα ∼ F(K−1;(K−1)(K−2);1−α) ∧
Fβ ∼ F(K−1;(K−1)(K−2);1−α) ∧ Fγ ∼ F(K−1;(K−1)(K−2);1−α) . Además podemos expresar como M SCBF =
SCBF SCBC SCLL SCE
K−1
, M SCBC = K−1
, M SCLL = K−1
y M SCE = (K−1)(K−2)
.
Los estadı́sticos obtenidos, nos permiten validar las dócimas de hipótesis para los parámetros αi ,
βj y γh . En consecuencia, se denotan las hipótesis como:
H0 : α1 = ... = αK = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.15)
H0 : β1 = ... = βK = 0 versus H1 : ∃ βi 6= βj , i 6= j (A.16)
H0 : γ1 = ... = γK = 0 versus H1 : ∃ γi 6= γj , i 6= j (A.17)
La regiones de rechazo ℵα , ℵβ , ℵγ , con un nivel de significancia α para validar los supuestos, son:
ℵα = {Se rechaza H0 | Fα > F(K−1;(K−1)(K−2);1−α) }
ℵβ = {Se rechaza H0 | Fβ > F(K−1;(K−1)(K−2);1−α) }
ℵγ = {Se rechaza H0 | Fγ > F(K−1;(K−1)(K−2);1−α) }
A.6. Diseño de cuadrados grecolatinos
Consideremos un cuadrado latino K × K al cual se le superpone un segundo cuadrado latino

K × K en el que los tratamientos se expresan con letras griegas. En el momento que se hace la
superposiciòn los dos cuadrados tiene la propiedad de que cada letra griega aparece una y solo una
vez con cada letra latina, se dice que los dos cuadrados latinos son ortogonales, entonces, el diseño
respectivo se denota como grecolatino.
El modelo aditivo asociado a este diseño es:


 i = 1, 2, ..., K


 j = 1, 2, ..., K
yijpl = µ + θi + τj + ωp + ψl + ijpl (A.18)


 p = 1, 2, ..., K

l = 1, 2, ..., K

donde,
yijpl : Observación del renglón i y la columna l para la letra latina j y la letra griega p
µ: Media global
θi : Efecto del renglón i-ésimo
τj : Efecto del tratamiento de la letra latina j
ωp : Efecto de la letra griega p
ψl : Efecto de la columna l
ijpl : Componente del error aleatorio, cuya distribución es iid normal.
La descomposición de la suma de cuadrados para este diseño es la siguiente:
K
X
SCLL = K (y .j.. − y .... )2
j=1
K
X
SCLG = K (y ..p. − y .... )2
p=1
K
X
SCRG = K (y i... − y .... )2
i=1
K
X
SCCL = K (y ...l − y .... )2
l=1
K X
X K X
K X
K
SCT = (yijpl − y .... )2
i=1 j=1 p=1 l=1
SCE = SCT − SCLL − SCLG − SCRG − SCCL
Entonces, el análisis de varianza(ANOVA) respectivo, y en virtud de las expresiones anteriores es:

SCLL M SCLL
Tr Letras latinas K −1 SCLL K−1
F1 = M SCE
SCLG M SCLG
Tr Letras griegas K −1 SCLG K−1
F2 = M SCE
SCRG M SCRG
Renglones K −1 SCRG K−1
F3 = M SCE
SCCL M SCCL
Columnas K −1 SCCL K−1
F4 = M SCE
SCE
Error (K − 3)(K − 1) SCE (K−3)(K−1)
2 SCT
Total K −1 SCT K 2 −1
Observaciónes:
1. Notar que Fk ∼ F(K−1;(K−3)(K−1);1−α) ∀k = 1, 2, 3, 4
2. Se realiza la misma validación de hipótesis, considerando regiones de rechazo ℵk
A.7. Reglas de Cornfield y Tuckey
A.7.1. Grados de libertad para la fuente de variación en ANOVA
1. Los grados de libertad asociados a la fuente de variación total son iguales al producto de los
niveles de todos los factores menos uno.
2. Los grados de libertad de la interacción entre dos o más factores cruzados son iguales al producto
de sus respectivos grados de libertad, anotando que para un factor en particular es el número
de niveles menos uno.
3. Los grados de libertad de un factor anidado en un factor cruzado, son iguales al producto de
los grados de libertad del factor anidado por el número de niveles del factor cruzado.
4. Si un factor está anidado en otro factor pero a la vez interacciona con un tercer factor. Los
grados de libertad para la interacción son iguales a los grados de libertad del factor anidado
multiplicado por el número de niveles del factor en que se anida y por los grados de libertad
del factor con el que se cruza.
5. Los grados de libertad para repeticiones son componente que siempre está anidado en las
combinaciones de todos los demás factores; por lo anterior, los grados de libertad son (r − 1)
por el número de niveles de los demás factores.
6. Los grados de libertad para factores principales son simplemente el número de niveles que tenga
el factor menos uno.
7. Los grados de libertad del error experimental se pueden hallar a partir de la diferencia de los
grados de libertad de la fuente de variación total menos las demás fuentes de variación presentes
en el modelo de clasificación experimental.
A.7.2. Construcción del cuadrado medio
Para construir el cuadrado medio se requiere conocer el tipo de efecto, si es aleatorio o fijo, o un
componente mixto. Las reglas son las siguientes:
1. Las interacciones entre factores fijos y aleatorios se consideran aleatorios.

2. A cada factor aleatorio se le asigna su componente de varianza σ 2 .
3. A cada factor fijo se le asigna su efecto fijo representado por la suma de cuadrados de los
parámetros dividido por sus grados de libertad.
4. Los sub-indices de cada término se clasifican en tres clases:
Ausentes: Pertenecen al modelo, pero no están en el término
Activos: Están en el término y no se encuentran entre paréntesis
Pasivos: Están en el término y se encuentran entre paréntesis.
A.7.3. Construcción del cuadrado medio esperado
A partir de un modelo determinado, se construye una tabla con todos los parámetros constituyen-
tes, esto incluye a la componente de error, no ası́ a la media global del diseño. Los parámetros por
convención se escriben en la primera columna.
En el encabezado de la tabla (de izquierda a derecha), se escribe en la primera fila (desde el encabezado
hacia arriba) los subı́ndices que participan en el modelo, en la segunda fila (por sobre la primera),
se colocan la cantidad de niveles que tiene cada subı́ndice, generalmente hablamos de expresiones
algebraicas, ya sea a, b, c, ..., etc. y finalmente, en la tercera fila del encabezado de la tabla, se coloca
el tipo de factor que representa cada subı́ndice, ya sea fijo (F) o aleatorio (A).
En el espacio conjunto, es decir donde se intersectan subı́ndices con respecto a los factores y/o
componente de error, colocamos numeración, ya sea 1 o 0, de acuerdo a las siguientes condiciones:
En cada fila se escribe (1) si uno de los sub-indices pasivos (también están entre paréntesis los
correspondientes a los anidados) de los componentes de la fila coincide con el sub-indice de la
columna.
Si algún sub-indice de la fila la coincide con el sub-indice de la columna se escribe: 1 si es un

factor aleatorio y 0 si es un factor fijo.
En los espacios restantes se escriben los niveles correspondientes a la columna respectiva
valor esperado
Para obtener el valor esperado, de acuerdo a los pasos anteriormente descritos, se exhiben los si-
guientes pasos:
Se tapan todas las columnas encabezadas por los sub-indices activos de ese componente.
Se multiplican los números de las filas que tienen al menos los mismos sub-indices que el
componente, multiplicandolo a su vez por el factor fijo (suma de cuadrados) o el factor aleatorio
(varianza) obtenidos.
La sumatoria de estos productos es la esperanza de los cuadrados medios.
A.8. Diseño factorial
En ocasiones el experimentador está interesado en estudiar el efecto sobre la variable respuesta

de varios factores. En estos casos, la alternativa a la experimentación clásica en la que se estudia el
efecto de cada factor en experimentos independientes, es el diseño factorial.En este diseñoo, además
se verifica si existe información de la acción combinada de los tratamientos de los factores, lo que se
conoce como interacción.
Vamos a analizar a continuación, algunos diseños factoriales usuales.
A.8.1. Análisis Factorial: 2 factores de efecto fijo y/o aleatorio y/o mixto
Se tiene un factor A con a niveles, y un factor B con b niveles y para cada combinación AB de
tratamientos, se tienen n repeticiones. El modelo aditivo de este diseño está dado por:

 i = 1, 2, ..., a


yijk = µ + αi + βj + (αβ)ij + ijk j = 1, 2, ..., b (A.19)


 k = 1, 2, ..., n
donde,
yijk : Resultado del tratamiento i de A y del tratamiento j de B en la réplica k
(αβ)ij : Interacción del tratamiento i de A y del tratamiento j de B.
Los supuestos, para diseños de factores fijo, aleatorio o mixto son los siguientes:
1. Factores fijos:
a
X b
X a
X b
X
αi = βj = (αβ)ij = = (αβ)ij = 0
i=1 j=1 i=1 j=1
iid
ijk ∼ N (0, σ2 )
2. Factores aleatorios:
αi ∼ N (0, σα2 ) ∧ βj ∼ N (0, σβ2 ) ∧ (αβ)ij ∼ N (0, σαβ

2
)
iid
ijk ∼ N (0, σ2 )
3. Factores mixtos:
En el caso que A sea fijo, y B aleatorio:

a X a
X
2 a−1 2
• αi = 0 ∧ βj ∼ N (0, σβ ) ∧ (αβ)ij ∼ N 0, σαβ ∧ (αβ)ij = 0
i=1
a i=1
iid
• ijk ∼ N (0, σ2 )
En el caso que A sea aleatorio, y B sea fijo:

b b
X b−1 2 X
• βj = 0 ∧ αi ∼ N (0, σα2 ) ∧ (αβ)ij ∼ N 0, σαβ ∧ (αβ)ij = 0
j=1
b j=1
iid
• ijk ∼ N (0, σ2 )
Los estimadores de los parámetros de este caso particular de modelo factorial serán:
b = y ...
µ
bi = y i.. − y ...
α
βbj = y .j. − y ...

c =y −y −y +y
αβ ij ij. i.. .j. ...
Considerando las pruebas de hipótesis para los parámetros de interés, ya sea factores A, B o la
interacción AB. Las dócimas respectivas para factores fijos son:
H0 : α1 = ... = αa = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.20)
H0 : β1 = ... = βb = 0 versus H1 : ∃ βi 6= βj , i 6= j (A.21)
H0 : (αβ)ij = 0 versus H1 : ∃ (αβ)ij 6= 0, i 6= j (A.22)
Para factores aleatorios:
H0 : σα2 = 0 v/s H1 : σα2 > 0 (A.23)

H0 : σβ2 = 0 v/s H1 : σβ2 > 0 (A.24)
2 2
H0 : σαβ = 0 v/s H1 : σαβ >0 (A.25)
Luego, las tablas (ANOVA) respectivas al caso de factores fijos o aleatorio son:

SCF A M SCF A
F. A a−1 SCF A a−1
Fα = M SCE
SCF B M SCF B
F. B b−1 SCF B b−1
Fβ = M SCE
SCF AB M SCF AB
Int. (AB) (a − 1)(b − 1) SCF AB (a−1)(b−1)
Fαβ = M SCE
SCE
Residuo ab(n − 1) SCE ab(n−1)
SCT
Total abn − 1 SCT (abn−1)

SCF A M SCF A0
F. A a−1 SCF A a−1
Fα = M SCF AB
SCF B M SCF B 0
F. B b−1 SCF B b−1
Fβ = M SCF AB
SCF AB M SCF AB 0
Int. (AB) (a − 1)(b − 1) SCF AB (a−1)(b−1)
Fαβ = M SCE
SCE
SCT
Cabe descatar que, la descomposición de suma de cuadrados para este diseño es de la forma:
SCT = SCE + SCF A + SCF B + SCF AB . (A.26)
Consideremos, entonces la expresión para cada suma de cuadrados:

X a X
b Xa
2
SCT = (yij − y .. ) ∧ SCF A = bn (αi )2
i=1 j=1 i=1
Xb a X
X b
SCF B = an (βj )2 ∧ SCF AB = n (αβ)2ij
j=1 i=1 j=1
Notar que:
1. Los estadı́sticos para caso factor fijo y aleatorio distribuyen de la forma Fα ∼ F(a−1;ab(n−1)) ∧
Fβ ∼ F(b−1;ab(n−1)) ∧ Fαβ ∼ F(a−1)(b−1);ab(n−1)
2. La región de rechazo para cada una de las dócimas estará condicionada de tal forma que H0 se
rechaza si y solamente si (para cada dócima por separado o para todas simultáneamente):
Fα > F(a−1;ab(n−1)) para las dócimas (A.20) o (A.23), ya sea un diseño fijo o aleatorio
respectivamente.
Fβ > F(b−1;ab(n−1)) para las dócimas (A.21) o (A.24), ya sea un diseño fijo o aleatorio
respectivamente.
Fαβ > F(a−1)(b−1);ab(n−1) para las dócimas (A.22) o (A.25), ya sea un diseño fijo o aleatorio
respectivamente.
Es importante recalcar, que las expresiones algebraicas las podemos generalizar para un diseño
factorial con m factores, luego, se hace extensible la posibilidad de revisar más posibilidades de
estudio, donde interactúen factores entre sı́ y de forma separada. Se construye del mismo modo la
tabla ANOVA, donde los grados de libertad, los cuadrados medios esperados y las respectivas es-
tadı́sticas de prueba se calculan utilizando la regla de Cornfield y Tukey.
Es posible también querer controlar una fuente de variación o factor extraño, dando lugar a la
formación de bloques en el diseño factorial, el cual puede ser fijo o aleatorio y tiene efecto aditivo,
es decir, no interactúa con los factores. De esta manera si se tiene un diseño con dos factores y un
factor bloque, el modelo será el mismo que para el diseño con dos factores sumándole el efecto bloque,
pudiéndose generalizar para cuando se usan más de dos factores.
A.9. Diseño de parcelas divididas
Este es un diseño experimental combinado que resulta útil cuando al estudiar simultáneamente
varios factores, alguno o algunos de ellos deben ser aplicados sobre unidades experimentales relativa-
mente grandes, pudiéndose aplicar el otro o los otros en unidades experimentales menores, dentro de
las unidades mayores. El caso más sencillo es aquél en el que se tienen sólo dos factores, asignando los
niveles de uno de ellos a las unidades mayores y los niveles del otro a las subunidades. A las unidades
experimentales mayores suele llamárseles parcelas grandes o parcelas principales y a las unidades ex-
perimentales menores se le llama subparcelas o subunidades. En un algunos experimentos factoriales
con factores múltiples quizás no sea posible la aleatorización completa del orden de las corridas. Esto
suele resultar en una generalización del diseño factorial llamada diseño de parcelas subdivididas. El
modelo respectivo para este diseño es:
A.9.1. Diseño de parcelas divididas para dos factores y un bloque
Los diseños en parcelas divididas (P.D.) y subdivididas (P.S.D) se emplean frecuentemente en ex-
perimentos factoriales en las condiciones del material experimental, o las operaciones experimentales
contempladas dificultan el manejo de todas la combinación de factores. El modelo estadı́stico para
el diseño de parcelas subdivididas es:

 i = 1, 2, ..., r


yijk = µ + τi + βj + (τ β)ij + γk + (τ γ)ik + (βγ)jk + (τ βγ)ijk + ijk j = 1, 2, ..., a (A.27)


 k = 1, 2, ..., b
La notación referida a este diseño es la siguiente:
τi ,βj y (τ β)ij : En conjunto nos referimos a la parcela completa. Respectivamente, representan

los bloques, tratamientos principales (factor A), y el error de la parcela completa
γk , (τ γ)ik , (βγ)jk , (τ βγ)ijk : En conjunto representan la subparcela. Respectivamente representan

tratamiento de la subparcela (factor B), réplicas × B, interacciones AB y Error de la subparcela
(bloques × AB)
A.10. Diseños Anidados
Existen ocasiones donde los niveles de un factor B son similares pero no idénticos para diferentes
niveles del factor A. Es decir, que son similares para cada nivel del factor A pero por no ser idénticos,
se encuentran anidados en el nivel al que correspondan para el factor A. A este tipo de diseños se
les llama anidados o jerárquicos1 .
A.10.1. Diseños anidados para dos factores
El modelo estadı́stico para el diseño también llamado de dos etapas es:

 i = 1, 2, ..., a


yijk = µ + αi + βj(i) + (ij)k j = 1, 2, ..., b (A.28)


 k = 1, 2, ..., n
µ es la media global, αi es el factor A con a niveles, βj(i) es el factor B anidado en A con b niveles,
mientras que, (ij)k el error.
En virtud de la teorı́a vista durante este manual y desprendida de textos de apoyo referidos al diseño
y análisis de experimentos2 , la descomposición de la suma de cuadrados usual queda de la forma:
1
Con los niveles del factor B anidados bajo los niveles de el factor A
2
Montgomery, “Diseño y Análisis de Experimentos”(2004)
a X
X b X
n
SCT = (yijk − y ... )2
i=1 j=1 k=1
a
X
SCF A = bn (y i.. − y ... )2
i=1
a X
X b
SCF A(B) = n (y ij. − y ... )2
i=1 j=1
Dado que SCT = SCF A + SCF A(B) + SCE =⇒ SCE = SCT − SCF A − SCF A(B)
De esta manera, podemos considerar los parámetros constituyentes de la ecuación (A.28), de modo
que se estiman:
µ
b = y ...
bi = y i.. − y ...
α
βbj(i) = y ij. − y ...
Con toda la información teórica anterior, podemos realizar el análisis de docimacia para este modelo,
de modo que, la tabla ANOVA para un diseño anidado para factores fijos es:

SCF A M SCF A
FA a−1 SCF A a−1
Fα = M SCE
SCF A(B) M SCF A(B)
FA(B) a(b − 1) SCF A(B) a(b−1)
Fα(β) = M SCE
SCE
SCT
En cambio, cuando los factores son aleatorios, el análisis de varianza (ANOVA) queda como:

SCF A M SCF A
FA a−1 SCF A a−1
Fα = M SCF A(B)
SCF A(B) M SCF A(B)
FA(B) a(b − 1) SCF A(B) a(b−1)
Fβ(α) = M SCE
SCE
SCT
Notar que:
1. Los estadı́sticos para caso factor fijo y aleatorio distribuyen de la forma Fα ∼ F(a−1;ab(n−1)) ∧
Fα(β) ∼ F(a(b−1);ab(n−1))
A.11. Referencias Bibliográficas
Dı́az Abel, ”Diseño Estadı́stico de Experimentos”(1999)
Douglas C. Montgomery, ”Diseño Estadı́stico de Experimentos”(2004)
Joan Ferré, F. Xavier Rius, “Introducción al diseño estadı́stico de experimentos”

Manual Taller1 DiseñoExperimentos

Transféré par

Informations du document

Description originale:

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Manual Taller1 DiseñoExperimentos

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSIDAD DE SANTIAGO DE CHILE

DEPARTAMENTO DE MATEMÁTICA Y C.C

Integrantes: Italo Chiappa

Diseño y Análisis de Experimentos

La investigación de procesos, en diversas áreas de estudio persiguen descubrir algo respecto a

A.1. Conceptos básicos

1. Unidad Experimental: Es un elemento animado y/o inanimado, seleccionado de forma obje-

2. Tratamiento: El tratamiento es el proceso de modificación de factores de uno o más elementos

3. Aleatorización: Las unidades experimentales se seleccionan aleatoriamente, por lo que la

4. Replicación: Es la reiteración con la que se realiza un experimento. Esta repetición, contribuye

Factor bloque: es un factor en el que no se está interesado en conocer su influencia en la

A.2. Diseño con un factor

yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.1)

A.2.1. Diseño con un factor fijo

La docimacia para este tipo de diseño, la vamos a expresar de la siguiente forma:

H0 : α1 = ... = αk = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.2)

Diseño con un factor fijo no balanceado

Luego, para poder estimar los parámetros de interés, requerimos de:

Media de cada tratamiento:

Finalmente, descomponemos la suma de cuadrados, para la construcción de nuestra tabla ANOVA.

Por lo tanto, la tabla ANOVA respectiva es:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico

Observación: El estadı́stico T distribuye Fisher-Snedecor tal que, T ∼ F(k−1;n−k) . Además podemos

ℵ = {Se rechaza H0 | T > F(k−1;N −k) }

Luego, para poder estimar los parámetros de interés, requerimos de:

Observación: Al igual que en el caso no-balanceado, la tabla ANOVA y la región de rechazo se

A.2.2. Diseño con un factor aleatorio

Consideremos el siguiente modelo:

yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.4)

A.3. Comparaciones Múltiples y Análisis de contrastes

Luego, la prueba de hipótesis para el método de Scheffé es:

En efecto, podemos definir la región de rechazo R con un nivel de significancia α, de la forma:

Finalmente, consideramos un intervalo confidencial (1 − α)100 % de confianza, para L, tal que:

El planteamiento de la prueba de hipótesis para este método es:

En efecto, podemos definir la región de rechazo Rf con un nivel de significancia α, de la forma:

A.3.2. Comparaciones de pares de Medias por tratamiento

En virtud de (A.7), podemos definir la región de rechazo W con un nivel de significancia α, de la

Finalmente, podemos calcular un intervalo (1 − α)100 % de confianza, para µj − µi , de la forma:

A.4. Diseños de bloques completamente aleatorizados

yij = µ + αi + βj + ij i = 1, 2, ..., k j = 1, 2, ..., b (A.8)

De acuerdo a la información anterior, los supuestos de este diseño son:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico

Observación: El estadı́stico Fα y Fβ distribuyen Fisher-Snedecor tal que, Fα ∼ F(k−1;(b−1)(k−1);1−α) ∧

ℵ = {Se rechaza H0 | Fα > F(k−1;(b−1)(k−1);1−α) }

A.5. Diseño de cuadrados latinos

Recibe el nombre de cuadrado latino de orden K a una disposición en filas y columnas de K

Luego, vamos a considerar el modelo aditivo de la forma:

µ: Representa la media global del diseño

Estimando por máxima verosimilitud, obtenemos la estimación de los parámetros de nuestro

En virtud de las expresiones anteriores, la descomposición de la suma de cuadrados, se

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico

H0 : α1 = ... = αK = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.15)

H0 : β1 = ... = βK = 0 versus H1 : ∃ βi 6= βj , i 6= j (A.16)

H0 : γ1 = ... = γK = 0 versus H1 : ∃ γi 6= γj , i 6= j (A.17)

ℵα = {Se rechaza H0 | Fα > F(K−1;(K−1)(K−2);1−α) }

ℵβ = {Se rechaza H0 | Fβ > F(K−1;(K−1)(K−2);1−α) }

ℵγ = {Se rechaza H0 | Fγ > F(K−1;(K−1)(K−2);1−α) }

A.6. Diseño de cuadrados grecolatinos

Consideremos un cuadrado latino K × K al cual se le superpone un segundo cuadrado latino

El modelo aditivo asociado a este diseño es:

θi : Efecto del renglón i-ésimo

τj : Efecto del tratamiento de la letra latina j

ωp : Efecto de la letra griega p

yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.1)

yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.4)

yij = µ + αi + βj + ij i = 1, 2, ..., k j = 1, 2, ..., b (A.8)

ijpl : Componente del error aleatorio, cuya distribución es iid normal.