Vous êtes sur la page 1sur 25

UNIVERSIDAD DE SANTIAGO DE CHILE

DEPARTAMENTO DE MATEMÁTICA Y C.C

TALLER I
PRIMER SEMESTRE 2016

Manual

Integrantes: Italo Chiappa


Lautaro Collihuı́n
Andrea Hernández
Alvaro Palma
Profesor: Luis Figueroa
Malen Antillanca
Fecha de entrega: 13 de abril de 2016
Índice general

3
Apéndice A

Diseño y Análisis de Experimentos

La investigación de procesos, en diversas áreas de estudio persiguen descubrir algo respecto a


ese sistema en particular. De esta manera, y de acuerdo al contexto de un experimento, podrı́amos
definirlo como una prueba que se realizan sobre ese fenómeno de investigación. Formalmente, la
experimentación es reiterativa, es decir, se repite una serie de veces el experimento, alterando las
variables que están en juego y determinando cambios que al término de la experiencia se vislumbraron;
La realización del experimento implica la realización de un análisis de los resultados obtenidos, para
posteriormente concluir sobre lo ocurrido. En particular, y de acuerdo al contexto de disciplina en
que enfoquemos la experimentación de fenómenos, podemos desarrollar procesos robustos, esto quiere
decir, que sean afectos por la menor cantidad de variables externas a ellos. Luego, podemos definir
un diseño, como la construcción matemática de un modelo que nos permita comprender, y obtener
información numérica, que será analizada estadı́stica y probabilı́sticamente, con la finalidad de poder
tomar decisiones frente al fenómeno de interés.

Los objetivos principales de este capı́tulo, en primera instancia, persiguen conocer los diseños más
usuales para poder modelar experimentos, sus expresiones matemáticas que cooperan en la medición
de los datos que se dispongan ante un experimento dado, por otro lado, y en segundo lugar, a través
del desarrollo matemático de los diferentes diseños, también se pretende exhibir la base teórica en la
cual se apoya la validación de cualquier proceso y supuesto, en particular enfocado a la ingenierı́a, o a
cualquier disciplina cientı́fica que persiga respuestas ante diversas disyuntivas que requiera contestar.

A.1. Conceptos básicos

1. Unidad Experimental: Es un elemento animado y/o inanimado, seleccionado de forma obje-


tiva, y al que se le modificarán factores o condiciones, con la finalidad de observar las respuestas
posibles. La unidad de medida de cada elemento extraı́do, dependerá única y exclusivamente

5
del investigador.

2. Tratamiento: El tratamiento es el proceso de modificación de factores de uno o más elementos


y/o unidades experimentales, cuyos efectos van a ser medidos y comparados.

3. Aleatorización: Las unidades experimentales se seleccionan aleatoriamente, por lo que la


extracción es imparcial. Esto implica, que se cancelan los efectos de factores externos que
pudiesen afectar al experimento y conlleva a independencia de las variables aleatorias bajo
estudio.

4. Replicación: Es la reiteración con la que se realiza un experimento. Esta repetición, contribuye


a incurrir en mejores estimaciones de los errores experimentales, ası́ como, la estimación del
efecto de los factores.

5. Factores: Son las variables independientes, que pueden influir en la variable de interés. Pode-
mos considerar dos tipos de factores:

Factor tratamiento: Es un factor que nos interesa conocer, dada su influencia sobre la
variable respuesta de un estudio particular.

Factor bloque: es un factor en el que no se está interesado en conocer su influencia en la


respuesta pero se supone que ésta existe y se quiere controlar para disminuir la variabilidad
residual.

6. Niveles: Son los resultados de un factor. Según sean elegidos, ya sea por el experimentador o
escogidos al azar de una amplia población, se denominan factores de efectos fijos o factores de
efectos aleatorios.

7. Diseño balanceado: También llamado diseño equilibrado, es el diseño en el que todos los
tratamientos son asignados a un número igual de unidades experimentales.

A.2. Diseño con un factor

Este diseño consta de un solo factor, también llamada variable explicativa. Esta variable puede ser
fija o aleatoria y comprende k niveles (tratamientos) con k ≥ 2, l. El propósito principal es realizar
contrastes acerca de si los efectos que producen los tratamientos en la variable respuesta son iguales
o no. El modelo de los efectos principal para este tipo de diseño es:

yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.1)


Luego, la notación referida al modelo anterior es:
yij : j-ésima observación, del i-ésimo tratamiento
µ: Media global.
αi : Efecto de la respuesta sobre el i-ésimo tratamiento.
ni : Número de observaciones del i-ésimo tratamiento.
eij : Error experimental de la j-esima observación, sobre el i-ésimo tratamiento.

Además, sabemos que el tamaño poblacional de nuestro experimento denotado por N , se exhibe
Xk
como N = ni
i=1

A.2.1. Diseño con un factor fijo

La docimacia para este tipo de diseño, la vamos a expresar de la siguiente forma:

H0 : α1 = ... = αk = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.2)

Vamos a considerar el modelo de los efectos visto en (A.8). Entonces, los siguientes supuestos para
este tipo de diseño son:

Los errores (ij ): Los errores o residuos son independientes entre sı́ y además se encuentran
iid
normalmente distribuidos. Entonces cov(i , j ) = 0 y ij ∼ N (0, σ2 )
k
X
Factor (αi ): αi = 0
i=1

iid
De acuerdo al supuesto que los yij ∼ N (0, σ 2 ) vamos a estimar los parámetros de interés para
este diseño, entonces, a partir de la suma de los cuadrados del error S expresada como:

k X
X n k X
X n
2
S= (eij ) = (yi j − µ − αi )2 (A.3)
i=1 j=1 i=1 j=1

Entonces, estimaremos los parámetros de interés. No obstante, para un diseño de factor fijo, nos
encontramos con dos posibilidades: balanceado o no balanceado, por ende, la estimación se verá
restringida a estos casos.

Diseño con un factor fijo no balanceado

Este diseño consta de una cantidad de observaciones que irá variando por nivel i. Por lo tanto,
estimando mediante el método de minimos cuadrados, considerando (A.3) obtendremos los siguientes
estimadores:
bi = y.. ∧ α
µ bi = yi. − y.. ∧ b
ij = yij − µ
b−α
bi

Luego, para poder estimar los parámetros de interés, requerimos de:

La media general:
k ni
1 XX
y .. = yij
N i=1 j=1

Media de cada tratamiento:


n
i
1X
y i. = yij
n j=1

Finalmente, descomponemos la suma de cuadrados, para la construcción de nuestra tabla ANOVA.


Entonces,

X ni
k X ni
k X
X ni
k X
X
(yij − y .. )2 = 2
(y i. − y .. ) + (yij − y i. )2
i=1 j=1 i=1 j=1 i=1 j=1
| {z } | {z } | {z }
Suma de cuadrados totales(SCT) Suma de cuadrados del modelo (SCM) Suma de cuadrados del error (SCE)

Por lo tanto, la tabla ANOVA respectiva es:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


SCM M SCM
Modelo k−1 SCM k−1
T = M SCE
SCE
Residuo N −k SCE N −k
SCT
Total N −1 SCT N −1

Observación: El estadı́stico T distribuye Fisher-Snedecor tal que, T ∼ F(k−1;n−k) . Además podemos


SCM SCE
expresar como M SCM = k−1
y M SCE = N −k
.

Finalmente, sea ℵ la región de rechazo con un nivel de significancia α para la dócima que se
exhibe en (A.2), tal que:

ℵ = {Se rechaza H0 | T > F(k−1;N −k) }


Diseño con un factor fijo balanceado

En este diseño, la cantidad de observaciones por nivel observado será la misma. Luego, los estimadores
respectivos son:
b = y.. ∧ α
µ bi = yi. − y.. ∧ b
ij = yij − µ
b−α
bi

Luego, para poder estimar los parámetros de interés, requerimos de:

La media general:
k n
1 XX
y .. = yij
nk i=1 j=1
Media de cada tratamiento:
n n
1X 1X
y i. = yij =⇒ y .j = yij
n j=1 k j=1

La suma de cuadrados se descompone de la misma manera que en el caso anterior, es decir, SCT =
SCM + SCE, no obstante, obtendremos lo siguientes resultados:

k X
X n
SCT = (yij − y .. )2
i=1 j=1
X k
SCM = n (yi. − y .. )2
i=1
k X
X n
SCE = (yij − y .. )2
i=1 j=1

Observación: Al igual que en el caso no-balanceado, la tabla ANOVA y la región de rechazo se


exhiben del mismo modo.

A.2.2. Diseño con un factor aleatorio

Consideremos el siguiente modelo:

yij = µ + αi + ij i = 1, 2, ..., k j = 1, 2, ..., ni (A.4)

Cuyos supuestos, a diferencia del diseño de factor fijo variarán para k niveles, dado esta vez un factor
aleatorio. Entonces:

iid
ij ∼ N (0, σ2 )
iid
αi ∼ N (0, σα2 )
Nota:

1. Cabe destacar que σα2 es la varianza asociada al factor, esta vez de carácter aleatorio.

2. Los estimadores obtenidos en el diseño de factor fijo y la tabla ANOVA son análogos para este
diseño.

A.3. Comparaciones Múltiples y Análisis de contrastes

Las comparaciones múltiples nos permiten comparar tratamientos y hallar diferencias entre ellos;
Este análisis trae implicancias con respecto los efectos significativos que conlleva un tratamiento
particular en mis datos. Por lo tanto, vamos a estudiar distintas metodologı́as para efectuar las
comparaciones respectivas.

A.3.1. Contrastes

Método de Scheffé

Este método es utilizado cuando no se tiene claro el número de comparaciones que se desea rea-
lizar, con esto se puede comparar cualquier contraste o bien posibles contrastes entre medias de
tratamientos. Entonces, considerando una combinación lineal de la forma:
k
X k
X
L
b= ci µi =⇒ ci = 0 (A.5)
i=1 i=1

Luego, la prueba de hipótesis para el método de Scheffé es:


k
X k
X
H0 : ci µi = 0 v/s H1 : ci µi 6= 0
i=1 i=1

En efecto, podemos definir la región de rechazo R con un nivel de significancia α, de la forma:

 v 
 u k 2
X cj 
u
b > t(k − 1)F(k−1;n−k;1−α) M SCE
R = Se rechaza H0 L
 nj  j=1

Finalmente, consideramos un intervalo confidencial (1 − α)100 % de confianza, para L, tal que:


 v 
u k 2
u X cj
IC(L; 1 − α) = L b ± σ t(k − 1)F(k−1;n−k; α ) 
2
j=1
n j
Método de Bonferroni

Este método nos permite realizar a diferencia del método anterior, s contrastes. Es de esta manera,
que esta metodologı́a conlleva la comparación de medias, considerando coeficientes peso cj para cada
una de las medias consideradas. De esta manera, podemos expresar una combinación lineal L cf que
se exhibe como:
k
X k
X
L
cf = cif µi =⇒ cif 6= 0 f = 1, 2, ..., s (A.6)
i=1 i=1

El planteamiento de la prueba de hipótesis para este método es:


k
X k
X
H0 : cif µi = 0 v/s H1 : cif µi 6= 0
i=1 i=1

En efecto, podemos definir la región de rechazo Rf con un nivel de significancia α, de la forma:

 v 
 u k 2
X cjf 
u
cf > t(n − k)F(k−1;n−k;1− α ) M SCE
Rf = Se rechaza H0 L
 2s
nj  j=1

Observación: Notar que basta para alguno de los s contrastes que se rechase H0 , se concluye para
el test, que se rechaza finalmente la hipótesis nula.

A.3.2. Comparaciones de pares de Medias por tratamiento

Método de Tukey

Sirve para probar todas las diferencias de medias de tratamientos de una experiencia. Por ende, es
importante que el número de repeticiones por tratamiento sea constante. Es ası́, como para determinar
si esta diferencia es significativa, postulamos que la prueba de hipótesis bajo este contexto sea:

H0 : µi = µj v/s H1 : ∃ µi 6= µj ∀i 6= j (A.7)

En virtud de (A.7), podemos definir la región de rechazo W con un nivel de significancia α, de la


forma:

( r )
M SCE
W = bj − µ
Se rechaza H0 µ bi > q(k,k(n−1),1−α)
n

Observaciónes:

1. La tabla de valores estudentizados de Tukey con un α nivel de significancia, entrega los valores
de q(k,k(n−1),1−α) .
2. k es la cantidad de comparaciones que realizaremos, con un total de n observaciones

Finalmente, podemos calcular un intervalo (1 − α)100 % de confianza, para µj − µi , de la forma:


r !
M SCE
IC(µj − µi ; 1 − α) = µbj − µbi ± q(k,k(n−1),1−α)
n

A.4. Diseños de bloques completamente aleatorizados

En este diseño, se requiere estudiar la influencia de un factor con k niveles sobre la variable
respuesta, en presencia de un factor bloque controlado con b niveles. Ası́, tenemos el siguiente modelo
de efectos aditivo (sin interacción entre bloque y tratamiento).

yij = µ + αi + βj + ij i = 1, 2, ..., k j = 1, 2, ..., b (A.8)

Notación: µ representa la media global, mientras que αi es el efecto del i-ésimo tratamiento y βj es
el efecto del j-ésimo bloque. Finalmente, ij son los residuos o errores.

De acuerdo a la información anterior, los supuestos de este diseño son:

Los errores (ij ): Los errores o residuos son independientes entre sı́ y además se encuentran
iid
normalmente distribuidos. Entonces cov(i , j ) = 0 y ij ∼ N (0, σ2 )
k
X b
X
Factor Tratamiento y Factor Bloque (αi y βj ): αi = 0 ∧ βj = 0
i=1 j=1

A partir de los supuestos del modelo, vamos a considerar la docimacia para este modelo, la cual
es la misma que para el caso de un diseño con un factor, vale decir, H0 : α1 = ... = αk = 0

Para docimar esta hipótesis, vamos a realizar un análisis de varianza (ANOVA) para concluir
respecto a la hipótesis nula. Se desprende por lo tanto que:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


Pk 2 SCTr M SCTr
Tratamientos k−1 i=1 ni (y i. − y .. ) k−1
Fα = M SCE
Pb 2 SCB M SCB
Bloques b−1 j=1 nj (y .j − y .. ) b−1
Fβ = M SCR
SCR
Residuos (b − 1)(k − 1) SCT − SCTr − SCB (b−1)(k−1)
Pk Pb 2 SCT
Total bk − 1 i=1 j=1 (yij − y .. ) bk−1

Observación: El estadı́stico Fα y Fβ distribuyen Fisher-Snedecor tal que, Fα ∼ F(k−1;(b−1)(k−1);1−α) ∧


SCTr SCB
Fβ ∼ F(k−1;(b−1)(k−1);1−α) . Además podemos expresar como M SCTr = k−1
, M SCB = (b−1)(k−1)
y
SCR
M SCR = bk−1
.

Finalmente, sea ℵ la región de rechazo con un nivel de significancia α para la dócima que se
exhibe en (A.8), tal que:

ℵ = {Se rechaza H0 | Fα > F(k−1;(b−1)(k−1);1−α) }

A.5. Diseño de cuadrados latinos

Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes de
variabilidad. En dichos diseños el número de niveles del factor principal tiene que coincidir con el
número de niveles de las dos variables de bloque o factores secundarios y además hay que suponer
que no existe interacción entre ninguna pareja de factores. Supongamos que el número de niveles de
cada uno de los factores es K. El diseño en cuadrado latino utiliza K 2 bloques, cada uno de estos
bloques corresponde a una de las posibles combinaciones de niveles de los dos factores de control. En
cada bloque se aplica un solo tratamiento de manera que cada tratamiento debe aparecer con cada
uno de los niveles de los dos factores de control.

Si consideramos una tabla de doble entrada donde las filas y las columnas representan cada
uno de los dos factores de bloque y las celdillas los niveles del factor principal o tratamientos, el
requerimiento anterior supone que cada tratamiento debe aparecer una vez y sólo una en cada fila y
en cada columna.

Recibe el nombre de cuadrado latino de orden K a una disposición en filas y columnas de K


letras latinas, de tal forma que cada letra aparece una sola vez en cada fila y en cada columna.

Luego, vamos a considerar el modelo aditivo de la forma:



 i = 1, 2, ..., K


yij(h) = µ + τi + βj + γh + ij(h) j = 1, 2, ..., K (A.9)


 h = 1, 2, ..., K

Tal que,

yij(h) : Observación correspondiente a la i-ésima fila, j-ésima columna y h-ésima letra latina.

µ: Representa la media global del diseño


PK
τi : Efecto producido por el i-ésimo nivel del factor fila. Cuya restricción es i=1 τi =0
PK
βj : Efecto producido por el j-ésimo nivel del factor columna. Cuya restricción es j=1 βj = 0
γh : Efecto producido por la h-ésima letra latina. Dichos efectos están sujetos a la restricción
PK
h=1 γh = 0

iid
ij(h) : Es el residuo o factor error, tal que ij(h) ∼ N (0, σ2 )

Estimando por máxima verosimilitud, obtenemos la estimación de los parámetros de nuestro


diseño, entonces:
K X
X K
yij(.)
i=1 j=1
µ
b= = y ... (A.10)
K2
K
X K X
X K
yij(.) yij(.)
j=1 i=1 j=1
τbi = − = y i.. − y ... (A.11)
K K2
K K X
X K
X
yij(.) yij(.)
i=1 i=1 j=1
βbj = − = y .j. − y ... (A.12)
K K2
K
X K X
X K
yij(h) yij(.)
i,j i=1 j=1
γ
bh = − = y ..h − y ... (A.13)
K K2
ijh = yij(h) − y i.. − y .j. − y ..h + 2y ... (A.14)

En virtud de las expresiones anteriores, la descomposición de la suma de cuadrados, se


construye de la forma:
K X
X K K
X K
X
(yij(h) − y ... )2 = K (y i.. − y ... )2 + K (y .j. − y ... )2 +
i=1 j=1 i=1 j=1
| {z } | {z } | {z }
Suma de cuadrados totales(SCT) Suma de cuadrados efecto fila (SCBF) Suma de cuadrados por efecto columna (SCBC)
X K K X
X K
K (y ..h − y ... )2 + (yij(h) − y i.. − y .j. − y ..h + 2y ... )2
h=1 i=1 j=1
| {z } | {z }
Suma de cuadrados por letra latina (SCLL) Suma de cuadrados del error (SCE)

Finalmente, realizaremos el análisis de varianza (ANOVA), para este diseño. La tabla respectiva
es:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


SCBF M SCBF
Bloque fila K −1 SCBF K−1
Fα = M SCE
SCBC M SCBC
Bloque columna K −1 SCBC K−1
Fβ = M SCE
SCLL M SCLL
Tratamiento K −1 SCLL (K−1)(K−2)
Fγ = M SCE
SCE
Error (K − 1)(K − 2) SCE (K−1)(K−2)
SCT
Total K2 − 1 SCT K 2 −1
Observación: Los estadı́stico Fα , Fβ y Fγ distribuyen Fisher-Snedecor tal que, Fα ∼ F(K−1;(K−1)(K−2);1−α) ∧
Fβ ∼ F(K−1;(K−1)(K−2);1−α) ∧ Fγ ∼ F(K−1;(K−1)(K−2);1−α) . Además podemos expresar como M SCBF =
SCBF SCBC SCLL SCE
K−1
, M SCBC = K−1
, M SCLL = K−1
y M SCE = (K−1)(K−2)
.

Los estadı́sticos obtenidos, nos permiten validar las dócimas de hipótesis para los parámetros αi ,
βj y γh . En consecuencia, se denotan las hipótesis como:

H0 : α1 = ... = αK = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.15)

H0 : β1 = ... = βK = 0 versus H1 : ∃ βi 6= βj , i 6= j (A.16)

H0 : γ1 = ... = γK = 0 versus H1 : ∃ γi 6= γj , i 6= j (A.17)

La regiones de rechazo ℵα , ℵβ , ℵγ , con un nivel de significancia α para validar los supuestos, son:

ℵα = {Se rechaza H0 | Fα > F(K−1;(K−1)(K−2);1−α) }

ℵβ = {Se rechaza H0 | Fβ > F(K−1;(K−1)(K−2);1−α) }

ℵγ = {Se rechaza H0 | Fγ > F(K−1;(K−1)(K−2);1−α) }

A.6. Diseño de cuadrados grecolatinos

Consideremos un cuadrado latino K × K al cual se le superpone un segundo cuadrado latino


K × K en el que los tratamientos se expresan con letras griegas. En el momento que se hace la
superposiciòn los dos cuadrados tiene la propiedad de que cada letra griega aparece una y solo una
vez con cada letra latina, se dice que los dos cuadrados latinos son ortogonales, entonces, el diseño
respectivo se denota como grecolatino.

El modelo aditivo asociado a este diseño es:



 i = 1, 2, ..., K


 j = 1, 2, ..., K
yijpl = µ + θi + τj + ωp + ψl + ijpl (A.18)


 p = 1, 2, ..., K

l = 1, 2, ..., K

donde,
yijpl : Observación del renglón i y la columna l para la letra latina j y la letra griega p

µ: Media global

θi : Efecto del renglón i-ésimo

τj : Efecto del tratamiento de la letra latina j

ωp : Efecto de la letra griega p

ψl : Efecto de la columna l

ijpl : Componente del error aleatorio, cuya distribución es iid normal.

La descomposición de la suma de cuadrados para este diseño es la siguiente:

K
X
SCLL = K (y .j.. − y .... )2
j=1

K
X
SCLG = K (y ..p. − y .... )2
p=1

K
X
SCRG = K (y i... − y .... )2
i=1
K
X
SCCL = K (y ...l − y .... )2
l=1
K X
X K X
K X
K
SCT = (yijpl − y .... )2
i=1 j=1 p=1 l=1

SCE = SCT − SCLL − SCLG − SCRG − SCCL

Entonces, el análisis de varianza(ANOVA) respectivo, y en virtud de las expresiones anteriores es:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


SCLL M SCLL
Tr Letras latinas K −1 SCLL K−1
F1 = M SCE
SCLG M SCLG
Tr Letras griegas K −1 SCLG K−1
F2 = M SCE
SCRG M SCRG
Renglones K −1 SCRG K−1
F3 = M SCE
SCCL M SCCL
Columnas K −1 SCCL K−1
F4 = M SCE
SCE
Error (K − 3)(K − 1) SCE (K−3)(K−1)
2 SCT
Total K −1 SCT K 2 −1

Observaciónes:
1. Notar que Fk ∼ F(K−1;(K−3)(K−1);1−α) ∀k = 1, 2, 3, 4

2. Se realiza la misma validación de hipótesis, considerando regiones de rechazo ℵk

A.7. Reglas de Cornfield y Tuckey

A.7.1. Grados de libertad para la fuente de variación en ANOVA

1. Los grados de libertad asociados a la fuente de variación total son iguales al producto de los
niveles de todos los factores menos uno.

2. Los grados de libertad de la interacción entre dos o más factores cruzados son iguales al producto
de sus respectivos grados de libertad, anotando que para un factor en particular es el número
de niveles menos uno.

3. Los grados de libertad de un factor anidado en un factor cruzado, son iguales al producto de
los grados de libertad del factor anidado por el número de niveles del factor cruzado.

4. Si un factor está anidado en otro factor pero a la vez interacciona con un tercer factor. Los
grados de libertad para la interacción son iguales a los grados de libertad del factor anidado
multiplicado por el número de niveles del factor en que se anida y por los grados de libertad
del factor con el que se cruza.

5. Los grados de libertad para repeticiones son componente que siempre está anidado en las
combinaciones de todos los demás factores; por lo anterior, los grados de libertad son (r − 1)
por el número de niveles de los demás factores.

6. Los grados de libertad para factores principales son simplemente el número de niveles que tenga
el factor menos uno.

7. Los grados de libertad del error experimental se pueden hallar a partir de la diferencia de los
grados de libertad de la fuente de variación total menos las demás fuentes de variación presentes
en el modelo de clasificación experimental.

A.7.2. Construcción del cuadrado medio

Para construir el cuadrado medio se requiere conocer el tipo de efecto, si es aleatorio o fijo, o un
componente mixto. Las reglas son las siguientes:

1. Las interacciones entre factores fijos y aleatorios se consideran aleatorios.


2. A cada factor aleatorio se le asigna su componente de varianza σ 2 .

3. A cada factor fijo se le asigna su efecto fijo representado por la suma de cuadrados de los
parámetros dividido por sus grados de libertad.

4. Los sub-indices de cada término se clasifican en tres clases:

Ausentes: Pertenecen al modelo, pero no están en el término

Activos: Están en el término y no se encuentran entre paréntesis

Pasivos: Están en el término y se encuentran entre paréntesis.

A.7.3. Construcción del cuadrado medio esperado

A partir de un modelo determinado, se construye una tabla con todos los parámetros constituyen-
tes, esto incluye a la componente de error, no ası́ a la media global del diseño. Los parámetros por
convención se escriben en la primera columna.

En el encabezado de la tabla (de izquierda a derecha), se escribe en la primera fila (desde el encabezado
hacia arriba) los subı́ndices que participan en el modelo, en la segunda fila (por sobre la primera),
se colocan la cantidad de niveles que tiene cada subı́ndice, generalmente hablamos de expresiones
algebraicas, ya sea a, b, c, ..., etc. y finalmente, en la tercera fila del encabezado de la tabla, se coloca
el tipo de factor que representa cada subı́ndice, ya sea fijo (F) o aleatorio (A).

En el espacio conjunto, es decir donde se intersectan subı́ndices con respecto a los factores y/o
componente de error, colocamos numeración, ya sea 1 o 0, de acuerdo a las siguientes condiciones:

En cada fila se escribe (1) si uno de los sub-indices pasivos (también están entre paréntesis los
correspondientes a los anidados) de los componentes de la fila coincide con el sub-indice de la
columna.

Si algún sub-indice de la fila la coincide con el sub-indice de la columna se escribe: 1 si es un


factor aleatorio y 0 si es un factor fijo.

En los espacios restantes se escriben los niveles correspondientes a la columna respectiva

valor esperado

Para obtener el valor esperado, de acuerdo a los pasos anteriormente descritos, se exhiben los si-
guientes pasos:
Se tapan todas las columnas encabezadas por los sub-indices activos de ese componente.

Se multiplican los números de las filas que tienen al menos los mismos sub-indices que el
componente, multiplicandolo a su vez por el factor fijo (suma de cuadrados) o el factor aleatorio
(varianza) obtenidos.

La sumatoria de estos productos es la esperanza de los cuadrados medios.

A.8. Diseño factorial

En ocasiones el experimentador está interesado en estudiar el efecto sobre la variable respuesta


de varios factores. En estos casos, la alternativa a la experimentación clásica en la que se estudia el
efecto de cada factor en experimentos independientes, es el diseño factorial.En este diseñoo, además
se verifica si existe información de la acción combinada de los tratamientos de los factores, lo que se
conoce como interacción.

Vamos a analizar a continuación, algunos diseños factoriales usuales.

A.8.1. Análisis Factorial: 2 factores de efecto fijo y/o aleatorio y/o mixto

Se tiene un factor A con a niveles, y un factor B con b niveles y para cada combinación AB de
tratamientos, se tienen n repeticiones. El modelo aditivo de este diseño está dado por:


 i = 1, 2, ..., a


yijk = µ + αi + βj + (αβ)ij + ijk j = 1, 2, ..., b (A.19)


 k = 1, 2, ..., n

donde,

yijk : Resultado del tratamiento i de A y del tratamiento j de B en la réplica k

(αβ)ij : Interacción del tratamiento i de A y del tratamiento j de B.

Los supuestos, para diseños de factores fijo, aleatorio o mixto son los siguientes:

1. Factores fijos:
a
X b
X a
X b
X
αi = βj = (αβ)ij = = (αβ)ij = 0
i=1 j=1 i=1 j=1
iid
ijk ∼ N (0, σ2 )
2. Factores aleatorios:

αi ∼ N (0, σα2 ) ∧ βj ∼ N (0, σβ2 ) ∧ (αβ)ij ∼ N (0, σαβ


2
)
iid
ijk ∼ N (0, σ2 )

3. Factores mixtos:

En el caso que A sea fijo, y B aleatorio:


a   X a
X
2 a−1 2
• αi = 0 ∧ βj ∼ N (0, σβ ) ∧ (αβ)ij ∼ N 0, σαβ ∧ (αβ)ij = 0
i=1
a i=1
iid
• ijk ∼ N (0, σ2 )

En el caso que A sea aleatorio, y B sea fijo:


b   b
X b−1 2 X
• βj = 0 ∧ αi ∼ N (0, σα2 ) ∧ (αβ)ij ∼ N 0, σαβ ∧ (αβ)ij = 0
j=1
b j=1
iid
• ijk ∼ N (0, σ2 )

Los estimadores de los parámetros de este caso particular de modelo factorial serán:

b = y ...
µ

bi = y i.. − y ...
α

βbj = y .j. − y ...


c =y −y −y +y
αβ ij ij. i.. .j. ...

Considerando las pruebas de hipótesis para los parámetros de interés, ya sea factores A, B o la
interacción AB. Las dócimas respectivas para factores fijos son:

H0 : α1 = ... = αa = 0 versus H1 : ∃ αi 6= αj , i 6= j (A.20)

H0 : β1 = ... = βb = 0 versus H1 : ∃ βi 6= βj , i 6= j (A.21)

H0 : (αβ)ij = 0 versus H1 : ∃ (αβ)ij 6= 0, i 6= j (A.22)

Para factores aleatorios:

H0 : σα2 = 0 v/s H1 : σα2 > 0 (A.23)


H0 : σβ2 = 0 v/s H1 : σβ2 > 0 (A.24)

2 2
H0 : σαβ = 0 v/s H1 : σαβ >0 (A.25)

Luego, las tablas (ANOVA) respectivas al caso de factores fijos o aleatorio son:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


SCF A M SCF A
F. A a−1 SCF A a−1
Fα = M SCE
SCF B M SCF B
F. B b−1 SCF B b−1
Fβ = M SCE
SCF AB M SCF AB
Int. (AB) (a − 1)(b − 1) SCF AB (a−1)(b−1)
Fαβ = M SCE
SCE
Residuo ab(n − 1) SCE ab(n−1)
SCT
Total abn − 1 SCT (abn−1)

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


SCF A M SCF A0
F. A a−1 SCF A a−1
Fα = M SCF AB
SCF B M SCF B 0
F. B b−1 SCF B b−1
Fβ = M SCF AB
SCF AB M SCF AB 0
Int. (AB) (a − 1)(b − 1) SCF AB (a−1)(b−1)
Fαβ = M SCE
SCE
Residuo ab(n − 1) SCE ab(n−1)
SCT
Total abn − 1 SCT (abn−1)

Cabe descatar que, la descomposición de suma de cuadrados para este diseño es de la forma:

SCT = SCE + SCF A + SCF B + SCF AB . (A.26)

Consideremos, entonces la expresión para cada suma de cuadrados:


X a X
b Xa
2
SCT = (yij − y .. ) ∧ SCF A = bn (αi )2
i=1 j=1 i=1
Xb a X
X b
SCF B = an (βj )2 ∧ SCF AB = n (αβ)2ij
j=1 i=1 j=1

Notar que:

1. Los estadı́sticos para caso factor fijo y aleatorio distribuyen de la forma Fα ∼ F(a−1;ab(n−1)) ∧
Fβ ∼ F(b−1;ab(n−1)) ∧ Fαβ ∼ F(a−1)(b−1);ab(n−1)

2. La región de rechazo para cada una de las dócimas estará condicionada de tal forma que H0 se
rechaza si y solamente si (para cada dócima por separado o para todas simultáneamente):
Fα > F(a−1;ab(n−1)) para las dócimas (A.20) o (A.23), ya sea un diseño fijo o aleatorio
respectivamente.

Fβ > F(b−1;ab(n−1)) para las dócimas (A.21) o (A.24), ya sea un diseño fijo o aleatorio
respectivamente.

Fαβ > F(a−1)(b−1);ab(n−1) para las dócimas (A.22) o (A.25), ya sea un diseño fijo o aleatorio
respectivamente.

Es importante recalcar, que las expresiones algebraicas las podemos generalizar para un diseño
factorial con m factores, luego, se hace extensible la posibilidad de revisar más posibilidades de
estudio, donde interactúen factores entre sı́ y de forma separada. Se construye del mismo modo la
tabla ANOVA, donde los grados de libertad, los cuadrados medios esperados y las respectivas es-
tadı́sticas de prueba se calculan utilizando la regla de Cornfield y Tukey.

Es posible también querer controlar una fuente de variación o factor extraño, dando lugar a la
formación de bloques en el diseño factorial, el cual puede ser fijo o aleatorio y tiene efecto aditivo,
es decir, no interactúa con los factores. De esta manera si se tiene un diseño con dos factores y un
factor bloque, el modelo será el mismo que para el diseño con dos factores sumándole el efecto bloque,
pudiéndose generalizar para cuando se usan más de dos factores.

A.9. Diseño de parcelas divididas

Este es un diseño experimental combinado que resulta útil cuando al estudiar simultáneamente
varios factores, alguno o algunos de ellos deben ser aplicados sobre unidades experimentales relativa-
mente grandes, pudiéndose aplicar el otro o los otros en unidades experimentales menores, dentro de
las unidades mayores. El caso más sencillo es aquél en el que se tienen sólo dos factores, asignando los
niveles de uno de ellos a las unidades mayores y los niveles del otro a las subunidades. A las unidades
experimentales mayores suele llamárseles parcelas grandes o parcelas principales y a las unidades ex-
perimentales menores se le llama subparcelas o subunidades. En un algunos experimentos factoriales
con factores múltiples quizás no sea posible la aleatorización completa del orden de las corridas. Esto
suele resultar en una generalización del diseño factorial llamada diseño de parcelas subdivididas. El
modelo respectivo para este diseño es:

A.9.1. Diseño de parcelas divididas para dos factores y un bloque

Los diseños en parcelas divididas (P.D.) y subdivididas (P.S.D) se emplean frecuentemente en ex-
perimentos factoriales en las condiciones del material experimental, o las operaciones experimentales
contempladas dificultan el manejo de todas la combinación de factores. El modelo estadı́stico para
el diseño de parcelas subdivididas es:


 i = 1, 2, ..., r


yijk = µ + τi + βj + (τ β)ij + γk + (τ γ)ik + (βγ)jk + (τ βγ)ijk + ijk j = 1, 2, ..., a (A.27)


 k = 1, 2, ..., b

La notación referida a este diseño es la siguiente:

τi ,βj y (τ β)ij : En conjunto nos referimos a la parcela completa. Respectivamente, representan


los bloques, tratamientos principales (factor A), y el error de la parcela completa

γk , (τ γ)ik , (βγ)jk , (τ βγ)ijk : En conjunto representan la subparcela. Respectivamente representan


tratamiento de la subparcela (factor B), réplicas × B, interacciones AB y Error de la subparcela
(bloques × AB)

A.10. Diseños Anidados

Existen ocasiones donde los niveles de un factor B son similares pero no idénticos para diferentes
niveles del factor A. Es decir, que son similares para cada nivel del factor A pero por no ser idénticos,
se encuentran anidados en el nivel al que correspondan para el factor A. A este tipo de diseños se
les llama anidados o jerárquicos1 .

A.10.1. Diseños anidados para dos factores

El modelo estadı́stico para el diseño también llamado de dos etapas es:


 i = 1, 2, ..., a


yijk = µ + αi + βj(i) + (ij)k j = 1, 2, ..., b (A.28)


 k = 1, 2, ..., n

µ es la media global, αi es el factor A con a niveles, βj(i) es el factor B anidado en A con b niveles,
mientras que, (ij)k el error.

En virtud de la teorı́a vista durante este manual y desprendida de textos de apoyo referidos al diseño
y análisis de experimentos2 , la descomposición de la suma de cuadrados usual queda de la forma:
1
Con los niveles del factor B anidados bajo los niveles de el factor A
2
Montgomery, “Diseño y Análisis de Experimentos”(2004)
a X
X b X
n
SCT = (yijk − y ... )2
i=1 j=1 k=1

a
X
SCF A = bn (y i.. − y ... )2
i=1

a X
X b
SCF A(B) = n (y ij. − y ... )2
i=1 j=1

Dado que SCT = SCF A + SCF A(B) + SCE =⇒ SCE = SCT − SCF A − SCF A(B)

De esta manera, podemos considerar los parámetros constituyentes de la ecuación (A.28), de modo
que se estiman:
µ
b = y ...

bi = y i.. − y ...
α

βbj(i) = y ij. − y ...

Con toda la información teórica anterior, podemos realizar el análisis de docimacia para este modelo,
de modo que, la tabla ANOVA para un diseño anidado para factores fijos es:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


SCF A M SCF A
FA a−1 SCF A a−1
Fα = M SCE
SCF A(B) M SCF A(B)
FA(B) a(b − 1) SCF A(B) a(b−1)
Fα(β) = M SCE
SCE
Residuo ab(n − 1) SCE ab(n−1)
SCT
Total abn − 1 SCT (abn−1)

En cambio, cuando los factores son aleatorios, el análisis de varianza (ANOVA) queda como:

Fuente de variación Grados de libertad Suma de cuadrados Cuadrado Medio Estadı́stico


SCF A M SCF A
FA a−1 SCF A a−1
Fα = M SCF A(B)
SCF A(B) M SCF A(B)
FA(B) a(b − 1) SCF A(B) a(b−1)
Fβ(α) = M SCE
SCE
Residuo ab(n − 1) SCE ab(n−1)
SCT
Total abn − 1 SCT (abn−1)

Notar que:

1. Los estadı́sticos para caso factor fijo y aleatorio distribuyen de la forma Fα ∼ F(a−1;ab(n−1)) ∧
Fα(β) ∼ F(a(b−1);ab(n−1))
A.11. Referencias Bibliográficas

Dı́az Abel, ”Diseño Estadı́stico de Experimentos”(1999)

Douglas C. Montgomery, ”Diseño Estadı́stico de Experimentos”(2004)

Joan Ferré, F. Xavier Rius, “Introducción al diseño estadı́stico de experimentos”

Vous aimerez peut-être aussi