Académique Documents
Professionnel Documents
Culture Documents
TALLER I
PRIMER SEMESTRE 2016
Manual
3
Apéndice A
Los objetivos principales de este capı́tulo, en primera instancia, persiguen conocer los diseños más
usuales para poder modelar experimentos, sus expresiones matemáticas que cooperan en la medición
de los datos que se dispongan ante un experimento dado, por otro lado, y en segundo lugar, a través
del desarrollo matemático de los diferentes diseños, también se pretende exhibir la base teórica en la
cual se apoya la validación de cualquier proceso y supuesto, en particular enfocado a la ingenierı́a, o a
cualquier disciplina cientı́fica que persiga respuestas ante diversas disyuntivas que requiera contestar.
5
del investigador.
5. Factores: Son las variables independientes, que pueden influir en la variable de interés. Pode-
mos considerar dos tipos de factores:
Factor tratamiento: Es un factor que nos interesa conocer, dada su influencia sobre la
variable respuesta de un estudio particular.
6. Niveles: Son los resultados de un factor. Según sean elegidos, ya sea por el experimentador o
escogidos al azar de una amplia población, se denominan factores de efectos fijos o factores de
efectos aleatorios.
7. Diseño balanceado: También llamado diseño equilibrado, es el diseño en el que todos los
tratamientos son asignados a un número igual de unidades experimentales.
Este diseño consta de un solo factor, también llamada variable explicativa. Esta variable puede ser
fija o aleatoria y comprende k niveles (tratamientos) con k ≥ 2, l. El propósito principal es realizar
contrastes acerca de si los efectos que producen los tratamientos en la variable respuesta son iguales
o no. El modelo de los efectos principal para este tipo de diseño es:
Además, sabemos que el tamaño poblacional de nuestro experimento denotado por N , se exhibe
Xk
como N = ni
i=1
Vamos a considerar el modelo de los efectos visto en (A.8). Entonces, los siguientes supuestos para
este tipo de diseño son:
Los errores (ij ): Los errores o residuos son independientes entre sı́ y además se encuentran
iid
normalmente distribuidos. Entonces cov(i , j ) = 0 y ij ∼ N (0, σ2 )
k
X
Factor (αi ): αi = 0
i=1
iid
De acuerdo al supuesto que los yij ∼ N (0, σ 2 ) vamos a estimar los parámetros de interés para
este diseño, entonces, a partir de la suma de los cuadrados del error S expresada como:
k X
X n k X
X n
2
S= (eij ) = (yi j − µ − αi )2 (A.3)
i=1 j=1 i=1 j=1
Entonces, estimaremos los parámetros de interés. No obstante, para un diseño de factor fijo, nos
encontramos con dos posibilidades: balanceado o no balanceado, por ende, la estimación se verá
restringida a estos casos.
Este diseño consta de una cantidad de observaciones que irá variando por nivel i. Por lo tanto,
estimando mediante el método de minimos cuadrados, considerando (A.3) obtendremos los siguientes
estimadores:
bi = y.. ∧ α
µ bi = yi. − y.. ∧ b
ij = yij − µ
b−α
bi
La media general:
k ni
1 XX
y .. = yij
N i=1 j=1
X ni
k X ni
k X
X ni
k X
X
(yij − y .. )2 = 2
(y i. − y .. ) + (yij − y i. )2
i=1 j=1 i=1 j=1 i=1 j=1
| {z } | {z } | {z }
Suma de cuadrados totales(SCT) Suma de cuadrados del modelo (SCM) Suma de cuadrados del error (SCE)
Finalmente, sea ℵ la región de rechazo con un nivel de significancia α para la dócima que se
exhibe en (A.2), tal que:
En este diseño, la cantidad de observaciones por nivel observado será la misma. Luego, los estimadores
respectivos son:
b = y.. ∧ α
µ bi = yi. − y.. ∧ b
ij = yij − µ
b−α
bi
La media general:
k n
1 XX
y .. = yij
nk i=1 j=1
Media de cada tratamiento:
n n
1X 1X
y i. = yij =⇒ y .j = yij
n j=1 k j=1
La suma de cuadrados se descompone de la misma manera que en el caso anterior, es decir, SCT =
SCM + SCE, no obstante, obtendremos lo siguientes resultados:
k X
X n
SCT = (yij − y .. )2
i=1 j=1
X k
SCM = n (yi. − y .. )2
i=1
k X
X n
SCE = (yij − y .. )2
i=1 j=1
Cuyos supuestos, a diferencia del diseño de factor fijo variarán para k niveles, dado esta vez un factor
aleatorio. Entonces:
iid
ij ∼ N (0, σ2 )
iid
αi ∼ N (0, σα2 )
Nota:
1. Cabe destacar que σα2 es la varianza asociada al factor, esta vez de carácter aleatorio.
2. Los estimadores obtenidos en el diseño de factor fijo y la tabla ANOVA son análogos para este
diseño.
Las comparaciones múltiples nos permiten comparar tratamientos y hallar diferencias entre ellos;
Este análisis trae implicancias con respecto los efectos significativos que conlleva un tratamiento
particular en mis datos. Por lo tanto, vamos a estudiar distintas metodologı́as para efectuar las
comparaciones respectivas.
A.3.1. Contrastes
Método de Scheffé
Este método es utilizado cuando no se tiene claro el número de comparaciones que se desea rea-
lizar, con esto se puede comparar cualquier contraste o bien posibles contrastes entre medias de
tratamientos. Entonces, considerando una combinación lineal de la forma:
k
X k
X
L
b= ci µi =⇒ ci = 0 (A.5)
i=1 i=1
v
u k 2
X cj
u
b > t(k − 1)F(k−1;n−k;1−α) M SCE
R = Se rechaza H0 L
nj j=1
Este método nos permite realizar a diferencia del método anterior, s contrastes. Es de esta manera,
que esta metodologı́a conlleva la comparación de medias, considerando coeficientes peso cj para cada
una de las medias consideradas. De esta manera, podemos expresar una combinación lineal L cf que
se exhibe como:
k
X k
X
L
cf = cif µi =⇒ cif 6= 0 f = 1, 2, ..., s (A.6)
i=1 i=1
v
u k 2
X cjf
u
cf > t(n − k)F(k−1;n−k;1− α ) M SCE
Rf = Se rechaza H0 L
2s
nj j=1
Observación: Notar que basta para alguno de los s contrastes que se rechase H0 , se concluye para
el test, que se rechaza finalmente la hipótesis nula.
Método de Tukey
Sirve para probar todas las diferencias de medias de tratamientos de una experiencia. Por ende, es
importante que el número de repeticiones por tratamiento sea constante. Es ası́, como para determinar
si esta diferencia es significativa, postulamos que la prueba de hipótesis bajo este contexto sea:
H0 : µi = µj v/s H1 : ∃ µi 6= µj ∀i 6= j (A.7)
( r )
M SCE
W = bj − µ
Se rechaza H0 µ bi > q(k,k(n−1),1−α)
n
Observaciónes:
1. La tabla de valores estudentizados de Tukey con un α nivel de significancia, entrega los valores
de q(k,k(n−1),1−α) .
2. k es la cantidad de comparaciones que realizaremos, con un total de n observaciones
En este diseño, se requiere estudiar la influencia de un factor con k niveles sobre la variable
respuesta, en presencia de un factor bloque controlado con b niveles. Ası́, tenemos el siguiente modelo
de efectos aditivo (sin interacción entre bloque y tratamiento).
Notación: µ representa la media global, mientras que αi es el efecto del i-ésimo tratamiento y βj es
el efecto del j-ésimo bloque. Finalmente, ij son los residuos o errores.
Los errores (ij ): Los errores o residuos son independientes entre sı́ y además se encuentran
iid
normalmente distribuidos. Entonces cov(i , j ) = 0 y ij ∼ N (0, σ2 )
k
X b
X
Factor Tratamiento y Factor Bloque (αi y βj ): αi = 0 ∧ βj = 0
i=1 j=1
A partir de los supuestos del modelo, vamos a considerar la docimacia para este modelo, la cual
es la misma que para el caso de un diseño con un factor, vale decir, H0 : α1 = ... = αk = 0
Para docimar esta hipótesis, vamos a realizar un análisis de varianza (ANOVA) para concluir
respecto a la hipótesis nula. Se desprende por lo tanto que:
Finalmente, sea ℵ la región de rechazo con un nivel de significancia α para la dócima que se
exhibe en (A.8), tal que:
Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes de
variabilidad. En dichos diseños el número de niveles del factor principal tiene que coincidir con el
número de niveles de las dos variables de bloque o factores secundarios y además hay que suponer
que no existe interacción entre ninguna pareja de factores. Supongamos que el número de niveles de
cada uno de los factores es K. El diseño en cuadrado latino utiliza K 2 bloques, cada uno de estos
bloques corresponde a una de las posibles combinaciones de niveles de los dos factores de control. En
cada bloque se aplica un solo tratamiento de manera que cada tratamiento debe aparecer con cada
uno de los niveles de los dos factores de control.
Si consideramos una tabla de doble entrada donde las filas y las columnas representan cada
uno de los dos factores de bloque y las celdillas los niveles del factor principal o tratamientos, el
requerimiento anterior supone que cada tratamiento debe aparecer una vez y sólo una en cada fila y
en cada columna.
Tal que,
yij(h) : Observación correspondiente a la i-ésima fila, j-ésima columna y h-ésima letra latina.
iid
ij(h) : Es el residuo o factor error, tal que ij(h) ∼ N (0, σ2 )
Finalmente, realizaremos el análisis de varianza (ANOVA), para este diseño. La tabla respectiva
es:
Los estadı́sticos obtenidos, nos permiten validar las dócimas de hipótesis para los parámetros αi ,
βj y γh . En consecuencia, se denotan las hipótesis como:
La regiones de rechazo ℵα , ℵβ , ℵγ , con un nivel de significancia α para validar los supuestos, son:
i = 1, 2, ..., K
j = 1, 2, ..., K
yijpl = µ + θi + τj + ωp + ψl + ijpl (A.18)
p = 1, 2, ..., K
l = 1, 2, ..., K
donde,
yijpl : Observación del renglón i y la columna l para la letra latina j y la letra griega p
µ: Media global
ψl : Efecto de la columna l
K
X
SCLL = K (y .j.. − y .... )2
j=1
K
X
SCLG = K (y ..p. − y .... )2
p=1
K
X
SCRG = K (y i... − y .... )2
i=1
K
X
SCCL = K (y ...l − y .... )2
l=1
K X
X K X
K X
K
SCT = (yijpl − y .... )2
i=1 j=1 p=1 l=1
Observaciónes:
1. Notar que Fk ∼ F(K−1;(K−3)(K−1);1−α) ∀k = 1, 2, 3, 4
1. Los grados de libertad asociados a la fuente de variación total son iguales al producto de los
niveles de todos los factores menos uno.
2. Los grados de libertad de la interacción entre dos o más factores cruzados son iguales al producto
de sus respectivos grados de libertad, anotando que para un factor en particular es el número
de niveles menos uno.
3. Los grados de libertad de un factor anidado en un factor cruzado, son iguales al producto de
los grados de libertad del factor anidado por el número de niveles del factor cruzado.
4. Si un factor está anidado en otro factor pero a la vez interacciona con un tercer factor. Los
grados de libertad para la interacción son iguales a los grados de libertad del factor anidado
multiplicado por el número de niveles del factor en que se anida y por los grados de libertad
del factor con el que se cruza.
5. Los grados de libertad para repeticiones son componente que siempre está anidado en las
combinaciones de todos los demás factores; por lo anterior, los grados de libertad son (r − 1)
por el número de niveles de los demás factores.
6. Los grados de libertad para factores principales son simplemente el número de niveles que tenga
el factor menos uno.
7. Los grados de libertad del error experimental se pueden hallar a partir de la diferencia de los
grados de libertad de la fuente de variación total menos las demás fuentes de variación presentes
en el modelo de clasificación experimental.
Para construir el cuadrado medio se requiere conocer el tipo de efecto, si es aleatorio o fijo, o un
componente mixto. Las reglas son las siguientes:
3. A cada factor fijo se le asigna su efecto fijo representado por la suma de cuadrados de los
parámetros dividido por sus grados de libertad.
A partir de un modelo determinado, se construye una tabla con todos los parámetros constituyen-
tes, esto incluye a la componente de error, no ası́ a la media global del diseño. Los parámetros por
convención se escriben en la primera columna.
En el encabezado de la tabla (de izquierda a derecha), se escribe en la primera fila (desde el encabezado
hacia arriba) los subı́ndices que participan en el modelo, en la segunda fila (por sobre la primera),
se colocan la cantidad de niveles que tiene cada subı́ndice, generalmente hablamos de expresiones
algebraicas, ya sea a, b, c, ..., etc. y finalmente, en la tercera fila del encabezado de la tabla, se coloca
el tipo de factor que representa cada subı́ndice, ya sea fijo (F) o aleatorio (A).
En el espacio conjunto, es decir donde se intersectan subı́ndices con respecto a los factores y/o
componente de error, colocamos numeración, ya sea 1 o 0, de acuerdo a las siguientes condiciones:
En cada fila se escribe (1) si uno de los sub-indices pasivos (también están entre paréntesis los
correspondientes a los anidados) de los componentes de la fila coincide con el sub-indice de la
columna.
valor esperado
Para obtener el valor esperado, de acuerdo a los pasos anteriormente descritos, se exhiben los si-
guientes pasos:
Se tapan todas las columnas encabezadas por los sub-indices activos de ese componente.
Se multiplican los números de las filas que tienen al menos los mismos sub-indices que el
componente, multiplicandolo a su vez por el factor fijo (suma de cuadrados) o el factor aleatorio
(varianza) obtenidos.
A.8.1. Análisis Factorial: 2 factores de efecto fijo y/o aleatorio y/o mixto
Se tiene un factor A con a niveles, y un factor B con b niveles y para cada combinación AB de
tratamientos, se tienen n repeticiones. El modelo aditivo de este diseño está dado por:
i = 1, 2, ..., a
yijk = µ + αi + βj + (αβ)ij + ijk j = 1, 2, ..., b (A.19)
k = 1, 2, ..., n
donde,
Los supuestos, para diseños de factores fijo, aleatorio o mixto son los siguientes:
1. Factores fijos:
a
X b
X a
X b
X
αi = βj = (αβ)ij = = (αβ)ij = 0
i=1 j=1 i=1 j=1
iid
ijk ∼ N (0, σ2 )
2. Factores aleatorios:
3. Factores mixtos:
Los estimadores de los parámetros de este caso particular de modelo factorial serán:
b = y ...
µ
bi = y i.. − y ...
α
Considerando las pruebas de hipótesis para los parámetros de interés, ya sea factores A, B o la
interacción AB. Las dócimas respectivas para factores fijos son:
2 2
H0 : σαβ = 0 v/s H1 : σαβ >0 (A.25)
Luego, las tablas (ANOVA) respectivas al caso de factores fijos o aleatorio son:
Cabe descatar que, la descomposición de suma de cuadrados para este diseño es de la forma:
Notar que:
1. Los estadı́sticos para caso factor fijo y aleatorio distribuyen de la forma Fα ∼ F(a−1;ab(n−1)) ∧
Fβ ∼ F(b−1;ab(n−1)) ∧ Fαβ ∼ F(a−1)(b−1);ab(n−1)
2. La región de rechazo para cada una de las dócimas estará condicionada de tal forma que H0 se
rechaza si y solamente si (para cada dócima por separado o para todas simultáneamente):
Fα > F(a−1;ab(n−1)) para las dócimas (A.20) o (A.23), ya sea un diseño fijo o aleatorio
respectivamente.
Fβ > F(b−1;ab(n−1)) para las dócimas (A.21) o (A.24), ya sea un diseño fijo o aleatorio
respectivamente.
Fαβ > F(a−1)(b−1);ab(n−1) para las dócimas (A.22) o (A.25), ya sea un diseño fijo o aleatorio
respectivamente.
Es importante recalcar, que las expresiones algebraicas las podemos generalizar para un diseño
factorial con m factores, luego, se hace extensible la posibilidad de revisar más posibilidades de
estudio, donde interactúen factores entre sı́ y de forma separada. Se construye del mismo modo la
tabla ANOVA, donde los grados de libertad, los cuadrados medios esperados y las respectivas es-
tadı́sticas de prueba se calculan utilizando la regla de Cornfield y Tukey.
Es posible también querer controlar una fuente de variación o factor extraño, dando lugar a la
formación de bloques en el diseño factorial, el cual puede ser fijo o aleatorio y tiene efecto aditivo,
es decir, no interactúa con los factores. De esta manera si se tiene un diseño con dos factores y un
factor bloque, el modelo será el mismo que para el diseño con dos factores sumándole el efecto bloque,
pudiéndose generalizar para cuando se usan más de dos factores.
Este es un diseño experimental combinado que resulta útil cuando al estudiar simultáneamente
varios factores, alguno o algunos de ellos deben ser aplicados sobre unidades experimentales relativa-
mente grandes, pudiéndose aplicar el otro o los otros en unidades experimentales menores, dentro de
las unidades mayores. El caso más sencillo es aquél en el que se tienen sólo dos factores, asignando los
niveles de uno de ellos a las unidades mayores y los niveles del otro a las subunidades. A las unidades
experimentales mayores suele llamárseles parcelas grandes o parcelas principales y a las unidades ex-
perimentales menores se le llama subparcelas o subunidades. En un algunos experimentos factoriales
con factores múltiples quizás no sea posible la aleatorización completa del orden de las corridas. Esto
suele resultar en una generalización del diseño factorial llamada diseño de parcelas subdivididas. El
modelo respectivo para este diseño es:
Los diseños en parcelas divididas (P.D.) y subdivididas (P.S.D) se emplean frecuentemente en ex-
perimentos factoriales en las condiciones del material experimental, o las operaciones experimentales
contempladas dificultan el manejo de todas la combinación de factores. El modelo estadı́stico para
el diseño de parcelas subdivididas es:
i = 1, 2, ..., r
yijk = µ + τi + βj + (τ β)ij + γk + (τ γ)ik + (βγ)jk + (τ βγ)ijk + ijk j = 1, 2, ..., a (A.27)
k = 1, 2, ..., b
Existen ocasiones donde los niveles de un factor B son similares pero no idénticos para diferentes
niveles del factor A. Es decir, que son similares para cada nivel del factor A pero por no ser idénticos,
se encuentran anidados en el nivel al que correspondan para el factor A. A este tipo de diseños se
les llama anidados o jerárquicos1 .
i = 1, 2, ..., a
yijk = µ + αi + βj(i) + (ij)k j = 1, 2, ..., b (A.28)
k = 1, 2, ..., n
µ es la media global, αi es el factor A con a niveles, βj(i) es el factor B anidado en A con b niveles,
mientras que, (ij)k el error.
En virtud de la teorı́a vista durante este manual y desprendida de textos de apoyo referidos al diseño
y análisis de experimentos2 , la descomposición de la suma de cuadrados usual queda de la forma:
1
Con los niveles del factor B anidados bajo los niveles de el factor A
2
Montgomery, “Diseño y Análisis de Experimentos”(2004)
a X
X b X
n
SCT = (yijk − y ... )2
i=1 j=1 k=1
a
X
SCF A = bn (y i.. − y ... )2
i=1
a X
X b
SCF A(B) = n (y ij. − y ... )2
i=1 j=1
Dado que SCT = SCF A + SCF A(B) + SCE =⇒ SCE = SCT − SCF A − SCF A(B)
De esta manera, podemos considerar los parámetros constituyentes de la ecuación (A.28), de modo
que se estiman:
µ
b = y ...
bi = y i.. − y ...
α
Con toda la información teórica anterior, podemos realizar el análisis de docimacia para este modelo,
de modo que, la tabla ANOVA para un diseño anidado para factores fijos es:
En cambio, cuando los factores son aleatorios, el análisis de varianza (ANOVA) queda como:
Notar que:
1. Los estadı́sticos para caso factor fijo y aleatorio distribuyen de la forma Fα ∼ F(a−1;ab(n−1)) ∧
Fα(β) ∼ F(a(b−1);ab(n−1))
A.11. Referencias Bibliográficas