Académique Documents
Professionnel Documents
Culture Documents
1. Diseo Experimental
1.1. Generalidades . . . . . . . . . . . . . . . . .
1.2. Conceptos Bsicos del Diseo Experimental
1.2.1. Unidad Experimental y Tratamiento
1.2.2. Error Experimental (EE) . . . . . .
1.2.3. Repeticiones y sus Funciones . . . . .
1.2.4. Control del Error Experimental . . .
1.2.5. Aleatorizacin . . . . . . . . . . . . .
1.3. Estructuras del Diseo Experimental . . . .
1.3.1. Estructura de Tratamiento . . . . . .
1.3.2. Estructura de Diseo . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
2
3
3
3
4
4
4
4
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
6
7
7
7
8
9
10
11
11
12
14
15
16
18
18
19
3. Comparaciones Mltiples
3.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2. Evaluacin de la Tasa de Error . . . . . . . . . . . . . . . . . . . . . .
3.3. Pruebas de Comparaciones Mltiples . . . . . . . . . . . . . . . . . . .
3.3.1. Metodo de las Diferencias Mnimas Significativas (DMS) . . . .
3.3.2. La Prueba de Intervalos Mltiples de Duncan. . . . . . . . . . .
3.3.3. Prueba Honesta de Tukey . . . . . . . . . . . . . . . . . . . . .
3.3.4. Prueba de Scheff . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.5. Prueba de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . .
3.3.6. Comparacin de Medias de Tratamientos con un Control (Prueba
de Dunnett) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.7. Contrastes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.8. Contrastes Ortogonales . . . . . . . . . . . . . . . . . . . . . .
3.3.9. Polinomios Ortogonales . . . . . . . . . . . . . . . . . . . . . . .
23
23
24
25
26
28
31
32
34
50
50
35
36
38
40
51
51
52
56
59
CAPTULO 1
DISEO EXPERIMENTAL
1.1.
Generalidades
En la bsqueda planeada para obtener nuevos conocimientos o para confirmar o no resultados de experimentos previos con la finalidad de tomar desiciones, los investigadores
se apoyan en las herramientas que brinda el diseo experimental para seguir realizando
sus experimentos. Los objetivos se establecen sobre la base de preguntas que han de
responderse, hiptesis que han de probarse, y efectos que han de estimarse.
Los objetivos se deben clasificar en mayores y menores ya que ciertas comparaciones de
tratamientos son ms importantes que otras.
Existen tres categorias de experimentos:
1. Experimento preliminar:
el investigador prueba un nmero grande de tratamientos con el objeto de tener
indicios para futuros trabajos
2. Experimento crtico:
el investigador compara las respuestas a diferentes tratamientos usando un nmero suficiente de observaciones para obtener seguridad razonable de detectar
diferencias significativas.
3. Experimentos demostrativos:
se llevan a cabo cuando se quieren comparar uno o mas tratamientos nuevos con
un patrn.
1.2.
1.2.1.
1.2.2.
1.2.3.
1.2.4.
El control del error experimental puede lograrse mediante la escogencia del diseo experimental adecuado, es decir, por medio de diseos como el de bloques completos
aleatorizados (DBCA) o cuadrados latinos (DCL), el uso de observaciones concominantes (Covariables) y una apropiada eleccin del tamao y la forma de las unidades
experimentales.
Los tratamientos deben ser elegidos de tal forma que esten acordes con el estudio que
se quiere realizar, con los objetivos, con el problema que se est planteando, es decir,
con las hiptesis de inters.
1.2.5.
Aleatorizacin
1.3.
Segn Hinkelmann & kempthorne (1994), cuando se realiza un diseo es esencial tener
en cuanta dos estructuras bsicas, las cuales hay que identificar y distinguir, estas son:
La estructura de tratamiento y la estructura de diseo.
1.3.1.
Estructura de Tratamiento
1.3.2.
Estructura de Diseo
de unidades experimentales, donde las unidades dentro del grupo son ms homogneas
que las unidades entre grupos distintos, entonces se habla de diseos en bloques.
CAPTULO 2
DISEO COMPLETAMENTE AL AZAR
(DCA)
2.1.
Generalidades
En esta estructura de diseo se supone que el material o rea experimental es completamente homogneas, es decir, las condiciones de todas las unidades experimentales
son igualmente controladas. En este tipo de diseo los tratamientos se asignan a las
unidades experimentales en forma completamente aleatoria.
Si se tienen t tratamientos y n unidades experimentales, con n > t, se puede aplicar el
primer tratamiento a r1 unidades experimentales escogidas al azar del total n, se asigna
el segundo tratamiento a r2 unidades experimentales a partir de las n r1 restantes,
asi hasta llegar a asignar el tratamiento t a la rt ltimas unidades experimentales.
2.1.1.
1. Ventajas. Entre las ventajas que se pueden obtener cuando se aplica este diseo
tenemos: la flexibilidad, es decir, se puede aplicar cualquier nmero de tratamientos y repeticiones. Aunque no es necesario tener igual nmero de repeticiones
por tratamiento; las comparaciones entre tratamientos son ms precisas cuando
r j = r j = 1, 2, , t. Otra ventaja es la sencillez en el anlisis estadstico, puesto que el anlisis es simple a pesar de que no se tenga igual nmero de
repeticiones por tratamientos, y no se complica por la prdida de unidades experimentales. Adems, el diseo proporciona el mayor nmero de grados de libertad
para el error, comparado con otros diseos de estructura ms compleja.
2. Desventajas. La principal desventaja es su baja precisin y eficiencia cuando las
unidades experimentales son heterogneas hecho que lleva a una sobre-estimacin
de la varianza del error experimental.
2.1.2.
Usos
1. Si las unidades experimentales son uniformes, es el diseo ms eficiente entre todos los diseos
2. til cuando una porcion grande de unidades experimentales pueden no responder
o pueden perderse
3. til en experimentos donde hay una limitacin en el nmero total de unidades
experimentales ya que proporciona el mayor nmero de grados de libertad.
2.1.3.
Aleatorizacion
2.2.
(2.1)
y
j = 1, 2, , t,
donde,
Yij : Es la observacin obtenida en la i esima unidad experimental del j esimo
tratamiento.
: Es un parmetro comn a todos los tratamientos y corresponde a la media
general.
j : Es el efecto del tratamiento j esimo.
ij : Es el error aleatorio que se comete en la i esima unidad experimental del
j esimo tratamiento.
rj : Es el nmero de repeticiones del tratamiento j esimo.
t: Es el nmero de tratamientos.
El modelo de la ecuacin se puede escribir en la forma Yij = j + ij donde j = + j
representa la media del tratamiento j esimo, entonces ij = Yij j por lo tanto,
E(ij ) = E(Yij ) j = j j = 0 y V (ij ) = 2ij = j2 . Como todos los tratamientos estn sometidos a las mismas condiciones, se supone que 2ij = j2 = 2 ,
para j = 1, 2, ..., t, es decir, los errores tienen varianza constante 2 . Por otro lado, los
tratamiento son aleatorizados, lo que hace pensar que los errores deberan ser independientes, es decir, el error en la unidad experimental i, no influye en el error obtenido
0
en la unidad experimental i . Esto se puede expresar estadsticamente como Cov(ij ,
i0 j 0 ) = 0 para todo j, j 0 = 1, 2, ..., t e i, i0 = 1, 2, ..., rj .
Para llevar a cabo las pruebas de hiptesis del modelo se necesita asignarle una distribucin a los errores, la ms comn es la distribucin normal, dadas las caractersticas
que tiene esta variable aleatoria y para poder llegar teorcamente a encontrar un estadstico de prueba basado en la teora de la inferencia estadstica clsica. As, se supone
que los errores tienen distribucin normal, son independientes e identicamente distribuidos, tienen media cero, varianza constante, todas estas caractersticas de los errores
se resume en la siguiente notacin:
iid
ij N (0, 2 ) .
Dado que los estadsticos de prueba estn construidos bajo estos supuestos, posteriormente para dar mayor credibilidad a los resultados obtenidos estos deben ser validados
con los datos que se obtengan del experimento.
2.3.
se tiene el supuesto
t
P
j = 0.
j=1
2.3.1.
Estimacin de Parmetros
Para cada tratamiento j = 1, 2, ..., t, la muestra de tamao rj > 1, proporciona un estimativo de la media y la varianza muestral de ese tratamiento mediante las expresiones
usuales
rj
rj
2
P
P
Yij Y j
Yij
rj
P
Y
y
b2 = CM =
t
P
(rj 1) Sj2
j=1
t
P
(rj 1) Sj2
j=1
nt
(rj 1)
(2.2)
j=1
Ahora:
(rj 1) Sj2 =
rj
P
i=1
Yij Y .j
2
rj
P
Yij2 rj Y .j =
i=1
rj
P
Yij2
i=1
Y.j2
rj
b =
SCEEj
j=1
n t
(2.3)
Para el estimador de j ,
bj = Y j se tiene, de acuerdo a la teora estadstica que:
2
bj N j , rj
para
j = 1, 2, ..., t.
2.3.2.
bj j
bj
rj
tnt .
(2.4)
Hiptesis de Inters
En el modelo de efectos fijos se desea probar si los efectos de los diferentes tratamientos
es difeerente de cero o tambin si las medias de los diferentes conjuntos de tratamientos
presentan diferencias estadsticas. El experimentador puede probar los siguientes tipos
de hiptesis.
H0 :
H0 : 1 = 2 = = t
H0 : j = j0
para algn j 6= j0
t
P
j=1
cj
bj es:
(2.5)
q
Pt
bj
i=1 cj
Pt
i=1 cj j
c2j
i=1 rj
t
P
tnt
(2.6)
cj j = a se debe calcular
j=1
t
P
t
P
cj
bj a
cj
bj a
j=1
j=1
!= s
tc =
,
t
t C2
P
P
j
ee
cj
bj
b
rj
j=1
(2.7)
j=1
rechazandose H0 s |tc | > t(1/2, nt) . Las pruebas de hiptesis de los casos 2 y 3 se
obtienen como casos particulares de la hiptesis del caso 1.
2.3.3.
Cuadro 2.1:
repetici
on/T T O
1
2
3
..
.
Tabla
1
Y11
Y21
Y31
..
.
rj
Total
Media
Yr1 1
Y1
Y 1
t
Y1t
Y2t
Y3t
..
.
Yr t t
Yt
Y t
Si se tienen rj observaciones para cada tratamiento, los datos del experimento se pueden
representar mediante la matriz dada en la Tabla ??.
donde rj es el nmero de repeticiones por tratamiento y t es el nmero de tratamientos,
rj
P
Yij = Yj es el total del tratamiento j esimo para j = 1, 2, ..., t.
i=1
rj P
t
P
Yij =
i=1j=1
Y =
Y
,
n
2.3.4.
t
P
Y j =
j=1
t
P
Yj
rj
rj .
j=1
rj P
t
P
Yij Y
2
i=1j=1
rj P
t
P
Yij2
i=1j=1
(2.8)
rj P
t
P
Y2
Y2
=
Yij2 F C con F C = ,
n
n
i=1j=1
rj P
t
P
i=1j=1
Y j Y
2
t
P
rj Y j Y
j=1
rj P
t
P
t Y2
P
j
j=1
Yij2
i=1j=1
t
P
2
rj
Y2
n
t Y2
P
j
j=1
rj
t Y2
P
j
.
r
j=1 j
rj 1 = t 1 + glEE glEE =
j=1
FC
t
P
rj t = n t.
j=1
2.3.5.
(2.9)
CMT T O
F(t1 , nt)
CMEE
(2.10)
F.V.
TTO
EE
Total
gl
t1
nt
n1
Si se rechaza H0 al nivel de significancia del 5 %, se dice que existen diferencias significativas entre los tratamientos, y se coloca un * a la Fc o al CMT T O , s adems tambin
se encuentran diferencias al 1 %, se dice que las diferencias son altamente significativas,
y se coloca **. S no se rechaza H0 al nivel de significancia del 5 % se dice que no
existen diferencias estadsticas significativas entre los tratamientos, lo cual se nota con
N S, pero an asi se pueden hablar de diferencias al 6 %, 7 %, 8 %, 9 %, y hasta del 10 %
que tambin es muy usual.
As mismo, cuando el investigador desea llevar a cabo cualquier prueba para un tratamiento en particular, esta se puede realizar utilizando en este caso el error estndar de
estimacin para una media de tratamiento, el cual viene dado por:
s
CMEE
(2.11)
SY j =
rj
y cualquier inferencia para el j esimo tratamiento se debe realizar con este error.
Ejemplo 2.1. Un Mdico veterinario est interesado en probar la ganancia de peso en
libras en una determinada raza de cerdos al variar uno de los componentes de cierta
dieta tradicional, en porcentajes de 15 %, 20 %, 25 %, 30 % y 35 % (llmense
A, B, C,
D y E, respectivamente). El Mdico veterinario toma 5 cerdos, o repeticiones, para
cada nueva dieta; los datos del experimento estan dados en la Tabla ??.
5 X
5
X
Yij2
i=1 j=1
SCT T O =
Y2
(376)2
= (7)2 + (7)2 + ... + (15)2 + (11)2
= 636, 96
n
25
5
X
Yj2
j=1
Y2
(49)2 + ... + (54)2 (376)2
= 475, 76
rj
n
5
25
y
SCEE = SCT otal SCT T O = 636, 96 475, 76 = 161, 20.
Finalmente se obtiene el ANAVA dado en la Tabla ??
Cuadro 2.4: Analisis de varianza para ganancia de peso.
F.V. gl
SC
CM
Fc
F5 %(4,20)
> library(agricolae)
> datos = read.csv2(file.choose())
> attach(datos)
Medias por tratamiento
> tapply(Peso,Dieta,mean)
a
b
c
d
e
9.8 15.4 17.6 21.6 10.8
Df
Sum Sq Mean Sq
F value
Pr(>F)
Dieta
4
475.8
118.94
14.76
9.13e-06 ***
Residuals 20 1285.9
128.6
Signif. codes:
0 0.001 0.01 0.05 0.1 1
> mod=aov(Peso Dieta) ;mod
Call:
aov(formula = Peso Dieta)
Terms:
Dieta Residuals
Sum of Squares
475.76
161.20
Deg. of Freedom
4
20
Residual standard error: 2.839014 Estimated effects may be
unbalanced
En conclusin, como se observa en la Tabla ?? que 14,76 > F5 % se puede decir que hay
diferencias significativas entre las dietas, es decir, al menos una de las dietas tiene un
comportamiento diferente.
Ejemplo 2.2. Un especialista en hidrulica esta interesado en saber si cuatro mtodos diferentes para estimar las frecuencias de las inundaciones producen estimaciones
equivalentes del gasto (o flujo ) mximo cuando se aplica a una misma cuenca. Cada procedimiento se us seis veces en la cuenca y los resultados de gasto mximo (en
pies cubicos por segundo) se muestran en la Tabla ??. Determine s existen diferencias
significativas entre los cuatros mtodos.
Cuadro 2.5: Gasto mximo para cada mtodo
Mtodo de estimacin
Mtodo 1
Mtodo 2
Mtodo 3
Mtodo 4
0, 34
0, 91
6, 31
17, 15
0, 12
2, 94
8, 37
11, 82
Repeticiones
1, 23
0, 70
2, 14
2, 36
9, 75
6, 09
10, 95 17, 20
1, 75
2, 86
9, 82
14, 35
0, 12
4, 55
7, 24
16, 82
Y .j
0, 71
2, 63
7, 93
14, 72
Sj
0, 66
1, 09
1, 66
2, 77
Solucin:
Aplicando los mismos pasos que en el ejemplo anterior se llega a resultados mostrados
en la Tabla 2,6.
Los resultados de la Tabla 2,6 muestran que existen diferencias estadsticas significativas,en las estimaciones de la media del gasto mximo, entre los cuatro procedimientos.
2.4.
Como se mencion al inicio de este captulo, existen ciertos supuestos sobre los errores
del modelo en los que se basa el ANAVA, los cuales son:
1. Los errores tienen distribucin normal con media cero, E (ij ) = 0 y varianza
constante, V (ij ) = 2 .
0
i = 1, 2, . . . , rj ,
j = 1, 2, 3, . . . , t,
(2.12)
es decir, los errores estimados se calculan por tratamiento, restndole a los datos obtenidos de cada tratamiento la media de ese tratamiento.
Los dos supuestos del modelo ms importantes a cumplirse, se refieren a la normalidad
y la homogeneidad de varianza de los errores, puesto que de hecho los tratamientos son
asignados aleatoriamente a las unidades experimentales al inicio de todo experimento
y esto garantiza, en cierta forma la independencia de los errores. A continuacin se
presentan los algoritmos para llevar a cabo las pruebas de homogeneidad de varianza y
normalidad.
2.4.1.
Prueba de Hartley
Para llevar a cabo la prueba de hiptesis
H0 : 12 = 22 = = t2 = 2 contra H1 : las varianzas no son homogeneas,
(2.13)
donde j2 representa la varianza del j esimo tratamiento y adems donde todos los
tratamientos tienen el mismo nmero de repeticiones, es decir r1 = r2 = = rt = r.
Hartley propone la siguiente estadstica para llevar a cabo la prueba de hiptesis 2,13
M ax Sj2
j
,
FM ax =
M in Sj2
j
Prueba de Bartlett
Es una prueba ms liberal que la anterior. Para llevar a cabo la prueba de hiptesis dada
en, los tratamientos no necesariamente deben tener el mismo nmero de repeticiones.
La estadstica dada por Bartlett esta definida por:
"
#
t
X
1
v ln (CMEE )
(2.14)
vj ln Sj2 ; j = 1, 2, . . . , t
2 =
C
j=1
donde: vj = rj 1; v =
t
P
vj y C = 1 +
j=1
1
3(t1)
t 1
P
1
v
j=1 vj
!
y la hiptesis nula H0
2.4.2.
H0 : LoserroresprovienendeunapoblacincondistribucinnormalH1 : Loserroresnoprovienendeunapoblac
(2.15)
Para llevar a cabo esta prueba inicialmente se calculan los errores del modelo bajo un
diseo completamente al azar, los cuales vienen dados por la expresin
eij = Yij Y .j
para cada j = 1, 2, . . . , t,
posteriormente se ordenan los errores de menor a mayor, e(1) , e(2) , , e(n) , eliminando
el trmino que queda en la mitad de los datos, si el nmero de observaciones fuese impar,
el paso siguiente es realizar las diferencias d(1) = e(n) e(1) , d(2) = e(n1) e(2) , , es
decir, el ms grande menos el ms pequeo, el segundo ms grande menos el segundo
ms pequeo, etc; hasta llegar a los dos datos del centro; posteriormente estas diferencias
se ponderan, en ese orden, por los trminos ak,n , los cuales se encuentran en la Tabla
dada por Shapiro - Wilk, es decir se realizan los productos ak,n d(k) , posteriormente
se calcula la estadstica
"
#2
X
1
ak,n d(k)
(2.16)
SW =
SCEE k
La hiptesis nula, H0 , es rechazada s SW < W, n siendo W, n el valor de la estadstica
de Shapiro - Wilk al nivel de significancia .
Ejemplo 2.3. Ilustremos estas pruebas con un experimento en aj picante con tres
tratamiento D1, D2 y D3, cuyos datos de la variable respuesta son dados en la Tabla
??:
Como se dijo anteriormente los errores para este modelo, DCA, se obtienen realizando la diferencia entre los valores observados para cada tratamiento y el promedio del
respectivo tratamiento, as:
e(ij)
26, 49
con lo cual se obtiene
"
#2
X
1
26, 492
SWC =
ak,n d(k)
=
= 0, 9412.
SCE k
745, 6
Ahora, el valor crtico al 5 % de significancia de SW es SW=0,05; n=9 = 0, 829 entonces,
como SWC > SW=0,05; n=9 , no se rechaza la hiptesis nula de normalidad de los errores.
2.4.3.
2.4.4.
Prueba de Bartlett:
Se ilustra esta prueba con la misma informacin de la prueba anterior; as, la hiptesis
a verificar es:
H0 : 12 = 22 = 32
H1 : j2 = j02 para algn j 6= j0.
Para aplicar la prueba de Barttley, calculemos vj y Ln Sj2 para j = 1, 2, 3. Entonces,
v1 = r1 1 = 3 1 = 2, v2 = r2 1 = 3 1 = 2 y v3 = r3 1 = 3 1 = 2,
3
P
as v =
vj = 2 + 2 + 2 = 6, tambin Ln (S12 ) = Ln (73, 59) = 4, 29; Ln (S22 ) =
j=1
vj Ln Sj2 = 2 4, 29 + 2 5, 29 + 2 4, 60 = 28, 39.
j=1
= 1 + 3(31)
+ 2 + 2 6 = 1, 222
j=1 vj
v
2
llegndose
h finalmente a: P
i
1
2
c = C vLn (CMEE ) 3j=1 vj Ln Sj2 =
1
1,22
tener igual nmero de repeticiones por tratamiento, indudablemente que los resultados
sern mejores si la varianza del error (CMEE ) no es muy grande.
2.5.
El modelo de efectos fijos se utiliza cuando los tratamientos son fijos o el experimentador
los elige por su importancia, disponibilidad o comodidad en el manejo. Por ejemplo,
tratamientos mdicos, variedades, concentraciones, lugares y tiempos. En este modelo,
los parmetros son generalmente las medias de los tratamientos y el objetivo es la
comparacin y estimacin de estos promedios. En el modelo de efectos aleatorios los
niveles del factor son una poblacin de la cual se toma una muestra aleatoria; por
ejemplo, animales de una especie dada, sitios de un lago, hojas de una planta, etc.
los parmetros de inters en este modelo son las varianzas y el objetivo primordial es
estimar sus magnitudes absolutas y relativas.
El modelo propuesto para este tipo de experimento es:
Yij = + Aj + ij ,
i = 1, 2, ...., rj y j = 1, 2, ..., t,
(2.17)
donde
rj : Es el nmero de repeticiones del tratamiento j esimo.
t: Es el nmero de tratamientos.
Yij : Es la observacin obtenida en la i esima unidad experimental del j esimo
tratamiento.
: Es un parmetro comn a todos los tratamientos y corresponde a la media
general .
En este modelo se debe cumplir:
1. Los Aj : Son variables aleatorias independientes con distribucin normal N (0, A2 )
2. Los ij : Son variables aleatorias independientes con distribucin normal N (0, 2 )
3. Las variables Aj y ij son variables aleatorias independientes entre s.
La tabla ANAVA es la misma que la mostrada en el modelo de efectos fijos, adems los
clculos de las sumas de cuadrados como la prueba F de significancia, son igualmente
vlidos para este modelo.
Las hiptesis a probar son:
H0 : A2 = 0 ( no hay variabilidad entre los niveles de A) contra
H1 : A2 6= 0 (la variabilidad entre los niveles es significativa).
bT2 T O =
E(CMT T O ) = 2 + r0 A2
bA2 =
b2
bT2 T O
CMT T O CMEE
=
r0
r0
(2.18)
1
[29 (62 + 82 + 72 + 82 ) /29] = 7, 22 y asi,
3
bA2 =
0, 0468 0, 0142
= 0, 0045
7, 22
entonces
b2 = 0, 0045 + 0, 0142 = 0, 0187.
Estas estimaciones no son faciles de interpretar, por eso es usual expresar los resultados
como porcentajes de la variacin total. El cociente
0, 0045
bA2
=
= 0, 2406 = 24, 06 % (coeficiente de correlacin intraclase que mide
2
bX
0, 0187
la semejanza entre individuos de un mismo grupo) mide la proporcin de la variabilidad
total que es atribuible a la variabilidad del factor; es decir, a la variabilidad entre padres.
El otro 75,94 % es la variabilidad entre terneros del mismo padre.
rI =
Puede suceder que en las estimaciones de las componentes de varianza, alguna resulte
negativa, caso en el cual se le tomar como s fuese cero por la condicin que existe para
la varianza. De estos resultados tambin se puede obtener el coeficiente de heredabilidad
h2 = 4rI , el cual es una medida del grado de influencia gentica que puede recibir un
genotipo. Generalmente vara entre 0, 3 y 0, 5 segn Gardner y Snustad (1984). Para
el caso de la ganancia de peso en terneros h2 = 0, 96, coeficiente bastante alto, pero
explicable debido a la gran variabilidad de A2 .
CAPTULO 3
COMPARACIONES MLTIPLES
3.1.
Generalidades
(3.1)
Al realizar una prueba de compracin mltiple se est en riesgo de cometer ya sea error
tipo I o un error tipo II. El nivel de significancia tomado determina el riesgo de error
tipo I, el tamao de la muestra, la varianza y el tamao de la comparacin para las
medias poblacionales reales, determina la tasa de error tipo II para una tasa de error
tipo I.
El riesgo que se est dispuesto en una sola comparacin es comunmente denotado c .
Ahora, cuando existen t (t 1) /2 comparaciones por pares entre t medias de los tratamientos; si se lleva a cabo cada comparacin con el estadstico t-student, existe la
posibilidad de cometer el mismo nmero errores tipo I, si las pruebas se consideraran
independientes.
23
Por ejemplo: para t = 4, entonces existen 6 pares de medias a comparar y hasta seis
errores tipo I.
Otro tipo de error tipo I es el basado en el riesgo acumulado asociado con la familia
de pruebas en estudio. La familia es el conjunto de comparaciones por pares. El riesgo
acumulado asociado con una familia de comparaciones se conoce como la tasa de error
tipo I con respecto al experimento, E . Este es el riesgo de cometer al menos un error
tipo I en la familia de comparaciones en el experimento.
3.2.
Para una familia de pruebas independientes, se puede evaluar la tasa de error tipo I
con respecto al experimento, sin embargo las pruebas no son independientes ya que el
CME es el mismo en el estadstico de prueba, adems que una misma media es utilizada
varias veces. Por esto se evaluar el lmite superior para el valor del error tipo I con
respecto al experimento, suponiendo pruebas independientes. S las H0 son ciertas, el
error tipo I para cada una de las n pruebas es c , con (1 c ) como la probabilidad de
tomar una decisin correcta. La probabilidad de cometer x errores tipo I est dada por
la distribucin binomial:
P (X = x) =
n!
x (1 c )nx ,
x! (n x)! c
(3.2)
el cual expresa la tasa de error tipo I con respecto a la comparacin como una funcin
de la tasa de error tipo I con respecto al experimento.
Se nota que al aumentar el nmero de pruebas, se eleva el riesgo de cometer un error
tipo I. La relacin entre c y E para un nmero n = 1, 2, 3, 4, 5 0 10 comparaciones se
muestra en la Tabla ??: As, cuando se hacen cinco pruebas independientes y se desea
mantener el riesgo de cometer al menos un error tipo I una vez cada 20, la tasa de error
con respecto a la comparacin de cada una de las n = 5 pruebas debe ser c = 0, 01 y
para n = 10 debe ser c = 0, 005.
Desigualdad de Bonferroni
Bonferroni demostr que para n comparaciones la tasa de error tipo I del experimento
es menor o igual a la suma de las tasas de error de cada prueba.
E nc ,
donde la igualdad se cumple si las comparaciones son independientes.
Para una E deseada, se puede tomar c E /n.
Con base a estos resultados se dan algunas recomendaciones, Tabla 3,2, para protegerse
del error tipo I de cada prueba y del experimento.
Cuadro 3.2: Nmero de comparaciones recomendadas para n pruebas.
Prueba
Por comparacin( c )
Por experimento( E )
DMS
Duncan
SNK
Bonferroni
Tukey
Scheff
Constante
Vara con n
Constante
Conservador con respecto a n
Conservador con respecto a n
Conservador con respecto a n
No se aumenta
Vara con n
Constante
Constante
Constante
Constante
Nmero de
comparaciones
6
10
cualquier nmero
6 - 21
>10
>10
3.3.
3.3.1.
Supngase que despus de haber rechazado la hiptesis nula, con la prueba F del analisis
de varianza, se desea probar que:
0
H0 : j = j 0 , para j 6= j .
Esto puede hacerse empleando la estadstica
Y j Y j0
CMEE r1j +
t0 = s
1
r 0
.
(3.3)
, nt)
v
u
u
tCMEE
, nt)
CMEE
1
1
+
.
rj rj 0
1
1
+
rj rj 0
(3.4)
!
(3.5)
Peso
Conclusi
on
5, 6 > 3, 75
7, 8 > 3, 75
11, 8 > 3, 75
1, 0 < 3, 75N S
2, 2 < 3, 75N S
6, 2 > 3, 75
4, 6 > 3, 75
4, 0 > 3, 75
6, 8 > 3, 75
10, 8 > 3, 75
b d
6.2
2.514238e03
** 9.9454518
b e
4.6
1.859495e02
*
0.8545482
c d
4.0
3.754082e02
* 7.7454518
c e
6.8
1.156713e03
**
3.0545482
d e
10.8
7.011202e06 ***
7.0545482
Means with the same letter are not significantly
Groups,
Treatments and means
a d
21.6
b c
17.6
b b
15.4
c e
10.8
c a
9.8
2.4545482
8.3454518
0.2545482
10.5454518
14.5454518
different.
Los resultados anteriores se pueden resumir de la siguiente forma: ordnense las medias
de los tratamientos de mayor a menor, en ese mismo orden coloque las etiqueta de los
tratamientos; ahora, si para dos tratamientos que estn seguidos uno del otro no resulta
significativa la diferencia entre medias, entonces se les coloca una misma letra debajo, o
al lado si estn ordenadas en forma vertical, de las respectivas etiquetas, s la diferencia
resulta significativa, se les coloca letras diferentes, por ejemplo en el caso de ganancia
de peso las medias ordenadas de mayor a menor quedan Y 4 Y 3 Y 2 Y 5 Y 1 ,
que corresponde a: T4 T3 T2 T5 T1 .
Entre los tratamientos 1 y 5 no se encontr diferencias significativas entonces a estos se
les coloca la letra a debajo
T4
T3
T2
T5 T1
a
a
Entre los tratamientos 5 y 2 existen diferencias significativas pero entre los tratamientos
2 y 3 no existen diferencias, entonces
T4
T3
b
T2 T5 T1
b
a a
3.3.2.
T2
b
T5 T1
a a.
Uno de los procedimientos ms conocidos y aplicados para comparar medias de tratamientos es el dado por Duncan(1955), y conocido como comparacin por intervalos
mltiples de Duncan. Este procedimiento exige que los tratamientos tengan el mismo
Q0,05 (2, 20) = 2, 95; Q0,05 (3, 20) = 3, 10; Q0,05 (4, 20) = 3, 18; Q0,05 (5, 20) = 3, 25
obtenindose los valores Rp como se muestra en la Tabla ??.
Cuadro 3.5: Valores Rp tabulado para la prueba de Duncan
R2 = Q0,05 (2, 20) SY .j = (2, 95) (1, 27) = 3, 75
R3 = Q0,05 (3, 20) SY .j = (3, 10) (1, 27) = 3, 94
R4 = Q0,05 (4, 20) SY .j = (3, 18) (1, 27) = 4, 04
R5 = Q0,05 (5, 20) SY.j = (3, 25) (1, 27) = 4, 13
Al hacer las comparaciones entre medias se obtiene Tabla resumen 3,6. A partir de
Cuadro 3.6: Prueba de intervalos mltiples de
Duncan para ganancia de peso
Y j Y j 0 Conclusi
Comparaci
on
Y j Y j 0
on
T4 contra T1 21, 6 9, 8 = 11, 8
11, 8
11, 8 > 4, 13
T4 contra T5 21, 6 10, 8 = 10, 8
10, 8
10, 8 > 4, 04
T4 contra T2
21, 6 15, 4 = 6, 2
6, 2
6, 2 > 3, 94
T4 contra T3
21, 6 17, 6 = 4, 0
4, 0
4, 0 > 3, 75
T3 contra T1
17, 6 9, 8 = 7, 8
7, 8
7, 8 > 4, 04
T3 contra T5
17, 6 10, 8 = 6, 8
6, 8
6, 8 > 3, 93
T3 contra T2
17, 6 15, 4 = 2, 2
2, 2
2, 2 < 3, 75N S
T2 contra T1
15, 4 9, 8 = 5, 6
5, 6
5, 6 > 3, 94
T2 contra T5
15, 4 10, 8 = 4, 6
4, 6
4, 6 > 3, 75
T5 contra T1
10, 8 9, 8 = 1, 0
1, 0
1, 0 < 3, 75N S
este anlisis se observa que existen diferencias significativas entre todas las parejas de
medias, excepto entre 3 y 2, y entre la 5 y 1.
T4 T3
c b
T2
b
T5 T1
a a
d
21.6
1.1661904 5
19
25
e
10.8
1.2806248 5
7
15
alpha: 0.05 ; Df Error: 20
Critical Range
2
3
4
5
3.745452 3.931466 4.049682 4.132249
Comparison between treatments means
Difference
pvalue sig.
LCL
UCL
a b
5.6
0.007154
** 9.5314658 1.6685342
a c
7.8
0.000550 *** 11.8496819 3.7503181
a d
11.8
0.000005 *** 15.9322493 7.6677507
a e
1.0
0.583753
4.7454516 2.7454516
b c
2.2
0.234715
5.9454516 1.5454516
b d
6.2
0.003394
** 10.1314658 2.2685342
b e
4.6
0.018595
*
0.8545484 8.3454516
Means with the same letter are not significantly different.
Groups, Treatments and means
a d 21.6
b c 17.6
b b 15.4
c e 10.8
c a
9.8
3.3.3.
(3.9)
CMEE
, debe notarse que en todas las compar
T4 T3
a ab
T2 T5 T1
b bc
c
3.3.4.
Prueba de Scheff
Una ventaja de esta prueba es su robustez frente a la violacin de los supuestos del
ANAVA, adems que no necesita igual nmero de repeticiones por tratamiento. Es una
Y .j
donde: v = glEE .
Prueba de Scheff.
>sche <- scheffe.test(mod,"Dieta", group=TRUE)
Study:
Scheffe Test for Peso
Mean Square Error : 8.06
Dieta, means
Peso
std.err r Min. Max.
a
9.8
1.4966630 5
7
15
b
15.4
1.4000000 5
12
18
c
17.6
0.9273618 5
14
19
d
21.6
1.1661904 5
19
25
e
10.8
1.2806248 5
7
15
alpha: 0.05 ; Df Error: 20
Critical Value of F: 2.866081
Minimum Significant Difference: 6.079555
Comparison between treatments means
Difference
pvalue sig
LCL
UCL
a b
5.6
0.081176
12.2079179 1.0079179
a c
7.8
0.007613 ** 14.4079179 1.1920821
a d
11.8
0.000079 *** 18.4079179 5.1920821
a e
1.0
0.988295
7.6079179 5.6079179
b c
2.2
0.823486
8.8079179 4.4079179
b d
6.2
0.044113
* 12.8079179 0.4079179
b e
4.6
0.203196
2.0079179 11.2079179
c d
4.0
0.325658
10.6079179 2.6079179
c e
6.8
0.023228
*
0.1920821 13.4079179
d e
10.8
0.000243 ***
4.1920821 17.4079179
Means with the same letter are not significantly different.
Groups, Treatments and means
a d 21.6
ab c 17.6
bc b 15.4
c e 10.8
c a
9.8
(3.10)
3.3.5.
Prueba de Bonferroni
v
u
u
Y .j 0 > t(/2p, glEE ) tCMEE
1
1
+
rj rj 0
!
,
(3.11)
d e 10.8
0.000070 ***
5.137911 16.4620885
Means with the same letter are not significantly different.
Groups,
Treatments and means
a d
21.6
ab c
17.6
bc b
15.4
c e
10.8
c a
9.8
3.3.6.
(3.12)
r
2CM E
2(8, 06)
= 2, 65
= 4, 76.
r
5
En consecuencia, un tratamiento debe considerarse significativamente diferente del control si la diferencia de medias en valor absoluto es mayor que 4,76. Las diferencias
observadas son mostradas en la Tabla ??:
Solo las diferencias Y 3 Y 5 y Y 4 Y 5 resultaron significativas.
3.3.7.
Contrastes
En cualquier experimento se puede presentar la necesidad de comparar grupos de tratamientos, en estos casos el mtodo de los contrastes resulta una alternativa para llevar a
cabo dichas comparaciones. Por ejemplo el investigador quisiera corroborar el supuesto
de que los promedios de los tratamientos 1 y 2 no difieren de los promedios de los
tratamientos 3 y 4. En este caso la prueba que se quiere llevar a cabo es
H0 : (1 + 2 ) (3 + 4 ) = 0
contra
H1 : (1 + 2 ) (3 + 4 ) 6= 0.
Estudiamos ahora como se llega a un estadstico de prueba para corroborar esta hiptesis.
Definicin: Un contraste es toda combinacin lineal de medias de tratamiento, donde
la suma algebrica de sus coeficientes es igual a cero. En general una combinacin lineal
o contraste es de la forma:
Z1 = c11 1 + c12 2 + + c1t t =
t
X
c1j j ,
(3.13)
j=1
P
c
donde se cumple que tj=1 r1jj = 0.
Si los tratamientos tienen el mismo nmero de repeticiones, la condicin anterior se
reduce a:
t
X
c1j = 0.
(3.14)
j=1
Entonces es posible escribir una prueba de hiptesis que involucre grupo de medias de
tratamientos a partir del concepto de lo que es un contraste. Si Z1 es el contraste que
representa una comparacin de medias entonces las hiptesis estadsticas se escriben
como se muestra a continuacin:
H0 : Z1 =
t
P
j=1
c1j j = 0
contra
H1 : Z1 =
t
P
c1j j 6= 0.
j=1
Un estimador del contraste dado en (3.13) basandose en las medias de los tratamientos
es:
t
X
b
Z1 = C11 Y ,1 + C12 Y ,2 + + C1t Y .t =
C1j Y .j ,
(3.15)
j=1
donde los Y .j son los promedios procedentes de muestras aleatorias de tamao rj . S las
muestras provienen de poblaciones normales e independientes, entonces por el teorema
central del lmite se tiene que:
j2
2
.
Y.j N j , j Y .j N j ,
rj
De estos resultados se llega a:
" t
#
t
t
X
X
X
b
E Zk = E
Ckj Y .j =
Ckj E Y .j =
Ckj j .
j=1
j=1
(3.16)
j=1
y
V Zbk = V
"
t
X
#
Ckj Y .j =
j=1
t
X
t
t
2
X
X
Ckj
2
2
2 j
Ckj
V Y .j =
Ckj
= 2
,
r
r
j
j
j=1
j=1
j=1
(3.17)
j=1
rj
(3.18)
H1 : Z1 6= 0
contra
(3.19)
j=1
SCZck =
Zbk
t
P
2
para totales
(3.21)
rj Cj2
j=1
SCZck
1
= SCZck .
(3.22)
H0 : Zk = 0
contra H1 : Zk 6= 0
3.3.8.
Contrastes Ortogonales
Dos contrastes
Z1 = C11 1 + C12 2 + + C1t t
se dicen ortogonales s,
t
X
C1j C2j
j=1
rj
= 0,
(3.24)
C1j C2j = 0.
(3.25)
j=1
(3.26)
puesto que los contrastes que se analizan son independientes dos a dos, lo que conlleva
a que la variacin que se deduce de uno de los contrastes no es posible volverla a tener
en otro contraste.
Ejemplo 3.3. Se realiz un experimento con tres tratamientos, que consistin en tres
tipos de empaques llmense A (testigo), B y C, con 7 repeticiones cada uno, con el
fin de observar en un tiempo determinado la conservacin de un alimento. Despus de
procesar la informacin, se obtuvo un CMEE = 3, 076. Las comparaciones deseadas
son:
1) TA contra (TB, TC ) y 2) TB contra TC
que en terminos de contrastes ortogonales se escriben como
B + C
o Z1 : 2A B C = 0 y
1) A =
2
2) B = C
o
Z2 = B C = 0.
Solucin: Note que: C11 = 2, C12 = 1, C13 = 1 para Z1 y C21 = 0, C22 = 1, C23 = 1
para Z2 , as se puede verificar que:
3
3
P
P
0
1)
C1j = 2 + (1) + (1) = 0
y
C2j
= 0 + 1 + (1) = 0, tambin
j=1
j=1
2)
3
P
0
= (0) (2) + (1) (1) + (1) (1) = 0 + (1) + 1 = 0,
C1j C2j
j=1
contra
H1 : Z1 = 2A B C 6= 0
contra
H1 : Z2 = B C 6= 0,
FZb =
1
CMEE
SCZb
2
68, 09
63, 32
1
= 22, 13 y FZb =
= 20, 26 .
=
=
2
3, 076
CMEE
3, 076
Siendo F(5 %,1,18) = 4, 41 y F(1 %,1,18) = 8, 29 entonces, FZb y FZb >> F5 %,1,18 = 4,41,
1
2
rechazndose las hiptesis nulas planteadas.
Conclusin: al nivel de significancia del 5 %, los empaques B y C conservaron mejor el
alimento que el testigo (A) y a su vez el empaque C super en conservacin al empaque
B, dando como resultado que el mejor empaque es el C seguido del B y por ltimo el
A.
Observaciones
1. La DM S o LSD no es recomendada para todas las comparaciones mltiples de
medias cuando el nmero de tratamientos es muy alto, puesto que incrementa el
nivel de significancia o la tasa de error por comparacin.
2. El test de Duncan es sensible a declarar diferencias significativas cuando el nmero
de tratamientos es muy alto.
3. El test de Bonferroni es bastante flexible, puede ser empleado en casos balanceados o no y es superior al test de Tukey o Scheffe, si el nmero de comparaciones
es pequeo.
4. El test de Tukey es util en situaciones en que se desea informaciones preliminares
en el uso del experimento como un todo, en la determinacin de diferencias significativas o para determinar intervalos de confianza para las diferencias de medias
poblacionales.
3.3.9.
Polinomios Ortogonales
Como se aclar anteriormente cuando los niveles del factor en estudio son cuantitativos,
tales como dosis de un medicamento, raciones en una dieta, distancia de siembra, tiempo
de maduracin de un producto, etc, hacer un anlisis de comparaciones mltiples tiene
poco sentido ya que lo que interesa es la relacin entre la variable medida y los niveles
del factor cuantitativo aplicado, es decir, la funcin matemtica que explica la variable
respuesta en funcin de los niveles del factor en estudio, en estos casos el anlisis de
regresin, discutido en captulos anteriores es lo ms aconsejable.
En situaciones en la que los niveles del factor son equidistantes o igualmente espaciados,
puede simplificarse mucho el ajuste de modelos polinomiales por el mtodo de mnimos
cuadrados. El procedimiento utiliza los coeficientes de los contrastes ortogonales (Anexo
10) que se fundamenta en la siguiente explicacin (ver Gmez 1997).
Para un factor A con tres niveles, los efectos del factor estan formados por dos componentes: lineal y cuadrtico
Cambio en A
0 - 1
1 - 2
Incremento en la respuesta
a1 -a0
a2 -a1
a0 ) + (a2
a1 )] = 12 (a2
a0 ) .
a1 ) (a1
a0 )] = 21 (a2 2a1 + a0 ) .
Notese que tanto Al como AC representan un contraste, por esto, para determinar la
significancia, o presencia, de cada efecto se plantean las siguientes hiptesis nulas con
respecto a los contrastes anteriores:
H0 : AL = 0 21 (2 0 ) = 0 2 0 = 0 0 2 = 0
H0 : Ac = 0 21 (2
21 + 0 ) = 0 0
21 + 2 = 0.
As, los coeficientes ortogonales para el efecto lineal son: 1, 0 y -1 y para el efecto
cuadrtico son 1, -2 y 1.
En general, realizando el ajuste del polinomio por mnimos cuadrados, se pueden obtiener los efectos lineal, cuadrtico, cbico etc. Igualmente, tambien se puede obtener la
suma de cuadrados de cada efecto, lo cual permite determinar la contribucin de cada
trmino del polinomio.
Al igual que en contrastes ortogonales, si t niveles del factor se analizan en un experimento, es posible extraer efectos polinomiales hasta de orden t 1.
El modelo estadstico del polinomio es:
Y = 0 + 1 p1 (x) + 2 p2 (x) + 3 p3 (x) + ... + t1 pt1 (x) +
(3.27)
(3.28)
d
12
"
3
2
#
3t 7
X X
X X
el efecto cbico
p3 (x) = 3
d
d
20
y
"
#
4
2 2
X X
3t 13
3 (t2 1) (t2 9)
X X
p4 (x) = 4
+
,
d
d
14
560
el efecto de cuarto grado, donde:
d es la distancia entre los niveles del factor,
t es el nmero de niveles del factor,
j es una constante dada en la tabla de polinomios ortogonasles,
X es el promedio de los niveles del factor.
Para determinar la significancia de cada termino del polinomio o efecto, se llevan en
forma similar como se realiza en los modelos de regresin, las siguientes pruebas de
hiptesis sobre los parmetros del modelo.
H0 : 1 = 0 contra H1 : 1 6= 0,
H0 : 2 = 0 contra H1 : 2 6= 0,
H0 : 3 = 0 contra H1 : 3 6= 0,
H0 : 4 = 0 contra H1 : 4 6= 0.
Las pruebas de estas hiptesis son anlogas a las realizadas sobre un conjunto de contrastes ortogonales, donde los Ckj ya no son seleccionados segn la situacin, sino que
estn dados en la tabla de polinomios ortogonales, para cada uno de los efectos lineal,
cuadrtico, cbico, etc. As, es suficiente encontrar las sumas de cuadrados de los t 1
t
P
polinomios ortogonales Zk =
Ckj j en forma similar a como ocurre para los t 1
j=1
t
X
Ckj j .
j=1
Las estimaciones por mnimos cuadrados de los parmetros del modelo polinomial son:
t
P
bj =
Y j Pj (Y )
j=1
t
P
para
j = 0, 1, 2, ...., t 1,
[Pi (Y )]
j=1
es decir,
t
P
b0 =
t
P
C0j Y .j
j=1
t
P
2
C0j
= Y ,
b1 =
j=1
t
P
C1j Y j
j=1
t
P
2
C1j
, ,
bk =
Ckj Y .j
j=1
j=1
t
P
j=1
,
2
Ckj
donde los coeficientes Ckj son dados en la Tabla de poligonos ortogonales para el efecto
lineal (P1 (x)) , cuadrtico (P2 (x)) , cbico(P3 (x)) , etc.
Ejemplo 3.4. Supongamos que en el ejemplo del ANAVA que se ha venido analizando, las dietas que se estudian se diferencia una de otra por la presencia de un cierto
componente en dosis diferentes en porcentajes de 15, 20, 25, 30 y 35 %, tenindose entonces un factor cuantitativo e igualmente espaciado sus niveles, por lo tanto el anlisis
a considerar para este caso es el de los polinomios ortogonales. Se recuerda que en este
experimento se realiz un DCA, con cinco repeticiones.
Los datos que se obtuvieron son dados en la Tabla 3,9
Cuadro 3.9: Ganancia de peso en componentes igualmente espaciado
ganancia de peso (libra)
% componente/Repeticn 1
2
3
4
5
Y.j
Y .j
15
7
7 15 11 9
49
9, 8
20
12 17 12 18 18
77
15, 4
25
14 18 18 19 19
88
17, 6
30
19 25 22 19 23
108
21, 6
35
7 10 11 15 11
54
10, 8
Y = 376 Y = 15, 04
imdican que existen diferencias altamente significativas entre los niveles del factor estudiado.
P romedio
Ef ecto
lineal
Ef ecto
cuadr
atico
Ef ecto
c
ubico
Ef ecto
cuartico
9,8
15,4
17,6
21,6
10,8
2
1
0
1
2
2
1
2
1
2
1
2
0
2
1
1
4
6
4
1
8, 2
31
11, 4
21, 8
2, 8
14
10
14
10
70
(8, 2)2
2
= 33, 6
(31)2
2, 8
= 343, 2
(11, 4)2
2
= 64, 9
(21, 8)2
14
= 33, 9
j=1
t C2
P
kj
j=1
t
P
rj
2
Ckj
j=1
t
P
!2
Ckj Y .j
j=1
SC =
t
P
j=1
2
Ckj
rj
Las conclusiones para cada efecto se obtienen de las Tablas 3,11 y 3,11:
Entonces se concluye, para = 5 %, que la relacin entre la ganancia de peso y el %
del componente es cbica, es decir que el polinomio segn los resultados del ANAVA
es:
Yb =
b0 +
b2 p2 (x) +
b3 p3 (x)
(3.30)
Con los resultados de la Tabla 3,11 se pueden estimar los parmetros
bk del polinomio,
aplicando las expresiones correspondientes dadas anteriores, con lo cual se encuentra
que:
376
b0 = Y.. =
= 15, 04,
b2 =
25
5
P
C2j Y ij
j=1
5
P
j=1
5
P
b3 =
C3j Yj
j=1
5
P
=
2
C3j
=
2
C2j
31
= 2, 214 y
14
11, 4
= 1, 14.
10
j=1
F1 %1,20
8, 10
2 2
#
X
25
5
1
Yb = 15, 04 2, 21 (1)
5
12
!#
"
3
5
X 25
X 25
3 (5)2 7
1, 14
6
5
5
20
y simplificando se llega a:
Yb = 66, 7111 9, 174X + 0, 4814X 2 0, 00786X 3 .
(3.31)
Ahora, para encontrar la dosis ptima se aplican los conceptos de mximos y mnimos del clculo diferencial, entonces derivando la funcin anterior con respecto a X e
igualando esta derivada a cero se obtiene:
dYb
= 9, 174 + 0, 9628X 0, 02358X 2
dX
entonces al hacer esta expresin igual a cero se obtienen las soluciones:
q
1.
d2 Yb
|x=25,67 = 0, 9628 0, 04716 (25, 67) = 0, 2481 < 0 es decir, en X = 25, 67
dx2
existe un mximo relativo.
2.
d2 Yb
|x=15,15 = 0, 9628 0, 04716 (15, 15) = 0, 248 > 0 por lo tanto, en X = 15, 15
dx2
existe un mnimo relativo.
De estos resultados se concluye que la mxima ganancia de peso se tiene para dosis
alrededor de 25,67 % del componente y la mnima ganacia se obtiene con dosis cercana
a 15,15 %. Es decir que la dosis de mejor comportamiento en el experimento es la de
25 % del componente.
Ejemplo 3.5. Para ilustrar el procedimiento analicemos el trabajo preliminar llevado a
cabo por Cardona (2003), donde se estudi el efecto de la aplicacin de dosis de calcio,
en tres dosis de aplicacin, en la calidad de los frutos de tomate. La variable de inters
fue la cantidad de calcio en dicho fruto. Las dosis de calcio estudiadas fueron de 0; 0,05;
0,1 y 0,15 el experimento se llevo a cabo bajo un diseo completamente al azar (DCA)
con 4 repeticiones. Los resultados obtenidos por unidad experimental son presentados
en la Tabla 3,13.
1
0, 172
0, 212
0, 252
0, 424
as
FC =
2
0, 204
0, 136
0, 272
0, 468
3
0, 244
0, 268
0, 212
0, 524
4
0, 148
0, 204
0, 228
0, 452
Y.j
0, 768
0, 82
0, 964
1, 968
Y.. = 4, 42
Y .j
0, 192
0, 205
0, 241
0, 467
Y .. = 0, 2762
Y..2
4, 422
=
= 1, 2210
n
16
4 X
4
X
Yij2 F C
i=1 j=1
= 0, 1722 + 0, 2042 + 0, 2442 + 0, 5242 + 0, 4522 1, 2210 = 0, 2205
SCConcentracion =
4
X
Y.j2
j=1
rj
FC
0, 7682 0, 822 0, 9642 1, 8682
=
+
+
+
1, 2210 = 0, 1992
4
4
4
4
= SCT otal SCConcentracion = 0, 2205 0, 1992 = 0, 0213
SCEE
Tenindose un factor cuantitativo e igualmente espaciado sus niveles, el anlisis a considerar es el de polinomios ortogonales. Los coeficientes, a partir de la tabla de polinomios
ortogonales, para este caso de 4 niveles de tratamiento para cada efecto, lneal, cuadrtico y cbico, son dados en la Tabla 3,15
Cuadro 3.15: Coeficientes para cuatro niveles igualmente espaciados
C1j (E. lineal) C2j (E. cuadr
atico) C3j (E. c
ubico)
3
1
1
1
1
3
1
1
3
3
1
1
Los resultados de la suma de cuadrados para cada efecto se obtiene en la Tabla 3,16
Cuadro 3.16: Sumas de cuadrado para concentraciones de calcio.
Ef ecto
Ef ecto
Ef ecto
Concentracin
Y .j
lineal
cuadr
atico
c
ubico
0
0, 192
3
1
1
0, 05
0, 205
1
1
3
0, 1
0, 241
1
1
3
0, 15
0, 467
3
1
1
P4
b
Z = j=1 Ckj Y .j
0, 861
0, 213
0, 167
2
P4 Ckj
5
1
5
j=1
P4 rj2
20
4
20
j=1 Ckj
P
2
4
j=1 Ckj Y .j
2
2
0,8612
SC =
= 0, 1482 0,213
= 0, 0453 0,167
= 0, 0055
2
P4 Ckj
5
1
5
j=1 rj
(3.32)
para efectos de
SC
CM
0, 1992 0, 0664
0, 1482 0, 1482
0, 0453 0, 0453
0, 0055 0, 0055
0, 0142
8, 06
concentracin de calcio.
Fc
F5 %(1,20) F1 %(1,20)
37, 27
3, 49
5, 95
83, 22
4, 75
9, 33
25, 46
4, 75
9, 33
NS
3, 13
4, 75
9, 33
4, 75
9, 33
Analizando los resultados anteriores se tiene que la respuesta lneal fue significativa,
es decir que existen diferencias estadsticas al 5 % entre la dosis de cero y la de 0,15;
ahora como el efecto es positivo quiere decir que se obtiene mayor cantidad de calcio
en el tomate para concentracin de 0,15 que para concentracin de cero. Tambien el
efecto cuadrtico resulto significativo, es decir que los incrementos y decrementos en
la respuesta se presentan en forma desuniforme; siendo el efecto positivo, entonces la
parabola abre hacia arriba indicando que se presenta inicialmente un decremento y
posteriormente un incremento en la cantidad de calcio en el cultivo de fruto de tomate.
Con los resultados de la Tabla 3,17 se pueden estimar los parmetros del polinomio,
aplicando las expresiones correspondientes dadas anteriormente, por lo tanto se tiene
que:
b0 = Y .. = 0, 2762
P4
0, 861
j=1 C1j Y ij
=
= 0, 0430
b1 =
P4
2
20
j=1 C1j
P4
0, 213
j=1 C2j Y .j
=
b2 =
= 0, 0532.
P4
2
4
j=1 C2j
Asimismo, de la Tabla de polinomios ortogonales se tiene que 1 = 2 y 2 = 1 adems
como d = 0, 05 y t = 4 entonces: X = 0+0,05+0,1+0,15
= 0, 075 luego, remplazando
4
todos estos terminos en la ecuacin (3,32) se obtiene:
"
2 2
!#
X
0,
075
4
1
X
0,
075
+0, 0532 (1)
(3.33)
Para encontrar la concentracin ptima se aplican los conceptos de mximos y mnimos de una funcin del clculo diferencial, entonces derivando la funcin anterior con
respecto a X e igualando esta derivada a cero se obtiene:
dYb
dYb
= 42, 56X 1, 472 y haciendo dX
= 0 se obtiene X = 1,472
= 0, 03458 como punto
dX
42,56
crtico de la funcin. Calculando la segunda derivada se llega a
d2 Yb
dX 2
= 42, 56 y aplicando
2b
d Y
el criterio de la segunda derivada se obtiene que, dX
2 /x=0,03458 = 42, 56 > 0 es decir que
en X = 0, 03458 existe un mnimo relativo.
De estos resultados se concluye que la mnima cantidad de calcio en el fruto de tomate
se obtiene para una concentracin de calcio aplicando alrededor de 0,03458 %. La curva
estimada es una parabola abierta hacia arriba, entonces la mejor concentracin en el
experimento son las cercanas a los valores extremos, para el caso la concentracin de
0,15( %).
CAPTULO 4
DISEO EN BLOQUES
COMPLETAMENTE ALEATORIZADOS
4.1.
Generalidades
Cuando se lleva a cabo un experimento, no siempre se tienen condiciones de homogeneidad en el rea o rea experimental, por lo que tenemos que pensar en una alternativa
para controlar el error experimental. Una muy utilizada es la aplicacin del diseo en
bloques al azar.
El diseo en bloques al azar se recomienda cuando las unidades experimentales pueden
agruparse de acuerdo a una fuente de variacin o gradiente, de tal modo que en cada
grupo o bloque resulte un conjunto relativamente uniforme u homogneo de unidades
experimentales
Entre los diseos en bloque, el ms comn es el de bloques completos al azar, en el cual
todos los tratamientos aparecen en cada bloque. En este diseo los bloques contienen
el mismo nmero de unidades experimentales y los tratamientos se deben distribuir al
azar dentro de cada bloque; es usual que cada tratamiento se asigne una sola vez en
cada bloque, caso balanceado, pero podra repetirse dos o mas veces al requerirse mayor
precisin. Cuando cada tratamiento aparece una sola vez en cada bloque, entonces, las
repeticiones la conforman los bloques, es decir r1 = r2 . . . rt = r para cada tratamiento.
En la prctica las unidades experimentales deben colocarse con su mayor longitud
paralela a la fuente de variacin o gradiante del factor que se quiere controlar. Para r
bloques, o repeticiones, el esquema en campo es el siguiente:
En este tipo de diseo los bloques se utilizan como un medio para controlar el error
experimental, pero en ningn caso la respuesta debe estar sujeta al efecto combinado de
bloques y tratamientos. Por eso es importante llevar a cabo una prueba de aditividad
del modelo.
50
Bloque1
Bloque2
Sentido de la
Gradiente
Bloque r 1
Bloque r
CORRECT O
4.1.1.
Bloque1
Bloque2
Sentido de la
Gradiente
Bloque r 1
Bloque r
IN CORRECT O
1. Ventajas:
El agrupamiento de las unidades experimentales permite controlar una fuente
de variacin, obteniendose una reduccin del error experimental
Es posible aumentar el nmero de repeticiones dentro de cada bloque para
aquellos tratamientos que se deseen estudiar con mayor precisin.
Si se pierde una, o ms de una unidad experimental, esta(s) se puede(n)
estimar con las restantes.
2. Desventajas :
No es apropiado para un nmero grande de tratamientos (se recomiendan
mximo 25)
Si se bloquea sin necesidad, no hay ganancia en precisin respecto al DCA
y por el contrario se pierde eficiencia debido a la reduccin de los glEE.
3. Aleatorizacin
Los tratamientos se deben aleatorizar dentro de cada uno de los bloques, en
forma independiente. Por ejemplo, si el ensayo en campo consta de cinco tratamientos (t1, t2, t3, t4, t5 ) y tres bloques, una de las posibles distribuciones de
los tratamientos a las parcelas puede ser:
t2
4.2.
Bloque I
t1 t5 t4
t3
t1
Bloque II
t2 t3 t4
t5
t3
Bloque III
t2 t1 t4
t5
Modelo Estadstico
(4.1)
4.2.1.
Nuevamente el inters radica en saber si estadsticamente existen diferencias significativas entre los tratamientos, y por otro lado, pero ya en un segundo plano, determinar
si el bloqueo fue efectivo.
As, las pruebas de hiptesis correspondientes son:
1. Para los tratamientos: Ho : 1 = 2 = = t contra H1 : j 6= j 0 para
0
algn j 6= j ,
2. Para los Bloques: Ho : 1 = 2 = = r contra H1 : i 6= i para algn
0
i 6= i .
Dado que j = + j , entonces la primera hiptesis tambin se puede escribir como
0
r X
t
X
i=1 j=1
r X
t
X
Yij Y
2
r X
t
X
Y i Y
i=1 j=1
Yij Y i Y j + Y
2
2
r X
t
X
Y j Y
2
+(4.2)
i=1 j=1
(4.3)
i=1 j=1
gl
r1
t1
(r 1) (t 1)
n1
SC
SCBloques
SCT T O
SCEE
SCT otal
CM
SC
CMBloques = Bloques
r1
TTO
CMT T O = SCt1
SCEE
CMEE = (r1)(t1)
Fc
CMBloques
CMEE
CMT T O
CMEE
FT abla
F, (r1), (r1)(t1)
F, t1,(r1)(t1)
donde,
SCT otal =
r X
t
X
Yij2
i=1 j=1
SCT T O =
t
X
Yj2
j=1
Adems,
r P
t
P
Y =
Yij2 ,
n=
i=1 j=1
t
P
Y2
;
n
Y2
n
SCBloques =
r
X
i=1
Yi.2
Y2
n
j=1
glEE = (r 1) (t 1) .
La implementacin de las pruebas de comparacin mltiple en este diseo se hace
en forma similar al de DCA, simplemente que ahora se utilizarn los glEE y el CMEE
obtenidos para el diseo en bloque, pero las expresiones para las pruebas son las mismas estudiadas en el DCA. Si algunos tratamientos se han repetido un numero de veces
mayor que otros, las repeticiones extras de estos tratamientos deben aparecer en forma
consistente en todos los bloques. Para efectuar las comparaciones multiples en este
caso, se adopta la expresin :
s
S2
1
1
.
(4.4)
+
2
rj
rj 0
Ejemplo 4.1. Lozano et al (2004), estudiaron el comportamiento agronmico del cultivo del maz HS-36 para un programa de nutricin foliar complementario, bajo un
diseo en bloques completamente al azar con 4 repeticiones o bloques. Los tratamientos
que componen los programas de nutricin son los siguientes:
T 1: Testigo o control (nutricin edfica)
T 2: Nutricin edfica +aplicaciones de nutrientes foliares a los 12 das (1 lt/ha) y a
los 18 y 25 das 2 lt/ha, en cada aplicacin
T 3: Nutricin edfica +aplicaciones de nutrientes foliares a los 12 das (1 lt/ha) y a
los 18 y 25 das 2 lt/ha, en cada aplicacin
FC =
SCT otal
SCBloques =
4
X
Y2
i.
i=1
SCT T O =
Y2
n
Y2
n
>bloques = read.csv2("Long.csv")
>attach(bloques)
>Bloques=as.factor(Bloque)
>summary(aov(Longitud Bloques+Tratamiento))
Df
Sum Sq Mean Sq F value Pr(>F)
Bloques
3
443413
147804 3.690
0.0557 .
Tratamiento 3
258183
86061 2.148
0.1641
Residuals
9
360526
40058
-Signif. codes:
0 0.001 0.01 0.05 0.1 1
No se encuentran diferencias significativas entre tratamientos como tampoco entre bloques, es decir para una prxima ocasin por esta variable no es necesario bloquear. An
asi se puede utilizar la prueba de Bonferroni para corroborar la hiptesis
H0 : .j = .j , , para j 6= j
en este caso
p=6 comparaciones, es
p el valor crtico para p
t( , glEE ) 2CMEE /r = t( 0,05 , 9) 2 40058, 4/4 = 3, 28 141, 5 = 464, 2.
2p
26
Los promedios por tratamiento son dados en la tabla 4,4
Cuadro 4.4: Promedio por TTO para longitud de mazorca
T3
T4
T2
T1
1613,1 1491,7 1458,0 1259,6
>tapply(Longitud,Tratamiento,mean)
T1
T2
T3
T4
1259.625 1458.082 1613.155 1491.790
4.2.2.
rYi0 + tYj0 Y0
.
(r 1) (t 1)
(4.5)
118 137
160 133 130 141
Entonces, para estimar Y23 se tiene: Y02 = 158 + 162 + 118 + 137 = 575,
Y30 = 145 + 133 = 278 y Y = 164 + 150 + + 141 = 2028
entonces,
drado medio del error para este experimento o son 8, pero como se estim una
observacin se reducen en uno, es decir que slo quedan 7 grados de libertad para
estimar el error experimental.
2. Estimacin para Ms de Una Unidad Perdida.
Cuando se pierde ms de una observacin en el experimento, el procedimiento
para completar la informacin se ilustrar con el siguiente ejemplo: Supongase
que en la informacin anterior se perdieron tres observaciones, Y11 , Y23 y Y35 , tal
y como se ilustra en la Tabla 4,8
118 137
III
137 160 133 130
Inicialmente se estimar la observacin Y11 , as que para las otras dos observaciones
perdidas se tomar el promedio de las dos unidades que no se perdieron, resultando la
Tabla 4,9
118
III
137
160 133 130
perdida
5
141
137
139
Finalmente se obtiene el ltimo valor perdido Yb35 , entonces siguiendo los mismos pasos
de los anteriores valores perdidos, se tiene: Y30 = 560, Y50 = 278 y Y = 2015, 031
obtenindose
3 560 + 5 278 2015, 031
= 131, 871.
Yb35 =
(3 1) (5 1)
Llegndose as a la Tabla completa 4,12
Sin embargo, este proceso no termina aqu, ahora nuevamente se estima Y11 , con este
valor nuevamente se estima Y23 y posteriormente Y35 , asi se sigue el proceso iterativamente hasta cuando haya convergencia en los valores, es decir cuando estos sean muy
parecidos entre una iteracin y otra.
Como se han estimado tres observaciones, entonces los grados de libertad del error se
disminuyen en 3, es decir que ahora slo se tienen 5 grados de libertad para estimar el
error experimental.
4.2.3.
Para llevar a cabo las pruebas de validacin correspondientes se deben calcular inicialmente los errores, los cuales vienen dados por la expresin
eij = Yij Y i Y j + Y ,
(4.6)
con los cuales se valida la hiptesis de normalidad de Shapiro Wilk, o cualquier otra,
mientras que para la prueba de homogeneidad de varianzas el procedimiento es el mismo
dado por el mtodo de Hartley o el de Bartlett, aunque en este diseo por lo general se
aplica la prueba de Hartley por ser ms sencilla de aplicar aunque es ms conservadora.