Vous êtes sur la page 1sur 60

CONTENIDO

1. Diseo Experimental
1.1. Generalidades . . . . . . . . . . . . . . . . .
1.2. Conceptos Bsicos del Diseo Experimental
1.2.1. Unidad Experimental y Tratamiento
1.2.2. Error Experimental (EE) . . . . . .
1.2.3. Repeticiones y sus Funciones . . . . .
1.2.4. Control del Error Experimental . . .
1.2.5. Aleatorizacin . . . . . . . . . . . . .
1.3. Estructuras del Diseo Experimental . . . .
1.3.1. Estructura de Tratamiento . . . . . .
1.3.2. Estructura de Diseo . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

2. Diseo Completamente al Azar (DCA)


2.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1. Ventajas y Desventajas del DCA . . . . . . . . . . . .
2.1.2. Usos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.3. Aleatorizacion . . . . . . . . . . . . . . . . . . . . . . .
2.2. Modelo Estadstico y Supuestos . . . . . . . . . . . . . . . . .
2.3. Modelos de Efectos Fijos y Aleatorios . . . . . . . . . . . . . .
2.3.1. Estimacin de Parmetros . . . . . . . . . . . . . . . .
2.3.2. Hiptesis de Inters . . . . . . . . . . . . . . . . . . . .
2.3.3. Anlisis de Varianza (ANAVA) . . . . . . . . . . . . .
2.3.4. Sumas de Cuadrados (SC) y Grados de Libertad (gl) .
2.3.5. Pruebas de Hiptesis y Errores Estndar . . . . . . . .
2.4. Pruebas de Validacin de los Supuestos del Modelo . . . . . .
2.4.1. Pruebas de Homogeneidad de Varianzas . . . . . . . .
2.4.2. Prueba de Normalidad de los Errores de Shapiro - Wilk
2.4.3. Prueba de homogeneidad de Hartley: . . . . . . . . . .
2.4.4. Prueba de Bartlett: . . . . . . . . . . . . . . . . . . .
2.5. Modelo de Componentes de Varianza (Efectos Aleatorios) . . .
1

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

2
2
2
3
3
3
4
4
4
4
4

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

6
6
6
7
7
7
8
9
10
11
11
12
14
15
16
18
18
19

3. Comparaciones Mltiples
3.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2. Evaluacin de la Tasa de Error . . . . . . . . . . . . . . . . . . . . . .
3.3. Pruebas de Comparaciones Mltiples . . . . . . . . . . . . . . . . . . .
3.3.1. Metodo de las Diferencias Mnimas Significativas (DMS) . . . .
3.3.2. La Prueba de Intervalos Mltiples de Duncan. . . . . . . . . . .
3.3.3. Prueba Honesta de Tukey . . . . . . . . . . . . . . . . . . . . .
3.3.4. Prueba de Scheff . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.5. Prueba de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . .
3.3.6. Comparacin de Medias de Tratamientos con un Control (Prueba
de Dunnett) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.7. Contrastes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.8. Contrastes Ortogonales . . . . . . . . . . . . . . . . . . . . . .
3.3.9. Polinomios Ortogonales . . . . . . . . . . . . . . . . . . . . . . .

23
23
24
25
26
28
31
32
34

4. Diseo en Bloques Completamente Aleatorizados


4.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1. Ventajas, Desventajas y Aleatorizacin en el Diseo en Bloques
al Azar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2. Modelo Estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1. Pruebas de Hiptesis y Anlisis de Varianza . . . . . . . . . . .
4.2.2. Estimacin de Valores Perdidos en un Diseo en Bloques Completos al Azar . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3. Pruebas de Validacin de los Supuestos del Modelo . . . . . . .

50
50

35
36
38
40

51
51
52
56
59

CAPTULO 1
DISEO EXPERIMENTAL

1.1.

Generalidades

En la bsqueda planeada para obtener nuevos conocimientos o para confirmar o no resultados de experimentos previos con la finalidad de tomar desiciones, los investigadores
se apoyan en las herramientas que brinda el diseo experimental para seguir realizando
sus experimentos. Los objetivos se establecen sobre la base de preguntas que han de
responderse, hiptesis que han de probarse, y efectos que han de estimarse.
Los objetivos se deben clasificar en mayores y menores ya que ciertas comparaciones de
tratamientos son ms importantes que otras.
Existen tres categorias de experimentos:
1. Experimento preliminar:
el investigador prueba un nmero grande de tratamientos con el objeto de tener
indicios para futuros trabajos
2. Experimento crtico:
el investigador compara las respuestas a diferentes tratamientos usando un nmero suficiente de observaciones para obtener seguridad razonable de detectar
diferencias significativas.
3. Experimentos demostrativos:
se llevan a cabo cuando se quieren comparar uno o mas tratamientos nuevos con
un patrn.

1.2.

Conceptos Bsicos del Diseo Experimental

A continuacin se estudiaran conceptos bsicos que son importantes en la construccin


y ejecucin de un diseo experimental.

1.2.1.

Unidad Experimental y Tratamiento

Una unidad experimental, o parcela experimental, es la unidad de materia a la cual se


aplica un tratamiento.
El tratamiento es el procedimiento cuyo efecto se mide y se compara con otros tratamientos.
La unidad experimental puede ser un animal, una parcela, una planta, un medio de
cultivo, una persona, un grupo de personas, 10 pollos en galpn, etc. El tratamiento
puede ser una dosis de cal, una variedad, un tipo de fertilizante, un programa de aspersin , una combinacin temperatura-humedad, una dieta, un mtodo de aplicacin,
etc. Cuando se mide el efecto de un tratamiento, se mide en una unidad de muestreo,
cierta fraccin de la unidad experimental, por lo tanto la unidad de muestreo puede ser
la unidad completa.
Al escoger los tratamientos se debe tener el cuidado de asegurarse que el conjunto de
respuestas esten coherentemente relacionadas con los objetivos.

1.2.2.

Error Experimental (EE)

Una caracterstica de todo material experimental es la variacin. El error experimental


es una medida de la variacin existente entre las observaciones medidas sobre unidades
experimentales tratadas en forma similar.
Las variaciones por lo general provienen de dos fuentes principales: la variabilidad
inherente al material experimental y la variacin resultante de cualquier falta de uniformidad en la realizacin fsica del experimento.
Por otro lado, la longitud de un intervalo de confianza y el poder o potencia de una prue2
ba de hiptesis dependen en definitiva de V (Y ) = n . Asi que para obtener intervalos
cortos o alto poder en las pruebas, se debe reducir al mximo el error experimental, es
decir, manejar el material experimental de tal manera que se logren reducir los efectos
debidos a la variabilidad inherente y refinar la tcnica experimental.
Segn Fisher (1935), se puede obtener un buen diseo de experimento si se tienen en
cuenta los siguientes principios bsicos:

1.2.3.

Repeticiones y sus Funciones

Cuando un tratamiento aparece ms de una vez en un experimento se dice que esta


repetido.
Las funciones de la repeticin son:
1. Permitir estimar el error experimental
2. Mejorar la precisin de un experimento mediante la reduccin de la desviacin
estndar de una media de tratamiento V (Y ).
3. Aumentar el alcance de la inferencia del experimento a travs de la seleccin y
uso apropiado de unidades experimentales mas viables.
4. Ejercer control sobre la varianza del error.

1.2.4.

Control del Error Experimental

El control del error experimental puede lograrse mediante la escogencia del diseo experimental adecuado, es decir, por medio de diseos como el de bloques completos
aleatorizados (DBCA) o cuadrados latinos (DCL), el uso de observaciones concominantes (Covariables) y una apropiada eleccin del tamao y la forma de las unidades
experimentales.
Los tratamientos deben ser elegidos de tal forma que esten acordes con el estudio que
se quiere realizar, con los objetivos, con el problema que se est planteando, es decir,
con las hiptesis de inters.

1.2.5.

Aleatorizacin

La aleatorizacin es la disposicin de los tratamientos dentro del campo experimental.


La funcion de la aleatorizacin es la de asegurarse que se obtengan estimativas vlidas
del error experimental.
En todos los diseos, la aleatorizacin de los tratamientos a las unidades experimentales
es esencial para obtener conclusiones vlidas en los resultados.

1.3.

Estructuras del Diseo Experimental

Segn Hinkelmann & kempthorne (1994), cuando se realiza un diseo es esencial tener
en cuanta dos estructuras bsicas, las cuales hay que identificar y distinguir, estas son:
La estructura de tratamiento y la estructura de diseo.

1.3.1.

Estructura de Tratamiento

Segn la naturaleza del experimento, en esta fase se debe determinar, el nmero de


tratamientos, combinaciones de tratamientos que se van a estudiar y a comparar. Los
tratamientos estan determinados por el nmero de factores que se van a comparar
para medir sus efectos. Si es un factor nicamente, la estructura de tratamientos
est formada por un conjunto de tratamientos, en este caso se habla de una va de
clasificacin. Si hay ms de un factor, los tratamientos son combinaciones de niveles de
los factores y se habla de clasificacin a dos vias y ms, dependiendo del nmero de
factores (experimentos factoriales).

1.3.2.

Estructura de Diseo

Se determina con la agrupacin de las unidades experimentales en bloques o grupos


homogneos, de tal manera que las condiciones bajo las cuales se observan los tratamientos sean las ms homogneas posible. Si todas las unidades experimentales se dan
bajo las mismas condiciones, se tiene slo un grupo y los tratamientos se pueden asignar
en forma completamente aleatoria a las unidades experimentales, en este caso se tiene
un diseo completamente aleatorio (DCA), Si se necesita ms de un grupo (bloques)

de unidades experimentales, donde las unidades dentro del grupo son ms homogneas
que las unidades entre grupos distintos, entonces se habla de diseos en bloques.

CAPTULO 2
DISEO COMPLETAMENTE AL AZAR
(DCA)

2.1.

Generalidades

En esta estructura de diseo se supone que el material o rea experimental es completamente homogneas, es decir, las condiciones de todas las unidades experimentales
son igualmente controladas. En este tipo de diseo los tratamientos se asignan a las
unidades experimentales en forma completamente aleatoria.
Si se tienen t tratamientos y n unidades experimentales, con n > t, se puede aplicar el
primer tratamiento a r1 unidades experimentales escogidas al azar del total n, se asigna
el segundo tratamiento a r2 unidades experimentales a partir de las n r1 restantes,
asi hasta llegar a asignar el tratamiento t a la rt ltimas unidades experimentales.

2.1.1.

Ventajas y Desventajas del DCA

1. Ventajas. Entre las ventajas que se pueden obtener cuando se aplica este diseo
tenemos: la flexibilidad, es decir, se puede aplicar cualquier nmero de tratamientos y repeticiones. Aunque no es necesario tener igual nmero de repeticiones
por tratamiento; las comparaciones entre tratamientos son ms precisas cuando
r j = r j = 1, 2, , t. Otra ventaja es la sencillez en el anlisis estadstico, puesto que el anlisis es simple a pesar de que no se tenga igual nmero de
repeticiones por tratamientos, y no se complica por la prdida de unidades experimentales. Adems, el diseo proporciona el mayor nmero de grados de libertad
para el error, comparado con otros diseos de estructura ms compleja.
2. Desventajas. La principal desventaja es su baja precisin y eficiencia cuando las
unidades experimentales son heterogneas hecho que lleva a una sobre-estimacin
de la varianza del error experimental.

2.1.2.

Usos

1. Si las unidades experimentales son uniformes, es el diseo ms eficiente entre todos los diseos
2. til cuando una porcion grande de unidades experimentales pueden no responder
o pueden perderse
3. til en experimentos donde hay una limitacin en el nmero total de unidades
experimentales ya que proporciona el mayor nmero de grados de libertad.

2.1.3.

Aleatorizacion

En este diseo los tratamientos se distribuyen a las unidades experimentales en forma


completamente al azar, adems, sirve para remover sesgos sistemticos

2.2.

Modelo Estadstico y Supuestos

Sea Yij la respuesta al tratamiento j esimo en la unidad experimental i esima.


Se puede considerar Y11 , Y21 , Y31 , , Yr1 1 como una muestra aleatoria de tamao r1
tomada de una poblacion con media 1 y varianza 12 , asi mismo, Y12 , Y22 , Y32 , , Yr2 2
sera una segunda muestra aleatoria de tamao r2 tomada de una poblacion con media
2 y varianza 22 , asi sucesivamente para j = 3, 4, .., t.
Considere el caso ms simple donde 12 = 22 = = t2 = 2 , esto es, cuando la
aplicacin del tratamiento j esimo en la unidad experimental i esima afecta la
media de la respuesta debido a la aplicacin del tratamiento pero no su varianza.
El modelo estadstico que describe las respuestas de las n observaciones es:
Yij = + j + ij
i = 1, 2, , rj

(2.1)
y

j = 1, 2, , t,

donde,
Yij : Es la observacin obtenida en la i esima unidad experimental del j esimo
tratamiento.
: Es un parmetro comn a todos los tratamientos y corresponde a la media
general.
j : Es el efecto del tratamiento j esimo.
ij : Es el error aleatorio que se comete en la i esima unidad experimental del
j esimo tratamiento.
rj : Es el nmero de repeticiones del tratamiento j esimo.

t: Es el nmero de tratamientos.
El modelo de la ecuacin se puede escribir en la forma Yij = j + ij donde j = + j
representa la media del tratamiento j esimo, entonces ij = Yij j por lo tanto,
E(ij ) = E(Yij ) j = j j = 0 y V (ij ) = 2ij = j2 . Como todos los tratamientos estn sometidos a las mismas condiciones, se supone que 2ij = j2 = 2 ,
para j = 1, 2, ..., t, es decir, los errores tienen varianza constante 2 . Por otro lado, los
tratamiento son aleatorizados, lo que hace pensar que los errores deberan ser independientes, es decir, el error en la unidad experimental i, no influye en el error obtenido
0
en la unidad experimental i . Esto se puede expresar estadsticamente como Cov(ij ,
i0 j 0 ) = 0 para todo j, j 0 = 1, 2, ..., t e i, i0 = 1, 2, ..., rj .
Para llevar a cabo las pruebas de hiptesis del modelo se necesita asignarle una distribucin a los errores, la ms comn es la distribucin normal, dadas las caractersticas
que tiene esta variable aleatoria y para poder llegar teorcamente a encontrar un estadstico de prueba basado en la teora de la inferencia estadstica clsica. As, se supone
que los errores tienen distribucin normal, son independientes e identicamente distribuidos, tienen media cero, varianza constante, todas estas caractersticas de los errores
se resume en la siguiente notacin:
iid

ij N (0, 2 ) .
Dado que los estadsticos de prueba estn construidos bajo estos supuestos, posteriormente para dar mayor credibilidad a los resultados obtenidos estos deben ser validados
con los datos que se obtengan del experimento.

2.3.

Modelos de Efectos Fijos y Aleatorios

En la prctica los tratamientos que se utilizan en el experimento son escogidos por el


investigador de acuerdo a los objetivos de la investigacin, por referencias tericas, o
a su criterio, en este caso se dice que el modelo de la ecuacin es de efectos fijos. Por
ejemplo, el investigador decidi que las variedades a utilizar para el experimento son A,
B y C, que las dosis de cal ms oportunas son de 0, 20, 60 y 80 kg/ha. En otros casos
los tratamientos pueden ser seleccionados aleatoriamente de un nmero determinado de
tratamientos, en cuyo caso se dice que el modelo es de efectos aleatorios. Como en el
caso en que el investigador debe seleccionar un nmero de semillas de una gran familia
de semillas o escoger un grupo de toros de un hato mayor.
En cada uno de los casos anteriores los objetivos son diferentes, como se ilustra a
continuacin.
1. Modelo de Efectos Fijos
El objetivo primordial es saber si existen diferencias entre los tratamientos aplicados, lo cual equivale a comparar los promedios de los tratamientos para determinar
si existen diferencias entre ellos. Como j es la variacin de la media del tratamiento j con respecto a la media general, j = + j , entonces bajo este modelo

se tiene el supuesto

t
P

j = 0.

j=1

En este tipo de modelo, al haber repeticin del ensayo, el experimento se repite


con los mismos tratamientos. Las hiptesis de inters son:
H0 : 1 = 2 = = t = contra H1 : Al menos una media de tratamiento
es diferente.
2. Modelo de Efectos Aleatorios
Por la naturaleza del modelo, el objetivo no se centra en las medias de los tratamientos, sino en la variabilidad de stos, porque al no existir tal variabilidad,
el comportamiento de los tratamientos sera similar. Entonces el objetivo central
es estimar la variacin entre las medias de los tratamientos. En este caso si el
experimento se repite no se tienen siempre los mismos tratamientos, puesto que
por cada ensayo hay selecin de los tratamientos a tener en cuenta. el supuesto
sobre los efectos de los tratamientos es que. j N (0, 2 ) .
La hiptesis de inters es H0 : 12 = 22 = = t2 = 2 .

2.3.1.

Estimacin de Parmetros

Para cada tratamiento j = 1, 2, ..., t, la muestra de tamao rj > 1, proporciona un estimativo de la media y la varianza muestral de ese tratamiento mediante las expresiones
usuales
rj
rj
2
P
P
Yij Y j
Yij
rj
P
Y
y

bj2 = Sj2 = i=1


siendo Y.j = Yij .
= r.jj .
bj = Y j = i=1
rj
rj 1
i=1
Dado el supuesto que la variabilidad de los tratamientos es la misma, e igual a 2 , entonces un promedio ponderado de los t estimadores Sj2 da el mejor estimador insesgado
de 2 . As el mejor estimador insesgado de 2 viene dado por:
t
P

b2 = CM =

t
P

(rj 1) Sj2

j=1
t
P

(rj 1) Sj2

j=1

nt

(rj 1)

(2.2)

j=1

Ahora:
(rj 1) Sj2 =

rj 
P
i=1

Yij Y .j

2

rj
P

Yij2 rj Y .j =

i=1

rj
P

Yij2

i=1

Y.j2
rj

= SCEEj , siendo SCEEj

la suma de cuadrados de los errores para el tratamiento j-simo. Entonces,


Pt
2

b =

SCEEj

j=1

n t

(2.3)

Para el estimador de j ,
bj = Y j se tiene, de acuerdo a la teora estadstica que:



2

bj N j , rj

para

j = 1, 2, ..., t.

Entonces la variable aleatoria


t=

2.3.2.

bj j

bj

rj

tnt .

(2.4)

Hiptesis de Inters

En el modelo de efectos fijos se desea probar si los efectos de los diferentes tratamientos
es difeerente de cero o tambin si las medias de los diferentes conjuntos de tratamientos
presentan diferencias estadsticas. El experimentador puede probar los siguientes tipos
de hiptesis.
H0 :

cj j = a, para un conjunto de constantes c1, c2, . . . , ct y a.

H0 : 1 = 2 = = t
H0 : j = j0

para algn j 6= j0

Para el primer caso se puede probar que el error estndar de


v
!
u t
t
X
uX Cj2
ee
cj
bj =
bt
r
j=1
j=1 j

t
P
j=1

cj
bj es:
(2.5)

Por lo tanto la estadstica


Pt
t=

q
Pt

bj
i=1 cj

Pt

i=1 cj j
c2j
i=1 rj

es decir, para probar la hiptesis nula H0 :

t
P

tnt

(2.6)

cj j = a se debe calcular

j=1
t
P

t
P
cj
bj a
cj
bj a
j=1
j=1
!= s
tc =
,
t
t C2
P
P
j
ee
cj
bj

b
rj
j=1

(2.7)

j=1

rechazandose H0 s |tc | > t(1/2, nt) . Las pruebas de hiptesis de los casos 2 y 3 se
obtienen como casos particulares de la hiptesis del caso 1.

2.3.3.

Cuadro 2.1:
repetici
on/T T O
1
2
3
..
.

Tabla
1
Y11
Y21
Y31
..
.

rj
Total
Media

Yr1 1
Y1
Y 1

de totales para un DCA.


2
3
...
j
...
Y12 Y13 ... Y1j ...
Y22 Y23 ... Y2j ...
Y32 Y33 ... Y3j ...
..
..
..
.
.
...
.
...
Yr2 2 Yr3 3 ... Yrj j ...
Y2
Y3 ... Yj ...
Y 2 Y 3 ... Y j ...

t
Y1t
Y2t
Y3t
..
.
Yr t t
Yt
Y t

Anlisis de Varianza (ANAVA)

Si se tienen rj observaciones para cada tratamiento, los datos del experimento se pueden
representar mediante la matriz dada en la Tabla ??.
donde rj es el nmero de repeticiones por tratamiento y t es el nmero de tratamientos,
rj
P
Yij = Yj es el total del tratamiento j esimo para j = 1, 2, ..., t.
i=1

Tambin se tiene que Y =

rj P
t
P

Yij =

i=1j=1

Y =

Y
,
n

2.3.4.

t
P

Yj , llamado total general,

Y j =

j=1

que representa la media general siendo n =

t
P

Yj
rj

rj .

j=1

Sumas de Cuadrados (SC) y Grados de Libertad (gl)

En este diseo la variacin total se divide en dos componentes


SCT otal = SCT ratamiento + SCError Experimental ,
que se puede simplificar un poco escribiendo
SCT otal = SCT T O + SCEE
donde SCT otal =

rj P
t
P

Yij Y

2

i=1j=1

rj P
t
P

Yij2

i=1j=1

(2.8)

rj P
t
P
Y2
Y2
=
Yij2 F C con F C = ,
n
n
i=1j=1

llamado factor de correccin.


SCT T O =

rj P
t
P
i=1j=1

Y j Y

2

t
P

rj Y j Y

j=1
rj P
t
P

SCEE = SCT otal SCT T O =

t Y2
P
j
j=1

Yij2

i=1j=1
t
P

Tambin glT otal = glT T O + glEE

2

rj

Y2
n

t Y2
P
j
j=1

rj

t Y2
P
j
.
r
j=1 j

rj 1 = t 1 + glEE glEE =

j=1

FC

t
P

rj t = n t.

j=1

2.3.5.

Pruebas de Hiptesis y Errores Estndar

Como se mencion anteriormente el inters est centrado en comparar las medias de


los tratamientos para verificar la hiptesis nula que entre los tratamientos no existen
diferencias significativas. Esta hiptesis se puede enunciar como
0

H0 : 1 = 2 = = t = contra H1 : j 6= j 0 para algn j 6= j ,

(2.9)

la estadstica utilizada para esta prueba es:


Fc =

CMT T O
F(t1 , nt)
CMEE

(2.10)

y se rechaza H0 , al nivel de significancia , s Fc > F, (t1 , nt) .


Todos estos procedimientos se pueden resumir en la tabla de anlisis de varianza, dada
en la Tabla ??.

F.V.
TTO
EE
Total

gl
t1
nt
n1

Cuadro 2.2: Tabla ANAVA para un DCA


SC
CM
Fc
F5 %
F1 %
CMT T O
SCT T O CMT T O CMEE F5 %, (t1, nt) F1 %, (t1, nt)
SCEE CMEE
SCT otal

Si se rechaza H0 al nivel de significancia del 5 %, se dice que existen diferencias significativas entre los tratamientos, y se coloca un * a la Fc o al CMT T O , s adems tambin
se encuentran diferencias al 1 %, se dice que las diferencias son altamente significativas,
y se coloca **. S no se rechaza H0 al nivel de significancia del 5 % se dice que no
existen diferencias estadsticas significativas entre los tratamientos, lo cual se nota con
N S, pero an asi se pueden hablar de diferencias al 6 %, 7 %, 8 %, 9 %, y hasta del 10 %
que tambin es muy usual.
As mismo, cuando el investigador desea llevar a cabo cualquier prueba para un tratamiento en particular, esta se puede realizar utilizando en este caso el error estndar de
estimacin para una media de tratamiento, el cual viene dado por:
s
CMEE
(2.11)
SY j =
rj
y cualquier inferencia para el j esimo tratamiento se debe realizar con este error.
Ejemplo 2.1. Un Mdico veterinario est interesado en probar la ganancia de peso en
libras en una determinada raza de cerdos al variar uno de los componentes de cierta
dieta tradicional, en porcentajes de 15 %, 20 %, 25 %, 30 % y 35 % (llmense

A, B, C,
D y E, respectivamente). El Mdico veterinario toma 5 cerdos, o repeticiones, para
cada nueva dieta; los datos del experimento estan dados en la Tabla ??.

Cuadro 2.3: Totales y promedios para la ganancia de peso


Repeticiones
Totales
Promedios
Dieta 1
2
3
4
5
Yj
Y j
A
7
7 15 11 9
49
9.8
B
12 17 12 18 18
77
15,4
C
14 18 18 19 19
88
17,6
D
19 25 22 19 23
108
21,6
E
7 10 11 15 11
54
10,8
Y = 376 Y = 15,04

Utilizando un anlisis de varianza, con un nivel de significacion del 5 %, establecer si


las 5 nuevas dietas presentan la misma ganancia de peso.
Solucin:
La suma de los cuadrados requeridas para el analisis de varianza se calculan como sigue:
SCT otal =

5 X
5
X

Yij2

i=1 j=1

SCT T O =

Y2
(376)2
= (7)2 + (7)2 + ... + (15)2 + (11)2
= 636, 96
n
25

5
X
Yj2
j=1

Y2
(49)2 + ... + (54)2 (376)2

= 475, 76
rj
n
5
25

y
SCEE = SCT otal SCT T O = 636, 96 475, 76 = 161, 20.
Finalmente se obtiene el ANAVA dado en la Tabla ??
Cuadro 2.4: Analisis de varianza para ganancia de peso.
F.V. gl
SC
CM
Fc
F5 %(4,20)

Dieta 4 475, 76 118, 94 14, 76


2,87
EE
20 161, 20
8, 06
Total 24 636, 96

> library(agricolae)
> datos = read.csv2(file.choose())
> attach(datos)
Medias por tratamiento
> tapply(Peso,Dieta,mean)
a
b
c
d
e
9.8 15.4 17.6 21.6 10.8

Df
Sum Sq Mean Sq
F value
Pr(>F)
Dieta
4
475.8
118.94
14.76
9.13e-06 ***
Residuals 20 1285.9
128.6
Signif. codes:
0 0.001 0.01 0.05 0.1 1
> mod=aov(Peso Dieta) ;mod
Call:
aov(formula = Peso Dieta)
Terms:
Dieta Residuals
Sum of Squares
475.76
161.20
Deg. of Freedom
4
20
Residual standard error: 2.839014 Estimated effects may be
unbalanced
En conclusin, como se observa en la Tabla ?? que 14,76 > F5 % se puede decir que hay
diferencias significativas entre las dietas, es decir, al menos una de las dietas tiene un
comportamiento diferente.
Ejemplo 2.2. Un especialista en hidrulica esta interesado en saber si cuatro mtodos diferentes para estimar las frecuencias de las inundaciones producen estimaciones
equivalentes del gasto (o flujo ) mximo cuando se aplica a una misma cuenca. Cada procedimiento se us seis veces en la cuenca y los resultados de gasto mximo (en
pies cubicos por segundo) se muestran en la Tabla ??. Determine s existen diferencias
significativas entre los cuatros mtodos.
Cuadro 2.5: Gasto mximo para cada mtodo
Mtodo de estimacin
Mtodo 1
Mtodo 2
Mtodo 3
Mtodo 4

0, 34
0, 91
6, 31
17, 15

0, 12
2, 94
8, 37
11, 82

Repeticiones
1, 23
0, 70
2, 14
2, 36
9, 75
6, 09
10, 95 17, 20

1, 75
2, 86
9, 82
14, 35

0, 12
4, 55
7, 24
16, 82

Y .j
0, 71
2, 63
7, 93
14, 72

Sj
0, 66
1, 09
1, 66
2, 77

Solucin:
Aplicando los mismos pasos que en el ejemplo anterior se llega a resultados mostrados
en la Tabla 2,6.
Los resultados de la Tabla 2,6 muestran que existen diferencias estadsticas significativas,en las estimaciones de la media del gasto mximo, entre los cuatro procedimientos.

2.4.

Pruebas de Validacin de los Supuestos del Modelo

Como se mencion al inicio de este captulo, existen ciertos supuestos sobre los errores
del modelo en los que se basa el ANAVA, los cuales son:

Cuadro 2.6: Analisis de varianza para los datos de gasto mximo.


F.V.
gl
SC
CM
Fc
F5 %(3,20)
Metodos 3 708,3471 236,1157 76,07
3,10
EE
20 62,0811
3,1041
Total
23 770,4282

1. Los errores tienen distribucin normal con media cero, E (ij ) = 0 y varianza
constante, V (ij ) = 2 .
0

2. Son variables aleatorias independientes, es decir, para i 6= i , Cov (i , i0 ) = 0.


En la prctica los errores se estiman con los datos experimentales que se obtienen en
campo; para un DCA la estimacin se lleva a cabo mediante la expresin
eij = ij = Yij Y j ,

i = 1, 2, . . . , rj ,

j = 1, 2, 3, . . . , t,

(2.12)

es decir, los errores estimados se calculan por tratamiento, restndole a los datos obtenidos de cada tratamiento la media de ese tratamiento.
Los dos supuestos del modelo ms importantes a cumplirse, se refieren a la normalidad
y la homogeneidad de varianza de los errores, puesto que de hecho los tratamientos son
asignados aleatoriamente a las unidades experimentales al inicio de todo experimento
y esto garantiza, en cierta forma la independencia de los errores. A continuacin se
presentan los algoritmos para llevar a cabo las pruebas de homogeneidad de varianza y
normalidad.

2.4.1.

Pruebas de Homogeneidad de Varianzas

Prueba de Hartley
Para llevar a cabo la prueba de hiptesis
H0 : 12 = 22 = = t2 = 2 contra H1 : las varianzas no son homogeneas,

(2.13)

donde j2 representa la varianza del j esimo tratamiento y adems donde todos los
tratamientos tienen el mismo nmero de repeticiones, es decir r1 = r2 = = rt = r.
Hartley propone la siguiente estadstica para llevar a cabo la prueba de hiptesis 2,13

M ax Sj2
j
 ,
FM ax =
M in Sj2
j

conocida como la estadstica F mxima de Hartley. En esta prueba H0 se rechaza


s FM ax > FM ax(, t, v) donde FM ax(, t, v) es el valor en la Tabla FM ax al nivel de
significancia , para t tratamiento y v = r 1.(Ver anexo 7).

Prueba de Bartlett
Es una prueba ms liberal que la anterior. Para llevar a cabo la prueba de hiptesis dada
en, los tratamientos no necesariamente deben tener el mismo nmero de repeticiones.
La estadstica dada por Bartlett esta definida por:
"
#
t
X

1
v ln (CMEE )
(2.14)
vj ln Sj2 ; j = 1, 2, . . . , t
2 =
C
j=1
donde: vj = rj 1; v =

t
P

vj y C = 1 +

j=1

1
3(t1)

t 1
P
1

v
j=1 vj

!
y la hiptesis nula H0

se rechaza s 2 > 2(, t1) .

2.4.2.

Prueba de Normalidad de los Errores de Shapiro - Wilk

La hiptesis a probar en este caso es:

H0 : LoserroresprovienendeunapoblacincondistribucinnormalH1 : Loserroresnoprovienendeunapoblac
(2.15)
Para llevar a cabo esta prueba inicialmente se calculan los errores del modelo bajo un
diseo completamente al azar, los cuales vienen dados por la expresin
eij = Yij Y .j

para cada j = 1, 2, . . . , t,

posteriormente se ordenan los errores de menor a mayor, e(1) , e(2) , , e(n) , eliminando
el trmino que queda en la mitad de los datos, si el nmero de observaciones fuese impar,
el paso siguiente es realizar las diferencias d(1) = e(n) e(1) , d(2) = e(n1) e(2) , , es
decir, el ms grande menos el ms pequeo, el segundo ms grande menos el segundo
ms pequeo, etc; hasta llegar a los dos datos del centro; posteriormente estas diferencias
se ponderan, en ese orden, por los trminos ak,n , los cuales se encuentran en la Tabla
dada por Shapiro - Wilk, es decir se realizan los productos ak,n d(k) , posteriormente
se calcula la estadstica
"
#2
X

1
ak,n d(k)
(2.16)
SW =
SCEE k
La hiptesis nula, H0 , es rechazada s SW < W, n siendo W, n el valor de la estadstica
de Shapiro - Wilk al nivel de significancia .
Ejemplo 2.3. Ilustremos estas pruebas con un experimento en aj picante con tres
tratamiento D1, D2 y D3, cuyos datos de la variable respuesta son dados en la Tabla
??:
Como se dijo anteriormente los errores para este modelo, DCA, se obtienen realizando la diferencia entre los valores observados para cada tratamiento y el promedio del
respectivo tratamiento, as:

Cuadro 2.7: Datos de la variable respuesta para aj picante.


Rep/TTO
D1
D2
D3
1
186,55 151,7
150,9
2
202,5
171,4 144,35
3
200
144,05
164
Y j
196,35 155,71 153,08

Para el tratamiento 1 (D1):


e11 = Y11 Y ,1 = 186, 55196, 35 = 9,8, e21 = Y21 Y ,1 = 202, 5196, 35 = 6, 15
y e31 = Y31 Y ,1 = 200 196, 35 = 3, 65.
Para el tratamiento 2 (D2):
e12 = Y12 Y ,2 = 151, 7 155, 71 = 4, 01, e22 = Y22 Y ,2 = 171, 4 155, 71 =
15,68 y e32 = Y32 Y ,2 = 144, 05 155, 71 = 11,66.
Para el tratamiento 3 (D3):
e13 = Y13 Y ,3 = 150, 9 153, 08 = 2, 18, e23 = Y23 Y ,3 = 144, 35 153, 08 =
8, 73 y e33 = Y33 Y ,3 = 164 153, 08 = 10, 91.
Ahora estos errores se ordenan en forma ascendente, tal como se muestra en la tabla ??
se realizan ahora las diferencias entre el ms grande y el menor, el segundo ms grande

e(ij)

Cuadro 2.8: Errores para los datos de aj picante


-11.66 -9.8 -8.73 -4.01 -2.18 3.65 6.15 10.91 15.68

y el segundo mas pequeo, etc, llegndose a


d1 = 15, 68 (11, 66) = 27, 35, d2 = 10, 91 (9, 8) = 20, 71, d3 = 6, 15 (8, 73) =
14, 88 y d4 = 3, 65 (4, 01) = 7, 66.
Las ponderaciones akn , en la Tabla de Shapiro-Wilk, son: a1 = 0, 5888, a2 = 0, 3244,
a3 = 0, 1976 y a4 = 0, 0947, de donde
P
akn dk = (0, 5888) (27,35) + (0, 3244) (20, 71) + (0, 1976) (14, 88) + (0, 0947) (7, 66) =
k

26, 49
con lo cual se obtiene
"
#2
X

1
26, 492
SWC =
ak,n d(k)
=
= 0, 9412.
SCE k
745, 6
Ahora, el valor crtico al 5 % de significancia de SW es SW=0,05; n=9 = 0, 829 entonces,
como SWC > SW=0,05; n=9 , no se rechaza la hiptesis nula de normalidad de los errores.

2.4.3.

Prueba de homogeneidad de Hartley:

la hiptesis a verificar es:


H0 : 12 = 22 = 32
H1 : j2 = j02 para algn j 6= j0.
Las varianzas obtenidas para cada tratamiento son: S12 = 73, 59, S22 = 199, 10 y
2
2
S32 = 100, 10, as que Sm
ax de
ax = 199, 10 y Smn = 73, 59 entonces calculando la Fm
Hartley se obtiene:
S 2 ax
199, 10
Fmax = m
=
= 2, 7.
2
Smn
73, 59
Como v = r 1 = 3 1 = 2, entonces el valor tabulado en la tabla de valores crticos de
Hartley para = 5 % es: Fmax,( 0,05; 2) = 87,5, luego, al nivel de significancia anterior,
no se rechaza la hiptesis nula de igualdad de varianza de los tratamientos aplicados u
homogeneidad de varianza de los errores.

2.4.4.

Prueba de Bartlett:

Se ilustra esta prueba con la misma informacin de la prueba anterior; as, la hiptesis
a verificar es:
H0 : 12 = 22 = 32
H1 : j2 = j02 para algn j 6= j0.

Para aplicar la prueba de Barttley, calculemos vj y Ln Sj2 para j = 1, 2, 3. Entonces,
v1 = r1 1 = 3 1 = 2, v2 = r2 1 = 3 1 = 2 y v3 = r3 1 = 3 1 = 2,
3
P
as v =
vj = 2 + 2 + 2 = 6, tambin Ln (S12 ) = Ln (73, 59) = 4, 29; Ln (S22 ) =
j=1

Ln (199, 10) = 5, 29 y Ln (S32 ) = Ln (100, 10) = 4, 60. Luego,


3
P


vj Ln Sj2 = 2 4, 29 + 2 5, 29 + 2 4, 60 = 28, 39.

j=1

Como CMEE = 124, 2 entonces, Ln (CMEE ) = Ln (124, 2) = 4, 82 de donde vLn (CMEE ) =


6 4, 82 = 28, 93 asi mismo tenemos
P

 1 1 1 1
3
1
1
1
1
C = 1 + 3(t1)

= 1 + 3(31)
+ 2 + 2 6 = 1, 222
j=1 vj
v
2
llegndose
h finalmente a: P
i
1
2
c = C vLn (CMEE ) 3j=1 vj Ln Sj2 =

1
1,22

[28, 93 28, 39] = 0, 43

como 2(0,05; 2) = 5, 99 entonces, 2c < 2(0,05; 2) , por lo tanto no se puede rechazar la


hiptesis nula de homogeneidad de varianza de los errores.
La tcnica del anlisis de varianza se dice robusta en el sentido que aunque se violen
algunos de los supuestos del modelo, la tcnica puede ser usada. En pocas palabras
el ANAVA puede ser usado aun si la distribucin del error no es perfectamente normal
o si no existe homogeneidad de varianzas de los errores. En el caso que no se tenga
homogeneidad de varianzas, para tener una buena potencia de la prueba se recomienda

tener igual nmero de repeticiones por tratamiento, indudablemente que los resultados
sern mejores si la varianza del error (CMEE ) no es muy grande.

2.5.

Modelo de Componentes de Varianza (Efectos


Aleatorios)

El modelo de efectos fijos se utiliza cuando los tratamientos son fijos o el experimentador
los elige por su importancia, disponibilidad o comodidad en el manejo. Por ejemplo,
tratamientos mdicos, variedades, concentraciones, lugares y tiempos. En este modelo,
los parmetros son generalmente las medias de los tratamientos y el objetivo es la
comparacin y estimacin de estos promedios. En el modelo de efectos aleatorios los
niveles del factor son una poblacin de la cual se toma una muestra aleatoria; por
ejemplo, animales de una especie dada, sitios de un lago, hojas de una planta, etc.
los parmetros de inters en este modelo son las varianzas y el objetivo primordial es
estimar sus magnitudes absolutas y relativas.
El modelo propuesto para este tipo de experimento es:
Yij = + Aj + ij ,

i = 1, 2, ...., rj y j = 1, 2, ..., t,

(2.17)

donde
rj : Es el nmero de repeticiones del tratamiento j esimo.
t: Es el nmero de tratamientos.
Yij : Es la observacin obtenida en la i esima unidad experimental del j esimo
tratamiento.
: Es un parmetro comn a todos los tratamientos y corresponde a la media
general .
En este modelo se debe cumplir:
1. Los Aj : Son variables aleatorias independientes con distribucin normal N (0, A2 )
2. Los ij : Son variables aleatorias independientes con distribucin normal N (0, 2 )
3. Las variables Aj y ij son variables aleatorias independientes entre s.
La tabla ANAVA es la misma que la mostrada en el modelo de efectos fijos, adems los
clculos de las sumas de cuadrados como la prueba F de significancia, son igualmente
vlidos para este modelo.
Las hiptesis a probar son:
H0 : A2 = 0 ( no hay variabilidad entre los niveles de A) contra
H1 : A2 6= 0 (la variabilidad entre los niveles es significativa).

Cuadro 2.9: ANAVA para un modelo de efectos aleatorios.


F.V.
gl
SC
CM
E(CM)
Fc
CMT T O
2
2
TTOS t 1 SCT T O CMT T O + r0 A CMEE
EE
nt
SCEE CMEE
2
T otal n 1 SCT otal

La Tabla de anlisis de varianza viene dada en la Tabla ??.


P rj2
n
n
.
donde r0 =
t1
La regla de decisin es la misma estudiada en el modelo de efectos fijos, pero las interpretaciones son bastante diferentes puesto que los modelos son diferentes, el objetivo
tambin es diferente puesto que ahora se desean estimar varianzas y no promedios y el
espacio inferencial ahora es mucho ms amplio.
Ejemplo 2.4. La tabla siguiente tomada de Diaz (1999), muestra los datos de la ganancia promedio diaria de peso en terneros, cuyos padres fueron cuatro toros de la misma
raza. Los terneros fueron alimentados de la misma manera y durante el mismo periodo
de tiempo. Se desea saber si la variabilidad de la ganancia en peso es atribuible a la
diferencia entre los padres o si es propia de los terneros, los cuales son tratados como
unidades experimentales. En este caso los tratamientos son los toros y no interesan los
promedios por tratamiento.
Suponiendo que los cuatro toros son escogidos al azar de un nmero grande de posibles
padres, los datos se analizarn de acuerdo al modelo de efectos aleatorios, puesto que
los cuatro padres o toros del experimento no son los nicos que interesan; el objetivo
se centra en la variabilidad poblacional de los padres y no en la comparacin de los
cuatro de la muestra. El factor de estudio es la paternidad o influencia hereditaria, que
se expresa en el aumento de peso de los terneros hijos.
Las hiptesis a probar son:
H0 : A2 = 0 ( no hay variabilidad entre padres)
H1 : A2 6= 0 (la variabilidad entre padres es significativa).
y los datos colectados son dados en la Tabla ??:
El ANAVA resultante es dado en la Tabla ??:
Se concluye que la variabilidad entre padres es significativa estadsticamente, es decir,
la variabilidad causada por los padres es alta, y la variabilidad restante, causada por
factores externos, por ejemplo el ambiente, es baja, lo cual lleva a la similitud de las
observaciones por grupo. Ahora es interesante saber qu parte de la variabilidad en las
unidades experimentales es asignable a los padres, A2 , y que parte es atribuible al error

Cuadro 2.10: Aumento de peso


toro 1 toro 2 toro 3 toro 4
1, 46
1, 17
0, 98
0, 95
1, 23
1, 08
1, 06
1, 10
1, 12
1, 20
1, 15
1, 07
1, 23
1, 08
1, 11
1, 11
1, 02
1, 01
0, 83
0, 89
1, 15
0, 86
0, 86
1, 12
1, 19
0, 99
1, 15
0, 97
1, 10

Cuadro 2.11: ANAVA


F.V.
Entre toros
EE ( Dentro de toros)
T otal

para el aumento de peso


gl
SC
CM
Fc
3 0, 1403 0, 0468 3, 29
25 0, 3555 0, 0142
28 0, 4958

experimental, 2 . De acuerdo al modelo de componentes de varianza, la varianza de


las observaciones se puede descomponer en dos componentes
Y2 = 2 + A2 , que para estimarla hay que estimar las respectivas varianzas de la suma.
Entonces,
de donde:
b2 + r0
bA2

bT2 T O =
E(CMT T O ) = 2 + r0 A2

bA2 =

b2

bT2 T O
CMT T O CMEE
=
r0
r0

(2.18)

Para el ejemplo que se est estudiando,


r0 =

1
[29 (62 + 82 + 72 + 82 ) /29] = 7, 22 y asi,
3

bA2 =

0, 0468 0, 0142
= 0, 0045
7, 22

entonces
b2 = 0, 0045 + 0, 0142 = 0, 0187.
Estas estimaciones no son faciles de interpretar, por eso es usual expresar los resultados
como porcentajes de la variacin total. El cociente
0, 0045

bA2
=
= 0, 2406 = 24, 06 % (coeficiente de correlacin intraclase que mide
2

bX
0, 0187
la semejanza entre individuos de un mismo grupo) mide la proporcin de la variabilidad
total que es atribuible a la variabilidad del factor; es decir, a la variabilidad entre padres.
El otro 75,94 % es la variabilidad entre terneros del mismo padre.

rI =

Puede suceder que en las estimaciones de las componentes de varianza, alguna resulte
negativa, caso en el cual se le tomar como s fuese cero por la condicin que existe para
la varianza. De estos resultados tambin se puede obtener el coeficiente de heredabilidad
h2 = 4rI , el cual es una medida del grado de influencia gentica que puede recibir un
genotipo. Generalmente vara entre 0, 3 y 0, 5 segn Gardner y Snustad (1984). Para
el caso de la ganancia de peso en terneros h2 = 0, 96, coeficiente bastante alto, pero
explicable debido a la gran variabilidad de A2 .

CAPTULO 3
COMPARACIONES MLTIPLES

3.1.

Generalidades

Despus que el investigador ha encontrado diferencias significativas en el ANAVA, el


paso siguiente es encontrar los tratamientos que se comportan en forma diferente; as
como tambin cuales son los que presentan los mejores resultados de acuerdo a los
objetivos del estudio o de su investigacin. La tcnica ms comn para comparar factores
cualitativos es la de las Pruebas de comparaciones mltiples.
Entre las pruebas ms utilizadas se encuentran: la diferencia mnima significativa (DM S),
Duncan, Tukey, Scheff, Bonferroni, T-multivariado, SNK, Dunnett y contrastes ortogonales. Entre estas pruebas algunas son planeadas, es decir se dan apriori o antes de
realizar el experimento como son la diferencia mnima significativa (DM S), Bonferroni, T-multivariado, contrastes ortogonales, Dunnett. Otras pruebas son no planeadas
o escogida por el investigador despus de obtener la informacin tales como: Duncan,
Tukey, Scheffe, SNK.
En estas pruebas, lo que interesa es comparar todas las parejas de medias de tratamientos, o un grupo de ellas y las hiptesis que por lo general se desean probar son:
H0 : j = j 0 contra H1 : j 6= j 0 , para j 6= j 0 .

(3.1)

Al realizar una prueba de compracin mltiple se est en riesgo de cometer ya sea error
tipo I o un error tipo II. El nivel de significancia tomado determina el riesgo de error
tipo I, el tamao de la muestra, la varianza y el tamao de la comparacin para las
medias poblacionales reales, determina la tasa de error tipo II para una tasa de error
tipo I.
El riesgo que se est dispuesto en una sola comparacin es comunmente denotado c .
Ahora, cuando existen t (t 1) /2 comparaciones por pares entre t medias de los tratamientos; si se lleva a cabo cada comparacin con el estadstico t-student, existe la
posibilidad de cometer el mismo nmero errores tipo I, si las pruebas se consideraran
independientes.

23

Por ejemplo: para t = 4, entonces existen 6 pares de medias a comparar y hasta seis
errores tipo I.
Otro tipo de error tipo I es el basado en el riesgo acumulado asociado con la familia
de pruebas en estudio. La familia es el conjunto de comparaciones por pares. El riesgo
acumulado asociado con una familia de comparaciones se conoce como la tasa de error
tipo I con respecto al experimento, E . Este es el riesgo de cometer al menos un error
tipo I en la familia de comparaciones en el experimento.

3.2.

Evaluacin de la Tasa de Error

Para una familia de pruebas independientes, se puede evaluar la tasa de error tipo I
con respecto al experimento, sin embargo las pruebas no son independientes ya que el
CME es el mismo en el estadstico de prueba, adems que una misma media es utilizada
varias veces. Por esto se evaluar el lmite superior para el valor del error tipo I con
respecto al experimento, suponiendo pruebas independientes. S las H0 son ciertas, el
error tipo I para cada una de las n pruebas es c , con (1 c ) como la probabilidad de
tomar una decisin correcta. La probabilidad de cometer x errores tipo I est dada por
la distribucin binomial:
P (X = x) =

n!
x (1 c )nx ,
x! (n x)! c

para x = 0, 1, 2, . . . , n errores tipo I. La probabilidad de no cometer errores tipo I es:


P (X = 0) = (1 c )n
La probabilidad de cometer al menos un error tipo I (x = 1, 2, . . . , n) es:
P (X 1) = 1P (X = 0) = 1(1 c )n denotada como: E = 1(1 c )n , La cual
es el riesgo de tener al menos un error tipo I entre las n comparaciones independientes.
El lmite superior de la tasa de error tipo I con respecto al experimento, para n pruebas
en un conjunto de medias de tratamiento, esta dada por
c = 1 (1 E )1/n ,

(3.2)

el cual expresa la tasa de error tipo I con respecto a la comparacin como una funcin
de la tasa de error tipo I con respecto al experimento.
Se nota que al aumentar el nmero de pruebas, se eleva el riesgo de cometer un error
tipo I. La relacin entre c y E para un nmero n = 1, 2, 3, 4, 5 0 10 comparaciones se
muestra en la Tabla ??: As, cuando se hacen cinco pruebas independientes y se desea
mantener el riesgo de cometer al menos un error tipo I una vez cada 20, la tasa de error
con respecto a la comparacin de cada una de las n = 5 pruebas debe ser c = 0, 01 y
para n = 10 debe ser c = 0, 005.
Desigualdad de Bonferroni
Bonferroni demostr que para n comparaciones la tasa de error tipo I del experimento
es menor o igual a la suma de las tasas de error de cada prueba.

Cuadro 3.1: Tasas de error para n comparaciones


n E cuando c = 5 % c cuando E = 5 %
1
0,05
0,05
2
0,098
0,025
3
0,143
0,017
4
0,185
0,013
5
0,226
0,010
10
0,401
0,005

E nc ,
donde la igualdad se cumple si las comparaciones son independientes.
Para una E deseada, se puede tomar c E /n.
Con base a estos resultados se dan algunas recomendaciones, Tabla 3,2, para protegerse
del error tipo I de cada prueba y del experimento.
Cuadro 3.2: Nmero de comparaciones recomendadas para n pruebas.
Prueba

Por comparacin( c )

Por experimento( E )

DMS
Duncan
SNK
Bonferroni
Tukey
Scheff

Constante
Vara con n
Constante
Conservador con respecto a n
Conservador con respecto a n
Conservador con respecto a n

No se aumenta
Vara con n
Constante
Constante
Constante
Constante

Nmero de
comparaciones
6
10
cualquier nmero
6 - 21
>10
>10

La clasificacin segn su grado de exigencia es la siguiente: Para llevar a cabo estas


Cuadro 3.3: Prueba liberales y conservadoras segn el nmero de comparaciones
Liberales
Conservadoras
DMS - Duncan - SNK
Bonferroni - Tukey - Scheffe
Nmero pequeo de comparaciones Nmero grande de comparaciones
Usar solo cuando F es * o **

comparaciones se presenta a continuacin los mtodos ms utilizados.

3.3.

Pruebas de Comparaciones Mltiples

Supongase que al efectuar un analisis de varianza para un modelo de efectos fijos la


hiptesis nula es rechazada, se concluye entonces que existen diferencia significativas

entre las medias de los tratamientos, aunque no se especifique exactamente cuales de


ellas son diferentes de las otras. En esta situacion puede ser util realizar comparaciones
adicionales entre grupos de medias de los tratamientos. La media del j e`simo tratamiento se define mediante j = + j y su estimacin es Y j . Las comparaciones entre
medias de tratamientos se realizan en terminos de los totales de tratamientos Y.j o de
los promedios de tratamientos Y j .

3.3.1.

Metodo de las Diferencias Mnimas Significativas (DMS)

Supngase que despus de haber rechazado la hiptesis nula, con la prueba F del analisis
de varianza, se desea probar que:
0

H0 : j = j 0 , para j 6= j .
Esto puede hacerse empleando la estadstica
Y j Y j0

CMEE r1j +

t0 = s

1
r 0

.

(3.3)

Entonces, suponiendo una hiptesis alterna bilateral j 6= j 0 , la pareja de medias j


y j 0 se consideran diferentes s
s


Y j Y j0 > DM S = t
(1 2
donde la cantidad
DM S = t(1 2

, nt)

v
u
u
tCMEE
, nt)


CMEE


1
1
+
.
rj rj 0

1
1
+
rj rj 0

(3.4)

!
(3.5)

se denomina mnima diferencia significativa (DM S o LSD). S el diseo es balanceado,


entonces r1 = ... = rt = r y
r
2CMEE
DM S = t(1 , nt)
.
(3.6)
2
r
Para usar el procedimiento DM S, simplemente se comparan las diferencias observadas
entre cada par de promedios con el valor correspondiente de la DM S.
S Y .j Y .j 0 > DM S, se concluye que las medias poblacionales j y j 0 son
estadsticamente diferentes.
Ejemplo
Tomando los datos del ejemplo uno del anlisis de varianza para probar ganancia de
peso, el valor de la DM S con = 0, 05 es:
r
r
2CMEE
2 (8, 06)
DM S = t(0,975 , nt)
= 2, 086
= 3, 75.
r
5

Por tanto, una pareja de medias difieren significativamente si el valor absoluto de la


diferencia de promedios en los tratamientos correspondientes es mayor que 3,75. Los
cinco promedios de tratamientos son (llamando A=1, B=2, C=3, D=4 y E=5):
Y 1 = 9, 8; Y 2 = 15, 4; Y 3 = 17, 6; Y 4 = 21, 6; Y 5 = 10, 8. Luego tenemos los pares
de comparaciones dados en la Tabla ??.
Cuadro 3.4: DMS para de Ganancia
de


Y .j Y 0
Comparaci
on
Y .j Y .j 0
.j
T1 contra T2 9, 8 15, 4 = 5, 6
5,6
T1 contra T3 9, 8 17, 6 = 7, 8
7,8
T1 contra T4 9, 8 21, 6 = 11, 8
11,8
T1 contra T5 9, 8 10, 8 = 1, 0
1,0
T2 contra T3 15, 4 17, 6 = 2, 2
2,2
T2 contra T4 15, 4 21, 6 = 6, 2
6,2
T2 contra T5
15, 4 10, 8 = 4, 6
4,6
T3 contra T4 17, 6 21, 6 = 4, 0
4,0
T3 contra T5
17, 6 10, 8 = 6, 8
6,8
T4 contra T5 21, 6 10, 8 = 10, 8
10,8

Peso
Conclusi
on
5, 6 > 3, 75
7, 8 > 3, 75
11, 8 > 3, 75
1, 0 < 3, 75N S
2, 2 < 3, 75N S
6, 2 > 3, 75
4, 6 > 3, 75
4, 0 > 3, 75
6, 8 > 3, 75
10, 8 > 3, 75

Diferncia Minima Significativa (LSD)


> mod=aov(Peso~Dieta)
> LSD<-LSD.test(mod, "Dieta")
Study:
LSD t Test for Peso
Mean Square Error: 8.06
Dieta, means and individual ( 95 %) CI
Peso
std.err r
LCL
UCL
Min. Max.
a
9.8 1.4966630 5
6.678016
12.92198
7
15
b
15.4 1.4000000 5
12.479651
18.32035
12
18
c
17.6 0.9273618 5
15.665557
19.53444
14
19
d
21.6 1.1661904 5
19.167369
24.03263
19
25
e
10.8 1.2806248 5
8.128663
13.47134
7
15
alpha: 0.05 ; Df Error: 20
Critical Value of t: 2.085963
Least Significant Difference 3.745452
Comparison between treatments means
Difference
pvalue sig.
LCL
UCL
a b
5.6
5.408874e03
** 9.3454518 1.8545482
a c
7.8
3.147387e04 *** 11.5454518 4.0545482
a d
11.8
2.107681e06 *** 15.5454518 8.0545482
a e
1.0
5.837529e01
4.7454518 2.7454518
b c
2.2
2.347148e01
5.9454518 1.5454518

b d
6.2
2.514238e03
** 9.9454518
b e
4.6
1.859495e02
*
0.8545482
c d
4.0
3.754082e02
* 7.7454518
c e
6.8
1.156713e03
**
3.0545482
d e
10.8
7.011202e06 ***
7.0545482
Means with the same letter are not significantly
Groups,
Treatments and means
a d
21.6
b c
17.6
b b
15.4
c e
10.8
c a
9.8

2.4545482
8.3454518
0.2545482
10.5454518
14.5454518
different.

Los resultados anteriores se pueden resumir de la siguiente forma: ordnense las medias
de los tratamientos de mayor a menor, en ese mismo orden coloque las etiqueta de los
tratamientos; ahora, si para dos tratamientos que estn seguidos uno del otro no resulta
significativa la diferencia entre medias, entonces se les coloca una misma letra debajo, o
al lado si estn ordenadas en forma vertical, de las respectivas etiquetas, s la diferencia
resulta significativa, se les coloca letras diferentes, por ejemplo en el caso de ganancia
de peso las medias ordenadas de mayor a menor quedan Y 4 Y 3 Y 2 Y 5 Y 1 ,
que corresponde a: T4 T3 T2 T5 T1 .
Entre los tratamientos 1 y 5 no se encontr diferencias significativas entonces a estos se
les coloca la letra a debajo
T4

T3

T2

T5 T1
a
a

Entre los tratamientos 5 y 2 existen diferencias significativas pero entre los tratamientos
2 y 3 no existen diferencias, entonces
T4

T3
b

T2 T5 T1
b
a a

Por ltimo, el tratamiento 4 presenta diferencias significativas con el tratamiento 3, y


por ende con el resto de tratamientos, entonces al tratamiento 4 se le coloca la letra c
T4 T3
c
b

3.3.2.

T2
b

T5 T1
a a.

La Prueba de Intervalos Mltiples de Duncan.

Uno de los procedimientos ms conocidos y aplicados para comparar medias de tratamientos es el dado por Duncan(1955), y conocido como comparacin por intervalos
mltiples de Duncan. Este procedimiento exige que los tratamientos tengan el mismo

nmero de repeticiones, es decir que r1 = r2 = = rt . Para llevar a cabo esta prueba


inicialmente se calcula el error estndar para una media de tratamiento dado por:
r
CMEE
.
(3.7)
SY j =
r
posteriormente se ordenan en forma descendente los t promedios de tratamiento.
Los valores tabulados para la prueba de Duncan, a un nivel de significancia , Q (p, glEE )
en donde p representa el nmero de medias entre dos tratamientos y glEE el nmero de
grados de libertad del error experimental, se obtienen de la siguiente forma: para cada
comparacin entre dos medias de tratamiento se debe calcular este valor, por ejemplo al
comparar el tratamiento con la media mayor contra el resto de tratamientos, se procede
asi: al comparar esta media de tratamiento con la media ms pequea obtenida, se tiene
p = t medias de tratamiento entre las medias comparadas, as se busca en la Tabla de
Duncan (Anexo 7) el valor Q (t, glEE ), cuando se va a comparar la media ms grande
con la segunda media mas pequea, entonces hay p = t 1 medias entre las comparadas; entonces ahora el valor de la tabla se busca con Q (t 1, glEE ) , asi se sigue
hasta llegar a comparar la media ms grande con la segunda media ms grande, cuyo
valor en la tabla ser ahora Q (2, glEE ) . Con el resto de comparaciones la metodologa
es similar, asi cuando usted compara la segunda media ms grande con la media ms
pequea, existen p = t 1, medias entre estas dos, por lo tanto el valor de la tabla
ser Q (t 1, glEE ) . Se puede seguir el procedimiento hasta comparar las t (t 1) /2
medias de tratamientos en el experimento.
Para cada comparacin entre medias de tratamiento se calcula el valor Rp = Q (p, glEE )SY j
para p = 2, 3...t, y la hiptesis nula de igualdad de medias entre los tratamientos comparados se rechaza s


Y .j Y 0 > Rp .
.j
En este procedimiento se debe tener tener en cuenta que s dos medias no difieren
significativamente, entonces cualquier otra media entre estas dos no debe diferir con
las comparadas inicialmente.
En muchos experimentos el nmero de repeticiones por tratamiento resulta ser de diferente tamao rj , aun as se puede aplicar la prueba de Duncan, aunque con menos
precisin, reemplazando r por la media armonica rh dada por(vea Martnez y Martnez,
1997):
t
rh = t
.
(3.8)
P
1/rj
j=1

Ejemplo 3.1. A continuacin se aplica la prueba de intervalos mltiples de Duncan


a los datos del ejemplo sobre ganancia de peso, despus de haber dado significativo el
respectivo anlisis de varianza. Para estos datos CMEE = 8, 06 ; n = 25; r = 5, con
20 grados de libertad para el error y = 0, 05. Los intervalos significativos (Anexo 7)
son:

Q0,05 (2, 20) = 2, 95; Q0,05 (3, 20) = 3, 10; Q0,05 (4, 20) = 3, 18; Q0,05 (5, 20) = 3, 25
obtenindose los valores Rp como se muestra en la Tabla ??.
Cuadro 3.5: Valores Rp tabulado para la prueba de Duncan
R2 = Q0,05 (2, 20) SY .j = (2, 95) (1, 27) = 3, 75
R3 = Q0,05 (3, 20) SY .j = (3, 10) (1, 27) = 3, 94
R4 = Q0,05 (4, 20) SY .j = (3, 18) (1, 27) = 4, 04
R5 = Q0,05 (5, 20) SY.j = (3, 25) (1, 27) = 4, 13

Al hacer las comparaciones entre medias se obtiene Tabla resumen 3,6. A partir de
Cuadro 3.6: Prueba de intervalos mltiples de
Duncan para ganancia de peso
Y j Y j 0 Conclusi
Comparaci
on
Y j Y j 0
on
T4 contra T1 21, 6 9, 8 = 11, 8
11, 8
11, 8 > 4, 13
T4 contra T5 21, 6 10, 8 = 10, 8
10, 8
10, 8 > 4, 04
T4 contra T2
21, 6 15, 4 = 6, 2
6, 2
6, 2 > 3, 94
T4 contra T3
21, 6 17, 6 = 4, 0
4, 0
4, 0 > 3, 75
T3 contra T1
17, 6 9, 8 = 7, 8
7, 8
7, 8 > 4, 04
T3 contra T5
17, 6 10, 8 = 6, 8
6, 8
6, 8 > 3, 93
T3 contra T2
17, 6 15, 4 = 2, 2
2, 2
2, 2 < 3, 75N S
T2 contra T1
15, 4 9, 8 = 5, 6
5, 6
5, 6 > 3, 94
T2 contra T5
15, 4 10, 8 = 4, 6
4, 6
4, 6 > 3, 75
T5 contra T1
10, 8 9, 8 = 1, 0
1, 0
1, 0 < 3, 75N S

este anlisis se observa que existen diferencias significativas entre todas las parejas de
medias, excepto entre 3 y 2, y entre la 5 y 1.
T4 T3
c b

T2
b

T5 T1
a a

Prueba Multiple de Duncan


>Dun<-duncan.test(mod, "Dieta")
Study:
Duncans new multiple range test for Peso
Mean Square Error: 8.06
Dieta, means
Peso
std.err
r Min. Max.
a
9.8
1.4966630 5
7
15
b
15.4
1.4000000 5
12
18
c
17.6
0.9273618 5
14
19

d
21.6
1.1661904 5
19
25
e
10.8
1.2806248 5
7
15
alpha: 0.05 ; Df Error: 20
Critical Range
2
3
4
5
3.745452 3.931466 4.049682 4.132249
Comparison between treatments means
Difference
pvalue sig.
LCL
UCL
a b
5.6
0.007154
** 9.5314658 1.6685342
a c
7.8
0.000550 *** 11.8496819 3.7503181
a d
11.8
0.000005 *** 15.9322493 7.6677507
a e
1.0
0.583753
4.7454516 2.7454516
b c
2.2
0.234715
5.9454516 1.5454516
b d
6.2
0.003394
** 10.1314658 2.2685342
b e
4.6
0.018595
*
0.8545484 8.3454516
Means with the same letter are not significantly different.
Groups, Treatments and means
a d 21.6
b c 17.6
b b 15.4
c e 10.8
c a
9.8

3.3.3.

Prueba Honesta de Tukey

Tukey (1953) propuso un procedimiento de comparacion mltiple que tambin esta


basado en intervalos. Su procedimiento requiere el uso de la cantidad q (t, glEE ) para
determinar el valor crtico de todas las comparaciones por pares, independientemente de
las medias en un grupo. Asi la prueba de Tukey declara dos medias significativamente
diferentes si el valor absoluto de sus diferencias muestrales excede el valor
T = q (t, glEE ) SY .j ,
r
donde SY .j esta definida como SY .j =

(3.9)

CMEE
, debe notarse que en todas las compar

raciones slo se usa el valor crtico T .


Ejemplo
Tomando los valores absolutos de los pares de medias se declara que existen diferencias
0
significativas entre los tratamientos j y j s


Y .j Y 0 > .
.j
Para el ejemplo de ganancia de peso, T0,05 = q0,05 (5; 20) SY j = (4, 23) (1, 27) = 5, 37
(Anexo 8). Al usar este valor crtico en los datos de nuestro ejemplo se determina que
ahora Y ,3 y Y ,4 no difieren en forma signifivativa, as como tampoco Y ,2 y Y ,5 , el
esquema siguiente resume estos resultados.

T4 T3
a ab

T2 T5 T1
b bc
c

Ntese que esta prueba es ms extricta que las dos anteriores.


Prueba Honesta de Tukey.
> tuk<- HSD.test(mod, "Dieta")
Study:
HSD Test for Peso
Mean Square Error: 8.06
Dieta, means
Peso
std.err r Min. Max.
a
9.8 1.4966630 5
7
15
b
15.4 1.4000000 5
12
18
c
17.6 0.9273618 5
14
19
d
21.6 1.1661904 5
19
25
e
10.8 1.2806248 5
7
15
alpha: 0.05 ; Df Error: 20
Critical Value of Studentized Range: 4.231857
Honestly Significant Difference: 5.372958
Comparison between treatments means
Difference
pvalue sig.
LCL
UCL
a b
5.6
0.038502
* 10.9729583 0.2270417
a c
7.8
0.002595
** 13.1729583 2.4270417
a d
11.8
0.000019 *** 17.1729583 6.4270417
a e
1.0
0.979771
6.3729583 4.3729583
b c
2.2
0.737244
7.5729583 3.1729583
b d
6.2
0.018894
* 11.5729583 0.8270417
b e
4.6
0.116297
0.7729583 9.9729583
c d
4.0
0.210109
9.3729583 1.3729583
c e
6.8
0.009065
**
1.4270417 12.1729583
d e
10.8
0.000062 ***
5.4270417 16.1729583
Means with the same letter are not significantly different.
Groups, Treatments and means
a d 21.6
ab c 17.6
bc b 15.4
cd e 10.8
d a
9.8

3.3.4.

Prueba de Scheff

Una ventaja de esta prueba es su robustez frente a la violacin de los supuestos del
ANAVA, adems que no necesita igual nmero de repeticiones por tratamiento. Es una

prueba bastante conservadora, ms que la de Tukey, se pueden llevar a cabo cualquiera


de las posibles comparaciones entre medias de tratamientos.
En esta prueba la hiptesis nula es:
0


Y .j

H0 : j = j 0 , para toda j 6= j , se rechaza s


s


q
1
1

+
,
Y j 0 > (t 1) F(, t1, v) CMEE
rj rj 0

donde: v = glEE .
Prueba de Scheff.
>sche <- scheffe.test(mod,"Dieta", group=TRUE)
Study:
Scheffe Test for Peso
Mean Square Error : 8.06
Dieta, means
Peso
std.err r Min. Max.
a
9.8
1.4966630 5
7
15
b
15.4
1.4000000 5
12
18
c
17.6
0.9273618 5
14
19
d
21.6
1.1661904 5
19
25
e
10.8
1.2806248 5
7
15
alpha: 0.05 ; Df Error: 20
Critical Value of F: 2.866081
Minimum Significant Difference: 6.079555
Comparison between treatments means
Difference
pvalue sig
LCL
UCL
a b
5.6
0.081176
12.2079179 1.0079179
a c
7.8
0.007613 ** 14.4079179 1.1920821
a d
11.8
0.000079 *** 18.4079179 5.1920821
a e
1.0
0.988295
7.6079179 5.6079179
b c
2.2
0.823486
8.8079179 4.4079179
b d
6.2
0.044113
* 12.8079179 0.4079179
b e
4.6
0.203196
2.0079179 11.2079179
c d
4.0
0.325658
10.6079179 2.6079179
c e
6.8
0.023228
*
0.1920821 13.4079179
d e
10.8
0.000243 ***
4.1920821 17.4079179
Means with the same letter are not significantly different.
Groups, Treatments and means
a d 21.6
ab c 17.6
bc b 15.4
c e 10.8
c a
9.8

(3.10)

3.3.5.

Prueba de Bonferroni

Esta prueba es recomendada cuando la F del ANAVA resulta no significativo, pero


tambin se puede usar en caso contrario, es una prueba medianamente conservadora,
que se debe usar slo para un nmero p no muy grande de comparaciones, puesto de lo
contrario se incrementa el nivel de significancia.
La hiptesis nula
H0 : j = j 0 , para j 6= j

se rechaza, al nivel de significancia , s



Y .j

v
u
u

Y .j 0 > t(/2p, glEE ) tCMEE

1
1
+
rj rj 0

!
,

(3.11)

donde p es el nmero de comparaciones que se piensan llevar a cabo y t(/2p, v) es el valor


tabulado de la estadstica de Bonferroni al nivel de significancia .
Prueba de Bonferroni.
>Bonf=LSD.test(mod, "Dieta", group=T, p.adj= "bon")
Study:
LSD t Test for Peso
P value adjustment method: bonferroni
Mean Square Error: 8.06
Dieta, means and individual ( 95 %) CI
Peso
std.err r
LCL
UCL
Min. Max.
a
9.8 1.4966630 5
6.678016
12.92198
7
15
b
15.4 1.4000000 5
12.479651
18.32035 12
18
c
17.6 0.9273618 5
15.665557
19.53444 14
19
d
21.6 1.1661904 5
19.167369
24.03263 19
25
e
10.8 1.2806248 5
8.128663
13.47134
7
15
alpha: 0.05 ; Df Error: 20 C
ritical Value of t: 3.153401
Least Significant Difference 5.662089
Comparison between treatments means
Difference
pvalue sig.
LCL
UCL
a b 5.6
0.054089
11.262089 0.0620885
a c 7.8
0.003147
** 13.462089 2.1379115
a d 11.8
0.000021 *** 17.462089 6.1379115
a e 1.0
1.000000
6.662089 4.6620885
b c 2.2
1.000000
7.862089 3.4620885
b d 6.2
0.025142
* 11.862089 0.5379115
b e
4.6
0.185950
1.062089 10.2620885
c d 4.0
0.375408
9.662089 1.6620885
c e
6.8
0.011567
*
1.137911 12.4620885

d e 10.8
0.000070 ***
5.137911 16.4620885
Means with the same letter are not significantly different.
Groups,
Treatments and means
a d
21.6
ab c
17.6
bc b
15.4
c e
10.8
c a
9.8

3.3.6.

Comparacin de Medias de Tratamientos con un Control


(Prueba de Dunnett)

En muchos experimentos uno de los tratamientos es un control o testgo y el investigador


puede estar interesado en comparar este control con el resto de tratamientos, es decir
llevar a cabo t 1 comparaciones de medias de tratamientos. Un procedimiento para
llevar a cabo esto, fue desarrollado por Dunnett (1964) como sigue: Supongase que el
tratamiento t es un control y se desea probar las hiptesis
H0 : j = t contra H1 : j 6= t ,
para j = 1, 2..., t 1. El procedimiento de Dunnett es una modificacion de la prueba t.
Para cada hiptesis se calculan las diferencias que se observan en las medias muestrales.


Y .j Y .t , para j = 1, 2, ..., t 1.
La hiptesis nula H0 : j = t se rechaza a un nivel de significancia , s
v
!
u
u


Y .j Y .t > d (t 1, ) tCMEE 1 + 1 ,
rj rj 0

(3.12)

donde la constante d (t 1, ) se encuentra en la Tabla de Dunnett, (Anexo 9). Siendo


v = glEE y el nivel de significancia asociado a las t 1 pruebas.
Ejemplo 3.2. Para ilustrar la prueba de Dunnett, considrense los datos del ejemplo de
ganancia de peso y supongase que el tratamiento 5 es el control . As, t = 5, t 1 = 4,
= 20 , rj = r = 5 y con el nivel de significancia del 5 % de la tabla de Dunnett,
d0,05 (4, 20) = 2,65 por lo tanto la diferencia crtica es.
r
d0,05 (4, 20)

r
2CM E
2(8, 06)
= 2, 65
= 4, 76.
r
5

En consecuencia, un tratamiento debe considerarse significativamente diferente del control si la diferencia de medias en valor absoluto es mayor que 4,76. Las diferencias
observadas son mostradas en la Tabla ??:
Solo las diferencias Y 3 Y 5 y Y 4 Y 5 resultaron significativas.

Cuadro 3.7: Prueba de Dunnett para


de peso
ganancia



Comparaci
on
Y j Y 5
Y j Y 5
Conclusin
T1 contra T5
9, 8 10, 8 = 1, 0
1
1, 0 < 4, 76N S
T2 contra T5 15, 4 10, 8 = 4, 6
4,6
4, 6 < 4, 76N S
T3 contra T5 17, 6 10, 8 = 6, 8
6,8
6, 8 > 4, 76
T4 contra T5 21, 6 10, 8 = 10, 8
10,8
10, 8 > 4, 76

3.3.7.

Contrastes

En cualquier experimento se puede presentar la necesidad de comparar grupos de tratamientos, en estos casos el mtodo de los contrastes resulta una alternativa para llevar a
cabo dichas comparaciones. Por ejemplo el investigador quisiera corroborar el supuesto
de que los promedios de los tratamientos 1 y 2 no difieren de los promedios de los
tratamientos 3 y 4. En este caso la prueba que se quiere llevar a cabo es
H0 : (1 + 2 ) (3 + 4 ) = 0

contra

H1 : (1 + 2 ) (3 + 4 ) 6= 0.

Estudiamos ahora como se llega a un estadstico de prueba para corroborar esta hiptesis.
Definicin: Un contraste es toda combinacin lineal de medias de tratamiento, donde
la suma algebrica de sus coeficientes es igual a cero. En general una combinacin lineal
o contraste es de la forma:
Z1 = c11 1 + c12 2 + + c1t t =

t
X

c1j j ,

(3.13)

j=1

P
c
donde se cumple que tj=1 r1jj = 0.
Si los tratamientos tienen el mismo nmero de repeticiones, la condicin anterior se
reduce a:
t
X
c1j = 0.
(3.14)
j=1

Entonces es posible escribir una prueba de hiptesis que involucre grupo de medias de
tratamientos a partir del concepto de lo que es un contraste. Si Z1 es el contraste que
representa una comparacin de medias entonces las hiptesis estadsticas se escriben
como se muestra a continuacin:
H0 : Z1 =

t
P
j=1

c1j j = 0

contra

H1 : Z1 =

t
P

c1j j 6= 0.

j=1

Un estimador del contraste dado en (3.13) basandose en las medias de los tratamientos
es:
t
X
b
Z1 = C11 Y ,1 + C12 Y ,2 + + C1t Y .t =
C1j Y .j ,
(3.15)
j=1

donde los Y .j son los promedios procedentes de muestras aleatorias de tamao rj . S las
muestras provienen de poblaciones normales e independientes, entonces por el teorema
central del lmite se tiene que:



j2
2
.
Y.j N j , j Y .j N j ,
rj
De estos resultados se llega a:
" t
#
t
t
 
X
X
 X
b
E Zk = E
Ckj Y .j =
Ckj E Y .j =
Ckj j .
j=1

j=1

(3.16)

j=1

y


V Zbk = V

"

t
X

#
Ckj Y .j =

j=1

t
X

t
t
2
X
 X
Ckj
2
2
2 j
Ckj
V Y .j =
Ckj
= 2
,
r
r
j
j
j=1
j=1
j=1

(3.17)

es decir que la estadstica


Zbk Zk
tgl .
t= s
2
Pt Ckj

j=1
rj

(3.18)

Entonces la prueba de hiptesis, al nivel de significancia ,


H0 : Z1 = 0

H1 : Z1 6= 0

contra

(3.19)

se puede llevar a cabo utilizando esta estadstica.


Suma de Cuadrados de un Contraste
La suma de cuadrados de un contraste para promedios o totales viene dada por:
 2
Zbk
SCZck = t 2
para promedios
(3.20)
P Ckj
rj

j=1


SCZck =

Zbk

t
P

2
para totales

(3.21)

rj Cj2

j=1

y como cada contraste tiene un grado de libertad, se deduce que


CMZc =
k

SCZck
1

= SCZck .

Con este resultado se llega a que la prueba de hiptesis

(3.22)

H0 : Zk = 0

contra H1 : Zk 6= 0

tenga un segundo estadstico de prueba, que es el ms utilizado, que el anterior, es dado


por
CMZbk
F =
F1,glEE .
(3.23)
CMEE
de tal forma que si al nivel de significancia , Fc > F,1,glEE entonces H0 se rechaza.

3.3.8.

Contrastes Ortogonales

Dos contrastes
Z1 = C11 1 + C12 2 + + C1t t

Z2 = C21 1 + C22 2 + + C2t t

se dicen ortogonales s,
t
X
C1j C2j
j=1

rj

= 0,

(3.24)

que para tratamientos con igual nmero de repeticiones se reduce a:


t
X

C1j C2j = 0.

(3.25)

j=1

Se puede probar que dados t tratamientos, se pueden obtener a lo ms t 1 contrastes


ortogonales cada uno con 1 grado de libertad y adems que:
SCT T O = SCZb1 + SCZb2 + . . . + SCZbt1 ,

(3.26)

puesto que los contrastes que se analizan son independientes dos a dos, lo que conlleva
a que la variacin que se deduce de uno de los contrastes no es posible volverla a tener
en otro contraste.
Ejemplo 3.3. Se realiz un experimento con tres tratamientos, que consistin en tres
tipos de empaques llmense A (testigo), B y C, con 7 repeticiones cada uno, con el
fin de observar en un tiempo determinado la conservacin de un alimento. Despus de
procesar la informacin, se obtuvo un CMEE = 3, 076. Las comparaciones deseadas
son:
1) TA contra (TB, TC ) y 2) TB contra TC
que en terminos de contrastes ortogonales se escriben como
B + C
o Z1 : 2A B C = 0 y
1) A =
2
2) B = C
o
Z2 = B C = 0.
Solucin: Note que: C11 = 2, C12 = 1, C13 = 1 para Z1 y C21 = 0, C22 = 1, C23 = 1
para Z2 , as se puede verificar que:
3
3
P
P
0
1)
C1j = 2 + (1) + (1) = 0
y
C2j
= 0 + 1 + (1) = 0, tambin
j=1

j=1

2)

3
P

0
= (0) (2) + (1) (1) + (1) (1) = 0 + (1) + 1 = 0,
C1j C2j

j=1

es decir, los contrastes Z1 y Z2 son ortogonales.


Llevemos ahora a cabo las pruebas de hiptesis
H0 : Z1 = 2A B C = 0
H0 : Z2 = B C = 0

contra

H1 : Z1 = 2A B C 6= 0

contra

H1 : Z2 = B C 6= 0,

al nivel de significancia = 5 %, conociendo de antemano que Y A = 17, 6; Y B = 19, 31


y Y C = 23, 53. As se obtiene
 2
Zb1
[7, 64]2
[2 17, 6 + (1) (19, 31) + (1) (23, 53)]2
=
= 68, 09
SCZb1 = 3 2 =
6
P C1j
(2)2 (1)2 (1)2
+
+
7
7
7
7
j=1 rj
 2
Zb2
[(19, 31) (23, 53)]2
[4, 22]2
SCZb2 = 3 2 =
=
= 62, 32
2
P C2j
(0)2 (1)2 (1)2
+
+
7
7
7
7
j=1 rj
entonces,
SCZb

FZb =
1

CMEE

SCZb

2
68, 09
63, 32
1
= 22, 13 y FZb =
= 20, 26 .
=
=
2
3, 076
CMEE
3, 076

Siendo F(5 %,1,18) = 4, 41 y F(1 %,1,18) = 8, 29 entonces, FZb y FZb >> F5 %,1,18 = 4,41,
1
2
rechazndose las hiptesis nulas planteadas.
Conclusin: al nivel de significancia del 5 %, los empaques B y C conservaron mejor el
alimento que el testigo (A) y a su vez el empaque C super en conservacin al empaque
B, dando como resultado que el mejor empaque es el C seguido del B y por ltimo el
A.
Observaciones
1. La DM S o LSD no es recomendada para todas las comparaciones mltiples de
medias cuando el nmero de tratamientos es muy alto, puesto que incrementa el
nivel de significancia o la tasa de error por comparacin.
2. El test de Duncan es sensible a declarar diferencias significativas cuando el nmero
de tratamientos es muy alto.
3. El test de Bonferroni es bastante flexible, puede ser empleado en casos balanceados o no y es superior al test de Tukey o Scheffe, si el nmero de comparaciones
es pequeo.
4. El test de Tukey es util en situaciones en que se desea informaciones preliminares
en el uso del experimento como un todo, en la determinacin de diferencias significativas o para determinar intervalos de confianza para las diferencias de medias
poblacionales.

5. El procedimiento de Scheffe es ms conservador que el test de Tukey, para la


comparacin de pares de medias es til para otras comparaciones, es un test
exacto para muestras de tamao desigual o para comparar medias ajustadas por
covarianza
6. S la F de la tabla ANAVA resulta no significativa, en comparaciones planeadas,
se debe utilizar para comparaciones mltiples la prueba de Bonferroni o la Tmultivariado.
7. Cuando se tienen factores cuantitativos, tales que los niveles son dosis, tiempo,
etc; una comparacin mltiple tiene poco sentido porque la variable respuesta
representa una funcin del factor, en ese caso se recomienda usar polinomios
ortogonales o anlisis de regresin.
A continuacin se presentan algunas sugerencias que se pueden tener en cuenta
cuando se desea llevar a cabo una prueba de comparacin mltiple
Cuadro 3.8: Sugerencias para el uso de las pruebas de comparaciones mltiple
N umero de
P rueba
U tilizar s
T ipo de prueba
comparaciones
DMS
F sgnificativa
planeada
6
Duncan
F sgnificativa
no planeada
10
SNK
F sgnificativa
no planeada
Cualquier nmero
Tukey
F sgnificativa
no planeada
> 10
Scheffe
F sgnificativa
no planeada
> 10
Bonferroni F sgnificativa o no
planeada
6-21
Contrastes
F sgnificativa
planeada
Cualquier nmero

3.3.9.

Polinomios Ortogonales

Como se aclar anteriormente cuando los niveles del factor en estudio son cuantitativos,
tales como dosis de un medicamento, raciones en una dieta, distancia de siembra, tiempo
de maduracin de un producto, etc, hacer un anlisis de comparaciones mltiples tiene
poco sentido ya que lo que interesa es la relacin entre la variable medida y los niveles
del factor cuantitativo aplicado, es decir, la funcin matemtica que explica la variable
respuesta en funcin de los niveles del factor en estudio, en estos casos el anlisis de
regresin, discutido en captulos anteriores es lo ms aconsejable.
En situaciones en la que los niveles del factor son equidistantes o igualmente espaciados,
puede simplificarse mucho el ajuste de modelos polinomiales por el mtodo de mnimos
cuadrados. El procedimiento utiliza los coeficientes de los contrastes ortogonales (Anexo
10) que se fundamenta en la siguiente explicacin (ver Gmez 1997).
Para un factor A con tres niveles, los efectos del factor estan formados por dos componentes: lineal y cuadrtico

Cambio en A
0 - 1
1 - 2

Incremento en la respuesta
a1 -a0
a2 -a1

Como para una tendencia lineal el incremento de la variable respuesta es igual a la


diferencia al pasar de un nivel a otro, este efecto se mide con el promedio de los incrementos al pasar de a0 a a2 , puesto que de existir la linealidad, el incremento al pasar
de a0 a a1 debe de ser igual al de pasar de a1 a a2 , asi:
Al = 12 [(a1

a0 ) + (a2

a1 )] = 12 (a2

a0 ) .

S la tendencia es cuadrtica, es porque los incrementos no son proporcionales, es decir,


el efecto cuadrtico viene representando una desviacin a la linealidad, en este caso el
incremento al pasar de a0 a a1 es diferente al de pasar de a1 a a2 , entonces de existir
la tendencia cuadrtica, la diferencia entre estos incrementos sera distinta de cero, por
esto el efecto cuadrtico es la diferencia de los incrementos:
AC = 12 [(a2

a1 ) (a1

a0 )] = 21 (a2 2a1 + a0 ) .

Notese que tanto Al como AC representan un contraste, por esto, para determinar la
significancia, o presencia, de cada efecto se plantean las siguientes hiptesis nulas con
respecto a los contrastes anteriores:
H0 : AL = 0 21 (2 0 ) = 0 2 0 = 0 0 2 = 0
H0 : Ac = 0 21 (2

21 + 0 ) = 0 0

21 + 2 = 0.

As, los coeficientes ortogonales para el efecto lineal son: 1, 0 y -1 y para el efecto
cuadrtico son 1, -2 y 1.
En general, realizando el ajuste del polinomio por mnimos cuadrados, se pueden obtiener los efectos lineal, cuadrtico, cbico etc. Igualmente, tambien se puede obtener la
suma de cuadrados de cada efecto, lo cual permite determinar la contribucin de cada
trmino del polinomio.
Al igual que en contrastes ortogonales, si t niveles del factor se analizan en un experimento, es posible extraer efectos polinomiales hasta de orden t 1.
El modelo estadstico del polinomio es:
Y = 0 + 1 p1 (x) + 2 p2 (x) + 3 p3 (x) + ... + t1 pt1 (x) + 

(3.27)

donde Y es la variable respuesta y X corresponde a los niveles del factor.


Ejemplo: para t = 5, se tiene que:
Y = 0 + 1 p1 (x) + 2 p2 (x) + 3 p3 (x) + 4 p4 (x) + 

(3.28)

con p0 (x) = 1, y los siguientes polinomios representan:


"
#
X X
p1 (x) = 1
el efecto lineal,
d
"
2  2
#
X X
t 1
p2 (x) = 2
el efecto cuadrtico,

d
12
"
3 
 2
#
3t 7
X X
X X
el efecto cbico
p3 (x) = 3

d
d
20
y
"
#
4 
2  2

X X
3t 13
3 (t2 1) (t2 9)
X X
p4 (x) = 4
+
,

d
d
14
560
el efecto de cuarto grado, donde:
d es la distancia entre los niveles del factor,
t es el nmero de niveles del factor,
j es una constante dada en la tabla de polinomios ortogonasles,
X es el promedio de los niveles del factor.
Para determinar la significancia de cada termino del polinomio o efecto, se llevan en
forma similar como se realiza en los modelos de regresin, las siguientes pruebas de
hiptesis sobre los parmetros del modelo.
H0 : 1 = 0 contra H1 : 1 6= 0,
H0 : 2 = 0 contra H1 : 2 6= 0,
H0 : 3 = 0 contra H1 : 3 6= 0,
H0 : 4 = 0 contra H1 : 4 6= 0.
Las pruebas de estas hiptesis son anlogas a las realizadas sobre un conjunto de contrastes ortogonales, donde los Ckj ya no son seleccionados segn la situacin, sino que
estn dados en la tabla de polinomios ortogonales, para cada uno de los efectos lineal,
cuadrtico, cbico, etc. As, es suficiente encontrar las sumas de cuadrados de los t 1
t
P
polinomios ortogonales Zk =
Ckj j en forma similar a como ocurre para los t 1
j=1

contrastes ortogonales. As, se cumple que:


SCT T O = SCE. Linear + SCE. Cuadratico + SCE. C ubico + SCE. Cuartico + ... + SCE. t1
t1
X
=
SCE. K ,
(3.29)
K=1

donde, para K = 1, 2, . . . , t 1, la SCE. K se obtiene calculando la SC del contraste


Zk =

t
X

Ckj j .

j=1

Las estimaciones por mnimos cuadrados de los parmetros del modelo polinomial son:

t
P

bj =

Y j Pj (Y )

j=1
t
P

para

j = 0, 1, 2, ...., t 1,

[Pi (Y )]

j=1

es decir,
t
P

b0 =

t
P

C0j Y .j

j=1
t
P

2
C0j

= Y ,
b1 =

j=1

t
P

C1j Y j

j=1
t
P

2
C1j

, ,
bk =

Ckj Y .j

j=1

j=1

t
P
j=1

,
2
Ckj

donde los coeficientes Ckj son dados en la Tabla de poligonos ortogonales para el efecto
lineal (P1 (x)) , cuadrtico (P2 (x)) , cbico(P3 (x)) , etc.
Ejemplo 3.4. Supongamos que en el ejemplo del ANAVA que se ha venido analizando, las dietas que se estudian se diferencia una de otra por la presencia de un cierto
componente en dosis diferentes en porcentajes de 15, 20, 25, 30 y 35 %, tenindose entonces un factor cuantitativo e igualmente espaciado sus niveles, por lo tanto el anlisis
a considerar para este caso es el de los polinomios ortogonales. Se recuerda que en este
experimento se realiz un DCA, con cinco repeticiones.
Los datos que se obtuvieron son dados en la Tabla 3,9
Cuadro 3.9: Ganancia de peso en componentes igualmente espaciado
ganancia de peso (libra)
% componente/Repeticn 1
2
3
4
5
Y.j
Y .j
15
7
7 15 11 9
49
9, 8
20
12 17 12 18 18
77
15, 4
25
14 18 18 19 19
88
17, 6
30
19 25 22 19 23
108
21, 6
35
7 10 11 15 11
54
10, 8
Y = 376 Y = 15, 04

La tabla ANAVA se resume en la Tabla 3,10. Los resultados del ANAVA


Cuadro
F.V.
Dieta
EE
Total

3.10: ANAVA para ganancia de peso


gl
SC
CM
Fc
F5 % F1 %
4 475,76 118,94 14,76 2,87 4,43
20 161,20
8,06
24 636,96

imdican que existen diferencias altamente significativas entre los niveles del factor estudiado.

Cuadro 3.11: Coeficientes de los polinomios ortogonales para ganacia de peso


Coeficientes de los polinomios ortogonales
Contenido
de la
dieta( %)
15
20
25
30
35
t
P
Zb =
Ckj Y .j

P romedio

Ef ecto
lineal

Ef ecto
cuadr
atico

Ef ecto
c
ubico

Ef ecto
cuartico

9,8
15,4
17,6
21,6
10,8

2
1
0
1
2

2
1
2
1
2

1
2
0
2
1

1
4
6
4
1

8, 2

31

11, 4

21, 8

2, 8

14

10

14

10

70

(8, 2)2
2
= 33, 6

(31)2
2, 8
= 343, 2

(11, 4)2
2
= 64, 9

(21, 8)2
14
= 33, 9

j=1
t C2
P
kj
j=1
t
P

rj
2
Ckj

j=1
t
P

!2
Ckj Y .j

j=1

SC =

t
P
j=1

2
Ckj
rj

Las conclusiones para cada efecto se obtienen de las Tablas 3,11 y 3,11:
Entonces se concluye, para = 5 %, que la relacin entre la ganancia de peso y el %
del componente es cbica, es decir que el polinomio segn los resultados del ANAVA
es:
Yb =
b0 +
b2 p2 (x) +
b3 p3 (x)
(3.30)
Con los resultados de la Tabla 3,11 se pueden estimar los parmetros
bk del polinomio,
aplicando las expresiones correspondientes dadas anteriores, con lo cual se encuentra
que:
376

b0 = Y.. =
= 15, 04,
b2 =
25

5
P

C2j Y ij

j=1
5
P
j=1

5
P

b3 =

C3j Yj

j=1
5
P

=
2
C3j

=
2
C2j

31
= 2, 214 y
14

11, 4
= 1, 14.
10

j=1

De la tabla de polinomios ortogonales se tiene que 2 = 1 y 3 = 65 ; adems


15 + 20 + 25 + 30 + 35
como d = 5 y t = 5 entonces, X =
= 25. Luego, remplazando
5

Cuadro 3.12: ANAVA para ganacia de peso


F.V.
gl
SC
CM
Fc
F5 %1,20
Dieta
4 475, 76 118, 94 14, 76
4, 35
NS
Efecto lineal
1
33, 62
33, 62 4, 17
Efecto cuadrtico 1 343, 21 343, 21 42, 58
Efecto cbico
1
64, 98
64, 98
8, 06
Efecto cuartico
1
33, 95
33, 95 4, 21N S
EE
20 161, 20
8, 06

F1 %1,20
8, 10

en la ecuacin (3.30) se obtiene:


"

2  2
#
X

25
5

1
Yb = 15, 04 2, 21 (1)

5
12
!#
  "
3 

5
X 25
X 25
3 (5)2 7
1, 14

6
5
5
20
y simplificando se llega a:
Yb = 66, 7111 9, 174X + 0, 4814X 2 0, 00786X 3 .

(3.31)

Ahora, para encontrar la dosis ptima se aplican los conceptos de mximos y mnimos del clculo diferencial, entonces derivando la funcin anterior con respecto a X e
igualando esta derivada a cero se obtiene:
dYb
= 9, 174 + 0, 9628X 0, 02358X 2
dX
entonces al hacer esta expresin igual a cero se obtienen las soluciones:
q

0, 9628 (0, 9628)2 4 (9, 174) (0, 02358)


0, 9628 0, 0616
X=
=
2 (0, 02358)
0, 04716
portanto, X1 = 25, 67 y X2 = 15, 15 son los puntos crticos. Ahora, calculando la
segunda derivada se llega a:
d2 Yb
= 0, 9628 0, 04716X
dx2
y aplicando el criterio de la segunda derivada se obtiene que,

1.

d2 Yb
|x=25,67 = 0, 9628 0, 04716 (25, 67) = 0, 2481 < 0 es decir, en X = 25, 67
dx2
existe un mximo relativo.

2.

d2 Yb
|x=15,15 = 0, 9628 0, 04716 (15, 15) = 0, 248 > 0 por lo tanto, en X = 15, 15
dx2
existe un mnimo relativo.

De estos resultados se concluye que la mxima ganancia de peso se tiene para dosis
alrededor de 25,67 % del componente y la mnima ganacia se obtiene con dosis cercana
a 15,15 %. Es decir que la dosis de mejor comportamiento en el experimento es la de
25 % del componente.
Ejemplo 3.5. Para ilustrar el procedimiento analicemos el trabajo preliminar llevado a
cabo por Cardona (2003), donde se estudi el efecto de la aplicacin de dosis de calcio,
en tres dosis de aplicacin, en la calidad de los frutos de tomate. La variable de inters
fue la cantidad de calcio en dicho fruto. Las dosis de calcio estudiadas fueron de 0; 0,05;
0,1 y 0,15 el experimento se llevo a cabo bajo un diseo completamente al azar (DCA)
con 4 repeticiones. Los resultados obtenidos por unidad experimental son presentados
en la Tabla 3,13.

Cuadro 3.13: Cantidad de calcio en frutos de tomate


Concentracin/Repeticin
0
0, 05
0, 1
0, 15

1
0, 172
0, 212
0, 252
0, 424

as
FC =

2
0, 204
0, 136
0, 272
0, 468

3
0, 244
0, 268
0, 212
0, 524

4
0, 148
0, 204
0, 228
0, 452

Y.j
0, 768
0, 82
0, 964
1, 968
Y.. = 4, 42

Y .j
0, 192
0, 205
0, 241
0, 467
Y .. = 0, 2762

Y..2
4, 422
=
= 1, 2210
n
16

Las sumas de cuadrados son:


SCT otal =

4 X
4
X

Yij2 F C

i=1 j=1



= 0, 1722 + 0, 2042 + 0, 2442 + 0, 5242 + 0, 4522 1, 2210 = 0, 2205
SCConcentracion =

4
X
Y.j2
j=1

rj

FC


0, 7682 0, 822 0, 9642 1, 8682
=
+
+
+
1, 2210 = 0, 1992
4
4
4
4
= SCT otal SCConcentracion = 0, 2205 0, 1992 = 0, 0213


SCEE

y el ANAVA correspondiente es presentado en la Tabla 3,14

Cuadro 3.14: Anlisis de varianza para concentracin de calcio.


F.V.
gl
SC
CM
Fc
F0,05; 3, 12 F0,01; 3, 12
Concentracin 3 0,1992 0,0664 37,27
3,49
5,95
EE
12 0,0213 0,0017
Total
15 0,2205

Tenindose un factor cuantitativo e igualmente espaciado sus niveles, el anlisis a considerar es el de polinomios ortogonales. Los coeficientes, a partir de la tabla de polinomios
ortogonales, para este caso de 4 niveles de tratamiento para cada efecto, lneal, cuadrtico y cbico, son dados en la Tabla 3,15
Cuadro 3.15: Coeficientes para cuatro niveles igualmente espaciados
C1j (E. lineal) C2j (E. cuadr
atico) C3j (E. c
ubico)
3
1
1
1
1
3
1
1
3
3
1
1

Los resultados de la suma de cuadrados para cada efecto se obtiene en la Tabla 3,16
Cuadro 3.16: Sumas de cuadrado para concentraciones de calcio.
Ef ecto
Ef ecto
Ef ecto
Concentracin
Y .j
lineal
cuadr
atico
c
ubico
0
0, 192
3
1
1
0, 05
0, 205
1
1
3
0, 1
0, 241
1
1
3
0, 15
0, 467
3
1
1
P4
b
Z = j=1 Ckj Y .j
0, 861
0, 213
0, 167
2
P4 Ckj
5
1
5
j=1
P4 rj2
20
4
20
j=1 Ckj
P
2
4
j=1 Ckj Y .j
2
2
0,8612
SC =
= 0, 1482 0,213
= 0, 0453 0,167
= 0, 0055
2
P4 Ckj
5
1
5
j=1 rj

As, el ANAVA, Tabla 3,17, queda dado por:


Entonces se concluye, para = 5 %, que los efectos lneal y cuadrtico son significativos
y que la relacin entre la ganancia de calcio y el del concentracin es cuadrtica, es decir
que el polinomio segn los resultados del ANAVA es:
Yb =
b0 +
b1 p1 (x) +
b2 p2 (x)

(3.32)

Cuadro 3.17: ANAVA


F.V.
gl
Concentracin
3
Efecto lineal
1
Efecto cuadrtico 1
Efecto cbico
1
Error Exptal
12

para efectos de
SC
CM
0, 1992 0, 0664
0, 1482 0, 1482
0, 0453 0, 0453
0, 0055 0, 0055
0, 0142
8, 06

concentracin de calcio.
Fc
F5 %(1,20) F1 %(1,20)
37, 27
3, 49
5, 95

83, 22
4, 75
9, 33

25, 46
4, 75
9, 33
NS
3, 13
4, 75
9, 33
4, 75
9, 33

Analizando los resultados anteriores se tiene que la respuesta lneal fue significativa,
es decir que existen diferencias estadsticas al 5 % entre la dosis de cero y la de 0,15;
ahora como el efecto es positivo quiere decir que se obtiene mayor cantidad de calcio
en el tomate para concentracin de 0,15 que para concentracin de cero. Tambien el
efecto cuadrtico resulto significativo, es decir que los incrementos y decrementos en
la respuesta se presentan en forma desuniforme; siendo el efecto positivo, entonces la
parabola abre hacia arriba indicando que se presenta inicialmente un decremento y
posteriormente un incremento en la cantidad de calcio en el cultivo de fruto de tomate.
Con los resultados de la Tabla 3,17 se pueden estimar los parmetros del polinomio,
aplicando las expresiones correspondientes dadas anteriormente, por lo tanto se tiene
que:

b0 = Y .. = 0, 2762
P4
0, 861
j=1 C1j Y ij
=
= 0, 0430

b1 =
P4
2
20
j=1 C1j
P4
0, 213
j=1 C2j Y .j
=

b2 =
= 0, 0532.
P4
2
4
j=1 C2j
Asimismo, de la Tabla de polinomios ortogonales se tiene que 1 = 2 y 2 = 1 adems
como d = 0, 05 y t = 4 entonces: X = 0+0,05+0,1+0,15
= 0, 075 luego, remplazando
4
todos estos terminos en la ecuacin (3,32) se obtiene:
"


2  2
!#
 
X

0,
075
4

1
X

0,
075
+0, 0532 (1)

Yb = 0, 2762+0, 0430 (2)


0, 05
0, 05
12
llegndose a la ecuacin:
Yb = 21, 28X 2 + 1, 472X + 0, 2004

(3.33)

Para encontrar la concentracin ptima se aplican los conceptos de mximos y mnimos de una funcin del clculo diferencial, entonces derivando la funcin anterior con
respecto a X e igualando esta derivada a cero se obtiene:
dYb
dYb
= 42, 56X 1, 472 y haciendo dX
= 0 se obtiene X = 1,472
= 0, 03458 como punto
dX
42,56
crtico de la funcin. Calculando la segunda derivada se llega a

d2 Yb
dX 2

= 42, 56 y aplicando

2b

d Y
el criterio de la segunda derivada se obtiene que, dX
2 /x=0,03458 = 42, 56 > 0 es decir que
en X = 0, 03458 existe un mnimo relativo.
De estos resultados se concluye que la mnima cantidad de calcio en el fruto de tomate
se obtiene para una concentracin de calcio aplicando alrededor de 0,03458 %. La curva
estimada es una parabola abierta hacia arriba, entonces la mejor concentracin en el
experimento son las cercanas a los valores extremos, para el caso la concentracin de
0,15( %).

CAPTULO 4
DISEO EN BLOQUES
COMPLETAMENTE ALEATORIZADOS

4.1.

Generalidades

Cuando se lleva a cabo un experimento, no siempre se tienen condiciones de homogeneidad en el rea o rea experimental, por lo que tenemos que pensar en una alternativa
para controlar el error experimental. Una muy utilizada es la aplicacin del diseo en
bloques al azar.
El diseo en bloques al azar se recomienda cuando las unidades experimentales pueden
agruparse de acuerdo a una fuente de variacin o gradiente, de tal modo que en cada
grupo o bloque resulte un conjunto relativamente uniforme u homogneo de unidades
experimentales
Entre los diseos en bloque, el ms comn es el de bloques completos al azar, en el cual
todos los tratamientos aparecen en cada bloque. En este diseo los bloques contienen
el mismo nmero de unidades experimentales y los tratamientos se deben distribuir al
azar dentro de cada bloque; es usual que cada tratamiento se asigne una sola vez en
cada bloque, caso balanceado, pero podra repetirse dos o mas veces al requerirse mayor
precisin. Cuando cada tratamiento aparece una sola vez en cada bloque, entonces, las
repeticiones la conforman los bloques, es decir r1 = r2 . . . rt = r para cada tratamiento.
En la prctica las unidades experimentales deben colocarse con su mayor longitud
paralela a la fuente de variacin o gradiante del factor que se quiere controlar. Para r
bloques, o repeticiones, el esquema en campo es el siguiente:
En este tipo de diseo los bloques se utilizan como un medio para controlar el error
experimental, pero en ningn caso la respuesta debe estar sujeta al efecto combinado de
bloques y tratamientos. Por eso es importante llevar a cabo una prueba de aditividad
del modelo.

50

Bloque1
Bloque2
Sentido de la
Gradiente
Bloque r 1
Bloque r
CORRECT O

4.1.1.

Bloque1
Bloque2
Sentido de la
Gradiente
Bloque r 1
Bloque r
IN CORRECT O

Ventajas, Desventajas y Aleatorizacin en el Diseo en


Bloques al Azar

1. Ventajas:
El agrupamiento de las unidades experimentales permite controlar una fuente
de variacin, obteniendose una reduccin del error experimental
Es posible aumentar el nmero de repeticiones dentro de cada bloque para
aquellos tratamientos que se deseen estudiar con mayor precisin.
Si se pierde una, o ms de una unidad experimental, esta(s) se puede(n)
estimar con las restantes.
2. Desventajas :
No es apropiado para un nmero grande de tratamientos (se recomiendan
mximo 25)
Si se bloquea sin necesidad, no hay ganancia en precisin respecto al DCA
y por el contrario se pierde eficiencia debido a la reduccin de los glEE.
3. Aleatorizacin
Los tratamientos se deben aleatorizar dentro de cada uno de los bloques, en
forma independiente. Por ejemplo, si el ensayo en campo consta de cinco tratamientos (t1, t2, t3, t4, t5 ) y tres bloques, una de las posibles distribuciones de
los tratamientos a las parcelas puede ser:

t2

4.2.

Bloque I
t1 t5 t4

t3

t1

Bloque II
t2 t3 t4

t5

t3

Bloque III
t2 t1 t4

t5

Modelo Estadstico

El modelo estadstico para un experimento en un DBCA viene dado por la expresin:


Yij = + i + j + ij
donde

(4.1)

Yij : Es la observacin de la variable de estudio Y en el i esimo bloque para


j esimo tratamiento.
: Es la media general comn a todos los tratamientos.
i : Es el efecto del bloque i esimo.
j : Es el efecto del tratamiento j esimo.
ij es el error experimental en la unidad experimental i esima para el tratamiento
j esimo.

4.2.1.

Pruebas de Hiptesis y Anlisis de Varianza

Nuevamente el inters radica en saber si estadsticamente existen diferencias significativas entre los tratamientos, y por otro lado, pero ya en un segundo plano, determinar
si el bloqueo fue efectivo.
As, las pruebas de hiptesis correspondientes son:
1. Para los tratamientos: Ho : 1 = 2 = = t contra H1 : j 6= j 0 para
0
algn j 6= j ,
2. Para los Bloques: Ho : 1 = 2 = = r contra H1 : i 6= i para algn
0
i 6= i .
Dado que j = + j , entonces la primera hiptesis tambin se puede escribir como
0

H0 : 1 = 2 = = t contra H1 : j 6= j 0 para algn j 6= j .


Descomposicin de la Suma de Cuadrados Total
De acuerdo al modelo estadstico planteado, la suma de cuadrados total (SCT otal ) tiene
la siguiente descomposicin.
SCT otal =

r X
t
X
i=1 j=1
r X
t
X

Yij Y

2

r X
t
X

Y i Y

i=1 j=1

Yij Y i Y j + Y

2

2

r X
t
X

Y j Y

2

+(4.2)

i=1 j=1

(4.3)

i=1 j=1

es decir, SCT otal = SCBloques + SCT T O + SCEE


Esta descomposicin lleva a la Tabla de anlisis de varianza, Tabla 4,1 la cual sirve de
apoyo para probar las hiptesis 1 y 2 citadas anteriormente.

Cuadro 4.1: ANAVA para un DBCA


F.V.
Bloques
TTO
EE
Total

gl
r1
t1
(r 1) (t 1)
n1

SC
SCBloques
SCT T O
SCEE
SCT otal

CM
SC
CMBloques = Bloques
r1
TTO
CMT T O = SCt1
SCEE
CMEE = (r1)(t1)

Fc
CMBloques
CMEE
CMT T O
CMEE

FT abla
F, (r1), (r1)(t1)
F, t1,(r1)(t1)

donde,
SCT otal =

r X
t
X

Yij2

i=1 j=1

SCT T O =

t
X

Yj2

j=1

Adems,
r P
t
P
Y =
Yij2 ,

n=

i=1 j=1

t
P

Y2
;
n

Y2
n

SCBloques =

r
X
i=1

Yi.2

Y2
n

SCEE = SCT otal SCBloques SCT T O .

r = tr, glBloques = r 1, glT T O = t 1 y

j=1

glEE = (r 1) (t 1) .
La implementacin de las pruebas de comparacin mltiple en este diseo se hace
en forma similar al de DCA, simplemente que ahora se utilizarn los glEE y el CMEE
obtenidos para el diseo en bloque, pero las expresiones para las pruebas son las mismas estudiadas en el DCA. Si algunos tratamientos se han repetido un numero de veces
mayor que otros, las repeticiones extras de estos tratamientos deben aparecer en forma
consistente en todos los bloques. Para efectuar las comparaciones multiples en este
caso, se adopta la expresin :
s 

S2
1
1
.
(4.4)
+
2
rj
rj 0
Ejemplo 4.1. Lozano et al (2004), estudiaron el comportamiento agronmico del cultivo del maz HS-36 para un programa de nutricin foliar complementario, bajo un
diseo en bloques completamente al azar con 4 repeticiones o bloques. Los tratamientos
que componen los programas de nutricin son los siguientes:
T 1: Testigo o control (nutricin edfica)
T 2: Nutricin edfica +aplicaciones de nutrientes foliares a los 12 das (1 lt/ha) y a
los 18 y 25 das 2 lt/ha, en cada aplicacin
T 3: Nutricin edfica +aplicaciones de nutrientes foliares a los 12 das (1 lt/ha) y a
los 18 y 25 das 2 lt/ha, en cada aplicacin

T 4: Nutricin edfica +aplicaciones de nutrientes foliares a los 12, 18 y 25 das en


dosis de 2lt/ha.en cada aplicacin
Para la variable longitud de la mazorca los datos recolectados se presentan en la tabla
??
Cuadro 4.2: Datos para Longitud
Bloque/T T O
T1
T2
1
1456, 58 1212, 81
2
1236, 75 1494, 88
3
1010, 53 1484, 1
4
1334, 64 1640, 54
Yi
5038, 5 5832, 32

de Mazorca de maz H5-36


T3
T4
Yj
1388, 62 1343, 46 5401, 46
1353, 49 1442, 87 5527, 99
1511, 39 1382, 97 5388, 99
2199, 12 1797, 86 6972, 16
6452, 62 5967, 16 23290, 6

Determine si existen diferencias entre los tratamientos aplicados.


Solucin:
Las hiptesis a probar son:
1. Para los tratamientos: Ho : 1 = 2 = 3 = 4 = contra H1 : .j 6= .j 0
0
para algn j 6= j ,
2. Para los Bloques: Ho : 1. = 2. = 3. = 4. contra H1 : i. 6= i0 para algn
0
i 6= i ,
asi,
Y2
23290, 62
=
= 33903276
n
16
4 X
4
X
Y2
2
=
Yij
n
i=1 j=1


= 1456, 582 + 1212, 82 + 1388, 622 + + 1797, 862 33903276
= 1062121, 5

FC =
SCT otal

SCBloques =

4
X
Y2
i.

i=1

SCT T O =

Y2
n

5038, 52 + 5832, 322 + 6452, 622 + 5967, 162


33903253 = 443412, 8
4
4
X
Yj2
i=1

Y2
n

5401, 462 + 5527, 992 + 5388, 992 + 6972, 162


33903253 = 258182, 5
4

SCEE = SCT otal SCBloques SCT T O = 1062121, 5 443412, 8 258182, 5 = 360526, 1


resultando asi la tabla de anlisis de varianza, Tabla 4,3. Resultados en R.
Cuadro 4.3: ANAVA para longitud de mazorca
F.V.
gl
SC
CM
Fc
F5 %
NS
Bloques 3
443412, 8 147804, 2 3, 69
3, 86
NS
TTO
3
258182, 5
86060, 8 2, 15
3, 86
EE
9
360526, 1
40058, 4
Total
15 1062121, 5

>bloques = read.csv2("Long.csv")
>attach(bloques)
>Bloques=as.factor(Bloque)
>summary(aov(Longitud Bloques+Tratamiento))
Df
Sum Sq Mean Sq F value Pr(>F)
Bloques
3
443413
147804 3.690
0.0557 .
Tratamiento 3
258183
86061 2.148
0.1641
Residuals
9
360526
40058
-Signif. codes:
0 0.001 0.01 0.05 0.1 1
No se encuentran diferencias significativas entre tratamientos como tampoco entre bloques, es decir para una prxima ocasin por esta variable no es necesario bloquear. An
asi se puede utilizar la prueba de Bonferroni para corroborar la hiptesis
H0 : .j = .j , , para j 6= j

en este caso
p=6 comparaciones, es
p el valor crtico para p
t( , glEE ) 2CMEE /r = t( 0,05 , 9) 2 40058, 4/4 = 3, 28 141, 5 = 464, 2.
2p
26
Los promedios por tratamiento son dados en la tabla 4,4
Cuadro 4.4: Promedio por TTO para longitud de mazorca
T3
T4
T2
T1
1613,1 1491,7 1458,0 1259,6

Asi se tienen las diferencias entre promedios, Tabla 4,5


Esta prueba reafirma que no existen aun pequeas diferencias entre los promedios de
los tratamientos aplicados.

Cuadro 4.5: Comparacin de medias


para longitud de mazorca


Comparaci
on Y .j Y .j 0 Y .j Y .j 0
Conclusi
on
T4 contra T1
33, 7
33, 7
No rechazar H0
T4 contra T2
232, 1
232, 1
No rechazar H0
T4 contra T3
121, 3
121, 3
No rechazar H0
T3 contra T1
353, 5
353, 5
No rechazar H0
T3 contra T2
155, 0
155, 0
No rechazar H0
T2 contra T1
198, 4
198, 4
No rechazar H0
T3
T4
T2
T1
1613,1a 1491,7a 1458,0a 1259,6a

>tapply(Longitud,Tratamiento,mean)
T1
T2
T3
T4
1259.625 1458.082 1613.155 1491.790

4.2.2.

Estimacin de Valores Perdidos en un Diseo en Bloques


Completos al Azar

Cuando se lleva a cabo un experimento bajo un diseo en bloques completos al azar


es posible que una o varias unidades experimentales se pierdan debido a cuestiones de
descuido o por cuestiones ajenas. Esto trae serias consecuencias al momento de llevar
a cabo el anlisis de la informacin, puesto que el modelo pierde ortogonalidad. Una
solucin a este problema es estimar la(s) unidad(es) perdida(s) y llevar posteriormente
el ANAVA como comnmente se realiza, disminuyendo los grados de libertad del error
experimental en tantos grados de libertad como unidades experimentales se hayan estimado. Otra solucin es llevar a cabo el anlisis de la informacin mediante el mtodo
de la covariable, apoyandose en los modelos de regresin. Por el momento se explicar
detalladamente el primer mtodo.
1. Estimacin de una Unidad Perdida.
Sea Yij la observacin perdida en el i-simo bloque del j-simo tratamiento. Sea
Y0i. el total del bloque donde se pierde la observacin y Y.j0 el total del tratamiento donde falta dicha observacin y Y..0 el gran total con la observacin perdida.
Entonces usando el mtodo de los mnimos cuadrados se encuentra que el valor
estimado de Yij que minimiza la suma de cuadrado de los errores es:
Ybij =

rYi0 + tYj0 Y0
.
(r 1) (t 1)

(4.5)

Ejemplo 4.2. Para un experimento agrcola se tiene la informacin de la Tabla


4,6 para altura de planta en un diseo en bloques al azar, la unidad del tratamiento
3 en el segundo bloque se perdi por cuestiones ajenas al experimento.

Cuadro 4.6: Datos para altura


Bloque/T T O
1
I
164
II
158
III
137

de plantas y un dato perdido


2
3
4
5
150 145 152 141
162

118 137
160 133 130 141

Entonces, para estimar Y23 se tiene: Y02 = 158 + 162 + 118 + 137 = 575,
Y30 = 145 + 133 = 278 y Y = 164 + 150 + + 141 = 2028
entonces,

3 575 + 5 278 2028


Yb230 =
= 135, 875
(3 1) (5 1)
quedando el ANAVA presentado en la Tabla 4,7. Los grados de libertad del cuaCuadro 4.7: Datos completos con unidad perdida estimada
Bloque/T T O
1
2
3
4
5
I
164 150
145
152 141
II
158 162 135,875 118 137
III
137 160
133
130 141

drado medio del error para este experimento o son 8, pero como se estim una
observacin se reducen en uno, es decir que slo quedan 7 grados de libertad para
estimar el error experimental.
2. Estimacin para Ms de Una Unidad Perdida.
Cuando se pierde ms de una observacin en el experimento, el procedimiento
para completar la informacin se ilustrar con el siguiente ejemplo: Supongase
que en la informacin anterior se perdieron tres observaciones, Y11 , Y23 y Y35 , tal
y como se ilustra en la Tabla 4,8

Cuadro 4.8: Ms de una unidad perdida


Bloque/TTO
1
2
3
4
5
I

150 145 152 141


II
158 162

118 137
III
137 160 133 130

Inicialmente se estimar la observacin Y11 , as que para las otras dos observaciones
perdidas se tomar el promedio de las dos unidades que no se perdieron, resultando la
Tabla 4,9

Cuadro 4.9: Estimando unidades perdidas


Bloque/T T O
1
2
3
4
5
I

150 145 152 141


II
158 162 139 118 137
III
137 160 133 130 139

ahora se estima Y11 como cuando se pierde una sola observacin, as


Y10 = 588, Y10 = 295 y Y = 2001 llegndose a
3 588 + 5 295 2001
= 154, 75.
Yb11 =
(3 1) (5 1)
Este valor estimado se reemplaza en la Tabla 4,9 y se estima ahora una cualquiera de
las dos restantes, digamos Y23 , entonces se tiene:
Cuadro 4.10: Estimando segunda unidad
Bloque/T T O
1
2
3
4
I
154,75 150 145 152
II
158
162

118
III
137
160 133 130

perdida
5
141
137
139

ahora, Y20 = 575, Y30 = 278 y Y = 2016, 75 de donde


3 575 + 5 278 2016, 75
Yb =
= 137, 281
(3 1) (5 1)
con lo que se llega a la Tabla 4,11,
Cuadro 4.11: Dados con segunda unidad perdida estimada
Bloque/T T O
1
2
3
4
5
I
154,75 150
145
152 141
II
158
162 137,281 118 137
III
137
160
133
130

Finalmente se obtiene el ltimo valor perdido Yb35 , entonces siguiendo los mismos pasos
de los anteriores valores perdidos, se tiene: Y30 = 560, Y50 = 278 y Y = 2015, 031
obtenindose
3 560 + 5 278 2015, 031
= 131, 871.
Yb35 =
(3 1) (5 1)
Llegndose as a la Tabla completa 4,12

Cuadro 4.12: Dados con valores estimados


Bloque/T T O
1
2
3
4
5
I
154,75 150
145
152
141
II
158
162 137,281 118
137
III
137
160
133
130 131,871

Sin embargo, este proceso no termina aqu, ahora nuevamente se estima Y11 , con este
valor nuevamente se estima Y23 y posteriormente Y35 , asi se sigue el proceso iterativamente hasta cuando haya convergencia en los valores, es decir cuando estos sean muy
parecidos entre una iteracin y otra.
Como se han estimado tres observaciones, entonces los grados de libertad del error se
disminuyen en 3, es decir que ahora slo se tienen 5 grados de libertad para estimar el
error experimental.

4.2.3.

Pruebas de Validacin de los Supuestos del Modelo

Para llevar a cabo las pruebas de validacin correspondientes se deben calcular inicialmente los errores, los cuales vienen dados por la expresin
eij = Yij Y i Y j + Y ,

(4.6)

con los cuales se valida la hiptesis de normalidad de Shapiro Wilk, o cualquier otra,
mientras que para la prueba de homogeneidad de varianzas el procedimiento es el mismo
dado por el mtodo de Hartley o el de Bartlett, aunque en este diseo por lo general se
aplica la prueba de Hartley por ser ms sencilla de aplicar aunque es ms conservadora.

Vous aimerez peut-être aussi