Vous êtes sur la page 1sur 24

Tcnicas para interpretar

resultados de Anlisis de Varianza:


con Ejemplos usando SAS:
Por
Prof. S. P. Sinha
Indice del Contenido:
Objetivos de esta
Pgina:
(1): Diseo
Completamente
aleatorio
(2): Diseo en bloques
aleatorios
(3): Diseo Cuadrado
Latino
(4): Experimentos
Factoriales
(5): Diseo de Parcelas
Divididas
(6): Diseo de Parcelas
Sub Divididas
Esta seccin hace uso de programas fuentes, salidas SAS
y esquemas de Anlisis de varianza, que Ud. puede consultar
por los enlaces que se presentan a continuacin:
Programa Fuente y Salida SAS
Andeva
Esquemtico
IMPORTANT NOTICE ABOUT THE COPYRIGHTS.

Anlisis
Grfico: 1 2 3

Objetivos de esta Pgina:


Esta pgina tiene los siguientes objetivos:
(1): Ilustrar mediante ejemplos como se debe hacer la
interpretacin de resultados que se obtienen por el procesamiento
de datos experimentales por SAS.
(2): Plantear y realizar diferentes aspectos de discusin en el
anlisis de datos experimentales tales como supuestos de ANDEVA y
modelo lineal del diseo usado, alternativas que existen para
analizar datos, complicaciones que pueden surgir para el anlisis
posterior de promedios cuando existen interacciones
significativas y otros tipos de problemas variados que pueden
presentarse debido a las caractersticas
propias de datos y el diseo usado.
(3) Capacitar al lector para extraer conclusiones que sean vlidas
estadsticamente.

Se asumir que el lector de esta pgina cumple con los siguientes


requisitos:
(i): ha asistido en alguna ocasin un curso bsico de diseo de
experimento.
(ii): tiene el conocimiento del lenguaje SAS por lo menos al nivel
prctico.

IMPORTANT NOTICE ABOUT THE COPYRIGHTS.


The author of this Web Page makes the following declaration as regards to the examples used in
this work:
I have used in this publication, examples which, come from different books which, I have used
in the past for teaching courses in Experimental Designs to both graduate and undergraduate
students. In each the of examples used here, a reference to the names of the authors is given, who
are the owners of corresponding copyrights. If no such reference appears in the example, then
this is because the example has been artificially constructed. En consequence, the comments
and explanations which I have given in this publication, should be considered as a bibliographic
review, which I have written in order to express my own views about the statistical methods
which can be used to analyze data in these examples.

Diseo Completamente aleatorio


(1.1): Caso fijo y balanceado: Tratamientos
cualitativos
(1.2): Caso fijo y balanceado: Tratamientos
cuantitativos

(1.1): Caso fijo y balanceado: Tratamientos


cualitativos

Este ejemplo proviene del libro de Montgomery, D. (2da. edicin: ingls),


Pgina 63.
Se trata de un modelo fijo balanceado. Hay 5 tratamientos que representan
diferentes porcentaje de algodn, que son :
15, 20, 25, 30 y 35 respectivamente. Se usaron 5 replicaciones. La variable
respuesta es la resistencia de fibra sinttica
(lb/in cuadrado.) . Ejemplo 1 no toma en cuenta la informacin que los 5
tratamientos se pueden considerar cuantitativos
caracterizados as por sus valores respectivos de porcentaje de algodn. Los
datos de este experimento se vuelven a
analizar en el ejemplo 1.2 considerando los tratamientos como cuantitativos.
Tabla 1.1.1: Datos experimentales:
Los datos que corresponden a un mismo tratamiento se tabulan en una
misma fila.
Tratamiento 1:
7 7 15 11 9
Tratamiento 2: 12 17 12 18 18
Tratamiento 3: 14 18 18 19 19

Tratamiento 4:
Tratamiento 5:

19 25 22 19 23
7 10 11 15 11
Salida SAS

Tabla 1.1.2: Tabla de ANDEVA: Diseo Completamente aleatorio


General Linear Models Procedure
Dependent Variable: Y
Source
Value
Pr > F
Model
14.76
0.0001
Error
Corrected Total
MSE
2.8390
Source
Value
Pr > F
Tratamientos
0.0001

DF

Sum of
Squares

Mean
Square

475.76000

118.94000

20
24

161.20000
636.96000

8.06000

R-Square
Y Mean

C.V.

0.746923
15.040
DF

18.87642

Type I SS
475.76000

Root

Mean Square
118.94000

F
14.76

Fijaremos el nivel de significacin = 0,05 para sacar las conclusiones


estadsticas.
El Valor de F para tratamientos es significativo al nivel de
significacin = 0,05 ya que Pr >F (Probabilidad mayor que el F
calculado) es igual = 0,0001, siendo este ltimo valor menor que 0,05
, el cual es el valor del nivel de significacin que estamos
considerando. Tambin el valor de F para tratamientos es significativo
para = 0,01 por la misma razn, o sea Pr >F = 0,0001 < 0,01 .
(obsrvese que si F calculado es significativo para = 0,01, entonces
esto implica que el F calculado tambin es significativo para = 0,05 .
Sin embargo la afirmacin inversa no necesariamente es cierta.)
Podemos decir de esta manera que el valor de F para tratamientos es
altamente significativo.
Modelo Lineal:
Yij = iij ; i = 1,...,k ; j = 1,..,n ij ~ NID(0, )
iel efecto del tratamiento i - simo; ij = error aleatorio para j - sima
observacin en el tratamiento i - simo.
En este ejemplo tenemos k = 5 y n = 5 ;
Hiptesis nula y alternante:
0 :i ; para todo i = 1,...,k; A :i ; para algn i = 1,...,k;

Otra forma equivalente de enunciar las mismas hiptesis es:


0 : 1 = 2 = ... = k ; en que i es el promedio poblacional del
tratamiento i - simo, i = 1,...,k ;
HA : No todos los promedios poblacionales de tratamientos son iguales.
Ya que el valor de F para tratamientos es significativo para = 0,05,
obtenemos la conclusin estadstica que los promedios poblacionales de
los 5 tratamientos son diferentes. Debemos realizar anlisis posterior
por el mtodo del Rango mltiple de Duncan para determinar cual es el
mejor tratamiento.
Tabla 1.1.3:
de Duncan:

rate,

Comparacin de promedios de tratamientos por el mtodo


General Linear Models Procedure
Duncan's Multiple Range Test for variable: Y
NOTE: This test controls the type I comparisonwise error
not the experimentwise error rate
Alpha= 0.05 df= 20 MSE= 8.06
Number of Means
2
3
4
5
Critical Range 3.745 3.931 4.050 4.132

Means with the same letter are not significantly different.


Duncan Grouping

Mean

21.600

30

B
B
B

17.600

25

15.400

20

C
C
C

10.800

35

9.800

15

Observamos que por la aplicacin del Mtodo de Duncan se forman 3


grupos de tratamientos. Los promedios poblacionales de tratamientos
dentro de los grupos entre ellos no son diferentes. El promedio
poblacional dentro de un grupo es diferente del promedio poblacional
del tratamiento de cualquier otro grupo.
El mejor tratamiento tiene 30 % del algodn.
Conclusiones:
(1): El Valor de F para tratamientos es significativo al nivel de
significacin a = 0,05 y en consecuencia los promedios poblacionales
de los 5 tratamientos son diferentes.
(2): La aplicacin del mtodo del Rango mltiple de Duncan revela que
el mejor tratamiento tiene 30 % del algodn.
Observacin:
Los Tratamientos en este experimento son cuantitativos, pero en este

ejemplo fueron analizados como cualitativos. Los datos de este ejemplo


se volvern a analizar en el Ejemplo 1.2, tomando en cuenta la
naturaleza cuantitativa de los tratamientos.

(2): Caso fijo y balanceado: Tratamientos cuantitativos


(Este Ejemplo usa datos de la Tabla 1.1.1)
Tabla 1.2.1:
Prueba de significacin de los componentes del
polinomio ortogonal:
General Linear Models Procedure
Dependent Variable: Y
Contrast
DF
Contrast SS Mean Square F
Value
Pr > F
LINEAL
1
33.62000
33.62000
4.17
0.0545
CUADRATICO
1
343.21429
343.21429
42.58
0.0001
CUBICO
1
64.98000
64.98000
8.06
0.0101
CUARTICO
1
33.94571
33.94571
4.21
0.0535

Ya que los tratamientos son caracterizados por diferentes porcentajes


del algodn (15, 20, 25, 30 y 35 ) y se encuentran igualmente
espaciados, podemos usar el mtodo de polinomios ortogonales como
un mtodo del anlisis posterior.Como un primer paso calculamos por
SAS la significacin de los diferentes componentes de polinomios
ortogonales (ver la Tabla 1.2.1). El polinomio ortogonal es de grado
tres, ya que el componente cuartico no es significativo (estamos
usando = 0,05) y adems el componente cbico si es significativo. A
continuacin se desarrolla el 2do. paso que consiste en hallar la
ecuacin polinmica ortogonal estimada de tercer grado.
Tabla 1.2.2: AJUSTE DE UNA REGRESION
CUBICA DE Y SOBRE X:
General Linear Models Procedure
Dependent Variable: Y
Source
Value
Pr > F
Model
15.85
0.0001
Error
Corrected Total
MSE
3.0484
Source
Value

DF

Sum of
Squares

Mean
Square

441.81429

147.27143

21
24

195.14571
636.96000

9.29265

R-Square
Y Mean
0.693630
15.040

C.V.

DF
Pr > F

Root

20.26852

Type I SS

Mean Square

X
3.62
X*X
36.93
X*X*X
6.99

0.0710
0.0001

33.62000

33.62000

343.21429

343.21429

64.98000

64.98000

0.0152
T for H0:

Error of
Parameter
Estimate
INTERCEPT
39.75743623
X
5.19660897
X*X
0.21604552
X*X*X
0.00287405

Pr > |T|

Estimate

Parameter=0

62.61142857

1.57

0.1302

-9.01142857

-1.73

0.0976

0.48142857

2.23

0.0369

-0.00760000

-2.64

0.0152

Std

En este 2do. paso , se vuelve a usar el Proc. GLM pero esta vez
considerando ambas variables y e x, en que y es la variable respuesta,
siendo x el porcentaje del algodn. En la instruccin Model del Proc
GLM, se declara un modelo del tercer grado y se obtiene la tabla del
Andeva y la estimacin de los parmetros.
No se debe tomar en cuenta la significacin de los componentes en la
tabla de Andeva 1.2.2, porque este paso ya se hizo en la tabla 1.2.1. El
clculo de significacin en la tabla 1.2.2. usa el error de la tabla 1.1.2
que tiene 20 g.l. En cambio la tabla 1.2.2 usa error con 21 g.l. Este
grado de libertad adicional es por el componente cuartico que
automticamente el Proc GLM suma al trmino del error en la tabla
1.2.2 ya que al no ser significativo en la tabla 1.2.1, se excluy este
trmino en la declaracin del modelo del Proc GLM para generar la
tabla 1.2.2 .
La informacin mas
importante que se consigue en
la tabla 1.2.2 es la funcin
polinmica estimada de tercer
grado, la cual es:
Y(estimada) =
62.61142857
-9.01142857*X +
0.48142857*X*X
-0.0076*X*X*X
en que Y es la resistencia y X
es el porcentaje del algodn.
Se puede maximizar esta
funcin y para hacer esto se
calcula la derivada de
Y(estimada ) con respecto X.
Luego se iguala la expresin
de la derivada a cero y se
obtiene una ecuacin

cuadrtica cuya solucin


produce el valor del X para el
cual se obtiene mximo de
Y(estimada).
Se podr verificar que
el mximo de la
resistencia se
produce para X =
28.23 y el valor del
mximo es 20.90

Conclusin:
La relacin ente la resistencia de la fibra sinttica y el porcentaje del
algodn se puede representar por la siguiente funcin polinmica
estimado de grado tres:
Y(estimada) = 62.61142857 -9.01142857*X + 0.48142857*X*X
-0.0076*X*X*X

El valor de la resistencia de la fibra sinttica crece a medida que


aumenta el valor del porcentaje del algodn, alcanzando su valor
mximo de 20.90 cuando el porcentaje del algodn asume el valor igual
a 28.23
Diseo Bloques aleatorios:
(2.1): Diseo Bloques aleatorios: (balanceado
con efectos fijos)
(2.2): Diseo Bloques aleatorios: (no balanceado
con efectos fijos)

(2.1): Diseo Bloques aleatorios:

(balanceado con efectos fijos)

Fuente de datos: Li, J.C.R. Captulo 14


Hay 6 tratamientos de Variedades y 5 bloques. Este experimento se hizo
en el campo experimental.
Tabulacin de datos: por filas como Variedades y por columnas como
bloques;
La variable repuesta es el rendimiento.
Datos:
32.6
38.4
65.1
54.2
83.7
77.1

41.0
17.9
23.8
19.6
39.4
37.1
42.8
21.8
59.9
41.9
36.1
21.1
46.4
43.6
35.1
43.4
37.9
69.3
63.8
50.7
70.8
57.7
51.1
46.5
Tabla 2.1.1: Anlisis de varianza para

Diseo B. A.

General Linear Models Procedure


Dependent Variable: Y
Sum of

Mean

Source
Value
Pr > F
Model
7.14
0.0001
Error
Corrected Total
MSE
10.083

DF

Squares

Square

6529.2027

725.4670

20
29

2033.4093
8562.6120

101.6705

R-Square
Y Mean
0.762525
45.660

C.V.

Root

22.08317

Source
DF
Type I SS Mean Square
Value
Pr > F
VARIEDADES
5
4541.6840
908.3368
8.93
0.0001
BLOQUES
4
1987.5187
496.8797
4.89
0.0065
Comentarios:
El Modelo Lineal del diseo usado en este experimento es:

Yij = ij + ij ; i = 1,...,k ; j = 1,..,n ; .= 0 ; . = 0 ;


en que, iel efecto del tratamiento i - simojel efecto del
bloque j - simo
ij = error aleatorio para la observacin en el j - simo bloque y el
tratamiento i - simo. ij ~ NID(0, )
para i = 1,...,k ; j = 1,..,n ;)
Hiptesis nula y alternante:

H0: i; para todo i = 1,...,k; HA: i; para algn i ;


H0: j; para todo j = 1,...,n; HA: j; para algn j ;
Nota: Las hiptesis antes especificadas tambin se pueden enunciar en trminos de
promedios de poblaciones de varidades y bloques respectivamente en una forma
similar tal como se hizo en el ejemplo 1.1 .
El valor del F calculado para variedades es altamente significativo. Por lo
tanto ser necesario usar un mtodo del anlisis posterior para determinar
cual es la mejor variedad.
El valor del F calculado para bloques es altamente significativo y esto indica
que se justific el uso del diseo bloques aleatorios ya que una parte de la
variabilidad total que se particiona en el anlisis de varianza como bloques
es significativa. (Si F para bloques en un diseo bloques aleatorios usado en
el campo experimental no es significativo, entonces diramos que los bloques
no fueron construidos y ubicados con una orientacin correcta. La
orientacin correcta consiste en ubicar los bloques en forma
perpendicular a la direccin en que vara la fertilidad del suelo. El Contraste
de hiptesis acerca de los bloques an cuando no es de inters directo para
el Investigador, se considera como un paso importante para confirmacin de
criterios usado en el planeamiento del experimento.)
Tabla 2.1.2: Anlisis posterior por el Mtodo de
Duncan:

General Linear Models Procedure


Duncan's Multiple Range Test for variable: Y
NOTE: This test controls the type I comparisonwise error rate,
not the experimentwise error rate

Alpha= 0.05 df= 20 MSE= 101.6705


Number of Means
2
3
4
5
6
Critical Range 13.30 13.96 14.38 14.68 14.89
Means with the same letter are not significantly different.
Duncan Grouping

Mean

VARIEDAD

A
A
A

61.080

60.640

B
B
B
B
B

44.820

44.540

35.900

26.980

C
C
C
Comentarios:

El uso del Rango mltiple de Duncan produce tres conjunto disjuntos


de variedades. El grupo con el mejor rendimiento consta de dos
variedades que son las variedades nmeros 5 y 6. Cualquiera de estas
dos variedades se pueden usar y entre ellas no existe diferencia
significativa.
(2.2): Diseo Bloques aleatorios: (no balanceado con
efectos fijos)

Hay 3 tratamientos de Variedades y 5 bloques.


Existe un dato faltante que se encuentra en el primer tratamiento
y primer bloque.
Tabulacin de datos: por filas como Tratamientos y por
columnas como bloques:
.
887 897 850 975
857 1189 918 968 909
917 1072 975 930 954
Tabla 2.2.1: Diseo B. A. con un dato faltante
General Linear Models Procedure
Dependent Variable: Y
Source
Value
Pr > F
Model
1.79
0.2316
Error
Corrected Total
MSE
76.264

DF

Sum of
Squares

Mean
Square

62501.989

10416.998

7
13

40713.725
103215.714

5816.246

R-Square
Y Mean
0.605547
949.86

C.V.
8.029030

Root

Source
Value
BLOCK
1.82
TRAT
1.74
Source
Value
BLOCK
2.14
TRAT
1.74

Pr > F
0.2303

DF

Type I SS

Mean Square

42255.048

10563.762

20246.942

10123.471

DF

Type III SS

Mean Square

49805.025

12451.256

20246.942

10123.471

0.2435
Pr > F
0.1785
0.2435

Comentarios:
Este ejemplo tiene el propsito de ilustrar el procedimiento a usar y los
aspectos computacionales cuando existe(n) dato(s) faltante(s) en un
diseo B. A. con efectos fijos.
Generalmente un diseo B. A. se planifica como un diseo balanceado
pero al perder uno o ms datos experimentales, el diseo llega a ser un
diseo no balanceado. Pueden surgir muchas complicaciones en el
anlisis estadstico y prdidas de propiedades ptimas del diseo por el
no balanceo, por ejemplo: El error estndar de promedios de
tratamientos ya no es un valor constante sino varia segn si se trata del
promedio de un tratamiento que tiene el problema de dato(s) faltante(s)
o no. Se pierde la propiedad de ortogonalidad del diseo ya que no se
cumplir la propiedad que S.C. Total = S.C. Bloques + S.C.
Tratamientos + S.C. Error experimental. En general se reduce la
potencia de la dcima del estadstico F , lo cual pudiera hacer difcil
detectar las diferencias significativas.
En cuanto al procedimiento computacional a usar, se hace necesario
usar Sumas de cuadrados, cuadrados medios y F del tipo III (Type III )
en la salida del SAS, para ambas fuentes de variacin que seran
bloques y tratamientos. En este ejemplo el valor de F para bloques es
2,14 y el valor de F para tratamientos es 1,74
Diseo Cuadrado Latino
(3.1): Cuadrado Latino:
4 Filas: 4 Columnas: 4 Tratamientos(Variedades de Trigo) ;
y = Rendimiento por parcela en Kg. ;
Ejemplo: Steel, R.G.D y Torrie, J.H.: Capitulo 8 ;
DATOS:
C 10.5 D
7.7 B 12.0 A 13.2
B 11.1 A 12.0 C 10.3 D
7.5
D
5.8 C 12.2 A 11.2 B 13.7
A 11.6 B 12.3 D
5.9 C 10.2
General Linear Models Procedure
Dependent Variable: Y

Source
Value
Pr > F
Model
21.49
0.0007
Error
Corrected Total
MSE
0.6733
Source
Value
Pr > F
FILAS
1.44
0.3219
COLUMNAS
5.00
0.0452
TRATAMIENTOS
58.03
0.0001

Sum of

Mean

DF

Squares

Square

87.680000

9.742222

6
15

2.720000
90.400000

0.453333

R-Square
Y Mean
0.969912
10.450

C.V.

Root

6.443065

DF

Type I SS

Mean Square

1.955000

0.651667

6.800000

2.266667

78.925000

26.308333

Comentarios:

= 0,05, observamos que el


F calculado para Filas no es significativo mientras el valor de F
calculado para columnas es significativo. Esto podra indicar que
ha habido una falla en
el planeamiento del diseo y/o la construccin de las columnas.
Surgen dudas sobre la justificacin del diseo utilizado, ya que
se pudo utilizar el diseo bloques aleatorios para controlar la
variabilidad por columnas.
Considerando el nivel de significacin

F para tratamientos es altamente significativo. Por lo tanto, se


debe realizar Anlisis del Rango Mltiple de Duncan para
determinar el mejor tratamiento. . Se omite este cmputo aqu,
ya que sera similar como se ha hecho esto en ejemplos
anteriores.
(4): Experimentos Factoriales
(4.1): Experimento Factorial 2x4 en el Diseo B. A.
(4.1): Experimento Factorial 2x4 en el Diseo B. A.
*
Inference
*
;
*
K ;
*
*
*

Datos: Li, J C. R., Capitulo 18: Introduction to Statistical


Factores:

Fecha de siembra con 2 niveles: Temprana , Tarda

Factor: Abono con 4 niveles: Abono estndar, Areo, Na, y,


Nmero de bloques = 4 ;
Variable respuesta: rendimiento por parcela de soya ;
Tabulacin de datos:

*
Bloques

;
* Fecha de siembra Abono
1
2
3
4
;
*
Temprana
Abono estndar ;
*
Temprana
Areo
;
*
Temprana
Na
;
*
Temprana
K
;
* .... Despus siguen 4 lineas siguientes para fecha de
siembra tarda ....;
Datos:
28.6 36.8
29.1 29.2
28.4 27.4
29.2 28.2
30.3 32.3
32.7 30.8

32.7
30.6
26.0
27.7
31.6
31.0

32.6
29.1
29.3
32.0
30.9
33.8

30.3
32.7

33.0
31.8

33.9
29.4

32.7
31.7

General Linear Models Procedure


Dependent Variable: Y
Source
Value
Pr > F
Model
2.97
0.0169
Error
Corrected Total
MSE
1.7787
Source
Value
Pr > F
BLOQUE
0.77
0.5238
FECHA
10.11
0.0045
ABONO
1.73
0.1919
FECHA*ABONO
4.05
0.0204

DF

Sum of
Squares

Mean
Square

10

94.100000

9.410000

21
31

66.438750
160.538750

3.163750

R-Square
Y Mean
0.586151
30.806

C.V.

Root

5.773807

DF

Type I SS

Mean Square

7.306250

2.435417

32.000000

32.000000

16.401250

5.467083

38.392500

12.797500

Comentarios:
Usaremos el nivel de significacin igual a 0,05 . Observamos que el
valor de F para bloques no es significativo. Esto indica que hubo una
falla en el planeamiento del experimento y/o en la construccin o
orientacin de los bloques en el campo experimental.

La interaccin Fecha x Abono es significativa y en consecuencia no se


puede realizar el anlisis posterior entre los promedios de niveles de
ninguno de los dos factores. El Anlisis grfico de esta interaccin
revela que las lneas de promedios correspondientes a las fechas de
siembra muestran una interseccin indicando que existe una interaccin
por el cambio en la direccin de la respuesta. Ya que el factor Abono no
es significativo, no necesitamos hacer ningn anlisis posterior entre
los promedios de 4 niveles del factor abono. La interaccin Fecha x
Abono significativa, implica que la que ser la mejor fecha depender
del nivel del factor Abono con que esta se combina. Pero si se puede
aplicar cualquier mtodo del anlisis posterior, (por ejemplo Duncan)
sobre los 8 promedios de tratamientos formados por todas las
combinaciones posibles entre los 2 niveles del factor Fecha y los 4
niveles del Factor abono.
Tomando en cuenta la informacin que se presenta en el cuadro ms
arriba, podemos hacer diferentes tipos de comparaciones:
Comparacin entre promedios de diferentes tipos de Abono para la
siembra Temprana.
Comparacin entre promedios de diferentes tipos de Abono para la
siembra Tarda.
Comparacin entre promedios de los dos tipos de fechas de siembra
separadamente para cada tipo de abono.
(No se requiere a volver a hacer otro cmputo del mtodo de Duncan,
sino usar los resultados del Anlisis de Duncan ya disponible)
El tratamiento que tiene el rendimiento ms alto es cuando se combina
el Abono estndar con una siembra temprana.

Diseos de Parcelas Divididas:

Los datos utilizados en este ejemplo proviene del libro de Steel, R.G.D.
y Torrie, J.H. 4 lotes de semillas de avena fueron usados como
tratamientos principales. Hay 4 sub tratamientos que consisten en un
testigo mas tres productos qumicos que sirven para controlar una
enfermedad de plantas. Se usaron 4 bloques.
Este diseo asigna la mxima precisin de estimacin al factor
productos qumicos (Sub Tratamientos) y la mnima precisin a al
factor Lotes de semillas(Tratamiento principal).
Tabulacin de datos:
Los datos se muestran en el programa de SAS. Las primeras 4 filas de
datos corresponden a los datos de los bloques 1 - 4, para el primer nivel
del Tratamiento principal. Dentro de cada fila hay 4 datos
correspondientes a los 4 niveles de sub tratamientos.
Las prximas 4 filas de datos corresponden a los datos de los bloques 1
- 4, para el segundo nivel del Tratamiento principal. Dentro de cada
fila hay 4 datos correspondientes a los 4 niveles de sub tratamientos.
etc. y as sucesivamente hasta la tabulacin de las ltimas 4 filas
correspondientes al cuarto y ltimo nivel del Tratamiento principal.
Programa fuente SAS:
data pdivid ;
do tratprin = 1 to 4;
do bloques = 1 to 4;
do subtrat = 1 to 4;
input Y @;
output;
end;
input;
end;
end;
cards;
42.9 53.8 49.5 44.4
41.6 58.5 53.8 41.8
28.9 43.9 40.7 28.3
30.8 46.3 39.4 34.7
53.3 57.6 59.8 64.1
69.6 69.6 65.8 57.4
45.4 42.4 41.4 44.1
35.1 51.9 45.4 51.6
62.3 63.4 64.5 63.6
58.5 50.4 46.1 56.1
44.6 45.0 62.6 52.7
50.3 46.7 50.3 51.8
75.4 70.3 68.8 71.6

65.6
54.0
52.7
;

67.3
57.6
58.5

65.3
45.6
51.0

69.4
56.6
47.4

proc print; run;


proc GLM;
class Bloques Tratprin Subtrat;
model Y = Bloques Tratprin Bloques*Tratprin Subtrat
Tratprin*Subtrat /ss1 ;
test h= Bloques Tratprin e=Tratprin*Bloques;
means Tratprin subtrat Tratprin*subtrat;
title 'Diseo Parcela Dividida';
run;
Salida SAS:
Nota: La salida SAS, tal como imprime el computador no se puede
usar, sino ser necesario reordenar la informacin obtenida en una
tabla de Andeva definitiva. Esta tabla que se obtenga, se llamar como
tabla de andeva del diseo de parcelas divididas, sin usar el calificativo
"definitiva". Se usa este calificativo "definitiva" simplemente para indicar
que hay un trabajo que hacer y una vez que este trabajo esta hecho, se
obtendr la tabla de andeva, la que se va a usar. Esta tabla se muestra
despus de la salida SAS, la cual lleva algunas indicaciones en color rojo
para preparar la tabla de Andeva definitiva:
Diseo Parcela Dividida
General Linear Models Procedure
Dependent Variable: Y
DF

Sum of
Squares

Mean
Square

27

7066.1919

261.7108

36

731.2025

20.3112

63

7797.3944

Source
Value
Pr > F
Model
12.89
0.0001
Error
Nombrarla como Error(b)
Corrected Total
R-Square
Y Mean
4.5068

0.906225
52.809

C.V.

Root MSE

8.534077

Source
DF
Type I SS
> F
BLOQUES
3
2842.8731
0.0001
No usar esta Fila.
TRATPRIN
3
2848.0219
0.0001
No usar esta Fila.
BLOQUES*TRATPRIN
9
618.2944
0.0042
Nombrarla como Error(a)
SUBTRAT
3
170.5369
0.0539

Mean Square

F Value

947.6244

46.66

949.3406

46.74

68.6994

3.38

56.8456

2.80

Pr

TRATPRIN*SUBTRAT
0.0059

586.4656

65.1628

3.21

Tests of Hypotheses using the Type I MS for


BLOQUES*TRATPRIN as an error term
Source
BLOQUES
0.0010
TRATPRIN
0.0010

DF

Type I SS

Mean Square

F Value

3
2842.8731
Usar esta Fila.
3
2848.0219
Usar esta Fila.

947.6244

13.79

949.3406

13.82

A continuacin se muestra la Tabla de Andeva definitiva.


Anlisis de Varianza
Fuentes de Variacin
G.L.
S.C.
C.M.
Pr > F
BLOQUES
3
2842.8731
947.6244
0.0010
TRATPRIN
3
2848.0219
949.3406
0.0010
Error(a)
9
618.2944
68.6994
SUBTRAT
3
170.5369
56.8456
0.0539
TRATPRIN*SUBTRAT
9
586.4656
65.1628
0.0059
Error(b)
36
731.2025
20.3112
Corrected Total
63
7797.3944

Pr > F

F
13.79
13.82
2.80
3.21

Comentarios:

= 0,05.
F para bloques es significativo y esto indica que hubo justificacin en
usar bloques en el diseo para controlar la variabilidad.
Tratprin es la abreviatura para Tratamientos principales y tiene el valor
de F significativo, lo cual implica que hay diferencias significativas
entre los promedios poblacionales de los 4 lotes de semillas de avena.
La fuente de variacin Sub tratamientos no tiene el valor de F
significativo y esto seala que no existen diferencias significativas
entre los promedios poblacionales de los 4 productos qumicos.
Consideraremos el nivel de significacin

La interaccin tratamientos principal*subtratamientos es significativa


lo cual indica que el mejor lote de semilla de avena podra ser diferente
para los diferentes productos qumicos usados. Tambin observamos
que debido a la presencia de la interaccin significativa no podemos
aplicar el mtodo del anlisis posterior a los promedios de los 4 lotes de
semillas de avena sino que los mismos deben ser comparados
separadamente por cada uno de 4 productos qumicos y as tambin
podemos comparar las 16 combinaciones de tratamientos.

Anlisis Grfico:
En la grfica de la interaccin Tratamiento
Principal x Sub tratamiento, se observa la
presencia de una interaccin por el cambio en la
direccin de la respuesta, ya que las lneas,
correspondientes a los tratamientos principales,
muestran puntos de interseccin.
La lnea de promedios correspondiente al
Tratamiento principal nmero 4, siempre se
encuentra arriba de las otras tres lneas
restantes. Por lo tanto, el mejor
tratamiento principal, debera ser el
cuarto, sujeto a confirmacin del resultado
del Anlisis de Duncan
Anlisis de Duncan:
Ya que la interaccin Tratamiento Principal
x Sub Tratamiento es significativa, no
podemos realizar anlisis posterior sobre
los promedios de Tratamientos principales
y asimismo tampoco sobre los promedios
de Sub Tratamientos (adems este ltimo
es no significativo). Se puede hacer la
comparacin entre los 16 tratamientos
combinaciones por el Anlisis de Duncan y
el resultado de este procedimiento podr
ser usado para responder preguntas
inicialmente planteadas en el objetivo del
experimento.
Para realizar el cmputo del mtodo de
Duncan, es necesario obtener un
estimacin del error experimental, la cual
se puede hallar por el promedio ponderado
de los cuadrados medios de los dos errores
(a) y (b) en el diseo. En este ejemplo, esta
estimacin mancomunada tendr 45 g.l.
El Anlisis de Duncan revela que el mejor
tratamiento es la combinacin 42. Tambin
se ha formado otro grupo que contiene las
combinaciones de tratamientos: 14 y 11,
que tiene los promedios ms bajos para la
variable respuesta rendimiento.
Utilizando los resultados del del Anlisis de

Duncan, tambin se puede determinar: (No


se requiere a volver a hacer otro cmputo
del mtodo de Duncan, sino usar los
resultados del Anlisis de Duncan ya
disponible.)
(a): el mejor subtratamiento para cada
uno de los tratamientos principales
separadamente.
(b): el mejor Tratamiento Principal para
cada uno de los Subtratamientos
separadamente.

(6): Diseo de Parcelas Sub Divididas

Los datos utilizados en este ejemplo proviene del libro de Montgomery,


D. Se trata de una investigacin mdica para estudiar el tiempo de
absorcin de un cierto tipo de cpsula antibitica. En esta investigacin
se utilizaron 3 tcnicos como Tratamientos principales, 3 dosis como
Sub Tratamientos y 4 niveles de grosor de la pared de cpsula como
Sub Sub Tratamientos. El experimento se hizo en 4 bloques.
Este diseo asigna la mxima precisin de estimacin al factor grosor
(Sub Sub Tratamientos) , la mediana precisin al factor dosis (Sub
Tratamientos) y la mnima precisin al factor tcnico (Tratamiento
principal).
Tabulacin de datos:
El esquema de la tabulacin de datos se presenta a continuacin. Los
datos se muestran en el programa de SAS.
Tcnico
----------------------------------------------------1
2
3
----------------------------------------------------Bloques Dosis 1 2 3 1 2 3 1 2 3
----------------------------------------------------Grosor - - - - - - - 1
- - - - - - - 1
2
- - - - - - - 3
- - - - - - - 4
- - - - - - - - indica un dato. Cada fila tiene 9 datos. Este esquema se repite para
los 3 bloques restantes.
Programa fuente SAS:

title Parcelas sub divididas;


data psubdiv ;
do Bloques = 1 to 4;
do Grosor = 1 to 4;
do Tecnico = 1 to 3;
do dosis = 1 to 3 ;
input y @@;
output;
end;
end;
input;
end;
end;
cards;
95 71 108 96 70 108 95 70 100
104 82 115 99 84 100 102 81 106
101 85 117 95 83 105 105 84 113
108 85 116 97 85 109 107 87 115
95 78 110 100 72 104 92 69 101
106 84 109 101 79 102 100 76 104
103 86 116 99 80 108 101 80 109
109 84 110 112 86 109 108 86 113
96 70 107 94 66 100 90 73
98
105 81 106 100 84 101 97 75 100
106 88 112 104 87 109 100 82 104
113 90 117 121 90 117 110 91 112
90 68 109 98 68 106 98 72 101
100 84 112 102 81 103 102 78 105
102 85 115 100 85 110 105 80 110
114 88 118 118 85 116 110 95 120
;
proc print; run;
PROC GLM;
class Bloques Tecnico Dosis Grosor ;
model y = bloques tecnico bloques*tecnico dosis tecnico*dosis
dosis*bloques(tecnico)
grosor tecnico*grosor dosis*grosor tecnico*dosis*grosor/ss1 ;
test h=bloques tecnico e=bloques*tecnico;
test h=dosis tecnico*dosis e=dosis*bloques(tecnico);
Run;
Salida SAS:
Parcelas
subdivididas
General Linear Models Procedure
Dependent Variable: Y
Sum of
Source
DF
Squares
F
Model
62
25921.472
0.0001
Error
81
723.188
Nombrar esta F.V. como Error(c)
Corrected Total
143
26644.660

Mean
Square

F Value

418.088

46.83

8.928

R-Square

C.V.

Root MSE

0.972858

3.074926

2.9880

Mean
97.174

Pr >

Source
F

DF

Type I SS

Mean Square

F Value

BLOQUES
3
48.410
0.1524 No usar esta Fila.
TECNICO
2
248.347
0.0001 No usar esta Fila.
BLOQUES*TECNICO
6
161.153
0.0105 Nombrarla como Error(a)
DOSIS
2
20570.056
0.0001 No usar esta Fila.
TECNICO*DOSIS
4
125.944
0.0105 No usar esta Fila.
BLOQUE*DOSIS(TECNIC)
18
226.000
0.1514 Nombrarla como Error(b)
GROSOR
3
3806.910
0.0001
TECNICO*GROSOR
6
126.486
0.0375
DOSIS*GROSOR
6
402.278
0.0001
TECNICO*DOSIS*GROSOR
12
205.889
0.0435

16.137

1.81

124.174

13.91

26.859

3.01

10285.028

1151.97

31.486

3.53

12.556

1.41

1268.970

142.13

21.081

2.36

67.046

7.51

17.157

1.92

Pr >

Tests of Hypotheses using the Type I MS for


BLOQUES*TECNICO as an error term
Source
F
BLOQUES
0.6378
TECNICO
0.0609

DF

Type I SS

Mean Square

F Value

48.40972

16.13657

0.60

248.34722

124.17361

4.62

Pr >

Tests of Hypotheses using the Type I MS for


BLOQUE*DOSIS(TECNIC) as an error term
Source
DF
Type I SS Mean Square F Value
F
DOSIS
2
20570.056
10285.028
819.16
0.0001
TECNICO*DOSIS
4
125.944
31.486
2.51
0.0784
A continuacin se muestra la Tabla de Andeva definitiva.
Anlisis de Varianza
Fuentes de Variacin
G.L.
S.C.
C.M.
F
F
BLOQUES
3
48.40972
16.13657
0.60
0.6378
TECNICO
2
248.34722
124.17361
4.62
0.0609
Error(a)
6
161.153
26.859
DOSIS
2
20570.056
10285.028
819.16
0.0001
TECNICO*DOSIS
4
125.944
31.486
2.51
0.0784
Error(b)
18
226.000
12.556
GROSOR
3
3806.910
1268.970
142.13
0.0001

Pr >

Pr >

TECNICO*GROSOR
0.0375
DOSIS*GROSOR
0.0001
TECNICO*DOSIS*GROSOR
0.0435
Error(c)
Corrected Total

126.486

21.081

2.36

402.278

67.046

7.51

12

205.889

17.157

1.92

81
143

723.188
26644.660

8.928

Comentarios:
El valor de F para Tcnico no es significativo. Esto indica que los tres
Tcnicos han tenido xito en conducir el experimento de una manera
uniforme. Puesto que F para dosis es significativo, podemos concluir que
existen diferencias significativas entre las potencias de las 3 dosis que se han
probado en este experimento. La interaccin Tcnico*Dosis al no ser
significativa, asegura que las 3 dosis entre ellas mantienen las mismas
diferencias relativas del tiempo de absorcin , no importa cual es el Tcnico
quin lo prepara. Esta informacin es importante ya que esto asegura la
uniformidad en la calidad del producto elaborado.
Grosor es significativo, lo cual implica que la potencia del antibitico depende
del grosor de la pared de cpsula. La interaccin DOSIS*GROSOR es
significativa. Esto indica que el factor dosis y el factor grosor de la cpsula no
son independientes. La interaccin TECNICO*GROSOR es significativa
indicando que el nivel del factor grosor que tenga el mejor tiempo de
absorcin depende del tcnico quin ha elaborado el antibitico. La
interaccin triple Tecnico*Dosis* Grosor, por ser una interaccin de tres
factores puede ser causada de una manera compleja por la significacin de
cualesquiera de las siguientes interacciones: Tcnico por Dosis*Grosor, o
Dosis por Tcnico*Grosor o por Grosor por Tcnico*Dosis.
A continuacin se presenta la informacin necesaria para hacer el Anlisis
grfico de las 3 interacciones dobles:

Anlisis Grfico:
Sabemos que una interaccin doble es causada por una o ambas de
las siguientes raznes:
(1): Existe diferencia en la magnitud de respuesta. (Se identifica esta
situacin en la grfica cuando algunas o todas
de las lneas no son paralelas pero no existe interseccin entre
ellas.)
(2): Existe diferencia en la direccin de respuesta. (Se identifica
esta situacin en la grfica cuando algunas o todas
de las lneas intersectan entre ellas.)
Cuando todas las lneas en la grfica son paralelas, entonces
no existe interaccin.
En las 3 grficas que se presentan arriba, podemos observar que:
(1): Ninguna de las 3 grficas muestran lneas paralelas y en
consecuencia suma de cuadrados para interaccin para
cada una de los 3 interacciones ser mayor que cero.
(2): Ninguna de las 3 grficas presentan la diferencia en la direccin
de respuesta, ya que no existe interseccin
entre las lneas.
(3): Cada una de las 3 grficas muestra diferencia en la magnitud de
respuesta, siendo esta de un grado leve para la
interaccion Tcnico*Dosis la cual no alcanza significacin
para = 0,05 .

En cambio, las interacciones Tcnico*grosor y Dosis*Grosor


muestran las diferencias en la magnitud de
respuesta en un grado ms pronunciado y as alcanzan
significacin para = 0,05 en la tabla de ANDEVA.
Anlisis Posterior:
Ya que la interaccin triple Tecnico*Dosis*Grosor y dos
interacciones dobles son significativas, no se puede hacer
el anlisis posterior sobre los promedios de los niveles de ninguno
de los 3 factores.
Podemos realizar el anlisis de Duncan sobre los promedios
tridimensionales de Tcnico, Dosis y Grosor. Este
clculo requiere la estimacin de la varianza del promedio
tridimensional y se puede obtener por el promedio
ponderado de los cuadrados medios de los 3 tipos de errores a, b, y c.
Esta estimacin tendr 105 g.l.. A
continuacin se representa en forma resumida el resultado obtenido
por el uso del anlisis de Duncan:
Duncan Grouping
Mean
N TRAT
A
115.250
4 413
A
A
115.000
4 313
A
A
115.000
4 433
A
B
A
112.750
4 423
B
A
B
A
112.000
4 421
........................................
Se omiten los valores intermedios
........................................
N
71.750
4 112
N
N
71.000
4 132
N
N
69.000
4 122

El grupo de combinaciones de tratamiento con promedios que


tengan valores ms altos de la variable respuesta
son: 413, 313 y 433 . Asimismo, el grupo formado por las
combinaciones de tratamientos: 112, 132 y 122, tiene
promedios con valores ms bajos de la respuesta.
Tomando en cuenta los resultados del del Anlisis de Duncan,
tambin se puede determinar:
(a): El mejor Tcnico para cada una de las combinaciones de Dosis
por Grosor.
(b): La mejor Dosis para cada una de las combinaciones de
Tcnico por Grosor.

(c): El mejor Grosor para cada una de las combinaciones de


Tcnico por Dosis.
(No se requiere a volver a hacer otro cmputo del mtodo de
Duncan, sino usar los resultados del Anlisis de
Duncan ya disponible.)

Vous aimerez peut-être aussi