Académique Documents
Professionnel Documents
Culture Documents
Statistical
Analysis System
AYACUCHO – PERU
2017
Manual SAS. 2
SAS
METODOS
ESTADISTICOS
CONTENIDO
CAPITULO I
CAPITULO II
CAPITULO III
CAPITULO IV
CAPITULO V
CAPITULO VI
CAPITULO VII
CAPITULO VIII
BIBLIOGRAFÍA .......................................................................................................................... 82
Manual SAS. 6
CAPITULO I
El manejo del SAS para Windows, permite una mayor velocidad en la ejecución de los programas
y el manejo de teclas de función que dinamizan el uso del SAS.
1.1 INTRODUCCIÓN
del escritorio para invocar al programa SAS. El SAS para Windows tiene su presentación
inicial por tres ventanas, como son:
LOG, PROGRAM EDITOR y OUTPUT (Ver Gráfico Nº 01)
La primera ventana LOG, nos muestra el proceso del programa que esta en ejecución,
indica también los errores en el proceso del programa en caso que no se corra
satisfactoriamente.
Grafico N° 01
La ventana OUTPUT, es donde se presenta los resultados del programa SAS que se ha
ejecutado en el PROGRAM EDITOR de la ventana anterior.
Ubicado el cursor en la ventana del PROGRAM EDITOR, vamos a la barra de menú (Ver
Gráfico Nº 02), al hacer clic con el botón izquierdo del mouse en lo correspondiente al
comando ‘File’, se muestra un menú en el que se puede llevar a cabo importantes funciones
Manual SAS. 7
como: abrir archivos (Open), grabar archivos (Save, Save as), imprimir (Print), correr
programa ( Run) y salir del programa (Exit).
Grafico N° 02
De igual modo, al hacer clic en el comando ‘Edit’ (Ver Gráfico Nº 03) aparece el menú que
permite realizar funciones principales como: copiar (Copy), pegar (Paste), borrar texto (Clear text)
seleccionar texto (Select all), buscar (Find) y Opciones (Options). En este ultimo comando al hacer
clic se presenta un submenú donde seleccionamos el comando ‘Numbers’ el mismo que permite
que aparezca una columna de números secuenciales lo que va a facilitar el ingreso de datos así
como para el programa que se digita.
Manual SAS. 8
Grafico N° 03
Grafico N° 04
Manual SAS. 9
En caso de que aparezca otra sentencia distinta, estaría indicando que el programa no ha
sido ejecutado satisfactoriamente. Ante esto se debe visualizar el programa en la ventana
LOG donde se podrá apreciar los errores que se cometieron en el programa, y luego de
corregir estos errores se procede a ejecutar nuevamente el programa.
Se puede retroceder o avanzar una página mediante las tecla Page Up o Page Down,
respectivamente. Los resultados OUTPUT, no lo podemos modificar en el SAS. Si
necesitamos modificarlo, primero se graba en el comando FILE y luego con un editor o un
procesador de textos (Word de Office 97 o 2000) se podrá modificar a nuestro criterio.
En caso de existir error en la corrida del programa, el SAS lo va detectar en la pantalla LOG,
en el cual se pueden identificar en donde radican las fallas. En caso de aparecer error se
tiene que realizar los siguientes pasos:
Recapitulando
2. En los datos a ser procesado. El lugar que ocupa cada variable debe ser especificado en
el programa SAS. Los datos pueden ser introducidos directamente en el programa SAS,
mediante la sentencia CARDS.
Las siguientes teclas de función son algunas de las muchas que posee el SAS y se invoca al
dar click en el comando help de la barra de menú y se selecciona keys, mostrando una
ventana con las descripciones siguientes:
Se puede usar Page Up y Page Down para pasar a una página anterior o posterior,
respectivamente. Asimismo se puede usar Ctrl-Page Up ó ctrl-Page Down para ir al
principio o al final de un archivo (sobretodo en archivos OUTPUT).
Para salir de la ventana KEYS se da un click con el botón izquierdo del mouse en el
cuadrito con aspa de la esquina superior derecha de la ventana KEYS.
Este primer programa servirá para tener una visión general del manejo de los comandos
básicos del SAS y un conocimiento de la sintaxis apropiada. La descripción de cada una
de las instrucciones usadas en este ejemplo se detallará en capítulos posteriores.
TRATAMIENTOS
Trat 1 Trat 2 Trat 3
35 33 35
37 35 39
36 38 43
34 29 41
Lo primero que se tiene que hacer es ubicarse en la ventana del PROGRAM EDITOR y
crear el programa SAS e incluir el conjunto de datos bajo las variables consideradas.
Dado que el modelo para el DCA es Yij = u + Ti + eij, donde Y es la variable respuesta, i =
1,2,3 (tratamientos) y j = 1,2,3,4 (repeticiones); y basándose en el lado izquierdo del modelo
Yij, deben existir en los datos una columna para la variable respuesta, otra para los
tratamientos y otra para las repeticiones. El conjunto de datos puede tener la siguiente
estructura:
1 1 35
1 2 37
1 3 36
Manual SAS. 11
1 4 34
2 1 33
2 2 35
2 3 38
2 4 29
3 1 35
3 2 39
3 3 43
3 4 41
Donde la primera columna es para los tratamientos (1, 2 y 3) la segunda columna es para
las repeticiones (1, 2, 3, y 4) y una última columna para los datos. Por ejemplo, el dato 35
corresponde al tratamiento 1 (trat 1) y repetición 1, y el último dato 41 corresponde al
tratamiento 3 (trat 3) y repetición 4. No interesa el orden de las variables en las columnas
de datos, es decir puede haberse escrito primero una columna para la variable respuesta,
luego una para repeticiones y una para tratamientos. Lo más importante es que todos los
datos que comprenden el análisis deben estar en el archivo y no deben existir datos
duplicados. Por ejemplo, se debe evitar lo siguiente:
1 3 37
1 3 36
Por cuanto este indicaría que existen dos datos que corresponden al primer tratamiento y a
la tercera repetición.
DATA DCA;
TITLE ‘EJEMPLO DE DISEÑO COMPLETO AL AZAR’;
OPTIONS PAGESIZE=80 LINESIZE=60 NODATE NONUMBER;
INPUT TRATAMI 1 REPETI 3 RESPU 5-6;
CARDS;
1 1 35
1 2 37
1 3 36
1 4 34
2 1 33
2 2 35
2 3 38
2 4 29
3 1 35
3 2 39
3 3 43
3 4 41
;
PROC PRINT;
RUN;
PROC ANOVA;
CLASS TRATAMI REPETI ;
MODEL RESPU = TRATAMI;
MEANS TRATAMI / DUNCAN;
RUN;
Este programa consta de 12 sentencias. Note que cada sentencia termina con un punto y
coma (;).
La primera sentencia permite al SAS definir un archivo de ingreso al SAS, creará un archivo
temporal donde se depositarán los resultados de la ejecución del programa.
Manual SAS. 12
La tercera sentencia OPTIONS ..., Indica que los resultados se presentarán con un máximo
de 80 columnas (PAGESIZE=80) y 60 líneas por hoja (LINESIZE=60). La opción NODATE
evita que el SAS ponga en cada página de los resultados la fecha y hora del sistema en
que fue procesado el programa. La opción NONUMBER evita que enumere
automáticamente cada página.
La sentencia PROC PRINT imprimirá en la ventana OUTPUT, los datos introducidos para
poder verificarlos. No es necesario para un programa en SAS, pero si es recomendable.
La sentencia MODEL define el diseño experimental a usar. Dado que es un DCA cuyo
modelo es Yij = u + Ti + eij este modelo es introducido en la sentencia MODEL teniendo en
cuenta lo siguiente:
Note que tanto en las sentencias CLASS, MODEL y MEANS, los nombres de las variables
son los correspondientes a los que se definió en la sentencia INPUT.
Manual SAS. 13
CAPITULO II
INTRODUCCION DE DATOS
En este capítulo se verá como se realiza la introducción de los datos para que sean procesados
por el SAS, se analizará la sentencia INPUT, y el uso del procedimiento PROC PRINT
Una de las formas más comunes de introducir los datos es creando una estructura de
datos, el cual posteriormente será invocado en el correspondiente programa SAS.
Yij = u + Ti + eij
i=1,...,p (tratamientos)
j=1,...,r (repeticiones)
En este caso, de acuerdo a lo especificado en el lado izquierdo del modelo (Yij), y por tanto
en la estructura de datos se debe tener 3 columnas: una para la variable respuesta (Y), otra
para los tratamientos (i) y una ultima columna para las repeticiones (j).
Repeticiones Tratamientos
1 2 3 4 5
1 9 16 17 10 19
2 13 16 17 10 19
3 8 11 21 15 24
4 12 13 11 11 28
5 10 15 22 8 25
6 15 12 18 9 26
Para poder introducir esta información, se crea una adecuada estructura de datos, Lo que
se ingresará después de la sentencia CARDS. En esta estructura se introducen los datos
teniendo en cuenta lo siguiente:
Cada uno de los datos debe tener su correspondiente valor para las otras variables
(tratamientos y repeticiones).
Todos los datos deben estar presentes, sin importar el orden. Tampoco interesa el orden en
que son introducidas las variables.
De acuerdo a lo enunciado, se puede empezar por ejemplo por el dato que se encuentra en
la parte superior izquierdo. Así el dato 9 corresponde al tratamiento 1 y repetición 1, luego
se puede ir con el siguiente dato, el 13 es el que corresponde al tratamiento 1 y repetición
2; y así sucesivamente hasta el último dato, el 26 es el que corresponde al tratamiento 5 y
repetición 6. Esto puede escribirse en el conjunto de datos de la siguiente manera:
9 1 1
13 1 2
8 1 3
Manual SAS. 14
12 1 4
10 1 5
15 1 6
16 2 1
16 2 2
11 2 3
13 2 4
15 2 5
12 2 6
17 3 1
17 3 2
21 3 3
11 3 4
22 3 5
18 3 6
10 4 1
10 4 2
15 4 3
11 4 4
8 4 5
9 4 6
19 5 1
19 5 2
24 5 3
28 5 4
25 5 5
26 5 6
Como bien se dijo, no importa que variable (respuesta, tratamientos o repeticiones) se
introduce primero, pero una vez que se ha definido un orden para el primer dato, éste debe
mantenerse en todo la estructura de datos. Por ejemplo, las siguientes líneas no son
válidas:
9 1 1
1 2 13
observe que, en la segunda línea se está indicando que el dato 1 corresponde al tratamiento
2 y repetición 13, lo cual es incorrecto.
Se debe asimismo, mantener una alineación de los datos en cada columna. Por ejemplo, la
siguiente líneas no son válidas:
9 1 1
13 1 2
1. Los datos pueden ser introducidos sin ninguna separación. En el ejemplo anterior, los
datos correspondientes a cada variable se digitaron en cada columna con uno o más
espacios de separación. Sin embargo también pudieron haber sido digitados de la
siguiente manera:
911
1312
813
.
.
.
Manual SAS. 15
1731
1732
2133
.
.
.
2854
2555
2656
Para que el SAS reconozca que la línea 911 significa que la variable respuesta 9
corresponde al tratamiento 1 y repetición 1, se debe especificar este cambio en el
programa SAS, lo cual se verá posteriormente en este capítulo.
9 Yungay 1
13 Yungay 2
8 Yungay 3
.
.
.
17 Tomasa 1
17 Tomasa 2
21 Tomasa 3
.
.
.
28 Perricholli 4
25 Perricholli 5
26 Perricholli 6
Hay que tener en cuenta, que como se tratan de datos alfanuméricos, sus datos deben
estar alineados a la izquierda. Note asimismo, que debido a que el dato correspondiente
a Perricholli ocupa el mayor número de caracteres en la columna de tratamientos, los
datos correspondientes a repeticiones deben de estar alineados teniendo en cuenta el
dato de repetición correspondiente a este tratamiento.
Bloques Tratamiento
A B C
I 13.2 12.2 11.4
II 14.3 11.6 12.3
III 13.0 12.0 12.9
IV 19.1 16.5 15.1
Yij = u + Bj + Tj + eij
i=1,...,3 (tratamientos)
j=1,...,4 (bloques)
Manual SAS. 16
En este caso, nuevamente se debe tener en cuenta la variable Yij, la que indica que debe
existir una columna para la variable respuesta, otra para la variable tratamientos y otra para
la variable bloques. El conjunto de datos puede tener la siguiente estructura:
A I 132
B I 222
C I 114
A II 143
B II 116
C II 123
A III 130
B III 120
C III 129
A IV 191
B IV 165
C IV 151
Yij(k) = u + Ti + Bj + Pj + eijk
i = 1,...,4 (tratamientos)
j = 1,...,4 (bloques)
k = 1,...,4 (columna)
En este caso, teniendo en cuenta la variable Yij(k) deben existir en la estructura de datos 4
columnas, una para la variable respuesta, otra para la variable tratamientos otra para la
variable bloques y una última para la variable columna. El conjunto de datos puede tener la
siguiente estructura:
R1 PARTO 1 1 41
R1 PARTO 2 3 40
R1 PARTO 3 4 39
R1 PARTO 4 2 28
R2 PARTO 1 2 36
R2 PARTO 2 1 26
R2 PARTO 3 3 38
R2 PARTO 4 4 29
R3 PARTO 1 3 40
Manual SAS. 17
R3 PARTO 2 4 25
R3 PARTO 3 2 30
R3 PARTO 4 1 34
R4 PARTO 1 4 43
R4 PARTO 2 2 27
R4 PARTO 3 1 36
R4 PARTO 4 3 38
En este caso, teniendo en cuenta la variable Yijk deben existir en la estructura de datos 4
columnas, una para la variable respuesta, otra para la variable del factor A, otra para la
variable de factor B y una última para la variable bloques. El conjunto de datos puede
tener la siguiente estructura:
54 1 1 1
58 1 1 2
58 1 1 3
65 1 1 4
68 1 1 5
50 1 2 1
51 1 2 2
53 1 2 3
58 1 2 4
60 1 2 5
63 2 1 1
65 2 1 2
65 2 1 3
68 2 1 4
69 2 1 5
59 2 2 1
61 2 2 2
67 2 2 3
69 2 2 4
65 2 2 5
Una vez establecido la estructura de datos, se puede proceder a crear el programa SAS.
Para el ejemplo del Diseño Completamente al Azar, el programa SAS puede tener
inicialmente estas sentencias:
DATA DCA;
TITLE ‘Experimento en DCA’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATE NONUMBER;
INPUT RESPU 1 -2 TRATAMI 4 REPET 6;
CARDS;
9 1 1
13 1 2
8 1 3
12 1 4
10 1 5
15 1 6
16 2 1
16 2 2
11 2 3
13 2 4
15 2 5
12 2 6
17 3 1
17 3 2
21 3 3
11 3 4
22 3 5
18 3 6
10 4 1
10 4 2
15 4 3
11 4 4
8 4 5
9 4 6
19 5 1
19 5 2
24 5 3
28 5 4
25 5 5
26 5 6
;
PROC PRINT;
RUN;
Nota: Las sentencias debe estar finalizadas y separadas con un punto y coma (;). Caso contrario; el
SAS tomará a las sentencias que no ha sido separadas por el punto y como (;) como una sola.
Permite que se impriman como máximo 60 líneas y 80 columnas por hoja, que no se
enumeren las hojas y que no ponga la hora y fecha del sistema en cada hoja.
Manual SAS. 19
80 columnas I
60
l
í
n
e
a
s
I
9 1 1
13 1 2
.
.
Donde la primera variable es la variable respuesta, la segunda variable es la de
tratamientos y la última es la de repeticiones. Este es el orden como deben introducirse las
variables en la instrucción INPUT, así:
Lo cual indica que la variable RESPU ocupa la posición 1 y 2, la variable TRATAMI ocupa la
posición 4 y la variable REPETI ocupa la posición 6. Los nombres de las variables pueden
ser los que se hayan considerado los más adecuados, pero teniendo en cuenta que no
deben tener más de 8 caracteres y se debe procurar poner un nombre relacionado con la
variable.
1 9 1 1
2 13 1 2
3 8 1 3
4 12 1 4
5 10 1 5
6 15 1 6
7 16 2 1
Manual SAS. 20
8 16 2 2
9 11 2 3
10 13 2 4
11 15 2 5
12 12 2 6
13 17 3 1
14 17 3 2
15 21 3 3
16 11 3 4
17 22 3 5
18 18 3 6
19 10 4 1
20 10 4 2
21 15 4 3
22 11 4 4
23 8 4 5
24 9 4 6
25 19 5 1
26 19 5 2
27 24 5 3
28 28 5 4
29 25 5 5
30 26 5 6
Donde:
911
1312
.
.
En este caso, lo que se tiene que cambiar es la sentencia INPUT. Esta tendrá la siguiente
forma:
con lo cual hará que el SAS tome los datos en forma correcta. Si posteriormente se ejecuta
el programa SAS, el resultado será idéntico al realizado anteriormente.
9 Yungay 1
13 Yungay 2
8 Yungay 3
.
.
Manual SAS. 21
28 Perricholli 4
.
.
▪ Si el archivo de datos contiene información sin el punto decimal, como es el caso del
ejemplo de Diseño de Bloques, cuya estructura de datos es:
A I 132
B I 122
.
.
A III 130
B III 120
.
.
La última parte de la sentencia RESPU 7-9 1, le está indicando el SAS que tome a los datos
de la variable respuesta desde la posición 7 hasta la 9, el número 1 digitado posteriormente
le indica que desde la última posición especificada (9) corra un (1) dígito a la izquierda y
ponga el punto decimal a todos los datos. Es decir que si se introdujo 132 lo va a tomar
como 13.2. Supongamos que hubiéramos tenido los siguientes datos:
A I 21324
B I 31225
C I 51146
.
.
A III 51306
.
.
Para indicar al SAS que los datos correspondiente a la variable respuesta son 213.24,
312.25, 511.46, etc., se debe poner la siguiente sentencia INPUT.
con lo que tomaría a la última como 21324 (7-11), y luego correría dos (2) dígitos
empezando del último y hacia la izquierda del número para poner el punto decimal y que sea
leído como 213.24
R1 PARTO1 1 41
R1 PARTO2 3 40
Manual SAS. 22
R1 PARTO3 4 39
.
.
NOTA : En el caso que los datos correspondientes a cada variable fueron introducidos con
su respectivo punto decimal y por lo menos un espacio en blanco de separación entre cada
columna; no es necesario especificar la posición que ocupa cada variable. Así, en el último
caso la siguiente sentencia INPUT proporciona los mismos resultados:
CAPITULO III
Este capítulo se estudiará como hacer programas que involucren diseños balanceados, mediante
el uso del procedimiento PROC ANOVA
3.1 INTRODUCCION
Se entiende por diseño balanceados, aquel que tenga un igual número de repeticiones por
tratamiento.
Como se dijo los capítulos anteriores, lo que se debe tener en cuenta es el modelo
estadístico correspondiente al diseño usado. En el capítulo 2 se vio como introducir los
datos para diferentes diseños, resta ver como se introduce el modelo para el análisis
estadístico.
2. El efecto aleatorio del error experimental, tampoco es introducido, dado que el SAS lo
calcula como la diferencia entre la variación total y la suma de todos los efectos
especificados en el modelos.
Yij = u + Ti + eij
Y = TRATAMI
Yij = u + Bj + Ti + eij
Y = BLOQUES TRATAMI
Manual SAS. 24
Yij = u + Bj + Pk + Ti + eij
Y = BLOQUES A B A*B
Cabe resaltar que el nombre utilizado para denominar a las variables pueden ser cualquiera
que sea válido en SAS (con un máximo de 8 caracteres), siendo de preferencia el uso de
nombres relacionados con la variable usada (por ejemplo BLOQUES).
La sentencia CLASS especifica a las variables de clasificación, estas son todas aquellas
especificadas en las sentencia INPUT, exceptuando la variable respuesta.
MODEL Y = TRATAMI;
Por último, resta decir que el PROC ANOVA trabaja bajo el supuesto del modelo I; es decir,
cuando los niveles del factor o de los factores han sido fijados, y por tanto se utiliza en la
prueba de F al Cuadrado Medio del Error como denominador. Esta prueba F no es válida
para el caso de trabajar con modelo II o modelos mixtos, por cuanto los denominadores de
las pruebas de F cambian.
Sin embargo, se enseñara posteriormente como poder resolver este problema mediante el
uso de la sentencia TEST.
Repet. Tratamientos
1 2 3 4 5
1 9 16 17 10 19
2 13 16 17 10 19
3 8 11 21 15 24
4 12 13 11 11 28
5 10 15 22 8 25
6 15 12 18 9 26
Cuadro ANVA
F.V. GL SC CM Fc Ft 0.05
Tratamiento 4 692.67 173.1675 18.66 2.76
Error 25 232.00 9.2800
Total 29 922.67
C.V. = 19.86723 %
Prueba de Duncan
GL Error = 25 = 0.05 Número de Promedios = 5
Tratamiento 4 1 2 3 5
Promedios 10.5 11.16 13.83 17.66 23.5
P 2 3 4 5
AES(D) 2.92 3.07 3.15 3.22
ALS(D) 3.63 3.82 3.92 4.00
Conclusión:
T4 T1 T2 T3 T5
DATA DCA;
TITLE ‘Experimento en DCA’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATE NONUMBER;
INPUT RESPU 1- 2 TRATAMI 4 REPETI 6;
Manual SAS. 26
CARDS;
9 1 1
13 1 2
8 1 3
12 1 4
10 1 5
15 1 6
16 2 1
16 2 2
11 2 3
13 2 4
15 2 5
12 2 6
17 3 1
17 3 2
21 3 3
11 3 4
22 3 5
18 3 6
10 4 1
10 4 2
15 4 3
11 4 4
8 4 5
9 4 6
19 5 1
19 5 2
24 5 3
28 5 4
25 5 5
26 5 6
;
PROC PRINT;
RUN;
PROC ANOVA;
CLASS TRATAMI REPETI;
MODEL RESPU = TRATAMI;
MEANS TRATAMI / DUNCAN;
RUN;
Note que al programa DCA SAS desarrollado en el capítulo anterior se le han agregado 4
líneas para poder realizar el Análisis de Variancia.
La primera sentencia añadida, PROC ANOVA, invoca al procedimiento ANOVA para realizar
el análisis de variancia de datos balanceados
La segunda sentencia
CLASS TRATAMI REPETI;
La tercera sentencia
MODEL RESPU = TRATAMI;
Especifica con cual modelo se va a realizar el análisis de variancia y por tanto con cual
diseño se trabaja.
Manual SAS. 27
La última sentencia
MEANS TRATAMI / DUNCAN;
1 9 1 1
2 13 1 2
3 8 1 3
4 12 1 4
5 10 1 5
6 15 1 6
7 16 2 1
8 16 2 2
9 11 2 3
10 13 2 4
11 15 2 5
12 12 2 6
13 17 3 1
14 17 3 2
15 21 3 3
16 11 3 4
17 22 3 5
18 18 3 6
19 10 4 1
20 10 4 2
21 15 4 3
22 11 4 4
23 8 4 5
24 9 4 6
25 19 5 1
26 19 5 2
27 24 5 3
28 28 5 4
29 25 5 5
30 26 5 6
Manual SAS. 28
1 2 3
Class Levels Values
TRATAMI 5 1 2 3 4 5
REPETI 6 1 2 3 4 5 6
5
R-Square C.V. Root MSE RESPU Mean
0.748555 19.86723 3.0463092 15.333333
14 15 16 17
19 20 21 22
24 25 26
27
Number of Means 2 3 4 5
Critical Range 3.622 3.805 3.922 4.006
Manual SAS. 29
31 30 29 28
A 23.500 6 5
B 17.667 6 3
C 13.833 6 2
C
C 11.167 6 1
C
C 10.500 6 4
Los datos de un DBCA, y su estructura fueron introducidos en el programa DBCA bajo SAS,
el que consta de las siguientes sentencias:
data dbca;
title ‘Experimento en DBCA’;
options linesize=80 pagesize=60 nodate nonumber;
input tratami $ 1 bloques $ 3-5 respu 7-9 1;
cards;
A I 132
B I 122
C I 114
A II 143
B II 116
C II 123
A III 130
B III 120
C III 129
A IV 191
B IV 165
C IV 151
;
proc print;
run;
proc anova;
class tratami bloques;
model respu = bloques tratami;
means tratami / duncan;
run;
Para el ejemplo de Cuadrado Latino, cuyos datos fueron introducidos en el programa bajo
SAS es el siguiente:
data dcl;
title ‘Experimento en DCL’;
options linesize=80 pagesize=60 nodate nonumber;
input razas $ 1-2 partos $ 4 –9 tratami 11 rendi 13-14;
cards;
R1 PARTO1 1 41
R1 PARTO2 3 40
R1 PARTO3 4 39
R1 PARTO4 2 28
R2 PARTO1 2 36
R2 PARTO2 1 26
R2 PARTO3 3 38
R2 PARTO4 4 29
R3 PARTO1 4 40
R3 PARTO2 3 25
R3 PARTO3 2 30
R3 PARTO4 1 34
R4 PARTO1 4 43
R4 PARTO2 2 27
R4 PARTO3 1 36
R4 PARTO4 3 38
Manual SAS. 31
;
proc print;
run;
proc anova;
class razas partos tratami ;
model rendi = razas partos tratami;
means tratami / t duncan;
run;
Para el caso del Arreglo Factorial en Bloques Completo al Azar, cuya estructura de datos
se introdujo en el programa bajo el SAS se tiene lo siguiente:
data factor;
title ‘Arreglo factorial en DBCA’;
options linesize=80 pagesize=60 nodate nonumber;
input respu 1-2 A 4 B 6 bloques 8;
cards;
54 1 1 1
58 1 1 2
58 1 1 3
65 1 1 4
68 1 1 5
50 1 2 1
51 1 2 2
53 1 2 3
58 1 2 4
60 1 2 5
63 2 1 1
65 2 1 2
65 2 1 3
68 2 1 4
69 2 1 5
59 2 2 1
61 2 2 2
67 2 2 3
69 2 2 4
65 2 2 5
;
proc print;
run;
proc anova;
class A B bloques;
model respu = bloques a b a*b;
means a b / duncan;
run;
Manual SAS. 32
CAPITULO
IV
ANALISIS DE EXPERIMENTOS NO BALANCEADOS
4.1 INTRODUCCION
E = efecto
Especifica un efecto de modelo para ser usado como término de error (denominador). Si
esta opción no es especificada el cuadrado medio del error (CME) será usado.
EJEMPLO 1
El primer ejemplo será el mismo que ha sido desarrollado por el PROC ANOVA, por lo cual
no se presentarán los cálculos manuales.
Manual SAS. 33
Note que con relación al programa DCA bajo SAS, desarrollado para el procedimiento
ANOVA se le ha cambiado el nombre de las variables, así como la ubicación de las
mismas en la estructura de datos las cuales están especificadas en la sentencia INPUT.
La sentencia PROC GLM invoca al procedimiento GLM (General Linear Model : Modelo
Lineal General) para realizar el análisis de variancia, las sentencias CLASS, MODEL y
MEANS especifican lo mismo que el PROC ANOVA.
Luego de ejecutar el programa GLM bajo SAS se obtendrán los siguientes resultados en la
ventana OUTPUT:
7 2 1 16
8 2 2 16
9 2 3 11
10 2 4 13
11 2 5 15
12 2 6 12
13 3 1 17
14 3 2 17
15 3 3 21
16 3 4 11
17 3 5 22
18 3 6 18
19 4 1 10
20 4 2 10
21 4 3 15
22 4 4 11
23 4 5 8
24 4 6 9
25 5 1 19
26 5 2 19
27 5 3 24
28 5 4 28
29 5 5 25
30 5 6 26
TRATA 5 1 2 3 4 5
REPETI 6 1 2 3 4 5 6
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2 3 4 5
Critical Range 3.622 3.805 3.922 4.006
A 23.500 6 5
B 17.667 6 3
C 13.833 6 2
C
C 11.167 6 1
C
C 10.500 6 4
Se puede observar en el contenido del programa GLM bajo SAS, que los resultados
obtenidos mediante el procedimiento GLM son similares a los resultados obtenidos
mediante el procedimiento ANOVA. La única diferencia aparente se da en que el PROC
GLM proporciona dos tipos de sumas de cuadrados para el efecto especificado (en este
caso TRATA), sin embargo estos valores son iguales y en términos interpretativos los
resultados también son idénticos.
EJEMPLO 2
Repeticiones T1 T2 T3 T4
1 3 6 6 13
2 4 7 8 11
3 5 5 10 13
4 4 6 11
5 6
Cuadro ANVA
F.V. GL SC CM Fc Ft 0.05
Total 15 157.75
C.V. = 18.4426 %
Prueba de Duncan
GL Error = 25 = 0.05 Número de Promedios = 5
Tratamientos 1 2 3 4
P 2 3 4
Conclusión
T1 T2 T3 T4
C = u1 + u2 + u3 – 3 u4
F. V. Gl SC CM Fc
El programa para procesar los datos de este diseño mediante el paquete SAS son:
data abc ;
title ‘Experimento en DCA bajo GLM’;
options ls = 80 ps=55 nodate nonumber;
input trat 1 rep 2 rend 4-5;
cards;
11 3
12 4
13 5
14 4
15 6
21 6
22 7
23 5
31 6
32 8
33 10
34 6
41 13
42 11
43 13
44 11
;
proc print;
run;
proc glm ;
class trat rep ;
model rend = trat ;
means trat / duncan ;
contrast ‘ t4 vs los demas trata’ trat 1 1 1 -3 ;
run;
Manual SAS. 37
Note que los coeficientes tienen un espacio de separación el cual debe cumplirse para todos
los casos.
TRAT 4 1 2 3 4
REP 5 1 2 3 4 5
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2 3 4
Critical Range 2.130 2.230 2.290
A 12.0000 4 4
B 7.5000 4 3
B
C B 6.0000 3 2
C
C 4.4000 5 1
EJEMPLO 3
Repetición A1 A2
B1 B2 B3 B1 B2 B3
1 1 2 4 5 5 2
2 4 5 7 7 10 1
3 5 7 9 11 13 3
4 9 9 11 15 16 5
El conjunto de datos para el programa SAS será introducida con su estructura respectiva.
Si se asume que ambos factores son fijos y se desea realizar las pruebas de tendencia
lineal y cuadrática para el factor B, el programa GLM bajo SAS realiza dicho análisis
mediante las siguiente sentencias:
Manual SAS. 39
DATA ABC ;
TITLE ‘Experimento Factorial 2Ax3B’;
OPTIONS LS=80 PS=60 NODATE NONUMBER;
INPUT Y A B REP ;
CARDS;
1 1 1 1
4 1 1 2
5 1 1 3
9 1 1 4
2 1 2 1
.
.
.
2 2 3 1
1 2 3 2
3 2 3 3
5 2 3 4
;
PROC PRINT;
RUN;
PROC GLM ;
CLASS A B REP ;
MODEL Y = A B A*B ;
CONTRAST ‘B-LINEAL ‘B 1 0 1;
CONTRAST ‘B-CUADRATICO ‘B 1 -2 1;
RUN;
Los dos últimas sentencias CONTRAST realizan las pruebas de tendencia lineal y
cuadrática respectivamente mediante la prueba de significación F. Los coeficientes
corresponden a valores tabulares y dependen del número de niveles que tenga el factor.
Manual SAS. 40
CAPITULO V
En este capítulo se estudiarán las formas de plantear las pruebas de significación haciendo
uso de la sentencia TEST, cuya aplicación es muy importante en los diseños de parcelas
divididas, modelos de efectos aleatorios y modelos mixtos. Adicionalmente se verá la
aplicación de la opción E = efecto correspondiente a las sentencias MEANS y CONTRAST.
5.1 INTRODUCCION
H = efectos ;
E = efecto ;
La primera instrucción especifica que efecto(s) del modelo van a ser utilizados como
numerador. La segunda instrucción especifica uno y únicamente un efecto a ser utilizado
como término de error (denominador).
Se puede utilizar tantas sentencias TEST como se requieran o términos de error existan en el
modelo. El uso de la sentencia se puede utilizar tanto en el procedimiento PROC ANOVA
como en el PROC GLM.
Se presentan dos ejemplos relacionados con parcelas divididas, en el cual presentaremos dos
formas alternativas de resolver el problema. El tercer ejemplo permite realizar pruebas de
tendencia lineal y cuadrática.
EJEMPLO 1
BLOQUES A1 A2
B1 B2 B3 B1 B2 B3
I 10 12 13 20 22 23
II 15 14 15 25 20 20
III 12 14 16 22 24 26
La variable en este caso Yijk, hace pensar en la inclusión de 4 columnas de datos, para el
programa, lo importante está en la especificación del modelo.
Obviamente, el SAS va tomar como error por defecto el Error(b), lo cual es válido para la
fuente de B y (A*B), sin embargo para bloques y A no sería el apropiado. Además sacaría
una prueba F para Bloques*A, el cual es el Error(a). Sin embargo, se puede solucionar este
problema usando la sentencia TEST. El programa bajo SAS, es el siguiente:
DATA AAA;
TITLE ‘Diseño en Parcelas Divididas’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATE NONUMBER;
INPUT BLOQUES A B Y ;
CARDS;
1 1 1 10
1 1 2 12
1 1 3 13
2 1 1 15
2 1 2 14
2 1 3 15
3 1 1 12
3 1 2 14
3 1 3 16
1 2 1 20
1 2 2 22
1 2 3 23
2 2 1 25
2 2 2 20
2 2 3 20
3 2 1 22
3 2 2 24
3 2 3 26
;
PROC PRINT;
RUN;
PROC ANOVA ;
BLOQUES A B ;
MODEL Y = BLOQUES A BLOQUES*A B A*B ;
TEST H = BLOQUES E = BLOQUES*A ;
TEST H = A E = BLOQUES*A ;
MEANS A / E= BLOQUES*A DUNCAN ;
MEANS B / DUNCAN ;
RUN;
Manual SAS. 42
BLOQUES 3 1 2 3
A 2 1 2
B 3 1 2 3
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2
Critical Range 4.303
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2 3
Critical Range 2.699 2.813
A 18.833 6 3
A
A 17.667 6 2
A
A 17.333 6 1
EJEMPLO 2
data aaa ;
title ‘ejemplo en parcela dividida’;
options linesize=80 pagesize=60 nodate nonumber;
input bloques a b y;
cards;
1 1 1 10
1 1 2 12
1 1 3 13
2 1 1 15
2 1 2 14
2 1 3 15
3 1 1 12
3 1 2 14
3 1 3 16
1 2 1 20
1 2 2 22
1 2 3 23
2 2 1 25
2 2 2 20
2 2 3 20
3 2 1 22
3 2 2 24
Manual SAS. 44
3 2 3 26
;
proc print;
run;
proc anova;
class bloques a b ;
model y = bloques a bloques*a b a*b bloques*b(a);
test h = bloques a e= bloques*a ;
test h = b a*b e= bloques*b(a) ;
means a / e= bloques*a duncan ;
means b / e = bloques*b(a) duncan ;
run;
BLOQUES 3 1 2 3
A 2 1 2
B 3 1 2 3
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2
Critical Range 4.303
A 22.444 9 2
B 13.444 9 1
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Number of Means 2 3
Critical Range 2.699 2.813
A 18.833 6 3
A
A 17.667 6 2
A
A 17.333 6 1
EJEMPLO 3
Considerando el ejemplo 2, suponga que se desea realizar las pruebas de tendencia lineal y
cuadrática para los factores de estudio.
data aaa ;
Manual SAS. 46
En este caso se invoca al procedimiento PROC GLM con el cual se pueden realizar las
pruebas de contrastes especificadas. Note que las dos primeras sentencias CONTRAST
hacen uso de la opción E = para especificar el término de error correcto para el análisis del
efecto A asignado en parcelas.
Manual SAS. 47
CAPITULO VI
En este capítulo se verá como realizar mediante un solo programa el análisis conjunto para un
experimento repetido así como el análisis individual para cada repetición, y por otro lado como
solucionar el problema del análisis de efectos simples.
Para poder realizar el análisis tanto individual como conjunto se necesita tener ordenados
los datos de acuerdo a la variable que determina el patrón del experimento repetido. Por
ejemplo, si se trabaja con experimentos repetidos en diferentes lugares, se debe tener los
datos ordenados por lugares. Como esto muchas veces no es posible hacerlo, tenemos
que hacer uso del procedimiento PROC SORT, el cual ordena los datos introducidos de
acuerdo a una o más variables. La estructura de este procedimiento es la siguiente:
PROC SORT;
BY variable1 variable2 ...;
PROC SORT primero ordena los datos de acuerdo a la primera variable especificada
(variable1), luego ordena los datos con un valor dado de la primera variable para la segunda
variable (variable2), y así sucesivamente.
Lugar 1
Bloque T1 T2 T3 T4 T5
I 12.5 13.4 15.8 14.6 16.3
Lugar 2
Bloque T1 T2 T3 T4 T5
Donde:
i = 1,2 (lugares)
j = 1,....5 (tratamientos)
k = 1,....4 (bloque)
El modelo aditivo lineal para el análisis de los experimentos en cada uno de los lugares es el
siguiente:
Yjk = u + Bk + Tj + ejk
Donde:
j = 1,....5 (tratamientos)
k = 1,....4 (bloque)
Y = BLOQUES TRATAMI ;
Para el archivo se debe tener en cuenta el modelo para el análisis combinado. El conjunto
de datos, tiene la siguiente estructura:
1 1 1 12.5
1 1 2 13.5
1 1 3 15.8
1 1 4 14.6
1 1 5 16.3
1 2 1 12.5
1 2 2 15.3
1 2 3 14.2
1 2 4 16.3
1 2 5 16.3
1 3 1 15.2
1 3 2 17.2
1 3 3 16.5
1 3 4 15.3
1 3 5 14.2
1 4 1 12.2
1 4 2 15.2
1 4 3 13.5
1 4 4 15.2
1 4 5 12.4
2 1 1 12.5
2 1 2 13.5
2 1 3 15.6
2 1 4 13.2
2 1 5 14.2
2 2 1 15.3
2 2 2 11.3
2 2 3 13.5
2 2 4 13.2
2 2 5 14.2
2 3 1 16.3
2 3 2 14.3
2 3 3 15.4
Manual SAS. 49
2 3 4 13.4
2 3 5 15.3
2 4 1 15.2
2 4 2 11.9
2 4 3 14.3
2 4 4 15.3
2 4 5 11.9
Donde la primera columna es para la variable lugar, la segunda para la variable tratami, la
tercera para la variable bloques y la última para la variable respuesta. El programa bajo SAS
es el siguiente:
DATA XYZ ;
TITLE ‘Experimentos repetidos en localidades’;
OPTIONS LINESIZE=80 PAGESIZE=55 NODATE NONUMBER;
INPUT LUGAR BLOQUES TRATAMI Y ;
CARDS;
1 1 1 12.5
1 1 2 13.5
1 1 3 15.8
1 1 4 14.6
1 1 5 16.3
1 2 1 12.5
1 2 2 15.3
1 2 3 14.2
1 2 4 16.3
1 2 5 16.3
1 3 1 15.2
1 3 2 17.2
1 3 3 16.5
1 3 4 15.3
1 3 5 14.2
1 4 1 12.2
1 4 2 15.2
1 4 3 13.5
1 4 4 15.2
1 4 5 12.4
2 1 1 12.5
2 1 2 13.5
2 1 3 15.6
2 1 4 13.2
2 1 5 14.2
2 2 1 15.3
2 2 2 11.3
2 2 3 13.5
2 2 4 13.2
2 2 5 14.2
2 3 1 16.3
2 3 2 14.3
2 3 3 15.4
2 3 4 13.4
2 3 5 15.3
2 4 1 15.2
2 4 2 11.9
2 4 3 14.3
2 4 4 15.3
2 4 5 11.9
;
PROC PRINT;
Manual SAS. 50
RUN;
PROC ANOVA ;
CLASS LUGAR BLOQUES TRATAMI ;
MODEL Y = BLOQUES (LUGAR) LUGAR TRATAMI LUGAR*TRATAMI;
TEST H = TRATAMI E=LUGAR*TRATAMI;
PROC SORT ;
BY LUGAR ;
PROC ANOVA ;
BY LUGAR ;
CLASS LUGAR BLOQUES TRATAMI ;
MODEL Y = BLOQUES TRATAMI;
RUN;
El segundo procedimiento, PROC SORT, permite arreglar los datos de acuerdo a la variable
por la cual vamos a obtener los análisis de variancia combinados. Como quiera que se
desea obtener los análisis de variancia por lugares, se ordenan los datos por LUGAR,
mediante:
PROC SORT;
BY LUGAR;
El tercer procedimiento, PROC ANOVA, permite realizar el análisis de variancia individual en
cada uno de los lugares. Para ello necesitamos usar la sentencia BY en el procedimiento
PROC ANOVA (ver Capítulo III). Esta opción BY debe ser de acuerdo a la del PROC
SORT. El modelo especificado es para el experimento individual.
Si se ejecuta este programa se obtendrán los siguientes resultados:
Experimento repetido
1 1 1 1 12.5
2 1 1 2 13.4
3 1 1 3 15.8
4 1 1 4 14.6
5 1 1 5 16.3
6 1 2 1 12.5
7 1 2 2 15.3
8 1 2 3 14.2
9 1 2 4 16.3
10 1 2 5 16.3
11 1 3 1 15.2
12 1 3 2 17.2
13 1 3 3 16.5
14 1 3 4 15.3
15 1 3 5 14.2
16 1 4 1 12.2
17 1 4 2 15.2
18 1 4 3 13.5
19 1 4 4 15.2
20 1 4 5 12.4
21 2 1 1 12.5
22 2 1 2 13.5
23 2 1 3 15.6
24 2 1 4 13.2
Manual SAS. 51
25 2 1 5 14.2
26 2 2 1 15.3
27 2 2 2 11.3
28 2 2 3 13.5
29 2 2 4 13.2
30 2 2 5 14.2
31 2 3 1 16.3
32 2 3 2 14.3
33 2 3 3 15.4
34 2 3 4 13.4
35 2 3 5 15.3
36 2 4 1 15.2
37 2 4 2 11.9
38 2 4 3 14.3
39 2 4 4 15.3
40 2 4 5 11.9
Experimento repetido
LUGAR 2 1 2
BLOQUES 4 1 2 3 4
TRATAMI 5 1 2 3 4 5
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Experimento repetido
BLOQUES 4 1 2 3 4
LUGAR 1 1
TRATAMI 5 1 2 3 4 5
Experimento repetido
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Experimento repetido
BLOQUES 4 1 2 3 4
LUGAR 1 2
TRATAMI 5 1 2 3 4 5
Experimento repetido
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Nota.- Para el análisis de utilizó el procedimiento PROC ANOVA, sin embargo se puede usar el PROC GLM
siendo los resultados válidos, debido a que se está trabajando con datos balanceados. Sin embargo, el PROC
ANOVA da resultados más precisos que el PROC GLM.
a1 a2 a3
B1 9 5 1 5 7 9 7 9 11
B2 7 11 15 10 13 16 1 3 5
F.V. GL SC CM Fc
A 2 48 24 2.72
B 1 18 18 2.04
AB 2 144 72 8.13
Error 12 106 8.83
Total 17 316
El análisis de variancia para el estudio de los efectos simples de los factores es el siguiente:
F.V. gl SC CM Fc
Efectos Simples de B
B (a1) 1 54 54 6.12
B (a2) 1 54 54 6.12
B (a3) 1 54 54 6.12
Efectos Simples de A
A (b1) 2 24 12 1.36
A (b2) 2 148 84 9.51
Error 12 106 8.83
Donde:
i = 1,2,3 (niveles de factor A)
j = 1,2, (niveles de factor B)
k = 1,2,3 (respectivamente)
El conjunto de datos tiene una estructura, donde la primera columna es para la variable B, la
segunda para la variable A la tercera para las repeticiones y la última para la variable
respuesta.
Con el programa SIMPLE SAS A, se realiza el análisis de variancia para el arreglo factorial
de manera sencilla, se puede usar el PROC ANOVA o el PROC GLM (ver nota anterior),
Sin embargo, si se quiere realizar el Análisis de Efectos Simple, debemos usar el PROC
SORT. La idea es que para obtener por ejemplo B(a1) se tiene que hacer un análisis de
variancia en cada nivel de A, para lo cual se ordenan los datos por A y se utiliza PROC
ANOVA con la sentencia BY para obtener B(a1), B(a2) y B(a3). El modelo a introducir es
aquel en el que sólo consideramos el factor B. Esto es:
Yjk = u + Bj + Ejk;
Manual SAS. 54
De igual manera, para obtener A(b1) y A(b2) se ordenan los datos por la variable B y se
utiliza PROC ANOVA con la sentencia BY con el siguiente modelo:
Yjk = u + Ti + Eik;
A 3 1 2 3
B 2 1 2
REP 3 1 2 3
Number of observations in data set = 18
Manual SAS. 55
Efectos simples
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Efectos simples
A 1 1
B 2 1 2
REP 3 1 2 3
Efectos simples
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Efectos simples
A 1 2
B 2 1 2
REP 3 1 2 3
Efectos simples
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Efectos simples
A 1 3
B 2 1 2
REP 3 1 2 3
Efectos simples
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Efectos simples
A 3 1 2 3
B 1 1
REP 3 1 2 3
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Efectos simples
A 3 1 2 3
B 1 2
REP 3 1 2 3
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 168.00000000 84.00000000 8.69 0.0169
Error 6 58.00000000 9.66666667
Corrected Total 8 226.00000000
Nota : Este programa para el análisis de efectos simples no proporciona los estadísticos de prueba F adecuados
(compare los resultados obtenidos con el SAS con los obteniendo manualmente), por cuanto el Error
considerado es tomado del diseño en el cual aparece un sólo factor y no del modelo en el cual aparece el
arreglo factorial que es el especificado en el primer PROC ANOVA. Por ejemplo para la fuente B(a1) se
obtuvo:
Efectos simples
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
CAPITULO
ANALISIS DE COVARIANCIA
VII
En este capítulo se verá como realizar el ANCOVA mediante el uso de los procedimientos PROC
GLM y PROC ANOVA
7.1 INTRODUCCION
El SAS permite realizar el Análisis de Covariancia (ANCOVA) usando en forma conjunta los
procedimientos PROC GLM y PROC ANOVA. Para ello, en primer lugar se presentará un
ejemplo desarrollado de la forma como uno se hace manualmente y luego se hará mediante
el SAS.
Supongamos los siguientes datos correspondientes a tres (3) tratamientos con 5 repeticiones
conducido en el Diseño Completamente al Azar donde la variable respuesta es la variable Y
(llamada también variable dependiente) y la variable relacionada o concomitante es la variable
X (llamada también covariable o variable independiente).
Tratamientos
Repeticiones T1 T2 T3
X Y X Y X Y
1 6 0.54 8 0.11 4 0.13
2 4 0.56 5 0.20 3 0.15
3 6 0.55 4 0.23 4 0.11
4 4 0.60 5 0.21 4 0.11
5 4 0.59 7 0.09 5 0.10
Fuentes Gl SC CM Fc
Regresión 1 0.00162 0.0162 42.86 **
Residual 11 0.0042 0.0004
En este caso como la prueba resulta significativa, se procede a realizar el ANCOVA cuyo
resultado son:
En caso de que la prueba sobre todo la regresión hubiera resultado no significativa, esto
significaría que el análisis estadístico se realiza en la variable Y, sin considerar X.
Fuentes Gl SC CM Fc
Tratamientos 2 0.60501 0.3025 178.29 **
Error 12 0.02036 0.0017
Total 14 0.62537
Para desarrollar en el SAS todo lo hecho manualmente, se debe tener en cuenta que se trata
de un DCA, y que en el conjunto de datos se deberían introducir 3 variables: Y, tratami y
repeti. Ahora para el ANCOVA solamente se debe agregar la variable X.
El conjunto de datos debe contener 4 columnas, una para variable Y, otra para la X, otra para
las repeticiones y una última para la de tratamientos. En nuestro caso la primera columna es
para la variable tratamientos, la segunda es para la variable repeticiones, la tercera para la
variable X y la última para la variable Y.
El programa bajo SAS, es el siguiente:
data aaa ;
title analisis de covariancia en DCR’;
options linesize=80 pagesize=60 nodate nonumber;
input tratami repeti x y ;
cards;
1 1 6 0.54
1 2 4 0.56
1 3 6 0.55
1 4 4 0.60
1 5 4 0.59
2 1 8 0.11
2 2 5 0.20
2 3 4 0.23
2 4 5 0.21
2 5 7 0.09
3 1 4 0.13
3 2 3 0.15
3 3 4 0.11
3 4 4 0.11
3 5 5 0.10
;
proc print ;
run;
proc glm ;
class repeti tratami ;
model y = tratami x / ss1 ss3 ;
lsmeans tratami / pdiff;
proc ancova ;
class repeti tratami ;
model y = tratami ;
run;
La sentencia INPUT, define la forma como fueron introducidos los datos en el programa SAS.
El procedimiento PROC GLM realizar la prueba del efecto de regresión y el análisis de
covariancia y de variancia. El procedimiento PROC ANOVA realiza el análisis de variancia.
En el procedimiento PROC GLM, se debe tener en cuenta el modelo aditivo lineal para un
Análisis de Covariancia en Diseño Completamente el Azar el cual es:
Manual SAS. 61
MODEL Y = TRATAMI X;
Las opciones que aparecen después del slash (/), SS1 y SS3 permiten realizar: el primero el
análisis de variancia y el segundo el análisis de covariancia. Asimismo ambas Sumas de
Cuadrados proporcionan la prueba de efecto de regresión. A pesar de que SS1 realiza el
Análisis de Variancia (no considera la variable X), la prueba F no es valida por cuanto el
Error que se está considerando es el Error Ajustado por la Variable X, lo cual no es valido.
Por ello, se realiza el procedimiento PROC ANOVA el cual presenta en forma correcta no sólo
las Sumas de Cuadrados sino la prueba F.
La sentencia
Permite obtener los promedios de los tratamientos ajustados. Asimismo, la opción PDIFF
muestra la prueba de significancia obtenida al realizar la prueba de comparación entre los
promedios ajustados de los tratamientos.
Al ejecutar el programa se obtiene:
analisis de covariancia
1 1 1 6 0.54
2 1 2 4 0.56
3 1 3 6 0.55
4 1 4 4 0.60
5 1 5 4 0.59
6 2 1 8 0.11
7 2 2 5 0.20
1 8 2 3 4 0.23
9 2 4 5 0.21
10 2 5 7 0.09
11 3 1 4 0.13
12 3 2 3 0.15
13 3 3 4 0.11
14 3 4 4 0.11
15 3 5 5 0.10
analisis de covariancia
REPETI 5 1 2 3 4 5
TRATAMI 3 1 2 3
analisis de covariancia
Dependent Variable: Y
Manual SAS. 62
Sum of Mean
Source DF Squares Square F Value Pr > F
Error
2 11 0.00415795 0.00037800
TRATAMI
5 2 0.61301640 0.30650820 810.88 0.0001
X 4 1 0.01620205 0.01620205 42.86 0.0001
analisis de covariancia
analisis de covariancia
REPETI 5 1 2 3 4 5
TRATAMI 3 1 2 3
analisis de covariancia
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Donde:
1 Son los datos introducidos y definidos en la sentencia INPUT.
2 Es la fuente correspondiente al Residual en la prueba de efecto de regresión y al Error
Ajustado en el Análisis de Covariancia.
3 Es la fuente correspondiente a Tratamientos para el Análisis de Variancia. Sin
embargo, de este resultado sólo se debe tener en cuenta los grados de libertad, la
Suma de Cuadrados y el Cuadrado Medio; la prueba F no es Válido por cuanto el
término del Error no es el apropiado.
4 Es la fuente correspondiente a la Regresión usada en la prueba sobre el Efecto de
Regresión, en ambos tipos de Sumas de cuadrados (Tipo I y Tipo III), los resultados son
idénticos.
5 Es la fuente correspondiente a Tratamientos usados para el Análisis de Covariancia.
6 Son los promedios de los tratamientos ajustados.
7 Especifica el nivel de significancia para la prueba de comparación de los tratamientos.
Como en todos los casos el nivel es menor a 0.01 los resultados son altamente
significativos en las pruebas de comparación.
8 Es la fuente correspondiente al Error para el Análisis de Variancia.
9 Es la fuente para Tratamientos en ANVA. Note que en este caso el F calculado es
178.29 mientras que en la SS1 (Tipo I) el F calculado era de 800.29. Esto debido a que
el Error en el caso de Tipo I no es el apropiado.
Manual SAS. 64
10
CAPITULO VIII
OTRAS OPCIONES DEL PAQUETE SAS
8.1 TRANSFORMACIONES DE DATOS
El paquete SAS permite realizar transformaciones a las variables en estudio mediante las
sentencias que serán descritas a continuación. Las transformaciones se especifican
después de la sentencia INPUT.
Estas sentencias crean las nuevas variables con las que se realizará en análisis respectivo.
Z = SQRT (Y)
La cual genera una nueva variable (Z) que tendrá como valores a las raíces cuadradas de
los valores de la variable Y.
X = SQRT (Y+ 1)
W = SQRT (Y+ 0.5)
REP A B C
1 12 14 58
Manual SAS. 65
2 13 20 65
3 22 32 107
DATA AAA ;
TITLE ‘EJEMPLO DE TRANSFORMACION EN DCA’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATA NONUMBER;
INPUT TRAT $ 2 REP 4 Y 6-8 ;
Z = LOG(Y) ;
CARDS;
A 1 12
A 2 13
A 3 22
B 1 14
B 2 20
B 3 32
C 1 58
C 2 65
C 3 107
;
PROC PRINT ;
RUN;
PROC GLM ;
CLASS REP TRAT ;
MODEL Z = TRAT ;
MEANS TRAT / T DUNCAN ;
RUN;
Observe como se ha definido la transformación logarítmica después de la sentencia INPUT
mediante: Z=LOG(Y), la variable transformada es especificada la sentencia MODEL para
realizar el análisis de variancia.
En el programa SAS utilizamos dos opciones para colocar títulos y/o etiquetas. Las dos
sentencias utilizadas para tal fin son:
La sentencia TITLE
La sentencia LABELS
La sentencia TITLE permite colocar títulos a las páginas de su trabajo, se puede utilizar
hasta un máximo de 10 sentencias, por ejemplo se pueden colocar los siguientes títulos al
inicio del archivo TRANSF SAS A.
Permite colocar un nombre a las variables en estudio, de forma que aparezca en la salida
de resultados. La sentencia LABEL se utiliza de la forma siguiente:
El SAS permite realizar el analizar el análisis de variancia a dos o más variables mediante
un solo archivo SAS, a continuación se ilustra con un ejemplo esta opción.
El análisis para estas tres variables se realiza mediante el siguiente programa SAS:
BIBLIOGRAFIA
1. Manual del SAS versión para DOS. UNA La Molina.1992
2. Release 6.11 of the SAS® System for Windows. Copyright (c) 1989 –
1995 by SAS Institute Inc. , Cary, NC, USA.
Manual SAS. 67