Vous êtes sur la page 1sur 67

Manual SAS.

UNIVERSIDAD NACIONAL DE SAN CRISTÓBAL DE HUAMANGA

FACULTAD DE INGENIERÍA QUÍMICA Y METALURGIA

ESCUELA PROFESIONAL DE INGENIERÍA AGROINDUSTRIAL

Statistical
Analysis System

Ing. Percy F. Velasquez


Ccosi

AYACUCHO – PERU
2017
Manual SAS. 2

SAS

METODOS
ESTADISTICOS

PARA INGENIERIA AGROINDUSTRIAL


Manual SAS. 3

CONTENIDO
CAPITULO I

Introducción al manejo del SAS para Windows....................................................................... 5

1.1 Introducción ............................................................................................................. 5


1.2 Ejecución de un programa en SAS ........................................................................... 8
1.3 Teclas de ayuda ........................................................................................ ...... .. 10
1.4 Programa Ejemplo .................................................................................................... 10

CAPITULO II

Introducción de Datos ............................................................................................................. 15


2.1 Entrada de Datos ...................................................................................................... 15
2.2 Otros Modelos.......................................................................................................... 18
2.3 Uso de la sentencia INPUT - PROC PRINT ................................................................ 21

CAPITULO III

Análisis de Experimentos Balanceados ................................................................................... 28


3.1 Introducción ............................................................................................................. 28
3.2 Especificación del Modelo........................................................................................ 28
3.3 Descripción del PROC ANOVA ................................................................................. 29
3.4 Ejemplo de Aplicación .............................................................................................. 31
3.5 Presentación de Otros Ejemplos .............................................................................. 38

CAPITULO IV

Análisis de Experimentos No Balanceados ............................................................................. 40


Introducción ...................................................................................................................... 40
4.1 Descripción del PROC GLM ...................................................................................... 40
4.2 Ejemplos de Aplicación ............................................................................................ 41

CAPITULO V

Diseños de Parcelas Divididas ................................................................................................. 49


5.1 Introducción ......................................................................................................... 49
5.2 Uso de la sentencia TEST ..................................................................................... 49
5.3 Ejemplos de Aplicación ........................................................................................ 49

CAPITULO VI

Análisis de Experimentos Repetidos y Efectos Simples .......................................................... 57


6.1 Uso del procedimiento PROC SORT ..................................................................... 57
6.2 Análisis de Experimentos Repetidos ................................................................... 57
6.3 Análisis de Efectos Simples .................................................................................. 64

CAPITULO VII

Análisis de Covariancia ........................................................................................................... 71


Manual SAS. 4

7.1 Introducción ......................................................................................................... 71


7.2 Ejemplo de Aplicación ......................................................................................... 71
7.3 Programa en SAS .................................................................................................. 73
Manual SAS. 5

CAPITULO VIII

Otras Opciones del SAS ........................................................................................................... 78


8.1 Transformación de Datos ..................................................................................... 78
8.2 Colocación de Títulos y/o Etiquetas .................................................................... 80
8.3 Procesamiento Múltiple mediante un solo archivo ............................................. 80

BIBLIOGRAFÍA .......................................................................................................................... 82
Manual SAS. 6

CAPITULO I

INTRODUCCIÓN AL MANEJO DEL SAS PARA WINDOWS

El manejo del SAS para Windows, permite una mayor velocidad en la ejecución de los programas
y el manejo de teclas de función que dinamizan el uso del SAS.

1.1 INTRODUCCIÓN

Una vez que se ha instalado el SAS en un directorio, se teclea el icono SAS

del escritorio para invocar al programa SAS. El SAS para Windows tiene su presentación
inicial por tres ventanas, como son:
LOG, PROGRAM EDITOR y OUTPUT (Ver Gráfico Nº 01)
La primera ventana LOG, nos muestra el proceso del programa que esta en ejecución,
indica también los errores en el proceso del programa en caso que no se corra
satisfactoriamente.

Grafico N° 01

La segunda ventana PROGRAM EDITOR, es donde se digita el programa y el ingreso de


datos que van a ser analizados.

La ventana OUTPUT, es donde se presenta los resultados del programa SAS que se ha
ejecutado en el PROGRAM EDITOR de la ventana anterior.

Normalmente se presentan la primera y segunda ventana al iniciar el SAS y la tercera


ventana se presenta al correr el programa.

Ubicado el cursor en la ventana del PROGRAM EDITOR, vamos a la barra de menú (Ver
Gráfico Nº 02), al hacer clic con el botón izquierdo del mouse en lo correspondiente al
comando ‘File’, se muestra un menú en el que se puede llevar a cabo importantes funciones
Manual SAS. 7

como: abrir archivos (Open), grabar archivos (Save, Save as), imprimir (Print), correr
programa ( Run) y salir del programa (Exit).

Grafico N° 02

De igual modo, al hacer clic en el comando ‘Edit’ (Ver Gráfico Nº 03) aparece el menú que
permite realizar funciones principales como: copiar (Copy), pegar (Paste), borrar texto (Clear text)
seleccionar texto (Select all), buscar (Find) y Opciones (Options). En este ultimo comando al hacer
clic se presenta un submenú donde seleccionamos el comando ‘Numbers’ el mismo que permite
que aparezca una columna de números secuenciales lo que va a facilitar el ingreso de datos así
como para el programa que se digita.
Manual SAS. 8

Grafico N° 03

En el Gráfico Nº 04, al hacer clic en el comando ‘Help’ de la barra de menú, se despliega un


menú que nos muestra, entre otros importantes, el comando Key (teclas),

Grafico N° 04
Manual SAS. 9

1.2 EJECUCION DE UN PROGRAMA EN SAS

Luego de haber creado el programa SAS en el PROGRAM EDITOR, se puede ejecutar el


mismo de la siguiente manera:

Se da un click con el botón izquierdo del mouse al icono . de la barra de herramientas,


tomando unas fracciones de segundos para el procesamiento y presentación en la ventana
del OUTPUT.

En caso de que aparezca otra sentencia distinta, estaría indicando que el programa no ha
sido ejecutado satisfactoriamente. Ante esto se debe visualizar el programa en la ventana
LOG donde se podrá apreciar los errores que se cometieron en el programa, y luego de
corregir estos errores se procede a ejecutar nuevamente el programa.
Se puede retroceder o avanzar una página mediante las tecla Page Up o Page Down,
respectivamente. Los resultados OUTPUT, no lo podemos modificar en el SAS. Si
necesitamos modificarlo, primero se graba en el comando FILE y luego con un editor o un
procesador de textos (Word de Office 97 o 2000) se podrá modificar a nuestro criterio.

En caso de existir error en la corrida del programa, el SAS lo va detectar en la pantalla LOG,
en el cual se pueden identificar en donde radican las fallas. En caso de aparecer error se
tiene que realizar los siguientes pasos:

1 Ir a la ventana SASLOG para visualizar los errores.


El signo (-) debajo de una sentencia del programa, indica que se ha cometido un error y
muestra posteriormente las consecuencias en la ejecución de este error.

2 Mediante la tecla F5 se pasa a la pantalla correspondiente a PROGRAM EDITOR,


que es donde se escribió el programa y se observa que ésta se encuentra vacía.
Sin embargo si se pulsa la tecla F4 se puede llamar al programa SAS que se ha
ejecutado.

3 Se realizan las correcciones adecuadas. Sin embargo antes de ejecutar


nuevamente el programa, se deben limpiar las pantallas anteriores (OUTPUT y
LOG), caso contrario el SAS imprimirá los resultados a continuación pudiéndose
dar origen a ciertas confusiones. Por ello, luego de realizadas las correcciones
en PROGRAM EDITOR, se debe mover con F6 LOG y F7 OUTPUT y borrar
todo lo que se obtuvo en esas pantallas utilizando el comando CLEAR TEXT.

Recapitulando

1. Utilizar un nombre de 8 caracteres, como máximo, para el nombre del programa. El


programa SAS, es el archivo que contiene el programa que va a procesar los datos de
acuerdo al modelo requerido y teniendo en cuenta los procedimientos especificados.

2. En los datos a ser procesado. El lugar que ocupa cada variable debe ser especificado en
el programa SAS. Los datos pueden ser introducidos directamente en el programa SAS,
mediante la sentencia CARDS.

3. La ventana OUTPUT muestra los resultados de la ejecución del programa.


4. LOG, contiene la forma secuencial de ejecución del programa. Es de gran utilidad en caso de que la
ejecución no haya sido realizada en forma total o en forma parcial, ya que al visualizar el contenido de este
archivo, se pueden apreciar los errores que aparecen en el programa SAS.

5. Se puede de esta forma, a través de la ventana SASLOG, visualizar directamente el


error, sin necesidad de buscarlo en todo el programa SAS. Una vez realizada la
corrección en el programa, se puede proceder a ejecutar nuevamente el programa.
La estructura de DATOS así como el programa SAS son los que el operador debe crear, los resultados (OUTPUT) y
procesamiento del programa (LOG) los crea la máquina luego de que la ejecución del programa haya sido realizada.
Manual SAS. 10

1.3 TECLAS DE AYUDA

Las siguientes teclas de función son algunas de las muchas que posee el SAS y se invoca al
dar click en el comando help de la barra de menú y se selecciona keys, mostrando una
ventana con las descripciones siguientes:

F1 Help, permite visualizar la estructura de algunas sentencias, procedimientos o


comandos.
F4 Muestra el programa SAS ejecutado anteriormente.
F5 Muestra la ventana del PROGRAM EDITOR.
F6 Muestra la ventana LOG.
F7 Muestra la ventana de resultados OUTPUT.
F8 Ejecuta el programa SAS del PROGRAM EDITOR
F9 Keys, muestra las teclas de función con su respectiva función.

Se puede usar Page Up y Page Down para pasar a una página anterior o posterior,
respectivamente. Asimismo se puede usar Ctrl-Page Up ó ctrl-Page Down para ir al
principio o al final de un archivo (sobretodo en archivos OUTPUT).

Para salir de la ventana KEYS se da un click con el botón izquierdo del mouse en el
cuadrito con aspa de la esquina superior derecha de la ventana KEYS.

1.4 PROGRAMA EJEMPLO

Este primer programa servirá para tener una visión general del manejo de los comandos
básicos del SAS y un conocimiento de la sintaxis apropiada. La descripción de cada una
de las instrucciones usadas en este ejemplo se detallará en capítulos posteriores.

Suponga que desea realizar el análisis de variancia de los siguientes datos


correspondientes a 3 tratamientos, cada uno con 4 repeticiones, el diseño utilizado es el
diseño completamente al azar.

TRATAMIENTOS
Trat 1 Trat 2 Trat 3

35 33 35

37 35 39

36 38 43

34 29 41

Lo primero que se tiene que hacer es ubicarse en la ventana del PROGRAM EDITOR y
crear el programa SAS e incluir el conjunto de datos bajo las variables consideradas.

Dado que el modelo para el DCA es Yij = u + Ti + eij, donde Y es la variable respuesta, i =
1,2,3 (tratamientos) y j = 1,2,3,4 (repeticiones); y basándose en el lado izquierdo del modelo
Yij, deben existir en los datos una columna para la variable respuesta, otra para los
tratamientos y otra para las repeticiones. El conjunto de datos puede tener la siguiente
estructura:
1 1 35
1 2 37
1 3 36
Manual SAS. 11

1 4 34
2 1 33
2 2 35
2 3 38
2 4 29
3 1 35
3 2 39
3 3 43
3 4 41
Donde la primera columna es para los tratamientos (1, 2 y 3) la segunda columna es para
las repeticiones (1, 2, 3, y 4) y una última columna para los datos. Por ejemplo, el dato 35
corresponde al tratamiento 1 (trat 1) y repetición 1, y el último dato 41 corresponde al
tratamiento 3 (trat 3) y repetición 4. No interesa el orden de las variables en las columnas
de datos, es decir puede haberse escrito primero una columna para la variable respuesta,
luego una para repeticiones y una para tratamientos. Lo más importante es que todos los
datos que comprenden el análisis deben estar en el archivo y no deben existir datos
duplicados. Por ejemplo, se debe evitar lo siguiente:

1 3 37
1 3 36

Por cuanto este indicaría que existen dos datos que corresponden al primer tratamiento y a
la tercera repetición.

Una vez creado la estructura de datos se procede a incluirlo en el programa en la ventana


del PROGRAM EDITOR. El cual contiene las siguientes instrucciones:

DATA DCA;
TITLE ‘EJEMPLO DE DISEÑO COMPLETO AL AZAR’;
OPTIONS PAGESIZE=80 LINESIZE=60 NODATE NONUMBER;
INPUT TRATAMI 1 REPETI 3 RESPU 5-6;
CARDS;
1 1 35
1 2 37
1 3 36
1 4 34
2 1 33
2 2 35
2 3 38
2 4 29
3 1 35
3 2 39
3 3 43
3 4 41
;
PROC PRINT;
RUN;
PROC ANOVA;
CLASS TRATAMI REPETI ;
MODEL RESPU = TRATAMI;
MEANS TRATAMI / DUNCAN;
RUN;

Este programa consta de 12 sentencias. Note que cada sentencia termina con un punto y
coma (;).

La primera sentencia permite al SAS definir un archivo de ingreso al SAS, creará un archivo
temporal donde se depositarán los resultados de la ejecución del programa.
Manual SAS. 12

La segunda sentencia TITLE, es un nombre o titulo que se da al trabajo que se va a realizar


para diferenciarlo de otro cualquiera.

La tercera sentencia OPTIONS ..., Indica que los resultados se presentarán con un máximo
de 80 columnas (PAGESIZE=80) y 60 líneas por hoja (LINESIZE=60). La opción NODATE
evita que el SAS ponga en cada página de los resultados la fecha y hora del sistema en
que fue procesado el programa. La opción NONUMBER evita que enumere
automáticamente cada página.

La cuarta sentencia invoca al comando INPUT. En esta sentencia se especifican las


variables en el orden que se introdujeron los datos. Como el orden de las variables fue de
tratamientos, repeticiones y variable respuesta; es en este orden como se introducen en la
sentencia INPUT. El nombre correspondiente a cada variable debe tener como máximo 8
caracteres. Cuando ponemos TRATAMI 1, el 1 específica que posición o posiciones ocupa
la variable TRATAMI. Por ejemplo, cuando escribimos RESPU 5-6, estamos diciendo que
en la estructura de datos la variable respuesta ocupa posiciones que van desde el 5 hasta el
6.

PROC PRINT y PROC ANOVA nos invoca a dos procedimientos, el procedimiento de


impresión por pantalla PROC PRINT y el procedimiento de Análisis de Variancia PROC
ANOVA. El SAS realizas todos los análisis estadísticos mediante procedimientos, existiendo
procedimientos de acuerdo a un área o función determinada. Así existen procedimientos
para:

Análisis de Varianza PROC ANOVA, PROC GLM


Impresión de datos PROC PRINT
Análisis de Regresión PROC REG - PROC GLM
Ordenación de Datos PROC SORT
Ploteo de Datos PROC PLOT
Gráficas PROC CHART
Etc.

La sentencia PROC PRINT imprimirá en la ventana OUTPUT, los datos introducidos para
poder verificarlos. No es necesario para un programa en SAS, pero si es recomendable.

La siguiente sentencia PROC ANOVA, invoca al procedimiento ANOVA. La sentencia


CLASS define a las variables de clasificación que son las introducidas en el archivo de
datos, exceptuado la variable respuesta.

La sentencia MODEL define el diseño experimental a usar. Dado que es un DCA cuyo
modelo es Yij = u + Ti + eij este modelo es introducido en la sentencia MODEL teniendo en
cuenta lo siguiente:

1. El efecto de la media general no es introducido, por cuanto el SAS siempre lo va a tomar.

2. El efecto aleatorio de error experimental, tampoco es introducido, dado que el SAS lo


calcula como la diferencia entre la variación total y la suma de todos los efectos
especificados en el modelo.

3. Los nombres usados deben corresponder a los usados en la sentencia INPUT.

La instrucción MEANS TRATAMI / DUNCAN, realiza la Prueba de Comparación de Medias


de Duncan.

Note que tanto en las sentencias CLASS, MODEL y MEANS, los nombres de las variables
son los correspondientes a los que se definió en la sentencia INPUT.
Manual SAS. 13

CAPITULO II
INTRODUCCION DE DATOS

En este capítulo se verá como se realiza la introducción de los datos para que sean procesados
por el SAS, se analizará la sentencia INPUT, y el uso del procedimiento PROC PRINT

2.1 ENTRADA DE DATOS

Una de las formas más comunes de introducir los datos es creando una estructura de
datos, el cual posteriormente será invocado en el correspondiente programa SAS.

Para realizar el análisis de variancia correspondiente a un diseño experimental


determinado, lo que se debe tener en cuenta es el modelo aditivo lineal.

Por ejemplo, si el diseño es un Diseño Completamente al Azar, entonces:

Yij = u + Ti + eij
i=1,...,p (tratamientos)
j=1,...,r (repeticiones)

En este caso, de acuerdo a lo especificado en el lado izquierdo del modelo (Yij), y por tanto
en la estructura de datos se debe tener 3 columnas: una para la variable respuesta (Y), otra
para los tratamientos (i) y una ultima columna para las repeticiones (j).

Por ejemplo, si se tienen los siguientes resultados correspondientes a un DCA:

Repeticiones Tratamientos
1 2 3 4 5
1 9 16 17 10 19
2 13 16 17 10 19
3 8 11 21 15 24

4 12 13 11 11 28
5 10 15 22 8 25
6 15 12 18 9 26

Para poder introducir esta información, se crea una adecuada estructura de datos, Lo que
se ingresará después de la sentencia CARDS. En esta estructura se introducen los datos
teniendo en cuenta lo siguiente:

Cada uno de los datos debe tener su correspondiente valor para las otras variables
(tratamientos y repeticiones).

Todos los datos deben estar presentes, sin importar el orden. Tampoco interesa el orden en
que son introducidas las variables.

De acuerdo a lo enunciado, se puede empezar por ejemplo por el dato que se encuentra en
la parte superior izquierdo. Así el dato 9 corresponde al tratamiento 1 y repetición 1, luego
se puede ir con el siguiente dato, el 13 es el que corresponde al tratamiento 1 y repetición
2; y así sucesivamente hasta el último dato, el 26 es el que corresponde al tratamiento 5 y
repetición 6. Esto puede escribirse en el conjunto de datos de la siguiente manera:

9 1 1
13 1 2
8 1 3
Manual SAS. 14

12 1 4
10 1 5
15 1 6
16 2 1
16 2 2
11 2 3
13 2 4
15 2 5
12 2 6
17 3 1
17 3 2
21 3 3
11 3 4
22 3 5
18 3 6
10 4 1
10 4 2
15 4 3
11 4 4
8 4 5
9 4 6
19 5 1
19 5 2
24 5 3
28 5 4
25 5 5
26 5 6
Como bien se dijo, no importa que variable (respuesta, tratamientos o repeticiones) se
introduce primero, pero una vez que se ha definido un orden para el primer dato, éste debe
mantenerse en todo la estructura de datos. Por ejemplo, las siguientes líneas no son
válidas:
9 1 1
1 2 13

observe que, en la segunda línea se está indicando que el dato 1 corresponde al tratamiento
2 y repetición 13, lo cual es incorrecto.

Se debe asimismo, mantener una alineación de los datos en cada columna. Por ejemplo, la
siguiente líneas no son válidas:
9 1 1
13 1 2

El 13 no está alineado con el 9, el SAS lo que hará es tomar al 9 como 90 o tomar al 13


como 1, dependiendo de como se han definido los datos en el programa SAS.

Otras dos reglas para la introducción de datos, son las siguientes:

1. Los datos pueden ser introducidos sin ninguna separación. En el ejemplo anterior, los
datos correspondientes a cada variable se digitaron en cada columna con uno o más
espacios de separación. Sin embargo también pudieron haber sido digitados de la
siguiente manera:

911
1312
813
.
.
.
Manual SAS. 15

1731
1732
2133
.
.
.
2854
2555
2656

Para que el SAS reconozca que la línea 911 significa que la variable respuesta 9
corresponde al tratamiento 1 y repetición 1, se debe especificar este cambio en el
programa SAS, lo cual se verá posteriormente en este capítulo.

2. Los datos correspondientes a tratamientos y repeticiones se introdujeron como variables


numéricas (1, 2, etc), pero también se pueden introducir como variables alfanuméricas,
como A, B, C, ó Tomasa, Perricholli, Yungay, etc.; de la siguiente manera:

9 Yungay 1
13 Yungay 2
8 Yungay 3
.
.
.
17 Tomasa 1
17 Tomasa 2
21 Tomasa 3
.
.
.
28 Perricholli 4
25 Perricholli 5
26 Perricholli 6

Hay que tener en cuenta, que como se tratan de datos alfanuméricos, sus datos deben
estar alineados a la izquierda. Note asimismo, que debido a que el dato correspondiente
a Perricholli ocupa el mayor número de caracteres en la columna de tratamientos, los
datos correspondientes a repeticiones deben de estar alineados teniendo en cuenta el
dato de repetición correspondiente a este tratamiento.

2.2 OTROS MODELOS

Diseño Bloque Completo al Azar


Suponga los siguientes datos:

Bloques Tratamiento
A B C
I 13.2 12.2 11.4
II 14.3 11.6 12.3
III 13.0 12.0 12.9
IV 19.1 16.5 15.1

El modelo correspondiente es el siguiente:

Yij = u + Bj + Tj + eij
i=1,...,3 (tratamientos)
j=1,...,4 (bloques)
Manual SAS. 16

En este caso, nuevamente se debe tener en cuenta la variable Yij, la que indica que debe
existir una columna para la variable respuesta, otra para la variable tratamientos y otra para
la variable bloques. El conjunto de datos puede tener la siguiente estructura:

A I 132
B I 222
C I 114
A II 143
B II 116
C II 123
A III 130
B III 120
C III 129
A IV 191
B IV 165
C IV 151

Donde la primera columna específica la variable tratamientos, la segunda columna


específica la variable bloque y la última la variable respuesta. En este conjunto de datos se
han utilizado para las variables tratamientos y bloques, datos de tipo alfanumérico.
Asimismo, note que los datos correspondientes a la variable respuesta fueron digitados sin
el punto decimal, para que sea más rápida la introducción de datos. Esto no afecta en
absoluto el análisis si especificamos este cambio en el archivo de programa SAS.

Diseño Cuadrado Latino

Suponga los siguientes datos:

Partos (j) Razas (k)


R1 R2 R3 R4
Parto 1 41 (1) 36 (2) 40 (3) 43 (4)
Parto 2 40 (3) 26 (1) 25 (4) 27 (2)
Parto 3 39 (4) 38 (3) 30 (2) 36 (1)
Parto 4 28 (2) 29 (4) 34 (1) 38 (3)

El modelo correspondiente es el siguiente:

Yij(k) = u + Ti + Bj + Pj + eijk
i = 1,...,4 (tratamientos)
j = 1,...,4 (bloques)
k = 1,...,4 (columna)

En este caso, teniendo en cuenta la variable Yij(k) deben existir en la estructura de datos 4
columnas, una para la variable respuesta, otra para la variable tratamientos otra para la
variable bloques y una última para la variable columna. El conjunto de datos puede tener la
siguiente estructura:

R1 PARTO 1 1 41
R1 PARTO 2 3 40
R1 PARTO 3 4 39
R1 PARTO 4 2 28
R2 PARTO 1 2 36
R2 PARTO 2 1 26
R2 PARTO 3 3 38
R2 PARTO 4 4 29
R3 PARTO 1 3 40
Manual SAS. 17

R3 PARTO 2 4 25
R3 PARTO 3 2 30
R3 PARTO 4 1 34
R4 PARTO 1 4 43
R4 PARTO 2 2 27
R4 PARTO 3 1 36
R4 PARTO 4 3 38

Arreglo Factorial conducido en Bloques Completos

Suponga los siguientes datos:


Bloques a1 a2
b1 b2 b1 b2
I 54 50 65 59
II 58 51 65 61
III 58 53 65 67
IV 65 58 68 69
V 68 60 69 65

El modelo correspondiente es el siguiente:

Yijk = u + i + Bj + (B)ij + Pk + eijk

i = 1,2 (niveles del factor A)


j = 1,2 (niveles del factor B)
k = 1,...,5 (bloques)

En este caso, teniendo en cuenta la variable Yijk deben existir en la estructura de datos 4
columnas, una para la variable respuesta, otra para la variable del factor A, otra para la
variable de factor B y una última para la variable bloques. El conjunto de datos puede
tener la siguiente estructura:

54 1 1 1
58 1 1 2
58 1 1 3
65 1 1 4
68 1 1 5
50 1 2 1
51 1 2 2
53 1 2 3
58 1 2 4
60 1 2 5
63 2 1 1
65 2 1 2
65 2 1 3
68 2 1 4
69 2 1 5
59 2 2 1
61 2 2 2
67 2 2 3
69 2 2 4
65 2 2 5

Donde la primera columna es para la variable respuesta, la segunda para el factor A, la


tercera para el factor B y la última para el factor Bloques.
Manual SAS. 18

2.3 USO DE LA SENTENCIA INPUT - PROC PRINT

Una vez establecido la estructura de datos, se puede proceder a crear el programa SAS.
Para el ejemplo del Diseño Completamente al Azar, el programa SAS puede tener
inicialmente estas sentencias:
DATA DCA;
TITLE ‘Experimento en DCA’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATE NONUMBER;
INPUT RESPU 1 -2 TRATAMI 4 REPET 6;
CARDS;
9 1 1
13 1 2
8 1 3
12 1 4
10 1 5
15 1 6
16 2 1
16 2 2
11 2 3
13 2 4
15 2 5
12 2 6
17 3 1
17 3 2
21 3 3
11 3 4
22 3 5
18 3 6
10 4 1
10 4 2
15 4 3
11 4 4
8 4 5
9 4 6
19 5 1
19 5 2
24 5 3
28 5 4
25 5 5
26 5 6
;
PROC PRINT;
RUN;

Nota: Las sentencias debe estar finalizadas y separadas con un punto y coma (;). Caso contrario; el
SAS tomará a las sentencias que no ha sido separadas por el punto y como (;) como una sola.

OPTIONS LINESIZE=80 PAGESIZE=60 NODATE NONUMBER;

Permite que se impriman como máximo 60 líneas y 80 columnas por hoja, que no se
enumeren las hojas y que no ponga la hora y fecha del sistema en cada hoja.
Manual SAS. 19

80 columnas I
60

l
í
n
e
a
s
I

En la siguiente sentencia, la instrucción INPUT, permite al programa DCA, reconocer las


variables introducidas en la estructura de datos. Según el ejemplo anterior de datos DCA
que tiene la siguiente estructura:

9 1 1
13 1 2
.
.
Donde la primera variable es la variable respuesta, la segunda variable es la de
tratamientos y la última es la de repeticiones. Este es el orden como deben introducirse las
variables en la instrucción INPUT, así:

INPUT RESPU 1-2 TRATAMI 4 REPETI 6;

Lo cual indica que la variable RESPU ocupa la posición 1 y 2, la variable TRATAMI ocupa la
posición 4 y la variable REPETI ocupa la posición 6. Los nombres de las variables pueden
ser los que se hayan considerado los más adecuados, pero teniendo en cuenta que no
deben tener más de 8 caracteres y se debe procurar poner un nombre relacionado con la
variable.

La sentencia PROC PRINT realiza la impresión en la ventana de resultados (OUTPUT) del


programa y los datos introducidos conforme a la sentencia INPUT. Este procedimiento no es
necesario para realizar el análisis estadístico, pero si es recomendable para chequear con
que datos se va a realizar éste análisis, sobretodo si los datos fueron introducidos sin
separación entre las variables o sin punto decimal.

Si ahora se ejecuta el programa SAS, dando un click con el mouse al icono


se obtendrá el resultado en la ventana OUTPUT con el nombre del archivo SAS, en el cual
se puede apreciar lo siguiente:

Diseño Completo al Azar

OBS RESPU TRATAMI REPETI

1 9 1 1
2 13 1 2
3 8 1 3
4 12 1 4
5 10 1 5
6 15 1 6
7 16 2 1
Manual SAS. 20

8 16 2 2
9 11 2 3
10 13 2 4
11 15 2 5
12 12 2 6
13 17 3 1
14 17 3 2
15 21 3 3
16 11 3 4
17 22 3 5
18 18 3 6
19 10 4 1
20 10 4 2
21 15 4 3
22 11 4 4
23 8 4 5
24 9 4 6
25 19 5 1
26 19 5 2
27 24 5 3
28 28 5 4
29 25 5 5
30 26 5 6
Donde:

1. Muestra el resultado del procedimiento PROC PRINT, en el aparecen los datos y


variables que se introdujeron en la estructura de datos y que fueron definidos en la
sentencia INPUT. En esta parte se añade una columna correspondiente a observaciones
(OBS), ésta hace corresponder a cada dato de la variedad respuesta un número
correlativo en forma ascendente, el último valor (30), permite visualizar rápidamente si el
programa SAS está trabajando con el número adecuado de datos.

2.4 OTROS CASOS

Se desarrollará en este apartado, los demás casos tratados en la parte de introducción de


datos.
▪ Si los datos fueron introducidos sin separación entre las variables como en el siguiente
caso:

911
1312
.
.

En este caso, lo que se tiene que cambiar es la sentencia INPUT. Esta tendrá la siguiente
forma:

INPUT Y 1-2 TRATAMI 3 REPETI 4;

con lo cual hará que el SAS tome los datos en forma correcta. Si posteriormente se ejecuta
el programa SAS, el resultado será idéntico al realizado anteriormente.

▪ Si los datos involucran variables alfanuméricas como por ejemplo:

9 Yungay 1
13 Yungay 2
8 Yungay 3
.
.
Manual SAS. 21

28 Perricholli 4
.
.

La sentencia INPUT será:

INPUT Y 1-2 TRATAMI $ 4-14 REPETI 16;

como en la columna correspondiente a la variable tratamiento el tratamiento de mayor


longitud es Perricholli, se le tomará en cuenta para definir la posición de TRATAMI. Note
que entre el nombre de la variable (TRATAMI) y la posición (4-14) aparece el signo de dólar
($). Este símbolo le indica al SAS que los datos que van desde la posición 4 hasta la
posición datos alfanuméricos.

▪ Si el archivo de datos contiene información sin el punto decimal, como es el caso del
ejemplo de Diseño de Bloques, cuya estructura de datos es:

A I 132
B I 122
.
.
A III 130
B III 120
.
.

se especifica el punto decimal en los datos en la siguiente sentencia INPUT.

INPUT TRATAMI $ 1 BLOQUES $ 3-5 REPETI 7-9 1;

La última parte de la sentencia RESPU 7-9 1, le está indicando el SAS que tome a los datos
de la variable respuesta desde la posición 7 hasta la 9, el número 1 digitado posteriormente
le indica que desde la última posición especificada (9) corra un (1) dígito a la izquierda y
ponga el punto decimal a todos los datos. Es decir que si se introdujo 132 lo va a tomar
como 13.2. Supongamos que hubiéramos tenido los siguientes datos:

A I 21324
B I 31225
C I 51146
.
.
A III 51306
.
.

Para indicar al SAS que los datos correspondiente a la variable respuesta son 213.24,
312.25, 511.46, etc., se debe poner la siguiente sentencia INPUT.

INPUT TRATAMI $ BLOQUES $ 3-5 RESPU 7-11 2;

con lo que tomaría a la última como 21324 (7-11), y luego correría dos (2) dígitos
empezando del último y hacia la izquierda del número para poner el punto decimal y que sea
leído como 213.24

▪ Para el ejemplo de Cuadrado Latino, cuyo datos fueron:

R1 PARTO1 1 41
R1 PARTO2 3 40
Manual SAS. 22

R1 PARTO3 4 39
.
.

la sentencia INPUT, correspondiente podrá ser:

INPUT RAZAS $ 1-2 PARTOS $ 4-9 TRATAMI 11 RENDI 13-14;

En el caso del Arreglo Factorial, tenemos los datos:


54 1 1 1
58 1 1 2
58 1 1 3
65 1 1 4
.
.

luego la sentencia INPUT, será el siguiente:

INPUT RESPU 1-2 A 4 B 6 BLOQUES 8;

NOTA : En el caso que los datos correspondientes a cada variable fueron introducidos con
su respectivo punto decimal y por lo menos un espacio en blanco de separación entre cada
columna; no es necesario especificar la posición que ocupa cada variable. Así, en el último
caso la siguiente sentencia INPUT proporciona los mismos resultados:

INPUT RESPU A B BLOQUES;


Manual SAS. 23

CAPITULO III

ANALISIS DE EXPERIMENTOS BALANCEADOS

Este capítulo se estudiará como hacer programas que involucren diseños balanceados, mediante
el uso del procedimiento PROC ANOVA

3.1 INTRODUCCION

Se entiende por diseño balanceados, aquel que tenga un igual número de repeticiones por
tratamiento.

Si se tiene datos balanceados, se puede realizar el análisis estadístico mediante el uso


procedimiento PROC ANOVA (Procedimiento de Análisis de Variancia). En cambio, si
poseen datos no balanceados, se debe usar el procedimiento PROC GLM (Procedimiento
de Modelo Lineal General).

NOTA : Si se usa el procedimiento PROC ANOVA para datos que no son


balanceados, se puede obtener resultados incorrectos, los cuales pueden incluir la
obtención de sumas de cuadrados negativos. El SAS verifica si sus datos corresponden o
no a un diseño balanceado y recomienda el procedimiento de análisis a usar.

3.2 ESPECIFICACIÓN DEL MODELO

Como se dijo los capítulos anteriores, lo que se debe tener en cuenta es el modelo
estadístico correspondiente al diseño usado. En el capítulo 2 se vio como introducir los
datos para diferentes diseños, resta ver como se introduce el modelo para el análisis
estadístico.

Para la especificación del diseño tenemos que tener en consideración lo siguiente:

1. El efecto de la media general no es introducido, por cuanto el SAS siempre lo toma.

2. El efecto aleatorio del error experimental, tampoco es introducido, dado que el SAS lo
calcula como la diferencia entre la variación total y la suma de todos los efectos
especificados en el modelos.

3. Los efectos especificados en el modelo se introducen con un espacio de separación, sin


necesidad de introducir el signo más (+).

Los nombres usados deben corresponder a los usados en la sentencia INPUT.

A continuación se presentan los modelos correspondientes a los diseños vistos


anteriormente, y debajo la forma como deben ser introducidos en un programa SAS.

Diseño Completamente al Azar

Yij = u + Ti + eij

Y = TRATAMI

Diseño Bloque Completo al Azar

Yij = u + Bj + Ti + eij

Y = BLOQUES TRATAMI
Manual SAS. 24

Diseño Cuadrado Latino

Yij = u + Bj + Pk + Ti + eij

Y = COLUMNA FILA TRATAMI

Arreglo Factorial en Bloque Completo al Azar

Yij = u + Pk + i + Bj + (B)ij + eij

Y = BLOQUES A B A*B
Cabe resaltar que el nombre utilizado para denominar a las variables pueden ser cualquiera
que sea válido en SAS (con un máximo de 8 caracteres), siendo de preferencia el uso de
nombres relacionados con la variable usada (por ejemplo BLOQUES).

3.3 DESCRIPCION DEL PROC ANOVA


El procedimiento PROC ANOVA, tiene las siguientes estructura:
PROC ANOVA;
BY variables;
CLASS variables;
MODEL variable respuesta = efectos;
MEANS efectos / opciones;
TEST H= efectos E = efecto;

La sentencia CLASS debe siempre preceder a la sentencia MODEL. EL uso de la sentencia


TEST y BY se verá en posteriores capítulos.

La sentencia CLASS especifica a las variables de clasificación, estas son todas aquellas
especificadas en las sentencia INPUT, exceptuando la variable respuesta.

Por ejemplo, para el caso del DCA visto anteriormente se tiene:

CLASS REPETI TRATAMI;

La sentencia MODEL, especifica el modelo a usar y de esta sentencia dependerá que el


análisis corresponda a un diseño DCA o a un Bloque Completo al Azar. Por ejemplo, para el
caso de DCA, se tiene:

MODEL Y = TRATAMI;

La sentencia MEANS, permite calcular promedios de los efectos específicos en esta


sentencia. Su uso más importante es mediante sus opciones, las cuales permiten realizar
pruebas de comparación de medias como DUNCAN, T, LSD, SCHEFFE, TUKEY, etc. Las
siguientes opciones pueden aparecer en la sentencia MEANS después del slash (/):

DUNCAN Realiza la prueba de Comparación de Duncan de los promedios de los efectos


principales especificados en la sentencia MEANS.
SCHEFFE Realiza la prueba de Scheffe
T, LSD Realiza la prueba de t
TUKEY Realiza la prueba de TUKEY
E= efecto Especifica el cuadrado medio del error a usar en la prueba de comparación. Su
uso se verá en posteriores capítulos.
ALPHA =  Especifica el nivel de seguridad. Por efecto toma el valor de 0.05. Se pueden
especificar valores como 0.01, 0.15 ó 0.01
Manual SAS. 25

Por último, resta decir que el PROC ANOVA trabaja bajo el supuesto del modelo I; es decir,
cuando los niveles del factor o de los factores han sido fijados, y por tanto se utiliza en la
prueba de F al Cuadrado Medio del Error como denominador. Esta prueba F no es válida
para el caso de trabajar con modelo II o modelos mixtos, por cuanto los denominadores de
las pruebas de F cambian.
Sin embargo, se enseñara posteriormente como poder resolver este problema mediante el
uso de la sentencia TEST.

3.4 EJEMPLO DE APLICACION

Para un mejor entendimiento se desarrolla un ejemplo en DCA en la forma que se hace


manualmente, luego se presenta el programa SAS y por último como el SAS lo presenta.

Se utilizará el ejemplo en DCA descrito en el capítulo anterior.

Repet. Tratamientos
1 2 3 4 5
1 9 16 17 10 19
2 13 16 17 10 19
3 8 11 21 15 24

4 12 13 11 11 28
5 10 15 22 8 25
6 15 12 18 9 26

Cuadro ANVA

F.V. GL SC CM Fc Ft 0.05
Tratamiento 4 692.67 173.1675 18.66 2.76
Error 25 232.00 9.2800
Total 29 922.67

C.V. = 19.86723 %
Prueba de Duncan
GL Error = 25  = 0.05 Número de Promedios = 5
Tratamiento 4 1 2 3 5
Promedios 10.5 11.16 13.83 17.66 23.5

P 2 3 4 5
AES(D) 2.92 3.07 3.15 3.22
ALS(D) 3.63 3.82 3.92 4.00

Conclusión:

T4 T1 T2 T3 T5

El programa DCA SAS correspondiente es el siguiente:

DATA DCA;
TITLE ‘Experimento en DCA’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATE NONUMBER;
INPUT RESPU 1- 2 TRATAMI 4 REPETI 6;
Manual SAS. 26

CARDS;
9 1 1
13 1 2
8 1 3
12 1 4
10 1 5
15 1 6
16 2 1
16 2 2
11 2 3
13 2 4
15 2 5
12 2 6
17 3 1
17 3 2
21 3 3
11 3 4
22 3 5
18 3 6
10 4 1
10 4 2
15 4 3
11 4 4
8 4 5
9 4 6
19 5 1
19 5 2
24 5 3
28 5 4
25 5 5
26 5 6
;
PROC PRINT;
RUN;
PROC ANOVA;
CLASS TRATAMI REPETI;
MODEL RESPU = TRATAMI;
MEANS TRATAMI / DUNCAN;
RUN;

Note que al programa DCA SAS desarrollado en el capítulo anterior se le han agregado 4
líneas para poder realizar el Análisis de Variancia.

La primera sentencia añadida, PROC ANOVA, invoca al procedimiento ANOVA para realizar
el análisis de variancia de datos balanceados

La segunda sentencia
CLASS TRATAMI REPETI;

Especifica cuales de las variable introducidas en el archivo de datos y especificadas en la


sentencia INPUT son variables de clasificación. Como ya se mencionó, estas son todas
aquellas especificadas en la sentencia INPUT exceptuando a la variable respuesta.

La tercera sentencia
MODEL RESPU = TRATAMI;

Especifica con cual modelo se va a realizar el análisis de variancia y por tanto con cual
diseño se trabaja.
Manual SAS. 27

La última sentencia
MEANS TRATAMI / DUNCAN;

especifica que se va a realizar la prueba de comparación de medias de DUNCAN. Se pudo


haber incluido otras pruebas de comparación. Por ejemplo, la sentencia:

MEANS TRATAMI / DUNCAN LSD TUKEY;

realiza las pruebas de Duncan, DLS y de TUKEY

Si ahora se ejecuta el programa DCA , dando un click al icono de la barra de


herramientas. Podemos visualizar en caso de no haber errores en la ejecución, en la
ventana OUTPUT los siguientes resultados:

Diseño Completo al Azar

OBS RESPU TRATAMI REPETI

1 9 1 1
2 13 1 2
3 8 1 3
4 12 1 4
5 10 1 5
6 15 1 6
7 16 2 1
8 16 2 2
9 11 2 3
10 13 2 4
11 15 2 5
12 12 2 6
13 17 3 1
14 17 3 2
15 21 3 3
16 11 3 4
17 22 3 5
18 18 3 6
19 10 4 1
20 10 4 2
21 15 4 3
22 11 4 4
23 8 4 5
24 9 4 6
25 19 5 1
26 19 5 2
27 24 5 3
28 28 5 4
29 25 5 5
30 26 5 6
Manual SAS. 28

Diseño Completo al Azar

Analysis of Variance Procedure


Class Level Information

1 2 3
Class Levels Values

TRATAMI 5 1 2 3 4 5

REPETI 6 1 2 3 4 5 6

4 Number of observations in data set = 30

Diseño Completo al Azar


Analysis of Variance Procedure

Dependent Variable: RESPU


9 10 12 13
8
Sum of Mean
Source DF Squares Square F Value Pr > F
6
Model 4 690.66666667 172.66666667 18.61 0.0001

Error 25 232.00000000 9.28000000


7 11

Corrected Total 29 922.66666667

5
R-Square C.V. Root MSE RESPU Mean
0.748555 19.86723 3.0463092 15.333333

14 15 16 17

19 20 21 22

Source 18 DF Anova SS Mean Square F Value Pr > F

TRATAMI 4 690.66666667 172.66666667 18.61 0.0001

Diseño Completo al Azar

Analysis of Variance Procedure


23 Duncan's Multiple Range Test for variable: RESPU

NOTE: This test controls the type I comparisonwise error rate,


not the experimentwise error rate

24 25 26

Alpha= 0.05 df= 25 MSE= 9.28

27

Number of Means 2 3 4 5
Critical Range 3.622 3.805 3.922 4.006
Manual SAS. 29

Means with the same letter are not significantly different.

31 30 29 28

Duncan Grouping Mean N TRATAMI

A 23.500 6 5
B 17.667 6 3
C 13.833 6 2
C
C 11.167 6 1
C
C 10.500 6 4

Donde los números encerrados en un círculo representan:

Para la sentencia CLASS:


1. El nombre de cada variable de clasificación en la sentencia CLASS.
2. El número de valores o niveles de las variables de clasificación.
3. Los valores de las variables de clasificación.
4. El número de observaciones en el archivo de datos y el número de datos excluidos del
análisis debido a valores perdidos, en caso los hubiera.

Para la sentencia MODEL:


5. La Fuente de Variación del Total para la variable respuesta.
6. La Suma de Cuadrados de todos los efectos especificados en la sentencia MODEL. En
el caso de DCA, esta es la suma de cuadrados de Tratamientos. Por ser el único efecto
introducido en la sentencia MODEL
7. La Fuente de Variación atribuido al Error.
8. Los Grados de Libertad (G.L.)
9. Las Sumas de Cuadrados.
10. Los Cuadrados Medios
11. El Cuadrado Medio del Error
12. El valor del estadístico de prueba F.
13. La probabilidad de significancia asociada con el estadístico F. En el caso de ser este
valor PR > F menor del nivel de seguridad escogido (0.05 ó 0.01), se rechaza la Hp, y
se concluye que existen diferencias significativas o altamente significativas según sea el
nivel de seguridad escogido ().
14. El coeficiente de determinación R2
15. El coeficiente de Variabilidad (C.V)
16. La raíz cuadrada del Cuadrado Medio del Error.
17. El promedio de la variable respuesta

Para cada efecto o fuente de variación especificada en la sentencia MODEL, se tiene:


18. Los Grados de Libertad
19. Las Sumas de Cuadrados
20. Los Cuadrados Medios
21. El valor del estadístico de prueba
22. La probabilidad de significancia asociada con el estadístico F.

Para la sentencia MEANS, se tiene:


23. Indica la realización de la prueba de DUNCAN
24. El nivel de seguridad ()
25 Los Grados de Libertad del Error.
26 El cuadrado Medio del Error
27. Los valores de las amplitudes y Límites de Significación de Duncan [(ALS(D)], para cada
comparación de promedios posible.
Manual SAS. 30

28. Valores o nombres de los tratamientos previamente ordenados de mayor a menor.


29. Número de repeticiones de cada uno de los tratamientos comparados.
30. Promedios de los tratamientos ordenados en forma descendente.
31 Conclusión de la Prueba de Duncan en un diagrama de líneas, presentado en forma
vertical. Los tratamientos que tengan la misma letra implican que no existen diferencias
significativas entre ellos y por tanto se puede unir mediante una línea.

PRESENTACION DE OTROS EJEMPLOS

Se presentan los correspondientes a los diseños presentados en capítulos anteriores

Diseño Bloque Completo al Azar

Los datos de un DBCA, y su estructura fueron introducidos en el programa DBCA bajo SAS,
el que consta de las siguientes sentencias:

data dbca;
title ‘Experimento en DBCA’;
options linesize=80 pagesize=60 nodate nonumber;
input tratami $ 1 bloques $ 3-5 respu 7-9 1;
cards;
A I 132
B I 122
C I 114
A II 143
B II 116
C II 123
A III 130
B III 120
C III 129
A IV 191
B IV 165
C IV 151
;
proc print;
run;
proc anova;
class tratami bloques;
model respu = bloques tratami;
means tratami / duncan;
run;

Para el ejemplo de Cuadrado Latino, cuyos datos fueron introducidos en el programa bajo
SAS es el siguiente:

data dcl;
title ‘Experimento en DCL’;
options linesize=80 pagesize=60 nodate nonumber;
input razas $ 1-2 partos $ 4 –9 tratami 11 rendi 13-14;
cards;
R1 PARTO1 1 41
R1 PARTO2 3 40
R1 PARTO3 4 39
R1 PARTO4 2 28
R2 PARTO1 2 36
R2 PARTO2 1 26
R2 PARTO3 3 38
R2 PARTO4 4 29
R3 PARTO1 4 40
R3 PARTO2 3 25
R3 PARTO3 2 30
R3 PARTO4 1 34
R4 PARTO1 4 43
R4 PARTO2 2 27
R4 PARTO3 1 36
R4 PARTO4 3 38
Manual SAS. 31

;
proc print;
run;
proc anova;
class razas partos tratami ;
model rendi = razas partos tratami;
means tratami / t duncan;
run;

Para el caso del Arreglo Factorial en Bloques Completo al Azar, cuya estructura de datos
se introdujo en el programa bajo el SAS se tiene lo siguiente:
data factor;
title ‘Arreglo factorial en DBCA’;
options linesize=80 pagesize=60 nodate nonumber;
input respu 1-2 A 4 B 6 bloques 8;
cards;
54 1 1 1
58 1 1 2
58 1 1 3
65 1 1 4
68 1 1 5
50 1 2 1
51 1 2 2
53 1 2 3
58 1 2 4
60 1 2 5
63 2 1 1
65 2 1 2
65 2 1 3
68 2 1 4
69 2 1 5
59 2 2 1
61 2 2 2
67 2 2 3
69 2 2 4
65 2 2 5
;
proc print;
run;
proc anova;
class A B bloques;
model respu = bloques a b a*b;
means a b / duncan;
run;
Manual SAS. 32

CAPITULO
IV
ANALISIS DE EXPERIMENTOS NO BALANCEADOS

4.1 INTRODUCCION

Alternativamente al procedimiento ANOVA para Diseños Experimentales se tiene el


procedimiento GLM el cual es usado para el caso de los experimentos no balanceados,
esto es, experimentos donde hay desigual número de repeticiones por tratamiento. Sin
embargo el procedimiento PROC GLM también puede ser usado para el caso de
experimentos balanceados, pero en estos casos es preferible utilizar el procedimiento
ANOVA ya que este es más eficiente al procesar los datos que el GLM.

4.2 DESCRIPCION DEL PROC GLM

El procesamiento PROC GLM tiene la siguiente estructura:


PROC GLM ;
By variables ;
CLASS variables ;
MODEL variable respuesta = efectos ;
TEST H = efectos E = efecto ;
CONTRAST ‘etiquetas’  efectos evaluados / opciones ;
‘o títulos’
LSMEANS efectos / PDIFF ;
Las sentencias CLASS, MODEL y MEANS ya fueron descritas en el procedimiento
ANOVA; las sentencias TEST, LSMEANS y BY serán descriptas posteriormente en otros
capítulos. En este capítulo se hará la descripción detallada de las sentencias
CONTRAST.

La sentencia CONTRAST permite realizar las pruebas de contrastes ortogonales mediante


la prueba de significación F. En el caso de experimentos con arreglo factorial se pueden
realizar las pruebas de tendencia lineal, cuadrática, cúbica, etc.; para todos los factores y
sus interacciones. La siguiente opción puede aparecer en la sentencia CONTRAST
después del slash ( / ).

E = efecto

Especifica un efecto de modelo para ser usado como término de error (denominador). Si
esta opción no es especificada el cuadrado medio del error (CME) será usado.

Esta opción de la sentencia CONTRAST es de particular importancia en los diseños de


efectos aleatorios, modelos mixtos, parcelas divididas, etc. Y será vista con un ejemplo en
el capítulo de parcelas divididas.

4.3 EJEMPLOS DE APLICACION

A continuación se presentan algunos ejemplos con la finalidad de aclarar el uso de la


sentencia CONTRAST.

Inicialmente se presentan en los cálculos manuales y luego los resultados obtenidos


usando el SAS, para finalmente dar una descripción de los resultados.

EJEMPLO 1

El primer ejemplo será el mismo que ha sido desarrollado por el PROC ANOVA, por lo cual
no se presentarán los cálculos manuales.
Manual SAS. 33

El programa GLM bajo SAS es el siguiente:


data abc;
title ‘Experimento DCA bajo GLM’;
options ls =80 ps=55 nodate nonumber;
input trata repeti
cards;
1 1 9
1 2 13
1 3 8
1 4 12
1 5 10
1 6 15
2 1 16
2 2 13
2 3 11
2 4 13
2 5 15
2 6 12
3 1 17
3 2 17
3 3 21
3 4 11
3 5 22
3 6 18
4 1 10
4 2 10
4 3 15
4 4 11
4 5 8
4 6 9
5 1 19
5 2 19
5 3 24
5 4 28
5 5 25
5 6 26
;
proc print ;
run;
proc glm ;
class trata repeti ;
model y = trata ;
means trata / duncan ;
run;

Note que con relación al programa DCA bajo SAS, desarrollado para el procedimiento
ANOVA se le ha cambiado el nombre de las variables, así como la ubicación de las
mismas en la estructura de datos las cuales están especificadas en la sentencia INPUT.

La sentencia PROC GLM invoca al procedimiento GLM (General Linear Model : Modelo
Lineal General) para realizar el análisis de variancia, las sentencias CLASS, MODEL y
MEANS especifican lo mismo que el PROC ANOVA.

Luego de ejecutar el programa GLM bajo SAS se obtendrán los siguientes resultados en la
ventana OUTPUT:

Diseño Completo al Azar

OBS TRATA REPETI Y


1 1 1 9
2 1 2 13
3 1 3 8
4 1 4 12
5 1 5 10
6 1 6 15
Manual SAS. 34

7 2 1 16
8 2 2 16
9 2 3 11
10 2 4 13
11 2 5 15
12 2 6 12
13 3 1 17
14 3 2 17
15 3 3 21
16 3 4 11
17 3 5 22
18 3 6 18
19 4 1 10
20 4 2 10
21 4 3 15
22 4 4 11
23 4 5 8
24 4 6 9
25 5 1 19
26 5 2 19
27 5 3 24
28 5 4 28
29 5 5 25
30 5 6 26

Diseño Completo al Azar

General Linear Models Procedure


Class Level Information

Class Levels Values

TRATA 5 1 2 3 4 5
REPETI 6 1 2 3 4 5 6

Number of observations in data set = 30

Diseño Completo al Azar

General Linear Models Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 4 690.66666667 172.66666667 18.61 0.0001

Error 25 232.00000000 9.28000000

Corrected Total 29 922.66666667

R-Square C.V. Root MSE Y Mean

0.748555 19.86723 3.0463092 15.333333

Source DF Type I SS Mean Square F Value Pr > F

TRATA 4 690.66666667 172.66666667 18.61 0.0001

Source DF Type III SS Mean Square F Value Pr > F

TRATA 4 690.66666667 172.66666667 18.61 0.0001

General Linear Models Procedure

Duncan's Multiple Range Test for variable: Y


Manual SAS. 35

NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate

Alpha= 0.05 df= 25 MSE= 9.28

Number of Means 2 3 4 5
Critical Range 3.622 3.805 3.922 4.006

Means with the same letter are not significantly different.

Duncan Grouping Mean N TRATA

A 23.500 6 5
B 17.667 6 3
C 13.833 6 2
C
C 11.167 6 1
C
C 10.500 6 4

Se puede observar en el contenido del programa GLM bajo SAS, que los resultados
obtenidos mediante el procedimiento GLM son similares a los resultados obtenidos
mediante el procedimiento ANOVA. La única diferencia aparente se da en que el PROC
GLM proporciona dos tipos de sumas de cuadrados para el efecto especificado (en este
caso TRATA), sin embargo estos valores son iguales y en términos interpretativos los
resultados también son idénticos.

EJEMPLO 2

Desarrollaremos un experimento en DCA con diferentes repeticiones para evaluar 4


espaciamientos de siembra. Los resultados se dan a continuación:

Repeticiones T1 T2 T3 T4
1 3 6 6 13
2 4 7 8 11
3 5 5 10 13
4 4 6 11
5 6

Cuadro ANVA
F.V. GL SC CM Fc Ft 0.05

Tratamientos 3 135.55 45.1833 24.423 3.49

Error 12 22.20 1.85

Total 15 157.75

C.V. = 18.4426 %
Prueba de Duncan
GL Error = 25  = 0.05 Número de Promedios = 5

Tratamientos 1 2 3 4

Promedios 4.4 6.0 7.5 12.0


Manual SAS. 36

P 2 3 4

AES (D) 3.08 3.23 3.33

ALS (D) 2.13 2.23 2.30

Conclusión

T1 T2 T3 T4

Prueba de Contraste Ortogonal

Prueba : T4 versus los demás tratamientos

C = u1 + u2 + u3 – 3 u4

F. V. Gl SC CM Fc

C 1 108.00329 108.00329 58.38 *

El programa para procesar los datos de este diseño mediante el paquete SAS son:

data abc ;
title ‘Experimento en DCA bajo GLM’;
options ls = 80 ps=55 nodate nonumber;
input trat 1 rep 2 rend 4-5;
cards;
11 3
12 4
13 5
14 4
15 6
21 6
22 7
23 5
31 6
32 8
33 10
34 6
41 13
42 11
43 13
44 11
;
proc print;
run;
proc glm ;
class trat rep ;
model rend = trat ;
means trat / duncan ;
contrast ‘ t4 vs los demas trata’ trat 1 1 1 -3 ;
run;
Manual SAS. 37

En este ejemplo se ha adicionado la sentencia CONTRAST con respecto a los ejemplo


anteriores. Esta sentencia pide realizar el contraste del tratamiento 4 versus los otros
tratamientos. La indicación para evaluar el contraste se identifica de la siguiente manera:

La sentencia CONTRAST seguida de un título o etiqueta para el contraste el cual debe de


ir entre apóstrofes y finalmente el efecto evaluado con los respectivos coeficientes para los
niveles del efecto. Así, si queremos realizar el contraste T1 versus T4 se especificará de la
siguiente manera:

CONTRAST ‘T1 vs T4’ TRAT 1 0 0 -1

Si se desea evaluar el contraste T1, T2 versus T3 se tendrá:

CONTRAST ‘ T1-T2 versus T3’ TRAT 1 1 -2 0

Note que los coeficientes tienen un espacio de separación el cual debe cumplirse para todos
los casos.

Al ejecutar el programa usando PROC GLM bajo SAS, se obtiene:

Diseño Completo al Azar

General Linear Models Procedure

Class Level Information

Class Levels Values

TRAT 4 1 2 3 4
REP 5 1 2 3 4 5

Number of observations in data set = 16

General Linear Models Procedure

Dependent Variable: REND


Sum of Mean
Source DF Squares Square F Value Pr > F

Model 3 135.55000000 45.18333333 24.42 0.0001


Error 12 22.20000000 1.85000000
Corrected Total 15 157.75000000

R-Square C.V. Root MSE REND Mean

0.859271 18.44267 1.3601471 7.3750000

Source DF Type I SS Mean Square F Value Pr > F

TRAT 3 135.55000000 45.18333333 24.42 0.0001

Source DF Type III SS Mean Square F Value Pr > F

TRAT 3 135.55000000 45.18333333 24.42 0.0001


Manual SAS. 38

Diseño Completo al Azar

General Linear Models Procedure

Duncan's Multiple Range Test for variable: REND

NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate

Alpha= 0.05 df= 12 MSE= 1.85


WARNING: Cell sizes are not equal.
Harmonic Mean of cell sizes= 3.870968

Number of Means 2 3 4
Critical Range 2.130 2.230 2.290

Means with the same letter are not significantly different.

Duncan Grouping Mean N TRAT

A 12.0000 4 4

B 7.5000 4 3
B
C B 6.0000 3 2
C
C 4.4000 5 1

Diseño Completo al Azar

General Linear Models Procedure

Dependent Variable: REND

Contrast DF Contrast SS Mean Square F Value Pr > F

t4 vs los demas trat 1 108.00329670 108.00329670 58.38 0.0001

EJEMPLO 3

La siguiente información corresponde a un experimento factorial 2Ax3B con 4 unidades


experimentales, conducido en DCA.

Repetición A1 A2

B1 B2 B3 B1 B2 B3

1 1 2 4 5 5 2

2 4 5 7 7 10 1

3 5 7 9 11 13 3

4 9 9 11 15 16 5

El conjunto de datos para el programa SAS será introducida con su estructura respectiva.

Si se asume que ambos factores son fijos y se desea realizar las pruebas de tendencia
lineal y cuadrática para el factor B, el programa GLM bajo SAS realiza dicho análisis
mediante las siguiente sentencias:
Manual SAS. 39

El programa GLM bajo SAS, es el siguiente:

DATA ABC ;
TITLE ‘Experimento Factorial 2Ax3B’;
OPTIONS LS=80 PS=60 NODATE NONUMBER;
INPUT Y A B REP ;
CARDS;
1 1 1 1
4 1 1 2
5 1 1 3
9 1 1 4
2 1 2 1
.
.
.

2 2 3 1
1 2 3 2
3 2 3 3
5 2 3 4
;
PROC PRINT;
RUN;
PROC GLM ;
CLASS A B REP ;
MODEL Y = A B A*B ;
CONTRAST ‘B-LINEAL ‘B 1 0 1;
CONTRAST ‘B-CUADRATICO ‘B 1 -2 1;
RUN;

Los dos últimas sentencias CONTRAST realizan las pruebas de tendencia lineal y
cuadrática respectivamente mediante la prueba de significación F. Los coeficientes
corresponden a valores tabulares y dependen del número de niveles que tenga el factor.
Manual SAS. 40

CAPITULO V

DISEÑOS EN PARCELAS DIVIDIDAS

En este capítulo se estudiarán las formas de plantear las pruebas de significación haciendo
uso de la sentencia TEST, cuya aplicación es muy importante en los diseños de parcelas
divididas, modelos de efectos aleatorios y modelos mixtos. Adicionalmente se verá la
aplicación de la opción E = efecto correspondiente a las sentencias MEANS y CONTRAST.

5.1 INTRODUCCION

Una característica importante en términos de la aplicación de la sentencia TEST es que en el


diseño de parcelas divididas existen dos errores: un Error(a) o Error de Parcelas y un Error(b)
o Error en Subparcelas. Dado que el SAS solo reconoce un solo error, debemos hacer uso de
una opción que nos permita realizar la prueba de significación para aquellas fuentes que
requieran como denominador otro diferente del error especificado. Para ello se tiene que
hacer uso de la sentencia TEST.

5.2 USO DE LA SENTENCIA TEST

Los términos que tiene que especificarse en la sentencia TEST son:

H = efectos ;
E = efecto ;

La primera instrucción especifica que efecto(s) del modelo van a ser utilizados como
numerador. La segunda instrucción especifica uno y únicamente un efecto a ser utilizado
como término de error (denominador).

Se puede utilizar tantas sentencias TEST como se requieran o términos de error existan en el
modelo. El uso de la sentencia se puede utilizar tanto en el procedimiento PROC ANOVA
como en el PROC GLM.

5.3 EJEMPLOS DE APLICACIÓN

Se presentan dos ejemplos relacionados con parcelas divididas, en el cual presentaremos dos
formas alternativas de resolver el problema. El tercer ejemplo permite realizar pruebas de
tendencia lineal y cuadrática.

EJEMPLO 1

Se da un experimento en el cual se tiene un factor A con 3 niveles en parcelas y un factor B


con 3 niveles en subparcelas. Los niveles del factor A fueron asignados bajo un diseño de
bloques completos al azar con 3 bloques. Los resultados experimentales se dan a
continuación:

BLOQUES A1 A2
B1 B2 B3 B1 B2 B3
I 10 12 13 20 22 23
II 15 14 15 25 20 20
III 12 14 16 22 24 26

El modelo aditivo lineal es:


Manual SAS. 41

Yijk = u + k +i + Error(a) + j + () ij + Error(b)

i = 1, 2, 3 (niveles del factor A)


j = 1,2, 3 (niveles del factor B)
k = 1,2, 3 (respectivamente)

La variable en este caso Yijk, hace pensar en la inclusión de 4 columnas de datos, para el
programa, lo importante está en la especificación del modelo.

Una primera forma de resolver el problema es teniendo en cuenta el Error(a). Debemos


conocer de la composición de este error. Como quiera que éste es el Error de Parcelas en
un diseño de bloques, está conformado por (BLOQUES*A), es decir, es la interacción del
factor A con los Bloques. Entonces, se puede especificar esta fuente en el modelo de la
forma siguiente.

Yijk = u + k + i + ()ik + j + () ij + Error(b)

Obviamente, el SAS va tomar como error por defecto el Error(b), lo cual es válido para la
fuente de B y (A*B), sin embargo para bloques y A no sería el apropiado. Además sacaría
una prueba F para Bloques*A, el cual es el Error(a). Sin embargo, se puede solucionar este
problema usando la sentencia TEST. El programa bajo SAS, es el siguiente:

DATA AAA;
TITLE ‘Diseño en Parcelas Divididas’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATE NONUMBER;
INPUT BLOQUES A B Y ;
CARDS;
1 1 1 10
1 1 2 12
1 1 3 13
2 1 1 15
2 1 2 14
2 1 3 15
3 1 1 12
3 1 2 14
3 1 3 16
1 2 1 20
1 2 2 22
1 2 3 23
2 2 1 25
2 2 2 20
2 2 3 20
3 2 1 22
3 2 2 24
3 2 3 26
;
PROC PRINT;
RUN;
PROC ANOVA ;
BLOQUES A B ;
MODEL Y = BLOQUES A BLOQUES*A B A*B ;
TEST H = BLOQUES E = BLOQUES*A ;
TEST H = A E = BLOQUES*A ;
MEANS A / E= BLOQUES*A DUNCAN ;
MEANS B / DUNCAN ;
RUN;
Manual SAS. 42

En este programa, se introduce el modelo correspondiente, además dos sentencias TEST.


En ellas se especifica que para las fuentes de BLOQUES y A se utilizará como denominador
el Cuadrado Medio de (Bloques*A), el cual es el Error(a). Este resultado se muestra en
forma adicional al ya mostrado. Asimismo en la sentencia MEANS para A, antes de
especificar el tipo de prueba (DUNCAN), se debe corregir el Cuadrado Medio con que se va
trabajar, caso contrario trabajará con el Cuadrado Medio del Error(b) ya que este lo toma
por defecto.

Los resultados obtenidos son los siguientes:

Diseño Parcelas divididas

Analysis of Variance Procedure


Class Level Information

Class Levels Values

BLOQUES 3 1 2 3
A 2 1 2
B 3 1 2 3

Number of observations in data set = 18

Diseño Parcelas divididas

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 9 400.05555556 44.45061728 10.81 0.0013


Error 8 32.88888889 4.11111111
Corrected Total 17 432.94444444
R-Square C.V. Root MSE Y Mean
0.924034 11.29925 2.0275875 17.944444

Source DF Anova SS Mean Square F Value Pr > F

BLOQUES 2 16.77777778 8.38888889 2.04 0.1923


A 1 364.50000000 364.50000000 88.66 0.0001
BLOQUES*A 2 9.00000000 4.50000000 1.09 0.3800
B 2 7.44444444 3.72222222 0.91 0.4421
A*B 2 2.33333333 1.16666667 0.28 0.7602

Tests of Hypotheses using the Anova MS for BLOQUES*A as an error term

Source DF Anova SS Mean Square F Value Pr > F


BLOQUES 2 16.77777778 8.38888889 1.86 0.3491

Tests of Hypotheses using the Anova MS for BLOQUES*A as an error term

Source DF Anova SS Mean Square F Value Pr > F


A 1 364.50000000 364.50000000 81.00 0.0121

Analysis of Variance Procedure

Duncan's Multiple Range Test for variable: Y

NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate

Alpha= 0.05 df= 2 MSE= 4.5

Number of Means 2
Critical Range 4.303

Means with the same letter are not significantly different.


Manual SAS. 43

Duncan Grouping Mean N A


A 22.444 9 2
B 13.444 9 1

Diseño Parcelas divididas

Analysis of Variance Procedure

Duncan's Multiple Range Test for variable: Y

NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate

Alpha= 0.05 df= 8 MSE= 4.111111

Number of Means 2 3
Critical Range 2.699 2.813

Means with the same letter are not significantly different.

Duncan Grouping Mean N B

A 18.833 6 3
A
A 17.667 6 2
A
A 17.333 6 1

EJEMPLO 2

Para el mismo problema planteado en el ejemplo 1 podemos superar el problema de los


errores de otra forma. Como muchas veces los resultados del estadístico F sin utilizar la
opción para A y Bloques en el ejemplo anterior se prestan a confusión, se puede hacer que
en el listado original, no aparezcan ningún F calculado y hacer todas las pruebas mediante
las sentencias TEST.

El programa sería el siguiente:

data aaa ;
title ‘ejemplo en parcela dividida’;
options linesize=80 pagesize=60 nodate nonumber;
input bloques a b y;
cards;
1 1 1 10
1 1 2 12
1 1 3 13
2 1 1 15
2 1 2 14
2 1 3 15
3 1 1 12
3 1 2 14
3 1 3 16
1 2 1 20
1 2 2 22
1 2 3 23
2 2 1 25
2 2 2 20
2 2 3 20
3 2 1 22
3 2 2 24
Manual SAS. 44

3 2 3 26
;
proc print;
run;
proc anova;
class bloques a b ;
model y = bloques a bloques*a b a*b bloques*b(a);
test h = bloques a e= bloques*a ;
test h = b a*b e= bloques*b(a) ;
means a / e= bloques*a duncan ;
means b / e = bloques*b(a) duncan ;
run;

En este caso, el cambio se produce en el modelo, donde además de especificar el Error(a)


con (BLOQUES*A), especificamos el Error (b) con (BLOQUES*B(A)), no dejando ningún
término para el Error . Por lo tanto la SC para el ERROR tomará el valor de 0 y en el punto
de Fc se apreciará un punto decimal ( . ). Para las pruebas de comparación se utiliza una
misma sentencia TEST para especificar dos efectos cuyo denominador es el mismo. El
único cambio con relación al Ejemplo 1 se da en que para la prueba de comparación entre
los niveles de B, se tiene que especificar primero cual es término de error.

El resultado del programa es el siguiente:

Diseño Parcelas divididas

Analysis of Variance Procedure


Class Level Information

Class Levels Values

BLOQUES 3 1 2 3

A 2 1 2
B 3 1 2 3

Number of observations in data set = 18

Diseño Parcelas divididas

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 17 432.94444444 25.46732026 . .


Error 0 . .

Corrected Total 17 432.94444444

R-Square C.V. Root MSE Y Mean


1.000000 0 0 17.944444

Source DF Anova SS Mean Square F Value Pr > F

BLOQUES 2 16.77777778 8.38888889 . .


A 1 364.50000000 364.50000000 . .
BLOQUES*A 2 9.00000000 4.50000000 . .
B 2 7.44444444 3.72222222 . .
A*B 2 2.33333333 1.16666667 . .
BLOQUES*B(A) 8 32.88888889 4.11111111 . .
Tests of Hypotheses using the Anova MS for BLOQUES*A as an error term
Manual SAS. 45

Source DF Anova SS Mean Square F Value Pr > F

BLOQUES 2 16.77777778 8.38888889 1.86 0.3491


A 1 364.50000000 364.50000000 81.00 0.0121

Tests of Hypotheses using the Anova MS for BLOQUES*B(A) as an error term

Source DF Anova SS Mean Square F Value Pr > F

B 2 7.44444444 3.72222222 0.91 0.4421


A*B 2 2.33333333 1.16666667 0.28 0.7602

Diseño Parcelas divididas

Analysis of Variance Procedure

Duncan's Multiple Range Test for variable: Y

NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate

Alpha= 0.05 df= 2 MSE= 4.5

Number of Means 2
Critical Range 4.303

Means with the same letter are not significantly different.

Duncan Grouping Mean N A

A 22.444 9 2
B 13.444 9 1

Diseño Parcelas divididas

Analysis of Variance Procedure

Duncan's Multiple Range Test for variable: Y

NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate

Alpha= 0.05 df= 8 MSE= 4.111111

Number of Means 2 3
Critical Range 2.699 2.813

Means with the same letter are not significantly different.

Duncan Grouping Mean N B

A 18.833 6 3
A
A 17.667 6 2
A
A 17.333 6 1

EJEMPLO 3

Considerando el ejemplo 2, suponga que se desea realizar las pruebas de tendencia lineal y
cuadrática para los factores de estudio.

El programa sería el siguiente:

data aaa ;
Manual SAS. 46

title ‘ejemplos de tendencias’;


options linesize=80 pagesize=60 nodate nonumber;
input bloques a b y;
cards;
1 1 1 10
1 1 2 12
1 1 3 13
2 1 1 15
2 1 2 14
2 1 3 15
3 1 1 12
3 1 2 14
3 1 3 16
1 2 1 20
1 2 2 22
1 2 3 23
2 2 1 25
2 2 2 20
2 2 3 20
3 2 1 22
3 2 2 24
3 2 3 26
;
proc print;
run;
proc glm;
class bloques a b;
model y = bloques a bloques*a b a*b;
test h = bloques a e = bloques*a;
contrast ’a-lineal’ a -1 0 1 / e = bloques*a;
contrast ’a-cuadra’ a 1 -2 1 / e = bloques*a;
contrast ’b-lineal’ b -1 0 1;
contrast ’b-cuadra’ b 1 2 1;
run;

En este caso se invoca al procedimiento PROC GLM con el cual se pueden realizar las
pruebas de contrastes especificadas. Note que las dos primeras sentencias CONTRAST
hacen uso de la opción E = para especificar el término de error correcto para el análisis del
efecto A asignado en parcelas.
Manual SAS. 47

CAPITULO VI

ANALISIS DE EXPERIMENTOS REPETIDOS Y DE EFECTOS SIMPLES

En este capítulo se verá como realizar mediante un solo programa el análisis conjunto para un
experimento repetido así como el análisis individual para cada repetición, y por otro lado como
solucionar el problema del análisis de efectos simples.

6.1 USO DEL PROCEDIMIENTO PROC SORT

Para poder realizar el análisis tanto individual como conjunto se necesita tener ordenados
los datos de acuerdo a la variable que determina el patrón del experimento repetido. Por
ejemplo, si se trabaja con experimentos repetidos en diferentes lugares, se debe tener los
datos ordenados por lugares. Como esto muchas veces no es posible hacerlo, tenemos
que hacer uso del procedimiento PROC SORT, el cual ordena los datos introducidos de
acuerdo a una o más variables. La estructura de este procedimiento es la siguiente:

PROC SORT;
BY variable1 variable2 ...;

PROC SORT primero ordena los datos de acuerdo a la primera variable especificada
(variable1), luego ordena los datos con un valor dado de la primera variable para la segunda
variable (variable2), y así sucesivamente.

6.2 ANALISIS DE EXPERIMENTOS REPETIDOS

Los siguientes datos corresponden a un experimento repetido en 2 lugares conducido en un


diseño de bloques completos al azar con 5 tratamientos y 4 bloques.

Lugar 1

Bloque T1 T2 T3 T4 T5
I 12.5 13.4 15.8 14.6 16.3

II 12.5 15.3 14.2 16.3 16.3

III 15.2 17.2 16.5 15.3 14.2

IV 12.2 15.2 13.5 15.2 12.4

Lugar 2

Bloque T1 T2 T3 T4 T5

I 12.5 13.5 15.6 13.2 14.2

II 15.3 11.3 13.5 13.2 14.2

III 16.3 14.3 15.4 13.4 15.3

IV 15.2 11.9 14.3 15.3 11.9

El modelo aditivo lineal para el análisis combinado es el siguiente:


Manual SAS. 48

Yijk = u + Bk + i + Tj + (T)ij + eijk

Donde:
i = 1,2 (lugares)
j = 1,....5 (tratamientos)
k = 1,....4 (bloque)

En SAS lo podemos especificar de la siguiente manera:

Y = BLOQUES (LUGAR) LUGAR TRATAMI LUGAR*TRATAMI ;

El modelo aditivo lineal para el análisis de los experimentos en cada uno de los lugares es el
siguiente:

Yjk = u + Bk + Tj + ejk

Donde:
j = 1,....5 (tratamientos)
k = 1,....4 (bloque)

En SAS lo podemos especificar de la siguiente manera:

Y = BLOQUES TRATAMI ;

Para el archivo se debe tener en cuenta el modelo para el análisis combinado. El conjunto
de datos, tiene la siguiente estructura:

1 1 1 12.5
1 1 2 13.5
1 1 3 15.8
1 1 4 14.6
1 1 5 16.3
1 2 1 12.5
1 2 2 15.3
1 2 3 14.2
1 2 4 16.3
1 2 5 16.3
1 3 1 15.2
1 3 2 17.2
1 3 3 16.5
1 3 4 15.3
1 3 5 14.2
1 4 1 12.2
1 4 2 15.2
1 4 3 13.5
1 4 4 15.2
1 4 5 12.4
2 1 1 12.5
2 1 2 13.5
2 1 3 15.6
2 1 4 13.2
2 1 5 14.2
2 2 1 15.3
2 2 2 11.3
2 2 3 13.5
2 2 4 13.2
2 2 5 14.2
2 3 1 16.3
2 3 2 14.3
2 3 3 15.4
Manual SAS. 49

2 3 4 13.4
2 3 5 15.3
2 4 1 15.2
2 4 2 11.9
2 4 3 14.3
2 4 4 15.3
2 4 5 11.9
Donde la primera columna es para la variable lugar, la segunda para la variable tratami, la
tercera para la variable bloques y la última para la variable respuesta. El programa bajo SAS
es el siguiente:

DATA XYZ ;
TITLE ‘Experimentos repetidos en localidades’;
OPTIONS LINESIZE=80 PAGESIZE=55 NODATE NONUMBER;
INPUT LUGAR BLOQUES TRATAMI Y ;
CARDS;
1 1 1 12.5
1 1 2 13.5
1 1 3 15.8
1 1 4 14.6
1 1 5 16.3
1 2 1 12.5
1 2 2 15.3
1 2 3 14.2
1 2 4 16.3
1 2 5 16.3
1 3 1 15.2
1 3 2 17.2
1 3 3 16.5
1 3 4 15.3
1 3 5 14.2
1 4 1 12.2
1 4 2 15.2
1 4 3 13.5
1 4 4 15.2
1 4 5 12.4
2 1 1 12.5
2 1 2 13.5
2 1 3 15.6
2 1 4 13.2
2 1 5 14.2
2 2 1 15.3
2 2 2 11.3
2 2 3 13.5
2 2 4 13.2
2 2 5 14.2
2 3 1 16.3
2 3 2 14.3
2 3 3 15.4
2 3 4 13.4
2 3 5 15.3
2 4 1 15.2
2 4 2 11.9
2 4 3 14.3
2 4 4 15.3
2 4 5 11.9
;
PROC PRINT;
Manual SAS. 50

RUN;
PROC ANOVA ;
CLASS LUGAR BLOQUES TRATAMI ;
MODEL Y = BLOQUES (LUGAR) LUGAR TRATAMI LUGAR*TRATAMI;
TEST H = TRATAMI E=LUGAR*TRATAMI;
PROC SORT ;
BY LUGAR ;
PROC ANOVA ;
BY LUGAR ;
CLASS LUGAR BLOQUES TRATAMI ;
MODEL Y = BLOQUES TRATAMI;
RUN;

El primer procedimiento, PROC ANOVA permite realizar el análisis combinado de los


experimentos realizados en los dos lugares. Hay que tener en cuenta que el factor LUGAR
es considerado muchas veces el azar por lo que hay que cambiar los denominadores del
estadístico de prueba F en la fuente TRATAMI. Esto se realiza mediante la sentencia
TEST.

El segundo procedimiento, PROC SORT, permite arreglar los datos de acuerdo a la variable
por la cual vamos a obtener los análisis de variancia combinados. Como quiera que se
desea obtener los análisis de variancia por lugares, se ordenan los datos por LUGAR,
mediante:
PROC SORT;
BY LUGAR;
El tercer procedimiento, PROC ANOVA, permite realizar el análisis de variancia individual en
cada uno de los lugares. Para ello necesitamos usar la sentencia BY en el procedimiento
PROC ANOVA (ver Capítulo III). Esta opción BY debe ser de acuerdo a la del PROC
SORT. El modelo especificado es para el experimento individual.
Si se ejecuta este programa se obtendrán los siguientes resultados:
Experimento repetido

OBS LUGAR BLOQUES TRATAMI Y

1 1 1 1 12.5
2 1 1 2 13.4
3 1 1 3 15.8
4 1 1 4 14.6
5 1 1 5 16.3
6 1 2 1 12.5
7 1 2 2 15.3
8 1 2 3 14.2
9 1 2 4 16.3
10 1 2 5 16.3
11 1 3 1 15.2
12 1 3 2 17.2
13 1 3 3 16.5
14 1 3 4 15.3
15 1 3 5 14.2
16 1 4 1 12.2
17 1 4 2 15.2
18 1 4 3 13.5
19 1 4 4 15.2
20 1 4 5 12.4
21 2 1 1 12.5
22 2 1 2 13.5
23 2 1 3 15.6
24 2 1 4 13.2
Manual SAS. 51

25 2 1 5 14.2
26 2 2 1 15.3
27 2 2 2 11.3
28 2 2 3 13.5
29 2 2 4 13.2
30 2 2 5 14.2
31 2 3 1 16.3
32 2 3 2 14.3
33 2 3 3 15.4
34 2 3 4 13.4
35 2 3 5 15.3
36 2 4 1 15.2
37 2 4 2 11.9
38 2 4 3 14.3
39 2 4 4 15.3
40 2 4 5 11.9
Experimento repetido

Analysis of Variance Procedure


Class Level Information

Class Levels Values

LUGAR 2 1 2

BLOQUES 4 1 2 3 4

TRATAMI 5 1 2 3 4 5

Number of observations in data set = 40

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 15 46.40075000 3.09338333 1.83 0.0898

Error 24 40.49900000 1.68745833

Corrected Total 39 86.89975000

R-Square C.V. Root MSE Y Mean

0.533957 9.053996 1.2990221 14.347500

Source DF Anova SS Mean Square F Value Pr > F

BLOQUES(LUGAR) 6 16.46350000 2.74391667 1.63 0.1832


LUGAR 1 5.11225000 5.11225000 3.03 0.0946
TRATAMI 4 4.47350000 1.11837500 0.66 0.6239
LUGAR*TRATAMI 4 20.35150000 5.08787500 3.02 0.0379

Tests of Hypotheses using the Anova MS for LUGAR*TRATAMI as an error term

Source DF Anova SS Mean Square F Value Pr > F

TRATAMI 4 4.47350000 1.11837500 0.22 0.9143

Experimento repetido

----------------------------------- LUGAR=1 ------------------------------------

Analysis of Variance Procedure


Class Level Information
Manual SAS. 52

Class Levels Values

BLOQUES 4 1 2 3 4

LUGAR 1 1

TRATAMI 5 1 2 3 4 5

Number of observations in by group = 20

Experimento repetido

----------------------------------- LUGAR=1 ------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 7 23.85750000 3.40821429 1.96 0.1457


Error 12 20.85200000 1.73766667
Corrected Total 19 44.70950000

R-Square C.V. Root MSE Y Mean


0.533611 8.964338 1.3182059 14.705000

Source DF Anova SS Mean Square F Value Pr > F

BLOQUES 3 10.20550000 3.40183333 1.96 0.1743


TRATAMI 4 13.65200000 3.41300000 1.96 0.1644

Experimento repetido

----------------------------------- LUGAR=2 ------------------------------------

Analysis of Variance Procedure


Class Level Information

Class Levels Values

BLOQUES 4 1 2 3 4
LUGAR 1 2
TRATAMI 5 1 2 3 4 5

Number of observations in by group = 20

Experimento repetido

----------------------------------- LUGAR=2 ------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 7 17.43100000 2.49014286 1.52 0.2496


Error 12 19.64700000 1.63725000
Corrected Total 19 37.07800000

R-Square C.V. Root MSE Y Mean


0.470117 9.146181 1.2795507 13.990000

Source DF Anova SS Mean Square F Value Pr > F

BLOQUES 3 6.25800000 2.08600000 1.27 0.3275


TRATAMI 4 11.17300000 2.79325000 1.71 0.2131
Manual SAS. 53

Nota.- Para el análisis de utilizó el procedimiento PROC ANOVA, sin embargo se puede usar el PROC GLM
siendo los resultados válidos, debido a que se está trabajando con datos balanceados. Sin embargo, el PROC
ANOVA da resultados más precisos que el PROC GLM.

6.3 ANALISIS DE EFECTOS SIMPLES


Los siguientes datos corresponden a un arreglo factorial de 3Ax2B con 3 repeticiones de
cada combinación conducido en un diseño complemente randomizado.

a1 a2 a3
B1 9 5 1 5 7 9 7 9 11
B2 7 11 15 10 13 16 1 3 5

El análisis de variancia es el correspondiente:

F.V. GL SC CM Fc
A 2 48 24 2.72
B 1 18 18 2.04
AB 2 144 72 8.13
Error 12 106 8.83
Total 17 316

El análisis de variancia para el estudio de los efectos simples de los factores es el siguiente:

F.V. gl SC CM Fc
Efectos Simples de B
B (a1) 1 54 54 6.12
B (a2) 1 54 54 6.12
B (a3) 1 54 54 6.12
Efectos Simples de A
A (b1) 2 24 12 1.36
A (b2) 2 148 84 9.51
Error 12 106 8.83

El modelo correspondiente al arreglo factorial bajo un DCA es el siguiente:

Yijk = u + Ti + Bj + (TB)ij + eijk

Donde:
i = 1,2,3 (niveles de factor A)
j = 1,2, (niveles de factor B)
k = 1,2,3 (respectivamente)

El conjunto de datos tiene una estructura, donde la primera columna es para la variable B, la
segunda para la variable A la tercera para las repeticiones y la última para la variable
respuesta.

Con el programa SIMPLE SAS A, se realiza el análisis de variancia para el arreglo factorial
de manera sencilla, se puede usar el PROC ANOVA o el PROC GLM (ver nota anterior),
Sin embargo, si se quiere realizar el Análisis de Efectos Simple, debemos usar el PROC
SORT. La idea es que para obtener por ejemplo B(a1) se tiene que hacer un análisis de
variancia en cada nivel de A, para lo cual se ordenan los datos por A y se utiliza PROC
ANOVA con la sentencia BY para obtener B(a1), B(a2) y B(a3). El modelo a introducir es
aquel en el que sólo consideramos el factor B. Esto es:

Yjk = u + Bj + Ejk;
Manual SAS. 54

De igual manera, para obtener A(b1) y A(b2) se ordenan los datos por la variable B y se
utiliza PROC ANOVA con la sentencia BY con el siguiente modelo:

Yjk = u + Ti + Eik;

Finalmente, el programa bajo SAS tiene la siguiente estructura:


data aaa ;
title ‘Efectos simples’;
options linesize=80 pagesize=55 nodate nonumber;
input b a rep y ;
cards;
1 1 1 9
1 1 2 5
1 1 3 1
1 2 1 5
1 2 2 7
1 2 3 9
1 3 1 7
1 3 2 9
1 3 3 11
2 1 1 7
2 1 2 11
2 1 3 15
2 2 1 10
2 2 2 13
2 2 3 16
2 3 1 1
2 3 2 3
2 3 3 5
;
proc print;
run;
proc anova ;
class a b rep;
model y = a b a*b ;
proc sort ;
by a ;
proc anova ;
by a ;
class a b rep ;
model y = b;
proc sort ;
by b ;
proc anova ;
by b ;
class a b rep ;
model y = a;
run;
La ejecución del programa nos proporciona los siguientes resultados:
Efectos simples
Analysis of Variance Procedure
Class Level Information

Class Levels Values

A 3 1 2 3
B 2 1 2
REP 3 1 2 3
Number of observations in data set = 18
Manual SAS. 55

Efectos simples

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 5 210.00000000 42.00000000 4.75 0.0126


Error 12 106.00000000 8.83333333
Corrected Total 17 316.00000000

R-Square C.V. Root MSE Y Mean

0.664557 37.15116 2.9720924 8.0000000

Source DF Anova SS Mean Square F Value Pr > F

A 2 48.00000000 24.00000000 2.72 0.1063


B 1 18.00000000 18.00000000 2.04 0.1789
A*B 2 144.00000000 72.00000000 8.15 0.0058

Efectos simples

------------------------------------- A=1 --------------------------------------

Analysis of Variance Procedure


Class Level Information

Class Levels Values

A 1 1
B 2 1 2
REP 3 1 2 3

Number of observations in by group = 6

Efectos simples

------------------------------------- A=1 --------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 1 54.00000000 54.00000000 3.38 0.1401


Error 4 64.00000000 16.00000000
Corrected Total 5 118.00000000

R-Square C.V. Root MSE Y Mean

0.457627 50.00000 4.0000000 8.0000000

Source DF Anova SS Mean Square F Value Pr > F

B 1 54.00000000 54.00000000 3.38 0.1401

Efectos simples

------------------------------------- A=2 --------------------------------------

Analysis of Variance Procedure


Class Level Information

Class Levels Values


Manual SAS. 56

A 1 2
B 2 1 2
REP 3 1 2 3

Number of observations in by group = 6

Efectos simples

------------------------------------- A=2 --------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 1 54.00000000 54.00000000 8.31 0.0449

Error 4 26.00000000 6.50000000

Corrected Total 5 80.00000000

R-Square C.V. Root MSE Y Mean


0.675000 25.49510 2.5495098 10.000000

Source DF Anova SS Mean Square F Value Pr > F

B 1 54.00000000 54.00000000 8.31 0.0449

Efectos simples

------------------------------------- A=3 --------------------------------------

Analysis of Variance Procedure


Class Level Information

Class Levels Values

A 1 3

B 2 1 2

REP 3 1 2 3

Number of observations in by group = 6

Efectos simples

------------------------------------- A=3 --------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 1 54.00000000 54.00000000 13.50 0.0213

Error 4 16.00000000 4.00000000

Corrected Total 5 70.00000000

R-Square C.V. Root MSE Y Mean

0.771429 33.33333 2.0000000 6.0000000

Source DF Anova SS Mean Square F Value Pr > F

B 1 54.00000000 54.00000000 13.50 0.0213


Manual SAS. 57

Efectos simples

------------------------------------- B=1 --------------------------------------

Analysis of Variance Procedure


Class Level Information

Class Levels Values

A 3 1 2 3

B 1 1

REP 3 1 2 3

Number of observations in by group = 9

------------------------------------- B=1 --------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 2 24.00000000 12.00000000 1.50 0.2963


Error 6 48.00000000 8.00000000
Corrected Total 8 72.00000000

R-Square C.V. Root MSE Y Mean

0.333333 40.40610 2.8284271 7.0000000

Source DF Anova SS Mean Square F Value Pr > F

A 2 24.00000000 12.00000000 1.50 0.2963

Efectos simples

------------------------------------- B=2 --------------------------------------

Analysis of Variance Procedure


Class Level Information

Class Levels Values

A 3 1 2 3
B 1 2
REP 3 1 2 3

Number of observations in by group = 9

------------------------------------- B=2 --------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 168.00000000 84.00000000 8.69 0.0169
Error 6 58.00000000 9.66666667
Corrected Total 8 226.00000000

R-Square C.V. Root MSE Y Mean


0.743363 34.54585 3.1091264 9.0000000

Source DF Anova SS Mean Square F Value Pr > F

A 2 168.00000000 84.00000000 8.69 0.0169


Manual SAS. 58

Nota : Este programa para el análisis de efectos simples no proporciona los estadísticos de prueba F adecuados
(compare los resultados obtenidos con el SAS con los obteniendo manualmente), por cuanto el Error
considerado es tomado del diseño en el cual aparece un sólo factor y no del modelo en el cual aparece el
arreglo factorial que es el especificado en el primer PROC ANOVA. Por ejemplo para la fuente B(a1) se
obtuvo:

Efectos simples

------------------------------------- A=1 --------------------------------------

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 1 54.00000000 54.00000000 3.38 0.1401

Error 4 64.00000000 16.00000000

Corrected Total 5 118.00000000

R-Square C.V. Root MSE Y Mean

0.457627 50.00000 4.0000000 8.0000000

Source DF Anova SS Mean Square F Value Pr > F

B 1 54.00000000 54.00000000 3.38 0.1401

En esta salida solamente es valida la parte correspondiente a la fuente B, que es la de


B(a1). En esta fuente el valor de F calculado no es valido por cuanto no usa el
denominador apropiado (Cuadrado Medio del Error del modelo completo especificado en la
primera sentencia MODEL), sino el correspondiente a un modelo con un solo factor.
Manual SAS. 59

CAPITULO
ANALISIS DE COVARIANCIA
VII
En este capítulo se verá como realizar el ANCOVA mediante el uso de los procedimientos PROC
GLM y PROC ANOVA

7.1 INTRODUCCION

El SAS permite realizar el Análisis de Covariancia (ANCOVA) usando en forma conjunta los
procedimientos PROC GLM y PROC ANOVA. Para ello, en primer lugar se presentará un
ejemplo desarrollado de la forma como uno se hace manualmente y luego se hará mediante
el SAS.

7.2 EJEMPLO DE APLICACION

Supongamos los siguientes datos correspondientes a tres (3) tratamientos con 5 repeticiones
conducido en el Diseño Completamente al Azar donde la variable respuesta es la variable Y
(llamada también variable dependiente) y la variable relacionada o concomitante es la variable
X (llamada también covariable o variable independiente).

Tratamientos
Repeticiones T1 T2 T3
X Y X Y X Y
1 6 0.54 8 0.11 4 0.13
2 4 0.56 5 0.20 3 0.15
3 6 0.55 4 0.23 4 0.11
4 4 0.60 5 0.21 4 0.11
5 4 0.59 7 0.09 5 0.10

Prueba Sobre el Efecto de Regresión

Fuentes Gl SC CM Fc
Regresión 1 0.00162 0.0162 42.86 **
Residual 11 0.0042 0.0004

En este caso como la prueba resulta significativa, se procede a realizar el ANCOVA cuyo
resultado son:

Fuentes gl X2 XY Y2 Gl CM Fc


Tratamientos 2 8.1333 0.0747 0.6050
Error 12 17.6 -0.534 0.0204 0.0042 11 0.0004
Trat + Error 14 25.7333 -0.4593 0.6254 0.6172
Trat. Ajustado por X 0.613 2 0.3065 610.68

Tratamiento Promedio Ajustado


1 0.5659
2 0.1963
3 0.0937
La prueba de Comparación de Medias DLS

Comparación Dif Sd DLS Sign


T1 , T2 0.370 0.0135 0.0419 **
T1 , T3 0.472 0.0132 0.0409 **
Manual SAS. 60

T2 , T3 0.102 0.0153 0.0475 **

En caso de que la prueba sobre todo la regresión hubiera resultado no significativa, esto
significaría que el análisis estadístico se realiza en la variable Y, sin considerar X.

Fuentes Gl SC CM Fc
Tratamientos 2 0.60501 0.3025 178.29 **
Error 12 0.02036 0.0017
Total 14 0.62537

7.3 PROGRAMA EN SAS

Para desarrollar en el SAS todo lo hecho manualmente, se debe tener en cuenta que se trata
de un DCA, y que en el conjunto de datos se deberían introducir 3 variables: Y, tratami y
repeti. Ahora para el ANCOVA solamente se debe agregar la variable X.

El conjunto de datos debe contener 4 columnas, una para variable Y, otra para la X, otra para
las repeticiones y una última para la de tratamientos. En nuestro caso la primera columna es
para la variable tratamientos, la segunda es para la variable repeticiones, la tercera para la
variable X y la última para la variable Y.
El programa bajo SAS, es el siguiente:
data aaa ;
title analisis de covariancia en DCR’;
options linesize=80 pagesize=60 nodate nonumber;
input tratami repeti x y ;
cards;
1 1 6 0.54
1 2 4 0.56
1 3 6 0.55
1 4 4 0.60
1 5 4 0.59
2 1 8 0.11
2 2 5 0.20
2 3 4 0.23
2 4 5 0.21
2 5 7 0.09
3 1 4 0.13
3 2 3 0.15
3 3 4 0.11
3 4 4 0.11
3 5 5 0.10
;
proc print ;
run;
proc glm ;
class repeti tratami ;
model y = tratami x / ss1 ss3 ;
lsmeans tratami / pdiff;
proc ancova ;
class repeti tratami ;
model y = tratami ;
run;

La sentencia INPUT, define la forma como fueron introducidos los datos en el programa SAS.
El procedimiento PROC GLM realizar la prueba del efecto de regresión y el análisis de
covariancia y de variancia. El procedimiento PROC ANOVA realiza el análisis de variancia.
En el procedimiento PROC GLM, se debe tener en cuenta el modelo aditivo lineal para un
Análisis de Covariancia en Diseño Completamente el Azar el cual es:
Manual SAS. 61

Yij = u + Ti + B (Xij - x ) + eij

Por tanto en la sentencia MODEL se debe especificar:

MODEL Y = TRATAMI X;
Las opciones que aparecen después del slash (/), SS1 y SS3 permiten realizar: el primero el
análisis de variancia y el segundo el análisis de covariancia. Asimismo ambas Sumas de
Cuadrados proporcionan la prueba de efecto de regresión. A pesar de que SS1 realiza el
Análisis de Variancia (no considera la variable X), la prueba F no es valida por cuanto el
Error que se está considerando es el Error Ajustado por la Variable X, lo cual no es valido.
Por ello, se realiza el procedimiento PROC ANOVA el cual presenta en forma correcta no sólo
las Sumas de Cuadrados sino la prueba F.

La sentencia

LSMEANS TRATAMI / PDIFF :

Permite obtener los promedios de los tratamientos ajustados. Asimismo, la opción PDIFF
muestra la prueba de significancia obtenida al realizar la prueba de comparación entre los
promedios ajustados de los tratamientos.
Al ejecutar el programa se obtiene:

analisis de covariancia

OBS TRATAMI REPETI X Y

1 1 1 6 0.54
2 1 2 4 0.56
3 1 3 6 0.55
4 1 4 4 0.60
5 1 5 4 0.59
6 2 1 8 0.11
7 2 2 5 0.20
1 8 2 3 4 0.23
9 2 4 5 0.21
10 2 5 7 0.09
11 3 1 4 0.13
12 3 2 3 0.15
13 3 3 4 0.11
14 3 4 4 0.11
15 3 5 5 0.10

analisis de covariancia

General Linear Models Procedure


Class Level Information

Class Levels Values

REPETI 5 1 2 3 4 5

TRATAMI 3 1 2 3

Number of observations in data set = 15

analisis de covariancia

General Linear Models Procedure

Dependent Variable: Y
Manual SAS. 62

Sum of Mean
Source DF Squares Square F Value Pr > F

Model 3 0.62121538 0.20707179 547.81 0.0001

Error
2 11 0.00415795 0.00037800

Corrected Total 14 0.62537333

R-Square C.V. Root MSE Y Mean

0.993351 6.813826 0.0194421 0.2853333

Source DF Type I SS Mean Square F Value Pr > F

TRATAMI 3 2 0.60501333 0.30250667 800.29 0.0001


X 1 0.01620205 0.01620205 42.86 0.0001
4
Source DF Type III SS Mean Square F Value Pr > F

TRATAMI
5 2 0.61301640 0.30650820 810.88 0.0001
X 4 1 0.01620205 0.01620205 42.86 0.0001

analisis de covariancia

General Linear Models Procedure


Least Squares Means

TRATAMI Y Pr > |T| H0: LSMEAN(i)=LSMEAN(j)


LSMEAN i/j 1 2 3

1 0.56597727 1 . 0.0001 0.0001


2 6 0.19631818 2 0.0001 . 0.0001 7
3 0.09370455 3 0.0001 0.0001 .

NOTE: To ensure overall protection level, only probabilities associated with


pre-planned comparisons should be used.

analisis de covariancia

Analysis of Variance Procedure

Class Level Information

Class Levels Values

REPETI 5 1 2 3 4 5

TRATAMI 3 1 2 3

Number of observations in data set = 15

analisis de covariancia

Analysis of Variance Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F

Model 2 0.60501333 0.30250667 178.29 0.0001

Error 8 12 0.02036000 0.00169667

Corrected Total 14 0.62537333

R-Square C.V. Root MSE Y Mean

0.967443 14.43596 0.0411906 0.2853333


Manual SAS. 63

Source DF Anova SS Mean Square F Value Pr > F


9
TRATAMI 2 0.60501333 0.30250667 178.29 0.0001

Donde:
1 Son los datos introducidos y definidos en la sentencia INPUT.
2 Es la fuente correspondiente al Residual en la prueba de efecto de regresión y al Error
Ajustado en el Análisis de Covariancia.
3 Es la fuente correspondiente a Tratamientos para el Análisis de Variancia. Sin
embargo, de este resultado sólo se debe tener en cuenta los grados de libertad, la
Suma de Cuadrados y el Cuadrado Medio; la prueba F no es Válido por cuanto el
término del Error no es el apropiado.
4 Es la fuente correspondiente a la Regresión usada en la prueba sobre el Efecto de
Regresión, en ambos tipos de Sumas de cuadrados (Tipo I y Tipo III), los resultados son
idénticos.
5 Es la fuente correspondiente a Tratamientos usados para el Análisis de Covariancia.
6 Son los promedios de los tratamientos ajustados.
7 Especifica el nivel de significancia para la prueba de comparación de los tratamientos.
Como en todos los casos el nivel es menor a 0.01 los resultados son altamente
significativos en las pruebas de comparación.
8 Es la fuente correspondiente al Error para el Análisis de Variancia.
9 Es la fuente para Tratamientos en ANVA. Note que en este caso el F calculado es
178.29 mientras que en la SS1 (Tipo I) el F calculado era de 800.29. Esto debido a que
el Error en el caso de Tipo I no es el apropiado.
Manual SAS. 64

10
CAPITULO VIII
OTRAS OPCIONES DEL PAQUETE SAS
8.1 TRANSFORMACIONES DE DATOS

El paquete SAS permite realizar transformaciones a las variables en estudio mediante las
sentencias que serán descritas a continuación. Las transformaciones se especifican
después de la sentencia INPUT.

8.1.1 Transformación Logarítmica

Es la más común de las transformaciones aplicadas en el paquete SAS se puede realizar la


transformación con el logaritmo neperiano o el logaritmo decimal mediante las siguiente
sentencia :

Logaritmo natural ; Z = LOG (y) ;


Logaritmo natural ; W = LOG10 (y) ;

Estas sentencias crean las nuevas variables con las que se realizará en análisis respectivo.

8.1.2 Transformación Raíz Cuadrada

El paquete SAS realiza la transformación raíz cuadrada mediante la sentencia:

Z = SQRT (Y)

La cual genera una nueva variable (Z) que tendrá como valores a las raíces cuadradas de
los valores de la variable Y.

También se pueden generar variables mediante las transformaciones:

X = SQRT (Y+ 1)
W = SQRT (Y+ 0.5)

8.1.3 Transformación Angular

Se realiza mediante las siguientes sentencias:

Transformación Arco Seno : X = ARSIN (Y) ;


Transformación Arco Coseno : Z = ARCOS (Y) ;

8.1.4 Otras Transformaciones

Otras transformaciones de menor uso en el análisis de variancia se dan a continuación:

Transformación Seno : X = SIN (Y) ;


Transformación Coseno :Z = COS (Y) ;
Transformación Tangente :X = TAN (Y) ;
Transformación Absoluto :Z = ABS (Y) ;

8.1.5 Ejemplo de aplicación

Suponga que se ha realizado un experimento cuyo resultado son:

REP A B C
1 12 14 58
Manual SAS. 65

2 13 20 65
3 22 32 107

Se requiere realizar el análisis de variancia basado en los datos transformados a logaritmos


neperianos. Para ello, primero estructuramos el conjunto de datos y luego se incorpora en
el programa SAS, como se ve a continuación:

DATA AAA ;
TITLE ‘EJEMPLO DE TRANSFORMACION EN DCA’;
OPTIONS LINESIZE=80 PAGESIZE=60 NODATA NONUMBER;
INPUT TRAT $ 2 REP 4 Y 6-8 ;
Z = LOG(Y) ;
CARDS;
A 1 12
A 2 13
A 3 22
B 1 14
B 2 20
B 3 32
C 1 58
C 2 65
C 3 107
;
PROC PRINT ;
RUN;
PROC GLM ;
CLASS REP TRAT ;
MODEL Z = TRAT ;
MEANS TRAT / T DUNCAN ;
RUN;
Observe como se ha definido la transformación logarítmica después de la sentencia INPUT
mediante: Z=LOG(Y), la variable transformada es especificada la sentencia MODEL para
realizar el análisis de variancia.

8.2 COLOCACION DE TITULOS Y ETIQUETAS

En el programa SAS utilizamos dos opciones para colocar títulos y/o etiquetas. Las dos
sentencias utilizadas para tal fin son:

La sentencia TITLE
La sentencia LABELS

8.2.1 LA SENTENCIA TITLE

La sentencia TITLE permite colocar títulos a las páginas de su trabajo, se puede utilizar
hasta un máximo de 10 sentencias, por ejemplo se pueden colocar los siguientes títulos al
inicio del archivo TRANSF SAS A.

TITLE1 EJEMPLO DE TRANSFORMACION DE DATOS ;


TITLE5  TRANSFORMACION LOGARÍTMICA ;
TITLE7  PROGRAMA DE ING. ESTADÍSTICA ;

8.2.2 LA SENTENCIA LABEL

Permite colocar un nombre a las variables en estudio, de forma que aparezca en la salida
de resultados. La sentencia LABEL se utiliza de la forma siguiente:

LABEL Y =  RENDIMIENTO PROMEDIO POR PARCELA


Manual SAS. 66

Esta sentencia asignará el nombre especificado a la variable Y, también es posible


colocar nombres a varias variables mediante una sentencia LABELS, por ejemplo:

LABEL Y= RENDIMIENTO PROMEDIO POR PARCELA


X= NUMERO PROMEDIO DE PLANTAS POR SURCO
Z= NUMERO DE FRUTOS POR PARCELA ;

8.3 PROCESAMIENTO MÚLTIPLE MEDIANTE UN SOLO ARCHIVO

El SAS permite realizar el analizar el análisis de variancia a dos o más variables mediante
un solo archivo SAS, a continuación se ilustra con un ejemplo esta opción.

Suponga que en un experimento se desea comparar tres tratamientos para lo cual se


analizan tres variables respuestas, el experimento es conducido en DCA. Los resultados
experimentales son:

REP TRAT1 TRAT2 TRAT3


Y1 Y2 Y3 Y1 Y2 Y3 Y1 Y2 Y3
1 8 12 7 8 13 6 6 14 5
2 5 20 8 7 17 8 8 13 7
3 4 18 9 10 21 9 7 17 9

El análisis para estas tres variables se realiza mediante el siguiente programa SAS:

title1 ejemplo de procesamiento múltiple;


data aaa ;
options linesize=80 pagesize=58 nodate nonumber;
input rep trat y1 y2 y3 ;
label y1 = numero de frutos por línea
y2 = rendimiento en kg/parcelas
y3 = numero de plantas por parcela ;
cards;
1 1 8 12 7
2 1 5 20 8
3 1 4 18 9
1 2 8 13 6
2 2 7 17 8
3 2 10 21 9
1 3 6 14 5
3 3 7 17 9
;
proc print ;
run;
proc anova;
class rep trat ;
model y1 – y3 = trat ;
means trat / t duncan ;
run;

BIBLIOGRAFIA
1. Manual del SAS versión para DOS. UNA La Molina.1992

2. Release 6.11 of the SAS® System for Windows. Copyright (c) 1989 –
1995 by SAS Institute Inc. , Cary, NC, USA.
Manual SAS. 67

Vous aimerez peut-être aussi