Académique Documents
Professionnel Documents
Culture Documents
SAS
FCAV/UNESP
Campus de Jaboticabal
ii
NDICE
I. APRESENTAO........................................................................................................1
I.1. Mdulos do SAS......................................................................................................1
I.2. Janelas do SAS ........................................................................................................1
I.3. Barra de ferramentas .............................................................................................4
I.4. Help do SAS ............................................................................................................5
II. PROGRAMAO SAS ...............................................................................................6
II.1. Alguns comandos do SAS .....................................................................................6
OPTIONS ...................................................................................................................6
TITLE .........................................................................................................................7
FOOTNOTE ...............................................................................................................7
COMENTRIOS .......................................................................................................7
DATA .........................................................................................................................7
LIBNAME ..................................................................................................................8
FILENAME ................................................................................................................8
RUN............................................................................................................................8
COMANDOS ARITMTICOS .................................................................................8
Constantes..............................................................................................................8
Variveis ................................................................................................................8
Operadores .............................................................................................................8
Aritmticos .......................................................................................................9
Lgicos..............................................................................................................9
De comparao..................................................................................................9
Funes ..................................................................................................................9
II.2. Algumas estruturas usadas na programao ...................................................10
IF ... THEN ... ELSE ................................................................................................10
DO ... END ..............................................................................................................10
II.3. Algumas formas para criar um SAS-DATA-SET............................................11
Quando os dados so colocados no prprio programa .............................................11
Quando os dados esto gravados como um arquivo ASCII......................................11
Comando INPUT ...............................................................................................11
Listado.............................................................................................................11
Colunado .........................................................................................................11
Formatado .......................................................................................................11
iii
iv
Procedimentos ..........................................................................................................24
UNIVARIATE.....................................................................................................24
INSIGHT..............................................................................................................24
Lista de Exerccios Aula 4...................................................................................25
V.5. Informaes necessrias para a aula 5.............................................................26
Grficos de disperso ...............................................................................................26
PROC PLOT........................................................................................................26
PROC GPLOT .....................................................................................................27
Outros grficos .........................................................................................................27
Histogramas (PROC GCHART)..........................................................................27
Grficos de 3 dimenses (PROC G3D) ...............................................................28
Lista de Exerccios Aula 5...................................................................................29
V.6. Informaes necessrias para a aula 6.............................................................30
Regresso Linear .....................................................................................................30
PROC REG..........................................................................................................30
Lista de Exerccios Aula 6...................................................................................31
V.7. Informaes necessrias para as aulas 7 e 8....................................................32
PROC ANOVA .......................................................................................................32
CLASS .................................................................................................................32
MODEL ...............................................................................................................32
MEANS ...............................................................................................................33
TEST H=... E=... ...............................................................................................33
PROC GLM .............................................................................................................33
LSMEANS...........................................................................................................33
CONTRAST ........................................................................................................34
RANDOM............................................................................................................34
Lista de Exerccios Aula 7...................................................................................35
V.8. Informaes necessrias para a aula 8 .............................................................37
Consideraes estatsticas .......................................................................................37
Esperanas dos quadrados mdios.......................................................................37
Regras prticas para obteno das esperanas dos quadrados mdios E(QM) dados balanceados................................................................................................38
Procedimentos para estimativas de componentes da varincia ................................39
PPROC VARCOMP............................................................................................39
Lista de Exerccios Aula 8...................................................................................40
INTRODUO AO SAS
Euclides Braga MALHEIROS1
I. Apresentao
O SAS um sistema composto por vrios mdulos, com aplicaes diversas. Alm do
mdulo para anlises estatsticas, o SAS/STAT, vrios outros mdulos fazem parte do
sistema.
Acessos s janelas, bem como outras operaes, podem ser feitos utilizando-se as Teclas
de Atalhos, como:
CTRL + E Limpa a Janela.
F1 HELP.
F4 Recarrega o ltimo programa rodado (Janela PGM).
F9 Janela com as definies das funes do teclado (KEYS). Pode ser usado para
redefinir essas funes.
F12 Limpa a janela (no padro do SAS, precisa ser definido na janela KEYS).
Essas e outras Teclas de Atalho podem ser vistas na Janela KEYS. Ver a Figura 3:
Toda vez que o Programa existente na janela PGM rodado (RUN), so geradas linhas
nas janelas LOG e OUTPUT, conforme apresentado na Figura 4.
LOG
PGM
RUN
OUTPUT
Figura 4. Esquema usado pelo SAS para gerar as Janelas LOG e OUTPUT.
HELP
SAS/ASSISTENTE
PASTAS
PROMPT DO DOS
DESFAZER
COLAR
COPIAR
RECORTAR
IMPRIMIR
ARQUIVO NOVO
ABRIR ARQUIVO
RODAR (RUN)
COMANDOS DE OPERAO
Figura 5. Barra de Ferramentas do SAS.
Fase 1
SAS-DATA-SET
Fase 2
OUTPUT,
GRAPHICS, etc
Ou
ARQUIVOS DE
DADOS
Figura 7. Fases de um programa SAS.
O SAS-DATA-SET o arquivo de dados a ser usado pelo SAS. Ele formado por linhas
e colunas, sendo nas colunas as variveis e nas linhas os registros.
Exemplo:
Nome
Maria
Jos
Rosa
Joo
Endereo
Rua 8, 567
Rua Tiradentes, 123
Av. Marajs, 750
Rua Poty, 1250
Cidade
Itu
Mato
Jaboticabal
Maring
Estado
SP
SP
SP
PR
Peso
59.50
85.00
.
79.00
Observao perdida
Ponto para separar as
casas decimais
Operao
Adio
Subtrao ou Negao
Multiplicao
Diviso
Potenciao
Exemplos
Usual
SAS
A+B
A+B
A-B ou -B
A-B ou -B
A.B
A*B
A:B
A/B
B
A
A**B
Operadores lgicos:
Operador
& ou AND
| ou OR
^ ou NOT
Operao
Negao
Exemplos
SAS
A&B ou A AND B
A|B ou A OR B
^A ou NOT A
Usual
AeB
AouB
No A
Operadores de comparao:
Operador
= ou EQ
> ou GT
< ou LT
>= ou GE
<= ou LE
^= ou NE
Operao
Igual a
Maior que
Menor que
Maior ou igual que
Menor ou igual que
Diferente de
Usual
A=B
A>B
A<B
AB
AB
AB
Exemplos
SAS
A=B ou A EQ B
A>B ou A GT B
A<B ou A LT B
A>=B ou A GE B
A<=B ou A LE B
A^=B ou A NE B
10
X
5
10
15
20
25
30
X2
25
100
225
400
625
900
X3
125
1.000
3.375
8.000
15.625
27.000
11
DATAFILE="ARQ.XLS"
DBMS=EXCEL2000
Comando INPUT
O comando INPUT relaciona os nomes das variveis a serem criadas no
SAS-DATA-SET. Ele pode ser de uma das formas: listado, colunado ou formatado.
Listado: quando se especifica no INPUT apenas a lista de variveis (nomes
separados por pelo menos um espao em branco). Usado quando os dados a serem
lidos esto separados por, pelo menos, um espao em branco.
Ex: INPUT NOME$ PESO ALTURA;
Colunado: quando se especifica a varivel e a coluna inicial e final onde se
encontram os dados a serem lidos.
Ex: INPUT NOME$ 1-20 PESO 20-25 ALTURA 25-30;
Formatado: quando se especifica a varivel e formato que o dado a ser lido deve
ser considerado.
Ex: INPUT NOME$ 1-20 DATANAS DDMMYY6. PESONAS 8.2
DDMMYY6. especifica que a data a ser lida contm 2 caracteres para o dia, 2
para o ms e 2 para o ano, num total de 6.
8.2 especifica que o peso a ser lido tem 8 casas, sendo 2 decimais.
12
Obs.: Quando se usa o INPUT, o nmero de valores por linha de dados deve coincidir
com o nmero de variveis do INPUT, a menos que a lista de variveis seja
seguida por @@.
Exemplo:
DATA EXEMPLO;
INPUT X Y;
CARDS;
10 20
12 22
15 35
;
DATA EXEMPLO;
INPUT X Y@@;
CARDS;
10 20 12 22 15 35
;
Lista de Opes.
Nome do Procedimento.
Prefixo de todo Procedimento (PROCEDURE).
...
RUN;
Opcionais e,
no geral,
independem da ordem.
13
14
Com esta opo, ser apresentada uma lista de lies do curso selecionado, e as possveis
sees (Instructions - que corresponde s instrues da lio, Summary - que
corresponde a um resumo da lio e Quiz - que um teste de avaliao da lio).
3) Selecione a lio e a seo, e siga em frente.
15
PROC CONTENTS
Finalidade: Apresenta uma descrio do SAS-DATA-SET.
Sintaxe: PROC CONTENTS < opes >;
PROC PRINT
Finalidade: Imprimir o SAS-DATA-SET no OUTPUT.
Sintaxe: PROC PRINT < opes >;
Algumas opes so:
NOOBS No imprime o nmero da observao (Registro).
DOUBLE Imprime com espaamento duplo.
ROUND Imprime os nmeros reais arredondados para 2 casas decimais.
LABEL Imprime tendo como cabealho das colunas os labels no lugar dos
nomes das variveis.
PROC SORT
Finalidade: Classificar o SAS-DATA-SET.
16
PROC MEANS
Finalidade: Calcular estatsticas descritivas de variveis numricas.
Sintaxe: PROC MEANS < opes > < lista de estatsticas >;
Algumas opes:
ALPHA=valor Especifica o nvel de significncia para o intervalo de confianca.
Algumas estatsticas:
N Nmero de observaes.
NMISS Nmero de observaes perdidas.
MEAN - Mdia aritmtica.
VAR Varincia.
STD - Desvio padro.
STDERR - Erro padro da mdia.
MIN - Valor mnimo.
MAX - Valor mximo.
CLM - Intervalo de confiana para a mdia.
RANGE - Amplitude (Mximo-Mnimo).
T - Teste t para a hiptese H0:mdia=0 vs H1:mdia0.
PRT - Nvel Mnimo de significncia para o teste t.
COMO CRIAR UM ARQUIVO ASCII, A PARTIR DO EXCEL
a)
b)
c)
d)
e)
Digite o arquivo, uma varivel em cada coluna, sem ttulos das colunas.
Preencha as caselas vazias com vrgulas ,.
Salve o arquivo especificando o tipo: Texto (OS/2 ou MS-DOS)(*.txt).
Feche o EXCEL.
Entre no EDIT do DOS.
INICIAR / PROGRAMAS / PROMPT MS-DOS / EDIT:
Abrir o Arquivo.
Trocar as vrgulas por pontos.
Salvar o arquivo.
Sair do Edit.
f) Sair do DOS (EXIT).
17
1
35
40
39
2
19
35
27
REPETIES
3
31
46
20
4
15
41
29
5
30
33
45
f) Imprimir o arquivo.
g) Mostrar uma descrio do contedo do arquivo.
2. Fazer um programa SAS para:
a) Colocar comentrios informando: o nmero da lista, do exerccio e a data.
b) Definir as opes para o OUTPUT: tamanho da linha=78, tamanho da pgina=64.
c) Criar um arquivo SAS, a partir do arquivo L1E2.DAT, que um arquivo ASCII, e
est codificado como segue:
COLUNAS
CAMPO
1-4
vaca
5-8
paiv
9-12
maev
13-14
diap
15-16
mesp
17-18
anop
19-20
orparto
21
sexo
22-23
anod
24-25
mesd
26-27
diad
28-33
pesonasc
34-39
pesodesm
Obs: Sexo = M ou F e Pesos com duas casas decimais
d) Imprimir o arquivo.
18
19
Sexo
M
F
M
F
SDS2
Funo
Aux. Escritrio
Secretria
Servente
Cozinheira
Com os comandos:
PROC SORT DATA=SDS1; BY NOME; RUN;
PROC SORT DATA=SDS2; BY NOME; RUN;
DATA SDS;
MERGE SDS1 SDS2;
BY NOME;
Nome
Antnio
Maria
Rosa
Salrio
600.00
800.00
300.00
20
Sexo
M
F
M
F
Funo
Aux. Escritrio
Secretria
Servente
Cozinheira
Salrio
600.00
800.00
.
300.00
Obs.: Os arquivos SDS1 e SDS2 devem estar classificados pela varivel NOME.
21
22
PROC TTEST
Finalidade: Teste t de Student para comparao das mdias de 2 grupos.
Sintaxe: PROC TTEST < opes >;
CLASS < varivel >;
23
RAA
Charolesa
Zebu
72,5
72
69
75
69,1 75
70,8 71,2 73
70
67,1 71
72
73
70,9 71
72,9 69,9 37
71,1 71,9 73
68
69
69,9 70,1 71
74
68,2 68,9 70
70
71,1 74
T1
T2
760
758
755
748
758
757
761
753
755
755
d) Imprimir o arquivo.
e) Aplicar o test t para testar a hiptese: H0: T1 = T2 .
c) Substituir as 2 primeiras repeties de T2 por 708 e 798, respectivamente, e ver o que
acontece.
72
72
24
25
75
75
70,8 71,2 73
70 67,1 71
72
70,9 71 72,9 69,9 37 71,1 71,9
73
73
68
69 69,9 70,1 71
68,2 68,9 70
70 71,1
74
74
72
72
26
Grficos de disperso
Os procedimentos utilizados para grficos de disperso so: PROC PLOT para
grficos no OUTPUT e PROC GPLOT para grficos na janela GRAPHICS.
PROC PLOT
Finalidade: Editar grficos de disperso no OUTPUT.
Sintaxe: PROC PLOT < opes1 >;
PLOT < Vertical >* < Horizontal > [=caracter] / < opes2 >;
Algumas das opes1 so:
caracter a ser usado
NOLEGEND No apresenta as legendas do grfico na representao dos
HPERCENT Especifica a porcentagem da pgina, pontos
na horizontal, deve ser usada pelo grfico
VPERCENT Especifica a porcentagem da pgina, na vertical, deve ser
usada pelo grfico
Algumas das opes2 so:
VPOS=N especifica o nmero de linhas que sero usadas
HPOS=N especifica o nmero de colunas que sero usadas
HAXIS = <li> TO <ls> BY <inc> - especifica a escala do eixo horizontal (X),
sendo li o limite inferior, ls o limite superior e inc o incremento
VAXIS = <li> TO <ls> BY <inc> - especifica a escala do eixo vertical (Y),
sendo li o limite inferior, ls o limite superior e inc o incremento
HREF = n1 n2 ... coloca linhas de referncias verticais, nas posies n1, n2,
etc, do eixo horizontal
VREF = n1 n2 ... coloca linhas de referncias horizontais, nas posies n1, n2,
etc, do eixo vertical
OVERLAY usado para sobrepor 2 ou mais grficos
VZERO Faz com que a origem do eixo vertical seja no ponto zero
HZERO Faz com que a origem do eixo horizontal seja no ponto zero
27
PROC GPLOT
Finalidade: Editar grficos de disperso na janela GRAPHICS.
Sintaxe: PROC GPLOT < opes1 >;
PLOT < Vertical >* < Horizontal > / < opes2 >;
SYMBOL[n] <opes3>;
1 primeira sequncia de pontos
2 Segunda
etc......
Outros grficos
Os procedimentos utilizados so:
PROC CHART ou GCHART para grficos no output ou na janela GRAPHICS,
respectivamente.
VBAR ou HBAR ou PIE, etc define o tipo do grfico, que pode ser: Barras
verticais, Barras Horizontais, tipo Pizza, etc.
28
M 22 F 23.2 M 20 F 21 M 31 F 28 F 20 M 13.5 F 23 M 19 M 18 M 16 F 17
;
RUN;
GOPTIONS DEVICE=WIN;
PATTERN V=SOLID COLOR=BLUE;
PROC GCHART;
VBAR PESO/GROUP=SEX LEVELS=10 ;
RUN;
DATA EX2;
DO X=-5 TO 5 BY 0.2;
DO Y=-5 TO 5 BY 0.2;
Z=X**2+Y**2;
OUTPUT;
END;
END;
PROC G3D;
PLOT X*Y=Z/GRID CAXIS=RED CBOTTOM=BLUE;
RUN;
29
30
PROC REG
Finalidade:
31
32
PROC ANOVA
A sintaxe do PROC ANOVA :
33
PROC GLM
A sintaxe do PROC GLM :
34
- ADJUST = (TUKEY | BON | SCHEFFE | etc) requer o ajuste do pvalue para o teste especificado
Especifica os efeitos aleatrios do modelo, Sempre que este comando for includo, o
SAS apresenta as Esperanas dos Quadrados Mdios do Modelo.
<efeitos> - lista de efeitos aleatrios
<opes> - Algumas da opes so:
- Q requer que todas as formas quadrticas dos efeitos fixos sejam
apresentadas no OUTPUT
- TEST requer que os testes F para a anlise da varincia sejam feitos no com
o resduo geral, e sim com os resduos apropriados
35
6
3020,0
920,0
842,0
227,0
44,0
36
3)
TRATAMENTOS
TRAT1
TRAT2
TRAT3
TRAT4
TRAT5
Y
X
Y
X
Y
X
Y
X
Y
X
1
74
9
58
7
118
9
41
6
95
8
2
51
9
67
8
48
9
38
9
41
8
3
95
8
40
5
49
9
77
8
39
9
4
62
9
58
8
64
9
92
9
114
9
5
60
9
29
6
67
8
57
7
35
6
6
47
9
64
8
51
8
77
7
49
8
7
14
6
55
9
15
8
59
8
39
9
8
19
8
47
8
29
9
32
8
100
9
Fonte: PIMENTELGOMES, F. Estatstica Experimental. Piracicaba:ESALQ/USP, 12. Ed., 1987.
BLOCOS
BLOCOS
1
42,9
53,8
49,5
53,3
57,6
59,8
2
41,6
58,5
53,8
69,6
69,6
65,8
3
28,9
43,9
40,7
45,4
42,4
41,4
4
30,8
46,3
39,4
35,1
51,9
45,4
37
G.L.
S.Q.
nt 1
nt(nr 1)
nt nr 1
SQ(Trat,)
SQ(Res,)
SQ(Total)
Onde t =
E(QM)
Ef. Aleatrio
Ef. Fixo
2
2
+ nt t
2+ nt t
2
2
F
QM(Trat)/QM(Res)
1 nt
( i ) 2
nt 1 i =1
2 = QM (Re s )
2 + nt t2 = QM (Trat )
logo:
2 = QM (Re s )
t2 =
1
[QM (Trat ) QM (Re s )]
nt
38
Regras prticas para obteno das esperanas dos quadrados mdios E(QM) dados balanceados
1. Determine as Fontes de Variao que comporo a Anlise de Varincia. Os efeitos
principais e todas as possveis interaes.
Se a letra ocorre em ambos os lados, a interao no existe. Se a letra se repete do
lado direito, coloque a letra apenas uma vez.
Ex: Fatores
Interao
----------------------------------------AeB
AB
A e C:B
AC:B
A:B e C:B AC:BB = AC:B
A:B e B:DE AB:BDE (no existe)
----------------------------------------2. A anlise de Varincia ter uma linha para cada Causa de Variao, inclusive para
o resduo.
3. O n de graus de liberdade de uma linha genrica obtida pelo produto dos (ni-1)
associados aos fatores esquerda dos dois pontos (:) com os nj aos direita.
Ex: Para AB:XY ------> (na-1)(nb-1)nxny graus de liberdade.
4. Denote os Componentes da Varincia por s2 com respectivos ndices
Ex: Para A:B use s2a:b.
5. Os coeficientes dos Componentes da Varincia o produto de todos os ni cujos
ndices no aparecem em s2.
6. Cada E(QM) conter aqueles s2 (com respectivos coeficientes) que possuem como
ndices, no mnimo, todas as letras presentes naquela linha.
7. Para os modelos mistos, sem restries nos parmetros, trat-los como aleatrios,
substituindo os s2 dos efeitos fixos pelas funes quadrticas correspondentes.
8. Para modelos mistos, com restries nos parmetros, eliminar da E(QM) aqueles
Componentes da Varincia que tm entre suas letras, qualquer letra de efeito fixo,
exceto as da linha.
39
40
41
42
REPETIES
1
2212,8
2195,2
1770,3
2
2025,3
2031,5
1800,0
3
1989,0
1876,5
1852,8
4
2232,8
1750,3
1769,0
5
2027,8
1060,3
43
44
1
14,85
17,39
22,32
29,21
40,73
47,34
50,41
2
14,80
18,11
21,04
30,20
40,96
51,34
54,62
Repeties
3
4
15,07
14,27
18,50
16,03
23,43
19,53
29,78
32,52
41,36
43,88
51,61
53,35
55,72
56,21
5
20,46
22,83
27,94
36,27
46,00
57,07
59,93
6
20,07
21,75
23,98
31,78
39,13
49,49
55,12