Vous êtes sur la page 1sur 7

O Sistema SAS1

I - O ambiente SAS: O Sistema SAS um sistema integrado de software que permite o desenvolvimento de entradas, recuperao e manipulao de dados, anlises estatsticas e matemticas, relatrios, entre outros. Seu ambiente formado por trs janelas principais: a) PROGRAM EDITOR: editor de programas. b) LOG: janela de avisos e mensagens de erros durante a execuo dos programas. c) OUTPUT: janela com sadas de programas. Obs: 1) Logo abaixo da linha de menu, existe uma caixa de comando para a execuo direta de comandos especficos, vlidos sempre para a janela ativa. II - Criando um programa SAS: Os programas SAS podem ser criados atravs do editor SAS (janela PROGRAM EDITOR) ou de qualquer outro editor de texto que grave arquivos no formato ASCII. Um programa SAS formado basicamente por dois mdulos: i) DATA: destina-se declarao e manipulao dos dados aceitando comandos de programao (tipo turbo pascal). ii) PROC: com procedimentos para anlise de dados, grficos e relatrios. Na janela PROGRAM EDITOR, um programa SAS composto pelos comandos: data Exemplo; input var1 var2 ... vark ; cards; ....... ....... { dados ....... ; ....... ....... { procedimentos ....... identifica o conjunto de dados declarao das variveis identifica o incio do conjunto de dados entrada de dados o ; finaliza o conjunto de dados. procedimentos para anlise.

Com a sequncia acima criado um conjunto de dados identificado com o nome Exemplo que identificado por SASdataset, o qual ser analisado atravs dos prodecimentos definidos a partir do final do conjunto de dados, indicado pelo ponto e vrgula.
1 Este tutorial foi escrito para verses mais antigas do SAS, por isso pode apresentar algumas diferenas visuais e funcionais com as verses atuais. De qualquer forma, todos as instrues aqui presentadas funcionam normalmente.

Obs: 1) Cada linha de comando deve ser encerrada por um ponto-e-vrgula ; . As linhas de dados no devem ser encerradas por ponto-e-vrgula. Um nico pontoe-vrgula deve ser colocado aps a ltima observao, indicando o final dos dados. Regras para nomes no SAS: Os nomes no SAS so usados para denominar conjuntos de dados, variveis e outros o tens. Um nome SAS pode ter de 1 a 8 caracteres sendo que o 1 caracter deve ser uma letra ou um underscore ( _ ). Brancos no podem ocorrer em nomes SAS. Varveis alfanumricas so identificadas atravs do smbolo " $ " aps o nome. Por exemplo: INPUT nome $ sexo $ idade altura peso. Neste caso as variveis nome e sexo so alfanumricas. III - Lendo um arquivo de dados externo: Acrescentando o comando INFILE antes do INPUT, podemos usar um arquivo de dados externo. Exemplo: DATA Exemplo; INFILE 'C:\...caminho...\nome.ext'; INPUT var1 var2; ....... ....... { procedimentos ....... Obs: 1) Note que agora no precisamos do comando CARDS. 2) O arquivo nome.ext deve estar no formato ASCII e no deve conter os nomes das variveis, ou seja, deve conter apenas as observaes. 3) Tambm podemos utilizar um arquivo de dados atravs do comando INCLUDE. IV - Executando um programa SAS: Clicar no boto Submit ou pressionar a tecla F8.

Obs: 1) Pode-se ainda, executar o comando SUBMIT na caixa de comandos, com a janela PROGRAM EDITOR ativa). 2) Pode-se executar o programa todo, ou partes deste, desdeque sejam devidamente marcadas. V - Principais comandos do SAS:

No Sistema SAS existem algums comandos especficos que podem ser utilizados diretamente atravs da caixa de comandos ou mesmo atravs de teclas de atalho (F-Keys). Alguns comandos so relacionados abaixo: Comando HELP PGM LOG OUTPUT SUBMIT KEYS ZOOM
1

Tecla de atalho (F-Key) F1 F5 F6 F7 F8 F9 F7

Descrio Aciona a janela HELP do SAS Move o cursor para a janela PROGRAM EDITOR Move o cursor para a janela LOG Move o cursor para a janela OUTPUT Executa os comandos selecionados quando a janela PROGRAM EDITOR estiver ativa Edita as teclas de atalho1 Expande a janela ativa para a tela toda

Podemos editar as teclas F-keys e reconfigur-las.

Existem, ainda, outros comandos, dos quais destacamos: - CLEAR: limpa a janela ativa (ou ctrl+E). - TILE: organiza lado-a-lado as janelas PROGRAM EDITOR, LOG e OUTPUT. - NEXT: move o cursor para a janela seguinte. - BYE / ENDSAS: encerra o programa SAS. - FILE: grava o contedo de uma janela ativa num arquivo. - INCLUDE: abre um programa SAS na janela EDITOR ou inclu um conjunto de dados no corpo de um programa. - LINESIZE = n (ou LS = n): define o comprimento da linha* ( 64 n 132 ). default LS = 132. - PAGESIZE = n (ou PS = n): especifica o nmero de linhas da pgina*. default PS = 60. - MISSING = 'caracter' : especifica caracter como valor perdido (missing value). * Os comandos PS e LS devem aparecer de preferncia no incio do programa. VI - Principais procedimentos do SAS: Todo procedimento SAS vem identificado pela palavra PROC e pode apresentar diversas opes e subcomandos especficos. A estrutura dos PROCs so basicamente a mesma para todos, conforme descrio abaixo: Sintaxe: PROC NOME opes; <declaraes>; A seguir, apresentaremos os principais procedimentos do SAS. A) Procedimentos de estatsticas descritivas : PROC CORR fornece correlaes e medidas de associao. PROC MEANS estatsticas descritivas. PROC UNVARIATE estatsticas descritivas, incluindo quantis e plots descritivos.

PROC CHART histogramas e grficos. PROC TABULATE tabelas com estatsticas descritivas. PROC TTEST compara mdias de dois grupos de variveis atravs do teste t.

B) Procedimentos para impresso: PROC PRINT mostra o contedo de SASdataset na janela OUTPUT. PROC FORMS formas padres, por exemplo mala direta. PROC PLOT para construir grficos. PROC TIMEPLOT para grficos de uma ou mais variveis na ordem temporal. PROC CALENDAR para construir calendrios. C) Procedimentos de regresso e anlise de varincia: PROC REG ajusta uma regresso linear com vrias opes de diagnsticos e diversos mtodos para seleo de modelos. PROC NLIN ajusta modelos de regresso no lineares. PROC ANOVA para anlise de varincia, anlise de varincia multivariada, anlise de varincia com medidas repetidas em experimentos balanceados, comparaes mltiplas. PROC GLM ajusta modelos lineares gerais (regresso simples, mltipla, polinomial e ponderada, faz anlise de varincia para dados desbalanceados). PROC VARCOMP para componentes de varincia. PROC LIFEREG ajusta modelos paramtricos para dados de tempos de vida. D) Procedimentos para dados multivariados: PROC PRINCOMP faz anlise de componentes principais. PROC CANCORR faz anlise de correlao cannica. PROC FACTOR faz anlise de fatores ortogonais com rotaes. PROC CLUSTER faz anlise de cluster (ou agrupamentos ). E) Procedimentos no paramtricos e para dados categricos: PROC NPAR1WAY anlise no paramtrica one-way para ranks. PROC CATMOD para tabelas de contingncia. PROC FREQ faz distribuies de frequncia para variveis categricas e tabelas cruzadas. PROC LOGIST ajusta modelos logsticos. PROC PROBIT faz regresso probit, logstica e logstica ordinal. F) Procedimentos Utilitrios: PROC APPEND anexa dados de um data set no fim de um outro data set. PROC COMPARE compara os contedos de dois data set's. PROC FORMAT define formatos de sada e de leitura de dados. PROC SORT ordena os dados de um SASdataset. VII - O procedimento PROC UNIVARIATE: Estatsticas descritivas, incluindo quantis e plots descritivos para variveis numricas. Sintaxe: PROC UNIVARIATE opes; var <variveis>; by <variveis>;

freq <variveis>; weight <variveis>; id <variveis>; output out=SASdataset Keyword=<nomes>; onde: 1) Opes: DATA=SASdataset especifica o conjunto de dados. NOPRINT no mostra as sadas. PLOT opes de grficos (ramos-folhas, box-plot, normal-plot). FREQ faz tabela de frequncia. NORMAL faz teste de normalidade dos dados, se n<51 faz o teste de Shapiro-Wilks, se n 51 faz o teste de Kolmogorov-Sirnov. PCTLDEF=k especifica o mtodo para o clculo dos quartis, k = 1, 2, 3, 4 ou 5 (default k = 5). VARDEF=df/weight/n/wdf especifica o divisor para o clculo da varincia (default =df), onde: df = graus de liberdade, weight = soma dos pesos, n = nmero de observaes, wdf = soma dos pesos menos 1 (w-1). ROUND=n especifica as unidades para arredondamento 2) Descrio das declaraes: var lista de variveis para o PROC UNIVARIATE (default = todas). * usar sempre aps uma declarao de output. by separa as anlises em subgrupos definidos pela varivel declarada. * os dados devem estar ordenados em ordem crescente pela varivel em questo. freq considera os valores da varivel como frequncias. * se os dados no so inteiros, os valores so truncados. weight varivel com pesos para o clculo da mdia e varincia ponderadas ( xW 2 e sW ). * valores negativos so considerados como zero. 2 s para calcular xW e sW . id usado para identificar as observaes (ou casos). * Considera os 8 primeiros caracteres. output requisita um arquivo interno de sadas. out = SASdataset define o nome do arquivo interno de sadas. keyword = nomes identifica as estatsticas desejadas. * o comando OUTPUT grava o contedo da memria RAM num arquivo SASdataset. Gravar as sadas num SASdataset no o mesmo que salvar num arquivo definitivo, o que pode ser obtido atravs do comando FILE. Os contedos dos SASdataset se perdem quando ao sair do SAS.

Os nomes definidos atravs da opo keyword podem ser: N nmero de observaes consideradas para os clculos (menos MISSING). NMISS nmero de valores perdidos. NOBS nmero total de observaes. MEAN mdia aritmtica. SUM soma das observaes. STD desvio padro. VAR varincia. SKEWNESS medida de simetria. KURTOSIS curtosi. SUMWGT soma dos pesos. MAX valor mximo. MIN valor mnimo. RANGE amplitude amostral (MAX-MIN). Q3 terceiro quartil. MEDIAN mediana. Q1 primeiro quartil. QRANGE amplitude interquartil (Q3-Q1). P1 10 percentil (quantil 0.01). P5 50 percentil (quantil 0.05). P10 100 percentil (quantil 0.10). P90 900 percentil (quantil 0.90). P95 950 percentil (quantil 0.95). P99 990 percentil (quantil 0.99). MODE moda (se houver mais do que uma moda, usada a menor delas).

VIII - O procedimento PROC MEANS: Estatsticas descritivas para variveis numricas. Sintaxe: PROC MEANS opes; var <variveis>; by <variveis>; class <variveis>; freq <variveis>; weight <variveis>; id <variveis>; output out=SASdataset Keyword=<nomes>; Principais opes: DATA=SASdataset especifica o conjunto de dados. NOPRINT no mostra as sadas. MAXDEC nmero de casas decimais para os resultados (0 a 8). FW tamanho do campo para impresso. Declaraes:

var lista de variveis para o PROC MEANS (default = todas). by especifica subgrupos. class especifica as variveis que definem subgrupos. freq considera os valores da varivel como frequncias. weight varivel com pesos para o clculo da mdia e varincia ponderadas. id usado para identificar as observaes (casos). output requisita um arquivo interno de sadas. out = SASdataset define o nome do arquivo interno de sadas. keyword = nomes identifica as estatsticas desejadas. Os nomes definidos atravs da opo keyword podem ser: MEAN RANGE MAX STD MIN SUM N SUMWGT NMISS VAR CV coeficiente de variao (porcentagem). STDERR erro padro da mdia. USS soma de quadrados no corrigida. CSS soma de quadrados corrigida. T valor t para testar se a mdia da populao zero. PRT P( T > t ) , onde T ~ t-Student. IX - O procedimento PROC PRINT: Imprime os valores das variveis de um arquivo de dados na janela OUTPUT. Sintaxe: PROC PRINT data=nome; var <variveis>; seleciona variveis. by <variveis>; especifica subgrupos. sum <variveis>; apresenta a soma das variveis selecionadas. * A opo data=nome define o SASdataset a ser impresso. Se este no for definido, o ltimo SASdataset utilizado pelo SAS ser considerado.

Vous aimerez peut-être aussi