Vous êtes sur la page 1sur 59

APOSTILA PARA TRATAMENTO DE DADOS VIA SPSS

Ronaldo Pilati
Juliana B. Porto

1
NDICE

APRESENTAO 1

CAPTULO 1 1

APRESENTAO DO SPSS 1

CAPTULO 2 14

DESCREVENDO DADOS NO SPSS 14

CAPTULO 3 21

EXPLORANDO E ADEQUANDO O ARQUIVO DE DADOS 21

CAPTULO 4 34

REALIZANDO ANLISES INFERENCIAIS: ANOVA UMA VIA, CORRELAO BIVARIADA, QUI-


QUADRADO E REGRESSO LINEAR SIMPLES 34

CAPTULO 5 39

ANLISE FATORIAL EM AVALIAO DO TREINAMENTO 39

CAPTULO 6 51

GERAO E MANIPULAO DE SYNTAX 51

2
Apresentao da Apostila

Apresentao
Nas ltimas dcadas o uso da microinformtica tem facilitado enormemente o
trabalho de organizao, tratamento e anlise de dados estatsticos de pesquisas em
psicologia e outras reas do conhecimento. Pelo fato do ferramental estatstico servir
como uma auxlio para iluminar as informaes advindas da realidade, esta tem sido
uma estratgia secular de produo do conhecimento em psicologia e reas afins. Boa
parte do conhecimento que temos hoje sobre o comportamento e a psicologia humana se
deve, em grande medida, ao uso da estatstica na prtica da pesquisa. A
microinformtica trouxe uma enorme capacidade de tratamento dos dados, graas ao
incremento do processamento dos hardwares, a miniaturizao dos computadores e ao
desenvolvimento de programas cada vez mais fceis de serem utilizados e poderosos em
seus recursos e capacidades grficas e de clculo.
Atualmente h uma grande quantidade de softwares estatsticos que podem ser
eficientemente utilizados para tratamento de dados nas pesquisas de psicologia e
cincias humanas, como o Excel, o BMDP, Minitab, NCSS, SYSTAT, Statplus, SAS,
SPSS, entre centenas de outros. H tambm softwares estatsticos gratuitos, vrios com
cdigo livre, como EPINFO e o R. H muitos programas que so especializados em
algumas anlises e outros, como a lista citada, que so gerais. Se voc for curioso poder
encontrar dezenas de softwares estatsticos em uma simples busca na internet.
Se por um lado o avano da microinformtica gerou muitas possibilidades para a
pesquisa em psicologia e reas afins, tambm potencializou o mau uso da estatstica. A
mxima lixo entra, lixo sai foi significativamente potencializada nos tempos modernos.
Por este motivo, no suficiente que o usurio saiba operar o software, mas sim que seja
capaz de compreender e analisar os resultados que o programa oferece, alm, claro, de
organizar as informaes a serem inseridas no programa de anlise de dados.
Esta apostila tem como objetivo ser um pequeno manual introdutrio ao SPSS,
um pacote estatstico que se tornou o principal software em uso entre psiclogos sociais,
do trabalho e organizacionais no Brasil. Especificamente no departamento de Psicologia
Social e do Trabalho da UnB este programa utilizado h mais de 30 anos, o que
significa que vrias geraes de pesquisadores acabaram sendo formados em anlise de

1
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Apresentao da Apostila

dados com o uso deste programa. Isto no quer dizer que ele seja o melhor daqueles
tantos oferecidos no mercado, mas um programa que oferece vrias vantagens
apreciadas pelos pesquisadores em cincias sociais, como menus fceis de serem
utilizados e a no necessidade de uso de linguagem de programao ou de conhecimento
sofisticado de matemtica para a realizao das anlises estatsticas. Alm disto, o
programa oferece uma ampla variedade de mdulos, que permitem um grande nmero
de anlises estatsticas multivariadas, boa parte das quais freqentes na pesquisa
cientfica em psicologia. Dentro deste zeitgeist que este manual foi concebido.
tambm neste contexto que ele deve ser utilizado, pois pretende ser um pequeno manual
introdutrio queles que tm a pretenso de fazer pesquisa em psicologia social e reas
afins, de forma a abrir o vasto mundo de utilizao da ferramenta estatstica SPSS.
Mas ateno! Este manual no tem a pretenso de substituir a aprendizagem
sria e comprometida do pensamento estatstico. Muito pelo contrrio, este manual
apenas uma leitura complementar para uso do SPSS. Portanto, foi concebido como uma
ferramenta extra para servir de apoio ao ensino de estatstica, feito com, no mnimo, o
uso de um livro texto de estatstica voltado para cientistas sociais. Isto significa que o
manual no pretende substituir a leitura de um bom livro introdutrio ou de anlise
multivariada de dados, muito menos a realizao de exerccios de aplicao de
conhecimentos estatsticos, mas sim auxiliar o aluno na realizao de procedimentos
estatsticos via SPSS. Considera que o desenvolvimento destas competncias parte
essencial da formao de pesquisa em psicologia.
Vale lembrar que o manual foi desenvolvido com base na verso 10.0 do SPSS, o
que significa que vrias dos aprimoramentos das verses posteriores no foram,
necessariamente, implementadas no manual. De qualquer forma considera-se que a
lgica geral do programa permanece a mesma para as verses posteriores, o que ainda o
deixa atualizado. Uma boa leitura!

2
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

CAPTULO 1
Apresentao do SPSS

Contedo:
1. Apresentao das Janelas de Trabalho
2. Descrio dos Menus de Comando

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1. Identificar o SPSS
2. Descrever cada uma das janelas de trabalho do programa
3. Montar arquivos de dados
4. Operar comandos bsicos dos menus do SPSS

1
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

JANELAS DE TRABALHO

O SPSS um pacote estatstico, composto de diferentes mdulos, desenvolvido


para o uso em cincias humanas, sociais, biolgicas, entre outras rea do conhecimento.
Est baseado no ambiente Windows, sendo de fcil operao e muito abrangente, pois
permite realizar uma grande amplitude de anlises estatsticas e grficas (anlises
descritivas, anlises inferenciais multivariadas, mdulos grficos, entre outros).
A principal janela de trabalho do software apresentada abaixo. A Figura 1.1
mostra a janela de digitao (ou input) de dados SPSS Data Editor, na qual os bancos
de dados so gerados e analisados. Na janela SPSS Data Editor as linhas so relativas
aos casos, participantes ou respondentes e as colunas relativas as variveis investigadas.
Esta janela gera um dos trs tipos de arquivos associados ao SPSS. Esse arquivo tem
terminao .sav e armazena todas as informaes relativas ao banco de dados, como
definio de variveis e os dados digitados.
Figura 1.1 Janela
de input de dados
do SPSS (v.10.0).

Colunas:
representam as
variveis em um
banco de dados.

Linhas:
representam os
casos em um
banco de dados

Acesso a janela
de definio dos
parmetros das
variveis.

2
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

Teoricamente, no SPSS, no existe limitao do nmero de colunas, muito


menos do nmero de casos, possibilitando a anlise de bancos de dados de qualquer
tamanho.
Os bancos de dados so montados no prprio SPSS ou importados de outras
planilhas. O SPSS importa praticamente todos os tipos de arquivos utilizados no
mercado, alm de trabalhar com arquivos de texto e .dat. Junto com a digitao dos
dados necessrio definir cada uma das variveis colocadas nas colunas da janela SPSS
Data Editor.
Nesta verso do SPSS, a definio das variveis do banco de dados feita em
outra janela tambm denominada SPSS Data Editor (Figura 1.2). Para tornar esta janela
ativa, deve-se clicar na opo Variable View, disposta no lado inferior esquerdo da
barra de rolamento da janela da Figura 1.1.

Figura 1.2 Janela


de definio de
variveis.

Colunas:
representam cada
uma das
caractersticas
das variveis a
serem definidas.

Linhas:
representam cada
uma das
variveis que
compem um
banco de dados.

A janela acima apresentada na Figura 1.2 possui vrias colunas relativas aos
principais parmetros de cada uma das variveis da planilha. So oito colunas:

3
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

Name: refere-se ao nome da varivel, composto de at oito caracteres (a depender


da verso do programa), que ser colocado nas colunas da janela de input
de dados. Deve-se clicar em qualquer cela dessa coluna para que se possa
digitar o nome da varivel;
Type: refere-se ao tipo de varivel, ou seja, sua caracterstica de notao
(numrica, qualitativa, etc). Clicando-se na cela desta coluna abre-se a
caixa de dilogo da Figura 1.3. Observe que a caixa de dilogo Variable
Type permite a escolha de vrios tipos de variveis. A definio de cada
uma pode ser acessada clicando-se no boto direito do mouse colocado em
cima da opo (ver reproduo na Figura 1.3). Esta mesma caixa de
dilogo tambm permite a escolha de outras caractersticas da varivel
(width e decimal places ver definies abaixo).

Figura 1.3 Caixa


de dilogo Variable
Type..

Caixa de dilogo
de definio de
tipo da varivel.

Clicando-se com
o boto da direita
do mouse abre-se
esta janela
explicativa.

Width: diz respeito ao nmero de caracteres da varivel. Pode ser definido


diretamente na cela ou atravs da caixa de dilogo Variable Type
reproduzida na Figura 1.3.

4
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

Decimals define o nmero de casas decimais, a direita da vrgula, que sero


apresentadas. Da mesma forma que o Width, pode ser definido
diretamente na cela ou na caixa de dilogo Variable Type.
Label define o nome atribudo a uma varivel e no possui restrio de nmero de
caracteres (e.g., idade, escolaridade, descrio do item de um questionrio,
entre outras);
Value refere-se aos valores que os labels podem assumir. Neste parmetro o
pesquisador deve definir todos os possveis valores que uma varivel pode
assumir. Um tipo comum nas cincias sociais a escala Likert (1 =
discordo totalmente; 2 = discordo...);
Missing define o tipo de tratamento para os casos ausentes que o pesquisador quer
adotar. O Default do programa geralmente usado, mas outros valores
podem ser definidos (e.g. 999 ou 99);
Columns define o tamanho da coluna da varivel, que ser apresentada na janela
de input de dados;
Align define o alinhamento dentro de cada clula da planilha de dados;
Measure que informa o tipo de varivel (contnua ou discreta) sendo estudada pelo
pesquisador. Esta definio fundamental, pois o software habilitar o uso
das variveis em certos procedimentos a partir do tipo de medida
(measure) selecionada.

Na construo de um arquivo de dados para digitao de dados importante criar


como primeira varivel uma coluna de identificao. A funo desta criar um rtulo
(varivel nominal) de identificao do questionrio dentro do banco de dados. A Figura
1.2 apresenta, na primeira coluna, uma varivel denominada identif. Este rtulo
importante para que o questionrio possa ser identificado a qualquer momento, para
correo de erros de digitao ou retorno ao questionrio para coletar qualquer tipo de
informao. A contagem automtica do SPSS no confivel, pois a excluso de
qualquer caso acarretar na modificao da numerao de todos os subsequentes.

5
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

O SPSS possui ainda mais janelas de trabalho. A prxima a ser apresentada


refere-se ao output do programa. Nesta janela so geradas as tabelas e os grficos
processados a pedido do usurio. Quando qualquer tipo de procedimento executado,
mesmo na janela de input, os resultados so gerados na janela de output, que se abre
automaticamente quando o procedimento de anlise solicitado. Essa janela , tambm,
um outro tipo de arquivo, com terminao .spo. importante o usurio ter em mente que
deve executar o procedimento de nomeao e salvamento desta janela, para que se torne
uma janela de resultados do SPSS. A Figura 1.4 apresenta esta janela do programa.

Figura 1.4 Janela


de output (sada de
dados)

Sumrio das
informaes da
janela de output.

Rgua de
diviso: pode ser
movida.

Resultado do
procedimento
para obteno de
grfico de barras.

A outra janela de trabalho do SPSS a de syntax. Esta janela possibilita a


execuo de anlises estatsticas e a gerao de grficos a partir dos cdigos de comando
do programa. Este tipo de janela muito til quando o padro de anlise de dados
extremamente complexo e/ou exige que as anlises sejam feitas com freqncia (como
aquelas para relatrios peridicos) ou quando as mesmas anlises devem ser feitas com
diferentes variveis, o que possibilita apenas que o nome das variveis seja modificado,
sem precisar repetir os procedimentos nos menus do programa. Tambm importante
ressaltar que, a exemplo da janela de output, a janela de syntax tambm um arquivo
6
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

diferenciado, com terminao .sps A Figura 1.5 apresenta esta janela de trabalho do
SPSS.

Figura 1.5 Janela


de syntax do SPSS.

Comandos do
SPSS para
Anlise Fatorial.

Comandos para
estatstica
descritiva
(mdia, desvio
padro, etc)

Comandos para
gerao de
grfico de
disperso.

MENUS DE COMANDO

Na janela SPSS Data Editor o programa possui uma srie de menus de


comandos, que possibilitam a manipulao e anlise dos dados, bem como os
procedimentos do windows para trabalhar com arquivos.
O primeiro desses menus denominado File e tem como principais funes a
abertura, salvamento, importao, alm de outras funes comuns aos diferentes
programas da mesma plataforma operacional ou especficos do SPSS.
O segundo menu o Edit, que possui as seguintes funes: voltar a ltima
ao, copiar, colar, cortar, procurar (find) e opes. O menu opes tem como
objetivo definir diferentes parmetros do programa, como formato de apresentao
dos dados digitados na SPSS Data Editor, o formato de gerao das tabelas na janela
de output de dados, entre outras funes. A Figura 1.6 apresenta a janela de dilogo
do menu edit/opes.
7
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

Figura 1.6 Janela


de opes do
programa.

Formato de
apresentao do
output nomes e
labels.

Formato de
apresentao da
janela de input.

Este menu de opes importante para adaptar o padro de apresentao do


programa s caractersticas ou preferncias de trabalho do usurio. Por exemplo, na
pasta output labels importante a definio de apresentao do nome das variveis e
tambm de seus labels, para que a tabela de resultados j possa fornecer todas as
informaes necessrias para a interpretao dos resultados das anlises
O prximo menu da barra de comandos denominada Data. Esse menu
possibilita manipular o arquivo de dados de diferentes maneiras. A figura 1.7
apresenta a tela do SPSS com este menu aberto.

8
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

Figura 1.7 Menu


Data do SPSS.

Como pode ser observado na Figura 1.7 o menu Data possui vrios comandos.
Estes sero apresentados em tpicos a seguir:
O comando insert variable permite a insero de uma nova coluna na planilha
de dados, ao lado esquerdo da coluna onde se encontra a cela ativa da planilha;
o comando insert case ir inserir uma nova linha em uma planilha de dados,
acima da linha em que est a cela ativa da planilha;
o sort cases realiza um ordenamento de todos os casos de uma planilha
(linhas) a partir da seleo de uma das colunas do arquivo de dados; este
ordenamento pode ser em ordem ascendente ou descendente, como a
especificao apontada na janela de dilogo deste comando;
o comando merge files, que possibilita a insero de novos casos (linhas) ou
variveis (colunas) provenientes de um outro arquivo de dados;
o split files possibilita a separao do banco de dados a partir de uma das
variveis deste banco. Quando este comando est acionado, por exemplo, as
anlises resultantes sero apresentadas para cada uma das categorias definidas
por uma varivel. Se for acionado o comando split files para a varivel
9
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

escolaridade na Figura 1.7 sero apresentados os resultados para os sujeitos


pertencentes a cada grupo de escolaridade;
o comando select cases possibilita a seleo de um grupo de casos em um
mesmo arquivo ou a criao de um outro arquivo a partir de um grupo de
casos inicial.
O prximo menu da barra de menus do SPSS denominado Transform. Este
menu possibilita a transformao de variveis do arquivo, assim como a criao de
novas variveis no arquivo de dados a partir de variveis j presentes no mesmo. A
Figura 1.8 apresenta o referido menu na janela de input do SPSS.

Figura 1.8 Menu


Transfom do SPSS

A seguir so apresentados os comandos desse menu.


compute um comando de gerao de novas variveis (ou sobreposio de
antigas) a partir de variveis j existentes no arquivo de dados. Este comando
que possibilitar, por exemplo, a gerao dos escores fatoriais, gerados a
partir da mdia aritmtica de cada um dos itens componentes do fator. Ele
permite a composio e manipulao de variveis por meio de dezenas de
funes matemticas;

10
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

o comando recode possibilita a recodificao de valores (labels) de uma


varivel nela mesma ou na criao de uma nova varivel;
automatic recode possibilita a recodificao de variveis em novas variveis,
mas de forma automtica, diferentemente do que possibilita o comando
recode, onde a estipulao dos valores manual;
create time series possibilita a gerao de uma varivel de srie temporal
dentro de um arquivo de dados j existentes;
o comando replace missing values realiza substituies automticas de casos
omissos nas variveis selecionadas. Esta substituio pode ser feita pelo valor
mdio ou mediano, alm de outros mtodos. Tambm importante ressaltar
que o comando gera um novo conjunto de variveis, onde a substituio
apresentada.
O prximo menu de comando denominado Analyze. Neste menu todos os
procedimentos estatsticos esto concentrados. Aqui so apresentadas todas as tcnicas
descritivas e inferenciais, univariadas e multivariadas. Vale uma ressalva: as tcnicas
descritivas so aquelas que sintetizam os dados brutos, apresentando os padres de
disperso (e.g. varincia, desvio padro) e tendncia central (e.g. mdia, moda e
mediana), assim como as medidas de posicionamento (e.g. quartil, decil, percentil). As
anlises inferenciais so aquelas que aplicam modelos probabilsticos, estimando a
chance do comportamento observado na amostra se repetir na populao. Quanto a
tcnicas univariadas, estas levam em considerao apenas uma varivel e as
multivariadas levam em considerao mltiplas variveis.
So comandos do menu analyze: report cases, descriptive statistics, compare
means, correlate, regression, data reduction, scale, entre outros. Durante este curso
sero abordadas tcnicas estatsticas bsicas que se encontram nos comandos
descriptives statistics, correlate e compare means. Estes comandos sero explorados em
detalhe no captulo 3.
O prximo menu denominado graph. Este relativo aos mdulos de gerao de
grficos do SPSS, que apresenta uma grande quantidade de recursos de gerao e

11
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

manipulao de dados a partir de grficos. A Figura 1.9 apresenta a tela do SPSS com
esse menu aberto.
Figura 1.9 Menu
Graph do SPSS.

So tipos de grficos gerados por este menu do SPSS:


bar apresenta grficos de barras, ideais para comparao de categorias de uma
varivel categrica, como escolaridade, sexo, entre outras. Esse tipo de
apresentao tambm importante para aquelas variveis categricas que no
tem um somatrio total de 100%;
pie um tipo de grfico conhecido por pizza. Ele ideal para variveis
discretas (categricas) que possuem somatrio total de categorias de 100%;
box-plot um grfico que apresenta o tipo de disperso de uma varivel,
apresentando o mnimo, o mximo, o primeiro e o terceiro quartil e a mediana
em uma nica representao grfica. direcionado para variveis contnuas e
ideal para observar casos extremos univariados. O SPSS trabalha a perspectiva
de amplitude interquartlica para a identificao de casos extremos;
histogram o grfico de barras direcionado para variveis contnuas, onde
todas as observaes so encaixadas em intervalos e sua freqncia contatada
12
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 1 Apresentao do programa

(eixo X o conjunto de intervalos e o Y a contagem de casos dentro daquela


amplitude). Este grfico ideal para observar a normalidade das distribuies;
scatter conhecido em portugus como grfico de disperso e apresenta o
relacionamento entre duas variveis, buscando captar o componente linear de
correlao entre essas variveis. uma forma grfica de captar um coeficiente
de correlao bivariada ou um coeficiente de regresso simples;
interactive um mdulo do SPSS para trabalhar com todos os grficos
descritos anteriormente e muitos outros, mas com a possibilidade de gerao e
manipulao tridimensional.
Os grficos dos SPSS podem ser formatados na janela de output do programa.
Para isso basta clicar duas vezes sobre o grfico, na janela de output, que uma terceira
janela ser aberta e vrios procedimentos de formatao podem ser executados, como
nomear o grfico, inserir notas de rodap, modificar a cor de partes do grfico, transpor
os eixos, entre muitas outra opes. Esses procedimentos so importantes para que os
grficos possam sair do SPSS com a aparncia desejada para serem inseridos no corpo
de relatrios ou textos.
O menu utilities possui vrios comandos que auxiliam na manipulao dos
dados e das variveis de um arquivo. Existem comandos para a visualizao das
variveis e seus respectivos critrios de definio, estipulados na janela do SPSS
Data Editor (input) chamada variable view.
O menu Window possibilita a mudana de janelas do SPSS, como em qualquer
programa de ambiente windows. O ltimo menu denominado Help. Nele esto
inseridas muitas informaes sobre o programa, desde como executar determinados
procedimentos at a explicao da funo de diferentes tcnicas estatsticas. Este
menu possui um tutorial de procura de termos, que pode ser muito til para a
proficincia na operao do SPSS.

13
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 2 Descrevendo Dados no SPSS

CAPTULO 2

Descrevendo Dados no SPSS

Contedo:
1. Tabelas de freqncia
2. Cruzamento de dados
3. Medidas de tendncia central
4. Medidas de posio
5. Medidas de disperso

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1. Gerar tabelas de freqncia no SPSS.
2. Gerar e interpretar tabelas de cruzamento de dados.
3. Realizar procedimentos estatsticos de tendncia central.
4. Gerar medidas de posio.
5. Calcular medidas de disperso de dados.

14
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 2 Descrevendo Dados no SPSS

Uma das primeiras aes a serem feitas com dados estatsticos sua descrio,
por meio de estatsticas descritivas, como freqncias, mdias, medianas, varincia,
entre outras. Muitas vezes tambm objetivo da anlise de dados a realizao de
cruzamento de diferentes informaes, para se ter uma noo da relao existente entre
variveis da pesquisa. Todos os procedimentos referentes a essa descrio de dados, e
conseqentemente todo o contedo desse segundo captulo da apostila, esto
concentrados no menu Analyze Descriptives Statistics do SPSS.
Na presente apostila ser iniciada a apresentao de tcnicas de descrio de
dados categricos via SPSS. Para tanto inicialmente sero apresentadas a gerao de
tabelas de freqncia e posteriormente a gerao de tabelas de cruzamento de dados
(crosstabs). Em seguida sero apresentadas as tcnicas de descrio de dados contnuos
no SPSS, primeiramente com as medidas de tendncia central, em seguida com as de
posio e por ltima as medidas de disperso.
Para a obteno de tabelas de freqncia deve-se seguir os seguintes passos para
a janela de dilogo apresentada na Figura 2.1: Analyze Descriptives Statistics
Frequencies.
Figura 2.1 Janela
do comando
Frequencies.

Caixa para requisio


de tabela de
freqncia.

15
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 2 Descrevendo Dados no SPSS

ESCOLAR escolaridade mai s el evada

Cumulat iv e Tabela 2.1 Resultado do


Frequency Percent Valid Percent Percent procedimento Frequencies.
Valid 3 Segundo grau 144 50. 7 50. 7 50. 7
4 Curso s uperior 90 31. 7 31. 7 82. 4
5 Espec ializa o 38 13. 4 13. 4 95. 8
Colunas com freqncia,
6 Mest rado 8 2. 8 2. 8 98. 6 percentagem,
7 Dout orado 4 1. 4 1. 4 100.0 percentagem vlida e
Tot al percentagem acumulada.
284 100.0 100.0

Como pode ser observado na Figura 2.1 foi solicitada uma tabela de freqncia
para cada uma das variveis do exemplo, i.e. sexo e escolaridade. A Tabela 2.1 apresenta
a tabela de freqncia para a varivel escolaridade, com o resultado da anlise solicitada
na Figura 2.1.
J a anlise de cruzamento de dados (crosstabs) obtida por meio do menu
Analyze Descriptives Statistics Crosstabs. Esse comando resultar na janela
apresentada na Figura 2.2.

Figura 2.2 Janela


do comando
Crosstabs.

Janelas de definio de
variveis que sero
apresentadas nas linhas
(row) e nas colunas
(column).

16
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 2 Descrevendo Dados no SPSS

ESCOLAR escolaridade mai s el evada * SEXO sexo Crosstabul ati on

Count
SEXO s exo Tabela 2.2 Resultado do
1 Feminino 2 Masc ulino Tot al procedimento Crosstabs.
ESCOLAR 3 Segundo grau 69 75 144
esc olaridade 4 Curso s uperior 45 45 90
mais elev ada 5 Espec ializa o 19 19 38
6 Mest rado Valor que representa o
4 4 8
nmero de pessoas do
7 Dout orado 1 3 4 sexo feminino que
Tot al 138 146 284 possuem nvel de
escolaridade de segundo
grau.

Como pode ser observado na Tabela 2.2, a tabela de cruzamento de dados do


SPSS apresenta o cruzamento de informaes entre variveis, como sexo e escolaridade,
como exemplificado. Dessa forma, possvel ter uma noo de covariao de variveis
categricas, para uma explorao das caractersticas dos dados da pesquisa.
As medidas de tendncia central so usualmente utilizadas em variveis
contnuas ou quantitativas. A Figura 2.3 apresenta a janela de dilogo para execuo das
principais medidas de tendncia central no SPSS, mdia, mediana e moda. Essa janela
obtida por meio do caminho Analyze Descriptives Statistics Frequencies.

Figura 2.3 Janela


do comando
Frequencies.

Desmarque essa opo.


Clique no boto statistics
para selecionar as
anlises.

17
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 2 Descrevendo Dados no SPSS

Quando selecionado o boto statistics da janela apresentada na Figura 2.3 tem-se


a nova janela de dilogo de estatsticas, apresentada na Figura 2.4.

Figura 2.4 Janela de


opes de estatstica do
comando Frequencies.

Selecione as medidas de
tendncia central
desejadas: mdia,
mediana e moda.

Nessa mesma caixa de


dilogo so apresentadas
as medidas de posio e
disperso.

Depois de geradas as anlises os resultados so apresentados na Tabela 2.3.

Statistics

EXPTRAB Tabela 2.3 Resultado das


tempo de anlises de tendncia central.
experincia
IDADE idade de trabalho
(j complet a) (em anos j
em anos complet os)
N Valid 274 282
As colunas apresentam as
Miss ing 10 2 variveis e as linhas as
Mean 31. 50 12. 156 anlise de tendncia
central.
Median 29. 00 10. 000
Mode 21a 2. 0
a. Mult iple modes ex is t. The smallest v alue is shown

Como salientado anteriormente a gerao de medidas de disperso e posio so


selecionadas na mesma janela de dilogo, apresentada na Figura 2.4. O resultado da
gerao de uma anlise de disperso e de posio apresentada na Tabela 2.4.

18
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 2 Descrevendo Dados no SPSS

Statisti cs

EXPTRAB
Tabela 2.3 Resultado das
tempo de anlises de tendncia central.
experincia
IDADE idade de trabalho
(j completa) (em anos j
em anos complet os) Medidas de disperso
(seta superior) e de
N Valid 274 282
posio (seta inferior).
Missing 10 2
Std. Dev iation 10. 329 9. 3293
Variance 106.698 87. 0361
Percentiles 25 23. 00 4. 000
50 29. 00 10. 000
75 38. 25 20. 000

Outra estratgia importante para descrio de dados o uso de grficos. Da


mesma forma que os indicadores estatsticos os grficos so especficos para cada tipo
de varivel em anlise. Grficos de barra e pizza so usados em variveis categricas e
histogramas so representaes de variveis contnuas. A Figura 2.5 apresenta o menu
chart da janela de dilogo frequencies, obtida pelo caminho Analyze Descriptives
Statistics Frequencies e apresentada anteriormente na Figura 2.3.

Figura 2.5 Janela de


grficos do comando
Frequencies.

Selecione o tipo de
grfico desejado de
acordo com a varivel a
ser descrita.

19
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 2 Descrevendo Dados no SPSS

O Grfico 2.1 apresenta um grfico de pizza, obtido por meio do comando


descrito na Figura 2.5.

Grfico 2.1 Grfico de


pizza obtido por meio do
menu chart do comando
Frequencies.

Exemplos de histogramas, grficos destinados variveis contnuas, so


apresentados no captulo 3 dessa apostila, destinado a obteno de acuracidade de banco
de dados aps a digitao.

20
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

CAPTULO 3

Explorando e Adequando o Arquivo de Dados

Contedo:
1. Deteco e correo de erros de digitao
2. Observao e tratamento de casos omissos
3. Observao da normalidade de variveis
4. Estudo e eliminao de casos extremos univariados
5. Estudo e eliminao de casos extremos multivariados

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1. Detectar erros de digitao em arquivos de dados
2. Produzir arquivos de dados acurados
3. Tratar os casos omissos por meio dos procedimentos apresentados
4. Identificar a normalidade/anormalidade das variveis
5. Identificar casos extremos univariados
6. Tratar casos extremos univariados
7. Tratar casos extremos multivaridos

21
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

Aps os dados terem sido digitados fundamental que o primeiro passo do


trabalho de anlise de dados seja a limpeza e a promoo da acuidade do arquivo.
Para tanto alguns cuidados e procedimentos devem ser seguidos. Pode-se apontar
quatro procedimentos padres, que sero apresentados no presente documento: (1)
deteco e correo de erros de digitao, (2) observao e tratamento de casos
omissos, (3) observao da normalidade das variveis do arquivo de dados e (4)
estudo e eliminao de casos extremos univariados.

DETECO E CORREO DE ERROS DE DIGITAO

muito comum, durante o processo de insero de dados no SPSS, ocorrerem


erros de digitao, por exemplo, a duplicao de nmeros em uma clula. Como os
questionrios em avaliao de treinamento geralmente so associados a escalas de
resposta tipo Likert, a duplicao de valores em uma clula vai acarretar em
inflacionamento das estatsticas daquela varivel, prejudicando todo o procedimento de
anlise de dados. Para que isso no ocorra fundamental, como primeiro passo para a
anlise de dados, verificar se no existem erros de digitao no arquivo de dados.
Esse procedimento pode ser realizados por meio do menu Analyze
Descriptives Statistics Explore, que resultar na janela apresentada na Figura 3.1.

Figura 3.1 Janela


do comando Explore.

Lista de variveis a
serem analisadas.

22
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

Aps pressionado o boto statistics da janela da Figura 3.1 ser aberta a janela
apresentada na Figura 3.2.

Figura 3.2 Janela


do comando Explore.

Opo outliers
deve ser
selecionada.

A seleo desta opo possibilitar a identificao de valores superiores a


amplitude da escala de resposta dos itens do questionrio. Assim, erros de digitao
do tipo duplicao de valores em uma clula sero identificados. Alm do valor ser
apontado atravs deste procedimento, ele tambm possibilitar a identificao do caso
onde se encontra esse valor errneo. O resultado do procedimento obtido atravs da
janela apresentada na Figura 3.1 apresentado abaixo, na Tabela 3.1.

Extreme Val ues

Cas e Number Value Tabela 3.1 Resultado


do procedimento
IMPAC1 Highest 1 2 5 Explore.
2 19 5
3 217 5
4 136 5
5 40 .a Valores mnimos e
mximos e respectivos
Lowes t 1 279 1 casos.
2 115 1
3 182 1
4 198 1
5 190 1
a. Only a partial list of c ases wit h t he v alue 5 are
shown in t he table of upper ext remes.

importante ressaltar que o procedimento explore apresenta vrias


informaes na janela de output, mas apenas a tabela de extreme values possui as
informaes disponveis na Tabela 3.1. Tambm possvel a identificao desses

23
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

erros de digitao por meio de outros mdulos do SPSS, como Analyze


Descriptives Statistics Frequencies. Aps identificados os casos com erros de
digitao o operador do arquivo de dados deve retornar a sua fonte bruta de
informaes (questionrios respondidos pelos treinandos) e inserir a informaes
correta no local certo.

OBSERVAO E TRATAMENTO DE CASOS OMISSOS

O segundo passo a ser seguido a identificao e tratamento de casos omissos


(missing data). Um caso omisso uma ausncia de resposta, ou seja, por algum motivo
o participante no atribuiu valor a uma pergunta do questionrio. Essa ausncia de
resposta pode ser decorrente de diferentes fatores, como saturao de informaes a
serem processadas pelo respondente, inadequao da formatao do questionrio,
incapacidade do participante opinar sobre a assero. A respeito dessa ltima
possibilidade o cdigo no se aplica (NA) de questionrios buscam diminuir a
ocorrncia deste tipo de ausncia de resposta.
importante ressaltar que o excesso de casos omissos em determinado item de
um questionrio pode trazer vrias indicaes e pode, inclusive, ser considerado como
escopo de um relatrio, pois a incapacidade dos respondentes em avaliar questes pode
indicar inadequao do instrumento, entre muitas outras possibilidades. Esse dado, por si
mesmo, pode ser indicador um indicador relevante.
A identificao dos casos omissos pode ser obtida por meio do menu Analyze
Descriptives Statistics Frequencies, que resultar na janela apresentada abaixo na
Figura 3.3.

24
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

Figura 3.3 Janela


do comando
Frequencies.

Variveis
selecionadas para
anlise.

Para a identificao dos omissos, basta que sejam deixadas as especificaes


padres do SPSS. A Tabela 3.2 apresenta o resultado dos procedimentos executados
atravs da Figura 3.3.

IMPAC 1

Cumulat iv e Tabela 3.2


Frequency Percent Valid Percent Percent Resultado do
Valid 1 Discordo Tot almente 5 1. 8 1. 8 1. 8 procedimento
2 Discordo Pouco 26 9. 3 9. 5 11. 3 Frequencies.
3 No concordo, nem
26 9. 3 9. 5 20. 8
disc ordo
4 Concordo 146 52. 3 53. 3 74. 1 Porcentagem de
5 Concordo Totalmente casos omissos
71 25. 4 25. 9 100.0
observados na
Tot al 274 98. 2 100.0 varivel.
Missing Sy s tem 5 1. 8
Tot al 279 100.0

A Tabela 3.2 apresenta os resultados obtidos por meio dos procedimentos


executados no comando frequencies. fundamental observar-se a percentagem de casos
omissos observados em uma varivel. Valores superiores a 3% podem ser considerados
problemticos e devem ser investigados com mais cuidado. Para variveis com valores
omissos inferiores ou iguais a 3%, estes podem ser substitudos pela mdia, por meio
dos procedimento Replace Missing Values, do menu Transform, j apresentados no
primeiro captulo desta apostila.
A literatura sobre tratamento de dados omissos ampla e bastante abrangente. De
forma geral os pesquisadores e analistas de dados interessados no tema desenvolveram
uma classificao para o tratamento destes casos. Um elemento central neste sistema de
25
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

classificao diz respeito sistematicidade dos casos omissos. A presena de


sistematicidade crucial para o pesquisador, pois se isto ocorre a forma de tratamento
destes casos deve ser diferenciada. A classificao pressupe que os casos omissos de
um banco de dados possam assumir as seguintes caractersticas: MCAR omissos
completamente aleatrios; MAR omissos aleatrios; MNAR omissos sistemticos. O
SPSS possui uma ferramenta til para anlise de casos omissos, o mdulo Missing
Values Analysis MVA. Acesse o mesmo no menu Analyze Missing Values
Analysis. Ser apresentada a janela da Figura 3.4.

Figura 3.4 Janela


do comando MVA.

Varivel de
interesse a ser
estudada

Campo para
estimao de
valores omissos.

Variveis
demogrficas a
serem checadas.

Em geral o estudo de sistematicidade de casos omissos est associada o


observao de relao da varivel de interesse com variveis demogrficas, para
obteno de indicaes da ocorrncia de sistematicidade entre a varivel de interesse (no
caso do exemplo a varivel AJUDA) e estes indicadores. Para o estudo desta
sistematicidade no boto Patterns da caixa de dilogo voc deve selecionar a opo
All cases optionally sorted by selected variables. Esta opo trar na janela de sada de
dados uma tabela apresentada todos os casos do banco e a ocorrncia de caso omisso na
varivel de interesse. uma ferramenta prtica para a observao de algum tipo de

26
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

associao entre a varivel de interesse e possveis dados categricos que possam estar
associados a um padro de omisso de resposta. Este mdulo do programa tambm
permite a estimao de valores para substituio de casos omissos. Como pode ser
observado na Figura 3.4 possvel se selecionar estratgias de estimao de valores
omissos, de acordo com a literatura da rea. Cada opo tem um tipo de uso e o
pesquisador deve estar consciente para a escolha da forma mais adequada para realizar a
substituio de valores omissos. Esta estimao pode e deve ser utilizada em conjunto ao
comando Replace Missing Values.

OBSERVAO DA NORMALIDADE DAS VARIVEIS

Um outro procedimento muito importante para testar a adequao dos dados para
emisso de relatrios o estudo da normalidade das variveis. A ausncia de
normalidade na distribuio de uma varivel pode indicar muitas coisas, como ausncia
de variabilidade (a grande maioria das pessoas concordam e/ou discordam de uma
afirmativa de escala Likert). Essa informao, por si s, j resultado de um relatrio de
avaliao de treinamento e pode ser utilizada como subsdio de um relatrio. O que
deve-se observar a ausncia de normalidade das variveis que sero inseridas em
anlises inferenciais multivariadas, como regresso mltipla. Caso alguma varivel
anormal seja parte de uma anlise multivariada, deve-se adotar procedimentos de
transformao da mesma (e.g. logartmica, raiz quadrada) atravs do comando compute,
no menu transform.
Para a deteco da normalidade das variveis deve-se executar o seguinte
procedimento Analyze Descriptives Statistics Frequencies, que resultar na
abertura da janela apresentada na Figura 3.5.

27
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

Figura 3.5 Janela


do comando
Frequencies.

Selecionar
anlises neste
boto.

Selecionar tipo
de grfico para
estudo da
normalidade.

Nesta janela de comando, a exemplo das outras janelas de comando estatstico do


SPSS, o operador deve selecionar o conjunto de variveis a serem analisados e mov-las
para a coluna da direita. Para a observao da normalidade, o operador deve pressionar
em dois botes da borda inferior da janela, o statistics e o charts. As janelas de dilogo
destes botes esto apresentadas nas Figuras 3.6 e 3.7.
Figura 3.6 Janela do
comando Frequencies:
Statistics.

Selecione
medidas de
tendncia central.

fundamental a
seleo destas
duas medidas de
distribuio.

28
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

Figura 3.7 Janela do


comando Frequencies:
Charts.

Selecione o
histograma com
curva densidade
(normal).

Lembre-se que sempre aps selecionar um procedimento dentro de uma caixa de


dilogo deve-se clicar o boto continue, para que o programa execute os procedimentos
solicitados. Os resultados dos procedimentos acima descritos so apresentados na Tabela
3.3 e no Grfico 3.1.

Statisti cs

TEMPO Tempo de Empresa


N Valid 267 Tabela 3.3 Estatsticas
Missing 12 descritivas do procedimento
frequencies.
Mean 8. 6059
Median 4. 0000
Std. Dev iation 8. 9123 Valores de skewness e
Skewness .782 kurtosis e seus respectivos
erros padro.
Std. Error of Skewness .149
Kurt osis -1.036
Std. Error of Kurtos is .297

29
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

Tempo de Empresa
80
Grfico 3.1
Histograma para
observao de
60 normalidade.

40
Frequency

20
Std. Dev = 8.91
Mean = 8.6
0 N = 267.00
0.0 4.0 8.0 12.0 16.0 20.0 24.0 28.0
2.0 6.0 10.0 14.0 18.0 22.0 26.0

T empo de Empresa

Para concluir se a distribuio de uma varivel normal deve-se observar para


alguns indicadores apresentados na Tabela 2.3, como a skewness e a kurtosis. Quanto
mais prximos de 0 estiverem esses valores, mais prximo da normalidade estar a
distribuio da varivel. Alm de se observar o valor bruto dos indicadores de assimetria
e achatamento deve-se dividir este indicador por seu erro padro. Se o resultado da
diviso for superior a 1,96 significa que aquele indicador estatisticamente significativo.
Tambm importante observar na mesma tabela o valor do desvio padro, que
superior a mdia, o que j indica ausncia de normalidade na distribuio. Por fim pode-
se comparar os resultados dos ndices da Tabela 3.3 com o efeito grfico do histograma,
do Grfico 3.1. Claramente a curva densidade (normal) no se aproxima da normalidade.
Essa normalidade na curva poderia ser comparada a silhueta de um sino com a boca
apontada para baixo.

ESTUDO E ELIMINAO DE CASOS EXTREMOS UNIVARIADOS E


MULTIVARIADOS

Casos extremos univariados so participantes que avaliaram de forma muito


diferenciada do restante do grupo um determinado aspecto. Estes casos influenciam, por
30
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

exemplo, a normalidade de uma distribuio. Casos extremos podem ser provenientes de


sujeitos que respondem sem ateno ao questionrio, avaliando apenas um ponto da
escala. Estes casos devem ser identificados, estudados e, se possvel, eliminados do
banco, para que os relatrios no sejam mascarados por avaliaes severas ou
lenientes em demasia.
Para identificao de casos extremos univariados deve-se seguir Analyze
Descriptives Statistics Explore, que resultar na janela apresentada na Figura 3.8.
Figura 3.8 Janela do
comando Explore.

Varivel
selecionada para
anlise.

Boto de grficos
deve ser
pressionado.

Aps pressionado o boto plots ser apresentada a janela da Figura 3.9.

Figura 3.9 Janela do


comando Explore: Plots.

Selecionar
dependentes juntos
varivel inserida no
campo das
dependentes.

31
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

A melhor anlise de casos extremos univariados pode ser obtida atravs do box-
plot do SPSS, que apresenta os casos diretamente abaixo ou acima dos limites da
distribuio. O Grfico 3.2 o resultado do procedimento descrito nas figuras anteriores.

5
Grfico 3.2 Box-plot
para observao de
4 casos extremos.

3 Caso extremo
nmero 215 do
arquivo de dados
2 exemplo.

0 279
115
211

-1
N= 275

Escore de Impacto Pr

O grfico aponta qual(is) casos esto acima da amplitude interquartlica. O


nmero disposto no caso indicado pelo grfico refere-se ao nmero automtico
apresentado na planilha do programa. Caso o grfico indique vrios casos, inicie a
deleo pelo nmero maior, para que a numerao dos mais baixos no seja alterada.
H um outro tipo de caso extremo que tambm deve ser explorado pelo
pesquisador, o caso multivariado. Este caso obtido a partir do estudo simultneo de
mltiplas variveis de interesse. Existem alguns procedimentos no SPSS para a
identificao dos casos extremos multivariados. A distncia de Mahalanobis a mais
comumente utilizada. Voc acessa este procedimento por meio do menu Analyze
Regression Linear. Voc obter a janela de dilogo apresentada na Figura 3.10.

32
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 3 Explorando e Adequando Arquivo de Dados

Figura 3.10 Janela do


comando Linear
Regression.

Selecionar uma varivel


dependente que assuma
qualquer valor (identificao
do sujeito).

Selecione as variveis que


sero analisadas em seu estudo
(todas que entraro no modelo
de anlise).

Pressione o boto save e


selecione a opo mahalanobis
em distncias.

O resultado desta anlise gerar uma nova coluna de varivel no seu banco de
dados. Esta coluna conter a informao da distncia de Mahalanobis. Esta distncia
uma distribuio de qui-quadrado e deve ser interpretada com auxlio de uma tabela de
distribuio qui-quadrado. Valores superiores ao nvel de significncia determinado pelo
pesquisador, considerando os graus de liberdade do modelo em teste (no exemplo gl= 2
pois so trs variveis em teste) determinam se o caso dever ou no ser excludo do
banco de dados. Para se automatizar o processo de eliminao de casos extremos
multivariados recomenda-se o uso do comando Select Cases do menu Data do SPSS.
A seguir, no captulo 4, sero apresentados os procedimentos para realizao de anlises
inferenciais via SPSS, mais especificamente ANOVA uma via, para teste de diferena de mdias,
correlao para medidas paramtricas e no-paramtricas, teste de qui-quadrado para dados
categricos e anlise de regresso linear simples.

33
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada

CAPTULO 4

Realizando Anlises Inferenciais: ANOVA uma via, Correlao Bivariada,


Qui-quadrado e Regresso Linear Simples

Contedo:
1. Comparao de Mdias via ANOVA uma via
2. Correlao bivariada para variveis contnuas e categricas
3. Teste de Qui-quadrado
4. Regresso linear simples

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1. Realizar anlises de comparao de mdias de ANOVA uma via.
2. Realizar anlises de correlao bivariada.
3. Realizar teste qui-quadrado.
4. Realizar anlise de regresso linear simples.

34
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada

Para realizar procedimentos de anlises de teste da relao entre variveis deve-


se efetivar procedimentos especficos, chamados de inferenciais. Caso se deseje testar a
diferena de mdia para uma varivel dependente em diferentes grupos necessria a
realizao de uma ANOVA uma via. A Figura 4.1 apresenta a caixa de dilogo da
ANOVA uma via que obtida por meio do caminho Analyze Compare Means
One-Way ANOVA.

Figura 4.1 Janela de


dilogo da ANOVA uma
via.

Acima: Varivel
dependente (contnua).
Abaixo: Varivel
independente
(categrica).

Anlises posteriores
para comparao par a
par dos grupos em
anlise.

A anlise solicitada na Figura 4.1 apresenta como resultado a Tabela 4.1, aonde
so apresentados os ndices de significncia estatstica do teste de F da ANOVA. Se o
ndice de significncia (sig.) for menor que 0,05, h diferenas significativas entre os
grupos.

ANOVA

EXPTRAB tempo de experincia de trabalho (em anos j c ompletos ) Tabela 4.1 Resultados
da ANOVA uma via.
Sum of
Squares df Mean Square F Sig.
Between Groups 6299.377 4 1574.844 24. 025 .000
Within Groups 18157. 758 277 65. 551
Tot al 24457. 135 281

Para a realizao de uma correlao bivariada deve-se seguir o caminho Analyze


Correlate Bivariate. Aparecer a janela de dilogo apresentada na Figura 4.2.

35
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada

Figura 4.2 Janela de


dilogo correlao
bivariada.

Uma correlao
bivariada exige ao
menos duas variveis
para anlise.

Faa a seleo dos


coeficientes adequados
para o tipo de varivel:
Pearson contnuas e
demais para
categricas.

A Tabela 4.2 apresenta os resultados da anlise de correlao. O coeficiente de


correlao varia de 1 a +1 e quanto mais prximo de 0 menor a associao entre duas
variveis.

Correlations
Tabela 4.2 Resultado
da correlao bivariada.
EXPTRAB
tempo de
experincia
IDADE idade de trabalho
(j complet a) (em anos j
Coeficiente de
em anos complet os)
correlao. Asteriscos
IDADE idade (j Pearson Correlation 1 .909** indicam o nvel de
complet a) em anos Sig. (2-t ailed) . .000 significncia da
correlao.
N 274 272
EXPTRAB tempo de Pearson Correlation .909** 1
experincia de t rabalho Sig. (2-t ailed) .000 .
(em anos j c ompletos )
N 272 282
**. Correlat ion is signif icant at t he 0.01 lev el (2-t ailed).

Para realizar comparao sobre a distribuio do nmero de casos em dois ou


mais grupos distintos, pode-se utilizar o teste qui-quadrado. Este teste obtido por meio
do caminho Analyze Nonparametric tests Qui-square. A Figura 4.3 apresenta a
caixa de dilogo do qui-quadrado.
36
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada

Figura 4.3 Janela de


dilogo qui-quadrado.

Varivel a ser testada.

Especifica se o nmero
de casos por grupo
de tamanho idntico
ou de tamanho
diferente.

A Tabela 4.3 apresenta os resultados do qui-quadrado. A primeira tabela


apresenta os valores observados no banco, os valores esperados e os resduos. A segunda
tabela apresenta o teste de significncia. Se significativo, a distribuio dos casos
diferente da esperada.

ESC OLAR escolaridade mais elevada Tabela 4.3 Resultado


do qui-quadrado.
Obs erv ed N Expec ted N Res idual
3 Segundo grau 144 56. 8 87. 2
4 Curso s uperior 90 56. 8 33. 2
5 Espec ializao 38 56. 8 -18.8 Valores observados e
6 Mes trado 8 56. 8 -48.8 esperados.
7 Doutorado 4 56. 8 -52.8
Tot al 284

Test Statistics
Teste de significncia.
ESCOLAR
esc olaridade
mais elev ada
Chi-Squarea 250.507
df 4
Asy mp. Sig. .000
a. 0 cells (.0%) hav e expec ted f requencies less than
5. The minimum expect ed cell f requency is 56.8.

37
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 4 Realizando ANOVA uma via e Correlao Bivariada

Para a realizao de anlises preditivas entre duas variveis pode-se realizar uma
anlise de regresso simples. Esta anlise obtida por meio do caminho Analyze
Regression Linear. A Figura 4.4 apresenta a caixa de dilogo da anlise de
regresso.

Figura 4.4 Janela de


dilogo da regresso
linear.

Defina a varivel
dependente de anlise.

Defina a varivel
independente de
anlise.

Mtodo de anlise de
regresso.

Botes para seleo de


procedimentos
complementares de
anlise.

O resultado da anlise apresentada na Tabela 4.4.


Model Summary
Tabela 4.4 Resultado
Adjust ed Std. Error of
Model R R Square R Square the Estimat e
da anlise de regresso
1 ,269a ,072 ,071 2, 975 linear simples.
a. Predic tors: (Cons tant), Atribuio_1 SMEAN(Atribuio)
Sumrio do modelo: R,
ANOVAb R2, e R2 ajustado para
o tamanho da amostra.
Sum of
Model Squares df Mean Square F Sig.
1 Regress ion 376,768 1 376,768 42, 569 ,000a
Res idual 4823,688 545 8, 851 Valores de F para
Tot al 5200,456 546 regresso e nvel de
a. Predic tors: (Cons tant ), Atribui o_1 SMEAN(Atribuio) significncia.
b. Dependent Variable: AJUDA_1 SMEAN(AJ UDA)

Coeffici entsa Coeficiente beta da


relao entre VI e VD
Uns tandardized Standardized
Coef f icients Coef f icients
e respectivos nveis de
Model B Std. Error Beta t Sig.
significncia.
1 (Constant) 4, 147 ,316 13, 141 ,000
Atribuio_1
,529 ,081 ,269 6, 524 ,000
SMEAN(At ribuio)
a. Dependent Variable: AJ UDA_1 SMEAN(AJUDA)

38
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

CAPTULO 5

Anlise Fatorial em Avaliao do Treinamento

Contedo:
1. Anlise Fatorial
2. Procedimentos de Execuo da Anlise Fatorial via SPSS

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1. Definir Anlise Fatorial
2. Identificar as funes da Anlise Fatorial
3. Descrever os principais conceitos associados Anlise Fatorial
4. Realizar uma Anlise Fatorial, seguindo todas as etapas, via SPSS

39
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

ANLISE FATORIAL EM AVALIAO DE TREINAMENTO

A anlise fatorial (AF) uma tcnica estatstica multivariada desenvolvida no


incio do sculo XX por um psiclogo-estatstico chamado Spearman. Este pesquisador
teve como objetivo estudar as capacidades humanas, por meio da identificao de
construtos ou dimenses que so subjacentes estas capacidades. Ele props que traos
latentes determinam o desempenho de uma pessoa, por exemplo, a inteligncia pode ser
mensurada por meio de um conjunto de itens. A pressuposio que existem habilidades
correlacionadas que determinam uma dimenso subjacente, que permite que as pessoas
desempenhem em situaes que exijam o uso dessas habilidades. Diante desta
pressuposio seria possvel desenvolver um conjunto de itens para mensurar
determinado trao latente. Se esses itens fizerem parte da mesma dimenso subjacente
sero relacionados entre si e podero ser considerados como indicadores de um
determinado construto. Deve-se ressaltar que a construo de medidas deve respeitar
alguns pressupostos da teoria psicomtrica, como a elaborao de um nmero suficiente
de itens (nem muito pouco, nem em exagero; cada habilidade ou atitude humana
necessitam de diferentes nmeros de itens) para mensurao de determinado trao
latente.
No caso de instrumentos relativos a avaliao de treinamento a pressuposio
que os indicadores de modelos de avaliao constituem-se em habilidades e atitudes dos
treinandos. Em um instrumento de reao, o trao subjacente a atitude do treinando a
respeito do evento instrucional, enquanto uma medida de aprendizagem procura
mensurar as habilidades subjacentes desenvolvidas durante o evento instrucional.
A partir dessa pressuposio, a AF possibilita a reduo de dados. Essa reduo
feita com base no estudo das dimenses latentes que determinariam as atitudes e/ou
habilidades das pessoas, que causariam a sua resposta a um conjunto de itens de
determinada forma. A implicao prtica deste tipo de procedimento est na reduo de
dados, tendo em vista que conjuntos muito extensos de itens podem ser reduzidos a
poucos escores, graas a pressuposio dos modelos de avaliao de treinamento, de que
as atitudes dos sujeitos so organizadas em dimenses subjacentes. Desta forma, pode-se

40
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

obter dois ou trs ndices para a mensurao de reao ao treinamento e, na maioria das
vezes, um ndice para o comportamento no cargo (impacto do treinamento no trabalho).
, ainda, importante ressaltar que os ndices estatsticos do subsdio para o tcnico
selecionar as dimenses, mas essa deve ser calcada, em ltima instncia, no sentido
terico dos itens que se agregaram a um fator.
Esta tcnica de anlise de dados tem sido muito utilizada na avaliao de
treinamento, tanto na pesquisa acadmica quanto nos sistemas de avaliao das
organizaes. Pode-se considerar que cada um dos nveis de anlise de um sistema de
avaliao possui, no mnimo, uma dimenso latente, compartilhada pelo conjunto de
treinandos envolvidos no processo instrucional. Para o nvel de aprendizagem, supe-se
a observao de um conjunto de habilidades humanas para cada treinamento
desenvolvido, mas os testes dimensionais para o nvel de aprendizagem tem sido mais
complicados, pela dificuldade na construo de mltiplas medidas (uma para cada
treinamento).
Kline (1994) aponta que existem alguns conceitos que so fundamentais para o
entendimentos e interpretao de resultados da AF. So esses:
Correlao: conceito estatstico que busca captar o componente linear de
variao conjunta de duas variveis. Esse coeficiente varia de 1 at +1. Uma
correlao perfeita possui o valor 1 (seja esta negativa ou positiva). Quanto
maior a correlao entre duas variveis mais estas possuem componentes de
covariao em conjunto, ou seja, quanto mais uma varia (modifica de valor)
mais a outra varia. A AF baseada nas correlaes entre os itens de um
questionrio de avaliao de treinamento. O primeiro passo para o clculo de
fatores em uma AF, realizado pelo computador, o clculo de uma matriz de
correlao. Todos os itens de um instrumento de avaliao so correlacionados
entre si, formando o ponto de partida para a AF.
Fatores: busca-se obter, em uma anlise fatorial, dimenses. Essas dimenses
so denominadas fatores. Estas so determinadas pela correlao
compartilhada por um conjunto de itens, ou seja, quanto mais correlacionados
for um conjunto de itens eles tm uma grande chance de formar um fator. Essa

41
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

correlao proveniente desta estrutura subjacente das pessoas, que determina


a forma como elas respondem a esse conjunto de questes. Cada fator extrado
de uma AF significa a identificao de uma dimenso latente.
Cargas Fatoriais: aps observada a correlao de todos os itens entre si e aps
a deteco de que alguns grupos desses itens podem ser organizados em
fatores necessrio traar qual a correlao de cada item com seu respectiva
fator. Essa relao item-fator dada por meio da carga fatorial. Esse um
coeficiente que varia de 1 a +1, como a correlao. Quanto mais prximo de
1 maior a relao entre o item e o fator.
muito importante ter em mente a funo prtica da AF, que se traduz no
conceito de validade. Em um modelo de avaliao, por exemplo no nvel de reao, se
pressupe vrias categorias diferentes, como habilidades do instrutor, qualidade do
material didtico, qualidade das instalaes do ambiente de treinamento, entre outras.
Mas apenas pode-se dizer que uma medida valida quando submete-se o conjunto de
instrumentos de avaliao em uma grande quantidade de treinandos e, posteriormente,
realiza-se a reduo de dados por meio da AF. Essa tcnica fornece os parmetros para
os tcnicos em avaliao de treinamento afirmarem que suas medidas conseguem
mensurar o que eles propunham mensurar quando delinearam o modelo, ou seja, a
validade da medida.
Aps identificado o conjunto de estruturas subjacentes de um questionrio de
avaliao de treinamento, faz-se necessrio extrair o ndice de confiabilidade desses
fatores. Esse ndice de confiabilidade diz respeito a preciso da medida. Enquanto a AF
apresenta a validade da medida, ou seja, o quanto aquele instrumento de avaliao
valido, por exemplo, para mensurar a reao dos treinandos perante o treinamento, o
ndice de confiabilidade informa qual a qualidade dessa medida.

Cuidado!
Como toda tcnica estatstica deve-se tomar alguns cuidados com a AF.
Atualmente, com a sofisticao dos microcomputadores e tambm dos softwares
estatsticos muito fcil realizar procedimentos multivariados como o de AF. O tcnico

42
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

sempre deve-se lembrar da mxima garbage in, garbage out (lixo entra, lixo sai). O
tcnico deve possuir uma pressuposio terica, na qual hipotetize a existncia de
dimenses subjacentes. No caso de avaliao de treinamento, os modelos possuem tal
pressuposio, pois so organizados em dimenses, constitudas por diferentes
indicadores. Por este motivo que no coerente efetuar uma anlise fatorial em um
conjunto de itens onde a pressuposio anterior de categorias no exista, pois podero
ser extradas dimenses, formadas apenas por correlaes esprias entre itens. Devido a
possibilidade de correlaes distorcidas que o sentido terico dos itens deve ser o
principal critrio para identificao de dimenses latentes.

PROCEDIMENTOS PARA EXECUO DA ANLISE FATORIAL

Para a realizao de uma anlise fatorial exploratria deve-se observar uma


seqncia lgica de procedimentos para a deteco dos fatores latentes em um conjunto
de itens. Inicialmente, o tcnico deve realizar uma anlise dos componentes principais e,
posteriormente, uma anlise fatorial propriamente dita. A anlise dos componentes
principais uma tcnica mais flexvel, que tem como funo dar indicaes do nmero
de fatores que devem ser extrados no segundo passo do procedimento. A figura 3.1
apresenta a janela de dilogo da AF, obtida atravs de Analyze Data Reduction
Factor.

43
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

Figura 5.1 Janela do


comando Factor

Pressione os
botes indicados
na parte inferior.

Figura 5.2 Janela do


comando Factor:
Descriptives.

Selecionar todas
essas opes.

Figura 5.3 Janela do


comando Factor:
Extration.

Mantenha o
default e
selecione esta
opo.

44
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

Figura 5.4 Janela do


comando Factor:
Rotation.

Mantenha o
default, que
sem indicao de
rotao.

Figura 5.5 Janela do


comando Factor:
Options

Selecione esta
opo, que
ordenar todos os
coeficientes.

Selecione esta
opo e
modifique o
valor para 0,30.

Todos esses procedimentos resultaro em tabelas e grficos no output. Os


principais, importantes para a tomada de deciso, sero apresentados a seguir. A tabela
3.1 apresente o teste de KMO. Este um indicador de fatorabilidade da matriz de dados.
Quanto mais prximo de 1 melhor. Acima de 0,80 j existe indicativo de que os dados
so submetidos a AF. No caso deste exemplo existe indicao de adequao dos dados
para serem submetidos a AF.

KMO and Bartlett's Test


Kaiser-Mey er-Olkin Measure of Sampling
Tabela 5.1 ndice de KMO.
Adequacy . .889

Bart lett's Tes t of Approx. Chi-Square 971.990


Sphericity df 66
Sig. .000

45
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

O prximo indicador, apresentado na tabela 3.2, aponta a quantidade de fatores


apontado pela anlise de componentes principais. Essa informao obtida por meio dos
eigenvalues. Valores superiores a 3,0 apontam para a existncia de dimenses. Em
seguida, no grfico 3.1, so apresentados os eigenvalues. Quando a curva torna-se uma
queda ordenada decrescente que existe indicao da estrutura fatorial.

Total Variance Expl ained

Init ial Eigenv alues Extraction Sums of Squared Loadings


Component Tot al % of Variance Cumulat iv e % Tot al % of Variance Cumulat iv e % Tabela 5.2 Eigenvalues da
1 4. 756 39. 634 39. 634 4. 756 39. 634 39. 634 soluo.
2 1. 251 10. 424 50. 058 1. 251 10. 424 50. 058
3 .862 7. 187 57. 246
4 .821 6. 838 64. 084 Somente um
5 .756 6. 302 70. 386 valor superior
6 .725 6. 041 76. 428 a 3, indicando
7 .599 4. 995 81. 423 apenas um fator.
8 .568 4. 732 86. 155
9 .492 4. 100 90. 255
10 .415 3. 455 93. 710
11 .380 3. 166 96. 875
12 .375 3. 125 100.000
Extraction Met hod: Princ ipal Component Analy sis.

Scree Plot Grfico 5.1 Scree-plot


5 grfico de eigenvalues.

Queda constante
indica a presena
3 de apenas um
fator.

2
Eigenvalue

0
1 2 3 4 5 6 7 8 9 10 11 12

Component Number

Como resultado da anlise de principais componentes deste banco de dados


observa-se que o conjunto de itens se agrega, adequadamente, em apenas um fator. A
concluso final pode ser extrada da observao do scree plot, que claramente indica a

46
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

presena de um fator, com eigenvalue muito elevado, indicando uma alta explicao da
varincia de todos os itens. Depois de concludo a estrutura fatorial a partir da anlise de
componentes principais, deve-se proceder a anlise fatorial.
Para tanto, sero necessrias alteraes em algumas das janelas (apresentadas nas
figuras 3.1 a 3.5), como apresentado a seguir:
Janela Factor (figura 3.1): matenha os mesmos itens selecionados para a
anlise de componentes principais;
Janela Factor: Descriptives (figura 3.2): retire a marcao de todas as opes.
Estas informaes no so mais necessrias;
Janela Factor: Extraction (figura 3.3): retire as marcaes do scree plot e
unrotated factor solution. Marque a opo nmero de fatores, informando o
nmero observado na anlise de componentes principais (um neste exemplo).
V at o campo Method e selecione principal axis factoring (PAF).
Janela Factor: Rotation (figura 3.4): mantenha o default, sem rotao. Isso
deve ser feito para este exemplo, com indicao de apenas um fator. A
ausncia de rotao aplica-se apenas para solues fatoriais de estrutura
unifatorial.
Janela Factor: Options (figura 3.5): matenha as mesmas informaes
solicitadas na anlise de componentes principais.
O arquivo de output desses procedimentos conter um nmero
consideravelmente menor de informaes do que aquele gerado pela anlise de
componentes principais. interessante observar algumas informaes nestes resultados,
como a tabela de porcentagem da varincia explicada, a mesma apresentada na tabela
3.2. Mas a principal informao que deve ser observada a matriz de cargas fatoriais da
soluo, apresentada na tabela 3.3. bom ressalvar que esta matriz recebe este nome
(factor matrix) quando a soluo unifatorial. Quando a soluo for com mais de um
fator a matriz que deve ser observada denominada pattern matrix.

47
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

Factor Matrixa

Factor Tabela 5.3 Cargas fatoriais


1 dos itens da soluo.
IMPAC6 .707
IMPAC1 .706
IMPAC9 .661
IMPAC3 .628
IMPAC5 .612
IMPAC2 .589
IMPAC8 .583
IMPAC12 .574
IMPAC4 .528
IMPAC7 .479
IMPAC10 .461
IMPAC11 .431
Extraction Met hod: Princ ipal Axis Fac toring.
a. 1 f actors extracted. 4 iterations required.

Na tabela 3.3 podem ser observadas duas colunas. A primeira possui o nome de
cada um dos itens do fator. Neste exemplo todos os itens do fator obtiveram valor de
carga fatorial superior a 0,30 e todos os itens analisados (12 ao total) fizeram parte da
soluo final. A segunda coluna (direita) possui a carga fatorial de cada item, indicando
o grau de correlao de cada um dos itens com o fator ao qual pertence.
Aps finalizada a anlise fatorial, o ltimo procedimento diz respeito ao clculo
do ndice de confiabilidade (preciso) do fator. Para tanto necessrio seguir o seguinte
procedimento Analyze Scale Reliability Analysis, que resultar na abertura da
janela apresentada na figura 3.6.
Figura 5.6 Janela do
comando Reliability.

Pressione este
boto e escolha
scale if item
deleted.

Selecione todos
os itens que
compem o fator
a ser examinado

48
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

O tcnico deve pressionar o boto da janela da figura 3.6 e selecionar a opo,


como indicada no texto explicativo ao lado da figura. Esse procedimento ir inserir na
tabela o valor do alpha (coeficiente de confiabilidade) caso o item seja excludo da
soluo fatorial. Esse mais um indicador para apontar a adequao do item na
mensurao da estrutura latente. A tabela 3.4 apresenta as informaes relativas ao
procedimento de teste de preciso da escala.

S C A L E (A L P H A) Tabela 5.4 Resultados dos


clculos de confiabilidade.

Coluna com
Item-total Statistics valores de alpha
caso o item fosse
Scale Scale Corrected eliminado.
Mean Variance Item- Alpha
if Item if Item Total if Item
Deleted Deleted Correlation Deleted

IMPAC1 41.3916 40.3384 .6428 .8383


IMPAC2 41.2548 42.6333 .5347 .8462
IMPAC3 41.3042 40.8537 .5732 .8430
IMPAC4 41.6350 42.4693 .4791 .8494
IMPAC5 41.5247 40.7542 .5624 .8438
IMPAC6 41.4068 40.8911 .6353 .8393
IMPAC7 41.7947 42.9424 .4398 .8519 ndice geral da
IMPAC8 41.3764 41.1669 .5451 .8450 escala, com todos
IMPAC9 41.4030 40.6156 .6196 .8399 os itens
IMPAC10 42.0570 41.6341 .4366 .8537 selecionados.
IMPAC11 41.6540 42.9905 .4133 .8538
IMPAC12 41.7529 41.1715 .5237 .8466

Reliability Coefficients

N of Cases = 263.0 N of Items = 12

Alpha = .8570

O valor obtido nesta escala do exemplo pode ser considerado bom, pois o valor
superior a 0,80. Este coeficiente varia de 0 a 1 e os melhores ndices so aqueles
superiores a 0,90.
Todos os procedimentos apresentados neste captulo sero suficientes para a
extrao de indicadores de validade e confiabilidade de questionrios de avaliao de
treinamento via SPSS. Caso o leitor esteja interessado em aprofundamentos na tcnica
de AF sugere-se recorrer a leitura recomendada ao final desta apostila.
49
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 5 Anlise Fatorial

Aps definidos os itens que compem cada fator do instrumento de avaliao de


treinamento, necessria a criao de escores fatoriais por caso no arquivo de dados,
gerando, finalmente, a reduo de um conjunto de itens a um nico indicador. Esse
procedimento feito atravs do menu Transform Compute, resultando na janela
apresentada na figura 3.7.
Figura 5.6 Janela do
comando Reliability

Selecione a
expresso
numrica MEAN
e defina as
variveis que
fazem parte do
fator

Atribua um nome
para a varivel
que ser gerada

O campo Functions possui uma srie de expresses. Para a criao do escore


fatorial a expresso MEAN deve ser selecionada e transportada para o campo superior.
Em seguida todas as variveis que compem o fator devem ser inseridas entre os
parnteses que seguem a expresso numrica. Aps esta seleo o boto OK deve ser
pressionado. Isto ir gerar uma coluna ao final do arquivo de dados, atribuindo um
escore para cada treinando que participou da avaliao do treinamento.
Esse mesmo procedimento pode gerar escores para qualquer estrutura fatorial
observada. Aps a execuo desse procedimento todas as anlises que iro subsidiar o
relatrio podero ser feitas com base nesses escores, deixando de lado os itens que os
constituram. Os itens podem ser usados novamente, a depender do interesse dos
tcnicos em treinamento.

50
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 6 Gerao e Uso de Syntax

CAPTULO 6

Gerao e Manipulao de Syntax

Contedo:
1. Funo e Uso da Syntax no SPSS

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1. Identificar quais os possveis usos dos comandos da syntax
2. Descrever alguns comandos da syntax
3. Criar syntax de comandos para gerao de rotinas de relatrios em avaliao de
treinamento

51
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 6 Gerao e Uso de Syntax

FUNO E USO DA SYNTAX NO SPSS


Como apresentado no primeiro captulo desta apostila, o SPSS possui um tipo de
arquivo que possibilita a gerao e arquivamento de informaes relativas a
procedimentos de anlise de dados. Este tipo de arquivo muito til quando o tcnico
necessita (a) realizar rotinas de anlise de dados, como relatrios peridicos, onde os
procedimentos no so diferenciados; (b) realizar anlises complexas, onde um mesmo
procedimento estatstico deve ser realizado, mas com diferentes variveis de um mesmo
arquivo de dados ou de arquivos de dados diferentes; e (c) trabalhar com mltiplos
procedimentos de anlise em um mesmo arquivo, como anlise exploratria complexa.
Na manuteno de um sistema de avaliao de treinamento interessante a utilizao de
arquivos de syntax para a realizao de rotinas peridicas de trabalho, como o caso da
elaborao de relatrios.
importante chamar a ateno que a presente apostila tem como funo informar
sobre alguns tipos de comandos da syntax do SPSS. Existem uma quantidade muito
grande de comandos via syntax e existem manuais especficos para a manipulao
desses procedimentos. O menu help do SPSS traz muita informao sobre a syntax,
podendo auxiliar na manipulao de dados por meio deste comando.
O arquivo de syntax pode ser obtido atravs do uso do boto Paste, presente na
grande maioria das janelas de dilogo do SPSS. A figura 4.1 apresenta o procedimento
para gerao do comando GET em um arquivo de syntax. A janela obtida por meio do
File Open Data.

52
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 6 Gerao e Uso de Syntax

Figura 6.1 Janela do


comando Open

Escolha o
arquivo desejado
e pressione o
boto indicado.

Esse mesmo procedimento, o boto Paste, pode ser utilizado em diversas caixas
de dilogo do SPSS para gerao dos arquivos syntax de comando. A figura 6.2
apresenta uma janela syntax com diferentes comandos j copiados em sua estrutura.
Figura 6.2 Janela de
arquivo syntax

Resultado do
comando
executado na
figura anterior

Variveis
selecionadas para
anlise
descritiva.

Na mesma figura ainda so apresentados outros procedimentos de anlise e


transformao de dados. O comando COMPUTE faz a criao de escores fatoriais, como

53
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 6 Gerao e Uso de Syntax

apresentado na Figura 5.6. Dois comandos GRAPH, para gerao de grficos; no


exemplo um grfico de disperso e um histograma. Tambm apresentado no exemplo
um comando CORRELATIONS.
Utilizando este procedimento possvel a gerao de arquivos de dados com
rotinas de trabalho, para gerao de relatrios em avaliao de treinamento. A Figura 6.3
apresenta um exemplo de comandos para relatrio de avaliao de treinamento, nos
nveis de reao, aprendizagem, comportamento no cargo (impacto do treinamento) e
mudana na organizao.
Figura 6.3 Janela de
syntax com exemplo de
rotina de relatrio

Neste exemplo so solicitados vrios tipos de anlises que podem ser teis em
um relatrio de avaliao de treinamento. Inicialmente foram solicitadas freqncias das
variveis discretas do banco de dados. Neste comando a inteno identificar a
frequencia de casos de cada uma das variveis indicadas no comando. Em seguida foi
solicitado o comando FREQUENCIES com especificao de ndices relativos as
variveis contnuas (e.g. impacto do treinamento em amplitude e profundidade). Essas
informaes iniciais possibilitam identificar os ndices descritivos do resultado do

54
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.
Captulo 6 Gerao e Uso de Syntax

treinamento, j indicando se o treinamento modificou o comportamento do treinando no


cargo.
Em seguida, foram solicitadas duas correlaes, para obter o grau de relao
existente entre algumas variveis. Neste caso a inteno comparar se existe algum tipo
e relao entre o resultado do treinamento no trabalho e variveis de contexto e dos
indivduos. Tambm foi solicitada uma correlao no paramtrica, indicada para
relacionar variveis contnuas e categorias, neste exemplo escolaridade com o resultado
do treinamento no trabalho.
Neste exemplo, tambm foi solicitado o clculo de um teste T, para averiguao
do nvel de significncia dos escores desta amostra em relao a populao. Por ltimo
foi solicitado um grfico interativo, atravs do comando IGRAPH, para observao do
padro de distribuio da varivel impacto do treinamento no trabalho.
Este exemplo hipottico pode ser o escopo de informaes de um relatrio de
apresentao dos resultados de impacto do treinamento no trabalho de um grupo de
treinandos. Obviamente que a equipe de tcnicos da organizao deve definir quais so
suas necessidades e tambm o interesse dos consumidores do resultado de um sistema de
avaliao de treinamento.

55
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Administrao da UnB.

Vous aimerez peut-être aussi