Vous êtes sur la page 1sur 64

Braslia, Fevereiro de 2011

APOSTILA PARA TRATAMENTO DE DADOS VIA SPSS

Ronaldo Pilati
Juliana B. Porto

NDICE
APRESENTAO

CAPTULO 1

APRESENTAO DO SPSS

CAPTULO 2

14

DESCREVENDO DADOS NO SPSS

14

CAPTULO 3

21

EXPLORANDO E ADEQUANDO O ARQUIVO DE DADOS

21

CAPTULO 4

34

REALIZANDO ANLISES INFERENCIAIS: ANOVA

UMA VIA,

CORRELAO

BIVARIADA, QUI-QUADRADO E REGRESSO LINEAR SIMPLES

34

CAPTULO 5

39

ANLISE FATORIAL EM AVALIAO DO TREINAMENTO

39

CAPTULO 6

50

GERAO E MANIPULAO DE SYNTAX

50

CAPTULO 7

55

NOES BSICAS DO AMOS

55
2

Apresentao da Apostila

Apresentao
Nas ltimas dcadas o uso da microinformtica tem facilitado enormemente o
trabalho de organizao, tratamento e anlise de dados estatsticos de pesquisas em
psicologia e outras reas do conhecimento. Pelo fato do ferramental estatstico servir
como uma auxlio para iluminar as informaes advindas da realidade, esta tem sido
uma estratgia secular de produo do conhecimento em psicologia e reas afins. Boa
parte do conhecimento que temos hoje sobre o comportamento e a psicologia humana se
deve, em grande medida, ao uso da estatstica na prtica da pesquisa. A
microinformtica trouxe uma enorme capacidade de tratamento dos dados, graas ao
incremento do processamento dos hardwares, a miniaturizao dos computadores e ao
desenvolvimento de programas cada vez mais fceis de serem utilizados e poderosos em
seus recursos e capacidades grficas e de clculo.
Atualmente h uma grande quantidade de softwares estatsticos que podem ser
eficientemente utilizados para tratamento de dados nas pesquisas de psicologia e
cincias humanas, como o Excel, o BMDP, Minitab, NCSS, SYSTAT, Statplus, SAS,
SPSS, entre centenas de outros. H tambm softwares estatsticos gratuitos, vrios com
cdigo livre, como EPINFO e o R. H muitos programas que so especializados em
algumas anlises e outros, como a lista citada, que so gerais. Se voc for curioso poder
encontrar dezenas de softwares estatsticos em uma simples busca na internet.
Se por um lado o avano da microinformtica gerou muitas possibilidades para a
pesquisa em psicologia e reas afins, tambm potencializou o mau uso da estatstica. A
mxima lixo entra, lixo sai foi significativamente potencializada nos tempos modernos.
Por este motivo, no suficiente que o usurio saiba operar o software, mas sim que seja
capaz de compreender e analisar os resultados que o programa oferece, alm, claro, de
organizar as informaes a serem inseridas no programa de anlise de dados.
Esta apostila tem como objetivo ser um pequeno manual introdutrio ao SPSS,
um pacote estatstico que se tornou o principal software em uso entre psiclogos sociais,
do trabalho e organizacionais no Brasil. Especificamente no departamento de Psicologia
Social e do Trabalho da UnB este programa utilizado h mais de 30 anos, o que
significa que vrias geraes de pesquisadores acabaram sendo formados em anlise de
1
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Apresentao da Apostila
dados com o uso deste programa. Isto no quer dizer que ele seja o melhor daqueles
tantos oferecidos no mercado, mas um programa que oferece vrias vantagens
apreciadas pelos pesquisadores em cincias sociais, como menus fceis de serem
utilizados e a no necessidade de uso de linguagem de programao ou de conhecimento
sofisticado de matemtica para a realizao das anlises estatsticas. Alm disto, o
programa oferece uma ampla variedade de mdulos, que permitem um grande nmero
de anlises estatsticas multivariadas, boa parte das quais freqentes na pesquisa
cientfica em psicologia. Dentro deste zeitgeist que este manual foi concebido.
tambm neste contexto que ele deve ser utilizado, pois pretende ser um pequeno manual
introdutrio queles que tm a pretenso de fazer pesquisa em psicologia social e reas
afins, de forma a abrir o vasto mundo de utilizao da ferramenta estatstica SPSS.
Mas ateno! Este manual no tem a pretenso de substituir a aprendizagem
sria e comprometida do pensamento estatstico. Muito pelo contrrio, este manual
apenas uma leitura complementar para uso do SPSS. Portanto, foi concebido como uma
ferramenta extra para servir de apoio ao ensino de estatstica, feito com, no mnimo, o
uso de um livro texto de estatstica voltado para cientistas sociais. Isto significa que o
manual no pretende substituir a leitura de um bom livro introdutrio ou de anlise
multivariada de dados, muito menos a realizao de exerccios de aplicao de
conhecimentos estatsticos, mas sim auxiliar o aluno na realizao de procedimentos
estatsticos via SPSS. Considera que o desenvolvimento destas competncias parte
essencial da formao de pesquisa em psicologia.
Vale lembrar que o manual foi desenvolvido com base na verso 10.0 do SPSS, o
que significa que vrios dos aprimoramentos das verses posteriores no foram,
necessariamente, implementadas no manual. De qualquer forma considera-se que a
lgica geral do programa permanece a mesma para as verses posteriores, o que ainda o
deixa atualizado. Uma boa leitura!

2
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa

CAPTULO 1
Apresentao do SPSS

Contedo:
1.

Apresentao das Janelas de Trabalho

2.

Descrio dos Menus de Comando

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1.

Identificar o SPSS

2.

Descrever cada uma das janelas de trabalho do programa

3.

Montar arquivos de dados

4.

Operar comandos bsicos dos menus do SPSS

1
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


JANELAS DE TRABALHO

O SPSS um pacote estatstico, composto de diferentes mdulos, desenvolvido


para o uso em cincias humanas, sociais, biolgicas, entre outras rea do conhecimento.
Est baseado no ambiente Windows, sendo de fcil operao e muito abrangente, pois
permite realizar uma grande amplitude de anlises estatsticas e grficas (anlises
descritivas, anlises inferenciais multivariadas, mdulos grficos, entre outros).
A principal janela de trabalho do software apresentada abaixo. A Figura 1.1
mostra a janela de digitao (ou input) de dados SPSS Data Editor, na qual os bancos
de dados so gerados e analisados. Na janela SPSS Data Editor as linhas so relativas
aos casos, participantes ou respondentes e as colunas relativas as variveis investigadas.
Esta janela gera um dos trs tipos de arquivos associados ao SPSS. Esse arquivo tem
terminao .sav e armazena todas as informaes relativas ao banco de dados, como
definio de variveis e os dados digitados.
Figura 1.1 Janela
de input de dados
do SPSS (v.10.0).

Colunas:
representam
as
variveis em um
banco de dados.

Linhas:
representam os
casos em um
banco de dados

Acesso a janela
de definio dos
parmetros das
variveis.

2
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


Teoricamente, no SPSS, no existe limitao do nmero de colunas, muito
menos do nmero de casos, possibilitando a anlise de bancos de dados de qualquer
tamanho.
Os bancos de dados so montados no prprio SPSS ou importados de outras
planilhas. O SPSS importa praticamente todos os tipos de arquivos utilizados no
mercado, alm de trabalhar com arquivos de texto e .dat. Junto com a digitao dos
dados necessrio definir cada uma das variveis colocadas nas colunas da janela SPSS
Data Editor.
Nesta verso do SPSS, a definio das variveis do banco de dados feita em
outra janela tambm denominada SPSS Data Editor (Figura 1.2). Para tornar esta janela
ativa, deve-se clicar na opo Variable View, disposta no lado inferior esquerdo da
barra de rolamento da janela da Figura 1.1.
Figura 1.2 Janela
de
definio
de
variveis.

Colunas:
representam cada
uma
das
caractersticas
das variveis a
serem definidas.

Linhas:
representam cada
uma
das
variveis
que
compem
um
banco de dados.

A janela acima apresentada na Figura 1.2 possui vrias colunas relativas aos
principais parmetros de cada uma das variveis da planilha. So oito colunas:
3
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


Name: refere-se ao nome da varivel, composto de at oito caracteres (a depender
da verso do programa), que ser colocado nas colunas da janela de input
de dados. Deve-se clicar em qualquer cela dessa coluna para que se possa
digitar o nome da varivel;
Type: refere-se ao tipo de varivel, ou seja, sua caracterstica de notao
(numrica, qualitativa, etc). Clicando-se na cela desta coluna abre-se a
caixa de dilogo da Figura 1.3. Observe que a caixa de dilogo Variable
Type permite a escolha de vrios tipos de variveis. A definio de cada
uma pode ser acessada clicando-se no boto direito do mouse colocado em
cima da opo (ver reproduo na Figura 1.3). Esta mesma caixa de
dilogo tambm permite a escolha de outras caractersticas da varivel
(width e decimal places ver definies abaixo).

Figura 1.3 Caixa


de dilogo Variable
Type..

Caixa de dilogo
de definio de
tipo da varivel.

Clicando-se com
o boto da direita
do mouse abre-se
esta
janela
explicativa.

Width: diz respeito ao nmero de caracteres da varivel. Pode ser definido


diretamente na cela ou atravs da caixa de dilogo Variable Type
reproduzida na Figura 1.3.

4
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


Decimals define o nmero de casas decimais, a direita da vrgula, que sero
apresentadas. Da mesma forma que o Width, pode ser definido
diretamente na cela ou na caixa de dilogo Variable Type.
Label define o nome atribudo a uma varivel e no possui restrio de nmero de
caracteres (e.g., idade, escolaridade, descrio do item de um questionrio,
entre outras);
Value refere-se aos valores que os labels podem assumir. Neste parmetro o
pesquisador deve definir todos os possveis valores que uma varivel pode
assumir. Um tipo comum nas cincias sociais a escala Likert (1 =
discordo totalmente; 2 = discordo...);
Missing define o tipo de tratamento para os casos ausentes que o pesquisador quer
adotar. O Default do programa geralmente usado, mas outros valores
podem ser definidos (e.g. 999 ou 99);
Columns define o tamanho da coluna da varivel, que ser apresentada na janela
de input de dados;
Align define o alinhamento dentro de cada clula da planilha de dados;
Measure que informa o tipo de varivel (contnua ou discreta) sendo estudada pelo
pesquisador. Esta definio fundamental, pois o software habilitar o uso
das variveis em certos procedimentos a partir do tipo de medida
(measure) selecionada.

Na construo de um arquivo de dados para digitao de dados importante criar


como primeira varivel uma coluna de identificao. A funo desta criar um rtulo
(varivel nominal) de identificao do questionrio dentro do banco de dados. A Figura
1.2 apresenta, na primeira coluna, uma varivel denominada identif. Este rtulo
importante para que o questionrio possa ser identificado a qualquer momento, para
correo de erros de digitao ou retorno ao questionrio para coletar qualquer tipo de
informao. A contagem automtica do SPSS no confivel, pois a excluso de
qualquer caso acarretar na modificao da numerao de todos os subsequentes.

5
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


O SPSS possui ainda mais janelas de trabalho. A prxima a ser apresentada
refere-se ao output do programa. Nesta janela so geradas as tabelas e os grficos
processados a pedido do usurio. Quando qualquer tipo de procedimento executado,
mesmo na janela de input, os resultados so gerados na janela de output, que se abre
automaticamente quando o procedimento de anlise solicitado. Essa janela , tambm,
um outro tipo de arquivo, com terminao .spo. importante o usurio ter em mente que
deve executar o procedimento de nomeao e salvamento desta janela, para que se torne
uma janela de resultados do SPSS. A Figura 1.4 apresenta esta janela do programa.
Figura 1.4 Janela
de output (sada de
dados)

Sumrio
das
informaes da
janela de output.

Rgua
de
diviso: pode ser
movida.

Resultado
do
procedimento
para obteno de
grfico de barras.

A outra janela de trabalho do SPSS a de syntax. Esta janela possibilita a


execuo de anlises estatsticas e a gerao de grficos a partir dos cdigos de comando
do programa. Este tipo de janela muito til quando o padro de anlise de dados
extremamente complexo e/ou exige que as anlises sejam feitas com freqncia (como
aquelas para relatrios peridicos) ou quando as mesmas anlises devem ser feitas com
diferentes variveis, o que possibilita apenas que o nome das variveis seja modificado,
sem precisar repetir os procedimentos nos menus do programa. Tambm importante
ressaltar que, a exemplo da janela de output, a janela de syntax tambm um arquivo
6
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


diferenciado, com terminao .sps A Figura 1.5 apresenta esta janela de trabalho do
SPSS.
Figura 1.5 Janela
de syntax do SPSS.

Comandos
do
SPSS
para
Anlise Fatorial.

Comandos para
estatstica
descritiva
(mdia, desvio
padro, etc)

Comandos
gerao
grfico
disperso.

para
de
de

MENUS DE COMANDO

Na janela SPSS Data Editor o programa possui uma srie de menus de


comandos, que possibilitam a manipulao e anlise dos dados, bem como os
procedimentos do windows para trabalhar com arquivos.
O primeiro desses menus denominado File e tem como principais funes a
abertura, salvamento, importao, alm de outras funes comuns aos diferentes
programas da mesma plataforma operacional ou especficos do SPSS.
O segundo menu o Edit, que possui as seguintes funes: voltar a ltima
ao, copiar, colar, cortar, procurar (find) e opes. O menu opes tem como
objetivo definir diferentes parmetros do programa, como formato de apresentao
dos dados digitados na SPSS Data Editor, o formato de gerao das tabelas na janela
de output de dados, entre outras funes. A Figura 1.6 apresenta a janela de dilogo
do menu edit/opes.
7
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa

Figura 1.6 Janela


de
opes
do
programa.

Formato
de
apresentao do
output nomes e
labels.

Formato
de
apresentao da
janela de input.

Este menu de opes importante para adaptar o padro de apresentao do


programa s caractersticas ou preferncias de trabalho do usurio. Por exemplo, na
pasta output labels importante a definio de apresentao do nome das variveis e
tambm de seus labels, para que a tabela de resultados j possa fornecer todas as
informaes necessrias para a interpretao dos resultados das anlises
O prximo menu da barra de comandos denominada Data. Esse menu
possibilita manipular o arquivo de dados de diferentes maneiras. A Figura 1.7
apresenta a tela do SPSS com este menu aberto.

8
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


Figura 1.7 Menu
Data do SPSS.

Como pode ser observado na Figura 1.7 o menu Data possui vrios comandos.
Estes sero apresentados em tpicos a seguir:

O comando insert variable permite a insero de uma nova coluna na planilha


de dados, ao lado esquerdo da coluna onde se encontra a cela ativa da planilha;

o comando insert case ir inserir uma nova linha em uma planilha de dados,
acima da linha em que est a cela ativa da planilha;

o sort cases realiza um ordenamento de todos os casos de uma planilha


(linhas) a partir da seleo de uma das colunas do arquivo de dados; este
ordenamento pode ser em ordem ascendente ou descendente, como a
especificao apontada na janela de dilogo deste comando;

o comando merge files, que possibilita a insero de novos casos (linhas) ou


variveis (colunas) provenientes de um outro arquivo de dados;

o split files possibilita a separao do banco de dados a partir de uma das


variveis deste banco. Quando este comando est acionado, por exemplo, as
anlises resultantes sero apresentadas para cada uma das categorias definidas
por uma varivel. Se for acionado o comando split files para a varivel
9

Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.


Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


escolaridade na Figura 1.7 sero apresentados os resultados para os sujeitos
pertencentes a cada grupo de escolaridade;

o comando select cases possibilita a seleo de um grupo de casos em um


mesmo arquivo ou a criao de um outro arquivo a partir de um grupo de
casos inicial.
O prximo menu da barra de menus do SPSS denominado Transform. Este

menu possibilita a transformao de variveis do arquivo, assim como a criao de


novas variveis no arquivo de dados a partir de variveis j presentes no mesmo. A
Figura 1.8 apresenta o referido menu na janela de input do SPSS.
Figura 1.8 Menu
Transfom do SPSS

A seguir so apresentados os comandos desse menu.

compute um comando de gerao de novas variveis (ou sobreposio de


antigas) a partir de variveis j existentes no arquivo de dados. Este comando
que possibilitar, por exemplo, a gerao dos escores fatoriais, gerados a
partir da mdia aritmtica de cada um dos itens componentes do fator. Ele
permite a composio e manipulao de variveis por meio de dezenas de
funes matemticas;
10

Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.


Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa

o comando recode possibilita a recodificao de valores (labels) de uma


varivel nela mesma ou na criao de uma nova varivel;

automatic recode possibilita a recodificao de variveis em novas variveis,


mas de forma automtica, diferentemente do que possibilita o comando
recode, onde a estipulao dos valores manual;

create time series possibilita a gerao de uma varivel de srie temporal


dentro de um arquivo de dados j existentes;

o comando replace missing values realiza substituies automticas de casos


omissos nas variveis selecionadas. Esta substituio pode ser feita pelo valor
mdio ou mediano, alm de outros mtodos. Tambm importante ressaltar
que o comando gera um novo conjunto de variveis, onde a substituio
apresentada.
O prximo menu de comando denominado Analyze. Neste menu todos os

procedimentos estatsticos esto concentrados. Aqui so apresentadas todas as tcnicas


descritivas e inferenciais, univariadas e multivariadas. Vale uma ressalva: as tcnicas
descritivas so aquelas que sintetizam os dados brutos, apresentando os padres de
disperso (e.g. varincia, desvio padro) e tendncia central (e.g. mdia, moda e
mediana), assim como as medidas de posicionamento (e.g. quartil, decil, percentil). As
anlises inferenciais so aquelas que aplicam modelos probabilsticos, estimando a
chance do comportamento observado na amostra se repetir na populao. Quanto a
tcnicas univariadas, estas levam em considerao apenas uma varivel e as
multivariadas levam em considerao mltiplas variveis.
So comandos do menu analyze: report cases, descriptive statistics, compare
means, correlate, regression, data reduction, scale, entre outros. Durante este curso
sero abordadas tcnicas estatsticas bsicas que se encontram nos comandos
descriptives statistics, correlate e compare means. Estes comandos sero explorados em
detalhe no captulo 3.
O prximo menu denominado graph. Este relativo aos mdulos de gerao de
grficos do SPSS, que apresenta uma grande quantidade de recursos de gerao e

11
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


manipulao de dados a partir de grficos. A Figura 1.9 apresenta a tela do SPSS com
esse menu aberto.
Figura 1.9 Menu
Graph do SPSS.

So tipos de grficos gerados por este menu do SPSS:

bar apresenta grficos de barras, ideais para comparao de categorias de uma


varivel categrica, como escolaridade, sexo, entre outras. Esse tipo de
apresentao tambm importante para aquelas variveis categricas que no
tem um somatrio total de 100%;

pie um tipo de grfico conhecido por pizza. Ele ideal para variveis
discretas (categricas) que possuem somatrio total de categorias de 100%;

box-plot um grfico que apresenta o tipo de disperso de uma varivel,


apresentando o mnimo, o mximo, o primeiro e o terceiro quartil e a mediana
em uma nica representao grfica. direcionado para variveis contnuas e
ideal para observar casos extremos univariados. O SPSS trabalha a perspectiva
de amplitude interquartlica para a identificao de casos extremos;

histogram o grfico de barras direcionado para variveis contnuas, onde


todas as observaes so encaixadas em intervalos e sua freqncia contatada
12

Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.


Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 1 Apresentao do programa


(eixo X o conjunto de intervalos e o Y a contagem de casos dentro daquela
amplitude). Este grfico ideal para observar a normalidade das distribuies;

scatter conhecido em portugus como grfico de disperso e apresenta o


relacionamento entre duas variveis, buscando captar o componente linear de
correlao entre essas variveis. uma forma grfica de captar um coeficiente
de correlao bivariada ou um coeficiente de regresso simples;

interactive um mdulo do SPSS para trabalhar com todos os grficos


descritos anteriormente e muitos outros, mas com a possibilidade de gerao e
manipulao tridimensional.
Os grficos dos SPSS podem ser formatados na janela de output do programa.

Para isso basta clicar duas vezes sobre o grfico, na janela de output, que uma terceira
janela ser aberta e vrios procedimentos de formatao podem ser executados, como
nomear o grfico, inserir notas de rodap, modificar a cor de partes do grfico, transpor
os eixos, entre muitas outra opes. Esses procedimentos so importantes para que os
grficos possam sair do SPSS com a aparncia desejada para serem inseridos no corpo
de relatrios ou textos.
O menu utilities possui vrios comandos que auxiliam na manipulao dos
dados e das variveis de um arquivo. Existem comandos para a visualizao das
variveis e seus respectivos critrios de definio, estipulados na janela do SPSS
Data Editor (input) chamada variable view.
O menu Window possibilita a mudana de janelas do SPSS, como em qualquer
programa de ambiente windows. O ltimo menu denominado Help. Nele esto
inseridas muitas informaes sobre o programa, desde como executar determinados
procedimentos at a explicao da funo de diferentes tcnicas estatsticas. Este
menu possui um tutorial de procura de termos, que pode ser muito til para a
proficincia na operao do SPSS.

13
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 2 Descrevendo Dados no SPSS

CAPTULO 2
Descrevendo Dados no SPSS

Contedo:
1.

Tabelas de freqncia

2.

Cruzamento de dados

3.

Medidas de tendncia central

4.

Medidas de posio

5.

Medidas de disperso

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1.

Gerar tabelas de freqncia no SPSS.

2.

Gerar e interpretar tabelas de cruzamento de dados.

3.

Realizar procedimentos estatsticos de tendncia central.

4.

Gerar medidas de posio.

5.

Calcular medidas de disperso de dados.

14
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 2 Descrevendo Dados no SPSS


Uma das primeiras aes a serem feitas com dados estatsticos sua descrio,
por meio de estatsticas descritivas, como freqncias, mdias, medianas, varincia,
entre outras. Muitas vezes tambm objetivo da anlise de dados a realizao de
cruzamento de diferentes informaes, para se ter uma noo da relao existente entre
variveis da pesquisa. Todos os procedimentos referentes a essa descrio de dados, e
conseqentemente todo o contedo desse segundo captulo da apostila, esto
concentrados no menu Analyze Descriptives Statistics do SPSS.
Na presente apostila ser iniciada a apresentao de tcnicas de descrio de
dados categricos via SPSS. Para tanto inicialmente sero apresentadas a gerao de
tabelas de freqncia e posteriormente a gerao de tabelas de cruzamento de dados
(crosstabs). Em seguida sero apresentadas as tcnicas de descrio de dados contnuos
no SPSS, primeiramente com as medidas de tendncia central, em seguida com as de
posio e por ltima as medidas de disperso.
Para a obteno de tabelas de freqncia deve-se seguir os seguintes passos para
a janela de dilogo apresentada na Figura 2.1: Analyze Descriptives Statistics
Frequencies.
Figura 2.1 Janela
do
comando
Frequencies.

Caixa para requisio


de
tabela
de
freqncia.

15
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 2 Descrevendo Dados no SPSS

ESCOLAR escolaridade mai s el evada

Valid

Frequency
3 Segundo grau
144
4 Curso s uperior
90
5 Espec ializa o
38
6 Mest rado
8
7 Dout orado
4
Tot al
284

Percent
50. 7
31. 7
13. 4
2. 8
1. 4
100.0

Valid Percent
50. 7
31. 7
13. 4
2. 8
1. 4
100.0

Cumulat iv e
Percent
50. 7
82. 4
95. 8
98. 6
100.0

Tabela 2.1 Resultado do


procedimento Frequencies.

Colunas com freqncia,


percentagem,
percentagem vlida e
percentagem acumulada.

Como pode ser observado na Figura 2.1 foi solicitada uma tabela de freqncia
para cada uma das variveis do exemplo, i.e. sexo e escolaridade. A Tabela 2.1 apresenta
a tabela de freqncia para a varivel escolaridade, com o resultado da anlise solicitada
na Figura 2.1.
J a anlise de cruzamento de dados (crosstabs) obtida por meio do menu
Analyze Descriptives Statistics Crosstabs. Esse comando resultar na janela
apresentada na Figura 2.2.
Figura 2.2 Janela
do
comando
Crosstabs.

Janelas de definio de
variveis
que
sero
apresentadas nas linhas
(row) e nas colunas
(column).

16
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 2 Descrevendo Dados no SPSS

ESCOLAR escolaridade mai s el evada * SEXO sexo Crosstabul ati on


Count

ESCOLAR
esc olaridade
mais elev ada

Tot al

3
4
5
6
7

Segundo grau
Curso s uperior
Espec ializa o
Mest rado
Dout orado

SEXO s exo
1 Feminino 2 Masc ulino
69
75
45
45
19
19
4
4
1
3
138
146

Tot al
144
90
38
8
4
284

Tabela 2.2 Resultado do


procedimento Crosstabs.

Valor que representa o


nmero de pessoas do
sexo
feminino
que
possuem
nvel
de
escolaridade de segundo
grau.

Como pode ser observado na Tabela 2.2, a tabela de cruzamento de dados do


SPSS apresenta o cruzamento de informaes entre variveis, como sexo e escolaridade,
como exemplificado. Dessa forma, possvel ter uma noo de covariao de variveis
categricas, para uma explorao das caractersticas dos dados da pesquisa.
As medidas de tendncia central so usualmente utilizadas em variveis
contnuas ou quantitativas. A Figura 2.3 apresenta a janela de dilogo para execuo das
principais medidas de tendncia central no SPSS, mdia, mediana e moda. Essa janela
obtida por meio do caminho Analyze Descriptives Statistics Frequencies.

Figura 2.3 Janela


do
comando
Frequencies.

Desmarque essa opo.


Clique no boto statistics
para
selecionar
as
anlises.

17
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 2 Descrevendo Dados no SPSS


Quando selecionado o boto statistics da janela apresentada na Figura 2.3 tem-se
a nova janela de dilogo de estatsticas, apresentada na Figura 2.4.

Figura 2.4 Janela de


opes de estatstica do
comando Frequencies.

Selecione as medidas de
tendncia
central
desejadas:
mdia,
mediana e moda.

Nessa mesma caixa de


dilogo so apresentadas
as medidas de posio e
disperso.

Depois de geradas as anlises os resultados so apresentados na Tabela 2.3.


Statistics

Valid
Miss ing

Mean
Median
Mode

IDADE idade
(j complet a)
em anos
274
10
31. 50
29. 00
21a

EXPTRAB
tempo de
experincia
de trabalho
(em anos j
complet os)
282
2
12. 156
10. 000
2. 0

Tabela 2.3 Resultado das


anlises de tendncia central.

As colunas apresentam as
variveis e as linhas as
anlise de tendncia
central.

a. Mult iple modes ex is t. The smallest v alue is shown

Como salientado anteriormente a gerao de medidas de disperso e posio so


selecionadas na mesma janela de dilogo, apresentada na Figura 2.4. O resultado da
gerao de uma anlise de disperso e de posio apresentada na Tabela 2.4.

18
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 2 Descrevendo Dados no SPSS

Statisti cs

Valid
Missing

Std. Dev iation


Variance
Percentiles
25
50
75

IDADE idade
(j completa)
em anos
274
10
10. 329
106.698
23. 00
29. 00
38. 25

EXPTRAB
tempo de
experincia
de trabalho
(em anos j
complet os)
282
2
9. 3293
87. 0361
4. 000
10. 000
20. 000

Tabela 2.3 Resultado das


anlises de tendncia central.

Medidas de disperso
(seta superior) e de
posio (seta inferior).

Outra estratgia importante para descrio de dados o uso de grficos. Da


mesma forma que os indicadores estatsticos os grficos so especficos para cada tipo
de varivel em anlise. Grficos de barra e pizza so usados em variveis categricas e
histogramas so representaes de variveis contnuas. A Figura 2.5 apresenta o menu
chart da janela de dilogo frequencies, obtida pelo caminho Analyze Descriptives
Statistics Frequencies e apresentada anteriormente na Figura 2.3.
Figura 2.5 Janela de
grficos
do
comando
Frequencies.

Selecione o tipo de
grfico
desejado
de
acordo com a varivel a
ser descrita.

19
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 2 Descrevendo Dados no SPSS

O Grfico 2.1 apresenta um grfico de pizza, obtido por meio do comando


descrito na Figura 2.5.

Grfico 2.1 Grfico de


pizza obtido por meio do
menu chart do comando
Frequencies.

Exemplos de histogramas, grficos destinados variveis contnuas, so


apresentados no captulo 3 dessa apostila, destinado a obteno de acuracidade de banco
de dados aps a digitao.

20
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados

CAPTULO 3
Explorando e Adequando o Arquivo de Dados

Contedo:
1.

Deteco e correo de erros de digitao

2.

Observao e tratamento de casos omissos

3.

Observao da normalidade de variveis

4.

Estudo e eliminao de casos extremos univariados

5.

Estudo e eliminao de casos extremos multivariados

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1.

Detectar erros de digitao em arquivos de dados

2.

Produzir arquivos de dados acurados

3.

Tratar os casos omissos por meio dos procedimentos apresentados

4.

Identificar a normalidade/anormalidade das variveis

5.

Identificar casos extremos univariados

6.

Tratar casos extremos univariados

7.

Tratar casos extremos multivaridos

21
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


Aps os dados terem sido digitados fundamental que o primeiro passo do
trabalho de anlise de dados seja a limpeza e a promoo da acuidade do arquivo.
Para tanto alguns cuidados e procedimentos devem ser seguidos. Pode-se apontar
quatro procedimentos padres, que sero apresentados no presente documento: (1)
deteco e correo de erros de digitao, (2) observao e tratamento de casos
omissos, (3) observao da normalidade das variveis do arquivo de dados e (4)
estudo e eliminao de casos extremos univariados.

DETECO E CORREO DE ERROS DE DIGITAO

muito comum, durante o processo de insero de dados no SPSS, ocorrerem


erros de digitao, por exemplo, a duplicao de nmeros em uma clula. Como os
questionrios em avaliao de treinamento geralmente so associados a escalas de
resposta tipo Likert, a duplicao de valores em uma clula vai acarretar em
inflacionamento das estatsticas daquela varivel, prejudicando todo o procedimento de
anlise de dados. Para que isso no ocorra fundamental, como primeiro passo para a
anlise de dados, verificar se no existem erros de digitao no arquivo de dados.
Esse procedimento pode ser realizados por meio do menu Analyze
Descriptives Statistics Explore, que resultar na janela apresentada na Figura 3.1.

Figura 3.1 Janela


do comando Explore.

Lista de variveis a
serem analisadas.

22
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados

Aps pressionado o boto statistics da janela da Figura 3.1 ser aberta a janela
apresentada na Figura 3.2.
Figura 3.2 Janela
do comando Explore.

Opo outliers
deve
ser
selecionada.

A seleo desta opo possibilitar a identificao de valores superiores a


amplitude da escala de resposta dos itens do questionrio. Assim, erros de digitao
do tipo duplicao de valores em uma clula sero identificados. Alm do valor ser
apontado atravs deste procedimento, ele tambm possibilitar a identificao do caso
onde se encontra esse valor errneo. O resultado do procedimento obtido atravs da
janela apresentada na Figura 3.1 apresentado abaixo, na Tabela 3.1.

Extreme Val ues

IMPAC1

Highest

Lowes t

1
2
3
4
5
1
2
3
4
5

Cas e Number
2
19
217
136
40
279
115
182
198
190

Value
5
5
5
5
.a
1
1
1
1
1

Tabela 3.1 Resultado


do
procedimento
Explore.

Valores mnimos e
mximos e respectivos
casos.

a. Only a partial list of c ases wit h t he v alue 5 are


shown in t he table of upper ext remes.

importante ressaltar que o procedimento explore apresenta vrias


informaes na janela de output, mas apenas a tabela de extreme values possui as
informaes disponveis na Tabela 3.1. Tambm possvel a identificao desses
23
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


erros de digitao por meio de outros mdulos do SPSS, como Analyze
Descriptives Statistics Frequencies. Aps identificados os casos com erros de
digitao o operador do arquivo de dados deve retornar a sua fonte bruta de
informaes (questionrios respondidos pelos treinandos) e inserir a informaes
correta no local certo.

OBSERVAO E TRATAMENTO DE CASOS OMISSOS

O segundo passo a ser seguido a identificao e tratamento de casos omissos


(missing data). Um caso omisso uma ausncia de resposta, ou seja, por algum motivo
o participante no atribuiu valor a uma pergunta do questionrio. Essa ausncia de
resposta pode ser decorrente de diferentes fatores, como saturao de informaes a
serem processadas pelo respondente, inadequao da formatao do questionrio,
incapacidade do participante opinar sobre a assero. A respeito dessa ltima
possibilidade o cdigo no se aplica (NA) de questionrios buscam diminuir a
ocorrncia deste tipo de ausncia de resposta.
importante ressaltar que o excesso de casos omissos em determinado item de
um questionrio pode trazer vrias indicaes e pode, inclusive, ser considerado como
escopo de um relatrio, pois a incapacidade dos respondentes em avaliar questes pode
indicar inadequao do instrumento, entre muitas outras possibilidades. Esse dado, por si
mesmo, pode ser indicador um indicador relevante.
A identificao dos casos omissos pode ser obtida por meio do menu Analyze
Descriptives Statistics Frequencies, que resultar na janela apresentada abaixo na
Figura 3.3.

24
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


Figura 3.3 Janela
do
comando
Frequencies.

Variveis
selecionadas para
anlise.

Para a identificao dos omissos, basta que sejam deixadas as especificaes


padres do SPSS. A Tabela 3.2 apresenta o resultado dos procedimentos executados
atravs da Figura 3.3.
IMPAC1

Valid

Missing
Tot al

1 Discordo Totalmente
2 Discordo Pouco
3 No conc ordo, nem
disc ordo
4 Conc ordo
5 Conc ordo Tot almente
Tot al
Sy s tem

Frequency
5
26

Percent
1. 8
9. 3

Valid Perc ent


1. 8
9. 5

Cumulat iv e
Percent
1. 8
11. 3

26

9. 3

9. 5

20. 8

146
71
274
5
279

52. 3
25. 4
98. 2
1. 8
100.0

53. 3
25. 9
100.0

74. 1
100.0

Tabela
3.2
Resultado
procedimento
Frequencies.

do

Porcentagem
de
casos
omissos
observados
na
varivel.

A Tabela 3.2 apresenta os resultados obtidos por meio dos procedimentos


executados no comando frequencies. fundamental observar-se a percentagem de casos
omissos observados em uma varivel. Valores superiores a 3% podem ser considerados
problemticos e devem ser investigados com mais cuidado. Para variveis com valores
omissos inferiores ou iguais a 3%, estes podem ser substitudos pela mdia, por meio
dos procedimento Replace Missing Values, do menu Transform, j apresentados no
primeiro captulo desta apostila.
A literatura sobre tratamento de dados omissos ampla e bastante abrangente. De
forma geral os pesquisadores e analistas de dados interessados no tema desenvolveram
uma classificao para o tratamento destes casos. Um elemento central neste sistema de
25
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


classificao diz respeito sistematicidade dos casos omissos. A presena de
sistematicidade crucial para o pesquisador, pois se isto ocorre a forma de tratamento
destes casos deve ser diferenciada. A classificao pressupe que os casos omissos de
um banco de dados possam assumir as seguintes caractersticas: MCAR omissos
completamente aleatrios; MAR omissos aleatrios; MNAR omissos sistemticos. O
SPSS possui uma ferramenta til para anlise de casos omissos, o mdulo Missing
Values Analysis MVA. Acesse o mesmo no menu Analyze Missing Values
Analysis. Ser apresentada a janela da Figura 3.4.

Figura 3.4 Janela


do comando MVA.

Varivel
interesse
estudada

de
ser

Campo
para
estimao
de
valores omissos.

Variveis
demogrficas
serem checadas.

Em geral o estudo de sistematicidade de casos omissos est associada o


observao de relao da varivel de interesse com variveis demogrficas, para
obteno de indicaes da ocorrncia de sistematicidade entre a varivel de interesse (no
caso do exemplo a varivel AJUDA) e estes indicadores. Para o estudo desta
sistematicidade no boto Patterns da caixa de dilogo voc deve selecionar a opo
All cases optionally sorted by selected variables. Esta opo trar na janela de sada de
dados uma tabela apresentada todos os casos do banco e a ocorrncia de caso omisso na
varivel de interesse. uma ferramenta prtica para a observao de algum tipo de
26
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


associao entre a varivel de interesse e possveis dados categricos que possam estar
associados a um padro de omisso de resposta. Este mdulo do programa tambm
permite a estimao de valores para substituio de casos omissos. Como pode ser
observado na Figura 3.4 possvel se selecionar estratgias de estimao de valores
omissos, de acordo com a literatura da rea. Cada opo tem um tipo de uso e o
pesquisador deve estar consciente para a escolha da forma mais adequada para realizar a
substituio de valores omissos. Esta estimao pode e deve ser utilizada em conjunto ao
comando Replace Missing Values.

OBSERVAO DA NORMALIDADE DAS VARIVEIS

Um outro procedimento muito importante para testar a adequao dos dados para
emisso de relatrios o estudo da normalidade das variveis. A ausncia de
normalidade na distribuio de uma varivel pode indicar muitas coisas, como ausncia
de variabilidade (a grande maioria das pessoas concordam e/ou discordam de uma
afirmativa de escala Likert). Essa informao, por si s, j resultado de um relatrio de
avaliao de treinamento e pode ser utilizada como subsdio de um relatrio. O que
deve-se observar a ausncia de normalidade das variveis que sero inseridas em
anlises inferenciais multivariadas, como regresso mltipla. Caso alguma varivel
anormal seja parte de uma anlise multivariada, deve-se adotar procedimentos de
transformao da mesma (e.g. logartmica, raiz quadrada) atravs do comando compute,
no menu transform.
Para a deteco da normalidade das variveis deve-se executar o seguinte
procedimento Analyze Descriptives Statistics Frequencies, que resultar na
abertura da janela apresentada na Figura 3.5.

27
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


Figura 3.5 Janela
do
comando
Frequencies.
Selecionar
anlises
neste
boto.

Selecionar tipo
de grfico para
estudo
da
normalidade.

Nesta janela de comando, a exemplo das outras janelas de comando estatstico do


SPSS, o operador deve selecionar o conjunto de variveis a serem analisados e mov-las
para a coluna da direita. Para a observao da normalidade, o operador deve pressionar
em dois botes da borda inferior da janela, o statistics e o charts. As janelas de dilogo
destes botes esto apresentadas nas Figuras 3.6 e 3.7.
Figura 3.6 Janela do
comando Frequencies:
Statistics.
Selecione
medidas
de
tendncia central.

fundamental a
seleo
destas
duas medidas de
distribuio.

28
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


Figura 3.7 Janela do
comando Frequencies:
Charts.

Selecione
o
histograma com
curva densidade
(normal).

Lembre-se que sempre aps selecionar um procedimento dentro de uma caixa de


dilogo deve-se clicar o boto continue, para que o programa execute os procedimentos
solicitados. Os resultados dos procedimentos acima descritos so apresentados na Tabela
3.3 e no Grfico 3.1.
Statisti cs
TEMPO Tempo de Empresa
N
Valid
Missing
Mean
Median
Std. Dev iation
Skewness
Std. Error of Skewness
Kurt osis
Std. Error of Kurtos is

267
12
8. 6059
4. 0000
8. 9123
.782
.149
-1.036
.297

Tabela 3.3 Estatsticas


descritivas do procedimento
frequencies.

Valores de skewness e
kurtosis e seus respectivos
erros padro.

29
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados

Tempo de Empresa
80

Grfico
3.1
Histograma
observao
normalidade.

60

para
de

Frequency

40

20
Std. Dev = 8.91
Mean = 8.6
N = 267.00

0
0.0

4.0
2.0

8.0
6.0

12.0
10.0

16.0

14.0

20.0

18.0

24.0

22.0

28.0

26.0

T empo de Empresa

Para concluir se a distribuio de uma varivel normal deve-se observar para


alguns indicadores apresentados na Tabela 2.3, como a skewness e a kurtosis. Quanto
mais prximos de 0 estiverem esses valores, mais prximo da normalidade estar a
distribuio da varivel. Alm de se observar o valor bruto dos indicadores de assimetria
e achatamento deve-se dividir este indicador por seu erro padro. Se o resultado da
diviso for superior a 1,96 significa que aquele indicador estatisticamente significativo.
Tambm importante observar na mesma tabela o valor do desvio padro, que
superior a mdia, o que j indica ausncia de normalidade na distribuio. Por fim podese comparar os resultados dos ndices da Tabela 3.3 com o efeito grfico do histograma,
do Grfico 3.1. Claramente a curva densidade (normal) no se aproxima da normalidade.
Essa normalidade na curva poderia ser comparada a silhueta de um sino com a boca
apontada para baixo.

ESTUDO

ELIMINAO

DE

CASOS

EXTREMOS

UNIVARIADOS

MULTIVARIADOS

Casos extremos univariados so participantes que avaliaram de forma muito


diferenciada do restante do grupo um determinado aspecto. Estes casos influenciam, por
30
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


exemplo, a normalidade de uma distribuio. Casos extremos podem ser provenientes de
sujeitos que respondem sem ateno ao questionrio, avaliando apenas um ponto da
escala. Estes casos devem ser identificados, estudados e, se possvel, eliminados do
banco, para que os relatrios no sejam mascarados por avaliaes severas ou
lenientes em demasia.
Para identificao de casos extremos univariados deve-se seguir Analyze
Descriptives Statistics Explore, que resultar na janela apresentada na Figura 3.8.
Figura 3.8 Janela do
comando Explore.

Varivel
selecionada para
anlise.

Boto de grficos
deve
ser
pressionado.

Aps pressionado o boto plots ser apresentada a janela da Figura 3.9.


Figura 3.9 Janela do
comando Explore: Plots.

Selecionar
dependentes juntos
varivel inserida no
campo
das
dependentes.

31
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


A melhor anlise de casos extremos univariados pode ser obtida atravs do boxplot do SPSS, que apresenta os casos diretamente abaixo ou acima dos limites da
distribuio. O Grfico 3.2 o resultado do procedimento descrito nas figuras anteriores.

Grfico 3.2 Box-plot


para observao de
casos extremos.

Caso
extremo
nmero 215 do
arquivo de dados
exemplo.

279
115
211

-1
N=

275

Escore de Impacto Pr

O grfico aponta qual(is) casos esto acima da amplitude interquartlica. O


nmero disposto no caso indicado pelo grfico refere-se ao nmero automtico
apresentado na planilha do programa. Caso o grfico indique vrios casos, inicie a
deleo pelo nmero maior, para que a numerao dos mais baixos no seja alterada.
H um outro tipo de caso extremo que tambm deve ser explorado pelo
pesquisador, o caso multivariado. Este caso obtido a partir do estudo simultneo de
mltiplas variveis de interesse. Existem alguns procedimentos no SPSS para a
identificao dos casos extremos multivariados. A distncia de Mahalanobis a mais
comumente utilizada. Voc acessa este procedimento por meio do menu Analyze
Regression Linear. Voc obter a janela de dilogo apresentada na Figura 3.10.

32
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 3 Explorando e Adequando Arquivo de Dados


Figura 3.10 Janela do
comando
Linear
Regression.
Selecionar
uma
varivel
dependente
que
assuma
qualquer valor (identificao
do sujeito).

Selecione as variveis que


sero analisadas em seu estudo
(todas que entraro no modelo
de anlise).

Pressione o boto save e


selecione a opo mahalanobis
em distncias.

O resultado desta anlise gerar uma nova coluna de varivel no seu banco de
dados. Esta coluna conter a informao da distncia de Mahalanobis. Esta distncia
uma distribuio de qui-quadrado e deve ser interpretada com auxlio de uma tabela de
distribuio qui-quadrado. Valores superiores ao nvel de significncia determinado pelo
pesquisador, considerando os graus de liberdade do modelo em teste (no exemplo gl= 2
pois so trs variveis em teste) determinam se o caso dever ou no ser excludo do
banco de dados. Para se automatizar o processo de eliminao de casos extremos
multivariados recomenda-se o uso do comando Select Cases do menu Data do SPSS.
A seguir, no captulo 4, sero apresentados os procedimentos para realizao de anlises
inferenciais via SPSS, mais especificamente ANOVA uma via, para teste de diferena de mdias,
correlao para medidas paramtricas e no-paramtricas, teste de qui-quadrado para dados
categricos e anlise de regresso linear simples.

33
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 4 Realizando ANOVA uma via e Correlao Bivariada

CAPTULO 4
Realizando Anlises Inferenciais: ANOVA uma via, Correlao Bivariada,
Qui-quadrado e Regresso Linear Simples

Contedo:
1.

Comparao de Mdias via ANOVA uma via

2.

Correlao bivariada para variveis contnuas e categricas

3.

Teste de Qui-quadrado

4.

Regresso linear simples

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1.

Realizar anlises de comparao de mdias de ANOVA uma via.

2.

Realizar anlises de correlao bivariada.

3.

Realizar teste qui-quadrado.

4.

Realizar anlise de regresso linear simples.

34
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 4 Realizando ANOVA uma via e Correlao Bivariada


Para realizar procedimentos de anlises de teste da relao entre variveis devese efetivar procedimentos especficos, chamados de inferenciais. Caso se deseje testar a
diferena de mdia para uma varivel dependente em diferentes grupos necessria a
realizao de uma ANOVA uma via. A Figura 4.1 apresenta a caixa de dilogo da
ANOVA uma via que obtida por meio do caminho Analyze Compare Means
One-Way ANOVA.
Figura 4.1 Janela de
dilogo da ANOVA uma
via.
Acima:
Varivel
dependente (contnua).
Abaixo:
Varivel
independente
(categrica).

Anlises
posteriores
para comparao par a
par dos grupos em
anlise.

A anlise solicitada na Figura 4.1 apresenta como resultado a Tabela 4.1, aonde
so apresentados os ndices de significncia estatstica do teste de F da ANOVA. Se o
ndice de significncia (sig.) for menor que 0,05, h diferenas significativas entre os
grupos.

ANOVA
Tabela 4.1 Resultados
da ANOVA uma via.

EXPTRAB tempo de experincia de t rabalho (em anos j completos )

Between Groups
Within Groups
Tot al

Sum of
Squares
6299.377
18157.758
24457.135

df
4
277
281

Mean Square
1574.844
65. 551

F
24. 025

Sig.
.000

Para a realizao de uma correlao bivariada deve-se seguir o caminho Analyze


Correlate Bivariate. Aparecer a janela de dilogo apresentada na Figura 4.2.

35
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 4 Realizando ANOVA uma via e Correlao Bivariada

Figura 4.2 Janela de


dilogo
correlao
bivariada.

Uma
correlao
bivariada exige ao
menos duas variveis
para anlise.

Faa a seleo dos


coeficientes adequados
para o tipo de varivel:
Pearson contnuas e
demais
para
categricas.

A Tabela 4.2 apresenta os resultados da anlise de correlao. O coeficiente de


correlao varia de 1 a +1 e quanto mais prximo de 0 menor a associao entre duas
variveis.

Correlati ons

IDADE idade (j
complet a) em anos
EXPTRAB tempo de
experincia de trabalho
(em anos j complet os)

Pears on C orrelation
Sig. (2-t ailed)
N
Pears on C orrelation
Sig. (2-t ailed)

EXPTRAB
tempo de
experincia
IDADE idade
de trabalho
(j completa)
(em anos j
em anos
complet os)
1
.909**
.
.000
274
272
.909**
1

.000

272

282

Tabela 4.2 Resultado


da correlao bivariada.

Coeficiente
de
correlao. Asteriscos
indicam o nvel de
significncia
da
correlao.

**. Correlat ion is signif icant at the 0. 01 lev el (2-tailed).

Para realizar comparao sobre a distribuio do nmero de casos em dois ou


mais grupos distintos, pode-se utilizar o teste qui-quadrado. Este teste obtido por meio
do caminho Analyze Nonparametric tests Qui-square. A Figura 4.3 apresenta a
caixa de dilogo do qui-quadrado.
36
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 4 Realizando ANOVA uma via e Correlao Bivariada


Figura 4.3 Janela de
dilogo qui-quadrado.

Varivel a ser testada.

Especifica se o nmero
de casos por grupo
de tamanho idntico
ou
de
tamanho
diferente.

A Tabela 4.3 apresenta os resultados do qui-quadrado. A primeira tabela


apresenta os valores observados no banco, os valores esperados e os resduos. A segunda
tabela apresenta o teste de significncia. Se significativo, a distribuio dos casos
diferente da esperada.
ESCOLAR escol aridade mais elevada

3 Segundo grau
4 Curso superior
5 Especializao
6 Mest rado
7 Dout orado
Tot al

Obs erv ed N
144
90
38
8
4
284

Expec ted N
56. 8
56. 8
56. 8
56. 8
56. 8

Res idual
87. 2
33. 2
-18.8
-48.8
-52.8

Tabela 4.3 Resultado


do qui-quadrado.

Valores observados e
esperados.

Test Statistics
ESC OLAR
esc olaridade
mais elev ada
Chi-Squarea
250.507
df
4
Asy mp. Sig.
.000

Teste de significncia.

a. 0 cells (.0%) hav e expec ted f requencies less than


5. The minimum expec ted cell f requency is 56.8.

37
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 4 Realizando ANOVA uma via e Correlao Bivariada


Para a realizao de anlises preditivas entre duas variveis pode-se realizar uma
anlise de regresso simples. Esta anlise obtida por meio do caminho Analyze
Regression Linear. A Figura 4.4 apresenta a caixa de dilogo da anlise de
regresso.
Figura 4.4 Janela de
dilogo da regresso
linear.
Defina a varivel
dependente de anlise.
Defina a varivel
independente
de
anlise.

Mtodo de anlise de
regresso.

Botes para seleo de


procedimentos
complementares
de
anlise.

O resultado da anlise apresentada na Tabela 4.4.


Model Summary
Model
1

R
R Square
,269a
,072

Adjust ed
R Square
,071

Tabela 4.4 Resultado


da anlise de regresso
linear simples.

Std. Error of
the Estimate
2, 975

a. Predic tors : (Const ant), Atribuio_1 SMEAN(Atribuio)

Sumrio do modelo: R,
R2, e R2 ajustado para
o tamanho da amostra.

ANOVAb
Model
1

Regress ion
Res idual
Tot al

Sum of
Squares
376,768
4823,688
5200,456

df
1
545
546

Mean Square
376,768
8, 851

F
42, 569

Sig.
,000a

Valores de F para
regresso e nvel de
significncia.

a. Predic tors : (Const ant ), Atribuio_1 SMEAN(Atribuio)


b. Dependent Variable: AJ UDA_1 SMEAN(AJUDA)

Coeffici entsa

Model
1

(Constant)
Atribuio_1
SMEAN(At ribuio)

Uns tandardized
Coef f icients
B
Std. Error
4, 147
,316
,529

,081

Standardized
Coef f icients
Beta
,269

t
13, 141

Sig.
,000

6, 524

,000

Coeficiente beta da
relao entre VI e VD
e respectivos nveis de
significncia.

a. Dependent Variable: AJ UDA_1 SMEAN(AJUDA)

38
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial

CAPTULO 5
Anlise Fatorial

Contedo:
1.

Anlise Fatorial

2.

Procedimentos de Execuo da Anlise Fatorial via SPSS

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1.

Definir Anlise Fatorial

2.

Identificar as funes da Anlise Fatorial

3.

Descrever os principais conceitos associados Anlise Fatorial

4.

Realizar uma Anlise Fatorial, seguindo todas as etapas, via SPSS

39
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


ANLISE FATORIAL EM AVALIAO DE TREINAMENTO

A anlise fatorial (AF) uma tcnica estatstica multivariada desenvolvida no


incio do sculo XX por um psiclogo-estatstico chamado Spearman. Este pesquisador
teve como objetivo estudar as capacidades humanas, por meio da identificao de
construtos ou dimenses que so subjacentes a estas capacidades. Ele props que traos
latentes determinam o desempenho de uma pessoa, por exemplo, a inteligncia pode ser
mensurada por meio de um conjunto de itens. A pressuposio que existem habilidades
correlacionadas que determinam uma dimenso subjacente, que permite que as pessoas
desempenhem em situaes que exijam o uso dessas habilidades. Diante desta
pressuposio seria possvel desenvolver um conjunto de itens para mensurar
determinado trao latente. Se esses itens fizerem parte da mesma dimenso subjacente
sero relacionados entre si e podero ser considerados como indicadores de um
determinado construto. Deve-se ressaltar que a construo de medidas deve respeitar
alguns pressupostos da teoria psicomtrica, como a elaborao de um nmero suficiente
de itens (nem muito pouco, nem em exagero; cada habilidade ou atitude humana
necessitam de diferentes nmeros de itens) para mensurao de determinado trao
latente.
A partir dessa pressuposio, a AF possibilita a reduo de dados. Essa reduo
feita com base no estudo das dimenses latentes que determinariam as atitudes e/ou
habilidades das pessoas, que causariam a sua resposta a um conjunto de itens. A
implicao prtica deste tipo de procedimento est na reduo de dados, tendo em vista
que conjuntos muito extensos de itens podem ser reduzidos a poucos escores, graas a
pressuposio de que as atitudes e/ou habilidades dos sujeitos so organizadas em
dimenses subjacentes. Desta forma, pode-se obter dois ou trs ndices para a
mensurao de uma atitude. , ainda, importante ressaltar que os ndices estatsticos do
subsdio para o pesquisador selecionar as dimenses, mas essa deve ser calcada, em
ltima instncia, no sentido terico dos itens que se agregaram a um fator.
Kline (1994) aponta que existem alguns conceitos que so fundamentais para o
entendimentos e interpretao de resultados da AF. So esses:
40
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial

Correlao: conceito estatstico que busca captar o componente linear de


variao conjunta de duas variveis. Esse coeficiente varia de 1 at +1. Uma
correlao perfeita possui o valor 1 (seja esta negativa ou positiva). Quanto
maior a correlao entre duas variveis mais estas possuem componentes de
covariao em conjunto, ou seja, quanto mais uma varia (modifica de valor)
mais a outra varia. A AF baseada nas correlaes entre os itens de um
questionrio ou outros indicadores da pesquisa. O primeiro passo para o
clculo de fatores em uma AF, realizado pelo computador, o clculo de uma
matriz de correlao. Todos os itens de um instrumento de avaliao so
correlacionados entre si, formando o ponto de partida para a AF.

Fatores: busca-se obter, em uma anlise fatorial, dimenses. Essas dimenses


so

denominadas

fatores.

Estas

so

determinadas

pela

correlao

compartilhada por um conjunto de itens, ou seja, quanto mais correlacionado


for um conjunto de itens eles tm uma grande chance de formar um fator. Essa
correlao proveniente da estrutura subjacente/latente, que determina a
forma como as pessoas respondem a esse conjunto de questes. Cada fator
extrado de uma AF significa a identificao de uma dimenso latente.

Cargas Fatoriais: aps observada a correlao de todos os itens entre si e aps


a deteco de que alguns grupos desses itens podem ser organizados em
fatores necessrio traar qual a correlao de cada item com seu respectivo
fator. Essa relao item-fator dada por meio da carga fatorial. Esse um
coeficiente que varia de 1 a +1, como a correlao. Quanto mais prximo de
1 maior a relao entre o item e o fator.
muito importante ter em mente a funo prtica da AF, que se traduz no

conceito de validade. Apenas pode-se dizer que uma medida valida quando submete-se
o conjunto itens a uma quantidade suficiente de sujeitos e, posteriormente, realiza-se a
reduo de dados por meio da AF. Essa tcnica fornece os parmetros para os
pesquisadores afirmarem que suas medidas conseguem mensurar o que eles propunham
mensurar quando delinearam o instrumento, ou seja, a validade da medida.

41
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


Aps identificado o conjunto de estruturas subjacentes de um questionrio de
avaliao de treinamento, faz-se necessrio extrair o ndice de confiabilidade desses
fatores. Esse ndice de confiabilidade diz respeito a preciso da medida. Enquanto a AF
apresenta a validade da medida, ou seja, o quanto aquele instrumento de avaliao
valido, por exemplo, para mensurar a reao dos treinandos perante o treinamento, o
ndice de confiabilidade informa qual a qualidade dessa medida.

Cuidado!
Como toda tcnica estatstica deve-se tomar alguns cuidados com a AF.
Atualmente, com a sofisticao dos microcomputadores e tambm dos softwares
estatsticos muito fcil realizar procedimentos multivariados como o de AF. O tcnico
sempre deve-se lembrar da mxima garbage in, garbage out (lixo entra, lixo sai). O
tcnico deve possuir uma pressuposio terica, na qual hipotetize a existncia de
dimenses subjacentes. Por este motivo que no coerente efetuar uma anlise fatorial
em um conjunto de itens onde a pressuposio anterior de categorias no exista, pois
podero ser extradas dimenses, formadas apenas por correlaes esprias entre itens.
Devido a possibilidade de correlaes distorcidas que o sentido terico dos itens deve
ser o principal critrio para identificao de dimenses latentes.

PROCEDIMENTOS PARA EXECUO DA ANLISE FATORIAL

Para a realizao de uma anlise fatorial exploratria deve-se observar uma


seqncia lgica de procedimentos para a deteco dos fatores latentes em um conjunto
de itens. Inicialmente, o tcnico deve realizar uma anlise dos componentes principais e,
posteriormente, uma anlise fatorial propriamente dita. A anlise dos componentes
principais uma tcnica mais flexvel, que tem como funo dar indicaes do nmero
de fatores que devem ser extrados no segundo passo do procedimento. A Figura 3.1
apresenta a janela de dilogo da AF, obtida atravs de Analyze Data Reduction
Factor.

42
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


Figura 5.1 Janela do
comando Factor

Pressione
os
botes indicados
na parte inferior.

Figura 5.2 Janela do


comando
Factor:
Descriptives.

Selecionar todas
essas opes.

Figura 5.3 Janela do


comando
Factor:
Extration.

Mantenha
default
selecione
opo.

o
e
esta

43
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


Figura 5.4 Janela do
comando
Factor:
Rotation.

Mantenha
o
default, que
sem indicao de
rotao.

Figura 5.5 Janela do


comando
Factor:
Options
Selecione
esta
opo,
que
ordenar todos os
coeficientes.
Selecione
esta
opo
e
modifique
o
valor para 0,30.

Todos esses procedimentos resultaro em tabelas e grficos no output. Os


principais, importantes para a tomada de deciso, sero apresentados a seguir. A tabela
3.1 apresente o teste de KMO. Este um indicador de fatorabilidade da matriz de dados.
Quanto mais prximo de 1 melhor. Acima de 0,80 j existe indicativo de que os dados
so submetidos a AF. No caso deste exemplo existe indicao de adequao dos dados
para serem submetidos a AF.
KMO and Bartlett's Test
Kaiser-Mey er-Olkin Measure of Sampling
Adequacy .
Bart lett's Tes t of
Sphericity

Approx. Chi-Square
df
Sig.

.889

Tabela 5.1 ndice de KMO.

971.990
66
.000

44
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


O prximo indicador, apresentado na tabela 3.2, aponta a quantidade de fatores
apontado pela anlise de componentes principais. Essa informao obtida por meio dos
eigenvalues. Valores superiores a 3,0 apontam para a existncia de dimenses. Em
seguida, no grfico 3.1, so apresentados os eigenvalues. Quando a curva torna-se uma
queda ordenada decrescente que existe indicao da estrutura fatorial.
Total Variance Expl ained

Component
1
2
3
4
5
6
7
8
9
10
11
12

Init ial Eigenv alues


% of Variance Cumulat iv e %
39. 634
39. 634
10. 424
50. 058
7. 187
57. 246
6. 838
64. 084
6. 302
70. 386
6. 041
76. 428
4. 995
81. 423
4. 732
86. 155
4. 100
90. 255
3. 455
93. 710
3. 166
96. 875
3. 125
100.000

Tot al
4. 756
1. 251
.862
.821
.756
.725
.599
.568
.492
.415
.380
.375

Extraction Sums of Squared Loadings


Tot al
% of Variance Cumulat iv e %
4. 756
39. 634
39. 634
1. 251
10. 424
50. 058

Tabela 5.2 Eigenvalues da


soluo.

Somente
um
valor superior
a 3, indicando
apenas um fator.

Extraction Met hod: Principal Component Analy sis.

Scree Plot

Grfico 5.1 Scree-plot


grfico de eigenvalues.

Queda constante
indica a presena
de apenas um
fator.

Eigenvalue

0
1

10

11

12

Component Number

Como resultado da anlise de principais componentes deste banco de dados


observa-se que o conjunto de itens se agrega, adequadamente, em apenas um fator. A
concluso final pode ser extrada da observao do scree plot, que claramente indica a
45
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


presena de um fator, com eigenvalue muito elevado, indicando uma alta explicao da
varincia de todos os itens. Depois de concludo a estrutura fatorial a partir da anlise de
componentes principais, deve-se proceder a anlise fatorial.
Para tanto, sero necessrias alteraes em algumas das janelas (apresentadas nas
figuras 3.1 a 3.5), como apresentado a seguir:

Janela Factor (Figura 3.1): matenha os mesmos itens selecionados para a


anlise de componentes principais;

Janela Factor: Descriptives (Figura 3.2): retire a marcao de todas as opes.


Estas informaes no so mais necessrias;

Janela Factor: Extraction (Figura 3.3): retire as marcaes do scree plot e


unrotated factor solution. Marque a opo nmero de fatores, informando o
nmero observado na anlise de componentes principais (um neste exemplo).
V at o campo Method e selecione principal axis factoring (PAF).

Janela Factor: Rotation (Figura 3.4): mantenha o default, sem rotao. Isso
deve ser feito para este exemplo, com indicao de apenas um fator. A
ausncia de rotao aplica-se apenas para solues fatoriais de estrutura
unifatorial.

Janela Factor: Options (Figura 3.5): matenha as mesmas informaes


solicitadas na anlise de componentes principais.
O

arquivo

de

output

desses

procedimentos

conter

um

nmero

consideravelmente menor de informaes do que aquele gerado pela anlise de


componentes principais. interessante observar algumas informaes nestes resultados,
como a tabela de porcentagem da varincia explicada, a mesma apresentada na tabela
3.2. Mas a principal informao que deve ser observada a matriz de cargas fatoriais da
soluo, apresentada na tabela 3.3. bom ressalvar que esta matriz recebe este nome
(factor matrix) quando a soluo unifatorial. Quando a soluo for com mais de um
fator a matriz que deve ser observada denominada pattern matrix.

46
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


Factor Matrixa

IMPAC6
IMPAC1
IMPAC9
IMPAC3
IMPAC5
IMPAC2
IMPAC8
IMPAC12
IMPAC4
IMPAC7
IMPAC10
IMPAC11

Factor
1
.707
.706
.661
.628
.612
.589
.583
.574
.528
.479
.461
.431

Tabela 5.3 Cargas fatoriais


dos itens da soluo.

Extraction Met hod: Princ ipal Axis Fac toring.


a. 1 f actors extracted. 4 iterations required.

Na tabela 3.3 podem ser observadas duas colunas. A primeira possui o nome de
cada um dos itens do fator. Neste exemplo todos os itens do fator obtiveram valor de
carga fatorial superior a 0,30 e todos os itens analisados (12 ao total) fizeram parte da
soluo final. A segunda coluna (direita) possui a carga fatorial de cada item, indicando
o grau de correlao de cada um dos itens com o fator ao qual pertence.
Aps finalizada a anlise fatorial, o ltimo procedimento diz respeito ao clculo
do ndice de confiabilidade (preciso) do fator. Para tanto necessrio seguir o seguinte
procedimento Analyze Scale Reliability Analysis, que resultar na abertura da
janela apresentada na Figura 3.6.
Figura 5.6 Janela do
comando Reliability.

Pressione
este
boto e escolha
scale if item
deleted.

Selecione todos
os itens que
compem o fator
a ser examinado

47
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


O tcnico deve pressionar o boto da janela da Figura 3.6 e selecionar a opo,
como indicada no texto explicativo ao lado da figura. Esse procedimento ir inserir na
tabela o valor do alpha (coeficiente de confiabilidade) caso o item seja excludo da
soluo fatorial. Esse mais um indicador para apontar a adequao do item na
mensurao da estrutura latente. A tabela 3.4 apresenta as informaes relativas ao
procedimento de teste de preciso da escala.
S C A L E

Tabela 5.4 Resultados dos


clculos de confiabilidade.

(A L P H A)

Coluna
com
valores de alpha
caso o item fosse
eliminado.

Item-total Statistics

IMPAC1
IMPAC2
IMPAC3
IMPAC4
IMPAC5
IMPAC6
IMPAC7
IMPAC8
IMPAC9
IMPAC10
IMPAC11
IMPAC12

Scale
Mean
if Item
Deleted

Scale
Variance
if Item
Deleted

41.3916
41.2548
41.3042
41.6350
41.5247
41.4068
41.7947
41.3764
41.4030
42.0570
41.6540
41.7529

40.3384
42.6333
40.8537
42.4693
40.7542
40.8911
42.9424
41.1669
40.6156
41.6341
42.9905
41.1715

Corrected
ItemTotal
Correlation
.6428
.5347
.5732
.4791
.5624
.6353
.4398
.5451
.6196
.4366
.4133
.5237

Alpha
if Item
Deleted
.8383
.8462
.8430
.8494
.8438
.8393
.8519
.8450
.8399
.8537
.8538
.8466

ndice geral da
escala, com todos
os
itens
selecionados.

Reliability Coefficients
N of Cases =
Alpha =

263.0

N of Items = 12

.8570

O valor obtido nesta escala do exemplo pode ser considerado bom, pois o valor
superior a 0,80. Este coeficiente varia de 0 a 1 e os melhores ndices so aqueles
superiores a 0,90.
Todos os procedimentos apresentados neste captulo sero suficientes para a
extrao de indicadores de validade e confiabilidade de questionrios de avaliao de
treinamento via SPSS. Caso o leitor esteja interessado em aprofundamentos na tcnica
de AF sugere-se recorrer a leitura recomendada ao final desta apostila.
48
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 5 Anlise Fatorial


Aps definidos os itens que compem cada fator do instrumento de avaliao de
treinamento, necessria a criao de escores fatoriais por caso no arquivo de dados,
gerando, finalmente, a reduo de um conjunto de itens a um nico indicador. Esse
procedimento feito atravs do menu Transform Compute, resultando na janela
apresentada na Figura 3.7.
Figura 5.6 Janela do
comando Reliability

Selecione
a
expresso
numrica MEAN
e
defina
as
variveis
que
fazem parte do
fator

Atribua um nome
para a varivel
que ser gerada

O campo Functions possui uma srie de expresses. Para a criao do escore


fatorial a expresso MEAN deve ser selecionada e transportada para o campo superior.
Em seguida todas as variveis que compem o fator devem ser inseridas entre os
parnteses que seguem a expresso numrica. Aps esta seleo o boto OK deve ser
pressionado. Isto ir gerar uma coluna ao final do arquivo de dados, atribuindo um
escore para cada treinando que participou da avaliao do treinamento.
Esse mesmo procedimento pode gerar escores para qualquer estrutura fatorial
observada. Aps a execuo desse procedimento todas as anlises que iro subsidiar o
relatrio podero ser feitas com base nesses escores, deixando de lado os itens que os
constituram. Os itens podem ser usados novamente, a depender do interesse dos
tcnicos em treinamento.

49
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 6 Gerao e Uso de Syntax

CAPTULO 6
Gerao e Manipulao de Syntax

Contedo:
1.

Funo e Uso da Syntax no SPSS

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1.

Identificar quais os possveis usos dos comandos da syntax

2.

Descrever alguns comandos da syntax

3.

Criar syntax de comandos para gerao de rotinas de relatrios em avaliao de

treinamento

50
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 6 Gerao e Uso de Syntax


FUNO E USO DA SYNTAX NO SPSS
Como apresentado no primeiro captulo desta apostila, o SPSS possui um tipo de
arquivo que possibilita a gerao e arquivamento de informaes relativas a
procedimentos de anlise de dados. Este tipo de arquivo muito til quando o tcnico
necessita (a) realizar rotinas de anlise de dados, como relatrios peridicos, onde os
procedimentos no so diferenciados; (b) realizar anlises complexas, onde um mesmo
procedimento estatstico deve ser realizado, mas com diferentes variveis de um mesmo
arquivo de dados ou de arquivos de dados diferentes; e (c) trabalhar com mltiplos
procedimentos de anlise em um mesmo arquivo, como anlise exploratria complexa.
Na manuteno de um sistema de avaliao de treinamento interessante a utilizao de
arquivos de syntax para a realizao de rotinas peridicas de trabalho, como o caso da
elaborao de relatrios.
importante chamar a ateno que a presente apostila tem como funo informar
sobre alguns tipos de comandos da syntax do SPSS. Existem uma quantidade muito
grande de comandos via syntax e existem manuais especficos para a manipulao
desses procedimentos. O menu help do SPSS traz muita informao sobre a syntax,
podendo auxiliar na manipulao de dados por meio deste comando.
O arquivo de syntax pode ser obtido atravs do uso do boto Paste, presente na
grande maioria das janelas de dilogo do SPSS. A Figura 4.1 apresenta o procedimento
para gerao do comando GET em um arquivo de syntax. A janela obtida por meio do
File Open Data.

51
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 6 Gerao e Uso de Syntax


Figura 6.1 Janela do
comando Open
Escolha
o
arquivo desejado
e pressione o
boto indicado.

Esse mesmo procedimento, o boto Paste, pode ser utilizado em diversas caixas
de dilogo do SPSS para gerao dos arquivos syntax de comando. A Figura 6.2
apresenta uma janela syntax com diferentes comandos j copiados em sua estrutura.
Figura 6.2 Janela de
arquivo syntax

Resultado
do
comando
executado
na
figura anterior

Variveis
selecionadas para
anlise
descritiva.

Na mesma figura ainda so apresentados outros procedimentos de anlise e


transformao de dados. O comando COMPUTE faz a criao de escores fatoriais, como
52
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 6 Gerao e Uso de Syntax


apresentado na Figura 5.6. Dois comandos GRAPH, para gerao de grficos; no
exemplo um grfico de disperso e um histograma. Tambm apresentado no exemplo
um comando CORRELATIONS.
Utilizando este procedimento possvel a gerao de arquivos de dados com
rotinas de trabalho, para gerao de relatrios em avaliao de treinamento. A Figura 6.3
apresenta um exemplo de comandos para relatrio de avaliao de treinamento, nos
nveis de reao, aprendizagem, comportamento no cargo (impacto do treinamento) e
mudana na organizao.
Figura 6.3 Janela de
syntax com exemplo de
rotina de relatrio

Neste exemplo so solicitados vrios tipos de anlises que podem ser teis em
um relatrio de avaliao de treinamento. Inicialmente foram solicitadas freqncias das
variveis discretas do banco de dados. Neste comando a inteno identificar a
frequencia de casos de cada uma das variveis indicadas no comando. Em seguida foi
solicitado o comando FREQUENCIES com especificao de ndices relativos as
variveis contnuas (e.g. impacto do treinamento em amplitude e profundidade). Essas
informaes iniciais possibilitam identificar os ndices descritivos do resultado do

53
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 6 Gerao e Uso de Syntax


treinamento, j indicando se o treinamento modificou o comportamento do treinando no
cargo.
Em seguida, foram solicitadas duas correlaes, para obter o grau de relao
existente entre algumas variveis. Neste caso a inteno comparar se existe algum tipo
e relao entre o resultado do treinamento no trabalho e variveis de contexto e dos
indivduos. Tambm foi solicitada uma correlao no paramtrica, indicada para
relacionar variveis contnuas e categorias, neste exemplo escolaridade com o resultado
do treinamento no trabalho.
Neste exemplo, tambm foi solicitado o clculo de um teste T, para averiguao
do nvel de significncia dos escores desta amostra em relao a populao. Por ltimo
foi solicitado um grfico interativo, atravs do comando IGRAPH, para observao do
padro de distribuio da varivel impacto do treinamento no trabalho.
Este exemplo hipottico pode ser o escopo de informaes de um relatrio de
apresentao dos resultados de impacto do treinamento no trabalho de um grupo de
treinandos. Obviamente que a equipe de tcnicos da organizao deve definir quais so
suas necessidades e tambm o interesse dos consumidores do resultado de um sistema de
avaliao de treinamento.

54
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 7 Noes bsicas do AMOS

CAPTULO 7
Noes Bsicas do AMOS

Contedo:
1.

Viso geral das funes do AMOS Graphics

Objetivos:
Ao final do captulo o aluno dever ser capaz de:
1.

Identificar as principais caractersticas da interface AMOS Graphics

2.

Elaborar diagramas estruturais (modelos mensurao e estrutural)

3.

Selecionar opes bsicas de anlise via AMOS Graphics

55
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 7 Noes bsicas do AMOS


O AMOS Graphics refere-se ao principal mdulo de interface com o software
de equaes estruturais vinculado ao SPSS. Este software possui outra interface de
oprao, o AMOS Basic. Essa interface opera por meio de syntax (i.e. linguagem de
programao). Este captulo tem como funo fornecer uma viso geral e introdutria
do AMOS Graphics, que a interface mais simples e direta de uso do software. Alm
de muito intuitiva chega a ser quase ldica, pois o trabalho de definio dos modelos
feito por meio do desenho, facilmente executado com o auxlio das ferramentas do
software. Vale ressaltar que, como esta interface, o trabalho do pesquisador centra-se
no desenvolvimento da lgica terica do modelo que ser testado, pois as relaes de
antecedncia e mediao entre variveis so facilmente operacionalizadas por meio da
construo do diagrama estrutural.
Figura 7.1 Interface
de trabalho ao AMOS
Graphics.

Barra de
ferramentas de
desenho,
definio de
anlises, etc

rea para
desenho dos
diagramas
estruturais.

Como pode ser observado na Figura 7.1 a interface do AMOS Graphics divide
a tela em duas metades, uma, esquerda, com os cones de desenho, definio de
parmetros de anlise, seleo de variveis, escolha de arquivo de dados para anlise,
entre outros. A outra metade, direita da tela, tem o espao delimitado para o desenho
do diagrama estrutural.
56
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 7 Noes bsicas do AMOS

Figura 7.2
Ferramentas para
desenho de diagramas
estruturais.
Selecione este
boto para poder
desenhar
diagrama com
estrutura latente.

Clique e arraste
no local que
desejar,
definindo o
tamanho.
Botes para
criao de setas e
termo de
distrbio de
varivel
endgena.

Os trs botes da primeira fileira da barra de desenhos permitem a criao dos


trs tipos bsicos de desenhos em diagramas estruturais: quadrados, elipses e
estruturas latentes (com elipses ligadas a quadrados). A segunda fileira de botes
permite a criao de setas uni ou bidirecionais, bem como a criao de erros, que
devem ser associados a variveis endgenas (que recebem ao menos uma seta
unidirecional). A terceira fileira de botes permite a criao do ttulo do diagrama,
bem como a identificao de variveis no banco de dados vinculado ao diagrama ou
as variveis definidas no diagrama. A quarta fileira permite selecionar ou eliminar a
seleo de elementos do diagrama desenhado. A quinta fileira tambm refere-se a
elementos de formatao do desenho, respectivamente, copiar, mover ou eliminar
partes de um desenho. As fileiras seis e sete tambm dizem respeito a ferramentas de
formatao de desenhos j elaborados, como a redefinio do tamanho de elementos
(sejam elipses ou quadrados), o estabelecimento de proporcionalidade entre elementos
do desenho, entre outras funcionalidades para formatar e tornar o diagrama mais
harmnico, permitindo a melhor visualizao de suas partes.
Vale ressaltar que, no relato de anlises via MEE, fundamental que a
representao pictrica esteja muito bem elaborada, permitindo a visualizao
57
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 7 Noes bsicas do AMOS


completa de todos os seus elementos, inclusive os coeficientes de regresso e
varincias, que podem ser apresentados conjuntamente com o diagrama estrutural.
Isto parte fundamental da apresentao dos resultados da tcnica de anlise,
inclusive previsto e normalizado pelo manual da APA.
Figura 7.3 Nomeando
e definindo parmetros
de cada objeto do
diagrama.
Clique com o
boto da direita
sobre o elemento
que deseja
definir
propriedades.

Vrios
propriedades
podem ser
definidas nesta
janela de
trabalho.

OBS: se o seu banco j possui as variveis definidas voc pode seguir diretamente
para o passo seguinte, apresentado na Figura 7.4.
Todos os objetos desenhados em um diagrama devem ter suas propriedades
definidas, como seu nome, label, se o parmetro fixo ou randmico, entre outros
elementos. Este procedimento realizado por meio da janela de dilogo apresentada
na Figura 7.3. Note que as duas estruturas de mensurao definidas possuem valores
fixados em vrias das setas unidirecionais (ex: entre erros de mensurao e variveis
observadas ou entre uma das relaes da varivel latente e indicadores observados). O
AMOS tem como default fixar estes parmetros, como forma de garantir identificao
do modelo a ser estimado (i.e. manter um nmero suficiente de elementos da matriz
de covarincias livres para permitir a estimao dos parmetros no livres). Se for o
caso possvel, por meio da mesma janela de dilogo, empreender alteraes neste
padro adotado pelo programa.
58
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 7 Noes bsicas do AMOS

Figura 7.4 Definindo


um banco de dados para
o diagrama.
Selecione este
boto para a
abertura da caixa
de dilogo de
definio de
arquivo .sav.
Na caixa de
dilogo
possvel definir
um arquivo .sav
para a realizao
de anlises.

Depois de elaborado o diagrama estrutural possvel definir o arquivo de

Depois de
selecionado o
arquivo, clique
nesta opo para
abrir as variveis
do banco. Clique
a arraste para
colocar as
variveis nos
respectivos
elementos do
diagrama.

dados do SPSS (.sav) que ser a base de anlise das relaes definidas pelo
pesquisador. Lembre-se que este arquivo j deve ter os casos omissos resolvidos por
meio de alguma estratgia, como eliminao destes casos ou imputao por meio de
alguma estratgia (EM, Regresso, Mdia etc). Depois de definido o banco possvel
relacionar suas variveis com cada elemento do diagrama estrutural, guardando
coerncia lgica entre as pressuposies tericas do pesquisador, expressas no
diagrama, e as variveis observadas, constantes no banco de dados. Lembre-se sempre
que em MEE as elipses no esto presentes no banco de dados, pois sero varincias
estimadas com base nas variveis observadas (constantes no banco). Portanto no faz
nenhum sentido arrastar uma varivel do banco para uma elipse.

59
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Captulo 7 Noes bsicas do AMOS


Figura 7.5 Definindo
as propriedades da
anlise.
Selecione este
boto para a
abertura da caixa
de dilogo de
propriedades da
anlise.

Esta caixa
permite
selecionar
elementos da
anlise, como:
mtodo de
estimao,
informaes do
output, entre
vrios outros.
Para visualizar o
output, aps
executada a
anlise, clique
neste boto.

As definies dos parmetros de anlise do diagrama estrutural so definidos


na janela de dilogo apresentada na Figura 7.5. Todos os procedimentos bsicos para
realizao de uma MEE podem ser obtidos por meio desta janela. A Figura 7.6
apresenta um exemplo de arquivo de output.
Figura 7.6 Arquivo de
output do AMOS 7.0.

Sumrio das
anlises
realizadas.
Clique em cada
um para obter as
informaes.

60
Ronaldo Pilati Professor do Departamento de Psicologia Social e do Trabalho da UnB.
Juliana Barreiros Porto Professora do Departamento de Psicologia Social e do Trabalho da UnB.

Vous aimerez peut-être aussi