Vous êtes sur la page 1sur 37

11 12

BrevesConsideraessobreSPSS

Escola Superior de Educao Prof. Raquel Vieira

raquelsav@gmail.com

1 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

NDICE
1. APRESENTAO SUCINTA DO AMBIENTE SPSS 1.1. 1.2. 1.3. 1.4. PRINCIPAIS MENUS E JANELAS SPSS PARA ORGANIZAR DADOS EXPLORAO DE VARIVEIS A APRESENTAO GRFICA DE DADOS E O TIPO DE VARIVEL 3 3 5 10 11 15 22 22 25 26 27 27 29 36

2. MEDIDAS DE LOCALIZAO DE TENDNCIA CENTRAL REVISO DE CONCEITOS E APLICAO A SPSS 3. ASSOCIAO E CORRELAO 3.1. DIAGRAMA DE DISPERSO 3.2. COVARINCIA E CORRELAO 3.2.1.COEFICIENTEDECORRELAOLINEARDEPEARSON 3.2.2.COEFICIENTEDECORRELAOORDINALDESPEARMAN 3.2.3.COEFICIENTEDECORRELAOBISSERIALPORPONTOS 3.3. ASSOCIAO: TABELAS DE CONTINGNCIA E COEFICIENTE DE ASSOCIAO 4. TESTES PARAMTRICOS E NO PARAMTRICOS

2 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

1. Apresentao sucinta do Ambiente SPSS


O SPSS (Statistical Package for Social Sciences) um software de anlise estatstica e tratamento de dados vocacionado para as Cincias Sociais que permite, entre muitas outras possibilidades, a manipulao, transformao e criao de tabelas e grficos que resumam a informao obtida. Mas as suas potencialidades vo mais alm do que a simples anlise descritiva de um conjunto de dados. tambm possvel realizar, com este software, procedimentos mais avanados que vo desde a Inferncia Estatstica, teste de hipteses e estatsticas multivariadas para dados qualitativos e quantitativos.

1.1. Principais menus e janelas


Tal como em outros programas, podemos encontrar na parte superior um conjunto de comandos que permitem a execuo de vrias operaes (File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window e Help). Embora quando de se abre um novo documento de SPSS, a aparncia possa ser muito semelhante ao programa Excel, no que se refere organizao em linhas e colunas, a forma de funcionamento apresenta diferenas estruturais. De facto, cada uma das clulas resulta do cruzamento de vrias colunas onde devem constar as variveis em estudo (Ex. Peso, sexo, idade, etc.) e vrias linhas, sendo cada uma destas respeitante a cada um dos sujeitos ou participantes.

3 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Alm dos Menus, o SPSS apresenta outro tipo de interfaces, tais como: janelas, barras de ferramentas e de estado e caixas de dilogo que tornam mais acessvel o seu manuseamento. No que se refere a janelas, destacamos:
A janela de edio (SPSS Data Editor) que se subdivide em duas janelas: - Janela de dados - (Data View): Ao abrir o SPSS a primeira janela que visualizada e consiste numa matriz (linhas/colunas) onde vo ser inseridos (ou alterados) os dados. Cada coluna representa uma varivel e cada linha um registo, caso ou observao. - Janela de Variveis - (Variable View): O SPSS tem uma janela de vista de variveis onde se definem, ou se modificam, todos os aspectos relativos a cada uma das variveis.

A Janela de resultados (Output Viewer) Onde todos os resultados, sob a forma de tabelas ou grficos so exibidos. O contedo pode ser editado e gravado em ficheiro.

4 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

1.2. SPSS para organizar dados 1 PASSO: INTRODUO E DEFINIO DE VARIVEIS


A introduo de dados pressupe que, antecipadamente sejam identificadas e classificadas as variveis em questo. Para isso, deve ser seleccionada a Janela das Variveis (Variable View) onde devero ser preenchidas, nas diferentes colunas as dimenses para a caracterizao das variveis em estudo:

Name: Define-se o nome da varivel. Type: Determina-se o tipo de varivel em uso:

- Numeric - numricas - Comma - com vrgulas a separar os milhares - Dot- Com ponto separador nos milhares - Scientific notation - numricos com notao cientfica - Date- data-vros formatos - DolLar-para moeda dlar - Custom Currency- outros fomatos para valores monetrios - String- alfanumricas - mais usada para posteriormente identificar casos em 1 apresentao grfica de resultados, ou seja para variveis Nominais e Ordinais. - Restricted Numeric: nmero inteiro com zeros esquerda

Label: etiqueta que, queremos que saia, por exemplo, no Output dos resultados.

1Mesmo quando as variveis so qualitativas possvel escolher numeric para que se possam
realizar posteriormente anlises estatsticas com este tipo de variveis. Por exemplo, Grau de satisfao ser 1 para muito baixo, 2 para moderado e 3 para muito alto.

5 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Value Labels- atribui etiquetas aos valores da varivel

Missing values - Os valores em falta. Note-se que os valores de uma varivel- mesmo sendo numricos- especificados como missing values pelo utilizador so excludos do tratamento estatstico dos dados e so tratados como um caso especial. Columns - Permite definir/alterar o tamanho da coluna. Align - Permite definir/alterar o alinhamento da coluna. Measure Permite definir o tipo de varivel: - Scale se so quantitativas - Nominal e Ordinal se so variveis qualitativas (ambas tratadas como categricas nos procedimentos de tabelas e grficos, mesmo que os valores sejam numricos). Role Permite definir o papel que a varivel poder tonar na anlise dos dados: - Input : varivel independente - Target: varivel depente - Both: ambas - None: sem papel assumido - Partition: ser usada para a partio de dados em duas amostras separadas - Split: permite a compatibilidade (nos dois sentidos) com o PASW Modeler (programa que permite a descoberta de padres).

A EXPLORAO DE ALGUMAS FERRAMENTAS:

O Menu Transform
O SPSS possui um conjunto de ferramentas que permitem transformar as variveis, alterar os valores a uma varivel ou at criar novas variveis a partir de outras, e se necessrio tambm seleccionar casos a analisar.

Compute- Permite calcular valores, mediante uma expresso matemtica.


Por exemplo: Um determinado suplemento alimentar faz aumentar a massa muscular em 5%. A frmula matemtica correspondente ser: massa muscular final = 1.05* massa muscular inicial o SPSS permite, assim, a criao de uma nova varivel partindo da anterior, usando Compute Variable, escrevemos o nome da nova varivel MMfinal" na caixa de texto e em Target Variable a expresso numrica 1.05*MMinicial (Varivel anterior)

6 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Clicamos OK.

Recode Este comando


permite codificar valores de uma varivel em novos valores, sendo til para conseguir categorizar variveis ou para agrupar ou transformar valores nominais em numricos. Por exemplo se temos uma varivel que necessitamos agrupar por classes. Por exemplo: Depois de inserirmos a varivel peso, podemos ter necessidade de a codificar em intervalos pela classificao de IMC: at 19,99 - peso baixo 20 a 24,99 - peso normal 25 a 29,99 - excesso de peso 30 a 35,99 - obesidade a partir de 36 - obesidade mrbida Acedemos ao menu Transform Recode Into different Variables e criamos o nome da nova varivel, por exemplo classimc, incluindo um nome mais completo em Label.

7 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Seleccionamos Old and New Values e atribumos um cdigo a cada uma das classes. Por exemplo: 1-> at 19,99 - peso baixo 2-> 20 a 24,99 - peso normal 3-> 25 a 29,99 - excesso de peso 4-> 30 a 35,99 - obesidade 5-> a partir de 36 - obesidade mrbida

Depois de criada a nova varivel, no modo Variable View- Value podemos atribuir a cada um dos valores uma etiqueta:

AINDA OUTRAS FERRAMENTAS NO MENU TRANSFORM


Count- Comando que permite criar uma varivel que faz a contagem de determinado caso numa varivel. Rank Cases- cria scores , ordens, para os casos de acordo com os valores de uma varivel . Automatic Recode Converte as categorias de uma varivel Nominal ou Ordinal em valores numricos e automaticamente cria rtulos para os valores, no entanto, o Recode mais usado porque permite controlar as categorias e atribuio de rtulos.

8 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

O Menu Data
No menu data esto alguns dos comandos directamente relacionados com os dados, dos quais podemos destacar alguns procedimentos, por enquanto: Sort Cases- Ordena os casos de acordo com uma varivel. Neste exemplo os dados esto ordenados a partir da varivel peso:

Transpose- Transpe linhas para colunas o que significa que as variveis passam a ser casos e as observaes variveis. Merge files- permite acrescentar valores (casos ou variveis) de outro ficheiro de dados do SPSS. Split Files permite dividir ficheiros de dados em funo de categorias de uma varivel categrica. til quando necessrio compara resultados para dois grupos distintos. Por exemplo: feminino e masculino. Select Cases- Permite escolher um subconjunto de observaes para se fazer vrias anlises, tendo em considerao esses valores, dependendo de um critrio introduzido (if condition is satisfied), aleatoriamente (Random Sample of cases) , num intervalo (time or case range). Por exemplo: seleccionar todos os casos em que a idade seja inferior ou igual a 30 anos:

9 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Weight Cases- Apresenta os valores pesadospor uma varivel . Ou seja em vez de


cada linha representar uma observao, esta poder representar tantos casos como os que estaro definidos pela varivel definida para pesar os valores (weight). Os valores dessa varivel devem indicar o nmero de observaes que verificam conjuntamente as categorias das outras variveis. Valores nulos, omissos ou negativos sero excludos.

1.3. Explorao de variveis


Numa anlise estatstica h a distinguir, em primeiro lugar, dois tipos de estatsticas: a que pretende descrever os dados amostrais - estatstica descritiva - e a que pretende extrapolar esses resultados para a populao estatstica inferencial. A explorao de variveis em qualquer um dos contexto remete-nos ao menu Analize

Menu Analyze e a estatstica descritiva


Mostrar as potencialidades deste menu exige, antes de mais, aprofundar a definio das variveis, pois esta definio determinante na sada dos dados.
Sabemos que existem os seguintes tipos de variveis: Nominal (Nominal): dados classificados por categorias no ordenadas; Ordinal (Ordinal): dados classificados por categorias ordenadas Intervalar (Scale): dados expressos numa escala numrica com origem arbitrria Razo (Scale): dados expressos numa escala numrica com origem fixa Note-se que, por vezes, h necessidade de categorizar variveis contnuas.

10 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

1.4. A apresentao Grfica de dados e o tipo de varivel


Varivel Nominal
Uma forma simples de apresentar as variveis nominais recorrendo a uma tabela de frequncias (frequncias absolutas e relativas) ou em grfico (de barras, circular). Estas obtm-se no menu Analyze, onde podem ser escolhidas diversas opes.

11 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Varivel Ordinal
A informao sumria das variveis, geralmente, semelhante ao descrito anteriormente para as variveis nominais, no entanto no se pode alterar a ordem das categorias uma vez que estas tm uma ordem prpria.

12 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Varivel Contnua e Discreta


Para descrever variveis discretas que assumam poucos valores ainda possvel usar uma tabela de frequncias e/ou grficos de barras. Mas para variveis discretas, que assumam vrios valores, ou para variveis contnuas uma tabela de frequncias no , normalmente, muito til, pois grande parte dos valores tero frequncia muito baixa. A tabela de frequncias ser uma lista de valores que torna a informao a extrair da varivel muito complexa. Da mesma forma um grfico de barras para dados contnuos seria composto por uma srie de pequenas barras. Uma opo que permite uma visualizao dos dados melhor que a obtida com um grfico de barras o histograma. O histograma semelhante ao grfico de barras com a diferena que cada barra representa a frequncia de valores num intervalo ou classe (de valores). Cada intervalo de valores tem a continuao no intervalo da barra seguinte. Por isso as barras so representadas todas juntas.

Grfico de Caule-e-folhas O diagrama de caule-e-folha (stem and leaf) consiste numa representao grfica que apresentar os dados separando em cada dado quantitativo os algarismos de maior ordem (caule) dos de menor ordem (folhas). Esta tabela tem a particularidade de permitir ao observador uma percepo do aspecto global dos dados sem perda de informao contida na coleco de dados inicial. Para construir um grfico de caule-e-flores deve proceder aos seguintes passos: Descritive Statistics -> Explore e escolher a varivel que pretender e seleccionar Plots -> Stem-and-leaf

13 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Obtendo o seguinte Output:

14 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

2. Medidas de localizao de tendncia central Reviso de Conceitos e aplicao a SPSS Mdia aritmtica
1) Seja x1, x2, x3, .., xn os n valores de uma varivel quantitativa. Chama-se mdia, e representa-se por , ao valor obtido por . 2) Quando os dados esto agrupados em classes, x1, x2, x3,..., xn so os valores mdios da classe

com k =nmero de classes; Fi=frequncia absoluta classe i; yi o ponto mdio da classe i (representante da classe). O valor que obtemos para a mdia deixa de ser exacto, passando a ser uma aproximao. A mdia aritmtica o valor nico que equilibra a distribuio, dado que a soma dos desvios de todas as observaes em relao mdia zero. muitas vezes designada de centro de gravidade da distribuio e depende do valor de todas a observaes, sendo objectivamente afectada pelos valores extremos. A mdia o centro nas distribuies normais

DESVANTAGEM DA MDIA: A mdia muito sensvel a valores muito grandes ou muito pequenos, por isso uma medida sensvel e pouco resistente.

Mediana
Indica o valor central das observaes, depois de ordenadas. A mediana o valor que a divide ao meio, isto , 50% dos elementos da amostra so menores ou iguais mediana e os outros 50% so maiores ou iguais. Depois de ordenada a amostra: Se n mpar a mediana o elemento mdio. Se n par a mediana a semi-soma dos dois elementos mdios. Como medida de localizao, a mediana mais resistente do que a mdia, pois no to sensvel aos dados.

15 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Mediana a partir de dados agrupados:


A frmula emprica para o clculo da mediana :

Sendo: l limite inferior da classe; c amplitude da classe mediana; n dimenso da populao F frequncia acumulada da classe anterior classe mediana; f frequncia da classe mediana

Quantil
A designao de quantil encontra-se associada ideia de que os quantis dividem a distribuio de frequncias em quantidades iguais, isto , com igual nmero de observaes. Os quantis podem ser: Quartis divide a distribuio de frequncias em 4 partes iguais. Decis divide a distribuio de frequncias em 10 partes iguais Percentis divide a distribuio de frequncias em 100 partes iguais. Sejam x1 e xn, respectivamente, o menor e o maior valor da varivel considerando o conjunto ordenado. Q1 Q2 Q3

x1

mediana

xn

Q1, Q2 e Q3 representam os quartis da distribuio: 1 quartil o valor da varivel tal que o nmero de observaes para valores inferiores a Q1 25%, e o n de observaes superior a 75%. 2 quartil coincide com a mediana, o que significa que 50% das observaes esto abaixo de Q2 e, pelo menos, 50% esto acima de Q2. 3 quartil o valor da varivel tal que o nmero de observaes para valores inferiores a Q3 75%, e o n de observaes superiores 25%. As frmulas de clculo do Q1 e do Q3 so idnticas da mediana, substituindo respectivamente por e (e os valores na frmula tm de ser adaptados ao

intervalo correspondente ao quartil).

Moda
o valor mais frequente da distribuio ou o valor que mais observaes apresenta no conjunto de dados. Existem conjuntos de dados que no apresentam moda, porque nenhum valor se repete maior nmero de vezes, e existem conjuntos de dados com duas ou mais modas. Se os dados esto agrupados em classes de igual amplitude, a classe de maior

16 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

frequncia chama-se classe modal. Quando as amplitudes so variveis, a classe modal aquela que corresponde ao rectngulo com maior altura do histograma. A moda pode considerar-se o ponto mdio da classe modal. A moda tem algumas vantagens como medida de estatstica descritiva: fcil de calcular e interpretar; No afectada por valores extremos

Mas apresenta uma clara desvantagem: No pode ser definida com rigor

Medidas de Assimetria e Curtose


- Assimetria Este mtodo consiste na comparao das trs medidas de tendncia central: a mdia, a mediana e a moda. Na maioria dos estudos, o conhecimento de uma nica medida pouco adianta para a compreenso do fenmeno. Vejamos que relao existe entre estas trs medidas, quando temos uma representao atravs de um polgono de frequncias. Para ser mais acessvel esta leitura, imaginemos que limvamos as arestas do polgono de frequncias de modo a obter uma linha curva em vez de uma linha quebrada. Podemos resumir em trs casos as diferentes curvas que se podem obter: enviesada para a esquerda (assimtrica negativa)

simtrica

enviesada para a direita (assimtrica positiva)

17 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

De um modo geral:

Curva simtrica

Curva assimtrica positiva

Curva assimtrica negativa

- Achatamento ou Curtose As medidas de curtose do-nos uma indicao da intensidade das frequncias na vizinhana dos valores centrais. Como referncia ao grau de achatamento podemos ter:

Distribuio Leptocrtica

Distribuio Mesocrtica

Distribuio Platicrtica

18 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Para medir o grau de curtose pode ser utilizada a seguinte medida:

Grau de Curtose

Sendo Q1 e Q3 o primeiro e terceiro quartis e P90 e P10 o 90 e 10 percentis. Se K = 0.263 Se K > 0.263 Se K < 0.263 a distribuio mesocrtica; a distribuio platicrtica; a distribuio leptocrtica.

Para obter as medidas descritivas, basta explorar o menu Analyse: Analyse -> Descritive Statistics.

19 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Diagrama de caixa de bigodes


H situaes para as quais a avaliao dos extremos fundamental. Turkey (1977) desenvolveu uma tcnica denominada caixa e bigodes (blox plot) que nos fornece uma indicao clara dos valores extremos, da mesma forma que o histograma e o diagrama de caule e folhas informa como os valores esto distribudos. Da construo deste diagrama depende a determinao das seguintes medidas: Mediana Quartis Distncia entre quartis Valores extremos Este diagrama, tambm denominado por diagrama de extremos e quartis, uma das representaes grficas mais utilizadas na prtica uma vez que fcil de construir e evidencia uma quantidade de informao dos dados, em suma, medidas de localizao, assimetria, curtose e os outliers, como j referimos anteriormente. Este diagrama tanto pode ser apresentado na forma horizontal como vertical. Se o construssemos manualmente deveramos seguir os seguintes passos: 1. Determinar mximo e mnimos 2. Determinar os quartis 3. Desenhar uma rgua graduada e assinalar os pontos anteriormente assinalados. 4. Construir a caixa de bigodes. Partindo do exemplo dos pesos dos alunos de uma turma em que o peso mximo 100 kg e o mnimo 55, seguindo a distribuio ao lado, obtemos a seguinte estatstica descritiva e respectivo Diagrama de caixa e bigodes:

20 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Mximo

Q3 Mediana Q1

Mnimo

No SPSS podemos obt-la em:

A identificao dos outliers, ou seja, dos valores que diferem significativamente do conjunto, feita com recurso a um critrio de distncia. So determinadas distncias, com referencia ao Q1 e Q3, permitindo o clculo das chamadas barreiras internas e externas (superior e inferior). Este critrio permite identificar e classificar se esses valores diferem muito do restante conjunto de dados. Relativamente interpretao a dar caixa de bigodes, de referir: Quanto mais pequena for a caixa, maior a concentrao da distribuio de frequncias (menor disperso) para, pelo menos 50% das observaes. Se Q2-Q1 = Q3-Q2 a distribuio aproximadamente simtrica; Se Q2-Q1 < Q3-Q2 a distribuio aproximadamente assimtrica positiva; Se Q2-Q1 > Q3-Q2 a distribuio aproximadamente assimtrica negativa;

21 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

3. Associao e Correlao
No captulo anterior vimos como caracterizar dados descrevendo uma varivel, no entanto, uma das grandes vantagens na utilizao do SPSS consiste na potencialidade comparar o comportamento de vrias variveis entre si. Assim, caso se pretenda estudar a relao existente entre duas variveis de natureza quantitativa ou qualitativa medida em escala ordinal, recorre-se ao conceito de correlao. Quando as variveis so de natureza qualitativa e esto medidas atravs de uma escala nominal, usual designar-se a relao entre elas por associao. A anlise de correlao linear entre duas variveis X e Y tem por objectivo quantificar a intensidade da relao linear existente entre elas, analisando portanto a sua variao conjunta. Ou seja, a correlao mede o grau de associao linear entre variveis. Existem vrios coeficiente de correlao, que variam em absoluto entre 0 e 1. Quanto mais prximo de 1, mais forte a associao entre as variveis. Se assumir valores positivos, as variveis evoluem no mesmo sentido, enquanto se assumirem valores negativos, variam no sentido inverso. Note-se que a correlao mede apenas o grau de associao entre variveis no constituindo, isoladamente uma prova de causalidade entre as mesmas. Neste captulo iremos estudar os aspectos essenciais acerca de Associao de variveis, e distinguir em que situaes devemos usar os coeficientes de correlao respectivos.

3.1. Diagrama de Disperso


Na representao de uma amostra de n observaes de duas variveis X e Y utiliza-se muitas vezes um diagrama de disperso, este consiste na representao das observaes (xi, ,yi), i= 1, 2, ... n num referencial cartesiano. A disposio das observaes neste grfico pode alertar para a existncia de possveis relaes entre as duas variveis bem como a existncia de eventual valores aberrantes (outliers). Consideremos os seguintes dados acerca das mdias de curso e da mdia horas de estudo respectivas: Mdia curso 14,0 14,5 12,0 14,0 15,0 15,0 14,0 13,0 16,0 17,0 15,0 16,0 12,5 Mdia de horas de estudo 2,0 2,0 1,5 2,0 2,5 3,0 2,0 2,0 3,5 4,0 3,0 4,0 1,5

Podemos construir uma tabela que relacione, ordenadamente as duas variveis:

22 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

E obtemos

No entanto, o diagrama de disperso uma das representaes grficas mais adequadas para analisar graficamente a relao entre estas duas variveis, e nos permite, facilmente concluir, neste exemplo, que medida que aumentam as mdias de curso aumenta o nmero mdio de horas de estudo. Podemos afirmar, nesta situao que existe uma relao

23 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

positiva entre as duas variveis, j que a valores elevados de mdia esto, em mdia, associados valores elevados de mdia de horas de estudo. No entanto, este tipo de diagrama no nos permite quantificar a intensidade desta relao.

24 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

3.2. Covarincia e Correlao


Detectada uma possvel relao linear entre as variveis coloca-se a questo de quantificar a intensidade dessa relao atravs de medidas adequadas. Uma primeira medida de correlao linear denominada por covarincia e definida pela mdia dos produtos dos desvios em relao mdia. Assim, para duas variveis quantitativas X e Y, a covarincia entres elas definida por:

sxy =

1 n xi x yi y n i =1

)(

Pode fazer-se uma interpretao simples da expresso da covarincia a partir do respectivo diagrama de disperso. O seu sinal depende do quadrante em que o para ordenado se encontra no sistema de eixos cartesianos. Como podemos observar na seguinte tabela:

Quadrantes
1 Quadrante

( x x)
i

( y y)
i

( x x )( y y)
i i

+
2 Quadrante

3 Quadrante

4 Quadrante

O sinal da covarincia indica se a relao entre X e Y positiva ou negativa. Se o sinal for positivo, predominam os produtos dos desvios positivos em relao aos negativos e, por consequncia, os desvios tendem a ser ambos positivos ou ambos negativos (Q1 e Q3). Assim, as variveis variam em mdia no mesmo sentido, ou seja, quando uma varivel aumenta a outra tambm aumenta, em mdia, e quando uma varivel diminui a outra tambm diminui, em mdia. Se o sinal for negativo, predominam os produtos dos desvios negativos em relao aos positivos e, por consequncia, os desvios tendem a ter sinais contrrios (Q2 e Q4). Assim, quando uma varivel aumenta a outra tambm diminui, em mdia, e vice-versa.

25 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Quando a covarincia nula, a magnitude dos desvios positivos e negativos igual e, por isso, no existe relao linear entre as variveis.

3.2.1.CoeficientedeCorrelaoLineardePearson
Na avaliao do grau de correlao entre duas variveis, a covariancia apresenta desde logo dois inconvenientes: depende das unidades de medida das variveis, e assume valores no conjunto dos nmeros reais. Atendendo a que a preciso de qualquer medida inversamente proporcional amplitude do intervalo onde a mesma toma valores, podemos concluir que a covarincia uma medida pouco precisa, pois d-nos pouca informao relativamente intensidade de correlao existente entre as variveis. Assim a informao contida na covarincia essencialmente sobre o sinal e no sobre a sua intensidade. Surge assim a necessidade de criar um coeficiente de correlao linear que damos o nome de Pearson, que assume valores no intervalo [-1,1] e no depende das unidades de medida das variveis e que se calcula fazendo:

rx, y =

sxy sx sy

1 n x x yi y n i =1 i 1 n x x n i =1 i

)(

) )
2

1 n y y n i =1 i

Em funo do sinal e do valor absoluto deste coeficiente pode concluir-se sobre a direco e a intensidade da relao existente entre duas variveis quantitativas

Coeficiente de correlao

Concluses

Diagrama de disperso

rx,y = -1

Os pontos esto inscritos numa recta de declive negativo. A correlao linear entre as variveis negativa perfeita. Os pontos esto inscritos numa recta de declive negativo. A correlao linear entre as variveis negativa. Quanto mais prximo de -1 for o valor de rx,y menor a variabilidade dos pontos em torno da recta.

-1 < rx,y < 0

rx,y = 0

A varivel no apresenta relao linear.

0 < rx,y < 1

Os pontos esto inscritos numa recta de declive positivo. A correlao linear entre as variveis positiva. Quanto mais prximo de 1 for o valor de rx,y menor a variabilidade dos pontos em torno da recta.

26 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

rx,y = 1

Os pontos esto inscritos numa recta de declive positivo. A correlao linear entre as variveis positiva perfeita.

3.2.2.CoeficientedeCorrelaoOrdinaldeSpearman
Quando se pretende analisar a correlao entre duas variveis medidas em escala ordinal deve recorrer-se ao Coeficiente de Correlao Ordinal de Spearman, que mede a intensidade da relao entre variveis ordinais. Este coeficiente recorre s ordens de observaes em detrimento dos seus valores observados. O coeficiente de correlao de Spearman pode ser encarado como um caso particular do coeficiente de correlao de Pearson, entre as ordens de observao. O coeficiente de correlao de Spearman mede a intensidade da relao existente entre duas variveis medidas numa escala pelo menos ordinal, e calcula-se da seguinte forma:

rx, y = 1

6 d 2 n n 1

i =1 2

em que

di = o(xi ) o(yi ) e

o(xi ) a ordem da observao xi na amostra o(yi ) a ordem da observao yi na amostra


n o nmero total de observaes Este coeficiente assume valor: 1 quando as observaes tiverem exactamente a mesma ordem, -1 quando tiverem ordem inversa 0 quando as ordens se dispuserem de uma forma aleatria uma relativamente outra.

3.2.3.CoeficientedeCorrelaoBisserialporpontos
O Coeficiente de Correlao Bisserial por pontos mede a intensidade da relao existente entre uma varivel quantitativa y e uma varivel qualitativa dicotmica x, e definido da seguinte forma:

rx, y =
em que

y p yq sy

pq

p=

np n

Proporo de casos com 1, em x, e

n p o nmero de casos de categoria (x=1)

n o nmero toral de casos

27 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

q=

nq n

Proporo de casos com 0, em x, e

n p o nmero de casos de categoria (x=0)

n o nmero toral de casos

y mdia aritmtica de todos os valores de Y


y p mdia, na varivel Y, de todos os casos a que correspondem 1s em X yq mdia, na varivel Y, de todos os casos a que correspondem 0s em X

sy desvio padro dos valores de Y.


Este coeficiente, semelhana do coeficiente de correlao de Spearman, assume os valores:

1 quando as observaes tiverem exactamente a mesma ordem, -1 quando tiverem ordem inversa 0 quando as ordens se dispuserem de uma forma aleatria uma relativamente outra. Interpretao:

rbp > 0 y p > yq existe uma correlao positiva entre Y e a caracterstica medida
como 1 em Y.

rbp < 0 y p < yq existe uma correlao negativa entre Y e a caracterstica medida
como 1 em Y, ou, uma correlao positiva entre Y e a caracterstica medida como 0 em Y.

ParaobterestescoeficientesnoSPSS,bastafazer:

28 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

NOTA:OCoeficienteBisserialporpontosnosecalculadirectamentenoSPSS,maspode facilmenteserobtidoapartirdoBisserial.EoBisserialidnticoacalcularcoeficiente correlaodePearson.

Coeficiente de correlao
Linearde Pearson Ordinalde Spearman Bisserial

Variveis
Quantitativa X Quantitativa Ordinal X Ordinal (pelomenos) Quantitativa X Qualitativa dicotmica

Exemplos
Associaoentreonmerodehorasdetrabalho dedicadoeanotaobtida,medidanumaescalaentre 0e20. AssociaodeumanotamedidapelaEscala(1Mau; 2Suficiente,3Bom,4MuitoBom)eanotanum trabalhomedidopelaescala(A,B,C,D) Associaoentreonmerodehorasqueumgrupo demoraaexecutarcertatarefaeognero

3.3. Associao: Tabelas de Contingncia e Coeficiente de Associao


Quando se pretende estudar a associao existente entre duas variveis medidas em escala nominal ou ordinal, recorre-se aos conceitos de tabela de contingncia (ou de dupla entrada) e de coeficiente de associao. O coeficiente de associao permite quantificar a associao existente entre duas variveis dicotmicas, e o seu clculo baseado numa tabela de contingncia do tipo:

B A 1 2 Totais

1 a c a+c

2 b d b+d

Totais a+b c+d a+b+c+d=n

29 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Designamsepormodalidadesconcordantes(A1,B1)/(A2,B2)epor modalidadesdiscordantes(A1,B2)/(A2,B1): Ocoeficientedeassociao dadopor: ad bc = ( a + b )( c + d )( a + c )(b + d ) Ainterpretaodestecoeficientefeitadaseguinteforma: coeficientedeassociao Concluses -1 < < 1 ExisteumaassociaoentreAeBnas > 0 modalidadesconcordantes Noexisteassociaoentreasvariveis = 0 AeB ExisteassociaoentreAeBnas <0 modalidadesdiscordantes Exemplo: NoMinistriodaEducaoforaminquiridos500indivduosdosquadros tcnicossuperiorese700dosquadrostcnicossobreasnormasde seguranadosrespectivoslocaisdetrabalho.Aopiniodosinquiridos encontraseresumidanaseguintetabela: Opinio So Noso Totais cumpridas cumpridas Quadros 350 150 500 Superiores Quadros 125 575 700 Tcnicos Totais 475 725 1200 Pretendesesabercomoserelacionamequalaintensidadedarelaoentre aduasvariveisconsideradas. Asvariveisso: Opiniosobrenormasdesegurana:variveldicotmica,jques podeassumirdoisvaloresdiferentes(Cumpridasounocumpridas) Quadros:variveldicotmica(Superioresoutcnicos) Porsetrataremdeduasvariveisnominaisedicotmicas,paramedira intensidadedarelaoentreelasvamosutilizarocoeficientedeassociao.
=

( 350 + 150 ) (125 + 575 ) ( 350 + 125 ) (150 + 575 )

350 575 150 125

= 0, 526

Ovalordocoeficientedeassociao0,526,oquesignificaqueexisteumarelao positivaentreaopinioeasnormasdeseguranaeacategoriaprofissional,ou seja,osquadrossuperiorestmumamaiortendnciaemafirmarqueasregrasde seguranasocumpridas.

30 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

UsandooSPSS:
1.Inserirasvariveisecaracterizlasconvenientemente:

NOTA:paraquadroseopiniodeveusaraopoValuesparaindicaras possibilidadesdasvariveis.

31 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

2. Especificarqueavarivelfreqobscaracterizaasfrequnciasobservadas:

3.

ObterocoeficientedeAssociaoatravsdosseguintespassos:

32 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

4.

Obtemosassim:

33 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Confirmandoassim,ovalorobtidoanteriomente,0,526(Phi).

Podemos,ainda,obterumainterpretaomaisaprofunda,seleccionandoem Crosstabs>Cells

34 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Paraobter:

Podemosretiraralgumasconclusesdestatabela: Dos475elementosqueafirmaramqueasnormasdeseguranaso cumpridas,350(73.7%)sodosquadrossuperioreseosrestantes125 (26,3%)sodequadrostcnicos; Dos500elementosdequadrossuperiores350(70%)afirmamqueas normasdeseguranasocumpridase150(30%)afirmamquenoso cumpridas; Dototaldoselementos,1200,575(47,9%)sodequadrostcnicose afirmamqueasnormasdesegurananosocumpridas; Dototaldaselementos,1200,500(41,7%)sodequadrossuperiores.

35 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

4. Testes paramtricos e no paramtricos


Uma ferramenta de extrema utilidade em estatsticas so os testes de hipteses. So muitos os estudos de investigao que recorrem a esta estratgia e torna-se necessrio aprofundar tcnicas de tratamento e anlise dos dados obtidos. Preferencialmente, e quando esto 2 reunidas diversas condies (ver quadro abaixo), so utilizados mtodos paramtricos . Contudo, quando estas condies no esto reunidas, a opo encontrada a utilizao de testes no paramtricos. Os testes incidem explicitamente sobre um parmetro de uma ou mais populaes (por exemplo, sobre a mdia ou valor esperado, ou sobre a varincia); A distribuio de probabilidades da estatstica de teste pressupe uma forma particular das distribuies populacionais de onde as amostras foram recolhidas. Por exemplo, a distribuio da estatstica de teste do teste t-Student para comparar as mdias de duas amostras pressupe que as amostras foram retiradas de uma populao que se distribui segundo uma funo de probabilidades Normal, e alm disso pressupe tambm que as varincias das duas amostras so homogneas. Etc. Os testes no paramtricos no esto condicionados por qualquer distribuio de probabilidades dos dados em anlise, no entanto, no so to potentes como os paramtricos. Geralmente utilizam-se quando as variveis envolvidas so tipicamente qualitativas (nominais ou ordinais) ou, no caso de variveis quantitativas, se encontram afastadas da normalidade e/ou amostras pequenas. Independentemente do teste utilizado ser, ou no, paramtrico, a questo da aleatoriedade da amostra fundamental. Para verificar a forma de distribuio das populaes, a fim de se decidir pela utilizao de um teste paramtrico ou por um teste no paramtrico, podem usar-se os testes de bondade ou qualidade de ajustamento das amostras a funes de distribuio de probabilidades, tais como o teste do qui-quadrado, o teste de KolmogorovSmirnov, teste de Shapiro-Wilk. Alguns dos testes no paramtricos baseiam-se em probabilidades ou em frequncias (Binomial, Qui-quadrado, McNemar) ou de valores centrais (Mann-Whitney, Wilcoxon, Kruskal-Wallis e Friedman), sendo que estes ltimos se baseiam em ordenaes, e no em valores absolutos.

2Estestestes(porexemplotesteststudenteANOVA)noseroobjectodeestudodesta disciplina. 36 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira

Referncias Bibliogrficas Bessa, J. (2006). Folha de Apoio - Iniciao ao SPSS. Aveiro: Universidade de Aveiro [Acessvel em http://www2.dce.ua.pt/leies/pacgi/Folhaapoio1.pdf] Cunha, G.; Martins, M. R.; Sousa, R. & Oliveira, F.F. (2007). Estatstica Aplicada s Cincias e Tecnologias da Sade. Lisboa: Lidel; Martinez, L. F. & Ferreira, A. I. (2008). Anlise de dados com SPSS: Primeiros passos (2ed.). Lisboa: Escolar Editora. Pereira, A. (2006). SPSS Guia Prtico de Utilizao: Anlise de dados para cincias sociais e psicologia. (6 Ed.). Lisboa. Edies Slabo

37 ESETN:Estatstica/TratamentoEstatsticoProf.RaquelVieira