Vous êtes sur la page 1sur 162

TATiSTKY,

Fklb:" APLICADA
Cv; '

CINCIA$
HUMANAS
.1410tR3104
4111,8

t:4

P4R.4 Jack Levin


Northeastern University

Traduvo:
Sa.gio Francisco Costa
de Nst
FA,Adda".:ie de FilOsofia. Cincias e tetras
Siio Caetano do Sul (SP).

UN1VRSU)ADE FEDERAL
VIBLIOThCA CEN1

BARBRA -

EDITORA HARPER &


LTDA. ROW DO BRA 'FL
- Bogota - Mxico - Nova lorque Londres
Sao Paulo
Sidney - So Francisco - Tquio - Nova Deli

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
'
Odip

Este livro deve ser devolvido na


Tombo : f
c)
,--,------)) J.
, 46.4/
040
4Ls
re.
fitett,

ltima data carimbada


Class :
, ' _ t .4,O
C4V),A,,
,
,
hb
, :
,-Ar.
t t 6,
IA
, ,

A Flea, Michael,
Bonnie e Andrea.

k
tO

Superriso I>).
'

Repiseio Maria Lticia G.


Leite
:

Provers ' :
: Maria Elizab th Santo
Maria Pia Ca tiglia
Produceo Grdfica Maria Braga e Jesus
c.

: Progruma
Capa Pr ducoes G:ficas
: Lourdes
Ltda.
impresso Mar ins
: GRAFICA EDITO
ESTATSTICA APLICADA A HAMBURG trim.
A CIENCIAS HU
Copyright 1978, ANAS
pela Editora Harpes
Rua Joaquin] Tivor & Ro do Brasil
663 , Vila Mariana, Ltda,
Rua Castro Alves131, ST. + Telefone: 70-3572,70-4891
49 andar, Liberdade,
S P. -- Telelone:
278-7109
Traduzlo de Elementary '

Statistics
Copyright 0 1977, por Jack Levin.
in Social ReSearch,
2 q, edia'o
Publicado originalmente
nos Estados Unidos
por Harper Row Publishers, .84,
Todos os direiros Inc.
reservados Fica
pareialnitente, sem terininantimente proibido
autorizaciio expressa reproduzir esta obra,
dos Editpres. totai Ou
Impresso no Braql

Printed M Brazil

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
,
<1? 6>0
1.6 '10

.4?
Prefcip
CZ'4,4(
Prefcio Edio Brasileira P_, 0 ,00
1 Por que o Pesquisador usa Estatfstica? 1
`
A natureza da pesquisa /
Por que testar hiperteses? 2
Os estagios da pesquisa 2
O ttso de sries numricas em pesquisa 3
Fun Vies da estatistici 6
Reuino 12

PAIRTE I DESCRIOO 13
2 Orgtinizao de Dados 15
Distribuies de freqncia de d dos nominal
CoMparao das distribuieS
M;t,dbuies dc freqiincias simi es relativas a dado dinais e intervalares
Dist ribuies de freqUncias com dadOs agrupados
Distribuies cumulativas
Posto percentil 27
Resumo
Represent es Gr 351
Grficos setoriais
'Graficos de barras
Polfgonos de freq cias 37/.
Construgo de grficos de arras e de pollgonos de freqncias 39 .

Forma de urna distribuio de freqnncias 40,


Resuino 41

Medicb,s de Tendncia Central 42


Mq..titt 42
igim 43
Mdia aritmtica 45
-Coaiparaco entre m9da, mediana e mdia 47
Clculo da moda, da Mediana e da mdia numa distribuio de freqncias corn
dadoS agrupados 52
Resurno 55

Medids de Variabilidade. 59
Amplitutk total 60
Des.triorn6dio 61

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Desvio padro 63
Comparao en tre amplitu e total, idesvio mdio e d'esvio padro 7/ ;

('lcnlo da amplitude total do desv.lo mdio e do deSvio padro de dadOs


nrupados 72
Resumo 75

PARTE II DA DESCRIO A TOMADA DE DECISOES 79


6 A Curva Normal 81
Caractersticas da curva normal 82
Curvas normais: o modelo e 0 mundo real 82
A Area sob a curva normal $4
Tornando a noo de desvio padro mais clara: uma ilustrao 86
Uso da tabela B 88
Escores padronizados e a curva normal 89
Probabilidade e curva normal 91
Resumo 98

Amostras e Populaes 100


Mtodos-de amostragem 101
Erro amostral 106
Distribuio amostral de mdias .107
Erro padro da mdia 112
lntervalos de confiana .114
Estimativa de propores 119
Resumo 121

PARTE Ill TOMADA DE DECISES 125

8 Testes de Diferen'as entre Mdias 127


Iliptese nula: utio h diferena entre as mdias 127
Hiptese experimental: h diferenga entre as mdias 128
Distribuio amostral de diferenas entre mdias 129
Testes de hipteses relacionados com a distribuio de diferenas 133
Niveis de significiincia 136
Erro padro de diferena 138
Comparaes en tre amostras pequenas 142
Comparaes entre amostras de tamanhos diferentes 146
Comparao de dados resultantes de duas mensuraes temporalmente distintas
da mesma amostra 148
Requisitos para o uso do escore z e da razo t 151
Resumo /51

9 Anlise de Varincia 156


A lgica da anlise de varincia / 7
Somas de quadrados 158
Quadrado mdio 163

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
wo.Avk
34
A estatstica F(razo F) 165 awraorgeA i4f1:
Comparao mltipla de mdias 1 70
Exigncias para o uso da estatstica F(razo F) 1 72
Resumo I 72

10 Qui-quadrado e outros Testes Islo-paramtricos 175


Qui-quadrado: um teste de significncia 1 76
Clculo do qui-quadrado 1 77
Clculo das freqncias esperadas (tericas) 180
FOrmula para o clculo do qui-quadrado de uma tabela 2 X 2 184
Correo de freqncias esperadas pequenas 185
Comparao de vrios grupos 187
Requisitos para o uso do qui-quadrado 192
O teste da mediana 194
Dupla anlise da varincia por postos: x2 de Friedman 197
Anlise da varincia por postos: H de Kruskal-Wallis 200
Resumo 203

11 Correlao 208
Fora da correlao 208
Sentido da correlao 209
Correlao curvilnea 210
Coeficiente de correlao 211
Coeficiente de correlao para dados intervalares 212
FOrmula para o clculo do r de Pearson 215
Anlise de regresso 220
Coeficiente de correlao para dados ordinais 226
Gama de Goodman e Kruskal 232
Coeficiente de correlao de dados nominais dispostos numa tabela 2 X 2 239
Coeficientes de correlao de dados nominais dispostos em tabelas de ordem
superior a 2 X 2 241
Resumo 244

12 Aplicao de Procedimentos Estatsticos a Problemas de Pesquisa 249


Situaes de pesquisa 250
Solues das pesquisas propostas 257

APENDICES 261
Apndice A Reviso de Fundamentos de Matemtica 262
Nmeros decimais 262
Nmeros negativos 265
Clculo de razes quadradas mediante o uso da tabela A 266
Ape-ndice B Tabelas 268
Apendice C Lista de Frmulas 298
Apndice D Classificao de Classes Scio-Econmicas no Brasil 303
Referncias 306
Respostas aos Problemas Pares 304
Indice 308

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Prefcio

0 objetivo de Estatstica Aplicada a Oncias Humanas, segunda edio, igual ao


da primeira edio: oferecer uma introduo Estatstica para alunos da rea de Cin-
cias Humanas (o que engloba campos tais como Sociologia, Poltica, Servio Social,
Psicologia, Administrao, Educao) que no tenham tido a oportunidade de receber
treinamento aprofundado em Matemtica, e que estejam enfrentando seu primeiro curso
de Estatstica. Como antes, este livro ndo tem a inteno de ser um material de referncia
exaustivo; no deve tambm ser tomado como um texto adequado a cursos avanados
de Mtodos Estatsticos. Ao contrrio, foi escrito e revisado com vistas a preencher a
sentida necessidade de um enfoque significativo e compreensvel daquilo que 6 bsico
em Estatstica. Mais uma vez, as ilustraes "passo a passo" dos procedimentos estats-
ticos foram localizadas em pontos estratgicos do texto, alm de terem sido apresen-
tados numerosos problemas, tirados de pesquisas reais.
Como na edio anterior, este volume foi organizado em trs partes: a Parte I
(Captulos 2 a 5) leva o estudante a compreender e a manejar alguns mtodos teis para
a descrio e comparao de dados brutos. A Parte II (Captulos 6 e 7) tem o propsito
de servir de transio, uma vez que leva o leitor do tpico relacionado com a curva
- -
normal importante instrumento descritivo ao primeiro captulo em que essa mesma
curva usada como fundamento para generalizaes (partindo de amostras para popu-
laes). Ainda com o enfoque centrado na tomada de decises, a Parte III (Captulo 8
a 12) contm vrios testes de significncia bem conhecidos, alm de procedimentos para
a obteno de coeficientes de correlao e uma introduo anlise de regresso.
Esta edio apresenta algumas mudanas dignas de nota. Por insistricia de colegas
professores, o Captulo 10 foi substancialmente aumentado para permitir um trata-
mento mais extensivo da(s) estatstica(s) no-paramtrica(s). Alm disso, foram aumen-
tados, esmiuados ou acrescentados os seguintes tpicos: posto percentil, probabilidade,
comparao mltipla de mdias aritmticas, depois anlise de vanncia, coeficiente
gama e r de Pearson. Tendo em mente salientar a aplicao da Estatstica em pes-
quisa, um novo captulo (12) foi acrescentado; quanto s vrias situaes de pesquisa
nele apresentadas, o aluno deve tentar selecionar o procedimento estatstico mais ade-
quado a cada situao. 0 nmero de exerccios no fim de cada captulo tambm foi
aumentado. Finalmente, os ap6ndices foram ampliados com vistas a incluir uma reviso
dos fundamentos de Matemtica e uma lista de frmulas.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
1.
Muitas pessoas contriburam de diferentes formas para o desenvolvimento da se- UNWERSIDADE FEDERAL DO PARA
gunda edio deste livro. A reviso aguad de Kenneth Pollinger em Contemporary BIBLIOTECA CENTRAL
Sociology serviu de base para vrias melhorias e adies. Agradeo a Richard Sprinthall
e seus alunos do American International College (particularmente a Lynn Arnold, Cheryl
Janes, Jim Lynch, Claire Nolen e Gary Zera) por terem-me alertado quanto existncia
de alguns erros ou fontes de interpretao errnea na edio anterior. Meus agradeci-
Prefcio
mentos especiais as seguintes pessoas pelas leituras crticas que fizeram das minhas revi-
ses: GeOrge Bowlby, James Elliot, Roy Hansen, C. Lincoln Johnson, Carol Owen,
Lawrence Rosen, Norman Roth, Ellen Bouchard Ryan e Larry Siegel. Tambm agradeo
Edio Brasileira
a Suzanne Johnson e Michael Weissbuch pelos comentrios e sugestes espontneas. Fi-
nalmente, uma palavra d agradecimento ao responsvel pelo Patrimnio Literrio do
falecido Sir. Ronald A. Fisher, F.R.S., a Frank Yates, F.R.S e a Oliver & Boyd, Edinburgh,
pela permisso para reimprimir as Tabelas III, IV, V e VI do seu livro Statistical Tables
for Biological, Agricultural and Medical Research.

Jack Levin Estatistica Aplicada a Ciencias Humanas um livro comparvel a "corao de


me": d muito e exige pouco!
-
Mais do que lucidez e experincia detectveis no s a partir das explicaes no
texto como tambm da escolha bibliogrfica criteriosa que embasou seu trabalho o -
l'rof. Jack Levin teve a coragem de escrever um livro supersimplificado - como se sua
clientela consumidora tivesse parcos conhecimentos de Matemtica. Sua coragem, repita-
-se, est muito mais em fazer algo, tomar a iniciativa de escrever este livro, do que na
simples admisso dessa hiptese, que, quando mais no seja, dove dizer-lhe a longa pr-
ica, verdadeira numa proporO alarmante!
Escrito numa linguagem amena e quase despojado do jargo matemtico, Estats-
tica Aplicada a Ciencias Humanas destina-se a um pblico muito especfico: estudantes
de Cincias Humanas, refgio errneo dos que fogem das equaes e dos clculos, pois
que, embora "humanas" -e -
talvez por isso mesmo no podem prescindir das to
odiadas quantificaes! Com a traduo que ora vai a pblico, procurou-se, sem perder
de vista o carter elementar que o livro deve manter, enriquec-lo um pouco, custa de
notas de rodap, talvez desnecessrias num primeiro contato com a Estatstica, mas sem
dvida proveitosas em revises posteriores.
No original, o Autor grifou muito menos palavras ou sentenas: a abundncia de
grifos, na traduo, foi uma tentativa visual de chamar a ateno do leitor para aspectos
relevantes do texto.
0 temor de que possa pairar a mais leve dvida sobre o discernimento e saber do
Prof. Levin obriga a que se diga o seguinte: transpira, evidente, em todo o livro, a inten-
gab clara de levar o aluno ao raciocnio estatstico atravs de exemplos tirados do dia-a-
-dia, por isso, talvez, menos refinados, mas seguramente mais prximos de seu universo
cognitivo.
Que o nome de Levin possa, atravs desta contribuio, ganhar lugar de destaque
entre os estudiosos brasileiros.

So Paulo, julho de 1978


PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Srgio Francisco Costa
1
Por que o Pesquisador
usa Estatistica?
Todos ns temos um pouco de cientista. Quase que diariamente, temos "palpites"
com relao a acontecimentos futuros em nossas vidas, a fim de prever o que acon-
tecer em novas situaes ou experincias. medida que essas situaes ocorrem,
podemos, As vezes, confirmar ou sustentar nossas_idias; outras vezes, entretanto, no
temos tanta sorte e, por isso, acabamoi-experimentando consegtincias Jlesagradveis.
Tomemos alguns exemplos familiares: poderamos investir na bolsa de valores,
votar em algum candidato que prometesse resolver os problemas nacionais, jogar nos
cavalos, tomar um remdio para reduzir os incmodos de um resfriado, jogar dados
num cassino, tentan"adivinhar" o que nossos examinadores iro perguntar nos exames
ou acertar (As cegas) um encontro com uma garota desconhecida, marcado atravs de
um amigo.
s vezes, ganhamos; As vezes, perdemos. Desse modo, poderamos fazer um belo
investimento na bolsa, mas reconhecer que no fizemos a escolha do melhor candida-
to; poderamos ganhar no cassino, mas descobrir que tomamos o remdio errado para
nossa doena; conseguir aprovao nos exames, mas penar na companhia arranjada pelo
amigo; e assim por diante. verdade kque,_ilgelizmente, nem todas as nossas previsaes_
acabamtornando realidade.

A NATUREZA DA PESQUISA
De modo mais ou menos semelhante, o cientista tem jdias sobre a natureza da reali-
dade(idias que ele denomina hiptaes) e freqentemente lesta suas ideias atravs
de_pesquisa sistemAtica Por exemplo, ele poderia levantar a hiptese_ de que crian-
yas socialmente isoladas agsistem mais televiso do que crianas bem integradas
em seus grupos-e, a partir da, fazer um levantamento em que fossem feitas perguntas
tanto As crianas socialmente isoladas, quanto As crianas bem integradas com relao
ao nmero de horas que elas passam diante do video. Ou, ele poderia levantar a hiptese
de que a familia constituda por um s genitor (me ou pai ausente) gera maior delin-
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Por que o Pesquisador usa Estatstica?
2 Por que o Pesquisador usa Estatstica?
1. o problema a ser estudado reduzido a urna hiptese testvel* (por exemplo:
qencia do que a famlia constituda por ambos os genitores (me e pai presentes); "famlias de um genitor produzem mais delinqncia que famlias de dois
ento, o pesquisador poderia entrevistar amostras de delinqentes e no-delinqentes genitores");
que procedessem de famlias de ambos os tipos. 2. um conjunto de instrumentos adequado desenvolvido (por exemplo, so ela-
Desse modo, semelhana do que ocorre nas ciacias fsicas, o cientista social
borados um questionrio ou esquema de uma entrevista);
freqentemente faz pesquisas para aumentar seu cabedal dos problemas e suas conse- dados so coletados (isto , o pesquisador pode ir a campo e fazer uma conta-
qncias em seu campo de estudos. A pesquisa assume muitas formas e pode ser gem ou um inqurito);
usada para investigar uma srie-enorme de problemas. 0 pesquisador pode, na qualidade (\4. os dados so analisados em cotejo com as hipteses iniciais; e
de observador participante, trabalhar com grupos de delinqentes; pode tambm traba-
5. os resultados da anlise so interpretados e comunicados ao pblico, por exem-
lhar num levantamento amostral de suas tendncias polticas, ou fazer uma anlise de
plo, por meio de conferncia ou publicao.
valores em folhetos politicos; ou, ainda, realizar um experimento a fim de determinar os
efeitos do remanejamento de moradias em indivduos atingidos por4esaliroptragiies Como veremos nos captulos subseqentes, o material apresentado neste livro
trata com maior profundidade daqueles aspectos da pesquisa relacionados com a anlise
de dados (ver 4, acima), os quais, depois de colecionados ou recolhidos pelo pesquisa-
POR QUE TESTAR HIPTESES? dor, so analisados luz das hipteses iniciais. nesse estgio da pesoisa..que_os_slados_
A.

, de modo geral, desejvel-para no dizer necessrio-testar sistematicamente nossas cakulados, contados, resumidos, reclassificados, comparados ou,
hipteses sobre a nattireia da realidade, mesmo aquelas que parecem verdadeiras, numa palavra, organizados, a fim de que a preciso ou a validade de nossas hipteses
em
lgicas otLevidentes. Os nossos "testes" de bom senso dirio geralmente baseiam-se possam ser testadas.
idias pr:concehidas muito estreitas, se no tendenciosas, e em experincias pessoais, o

que pode levar-nos a aceitar concluses no vlidas a respeito da natureza dos fenme-
nos. Para demonstrar esse ponto, vamos examinar as seguintes hipteses, que fo- 0 USO DE SRIES NUMRICAS EM PESQUISA
ram testadas com um grande nmero de soldados durante a Segunda Guerra Mundial.
Qualquer pessoa que j tenha feito pesquisa sabe os problemas que surgem
Voc teria sido capaz de prever estes resultados com base em suas experincias dirias?
na anlise dos dados devem ser seriamente confrontados na fase de planejamento (da
Voc acha que valeu a pena test-las? Ou ser que etas parecem to bvias e evidentes
pesquisa), uma vez que de seu significado depende a natureza de decises em fases
que dispensam pesquisas sistemticas?
posteriores. Tais problemas amide afetam no s aspectos do delineamento da pes-
1. Homens de nvel educacional mais alto apresentaram maior quantidade
de
instruo. quisa** como tambm a escolha dos tipos de instrumentos utilizveis na coleta de da-
sintomas psiconeurticos do que aqueles que haviam recebido menos dos. Por esta razo, buscamos constantemente tcnicas e mtodos que permitam melho-
du-
2. Homens procedentes do meio rural mantiveram-se mais bem-humorados_
meios urbanos. rar a qualidade da anlise dos dados.
rante o perodo de guerra do que os soldados recrutados nos Muitos pesquisadores acham que essencial fazer mensurao ou empregar uma
3. A capacidade dos soldados procedentes do Sul para suportar o clima
quente
do Norte. srie de nmeros na anlise dos dados. Por isso, os pesquisadores desenvolveram me-
das Ilhas dos Mares do Sul era maior que a dos soldados vindos
ansiosos para didas*** para urna grande variedade de fenmenos, tais como: prestgio ocupacional,
4. medida que a guerra prosseguia, os homens sentiam-se mais atitudes polticas, autoritarismo, alienao, anomia, delinqncia, classe social, pre-
retornar aos Estados Unidos do que aps a derrocada dos alemes. conceito, dogmatismo, realizao, etnocentrismo, vizinhana, religiosidade, ajustamento
Se voc acredita que essas relaes eram to bvias que qualquer teste sistemtico conjugal, mobilidade ocupacional, urbanizao, status sociomtrico, fertilidade etc.
teria sido dispensvel, saiba que cada item "representa a concluso oposta ao que real- Os nmeros trn pelo menos trs funes importantes para o pesquisador, depen-
mente se verificou.. Soldados parcamente educados neurotizaram-se mais do que os dendo do nvel de mensurao especfico que ele empregue. Especificamente, uma
que receberam boa educao; os sulistas no demonstraram maior habilidade que os srie de valores pode ser usada
nortistas em adaptar-se a um clima tropical; ... e assim por diante."' Ficar apenas na 1. para categorizar ao nvel de mensurao denominado nominal,
dependncia do bom senso ou da experincia do dia-a-dia tem seus limites!
* N.T.: Reduzir um problema a uma hiptese testvel significa definir o problema e a(s) hiptese(s)
OS ESTGIOS DA PESQUISA em termos operacionais. Uma definiao operacional explicita comportamentos observveis (direta ou
Testar sistematicamente nossas idias sobre a natureza da realidade muitas vezes requer indiretamente).
uma pesquisa cuidadosamente planejada e executada, onde: ** N.T.: 0 ideal ter a sido conservar a palavra "design". HA quem prefira "modelo" ou mesmo
"desenho".
Paul Lazarsfeld, "The American Soldier-An Expository Review", Public Opinion Quarterly, *** N.T.: Na verdade, desenvolveram "processos de mensurao".

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
outono de 1949, pg. 380.
Por que o Pesquisador usa Estatatica?
4 Por que o Pesquisador usa Estatstica?
propsito de agrupar os sujeitos em categorias separadas para indicar similitude ou
postos ou ordem ao nvel de mensurao denominado ordinal e
2. para atribuir diferena com referncia a uma dada qualidade ou caracterstica.
3. para avaliar ao nvel de mensurao denominado intervalar.
Antes de prosseguir com a discusso do papel da Estatstica na pesquisa vamps TABELA 1.1 Atitudes de Dez Estudantes Universitrios com Relao a "Neutralianos": Dados
parar aqui para examinar algumas caractersticas mais importantes desses nveis de Nominais
mensurao, caractersticas que, mais adiante, assumiro grande importancia ao tentar- Atitude corn Relao aos "Neutralianos" Freqiiincia
mos aplicar tcnicas estatsticas a determinadas situaes de pesquisa.
1 = Preconceituosos 5
Nvel Nominal 2 = No-preconceituosos 5
0 nvel nominal de mensurao envolve simplesmente o ato de nomear ou rotular; em_ Total 10
outras palavras, consiste em colocar indivduos* em categorias e contar a freqncia
com que ocorrem. Para ilustrar, poderamos usar uma medida de nvel nominal para -
indicar se cada respondente tem ou no preconceito com relao a determinado grupo Nvel Ordinal
social ("Neutrlia"). Como demonstra a Tabela 1.1, poderamos submeter 10 alunos de Quando o pesquisador vai alm desse nvel de mensurao e procura ordenar seus
determinada classe a um questionrio e verificar que 5 podem ser considerados "precon- sujeitos em funo do grau que apresentam de determinada caracterstica, ele est
ceituosos" (= 1) enquanto que 5, "no-preconceituosos" (= 2). irabalhando no nvel ordinal de mensurao. A natureza da relao entre categorias
Outras medidas de nvel nominal em pesquisa so: sexo (masculino versus ordinais depende da caracterstica que o pesquisador procura medir. Para citar um
feminino); classe scio-econmica (alta e baixa), partido poltico (ARENA e MDB), exemplo familiar, ele poderia classificar indivduos com referncia a status scio-eco-
carter social (voltado "para dentro" e tradicional), modo de adaptao (conformismo, nmico e disp-los em "classe baixa", "classe mdia" e "classe alta". Ou, em lugar
inovao, ritualismo, fuga, rebeldia), orientao no tempo (presente, passado e futuro), de categorizar os alunos de uma dada classe em preconceituosos ou no-preconceituosos,
urbanizao (urbano, rural e suburbano)-para mencionar algumas. ele poderia classific-los de acordo com o grau de preconceito contra os "neutralianos",
trabalhar com dados nominais, devemos ter em mente que cada sujeito deve A semelhana do que vai indicado na Tabela 1.2.

ser colocado em uma-e somente uma-categoria. Este requisito indica que as categorias 0 nvel ordinal de mensurao fornece informaes sobre a ordenao das cate-
no devem sobrepor-se, isto , devem ser mutuamente excludentes." Desse modo, a gorias, mas no indica a Aagnitude das diferenas entre os valores. Por exemplo, o
raa de um respondente no pode ser simultaneamente classificada em "branca" e pesquisador que emprega uma medida de nvel ordinal para estudar a varivel pre-
"preta"; qualquer respondente que seja classificado como "macho" no pode ser tam- conceito no sabe quanto um respondente mais (ou menos) preconceituoso que
bm classificado como "fdmeo". 0 requisito implica tambm o fato de que as catego- outro. No exemplo dado acima, no possvel determinar quanto Adriana mais
rias devem ser exaustivas-ou seja, deve haver um lugar_ especfico para cada suieito preconceituosa do que Maria ou quo menos preconceituosa Roberta corn relao a
experimental que aparea. A ttulo de ilustrao, imagine um estudo em que todos os Patrcia ou Pedro. Isto ocorre porque os intervalos entre os pontos ou postos numa
respondentes sejam entrevistados e categorizados por raa, como brancos ou negros. escala ordinal, no so conhecidos ou, melhor dizendo, dotados de significado. Portanto,
Onde que colocaramos um respondente chinds na hiptese de surgir um? Neste caso, no possvel atribuir valores a sujeitos localizados em diferentes pontos da escala.
poderia tornar-se necessrio ampliar as categorias originais e incluir "orientais" ou, TABELA 1.2 Atitudes de Dez Estudantes Universitrios com Relao a "Neutralianos": Dados
ento, admitindo-se que a maioria dos respondentes ser de raa branca (ou de raa Ordinais
negra), incluir a categoria "outros", onde tais excees possam ser colocadas.
Aluno Posto
0 leitor deve observar que os dados nominais nab so graduveis, ordenveis ou
escalonveis relativamente a qualidades tais como melhor ou pior, mais alto ou mais
Adriana
baixo, mais ou menos. Obviamente, ento, uma medida nominal de sexo no significa 1 mais preconceituosa (primeiro posto)

que os machos sejam "superiores" ou "inferiores" s fmeas. Os dados nominais so


Maria 2 - segundo
Benito 3 - terceiro
simplesmente rotulados, As vezes por nome (macho versus femea, preconceituosos Jos 4 - quarto
versus no-preconceituosos), outras vezes por nmero (1 versus 2), mas sempre com o Ctia 5 - quinto
Geraldo 6 - sexto
Filipe 7 - stimo
* N.T.: comum usarem-se em pesquisa os termos "sujeito", "indivduo", "caso" sinonimamente. Pedro 8 - oitavo
Alm disso, no h necessariamente aluso a "pessoas" quando se usam os termos
"sujeito" ou
Patrcia 9 - nono
"indivduo". A idia bsica sujeito experimental. Roberta 10 - menos preconcertuosa
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
** N.T.: comum a expresso "mutuamente exclusivo".
6 Por que o Pesquisador usa Estatstica? Por que o Pesquisador usa Estatstica? 7

Nvel Intervalar
Em contraposio, o nvel intervalar de mensurao orienta-nos relativamente, or,dem Para chegar a concluses ou obter resultados, o pesquisador geralmente estuda cen-
das categorias, bem como indica-nos a distncia exata entre elas. Escalas iiire)rvala- tenas, milhares ou mesmo quantidades ainda maiores de pessoas ou grupos. Como
res implicam unidades constantes de medida (por exemplo: cruzeiros-ou centavos, um caso extremo, consideremos o trabalho do "United States Bureau of the Census"
graus Fahrenheit ou centgrados, metros ou centmetros, minutos ou segundos), as (Servio Norte-americano de Recenseamento) na enumerao exaustiva de toda a
(Timis comportam intervalos iguais entre os vrios pontos da escala. populao dos Estados Unidos, para o que mais de 200 milhes de sujeitos foram
Desse modo, uma medida intervalar de preconceito contra os "neutralianos"-por entrevistados. Apesar da ajuda de numerosos procedimentos sofisticados idealizados
exemplo, as respostas a uma srie de perguntas sobre esses sujeitos avaliadas numa escala para a tarefa, descrever e resumir a enorme quantidade de dados que se origin= de
de 0 a 100 (o mximo de preconceito correspondendo a 100)-poderia fornecer dados projetos de pesquisa social sempre um trabalho de propores astronmicas.
como os que constam da Tabela 1.3 sobre os dez estudantes numa dada sala de aula. Para dar um exemplo familiar, as notas de exame de uma classe de apenas 80
Como bem demonstra a Tabela 1.3, agora podemos ordenar os alunos em termos de alunos foram catalogadas na Tabela 1.4. Percebe-se algum padro nessas notas?
seus preconceitos e, alm disso, indicar as distancias que separam uns dos outros. Por Poder-se-ia descrev-las em poucas palavras? Ou em poucas sentenas? De modo geral,
exemplo, possvel dizes que Roberta a menos preconceituosa da classe, uma vez que seriam elas particularmente altas ou baixas?
ela recebeu o escore baixo. Podemos dizer tambm que Roberta apenas ligeira-
mente meniis preconceituosa que Patrcia ou Osvaldo, mas muito menos preconceituosa TABELA 1.4 Notas de Exame de 80 Alunos
es,$)
do que Adriana, Maria, Benito ou Jos, os quais receberam valores (escores) extrema-
mente altos. Dependendo do propsito para o qual o estudo foi concebido, seria impor- 72 83 91 29 dtb
e."0I?
<9
tante determinar tais informaes, as quais, entretanto, no estariam disponveis no 38 89 49 36
AN
43 60 67 49
nvel ordinal de mensurao. 0fr`
81 52 76 62
1
79 62 72 31
TABELA 1.3 Atitudes de Dez Estudantes Universitrios -,com Relao a "Neutralianos": Escala c
71 32 60 73
Intervalar 65 28 40 40
59 39 58 38
90 49 52 59
Aluno Escorea 60
83 48 68
39 65 54 75
Adriana 98 42 72 52 93
Maria 96 58 81 58 53
Benito 95 56 58 77 57
Jos 94 72 45 88 61
Ctia 22 63 52 70 65
Geraldo 21 49 63 61 70
Filipe 20 81 73 39 79
Osvaldo 15 56 69 74 37
Patrcia 11 60 75 68 46
Roberta 6

a Escores mais altos indicam maior preconceito.


Ainda que se usem os mais rudimentares princpios de estatstica descritiva-da
maneira como so apresentados nos captulos subseqentes deste livro- possvel
FUNES DA ESTATNTICA caracterizar a distribuio de notas de exame da Tabela 1.4 com bastante clareza e
quando o pesquisador usa nmeros-quando ele quantifica seus dados no nvel preciso, de sorte que as tendncias gerais ou as caractersticas grupais possam ser mais
de mensura nominal, ordinal ou intervalar-que ele muito provavelmente emprega rapidamente descobertas e mais facilmente comunicadas a quase todas as pessoas.
a Estatstica como um instrumento de (1) descrio ou de (2) deciso. Vamos agora Primeiro, poderamos reagrupar as notas em ordem decrescente (da mais alta para a
examinar mais de perto essas importantes funes da Estatstica. mais baixa), a fim de reuni-las num nmero bem menor de categorias. Essa distribuio
agrupada (condensada) de freqncias, tal como figura na Tabela 1.5 (e que ser discuti-
* N.T.: Escore significa "nota", "valor", "medida", conforme o caso. da minuciosamente no Captulo 2), apresentaria as notas "encaixadas" em categorias
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
8 Por que o Pesquisador usa Estattstica?
Por que o Pesquisador usa Estattstica?

(classes) mais abrangentes, juntamente com o nmero ou a freqncia (f) de alunos tua-se entre 50 e 80, enquanto que as notas muito mais altas ou baixas so relativamente
cujas notas cassem nessas categorias.
poucas.
Pode-se prontamente observar, por exemplo, que 17 alunos receberam notas entre
No Captulo 4 ser apresentado um mtodo estatstico que particularmente
60 e 69, enquanto que somente 2 alunos receberam notas entre 20 e 29.
conveniente e til. Trata-se de algo com que j estamos mais ou menos familiarizados
Outro procedimento til (explicado no Captulo 3) seria reagrupar os dados grafi- e que consiste em perguntar: Qual a nota mdia desse grupo de 80 estudantes? A mdia
camente. Tal como ilustra a Figura 1.1, poderamos localizar as categorias (classes) de aritmtica (ou simplesmente mdia), que se obtm pela diviso da soma de todas as
notas (de 20-29 a 90-99) ao longo de um dos eixos do grfico (isto , a linha de base, notas pelo nmero de alunos, d-nos uma idia mais clara da tendncia geral do grupo.
horizontal) e o nmero delas (categorias), ou seja, as freqncias, ao longo do outro A mdia aritmtica do exemplo em questo de 60,5, nota bastante baixa se comparada
eixo (vale dizer: o eixo vertical). com outras mdias de classe com as quais a maioria dos alunos j est familiarizada.
Aparentemente, esse grupo de 80 alunos saiu-se relativamente mal como um todo.
TABELA 1.5 Notas de Exame de 80 Alunos: Distribuio Agrupada de Freqncias
Assim, com o auxlio de recursos estatsticos, tais como distribuies condensadas
Notas de freqncias, grficos e mdias aritmticas, possvel detectar e descrever modelos ou
tendncias em distribuies de valores (por exemplo, as notas da Tabela 1.4), o que
90-99 3
poderia ter passado despercebido pelo observador no preparado. Neste contexto, ento,
80-8 9 7 a Estatstica pode ser definida como um conjunto de tcnicas para a redudo de dados
70-7 9 16 quantitativos (ou seja, uma srie de nmeros) a um nmero menor de termos descritivos
60-69 17 que sejam mais convenientes, e facilmente comunicdveis.
50-59 15
40-49 11
30-39 9
Tomada de Decisties
20-29 2 Quando o propsito testar hipteses, muitas vezes necessrio ir alm da mera descri-
o. tambm geralmente necessrio fazer inferncias, isto , tomar decises com base
em dados colhidos de uma amostra, o que quer dizer: estudar apenas uma pequena
porciro de um grupo maior-que, por seu turno, representa o centro de interesse para
estudo. Custo, tempo e necessidade de superviso adequada so fatores que muitas vezes
15 -
_
impedem uma enumerao completa ou rol do grupo todo (grupo que os pesquisadores
chamam populaeo ou universo).
Como veremos no Captulo 7, todas as vezes que o pesquisador testa suas
hipteses numa amostra, ele precisa decidir se de fato acertado generalizar suas desco-
o
<CL)
10 -
_ bertas para toda a populao da qual a amostra foi tirada. Inevitavelmente surgem erros
o de amostragem, mesmo quando esta tenha sido convenientemente planejada e executa-
da. Este o problema da generalizao ou inferncia da amostra para a populao.2

5 - 2
Observagro para o leitor. O conceito de "erro amostral" (de amostragem) vai ser discutido com
maior profundidade no Captulo 7. Todavia, a fim de entender melhor o problema da inevitabilidade
de erro ao amostrar* de um grupo maior, o leitor pode querer desenvolver o seguinte experimento.
Use a Tabela 1.4 (como fonte de referncia) a qual contm as notas de uma populao de 80 alunos.
0 Aleatoriamente (por exemplo, feche os olhos e escolha com o dedo), selecione uma amostra de
20-29 30-39 40-49 50-59 60-69 70-79 80-89 90-99 algumas notas (por exemplo, 5) da lista toda. Procure a nota mdia somando os valores sorteados e
Classes (Categorias) de Notas
dividindo o resultado por 5, que equivale ao nmero total de mdias. d foi mencionado que a nota
mdia para toda a classe (80 alunos) era 60,5. Em que medida a mdia da sua amostra difere da
mdia da classe toda (60,5)? Faa este experimento usando vrias outras amostras de notas selecio-
FIGURA 1.1 Notas de Exame de 80 Alunos Dispostas num Grfico de Barras nadas ao acaso-e sempre sorteadas do mesmo grupo (de 80 alunos). Com significativa perseverana
voc verificar que a sua mdia amostral vai diferir quase sempre, pelo menos um pouco, da mdia
obtida para o grupo todo. essa diferena, isto , a diferena entre a mdia da populao (80 alunos)
Essa disposio tem como resultado uma representao grfica facilmente visuali-
e cada uma das mdias amostrais encontradas que se chama "erro amostral".
zada (por exemplo, o grfico. de barras), onde podemos ver que a maioria das notas si- N.T.: "Amostrar" um neologismo empregado em Estatstica para significar "colher urna amostra".
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
10 Por que o Pesquisador usa Estatstica?
,Por que o Pesquisador usa Estatstica? 11

A Estatstica pode ser muito til quando o propsito do pesquisador generalizar


verdadeiras? Ou ser que obtivemos diferenas casuais entre alunos e alunas em virtu-
suas descobertas a partir de amostras pequenas para populaes maiores-com um alto
de-estritamente-de erro amostral, ou seja, do erro que ocorre todas as vezes que
grau de segurana. Para ficar mais bem entendido o propsito da Estatstica como
retiramos de um grupo maior um grupo menor (amostra)?
instrumento de tomada de decisgo e ainda o conceito de generalizao de amostras para
Para ilustrar o problema da generalizao de resultados amostrais em funso das
populaes, vamos examinar os resultados de um estudo hipottico que foi realizado
respectivas populaes, vamos imaginar que os pesquisadores tivessem obtido os resul-
para testar a seguinte hiptese:
tados da Tabela 1.7. Observe que tais resultados mantm-se na dirego prevista: 55
Hiptese: A probabllidade de estudantes universitrios do sexo masculino terem expe- alunos em oposigo a apenas 45 alunas j experimentaram maconha. Ora, o nosso
rimentado maconha e maior que a probabilidade de estudantes do sexo problema no ainda o de generalizar esses resultados para o grupo maior, vale dizer,
feminino terem feito o mesmo. a populao universitria? No ser possvel que uma diferena dessa magnitude (10
alunos mais que alunas) tenha ocorrido simplesmente por acaso? Ou ser que podemos
Os pesquisadores decidiram, neste estudo, testar sua hiptese numa universidade dizer com confiana que tais diferenas "pequenas" refletem uma diferena real entre
urbana na qual cerca de 20.000 estudantes estavam matriculados (10.000 do sexo alunos e alunas daquela determinada universidade?
masculino e 10.000 do sexo feminino). Em virtude do custo e de fatores ligados a
tempo, eles ngo puderam entrevistar todos os estudantes da universidade, mas obtive- TABELA 1.7 Uso de Maconha em Funo do Sexo do Respondente. Caso II
ram da secretaria uma lista completa de todos os alunos. Dessa lista, cada centsimo
aluno (metade do sexo masculino, metade do sexo feminino) foi selecionado para Sexo dos Respondentes
fazer parte da amostra, sendo subseqentemente entrevistado por membros da equipe
Uso de Maconha Alunos Alunas
de pesquisa que tinham sido treinados para este propsito. Os entrevistadores pergun-
taram a cada um dos 200 sujeitos da amostra se ele ou ela tinha alguma vez experi-
Nmero de estudantes
mentado maconha, anotando em seguida o sexo do respondente. Depois de terem que experimentaram 55 45
sido completadas todas as entrevistas e remetidas para o escritrio central, os resul- Nmero de estudantes
tados do estudo foram tabulados por sexo e apresentados conforme a Tabela 1.6. que no experimentaram 45 55
Observe que os resultados obtidos nesta amostra de 200 estudantes, tal como Total 100 100
figura na Tabela 1.6, tm a seguinte direo hipottica: de cada 100 alunos, 60 decla-
raram que experimentaram maconha, enquanto que, com relao As alunas, esse nmero
cai para 40 em cada 100. Obviamente, nessa pequena amostra, havia maior probabili- Vamos levar este exemplo um passo mais adiante. Suponham que os pesquisa-
dade de os sujeitos do sexo masculino terem experimentado maconha do que os de dores tivessem obtido os dados constantes da Tabela 1.8. A as diferenas entre rapazes
e moas no poderiam ser muito menores e prevaleceria ainda a direo estabelecida na
TABELA 1.6 Uso de Maconha em Funo do Sexo do Respondente. Caso I hiptese: 51 rapazes em contraste com 49 moas experimentaram maconha-o clue
implica uma diferena de apenas 2 sujeitos a mais do sexo masculino. Quantos de As
Sexo dos Respondentes estaramos dispostos a chamar esta descoberta de diferena populacional verdadeira, 3in
Uso de Maconha Alunos Alunas lugar de produto do acaso ou erro amostral?

Nmero de estudantes TABELA 1.8 Uso de Maconha em Funo do Sexo do Respondente. Caso III
que experimentaram 60 40
Nmero de estudantes
Sexo dos Respondentes
que no experimentaram 40 60
Uso de Maconha Alunos Alunas
Total 100 100

Nmero de estudantes
sexo feminino. Para os nossos propsitos, entretanto, a questo mais importante que experimentaram 51 49
saber se essas diferenas de sexo ligadas ao uso de maconha so grandes o suficiente para Nmero de estudantes
que possamos, com confiana, generaliz-las para uma populao universitria muito que no experimentaram 49 51
maior de 20.000 alunos. Ser que tais resultados representam diferenas populacionais Total 100 100
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
12 Por que o Pesquisador usa Estatestica?

Ento, onde se situa a linha divisria? Em que ponto (ou em que momento) uma
diferena amostral torna-se suficientemente grande para scr tratada como significante
ou real? Com o auxlio da Estatstica podemos de pronto e com alto grau de confiana, UNIVERSIDADE 77.0 TIM_ DO
tomar tais decises sobre as relaes existentes entre amostras e populaes. Para B BLIOTEC A CENT
ilustrar: se tivssemos usado um dos testes de significtincia discutidos mais adiante
(por exemplo, qui-quadrado-ver Captulo 10), teriamos sabido que somente aqueles
resultados que aparecem na Tabela 1.6 poderiam ser generalizados para a populao
de 20.000 estudantes universitrios, o que equivalo a dizer que se de cada 100 alunos
60 j usaram maconha, e se de cada 100 alunas 40 fizeram o mesmo, tal descoberta
substancial o suficiente para ser extrapolada para a populao toda com um alto
grau de confiana. O nosso testa estatstico dlz-nos que h somente 5 possibilidades
em 100 de estarmos errados! Em contrapartida, os resultados apresentados nas Tabelas
1.7 e 1.8 so estatisticamente ndo-significantes, de sorte que resultam muito mais de
erro amostral do que de diferenas de sexo no uso dessa substncia. Usando um critrio
estatstico mais uma vez, podemos concluir quo eases resultados nab refletem diferenas
populacionais verdadeiras, e sim, meros erros amostrais.*
No presente contexto, portanto, Estaastica um conjunto de tcnicas para a
tomada de decises que auxiliam os pesquisadores na tarefa de fazerem inferncias de
amostras para populaceies e, a partir da, nos testes das hipteses levantadas sobre a
natureza da realidade.
PARTE I
RESUMO
Este captulo "juntou" nossas previses dirias sobre acontecimentos futuros com as
experincias do pesquisador, que usa a Estatstica como um recurso para teStar suas
Descrio
hipteses a respeito da natureza da realidade. A mensurao foi discutida em termos
de dados nominais, ordinais e intervalares. Foram identificadas, com a anlise de dados
(e resumidamente discutidas e ilustradas), as duas seguintes funes bsicas da Esta-
tstica:
1. descrio (isto , reduo de dados quantitativos a termos descritivos mais
convenientes e em menor nmero) e
2. tomada de decises (ou seja, inferncias de amostras para populaes).

* N.T.: No confundir ideal com real. 0 ideal seria ?brio cometer erros; na realidade, por maiores que
sejam os controles, erros casuais sempre ocorrem. praticamente impossvel evitar erros amostrais.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
2
Organizao de
Dados

A coleta de dados envolve um srio esforo da parte do pesquisador interessado ert.

aumentar seu conhecimento do comportamento humano. Para entrevistar ou, por ou'
eliciar informaes de um grupo de beneficirios da previdncia, de estudantes unitcr-
sitrios, de viciados em drogas, de moradores de penses, de homossexuais, de norte-
-americanos da classe mdia ou de respondentes de outras categorias, tornam-se necrs-
srios certo grau de previsao, planejamento cuidadoso, controle, alm do tempo desprn-
dido em campo.
Completar a coleta de dados, entretanto, somente o comeo daquilo que cons-
titui a anlise estatstica. A coleta de dados o passo inicial, a matria-prima com que
o pesquisador deve trabalhar se o seu objetivo analisar os dados, obter resultados e
testar hipteses acerca da natureza da realidade.

DISTRIBUIES DE FREQUENCIA DE DADOS NOMINAIS


0 marceneiro transforma madeira bruta em mobilirio; o mestre-cuca d aos alimentos
bsicos aquele toque de sabor que enriquece as mesas. Por processo anlogo, o pesqui-
sador-auxiliado por "receitas" denominadas frmulas e tcnicas-procura transformar
seus dados brutos num conjunto de mensuraes, organizadas e dotadas de sentido, que
possam ser usadas para testar suas hipteses iniciais.

TABELA 2.1 Estudantes de Ambos os Sexos Presentes a uma Exposio de Pintura

Sexo Freqncia (f)

Masculino 80
Feminino 20
Total 100

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
16 DESCRIO
Organizao de Dados 17

O que o pesquisador pode fazer para organizar a dizer tambm que nas ocasies em que as moas compareceram, elas mostraram-se,
avalancha de dados brutos que
ele recolhe de seus respondentes? Que que ele faz 'de certa forma, mais inclinadas para a ala de pintura clssica que para a de moderna.
para transformar essa massa de
dados brutos num conjunto-resumo fcil de entender? O primeiro
passo poderia ser
construir umadistribuicdo de freqncias sob a forma de tabela.
Examinaremos a distribuio de freqncias da Tabela 2.1. TABELA 2.2 Comparecimento de Alunos de Ambos os Sexos a uma Exposio de Pintura (Arte
Observem, em pri-
meiro lugar, que a tabela encabeada por um nUmero (2.1) e Clssica e Arte Moderna)
por um dtulo que d ao
leitor uma idia da natureza dos dados apresentados-"Estudantes
de ambos os sexos
presentes a uma exposio de pintura". Esse o procedimento Comparecimento ers Exposies
padro; todas as tabelas
devem ser claramente tituladas e, quando forem Arte Moderna
apresentadas em seqncia, devem Arte Clssica
conter tambm um nmero. Sexo
As distribuies de freqncia de dados nominais
consistem em duas colunas.
Na Tabela 2.1, por exemplo, a coluna da esquerda indica
a caracterstica de interesse* Masculino 80 70
(sexo) e contm as categorias de anlise (homens e mulheres). Feminino
Uma coluna adjacente 20 30
titulada "Freqncia" ou `f" indica o nmero de sujeitos em cada
categoria (80 e 20, Total 100 100
respectivamente), bem como o nmero total de sujeitos (N = 100),
Uma rpida inspeo da distribuio de freqncia constante
da Tabela 2.1
revela perfeitamente que muito mais alunos do que alunas
compareceram exposio:
dos 100 alunos presentes 80 cram do sexo masculino. Propores e Porcentagens
Quando o pesquisador estuda distribuies de tamanho igual (isto , amostras de mesmo
tamanho), os dados freqenciais podem ser usados no estabelecimento de comparaes
COMPARAO DAS DISTRIBUIES entre os grupos. Assim, o nmero de rapazes presentes exposio de pintura clssica
Suponham, entretanto, que desejemos comparar a presena de pode ser diretamente comparado com o nmero de rapazes presentes de pintura
estudantes na ala de moderna, uma vez que sabemos terem visitado cada ala da exposio exatamente 100
arte moderna com a presena de estudantes na ala de arte
clssica. Fazer comparaes
entre distribuies de frequncias constitui um procedimento usado estudantes. Em geral no possvel, entretanto, estudar distribuies com exatamente
amide para tornar o mesmo nmero de sujeitos. Por exemplo, como podemos estar certos ("a priori") de
os resultados mais claros e a informao mais ampla. A
comparao especfica que o que precisamente 100 alunos comparecero a ambas as exposies?*
pesquisador faz determinada pela questo a que ele procura responder.
Voltando ao nosso exemplo hipottico, poderamos perguntar: ser que A fim de tornar tais resultados mais claros (mais "legveis"), necessitamos de um
os rapa- mtodo que permita padronizar distribuies de freqncias quanto ao tamanho, ou
zes so mais propensos a comparecer a exposies de
pintura moderna e clssica do
que as moas, ou ser que eles se distribuem casua1mente? seja, uma forma de comparar grupos a despeito de diferenas nas freqncias totais.
Para responder, poderamos
comparar a distribuio de 100 alunos** presentes ala de Dois dos mais teis e populares mtodos de padronizar tamanho e comparar distribui-
pintura moderna com a es so o mtodo da proporgro e o mtodo da porcentagem.
distribuio de outros 100-da mesma universidade-presentes ala de
pintura clssica. No mtodo da proporo, compara-se o nmero de sujeitos de uma dada categoria
Vamos imaginar que os resultados obtidos sejam os constantes da
Tabela 2.2. com o total de sujeitos que compe a distribuio (e na qual a dada categoria se inclui).
Tal como demonstra a tabela, de 100 estudantes presentes
na ala de pintura Podemos transformar qualquer freqncia nunia proporo P, atravs da diviso do
moderna, 30 eram do sexo feminino; j na ala de pintura clssica,
de 100 apenas 20
eram do sexo feminino. Isto j nos d muito mais informaes nmero de sujeitos de uma dada categoriaf pelo nmero total de sujeitos da distribuio
do que a simples distri- (N). Em smbolos:
buio de freqncia apresentada na Tabela 2.1. Assim, podemos
agora dizer que os
rapazes tiveram uma participao maior do que suas colegas de
universidade. Podemos
f **

* N.T.: A caracterfstica de interesse


habitualmente designada por varivel observacional, varivel
de observao, variverde anlise.
**N.T.: Obviamente, o exemplo forado, s se admitindo por *N.T.: Veja-se, a propsito, o que ficou dito na nota de rodap anterior sobre a arbitrariedade desse
motivos de ordem didtica. Por
outras palavras, ele chega a ser claro, ainda que no rigorosamente procedim en to.
correto. No Capftulo 7 o leitor
encontrar algumas noes de Tcnica de Amostragem que muito o **N.T.: Como se ver no Capftulo 6, intitulado "A Curva Normal", a probabilidade de um evento
auxiliaro a entender as limita-
es do exemplo acima. um quociente em que o numerador representa o nfunero de casos
favorveis ocorrncia desse
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
18 DESCRIO
Organizao de Dados 19
Portanto, 10 rapazes num grupo de 40 estudantes
presentes a uma exposio do origem
proporo P =71-1: = 0,25. Razes
Apesar da utilidade do mtodo das propores, Um mtodo menos usado na padronizao de tamanho denomina-se razo. Tal mtodo
muitas pessoas preferem indicar
o tamanho relativo de um conjunto de valores compara diretamente o nmero de sujeitos que se enquadram numa categoria (por
em termos de porcentagem, que, ao cabo,
vem a ser a prpria freqncia com que exemplo, homens) com o nmero de sujeitos que se enquadram noutra categoria (por
determinada categoria ocorre em relao ao
nmero 100. Para calcular a porcentagem, exempo, mulheres). Assim, pode-se obter uma razo mediante a frmula
simplesmente multiplicamos uma dada
proporo por 100, donde a frmula

% =
razsb = -
12
(100) .

onde f5 = freqncia de sujeitos de uma categoria e f2 = freqncia de sujeitos de outra


Portanto, a proporo P = categoria.
do exemplo anterior transforma-se em (100)
-01

Assim, 25% desse grupo de 40 estudantes compe-se = 25%. Se estivssemos interessados, por exemplo, na determinao da razo existente
de rapazes. Para ilustrar a utilidade entre torcedores de futebol, podetiamos comparar o nmero de simpatizantes do
das porcentagens nas comparaes entre distribuies,
vamos examinar o compareci- time A (f = 150) com o nmero de simpatizantes do time B (f = 100), o que daria
mento de estudantes a exposies de pintura realizadas
num "campus" universitrio em Simplificando a frao, isto , cancelando os fatores comuns do numerador e de-
que a arte moderna considerada de importncia
fundamental. Suponhamos, ento, que
alaleria de arte moderna atraiu um bom nmero de estudantes, nominador, resulta: jj = (Em termos concretos, isto significa que para cada 3 tor-
digamos 1.352, enquanto cedores do time A existem 2 torcedores do time B.)
que a galeria de pintura clssica conseguiu atrair
um nmero bem menor, digamos 183. O pesquisador poderia aumentar a clareza dessa razo se desse ao denominador
A Tabela 2.3 indica, ao mesmo tempo, as
freqiiticias e as porcentagens de visita- uma forma que fosse mais inteligfvel. Por exemplo, a chamada razo de sexo comumen-
o a ambas as galerias. Note o leitor a dificuldade
que surge ao tentar-se estabelecer te empregada por diemgrafos, relaciona o nmero de homens em funo de grupos de
rapidamente diferenas ligadas a sexo em termos de
comparecimento, se o quadro de 100 mulheres. Com isso, esses pesquisadores procuram comparar a quantidade de homens
referncia ficar restrito apenas as freqncias. Em contrapartida,
as porcentagens reve- coin a quantidade de mulheres existentes num ncleo populacional determinado.
lam de forma clara que em ambas as galerias o elemento
feminino foi igualmente repre- Ilustrando: se a razo de homens para mulheres for , haver 150 libmens para
sentado. Especificamente, 20% dos estudantes presentes 1-51+3

a ambas as galerias eram do 50 mulheres, ou, simplificando, 3 homens para cada mulher. Para obter a verso con-
sexo feminino.
vencional da razo de sexo, basta multiplicar o resultado acima por 100, donde:

razo de sexo = (100)


f de homens (100) 150
300.
evento, e o denominador, o nmero de casos posseveis
plo, se numa urna h 10 bolas amarelas (A) e 40 bolas
de realizao desse mesmo evento. Por exem- f de mulheres 50
vermelhas (V), a probabilidade de retirar-se
ao acaso, isto , por sorteio, 1 bola vermelha :
Esse nmero est a nos dizer que nessa populao particular existem 300 homens para
Nmero de casos favoriveis i"bola vermelha" cada 100 mulheres.
P(V) = 40
Ntmero de casos possveis de "retirar 1 bola" 10 + 40
- 40
50
- 08
,

De modo anlogo,
TABELA 2.3 Comparecimento de Alunos de Ambos os Sexos a uma Exposio de Pintura (Arte
Clssica e Arte Moderna)

P(A) = 10 = 0,2
50
Comparecimento cis Exposies
P(V) e P(A) representam, respectivamente, a Arte Moderna Arte Chissica
"probabilidade de ocorrer bola vermelha" e a "probabi-
lidade de ocorrer bola amarela".
Sexo
Note-se, finalmente, a analogia existente entre a
expresso
Masculino 1.082 (80) 146 (80)
P =
Feminino 270 (20) 37 (20)
e o quociente que di a probabilidade de ocorrncia de um Total 1.352 (100) 183 (100)
evento.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
20 DESCRIO
Organizao de Dados 21
As razes (como as indicadas acima) j no
so exaustivamente usadas em pesqui- a taxa de mudana, pode ser usada para comparar uma populao com si prpria em
sas-talvez pelos seguintes motivos:
dois momentos distintos. Ao computar a taxa de mudana, comparamos a
1. So necessrias muitas razes mudana
para descrever distribuies que possuem vrias efetiva ocorrida entre um tempo 1 e um tempo 2, onde a extenso do tempo 1 serve
categorias de anlise. de base. Desse modo, uma populao que cresceu de 20.000 a 30.000
2. Pode tornar-se difcil a comparao habitantes entre
de razes baseadas em nmeros muito 1960 e 1970 apresenta a seguinte taxa de mudana
grandes.
3. Alguns pesquisadores preferem evitar as
fraes geradas pelas razes.* (100 f de tempo 2
f de tempo
-f de tempo 1 ( -
(100) 0.000 20.000
50%
Taxas 1 20.000
Outro tipo de razo-que tende a ser muito mais
utilizado pelos pesquisadores- a Em outras palavras, houve um aumento populacional de 50% no perodo de 1960/70.
taxa. Os socilogos habitualmente analisam
populaes quanto a taxas de reproduo, Observe-se que a taxa de mudana pode ser negativa, caso em que indicar a
mortalidade, crime, divrcio, casamento e fatos semelhantes.
Todavia, enquanto que a diminuio de algo num dado perodo. Exemplo: se uma populao mudar de 15.000
maioria das outras razes compara o nmero de
sujeitos de um subgrupo qualquer para 5.000 habitantes num dado perodo a taxa de mudana ser
(categoria) com o nmero de sujeitos de qualquer
outro subgrupo (categoria), as
taxas indicam comparaes entre o nmero efetivo
Por exemplo, para determinar a taxa de nascimento
de sujeitos e o nmero potencial.
de uma dada populao, podera-
(100) 5.000 - 15.000 - -
67%
mos tomar o nmero efetivo de crianas nascidas 15.000
vivas e cotej-lo com o nmero de
mulheres cujas idades fossem compatveis com gravidez
(ou seja, aquelas mulheres da
populao que esto expostas ao risco de gravidez e DISTRIBUIES DE FREQUNCIAS SIMPLES RELATIVAS A DADOS ORDINAIS
que, por isso, representam ca-
sos**potenciais). De modo anlogo, para determinar a taxa de E INTERVALARES
divrcio, poderamos
comparar o nmero efetivo de divrcios com o nmero Posto que dados nominais so "rotulados" em vez de graduados ou mensurados, as
de casamentos durante certo
perodo (por exemplo, um ano). As taxas so freqentemente categorias das distribuies de nvel nominal no precisam ser construdas em
dadas em termos de nenhuma
uma base de 1.000 casos potenciais. Assim, taxas ordem especffica. Assim, os dados relativos a preferncias religiosas que aparecem
de nascimentos representam o nmero
de nascimentos por 1.000 mulheres; taxas na Tabela 2.4 podem ser apresentados de trs modos diferentes, embora
de divrcio, o nmero de divrcios por igualmente
1.000 casamentos. Ento, se ocorrerem 500 aceitveis.
nascimentos entre 4.000 mulheres (de
idade compatvel com gravidez), vem:
TABELA 2.4 Distribuio de Preferncias Religiosas. (Tres Apresentaes Diferentes.)

Taxa de nascimento = (1.000) f de casos efetivo - (1.000) 500


f de casos potenciais 4.000
- 125
Religio Religio Religio

Disso resulta que para cada 1.000 mulheres Protestantes 30 Catlicos 20 Judeus 10
passveis de gravidez ocorrem 125 nasci- Catlicos 20 Judeus 10
mentos de crianas vivas. Protestantes 30
Judeus 10 Protestantes
At aqui discutimos taxas que podem ser teis no _30 Catlicos 20
estabelecimento de compara- Total 60 Total 60 Total
es entre diferentes populaes. Por exemplo, 60
poderamos querer comparar taxas de
nascimento entre pretos e brancos, entre mulheres de classe mdia e Em contraste, as categorias ou os escores das distribuies ordinais ou
de classe baixa, intervalares
entre grupos religiosos ou sociedades inteiras e assim por representam o grau em que uma caracterstica particular est presente. O arrolamento
diante. Outro tipo de taxa,
de tais categorias ou escores nas distribuies de freqncias simples deve
ser feito de
N.T.: Dos tres motivos apresentados, o mais fraco , al modo que reflita essa ordem.
sem dvida, o de n. 3, pois, como se ver
mais adiante, no se faz praticamente nada
em Estatfstica sem continua recorrncia
Por essa razo, as categorias intervalares e ordinais so sempre dispostas em
Probabilidades. Ora, a no ser nos casos (raros) de certeza de Teoria das ordem, isto , do valor mais alto ao mais baixo. Por exemplo, poderamos arrolar
que ocorre e certeza de que ndb ocorre, as
cujas probabilidades so, respectivamente, 1 e 0, ea tegorias componentes da varivel classe social da mais alta mais
todas as demais probabilidades so fracionrias e baixa (alta, mdia
menores que 1 (porm positivas). No ser, pois, evitando
as razes que evitar-se-o complicaes o baixa), ou poderamos atribuir postos aos resultados de
de clculo causadas pelo surgimento de nmeros um exame semestral de
fracionrios. Blologia, onde a ordem desses postos fosse seqencial; portanto, do mais alto ao
**N.T.: Comumente aparece a expresso casos com o mais
sentido de sujeitos.
boixo.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
DESCRIO Organizao de Dados 23

TABELA 2.5 Distribuio de Freqncias Relativas a Atitudes Quanto I Guerra. Apresentaes TA BELA 2.6 Notas de Exame Final de 71 Estudantes Dispostas numa Distribuio de Freqncias
Correta e Incorreta
Nota f Nota f Nota Nota
Atitude Quanto Guerra Atitude Quanto Guerra
99 0 85 2 71 4 57 0
Ligeiramente favorvel 2 Muito favorvel o 98 1 84 1 70 56 1

Um pouco desfavorvel 10 Um pouco favorvel 1 97 0 83 0 69 3 55 0


Muito favorvel 0 Ligeiramente favorvel 2 96 1 82 3 68 5 54 1
Ligeiramente desfavorvel 4 Ligeiramente desfavorvel 4 95 1 81 1 67 1 53 0
Mu ito desfavorvel 21 Um pouco desfavorvel 10 94 0 80 2 66 3 52 1
Um pouco favorvel 1 Muito desfavorvel 21 93 0 79 8 65 0 51 1
92 1 78 1 64
Total 38 Total 38 1 50 1
91 1 77 0 63 2
90 0 76 Total 71
Incorreto Correto 2 62 0
89 1 75 1 61 0
88 0 74 1 60 2
Perturbar a ordem de categorias intervalares e ordinais reduz a legibilidade das 87 1 73 1 .59 3
86 0 72
descobertas do pesquisador. Tal efeito pode ser observado na Tabela 2.5, onde as 2 58 1

verses "correta" e "incorreta" de uma distribuio de "Atitudes quanto Guerra"


foram apresentadas. Qual verso voc acha mais fcil de interpretar? TABELA 2.7 Notas de Exame Final de 71 Estudantes Redispostas numa Distribuio
de Freqncias
Agrupadas
DISTRIBUIES DE FREQENCIAS COM DADOS AGRUPADOS
Intervalo de Classe
Os escores de nvel intervalar espalham-se, s vezes, ao longo de uma extensa amplitude
(valor maior menos valor menor), o que torna a distribuio de freqncias resultante 95-99 3
no s longa, mas, tambm, difcil de ler. Quando ocorrerem tais situaes, poucos 90-94 2
sujeitos podero estar em correspondncia com cada um dos escores, donde se segue 85-89 4
que o modelo do grupo torna-se indefinido. Ilustrando: a distribuio apresentada 80-84 7
75-79 12
na Tabela 2.6 contm valores que variam de 50 a 99 e estende-se por quase quatro
70-74 17
colunas.* 65-69 12
Para tornar mais clara nossa apresentao, poderamos construir uma distribui- 60-64 5
cdo de freqncias agrupadas, condensando os escores separados num nmero menor 55-59 5
de categorias ou grupos, cada um contendo mais de um escore. Cada eategoria ou 50-54 4
grupo numa distribuio assim condensada recebe o nome de intervalo de classe, cujo Total 71
tamanho determinado pela quantidade de escores nele contidos.
As notas de exame dos 71 alunos originalmente apresentados na Tabela 2.6 esto limite inferior. primeira vista, os limites superior e inferior de uma
dada categoria
redispostas numa distribuio de freqncias agrupadas na Tabela 2.7. Aparecem, a, parecem ser os limites reais. Assim, poderamos com certa "lgica" imaginar
que os
10 intervalos de classe, cada um de tamanho 5. Desse modo, o intervalo de classe mais limites superior e inferior do intervalo 60-64 fossem 64 e 60, respectivamente.
Se assim
alto (95-99) contm cinco valores, a saber: 95, 96, 97, 98 e 99. Da mesma forma, o procedssemos, todavia, estaramos errados, uma vez que 60 e 64 no so de
limites do intervalo 60-64.
fato os
intervalo 70-74, tambm de tamanho 5, contm os escores 70, 71, 72, 73 e 74. Muitos leitores estaro perguntando: por que no? Para responder, vamos
minar um problema que poderia surgir se tivssemos de definir limites exa-
de classe em
Limites de Classe termos do escore mais alto e mais baixo de um intervalo qualquer.
Suponham que
De acordo com seu tamanho, cada intervalo de classe tem um limite superior e um tentssemos localizar, num intervalo de classe, nmeros dotados de uma
da (fraes decimais);* tome-se -por base a distribuio de frequncia parte fracion-
Tabela 2.7. Onde colocaramos o escore 62,3? A maioria de
apresentada na
ns concordaria que tal
N.T.: Obviamente, se o autor reduzisse a altura das colunas de sua tabela, ele poderia "dar mais
enfase" ao que disse acima, pois, a, os escores de 50 a 99 ocupariam, quem sabe (?!), oito colunas.
O argumento logicamente fraco. N.T.: curioso que o autor, ao referir-se a nmeros dotados de
fracionria, esclarea uma parte
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
UNIVERSID4ZE FEDL7i',11_ DOOrgnizaciio
24 DESCRIO de Dados 25
BIBL1OTECA t.ENTR AL

valor pertence ao intervalo 60-64. Mas que dizer do escore 69,4? E que tal tentar situar dade de ver, a posio dos limites de classe deve ser estabelecida a fim de ser possvel a
54,2 ou 94,6? 0 leitor poderia notar que os escores mais alto e mais baixo de um aplicao de certos procedimentos estatsticos.
intervalo qualquer deixam lacunas (espaos vazios) entre grupos numricos adjacentes,
de sorte que alguns valores fracionrios no podem ser includos em nenhum intervalo Ponto Mdio
de classe da distribuio, donde decorre que eles devem simplesmente ser
excludos. Outra caracterstica de qualquer intervalo de classe o seu ponto mdio, que se define
Contrariamente ao que sugerem o escore mais alto e mais baixo de um intervalo como o valor "mais central" desse mesmo intervalo. Um mtodo simples e rpido de
qualquer, os limites de classe esto localizados num ponto que se situa a meio caminho achar o ponto mdio procurar o valor do intervalo de classe que se situa exatamente
entre as classes intervalares adjacentes e, portanto, servem para preencher as lacunas no meio. Alguns exemplos: 50 o ponto mdio do intervalo 48-52; 3,5 o ponto
existentes (ver Figura 2.1). Assim, o limite superior do intervalo 90-94 94,5 e o limite mdio do intervalo 2-5. 0 ponto mdio tambm pode ser calculado mediante uma
frmula* que relaciona os limites superior e inferior de um dado intervalo. Por exem-
plo, o ponto mdio do intervalo 48-52
95
- 94,5 Limite Superior fimite inferior + limite superior 48 + 52
Escore = 50
Mais Alto 2 2
93
Determinao do Nmero de Intervalos
92
Para apresentar dados intervalares sob a forma de distribuio de freqncias agrupadas,
91 o pesquisador deve levar em conta o nmero de categorias (classes) que ele deseja
empregar. Os textos geralmente recomendam usar no menos que 5 nem mais que
Escore -I.- 90 20 intervalos. No tocante a este aspecto, cumpre lembrar que as distribuies de fre-
Mais Baixo - 89,5 -0-- Limite Inferior
qncias agrupadas so usadas com o intuito de revelar ou enfatizar um modelo grupal.**
89
Intervalos de classe em excesso ou em escassez podem tornar esse modelo menos inteli-
FIGURA 2.1 Escores Mais Alto e Mais Baixo Versus Limites Superior e Inferior da Classe Intervalar gvel e, com isso, trabalhar contra o pesquisador-que procura aumentar a clareza de
90-94 sua anlise. Alm disso, reduzir os escores individuais a um nmero desnecessariamente
inferior do intervalo 95-99 tambm 94,5. Da mesma forma, 59,5 tanto serve de Willie pequeno de intervalos, pode redundar em sacrifcio de muita preciso-justamente a
superior do intervalo 55-59 quanto do limite inferior do intervalo 60-64. 0
leitor preciso que se conseguiu no incio mediante o conhecimento da identidade dos escores
que fazer com o valor 59,5, uma vez que ele cai exatamente no individuais da distribuio. Em suma, portanto, o pesquisador geralmente toma sua
poderia perguntar o
ser
meio do espao que separa duas classes intervalares adjacentes. Esse escore deveria
includo no intervalo 55-59 ou no intervalo 60-64? Este problema geralmente contor- * N.T.: Tal como foi explicado nos tpicos anteriores, os nmeros que aparecem nos vrios inter-
59,5
nado mediante arredondamento para o inteiro par mais prximo. Por exemplo: valos de classe constituem seus limites aparentes. Ento, obriga-nos o rigor matemtico a respeitar-e
seria colocado no intervalo 60-64; 84,5, no intervalo 80-84.* Como teremos oportuni- usar nos clculos-os limites reais de pada intervalo de classe. Assim, o ponto mdio do intervalo
48-52 (que, segundo sugesto anterior, deveria grafar-se 48 1-52) no 50, mas, sim, 49,5, a menos
que os valores 48 e 52 sejam resultantes de uma contagem, pois, nesse caso, a varivel discreta (ou
no
tratarem-se de "fraes decimais". Se, de um lado, o que ele diz no est errado, de outro, descontnua), e s admite valores inteiros. A frmula que permite, com rigor matemtico, calcular o
chega a estar completo, uma vez que a notagab decimal uma forma de exprimir
fraes, mas no -
ponto mdio : (limite inferior aparente 0,5) + (metade da amplitude do intervalo). Em smbolos:
a nica. Alternativamente, existe a notao ordinria, expressa por numerador-trao-denominador, 1 = limite inferior aparente
Exempli-
capaz de, em muitos casos, atingir requintes de preciso que superam a notao decimal. = limite superior aparente
entretanto 0,333 ... jamais ser um li = (L - 1) =amplitude do intervalo
ficando: 2,25 (com notao decimal) o mesmo que 2 +
dado to preciso quanto 1/3.
H ,
ponto mdio = (1 - 0,5) +
* N.T.: Em Matematica, ocorrem com freqncia as seguintes
notaes de intervalos: ,

intervalo fechado; intervalo fechado


Esses sinais significam, respectivamente: intervalo aberto; Exemplo: achar o ponto mdio do intervalo 48 4-52.
Por uma questo
esquerda (ou aberto direita); intervalo fechado direita (ou aberto esquerda).
de rigor, sugere-se que os intervalos que aparecem no corpo da obra notados com "-" sejam substi- Ponto mdio = (48 - 0,5) +
4
= 47,5 + 2 = 49,5.
dirimindo-se assim eventuais dvidas. Com essa nova simbologia, os intervalos
tudos por " **N.T.: Entenda-se por "modelo", aqui, "tendncia".
95-99 e 90-94 passam a ser designados por 95 I- 99 e 90 1-94, respectivamente.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
26 DESCRIO
Organizactio de Dados 27

deciso quanto ao nmero de intervalos baseado em seu prprio conjunto de dados e


Alm da freqncia acumulada, podemos tambm construir uma distribuio
em seus objetivos pessoais, fatores que podem variar consideravelmente de uma situao que indica a porcentagem acumulada (c%), ou seja, a porcentagem de sujeitos que
de pesquisa para outra.
obtiveram determinado nmero de pontos ou, dito de outra forma, a porcentagem de
sujeitos que obtiveram, no mximo, determinado nmero de pontos. Calcula-se a
porcentagem acumulada atravs da modificao da frmula de porcentagem (%) apre-
DISTRIBUIVIES CUMULATIVAS sentada pginas atrs neste mesmo captulo:
desejvel, algumas vezes, apresentar freqncias de forma cumulativa, especialmente
quando procuramos situar a posio de um sujeito em funo do desempenho total do c % = (100) , onde
grupo. Definem-se freqncias cumulativas como o nmero total de sujeitos portadores
de um dado escore ou como o nmero total de sujeitos portadores de um escore menor
fa = freqncia acumulada para qualquer categoria (classe);
que outro previamente especificado. Assim, a freqncia acumulada, ou cumulativa (fa),
N = total de sujeitos (casos) da distribuigo.
de qualquer categoria (ou classe intervalar) obtm-se atravs da soma da freqncia
daquela categoria com a freqncia total de todas as categorias que esto abaixo dela. Se apficarmos a frmula acima aos dados da Tabela 2.8, verificaremos que a
porcentagem de alunos que obtiveram 350 ou menos foi

-
No caso dos pontos obtidos pelos universitrios (Tabela 2.8), observamos que a fre-
qncia f associada ao intervalo de classe 301-350 12. Tal freqncia (12) correspon-
12
de, tambm, freqncia acumulada relativa ao intervalo 301-350, uma vez que nenhum c % = (100) = (100)(0,0357) = 3,57%
membro do grupo fez menos pontos do que 301. A freqncia* da classe intervalar 336
A porcentagem dos que conseguiram 400 ou menos foi
TA BELA 2.8 Distribuio de Freqncias Acumuladas Varivel:Escores de Desempenho Acadmico
Obtidos por 336 Universitrios

Intervalo de Classe fa
c % = (100) -
45
336
= (100)(0,1339) = 13,39%

A porcentagem dos que obtiveram 450 ou menos foi

-
75 1-8 00 6 336
701-750 25 330 93
651-700 31 305 c % = (100) = (100)(0,2768) = 27,68%
601-650 30 274 336
551-600 35 244
501-550 55 209 A distribuio de porcentagens acumuladas baseada nos dados da Tabela 2.8 figura na
45 1-5 00 61 154 Tabela 2.9.
401-450 48 93
351400 33 45
301-350 12 12 POSTO PERCENTIL
Total 336 Suponhamos que voc tenha obtido 80 num exame de Estatstica. A fim de determinar
com exatidgo o seu grau de desempenho, seria provavelmente til saber como a sua
nota 80 compara-se com as notas dos demais colegas de classe que passaram pela mesma
seguinte (351-400) 33, enquanto que a freqncia acumulada para o mesmo intervalo prova. A maioria de seus colegas ficou em torno de 80 ou 90? Se assim foi, a sua clas-
45 (isto , 33 + 12). Essas informaes permitem-nos tomar conhecimento, portanto,
sificao (nota) pode no ter sido "terrivelmente alta"! Por outro lado, se a maioria de
de que 33 universitrios situaram-se na faixa 351400, e de que 45 receberam escores seus colegas no tirou mais que 60 ou 70, a nota 80 pode muito bem situar-se entre as
iguais ou inferiores a 400. Poderfamos continuar com este procedimento e obter fre- mais altas do grupo.
qncias acumuladas para todos os intervalos de classe, at chegarmos ao intervalo de Com o auxlio da distribuio de porcentagens acumuladas, podemos fazer com-
maiores limites, 751-800, cuja freqncia acumulada (336) igual totalidade de paraes precisas entre qualquer sujeito e o grupo ao qual ele pertence. Especificamente,
sujeitos-uma vez que nenhum membro do grupo conseguiu mais que 800 pontos. podemos calcular o posto percentil de um escore, que nada mais que um simples
inmero indicativo da porcentagem (total) de sujeitos de uma distribuio que conse-
* N.T.: comum falar-se em freqiincia simples para reduzir a possibilidade de confuso com
guiram menos que um dado valor. Por exemplo, se ao escore 80 corresponde o posto
freqii encias acumuladas.
percentil 95, ento 95% dos alunos receberam, nesse exame de Estatstica, escores
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
28 DESCRIO Organizao de Dados 29

inferiores a 80 (apenas 5% obtiveram valores acima de 80). Entretanto, se a um escore H vrias caractersticas relativas ao intervalo crtico que devem ser determinadas
de 80 corresponder um posto percentil de 45, ento somente 45% receberam notas de antes da aplicao da frmula do posto percentil:
exame abaixo de 80 (donde decorre que 55% conseguiu notas superiores). Em smbolos: 1. 0limite inferior do intervalo crtico-que corresponde ao ponto situado
entre o intervalo crtico 601-650 e o intervalo imediatamente abaixo dele,
c% abaixo \ limite inferior vale dizer: 551-600. Neste caso, o limite inferior (real) do intervalo 601-650
do limite escore - do intervalo / % no \ 600,5.
Posto percentil = inferior do crtico intervalo 2. 0 tamanho do intervalo* crtico-que se determina a partir do nmero de
intervalo tamanho do intervalo \ crtico / escores contidos nesse intervalo. No caso do intervalo 601-650, a amplitude
crtico crtico 50, uma vez que entre 601 e 650 h 50 valores.**
3. A porcentagem dentro do intervalo crtico-que se obtm dividindo o nmero
Para ilustrar o procedimento, vamos calcular, relativamente aos dados que apa- de sujeitos contidos nesse intervalo particular (f), pelo nmero total de sujeitos
recem na Tabela 2.8, o posto percentil do escore 620. Antes de aplicar a frmula, da distribuio (1V), e multiplicando a resposta por 100. Em smbolos:
TA BELA 2.9 Distribuio de Porcentagens Acumuladas. Varivel: Escores de Desempenho
Acarlimico Obtidos por 336 Estudantes Universitrios. (Esta Tabela Baseia-se na de
n.0 2.8)
% = (100)1 = (100) -
30
336
"50
= (100)(0,089) = 8,93%

Vemos, portanto, que 8,93% desses escores obtidos pelos universitrios caem
Intervalo de Classe fa e%
dentro do intervalo de classe 601-650.
4. A porcentagem acumulada abaixo do limite inferior do intervalo crtico. O
751-800 336 100%
701-750 330 98,21 valor de c% pode ser lido diretamente na Tabela 2.9, que fornece a distribuio
651-700 305 90,77 das porcentagens acumuladas. Ao percorrermos a coluna da c% de baixo para
601-650 274 81,55 cima, observamos que 72,62% dos escores ficam abaixo do intervalo crtico;
551-600 244 72,62 esta , pois, a porcentagem acumulada associada ao intervalo de classe que se
501-550 209 62,20
situa imediatamente abaixo do intervalo crtico.
45 1-5 00 154 45,83
401-450 93 27,68 Estamos agora preparados para aplicar a frmula do posto percentil:
351-400 45 13,39
301-350 12 3,57
Posto Percentil - 72,62 +
620 - 600,5 1
(8,93) - 72,62 +
[19,50
(8,93)1
50 50
devemos primeiro localizar o intervalo crtico, que corresponde ao intervalo de classe
onde o escore 620 est contido. Tal como demonstrado abaixo, o intervalo crtico = 72,62 + (0,39)(8,93) = 72,62 + 3,48 = 76,10
deste problema 601-650:
Resulta, ento, que pouco mais do que 76% recebeu escores inferiores a 620. Somente
Intervalo de Classe 23,90% obteve valores superiores.

751-800 N.T.: O tamanho do intervalo tambm chamado amplitude (amplitude da classe, amplitude do
701-750
Intervalo). diferena entre o maior valor e o menor valor de uma distribuio di-se o nome de
651-700
amplitude total.
601-650 Intervalo de classe que contm o escore 620 ** N.T.: Observe-se que a amplitude 50 decorre da aplicao da seguinte frmula:
551-600 (L - 1) + 1 = (650 - 601) + 1 =49 + 1 =50.
501-550
451-500 Nu verdade, trata-se, aqui, da aplicao da frmula que permite calcular o nilmero de termos de
401-450 uma progresso aritmtica, ou seja:
351-400 an -a +
301-350 n = 1, onde an = L, al = 1, r = 1

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
UNIVERSWADE
F RAL oc
30 DESCRIO CENTROrganizao de Dados 31

Como exemplo adicional, vamos calcular o posto percentil relativo ao escore 92 Estamos, agora, em condies de substituir esses dados na frmula do posto
da seguinte distribuio: percentil:
Intervalo de Classe f fa e% [92 - 89,5 2 50

90-99 6 49 100%
Posto percentil = 87,76 +
10
(12,24 )= 87,76 + 10
(12,24)

80-89 8 43 87,76
70-79 12 35 71,43 = 87,76 + (0,25)(12,24) = 87,76 + 3,06 = 90,82%
60-69 10 23 46,94
50-59 7 13 26,53
40-49
N =
_6

49
6 12,24
Quase 91% dos alunos, receberam notas menores que 92. Somente 9,18% receberam
notas superiores a 92.*
A escala de postos percentis consiste em 100 unidades. Certos postos percentis
situados ao longo dessa escala tm nomes especficos. Os decis dividem a escala em
Conforme a ilust ao abaixo, o intervalo crtico para um escore de 92 90-99: pores de dez. Assim, se um escore estiver situado no primeiro deal (posto percen-
til = 10), sabemos que 10% dos casos situam-se abaixo desse escore; se um escore estiver
Intervalo de Classe no segundo decil (posto percentil = 20), ento 20% dos casos estaro abaixo dele e
assim por diante. Os pontos que dividem a escala de postos percentis em grupos de 25
90-99 +- Intervalo de classe ao qual pertence o valor 92 (isto , 25%) so conhecidos pelo nome de quartis.* * Se um escore estiver localizado
80-89 no primeiro quartil (posto percentil = 25), sabemos que 25% dos casos caem abaixo
70-79 dele; se um escore estiver no segundo quartil (posto percentil = 50), ento 50% dos
60-69
50-59
40-49 Posto Pereentil Decil Quartil

As caractersticas do intervalo crtico que devemos determinar so as seguintes: 90 = 90


1. 0 limite inferior do intervalo crtico 89,5. 85
80 = 8.
2. 0 tamanho (amplitude) do intervalo crtico 10, j que h 10 escores de 75 = 3.
90 a 99 (90, 91,92, 93, 94, 95, 96, 97, 98, 99).* 70 = 7.o
3. A porcentagem dentro do intervalo crtico 12,24%. Em smbolos: 65
60 = 6.0
55
% = (100) -f , donde 50 = 50 2.
45
40 = 4.

% = (100) -
6
49
= (100) 0,1224 = 12,24%
35
30 =
25 =
3.o
1.
20 = 2.
15
4. A porcentagem acumulada abaixo do limite inferior do intervalo crtico pode
10 = 1.
ser encontrada na coluna c%, em correspondncia ao intervalo de classe imedia-
tamente abaixo do j citado intervalo crtico. A porcentagem acumulada que PIGURA 2.2. Escala de Postos Percentis Dividida em Decis e Quartis
corresponde classe intervalar 80-89 87,76%.

* N.T.: Observe-se que 91%+ 9,18% > 100%. Isto porque o autor arredondou para mais a porcen-
*N.T.: Veja-se, mais uma vez, a nota de rodap anterior. Mediante sua aplicao, resulta, de imedia-
-
to, o valor 10, pois: (L - 1) + 1 = (99 90) + 1 = 10.
* turn 90,82-anteriormente encontrada.
** N.T.: Os sujeitos de uma distribuio que se localizam entre o primeiro e o terceiro quartis
PDF compression, OCR, web optimization using a watermarked evaluation
portencem ao que copy
convencionou chamar of CVISION
de intervalo PDFCompressor
de normalidade.
I' - Apesar de tratar-se de
se
32 DESCRIO
Organizao de Dados 33

escores estaro situados abaixo dele; por igual raciocnio, para um escore que esteja
Estrutura Familiar de Crianas
no terceiro quartil (posto percentil = 75), haver 75% de escores abaixo dele (ver Pretas e Crianas Brancas
Figura 2.2).
Raa da Criana
Preta Branca
RESUMO Estrutura Familiar
Foram introduzidas, neste captulo, algumas das tcnicas bsicas usadas pelo pesqui-
sador na organizao do emaranhado de dados originais (brutos) que ele coleta de Um genitor 53 59
seus respondentes. Distribuies de freqncia e mtodos para comparar essas distri- Dois genitores 130 167
buies-quando compostas de dados nominais (propores, porcentagens, razes e Total 183 226
taxas)-foram discutidos e ilustrados. Examinaram-se, tambm, as caractersticas de
distribuies de freqncias simples, agrupadas e acumuladas com relao a dados
ordinais e intervalares. Finalmente, apresentou-se o procedimento que permite obter Calcular: (a) a porcentagem de crianas pretas que possuem dois genitores; (b) a
o posto percentil de um escore bruto.
porcentagem de crianas brancas que possuem dois genitores; (c) a proporo de
crianas negras que possuem dois genitores; (d) a proporo de crianas brancas que
tm dois genitores.
3. Num grupo de 4 sujeitos de alta realizao e 24 de baixa realizao, qual a razo
PROBLEMAS
1. Usando os dados do quadro abaixo, onde aparecem telespectadores e nao-telespec-
dos primeiros para os segundos?
4. Num grupo de 125 machos e 80 fe'rneas, qual a razo macho/fmea?
tadores, reclassificados quanto ao seu grau de reafizao, calcular: (a) a porcentagem
dos que no so telespectadores, porm grandes realizadores; (b) a porcentagem dos
5. Num grupo de 15 crianas negras e 20 brancas, qual a razo negros/brancos?
6. Se 300 crianas nascem vivas entre 3.500 mulheres (em idade compatvel com gra-
telespectadores que sNo grandes realizadores; (c) a proporo de no-telespectadores
que so grandes realizadores; (d) a proporo de telespectadores que so grandes videz), qual a taxa de nascimento?
realizadores.
7. Qual a taxa de mudana de uma populao que cresce de 15.000 habitantes em
1950 a 25.000 habitantes em 1970?
Rea lizao versus Assistncia a Programas 8. Transforme a seguinte distribuio de escores numa distribuio de freqncias
de Televiso agrupadas com quatro intervalos de classe e (a) determine o tamanho dos intervalos
de classe; (b) indique os fimites superior e inferior de cada classe; (c) identifique o
ponto mdio de cada intervalo de classe; (d) calcule a freqncia acumulada para
Situao
cada intervalo de classe; (e) calcule a porcentagem acumulada para cada intervalo de
No-telespectadores Telespectadores classe.
Realizao
Escores 41)4
Alta realizao 46 011111/eRSIDADt- Z
Baixa realizao 90 127
Total 183 173 FEIVRAL

cent
2. 0 quadro seguinte representa (para uma dada regio) a estrutura familiar de crianas r.R.1 1341Z4
pretas e crianas brancas.
I..moimm....,..0
"conveno", h uma lgica defensivel por trs disso: ho de ser normais os sujeitos que, relativa-
mente a uma dada varivel, ocupem, pelo menos, 50% da distribuio. Esses 50% devem ocupar o
"centro" da distribuio, ficando os 50% restantes divididos em duas pores de 25%, uma esquerda,
outra direita. Os 25% da esquerda so chamados subnormais e os 25% da direita, supernormais.
'A3NP ......
Finalmente, chamando o 1.0 quartil de Q1, e o 30 quartil de Q3, define-se a amplitude do intervalo
de normalidade pela diferena (Q3 - Q1). pi.N6 PDFCompressor
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION 113-Voo
34 DESCRIO

9. Na seguinte distribuiao de escores, calcule o (posto)* percentil relativo a (a) 75;


(b) 52.

Intervalo de Classe

90-99
80-89
6
9
fa

48
42
3
70-79 10

Representaes
33
60-69 10 23
50-59 8 13
40-49 5 5

N= 48

10. Na seguinte distribuio de escores, calcular o


Grficas
(posto) percentil para (a) 36; (b) 18.

Intervalo de Classe

40-44 5
35-39 5
30-34 8
25-29 9
20-24 10
15-19 8
10-14
Colunas numricas j conseguiram despertar medo, aborrecimento, apatia e mal-enten-
6
5-9 5
didos. Enquanto que algumas pessoas parecem "desligar-se" ao serem expostas a infor-
maes estatsticas em forma tabular, numrica, elas podem prestar bastante ateno As
N = 56
mesmas informaes apresentadas em forma grfica ou pictrica. Da resulta que muitos
pesquisadores e autures preferem usar grficos em substituio a tabelas numricas.
Razes semelhantes levam pesquisadores a utilizar, comumente, grficos tais como
os setoriais, grficos de barras, polgonos de freqncia etc., num evidente esforo
de tornar mais legveis as suas investigaes.

GRAFICOS SETORIAIS
O grfico setorial (ou de setor) um dos mais simples recursos grficos, posto que con-
siste em um crculo cujos setores (isto , partes do mesmo crculo) somam 100%. Os
grficos setoriais so particularmente teis quando se trata de visualizar diferenas
freqenciais entre algumas categorias de nvel nominal. Ilustrando: A Figura 3.1 repre-
senta a origem urbana, suburbana ou rural de uma populao de 2.000 universitrios.
Note-se que 70% desses alunos vm de reas suburbanas, enquanto que apenas 12% de
Areas rurais.*

* N.T.: Ndo se tome ao p da tetra essa repartio porcentual, uma vez que (a) a sociedade-referencia
a norte-americana; (b) essas porcentagens referem-se a um particular universo de universitrios.
Nada garante, portanto, que mesmo nos Estados Unidos todas as universidades apresentem igual
N.T.: So nnirnas as expresses percentil e posto percentil.
PDF
*
compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
s
repartieo de clientela.
36 DESCRIO
Representarcies Grficas 37

SO

70

Origem dos Alunos 60


Ocupao (= Profissifo) 50
(Q)
40
Urbana 240 12 A = Artesanato 52
Suburbana 1.400 30
70 B = Trabalho no qualificado 65
Rural 360 18 C = Gerencial 29 20
Total 2.000 D = Servios burocrticos 34 10
100
O
Total 180
Artesanato Trabalho Gerencia Servios
No quali- Burocrticos
ficado
Profisso do Respondente
FIGURA 3.1 Origem Urbana, Suburbana e Rural de uma Populao de 2.000 Universitrios
FIGURA 3.3 Grfico de Barras Ilustrativo de uma Distribuio Ocupacional
GRFICOS DE BARRAS na linha de base horizontal ( ou eixo dos X) marcam-se os valores ou as categorias (no
0-grfico de setores ilustra, de modo fcil e rpido, dados que podem ser subdivididos presente exemplo so classes sociais); na linha vertical (ou eixo dos Y) localizam-se as
em algumas categorias. Comparativamente, o grfico de barras (ou histograma) freqncias relativas a cada categoria ou a cada valor. (No caso de dados agrupados, so
pode
"acomodar" qualquer quantidade de categorias de qualquer nvel de mensurao e, por os pontos mdios dos intervalos de classe que se colocam no eixo dos X.) Note-se que
isso, muito mais usado em pesquisas. as freqncias de cada valor (da varivel) so indicadas por barras retangulares, e de
Examinemos o grfico de barras, Figura 3.2, que ilustra a distribuio de frecitieU- conformidade com o seguinte critrio: quanto mais alta a barra, maior a freqiincia de
cia de classes sociais. Esse grfico construdo de acordo com o seguinte procedimento:. ocorrncia.
Na Figura 3.2 as barras retangulares foram unidas a fim de enfatizarem-se as
50 - diferenas entre os vrios graus de status representados por diferentes classes sociais.
Acrescente-se a isso o seguinte: as classes sociais foram localizadas no eixo horizontal
- em ordem crescente, isto , da mais baixa para a mais alta. Esse, alis, o critrio
convencional adotado na construo de grficos de barras em que a varivel de obser-
30
vao de nvel ordinal oti de nvel intervalar.
C1ass\4ocia1 ag Nos grficos de barras em que a varivel observacional categrica, isto , de
,D 20
Lu
nvel nominal, as barras devem apresentar-se separadas, pois, do contrrio, sua unio
A 5 poder implicar continuidade. Alm disso, as categgrias resultantes de variveis nominais
10
14 podem ser dispostas em qualquer ordem ao longo do eixo horizontal. 0 grfico de
23 barrs da Figura 3.3 ilustra bem essa caracterstica.
45 O

38
25
Total
POLGONOS DE FREQNCIAS
150
Outra representao grfica comumente usada o polkono de freqncias. Muito
Classe Social do Respondente embora o polgono de freqncias tenha flexibilidade bastante para ajustar-se a uma
ampla variedade de situaes, ele tende a sugerir muito mais continuidade do que
FIGURA 3.2 Grfico de Barras Ilustrativo de uma Distribuio de Classes Socials* discriminaed; da sua particular utilidade na representao de dados ordinais ou inter-
valares. Isto acontece porque as freqncias so indicadas por uma srie de pontos
* N.T.: A classificao mais usual no Brasil a da ABA (Associao colocados exatamente acima (numa vertical) dos valores constantes do eixo dos X ou,
Brasileira de Anunciantes).
Essa classificao distribui os indivduos em quatro classes scio-econmicas-A,
B, C. D-, onde quando for o caso, exatamente acima dos valores que representam_os pantos mdios
A a classe mais alta e D, a mais baixa, e basta, para tanto, levar em jos intervalos de classe. Esses pontos so, a seguir, unidos por segmentos de retas
conta os itens e a pontuao
indicados no Apendice D.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor (donde-o nome "po-lgonos"), sendo que, em ambas as extremidades, a linha poligonal,
38 DESCRIO
Representaes Grfieas 39

graas a um prolongamento convencional, toca o eixo dos X. Como bem demonstra


a Figura 3.4, a altura de cada ponto indica a freqncia com que cada valor particular Intervalo de Classe f fa 350
ocorre. 75 1-8 00 6 336 300
701-750 25 330
651-700 31 305 250
Intervalo de Classe 601-650 30 274
551-600 35 244 200
501-550 55 209
136-145 11 1 50
45 1-5 00 61 154
126-135 16 401-450 48 93
116-125 29 100
351-400 33 45
106-115 40 301-350 12 12
96-105 44 50
86-95 25 N = 336
76-85 13 0
Total 178 80,5 90,5 100,5 110,5 120,5 130,5 140,5
Qls dos Respondentes Expressos
pelos Respectivos Pontos Mdios Limite Superior do
Intervalo de Classe
FIGURA 3.4 Polgono de Freqncias de uma Distribuio de QIs**
FIGURA 3.5 Polgono de Freqncias Acumuladas. Dados da Tabela 2.8
Quando o problema representar graficamente freqncias acumuladas (ou
porcentagens acumuladas), possvel construir o chamado polgono de freqncias a linha poligonal que une os pontos num grfico de freqncias acumuladas no pode ser
acumuladas* Na Figura 3.5, as freqncias acumuladas esto marcadas no eixo ver- "amarrada" ao eixo das abcissas. A razo desse fato que estas freqncias representam
tical e so indicadas pela altura, isto , pela distncia de cada ponto at a linha de um conjunto de adies sucessivas. Uma freqncia acumulada qualquer nunca menor
base. Contrariamente ao que ocorre com um polgono de freqncias (ver Fig. 3.4), (e geralmente maior) do que a freqncia acumulada precedente. Acrescente-se, ainda,
que os pontos num grfico cumulativo so marcados sobre perpendiculares levantadas a
* N.T.: Prolongar a linha poligonal em ambas as extremidades um recurso que permite "aterrizar" o partir dos limites superiores de cada intervalo de classe, coisa que no ocorre com o
desenho, que, de outra forma, ficaria como que "solto" no quadrante determinado pelas coordena-
das cartesianas ortogonais. O critrio geralmente aceito para essa "aterrizagern" o seguinte: unir
polgono de freqncias comum, onde as marcaes tm como referncia os pontos
a extremidade esquerda da linha poligonal ao valor terico que antecede o primeiro valor real da mdios das classes. Isto explica-se pelo fato de que qualquer freqncia acumulada
tabela, e a extxemidade direita ao valor terico que sucede o Ultimo valor real da mesma tabela. representa o nmero total de sujeitos compreendidos, ao mesmo tempo, dentro e abaixo
**N.T.: prtica no s comum, mas tambm bastante aconselhvel, no unir a extremidade esquer- de um intervalo de classe particular.
da da linha poligonal origem zero do sistema de coordenadas. Isto porque, se houvesse um valor
anterior a 80,5, com certeza ele seria 70,5 e no 0 (zero). Ento, contorna-se o problema "sanfonan- CONSTRUO DE GRFICOS DE BARRAS E DE POLGONOS DE FREQENCIAS
do" uma parte do eixo das abscissas, conforme indicado abaixo:
As regras e procedimentos apresentados a seguir podem ser aplicados tanto construo
de diagramas de barras quanto a de polgonos de freqncias:
1.Por questo de tradio e para evitarem-se confuses, o pesquisador sempre
dispe os valores mensurados (escores) ao longo do eixo horizontal, e as
freqncias (ou as porcentagens) no eixo vertical.*
2. Todos os componentes de um grfico devem ter nome. A linha de base hori-
zontal costuma representar uma caracterstica** (por exemplo, a idade do
* N.T.: Isso nem sempre assim. Talvez fique mais fcil (ou prtico)
estabelecer o seguinte: no eixo
das abscissas escrevem-se os valores da varitivel independente (designada por V.I.) e, no eixo das
0 70,5 80,5 90,5 ordenadas, os valores correspondentes da varidvel dependente, ou fungi (designada por V.D.).
**N.T.: Essa caracterstica, na verdade, o prprio nome da varivel que constitui objeto de investi-
gao. conveniente identificar seu nvel de mensurao e, alm disso, observar o que foi dito na
***N.T.: polgono de freqncias acumuladas tambm conhecido por ogiva de Galton.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
O
nota de rodap anterior sobre variveis independentes e dependentes.

A.
40 DESCRIO Representaces Grficas 41

respondente); a linha vertical costuma ser rotulada de acordo com o que se Existem vrios tipos de distribuies assimtricas ou enviesadas. Quando os
pretende representar (freqencias ou porcentagens), sendo que os valores nu- escores se amontoam num dos lados da curva assimtrica, a distribuio apresenta
mricos correspondem a pontos situados ao longo dos eixos. Alm disso, todo uma cauda acentuada. A posio dessa causa indica o sentido da assimetria, sentido
grfico deve ter um ttulo capaz de indicar a natureza dos dados ilustrados. esse que aponta para o lado onde se situam os escores mais extremos.
3. Na construo de um grfico, o comprimento do eixo vertical deve ser 75% A distribuio (a) da Figura 3.7 assimtrica negativa (enviesada para a esquer-
do comprimento do eixo horizontal. Tal procedimento introduz uma forma da), uma vez que sua cauda muito maior do lado esquerdo do que do lado direito.
relativamente padronizada de construir grficos e reduz ao mnimo fontes de Essa distribuio mostra que a maioria dos respondentes recebeu notas altas, e que
confuso potencial.* somente alguns receberam notas baixas. Se essa fosse a distribuio dos resultados
4. 0 primeiro ponto do eixo vertical-o ponto onde o eixo vertical cruza com o de um exame final, poderamos dizer que a maioria dos estudantes saiu-se muito bem,
horizontal-deve ser sempre zero, uma vez que qualquer outro procedimento enquanto que apenas alguns "rodaram".
poderia fornecer uma imagem distorcida dos dados.

(a) (b) (e)


(a) Leptocrtica (b) Platicrtica (c) Mesocrtica FIGURA 3.7 Trs Distribuies Representativas do Sentido da Assimetria
FIGURA 3.6 Variaes em Curtose entre Distribuies Isomtricas
Observe-se em seguida a distribuio (b), cuja cauda est direita. Uma vez que
a assimetria uma funo do sentido da cauda, podemos dizer que essa distribuio
FORMA DE UMA DISTRIBUIO DE FREQENCIAS assimetrica positiva (ou enviesada direita). Os resultados do exame final dos alunos
Os processos grficos podem ajudar-nos a visualizar a imensa variedade de figuras e dessa nossa classe hipottica seriam bem baixos!
formatos que as distribuies de freqencia assumem. Algumas distribuies so sime- Finalmente, vamos examinar a distribuio (c), que contm duas caudas identicas.
tricas: "dobrando-se"a curva ao meio as duas metades coincidem. Portanto, tais distri- Em tal situao h, em ambas as caudas, a mesma quantidade de escores extremos. A
buies contm o mesmo nmero de escores extremos em ambos os lados (escores simetria dessa distribuio absoluta. Se esta fosse a distribuio dos resultados de
altos do lado direito e escores baixos do lado esquerdo):"Outras distribuies, de- nosso exame final, teramos um nmero grande de estudantes cujas notas estariam
nominadas assimetricas, apresentam maior quantidade de dados extremos numa das prximas da mdia, e poucos estudantes com notas muito altas ou muito baixas.
caudas.
As chamadas distribuies simtricas apresentam considervel variao. Por
RESUMO
exemplo, elas podem diferir acentuadamente em termos de alongamento (ou curtose).
As representaes grficas de dados podem ser usadas para aumentar
As distribuies simtricas, tais como as da Figura 3.6, podem ser: (a) leptocrticas a legibilidade
(bastante pontiagudas ou altas); (b) platicarticas (quando so achatadas); (c) meso- de resultados de pesquisas. Nosso estudo de representaes grficas abrange grficos
carticas (quando no so nem muito pontiagudas nem muito achatadas). Um tipo de setoriais, grficos de barras e polgonos de freqncias. Os grficos setoriais servem
distribuio simtrica mesocrtica (ver Figura 3.6(c)) a curva normal, que tem espe- para ilustraes simples de dados que podem ser classificados em algumas categorias.
cial importncia na pesquisa. (A curva normal ser estudada pormenorizadamente Os grficos de barras so de uso mais generalizado, j que tm a propriedade de acomo-
no Captulo 6.) dar qualquer quantidade de categorias. Os polgonos de freqncias tambm gozam
dessa elasticidade, mas so particularmente teis quando se trata de representar dados de
* N.T.: 0 procedimento indicado na nota 3, acima, irrelevante uma vez que a interpretao do natureza ordinal ou intervalar, pois o "efeito de continuidade" torna-se mais evidente.
fenmeno posto em grfico depende apenas das escalas de medidas usadas e nab do comprimento As variaes na forma das distribuies podem ser caracterizadas em termos de
dos eixos. slmetria ou, conforme haja um acmulo de dados extremos na cauda esquerda ou na
PDF compression,
**N.T.: As extremidades esquerda OCR, web
direita de uma
e optimization
curva so using a watermarked evaluation copy of CVISION PDFCompressor
comumente chamadas caudas. cauda direita da curva, em termos de assimetria positiva ou negativa.
Medidas de Tendncia Central 43

freqencias mximas, que sugerem o costado de um camelo. Essas distribuies so

4 chamadas de bimodais, em contraste com a variedade mais comum, unimodal, que tem
apenas uma corcova-ou ponto de freqncia maxima (ver Figura 4.1).

TA BELA 4.1 Procedimento para Encontrar a Moda numa Distribuio de Freipiencias.-pom


Isolados
I/09s

Medidas de
Valores

7 2
6 3

Tendncia Central 5
Mo 4. 4
3
2
4-

4
3
1 2
Pesquisadores em muitos campos te'm usado o termo "mdia" em questes tais como:
Total 23
qual a renda mdia de colegiais e universitrios j graduados? Quantos cigarros fuma,
em mdia,o adolescente? Qual a nota mdia de uma universitria? Em mdia, quantos
so os acidentes automobilsticos que resultam diretamente da ingesto de lcool ou MEDIANA
drogas?
Quando dados ordinais ou intervalares so dispostos por ordem de tamanho, torna-se
Uma forma til de descrever um grupo como um todo consiste ern encontrar
possvel localizar a mediana (Md), que corresponde ao ponto central da distribuio.
um nico nmero que represente o que "medic)." ou "tpico" naquele conjunto
particular de dados. Em pesquisa, tal valor conhecido por medida de tendncia central,
uma vez que ela geralmente se localiza em torno do meio ou centro de uma distribui-
.2
o-onde a maior parte dos dados tende a concentrar-se. <a

A idia que o leigo faz do termo "media" quase sempre vaga e mesmo confusa. o
A concepo do pesquisador muito mais precisa do que a do pblico em geral; ela
expressa numericamente como uma das vrias espcies de "medidas mdias"-ou Unimodal Bimodal
de tendncia central-que, para um mesmo conjunto de dados, pode assumir diferentes
valores. Somente as trs medidas de tendncia central mais conhecidas so aqui discuti- FIGURA 4.1 Representaes Grficas de uma Distribuio Unimodal e de uma Bimodal
das: a moda, a mediana e a media aritmtica.
Portanto, a mediana considerada a medida de tendncia central que corta a distri-
buio em duas partes iguais.
MODA Se estivermos diante de uma distribuio com nmero npar de dados, a mediana
Para obter a moda (Mo), procure simplesmente o escore ou categorfa que, numa dis- sera o dado que cai exatamente no meio da distribuio. A posio do valor mediano
tribuio, ocorre com maiw freqncil. A moda pode ser localizada com muito mais pode ser determinada pelo exame dos dados ou pela formula:
facilidade por exame do que por clculo. Por exemplo, no conjunto de escores 0,
2, 3,0 0,'
0,
6, 5, 4, 4, 4, 3, a moda 1, uma vez que 1 o nmero que ocorre com Posio da mediana =
+ 1

maior freqncia no conjunto (quatro vezes). 2 7


No caso de uma distribuio de freqncias com dados isolados, onde os escores
e as freqncias figuram em colunas separadas, a moda o valor (escore) que aParece Assim, 16 o valor mediano na distribuio 11, 12, 13, 1.6), 17, 20, 25; em outras
mais amide na tabela. Portanto, na distribuio de freqncias da Tabela 4.1, Mo = 4. palavras, 16 o valor que divide a distribuio de tal forma que, de ambos os lados, h
Algumas distribuies de freqncias apresentam duas ou mais modas. No seguinte igual quantidade de dados. De acordo com a frmula, (7 + 1)12, vemos que a mediana,
conjunto de dados, por exemplo, os escores 2 e 6 ocorrem ambos com igual freqncia 16, o quarto valor da distribuio independentemente do lado por onde se inicie a
alta: 6, 6, 7, 2, 6, 1, 2, 3, 2, 4. Graficamente, tais distribuies tm dois pontos de
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
contagem.
44 DESCRIO Medidas de Tendncia Central 45

Se o nmero de dados for par, a mediana ser sempre aquele ponto da distribuio mais baixo, vamos somando as freqncias at chegar a um valor que contenha o dcimo
que antecedido e precedido por igual nmero de dados.* Para uma distribuio com segundo escore da distribuio. No exemplo em foco, o valor do escore mediano 4.
nmero par de dados, sempre h dois valores considerados "centrais". Ilustrando: os
nmeros 16 e 17 representam os dados centrais na seguinte distribuio: 11, 12, 13,
0,
0, 20 25, 26. Pe la frmula, (8 + 1)12 = 4,5, o que significa que a mediana vai
cair entre o quarto e o quinto valores; o ponto central dessa distribuio vai,
MDIA ARITMTICA
Sem sombra de dvida, a medida de tendncia central mais comumente usada a mdia
ser 16,5, uma vez que ele fica precisamente no meio de 16 (4.0 valor) e 17 (5.0 valor). aritmtica, X , cujo clculo consiste em somar um conjunto de escores e dividir o total
Por igual raciocnio, a mediana 9 na seqncia 2, 5,C), 0,
11, 12, porque est pelo nmero de parcelas. Portanto, podemos definir mdia aritmtica, mais formal-
mente, como a soma de um conjunto de escores dividida pelo namero de escores desse
situado exatamente entre os dois dados centrais, ou seja, (6 + 1)/2 = 3,5.
Outra circunstncia que precisa ser explanada e ilustradi, caracteriza-se pelo
.
conjunto. Em smbolos:
clculo da mediana de uma distribuio em que figuram, na regio central, vrios dados
numericamente idnticos. A soluo simples: a uele valor particular constitui a me-
diana. Assim, na seqncia 11, 12, 13,
de esse valor ocorrer mais de uma vez.
25, 26, 27, a mediana 16, apesar
X = -
EX
, onde

= mdia (leia-se "xis-barra")


Obteno da Mediana numa Distribuio de Freqncias com Dados,Isolados = soma (expressa pela letra grega, maiscula, "sigma")1
Para encontrar a mediana de dados dispostos numa tabela de freqncias simples, X= qualquer escore bruto do conjunto (isto , a prpria varivel)
iniciamos com o procedimento apresentado acima. No caso da Tabela 4.1, N= total de escores do conjunto.

23 + 1 24 Usando a frmula acima, verificamos que o QI mdio dos oito respondentes


Posio da mediana = = 12
2 2 arrolados na Tabela 4.3 108.

A mediana vem a ser o dcimo segundo valor nessa distribuio de freqncias. Para TABELA 4.3 Clculo da Mdia Aritmtica: Uma Ilustrao
facilitar a localizao desse dcimo segundo escore, poderamos construir uma distri-
buio de freqncias acumuladas, tal como ilustra a terceira coluna da Tabela 4.2 Respondentes X(QI)
(para um pequeno nmero de escores isso pode ser feito de cabea). A partir do escore
Benedito 125
Francisco 92 EX
TABELA 4.2 Localizao da Mediana numa Distribuio de Freqncias de Dados Isolados Sara 72
Miguel 126
Jesufno 864
Valores dos Escores fa 120 =
Helena 8
99
Benjamim 130
7 23 Paulo 100 = 108
6 3 21
5 4 18 EX = 864
Md 4 5 14
Em oposio ao que acontece com a moda,,a mdia nem sempre o escore que
3 4 9
ocorre com maior freqncia. Tambm, ao contrrio do que se passa com a mediana, a
2 3 5
1 2 2 nidia no e necessariamente o ponto central de uma chstribuio. O que, ento, sig-
Total 23
nifica media? Dque maneira ela pode ser interpretada? Veremos adiante que a mdia
.
pode ser tomada como o "centro de gravidade", isto , o ponto de qualquer distribuio

* N.T.: De acordo com o texto original, a traduo deveria ser: aquele ponto acima e abaixo do
qual ocorrem 50% dos valores da distribuio. Esta afirmao foi evitada no corpo do texto por A letra maiscula grega sigma, (E), ser observada vrias vezes ao longo do texto. Ela indica
sim-
tratar-se de uma incoerencia. De fato, se antes da Md h 50% dos escores, e depois dela tambm plesmente que devemos somar ou adicionar os valores da varivel em foco. No exemplo presente,
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
50% de escores, evidente que 50% + Md + 50% > 100%, o que um absurdo!
EX indica a soma de todos os escores brutos.
46 DESCRIO Medidas de Tendncia Central 47

em torno do qual se equilibram as discrepncias positivas e negativas. A fim de que seja serve perfeitamente. Entretanto, quando estamos diante de um nmero maior de dados,
possvel perceber essa caracterstica da mdia, devemos primeiro entender o conceito de pode ser mais prtico e menos demorado calcular a mdia de uma distribuio de
disf:repncia, que nada mais seno a distncia da media a qualquer escore bruto. Para freqUncias (dados isolados) pela frmula
calcular uma determinada discrepncia, basta subtrair a mdia afitmtica de qualquer
escore bruto dado. Em smbolos:

x = X - X , onde
-
X = -
EfX
, onde

x = escore-discrepncia ou simplesmente discrepncia (sempre simbolizada por x,


isto , "xis minsculo")
x=
fx
=

=
mdia
um escore bruto qualquer da distribuio (isto , a prpria varivel)
um escore qualquer multiplicado pela respectiva freqncia de ocorrncia
X = qualquer escore bruto da distribuio
EfX = soma dos fX's
= mdia aritmtica.
N= total de escores.
TABELA 4.4 Discrepncias de um Conjunto de Escores Brutos com Relao a X
A Tabela 4.5 ilustra o clculo da mdia de um conjunto de dados isolados (porm
X
afetados de freqncias).

TABELA 4.5 Clculo de X de uma Distribuio de Freqncias Simples (Dados Isolados)


9
+ 5
8
6 X = 6 fX
4
3
-5
8 2 16
7 3 21
Uma vez que X = 6 para o conjunto de escores brutos 9, 8, 6, 4 e 3, o valor X = 9 6 5 30
fica exatamente trs unidades acima da mdia 6 (ou X = 9-X -6
= + 3). De modo
5 6 30 =EfX 132
4,71
anlogo, o escore bruto 4 fica duas unidades abaixo da mdia (ou X =4 -X
= 2). -6 - 4
3
4
4
16
12
Concluso: quanto maior a discrepncia x, tanto maior a distncia entre um determi- 2 3 6
nado escore bruto e a mdia da distribuio. 1 1 1

Considerando-se a mdia como o ponto de equilbrio da distribuio, pode-se N = 28 EfX =132


dizer, agora, que a soma das discrepncias situadas acima da mdia igual, em valor
absoluto (descartados os sinais "menos"), soma das discrepncias que ficam abaixo
dela. Vamos voltar a um exemplo anterior-o conjunto de escores 9, 8, 6, 4, 3, onde
X = 6. Se a mdia dessa distribuio for seu "centro de gravidade", ento, desprezando COMPARAO ENTRE MODA, MEDIANA E MEDIA
os sinais "menos" e somando as discrepncias positivas (discrepncias relativas aos H um momento em que o pesquisador procura uma medida de tendncia central para
escores 8 e 9), o resultado deve ser igual ao obtido mediante a soma das discrepncias a sua situao particular de pesquisa. Empregar ele a moda, a mediana ou a mdia? Sua
negativas (isto , relativas aos escores 4 e 3). Como evidencia a Tabela 4.4, precisa- deciso envolve vrios fatores tais como:
mente esse caso-j que a soma das discrepncias abaixo de X (- 5) igual soma das 1. onvel de mensurao;
discrepncias acima de X (+ 5). 2. oaspecto ou forma de sua distribuio de dados e
Vamos a mais um exemplo: 4 a mdia de 1,2, 3, 4, 5, 6 e 7. Observe-se que a 3. o objetivo da pesquisa.
-
soma das discrepncias abaixo desse escore 6, enquanto que a soma das discrepn-
cias acima dele + 6. Voltaremos a examinar o conceito de discrepancia nos Captulos Nfvel de Mensurao
5 e 6. Uma vez que a moda requer apenas o conhecimento das freqncias, ela pode ser
calculada para qualquer conjunto de dados, sejam eles do nvel nominal, ordinal ou
-
Cilculo da Media de uma Distribuio de Freqncias (com Dados Isolados) intervalar. Por exemplo, poderamos estabelecer que a categoria modal do nvel nomi-
=EXIN
Para obter-se a mdia de um pequeno nmero de escores, a frmula bsica X
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
nal da varivel "filiao religiosa" (protestante, ea-taco ou judeu) protestante, se a
48 DESCRIO Medidas de Tendncia Central 49

maioria dos nossos respondentes se identificassem como tais. Similarmente, poderamos A Figura 4.3 mostra que a moda, a mediana e a mdia no coincidem em dis-
dizer que a maioria dos estudantes freqentadores de uma dada universidade apresenta tribuies assimtricas, muito embora suas posies rekttivas permanecam constantes;
uma nota mdia 2,5 (Mo = 2,5). dito de outra forma, no sentido "pico"/"cauda", a ordem sempre da moda para a
A mediana exige uma ordenao de categorias, da mais alta mais baixa. Por essa mdia, com a mediana entre esses dois pontos. A moda a que cai mais perto do "pico"
razo, ela s pode ser obtida a partir de dados ordinais ou intervalares, mas nunca de da curva, j que ela corresponde ao ponto da escala cujo valor mais freqente. A
dados nominais. Ilustrando: poderamos descobrir que a renda anual mediana de den- mdia, ao contrrio, a que est mais prxima da "cauda", onde se situam os escores
tistas de uma pequena cidade da ordem de Cr$ 289.000,00. Esse resultado fornece-nos extremos (e poucos). Por essa razo, o escore mdio numa distribuio positivamente
um critrio slido para o exame da tendncia central de nossos dados. Contrariamente, assimtrica (Figura 4.3(a)) localiza-se entre os escores mais altos; a mdia numa distri-
faria pouco sentido calcular a mediana de escalas de filiao religiosa (protestante, buio negativamente assimtrica (Figura 4.3(b)) cai perto dos escores mais baixos.
catlico ou judeu), sexo (masculino ou feminino), ou pals de origem (Inglaterra, Polnia,
Frana ou Alemanha), onde no foi feita uma atribuio de postos (escalonamento).
O uso da mdia est restrito exclusivamente a dados intervalares. Calcular a mdia
de dados ordinais ou nominais d origem a um resultado sem sentido, que em geral no
indica a tendncia central. Que sentido faria o clculo da mdia de uma distribuio a
<CD
onde a varivel fosse filiaco religiosa ou sexo? Embora seja menos bvio, igualmente :0
C.
inapropriado calcular a mdia de dados que podem ser graduados porm no medidos.

Forma da Distribuio
O aspecto ou forma de uma distribuio outro fator que pode influenciar o
pesquisa-
dor na escolha de uma medida de tendncia central. Numa distribuio unimodal e Mo Md Md Mo
perfeitamente simtrica, a moda, a mediana e a mdia sero idnticas, uma vez que o (a) (b)
ponto de freqncia mxima (Mo) tambm o valor "mais" central (Md) e o "centro
de gravidade" dos dados (X). Como demonstra a Figura 4.2, as medidas de tendncia FIGURA 4.3 Posies Relativas de Medidas de Tendncia Centrah (a)-Distribuio Positivamente
central coincidiro no ponto central, exatamente no "pico" da distribuio simtrica. Assimtrica e (b)-Distribuio Negativamente Assimtrica
Quando o pesquisador trabalha com uma distribuio simtrica, a escolha de
uma medida de tendncia central baseia-se principalmente nos objetivos particulares Enquanto que a mdia muitssimo influenciada pelos escores extremos (ern
de sua investigao e no nvel em que seus dados foram colhidos. Entretanto, quando ambos os sentidos), a mediana sofre pouca ou nenhuma influncia de alteraes nos
ele trabalha com uma distribuio assimtrica, sua deciso muito influenciada pelo valores extremos. Isto porque a mdia considera todos os escores de qualquer distri-
formato dos dados de que dispe. buio, enquanto que a mediana (por definio) s se preocupa com o valor numrico
do escore que ocupa a posio "mais" central. Como ilustrado abaixo, a mudana do
valor de um escore extremo de 10 (distribuio.a) para 95 (distribuio b), no modifica
de maneira nenhuma o valor da mediana (Md = 7,5), enquanto que a mdia pula de
7,63 para 18,25.

distribuio A: 5 6-6 7 8 9 10 10 Md = 7,5 X = 7,63


distribuio B: 5 6 6 7 8 9 10 95 Md = 7,5 X = 18,25
Numa distribuio assimtrica, a mediana sempre cai em algum lugar entre a
mdia e a moda. 8 essa caracterstica que a torna a medida de tendncia central mais
desejvel para descrever uma distribuio assimtrica. Para ilustrar essa vantagem da
Mo mediana, voltemo-nos para a Tabela 4.6 e examinemos o salrio anual "mdio" dos
Md empregados que trabalham numa pequena corporao. Se trabalhssemos no departa-
X
mento de relaes pblicas dessa corporao e desejssemos angariar-lhe uma imagem
Distribuio Unimodal, Simtrica, com a Localizao da Moda, da Mediana e da pblica favorvel, calcularamos, talvez, a mdia, a fim de demonstrar que o empregado
Mdia (onde Mo =Md =17) "tpico" ganha Cr $306.000,00 (por ano), e , portanto, relativamente bem pago. Por
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
50 DESCRIO Medidas de Tendncia Central 51

outro lado, se a's fssemos representantes sindicais e estivssemos procurando melhorar nesse grupo de respondentes: uma com urn nmero bastante grande de pessoas (Mo = 8)
os nveis salariais, iramos provavelmente empregar a moda para demonstrar que o e outra com apenas algumas pessoas (Mo = 3).
salrio anual "mdio" de apenas Cr $ 17.000,00, o que representa uma quantia bas- TA BELA 4.7 Coneepes Ideais de Tamanho de Familia numa Amostra de 26 Respondentes de
tante reduzida. Para finalizar, se fssemos pesquisadores sociais desejosos de dar uma Renda Baixa. (Distribuio Bimodal)
informao acurada do salrio "mdio" dos empregados dessa corporao, emprega-
ramos, inteligentemente, a mediana (Cr $51.000,00), uma vez que esse valor cai entre Tamanho Ideal de Famlia
as outras medidas de tendncia central e, portanto, oferece um quadro mais equilibrado
da estrutura salarial. O mtodo mais aceitvel seria indicar as tits medidas de tendncia 10 1

central e permitir que os interessados interpretassem os resultados. Infelizmente 9 2


8 6
verdade que poucos pesquisadores sociais-no contando os relaes pblicas e os
7 3
lderes sindicais-indicam mais do que uma (mica medida de tendncia central. 6 2
5 1

4 2
TABELA 4.6 Medidas de Tendncia Central numa Distribuio Assimtrica de Salsios Anuais
3 6
2 2
Salrio Medido em Cruzeiros (6$) 1 1

N = 26
1.700.000,00
425.000,00
170.000,00 X = Cr $306.000,00 Objetivo da Pesquisa
85.000,00 At aqui, discutimos a escolha de uma medida de tendncia central em termos do nvel
17.000,00 Md = Cr $ 51.000,00 de mensurao e da forma de uma distribuio de escores. Perguntamos agora: que o
17.000,00 pesquisador espera fazer com a medida de tendncia central escolhida? Se el procura
17.000,00 Mo = Cr$ 17.000,00 uma medida descritiva que seja rpida, simples, ainda que grosseira, ou se ele estiver
trabalhan do com uma distribuio bimodal, ele geralmente empregar a moda. Na maioria
das situaes com que um pesquisador se defronta, entretanto, a mod.`' s til como
Ainda mais grave o fato de que alguns relatrios de pesquisa no especificam de forma um indicador preliminar de tendncia central, que pode ser obtida com rapidez a partir
exata a medida de tendncia central-moda, mediana ou mdia-que foi usada para de um exame cuidadoso dos dados. Se ele procura uma medida de tendncia central que
calcular a quantia ou posio "mdia" de um grupo de escores. Como demonstrou a seja exata,* a deciso fica geralmente entre a mediana e a mdia.
ilustrao anterior, uma interpretao razovel de certos dados pode tornar-se literal-
mente impossvel sem tal informao.
* N.T.: Muito embora o uso popular tenha tornado sinnimas as palavras preciso e exatido, do
Salientou-se pginas atrs que algumas distribuies de frequncias podem ser
ponto de vista formal estamos diante de coisas diferentes. Um instrumento preciso quando, em
caracterizadas como bimodais, uma vez que elas contm dois pontos de freqncia sucessivas mensuraes da mesma magnitude, ele apresenta um erro constante. Um instrumento
maxima. Para descrever adequadamente distribuies bimodais, , em geral, til identi- preciso caracteriza-se pela preciso.
ficar ambas as modas; aspectos importantes de tais distribuies podem ser encobertos Um instrumento exato quando, em sucessivas mensuraes da mesma magnitude, o erro
se a mediana ou a mdia forem usadas. varivel (para mais ou para menos), porm a mdia aritmtica de todas as mensuraes representa
o Valor mais provvel da dita magnitude. Por isso, a mdia aritmtica representa o valor exato bus-
Considerem a situao em que um pesquisador realizou entrevistas pessoais com
cado. O instrumento que produz mensuraes exatas caracteriza-se pela exatido.
26 respondentes de renda baixa, a fim de estabelecer seus conceitos ideais de tamanho Exemplificando: Se um objeto pesa realmente 2 kg, pesado com uma balana exata repetidas
de famlia. A cada um deles foi dito o seguinte: "Suponha que voc pudesse decidir vezes, as mensuraes resultantes podero ser: 2,1 kg; 2,2 kg; 1,9 kg; 1,8 kg; etc., onde a mdia
exatamente o tamanho de sua famlia. Incluindo todas as crianas e os adultos, quantas aritmtica produz o valor real buscado. Assim:
pessoas voc gostaria que ela tivesse?" Como demonstra a Tabela 4.7, os resultados desse 2,1 kg + 2,2 kg + 1,9 g + 1,8 kg
estudo indicaram amplas preferncias por tamanho de famlia, preferncias que variaram 4
. - 2 kg

desde viver sozinho (1) at viver com muitas pessoas (10). Usando ou a mdia ou a
mediana, poderamos concluir que a famlia ideal de um respondente "mdio" consis- Seja agora outra balana com a seguinte caracterstica: em cada quilo ela erra, para mais, 10 gramas.
tiria de seis pessoas = 5,58; Md = 6). Entretanto, sabendo que a distribuio bimo- Ento, esse objeto, cujo peso real 2 kg, pesar sempre 2 kg + 20 g. Se a pesagem for repetida
Pi vezes (n > 1), o erro ser consistente e constante: 20 g.
dal, percebemos que, de fato, houve duas concepes ideais de tamanho de famlia
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
ONIVERS1DADE I

52 DESCRIO
BE8 r feTd'iiir,a, tiendnia Central 53

Para localizar a mediana de dados agrupados numa distribuio de freqncias,


Na descrio de uma distribuio assimtrica, o pesquisador normalmente escolhe
devemos (1) encontrar o intervalo de classe que contm a mediana e (2) interpolar.
a mediana (como, alias, j foi mencionado em outro local), uma vez que ela tende a dar
Passo 1-Para localizar o intervalo mediano, construmos primeiro uma distribui-
um quadro balanceado* dos escores extremos. Alm disso, a mediana algumas vezes o de freqncias acumuladas, tal como figura na terceira coluna da Tabela 4.9. A
usada como um ponto da distribuio que divide os escores em duas categorias-ambas
partir do intervalo que contm os valores mais baixos (as idades menores-20/29),
com o mesmo nmero de sujeitos. Por exemplo, poderamos dividir os respondentes
vamos somando as freqncias at chegar quele intervalo que contm o ponto (o
(Tabela 4.7) em dois grupos: aqueles que preferem uma famlia grande (valores superio-
valor) que divide a distribuio em duas partes iguais, isto , o ponto central. No pre-
res a mediana) e os que preferem famlia pequena (valores menores que a mediana).
sente exemplo, N = 100. Portanto, devemos procurar o qiiinquagsimo valor, que :
Sempre que se deseja uma medida exata de distribuies simtricas, a mdia tem
N/2 = 100/2 = 50. Consultando a coluna das freqncias acumuladas (de baixo para
preferncia sobre a mediana pelo fato de poder ser facilmente usada em anlises estats-
cima), observamos que 26 sujeitos tm idades de 39 anos ou menos. Vemos tambm
ticas mais avanadas, tais como as que aparecem em captulos subseqentes deste livro.
que o qinquagsimo sujeito situa-se no intervalo 40/49, j que esse o intervalo de
Acrescente-se a isso o fato de ser a mdia mais estvel que a mediana, ou seja, se de classe cujas freqncias acumuladas contm 53-portanto, mais do que a metade dos
uma dada populao forem extradas diferentes amostra.s, haver menor variao nas sujeitos. Em outras palavras: com relao s freqncias acumuladas, do vigsimo
mdias do que nas medianas. Essa vantagem da mdia-muito embora talvez ainda no stimo ao qiiinquagsimo terceiro sujeitos encontramo-nos no intervalo 40/49. Esse
compreendida ou avaliada pelo leitor-tornar-se- mais evidente em estudos posteriores
o intervalo mediano.*
do tpico que trata do problema das decises em Estatstica (ver Captulo 7).
TABELA 4.9 Distribuio de Freqiincias de Dados Agrupados (idades)

CALCULO DA MODA, DA MEDIANA E DA MDIA NUMA DISTRIBUIO DE


Intervalo fa
FREQUENCIAS COM DADOS AGRUPADOS
Numa distribuio de freqncias com dados agrupados, a moda o ponto mdio do 60-69 15 100
intervalo de classe que apresenta a freqncia mais alta. De- acordo com essa definio, 50-59 32 85
a moda da distribuio constante da Tabela 4.8 72, uma vez que esse valor correspon- 40-49 - 27
de ao ponto mdio do intervalo que aparece mais vezes (ele ocorre 17 vezes)** 30-39 16 26
20-29 10 10

TABELA 4.8 Localizao da Moda numa Distribuio de Freqncias com Dados Agrupados N = 100

Intervalo de Classe Ponto Medio Passo 2-Para encontrar o valor exato da mediana, aplicamos a frmula

95-99 97 Freqncia acumulada


90-94 92 corrrespondente ao
85-89 87 4
82 7 Limite inferior real 2 intervalo anterior ao
80-84
75-79 77 12 Mediana = que contm a mediana
do intervalo
70-74
65-69
72
67
62
17
12 mediano Freqncia absoluta do
intervalo mediano
/
60-64
55-59 57 5

50-54 52 4 Amplitude
N = 71
X do intervalo
mediano

* N.T.: Melhor seria dizer apenas o -seguinte: o intervalo mediano o intervalo que corresponde,
*N.T.: Balanceado significa aqui "que no sofre a influncia de valores extremos". na coluna freqncias acumuladas, ao valor que contm (pela primeira vez) metade do total de
**N.T.: Rigorosamente, o ponto na6dio da 6 4 classe (de cima para baixo) 71,5, se a varivel
for con-
os sujeitos da distribuio. Sendo fai uma freqncia acumulada de ordem i, o intervalo mediano ser
tnua. Para que esse ponto medio seja 72 preciso que, nas condies da tabela, sejam desprezados obtido por correspondncia com
porque a classe foi indicada pela notao 70-74, que a relao fai NI2. O intervalo mediano tambm chamado de
limites do intervalo, ou seja, 70 e 74. Isso
lugar niediano.
a maneira tradiional de indicar um intervalo aberto (dos dois lados).
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
54 DESCRIO Medidas de Tendeneia Central SS

Para os dados da Tabela 4.9*, a mediana calculada como segue: PASSO 2: Multiplicar cada ponto mdio pela respectiva freqncia absoluta, a fim de
50 - 26 )10 - 39,5 obter 2fX
Mediana = 39,5 + ( + 8,89 - 48,39 anos.
27 Intervalo X = Ponto Medio fX
Para calcular a mdia de uma distribuiO de freqncias com dados agrupados,
podemos usar uma verso modificada da frmula vista anteriormente (ver Tabela 4.5). 17 -20 18 1 18
Conforme exemplificado abaixo, o smbolo X no ser mais usado para designar um 14 -17 15 2 30
11 -14

-
escore, mas, sim, o ponto mdio de um intervalo de classe. Portanto, 12 3 36
8 -11 9 5 45
- EfX 5-8 6 4 24
X = , onde 2-5 3 2 6
N = 17 1fX = 159
= mdia
X = ponto mdio de um intervalo de classe PASSO 3: "Entrar" com o resultado do Passo 2 na frmula de X.
fX = ponto mdio de um intervalo de classe multiplicado pela respectiva freqncia
absoluta
N = nmero total de escores.
=
EfX
= -
159
17
= 9,35

Podemos ilustrar o clculo da mdia de dados agrupados usando como referncia


a seguinte distribuio.**
RESUMO
Intervalo
Este captulo introduziu as trs medidas de tendncia central mais conhecidas, vale
17 1-20 dizer, medidas do que "mdio" ou "tpico" num conjunto de dados. A moda foi
14 1-17 2
defmida como sendo a categoria ou escore que ocorre com maior freqncia; a me-
11 1-14 3
8 H11 5 diana, como o ponto que divide a distribuio ao meio; a mdia, como a soma de todos
5 H8 4 os valores dividida pelo nmero de parcelas (isto , de valores do conjunto). Essas
2 1-5 2 medidas de tendncia central foram comparadas relativamente a: nvel de mensurao
N = 17 (da varivel), forma da distribuio (dos dados) e objetivo da pesquisa. Podemos
resumir as condies que regem a escolha de uma dessas medidas de tendncia central
PASSO 1: Calcular o ponto mdio de cada intervalo de classe. da seguinte maneira:

Intervalo X = Ponto Mdio Moda:


1. nvel de mensurao: nominal, ordinal ou intervalar;
17 1-20 18 2. forma da distribuio: mais apropriada para distribuies bimodais;*
14 1-17 15 3. objetivo: permite obter uma medida de tendencia central rpida, simples,
11 j--14 12 embora grosseira.
8 H11 9
5 1-8 6 Mediana:
2 H5 3
1. nvel de mensurao: ordinal ou intervalar;
2. forma da distribuio: mais adequada para distribuies muito assimtricas;
*N.T.: A varivel "idade" urna varivel continua. Por isso, qualquer limite inferior real obtido a par-
tir do limite inferior aparente menos 0,5. Para ajudar a "enxergar" este fato, o ideal seria adotar a
seguinte notao nos intervalos de classe: 40 -50, 50 -60, etc. Assim fica claro que os limites
* N.T.: Melhor seria dizer multimoddis, j que a "bimodalidade"
inferiores reais so, respectivarnente, 39,5 e 49,5, que os superiores so, na mesma ordem, 49,4 e 59,4. est implcita na "multimodali-
**N.T.: Veja-se a propsito, o que ficou dito na nota do tradutor, pgina 24, Cap. 2, sobre a notao dade". Observe-se, ainda, que nada impede que a moda seja a medida "prefervel" mesmo numa
de intervalo. distribuio unimodal. 0 que rege isso o objetivo da pesquisa.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
56 DESCRIO Medidas de Tencleneia Central 57

3. objetivo: uma medida de tendncia central "confivel"; pode, as vezes, ser 13. Qual a discrepncia de cada um dos seguintes escores com relao a I- = 15?
usada em operaes estatsticas mais avanadas ou para "quebrar" uma distri- (a) X = 22,5; (b) X = 3; (c) X = 15; (d) X = 10,5.
buio em duas categorias distintas (por exemplo: alto X baixo). 14. Os escores relativos a atitudes de 31 estudantes frente a um grupo minoritrio,
foram dispostos na seguinte distribuio de freqncias (quanto maior o escore
Media: mais favorvel a atitude:
1. nvel de mensurao: intervalar (no mnimo);
2. forma da distribuio: mais apropriada para distribuies unimodais simtricas; Escores Rektivos e Atitudes
3. objetivo: medida de tendncia central exata; pode freqentemente ser usada em
operaes estatsticas mais avanadas, tais como os testes para tomada de 7 3
decises que aparecero mais adiante neste livro. 6 4
5 6
PROBLEMAS 7

1. Sete empregados horistas numa companhia de porte mdio ganham Cr$ 153,00;
3 5
2 4
Cr$ 136,00; Cr$153,00; Cr$68,00; Cr$17,00; Cr$ 102,00 e Cr$51,00. Calcule 1 2
(a) o salno-hora modal; (b) o salrio-hora me.diano e (c) o salrio-hora mdio.
N = 31
Suponha que a companhia do problema 1 tenha recrutado mais um empregado
pelo salrio-hora de Cr $17,00, resultando, assim, a seguinte distribuio:Cr $153,00; Calcule (a) a moda; (b) a mediana; (c) a mdia.
Cr$136,00; Cr$ 153,00; Cr$ 68,00; Cr$ 17,00; Cr$ 102,00; Cr$51,00; e Cr$ 17,00. 15. Trinta e uma crianas matriculadas numa terceira srie do primeiro grau de uma
Calcule (a) o salrio-hora modal; (b) o salrio-hora mediano; (c) o salrio-hora zona urbana indicaram, numa pesquisa, o nmero de irmos e/ou irms que viviam
mdio. com cada um deles em casa. Os dados resultantes foram dispostos na seguinte
3. Para os escores 205, 6, 5, 5, 5, 2, e 1 calcule (a) a moda; (b) a mediana e (c) a tabela de distribuio de freqncias:
mdia. Que medida de tendncia central no deveria ser usada para descrever
(isto , para analisar) esse conjunto de escores? Por qu? ATUrnero de Irmoslirmis
44. Seis estudantes num seminrio de sociologia foram testados por meio de um instru-
;' mento que produz mensuraes de nvel intervalar. O objetivo da pesquisa era 5 6
mensurar suas atitudes com relao a um grupo minoritrio. Suas respostas, numa 4 7
escala de 1 a 10 (quanto mais alto o escore, mais favorvel a atitude), foram: 5, 2, 3 9
2
6, 3, 1 e 1. 5

Relativamente aos escores acima, calcule (a) a moda;(b) a mediana e (c) a mdia. 4
1

No geral, at que ponto esses estudantes so favorveis a esse grupo minoritrio? N = 31

5. Dados os escores 10, 12, 14, 8, 6, 7, 10, 10, encontre (a) a moda; (b) a mediana
e (c) a mdia.
Para essa classe de 31 crianas, ca1cule
Dados os escores 3, 3, 4, 3, 1, 6, 5, 6, 6, 4, encontre (a) a moda; (b) a mediana e (a) o nmero modal de irmos/irms;
(c) a mdia. (b) o nmero me diano de irmos/irms; Escores
7. Dados os escores 8, 8, 7, 9, 10, 5, 6, 8, 8, encontre (a) a moda, (b) a mediana
e (c) a mdia de irmos/inns.
10 3
(c) a mdia.
Dada a seguinte distribuio de fre- 9 4
8. Dados os escores 5, 4, 6, 6, 1, 3, encontre (a) a moda, (b) a mediana e (c) a mdia.
16.
8 6
qncias, calcule (a) a moda; (b) a
9. Dados os escores 8, 6, 10, 12, 1, 3, 4, 4, encontre (a) a moda, (b) a mediana
e
7 8
(c) a mdia. mediana e (c) a mdia: 6 9
a mediana e (c) a
10. Dados os escores 12, 12, 1, 12, 5, 6, 7, encontre (a) a moda, (b) 5 7
4 5
mdia.
11. Qual a discrepncia de cada um dos seguintes escores com
relao a X = 20,5? 3 2
2 1
(a) X= 20,5; (b) X = 33,0; (c) X= 15,0; (d) X = 21,0. 1 1
12. Qual a discrepncia de cada um dos seguintes escores com relao'
a X = 3,0?
N = 46
(a) X = 4,0; (b) X = 2,5; (c) X = 6,3; (d) X = 3,0.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
58 DESCRIO

5
17. Dada a seguinte distribuio de freqncias, calcule (a) a moda; (b) a mediana e
(c) a mdia:

Intervalo de Classe

20-24 2
15-19
10-14
5-9
-
4
8
5
Medidas de
N = 19

18:yada
a seguinte
(c) a mdia:
distribuio de freqncias, calcule (a) a moda; (b) a mediana e Variabilidade
No Captulo 4, vimos que a moda, a mediana e a mdia podiam ser usadas para resumir,
Intervalo de Classe
num nico nmero, aquilo que "mdio" ou "tpico" numa distribuio. Quando
16
empregada sozinha, entretanto, qualquer medida de tendncia central fornece apenas
90-99
80-89 17 uma viso incompleta de um conjunto de dados e, portanto, pode confundir ou distor-
70-79 15 cer tanto quanto esclarecer.
60-69 3 Com vistas a ilustrar essa situao, admitam que Honolulu (Hava) e Houston
50-59 2
(Texas) tenham quase a mesma temperatura mdia diria de 750.* Ser que, por isso,
40-49 3
podemos admitir que a temperatura basicamente a mesma em ambas as localidades?
N = 56 Ou no ser possvel que enquanto uma melhor para natao a outra o seja
para atividades extemas?
19. Dada a seguinte distribuio de freqncias, calcule (a) a moda; (b) a mediana;
Como bem ilustra a Figura 5.1, a temperatura em Honolulu varia muito pouco
(c) a mdia:
ao longo do ano, oscilando, em geral, entre 70F e 80F. Por outro lado, a temperatura
Intervalo de Classe
em Houston pode diferir estacionalmente, isto , apresentar-se baixa em janeiro-cerca
de 40F-e alta em julho e agosto-bem perto de 100F. Desnecessrio dizer, pois, que
2
as praias de Houston no esto apinhadas de gente durante todo o ano!
17-19
14-16 3 Vamos a um outro exemplo. Suponham que, numa particular cidade, tanto ladres
11-13 6 quanto professores secundrios tenham uma renda mdia anual de Cr$ 136.000,00.
8-10 5 Ser que essa informao indica que as duas distribuies de renda so necessariamente
5-7 1
semelhantes? Muito ao contrrio, poder-se-ia descobrir que elas diferem-e muito-num
N = 17 outro aspecto importante, qual seja, o fato de as rendas dos professores concentrarem-se
ao redor de Cr $ 136.000,00, enquanto que as dos ladres espalham-se mais, o que reflete,
portanto, maiores oportunidades para prises, desemprego, pobreza e, em alguns casos,
fortunas excepcionais.

* N.T.: A falta de uma unidade de medida pode, as vezes, confundir o leitor. Este livro, de autor
"norte-americano, traduz, em muitos pontos, aspectos da cultura vigente em pases anglo-saxes;
entre csses aspectos, destaca-se a escala de temperatura Fahrenheit, cuja caracterstica 6 a seguinte:
32F correspondem ao gelo fundente e 212F, a agua em ebulio. Em graus Celsius (centgrados),
75F correspondem a 23,9C (aprox.). A frmula de converso usada foi a seguinte:

- F - 32). e
o
c = 5
9
(
o

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
ADE
BlacroTEcA, Do
60 DESCRIO imecii4a4fk Variabilidade 61

DESVIO MEDIO
No captulo anterior, desvio* foi definido como sendo a distncia entre qualquer escore
bruto e a mdia da distribuio. Aprendemos, -s-siirvque, para calciar discrepancias
(desvios), bastava subtrair a media (aritrfitica) de qualquer escore bruto: x = (X
Se desejarmos agora obter uma medida de variabilidade que leve em conta todos os
escores da distribuio (e no apenas dois), poderemos tornar o valor absoluto de cada
discrepncia (isto , das distncias com relao media), somar esses valores e, ento,
= 75F = 75F dividir o total pelo nmero de escores. O resultado ser o desvio mdio. Em smbolos:
AT = 26F AT = 69F
Honolulu Houston E lx I

DM = , on de
FIGURA 5.1 Diferenas de Variabilidade: Distribuies de Temperaturas em Locais Distintos:
Honolulu e Houston (Valores Aproximados)
DM desvio mdio
Tal fato demonstra que necessitamos, alm de uma medida de tendncia central, E Ix soma dos valores absolutos das discrepncias (ou seja, soma das discre-
de um ndice que indique o grau de disperso dos escores em torno do centro da distri-
pncias sem considerar-se a presena dos sinais + e -)
buio (isto , em torno da mdia). Numa palavra, precisamos de uma medida indicativa
= total de escores (ou de sujeitos, respondentes ou dados).
do que costumeiramente se chama variabilidade (tambm designada como variao ou
disperso). Voltando a um exemplo anterior, poderamos dizer que a distribuio de Nota importante-No clculo de E Ix1 devemos ignorar os sinais "mais" (+) e
temperaturas em Houston (Texas) tem maior variabilidade do que a distribuio de "menos" (-) e somar apenas os valores absolutos. Este procedimento correto, porque
temperaturas em Honolulu (Hava). Da mesma forma, podemos dizer que a distribui- a soma das discrepncias reais (Ex)-onde os sinais indicam o sentido do desvio com re-
o de rendas entre professores apresenta menos variabilidade do que a distribuio de lao mdia* sempre igual a zero.*** As discrepncias positivas e as negativas ten-
rendas entre ladres. O presente captulo discute apenas as medidas de variabilidade dem a cancelar-se (compensar-se) e no podem, por isso, ser usadas para descrever ou
mais conhecidas: a amplitude total, o desvio mdio e o desvio padro. comparar a variabilidade de distribui0es. Por outro lado, a soma dos valores absolutos
das discrepncias tende a tornar-se maior medida que a variabilidade da distribuio
AMPLITUDE TOTAL aumenta.
Pode-se obter uma medida de variabilidade rpida (cmoda), embora no muito exata, Podemos agora ilustrar, passo a passo, o procedimento para o clculo do desvio
pelo clculo da chamada amplitude total (AT), que nada mais seno a diferena entre mdio. Para tanto, consideremos o seguinte conjunto de escores: 9, 8, 6, 4, 2 e 1.
o maior e o menor escore da distribuio. Por exemplo, se a temperatura anual mais PASSO 1: Calcular a mdia (aritmtica) da distribuio.
alta em Honolulu foi de 88F e a mais baixa, 62F, a amplitude total da temperatura
anual em Honolulu foi de 26F (isto , 88F -62F = 26F). Se o dia mais quente em X
Houston apresentou 102F e o mais frio, 33F, a amplitude total da temperatura anual
-
em Houston foi de 69F (isto , 102F 33F = 69F).
9
8 1= Ex
A vantagem da amplitude total-clculo rpido e fcil-constitui tambm sua mais 6
importante desvantagem. Por outras palavras, a amplitude total inteiramente depen- 4 30
dente de apenas dois escores: o maior e o menor num dado conjunto de valores. Como 2 6

resultado, a amplitude total fornece, via de regra, um mero ndice grosseiro da variabili-
1 = 5
EX = 30
dade de uma distribuio. Por exemplo, AT = 98 no seguinte conjunto de dados: 2, 6, 7,
7, 10, 12, 13, 100 (AT = 100 - 2 = 98); entretanto, AT = 12 neste outro conjunto:
N.T.: Insista-se no seguinte: desvio, afastamento e discrepncia so expresso-es sinnimas. Entre-
2, 6, 7, 7, 10, 12, 13, 14 (AT = 14 -2 = 12). Portanto, pela simples troca de um nico
*
tanto, prtica comum usar o termo discrepncia para designar qualquer X que resulte de (Xi - Y).
valor (14 em lugar de 100), fizemos com que a amplitude total flutuasse bruscamente de 98 N.T.: Os valores afetados de + (hiais) esto situados a direita do zero; os afetados de - (menos),
para 12. Qualquer medida que seja to afetada pelo escore de um nico respondente (ou A esquerda. Nos termos do texto, a mdia (aritmtica),
semelhana do zero, funciona como uma
por um nico valor da varivel) no pode, por certo, fornecer uma idia precisa quanto origem. Ento: a direita da mdia, discrepncias positivas; esquerda, discrepncias negativas.
variabilidade; quando hmito, possvel consider-la como um ndice preliminar ou, at, ***N.T.: Dizer que a soma das discrepncias sempre igual a zero o mesmo que dizer, em situ-
pouco exato. bolos, o seguinte: Ex = 0. Ora, Ex =EGv - Ento: E(x -x)= 0.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
62 DESCRIO Medidas de Variabilidade 63

PASSO 2: Subtrair de cada escore bruto a mdia da distribuio e somar as discrepn- Observem, antes de mais nada, que a media de cada distribuio Cr$ 340,00.
cias sem levar em conta os sinais (isto , "fazer de conta" que todas as discrepncias Notem tambm que parece haver diferenas marcantes em termos de variabilidade entre
trn o sinal +). essas distribuies-diferenas que podem ser detectadas com o auxlio da amplitude
total e do desvio mdio.
X
Vamos examinar, primeiro, a distribuio de rendas (a), onde todos os valores
9
so idnticos. Uma vez que todos os escores dessa distribuio so expressos pelo mesmo
8 valor numrico (Cr$ 340,00), podemos dizer que ela no apresenta variabilidade alguma.
6 Todas as pessoas (isto , as sete da amostra (a)) ganharam a mesma importncia naquele
4 determinado dia. Como resultado, a amplitude total 0 (zero) e no h absolutamente
2
nenhum desvio com relao mdia (DM = 0). As distribuies (b) e (c) apresentam va-
1
riabilidade. De forma especfica, a distribuio (b) tern uma amplitude total de Cr $ 102,00
EX = 30
e um desvio mdio de Cr$ 29,14; a distribuio (c) apresenta urna amplitude total de
Cr $510,00 e um desvio mdio de Cr$ 145,71. Podemos, pois, dizer que a distribuio
PASSO 3: Dividir E lx por N, a fun de garantir uma eqidistribuio que leve em
1 (b) contm menos variabilidade que a distribuio (c), ou seja, as rendas que fazem
conta o nmero de dados envolvido. parte da distribuio (b) so, entre si, mais semelhantes que as rendas da distribuio (c).
Elx1 16
DM = = 2,67
6

De acordo com o procedimento precedente, vemos que o desvio mdio para o DESVIO PADRO
conjunto 9, 8, 6, 4, 2 e 1 2,67. Isso indica que, em mdia, os escores dessa distribuio
oscilam 2,67 unidades em torno da mdia.
Com vistas a entender melhor a utilidade do desvio mdio, vamos voltar ao pro- Por motivos que logo se tornaro aparentes, o desvio mdio j no muito usado pelos
blema das distribuies (a), (b) e (c) de rendas dirias, tal como figuram na Tabela 5.1. pesquisadores; na maioria dos casos, ele foi abandonado como 'Imedida de variabilidade"
em favor de um "parente prximo" mais eficiente: o desvio padra-o. Como teremos a
TABELA 5.1 Variabilidade em Distribuies de Rendas Dirias, onde a Mdia Fixa (Cr $340,00) oportunidade de verificar, entretanto, o desvio mdio no pode ser considerado uma
perda de tempo, pois, na pior das hipteses, ele oferece-nos uma boa base para a com-
Distribuio (a) Distribuio (b) Distribuio (c) preenso da natureza do desvio padro.
X lx1 X lx1 X 1x1 Em discusses anteriores, vimos que o desvio mdio evita o problema de nmeros ne-
Cr$ Cr$ Cr$ gativos que cancelam os positivos; isso foi conseguido graas conveno de ignorarem-se
340
os sinais "mais" (+) e "menos" (-), somando, em seguida, os valores absolutos dos
0 391 +51 595 +255
340 0 374 +34 510 +170 desvios com relao mdia. Tal procedimento para a criao de uma medida de variabi-
340 0 357 +17 425 + 85 lidade tem a ntida desvantagem de impedir que esses valores absolutos sejam sempre
340 0 340 0 340 0 teis em anlises estatsticas mais avanadas (pois eles no comportam facilmente
-
-
340 0 323 -17 255 85 manipulaes algbricas).
340 0 306 -34 170 -170
340
-
0 289 -51 85 -255 Para superar esse problema e obter uma medida de variabilidade que seja mais
conveniente (isto , ajustada, "usvel") em procedimentos estatsticos avanados,
Elx1 = 0 Elx1 = 204 EtxI = 1.020
podemos elevar ao quadrado as discrepdncias reais (com os respectivos sinais) e som-las
X = Cr$340
AT = Cr$0
X = er$340
AT = Cr$102
i= Cr$340
AT = Cr$510
a seguir (Ex2). Corno ilustrado na Tabela 5.2, esse procedimento permite "fugir"
influncia dos sinais, j que o quidrado de qualquer nmero sempre positivo.
DM = Cr$0 DM = Cr$29,14 DM = Cr$145,71
Aps termos somado os quadrados das discrepncias, podemos dividir o total por
Nenhuma Pouca Muita N, a fim de garantir uma eqidistribuio desse resultado (total) rektivamente a todos
Variabilidade Variabilidade Variabilidade
os escores envolvidos. O valor que se obtm dessa operao conhecido pelo nome de
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
64 DESCRIO Medidas de Variabilidade 65

media quadrtica* (ou mdia das discrepncias ao quadrado). (Nota-Recorde-se que = desvio padro
procedimento semelhante foi adotado no clculo do desvio mdio, quando E lx1 foi Ex2 = soma das discrepncias ao quadrado
N total de escores da distribuio.

-
dividido por N.) Continuando corn a ilustrao da Tabela 5.2, vemos que =

Ex2
N
= -= 8,67
52
6
Para resumir: o procedimento para o clculo do desvio padro no difere muito
do mtodo que vimos anteriormente para o clculo do desvio mdio. Com refeitncia
ao exemplo presente, os seguintes passos devem ser seguidos:
TABELA 5.2 Elevao de Discrepncias ao Quadrado para a Eliminao de Nmeros Negativos.
(Dados da Tabela 5.1)
PASSO 1: Calcular a mdia da distribuio.
x2
4ikiz:9s
X
+4
8
9
+3
16
9
49:44('
11
9
6 +1 1
EX ('4 44144
8
4 -1 1 6 4'4,74> 00
2 -3 9 4 30
-4 1:14,4
1 16 2 6
Ex = 0 Ex2 = 52 1 = 5

EX = 30
Surge, agora, um problema adicional. Como conseqncia direta do fato de
termos elevado as discrepncias ao quadrado, a unidade de medida sofreu uma altera-
o, o que dificulta a Interpretao do resultado 8,67. De fato, temos 8,67, mas 8,67 PASSO 2: Subtrair de cada escore bruto o valor da media da distribuio para, dessa
unidades de qu? Com vistas, ento, a voltar unidade de medida original, extramos forma, obterem-se as discrepncias.
a raiz quadrada da mdia quadrtica, donde resulta:

/ /x2
N
- N/8,67 = 2,94 X

Podemos agora definir o desvio padro-resultado das operaes atrs realiza- 9 +4


8 +3
das-como sendo a raiz quadrada da mch das discrepncias ao quadrado. Indicando 6 +1
o desvio padro por DP ou pela letra grega minscula a** (sigma), vem: 4 -1

Cr = - 2
onde
2
1

PASSO 3:
-3
-4

Elevar ao quadrado cada discrepncia e som-las.


*

siMbolos, S2 (X) = -
N.T.: Na verdade, a mdia quadrtica
Ex2
N
muito mais conhecida pelo nome de varkincia. Em

onde S2 (X) representa a varincia. As vezes, em lugar de S2 (X) aparece

a2 (X); quando tal ocorrer, interprete-se assim: S2 (X) a varincia da amostra e 02 (X), da populao.
X

9 +4
x x2

16
** N.T.: Releia-se a nota de rodap anterior . O que ficou dito relativamente varincia tambm 8 +3 9
vale para o desvio padro. Observe-se, ainda, que o Autor no faz, a esta altura, nenhuma distingo 6 +1 1

na maneira de notar o desvio padro, quer seja ele calculado para uma populao, quer para uma
4 -1 1

amostra. Essa distino ser feita, entretanto, no Capftulo 7. Mais uma observao: o desvio padro 2 -3 9
pode ser definido como sendo a raiz quadrada positiva da varkincia. Assim: 1 -4 16
Ex2 = 52
VVarincia = Desvio padro.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
66 DESCRIO Medidas de Variabilidade 67

PASSO 4: Dividir por N e extrair a raiz quadrada do resultado.


X 04,1

9
2:c2 52 EX 30
o- = = N/8 67 = 2,94 8
-
N 6 ' 6
N 6

4
12 25
Podemos agora dizer que o desvio padro do conjunto de escores 9, 8, 6, 4, 2 e 1 2
1
2,94.
IX = 30

nil-tut& para o Clculo do Desvio Padrdo a Partir de Dados Brutos


At este ponto, a nica firmula usada para o clculo do desvio padro tem sido N/Ex2 /N.
PASSO 3: "Entrar" com os resultados dos Passos e 2 na frmula.
No caso particular de estar disponvel uma mquina de calcular, h um mtodo mais
1

fcil de obter-se o DP-um mtodo que prescinde das discrepncias e que trabalha
diretamente com os dados brutos.
A frmula desse novo mtodo
cr =
1X2
3C-2 = 1 202
6
- 25 = 03,67 - 25,00 = N/8,67

2X2 -X2 = 2,94


N N
Como podemos observar acima, a aplicao da nova frmula aos dados da Tabela
onde 5.2 produz uma resposta idntica obtida com o mtodo original.
a = desvio padro
EX2 = soma dos quadrados dos escores brutos (Importante: primeiro, elevar Clculo do Desvio Padro (DP) de uma Distribuio de Freqncias com Dados Isolados
cada escore bruto ao quadrado; depois, efetuar a soma.) Para obter-se o desvio padro de uma distribuio de freqncias com dados isolados,
N= nmero total de escores aplique-se a frmula
= mdia aritmtica ao quadrado.

procedimento passo a passo para o clculo do DP mediante a aplicao da


O
VWX2
N
-
X2
frmula anterior pode ser ilustrado a partir dos dados da Tabela 5.2.
Vamos, a ttulo de ilustrao, calcular o desvio padro da seguinte distribuio:
PASSO 1: Quadrar (isto , elevar ao quadrado) cada escore bruto separadamente e
somar.
Escores

x2 7 1

6 2
9 81 5 3
8 64 4 5
6 36 3 2
4 16 2 2
2 4 1 1
1 1
N = 16
EX2 = 202

PASSO 2: Calcular a mdia aritmtica e elev-la ao quadrado. PASSO 1: Multiplicar cada escore
(X) pela respectiva freqncia (f), a fim de obter fX.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
68 DESCRIO Medidas de Variabilidade 69

Significado do Desvio Padro


fX
Essa srie de passos para o clculo do desvio padro pode deixar o aluno com uma
7 1 7
desagradvel sensao relacionada com o significado de seu resultado. Por exemplo,
6 2 12 suponham que, numa particular distribuio de escores, o desvio padro seja 4 (a = 4).
5 3 15 Que indica esse nmero? 0 que, exatamente, podemos dizer agora a respeito dessa
4 5 20 distribuio que no poderamos ter dito antes?
3 2 6
0 captulo seguinte tentar elucidar o significado concreto do desvio padro.
2 2 4
1 1 1
Por ora, estabeleamos sumariamente que o desvio padro (como o desvio mdio)
representa a "variabilidade mdia" de uma distribuio, j que ele mede a media de
discrepncias (desvios) com relao a X. Os procedimentos de quadrar e extrair a raiz
PASSO 2: Multiplicar cada fX pelo respectivo X, a fim de obter fX2. Em seguida, quadrada tambm entram no problema, mas basicamente no sentido de eliminar os
somar tudo para obter EfX2. sinais de "menos" e voltar a uma unidade de medida mais conveniente, vale dizer, a
unidade de medida dos dados brutos.
X fX fX2 Observamos tambm que quanto maior a variabilidade em tomo da media de
uma distribuio, maior o desvio padro. Assim, a = 4,5 indica maior variabilidade
7 7 49 que a = 2,5. Por exemplo, a distribuio da temperatura diria em Houston (Texas)
6 12 72 tem um desvio padro maior do que o da distribuio da temperatura diria, no mesmo
5 15 75 perodo, em Honolulu (Hava).
4 20 80 Se desejssemos estudar a distncia que separa uma mesa da parede da sala de
3 6 18
estar, poderamos pensar em termos de centmetros ou metros como unidade de medi-
2 4 8
1 1 1
da. (Por exemplo, "a mesa da sala de estar dista 5 metros desta parede".) Mas como
medir a extenso da linha de base de um polgono de freqncias, onde estejam regis-
EfX2 = 303
trados os escores de um grupo de respondentes-escores claisificados em ordem cres-
cente? Ainda com relao ao mesmo assunto, que mtodo usar para encontrar a dis-
PASSO 3: Calcular a mdia aritmtica e elev-la ao quadrado. tncia entre qualquer escore bruto e a media de distribuio-mtodo padronizado que
nos possibilitasse fazer comparaes entre escores brutos da mesma distribuio ou
fX entre escores de distribuies diferentes? Se estivssemos falando de mesas, poderamos
dizer que uma dista 5 metros da parede da sala de estar, enquanto que outra est a
7 10 metros da parede da cozinha. Do ponto de vista metros, dispomos de uma unidade
12
EfX padronizada de medida e, portanto, podemos fazer tais comparaes de modo objetivo.
15 X =
20 Mas como proceder na comparao de escores brutos? Por exemplo, ser que sempre
65 possvel comparar a nota 85-resultante de um exame de ingls-com a nota 80-resul-
6 = 16,48
4 = 16 tante de um de alemo? Qual dessas notas realmente mais alta? Um pouco de ateno
1 = 4,06 vai demonstrar que isso depende fundamentalmente da maneira como se saram os
EfX = 65 outros alunos em cada uma dessas disciplinas.
Uma forma de obter-se um indicador grosseiro da extenso (largura) de uma
linha de base calcular a amplitude total, uma vez que ela fornece a distncia entre
PASSO 4: "Entrar" com os resultados dos Passos 1, 2 e 3 na frmula. o escore mais alto e o mais baixo. Tal medida porm no serve para localizar, com
eficcia, um escore particular com relao mdia, pois-deixando de lado outras
fragilidades dessa medida-ela cObre toda a extenso da linha de base. Em contraposio,
= IfNX2 Tc2 = IT-363 - 16,48 = .\/1 8,94 - 16,48 =
o "tamanho" do desvio padro menor do que o da amplitude total e geralmente cobre
muito menos do que toda a extenso da linha de base.
Da mesma forma que medimos o tamanho de um tapete em metros ou centime-
= 2/4.6 = 1,57
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor tros, tambm podemos medir a linha de base em unidades de desvio padro (isto , em
70 DESCRIO Medidas de Variabilidade 71

ponto importante: enquanto que metros, centmetros sempre tem tamanho constante,
o valor do desvio padro varia de distribuio para distribuio. Alias, se no fosse
assim, no poderamos usar o desvio padro-como ilustramos pginas atrs-na compa-
rao de distribuies quanto sua variabilidade (por exemplo, DP = Cr $85.000,00 para
a distribuio da renda de professores secundrios; DP = Cr$ 255.000,00 para a distribui-
o da renda de larpios). Por essa razo, precisamos calcular o "tamanho" do desvio
padro de todas as distribuies com que estejamos trabalhando. Tambm em conse-
qncia deste fato, geralmente mais difcil compreender o significado do desvio
65 70 75 80 85 90 95 padro, em contraste com o significado de metros ou centmetros como unidades de
-3a -2a -la X +la +2a +36, mensurao. No captulo seguinte voltaremos a examinar o conceito de desvio padro.

FIGURA 5.2 Mensurao da Linha de Base em Unidades de Desvio Padro. (Neste exemplo, o COMPARAO ENTRE AMPLITUDE TOTAL, DESVIO MDIO E DESVIO PADRO
desvio padro (0) 5 e a mdia (X) 80)
A amplitude total pode ser considerada um mero ndice preliminar ou grosseiro da va-
unidades "sigma"). Por exemplo, poderamos somar um desvio padro ao valor da riabilidade de uma distribuio. Sua obteno rpida e fcil; todavia, ela no muito
mdia, a fim de determinar qual escore bruto localiza-se a exatamente um desvio padro "confivel". Pode ser aplicada a dados intervalares ou ordinais.
dela (isto , um escore bruto distante da media um sigma). Como ficou demonstrado A amplitude total tem utilidade no que diz respeito ao clculo do desvio padro.
na Figura 5.2, se X = 80 e DP = 5, ento o escore bruto 85 fica a exatamente um desvio A Figura 5.2 ilustra que seis desvios padres cobrem quase que inteiramente a distncia
padro acima da mdia (80 + 5 = 85); isso equivale a dizer que o escore 85 dista dela que vai desde o menor escore at o maior numa distribuio (de -3a a +3a). Esse fato
+1a. Essa direo "mais" (+) porque todas as discrepncias acima da mdia so isolado j nos d um mtodo conveniente para estimar (mas no calcular) o desvio
positivas; todas as discrepncias abaixo da mdia so "menos" (-) ou negativas. padro. De modo geral, o tamanho do desvio padro cerca de um sexto (1/6) do
Podemos continuar "graduando" a linha de base mediante a adio de mais um tamanho da amplitude total. Por exemplo, se a amplitude total for 36, espera-se que
desvio padro ao escore bruto 85. Tal procedimento d-nos o escore bruto 90, que se o DP caia bem perto de 6; se a amplitude total for 6, o DP deve de estar prximo de 1.
situa a exatamente dois desvios padres acima da mdia (85 + 5 = 90). Por igual pro- Essa regra pode assumir considervel importncia aos olhos do aluno que deseja
cedimento, adiciona-se um desvio padro ao escore bruto 90 e obtemos 95-que repre- "testar" se seu resultado tem grande probabilidade de estar correto. Tomemos um caso
senta o escore bruto localizado a exatamente tres desvios padres acima da mdia. extremo: se A T = 10 e o DP (calculado) = 12, devemos ter cometido algum erro, pois o
Para continuar esse processo do "lado negativo" (abaixo da mdia), vamos subtraindo, DP no pode ser maior que a amplitude total. Uma nota de alerta: a regra do "um
a partir de if, um desvio padro, dois desvios padres etc., donde resulta: 75 (localizado sexto" s se aplica a distribuies compostas de grande nmero de escores. Quando
a - -
la), 70 (localizado a 2a), e assim por diante. o nmero de escores for pequeno, via de regra, haver necessidade de menos desvios
Como bem ilustra a Figura 5.3, o processo de medir a linha de base em unidades padres para cobrir toda a amplitude da distribuio.
de desvio padro , em muitos aspectos, semelhante mensurao da distncia em metros Enquanto que a amplitude total calculada a partir de apenas dois escores, tanto
entre uma mesa e uma dada parede. No entanto, a analogia falha em pelo menos um o desvio padro quanto o desvio mdio levam em conta todos os escores da distribuio.
Apesar da sua relativa estabilidade, o desvio mdio no muito usado em pesquisa,
uma Vez que ele no se presta a muitas anlises estatsticas avanadas. Por outro lado,
o clculo do desvio padro implica a utilizao de um procedimento aceitvel do ponto
de vista matemtico, com vistas a contornar o problema dos sinais (+; -): quadrar as
(a) 2 metros -1- discrepncias em vez de simplesmente ignorar os sinais. Como resultado, o desvio padro
acabou por tomar-se o passo inicial na obteno de certas medidas estatsticas, em par-
ticular no terreno das inferncias. Essa caracterstica do desvio padro ser explorada
em detalhes em captulos subseqentes, especialmente nos de nmeros 6 e 7.
Apesar da sua utilidade como medida de disperso "confivel", o desvio padro
(b) X 90 +2 a X-80 a= 5 unidades de escore bruto
tambm apresenta algumas desvantagens. Comparado com outras medidas de variabili-
FIGURA 5.3 Mensurao de Distncias; (a) entre uma mesa e uma parede, onde a unidade de dade, seu clculo no s &P.M como demorado. Todavia, essas desvantagens esto
medida usada o metro; (b) entre um escore bruto e a mdia da distribuio, onde dia a dia sendo superadas pelo crescente uso ou de mquinas de calcular de alta veloci-
a unidade de medida vem expressa em unidades de desvio padro dade ou de computadores programados para a execuo de anlises estatsticas. O desvio
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
72 DESCRIO Medidas de Variabilidade 73

padro (da mesma forma que o desvio mdio) tambm tem a caracterstica de ser uma
medida intervalar, donde decorre que sua utilizao torna-se impossvel com dados
X = ponto mdio fX
nominais ou intervalares-via de regra utilizados no trabalho de muitos pesquisadores.
9 5 45 159
CALCULO DA AMPLITUDE TOTAL, DO DESVIO
MDIO E DO DESVIO PADRO 6 4 24 - 17
DE DADOS AGRUPADOS 3 2 6
= 9,35
fX = 159
Estejam os dados agrupados ou no, a amplitude total sempre a diferena entre o
maior e o menor escore. Seu clculo no requer o uso de nenhum mtodo especial ou PASSO 3: Calcular o desvio (= a discrepncia) de cada ponto mdio com relao
frmula. mdia.
Com o propeisito de ilustrar passo a passo o procedimento para a obteno do
desvio mdio numa distribuio de freqencias com dados agrupados, considere-se a X = Ponto Mdio - = ixl
seguinte tabela*:
18 8,65
Intervalo IS 5,65
de Classe 12 2,65
9 0,35
17-19 1
6 3,35
14-16 2
3 6,35
11-13 3
8-10 5
5-7 4
PASSO 4: Multiplicar cada discrepncia pela freqncia correspondente ao intervalo
2-4 2 de classe e, em seguida, somar esses produtos.
N = 17
Intervalo fx
PASSO 1: Calcular o ponto mdio de cada intervalo de classe.
17-19 1 8,65 8,65
14-16 2 5,65 11,30
Intervalo X = Ponto Mdio 11-13 3 . 2,65 7,95
8-10 5 0,35 1,75
17-19
5-7 4 3,35 13,40
18 2-4 2 6,35 12,70
14-16 15
11-13 12 N = 17 Ef x = 55,75
8-10 9
5-7 6
2-4 3 PASSO 5: Dividir por N.

PASSO 2: Determinar a media da distribuio. Zflx 55,75


DM =
I

- 3,28
17
X = ponto mdio fX

,
15
12
1

2
3
18
30
36
-
X = -
EfX
/V
Chegamos, assim, a um desvio mdio de 3,28.
Para o clculo do desvio padro de dados agrupados, podemos usar uma frmula
que se utiliza apenas dos dados brutos da tabela inicial. Em smbolos, temos:

* N.T.: sempre interessante especificar, na coluna onde figuram os intervalos de classe, a unidade
am que a varivel foi mensurada. \I"Nx2 )72
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
/ 18
74 DESCRIO Medidas de Variabilidade 75

onde PASSO 3: Multiplicar cada ponto mdio por fX e somar esses produtos.

a = desvio padro Intervalo de Ponto


f = freqncias dos intervalos de classe Classe f medio (X) fX fX2
X = ponto mdio de cada intervalo de classe
17-19 18 18 324
N = nUmero total de escores 1
30 450
12 14-16 2 15
= quadrado da mdia (aritmtica). 11-13 3 12 36 432
8-10 5 9 45 405
5-7 4 6 24 144
2-4 2 3 6 18
0 procedimento passo a passo para o clculo do desvio padro pode ser ilustrado, EfX2 = 1773
por exemplo, com relao seguinte tabela de dados agrupados:
PASSO 4: "Entrar" com os resultados dos Passos 2 e 3 na formula.

Intervalo
de Ckisse a- - V1fX2 - j1773 - 87,42
17
= .V104,29 - 87,42 =

17-19 1

14-16 2 = V16,87 = 4,11


11-13 3
8-10 5
5-7 4
0 desvio padro, conforme sugere a prpria frmula, 4,11.
2-4 2

RESUMO
Introduzimos, neste captulo, o conceito de amplitude total, de desvio medio e de
desvio padrifo-que so trs medidas de variabilidade ou, para dizer de outra forma,
PASSO 1: Multiplicar cada ponto mdio pela freqncia do intervalo de classe cor-
medidas que "mostram" a maneira como os escores agrupam-se em torno do centro
respondente e somar esses produtos.
da distribuio. A amplitude total foi definida como um indicador de variabilidade
rpido e grosseiro, facilmente calculada a partir da diferena entre o maior e o menor
Intervalo de Classe f Ponto Medio (X) fX escore da distribuio. 0 desvio mdio-ou seja, a soma dos valores absolutos das dis-
crepncias (desvios), dividida por N-foi, desde o incio, tratado como uma medida
17-19 1 18 18 inadequada de variao, do ponto de vista matemtico, apesar de constituir slida base
14-16
para a compreenso do desvio padro; este, por sua vez, foi definido como .sendo a
2 15 30
11-13 3 12 36
8-10 5 9
raiz quadrada da varincia da distribuio. 0 desvio padro uma medida de variabi-
45
5-7 4 6 24 lidade confkivel, de nvel intervalar, que pode ser utilizada em operaes estatsticas
2-4 2 3 6 avanadas, descritivas ou inferenciais. 0 significado amplo do desvio padro ser
N = 17 EfX = 159 objeto de estudos posteriores: nas discusses relacionadas com a curva normal e nas
generalizaes de amostras para populaes.

PASSO 2: Calcular a mdia aritmtica e elev-la ao quadrado. PROBLEMAS


1. Um grupo de 5 estudantes obteve as seguintes notas de exame, numa escala de
X- 10 pontos: 7, 5, 3, 2 e 1. Relativamente a esse conjunto de escores, calcule (a) a
- N 17 9'35
amplitude total; (b) o desvio mdio; (c) o desvio padro.
12 = 87,42 2. Numa escala destinada a mensurar atitudes para com o problema da segregao
racial, duas classes de universitrios obtiveram os seguintes pontos:
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
76 DESCRIO Medidas de Variabilidade 77

8. Calcule o desvio padro relativo seguinte distribuio freqencial de escores:


Classe A Classe B
UITVERS;DAbE FEDERAL DO PARA
4 3 B1BLIOTECA CENTRAL
6 3
2 10 2
2
9 5
1 1
8 8
1 4
7 7
1 2
6 4
5 3
Compare a variabilidade de atitudes relativamente segregao racial N = 29
entre os
membros das classes A e B mediante a determinao do seguinte:
total para cada classe; (b) o desvio mdio dos escores de cada classe;
(a) amplitude 9. Calcule, relativamente seguinte tabela de dados agrupados por freqncias, (a) a
(c) o desvio amplitude total; (b) o desvio mdio; (c) o desvio padro.
padro de cada classe. Qual das classes apresenta maior variabilidade
de atitudes?
3. Para o seguinte grupo de escores: 3, 5, 5, 4, 1, calcule Intervalo de Classe
(a) a amplitude total; (b) o
desvio mdio; (c) o desvio padro.
90-99 6

4. Dado o conjunto de escores: 1, 6, 6, 3, 7, 4, 10, calcule 80-89 8


o desvio padro. 70-79 4
60-69 3
5. Dado o conjunto de escores: 12, 12, 10, 9, 8, calcule o desvio padro. 50-59 2

N = 23
6. Calcule o desvio padro relativo seguinte distribuio freqencial escores:
10. Relativamente seguinte tabela de dados agrupados por freqncias, calcule: (a) a
amplitude total; (b) o desvio mdio; (c) o desvio padra-q.

Intervalo de Classe
5
4 5 17-19 2
3 6 14-16 3
2 2 11-13 6
1

N =
_
18
2 8-10
5-7
5
1

11. Relativamente seguinte tabela de dados agrupados por freqncias, calcule: (a) a
7. Calcule o desvio padro relativo seguinte distribuio freqencial de escores: amplitude total; (b) o desvio mdio; (c) o desvio padro.

Intervalo de Classe

20-24 2
7 2 15-19 4
6 3 10-14 8
5 5 5-9 5
4 7 N = 19
3 4
2 3
1 1

N = 25

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
PARTE II
Da Descrio
Tomada de Decises

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
6
A Curva Normal

Nos captulos anteriores, vimos que as distribuies de freqncias podem assumir


uma grande variedade de formas. Algumas so simtricas ou livres de alongamento;
outras so negativa ou positivamente alongadas; outras, ainda, apresentam-se com
mais de uma "corcova", e assim por diante. Apesar dessa grande diversidade, h uma
distribuio de freqncias com a qual muitos de ns j nos familiarizamos, se no por
outra razo, pelo fato de termos sido classificados de acordo com ela por nossos pro-
curva normal, um modelo terico
ou ideal que resulta muito mais de uma equao matemtica do que de um real de-
lineamento de pesquisa com posterior coleta de dados.1 Entretanto, a utilidade da
curva normal para o pesquisador pode ser evidenciada airavs de suas aplicaes a
efetivas situaes de pesquisa.
Como veremos neste captulo, por exemplo, a curva normal pode ser usada na
descrio de distribuies de escores, na interpretao do desvio padro e em afirmaes
relacionadas com a noo de probabilidade. Em captulos subseqentes, veremos que a
curva normal constitui um ingrediente essencial para a tomada de decises estatsticas, a
partir da qual o pesquisador pode generalizar para populaes as concluses a que tenha
chegado ao lidar com amostras. Antes de prosseguirmos com a discusso de tcnicas para
tomada de decises, faz-se necessrio que conheamos alguns dados relacionados com
as propriedades da curva normal.

A curva normal pode ser construda a partir da seguinte frmula:

1 x ,2
Y =
- a
2 ( , onde
uf27r
Y = ordenada correspondente a um dado valor de X (isto , a ordenada representa a freqiincia
com que X ocorre na distribuio)
77 = 3,1416
e = 2,7183
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
A
82 DA DESCRIO TOMADA DE DECISES
A Curva Normal 83

CARACTERSTICAS DA CURVA NORMAL


Como pode ser caracterizada a curva normal? Quais as propriedades
que a distinguem de
outras distribuies? Tal como indica a Figura 6.1, a curva
normal um tipo de cui-va
simtrica, suave, cuja forma lembra um sino e, por isso, amplamente
conhecida por
"curva em sino". possvel que o aspecto mais marcante dessa curva
seja a sua simetria;
se "dobrssemos" a curva em seu ponto central (que
corresponde freqncia mxima),
daramos origem a duas metades, sendo que cada uma delas seria a imagem
espelhada da
outra.*
Alm disso, a curva normal unimodal, isto , possui um s (pico
ou) ponto de 60 70 80 90 100 110 120 130 140
freqncia mxima; esse ponto, por sua vez, aquele situado no meio da
distribuio
(curva), em que a mdia, a mediana e a moda coincidem. (Recorde-se que,
confonne o FIGURA 6.2 Distribuio Hipottica de Quocientes de Inteligncia (QIs)
Captulo 3, a mdia, a mediana e a moda ocorrem em pontos diferentes
(isto , no
coincidentes) numa distribuio alongada (assimtrica).) A partir do topo exemplo, veramos que a maioria dos adultos estaria na faixa que vai de 152 cm (aprox.)
(central,
arredondado), a curva normal "car gradualmente at formar as caudas (duas, at 183 cm (aprox.), com muito pouca gente menor que 152 cm ou maior que 183 cm.
uma de
cada lado), que se estendem de forma indefinida, aproximando-se
cada vez mais da A Figura 6.2 demonstra que o QI tambm seria previsvel-a maioria dos QIs situando-se
linha de base (eixo das abscissas) sem, entretanto, jamais toc-la.**
entre 90 e 110; como podemos observar, h uma "descida" gradual dos escores para
ambas as caudas, com pouqussimos "gnios" que tm QI superior a 140 e, da mesma
CURVAS NORMAIS: O MODELO E 0 MUNDO REAL forma, pouqussimas criaturas menos privilegiadas, cujos QIs esto abaixo de 60. Por
Poderamos perguntar: at que ponto as distribuies de dados reais (ou seja, de dados igual raciocnio, relativamente poucos sujeitos poderiam ser considerados politicos
coletados por pesquisadores ao longo de suas pesquisas) ajustam-se ou aproximam-se extremistas-de direita ou de esquerda-enquanto que a tendncia poltica da maioria
figura (ao formato) normal? A ttulo de ilustrao, vamos imaginar que todos seria considerada moderada.
os fenmenos sociais, psicolgicos e fsicos sejam normalmente distribudos. Finalmente, mesmo o desgaste dos pisos, resultante do fluxo de transeuntes, lembra a
Como distribuio normal: a maior parte do desgaste ocorre no centro dos pisos (degraus etc.),
seria esse mundo hipottico?
Se atentssemos para as enquanto que nos lados, medida que nos afastamos do ce.ntro, o desgaste vai-se tor-
caractersticas fsicas dos seres humanos, estatura, por
nando cada vez menor.
Os leitores tero, a esta altura, observado que o mundo hipottico da curva normal
no difere de forma radical do mundo "real" em que vivemos no momento. Fenmenos
tais como estatura, QI, orientao poltica, desgaste dos pisos etc. aproximam-se, na
prtica, at que muito bem da distribuio normal terica. Pelo fato de tantos fenme-
nos terem essa caracterstica-isto , pelo fato de ela ocorrer to freqentemente na
natureza (e por outras razes que logo se tornaro aparentes)-pesquisadores de diferen-
tes campos tm feito uso extensivo da curva normal, aplicando-a aos dados que eles
coletam e analisam.
Observe-se, porm, que alguns fenmenos no campo social-como em qualquer
outro-simplesmente no se ajustam noo terica da distribuio normal. Muitas
FIGURA 6.1 Formato da Curva Normal distribuies so assimtricas; outras tm mais de uma moda; outras so simtricas, mas
no tm a forma de "sino". Como exemplo concreto, consideremos a distribuio de
riqueza no mundo. fato bem conhecido que "os que tm" superam de longe "os que
* N.T.: Essa "dobra" representa, de maneira mais formal, um eixo de simetria.
Tomando-se esse no tm". Assim, como ilustra a Figura 6.3, a distribuio de riquezas (indicada pela
eixo como referncia, observa-se que a curva normal bicaudal. Ento, para
retomar a idia do autor,
dizer que uma metadc e a imagem espelhada da outra o mesmo que dizer o
seguinte: "dobrando-se"
renda per capita) de extrema.assimetria (pelo menos na aparncia), de sorte que apenas
a curva em seu eixo de simetria, a cauda da esquerda uma pequena proporo da populao mundial recebe poro significativa da renda total.
ajusta-se (sobrepe-se) perfeitamente A cauda
du direita. ' De forma anloga, especialistas em demografia dizem-nos que os Estados Unidos da
l-* N.T.: Diz-se, por essa razo, que o xampo de variao de uma distribuio normal Amrica do Norte tornaram-se, nos ltimos tempos, uma terra de jovens e velhos. Do
estende-se de
1. a + 0 ponto de vista econmico, essa distribuio de idades representa um fardo pesado
.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
84 DA DESCRIO TOMADA DE DECISES A Curva Normal 85

20
Poderfamos limitar uma poro dessa rea total se trassemos, a partir de dois
pontos quaisquer tomados na linha de base, segmentos perpendiculares at a prpria
15
curva. Por exemplo, usando a mdia como ponto de partida, poderfamos traar um
segmento em X e um outro no ponto que coincide com 1 DP (1 distncia sigma) acima
10
(isto , direita) de X. Esta poro sombreada da curva normal ilustrada na Figura 6.5
abrange 34,13% da freqncia total.
5
Da mesma forma, podemos dizer que 47,72% dos sujeitos sob a curva normal
caem entre X e 2 DP acima ( direita) da mdia; igualmente, que 49,87% caem entre
e 3 DP acima da mdia (ver Figura 6.6).
tC3
Como veremos mais adiante, uma proporvo constante da rea total sob a curva
normal cair entre a media e qualquer distncia dada a contar de X -desde que a men-
Renda (em US $ )
surao seja feita em unidades de desvio padro. Esta afirmao verdadeira, indepen-
FIGURA 6.3 Distribuio da Renda "Per Capita" (Naes do Mundo) dentemente da mdia e do desvio padro da distribuiO particular que estejamos
estudando e aplica-se a todos e quaisquer dados que tenham distribuio normal. Assim,
para um grupo relativamente pequeno de trabalhadores, isto porque, sendo todos a rea sob a curva normal compreendida entre X e 1 DP acima da mdia vai sempre
cidados de meia-idade, tm a seu encargo um nmero assustador tanto de velhos incluir 34,13% da totalidade dos dados, quer estejamos discutindo a distribuio de
(aposentados) quanto de jovens (ainda em perfodo escolar). estaturas, de inteligncia, de filiao partidria ou de desgaste nos degraus das portas
Naquelas circunstncias em que temos boas razes para esperar grandes diver- entrada de nossas casas. 0 requisito bsico, em cada situao, que estejamos tra-
gncias da normalidade-como, por exemplo, no caso da idade e da renda-a curva balhando com escores que tenham realmente distribuio normal.
A natureza simtrica da curva normal leva-nos a tirar outra concluso impor-
normal nab pode ser usada como "modelo" para os dados coletados. Vemos, assim,
que no possfvel aplic-la com liberdade a todas as distribuies que o pesquisador
tante: qualquer distncia medida em "sigmas", acima ou abaixo da media, contm
obtm, e deve, ao contrrio, ser usada com uma boa dose de bom senso. Felizmente a mesma poro da area sob a curva. Ento, se 34,13% da rea total situam-se entre
a mdia e 1 DP acima de Xi, tambm 34,13% da rea total situam-se entre a mdia e
os estatfsticos sabem que grande quantidade de fenmenos de interesse segue o modelo
1 DP abaixo de X ; se 47,72% situam-se entre a mdia e 2 DP acima de X, tambm
normal.
47,72% situam-se entre a mdia e 2 DP abaixo de X ; finalmente, se 49,87% situam-se
entre a mdia e 3 DP acima de X, tambm 49,87% situam-se entre a mdia e 3 DP
A AREA SOB A CURVA NORMAL
abaixo de X. Em outras palavras, como ilustra a Figura 6.7, 68,26% da rea total sob
a curva normal (34,13% + 34,13% -- 68,26%) caem entre -1 a e +1a, sendo a mdia
A fim de podermos empregar a curva normal na soluo de problemas, precisamos, antes, (aritmtica), X , o ponto de referncia; 95,44% da rea total (47,72% + 47,72%) caem
aprender o significado da expresso "rea sob a curva normal": aquela poro do plano,
compreendida entre a curva e a linha de base, que corresponde, ern qualquer distribuivo
entre - 2a e +2a a partir de X ; 99,74% da rea total-que, alis, praticamente toda
a rea sob a curva-caem entre -3a e +3a (sempre X como ponto de partida). Podemos
normal, a 100% dos dados considerados. A Figura 6.4 ilustra essa caracterfstica.

0.)

FIGURA 6.5 Porcentagem da Area Total sob a Curva Normal Limitada por X e por um Desvio
FIGURA 6.4 A Area sob a Curva Normal Padro Acima de X
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
86 DA DESCRIO TOMADA DE DECISES
A Curva Normal 87

+2 a +3 a

1--47,72%1
1-49,87%
99,74%

FIGURA 6.6 Porcentagem da Area Total sob a Curva Normal Limitada por
Padres Acima de X.
I e por Dois Desvios
FIGURA 6.8 Distribuio de QIs Masculinos

Neste caso especfico, vamos admitir que os QIs masculinos apresentem maior hetero-
geneidade do que os femininos; em outras palavras, a distribuio dos QIs masculinos
contm uma porcentagem maior de escores extremos-representativos de sujeitos
brilhantes e de sujeitos medocres-enquanto que a distribuio de Qls femininos
contm uma porcentagem maior de escores localizados prximos mdia, isto , ao
redor do ponto de freqncia mxima, no centro.
Em virtude de o desvio padro ser uma medida de variabilidade, essas diferenas
ligadas a sexo deveriam refletir-se no valor do DP de cada distribuio de QIs. Podera-
mos, assim, verificar, por exemplo, que DP = 10 para sujeitos do sexo masculino e que
-3 a -2 a -la X +la +2 a + 30 DP = 5 para os do sexo feminino.
L68,26%-1 Se conheassemos o desvio padro de cada conjunto de escores QI e admits-
95,44% semos que cada conjunto tivesse distribuio normal, poderamos estimar e, em seguida,
99,74% comparar as porcentagens de machos e fmeas localizadas numa dada amplitude de QIs.

FIGURA 6.7 Porcentagens da Area Total sob a Curva Normal Compreendidas Entre -10, -2cr e
-3 a

dizer, ento, que 6 DPs abarcam, para efeitos prticos, a totalidade dos dados sob
qualquer curva normal (mais de 99%).

TORNANDO A NOO DE DESVIO PADRO MAIS CLARA: UMA ILUSTRAO


Ulna importante caracterstica da curva normal auxiliar na interpretao e compre-
enso do desvio padro. Para entendermos melhor essa caracterstica, vamos examinar 85 X = 100 115
o que os antroplogos nos dizem a respeito de diferenas de QIs ligadas a sexo. Muito (-3 a)
embora isso contrarie a opinio dos chauvinistas, h provas de que homens e mulheres
IItm um QI mdio aproximadamente igual a 100. Diga-se tambm, de passagem, que 99,74%
' esses QIs diferem acentuadamente em termos de variabilidade em tomo da mdia.
Distribuio de QIs Femininos FIGURA 6.9
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
88 DA DESCRIO TOMADA DE DECISES
A Curva Normal 89
Por exemplo, se medirmos a linha base da distribuio de QIs masculinos em partir da media, deveria incluir mais de 34,13%, porm menos de 47,72% do total da
a
unidades DP (desvio padro), ficaremos sabendo que 68,26% dos escores caem entre rea sob a curva normal.
-la e +1a, a partir da mdia. Como o desvio padro sempre expresso em unidades Para calcular a porcentagem exata (dos sujeitos que caem dentro) desse intervalo,
brutas e o = 10, autoniaticarnente descobrimos onde se localizam, na distribuio, os devemos empregar a Tabela B do final do livro, tabela essa que fornece a porcentagem
escores 90 e 100 (ou seja: X a = X; portanto 100 -
10 = 90 e 100 + 10 = 110). sob a curva normal entre a mdia e diversas distncias sigmas (medidas a partir de ).
Desse modo, 68,25% dos representantes do sexo masculino tero, nas condies propos- Tais distncias sigmas (de 0,0 a 5,0) aparecem na coluna do lado esquerdo da Tabela B
tas, QIs situados entre 90 e 110. e foram calculadas at a primeira casa decimal. A segunda casa decimal aparece na
Distanciando-nos progressivamente de X no sentido das caudas, verificamos, tal primeira linha, no topo da tabela.
como ilustra a Figura 6.8, que 99,74%, isto , a quase totalidade dos sujeitos (machos), Observe-se que a simetria da curva normal torna possvel calcular as porcentagens
tem QIs entre 70 e 130 (entre -3u e +30). para apenas um dos lados* da media, ou seja, relativamente metade da area da curva
Da mesma forma, se examinarmos, a seguir, a distribuio dos QIs femininos-tal (50%). Os valores da Tabela B correspondem a qualquer dos lados.** Abaixo figura um
como vem ilustrado na Figura 6.9- verificaremos que 99,74% dos dados cairo entre os extrato dessa tabela.
escores (QIs) 85 e 115 (tambm entre -3a e +3a). Assim, se compararmos as duas
distribuies, veremos que a dos QIs femininos apresenta-se relativamente homognea, 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
uma vez que possui menor proporo de escores extremos em ambas as caudas. Tal
diferena reflete-se no "tamanho relativo" de cada DP, e nos escores QIs que caem 0,0 00,00 00,40 00,80 01,20 01,60 01,99 02,39 02,79 03,19 03,59
entre -3a e +3a, a contar da media. 0,1 03,98 04,38 04,78 05,17 05,57 05,96 06,36 06,75 07,14 07,53
0,2 07,93 08,32 08,71 09,10 09,48 09,87 10,26 10,64 11,03 11,41
0,3 11,79 12,17 12,55 12,93 13,31 13,68 14,06 14,43 14,80 15,17
0,4 15,54 15,91 16,28 16,64 17,00 17,36 17,72 18,08 18,44 18,79
USO DA TABELA B
Na discusso da distribuio normal lidamos, at este ponto, apenas com aquelas distn- Para aprender a usar e entender a Tabela B, poderamos, primeiro, tentar localizar
cias, contadas a partir da media, que so mltiplos exatos do desvio padro. Em outras a porcentagem de dados situados entre uma distncia sigma igual a 1,0 e a media. (A
palavras, at aqui s trabalhamos com DPs iguais a 1, 2 ou 3, acima ou abaixo de X. razo disso simples: j sabemos que 34,13% da area total caem entre esses dois pontos
O problema que se coloca agora o seguinte: que devemos fazer para determinar a na linha base.) Ao observar a Tabela B, verificamos que, de fato, ela indica que 34,13%
porcentagem de sujeitos que se situam entre duas quaisquer ordenadas (nab expressas da freqencia total caem entre a media e uma distncia sigma igual a 1,00. Da mesma
por nmeros inteiros)? Por exemplo, suponha o leitor que desejemos estabelecer a forma, vemos que a distncia sigma igual a 2,00 abarca exatamente 47,72% da area
porcentagem da freqncia total que cai entre a media e, digamos, um escore bruto total sob a curva, enquanto que a distncia sigma igual a 2,01 corresponde a 47,78%
localizado a 1,40 DPs acima da media. Como bem demonstra a Figura 6.10, um escore dessa area total.
bruto situado a 1,40 DPs acima da mdia obviamente maior que 1 DP, porm menor
que 2 DPs-contados, ambos a partir de X. Sabemos, assim, que essa distncia, calculada ESCORES PADRONIZADOS E A CURVA NORMAL
Estamos agora preparados para calcular a porcentagem da rea total, sob a curva normal,
associada a qualquer distncia sigma que seja tomada a partir da media. Entretanto,
ainda resta uma questo importante por responder: como determinarnos a distncia
sigma de qualquer escore dado? Em outras palavras, como fazemos para traduzir nosso
escore bruto-aquele que foi originalmente colhido no contato com os respondentes,
por exemplo-em unidades de desvio padro? Se desejssemos traduzir ps em jardas,
simplesmente dividiramos o nmero de ps por 3, uma vez que h 3 ps numa jarda.***
Da mesma forma, se estivssemos traduzindo minutos em horas, dividiramos o nmero
de minutos por 60, j que h 60 minutos em cada hora. De maneira idntica, podemos

* N.T.: Por questo de comodidade, o lado escolhido o da direita, j que, assim, nenhum valor
precisa vir antecedido de sinal.
** N.T.: Observe-se o que ficou dito na N. do T. anterior.
LFIGURA 6.10 Localizao de um Escore (Bruto) Localizado a 1,40 DPs Acima de X
*** N.T.: p =30,48 cm. jarda = ps e, portanto, igual a 3(30,48 cm) =91,44
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor 1 1
cm. 3
90 DA DESCRIO TOMADA DE DECISES
A Curva Normal 91

traduzir qualquer escore bruto em unidades de desvio padro, dividindo a distncia*


X = escore-diferena ou escore-discrepncia
que separa esse escore da mdia (X) pelo desvio padro da distribuio. Para ilustrar:
o = desvio padro da distribuio
vamos imaginar um escore bruto igual a 6 numa distribuio cuja mdia = 3 e cujo
Z = escore padronizado
desvio padro = 2. Calculando-se a diferena entre esse escore bruto e a mdia, obtm-se
um escore-diferena representado por (6 -
3); esse clculo simples mostra que um Exemplo 1
escore bruto igual a 6 est a 3 unidades acima da mdia-sendo que essa "medida" Vamos estudar a distribuio da renda anual de urna cidade norte-americana. A renda
tambm expressa em escores brutos. Se dividirmos esse escore-diferena (discrepncia) anual mdia de US $5.000 e o desvio padro, US$1.500. Admitindo-se que a distri-
pelo desvio padro, que igual a 2, veremos que o escore bruto "6" est a 1,5 (um e meio) buio da renda anual tenha distribuio normal, podemos traduzir um escore bruto
desvios padres acima da mdia. Em outras palavras, a distncia sigma de um escore de, por exemplo, US$7.000 em escore padro do seguinte modo:
igual a 6, nesta distribuio particular, 1,5. Note-se que, independentemente da "situa-
o de mensurao", sempre h 3 ps numa jarda e 60 minutos numa hora. A constncia
z =
-
7.000 5.000
- +1,33
que caracteriza todas essas medidas padronizadas no se aplica ao desvio padro, uma 1.500
vez que ele varia de distribuio para distribuio. Por essa razo, precisamos conhecer
o desvio padro de uma distribuio ou por caculo ou por estimativa ou por informaco
Vemos, assim, que uma renda anual de US$7.000 corresponde a um 1,33 desvios
de terceiros sempre que tenhamos em mente traduzir um determinado escore bruto em
padres acima da mdia anual de US$5.000 (ver Figura 6.12).
unidades de desvio padro.
O processo que acabamos de ilustrar-ou seja, o clculo da distncia sigma a partir
Exemplo 2
de X-produz um valor chamado escore z ou escore padronizado, que indica, em unida- Ao trabalhar com uma distribuio normal de escores representativos do grau de conten-
des de desvio padro, o sentido e o grau com que um dado escore bruto se afasta da
tamento manifestado por um grupo de inquilinos beneficirios do servio pblico de
mdia da distribuioo qual ele pertence. (Observe-se que a coluna do lado esquerdo habitao, vamos supor que X = 10 e DP = 2. (Por conveno, quanto maior o escore,
da Tabela B no fim do livro vem encimada com z.) Assim, um escore z de +1,4 indica maior a satisfao advinda do servio pblico.) Para determinarmos quantos desvios
que o escore bruto fica a 1,4 DPs (ou quase 11/2 DPs) direita (acima) da mdia, en- padres um escore igual a 3 dista da mdia (X = devemos
quanto que um escore z de -2,1 significa que o escore bruto correspondente cai fazer obter a diferena entre esse escore e X Assim: .

esquerda (abaixo) da mdia, num ponto ligeiramente superior a 2 DPs (ver Figura 6.11).
Obtemos um escore z atravs do clculo do escore-diferena (x = X X)-que d - z = X -X = 3 - 10 = -7
a distncia de um X qualquer at a mdia-e, ento, pela diviso dessa diferena por a.

Em sfmbolos: Dividindo, ento, o resultado pelo desvio padro, vem:


z =
X -X
ou onde
a a
,
z = -
0'
= 2
= -3,5
Portanto, como bem demonstra a Figura 6.13, um escore bruto de 3, nessa distribuio,
cai a 3,5 desvios padres abaixo ( esquerda) da mdia.
Nota: conhecendo-se um escore z (padronizado), sempre possfvel obter-se o
escore bruto equivalente mediante o emprego da seguinte frmula:

X = za + X

Entrando com os dados do presente exemplo nessa frmula, resulta:


z = 2,1 X = +1,4
z X = (-3,5)(2) + 10 = -7 + 10 = 3

FIGURA 6.11 Posio de z = -2,1 e de z = +1,4 Numa Distribuio Normal


PROBABILIDADE E CURVA NORMAL
* N.T.: Essa distncia entre o escore bruto e a mdia a prpria discrepncia.
Como veremos a seguir, a curva normal pode ser usada em conjuno
com os escores z
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
92 DA DESCRIO TOMADA DE DECISES
A Curva Normal 93

$5.000 $7.000 3 10
z= +1,33 z = -3,5

FIGURA 6.12 Posio de z =1,33 (na Curva Normal), Relativa ao Escore Bruto US$7.000 FIGURA 6.13 Posio de z = -3,5 Relativa ao Escore Bruto =3

(escores padronizados) e a Tabela B no clculo da probabilidade associada a qualquer da a media, onde se localizam os escores mais freqentes, e h, ainda, reas me-
dado de uma distribuio. No contexto presente, o termo probabilidade refere-se nores progressivamente mais prximas de ambas as extremidades (caudas), onde en-
freqncia relativa de ocorrncia de um dado ou evento qualquer; em outras palavras, contramos, em pequenas propores, escores muito altos ou muito baixos. Ento, em
a probabilidade associada a um evento qualquer o nmero de vezes que tal evento termos probabilsticos, podemos dizer que a probabilidade decresce medida que, na
pode ocorrer em relao ao nmero total de eventos. Redispondo os termos dessa linha de base, nos afastamos da media em ambos os sentidos. Desse modo, dizer que
definio: 68,26% da freqencia total sob a curva normal caem entre -la
e +1 a, a partir da
media, o mesmo que dizer que a probabilidade de cerca de 68 em 100 de que um
Nmero de vezes que o dado caia dentro desse intervalo (-1 a +1a). De forma anloga,
I

Probabilidade de um dado ou evento pode ocorrer dizer que 95,44% da freqncia total sob a curva normal caem entre -2a e +2a, a
ou de um evento qualquer contar da mdia, o mesmo que dizer que a probabilidade de aproximadamente
Nmero total de dados
95 em 100 de que um escore bruto qualquer venha a situar-se dentro desse intervalo
ou eventos
(-2a1---1+2a) e assim por diante.
Assim, a probabilidade de extrair uma nica carta (digamos, um "As de espadas"), O que acabamos de fazer foi repetir precisamente o mesmo conceito de probabili-
de um mao embaralhado de 52 cartas, 1 em 52, uma vez que o evento "s de espadas" dade ou freqncia relativa que j estudamos quando extramos uma carta de um
s pode ocorrer uma vez no total (pois entre as 52 cartas s existe um "s de espadas"). baralho completo, quando jogamos uma moeda ou quando abrimos de forma aleatria
A probabilidade de obter-se "cara" com uma moeda honesta* (ou perfeitamente um livro numa pgina qualquer. Note-se, contudo, que as probabilidades associadas As
balan-
ceada), numa s jogada 1 em 2, j que "cara" s ocorre uma vez no conjunto total de reas sob a curva normal so sempre expressas com relao a 100%-que correspondem
possibilidades (2). Por igual raciocnio, se nos mandassem abrir um livro de 100 pginas rea total sob a curva (por exemplo, 68 em 100; 95 em 100; 99 em 100 e assim por
numa pgina qualquer (por exemplo, pg. 23),** a probabilidade de conseguir, numa s diante). Por essa razo e para garantir que em todo o resto deste livro o termo seja
tentativa e aleatoriamente, abrir o livro naquela pgina seria de 1 em 100. entendido de modo padronizado, vamos sempre falar em probabilidade como sendo o
A curva normal uma distribuio na qual possvel determinar probabi- nmero de vezes que um dado evento pode ocorrer num conjunto de 100 repetices.
Hades associadas a todos os pontos da linha de base. Como j foi mencionado Assim, a probabilidade de sortear um s de espadas de um baralho bem misturado
anteriormente, a curva normal uma distribuio de freqncias; a freqncia to- de 1,92 em 100 (h); a probabilidade de tirar "cara" no lance de uma moeda de 50
tal sob a curva igual a 100%; essa curva apresenta uma rea central que circun- em 100 (1). Note-se, alm disso, que usual expressar probabilidades sob a forma
decimal (P). Por exemplo, podemos dizer que P = 0,50-isto , (A)-de tirar "cara"
num s lance; analogamente, podemos dizer que P = 0,68-ou seja, (-,)-de que um
* N.T.: Alm do termo "honesto"(a), muito comum em
Estatstica, ocorrem, ainda: eqUiprovvel, escore bruto caia entre -1 a e +1 a sob a curva normal.
balanceado(a), nab viesado (a).
Expressa sob a forma de razo (quociente), a probabilidade sera sempre um
* *N.T.: Esse raciocnio falho! Se a idia for
abrir o livro na pgina 23, o mais "ingnuo" dos nmero que oscila entre 0 e 1. A probabilidade de ocorrencia de um evento 0 quando
pesquisadores procurar abri-lo na "primeira metade" e, a, o 100 fica sem sentido. Melhor
seria estamos absolutamente seguros de que ele no ocorrer; 1 quando estamos convenci-
suprimir a sugesto quanto pgina, deixando apenas qualquer.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor dos de que sem dvida nenhuma ele ocorrer. O problema que os pesquisadores nunca
94 DA DESCRIO TOMADA DE DECISES
A Curva Normal 95
esto totalmente seguros a respeito de coisa alguma! Em
conseqncia, podemos, via
de regra, esperar encontrar probabilidades iguais a 0,60,
0,25 ou 0,05; mas raras vezes
possvel esperar reduzir a probabilidade a 0 ou, por outro lado, elev-la Probabilidade de sair "cara" no primeiro lance
a 1.
Uma caracterstica importante das probabilidades reside na regra
da soma, que
estabelece o seguinte: a probabilidade de ocorrencia de um evento Probabilidade de sair "cara" no segundo lance
qualquer, num con-
junto de alternativas, igual el soma das probabilidades separadas.
Suponham, por
exemplo, que desejemos encontrar a probabilidade de extrair, dum
mao bem embara- Probabilidade de safrem "caras" nas duas joga-
lhado de 52 cartas, ou o "s de espadas", ou a "rainha de ouros" ou T (isto e,P - 0,25)
o "rei de copas" das sucessivas
num nico lance. Pela soma das probabilidades isoladas-( + +
h)-verificamos que
a probabilidade de obteno de qualquer dessas
3
cartas, numa nica tentativa igual a
, ou seja, P = 0,06. Em outras
palavras, temos 6 chances em 100 de obter, numa nica FIGURA 6.15 Ilustrao da Regra da Multiplicao: Clculo da Probabilidade de Sarem "Caras" em
tentativa, ou um "s de espadas", ou uma "dama de ouros" ou um "rei 2 Jogadas Sucessivas da Mesma Moeda
de copas"
(ver Figura 6.14).
A regra da soma sempre pressupe que os eventos sejam mutuamente a probabilidade de obteno de eventos mutuamente excludentes em srie igual ao
excludentes, produto das probabilidades separadas. Em lugar de "ou ou", a regra da multiplicao
em outras palavras, que dois eventos no podem jamais ocorrer em
simultaneidade. sugere "primeiro, segundo, terceiro, ..."
Por exemplo, num baralho de 52 cartas, no possvel que, ao mesmo tempo,
uma carta Por exemplo, qual a probabilidade de obter "cara" em duas jogadas sucessivas
seja de "espadas", de "ouros" e de "copas". Analogamente, uma
moeda, jogada uma de uma moeda (isto , "cara" tanto no primeiro lance quanto no segundo)? Visto que
s vez, no pode produzir em conjunto "cara" e "coroa". *1

Admitida a mtua excluso de eventos, podemos dizer que as probabilidades esses eventos so independentes, o evento relacionado com o primeiro lance no influen-
associadas a cada uma das possveis ocorrncias de um evento sempre tm 1 cia o segundo. Na primeira jogada da moeda, a probabilidade de sair "cara" igual
por soma. (ou seja, P = 0,50); na segunda jogada, a probabilidade desse mesmo evento ainda igua1
Essa afirmao estabelece que algo tem que ocorrer. Se no sair "cara",
sai "coroa"; se a -1 (isto , P = 0,50). Portanto, a probabilidade de conseguirmos "cara" em dois lances
no for um "s", ser um "rei", "rainha", "valete", "dez" e por a afora. No
lana- sucessivos de uma moeda igual a )(-- ) = (ou P = 0,25) (ver figura 6.15).
mento de uma moeda, a probabilidade de sair "cara" de (isto , P = 0,50). Natural-
mente, a probabilidade de sair "coroa" tambm de -} (ou seja, P = 0,50). Ento, Para aplicarmos o conceito precedente de probabilidade com referncia curva
se normal, vamos voltar a um exemplo anterior. Recorde-se o litor de que naquele proble-
somarmos as probabilidades relativas a todas as ocorrncias, verificaremos que a
proba- ma relacionado com a distribuio de renda anual de uma cidade (norte-americana),
bilidade de sair "cara" ou "coroa" 1 (isto , + = 1).
Outra propriedade importante das probabilidades a regra da multiplicao: um particular escore bruto teve de ser transformado no seu eqivalente z. Tal distribui-
a, o de rendas tinha mdia de US$5.000 e desvio padro de US$1.500.
o problema consiste em determinar a probabilidade de
realizao de dois ou mais Ao aplicarmos a firmula da "escala z", verificamos, anteriormente, que uma
eventos em sucessa-o, um aps o outro. A regra da multiplicao
estabelece o seguinte: renda anual de US $ 7.000 situava-se a 1,33 DPs acima da mdia (US$5.000); ou seja,

A z =
-
7.000 5.000
= +1,33
Probabilidade de extrair um "s de espadas"
= 52 1.500
Vamos agora determinar a probabilidade associada a um escore situado entre
Probabilidade de extrair uma "dama de ouros" = A + US$5.000-a prpria mdia-e US$7.000. Em outras palavras, qual a probabilidade
de escolher-se de forma aleatria, numa s tentativa, uma pessoa dessa cidade cuja
Probabilidade de extrair um "rei de copas"
renda anual caia entre US$5.000 e US$7.000? O problema est ilustrado graficamente
52 na Figura 6.16 (observe-se a rea sombreada sob a curva) e pode ser resolvido (em ma-
temtica) pela aplicao da frmula dos escores z, combinada com a Tabela B (fim
Probabilidade de extrair ou um "s de espa- do livro).
das", ou uma "dama de ouros" ou um rei de ; isto e, P = 0,06
copas" PASSO 1: Transformar o escore bruto (US$7.000) em escore z *

FIGURA 6.14 Exemplo Ilustrativo da Regra da Soma: Trata-se, Aqui, de Extrair num S
Lance, ou
um "A's de Espadas", ou uma "Dama de Ouros" ou um "Rei de Copas" * N.T.: Alm de "escore z", comum falar-se em "escore reduzido", "(varivel) normal reduzida"
ou, simplesmente, valor da "escala z".
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
96 DA DESCRIO TOMADA DE DECISES
A Curva Normal 97

C.

$5.000 $7.000 $5.000 $7.000


FIGURA 6.16 Proporo da Area Total (sob a Curva Normal) qual Desejamos Associar uma Proba-
bilidade de Ocorrncia FIGURA 6.18 Poro da Area Total (sob a Curva Normal) Cuja Probabilidade de Ocorrncia Dese-
jamos Estabelecer

outras vezes, a porcentagem da area at esse escore; finalmente, a porcentagem da rea


z
X -X 7.000 - 5.000
= +1,33 alm dele, caso em que a idia de "caudalidade" deve estar presente.* Par exemplo, no
a 1.500
caso em pauta, talvez desejssemos saber qual a probabilidade associada ao evento
"renda anual = US$7.000 ou mais que US$7.000".
Vemos, assim, que o escore bruto USS 7.000 est a 1,33 DPs acima da mdia.
Este problema pode ser ilustrado graficamente, conforme a Figura 6.18 (ver area
sombreada). Neste caso, o procedimento seguir os passos 1 e 2 acima, a fim de obter o
PASSO 2: Usando a Tabela B, procurar a porcentagem da freqncia total (sob
o escore z (z = +1,33) e a mdia.
a escore z e encontrar a porcentagem sob a curva normal entre f
= US$5.000 e z = 1,33
(ver Tabela B). No presente caso, entretanto, precisamos ir um passo alm e subtrair de
50% a porcentagem obtida na Tabela B-ou seja, aquela porcentagem da rea que se
Na Tabela B, verificamos que 40,82% (quase 41%) da populao total dessa cidade
ganha entre US$5.000 e US$7.000 (ver Figura 6.17). Assim, se caminharmos com localiza direita (ou esquerda) de I.
Esta afirmao verdadeira porque a Tabela B
a sempre registra a porcentagem da diva que vai de X at um dado z (e nunca a porcenta-
vrgula duas casas para a esquerda e arredondarmos, veremos que a probabilidade de
gem associada a um z particular ou rea situada alm dele).
41 em 100; P = 0,41 de que, ao extrair aleatoriamente um sujeito dessa
populao, sua Portanto, subtraindo 40,82% de 50%, verificamos que pouco mais de 9% (9,18%)
renda anual esteja compreendida nesses limites.
No exemplo anterior, o problema era determinar a probabilidade associada caem em ou alm de US$7.000. Em termos probabilsticos podemos dizer (caminhan do
com a vrgula duas casas para a esquerda) que s h pouco mais de 9 chances em 100
distncia entre a mdia e um particular valor sigma. Muitas vezes, entretanto, possvel
(isto , P = 0,09) de encontrarmos casualmente, nessa cidade, um sujeito cuja renda
que queiramos achar a porcentagem da rea associada a um escore bruto particular;
anual seja igual a ou maior que US $ 7.000.
J mencionamos anteriormente que qualquer distncia sigma acima da mdia
contm uma proporo de sujeitos (dados) idntica encontrada na mesma distncia
sigma abaixo da mdia. Por essa razo, o procedimento para calcular probabilidades
.E1
associadas a pontos (valores, dados, escores) abaixo de X- idntico ao adotado nos
a
(a) exemplos acima.
:a
C.
Por exemplo, a porcentagem da freqncia total entre z = -1,33 (US$3.000)
4-1 e a mdia idntica porcentagem entre z = 1,33 (US$7.000) e a mdia. Portanto,
sabemos que a probabilidade de sortear um sujeito dessa populao (cidade) cuja renda
anual caia entre US$3.000 e US$5.000 de P = 0,41. Por igual raciocnio, a porcen-
$5.000 z = +1,33
* N.T.: "Caudalidade" um neologismo necessrio. Ter presente a "caudalidade" significa obser-
var se o escore em foco est direita ou esquerda na curva. Fala-se, a, em unicaudalidade. Tambm
IFIGURA
6.17 Porcentagem da Area Total sob a Curva Entre X = US $5.000 z = +1,33 possvel, porm, em casos especiais, pensar-se em bicaudalidade, circunstncias em que dois escores
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
e so considerados sitnultaneamente.
98 DA DESCRIO A TOMADA DE DECISES
A Curva Normal 99

tagem da freqncia total em ou alm de z = -1,33 (ou seja, US$3.000 ou


menos) PROBLEMAS
igual porcentagem em ou alm de z = +1,33 (USS 7.000 ou mais). Desse
modo, sabe-
mos que P = 0,09 de obtermos aleatoriamente algum dessa cidade com
uma renda 1. Em qualquer distribuio normal, qual a porcentagem da Area total que cai (a) entre
anual de US$3.000 ou menos. -1 DP e +1 DP; (b) entre -2 DPs e +2 DPs; (c) entre -3 DPs e +3 DPs?
Podemos usar a regra da adio para encontrar a probabilidade de obteno 2. Dado um conjunto de escores brutos com distribuio normal, onde X = 7,5 e
de mais de uma poro da Area sob a curva normal. Por exemplo,
j determinamos DP = 1,3, exprimir cada um dos seguintes escores brutos em termos de escala z:
que P = 0,09 tanto para rendas de US$3.000 ou menos quanto para
rendas de (a) X = 8,0; (b) X = 6,0; (c) X = 5,3;(d) X = 10,2;(e) X = 7,50) X = 8,5; (g) X = 11.
US$7.000 ou mais. Para encontrarmos a probabilidade de obter "US $ 3.000 ou menos" 3. Seja uma distribuio de ganhos dirios, onde X = Cr$ 178,50 e DP = Cr$ 47,60.
ou"US$ 7.000 ou mais", simplesmente somamos as probabilidades individuais (isto , Supondo-se distribuio normal, como podem ser expressas, em escala z, as seguintes
separadas): dirias: (a) X = Cr $142,80; (b) X = Cr $187,00; (c) X = Cr $ 224,40; (d) X = Cr $85,00;
(e) X = Cr$ 255,00; (f) X = Cr$ 195,50; (g) X= Cr$ 153,00.
P = 0,09 + 0,09 = 0,18 4. Mesmos dados bsicos do problema 3, acima. Determinar: (a) a porcentagem de res-
De modo similar, podemos calcular a probabilidade de sortear algum cuja renda pondentes que ganham uma diria de Cr$ 255,00 ou mais; (b) a probabilidade de
caia entre US$3.000 e US$7.000; para tanto, basta somar as probabilidades associadas sortear um respondente cuja diria seja de Cr$ 255,00 ou mais; (c) a porcentagem de
ao escore z = 1,33 de cada lado da mdia.* Portanto, respondentes que ganham de Cr $ 170,00 a Cr$ 178,50; (d) a probabilidade de sortear
um respondente cuja diria caia entre Cr$ 170,00 e Cr$ 178,50; (e) a probabilidade
P = 0,41 + 0,41 = 0,82 de sortear um respondente cuja diria seja de Cr $170,00 ou menos; (f) a probabili-
dade de sortear um respondente cuja diria seja de "Cr$ 170,00 ou menos" ou de
Observe-se que 0,82 + 0,18 = 1, resultado que corresponde soma de todas as "Cr$ 187,00 ou mais"; (g) a probabilidade de sortear dois respondentes cujas dirias
A.

ocorrncias possveis relacionadas com um mesmo fenmeno. sejam de Cr$ 170,00 ou menos.
A aplicao da regra da multiplicao curva normal pode ser ilustrada com o 5. Dado um conjunto de escores brutos, distribudos normalmente, onde = 80 e
seguinte problema: qual a probabilidade de sortearmos de forma aleatoria, nessa popu- DP = 7,5, determinar (a) a porcentagem de respondentes que obtiveram 60 ou
lao, quatro sujeitos cujas rendas anuais sejam de US$ 7.000 ou mais? J sabemos que menos; (b) a probabilidade de sortear um respondente que tenha obtido 60 ou
a probabilidade de extrair casualmente um sujeito (dessa populao) cuja renda anual menos; (c) a porcentagem de respondentes que obtiveram entre 80 e 90; (d) a proba-
seja no mnimo igual a US$7.000 P = 0,09. Portanto, bilidade de sortear um respondente que tenha obtido entre 80 e 90; (e) a porcentagem
de respondentes que obtiveram 85 ou mais; (f) a probabilidade de sortear um respon-
P = (0,09)(0,09)(0,09)(0,09) = (0,09)4 ** = 0,00007 dente que tenha obtido 85 ou mais; (g) a probabilidade de sortear um respondente
que tenha tirado "70 ou menos" ou "90 ou mais"; (h) a probabilidade de sortear
Pe la aphcao da regra da multiplicao, vemos que a probabilidade de extrao tits respondentes que tenham tirado 90 ou mais.
aleatria de quatro sujeitos de renda igual ou superior a US $ 7.000 corresponde a 7
(chances) em 100.000.
04110310ADE
11114,10 FEDERAL
RESUMO TeC4 DO
CRIVTRA PAPA
Procurou-se, neste captulo, relacionar as propriedades da distribuio normal terica E
com problemas do "mundo real", que apresentam interesse para a pesquisa. Demons-
trou-se, assim, que a Area sob a curva normal pode ser usada tanto na interpretao do
desvio padro quanto na elaborao de afirmaes que envolvem a noo de probabi-
lidade. A importncia da distribuio normal tornar-se- mais visvel em captulos
subseqentes deste livro.

* N.T.: Aqui, por exemplo, o problema exige que pensemos em "bicaudalidade".


** N.T.: Seria de grande utilidade para o leitor familiarizar-se, neste ponto, com a chamada
Distri-
buio
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Amostras e Populaes 101

METODOS DE AMOSTRAGEM
Os mtodos de amostragem do pesquisador so, em geral, mais elaborados e sistemti-
cos do que aqueles utilizados no dia-a-dia. Ele preocupa-se basicamente Jill saber se

7
sua amostra de sujeitos bem representativa da populao, a fim de ser-lhe possfvel
fazer generalizaes de uma para a outra. Para fazer tais inferncias, o pesquisador
seleciona um mtodo apropriado de amostragem que leva em conta a possibilidade de
todos os membros da populao fazerem parte da amostra ou, ento, de apenas alguns
membros fazerem parte dela. Se todos os componentes de tal populao tiverem igual
oportunidade (probabilidade) de participar da amostra, diz-se que o mtodo usado o

Amostras e Populaes
da arnostragem casual; se este no for o caso, fala-se em amostragem ntio-casual.

Amostras No-casuais
O mtodo de amostragem no-casual mais conhecido-amostragem acidental-difere
muito pouco dos nossos procedimentos dirios de amostragem, uma vez que ele se
baseia com exclusividade no que convm ao pesquisador. Em outras palavras, o pesqui-
O pesquisador social procura geralmente tirar concluses
sador simplesmente inclui os sujeitos convenientes na amostra, dela excluindo os incon-
a respeito de um grande venientes. A maioria dos estudantes recorda-se de, pelo menos, algumas ocasies em que
ntimero de sujeitos. Por exemplo, ele poderia desejar estudar os 220.000.000 de
cida- um instrutor, interessado numa pesquisa, pediu-lhes que participassem de um experi-
dabs que constituem a populao dos Estados Unidos da Amrica do Norte,
os 1.000 mento ou preenchessem um questionrio. A popularidade dessa forma de amostragem
membros de um sindicato particular, os 10.000 norte-americanos negros que
moram acidental em Psicologia fez com que alguns crticos olhassem para essa disciplina como
numa cidade do sul ou os 45.000 estudantes habitualmente matriculados numa univer-
sidade do leste. sendo "a cincia dos calouros universitrios", dada a grande freqncia com que eles
At aqui, temos admitido que o pesquisador social investiga todo o grupo figuram como sujeitos experimentais em pesquisas.
que Outro tipo de amostragem no-casual o de quotas. Neste procedimento, diversas
ele tenta compreender. Conhecido por populao ou universo, tal grupo
consiste em caractersticas de uma populao, tais como idade, sexo, classe social ou etnia so amos-
um conjunto de indivduos que partilham de, pelo menos, uma caracterstica
comum, tradas nas mesmas propores em que figuram na populao. Suponham, por exemplo,
seja ela cidadania, filiao a uma associao de voluntrios, etnia,
matrcula na univer- que tivssemos de extrair urna amostra, por quota, da populao de alunos de uma dada
sidade etc. Desse modo, poderamos falar a respeito da populao dos Estados
Unidos, universidade, onde 42% fossem mulheres e 58%, homens. Usando esse mtodo, os entre-
da populao dos membros do sindicato, da populao dos norte-americanos
negros vistadores recebem a incumbncia de localizar uma quota de estudantes de tal forma que
residentes numa cidade do sul ou da populao de alunos universitrios.
somente 42% da amostra consista de mulheres e 58%, de homens. As mesmas porcenta-
Posto que o pesquisador trabalha com tempo, energia e recursos econmicos
gens que figuram na populao so reproduzidas na amostra. Se o tamanho global da
limitados, ele raras vezes estuda individualmente todos os sujeitos da populao
na amostra fosse 200, ento 84 moas e 116 rapazes deveriam ser selecionados.
qual est interessado. Em lugar disso, o pesquisador estuda apenas
uma amostra- Uma terceira variedade de amo5tra no-casual a de julgamento ou convenin-
que se constitui de um nfimero menor de sujeitos tirados de uma determinada
popu- cia.* A idia bsica aqui envolvida a de que a lgica, o senso comum ou um julgamen-
lao. Atravs do processo de amostragem, o pesquisador busca generalizar (concluses)
to equilibrado podem ser usados na seleo de uma amostra que seja representativa de
de sua amostra (o grupo pequeno) para a populao toda (o grupo maior), da qual
essa um grupo maior (populao). Por exemplo, para extrair uma amostra de revistas que
mesma amostra foi extrada.
reflitam valores da classe mdia norte-americana, poderamos, levados apenas pela
O processo de amostragem faz parte do dia-a-dia. De que outra forma
consegui- intuio, selecionar Reader's Digest, People ou Parade, uma vez que os artigos dessas
ramos informao acerca de pessoas diversas, nab fora amostrando as que esto nossa
revistas parecem refletir aquilo que a maioria dos norte-americanos de classe mdia
volta? Por exemplo, poderamos casualmente discutir assuntos polticos com alguns
deseja (por exemplo, a satisfao do sonho americano, sucesso econmico, e coisas
estudantes a fim de determinar a opinio geral que a classe estudantil tem com relao
semelhantes). De modo similar, certos bairros que tradicionalmente elegiam o candi-
a esse assunto; poderamos tentar descobrir como nossos
colegas de classe esto-se dato oficial, poderiam ser selecionados num esforo de predizer o resultado de uma
preparando para um exame particular atravs de conversas antecipadas com apenas
eleio oficial.
alguns membros da classe; poderamos mesmo investir na bolsa depois
de descobrir
que uma pequena amostra de nossos scios ganhou dinheiro dessa forma.
PDF compression, OCR, web optimization using a watermarked
N.T.: Umaevaluation copyo uso
traduo mais literal obrigaria
*
ofdeCVISION
"proposital". PDFCompressor
102 DA DESCRIO TOMADA DE DECISES.
A mostras e Populaes 103
Amostras Casuais*
aleatrios, o pesquisador arranja, em primeiro lugar, uma lista de todos os componen-
COMO j foi mencionado anteriormente, a amostragem casual d a cada
membro da tes da populao, e atribui a cada um deles um (e um s) nmero de
populao igual oportunidade de fazer parte da amostra. Esta caracterstica da amos- identificagffo. Por
exemplo, se ele estivesse fazendo uma pesquisa que envolvesse os 500 alunos
tragem casual implica que todos os sujeitos da populao devem ser identificados matricula-
dos na disciplina "Introduo Sociologia", ele poderia conseguir,
antes da extrao da amostra, exigncia geralmente preenchida mediante a obteno com a secretaria,
uma lista de todos os nomes, e atribuir a cada um, sem repeties, um' nmero
(elaborao) de uma lista que contenha todos os sujeitos da populao. Um pouco de da
srie 001, 002, etc. at 500. Concluda a preparao da lista, ele inicia
ateno sugere logo que o fato de conseguir um arrolamento completo de todos os a montagem
de sua amostra extraindo nmeros de uma tabela de nmeros aleatrios.
membros da populao nem sempre tarefa fcil, mormente se uma populao muito Digamos que
o pesquisador queira extrair uma amostra de 50 alunos para
grande ou muito diversificada estiver sendo estudada. Para dar um exemplo simples, representar os 500 membros
dessa populao. Ele poderia iniciar a consulta tabela de nmeros
onde poderamos conseguir uma lista completa dos a1unos regularmente matriculados aleatrios a partir
de qualquer nmero (de olhos fechados, por exemplo) e, movendo-se
numa universidade grande? Agueles pesquisadores que j tentaram fazer isto poderffo em qualquer
sentido, pegar nmeros adequados at que os 50 membros fossem selecionados. Ao
dar testemunho da dificuldade encontrada. Para exemplificar uma tarefa um pouco
olhar para uma poro da tbua de nmeros aleatrios acima, poderamos arbitraria-
mais laboriosa, tente-se encontrar uma lista de todos os residentes numa cidade grande.
mente comear na interseco da coluna 1 com a linha 3, caminhar da esquerda para
De que modo podemos estar seguros de ter identificado todo mundo-mesmo a
aqueles direita e tomar todos os nmeros que surgissem entre 001 e 500. Os primeiros nmeros
residentes que no desejam ser identificados?
que aparecem no cruzamento da coluna 1 com a linha 3 so 0, 4 e 5. Desse
O tipo bsico de amostra aleatria (casual), amostra casual simples, pode ser modo, o
obti- aluno nmero 045 o primeiro membro da populao a ser selecionado para a
do por um processo que no diferente daquela to conhecida tcnica de escrever o amostra.
Continuando da esquerda para a direita, vemos que 4, 3 e 1 so os trs nmeros que
nome de cada um em pedacinhos separados de papel e, de olhos vendados, extrair
\rem a seguir, de modo que o aluno 431 (da lista original) selecionado.
apenas alguns nomes de um chapu. Este procedimento d, idealmente, a cada membro Esse processo
continua at que os 50 sujeitos da amostra tenham sido escolhidos. Nota ao estudante:
da populao uma igual oportunidade de ser selecionado para a amostra, uma vez que
ao usar uma tbua de nmeros aleatrios, no considere nmeros que se
um e somente um pedacinho de papel, por pessoa, colocado no chapu. Por vrias repetem ou
que sejam superiores aos necessrios.
razes (inclusive o fato de que o pesquisador necessitaria um chapu extremamente
Todos os mtodos de amostragem casual so, na verdade, variaes do procedi-
grande), o pesquisador interessado numa amostra casual via de regra no tira nomes de
mento de amostragem aleatria simples que acabou de ser llustrado. Por exemplo, no
chapus. Em vez disso, ele usa uma tbua de nmeros aleatrios semelhante Tabua H
caso de amostragem sistemtica, no h necessidade de usar uma tbua de
localizada no fim deste livro. Parte de uma tbua de nmeros aleatrios foi reproduzida nmeros
aleatrios, uma vez que os membros da populao que participam da amostra so
abaixo.
determinados a partir de intervalos fixos. Ao empregar amostragem sistemtica, ento,
cada n-simo membro de uma populao includo numa amostra daquela
Coluna populao.
Ilustrando: na extrao de uma amostra de tamanho 1.000 de uma populao composta
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 de 10.000 inquilinos, poderamos, depois de proceder ao arrolamento
inicial, selecionar
1 2 3 1 5 7 5 4 8 5 9 0 1 8 3 7 2 5 9 9 3 cada dcimo sujeito da lista.
2 6 2 4 9 7 0 8 8 6 9 5 2 3 0 3 6 4 4
7 0 A vantagem da amostragem sistemtica est no fato de que no necessrio
3 0 4 5 5 5 0 4 3 1 0 5 .3 7 4 3 5 0 8 9 0 usar
4 1 1 8 3 7 4 4 1 0 9 6 2 2 3 4 tbuas de nmeros aleatrios. Como resultado, esse mtodo leva menos tempo do
1 3 1 4 8 que
5 1 6 0 3 5 0 3 2 4 0 4 3 6 2 2 2 3 5 0 o da amostragem casual simples, especialmente quando as populaes so
0 muito grandes.
Do ponto de vista das desvantagens, extrair uma amostra sistemtica implica
admitir
que o fator "posio" na lista dos componentes da populao no introduz vis
Uma tbua de nmeros aleatrios construda com a finalidade de gerar uma nos
srie de nmeros totalmente desprovida de uma "lei de formao". Como resultado,
resultados, isto , no toma a seleo menos aleatria. Se esse aspecto no for levado a
srio, na amostra final podem aparecer mais sujeitos de um tipo do que
o processo de utilizao de uma tbua de nmeros aleatrios produz uma
amostra de outro.
Isso pode ocorrer, por exemplo, quando se extrai uma amostra
no-viesada semelhante produzida pela retirada de nomes, com os olhos vendados, sistemtica de uma
populao de casas, onde as de esquina (por serem geralmente as mais caras do
de um chapu. guar-
teiro) ocupam uma posio fixa; ou, ento, quando os nomes de uma lista
Para extrair uma amostra casual simples por meio de uma tbua de nmeros telefnica
so amostrados por intervalos fixos, pode ocorrer que certos nomes,
vinculados a
problemas tnicos, sejam subestimados.
* N.T.: Ern alguns textos j aparece a expresso amostra Outra variao da amostra casual simples, a amostra estratificada, consiste em
randmica onde "randmica" um apor-
tuguesamento da palavra inglesa random (casual, aleatrio). dividir a populao em subgrupos mais homogneos-estratos-dos quais
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor amostras aleat-
104 DA DESCRIO TOMADA DE DECIS&S Amostras e Populavefes 105

rias, simples, so extradas. Suponham, por exemplo, que desejemos estudar a aceita- gem estratificada, surge uma exceo quando um estrato particular est desproporcional-
o de vrios dispositivos para o controle da natalidade entre os membros de deter- mente bem representado na amostra, tomando-se possvel, assim, uma subanlise
mals
minada cidade. Como as atitudes relativas a controle da natalidade variam com a reli- minuciosa daquele grupo. Tal situao poderia surgir, por exemplo, quando
negros
gio e com a situao scio-econmica, poderamos estratificar nossa populao com norte-americanos, que constituem uma pequena proporo de uma dada populao,
base nessas variveis, e obter, assim, subgrupos cuja homogeneidade maior. Mais so "superamostrados" num esforo de examinar suas caractersticas de maneira
mais
especificamente, suponhamos que fosse possvel identificar, na populao, catlicos, pormenorizada.
protestantes e judeus, bem como classe alta, classe mdia e classe baixa. Nosso proce- Apesar de suas aparentes similaridades, amostras por quota e por estratos so
dimento de estratificao poderia produzir os seguintes subgrupos ou estratos: essencialmente diferentes. Enquanto que os membros de amostras por quotas so
escolhidos atravs do mtodo pelo qual o pesquisador optou, os membros de amostras
protestantes de classe alta estratificadas so sempre selecionados de forma casual, de hbito por meio de uma
protestantes de classe mdia tbua de nmeros aleatrios aplicados lista completa (rol) dos componentes
da
protestantes de classe baixa populao.
catlicos de classe alta Antes de encerrarmos o tpico de mtodos de amostragem, vamos examinar
a
catlicos de classe mdia natureza de uma forma particularmente popular de amostragem casual, conhecida por
catlicos de classe baixa mtodo de conglomerados. Tais amostras so bastante usadas para reduzir os custos
judeus de classe alta de grandes pesquisas, nas quais os entrevistadores devem ser enviados
a locals muito
judeus de classe mdia esparsos, fato do qual decorrem muitas viagens. No emprego do mtodo de
conglome-
judeus de classe baixa rados pelos menos dois nveis de amostragem so empregados:

Tendo identificado nossos estratos, comeamos a colher amostras casuals simples 1.a unidade primria de amostragem ou conglomerado, que corresponde
a algu-
de cada subgrupo ou estrato (por exemplo, de protestantes da classe baixa, de catlicos ma rea bem delineada onde se concentram caractersticas encontradas
na po-
da classe mdia, e assim por diante), at que toda a populao tenha sido amostrada. pulaco toda (por exemplo, estado, comarca, quarteiro, e assim por diante)
e
Em outras palavras, cada estrato tratado, para fins de coleta de amostra, como se 2. os sujeitos amostrados dentro de cada conglomerado.
fosse uma populao completa, e o procedimento de amostragem casual simples
aplicado. Especificamente, cada membro de um estrato recebe um nmero de identi- Para fins ilustrativos, imaginem que quisssemos entrevistar uma amostra
repre-
ficao, arrolado e, a seguir, amostrado por meio de uma tbua de nmeros aleatrios. sentativa de sujeitos que vivem numa rea grande da cidade. Extrair uma amostra casual
0 passo final do procedimento consiste em juntar, num s grupo, os sujeitos seleciona- simples, ou sistemtica ou estratificada de respondentes espalhados numa
grande Area,
dos de cada subgrupo ou estrato, a fim de obter-se uma amostra da populao toda. implicaria muitas viagens, sem mencionar tempo e dinheiro. Se recorrssemos a
amos-
A estratificao baseia-se na idia de que um grupo homogneo requer uma tragem por conglomerados, entretanto, limitaramos nossas entrevistas Agueles sujeitos
amostra menor do que um grupo heterogneo. Por exemplo, estudar os sujeitos que localizados dentro de relativamente poucos conglomerados. Poderamos comear,
por
passam por uma particular esquina do centro da cidade, provavelmente requer uma exemplo, tomando os quarteires da cidade como nossa unidade primria de amostra-
amostra maior do que a necessria para estudar sujeitos que vivem num subrbio de gem ou conglomerado. Seria possvel continuar, ento, arranjando uma lista de
todos
classe mdia. Em geral, encontram-se, no centro da cidade, sujeitos que podem apre- os quarteires abrangidos pela rea, a partir da qual sorteramos uma
amostra casual e
sentar as mais variadas combinaes de caractersticas. Em contraste, as pessoas que simples de quarteires. Depois de ter extrado nossa amostra de quarteires da
cidade,
moram num subrbio de classe mdia so, via de regra, mais semelhantes no que res- selecionaramos os respondentes (ou lares) de cada quarteiro pelo emprego do mesmo
peita a educao, renda, orientao poltica, tamanho da famlia, atitude para com o mtodo casual. Mais especificamente, todos os sujeitos (ou lares) de cada um dos guar-
trabalho-para mencionar apenas algumas caractersticas. teires escolhidos so listados (arrolados) e, com o auxlio de uma tbua de nmeros
Superficialmente, as amostras estratificadas casuals apresentam uma enorme aleatrios, seleciona-se uma amostra de respondentes de cada quarteiro. Atravs do
semelhana com o mtodo de quotas no-casuais, tal como j discutido, uma vez que mtodo de conglomerados, cada entrevistador opta por um dos quarteires j sorteados
ambos os procedimentos requerem, de hbito, a incluso de caractersticas de amostra e contacta alguns respondentes que ali residem.
nas propores exatas com que figuram na populao. Portanto, se 32% de nossa popu- Numa escala mais ampla, o mesmo procedimento de conglomerados pode ser
lao compem-se de protestantes da classe mdia, ento exatamente 32% da nossa aplicado a pesquisas de mbito nacional; para tanto, basta (1) que regies, estados,
amostra devem ser colhidos dentre protestantes da classe mdia; da mesma forma, se parquias sejam tomados como unidades amostrais primrias, sobre as quais incide
11% de nossa populao consiste em judeus da classe baixa, ento 11% de nossa amostra o processo inicial de escolha e (2) que de cada regio, estado ou
parquia seja extrada
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
devem ser constitudos de forma semelhante, e assim por diante. No terreno da amostra- uma amostra aleatria simples-objeto das entrevistas. Desse modo, os entrevistado-
106 DA DESCRIO TOMADA DE DECISES
Amostras e Populaes 107

as regies, estados ou parquias, mas somente


res no precisam percorrer (cobrir) todas aritmeticamente idntica a qualquer das mdias amostrais; de modo anlogo, h
dife-
uma quantidade muito menor de reas-que tenham sido aleatoriamente selecionadas renas entre as prprias mdias amostrais.
para a pesquisa.

DISTRIBUIO AMOSTRAL DE MEDIAS


ERRO AMOSTRAL
Dada a existncia de erro amostral, o aluno pode perguntar-se como
Daqui para a frente, tomaremos um cuidado especial em distinguir as caractersticas possvel gene-
ralizar de uma amostra para uma populao. Para dar uma resposta sensata,
das amostras (que de fato estudamos) das caractersticas das populaes-que consti- vamos
considerar o trabalho de um pesquisador hipottico que esteja estudando o tempo
tuem objeto de nossas generalizaes. A fim de marcar essa distino em nossos pro- gasto
em audio de rdio pela populao de um milho de residentes
cedimentos estatsticos, no podemos mais usar os mesmos smbolos para representar numa cidade do
centro-oeste. Para economizar tempo e dinheiro, ele entrevista somente uma amostra
a mdia e o desvio padro tanto de uma amostra como de uma populao. Ao invs,
colhida ao acaso da populao de residentes. Ele escolhe 500 residentes por meio
devemos empregar diferentes smbolos, conforme estejamos tratando de caractersticas de
uma tbua de nnneros aleatrios e pergunta a cada membro-"Quantos minutos
amostrais ou populacionais. Com referncia mdia, vamos sempre simboliz-la por voc
ouve rdio diariamente?"-e descobre que o tempo gasto varia de 0 a
X quando se tratar de uma amostra e por M, quando se tratar de uma populao. 240 min. Como
demonstra a Figura 7.1, o tempo mdio gasto em audio de rdio, numa amostra
Com referncia ao desvio padro, notaremos por s quando se tratar de amostra e por
de 500 residentes, de 101,55 min.
a, quando se tratar de populactio.
Acontece que o nosso pesquisador hipottico um tanto exantrico, e possui uma
O comportamento tpico do pesquisador tentar obter uma amostra que seja
inclinao notvel para a extrao de amostras de populaes. To intenso
representativa da populao (grupo maior) na qual ele tem algum interesse. Uma vez o seu
entusiasmo por amostragem que ele continua a extrao de amostras adicionais,
que amostras casuais simples do a todos os membros da populao a mesma oportu- cada
uma composta de 500 residentes, e calcula, a seguir, o tempo mdio de audio para
nidade de seleo, elas acabam sendo, no final das contas, mais representativas das
cada amostra. Esse procedimento continua at que o nosso excntrico pesquisador
caractersticas populacionais do que as amostras no-casuais. Tal como foi discutido tenha
conseguido extrair 98 amostras, cada uma com 500 residentes. Nosso processo de extrao
de forma sucinta no Captulo 1, entretanto, por obra do acaso, sozinho, podemos
de 98 amostras casuais, ele, de fato, estuda 49.000 respondentes (500 X
sempre esperar alguma diferena entre uma amostra, aleatria ou no, e a populao 98 = 49.000).
Vamos admitir, conforme demonstra a Figura 7.2, que a populao inteira
da qual ela foi extrada. X quase nunca ser exatamente igual a M; s ser idntico a de
nossa cidade do centro-oeste tenha uma mdia de tempo de audio de
a em rarssimas ocasies. Conhecida por erro amostral, essa diferena aparece inde- 99,75 min.
Como tambm ilustra a Figura 7.2, vamos supor que as amostras colhidas
pendentemente do fato de o plano amostral ter sido bem elaborado e executado, apesar pelo nosso
exantrico pesquisador comportem mdias que variem de 89 a 111 min. De acordo com
das melhores intenes do pesquisador, e em casos onde no tenha havido burla ou
a discusso prvia que foi feita, isso poderia simples e facilmente ocorrer
erro. por causa do
erro amostral.
Para ilustrar a ocorrncia do erro amostral, vamos observar a Tabela 7.1, que
Distribuies de freqncias de escores brutos podem obter-se tanto de amostras
contm uma populao composta de 20 notas fmais de exame e 3 amostras, A, B e quanto de populaes. De modo anlogo, podemos construir uma distribukdo
C, extradas de forma casual dessa populao (mediante o uso de uma tbua de nme- de
mdias amostrais, ou seja, uma distribuio de freqncias de um grande
ros aleatrios). COMo seria de esperar-se, a mdia populacional (M = 71,55) no nmero de

TABELA 7.1 Populao e Trs Amostras Casuais de Notas Finais de Exame

Populao Amostra A Amostra B Amostra C


Nota: X = 101,55 representa a
mdia de uma amostra aleatria
70 80 93 96 40 72 de tamanho 500, onde os sujeitos
86 85 90 99 86 96 so respondentes sorteados de
56 52 67 56 56 49 uma populao cuja mdia, M,
56
igual a 99,75 min.
40 78 57 52 67
49 48
_
8,99
303 249 273

96
72
94
30
431
X =75,75 =62,25 I = 68,25
FGURA 7.1 Mdia do Tempo de Audio de uma Amostra Aleatria Tirada
M = 71,55 Populao de uma
PDF compression, OCR, web optimization using a watermarked evaluation
Hipottica copy of CVISION PDFCompressor
108 DA DESCRIO TOMADA DE DECISES Amostras e Populaes 109

Nota: Cada X representa uma


mostra de 500 respondentes.
SS s 2. A media de uma distribuio de mdias amostrais ("a mdia das medias") e
igual verdadeira media populacional. Se tomarmos um grande nmero de
mdias amostrais casuals da mesma populao e calcularmos a mdia de todas
elas, obteremos o valor da verdadeira media populacional. Portanto, como
demonstra a Figura 7.3, a media da distribuio amostral de mdias (a) igual
A media da populao original; (b) essas mdias
podem ser consideradas permu-
tveis, isto , podem ser tomadas umas pelas outras.
3. 0 desvio padnio de uma distribukdo de medias amostrais menor do que o
desvio padrcio da populao.
M = 99,75 min.
TABELA 7.2 Distribuio de Mdias Amostrais (Audio de Rdio) Resultantes de 98 Amostras
Casuais

Medias 421,

111 min 1
110 1
O4"
ids,
109 1 ./e-1 '((s
108 2 'C'
107
qs, ((se)ea,
2
FIGURA 7.2 Mdia do Tempo de Audio, Relativa a 98 Amostras Casuais Sorteadas de uma 106 CZ; r41(
3
Populao Hipottica em que M = 99,75 min. 105
la. o I
4
104 5
mdias amostrais aleatrias que tenham sido extradas da mesma populao. A Tabela 103 6
s' 444
7.2 apresenta, sob a forma de distribuio, as 98 mdias amostrais coletadas pelo nosso 102 8
101 9
pesquisador exantrico. Tal como quando se trabalha com uma distribuio de escores 100 9
brutos, as mdias da Tabela 7.2 foram dispostas consecutivamente, da mais alta mais 99 9
baixa, e suas respectivas freqncias de ocorre'ncia indicadas numa coluna adjacente. 98 8
97 7
Caractersticas de uma Distribuido de Mdias Amostrais 96 6
At este ponto, nab atacamos diretamente o problema da generalizao de amostras 95 5
94 4
para populaes. O modelo terico conhecido por distribuio de mdias amostrais
93 3
(tal como foi ilustrado pelas 98 mdias amostrais obtidas pelo nosso exantrico pes- 92 2
quisador) tem certas propriedades que lhe conferem um papel importante no processo 91 1

de amostragem. Antes de prosseguirmos com o processo de generalizaes de amostras 90 1

para populaes, precisamos examinar primeiro as caractersticas de uma distribuio 89 min 1

amostral de mdias: N = 98
1. A distribuiplo de medias amostrais aproxima-se de uma curva normal. Tal
como graficamente ilustrado na Figura 7.3(a), dispondo as mdias amostrais
da Tabela 7.2 num polgono de freqncia, acabamos obtendo uma distri- Como ilustra a Figura 7.3, a variabilidade da distribuio amostral sempre menor
buio normal. Isto verdade para todas as distribuies de mdias amostrais que a variabilidade da populao toda. Isso verdade porque tomamos escores
mdios
independentemente da forma da distribuio dos escores brutos que consti- (em lugar da totalidade dos escOres brutos que entram na composio dessas mdias), eli-
tuem a populao da qual as mdias foram extradas.1 minando, desta forma, valores extremos. Por exemplo, o escore mdio 100 pode ser ob-
tido a partir dos escores 60, 90, 110 e 140. Assim: (60 + 90 + 110 + 140 =41 = 100).
iIsso pressupe que extrafmos grandes amostras casuais, de igual tamanho, de uma dada populaco Ao levar esses escores brutos a um grfico, inclumos valores que se estendem
de 60 a
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
de escores brutos. 140; entretanto, ao colocar o escore mdio em grfico, obviamente reduzimos a ocor-
110 DA DESCRIO TOMADA DE DECISES A mostras e Populaes Ill

89 M = 99,75 111
(a)
-3 DP -2 DP -1 DP M +1 DP +2DP +3 DP

FIGURA 7.3 Polgonos de Freqncias Relativos a (a) Distribuio de Mdias Amostrais da Tabela L 68,26%-j
7.2 e (b) Populaes das Quais essas Mdias Foram Extradas 95 ,44% I
DP = desvio padro
99,74%
rncia de valores extremos a um Unico valor, 100. Como resultado, esperamos obter
FIGURA 7.4 A Distribuio de Mdias Amostrais Vista Como uma Distribuio de Probabilidades
um desvio padro menor sempre que certa quantidade de escores mdios for agrupada
e levada a grfico.
de uma curva normal, podemos dizer que as probabilidades decrescem medida
que nos
distanciamos da mdia das mdias (isto , da verdadeira media populacional). Isto faz
A Distribuico de Mdias Amostrais Vista como uma Curva Normal sentido porque, como o aluno poder recordar, a distribuio amostral um resultado
Se definirmos probabilidade em termos de freqncia de ocorrncia, como indicado que decorre de diferenas aleatrias entre mdias amostrais (erro amostral). Por essa
no Captulo 6, ento normal poder ser considerada uma distribuio de proba- razo, podemos esperar que, por acaso e puro a maioria das mdias amostrais
bilidades (e pode-se dizer que a probabilidade diminui A medida que caminhamos ao cair perto do valor que representa a verdadeira mdia popuiacional, enquanto que
longo da linha de base, a partir da mdia, em ambos os sentidos). relativamente poucas mdias amostrais cairo longe dela.
Com essa noo, podemos encontrar a probabilidade de obter diferentes escores A Figura 7.4 indica que cerca de 68% das mdias amostrais de uma distribuio
brutos numa distribuio, desde que sejam dados a mdia e o desvio padro. Por exem- amostral caem entre -1 DP e +1 DP, a partir da mdia das mdias (a verdadeira mdia
plo, para encontrar a probabilidade associada A localizao de um indivduo cuja renda populacional). Em termos probabilsticos, podemos dizer que P = 0,68 para qualquer
anual est entre Cr$ 85.000,00 e Cr $ 119.000,00 numa populao de renda media igual mdia amostral que caia nesse intervalo. Da mesma forma, podemos dizer que a proba-
a Cr $85.000,00, e desvio padro igual a Cr $25.500,00, traduzimos o escore bruto bilidade de que qualquer mdia amostral caia entre -2 DP e +2 DP de 0,95 (95 casos
Cr $ 119.000,00 em escore z (+ 1,33) e entramos na Tabela B do fim do livro para obter favorveis em 100), e assim por diante.
a porcentagem da freqncia total que cai entre o escore z (1,33) e a mdia. Essa rea Uma vez que a distribuio amostral toma a forma da curva normal, podemos
contm 40,82% dos escores brutos. Portanto,P = 0,41 (arredondando) de encontrarmos tambm usar os escores z e a Tabela B para calcular a probabilidade de obter qualquer
um sujeito cuja renda anual situa-se entre Cr$ 85.000,00 e Cr$ 119.000,00. Se desejar- media amostral-e no apenas aquelas que so mUltiplos exatos do desvio padro. Dados
mos a probabilidade de encontrar algum cuja renda de Cr $119.000,00 ou mais, a mdia das mdias e o desvio padro da distribuio amostral, o processo
idntico
precisamos ir um passo adiante, subtraindo de 50% o porcentual obtido na Tabela B. ao usado no captulo anterior relativamente a uma distribuio de escores brutos.
A
(Subtramos de 50% porque essa a porcentagem que se localiza de ambos os lados da nica coisa que muda so os nomes.
mdia.) Subtraindo 40,82% de 50%, verificamos que 9,18% caem exatamente em ou Imaginem, por exemplo, que certa universidade divulgue que seus alunos recebem
alm de Cr$ 119.000,00. Portanto, movendo a vrgula duas casas para a esquerda, uma renda anual media (M) de Cr$ 34.000,00. Supondo que temos boas
razes para
podemos dizer que P = 0,09 (9 casos favorveis em 100) de encontrarmos um sujeito questionar a legitimidade dessa afirmao, decidimos test-la com uma amostra
aleatria
de renda igual a ou maior que Cr $119.000,00. de 100 alunos. No processo, obtemos uma mdia amostral de apenas
Cr$ 23.800,00.
Na presente situao, no estamos interessados em obter probabilidades associa- Perguntamos agora: com que probabilidade obteramos uma mdia de Cr$ 23.800,00
das A distribuio de escores brutos. Ao contrrio, encontramo-nos trabalhando com ou menos se a verdadeira mdia populacional fosse, de fato, Cr$34.000,00?
Ser que a
distribuio de mdias amostrais que foram extradas de uma populao total de universidade divulgou a verdade? Ou ser que isso apenas um golpe
publicitrio na
escores, e desejamos fazer afirmaes probabilsticas acerca dessas mesmas mdias. tentativa de aumentar as matrculas ou as doaes? A Figura 7.5 ilustra a Area
para a
Como ilustra a Figura 7.4, j que a distribuio de mdias amostrais toma a forma
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor qual buscamos uma soluo.
112 DA DESCRIO TOMADA DE DECISES A mostras e Populaes 113

primeira qualidade com referncia distribuio de mdias amostrais. Estivemos tra-


balhando como se ele, da mesma forma como o pesquisador excntrico, realmente
tivesse coligido dados de um nmero bem grande de mdias amostrais, todas
colhidas
de forma aleatria de alguma populao. Se tal fato tivesse ocorrido como
se acabou
de expor, seria uma tarefa bastante simples fazer generalizaes a respeito da populao,
uma vez que a mdia das mdias assume um valor que igual ao da verdadeira mdia
populacional.
Na prtica, o pesquisador raramente coleta dados de mais do que uma ou duas
amostras, a partir das quais ele ainda deseja generalizar para a populao toda. Extrair
Cr$23.800,00 M = Cr$34.000,00 uma distribuio de mdias amostrais requer o mesmd esforo que o de estudar indi-
vidualmente cada membro da populao. Como resultado, o pesquisador no tem
FIGURA 7.5 Probabilidade Associada Obteno de uma Mdia Amostral de Cr $23.800,00 ou conhecimento real nem da mdia das mdias nem do desvio padro da distribuio
Menos, no Caso de a Verdadeira Mdia Populacional ser Cr $34.000,00 com um
Desvio Padro de Cr $4.420,00
amostral. Todavia, ele possui um bom mtodo para estimar o desvio padro da distri-
buio de mdias amostrais a partir dos dados que lhe fornecem uma nica amostra.
Suponhamos que o desvio padro da distribuio amostral seja de Cr$4.420,00. Essa estimativa conhecida por erro padro da media e simbolizada por cry .* Em
Seguindo o procedimento estabelecido, "traduzimos" a mdia amostral de Cr $23.800,00 smbolos:
em escore z, da seguinte forma:
a = ,onde
N -1
z -
- M 23.800,00 - 34.000,00
- -2,31,
Ux 4.420,00 01 = erro padro da mdia (estimativa do desvio padro de uma distribuio
de mdias amostrais)
onde s = desvio padro de uma amostra
= mdia de uma amostra da populao N = nmero total de escores da mesma amostra.
M = mdia das mdias (que corresponderia verdadeira mdia populacio-
Para ilustrar, se o desvio padro de uma amostra de dez respondentes for 2,5,
nal-segundo a declarao da universidade)
ento
ax = desvio padro da distribuio de mdias amostrais.
2,5 2,5
O resultado do procedimento acima informa-nos que uma mdia amostral de - - 0,83
Cr$ 23.800,00 cai a exatamente 2,31 desvios padres abaixo da mdia populacional N/10 - 1 3,0
de Cr$34.000,00-argilda como verdadeira. Consultando a Tabela B no fim do
livro, verificamos que 48,96% das mdias amostrais situam-se entre Cr$ 23.800,00 e Como salientamos acima, o pesquisador que examina apenas uma ou duas amos-
Cr$ 34.000,00. Se subtrairmos essa porcentagem de 50%, obteremos o porcentual tras no pode conhecer a mdia das mdias, ou seja, o valor que corresponde
verda-
da distribuio que corresponde s mdias amostrais de Cr $ 23.800,00 ou menos-na deira mdia da populao. A nica coisa que ele tem a mdia amostral, a qual difere
da
hiptese de a mdia populacional ser mesmo Cr$34.000,00. Tal porcentagem corres- mdia real (da populao) por fora do chamado erro de amostragem. Mas, com isso,
ponde a 1,04% (50% -
48,96% = 1,04%). Portanto, a probabilidade, por arredonda- no acabamos voltando ao ponto de partida? Como possvel estimar a
verdadeira
mento, de 0,01 (1 caso em 100) de obter-se uma mdia amostral de Cr $23.800,00 mdia populacional a partir de uma simples mdia amostral, especialmente diante de tais
ou menos, caso a verdadeira mdia populacional seja Cr$34.000,00. Com uma proba- diferenas inevitveis entre amostras e populaes?
bilidade to pequena de erro, podemos dizer com certa confiana que a verdadeira
mdia populacional ndo realmente Cr$34.000,00. No de estranhar se o relatrio * N.T.: Em muitos textos, o erro Padro da mdia, baseado no
desvio padro da populao e simbo-
da universidade com relao renda anual de seus alunos representar apenas propa-
A.
lizado por distingue-se do erro padro da media estimado, cujo clculo baseia-se no desvio
iganda de baixa categoria. padro da amostra e cujo smbolo Sy. Sem medir toda a populao, entretanto, o valor do
seu
desvio padro no conhecido e deve, por isso, ser estimado. A ttulo de simplificao,
decidimos
ERRO PADRO DA MEDIA fechar os olhos a essa distino, introduzindo uma nica frmula para o erro padro
da mdia,
0,
At agora, estivemos admitindo que o pesquisador possufa, de fato, informao de
PDF compression, OCR, web optimization using a watermarked evaluation simbolizado por
copy of CVISION PDFCompressor cuja base so os dados amostrais.
V 14 DA DESCRIO TOMADA DE DECISES

Na verdade, j nos distanciamos bastante de nossa posio original. Depois de ter = mdia
discutido a naturezo da distribuio de mdias amostrais, estamos agora preparados ay = erro padro da mdia
para estimar o valor de uma mdia populacional. Com a ajuda do erro padro da mdia,
podemos encontrar o intervalo de valores dentro do qual a verdadeira media populacio- Aplicando a frmula acima ao problema em foco, resulta:
18113 41CA CeATRAL
nal pode cair. Podemos, tambem, estimar a probabilidade com que nossa media popula-
cional realmente caird dentro desse mesmo intervalo (de valores de mdias). Este o
intervalo de confiana de 68% = Cr$ 23.800,00 Cr$ 3.400,00
conceito de intervalo de confrana. = Cr$ 20.400,00 Cr$ 27.200,00
O pesquisador, portanto, afirma que ele tem 68% de confiana de que a rendamdia
da populao composta por esses alunos universitrios de Cr$23.800,00 Cr$3.400,00.
1NTERVALOS DE CONFIANA Em outras palavras, h 68 possibilidades em 100 (P = 0,68) de que a verdadeira mdia
A fim de podermos explorar o procedimento que leva obteno de um intervalo de populacional caia realmente no intervalo de limites Cr$ 20.400,00 e Cr$ 27.200,00
confiana, vamos aprofundar o exame de um exemplo anterior. Suponham que uma (Cr$ 23.800,00 - Cr$3.400,00 = Cr$ 20.400,00; Cr$ 23.800,00 + Cr$3.400,00
amostra aleatria de 100 alunos de certa universidade apresente uma renda anual mdia = Cr$ 27.200,00). Essa estimativa feita a despeito do erro amostral, embora dentro
de Cr$ 23.800,00. Como esses dados resultam de apenas uma amostra aleatria, e no de uma margem de erro (de mais ou menos Cr$3.400,00) e a um nvel de confiana
de toda a populao de alunos, no h uma maneira segura de garantir que essa renda especificado (68%).
mdia reflita, de fato, a renda mdia da populao de alunos da universidade. Como j Os intervalos de confiana podem ser construdos para qualquer nvel de proba-
vimos anteriormente, o erro amostral , no fim das contas, a conseqncia inevitvel bilidade. A maioria dos pesquisadores nEo se sente suficientemente confiante em estimar
de amostrar a partir de populaes. uma mdia populacional sabendo que s h 68 possibilidades em 100 da mesma estar
Sabemos, entretanto, que 68,26% de todas as mdias amostrais aleatrias, numa correta (de cada 100 mdias amostrais 68 cairo dentro do intervalo Cr$ 20.400,00 e
distribuio de mdias amostrais, situar-se-o entre -1 DP e +1 DP, a contar da verda- Cr$ 27.200,00). Como resultado, tornou-se convencional usar um intervalo de confiana
deira mdia populacional. Se estimarmos o desvio padro da distribuio amostral mais amplo , embora menos preciso , mas que assegura com melhor probabilidade o
(ay = Cr$3.400,00), e usarmos a nossa mdia amostral de Cr $ 23.800,00 como uma clculo da estimativa da mdia populacional. O uso do intervalo de confiana de 95%
estimativa da mdia populacional, poderemos estabelecer o intervalo dentro do qual, permite obter esse clculo atravs do qual a mdia populacional estimada com a
com 68 possibilidades em 100 (por arredondamento), a verdadeira mdia populacional certeza de que h 95 possibilidades em 100 de estar-se coireto; e h 5 possibilidades
cair. Conhecido por interval de confiana de 68%, esse intervalo de rendas mdias em 100 de estar-se errado (de cada 100 mdias amostrais, 95 cairo dentro do intervalo).
est ilustrado graficamente no Figura 7.6. Entretanto, mesmo usando o intervalo de confiana de 95%, deve-se ter sempre em mente
O intervalo de confiana de 68% pode ser obtido da seguinte maneira: que a mdia amostral do pesquisador poderia ser uma daquelas cinco mdias amostrais

interval de confiana de 68% = I ay , onde


que cafram fora do intervalo estabelecido. Na tomada de decises estatsticas nunca h
possibilidade de ter certeza absoluta.
Como proceder para encontrar o intervalo de confiana de 95%? J sabemos que
95,44% das mdias amostrais numa distribuio amostral situam-se entre -2 DP e
+2 DP, contados a partir da mdia das mdias. Consultando a Tabela B, podemos
"5
afirmar que 1,96 desvios padres, em ambos os sentidos, cobrem exatamente 95% das
mdias amostrais (47,50% de cada lado da mdia das mdias). A fim de encontrar o
C. intervalo de confiana de 95%, devemos primeiro multiplicar o erro padro da mdia
por 1,96 (o intervalo corresponde a 1,96 unidades de ay , contadas para a esquerda e
para a direita a partir da mdia). Portanto,

intervalo de confiana de 95% = X (1,96) ay , onde


Cr$ 20.400,00 Cr$ 27.200,00
Cr $ 23.800,00 X = mdia amostral
-1 ax +1 u,-,
UI = erro padro da mdia.
L68,26% Se aplicarmos o intervalo de confiana de 95% estimativa da renda mdia dos alunos
FIGURA 7.6 Um Intervalo de Confiana de 68%, Quando ai =Cr$ 3.400,00 eX =Cr $23.800,00 universitrios, veremos que

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
116 DA DESCRIO A TOMADA DE DEC1SES Amostras e Populaes 117

intervalo de confiana de 95% = Cr$ 23.800,00 (1,96) Cr $3.400,00


= Cr$ 23.-800,00 Cr$6.664,00
= Cr$17.136,00 Cr$30.464,00 1 1

2
2
4 =V8,9 - 7,29
Concluso: temos 95% de certeza de que a verdadeira mdia populacional cai entre 4
4 16 =\/1,61
Cr $ 17.136,00 e Cr$ 30.464,00.
'i 3 9 = 1,27
Vamos resumir, passo a passo, o procedimento que leva obteno do intervalo
EX2 = 89
de confiana de 95% na seguinte amostra casual de escores brutos:

X PASSO 3: Calcular o erro padro da mdia.

1,27 1,27
0,42
5
2
V10 - 1 3

3
4 PASSO 4: Multiplicar o erro padro da mdia por 1,96.

2
2 Intervalo de confiana de 95% = X 1,96) ox
4 = 2,7 (1,96)(0,42) = 2,7 0,82
3

PASSO 5: Somar e subtrair esse produto da mdia amostral, a fim de obter o intervalo
PASSO 1: Calcular a mdia da amostra. dentro do qual cai a mdia populacional.

Intervalo de confiana de 95% = 2,7 0,82 = 1,88 I 3,52


1 Podemos estar 95% confiantes de que a verdadeira mdia populacional caia entre 1,88 e
5
3,52.
2
EX Um intervalo de confiana ainda mais rigoroso o intervalo de confiana de 99%.
3 X =
4 N Ao consultar a Tabela B no fim do livro, vemos que o escore z de 2,58 representa

2
1

2 -
27
10
49,50% da rea situada de cada lado da curva, a partir do centro (mdia). Dobrando essa
porcentagem, obtemos 99% da rea sob a curva; isso significa que 99% das mdias
amostrais cairo nesse intervalo. Em termos probabilfsticos, de cada 100 mdias amos-
4 = 2,7
3
trais, 99 cairo entre -2,58 DP e +2,58 DP a contar da mdia. Reciprocamente, so-
mente 1 de cada 100 mdias cair fora do intervalo. Em sfmbolos:
EX = 27
intervalo de confiana de 99% = X (2,58) ay , onde
PASSO 2: Calcular o desvio padro da amostra. X = mdia amostral
= erro padro da mdia.

5 25
'EX2 -2 * N.T.: A ttulo ilustrativo foi usada uma amostra pequena. Na prtica, entretanto, um
pesqui-
2 4 sador que use o procedimento acima para calcular um intervalo de confiana deve
trabalhar com,
3
4
9
16 =
'89 - (2,7)2 pelo menos, 30 dados, a fim de garantir a suposio de normalidade na
amostrais. (Ver a discusso da estatstica t no Captulo 8.)
distribuio de medias

PDF compression, OCR,


10
web optimization using a watermarked evaluation copy of CVISION PDFCompressor
118 DA DESCRIO TOMADA DE DECISES Amostras e Populaes 119

Com referncia nossa estimativa da renda media dos alunos universitrios, temos: PASSO 2: Calcular o desvio padro da amostra.
intervalo de confiana de 99% = Cr$ 23.800,00 (2,28) Cr$ 3.400,00
= Cr$ 23.800,00 Cr $ 8.772,00 x2
= Cr$15.028,00 Cr$32.572,00
1 1

Acabamos de estabelecer que, com 99% de certeza, a verdadeira media populacional 5 25


2 4
cair em algum ponto entre Cr$ 15.028,00 e Cr$ 32.572,00. =i-AT-
3 9
O aluno deveria observar que o intervalo de confiana de 99% consiste em uma 4 (2,7)2
16
faixa mais ampla (de Cr$ 15.028,00 a Cr$32.572,00) do que o intervalo de confiana 1 1

de 95% (de Cr$ 17.136,00 a Cr$30.464,00). O intervalo de confiana de 99% abrange 2 4 7,29
a maior parte da area total sob a curva normal e, portanto, um nmero maior de mdias 2 4
4 16 =V1,61
amostrais. Essa faixa mais ampla de escores mdios d-nos maior confiana no sentido
3 9 = 1,27
de termos estimado bem a verdadeira media populacional. Apenas uma nica media
amostral em cada 100 ficar fora do intervalo. Por outro lado, se aumentarmos a nossa EX2 = 89
confiana de 95% para 99%, tambm sacrificaremos o grau de preciso no estabeleci-
mento da media populacional. Mantendo o tamanho da amostra constante, o pesquisa- PASSO 3: Calcular o erro padro da media.
dor deve escolher entre estar correto com maior preciso ou estar correto com maior
confiana. 1,27 1,27
X = 0,42
A fim de resumir passo a passo o procedimento para o clculo do intervalo de 1 V10 - 1
3

confiana de 99%, vamos reexaminar a mesma amostra aleatria de escores:


PASSO 4: Multiplicar o erro padro da media por 2,58.

Intervalo de confiana de 99% = X (2,8)ui = 2,7 (2,58)(0,42)


= 2,7 1,08
2
3 PASSO 5: Somar e subtrair esse resultado (produto) da media amostral, a fim de ober
4 o intervalo dentro do qual cai a media populacional.

2
2
Intervalo de confiana de 99% = 2,7 1,08 = 1,621-I 3,78.
4
3 Temos, assim, 99% de certeza de que a verdadeira media populacional cai entre 1,62
e 3,78.
PASSO 1: Calcular a media da amostra.

ESTIMATIVA DE PROPORES
At aqui, concentramo-nos em procedimentos para estimar mdias populacionais.
No raro, entretanto, o pesquisador procura obter uma estimativa duma proporo
populacional a partir de uma outra proporo resultante do estudo de uma amostra
casual. Uma circunstncia em que isso ocorre com freqencia a chamada prvia eleito-
ral, cujos dados sugerem que certa proporo de votos ir para determinado partido ou
determinado candidato. Quandb um pesquisador de opinio pblica anuncia que 45%
dos votos sero a favor de certo candidato, ele o faz com a convico de que no est
3
100% correto. Em geral, ele tem 95% ou 99% de confiana de que sua proporo esti-
EX = 27 mada cai dentro de certa faixa de propores (por exemplo, entre 40% e 50%).
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
120 DA DESCRIO TOMADA DE DEC1SES
Amostras e Populaes 121

Estimamos propores da mesma maneira utilizada para a estimao de mdias. PASSO 1: Obter o erro padro da proporo.
Todas as estatsticas-inclusive mdias e propores-possuem distribuies amostrais
prprias. Da mesma forma como calculamos h pouco o erro padro da mdia, podemos
agora calcular o erro padro da proporo. Em smbolos: Op =
P (1 - P) 1 0,40(0,60) 0,24
i0,0024 = 0,049
100 100

=
VP(1 - onde
PASSO 2: Multiplicar o erro padro da proporo por 1,96.

Intervalo de confiana de 95% = P (1,96)ap = 0,40 (1,96)(0,049)


Up = erro padro da proporo (estimativa do desvio padro da distribuio = 0,40 0,096
amostral de propores)
P = proporo amostral PASSO 3: Somar esse resultado (produto) proporo amostral e depois subtrair esse
N = tamanho da amostra. resultado da mesma proporo amostral, a fim de obter o intervalo dentro do qual se
situa a proporo populacional.
A ttulo ilustrativo, vamos admitir que 45% de uma amostra aleatria de 100
alunos universitrios declare-se favorvel legalizao do uso de drogas. O erro padro Intervalo de confiana de 95% = 0,40 0,096 = 0,30 0,50
da proporo seria
Podemos assim dizer, com 95% de certeza, que a verdadeira proporo populacional cai
0,45(0,55) ,1 0,2475 entre 0,30 e 0,50.
Up -NI N/ 0,0025 = 0,05.
100 100 RESUMO
Para encontrar o intervalo de confiana de 95%, multiplicamos o erro padro da Este captulo explorou os conceitos e os procedimentos bsicos relacionados com o proble-
proporo por 1,96, e o resultado obtido (a) somamos proporo arnostral e (b) sub- ma de fazer generalizaes de amostras para populaes. Foram apresentados dois mtodos
tramos da proporo amostral. Assim: de amostragem: casual e no-casual. Salientou-se que o erro amostral-aquela diferena
inevitvel entre amostras e populaes-ocorre sempre, a despeito de o piano de amos-
Intervalo de confiana de 95% = P (1,96)op , onde tragem ter sido bem concebido e bem executado. Como conseqncia do erro amostral,
h possibilidade de discutir as caractersticas da distribuio de mdias amostrais, distri-
P = proporo amostral buio essa que, graficamente, assume a forma de uma curva normal, e cujo desvio
Crp = erro padro da proporo. padro pode ser estimado com o auxlio do erro padro da mdia. Munidos de tais
informaes, podemos calcular intervalos de confiana para mdias (ou propores),
Se quisermos estimar a proporo de universitrios que so favorveis legalizao dentro dos quais ser-nos- possvel ter uma dada certeza (95% ou 99%) de onde a ver-
do uso de drogas, procedemos da seguinte forma: dadeira mdia (ou proporo) populacional cai de fato.
Dessa forma, teremos condies de fazer generalizaes 5
Intervalo de confiana de 95% = 0,45 (1,96)(0,05) = 0,45 0,098 de uma amostra para uma populao. 3 3

= 0,35 2 3
0,55
1 2
5 2
Temos, dessa maneira, 95% de certeza de que a verdadeira proporo populacional nem
PROBLEMAS 4 3
menor que 0,35, nem maior que 0,55. Mais especificamente, em algum ponto entre 5 2
35% e 55% situa-se a porcentagem de alunos universitrios que so favorveis a essa 1. Calcule o erro padro da mdia com a seguinte
1 4
legalizao. H um risco de 5% de estarmos errados; por outras palavras, 5 vezes em cada amostra composta de 30 escores amostrais. 6 6
100 tais intervalos de confiana no contero a verdadeira proporo populacional. 3 1
2 1
Vamos resumir o procedimento que permite estimar uma proporo mediante o
1 3
uso do intervalo de confiana de 95%. Admitamos que a proporo amostral a partir da 1 4
qual nossa estimativa deve ser feita seja da ordem de 0,40 (40% dos 100 sujeitos cairo 2 3
nessa categoria). 3 4

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
122 DA DESCRIO TOMADA DE DECISES
Amostras e Populaes 123
2. Com a mdia amostral do problema 1, calcule (a) o
intervalo de confiana de 95%; informao, (a) calcule o erro padro da proporo e (b) construa um intervalo de
(b) o intervalo de confiana de 99%.
3. Calcule o erro padro da mdia com a seguinte amostra confiana de 95%.
composta de 34 escores: 8. Dadas uma amostra de tamanho 150 e uma propor-o amostral de 0,32,
(a) calcule
o erro padro da proporo e (b) construa um intervalo de confiana de 95%.
10 1
9. Dadas uma amostra de tamanho 200 e uma proporo amostral de
4 8 0,25, (a) calcule
10 7
o erro padro da proporo e (b) construa um intervalo de confiana de 95%.
5 5
5 6
6 10
7 6
3 8
5 7
4 PeO*FRA
4
5
00
5
6 5 It' .A
64
6 4
7 3
5 4
8 5

4. Com a mdia amostral do problema 3, calcule (a) o


intervalo de confiana de 95%;
(b) o interva10 de confiana de 99%.
5. Calcule o erro padro da mdia com a seguinte
amostra composta de 32 escores:

4 4
2 3
5 6
6 6
1 7
1 1

7 5
8 7
7 8
8 8
8 4
2 5
6 3
5 2
6 6
4 5

6. Com a media amostral do problema 5, calcule (a) o intervalo


de confiana de 95%;
(b) o intervalo de confiana de 99%.
7. Tendo em mente estimar a proporo de alunos de um
determinado "campus" uni-
versitrio que cram favorveis extino dos centros acadmicos, um
pesquisador
social entrevistou uma amostra aleatria de 50 estudantes e
descobriu que 57%
deles era, de fato, favorvel a essa extino (proporo amostral =
0,57). Com essa
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
PARTE Ill
Tomada de Decises

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
entre Mdias

No Captulo 7, vimos que uma mdia populacional ou uma proporo podem ser esti-
madas a partir da informaa-o que obtemos de uma Unica amostra. Por exemplo, po-
deramos estimar o grau de anomia em determinada cidade, a proporo de pessoas
idosas economicamente prejudicadas ou a atitude mdia relativa ao problema da segre-
gao racial numa populao de norte-americanos negros.
Muito embora tenha o enfoque descritivo da estimago de mdias e propores
importncia bvia, ele no constitui a atividade principal, nem o objetivo Ultimo do
processo de tomada de decises exercitado pelos pesquisadores. A maioria deles, con-
trariamente, preocupa-se com o problema denominado teste de hiptese, onde esto
envolvidas diferenas entre duas ou mais amostras.
Ao testarem diferenas entre amostras, os pesquisadores fazem perguntas tais
como: (a) Sera que os alemaes diferem dos norte-americanos com respeito obedincia
autoridade? (b) 0 maior ndice de suicdios ocorre entre protestantes ou catlicos?
(c) Sera que o fato de um entrevistador ser branco ou preto interfere na "honestidade"
da resposta de um negro? (d) Sera que politicos conservadores da-o a seus filhos uma
disciplina mais severa que politicos liberais? (Ver Captulo 1.) Observe-se que cada uma
dessas indagaes implica fazer uma comparao entre dois grupos: conservadores versus
liberais, entrevistadores negros versus entrevistadores brancos, protestantes versus
catlicos, alemes versus norte-americanos.

HIPTESE NULA: WAD HA DIFERENA ENTRE AS MDIAS


Tornou-se habitual em anlise estatstica comear pelo teste da chamada hiptese
nula-que, em termos bem sirnples, afirma terem duas amostras sido extraidas da mesma
popuho. De acordo com a hiptese nula, qualquer diferena observada entre as amos-
tras considerada como uma ocorrncia casual, mero resultado de erro arnostral. Por-
tanto, uma diferena entre duas mdias amostrais nab representa, luz da hiptese nula,
uma verdadeira diferenca entre as mdias popukcionais.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
128 TOMADA DE DECISES Testes de Diferencas entre Mdias 129

No contexto presente, a hiptese nula pode ser simbolizada da seguinte forma: hiptese experimental que afirma existir uma verdadeira diferena populacional. Em
pesquisa, esse o resultado final sempre esperado. A hiptese experimental estabelece
M1 = M2 , onde que as duas amostras foram colhidas de populaes portadoras de mdias diferentes.
Diz mais: que a diferena obtida do confronto entre as mdias amostrais grande demais
M1 = mdia da primeira populao para ser explicada apenas por erro de amostragem.
M2 = mdia da segunda populao A hiptese experimental relativa diferena entre duas mdias simbolizada
como se segue:
Vamos examinar as hipteses nulas relativas as indagaes h pouco formuladas:
MI M2 , onde
1. Os alemes so nem mais nem menos obedientes autoridade que os norte-
-americanos.
= mdia da primeira populao
2. Protestantes apresentam a mesma taxa de suicdio que catlicos.
3. Respondentes negros so igualmente honestos em suas respostas, quer sejam M2 = mdia da segunda populao significa "no igual")
entrevistados por negros, que por brancos.
Com referncia as indagaes h pouco formuladas, eis como poderiam ser as hipteses
4. As crianas tanto de polticos conservadores quanto de polticos liberais rece-
bem a mesma "dose" de sentido disciplinar. experimentais:
1. Os alemes diferem dos norte-americanos com relao obedincia auto-
Deve-se notar que a hiptese nula no nega a possibilidade de ocorrerem diferen- ri dade .
as entre mdias amostrais. Ao contrrio, ela procura explicar tais diferenas atravs 2. Protestantes e catlicos apresentam diferentes taxas de suicdlo.
da inevitvel presena do erro amostral. De acordo com a hiptese nula, por exemplo, 3. Respondentes negros diferem em suas respostas conforme sejam entrevistados
se descobrirmos que uma amostra aleatria de dentistas do sexo feminino ganha menos por negros ou brancos.
do que uma amostra aleatria dentistas do sexo 4. Polticos liberals diferem de polticos conservadores quanto
masculino (X- = Cr$ 255.000,00), no conclumos, s por isso, que a populao das tido disciplinar imposta aos filhos.
dentistas ganha menos que a populao dos dentistas. Ern lugar disso, tratamos nossa
diferena amostral (Cr$ 255.000,00 - Cr $ 204.000,00 = Cr $ 51.000,00) como um
DISTRIBUIO AMOSTRAL DE DIFERENAS ENTRE MEDIAS
produto de erro amostral-aquela diferena que inevitavelmente surge quanto extramos
uma amostra de uma populao. Como veremos mais tarde, esse aspecto da hiptese No captulo precedente, vimos que as 98 mdias resultantes das 98 amostras colhidas
nula estabelece um elo importante com a teoria da amostragem. pelo nosso excntrico pesquisador puderam ser levadas a grfico, dando origem a uma
distribuio amostral de mdias. De modo anlogo, vamos agora imaginar que o mesmo
HIPOTESE EXPERIMENTAL:* HA DIFERENA ENTRE AS MEDIAS pesquisador exantrico colha no uma, mas duas amostras aleatrias de cada vez, de um
A hiptese nula em geral (embora no necessariamente) estabelecida com a esperana dado universo de pessoas. Suponha-se, por exemplo, que ele colha uma amostra de
de que possa ser rejeitada. Tal afirmao faz muito sentido se atentarmos para o fato de 500 polticos liberais e uma amostra de 500 polticos conservadores. Para testar a hip&
que a maioria dos pesquisadores vive buscando relaes entre variveis. Em outras tese experimental de que os liberais so pais mais ou menos permissivos que os conser-
palavras, eles esto sempre muito mais interessados na busca de diferenas do que na vadores, ele formula perguntas a todos os indivduos componentes das amostras acerca
prova de que elas no existem. Para ilustrar: quem se daria o trabalho de estudar catli- de seus mtodos educacionais (por exemplo: Voc costuma punir seus filhos? Voc
cos e protestantes, quanto sua taxa de suicdio, na esperana de concluir que eles j os espancou? Em caso afirmativo, com que freqncia?). Das respostas a tais pergun-
no diferem? As diferenas entre grupos-sejam elas baseadas em fundamentos tericos tas, o pesquisador obtm uma medida* da permissividade relacionada com a educao
ou empricos-freqentemente fornecem a estrutura lgica para a realizao de um
estudo.
* Seria ingenuidade imaginar que o conjunto de tais perguntas constitui um instrumento
Se rejeitarmos a hiptese nula, ou seja, se concluirmos que a hiptese que antecipa
vlido, capaz de produzir uma medida consistente da varivel "permissividade educacional".
a inexistncia de diferena entre as mdias frgil, automaticamente aceitaremos a fcil de perceber que nada impede-alis tudo favorece!-que esses politicos dem respostas que,
embora contrariando sua postura pessoal, convenham imagem pblica que desejam projetar. No
* N.T.: A hiptese experimental, tambm chamada hiptese alternative, costuma ser indicada se trata, aqui, de "criticar" o instrumento "desse exc'ntrico pesquisador", mas, sim, de alertar o
por Ha (ler "ag-a"). A hiptese nula, tambm chamada hiptese probanda, designa-se por Ho (ler leitor para o fato de que a construo de um instrumento de medida (questionrio ou qualquer
"ag-zero"). outro) implica utilizar tecnologia bastante especial.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
130 TOMADA DE DECISES
Testes de Diferenas entre Medias 131

de crianas, medida essa que pode ser usada na comparao entre a amostra de
liberais Aps ter colhido suas amostras, nosso excentrico pesquisador interroga cada
e a de conservadores. Os escores que resultam desse questionrio variam de 1 (no per- sujeito de cada amostra (isto , 1.000 X 70 = 70.000 pessoas) relativamente ao mtodo
missivo) a 10 (muito permissivo). Como graficamente ilustrado na Figura 8.1, nosso que adota na educao dos filhos; desse levantamento, resulta um escore mdio da
pesquisador excentrico descobre que a amostra proveniente de liberais mais permissiva varivel "permissividade" para cada uma das amostras de liberais e outro escore mdio
(kt = 8,0) do que aquela procedente de conservadores (X = 3,0).
(da mesma varivel) para cada uma das amostras de conservadores. Alm disso, ele
Poderamos perguntar: luz do erro amostral, ser que a diferena entre 8,0 e 3,0 calcula, para cada par de amostras, o escore-diferena das mdias. Por exemplo, se a
(8,0 - 3,0 = +5,0) pode ser estritamente explicada apenas pela ao do acaso? Ser que mdia de permissividade para os liberais for 7,0 e a mdia de permissividade para os
devemos aceitar a hiptese nula (H0) de que no h diferena populacional?* Ou ser conservadores, 6,0, ento o escore-diferena ser +1,0; por igual raciocnio, se a media
que a diferena amostral obtida (+5,0) grande o suficiente para indicar (sugerir) a para os liberais for 5,0 e a mdia para os conservadores, 8,0, o escore-diferena ser
existncia de uma verdadeira diferena populacional entre conservadores e liberais, dife- -3,0. Obviamente, quanto maior o escore-diferena, mais as duas amostras diferem
rena relacionada com suas prticas de educar crianas? com respeito caracterstica pesquisada (isto , permissividade na educao dos filhos).
Aprendemos, no Captulo 2, a interpretar distribuies de freqncias de dados Note-se que sempre subtraimos, para cada amostra, o escore mdio dos conservadores
brutos colhidos numa particular populao. No Captulo 7, vimos que era possvel do escore mdio dos liberais. Os 70 escores-diferenas (resultantes das diferenas entre
construir uma distribuio amostral de escores mdios, bem como uma distribuio de as me dias dos 70 pares de amostras) obtidos pelo nosso pesquisador foram ilustrados
freqncias de mdias amostrais. Focalizando nossa ateno no problema especfico na Figura 8.2.
desse captulo, precisamos ampliar a noo de distribuio de freqncias e examinar Vamos supor que saibamos que a populao de conservadores e a de liberais na
a natureza de uma distribuio amostral de diferenas, isto , uma distribuio verdade no diferem absolutamente com respeito permissividade nos mtodos de criar
de fre-
qncias de um nmero bem grande de diferenas entre mdias amostrais aleatrias que filhos. Digamos que M = 5,0 em ambas as populaes. Se admitirmos que a hiptese
tenham sido extradas de uma dada populao. nula est correta e que liberais e conservadores so idnticos nesse aspecto, poderemos
Para ilustrar a distribuio amostral de diferenas, vamos voltar ao trabalho de usar as 70 diferenas de mdias que o nosso pesquisador obteve para ilustrar a distribui-
nosso pesquisador excentrico cujo amor pela amostragem levou-o, mais uma vez, a
extrair um nmero to grande de amostras que ultrapassa os limites habituais. Em
lugar de extrair uma nica amostra de 500 liberais e outra nica amostra de 500 con- Nota: cada escore re-
presenta a diferena en-
servadores, ele decide extrair 70 pares de tais amostras (70 amostras com, cada uma,
tre (a mdia de) uma
500 conservadores, e 70 outras amostras com, tambm, 500 liberais cada uma). Em amostra de 500 liberais
outras palavras, cada vez que ele extrai 500 conservadores aleatoriamente ele extrai, e (a mdia de) outra
tambm de forma casual, 500 liberais. amostra de 500 conser-
vad ores.

Nota: 5,0 representa a diferena


entre as mdias de duas amostras
aleatrias, cada uma composta de
500 sujeitos.

la
FIGURA 8.1 Diferena Entre as Mdias de Permissividade Resultantes de Amostras de Liberais e de
Conservadores (Populao Hipottica)

* N.T.: Essa e uma forma abreviada de perguntar o seguinte: "Ser


que devemos aceitar a hiptese FIGURA 8.2 Setenta Escores-diferenas Representativos das Diferenas Quanto Permissividade
nula de que, sendo diferentes as mdias das amostras, so tambm diferentes as mdias das populaes? Entre Amostras Aleatrias de Liberais e Conservadores. (Populao Hipottica)
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
132 TOMADA DE DECISES
Testes de Diferenas entre Mdias 133

o amostral das diferenas. Esta afirmao procede porque a


distribuio amostral 20
de diferenas parte do pressuposto de que todos os pares de amostras
s diferem por
fora do erro amostral e no por causa de reais diferenas entre as populaes.
As 70 diferenas entre as mdias, que figuram na Figura 8.2, foram 15
reagrupadas
sob a forma de distribuio de freqncias na Tabela 8.1. Da mesma
forma como tem
ocorrido com outros tipos de distribuies de freqncias, essas diferenas
foram
colocadas em ordem decrescente, com as respectivas freqncias de
ocorrncia na
coluna adjacente.
Com vistas a salientar as propriedades mais importantes de uma
distribuio
amostral de diferenas, os dados da Tabela 8.1 foram graficamente
apresentados
na Figura 8.3. Vemos que, como ilustra a tabela, a distribuio amostral de
diferenas
entre mdias amostrais tende para uma curva normal cuja media ("media das
diferen-
cas") zero.' Isso faz sentido porque as diferenas entre mdias, sendo
algumas posi-
-5 - -3 -2 -1 0 +1 +2 +3 +4 +
tivas e outras negativas, tendem a compensar-se na distribuio (j que
para cada valor
negativo existe um valor positivo eqidistante da mdia. FIGURA 8.3 Polgono de Freqncia Relativo Distribuio Amostral de Diferenas (Ver Tabela 8.1)

TA BELA 8.1 Distribuio Amostral das Diferenas Resultantes de 70 Pares de Amostras Aleatrias populao de conservadores e a de liberals for zero, tambm esperamos que a mdia de
uma distribuio amostral de diferenas seja zero.
Diferenas Entre
It- Medias*
TESTES DE HIPOTESES RELACIONADOS COM
+5 1 A DISTRIBUIO DE DIFERENAS
+4 2
+3
Em captulos anteriores, aprendemos a fazer afirmaes probabilsticas acerca da ocor-
5
+2 7
rncia de escores brutos e mdias amostrais. No presente caso, vamos tentar fazer afir-
+1 10 maes de probabilidade com relao aos escores-diferenas da distribuio amostral
0 18 das diferenas mdias. Como j foi salientado anteriormente, essa distribuio amostral
-1 10 assume a forma de uma curva normal e, portanto, pode ser considerada como uma
-2 8
-3 5
distribuirab de probabilidade. Podemos dizer que a probabilidade decresce A. me dida
-4 3
-5 1

N = 70
* Esses escores-diferenas incluem os valo-
res fracionrios. (Por exemplo, -5 inclui os
valores que vo desde -5,0 at 5,9)

Por ser uma curva normal, a maioria das diferenas mdias amostrais desta distri-
buio cai nos arredores de zero-que o ponto da distribuio que tem
freqncia
mxima; h relativamente poucas diferenas mdias em quaisquer das caudas da distri- -3 SD -2 SD -1 SD O +1 SD +2 SD +3 SD
buio. Tal fato de se esperar, uma vez que o conjunto de todas as diferenas da distri-
buio resulta muito mais de erro amostral do que de reais diferenas populacionais L68,26%1
entre conservadores e liberals. Em outras palavras, se a diferena mdia real 95,44%
entre a
99,74%
10 que pressupe
que extraImos aleatoriamente amostras grandes de uma dada populao de FIGURA 8.4 Distribuio Amostral de Diferenas Entendida Como uma Distribuio de Probabi-
Iscores brutos.
lidades
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
134 TOMADA DE DECISES
Testes de Difereneas entre Mdias I 35
que nos afastamos da mdia das diferenas (zero). Mais
especificamente, como ilustra
a Figura 8.4, vemos que 68,26% das diferenas No contexto presente procuramos, de forma semelhante, traduzir a nossa diferen-
mdias caem entre -1 DP e +1 DP, a
contar de zero. Em termos probabilsticos, isso indica que P = a media amostral (+5) em unidades de desvio padro, mediante a seguinte
0,68 de que qualquer frmula:
diferena entre mdias amostrais cair dentro desse
intervalo. De forma anloga, pode-
mos dizer que a probabilidade de aproximadamente
0,95 (95 casos em 100) de que z =
(Xi -X2)-0 , onde
qualquer diferena de mdias amostrais caia entre -2 DP e +2
DP a contar da mdia raw
da distribuio, que zero, e assim por diante.
A distribuio amostral de diferenas oferece uma X = mdia da primeira amostra
slida base para testarmos
hipteses acerca da diferena media entre duas amostras aleatrias. = media da segunda amostra
Suponhamos, por
. exemplo, que uma amostra de 100 liberais tenha um escore "0" = "zero", isto , o valor da media da distribuio amostral de diferenas.
mdio de permissividade
igual a 7 e que outra amostra, tambm de 100 sujeitos,
porm conservadores, apresente (admitimos que M1 M2 = -
media 2. 0 raciocfnio o seguinte: se a diferena mdia que adz = desvio padro da distribuio amostral de diferenas.
obtivemos, 5, resultante
de (7 -
2 = 5), situar-se to longe da diferena "zero" de
maneira a conferir-lhe somente
uma pequena probabilidade de ocorrncia na distribuio J que o valor da mdia da distribuio de diferenas sempre admitido como
amostral de diferenas, rejeita-
mos a hiptese nula, ou seja, a hiptese que afirma ser a diferena sendo zero, podemos eliminar esse valor (0) da frmula acima (escala z) sem alterar o
obtida apenas o resul-
tado da aa-o do acaso.* Se, por outro lado, nossa diferena media resultado. Portanto:
amostral cai to perto
de zero de forma que sua probabilidade de ocorrncia
grande, devemos aceitar a hi-
ptese nula e tratar a diferena obtida como resultante de erro de
amostragem. Z =
-x 2

Portanto, devemos procurar determinar a que distncia a diferena media


obtida
(neste caso, 5) fica da diferena mdia de zero. Ao fazer isso,
devemos primeiro trans-
formar nossa diferena obtida em unidades de desvio padro. Com relao permissividade entre liberais e conservadores, precisamos,
primeiro,
Recorde-se que para traduzir escores brutos em unidades de desvio padro
usamos
traduzir nossa diferena mdia (obtida, calculada) no eqivalente z. Se o desvio padro
a frmula da distribuio amostral de diferenas (udi) for 2, obteremos o
seguinte escore z:
X -X
z - , onde 7 -2 - 5
-2 = +2,5
2

X = escore bruto
Portanto, a diferena mdia, 5, entre liberais e conservadores situa-se a 2,5 desvios
X = mdia da distribuio de escores brutos
padres, a contar da media zero, na distribuio de diferenas.
a = desvio padro da distribuio de escores brutos.
Perguntamos: qual a probabilidade de que uma diferenca de 5 ou mais entre
Analogamente, podemos traduzir os escores mdios de uma distribuio de medias amostrais ocorra nica e exclusivamente em funco do erro amostral?
mdias Recor-
amostrais em unidades de desvio padro atravs da frmula rendo Tbua B no fim do livro, verificamos que z = 2,5 representa 49,38% da distri-
buio quer para a direita, quer para a esquerda da mdia zero. Em outras palavras,
t7-. 4/ 98,76% (isto , 49,38% + 49,38% = 98,76%) das diferenas mdias amostrais
caem
, onde entre zero e uma diferena mdia de 5 para ambos os lados (a partir da mdia),
ax donde
resultam, como ilustra a Figura 8.5, valores positivos e valores negativos. Em termos pro-
X = mdia amostral
babilsticos, isto significa que existe uma P = 0,99 (99 possibilidades em 100) de que uma
M = mdia da populao (mdia das mdias) -
diferena media caia entre -5 e +5. Se subtrairmos de 100% (100% 98,76% = 1,24%),
encontraremos, por arredondamento, P = 0,01; essa a probabilidade de que uma dife-
0-X = erro padro da mdia (estimativa do
desvio padro da distribuio de

[
rena mdia de 5 (ou maior que 5) entre amostras ocorra nica e exclusivamente por
mdias). causa do erro amostral. Em outras palavras, uma diferena mdia de 5 ou mais
ocorre
por fora do erro amostral (e, portanto, aparece na distribuio amostral) apenas uma
* N.T. : comum usar-se com o mesmo sentido erro vez em cada 100 diferenas mdias. Sabendo disso, no poderamos
amostral e diferenea resultante da aetTo do considerar a rejeio
caso. da hiptese nula e a aceitactio da hiptese experimental? (Lembremo-nos de que a
. hip-
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor tese experimental-lia-estabelece que realmente existe uma diferena
.

populacional
136 TOMADA DE DECISES Testes de Diferenas entre Medias 137

rejeio da hiptese nula sempre que for muito pequena a probabilidade


de que a di-
ferena amostral tenha sua origem no erro de amostragem (por exemplo,
5 casos em
100). *
Por uma questo de conveno, usamos o nvel de conflana (signifiaincia)
de
0,05 (= 5%). Em termos mais simples, estamos dispostos a rejeitar a
to
hiptese nula se a
diferena amostral obtida ocorrer por acaso somente 5 vezes ou menos em 100 (isto , 5%
z = -2,5 z = +2,5 no mximo). O nvel de confiana de 0,05 foi indicado graficamente na Figura
8.6.
Como ela bem ilustra, este nvel de confiana encontra-se nas reas pequenas das caudas
da distribuio de diferenas entre mdias. Essas so as reas sob a curva que
represen-
-7 -6 -5 -4 - -2 -1 0 +1 +2 +3 +4 +5 +6 +7 tam uma distncia de (mais ou menos) 1,96 desvios padres contados a partir de zero,
que a media das diferenas.
98,76%
Com vistas a entender melhor por que esse ponto particular na distribuio
FIGURA 8.5
amostral representa o nvel de confiana (significncia) de 0,05, podemos recorrer
Representao Grfica da Porcentagem da Area Total na Distribuio de Diferenas
Entre z = -2,5 e z = + 2,5 Tabela B (fim do livro) para determinar a porcentagem da freqncia total que est
associada aos 1,96 desvios padres contados a partir da mdia. Vemos que 1,96 desvios
entre conservadores e liberais-no caso de a varidvel observacional ser a permissividade padres para ambos os lados demarcam 2,5% das diferenas mdias amostrais. (Assim:
na criao de filhos.) Afinal, 1 possibilidade em 100 representa uma boa margem de 50% - 47,5% = 2,5%.) Em outras palavras, 95% das diferenas amostrais caem entre
risco, no mesmo?
-1,96 DPs e +1,96 DPs contados da mdia das diferenas (zero); somente 5% caem a
Dada a situao acima, a maioria de ns decidiria rejeitar a hiptese nula, ainda partir desse ponto (1,96) (2,5% + 2,5% = 5%).
que pudessemos estar errados ao faz-lo. (No esquea de que sempre existe 1 possibili- Nveis de significncia podem ser estabelecidos para qualquer grau de probabili-
dade em 100.) Entretanto, a deciso no sempre to fcil. Suponha-se, por exemplo, dade. Por exemplo, o nvel de 0,01 mais rigoroso, uma vez que sua adoo
implica
que seja do nosso conhecimento o fato de a diferena mdia ocorrer, por erro amostral, rejeitar a hiptese nula somente no caso de haver 1 possibilidade em 100 de que a dife-
10 (isto , P = 0,10), 15 (isto 6,P= 0,15) ou 20 (isto 6,P= 0,20) vezes em cada 100. Ser
que ainda assim vamos rejeitar a hiptese nula? Ou ser melhor e mais "prudente"
atribuir nossa diferena ao erro amostral?
Precisamos, pois, de um ponto de referencia consistente* para decidir se uma di-
ferena entre duas mdias amostrais grande demais para ser explicada apenas pela
ao do acaso. Em outras palavras, precisamos de um mtodo que nos possibilite decidir
quando um determinado resultado estatisticamente siginficante.**

NVEIS DE SIGNIFICNCIA
Para decidir se a diferena amostral obtida estatisticamente significante-resultado de
uma real diferena entre as populaes e nab apenas produto de erro amostral- habi-
tual estabelecer um nvel de confiana (tambm chamado nivel de signifialncia), nvel
esse que representa a probabilidade com que a hiptese nula pode ser rejeitada com
confiana (segurana)*** ou, dizendo de outro modo, a probabilidade com que a hip& FIGURA 8.6 Representao Grfica do Navel de Significncia (Confiana) de
0,05 (isto , 5%)
tese experimental pode ser aceita (com confiana). Em conseqncia, decidimos pela
* N.T.: Sendo de importncia- capital esse aspecto
da teoria da deciso estatfstica, no demais
recolocar a questo nos seguintes fermos: uma diferena entre mdias amostrais
N.T.: Esse ponto de referencia comumente designado valor critico. ocorre (1) porque
existe uma real diferena entre as mdias das populaes de onde foram
N.T.: Um resultado estatisticamente signzficante quando igual a ou maior que o valor extrafdas as amostras ou
(2) porque houve interferencia do erro de amostragem. Se houve erro de
crtico (isto , o ponto de referencia), o qual, via de regra, encontra-se tabelado. amostragem, tudo se passa
como se no existisse diferena entre as mdias amostrais. Esse fenmeno, porm,
relativamente
*** N.T.: Essa confiana ou segurana sempre relativa e no constitui um problema do estats- raro e, por isso, est associada a ele uma probabilidade muito pequena. Em
outras palavras, as reais
thy, seno do especialista na Area ern que determinada pesquisa esteja sendo feita. diferenas no ocorrem por acaso, mas, sim, por fora de um agente especfico.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
138 TOMADA DE DECISES
Testes de Diferenas entre Mdias 139

rena amostral encontrada deva-se apenas ao do acaso, isto , do erro de amostra- amostras pareadas, a fim de tornar possvel o seu clculo. Contudo, essc dcsvio padro
gem. O nvel de 0,01 representado pela rea que se estende de -2,58 a +2,58 desvios desempenha um importante papel nos testes de hipteses relacionados com diferenas
padres contados a partir de zero. entre mdias e, portanto, no pode ser ignorado.
Os nveis de confiana no nos oferecem garantia absoluta quanto correo da Felizmente, existe um mtodo simples atravs do qual o desvio padro da distri-
hiptese nula. Sempre que decidimos rejeit-la a um certo nvel de significncia, expo- buio de diferenas pode ser estimado de forma acurada com base nas duas amostras
mo-nos ao risco de estar tomando a deciso errada. Rejeitar a hiptese nula quando extradas. Essa estimativa do desvio padro da distribuio amostral de diferenas
deveramos t-la aceitado ocasiona o chamado erro alfa (ou erro tipo l). A probabilidade costuma ser designada erro padrab da diferena e simbolizada por cif Em smbolos:
de cometer um erro alfa s existe quando rejeitamos* a hiptese nula e varia de confor-
midade com o nvel de confiana adotado. Por exemplo, se rejeitarmos a hiptese nula,
dif = OX
- 2
UX
- 2
2
, onde
ao nvel de 5%, e concluirmos que conservadores de fato diferem de liberals quanto aos
mtodos de criao de filhos, haver 5 possibilidades em 100 de estarmos errados. Em
outras palavras, P = 0,05 de que cometamos um erro alfa-e conservadores no diferem adif = erro padro da diferena
realmente de liberais. De modo anlogo, se escolhermos o nvel de confiana (signifi-
ai = erro padro da primeira media amostral

cncia) de 1%, se:, h 1 possibilidade em 100 (P = 0,01) de tomarmos a deciso errada 2 = erro padro da segunda media amostral.
quanto diferena entre liberais e conservadores. bvio que, quanto mais rzgoroso o
Com o propsito de ilustrar, vamos supor que obtivemos os seguintes dados para
nosso nvel de confiana, menor a probabilidade de cometermos um erro alfa. (Note-se,
uma amostra de 50 liberais e outra amostra de 50 conservadores:
tambm, que, quanto mais rigoroso o nvel, mais na "ponta" das caudas ele se localiza.)
Para exemplificar com um caso extremo, se adotarmos o nvel de 0,001, o risco de
Liberais (N = 50) Conservadores (N =50)
ocorrncia de um erro alfa fica limitado a uma vez em cada mil.
Entretanto, quanto mais nas pontas das caudas localizar-se o nvel de significncia, X = 7,0 = 6,0
maior o risco de estarmos cometendo outro tipo de erro, conhecido por erro beta (ou s = 2,0 s = 1,5
erro tipo II). assim que se designa o erro de aceitar a hiptese nula quando, na verda-
de, ela deveria ter sido rejeitada. O erro beta indica que a nensa hiptese experimental A fim de calcular o erro padro da diferena, precisamos,.primeiro, encontrar o
ainda pode estar correta, apesar da deciso de rejeit-la em favor da hiptese nula. erro
padro para cada media amostral. Recorde-se que isso se faz a partir do desvio padro
Uma forma de reduzir o risco de cometer este tipo de erro beta aumentar o tamanho das de cada amostra (ver Captulo 7):
amostras, de sorte que, havendo uma real diferena entre as populaes, tal fato fique
mais evidenciado pelo procedimento.**
Nunca podemos estar certos de que no tomamos uma deciso errada relativamen-
te hiptese nula, j que examinamos apenas uma amostra e no a populao toda.
(TY'
s
- 1 \/50
2,0
- 1
= -
2,0
7,0
= 0,29

Como nab temos conhecimento dos verdadeiros valores populacionais,*** corremos o


risco de cometer ou um erro tipo I ou um erro tipo II, dependendo da nossa deciso.
Tal risco, na tomada de decises estatsticas, depende da disposio do pesquisador.
ffx2 VN2
S2

- 1 V50
1,5
- 1
= -
1,5
7,0
= 0,21

Uma vez que conheamos o ai para cada media amostral, podemos obter o ad,f como
ERRO PADRO DA DIFERENA se segue:

Nunca temos a possibilidade de conhecer, de imediato, o desvio padro da distribuio


de diferenas entre mdias. E, tal como o caso da distribuio amostral de mdias
adif = VcrX 12 + ax, 2 = V0,292 -I- 0,212 = V0,08 + 0,04 = N/0,12
(Captulo 7), seria um esforo descomunal tentar extrair um nmero muito grande de
= 0,35
* N.T.: Quando rejeitamos a hiptese nula indevidamente. O erro padro da diferena (ncissa estimativa do desvio padro da distribuio de dife-
** N.T.: Uma analogia pode ajudar a entender melhor o procedimento: quando certas partculas renas) , pois, 0,35. Se estivssemos testando a diferena entre liberals (X = 7,0) e
a() so facilmente visveis numa superfcie, uma lente de aumento, porque "aumenta" toda a regio conservadores (X = 6,0) com respeito varivel "permissividade", poderamos usar
por ela abrangida, reala, tambm, aquilo que antes era imperceptvel. nosso resultado (0,35) a fim de traduzir a diferena mdia amostral (obtida) no seu
***N.T.: Verdadeiros valores populacionais o mesmo que pardmetros.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
equivalente z (isto , em escala z):
140 TOMADA DE DECISES Testes de Diferencas antra Mdias

-
141

z -
17172
=
7 -6 - 1
= 2 86 Homens (N =35) Mulheres (N =35)
0dif 0,35 0,35 '
Xl X2 X2

Voltando Tabela B (fim do livro), verificamos que um escore z igual a 2,86


representa exatamente 49,79% das diferenas mdias para cada lado, ou 99,58% das
diferenas mdias para ambos os lados da curva a partir da mdia das diferenas, que
1 1

/
1
1

4
1

2
4
4
16
1

1
zero. (Em outras palavras, 49,79% + 49,79% = 99,58%) Se subtrairmos essa soma 1 1 1
2 4 1 1
de 100%, veremos que menos de 1% (0,42%) dos escores-diferenas entre mdias possui 1 1 1 1
um valor igual ou superior a 1. Portanto, P menor que 0,01 de obtermos uma diferena 1 1 1 1
mdia igual a 1 por puro acaso (= erro de amostragem). Podemos rejeitar a hiptese 1 1 5 25
nula tanto ao nvel de significncia de 0,05 quanto ao de 0,01 dependendo, apenas, do 1 1 1 1
2 4 2 4
critrio estabelecido para o nosso estudo.*
4 16 2 4
5 25 1 1
1 1 1 1
Ulna Ilustrao 1 1 1 1

Com vistas a dar ao leitor uma ilustrao passo a passo do procedimento (acima) que 2 4 1 1
1 2
permite testar a significncia da diferena entre duas mdias amostrais, vamos imaginar 1 4
2 4 3 9
que, ao nvel de 0,05, quisssemos pr prova a seguinte hipbtese: do ponto de vista 1 1 1 1
etnocntrico, no h diferena entre homens e mulheres (M1 = M2). Nossa hiptese 2 4 1 1
experimental que as mulheres diferem dos homens com respeito ao etnocentrismo 2 1 1 1 1

(M1 M2 ). Para testar essa hiptese, vamos imaginar que "aplicamos" um instrumento 1 1 2 4
destinado a avaliar a varivel "etnocentrismo" a uma amostra aleatria de 35 homens e 1 1 2 4
1 1 2 4
a outra amostra, tambm aleatria, de 35 mulheres, obtendo os seguintes escores para
3 9 1 1
cada uma delas (X = escores etnocntricos. A escala vai de 1 a 5 e quanto maior o valor 3 9 1 1
maior o grau de etnocentrismo.) if*

EX -=
-1

60 EX2 = 142
1

16
EX -=
1

54 EX2 = 114
1

Homens (N =35) Mulheres (N =35)

PASSO 1: Achar a mdia aritmtica de cada amostra.

1
1

1
1

1
1

1
- =
IX1
- 60
- 1,71
1 1 2 4
2 4 1 1
1

1
1
1
1

1
1

1
X2 - 1X2
N
- 35
1,54
3 9 3 9
3 9 1 1 PASSO 2: Achar o desvio padro de cada amostra.

2 4`Etnocentrismo" refere-se tendncia de avaliar


todos os grupos de pessoas pela utilizao de
s1 =
fX2
X - 142
2,92 = V4,(76 - 2,92 = Nin.4 = 1,07
nossos prprios padres culturais.
01 N.T.: E prtica no se) usual como tambm "cientificamente saudvel" fixar o nfvel de signifi- 1,c2 131:
- 2,37 =
cia antes da realizao do experimento e da coleta de dados. Tal prtica impede o pesquisador
= 0,94 sa= X 2,37 = V3,26
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
e fazer-se "concesses", caso os resultados finais no abonem a sua hiptese experimental.
142 TOMADA DE DEC1SES
Testes de Diferenas entre Mdias 143

PASSO 3: Achar o erro padro de cada mdia. que contm pequeno nmero de respondentes (ou de dados). Do ponto de vista prtico,
uma amostra pode ser considerada pequena se contiver, por exemplo, menos de 30
07 1 07
- 1

V34
=
5,83
- 0 18
'
sujeitos. Embora os resultados baseados em amostras pequenas possam ser convenientes,
se no necessrios, dada a dificuldade de colher amostras maiores, eles podem
com-
prometer de forma sria as concluses, se sua interpretao for associada rea sob a
S2 0,94 0,94 curva normal (Tabela B). Esta afirmao verdadeira porque a distribuio amostral de
= = 0'16
- 1 N/34 = 5,83 diferenas s assume a forma da curva normal se as amostras que a compem forem
grandes. Um pesquisador que esteja trabalhando com 5, 10 ou 20 respondentes por
PASSO 4: Achar o erro padro da diferena. amostra no tem condies de satisfazer ta1 exigncia. Como resultado, ele no pode
usar escoresz baseados na distribuio normal.
adif = N/o,17,2 + a.7722 = \/(0,18)2 + (0,16)2 = N/0,03 + 0,03 = V0,06 Esse "afastamento da normalidade" na distribuio de diferenas pode ser com-
pensado estatisticamente mediante o uso do que se convencionou chamar razo t (ou
= 0,25 estatistica t). Tal como ocorre com o escore z, a razo t pode ser usada para traduzir
uma diferena mdia amostral em unidades de erro padro da diferena. Ainda com a
PASSO 5: Traduzir a diferena mdia amostral em unidades de erro padro da diferena. escala z como pano de fundo, a razo t pode ser analogamente obtida da seguinte
forma: calcular a diferena entre as mdias das amostras e dividi-la pelo erro padro
Z - - X2 1,71 - 1,54 0,17
0,68 da diferena. Em smbolos:
0dif 0,25 0,25
X1 X2
PASSO 6: Achar a porcentagem da rea total sob a curva normal entre z e a mdia das t = , onde
diferenas (0). (Ver Tabela B.) 0chf

X1 mdia da primeira amostra


25,17%
X2 = mdia da segunda amostra
+25,17%
0dif erro padro da diferena.
50,34%
Como pode ser observado acima, a frmula da razo t iantica usada para o
PASSO 7: Subtrair de 100% para achar a porcentagem da rea total associada dife- clculo dos escores z, aprendida anteriormente. Porm, ao contrrio do que ocorre com
rena mdia amostral obtida. a estatstica z, a estatstica t precisa ser interpretada com referncia a graus de fiber-
dade3 (gl), graus esses que no s variam com o tamanho da amostra mas que so res-
100,00% ponsveis diretos pelo formato da distribuio amostral de diferenas. Quanto maior
a amostra, maior o nmero de graus de liberdade. Quanto maior o nmero de graus de
-50,34%
liberdade, maior a aproximao da distribuio de diferenas curva normal. Com infi-
49,66% nitos graus de liberdade, a razo t transforma-se num escore z e, a, podemos empregar
Do resultado do Passo 7, acima, vemos que, por arredondamento, h P = 0,50 a Tabela B para interpretar nossos resultados.
de obtermos uma diferena mdia de 0,17 (isto , 1,71 -
1,54 = 0,17) por mero erro Mas que ocorre quando trabalhamos com amostras pequenas? Como que resol-
vemos o problema de encontrar os graus de liberdade e interpretar nossa razo t? Quan-
amostral. Como conseqncia, devemos aceitar a hiptese nula e rejeitar a hiptese
experimental ao nvel de significncia de 0,05. A probabilidade de ocorrncia da nossa do esta ltima estiver sendo usada na comparao de duas mdias amostrais, o nmero
diferena mdia obtida entre homens e mulheres maior que 5% (ou seja, 5 em 100). de graus de liberdade pode ser calculado pela aplicao da frmula
Para sermos exatos, a probabilidade de 50 em 100! Concluso: nossos dados amostrais
nab indicam que, relativamente varivel "etnocentrismo", haja diferena significativa
gl = N1 + N2 - 2, onde

entre homens e mulheres.


3
Graus de liberdade, tecnicamente, referem-se liberdade de variao num conjunto de escores.
COMPARAES ENTRE AMOSTRAS PEQUENAS Se tivermos uma amostra de 6 escores, ento 5 deles tm "liberdade" de variar, enquanto que
1 e
apenas 1 fixo (quanto ao valor). Portanto, numa amostra simples de tamanho 6 (por exemplo, 6
comum que pesquisadores, principalmente no campo social, trabalhem com amostras respondentes), gl =N - 1 ou 5.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
144 TOMADA DE DEC1SES Testes de Difereneas entre Mdias 145

= tamanho da primeira amostra


1V2 = tamanho da segunda amostra. Identidade
Anonimato (N = 6) Conhecida (N =6)
Portanto, se estivermos comparando uma amostra de 6 liberals com outra de 8 conser-
12
vadores, nossos graus de liberdade sero: + 8 -2 = 12. X1 X2 12
UNIVERSIDADC
Com o auxlio da Tabela C (fim do livro) e do nmero (calculado) de graus de FEDERAL DO
1 1 3
gl BLI OTECA PARA
liberdade, podemos interpretar qualquer valor obtido de t. A Tabela C registra os valores 2 4 5 25
CE NTR AL
de t necessrios para a rejeio da hiptese nula aos nveis de significncia de 0,05 e 1 1 5 25
0,01, associados a diferentes graus de liberdade. Ao examinar a Tabela C, vemos uma 1 1 5 25
2 4 4
coluna encimada por gl (graus de liberdade) e uma lista de valores t para cada grau de 16
1 1
liberdade (p. ex., 1, 2, 3, ..., 30, ..., 40, ... 100, ..., 00), aos nveis de significncia de 0,05 e 5 25
EX = 8 EX2 = 12 Ex = 27 EX2 = 125
0,01. Como veremos adiante, esses valores t podem ser usados na interpretao do nosso
calculado (tambm chamado observado).
Observamos que os 6 membros da amostra "annima" deram, no
total, 8, en-
Comparao entre Amostras Pequenas: Uma Ilustrao quanto que os 6 membros da amostra "no-annima", 27. 0 procedimento
passo a
Para ilustrar o uso da estatstica t, dos graus de liberdade e da Tabela C no teste da di- passo que se segue pode ser usado para testarmos se a diferena
obtida estatisticamente
ferena entre mdias de duas amostras pequenas, considere-se a seguinte situao: certo significante.
pesquisador decide testar se o "comportamento caridoso" varia em funo do "anoni-
mato" ou "no-anonimato" do doador. Daf: PASSO 1 : Achar a mdia de cada amostra.

Hiptese Nub: 0 grau de "comportamento caridoso" no varia em funo do `no- /Xi 8


(1111= M2) nimato" ou "no-anonimato" do doador. =
N - 6
= 1,33

Hiptese Experimental: 0 grau de "comportamento caridoso" varia conforme seja o 1.X2 27


(M1 M2) doador mantido no "anonimato" ou no "no-anonimato".
2 - N 6
4,50

Para testar essa hiptese, o pesquisador estabelece 5% como nvel de significncia; PASSO 2: Achar o desvio padro de cada amostra.
por outras palavras, ele decide, desde o incio, rejeitar a hiptese nula somente se a
probabilidade for de 5 em 100* de que a diferena mdia amostral resulte de erro de VXX2
amostragem (isto , por ao do acaso). Depois de ter estabelecido esse critrio de signi- A/ 6 N/2,00 - 1,77 = = 0,48
ficncia, ele colhe duas amostras aleatrias de doadores potenciais. A todos os membros
de ambas as amostras ele solicita donativos, em dinheiro, para distribuio aos sobrevi- /125
ventes de um terremoto de grandes propores. Aos 6 membros da primeira amostra ele
S2 =
V 6
(4,50)2 = N/20,83 - 20,25 = N5F3 = 0,76
d a garantia do anonimato; aos 6 membros da segunda amostra ele promete tornar
pblicos os seus nomes. Temos, a, as condies experimentais de anonimato versus PASSO 3: Achar o erro padro de cada mdia.
identidade conhecida.
0,48
As quantias** doadas pelos membros de ambas as amostras figuram no quadro - 0,48
abaixo: - - 1 - 2
= 0,21

* N.T.: Cumpre salientar que o ravel de significncia de 5%, tal como foi estabelecido, a proba- r- = = 0,34
bilidade mxima tolerada, mas nada impede que esse nvel seja efetivamente menor que o estabele-
V5 2,24
cido. Maior que no pode!
** N.T.: No texto original, as quantias figuram em dlares (USS). Tendo em mente aproveitar o PASSO 4: Achar o erro padro da diferena.
exemplo, que foi muito bem concebido, a unidade monetria (USS) foi eliminada, de sorte que
1, 2, 3, 4 e 5 podem significar qualquer quant, em qualquer moeda, desde que seja respeitada a Voi12 + Gri22 = V(0,21)2 + (0,34)2 = V0,04 + 0,12 = f0-,176- = 0,40
paridade cambial.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
146 TOMADA DE DECISES Testes de Diferenas entre Medias 147

onde
PASSO 5: Traduzir a diferena mdia amostral em unidades de erro padro da diferena.
si = desvio padro da primeira amostra
Ati - 1
'
33 - 4,50
=
3,17
- 0,40 =
S2 = desvio padro da segunda amostra
CilliVERSIDADE
FEDERAL
adif 0,40 = tamanho da primeira amostra BLEILIOTECil
DO
N2 = tamanho da segunda amostra. CENTRAL PARA

PASSO 6: Achar o nnmero de graus de liberdade.


Para ilustrar passo a passo o procedimento que permite comparar amostras de
gl = + N2 - 2 = 6 + 6 -2 = 10
tamanhos diferentes, considere-se a hiptese de que crianas negras e crianas brancas
de certa regio urbana diferem quanto tendncia para a criminalidade. Nesse caso,
PASSO 7: Comparar a razo t (obtida, calculada) com o t adequado (que figura na
temos:
Tabela C). Hiptese Nula: Crianas negras nO diferem de crianas brancas com relao varivel
to = t observado (obtido) 7,93
(M1 = M2) observacional "tendncia para a criminalidade':
tc = t crtico (tabelado) = 2,228 Hiptese Experimental: Crianas negras diferem de crianas brancas com relaco
gl = 10 varivel observacional "tendncia para a criminalidade':
(M1 M2)
= 0,05
Para testar essa hiptese ao nvel (de confiana/significncia) de 0,05, imagine-se
Como bem evidencia o passo 7, para rejeitarmos a hiptese nula ao nvel de que certo pesquisador tenha submetido duas amostras aleatrias, de tamanhos diferen-
confiana (significncia) de 0,05, com 10 graus de liberdade, nosso t observado (to ) tes, a um instrumento de medida capaz de fornecer informaes numricas (dados)
deve ser igual a 2,228 ou maior. No caso em foco, obtivemos um t = 7,93. Portanto, relacionadas com a "tendncia para a criminalidade". A amostra de crianas brancas era
rejeitamos a hiprtese nula e aceitamos a hiprtese experimental. O grau de "compor- de tamanho 4 e a de negras, 7. Nessa escala, o valor 1 representa baixa tendncia para a
tamento caridoso" varia, na realidade, em funo do anonimato e do no-anonimato. criminalidade e o valor 5, forte tendncia. Os escores finais constam do quadro abaixo:
Para ser mais especfico, a condio "identidade conhecida" produz, significantemente
"mais caridade" (X = 4,50) do que a condio "anonimato" (X = 1,33).
Brancas (N =4) Negras (N =7)

COMPARAES ENTRE AMOSTRAS DE TAMANHOS DIFERENTES 271 A'2 x2 X2

At agora, temos trabalhado com amostras que contm exatamente o mesmo nnmero 1 1 4 16
de respondentes ou de dados. Na ilustrao anterior, por exemplo, cada amostra con- 2 4 1 1

tinha 6 respondentes. Porm, quando, de fato, estamos realizando uma pesquisa, no


raro ocorre que nossas amostras diferem quanto ao tamanho. Poderamos, assim, ter
uma amostra de 50 liberais e outra de 64 conservadores ou uma amostra de 15 homens EX1 =
- 1

7
-
EX2 = 15
9
1 1

2
2
1

4
4
e outra de 22 mulheres. Para que seja possvel fazer comparaes entre amostras de 1 1
tamanhos diferentes, precisamos encontrar uma forma de atribuir peso adequado EX2 = 12 EX2 = 28
influncia de cada amostra. No caso de X, isso ocorre automaticamente, uma vez que
sempre dividimos EX por N. Tal, porm, no se aplica ao erro padro da diferena: cada
O procedimento para testar essa hiptese pode ser ilustrado como se segue:
desvio padro amostral-em que se baseia o adif-"contribui" da mesma maneira na
f6rmula aprendida pginas atrs, muito embora diferenas grandes e importantes, ligadas
PASSO 1: Calcular a mdia de cada amostra.
ao tamanho da amostra, possam estar presentes.
Esse problema pode ser contornado mediante o emprego da frmula do erro
padro da diferena, em que a influncia relativa de cada desvio padro pode ser ponde- = 1,75
ra da em termos do respectivo tamanho da amostra. Essa frmula figura a seguir:

_1(N1s,2 + N2s22\( 1\ /X2 12


1 = = 1,71
N
(Fa if - 2 AN, + N2)
\ N, + N
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
148 TOMADA DE DECISES Testes de Diferenas entre Mdias 149

PASSO 2: Calcular o desvio padro de cada amostra. mens vs. mulheres", "negros vs. brancos", "liberais vs. conservadores". Antes de pas-
sarmos para outro tpico, precisamos introduzir uma ltima variao de procedimento
estatstico para a comparao de duas mdias. Estamos falando do procedimento
- 3,06 = V3,75 - 3,06 = NATO. = 0,83 chamado painel ou antes-e-depois: trata-se de mensurar a mesma amostra em dois
momentos distintos (momento 1 vs. momento 2). Por exemplo, um pesquisador pode
querer medir a varivel "hostilidade" numa mesma amostra de crianas em dois mo-
278
2,92 = N/4,00 - 2,92 = ./T,F3 = 1,04 mentos distintos: antes e depois de terem assistido a um particular programa de tele-
viso. Da mesma forma, poderamos querer medir "diferenas atitudinais" com refe-
PASSO 3: Calcular o erro padro da diferena. rncia a um determinado candidato em dois momentos tambm distintos: antes e
depois da campanha eleitoral.
11.9 +12 N+ 2Ns 222 ) (N11 N12) V( 4(0,483+)2 7(%04)2) Para ilustrar, passo a passo, esse procedimento comparativo (antes-e-depois),
vamos supor que diversos sujeitos tenham sido desapropriados e forados a mudar
de residncia em virtude da construo de um novo elevado. Como pesquisadores
.\/( 2,76 +9 7,56) sociais, temos interesse em determinar o impacto da mobilidade residencial forada
(0,25 + 0,14) = - 1(19-z9 (0,39) = N/1,15k0,39) sobre os sentimentos de "vizinhana" (isto , se havia, por parte dos mesmos sujeitos,
k 9
predisposio favorvel para com os vizinhos antes da mudana e se essa predisposio
- NAT,,T3- = 0,67 sofreu alterao depois dela). Nesse caso, ento, M1 o escore mdio de "aceitao
dos vizinhos" no momento 1 (antes da mudana) e M2 o escore mdio de "aceitao
PASSO 4: Traduzir a diferena mdia amostral em unidades de erro padro da diferena. dos vizinhos" (outros, naturalmente) no momento 2 (depois da mudana). Portanto:

t =
Yet - X., 1,75 - 1,71 0,04
- 0,06
Hiptese Nula: 0 grau de "aceitao dos vizinhos" no sofre influncia da varidvel
craa 0,67 0,67 011 = M2) "mudana forada".

PASSO 5: Achar o nmero de graus de liberdade. Hiptese Experimental: 0 grau de "aceitao dos vizinhos"-sofre influncia da vania-
(111 *M2) vel "mudana forpada':
gl = + N2 - 2 = 4 + 7 -2 = 9
Para testar o impacto da mudana forada sobre os sentimentos de "vizinhana",
PASSO 6: Comparar a razo t obtida com a razo t tabelada (Tabela C). entrevistamos uma amostra aleatria* de 6 sujeitos, antes e depois da mudana. De
nossas entrevistas resultam os seguintes escores de "aceitao dos vizinhos" (escores
mais altos, numa escala de 1 a 4, indicam maior aceitao):
razo t obtida (t observado) 0,06
razo t tabelada (t crtico) 2,262
Antes da Depois da
gl = 9
Mudana Mudana Dzferena (Dtferena)2
0,05
Respondente Xi X2 X1 - X2 = D D2
Como indica o passo 6, para rejeitarmos a hiptese nula ao nvel de 0,05, com Estvo 2 1 1 1
9 graus de liberdade, nosso t calculado deve ser igual a 2,262 ou maior. Posto que Mrian 1 2 1 1
obtivemos um t calculado de apenas 0,06, devemos aceitar a hiptese nula e rejeitar Carolina 3 1 , 4
a hiptese experimental. Nossos resultados no sustentam a opinio de que crianas Linda 3 1 2 4
ilegras e crianas brancas diferem significativamente com respeito varivel "tendncia
Para a criminalidade".
Alan
Davi
-
= 14
1

EX2 =
-
2
1

8
1
3

ED2 = 20
1
9

COMPARAO DE DADOS RESULTANTES DE DUAS


MENSURAES TEMPORALMENTE DISTINTAS DA MESMA AMOSTRA * N.T.: A casualidade da amostra refere-se apenas ao momento 1; no momento 2, os sujeitos en-
t aqui, discutimos comparaes entre duas amostras trevistados vo ser obrigatoriamente os mesmos.
A independentes, tais como "ho-
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
150 TOMADA DE DECISES
Testes de Diferencas entre Medias 15 I

O quadro acima demonstra que o foco da comparao do tipo antes-e-depois


PASSO 6: Comparar a razo t calculada com a razo t tabelada (Tabela C).
est na diferenca entre os momentos 1 e 2, como bem reflete a frrnula para o clculo
do desvio padro (da distribuio dos escores-diferenas antes/depois):
razo t calculada (t observado) = 1,47
razo t tabelada (t crtico) = 2,571
- (x, UNIVERSIDADE FEARAL DO PARA
s
N2
V1D - )72)2 gl = 5
= 0,05 131BUOTECA CENTRAL

Nessa frmula,
A rim de que seja possvel rejeitar a hiptese nula ao nvel de 0,05, com 5 graus
de liberdade, devemos obter um t observado de 2,571. Como o nosso t observado
s = desvio padro da distribuio de escores-diferenas antes/depois
igual a 1,47-menos do que o t crtico- aceitamos a hiptese nula e rejeitamos a hip&
D= diferena resultante da subtrao do "escore depois" do "escore antes" tese experimental. A diferena amostral obtida relativamente a "sentimentos de vizi-
N= tamanho da amostra (nmero de respondentes). nhana" antes e depois da mudana fruto, na verdade, de puro erro amostral.
PASSO 1: Calcular a media de cada momento. REQUISITOS PARA O USO DO ESCORE z E DA RAZO t
Como teremos a oportunidade de ver ao longo de todo o restante do livro, todos os
Tc, = 1,X - 14
= 2 33 testes estatsticos, para poderem ser usados, devem preencher certos requisitos. Quando
N 6 '
mais no for, pelo menos deve ser possvel admitir certas condies. O emprego de um
1X2 8 teste inadequado pode confundir e levar o pesquisador a falsas concluses. Por isso, os
N 6 '
seguintes requisitos devem ser rigorosamente observados sempre que cogitemos de usar
os escores z ou a razo t como testes de significncia:
PASSO 2: Calcular o desvio padro da diferena entre os escores colhidos nos mo- 1. comparacdo entre duas mdias. O escore z e a razo t so empregados a
mentos 1 e 2.
fim de possibilitar: (a) comparao entre duas mdias de amostras (aleatrias)
independentes; (b) comparao entre as mdias de dois conjuntos de escores
20 / 20
(Xi X2)
2
- 6
(2,33 - 1 33)2 =
A/ 6
1
'
00 relativos mesma amostra, porm colhidos em momentos distintos.
1
2. Dados Intervalares. Admitimos, aqui, que os nossos dados pertencem ao nvel
intervalar de mensurao. Portanto, no podemos usar escores z ou razo t
= 0,33 - 1,00 = V2,33 = 1,53
com dados ordinais ou dados que s possam ser categorizados, como o que
ocorre no nvel nominal de mensurao (ver Captulo 1).
PASSO 3: Calcular o erro padro da diferena.
3. Amostragem aleatria (casual). As nossas amostras devem ser sempre colhidas
1,53 1,53 aleatoriamente.
= = 0,68
(Td if
- 1 N/6 - 1 2,24 4. Distribuica-o normal. O emprego da razo t em amostras pequenas pressupe
que a varivel observacional,(na amostra) tenha distribuio normal na popula-
PASSO 4: Transformar a diferena mdia amostral em unidades de erro padro da o. O escore z, em amostras grandes, no muito afetado se esse requisito
diferena. no for respeitado. Geralmente, no temos 100% de certeza de que existe nor-
malidade de distribuio. No havendo razo para supor o contrrio, muitos
t
- x2 2,33 - 1,33 1,00
= 1,47
pesquisadores admitem pragmaticamente que a varivel observacional tenha dis-
Crdif 0,68 0,68 tribuio normal. Entretanto, se o pesquisador tiver boas razes para suspeitar
de possvel no-normalidade, aconselhamo-lo a no dar preferncia ao teste t
PASSO 5: Achar o nmero de graus de liberdade. (ver Captulo 6).

gl = N - 1 = 6 - 1 = 5 Nota:N refere-se ao tamanho da amostra e


no ao nmero de escores j que h RESUMO
2 por respondente.
com diferenas entre Este captulo ocupou-se dos testes de hipteses relacionadas
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
152 TOMADA DE DECISES Testes de Diferenas entre Medias 153

mdias amostrais. Com esse propsito em mente, descrevemos e ilustramos uma distri-
buio de diferenas entre mdias amostrais como uma distribuio de probabilidades. Amostra 1 Amostra 2
Com o auxilio dessa distribuio e do erro padro da diferena, foi possvel fazer afir-
maes de probabilidade acerca da diferena mdia; a partir da, foi tambm possvel 8 1

3 5
rejeitar ou aceitar uma hiptese nula a um especfico nvel de confiana (ou nvel de
1 8
significncia). Alm disso, vimos que uma estatstica t (razo t), associada a graus de 7 3
liberdade, podia ser usada para testar hipteses relacionadas com diferenas entre 7 2
pequenas amostras e entre amostras de tamanhos diferentes e, ainda, para testar a 6 1

mesma amostra quando mensurada em dois momentos distintos. A adequao da esta- 8 2

tstica t depende de certos requisitos, tais como: (1) comparao entre duas mdias;
(2) dados intervalares;* (3) amostragem aleatria e (4) distribuio normal dos dados. 4. Dadas as duas seguintes amostras aleatrias de escores, testar a significncia da
diferena entre suas mdias:

PROBLEMAS Amostra 1 Amostra 2


1. Pesquisadores sociais procuraram testar a hiptese de que os jornais lidos pela
6 6
classe baixa so igualmente "dirigidos" para temas sexuais quanto os lidos pela 6 5
classe mdia. Empregando um "ndice de sexualidade", eles coligiram dados de 8 7
uma amostra aleatria composta de 40 artigos publicados em revistas de classe 7 7
5 3
mdia e outra amostra, tambm aleatria, com outros 40 artigos publicados em
4 3
revistas de classe baixa. Enquanto que a amostra da classe mdia apresentou uma 8 5
mdia de sexualidade igual a 3,0, com um desvio padro de 1,5, a amostra da classe 7 6
mais baixa apresentou mdia 4,0 e desvio padro igual a 2,0. (Critrio: maiores 7
escores mdios indicam maior grau de sexualidade.) Com os dados acima, testar a
hiptese de que no h diferena (significativa), relativamente sexualidade, entre 5. Testar a significncia da diferena entre as mdias das sguintes amostras aleatrias
os contedos das publicaes dirigidas a essas duas classes scio-econmicas. O que de escores:
que indicam os seus resultados?
Amostra 1 Amostra 2
2. Dois grupos de alunos fizeram exames finais de Estatstica. Um desses grupos re-
cebeu preparao formal para esse exame, enquanto que o outro apenas leu os 15 10
textos bsicos, sem, entretanto, comparecer As aulas. O primeiro grupo (o que 18 11
assistiu As aulas) conseguiu as seguintes notas: 2, 2, 3 e 4; o segundo grupo (o que 12 12
no assistiu As aulas) obteve as seguintes notas: 1, 1, 2 e 3. Testar a hiptese nula 17 10
19 10
de que no h diferena, com respeito aos escores de exame, entre o primeiro grupo
de alunos e o segundo. Que que seus resultados indicam? (Observao: a escala de 6. Testar a significncia da diferena entre as mdias das seguintes amostras aleatrias
notas ia de 1 a 10, sendo que os maiores valores atribua-se maior conhecimento de de escores:
Estatstica.)
3. Dadas as duas seguintes amostras aleatrias de escores, testar a significncia** da Amostra 1 Amostra 2
diferena entre suas mdias:
1 2
1 2
2 4
* N.T.: Melhor seria dizer no minimo "dados intervalares". Com efeito, nada impede que, com
3 2
"dados racionais", faa-se uso da estatsticat.
3 2
N.T.: Testar a significiincia significa verificar se o t ealculado ou observado (to) igual a ou
maior que o t erftico (tc). Lembrar que se to tc -+ Ho rejeitada 7. Testar a significncia da diferena
..>.-*
entre as mdias das seguintes amostras aleatrias
e se to < tc -> Ho no rejeitada. de escores:
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
154 TOMADA DE DECISES
Testes de Diferenvas entre Mdias 155

Amostra 1 Amostra 2 11. Testar a significncia da diferena entre mdias, numa situao do tipo "antes-
-depois", com os seguintes escores componentes de amostras aleatrias:
5 10
7 7
7 9
Respondente Antes Depois
3 9
A 7 3
6 7
B 6 4
5 8
C 5 2
4
D 4 3
6
7

8. Testar a significncia da diferena entre as mdias das seguintes amostras aleatrias 1 2. Testar a significncia da diferena entre mdias, numa situao do tipo "antes-
de escores: -depois", com os seguintes escores componentes de amostras aleatrias:

Amostra 1 Amostra 2 Respondente Antes Depois

3 7 A 6 3
6 8 7 4
4 8 10 9 tillul/ERSIDADE
2 9 9 7
9 8 5 FEDiR44
BIBLIOTECA
6 /JO Plifi4
5
C4ITRAt
9. Testar se a diferena entre as mdias dos escores que comp:5m as duas seguintes
amostras aleatrias significante:

A mostra I Amostra 2

10 10
4 10
1 8
2 7
4
8
3
5

10. Antes e depois de assistirem a um filme, cujo objetivo era aliviar a discriminao
contra grupos minoritrios, seis estudantes foram testados. A vafivel observa-
cional era "atitude para com judeus", e
quanto maiores fossem os escores, mais
Estudantes Antes Depois
favorveis seriam as atitudes. Com os dados
abaixo, testar a hiptese de que, com rela- A 2 4
o s "atitudes", o filme no exerceu B 2 5
a menor influncia sobre os estudantes. C 4 3
D 6 8
E 7 9
F 5 8

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
16.-
Anlise de Varincia 157

serem consideradas significantes. Quanto mais testes estatsticos realizarmos, entretanto,

9 maiores as possibilidades de encontrarmos valores estatisticamente significantes em


virtude de erro amostral (mais do que em virtude de uma real diferena populacional) e,
da, cometer um erro alfa. Quando realizamos um grande nUmero de tais testes, a inter-
pretao do resultado torna-se problemtica. Um exemplo extremo: como interpreta-
ramos um t significante no meio de 1.000 comparaes pareadas feitas num estudo
Anlise de Varincia particular? Sabemos que pelo menos algumas diferenas entre mdias podem ocorrer
simplesmente como resultado de erro amostral.
Para superar esse problema e esclarecer a interpretao de nosso resultado, neces-
sitamos de um teste estatstico que, mantendo o erro alfa num nvel constante, permita
tomar uma Unica deciso-geral-quanto presena de uma diferena significativa entre
as trs ou mais mdias que buscamos comparar. Tal teste conhecido por andlise de
varkincia.
Negros e brancos, machos e fmeas, liberais e conservadores representam as espcies
de comparaes de duas amostras que ocuparam nossa ateno no captulo anterior.
Entretanto, a realidade social no pode-sempre-ser convenientemente dividida em A LGICA DA AMUSE DE VARIANCIA
dois grupos; os respondentes nem sempre se dividem de modo to simplificado.
Como resultado, o pesquisador quase sempre procura fazer comparaes entre Para fazer uma anlise de varincia, a variao total de um conjunto de escores tratada
trs, quatro, cinco ou mais amostras ou grupos. Para ilustrar, ele pode querer estudar como sendo divisvel em dois componentes: a distncia* dos escores brutos com relao
As mdias dos grupos a que pertencem-e a isto se chama variao dentro dos grupos-, e
a influncia da identidade racial (negros, brancos ou orientais) sobre a discriminao
profissional, do grau de privao econmica (severo, moderado ou brando) sobre a a prpria distncia existente entre as mdias dos vrios grupos-o que recebe o nome de
delinqncia juvenil, da classe social (alta, mdia, baixa ou operria) sobre a motivao variao entre grupos.
subjacente As realizaes. A fim de tornar possvel o exame da variao dentro dos grupos, os escores
O aluno pode perguntar a si mesmo se devemos usar uma srie de razes t para de motivao-realizao de sujeitos pertencentes a quatra classes sociais-(1) baixa,
fazer comparaes entre trs ou mais mdias. Suponhamos, por exemplo, que deseje- (2) operria, (3) mdia e (4) alta-foram representados graficamente na Figura 9.1,
mos testar a influncia da classe social sobre a motivao subjacente a realizaes. Por onde X1, X2, X3 e X4 correspondem a escores brutos em seus grupos de referncia e
que no podemos comparar duas a duas todas as possveis combinaes de classe so- X 1, X2, X3 e Xa, as respectivas mdias grupais. Em termos simblicos, vemos que tal
cial e obter um t (t observado) para cada comparao? Pe lo uso deste mtodo, quatro variao "dentro" dos grupos refere-se As distncias entre X1 e 1, entre X2 e X2 ,
amostras geram seis combinaes pareadas para as quais seis valores (razes) t devem ser entre X3 e X3 e entre X4 e X 4 .
calculados: Podemos visualizar tambm a variao "entre" grupos. Com o auxlio da Figura
9.2, vemos que o grau de motivao subjacente a realizaes varia com a classe social:
1. classe alta versus classe mdia;
o grupo pertencente classe alta (X4) tem maior motivao do que o grupo pertencente
2. classe alta versus classe operria;
classe mdia (X 3) o qual, por sua vez, tem maior motivao do que o grupo perten-
3. classe alta versus classe baixa;
4. classe mdia versus classe operria;
5. classe mdia versus classe baixa;
6. classe operria versus classe baixa.
cr

O procedimento de calcular uma srie de razes t envolve no somente uma boa


dose de trabalho como tambm uma limitao estatstica. Isto deve-se ao fato de ele Xi-X1 x2--"'"x2 -)(3 X4--X4
aumentar a probabilidade de cometer-se um erro alfa-o erro de rejeitar-se a hiptese Baixa Operria Mdia Alta
nula quando, na verdade, ela deveria ser aceita. Recordem que o pesquisador est FIGURA 9.1 Representao Grfica da Variao Dentro de Quatro Grupos Pertencentes a Classes
geralmente disposto a aceitar um risco de 5% no que se refere a cometer um erro alfa Sociais Distintas
(o chamado nvel de confiana da ordem de 0,05). Ele espera, portanto, que, por mero
acaso, 5 de cada 100 diferenas de mdias amostrais sejam grandes o suficiente para
corresponde a discrepncia. * N.T.: Distncia, aqui,
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
158 TOMADA DE DECISES
Anlise de Varincia 159

E.")
e seus dois componentes, temos as seguintes notaes: SSt = soma total de quadrados,
<cu SSe = soma de quadrados entre grupos, e SSd = soma de quadrados dentro dos grupos.
o.

Uma Rustrao de Pesquisa


X2 X3 -4-0- X4 Consideremos uma situao de pesquisa em que seja possvel calcular cada tipo de soma
Baixa Operria Mdia Alta de quadrados. Suponha-se que busquemos determinar a influe-ncia da orientao politica
sobre os mtodos de educar as crianas. No captulo precedente, estudamos esse tpico
FIGURA 9.2 Representao Grfica da Variao Entre Quatro Grupos Pertencentes a Classes pela comparao entre liberais e conservadores. Em contraste, queremos agora fazer
So ciais Distintas
comparaes que representam vrios pontos ao longo da, por assim dizer, escala pol-
tica (continuum politico). Por exemplo, poderamos comparar a permissividade na
cente classe operria (X 2 ) e este, fechando o crculo, maior motivao do que o grupo educao infantil demonstrada por conservadores, moderados, liberais e radicais. Em
pertencente classe baixa (X 1). tal caso, teramos:
A distino entre a variao dentro dos grupos e a variao entre grupos no
peculiar A. anlise de varincia. Muito embora no figurasse com essa denominao, Hiptese Nul: conservadores, moderados, liberais e radicais nab diferem com respeito
encontramos uma distino semelhante na definio da estatstica t, onde a diferena permissividade na educao infanta (M1 = M2 = M3 = M4 )
entre X1 e X 2 foi comparada com o erro padro da diferena (adif),
que corresponde Hiptese Experimental: conservadores, moderados, liberais e radicais diferem com
a uma estimativa combinada de diferenas dentro de cada grupo. Portanto,
respeito a permissividade na educao infanta (M1 M2 M3 M4 )

t
X -X 2 variao entre grupos Vamos imaginar que de fato entrevistamos amostras aleatrias de quatro conser-
vadores, quatro moderados, quatro liberais e quatro radicais com vistas a determinar
adif variao dentro dos grupos
seus mtodos de educar crianas. Imaginemos, ainda, que os valores obtidos para per-
missividade sejam os constarnes da Tabela 9.1 (onde a varivel permissividade assume
De modo similar, a anlise de varincia comporta uma razo F, cujo numerador valores que vo de 1 (pouca) at 5 (muita).
representa a variao entre os grupos comparados, e cujo denominador contm uma
estimativa da variao dentro desses grupos. Como veremos, a estatstica F (razo F) in- Soma de Quadrados Dentro dos Grupos
dica o tamanho da diferena entre os grupos em funco do tamanho da variao dentro de A soma de quadrados dentro dos grupos d-nos a soma dos quadrados dos afastamentos
cada grupo. Da mesma forma como era verdade para a estatstica t, quanto maior de cada valor bruto com relao media da amostra a que ele pertence. Portanto, a
a
estatstica F (quanto maior a variao entre os grupos com relao variao dentro dos soma de quadrados dentro dos grupos pode ser obtida simplesmente pela combinao
grupos), maior a probabilidade de rejeitar-se a hiptese nula e aceitar-se a hiptese da soma de quadrados dentro de cada amostra. Em smbolos:
experimental.
SSd = Ex? + Ex3 + Ex3 + Exi , onde
SOMAS DE QUADRADOS
x = afastamento (discrepncia) obtido a partir de (X - X).
No mago da anlise de varincia est o conceito de soma de quadrados, que
representa
o passo inicial para medir a variao total e a variao entre e dentro dos Aplicando a formula SSd aos dados da Tabela 9.1, obtemos:
grupos. Pode
ser at uma agradvel surpresa descobrir que somente o ttulo "soma de quadrados"
novidade para ns. O conceito em si foi introduzido no Captulo 5 como sendo um SSd = 1,00 + 2,00 + 0,74 + 2,74 = 6,48.
passo importante no procedimento para a obteno do desvio padro. Naquele
con-
texto, aprendemos a encontrar a soma de quadrados multiplicando, numa dada distribui- Soma de Quadrados Entre Grupos
o, cada discrepncia por si mesma, somando, em seguida, os valores resultantes A soma de quadrados entre grupos representa a soma dos quadrados dos afastamentos
(Ex2).
Esse procedimento eliminou os sinais negativos, ao mesmo tempo que forneceu de cada mdia amostral com relao media total. De acordo com o que precede,
uma
base matemtica slida para o desvio padro. devemos determinar a diferena entre cada mdia amostral e a mdia total (X -
Xt),
Quando aplicado a uma situao em que grupos devem ser comparados, h mais elevar essa diferena ao quadrado, multiplic-la pelo nmero de valores da amostra e,
de um tipo de soma de quadrados, muito embora cada um deles represente a soma por fim, somar tudo. A frmula decorrente da definio de soma de quadrados entre
de
afastamentos, ao quadrado, a partir da mdia. Confonne a distino entre variao total
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor grupos
160 TOMADA DE DECISES
Andlise de Varidncia 161

SSe = E(X - Xt)2N , onde


Soma Total de Quadrados
Pode-se demonstrar que a soma total de quadrados, a soma dos quadrados dos aPsta-
X qualquer mdia amostral
mentos de cada valor bruto com relaco ti media total do estudo em questo, igual
Xt. mdia total (mdia de todos os valores brutos originrios de todas as
a uma combinao (soma) dos seus componentes "dentro" e "entre". A soma total
amostras combinadas)
de quadrados para os dados da Tabela 9.1 pode ser calculada como se segue:
nmero de valores em qualquer das amostras
SSe soma de quadrados entre grupos. SSt = SSe + SSd = 0,48 + 6,48 = 6,96.

O procedimento para encontrar a soma de quadrados entre grupos, relativamente aos A soma total de quadrados pode tambm ser definida em termos da equao
dados da Tabela 9.1, figura logo abaixo do quadro.*
SSt = E (X - ft)2, onde
TABELA 9.1 Valores para Permissividade Relacionada com a Educao de Crianas, Obtidos de X = um valor bruto de qualquer aniostra
Amostras de Conservadores, Moderados, Liberais e Radicais
Xt = mdia total (mdia de todos os valores brutos originrios de todas as
amostras combinadas)
Conservadores (N =4) Moderados (N =4) SSt = soma total de quadrados.
x, X2 X2 X X2
Usando a frmula anterior, subtramos a mdia total (ft) de cada valor bruto do estudo
1 - 0,50 0,25 1 - 1 1 (X), elevamos ao quadrado os desvios (afastamentos) resultantes, somando-os em
2 0,50 0,25 3 1 1 seguida.
- 0,50 0,25 2 0
Para os dados da Tabela 9.1, vem:
2 0,50 0,25 2 0 0
=6 Ex2 =1,00 EX= 8 Ix2 =2,00 SSt = (1 - 1,75)2 + (2 - 1,75)2 + (1 - 1,75)2 + (2 - 1,75)2 + (1 - 1,75)2
+ (3 - 1,75)2 + (2 - 1,75)2 + (2 - 1,75)2 + (1 - 1,75)2 + (2 - 1,75)2
Xi = 1,5 X2 =-1* = 2,0 + (2 - 1,75)2 + (2 - 1,75)2 + (3 - 1,75)2
+ (2 - 1,75)2 + (1 - 1,75)2 + (1 - 1,75)2
Liberais (N =4) = + (0,25)2 + (- 0,75)2 + (0,25)2 + (- 0,75)2 + (1,25)2
(- 0,75)2
Radicais (N =4)
+ (0,25)2 + (0,25)2 + (- 0,75)2 + (0,25)2 + (0,25)2 + (0,25)2
X3 X X2 x2 + (1,25)2 + (0,25)2 + (- 0,75)2 + (- 0,75)2
- 0,75 0,56
= 0,56 + 0,06 + 0,56 + 0,06 + 0,56 + 1,56 + 0,06 + 0,06 + 0,56 + 0,06
1 3 1,25 1,56
2 0,25 0,06 2 0,25 0,06 + 0,06 + 0,06 + 1,56 + 0,06 + 0,56 + 0,56
2 0,25 0,06 1 - 0,75 0,56 = 6,96
2 0,25 0,06 1 - 0,75 0,56
EX =7 1,2 = 0,74 EX =7 ax2 =2,74 Clculo das Somas de Quadrados
As frmulas decorrentes das definies de somas de quadrados para valores intra-grupos,
X3 =2,r = 1,75 4 4 = 1,75
4
valores inter-grupos e valores totais baseiam-se na manipulao de afastamento, o que
toma o processo trabalhoso e demorado. Felizmente, podemos, ao invs, empregar as
It = 1,75
firmulas abaixo, muito mais simples, para obter um resultado na forma de estatstica F,
a qual idntica (excetuados os erros de arredondamento) que se obtm com as
SSe = (1,50 - 1,75)2 4 + (2,0 - 1,75)2 4 + (1,75 - 1,75)24 + (1,75 -
1,75)24 frmulas decorrentes das definies, de natureza mais complexa.
= (-
0,25)2 4 + (0,25)2 4 + (0)4 + (0)4 = (0,06)4 + (0,06)4 + (0)4 + (0)4 Os valores brutos da Tabela 9.1 foram transcritos na Tabela 9.2 com o propsito
= 0,24 + 0,24 = 0,48
de ilustrar o uso das frmulas abreviadas para a soma de quadrados.
A frmula abreviada que permite calcular a soma total de quadrados a seguinte:
* N.T.: Por comodidade, N o mesmo para todas as amostras, isto 6, o nmero de elementos
(EX02
(sujeitos, dados) no varia de uma para outra. Isso no absolutamente necessrio, porm muito SSt = EX2t , onde
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
conveniente, e o tipo de coisa bastante controlvel pelo pesquisador.
Nt
162 TOMADA DE DECISES
Anlise de Varincia 163

Nt = nmero total de valores, combinadas*todas as amostras.


0, Por exemplo, na Tabela 9.2:

-
Introduzindo os dados da Tabela 9.2 nessa frmula resulta:

SSt = (10 + 18 + 13 + 15) - (6 + 8 + 7 + 7)2 SS, =


(6)2

4
(8)2

4
012
4
(7)2

4
(28)2
16
-+ - + 49- + 49- -
36
4
64
4 4 4
784
16
4 +4 +4 +4

- (28)2
- -=
784 = 9,0 + 16 + 12,25 + 12,25 - 49,0 = 49,5 - 49,0 = 0,50
= 56
16
= 56
16
56 - 49 = 7
Posto que a soma de quadrados intra-grupos constitui a parte mais demorada
TABELA 9.2 Valores para Permissividade Relacionada com a Educao de Crianas, Obtidos de para ser calculada, podemos tirar vantagem do fato de que a soma total de quadrados
Amostras de Conservadores, Moderados, Liberais e Radicais igual soma de seus dois componentes. Portanto,

Conservadores (N =4) Moderados (N =4) SSd = SSt - SSe


.X1 x2 X2 X2
No presente caso,
1 1 1 1
2 4 3 9 SSd = 7,00 - 0,50 -= 6,50
1 1 2 4
2 4 2 4 A seguinte frmula abreviada serve para encontrar eventuais erros no clculo da soma
EX = 6 EX2 =10 IX= 8 EX2 = 18 de quadrados de valores intra-grupos:

X = 761 = 1,5 = = 2,0


ssd = E[(1)c)
Liberais (N =4) Radicais (N =4)
onde
X3 X2 X2

1
X = escore bruto de qualquer amostra
1 3 9
2 4 2 4
N = o nmero total de escores de qualquer anostra.
2 4 1 1 Introduzindo os dados da Tabela 9.2, resulta:
2 4 1 1

EX =7 IX2 = 1 3 EX =7 EX2 = 15 (6)2 (8)2 (7)2


SSd = - + [18 + [13 + 15
4
= = 1,75
44)
= 1,75
= (10 + (18 - 449)

A soma de quadrados entre grupos pode ser obtida mediante a seguinte frmula: = (10 - 9,0) + (18 - 16,0) + (13 - 12,25) + (15 - 12,25)
= 1,0 + 2,0 + 0,75 + 2,75 = 6,50
SS, y (IX)21 (1Xtotal )2
onde
N J Ntota I

N = numero total de escores (valores) em qualquer amostra QUADRADO MDIO


Nt = numero total de escores, combinadas todas as amostras Como bem poderamos esperar de uma medida de variao, o valor das somas de qua-
drados tende a tornar-se maior medida que a variao aumenta. Por exemplo, pro-
* N.T.: "Combinada", a, no alude a nenhum aspecto de anlise combinatria; a palavra vvel que SS = 10,9 designe uma variao maior do que SS = 1,3. Entretanto, a soma
est
sendo usada para indicar a juno de vrias amostras numa s, que, por isso, torna-se maior.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor de quadrados tambm se torna maior com o aumento do tamanho da amostra, de sorte
166 TOMADA DE DEC1SES
Anlise de Varkincia 167
cantes, isto , razes F que precisamos obter* para que seja possvel rejeitar a hiptese
Hiptese Experimental (ou Alternativa): As classes alta, media e baixa diferem signifi-
nula aos nveis de significncia de 0,05 e 0,01. Tal como ocorreu com a estatstica t, o
cativamente com respeito ao QI (M1 vi M2 vi M3).
valor especfico de F que devemos considerar (relativamente Tabela D) depende do
nmero de graus de liberdade. Portanto, ao consultar a Tabela D, procuramos duas vezes
Para testar essa hiptese, vamos convencionar o nvel de significncia de 5% como
os graus de liberdade: uma para os grupos "entre" e outra para os grupos "dentro".
critrio da confiana depositada nos resultados da pesquisa. Admitamos que seja pos-
Os graus de liberdade associados ao numerador (gle) foram escritos horizontalmente no
svel medir o QI dos membros das trs amostras de classes sociais colhidas: alta, mdia
topo da tabela (D); os graus de liberdade associados ao denominador (gld) foram colo-
e baixa. Os resultados das mensuraes figuram abaixo:
cados na vertical do lado esquerdo da mesma tabela. O corpo da Tabela D contm os F
significantes aos nveis de 0,05 e 0,01.
Classe Alta (N =5) Classe Mdia (N =5)
Para os dados da Tabela 9.2, encontramos gle = 3 e gld = 12. Ento, entramos na
Tabela D localizando, em primeiro lugar, a coluna gle = 3 e a linha gld = 12. Com esse Xi X2 X2 X2
procedimento encontramos, no cruzamento, um F significante que, ao nvel de 0,05,
deve ser igual a 3,49, no mnimo; na tabela da pgina seguinte (aincla Tabela D), verifi- 130 16900 120 14400
camos que, ao nvel de 0,01, o F crtico deve ser igual a ou maior que 5,95. 0 nosso F 125 15625 115 13225
calculado (F0 = F observado) de apenas 0,31. Como resultado, no temos outra 130 16900 115 13225
120 14400 110 12100
escolha seno "aceitar" a hiptese nula e atribuir as diferenas das mdias amostrais
122 14884 112 12544
(no tocante permissividade ligada criao de filhos) a erro amostral. Nada nos leva
a crer que essas diferenas devam-se a uma real diferena nas populaes constitudas
Ex =627 EX2 = 78709 EX= 572 EX2 =65494
por conservadores, moderados, liberais e radicais.
11 = 125,4 -2 = 114,4
Os resultados de nossa anlise de varincia podem ser apresentados num quadro-
-resumo semelhante ao da Tabela 9.3. Tornou-se prtica comum resumir uma anlise
de varincia desse jeito. Classe Baixa (N =5)

X3 x2
TABELA 9.3 Quadro-resumo de Anlise de Variincia (Resumo Ligado aos Dados da Tabela 9.2)

110 12100
Ponta de Variao gl SS MS 100 10000
90 8100
Entre grupos 3 0,50 0,17 0,31 100 10000
Dentro dos grupos 12 6,50 0,54 85 7225
EX = 485 EX2 =47425

Uma Ilustrao 2-Y3 = 97,0


Com vistas a oferecer uma ilustrao passo a passo de uma anlise de varincia, vamos
supor que desejemos testar a hiptese de que o QI varia em funo da classe social. O procedimento passo a passo para testar a significncia estatstica das diferenas entre
Portanto: as mdias obtidas o seguinte:

Hipelese Nula: As classes alta, media e baixa no diferem significativarnente com res- PASSO 1 : Calcular a mdia de cada amostra.
peito ao QI (Mi = M2 = M3).

1X
* N.T.: a) A raztio F ou a estatstica F que se obtm a partir de um conjunto de dados, e que o 1;VC2
Autor chama de calculada, costuma ser tambm denominada "Fo" (F observado). b) As razes F
que figuram na Tabela D so tambm chamadas "Fc" (F crticos). Observe-se que a rejeio de
627 572 485
urna hiptese nula em favor de uma hiptese experimental (ou alternativa) ocorre sempre que 5 5 5
F0 Fe. - 125,4 - 114,4 = 97,0
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
164 TOMADA DE DECISES Anlise de Varkincia 165

que N = 200 produzir uma SS maior do que quando N = 20. Como resultado, a soma
de quadrados no pode ser considerada como uma medida de variao "pura"
inteira-
mente satisfatria, a menos que, claro, possamos encontrar uma forma de controlar
o nmero de escores envolvidos.
81d = 16 - 4 = 12.

Felizmente, tal mtodo existe numa medida de variao conhecida por quadrado Estamos agora preparados para obter os quadrados mdios:
mdio (ou varkincia), que se obtm atravs da diviso da SSe ou da SSd pelo nmero
adequado de graus de liberdade (no Captulo 5, dividimos, de forma anloga, Ex2 por 0,50
N como um passo na obteno do desvio padro). Portanto, MS, = = 0,17
3

MSe = -SSe

gle
onde
6,50
MSd - = 0,54.
MSe = quadrado mdio entre grupos 12
SSe = soma de quadrados entre grupos
gle = graus de liberdade entre grupos

A ESTATSTICA F (RAZO F)
SSd Como observamos anteriormente, a anlise de varincia produz uma estatstica F na
MSd = , onde qual se comparam a variao entre grupos e a variao dentro dos grupos. Estamos
gld agora prontos para especificar o grau de cada tipo de variao-quando medida por
meio de quadrados mdios. Portanto, a estatstica F pode ser considerada como indica-
MSd = quadrado mdio dentro dos grupos tiva do tamanho do quadrado mdio entre grupos com relao ao tamanho do quadrado
SSd = soma de quadrados dentro dos grupos mdio dentro dos grupos, ou seja:
gld = graus de liberdade dentro dos grupos.
MS,
Contudo, precisamos ainda obter os graus de liberdade apropriados. Para o quadra-
F -
MSd
do mdio entre grupos,

-
Para a Tabela 9.2,
gle = R - 1, onde
0,17
R = nmero de amostras. F = = 0,31
0,54
Para encontrar o nmero de graus de liberdade no quadrado mdio dentro dos
grupos, Tendo obtido uma razo (estatstica) F, devemos agora decidir se ela grande o
suficiente para rejeitar a hiptese nula e levar aceitao da hiptese experimental.
Ser que conservadores, moderados, liberais e radicais realmente diferem quanto per-
gla = Ntotai -R , onde
missividade na educao de crianas? Quanto maior a razo F calculada (isto 6, quanto
maior a MSe e menor a MSd), com maior probabilidade vamos obter um resultado
Ntoto = nmero total de escores, somadas todas as amostras
R significante em termos estatsticos.
= nmero de amostras.
Mas como reconhecer de maneira exata uma razo F significante? Recorde-se que,
Ilustrando com os dados da Tabela 9.2, na qual SSe = 0,50 e SSd = 6,50, calcula- no Captulo 8, a razo t que obtivemos foi comparada com diversos valores de uma
mos nossos graus de liberdade como se segue: tabela de razes t, ao nvel de significncia de 0,05, e corn os graus de liberdade apro-
priados. De forma anloga, devemos agora interpretar nossa estatstica F (calculada)
= 4 -
PDF glecompression,
= 3
OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
1
com o auxlio da Tabela D no final do livro. Ela contm uma lista de razes F signifi-
168 TOMADA DE DECISES Andlise de Varidneta 169

Note-se que diferenas entre as mdias existem de fato, e que hi uma tendncia de PASSO 5: Calcular os graus de liberdade entre grupos.
aumento nos QIs medida que a classe varia de baixa para alta.
gle = k 1 = 3 1 = 2
PASSO 2: Calcular a soma total de quadrados
PASSO 6: Calcular os graus de liberdade dentro dos grupos.
SStotal IX2total
(IX total ) 2
v total
= Nt k = 15 3 = 12
(627 + 572 + 485)2
= (78709 + 65494 + 47425) PASSO 7: Calcular o quadrado mdio entre grupos.
15

= 191628
(1684)2 2835856 SSe 2050,53
= 191628
15 15 MS, = = = 1025,27
gle 2
= 191628 --- 189057,07 = 2570,93
PASSO 8: Calcular o quadrado mdio dentro dos grupos.
PASSO 3: Calcular a soma de quadrados entre grupos.
SSd
(ZXt)2 MS d = - 520 40 - 43,37
SSe = [ E gid 12
Nt
(627)2 (572)2 (485)2 (1684)2 PASSO 9: Calcular a razo F (F0, isto , o F observado).
+ +
5 5 5 15
MSe 1025,27
393129 + 327184
+
235225 2835856 'of F = 23,64
5 5 5 15 msd 43,37
= 78625,8 + 65436,8 + 47045,0 189057,07 = 191107,60 189057,07 PASSO 10: Comparar o F observado com o F crtico constante da Tabela D.
= 2050,53
F observado = 23,64
F crtico = 3,88
PASSO 4: Calcular a soma de quadrados dentro dos grupos.
2
SSd = SSt SSe = 2570,93 2050,53 = 520,40

OU
P = 0,05
ssd = E[ (IX') (iin Como bem demonstra o passo 10, para rejeitar-se a hiptese nula ao nvel
de
significncia de 0,05, com graus de liberdade*, nosso F calculado (observado) deve
(4855)2] ser de, no mnimo, igual a 3,88. Uma vez que obtivemos um F igual a 23,64,
= [ 78709 (627)2] + [ 65494 (572)2] + [ 47425 podemos
5 5 rejeitar a hiptese nula e aceitar a hiptese experimental. Especificamente,
possvel
concluir que, com relao varivel QI, existe uma real diferena entre as classes
3271841 1 2352251 baixa,
= [ 78709 3935129] + [ 65494 + 47425 mdia e alta.
5 ] 5 ]

= [78709 78625,8] + [65494 65436,8] + [47425 47045,0] * N.T.: No existe gxau de liberdade menor que 1. Por isso, no se v
confundir

PDF compression, OCR,


= 83,2 + 57,2 + 380,0 = 520,40web optimization using a watermarked evaluation
12
copy of 12CVISION
12
gl
gl no denominador PDFCompressor
= 2-- com uma frao. -
2
significa: 2 gl no numerador
170 TOMADA DE DECISES Anlise de Varidneia 171

COMPARAO MLTIPLA DE MEDIAS comparadas. Dependendo do valor de qa, quanto maior o nmero de mdias, mais
Um F significante d-nos uma informao a respeito da diferena global existente entre "conservadora" (= resistente) torna-se a DHS no tocante rejeio da hiptese nula.
Como resultado, obteremos menos 51iferenas significantes com a DHS do que com a
os grupos (amostras) estudados. Se estivssemos pesquisando a diferena entre apenas
razo t. Alm disso, uma diferenaientre mdias tem maior probabilidade de ser signi-
duas mdias amostrais, nenhuma anlise adicional seria necessria para a interpretao
ficante numa comparao mltipla de tre's mdias do que numa comparao mltipla
de nosso resultado: em tal situao, a diferena obtida ou estatisticamente significante
de quatro ou cinco.
ou nb, dependendo da magnitude de F. Entretanto, quando encontramos um F signi-
Para ilustrar o uso da DHS, vamos voltar ao exemplo anterior em que se verificou
ficante relacionado com diferenas entre tres ou mais mdias, pode ocorrer que seja
existirem diferenas nas classes sociais com respeito varivel QI. Mais especifica-
importante determinar onde se situam essas diferenas. Por exemplo, na ilustrao
mente, obtivemos um F significante (F = 23,64) para as seguintes mdias colhidas de
anterior, descobrimos que existem, com relao is tits classes sociais pesquisadas,
amostras das trs classes sociais:
diferenas de QI significantes do ponto de vista estatstico. Considerem as possibilida-
des levantadas por esse F significante: fi (alta) poderia diferir significantemente de XI (classe alta) = 125,4
X2 (media); Xi (alta) poderia diferir significantemente de 13 (baixa); 12 poderia :1172 (classe media) = 114,4
diferir significativamente de 13 (baixa). (classe baixa) = 97,0
Como j foi explicado pginas atrs, tentar obter uma razo t para cada compara-
co (Xi versus X2 ; Xi versus 13 ; X2 versus X3) implicaria uma quantidade proibitiva PASSO 1: Construir uma tabela de diferenas entre mdias ordenadas. Para os dados
de trabalho, alm de aumentar a probabilidade de cometer-se um erro alfa. Felizmente, presentes, a ordem das mdias (da menor para a maior) 97,0, 114,4 e 125,4. Elas so
estatsticos desenvolveram vrios outros testes que permitem fazer comparaes mlti- dispostas em tabela de tal forma que a diferena entre cada par de mdias aparea numa
plas a partir de um F significante (isto , Fo> Fe) e localizar onde se situam as diferen- matriz. Assim a diferena entre 11 (alta) e 13 (baixa) 28,40; a diferena entre X1
as significantes entre mdias. Vamos introduzir, ento, o teste DHS de Tukey, um (alta) e 12 (mdia) 11,0; e a diferena entre 12 (mdia) e 13 (baixa) 17,4*.
dos mais teis no terreno da comparao mltipla. (Obs.: DHS significa "diferena
honestamente significante".) 13 = 97,0 X2 = 114,4 XI = 125,4
O DHS de Tukey usado apenas quando um F significantej foi obtido**. Por este
mtodo, o que fazemos comparar a diferena entre quaisquer duas mdias com a DHS. 13 - 17,4 28,4
Uma diferena entre duas mdias diz-se estatisticamente significante s se for igual a ou 12 - 11,0
maior que a DHS. Em smbolos: ii -
PASSO 2: Procurar qa na Tabela I. Para encontrar qa na Tabela I (fim do livro), pre-
DHS = qa V
MSd
n cisamos ter: (a) os graus de liberdade (gl) relativos a MSd ; (b) o nmero mximo de
onde mdias (k) e (c) o nvel de significncia-0,01 ou 0,05. J sabemos, graas anlise de
varincia realizada, que gl = 12. Portanto, entramos na Tabela I pela coluna do lado
qa = valor tabelado (isto , valor crftico) para um dado nvel de significn- esquerdo, at localizar 12 graus de liberdade. Em seguida, como estamos comparando
cia*, a partir do nmero mximo de mdias que estejam sendo com- tress pares de mdias, consultamos a tabela horizontalmente, da esquerda para a direita,
paradas. at localizar a coluna que contm o nmero mximo de mdias (k = 3). Convencio-
MSd = quadrado mdio intra-grupos (obtido na anlise da varincia)
nmero de respondentes em cada grupo (admite-se que em todos os
II nando um nvel de significncia de 0,05, observamos que q0,05 = 3,77.

-
grupos, ou amostras, haja o mesmo nmero de sujeitos). PASSO 3: Calcular a DHS.
MSd 43,37
Em oposio ao que ocorre com a razo t, a DHS leva em conta o fato de que a DHS = q0,05 = 3,77 = 3,77 = 3,77(2,94)
probabilidade de um erro alfa aumenta medida que aumenta o nmero de mdias n 5
= 11,08

* N.T.: Recorde-se, mais uma vez, que o Autor "prefere" usar a expresso "nivel de confiana" PASSO 4: Comparar a DHS com a matriz de diferenas de mdias. Para que qualquer
cm lugar de "nivel de significncia". Na verdade, no h grande inconvenincia, desde que essa diferena entre mdias (ver matriz) seja considerada estatisticamente significante
- -
"confiana" seja interpretada da seguinte forma: (100% 5%) ou (100% 1%).
PDF
N.T.: compression,
** Isto , quando F, F, OCR, web optimization using a watermarked
.
evaluation
N.T. As diferenas copy
so consideradas of absolutos,
em valores
*
CVISION PDFCompressor
isto , desprovidas de sinal.
172 TOMADA DE DECISES UNI V ER Si DADE FE DAlese de Varidncia 173
BIBLIOTECA CEN1"
preciso que ela se iguale a ou exceda a DHS. De volta nossa matriz de diferenas de
mdias, verificamos que a diferena de 28,4 QI entre X-1 (classe alta) e X3 (classe Classe
baixa), e a diferena de 17,4 QI entre X2 (classe media) e X3 (classe baixa) so maiores Baixa Opeidria Media Alta
que DHS = 11,08. Como resultado, conclumos que essas diferenas entre mdias so
estatisticamente significantes ao nvel de 0,05. Somente a diferena de 11,0 entre 5
X 1 e X 2 no se iguala a nem excede DHS-e , por isso, no-significante do 2
ponto de
vista estatstico. 1

3
EXIGENCIAS PARA 0 USO DA ESTATSTICA F (RAZO F)
A anlise de varincia s deve ser feita depois de o pesquisador ter levado em conta as 2. Testar a significncia das diferenas entre as mdias das seguintes amostras aleatrias:
seguintes exigncias:
1. Comparao entre tres ou mais medias independentes-A razo F geral- Amostra 2 Amostra 3
mente empregada para fazer-se uma comparao entre tits ou mais mdias
extradas de amostras independentes. A estatstica F no se presta para testes 2 5 8
em que o nmero de amostras menor que dois. Porm, no caso especfico 1 4 9
3 3 7
de duas amostras, tanto faz usar F ou t, uma vez que F = t2 .
3 4 8
2. Dados intervalares-Ao fazer uma anlise de varincia, pressupomos ter atin-
gido o nvel intervalar de mensurao. Por igual raciocnio, dados categorizados 3. Testar se as diferenas entre as mdias das seguintes amostras aleatrias so sig-
ou ordenados no devem ser usados. nificantes:
3. Amostragem casual-Nossas amostras devero ter sido extradas aleatoriamente,
de uma dada populao de escores. Amostra A mostra 2 A mostra 3
4. Distribuio norrrwl-Admitimos que a varivel em foco possui, na populao
da qual se extraem as amostras, distribuio normal*. 12 6 3
RESUMO 6 5 2
A anlise de varincia pode ser usada para fazer comparaes entre tits ou mais mdias 8 7 5
7 5
amostrais. Esse teste produz uma estatstica ou razo F cujo numerador representa a 3
6 1 1
variao entre grupos, e cujo denominador contm uma estimativa da variao dentro
dos grupos. A soma de quadrados representa o passo inicial para mensurar a variao.
Entretanto, ele sofre grande influncia do tamanho da amostra. Para superar esse proble- 4. Testar se as diferenas entre as mdias das seguintes amostras aleatrias so signi-
ma, dividimos SSe ou SSd pelos gratis de liberdade apropriados, a fim de obter o quadra- ficantes:
do mdio. A razo F indica o tamanho do quadrado mdio entre os grupos em funo
do tamanho do quadrado mdio dentro dos grupos. Interpretamos nosso F observado A mostra I Amostra 2 Amostra 3
(calculado) mediante uma comparao com um F crtico adequado constante da Tabela
D. Com base nessa comparao, decidimos se a hiptese nula deve ou no ser rejeitada. 4 3
5 3 5
Aps a obteno de um F significante, podemos determinar onde se localizam as dife- 4 2
renas significantes aplicando o mtodo de Tukey para a comparao mltipla de 3 2 3
mdias. 6 1 3

PROBLEMAS
5. Utilizando os mesmos dados do problema 4, determinar
1. Nas seguintes amostras aleatrias de classe social, testar a hiptese nula de que a atravs do mtodo de
Tukey (comparao mltipla de mdias), onde, exatamente, ocorrem as diferenas
"camaradagem entre vizinhos" no varia com a "classe social". (Nota: escores mais
significantes.
altos indicam maior grau de camaradagem.)
6. Testar se as diferenas entre as mdias das seguintes amostras aleatrias
N.T.: No se pode admitir isso arbitrariamente. Havendo dvida quanto normalidade, faz-se
so sig-
PDF compression, OCR, web optimization using a watermarked
um teste para garantir-se eSse pr-requisito. evaluation copy of CVISION PDFCompressor
nificantes:
174 TOMADA DE DECISES 44

10
Ptp
<0
<49
A mostra 1 A mostra 2 A mostra 3 A mostra 4
0
3 4 6
0NO`

1 2 4 6
1C
4, e
Qui--quadrado
3 2 2 5
4 1 2 5 p o
2 5 3 4 e
1 5 3 6

7. Utilizando os mesmos dados do problema 6, determinar, atravs do mtodo de


Tukey (comparao mltipla de mdias), onde, exatamente, ocorrem as diferenas e outros Testes
significantes.

No-paramtricos
Tal como indicamos nos Captulos 8 e 9, precisamos exigir muito do pesquisador que
emprega uma estatstica t ou uma anlise de varincia para fazer comparaes entre
suas amostras. Cada um desses testes de significncia apresenta uma lista de requisitos,
que inclui, entre outros, o pressuposto de que a caracterstica estudada (isto , a vari-
vel observacional) tem distribuio normal numa particular populao. Alm disso,
cada um desses testes supe que a varivel tenha sido mensurada a nvel intervalar, no
mnimo, garantindo-se, assim, a possibilidade de atribuir a cada membro da amostra
o respectivo escore. Quando um teste de significncia-tal como a estatstica (razo) t
ou a anlise de varincia-requer (1) normafidade e (2) nvel'intervalar de mensurao,
fala-se em teste parametrico.1
Como se arranja o pesquisador que nab consegue empregar um teste paramtrico
porque no pode, honestamente, admitir normalidade de distribuio ou porque seus
dados foram colhidos num nvel de mensurao inferior ao intervalar? Suponha-se, por
exemplo, que ele esteja trabalhando com uma distribuio assimtrica, tal como renda
anual, ou com dados que tenham sido categorizados ou contados (nvel nominal) ou,
ainda, com dados ordenados (nvel ordinal).* De que modo esse pesquisador pode fazer
comparaes entre amostras sem violar os requisitos de um determinado teste?
Afortunadamente, os estatsticos desenvolveram uma boa quantidade de testes

1
Tal designao baseia-se no termo "parmetro", aplicvel a qualquer caracterstica de uma
populao.
*N.T.: Esse problema de nveis de mensurao deve ser entendido como uma "escada": qualquer nvel,
a partir do segundo, pressupe que as caractersticas dos anteriores estejam sempre presentes. Entio,
por exemplo, suponha-se que X assuma os valores 160 cm, 170 cm e 185 cm, onde X representa a
estatura de trs sujeitos. Pelo que j foi visto anteriormente, "comprimento" pertence ao ravel ra-
cional (escala de razo); entretanto, nada impede que se atribua o "posto" 1 ao sujeito de 160 cm, o
2 ao de 170 cm e o 3 ao de 185 cm. Ou, nessa mesma ordem, podem aplicar-se as denominaes
"baixo", "mediano" e "alto", onde (baixo < mediano < alto). Essa operao, como flied de ob-
servar, constitui um abaixamento de nvel de mensurao (de nvel racional para nvel ordinal).
O que importante notar que o abaixamento de nvel quase sempre possi'vel enquanto que a
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
elevao (isto , melhora) raramente se consegue-com sucesso.
176 TOMADA DE DECISES Qui-quadrado e outros Testes Ndo-paratntricos 177

ndo-paramtricos de significncia-testes cuja lista de requisitos no inclui normalidade porque na populao matriz existem reais diferenas* entre as variveis
estudadas.
de distribuio ou nvel intervalar de mensurao. Para entendermos a posio impor- Porm, ao contrrio do que ocorre com os testes de significncia anteriores,
o qui-qua-
tante dos testes no-paramtricos em pesquisa, precisamos entender tambm o conceito drado empregado para fazer comparaes entre freqiincias e no entre
escores m-
estatstico de poder. Poder de um teste a probabilidade de rejeitarmos a hiptese nula dios. Como resultado, a hiptese nula para o teste de qui-quadrado
estabelece que as
quando ela realmente falsa-e, por isso mesmo, deve ser rejeitada. populaes neio diferem relativamente freqncia com que ocorre uma
caracterfstica
O poder varia de um teste para outro. Os testes mais poderosos-aqueles que, com particular; por outro lado, a hiptese experimental estabelece que as diferenas
amos-
maior probabilidade, levam rejeio da hiptese nula (Ho) quando ela mesmo fal- trais refletem diferenas reais na populao matriz-a partir da
freqncia relativa de
sa-so testes que possuem os pr-requisitos mais difceis de satisfazer. Geralmente, uma dada caracterstica.
esses testes so paramtricos, tais como o t ou o F, que pressupem dados colhidos em Para ilustrar o uso do qui-quadrado com dados freqenciais (ou com
propores
nvel intervalar (no mnimo) e distribuiao normal, na populao, das caractersticas que possam ser reduzidas a freqncias), imagine-se que, ainda uma
vez, tenhamos sido
estudadas (isto , as variveis) na amostra. Em contraposio, as alternativas no-para- chamados a investigar a relao entre "orientao poltica" e "permissividade
na educa-
mtricas exigem muito menos em termos de pr-requisitos, e constituem-se testes de sig- o de crianas". Em vez de dar. notas (isto , atribuir escores) a liberais e
conservadores
nificncia com poder bem menor que o dos correspondentes paramtricos. Em conse- em termos de seu grau de permissividade, podemos categorizar nossos
sujeitos amostrais
ao admitir a hiptese nula falsa (e ao manter inalterados fatores tais como numa base estritamente do tipo "ou ou";** em outras palavras, o
problema decidir
o tamanho da amostra), mais provvel que o pesquisador a rejeite pelo uso adequado quais so permissivos e quais so no-permissivos. Portanto:
de F ou de t do que mediante uma altemativa no-paramtrica.
bvio que os pesquisadores querem, a todo custo, rejeitar a hiptese nula-quan- Hiptese Nu la: A freqncia rektiva de liberais permissivos igual freqncia
relativa
do ela falsa mesmo. Por isso, a maioria deles preferiria, idealmente, empregar testes de conservadores permissivos.
paramtricos de significncia. Entretanto, como observamos h pouco, comum no Hiptese Experimental: A freqncia relativa de liberais permissivos
ser possvel preencher as exigncias mnimas dos testes paramtricos. Em primeiro lugar, diferente da fre-
qiincia relativa de conservadores permissivos.
muitos dos dados no campo psicossocial pertencem ou ao nvel ordinal ou ao intervalar.
Depois, nunca podemos ter certeza de que as caractersticas estudadas na amostra tm,
de fato, distribuio normal na populao da qual ela foi extrada.
CALCULO DO QUI-QUADRADO
Quando os requisitos de um teste (paramtrico) so violados, torna-se impossvel
conhecer o seu poder. Da que os resultados de um teste paramtrico, cujos requisitos O teste de significncia denominado qui-quadrado ocupa-se
essencialmente com a dis-
no foram satisfeitos, no tm interpretao significativa. Sob tais condies, a maioria tino entre freqncias esperadas e freqncias obtidas (observadas). As freqncias
dos pesquisadores opta inteligentemente por testes de significncia no-paramtricos. esperadas (fe) referem-se aos termos da hiptese nula, de acordo com
os quais se espera
Este captulo introduz alguns dos mais conhecidos testes de significncia no-para- que a freqncia relativa (ou a proporo) seja a mesma para todos os grupos.
Por exem-
mtricos: qui-quadrado, teste da mediana, prova de Kruskal-Wallis (anlise de varincia plo, se a expectativa de que os liberais sejam permissivos de 50%, ento
ela tambm
por postos) e prova de Friedman (dupla anlise de varincia). corresponde a 50% para os conservadores. Em contraposio, as freqncias observadas
(fo) referem-se aos resultados obtidos de forma efetiva no momento da
coleta de dados,
donde decorre que, de um grupo para outro, elas podem-ou no-variar.
No caso de
QUI-QUADRADO: UM TESTE DE SIGNIFICANCIA as diferenas entre as freqncias obtidas e as esperadas serem
suficientemente grandes
O mais "popular" teste no-paramtrico de significncia utilizado em pesquisa chama-se que rejeitamos a hiptese nula e decidimos pela afirmao de que existe uma
diferena
qui-quadrado (x2). Como veremos adiante, o teste de X2 usado na comparao* entre real na populao.
duas ou mais amostras. Continuando com o presente exemplo, suponha-se que extrassemos uma amostra
semelhana do que ocorreu com a estatstica t e a anlise de varincia, existe aleatria de 20 liberais e outra amostra, tambm aleatria, de 20 conservadores;
em
uma distribuiO amostral de qui-quadrado que pode ser usada para estimar a probabili- seguida, esses 40 sujeitos poderiam ser dicotomizados em "permissivos" e
"no-permis-
dade da obteno de um valor significante (de qui-quadrado) por mero acaso e no sivos" relativamente varivel observacional "mtodo de educar
crianas". A Tabela
10.1 apresenta as freqncias obtidas que poderiam resultar.

* N.T.: 0 termo "comparao" precisa ser interpretado, j que ele pressupe "maior que," menor
* N.T.: Veja-se, a propsito, o que ficou dito na nota anterior.
que" ou "igual a". 0 que o teste de qui-quadrado geralmente permite fazer um estudo relacional
entre variveis, ou seja, a determinao do tipo de relao existente entre elas: independncia ou N.T.: Categorizar com base no critrio "ou ou" , ao cabo, dicotomizar (se forem duas
dependencia. H, ainda, 6 qui-quadrado de aderencia e o qui-quadrado de homogeneidade, cujos categorias), tricotomizar (se forem trs), tetracotomizar (se forem quatro)
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
objetivos so outros. Esses dois ltimos testes no so estudados neste livro.
e assim por diante.
178 TOMADA DE DECISES Qui-quadrado e outros Testes Nao-parametricos 179

Os dados da Tabela 10.1 indicam que "mtodos permissivos" foram usados por TABELA 10.2 Dados da Tabela 10.1 Dispostos numa Tabela 2 X 2*
5 dos 20 liberais e por 10 dos conservadores. Esses dados podem ser retabelados num
quadro do tipo 2 X 2 (2 linhas e 2 colunas), no qual as freqncias observadas esto Liberais Conservadores
distribudas pelas caselas, ao lado das freqncias esperadas (tericas), que figuram Freqncia
entre parnteses (Tabela 10.2). Observe-se que essas freqncias esperadas baseiam-se Freqii encia
Observada
Esperada
apenas na Nab do acaso, donde decorre uma pressuposio (provisria) de que a hipte- ---A,
Permissivo 5 (7 ,5) 10 (7,5) .A-- 15
se nula esteja correta. Note-se, tambm, que os totais marginais na Tabela 10.2 foram
obtidos pela soma horizontal ou vertical das freqncias das caselas, ou seja: 15 e 25
representam as somas das linhas (somas horizontais); 20 e 20, as somas das colunas Total Marginal
(somas verticais). O nmero total de sujeitos (N = 40), sito , o tamanho da amostra, (Horizontal)
pode ser obtido somando-se os totais marginais horizontais ou os totais marginais 15 (12,5) 10 (12,5) 25
verticais.* No-permissivo

TABELA 10.1 Freqncias Observadas num Estudo de Permissividade Relacionada com Orientao
Politica 20 20 N = 40

Orientao Poltica
Mtodos de Educao de Lib erais Conservadores
x2
(5 - 7,5)2 (10 - 7,5)2 (15 - 12,5)2 (10 - 12,5)2
Crianas fo fo 7,5 7,5 12,5 12,5
Perm issivo 5 10 (-2,5)2 (2,5)2
No-permissivo
(2,5)2 (-2,5)2
15 10
To tal
7,5 7,5 12,5 12,5
20 20

6,25 6,25 6,25 6,25


Tendo conseguido as freqncias observadas e as esperadas para o problema em 7,5 7,5 12,5 12,5
foco, o valor do qui-quadrado pode ser calculado mediante a frmula.**
0,83 + 0,83 + 0,50 + 0,50 = 2,66
x2 - Vemos, assim, que x2 = 2,66. A fim de podermos interpretar esse valor de
onde Ic qui-quadra-
do, devemos, ainda, determinar o nmero de graus de liberdade adequado. Esta
determi-
nao pode ser feita mediante o emprego da seguinte frmula independentemente
do
fo = freqncia observada por casela nmero de linhas ou de colunas existentes numa tabela:
fe = freqncia esperada por casela
X
2 -- qui-quadrado gl = (1- 1)(c - 1), onde
De acordo com a frmula do )(2 , devemos (1) subtrair cada freqncia esperada 1 = nmero de linhas na tabela de freqncias observadas
da freqncia observada correspondente, (2) quadrar a diferena, (3) dividir o quadrado c = nmero de colunas na tabela de freqncias observadas
de cada diferena pela freqncia esperada adequada*** e (4) somar os quocientes parciais gl = nmero de graus de liberdade
para obter o valor do qui-quadrado (x4
Os dados da Tabela 10.2 podem ser usados para ilustrar o procedimento acima: Posto que as freqncias observadas na Tabela 10.2 do origem a duas linhas e
duas colunas (2 X 2), vem que:
*N.T.: Obviamente, a soma dos totais marginais horizontais deve ser igual a soma dos totais marginais
verticals. Essa, alis, uma prova elementar de coerncia.
N.T.: O qui-quadrado assim calculado comumente chamado qui-quadrado observado e designa-
-se por * N.T.: Leia-se "tabela dois por dois". Alm disso, essa tabela conhecida pelos
nomes tabela de
dupla entrada e tabela de contingncia.
*** N.T.: A freqiincia esperada adequada
a que figura, em cada casela, entre parnteses.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
180 DMADA DE DECISES Qui-quadrado e outros Testes Ndoparamtricos 181

gl = (2 - 1)(2 - 1) = (1)(1) = 1 Para a casela inferior esquerda da Tabela 10.2 (liberais no-permissivos):

Consultando a Tabela E (no fim do livro), encontramos uma lista de valores de qui-qua- (20)(25) _ 500
drado,*os quais sat' significantes aos nveis (de confiana/significncia) de 0,05 e 0,01. fe
40 40
- 12,5
Ao nvel de 0,05 e 1 grau de liberdade, vemos que o qui-quadrado crtico 3,84. Para
que a hiptese nula possa ser rejeitada, preciso que esse valor (isto , 3,84) seja exce- Finalmente, para a casela inferior direita da Tabela 10.2 (conservadores
no-permissivos):
dido ou, pelo menos, igualado pelo qui-quadrado observado. Como o nosso X2 observa-
do (calcalado) somente 2,66-e, portanto, menor que o valor tabelado (ou seja, menor (20)(25) _ 500
que o k)-devemos aceitar a hiptese nula e rejeitar a hiptese experimental. As fre- fe 12,5
40 40
qncias obtidas (observadas) no se afastam das esperadas o suficiente para podermos
expficar a diferena como resultado de real diferena populacional.** Em outros ter- Como veremos mais adiante, o mtodo que acabamos de apresentar
pode ser aplicado a
mos, tal diferena (3,84 -
2,66) deve ser interpretada como resultante da ao do qualquer problema de qui-quadrado que implique obter freqncias
esperadas (fe).*
acaso.
Ilustrao
C.LCULO DAS FREQENCIAS ESPERADAS (TERICAS) Para resumir passo a passo o procedimento que permite obter o
qui-quadrado observado
As freqincias esperadas para cada casela devem refletir a ao do acaso nos termos da ou calculado (xD, vamos supor que quisssemos estudar a relao entre
"fumar maco-
hiptese nula (Ho). Se tais freqncias tm que indicar "mesmice" em todas as amos- nha" e "desejo de cursar o segundo grau" (antigo "colegial"). Poderamos
especificar
tras, devem ser proporcionais aos seus totais marginais, quer para as linhas, quer para nossas hipteses da seguinte forma:
as colunas.
Ho: a relao entre "fumar maconha" (X) e "fazer o segundo
obter a freqncia esperada relativa a uma determinada casela, simplesmente
Para grau" (Y) de independen-
cia, isto , X e Y so independentes.
multiplicamos seus respectivos totais marginais (de linha e de coluna), dividindo, em Ha: a relao entre Xe Ye de dependncia.
seguida,o produto por N. Portanto:
A fim de testar estas hipteses ao nvel de significncia
_ (total marginal "linha")(total marginal "coluna") de 0,05, colhemos duas
amostras de alunos de primeiro grau (preferentemente das ltimas sries):
uma, compos-
ta de 21 sujeitos cujo objetivo "prosseguir os estudos" e, outra, com 15
sujeitos cuja
deciso "parar os estudos aps concluso do primeiro grau".
Para a casela superior esquerda da Tabela 10.2 (liberais permissivos): Suponha-se que, ape's a
realizao da pesquisa com esses 36 sujeitos, resultassem os dados
condensados na
Tabela 10.3.
f (20)(15) 300 Como podemos observar nessa tabela, 15 dos 21 alunos que tencionam fazer o
je = 40 40 segundo
grau fumam maconha; entre os que no pretendem fazer o segundo
grau, apenas 5 fu-
mam essa erva. Para descobrir se h uma relao significante entre "fumar maconha"
Da mesrna forma, para a casela superior direita da Tabela 10.2 (conservadores permis- e
"continuar os estudos", os passos que devemos efetuar so os seguintes:
sivos):

(20X15) 300
fe 40 40
- 7,5 * N.T.: Tal afirmao nem sempre verdadeira! Se o pesquisador estiver
de aderncia (teste de), as freqncias tericas (esperadas) so obtidas
trabalhando com x2
a partir da lei que rege o
particular fenmeno que esteja sendo estudado. Por exemplo, num jogo
* N.T.: Os valores tabelados de qui-quadrado so geralmente chamados qui-quadrados crfticos e de cara-ou-coroa, onde
C = cara e K = coroa, suponha-se que C = 20 e K =
notados por 80, com N = 100 (obviamente). Ento, se a
moeda for honesta, a freqncia esperada para a varivel C dever ser
igual freqncia esperada
**N.T.: Insista-se, mais uma vez, no que ficou dito na nota pg. 176. Dessa comparao entre o x20 e para a varivel K, ou seja:
o resulta uma infonnao a respeito do tipo de relafTo existente entre as variveis estudadas.
Ento, se )d. < y, as variveis so independentes; se xo 4 as variveis so dependentes. No
C ->
fo
20
fe
50
exemplo em foco, < e, por isso, a hiptese experimental foi rejeitada. Isso equivale a dizer K -* 80 50
Observe-se, pois, que a regra apresentada pelo autor no se
que, com certeza de 95% as variveis "filiao poltica" e "permissividade na criao dos filhos" so aplica ao clculo dessas freqncias, uma vez que o fenmeno
variveis independentes. N -> 100 100 estudado (isto 6, "sair cara-ou-coroa") possui uma lei prpria.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
182 TOMADA DE DECISES Qui-quadrado e outros Testes Ndo-paramtricos 183

TABELA 10.3 Consumo de Maconha entre Alunos de Primeiro Grau e sua Relao com Objetivos PASSO 3: Subtrair cada freqncia esperada da respectiva freqncia observada
A cadmicos Posteriores

fo -fe
Tenciona Cursar o 2.0 Grau (superior esquerda) 15 - 11,67 = 3,33
Sim Aldo
(superior direita) 5 - 8,33 = -3,33
Fuma Maconha (fo) (fo)
(inferior esquerda) 6 - 9,33 = -3,33
(inferior direita) 10 - 6,67 = 3,33
Sim 15 5
No 6 10 PASSO 4: Quadrar essas diferenas
Total 21 15
(fo -fe) 2
(superior esquerda) (3,33)2 = 11,09
PASSO 1: Dispor os dados numa tabela de dupla entrada (tipo 2 X 2). (superior direita) (-3,33)2 = 11,09
Continuam os Param os (inferior esquerda) (-3,33)2 = 11,09
Estudos (inferior direita) (3,33)2 = 11,09
Estudos

PASSO 5: Dividir o quadrado de cada diferena pela respectiva frecitincia esperada


Fumantes 15 ( ) 20
(fo - 2

fe

No-fumantes 6 ) 10 16 11,09
( ( ) (superior esquerda) 0,95
11,67
11,09
(superior direita) 1,33
21 15 N = 36 8,33
11,09
(inferior esquerda) 1,19
PASSO 2: Obter a freqncia esperada (terica) para cada casela 9,33
(21)(20) 11,09
(superior esquerda) fe (inferior direita) 1,66
36 6,67
420 =
11,67 PASSO 6: Somar esses quocientes para obter o qui-quadrado observado
36

15 (11,67) 5 (8,33) 20 (superior direita) fe (15)(20) (fo - fb2

= -
300
36
36

(21)(16)
= 8,33
fe

0,95
1,33
6 (9,33) 10 (6,67) 16 (inferior esquerda)

-
fe 1,19
36 1,66
336
= = 9,33 X2 = 5,13
36
21 15 N =36
(15)(16)
(inferior direta) fe
36 PASSO 7: Achar o nmero de graus de liberdade
240
= 6,67
36 gl = (1 - 1)(c - 1) = (2 - 1)(2 - 1) = (1)(1) =
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
1
184 TOMADA DE DECISES Qui-quadrado e outros Testes Ndo-paramtrieos 185

PASSO 8: Comparar o valor do qui-quadrado observado (obtido) com o qui-quadrado Numa tabela 2 X 2, a disposio das caselas (A, B, C e D), com os respectivos
crtico (tabelado). Veja Tabela E (fim do livro) totais marginais, segue o modelo abaixo:

x2 obtido (observado) = 5,13


X2 tabelado (crftico) = 3,84 A A + B
gl = 1 INVERSIDADE FE
= 0,05 BIBLIOTECA
C + D
O passo 8 sugere que, para rejeitarmos a hiptese nula a um nvel de significncia
de 0,05 e com 1 grau de liberdade, o nosso qui-quadrado observado dever ser igual a A +C B+D N
ou maior que 3,84. Como o qui-quadrado que obtivemos de 5,13 (isto , xg < X2c),
podemos rejeitar a hiprtese nula e aceitar a hiptese experimental. Nossos resultados Para ilustrar o uso dessa nova frmula, vamos voltar aos dados da Tabela 10.3
"sugerem" que a proporco de fumantes de maconha maior entre os alunos que pre- (uso de maconha vs. continuidade dos estudos), para a qual j obtivemos um )(2 de
tendem cursar o segundo grau do que entre os que pretendem parar os estudos no 5,13. Podemos entrar na nova frmula diretamente com as freqncias observadas.
primeiro grau.* Assim:
O procedimento que acabamos de ilustrar, passo a passo, pode ser resumido, em
forma tabular, como se segue: 15 5
A B
(fo - fe)2
C D
fo fe fo -fe (fo - fe)2 fe
(superior esquerda) 15 11,67 3,33 11,09 0,95 10
-(superior direita) 5 8,33 -3,33 11,09 1,33 _
(inferior esquerda) 6 9,33 -3,33 11,09 1,19
(inferior direita) 10 6,67 3,33 11,09 1,66 apficando a frmula, vem que:
X2 = 5,13

X2 = (15 + 5(6 + 10)(15 + 6)(5 + 10)


FRMULA PARA 0 CALCULO DO QUI-QUADRADO DE UMA TABELA 2 X 2
Podemos evitar o processo lento e trabalhoso de calcular as freqncias esperadas para
um qui-quadrado associado a uma tabela 2 X 2 (2 linhas por 2 colunas), usando a X2
_ 36[(15)(10) -
(5)(6)]2 -
36(150 30)2
(15 + 5)(6 + 10)(15 + 6)(5 + 10) (20)(16)(21)(15)
seguinte frmula:
36(120)2 36(14.400)
=
N(AD BC)2- onde 100.800 100.800
518.400
5 14
X2
(A + B)(C + D)(A + C)(B + D) '
100.800

A= freqncia observada para a casela superior esquerda CORREO DE FREQNCIAS ESPERADAS PEQUENAS
B= freqncia observada para a casela superior direita
C= freqiincia observada para a casela inferior esquerda Se as freqncias esperadas numa tabela 2 X 2 forem muito pequenas (menores que
10
D freqiincia observada para a casela inferior direita em cada casela), as -frmulas que aprendemos at aqui podero produzir um qui-qua-
drado "inflado", isto , um valor de qui-quadrado maior do que o real. Note-se que isso
se) se aplica s freqncias esperadas e nab s de fato obtidas no
decorrer de uma pesqui-
sa; estas, alis, podem ser de qulquer tamanho.
* N.T.: No se v inferir da que existe uma relao obrigatria de causa e efeito. Alm disso, nada
indica que essa relao seja verdadeira. Primeiro, porque se trata de uma situao hipotetica;segundo, A fim de reduzir o "tamanho" do qui-quadrado observado e, assim, chegar-se a
porque, ainda que fosse verdadeira a relao de dependncia, ela seria, quando muito, verdadeira para um resultado mais "sensato", aplicamos a conhecida correct-to de Yates-sempre que a
um particular grupo de sujeitos, numa particular comunidade (norte-americana, no caso). tabela for do tipo 2 X 2. A correo de Yates consiste em reduzir de meia unidade
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
186 TOMADA DE DECISES
Qui-quadrado e outros Testes No-parametrkos 187
(0,5) todas as diferenas entre cada freqncia observada e a terica (esperada) respecti-
va. Uma vez que o x2 depende do tamanho dessas diferenas, conseguimos restringir,
tambm, o tamanho do prprio qui-quadrado observado.* A frmula "corrigida" do
(1 -fe I - 0,50)2
qui-quadrado, para situaes em que as freqncias esperadas so muito pequenas, (I fo -fe - 0,50)2 fe
a seguinte:
8,01 0,69
8,01 0,96
x2 x (I fo -fe I - 0,50)2 8,01 0,86
fe 8,01 1,20
X2 = 3,71
Na frmula "corrigida" (acima), as barras verticais que ladeiam fo indicam que -fe
meia unidade (0,5) deve ser subtrada do valor absoluto de cada diferena-ignorando-se
os sinais Como se observa acima, a correo de Yates produz um qui-quadrado (x2 = 3,71)
Vamos aplicar a frmula corrigida aos dados da Tabela 10.3: menor do que o obtido por meio das frmulas no-corrigidas (x2 = 5,13). No exemplo
em foco, nossa deciso quanto hiptese nula fica inteiramente a merc do fato de se
usar ou no a correo de Yates. Com a frmula corrigida, aceitamos a hiptese nula
X2
( I 15 - 11,67 - I 0,50)2 (15 - 8,33 - 0,50)2
I

(pois 3,71 < 3,84), e com as frmulas no-corrigidas, rejeitamos esta mesma hiptese.
11,67 8,33 A correo de Yates tambm se aplica frmula alternativa para o clculo do

( 6
I - 9,33 - I 0,50)2 ( I 10 - 6,67 - 1 0,50)2
qui-quadrado numa tabela 2 X 2. Assim:
9,33 6,67
N(1 AD - BC - N/2)2
(3,33 - 0,50)2 (-3,33 - 0,50)2 (-3,33 - 0,50)2
X2 - (A
1

+ B)(C + D)(A + C)(B + D)


11,67 8,33 9,33
Retomando os dados da Tabela 10.3, vem que:
(3,33 - 0,50)2
6,67
X
2
=
36[ (15)(10)
I - (5)(6) I -
36/212 I -
_ 36( 150 30 I -
18)2
(2,83)2 (2,83)2 (15 + 5)(6 + 10)(15 + 6)(5 + 10)
(2,83)2
+ (2,83)2 (20)(15)(21)(15)
11,67 8,33 9 ,33 6,67
8,01 8,01 8,01 8,01
-
36(120 18)2 36(102)2 36(10404) 374.544
11,67 8,33 9,33 6,67
100.800 100.800 - 100.800 100.800

= 0,69 + 0,96 + 0,86 + 1,20 = 3,71


COMPARAO DE VRIOS GRUPOS
O procedimento acima, em que se aplica a frmula "corrigida" do qui-quadrado, At aqui, limitamos nossas ilustraes ao esquema 2 X 2 amplamente empregado.
pode se resumido em frmula tabular: Deve-se enfatizar, entretanto, que freqente calcular-se o qui-quadrado para tabelas
maiores que as do tipo 2 X 2; nessas tabelas ingressam vrios grupos ou categorias. O
fo fe I fo -fe I I fo -fe I - 0,50 procedimento passo a passo usado na comparao* de vrios grupos , em essncia,
igual ao adotado na situao 2 X 2. Vamos ilustrar com um problema 3 X 3 (3 linhas
15 11,67 3,33 2,83 por 3 colunas), embora tal procedimento se aplique para qualquer nmero de linhas
5 8,33 3,33 2,83 ou colunas.
6 9,33 3,33 2,83 Imagine-se, mais uma vez, que o problema seja pesquisar a relao entre "orienta-
10 6,67 3,33 2,83 o poltica" e "mtodos de educao de crianas". Desta vez, porm, vamos admitir

* N.T.: As mesmas observaes feitas anteriormente com respeito ao termo "comparao" valem
* N.T.: Essa operao tambm conhecida pelo nome de correvcro de continuidade. para tabelas maiores que 2 X 2.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
188 TOMADA DE DECISES Qui-quadrado e outros Testes No-paramtricos 189

que trs amostras aleatrias tenham sido extrafdas: 32 liberais, 30 moderados e 27


A frmula acima pode ser empregada no problema 3 X 3 conforme se segue:
conservadores. Suponha-se, ainda, que os mtodos de educao de crianas estejam
categorizados em: "permissivos", "moderados" e "autoritrios". Ento: PASSO 1: Dispor os dados numa tabela de dupla entrada (tipo 3 X 3)

Hiptese Nula*: A freqncia relativa de mtodos permissivos, moderados e autoritdrios Orientao Poltica
a mesma tanto para liberais quanto para moderados quanto para
Mtodos Usados na Conservadores Moderados Liberais
conservadores. Educao de Crianas
Hiptese Experimental: A freqncia rekstiva de mtodos permissivos, moderados e 14
Permissivo 7 9 30
autoritdrios no a mesma para liberais, para moderados e
para conservadores.

Vamos admitir que, terminada a coleta de dados, resulte a Tabela 10.4. Nela, veri-
ficamos que 7 dos 32 conservadores, 9 dos 30 moderados e 14 dos 27 liberals adotam Moderado 10 10 8 28
Freq encia
prticas permissivas relativamente educao de seus filhos.
observada

TABELA 10.4 Educao de Filhos vs. Orientao Politica (Problema 3 X 3)


Autoritrio 15 11 5 31
Orientao Polttica
Mtodo de Conservadores Moderados Liberais 32 30 27 N = 89
Educao de Filhos fo fo fo
Total marginal
Permissivo 7 9 14
Moderado 10 10 8
Autoritrio 15 11
PASSO 2: Calcular a freqncia esperada para cada casela
5
Total 32 30 27

7 9 14 (30)(32) 960
Tenha-se em mente que tanto a correo de Yates quanto a frmula altemativa (10,79) (10,11) (9,10) (superior esquerda) fe = 89 - 98
para o x2 so aplicveis apenas quando se trata de uma tabela (problema) 2 X 2, no 30
sendo possvel, por isso, aplic-las a vrios grupos, como, por exemplo, o caso presente 10 10 8
= 10,79
(3 X 3). Para determinar se h uma diferena significativa na Tabela 10.4, temos de (10,07) (9,44) (8,49)
utilizar a frmula original de x2 , apresentada no infcio deste captulo, isto : 28 (intermediria (28)(32) 896
esquerda) fe = 89 89
15 11
X
2
- (.fo - fe)2 (11,41) (10,45)
5
(9,40)
fe 31 = 10,07
32 30 27 (31)(32) 992
N = 89 (inferior esquerda) fe - 89 89

* N.T.: Com o objetivo de no se perder de vista que o que se testa a independncia entre as = 11,14
variveis, essas hipteses podem ser reformuladas, a fim de obter maior preciso, para:
Ho: As variveis P, M e A guardam rekto de independencia com as variveis X, Y e Z. (intermediria (30)(30) 900
Ha: As variveis P, M e A guardam relao de dependnck com as variveis X, Y e Z. superior) fe 89 89
P = mtodo permissivo; M = mtodo moderado; A = mtodo autoritrio; X = liberals;
Y = moderados e Z = conservadores. = 10,11
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
r------
190 TOMADA DE DECISES
Qui-quadrado e outros Testes Mfoparamtricos 191

(28)(30) 840 (intermediria superior) (-1,11)2 = 1,23


(central) fe - 89 89 (central) (0,56)2 = 0,31
(intermediria inferior) (0,55)2 = 0,30
= 9,44 (superior direita) (4,90)2 = 24,01
(intermediria direita) (-0,49)2 = 0,24
(intermediria
inferior) fe - (31)(30)
89
. 930
89
(inferior direita) (-4,40)2 = 19,36

= 10,45 PASSO 5: Dividir cada diferena, ao quadrado, pela respectiva freqncia esperada

(30)(27) 810 -fe)2


(superior direita) fe - 89
(fo
= 89 fe
= 9,10
(superior esquerda) 14,-
36
1 33
(intermediria (28)(27) 756 10,79
direita) fe =
89 89
= 8,49 (intermediria esquerda) 0,-
01
10,07
0,00

(inferior direita) (31)(27) 837


fe
89 89
14,90
(inferior esquerda)
11,14
- 1,34
= 9,40

PASSO 3: Subtrair cada freqncia esperada da respectiva freqncia observada


1,23
(intermediria superior)
10,11
- 0,12
fo -fe
(superior esquerda)
(intermediria esquerda)
7
10
-
-
10,79 =
10,07 =
-3,79
-0,07 (central) 0,-
31
0,03
(inferior esquerda) 15 - 11,14 = 3,86 9,44
(intermediria superior) 9 - 10,11 = -1,11
(central) 10 - 9,44 = 0,56 0,30
(intermediria inferior) 11 - 10,45 = 0,55
(intermediria inferior)
10,45
- 0'03
(superior direita) 14 - 9,10 = 4,90
(intermediria direita) 8 - 8,49 = -0,49
(inferior direita) 5 - 9,40 = -4,40 (superior direita) 24,01
- 2,64
9,10
PASSO 4: Quadrar essas diferenas

(fo - fe)2 (intermediria direita) 0,-


24
8,49
0,03
(superior esquerda) (-3,79)2 = 14,36
(intermediria esquerda)
(infeTior esquerda)
(-0,07)2 = 0,01
(3,86)2 = 14,90 (inferior direita) 19,-
36
2,06
9,40
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
g.
192 TOMADA DE DEC1SES
Qui-quadrado e outros Testes No-parametricos 193

PASSO 6: Somar esses quocientes para obter o qui-quadrado observado (calculado) entretanto, que os requisitos para o uso de testes no-paramtricos so via de regra
preenchidos com mais facilidade-pelo menos quando comparados com os "corres-
(Jeo - fe)2 pondentes" paramtricos, tais como a estatstica t ou a anilise de varincia. Com isso
fe mente, vamos voltar nossa ateno para alguns dos mais importantes requisitos
oara o uso da prova de significncia chamada qui-quadrado:
1,33
0,00 1. "Comparao"*entre duas ou mais amostras.
1,34 Como procurou ilustrar este captulo, o teste de qui-quadrado usado para,
0,12 atravs da comparao entre um x2 observado e um x2 crtico (tabelado), levar
0,03 o pesquisador a decidir se, numa amostra aleatria, duas ou mais variveis guardam
0,03 entre si uma relao de independncia. Isso torna obrigatrio que tenhamos, no
2,64 uma tabela 2 X 2 (no mnimo 2 linhas, como tambm 2 colunas). Na
0,03 montagem da tabela, importante que o mesmo'sujeito no figure em mais de uma
2,06 casela. A amostra deve ser explorada (com relao As variveis observacionais)
X2 = 7,58 exaustivamente e a distribuio dos sujeitos pelas vrias caselas deve ser indepen-
dente. Assim, se numa amostra aleatria de N = 100 sujeitos, desejarmos pesquisar
a relao entre cor de olhos (claro/escuro) e cor de cabelos (claro/escuro), o mes-
PASSO 7: Achar nmero de graus de liberdade mo sujeito no pode, relativamente a esse par de variveis, figurar em mais de
uma casela. Essa circunstncia torna a utilizao do qui-quadrado em situaes ex-
gl = (1 - 1)(c - 1) = (3 - 1X3 - 1) = (2)(2) = 4 perimentais do tipo antes-e-depois algo restritiva, embora no impeditiva."
2. Dados pertencentes ao nivel nominal de mensuravo.
O pesquisador s necessita de freqncias, isto , do nmero de sujeitos observa-
PASSO 8: Comparar o valor do qui-quadrado obtido (observado) com o do qui-quadra- dos para cada situao.
do tabelado (crtico). Veja Tabela E
3. Amostragem aleatria.
Os sujeitos amostrais devem ter sido extrados aleatoriamente de uma particular
X2 observado (obtido) = 7,58
populao.
X2 tabelado (crtico) = 9,49
gl = 4 4. As freqncias esperadas (tericas) por casela ndo devem set muito pequenas.
P = 0,05 O tamanho mnimo de uma fe depende da natureza do problema. Numa tabela
2 X 2, nenhuma freqncia esperada deveria ser menor que 5. Alm disso,
Necessitamos, portanto, de um valor de qui-quadrado que seja pelo menos igual a aconselhvel que se use a correo de Yates sempre que, numa tabela 2 X 2,
9,49 para podermos rejeitar a hiptese nula. Uma vez que o nosso x2 obtido de ape- qualquer freqncia esperada for inferior a 10. Numa situao em que vrios
nas 7,58, devemos aceitar a hiptese nula e atribuir as diferenas amostrais ao do grupos estejam sendo "comparados" (por exemplo, 3 X 3 ou 4 X 5), no h uma
acaso. No conseguimos descobrir nenhuma prova estatisticamente significante capaz de
sustentar a idia de que as freqncias relativas dos mtodos de educao de filhos
k. regra rigida para o estabelecimento de freqncias tericas mnimas por casela,
embora seja recomendvel que bem poucas contenham menos que 5. Note-se,
diferem para liberais, moderados e conservadores.
* N.T.: 0 termo "comparao", como foi anteriormente salientado, deve ser interpretado. "Corn-
( parao" supae um cotejo entre o resultado obtido (observado) e o resultado terico (tabelado). No
caso de qui-quadrado, a um dado nvel de significncia e com certo nmero de graus de liberdadc, a
REQUISITOS PARA 0 USO DO QUI-QUADRADO "comparao" se faz entre 20 e )&,
In dependentemente do fato de que os testes no-paramtricos no pressupem distfi- ** N.T.: Em Edwards, Allen L. -Statistical Analysis, 3.a ed., Holt, Rinehart and Winston, Inc.,
buio normal de uma particular varivel na populao, eles apresentam, tambm, pgs. 158-159; cita-se o exemplo de um pesquisador que aplicou aos mesmos 90 sujeitos amostrais
uma srie de requisitos que devem ser levados em conta pelo pesquisador desejoso de dois testes: um, antes do tratamento e outro, depois. Apesar de a idia bsica ser a de independncia
dos resultados em face de uma particular varivel (tratamento), o teste de significncia torna obri-
proceder a uma escolha inteligente de algum teste de significncia. O leitor notar,
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressorgatrio conhecer x2 de aderencia, que no estudado neste livro.
194 TOMADA DE DECISES
Qui-quadrado e outros Testes Nto-paramtricos 195

porm, que, em qualquer situao, a soma de todas as freqhncias


esperadas A mediana o 14. escore contado a partir de qualquer extremo databela-cujos dados
dever ser igual soma de todas as freqncias observadas, ou seja:
devero ser ordenados a priori.
Para encontrar a mediana, dispomos todos os escores (de homens e mulheres) em
Efe = Efo *
ordem consecutiva (sem levar em conta a origem da amostra) e localizamos a mediana
"combinada":
0 TESTE DA MEDIANA 18
O qui-quadrado pode ser aplicado a qualquer nmero de amostras 18
independentes men-
suradas no nvel nominal. Quando os dados forem ordinais, o teste da mediana 17
constitui 17
um procedimento no-paramtrico simples capaz de determinar o grau de
"certeza" 16
com que duas amostras aleatrias foram extradas de populaes que tm a 16
mesma
medkna. 16
Para ilustrar o uso do teste da mediana, admitamos que certo pesquisador 15
dese- 15
jasse estudar reaes masculinas/femininas a uma particular situao
social tida como 15
embaraosa. Para criar a situao embaraosa, pediu a 15 homens e 12 mulheres-cuja
14
"vocao" para cantores era apenas "mdia"-que cantassem, individualmente, diante 14
de uma audincia de "peritos", algumas canes do reperhrio 13
popular. O nmero
de minutos que cada sujeito manteve-se disposto a continuar cantando
figura na ta-
12 Mediana (149 escore contado a partir de qualquer extremo)
bela abaixo, onde, quanto menor o nmero, maior a intensidade da 11
sensao de 11
embarao.** 10
10
Nmero de Minutos Durante os quais 10
cada Sujeito Cantou 9
9
Homens Mulheres Homens Mulheres 9
8
15 12 11 9 8
18 7 10 11 7
15 15 8 14 6
17 16 14 9 6
17 6 9
16 8 18
10 10 16
13 6 PASSO 2: Contar em cada amostra o nmero de sujeitos que se situam "acima da
mediana" e "no acima da mediana".*
PASSO 1: Achar a mediana depois de fundir as duas amostras num s grupo. Em
Smbolos: Homens Mulheres

N + 1 27 +
Posio da mediana =
2
=
2
1
- 14. dado da tabela
Acima da Mediana 10 3
No Acima da Mediana 5 9
* N.T.: Como regra prtica, j que este assunto algo controvertido, acrescente-se a tudo N = 27
o que
ficou dito mais o seguinte: a prova de qui-quadrado deve ser evitada sempre que
qualquer fe < 5
c, simultaneamente, (Efe = Ifo = N) < 30. Assim, quando N
< 30, aconselha-se usar a Prova
Exata de Fisher.
** N.T.: 0 exemplo serve apenas para ilustrar o procedimento N.T.: "No acima da mediana" no o mesmo que "abaixo da mediana". "No acima da media-
denominado teste da mediana. Do *
ponto de vista experimental, o delineamento est cheio de impropriedades. na" vai at Mdn =12, isto , o 12 pertence a essa categoria.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
196 TOMADA DE DECISES Qui-quadrado e outros Testes Nb-paramtricos 197

Como vimos, os valores (durao do canto) da tabela anterior, para 2. Dados ordinais.
cada amostra, quan-
do cotejados com a mediana da distribuio, so transformados Para que seja possvel aplicar o teste da mediana, preciso que os dados perten-
em freqncias, origi-
nando um quadro 2 X 2. No problema em foco, 10 dos 15 homens am, no mnimo, ao nvel ordinal. Dados nominais no podem ser usados.
e apenas 3 das 12
mulheres continuaram a cantar por um perodo superior ao representado
pela mediana 3. Amostragem aleatria.
do grupo maior (homens + mulheres).
Dada uma populao, as amostras devem ser extradas aleatoriamente.
PASSO 3: Realizar um teste de qui-quadrado para verificar se o
resultado significante.
Se no houver diferenas ligadas ao sexo com respeito
durao do canto (e ao presu- DUPLA ANLISE DA VARIANCIA POR POSTOS: x2 DE FRIEDMAN
mido embarao que dele decorre), podemos esperar que ambas as amostras
se "quebram"
no mesmo ponto mediano, de sorte que metade dos homens No Captulo 8, introduzimos uma variao da estatstica t passvel de ser usada na com-
e das mulheres caem
acima da mediana. Para determinar se as diferenas obtidas entre parao de dados resultantes da mesma amostra em dois momentos distintos. No esque-
homens e mulheres so
estatisticamente significantes ou apenas resultado de erros de amostragem, ma "antes-e-depois", por exemplo, o grau de hostilidade numa amostra de crianas
fazemos um
teste de x2. poderia ser mensurado em duas ocasies distintas: antes e depois de terem assistido a
um violento programa de televiso.
Homens Mulheres A dupla anlise de variAncia por postos-o x2 de Friedman (x2p)-constitui uma
Acima da Mediana
aproximao no-paramtrica que permite testar diferenas numa mesma amostra de
10 (A) 3 (B)
No Acima da Mediana 5 (C)
respondentes que tenham sido mensurados sob, pelo menos, duas condies distintas.
9 (D)
Em smbolos:
N = 27
12
N(I AD - BC - NI2)2 (/102 - 3N (k + 1)
(A
I

+ B)(C + D)(A + C)(B + D)


I
-
27[ (10)(9) (3)(5) I - 12

(10 + 3)(5 + 9)(10 + 5)(3 + 9)


x/3
Nk(k + 1) onde

k = nmero de tratamentos, (via de regra representam o nmero de "condi-


-
27(75 13,5)2 102.120,75
- 3,12
es" em que foram feitas as mensuraes dos respondentes)
32.760 32.760 N = tamanho da amostra (nmero de respondentes).
ERi = soma dos postos relativos a uma particular mensurao (via de regra re-
Consultando a Tabela E no fim do livro, verificamos que o x2 deve presentam a soma dos postos relativos a um particular tratamento).
igualar-se a ou
exceder 3,84 (com gl = 1) a fim de que possa ser, ao ravel de 0,05,
encarado como
significante. Visto que o nosso x2 obtido igual a 3,12, no possvel Bustrao
rejeitar a hip6-
tese nula. HA insuficincia de provas para concluirmos, com base Para ilustrar a aplicao da dupla anlise de varincia por postos de Friedman, supo-
nos nossos resultados,
que homens e mulheres diferem com respeito a suas reaes diante nha-se que desejemos testar a hiptese de que a hostilidade em crianas varia segundo
da situao social-
mente embaraosa chamada "cantar em pblico". o grau de violncia a que se exponham assistindo a programas de televiso. A fim de es-
tudar a influncia da violncia televisada, imaginemos que tenhamos condio de expor
Requisitos para o Uso do Teste da Mediana uma amostra aleatria de dez crianas a tits diferentes nveis de violncia televisada,
As seguintes condies devem ser satisfeitas a fim de tornar
possvel o uso adequado
num programa que seja essencialmente o mesmo quanto a todos os outros aspectos.*
do teste da mediana numa pesquisa: Vamos tambm admitir que obtivemos os seguintes escores de hostilidade dessas 10
crianas, nas trs difgrentes condies a que estiveram expostas (a escala vai de 20 a 60,
1. Comparao entre duas ou mais medianas independentes. e quanto mais alto o escore, maior a hostilidade:
O teste da mediana usado em comparaes entre duas ou
mais medianas origin-
rias de amostras independentes.*
* N.T.: Em linguagem experimental, fala-se, geralmente, em variveis de ties tipos (muito embora
existam outros): variveis independentes (VI), dependentes (VD) e relevantes (VR). As variveis
independentes so manipuladas; as dependentes so observadas e mensuradas; as relevantes so
* N.T.: A rigor, no bem isso. A mediana foi usada corno ponto de partida
para a definkdo ope- mantidas sob controle. No exemplo em foco, N = 10 crianas foram ,submetidas as Vls "tipos de
racional de uma particular varivel. No exemplo estudado acima, o que o
pesquisador fez foi testar programas violentos"; as VDs so as "reaes individuais" e as VRs constituem as "demais condies
se a varivel "embarao" estava associada, numa relao de dependencia,
varivel "sexo". ambientais".
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
198 TOMADA DE DECISES
Qui-quadrado e outros Testes Nffo.paramtrleos 199
PASSO 1: Atribuir postos a todas as condies (tratamentos) a que cada respondente
esteve exposto (cada coluna corresponde a um tratamento). A fim de realizarmos a
anlise de varincia de Friedman, trabalhamos diretamente com os postos atribudos a
Baixa Mediana Alta
cada respondente at esgotar-se a lista de mensuraes.2 Criana (B) Posto (M) Posto (A) Posto
Como foi possvel verificar acima, o nvel de hostilidade da criana A aumentou de
23 para 30 e desse valor para 32 5. medida que a "dose" de violncia televisada que
A 23 3 30 2 32 1
ela estava sendo exposta passou de "baixa" para "mediana" e de "mediana" para "alta". B 41 45
3 1 43 2
Pensando em termos de postos, o escore-hostilidade da criana A foi mais alto (1) no C 36 2 35 3 39 1
tratamento "violncia alta" (coluna A), mediano (2) no tratamento "violncia media- D 28 3 29 2 35 1

na" (coluna M) e baixo (3) no tratamento "violncia baixa" (coluna B). Prosseguindo E 39 3 41 2 47 1
F 25 3 28 27 2
na lista, o mesmo raciocfnio aplica-se criana B: posto 1 para o escore-hostilidade G
1
38 3 46 2 51 1
maior (coluna M), posto 2 para o escore-hostilidade mediano (coluna A) e posto 3 para H 40 3 47 2 49 1
o escore-hostilidade menor (coluna B). Com relao criana C, o quadro o seguinte: I 45 2 46 1 42 3
posto 1 para o escore da coluna A (39), posto 2 para o escore da coluna B (36) e posto 3 J 29 3 34 2 38 1
para o escore da coluna M (35).* Os postos atribudos a cada criana sob os diferentes
tratamentos figuram na tabela
(B) (M) (A)
Criana Posto Posto Posto
Mveis de Violncia Televisada
Baixa Mediana Alta A 3 2 1
Criana (B) (M) (A) B 3 1 2
C 2 3 1
A 23 30 32 D 3 2 1
B 41 45 43 E 3 2 I
C 36 35 39 F 3 1 2
D 28 29 35 G 3 2 1
E 39 41 47 H 3 2 1
F 25 28 27 I 2 1 3
G 38
40
46
47
51
49
J
__3_ _2 _
1

ER = 28 ER = 18 ER = 14
45 46 42
29 34 38
PASSO 3: Entrar na frmula para obter o xi,
PASSO 2: Somar os pontos relativos a cada tratamento (cada coluna corresponde a
12
um tratamento). Se a hiptese nula estiver correta-e, por isso, no existir diferena Ap
Nk(k + 1)
(R)2 - 3N(k + 1)
significativa entre os tratamentos-,podemos esperar que as somas dos postos sejam
iguais entre si, descartados os erros devidos ao acaso. No exemplo em causa, h trs 12
condies: violncia televisada baixa, mediana e alta. Os postos e respectivas somas
if

(10)(3)(3 + 1)
(282 + 182 + 142) - 3(10)(3 + 1)
totals para cada uma dessas condies (isto , tratamentos) so:
12
= 120 (784 + 324 + 196) - 120
2
Na presente ilustrao no apareceram postos "espelhados" (empatados). No caso de tais postos
ocorrerem (por exemplo, se o escore de hostilidade da criana A tivesse sido precisamente o mesmo
para dois ou mais nveis de violncia), adote-se o procedimento recomendado para postos "espelha-
= 0,10(1.304) - 120 = 130,4 - 120 = 10,4
dos", Captulo 11, sob o ttulo "Coeficiente de Correlao de Postos".
PASSO 4: Achar o nmero de graus de liberdade
* N.T.: Tanto faz que a atribuio de postos se faa, relativamente aos escores, do maior para o
gl = k -
menor ou vice-versa.
= 3 - = 2
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor 1 1
200 TOMADA DE DECISES Qui-quadrado e outros Testes Na-o-paramtricos 201

PASSO 5: Comparar o x, (obtido, observado, calculado) com 0 x2 crtico (tabelado) N= nmero total de dados ou de respondpAtes.,r,,, pc FEDERAL DO
soo.
na Tabela E n = nmero de respondentes por amostra
ERi = soma dos postos por amostra.
ottiLlOr ac,A, 11.i.NTRAEda
(obtido) = 10,4
X2 (tabelado) = 5,99 Ilustrao
gl = 2 Para ilustrar a utilizao da prova de Kruskal-Wallis, considere-se a possvel influncia
P = 0,05 da varivel "idade" sobre a varivel "habilidade (capacidade) para arranjar emprego".
Vamos supor que, para estudar esse problema, tenhamos extrado amostras aleatrias
O x, constitui um valor (de qui-quadrado) que decorre diretamente da soma dos de populaes constitudas, respectivamente, de sujeitos velhos, de meia-idade
e de
postos para todos os tratamentos. Como conseqncia, podemos comparar o 4 obtido jovens, e que a todos tenha sido dado igual nmero de dias (prazo) para encontrar
com o x2 tabelado (Tabela E). Com gl = 2 e ao nvel de significncia de 5%, necessita- emprego. Admitamos que os dados obtidos sejam os seguintes:
mos de um qui-quadrado igual a, no mnimo, 5,99 para podermos rejeitar a hipttese
nula. Como o x?, obtido igual al0,4, rejeitamos a hiptese nula e aceitamos a hiptese NUmero de Dias Antes de Encontrar Emprego
experimental. Acabamos de reunir, com isso, suficientes provas de que a violencia tele- Adultos de Adultos Jovens
visada realmente exerce influncia sobre o comportamento hostil de crianas. H, pois, Adultos Velhos (X1) Meia-idade (12) (13)
diferenas significantes na hostilidade medida que a violencia toma-se mais intensa.
(n = 7)63 (n = 8) 33 (n = 6) 25
Requisitos para o Uso da Dupla Anlise da Varifincia por Postos (x2 de Friedman) 20 42 31
43 27
O uso da dupla anlise da varincia por postos-f de Friedman-implica que as se-
6
58 28 14
guintes condies sejam satisfeitas: 57 51 18
71 64
1. Comparao de uma mesma amostra mensurada sob duas ou mais condies. 13
45 12
O teste de Friedman no pode ser aplicado para testar diferenas entre amos-
30
tras independentes; ao contrrio, ele pressupe que a mesma amostra de res-
pondentes tenha sido mensurada pelo menos duas vezes (ou, ento, que os mem- PASSO 1: Atribuir postos ao grupo total de escores (N = 21) e achar a soma desses
bros de duas ou mais amostras tenham sido aglutinados em funo de variveis postos por amostra. Os postos atribudos aos escores devem obedecer ao seguinte
especficas). critrio: ao posto 1 corresponde o menor escore (6) e ao posto 21, o maior escore (71).
2. Dados ordinais. Na presente ilustrao, tanto 6 quanto 71 representam dias.3
O teste s4.5 pode ser realizado com dados aos quais possam ser atribudos postos.
Xl Posto X2 Posto
3. 0 nmero de respondentes (isto , o tamanho da amostra) no deve ser muito X3 Posto
pequeno. 63 19 33 12
O tamanho mnimo de N depende do nmero de tratamentos (k) aos quais os res- 20
25 7
6 42 13 31 11
pondentes vo ser expostos. Por exemplo, N deve ser igual a ou maior que 10 43 14 27 8 6 1
quando k = 3;j com k = 4, N 5. 58 18 28 9 14 4
57 17 51 16 18 5
7 1 21 64 20 13 3
ANLISE DA VARIANCIA PORPOSTOS: H DE KRUSKAL-WALLIS 45 15 12 2
ER3 = 31
ER1 = 110 30 10
A anlise da varincia de KruskabWallis uma alternativa no-paramtrica anlise que
se faz por recorrncia estatstica F, e pode ser usada para comparar vrias amostras 1R2 = 90
independentes desde que os dados sejam de, no mnimo, nvel ordinal. Para podermos
aplicar a prova de Kruskal-Wallis, devemos calcular a estatstica H como se segue:
3 Nib apareceram postos "espelhados" (empatados) na ilustracao presente. No caso de tais postos
12 (1102 ] ontrotom (por exemplo, se duas pessoas levarem exatamente 24 dias pra encontrax um emprego),
- H n
3(N + 1)
N(N + 1)
onde
f
111110 o procedimento apresentado no Captulo 11, sob o ttulo
"Coeficiente de Correlaco de
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
202 TOMADA DE DECISES Qui-quadrado e outros Testes No-parametrleos 203

PASSO 2: Entrar na frmula para achar H. RESUMO


Os estatsticos desenvolveram certo nmero de testes no-pararntricos de significan-
r (IR)21
H = 3(N + 1) cia-testes cujos requisitos no incluem distribuio normal da varivel de observagifo

21(21
N(N + la
1) L n
nem nvel intervalar de mensurao. O qui-quadrado (x2), o mais conhecido dos testes
( 12 \ 1102 902 312) no-paramtricos, usado em comparaes entre freqncias. Quando as diferenas
+ + 3(21 + 1) entre as freqncias esperadas e as observadas so muito grandes, rejeitamos a hiptese
+ 1)) 7 8 6
nula e aceitamos a hiptese experimental (alternativa), que acena com uma verdadeira
=
t 12 \ t 12100 +
8100 961)
66 diferena na populao. Esse o requisito bsico para que um qui-quadrado observado
462) 7 8 6
seja significante. Existem ainda outros procedimentos no-paramtricos: o teste da
= (0,03)(1.728,57 + 1.012,50 + 160,17) - 66 mediana determina se lid uma diferena significativa entre as medianas de duas amos-
tras; a dupla anlise da varincia de Friedman permite fazer comparaes entre mensu-
= (0,03)(2.901,24) - 66 = 87,04 - 66 = 21,04 raes distintas da mesma amostra (duas mensuraes, no mnimo) e, finalmente, a
anlise da varincia por postos de Kruskal-Wallis d margem a uma comparao entre
PASSO 3: Calcular o nmero de graus de liberdade. vrias amostras independentes.

gl = k - 1 = 3 - 1 = 2 PROBLEMAS
1. Amostras aleatrias de homens e de mulheres foram entrevistadas com o objetivo
PASSO 4: Comparar H com o qui-quadrado crtico (Tabela E). de pesquisar-se o comportamento de "fumar cigarros". Descobriu-se que, de 29
homens, 15 eram fumantes; igualmente que, de 30 mulheres, 20 tinham o hbito
H = 21,04 de fumar. Teste a hip6tese nula de que a freqncia relativa de homens que so
X2 crtico (tabelado) = 5,991. fumantes igual de mulheres que tambm o so. Que indicam seus resultados?
gl = 2 2. Dois grupos de estudantes fizeram exames finais de Estatstica. Somente um grupo
P = 0,05 recebeu preparao formal para o exame; o outro grupo leu o texto recomendado,
mas nunca compareceu s aulas. Enquanto que 22 dos 30 membros do primeiro
Para rejeitarmos a hiptese nula ao nvel de significncia de 0,05, com 2 graus de grupo (os "freqentadores") passaram no exame, apenas 10 dos 28 do segundo
liberdade, nosso H teria que ser igual a ou maior que 5,991. Como obtivemos H = 21,04, grupo (os "ausentes") lograram aprovao. Teste a hiptese nula de que a freqn-
podemos rejeitar a hiptese nula em favor da hiptese alternativa (experimental). Nossos cia relativa dos "freqentadores" que passaram nas provas finais igual freqn-
dados revelam que existem diferenas significativas, por idade, na quantidade de dias cia relativa dos "ausentes" que tambm passaram. Que que seus resultados
necessria para arranjar-se um emprego. indicam?
3. Aplicando a correo de Yates, realize uma prova de qui-quadrado para o seguinte
Requisitos para o Uso da Anlise da Varifincia de Kruskal-Wallis problema 2 X 2:*
A prova de Kruskal-Wallis pressupe as seguintes condies para seu uso adequado:
16 8
1. Comparaedo de tre's ou mais amostras independentes.
A prova de Kruskal-Wallis nib pode ser usada para testar diferenas numa Unica
amostra de respondentes mensurados mais de uma vez. 7 11
2. Dados ordinais.
Essa prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja 4. Aplicando a correo de Yates, realize uma prova de qui-quadrado para o seguinte
possvel atribuir postos. problema 2 X 2:
3. 0 tamanho mnimo de cada amostra deve ser 6.
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determi-
nada por recorrncia Tabela E (qui-quadrados crticos). Para testar diferenas * N.T.: importante salientar duas coisas: (1)-no se faz correo de continuidade (correo de
entre amostras de tamanho inferior a 6, o leitor deve recorrer a tabelas especiais Yates) em tabelas com dois ou mats graus de liberdade; (2)-mesmo em tabelas corn um grau de
encontradas em Siegel (1956). liberdade, s tem sentido aplicar tal correo se a hiptese nula tiver sido refeitada.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Qui-quadrado e outros Testes Nab-paramtricos 205
204 TOMADA DE DECISES

9. Pediu-se a duas amostras (aleatrias) de alunos que lessem e em seguida avaliassem


um conto escrito por um novo autor. metade dos estudantes (isto , A primeira
8 12 amostra) foi dito que o texto era de autoria de uma mulher, enquanto que outra
metade (segunda amostra), que a autoria era de um homem. Resultaram as seguintes
avaliaes, onde escores mais altos indicam atitudes mais favorveis:
10 5

X1 (Foi-lhesDito que X2 (Foi-lhes Dito que


5. Aplicado a correo de Yates, realize uma prova de qui-quadrado para o seguinte o Texto era de o Texto era de
problema 2 X 2: Autoria de Autoria de
uma Mulher) um Homem)
20 14
6 6
5 8

10 1 8
1 2
3 5
4 6
6. Faa uma prova de qui-quadrado para o seguinte problema 3 X 3:
3 3
6 8

20 17 5 5 6
5 8
1 2
3 2
15 16 16
5 6
6 8

14 18 6 4
4
3 3

7. Faa um teste de qui-quadrado para o seguinte problema 4 X 2: Aplicando a prova da mediana, decida se existe uma diferena significativa entre as
medianas desses grupos. Ser que as avaliaes feitas pelos estudantes sofreram
25 6 influncia da varivel "sexo do autor"?
10. Aplicando o teste da mediana, determine se h uma diferena significativa entre as
19 10 medianas das seguintes amostras de escores:

15 15
It 12

7 4
8 20 8 9 7 3
7 5 3 2
6 9 2 2
8. Faa uma prova de qui-quadrado para o seguinte problema 2 X 3: 7 8 3 6
7 9 4 4
8 7 7 5
9 9 4 4
8 10 15 4 7 9 5 4
6 6 4
9 2 3
12 10 9
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
206 TOMADA DE DECISOES Qui-quadrado e outros Testes New-paramtricos 207

11. Uma amostra de 14 crianas, constituinte do grupo "harmonia e identificao", foi 13. Pesquisadores analisaram a varivel "alienao politica" entre trs amostras de uni-
mensurada ern dois momentos distintos: antes e depois de sua participao numa versitrios: bacharelandos em "profisses liberais", em "engenharia" e em "artes".
tarefa de classe cujo objetivo era tomar os alunos mais dependentes uns dos outros Cada amostra forneceu um grupo de escores, conforme abaixo indicado (quanto
na consecuo de uma promoo curricular. mais alto o escore maior a alienao):
Resultaram os seguintes escores-identificao (escores mais altos indicam maior
"harmonia grupal"): X1 (Prof Liberais) X2 (Engenharia) X3 (Artes)
100 101 97
Tarefa Cooperativa 110 90 98
95 92 99
Antes Depois 93 100 100
Tempo 2 106 90 104
Aluno Tempo 1
102 96 103
A 62 75 92
51 53
60 62
43 51 Aplicando a anlise da varincia de Kruskal-Wallis, verifique se h uma diferena
49 52
significativa entre as citadas amostras de universitrios com respeito ao nvel de
45 46
73 62 alienao poltica.
66 68 14. Aplican do a prova de Kruskal-Wallis, verifique se h uma diferena significativa
57 55 entre as seguintes amostras de dados:
63 69
43 45
46 45 Il
67 68 125 100 95 64f/
61 67 100 99 90
122 105 86
127 103 96
115 116 88
Aplicando a dupla anlise de varincia de Friedman (por postos), determine se h
129 98 89
uma diferena significativa entre os resultados obtidos no Tempo 1 e Tempo 2 130
relativamente varivel "harmonia grupal".
12. Aplicando a dupla anlise de varincia por postos-x2 de Friedman-verifique se h
uma diferena significativa entre os escores produzidos por uma amostra de 11
respondentes em trs momentos distintos: T1, T2 e T3 .

Respondente T2 T3

A 60 62 64
53 54 50
59 65 71
65 66 68
55 63 61
71 74 76
57 58 63
77 76 79
63 65 70
.1 54 59 62
63 62 65

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Correlacdo 209

grama de disperso, a varivel X localiza-se no eixo horizontal, enquanto que a varfilvel


Y, no vertical.*
Na Figura 11.1, temos dois diagramas de disperso: em ambos, h uma represen-

11
tao grfica da relao entre "anos de escola" (X) e "renda" (Y). Observe-se que essa
relao, na Figura 11.1(a), refere-se a homens, enquanto que na Figura 11.1(b), a
mulheres. Note-se, ainda, que, nesses diagramas de disperso, todos os pontos resullam
do "cruzamento" de dois escores-educao e renda-relativos a um particular respon-
dente. (Em outras palavras: a cada respondente correspondem dois escores e estes, em

Correlao
conjunto, do origem a um ponto do diagrama de disperso.) Na Figura 11.1(a), por
exemplo, vemos que a um homem com 4 anos de escolarizao corresponde uma renda
de CrS 68.000,00 (anuais), enquanto que a um homem com 13 anos de estudos, a renda
de CrIl. 170.000,00."
Podemos dizer que a fora de correlao entre X e Y aumenta medida que os
pontos, no diagrama de disperso, mais compactamente se agrupam em torno de urna
linha reta imaginria. Portanto, a Figura 11.1(a) (homens) representa uma correlao
mais forte do que a 11.1(b) (mulheres), muito embora ambos os diagramas indiquem
que a renda tende a aumentar com o aumento dos anos de escolarizao. Tais dados,
Caractersticas tais como orientao poltica, inteligncia e classe social variam de um na verdade, sugerem fortemente que a renda das mulheres (com relao dos homens)
respondente para outro e so, por isso, chamadas varidveis. Em captulos anteriores est menos relacionada com o nvel de escolaridade por elas atingido.
ocupamo-nos com o estabelecimento da presenca ou ausncia de relao entre duas
Variveis quaisquer, que, daqui por diante, chamaremos X e Y; por exemplo, relao SENTIDO DA CORRELAO***
entre orientao poltica (X) e mtodo de educar filhos (Y), entre classe social (X) e
A correlao pode ser classificada, quanto ao sentido, em positiva ou negativa. Uma
inteligncia (Y) ou entre orientao acadmica (X) e uso de entorpecentes (Y). Auxilia-
correldo positiva indica que os respondentes que obtiveram escores altos na varivel
dos pela razo t, pela anlise de varincia ou pelo qui-quadrado, procuramos, pginas
X tendem a obter escores tambm altos na varivel Y. De forma recproca, responden-
atrs, descobrir se uma diferena entre duas ou mais amostras podia ser considerada
tes que obtm escores baixos em X tendem a obter escores tambm baixos em Y (e,
estatisticamente significativa-reflexo de uma verdadeira diferena populacional-e no
nesse caso, a correlao tambm positiva). A correlao positiva pode ser ilustrada a
apenas o resultado de erro de amostragem (ao do acaso).
partir da relao entre escolaridade e renda. Como j vimos antes, respondentes com
muitos anos de escolaridade tendem a apresentar rendas anuais maiores do que aqueles
que freqiientaram a escola por poucos anos.
FORA DA CORRELAO
Diz-se que h correlao negativa quando, com relao aos mesmos respondentes,
Descobrir a existncia de uma relao no esclarece muito a respeito do grau de associa- medida que se obtm escores altos na varivel X, h a propenso de se obterem escores
o ou correlao entre duas variveis. Muitas so as relaes estatisticamente significan- baixos na Y. Reciprocarnente, ocorrer tambm correlao negativa se, em correspon-
tes; poucas expressam correlao perfeita ou exata. Ilustremos: sabemos que peso e dncia a valores baixos na varivel X, existir uma tendncia a valores altos na varivel Y.
estatura so variveis associadas, uma vez que, quanto mais alta a pessoa, maior tende a A relao entre escolaridade (anos de) e renda (anual) no caracteriza uma correlao
ser seu peso. H numerosas excees regra, entretanto. Algumas pessoas altas pesam
muito pouco; algumas pessoas baixas pesam muito. Da mesma forma, uma relao entre
orientao para estudos universitrios e uso de entorpecentes no prenuncia a possibili- * N.T.: Trata-se de um sistema cartesiano de eixos ortogonais.
dade de encontrarmos centenas de no-viciados entre estudantes que pretendam conti- ** N.T.: Em ambos os casos, mas principalmente no primeiro-a julgar pelo valor do salrio mnimo
nuar a vida acadmica ou muitos viciados entre os que no planejam freqentar a vigente-trata-se de empregados com algum grau de especializao.
universidade. ***N.T.: No texto original, o Autor fala em direct-to de correlao. Parece que o termo sentido
mais rigoroso, j que a mesma direco r (reta r) pode ser "percorrida" em dois sentidos (que se
As correlaes, na verdade, variam com respeito sua fora. Podemos visualizar
opem): de A para B e de B para A. Assim:
diferenas, quanto fora de correlao, por meio de um diagrama de disperso, que
um grfico capaz de mostrar a maneira pela qual os valores de duas variveis, X e Y, A

distribuem-se ao longo da faixa dos possveis resultados. Convencionalmente, num dia-


PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
210 TOMADA DE DEC1SES Correlafo 211

$14.000 814.000 Assim, famlias da classe mdia tan pequeno nmero de filhos: o tamanho da famlia
.0-.3 12.000 12.000 (Y) aumenta medida que a situao scio-econmica torna-se melhor ou pior.
10.000 10.000
6' 8.000 E 8.000 $14.000
-a 12.000
cl 6.000 -a 6.000
z 10.000
4.000 4.000 _
14-)

8.000
I
6.000 60
10
I 12
' 14 14 6 8 10 12 14 4.6
4.000
Anos de Estudo Anos de Estudo o .
40 e;:,
(a) Homens (b) Mulheres
2.000 Z 20
0 1} O
1 1 1 1 1 1 1 1 1 1

4 5 6 7 8 9 10 11 12 13 4 5 6 7 8 9 10 11 12 13
FIGURA 11.1 Diagramas de Disperso Ilustrativos de Diferenas na "Fora da Relao" entre Escolaridade em Anos Escolaridade em Anos
"Escolaridade" e "Renda" (Homens e Mulheres). (a) (b)

negativa, uma vez que respondentes com muitos anos de estudo tido tendem a apresen-
FIGURA 11.2 Diagramas de Disperso: (a) Correlao Positiva entre Escolaridade e Renda; (b) Cor-
tar rendas anuais baixas. Um exemplo mais caracterstico de correlao negativa resulta relao Negativa entre Escolaridade e Reprovaes.
da relao entre escolaridade (anos de) e reprovao nos grupos minoritrios. A repro-
vao tende a diminuir me dida que o nvel educacional aumenta. Portanto, sujeitos com
12
pouca educao formal tendem a apresentar maiores ndices de reprovao, enquanto
que os que freqentaram por mais tempo geralmente repetiram poucas vezes o ano. 10
8

6
CORRELAO CURVILNEA 4
e.
Uma correlao positiva ou negativa representa um tipo de relao linear. Graficamente, 2 - 4 ...*:4.0
os pontos* do diagrama de disperso aglomerar-se-o em torno da linha (reta) imagin-
0
1 1 1 11 11
ria in dicada na Figura 11.2(a). Por outro lado, se uma correlao negativa estiver presente, 1 2 3 4 5 6 7

os pontos do diagrama de disperso circundaro a reta imaginria conforme indica a (Baixa) (Alta)
Situao Scio-econmica
Figura 11. 2(b).
Na maior parte dos casos, os pesquisadores buscam estabelecer correlaes li-
neares, sejam elas positivas ou negativas. importante notar, entretanto, que nem FIGURA 11.3 Relao entre"Situao Scio-Econmica"(X) e "Tamanho da Famlia" (Y): Cor-
todas as relaes entre X e Y do origem, necessariamente, a uma linha reta.** Exis- relao Curvilnea.
tem muitas correlaceies curvilineas, indicativas de que uma varivel aumenta a medida
que a outra tambm aumenta, at ocorrer uma "reverso"; a partir da, uma das vari-
veis comea a decrescer, enquanto que a outra continua a crescer. Em outras palavras, COEFICIENTE DE CORRELAO
uma relao entre X e Y que comea positiva toma-se negativa; uma relao que comea O procedimento que permite trabalhar com correlaes no-lineares (curvilneas)
negativa toma-se positiva. Para ilustrar uma correlao curvilnea, consideremos a situa-se alm do escopo deste texto. Por essa razo, vamos voltar nossa ateno para
relao entre as variveis "nmero de crianas" (tamanho da famlia) e "situao scio- os chamados coeficientes de correlacio linear, que expressam, numericamente, tanto a
-econmica". Como evidencia a Figura 11.3, os pontos do diagrama de disperso tendem fora quanto o sentido da correlao. Tais coeficientes de correlao oscilam entre
a formar uma curva em U-e no uma reta, semelhana dos exemplos anteriores.
-1,00 e +1,00 conforme se segue:

N.T.: Fala-se costumeiramente em "nuvem de pontos". -1,00 correlao negativa perfeita


** N.T.: Na verdade, uma linha reta (perfeita) set resulta de uma funo matemtica do tipo
Y = a + bX. Nos demais casos, a linha interpolatriz que melhor se ajusta a todos os pontos da -0,95 correlao negativa forte
nuvem, que "sugere" uma reta.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
212 TOMADA DE DECISES 13Ifil1LYIro.ko"
Correlao 213
-0,50 <
correlao negativa moderada
r = I(ZxZy)
-0,10 <
correlao negativa fraca
onde
-0,00 < ausncia de correlao
r = coeficiente de correlao (linear) de Pearson
+0,10 < correlao positiva fraca zX escore z de um particular sujeito na varivel X, e dado por

+0,50 < correlao positiva moderada Z y = escore z de um particular sujeito na varivel Y, e dado por
+0,95 < correlao positiva forte N = total de pares de dados (escores), isto , total de "duplas" X e Y.
+1,00 < correlao positiva perfeita
Distribuio X Distribuio Y
Vemos, pois, que valores numricos negativos, tais como
-1,00, -0,95, -0,50 e -0,10,
indicam correlao negativa, enquanto que valores
numricos positivos, como, por
exemplo, +1,00, +0,95, +0,50 e +0,10, so indicativos
de correlapio positiva. Em
termos de grau de associao, quanto mais prximo
de 1,00 em ambos os sentidos,
maior a fora da correlao. Como tal fora independente
do seu sentido, podemos
dizer que -0,10 e +0,10 so iguais quanto fora
(ambos fracos); -0,95 e +0,95
tambm so iguais quanto a ela (ambos fortes).
Respondente A

Correlao Positiva

COEFICIENTE DE CORRELAO PARA DADOS


INTERVALARES
Com o auxlio do coeficiente de correlao
(linear) de Pearson (r), podemos determinar
a fora e o sentido da relao entre as
variveis X e Y-desde que elas tenham sido
mensuradas no nvel intervalar. O r de Pearson reflete a
extenso em que cada sujeito
amostral consegue obter o mesmo escore z nas duas variveis
(X e Y). No caso de cor-
relao positiva, ambos os escores z para um particular
respondente tm o mesmo
sinal, positivo ou negativo, e localizam-se aproximadamente
mesma distncia da media Respondente A
(aritmtica) de cada distribuio de escores. Assim, se o escore
do sujeito A na varivel Respondente B
X cair acima de X, o seu escore na varivel Y
tambm cair acima de Y; se o escore
de B, em X, cair abaixo de X, o seu escore em Y Correlao Negativa
tambm cair abaixo de Y. No caso
de correlao negativa, os escores z de um
particular respondente tm sinais opostos,
o que indica que os zs so no s eqidistantes
das respectivas mdias mas caem, com FIGURA 11.4 Intepretao Grfica de uma Correlao Positiva e de uma Negativa com Base
relao a elas, em lados opostos. Se o escore do sujeito no
A, em X, cair acima de X (isto Escore z.
, se Xi4 > X), o seu escore em Y cair abaixo
de Y (ou seja YA < Y); se o sujeito
B cair abaixo de X em X (se XB < X), ele
cair acima de Y osto 6,YB > em Y. Para ilustrar a aplicao do r de Pearson, vamos usar a frmula
A interpretao da correlao positiva e da acima na obteno do
negativa entre escores z foi ilustrada na coeficiente de correlao (linear) entre a varivel X, nmero de anos
Figura 11.4. completos de
P demos agora definir o r de Pearson
freqncia escola atingido pelo pai, e a varivel Y, nmero de anos de
como sendo a media dos produtos dos freqncia
escola completados pelo respectivo filho. Os dados da Tabela 11.1
escores z relativos s varidveis X e Y Em smbolos: respresentam essa
relao numa amostra aleatria de sete respondentes.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
214 TOMADA DE DECISES Correlao 215

TABELA 11.1 Relao entre Nivel Educacional do Respondente e do Respectivo Pai. (Nivel Educa-
cional Mensurado em Anos Completos de Freqncia Escola.)
x x- x- Y Y -Y Y - z x zy
Sx Sy
Anos de Eseola
Criana Pais (X) Crianas (Y)
A 12 12 D 16 5,57 1,85 11 1,57 0,79 1,46
B 10 8 E 8 -2,43 -0,81 10 0,57 0,29 -0,24
C 6 6 F 9 -1,43 -0,48 8 -1,43 -0,72 0,34
D 16 11 G 12 1,57 0,52 11 1,57 0,79 0,41
E 8 10 I
E(zx zy) = 5,29
F 9 8
G 12 11
Para ilustrar o procedimento que permite obter zX, Zy e Z.KZy acima, vamos examinar
Para aplicar a frmula do r de Pearson, precisamos, antes, descobrir o valor de cada as respostas do sujeito A, mensuradas das variveis X e Y. J sabemos que X = 10,43
uma das seguintes estatsticas: X, Y, SX e sy. Assim: e que sx = 3,01. Como X -X -
= 12 10,43 = 1,57 para o sujeito amostral
A, verificamos que sen zx = 1,57/3,01 = + 0,52. (Em outras palavras, os 12 anos
y2 de escola do sujeito A caem aproximadamente a meio desvio padro acima da m-
X X2 Y
dia da distribuio.) De modo anlogo, sabemos que Y = 9,43 e que s y = 1,98.
12
10
144
100
12
8
144
64
Como Y -Y = 12 - 9,43 = 2,57 para o sujeito amostral A, verificamos que
sen Zy = 2,57/1,98 = + 1,30. (Em outras palavras, esses 12 anos de escola caem
6 36 6 36 y- EY
16 256 11 121 = aproximadamente a um e um tero desvios padres acima da mdia da distribuio.)
8 64 10 100 Para obtermos o zxzy relativo ao sujeito A, s multiplicar o escore z = +0,52
9
12
81
144 _
8
11
64
121 = _73
7
= -
66
7
pelo escore z = +1,30 (donde: 0,52 X 1,30 = 0,68). Como evidencia a Ultima
coluna, direita, na tabela acima, a soma desses produtos de escores z 5,29.
EX = 73 EX2 = 825 EY = 66 EY2 = 650 Entrando com esses dados na fUrmula de Pearson, obtemos:
= 10,43 = 9,43

r = X(zxz y) 5,29
= + 0,75
7
Sy =
= VII)VC2 X.2
No exemplo acima, o r de Pearson igual a +0,75, o que indica uma correlao positiva
V825 V 650
(10,43)2 (9,43)2 razoavelmente forte entre o nvel educacional atingido pelos filhos e o nfvel educacional
= 7 7
atingido pelos respectivos pais. Em outras palavras, os respondentes cujos pais consegui-
= N/117,86 - 108,78 = N/92,86 - 88,92 ram um nvel alto de escolaridade tambm apresentaram propenso a chegar a um nvel
= N5,--4 alto de escolaridade; os respondentes cujos pais freqentaram a escola durante poucos
= 3,01 = 1,98 anos tambm demonstraram uma forte tendncia a freqentar a escola durante pouco
tempo.
Agora para cada sujeito amostral, calculamos dois escores z: um relativo varivel X,
outro Y; depois, achamos o produto desses escores z: FORMULA PARA 0 CALCULO DO r DE PEARSON
O clculo do r de Pearson a partir de escores z ajuda a relacionar o tpico da correla-
X -X Y - o com nossos esiudos anteriores sobre escores padronizados e curva normal. Entre-
X X -X Y Y - zx zy tanto, a frmula do r de Pearson baseada em escores z, requer muitos clculos que
s
X Sy
consomem bastante tempo. Felizmente, existe uma frmula para o clculo do r de
Pearson que trabalha de forma direta com escores brutos, eliminando-se, assim, a neces-
A 12 1,57 0,52 12 2,57 1,30 0,68
B 10 -0,43 -0,14 8 -1,43 -0,72 0,10 sidade de obterem-se os produtos dos escores z para X e Y. A frmula alternativa para
C 6 -4,43 -1,47 6 -3,43 -1,73 2,54 o r de Pearson
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
216 TOMADA DE DECISES correlaco 217

r =
NEXY - (IX)(EY) a hiptese de que no existe correlaO na populao. Com respeito ao coeficiente de
correlao (linear) d Pearson, a hiptese nula fixa que
V[NIX2 -(X)9[NEY2 - (EY )9
onde r = 0,

= coeficiente de correlao (linear) de Pearson enquanto que a hiptese e perimen (hiptese alternativa, Ha) estabelece que
= nmero de pares de escores brutos ("duplas" formadas de X e Y)
X = escore bruto (na varivel X) r 0.
= escore bruto (na varivel Y)
semelhana do que fi mos em captulos anteriores, testamos a hiptese sele-
A fim de ilustrar o uso da frmula alternativa para o clculo do r de Pearson, cionando um nvel de signifi ia igual a 0,05 ou 0,01,* aplicando, a seguir, a prova
vamos voltar aos dados da Tabela 11.1, onde se procurou estabelecer a relao entre adequada. Para testarmos a ign cncia do r de Pearson, podemos calcular uma esta-
nmero de anos de escola cursados pelo pai (X) e o nmero de anos de escola cursados tstica (razo) t com (N -
) gr au de liberdade, sendo N o nmero de pares de escores.
pelo respectivo filho (Y). A aplicao dessa frmula implica que calculemos primeiro A razo t pode ser obtida hedian te a frmula:
X2, Y2 e XY, conforme se segue:
t - rVN - 2
y2 XY
- r2
onde
12 144 12 144 144
10 100 8 64 80 t razo t (t observado, calculado) para testar a significncia do r de
36 6 36 36
6 Pearson
16 256 11 121 176
10 100 80 N = nmero de pares de escores (compostos de X. e Y)
8 64
9 81 8 64 72 r = o prprio r de Pearson (que est sendo posto prova).
12 144 11 121 132

EX = 73 EX2 = 825 EY = 66 Er2 = 650 EXY = 720 Voltando ao exempli anterior, podemos testar a significncia de um coeficiente
de correlao igual a +0,75 , resultante associao entre nveis educacionais de pais
e respectivos filhos. Assim:
Ento, o r.oeficiente de correlao (linear) de Pearson igual a

7(720) -
(73)(66)
0,7540-
r - A7(8251 - (73)9[7(650) - (66)9
N/1 - (0,754)2
5040 - 4818 222 222
0,754(2,236) ,69 1,69
V(5775 - 5329)(4550 4356) V(446)(194) N/86524
-s/1 -
0,569 431 0,656
2,58

222
= + 0,75
294,15
Ao consultar a Tabela C (fim do livr ), verificamos que, para ser significante, a razo t
deve igualar-se a ou exceder 2,57, ad nvel de significncia de 0,05, com 5 graus de
liberdade. Como o nOsso t calculado (4 = 2,58) maior do que o t tabelado (crtico),
Teste da Significncia o r de Pearson podemos rejeitar a hiptese nula de que r = 0 e aceitar a hiptese experimental de
O coeficiente de correl o (linar) de Pearson d-nos uma medida precisa
da forca e
que r 0. 0 nvel educacional do respondente e o nvel educacional de seu pai esto
do sentido da correlao isiente entre as variveis) na amostra estudada. Se tivermos
ainda querer realmente associados na populao.
extrado uma amostra alea na de uma particular populao, podemos
verificar se a associao pbtida ntre X e Y existe de fato na populao, e no resulta
meramente de erro amostral (= a -o do acaso). * N.T.: Ou qualquer outro nvel de significncia, pois isso depende do rigor com que o pesquisa-
Para testar a significncia de u a medida de correlao, geralmente estabelecemos dor deseja trabalhar.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Correlao 219
218 TOMADA DE DECISES

Mtodo Simplificado para Test a Siti ificincia de r


-14F--Respondente X X2 Y Y2 XY

Felizmente, o processo ilustrado cima para testar a/significncia do r de Pearson, foi A 10 100 1 1 10
simplificado; assim, torna-se desne essrio-a no ser a ttulo de exerccio-calcular a B 3 9 7 49 21

razo t. suficiente, pois, consultar Tabela F, no fim do livro, onde figura uma lista C 12 144 2 4 24
33
de valores significantes do r de Pearso aos nveis de significncia de 0,05 e 0,01,
associ- D 11 121 3 9

entre E 6 36 5 25 30
ados a graus de liberdade que vo de 1 904e for feita uma comparao direta o
F 8 64 4 16 32
nosso valor calculado de r e o valor tabel o (Tabela F), obteremos o mesmo resultado 14
G 14 196 1 1

que conseguiramos se, de fato, calculsieIlclos a razo t. No caso de o coeficiente de H 9 81 2 4 18


correlao de Pearson (calculado) ser menor que o valor crtico (tabelado), devemos I 10 100 3 9 30
100 20
aceitar a hiptese nula de que r = 0; ser'Por outr lado, o r calculado for igual a ou maior J 2 4 10
= = EXY =
que o r crtico, rejeitamos a hiptese/ nula e acei mos a hiptese experimental de que EX = 85 EX2 = 855 EY 38 EY2 218 232

existe correlao na populao. (1) (2) (3) (4) (5)


A ttulo de ilustrao, varios voltar ao nos exemplo anterior, no qual um
coeficiente de correlao igual a +0,754 foi testado r meio de uma razo t e consi-
significante. Ao consultar a Tab la F, verificamos que, ao nvel PASSO 2: Entrar com os resultados do passo 1 na frmula do r de Pearson:
derado estatisticamente
de 0,05 com graus de liberdade, um r, para ser signifiante e, assim, levar rejeio
e
da hipOtese
5
nula, deve ser, no minim, igual a 0,754. Vemos, por esse exemplo, que esse r =
NIX - (1X)(1Y)
mtodo simplificado leva-nos mesma concluso a que chegamos quando, pelo processo [N/X2 - ( )9[N/Y2 - (/Y)2]
mais longo, calculamos o t. 10(23 - (85)(38)
[10(855) - (8 )2][10(218) - (38)2]
Correlao: Uma Ilustrao 2320 - 230 - 910 - 910
Para ilustrar passo a passo o procedimento que permite obter o coeficiente de correlao
(8550 - 7225)(2180 - 1444) -01325)('736) \/975200
linear de Pearson (r), vamos examinar a relao entre X = anos completos de freqncia
escola e Y = nmero de reprovaes, na seguinte amostra aleatria de dez respondentes: - 910 = -0,92
\
987,52

Anos de Eseola (X) Reprovaes ( Y)a


Respondente O resultado encontrado/ indica a existncia de aprecivel correlao negativa entre
10 1
"educao" (X) e "reprovaes" (1').
A
B 3 7
C 12 2 PASSO 3: Achar os graus de liberdade.
D 11 3

E
F
6
8
5
4
gl = N -/2 = 10 - 2 = 8
G 14 1

H 9 2 PASSO 4: Comparar o r de Pearson obtido cmo r de Pearson crtico (Tabela F):


I 10 3
J 2 10 r calculado = -0,92
r crtico = 0,63
gl = 8
(a) Os nUmeros dessa coluna indicam quantas reprovaes cada sujeito
teve em sua vida escolar. P = 0,05

Como indicam os resultados acima, para que fosse possvel rejeitar a hiptese
Para calcular o r de Pearson, procede-se do seguinte modo: nula de que r = 0, ao nvel de significncia de 5% e com 8 graus de liberdade, seria
necessrio que o nosso r calculado fosse, no mnimo, igual a 0,63. Como o r calcula-
PASSO 1: Calcular (1) EX, (2) EX2, (3) IY; (4) EY2 e (5) EXY do igual a -0,92, rejeitamos a hiptese nula e aceitamos a hiptese experimental.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
220 TOMADA DE DECISES Correlao 221

Em outras palavras, nossos resultados sugerem a existncia de correlao entre "edu- Vimos, pginas atrs, que a form de uma correlao entre X e Y aumenta medi-
cao" e "reprovao" na populao da qual nossa amostra foi retirada. da que os pontos do diagrama de disperso concentram-se em torno de urna reta imagi-
nria. Podemos agora identificar essa curva* pelo nome de reta de regresso, que uma
Requisitos para o Uso do Coeficiente de Correlao de Pearson reta interpolatriz obtida a partir da nuvem de pontos do diagrama de disperso. O leitor
A fim de empregar-se corretamente o coeficiente de correlao de Pearson como medi- atento perceber que muitas so as retas que se "acomodam" aos pontos do diagrama,
da de associao entre as variveis X e Y, os seguintes requisitos devem ser levados em mas uma e somente uma constitui a reta de regresso. Isso porque o ajustamento dessa
conta: reta ao conjunto de pontos 6 o melhor possvel, garantindo-se, assim, boas previses de
Y, a partir do conhecimento de X.
1.Correboo* linear-0 r de Pearson s se aplica a correlaes lineares entre
X e Y.
Previso de Y a partir de X
2. Dados intervalares -As variveis X e Y devem ser mensuradas, no mnimo, a
Imaginem um estudo em que se procure estabelecer a correlao entre X = anos com-
ravel intervalar, de sorte que seja possvel trabalhar com escores.
pletos de freqncia escola e Y = renda mensal. Seja uma amostra de seis responden-
3. Amostragem casual-Os sujeitos amostrais devem ter sido extrados aleatoria-
tes, onde r = +1,00, isto 6, onde h correlao positiva perfeita:
mente de uma dada populao. Se assim no for, no ter nenhum sentido a
prova de significncia do coeficiente obtido.
Anos de Renda Mensal
4. Varicveis distribudas normalmente-Para que seja possvel testar a significn- Respondente Escola (X) em Cr$ (17)
cia do r de Pearson, 6 necessrio que ambas as variveis, X e Y, tenham distri-
buio normal na populao. Quando as amostras so pequenas, qualquer A 18 30.000,00
descuido na observncia dessa normalidade de distribuio pode comprometer B 6 10.000,00
seriamente a validade do r de Pearson. Entretanto, esse requisito deixa de ter C 9 15.000,00
D 15 25.000,00
importncia to grande quando o tamanho das amostras igual a ou maior E 12 20.000,00
que 30. F 3 5.000,00
ANLISE DE REGRESSO
Como demonstra a Figura 11.5, podemos marcar os escores acima num grfico
O estabelecimento de uma correlao entre duas variveis pode ter utilidade na previso
e traar por entre os pontos obtidos uma reta mediatriz. Essa mediatriz ser a reta de
dos valores de uma delas (Y) a partir do conhecimento dos valores da outra (X). A tc-
regresso que une os escores de cada respondente da amostra. Tal linha (reta) de regres-
nica empregada em tais previses conhecida por andlise de regresso.
so permite fazer a seguinte previso: um sujeito que tenha cursado a escola durante
18 anos poder ganhar Cr $30.000,00 mensais; um outro, que tenha freqentado apenas
* N.T.: Md.() v o leitor confundir correlaiio com relao de causa e efeito. Duas variveis, X e Y, 3 anos, Cr$ 5.000,00 mensais e assim por diante:
podem estar correlacionadas, mas isso no significa que uma delas seja a causa da outra. Mais formal-
J foi salientado anteriormente que h poucas correlaes perfeitas (+1,00 ou
mente, se Y = f(X), nada obriga, alm da correlao, que exista relao causal. Exemplo: suponha-se
que um pesquisador resolvesse estudar a associao existente entre as seguintes variveis: X = nmero -1,00) que a natureza apresenta. Este fato muito importante porque, como regra
de palavras que uma criana conhece e Y = tamanho do p desta mesma criana. Admita-se, agora, o geral, as previses tornam-se mais acuradas medida que o coeficiente de correlao
seguinte quadro: aproxima-se de -1,00. Quando a correlao entre duas variveis for forte, mas no
perfeita, possvel, ainda assim, construir uma linha de regresso (previso) que se
Nmero do
Nmero de Calado "ajuste** bem" ao conjunto de pontos do diagrama. Isso verdadeiro mesmo que nem
Idade da Palavras (= tam. do pi) todos os pontos da nuvem caiam exatamente sobre a reta (o que, alis, o mais co-
Criana (em anos) Conhecidas (X) (Y) mum); no ficamos impedidos de fazer previses, mas devemos aceitar o fato de que a
10 17
previso ser tanto mais imprecisa quanto mais distante o ponto estiver da linha de
1

2 300 20 regresso. A Figura 11.6 ilustra o caso de uma correlao forte, mas no perfeita.
3 1.000 24
4 3.000 28
5 8.000 30 * N.T.: Curva um nome genrico. Por isso nada impede, como, alis, o presente caso, que,
na regresso linear, a curva seja uma reta.
bvio que a correlao vai ser altfssima e positiva, o que no significa que o tamanho do p possa
ser explicado pela dimenso do vocabulrio ou vice-versa. Mais coerente pensar numa relaro trian- ** N.T.: Esse ajuste conseguido graas aplicao de uma "lei" denominada "Lei dos Mfnimos
gular, onde a prpria idade responsvel tanto pelo crescimento do 136 quanto do vocabulrio. Quadrados". As equaes de regresso so conseqncia direta dessa lei.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
222 TOMADA DE DECISES Correlao 223

Equao de Regresso podemos, a partir da, estabelecer a equao de regresso conforme se segue:
A equao de regresso, em smbolos, resulta na seguinte frmula:

Y' =rHx-r(-'1KyY+Y.
sx sx
= 0 ,85 -
05,
0,4
X - 0,85 (
0
0,4
5
) 10 + 5.000

onde = 1,06X - 1,06(10) + 5.000 = 1,06X - 10,6 + 5.000

= valor terico (previsto) de Y (Nota: como se trata de uma previso, = 1,06X + 4.989,4
rpode ser diferente de Y)
r O fim de prever (estimar) o valor de Y para cada X particular, basta entrarmos
= coeficiente de correlao linear de Pearson (r) para a relao entre
as variveis X e Y na frmula com os valores de X. Por exemplo: qual a renda mensal prevista para um
S y = desvio padro (amostral) da varivel Y sujeito que tenha ficado 12 anos completos na escola?
sx = desvio padro (amostral) da varivel X
Cr $35.000
X = um particular valor de X
= media aritmtica dos valores (amostrais) da varivelx 30.000
= media aritmtica dos valores (amostrais) da varivel Y.
25.000

Para ilustrar o uso da frmula de regresso na previso dos valores de Y, vamos 20.000
supor que entre as variveis X = anos de freqncia escola e Y = renda mensal te- 2
4 15.000
nhamos conseguido r = +0,85.
r'') 10.000
Cr$ 35.000

30.000 5.000

25.000 3 6 9
1 12
I 15
1 118

20.000 Anos de Escola (X)

15.000
FIGURA 11.6 Linha (Reta) de Regresso Correspondente Relao entre ol Nmero de Anos Com-
10.000 pletos de Freqncia Escola (X) e a Renda Mensal (Y), onde (r < +1,00)

5.000

3
t

6
III!
9 12 15 18
Entrando com os dados na equao de regresso, vem que:

Yl 1,06(12) + 4.989,4
Anos de Escola (X) 12,72 + 4.989,4
5.002,12
FIGURA 11.5 Linha (Reta) de Regresso Correspondente Relao entre o Nmero de Anos
Completos de Freqncia Escola (X) e a Renda Mensal (Y), onde (r +1,00) Portanto, a previso da renda mensal de algum que tenha 12 anos de escola de
Seja que: Cr$5.002,12.
Da mesma forma, podemos prever que um sujeito que tenha completado 6 anos
r = +0,85 de escola ganhe Cr $ 4.995,76, ou seja:
sy = 0,50
sx = 0,40 = 1,06(6) + 4.989,4
= 10 anos -= 6,36 + 4.989,4
= Cr $ 5.000,00 = Cr $4.995,76
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
224 TOMADA DE DECISES Correlago 225
et,
Anlise de Regresso: Ilustrao PASSO 3: Calcular os devios padres amostrais para X e Y.
O estudo da anlise de regresso pode ser ilustrado com maior profundidade retoman- d>0
do-se um exemplo anterior em que foram examinadas as variveis X = nvel educa- /X2 - 44C, 40
cional conseguido por pais e Y = nvel educacional conseguido pelos respectivos filhos. sx = Al X' si --- 0 <(''
fr
N 2' e
Como vimos no incio deste captulo, tal relao, numa amostra de sete respondentes, = -or (9,43)2
= \/8 5 ( 1 0,43)2
produziu um r de Pearson igual a 0,75. Recapitulemos: 0
= \/117,86 -
108,79 = N/92,86 - 88,93 11"1,

Educagio -= N/9,07 = N/3,93


'4
l'

Pais Respondentes = 3,01 = 1,98


Respondente (X) (Y)
PASSO 4: Entrar com os valores obtidos nos Passos 1, 2 e 3 na equao de regresso.
A 12 12
B 10 8
C 6 6 Y' = r
sx
- 7-(11-') V
+
D 16 11
E 8 10 '1,98 \ 98
F 9 8 = 0,75
\3,01,
X - 0,75
1
( '
3,01
) 10,43 + 9,43
G 12 11
= 0,75(0,66)X - 0,75(0,66)10,43 + 9,43 = 0,50X - 5,22 + 9,43
Podemos prever os valores de Y (educao dos filhos) a partir do conhecimento = 0,50X + 4,21
dos valores de X (educao dos respectivos pais), segundo o seguinte procedimento:
PASSO 5: Determinar os valores de Y' para os vrios valores de X.
PASSO 1: Determinar o coeficiente de correlao linear de Pearson. [Exemplos]
1. Para um respondente cujo pai tenha completado 16 anos de estudos:
r
NUY - (1X)(nT)

1ANU2 (U)2][NlY2 (IY)2] Yr = 0,50X + 4,21 = 0,50(16) + 4,21 = 8,0 + 4,21 = 12,21
7(720) (73)(66) - 2. Para um respondente cujo pai tenha completado 6 anos de estudos:
-
V[7(825) (73)27[7(650) - (66)27

5.040 -
4.818 Y' = 0,50X + 4,21 = 0,50(6) + 4,21 = 3,0 + 4,21 = 7,21
N/(5.775 - 5.329)(4.550 - 4.356) Concluso: temos condies de prever (estimar) que respondentes cujos pais
tenham concludo 16 anos de estudos cursaram/cursaro 12,21 anos; por igual racio-
222 cnio, os filhos de pais que estudaram 6 anos freqentaram/freqiientaro escola durante
N/294,15 7,21 anos.*

PASSO 2: Calcular as mdias aritmticas amostrais para X e Y , isto , X * N.T.: Observem-se trs aspectos importantes:
e Y.
1. Anlise de regresso no adivinhao. Tambm no um processo de "acertar a mosca".
0 leitor deve procurar perceber que o conjunto de pontos do diagrama de disperso define uma
- /Y
IX tendencia. A reta interpolatriz (isto 6, de regresso) apenas "sintetiza" essa tendncia e permite
X - N
Y
N uma generalizao, sob a forma de equao, como se todos os pontos cassem sobre ela.
2. Do que ficou dito em (1), acima, decorre que:
73 66 a) se Y = f(X) for funeo matemtica, as previses sero pontuais, isto , por ponto, e a pre-
7 7 ciso ser grande;
= 10,43 = 9,43 b) se Y = f(X) for funo estatstica, as previses sero intervalares, isto , os valores de
17' pertencero a um intervalo. Da que (Y' - Y) = erro de estimao.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
226 TOMADA DE DECISES Correlao 227

COEFICIENTE DE CORRELAO PARA DADOS ORDINAIS rs = coeficiente de correlao de postos


At aqui, estivemos trabalhando com o r de Pearson, que um coeficiente de correlao
D= diferena entre postos (relativa ao mesmo sujeito em ambas as
variveis).
aplicvel apenas a dados que possam ser mensurados, no mnimo, ao nvel intervalar.
Voltamos agora ao problema da determinao do grau de associao entre variveis N= nitmero de respondentes (isto , tamanho da amostra).
ordinais-variveis as quais possvel atribuir postos ou "graduao" a partir da presena
de uma caracterstica particular. Vamos considerar os dados tal como figuram na Tabela 11.2 e aplicar a fOrmula
Tomemos um exemplo do campo social. Consideremos a relao entre a "situao correlacional de Spearman:
scio-econmica" (X) e o "tempo despendido diante da TV" (Y). Imaginemos que nossa
amostra conste de oito respondentes e que, depois da atribuio de postos, tenha TABELA 11.2 Relao entre Situao Scio-Econmica e Tempo Gasto Diante da TV
resultado o seguinte quadro: Situao Tempo Gasto
Scio-Econmica Diante da TV
Situao Tempo Gasto Respondente X D2
Scio-Econmica (X) Diante da TV (Y)
Respondente Posto Posto A 1 2 -1 1

2 1 1 1

A
2
3
1

\ situao sci o-
2
1

3
3
4
5
3
5
4
-1
o

1
0
1

4 -econrnica 5
maior tempo diante 6 8 -2 4
5
mais alta 4
da TV 7 6 1

6 8 8 7 1

7 6 ED2 = 1 0
8 7

6(10) 60 60
Como podemos observar, o respondente A recebeu o posto 1 com relao ao
nvel scio-econmico, mas posto 2 quanto ao tempo despendido diante da TV; o
rs = 1
8(64 - 1)
= 1
8(63)
= 1
504
=
'
1 - 0,12 = + 0,88

respondente B recebeu posto 2 com respeito ao nvel scio-econmico e posto 1 quanto


ao tempo gasto diante do vdeo. Encontramos, portanto, uma correlao positiva forte (r5 = +0,88), entre "situnao
Para determinar o grau de associao entre essas duas variveis, podemos aplicar scio-econmica" e "tempo gasto diante do video": respondentes que apresentam uma
o coeficiente de correlaok de postos de Spearman (r s). Em smbolos: situaeo scio-econmica alta tendem a despender muito tempo diante da TV; res-
pondentes de baixo nvel scio-econmico tendem a ficar pouco tempo assistindo a
6/D2 programas de TV.
rs = 1
N (N2 - 1)
Procedimento para Lidar com Postos Empatados (Espelhados)
onde Na prtica, nem sempre possvel atribuir postos ou ordenar nossos respondentes sem
que, em *um momento, ocorram postos empatados (espelhados). Poderamos desco-
Sy brir, por exemplo, que dois ou mais respondentes despendem exatamente o mesmo
3. A equao r (-)
sx
X
sy _
r (-) X
sx
-I- conhecida tambm por equao de regresso tempo diante da televiso, ou que o desempenho acadmico de dois universitrios
semelhante ou, ainda, que diversos respondentes possuem o mesmo QI.
dos Y sobre os X. Entretanto, pode ocorrer que, dado um Y, o pesquisador resolva calcular o X
correspondente. Obviamente, o valor conseguido, semelhana de Y', ser um valor tambm aproxi- Para ilustrar o procedimento que permite ca1cular o coeficiente de correlaco de
mado, donde: (X' -
X) = erro de estimao. Nesse ltimo caso, quando se trata de buscar um X a postos, no caso de alguns deles estarem empatados, admita-se que estejamos interessados
partir de um Y conhecido, a equao denomina-se regresso dos X sobre os Y. Ei-la: no estabelecimento do grau de associao entre "posio acadmica" (X) e QI (Y).
Suponha-se tambm que nos seja possvel no s ordenar dez alunos graduandos (do
sx sx melhor para o pior) como tambm mensurar seus QIs. A tabela resultante apresentaria
(-)Y
Sy
r (-)Y X
Xt = r
Sy a seguinte disposio:
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
228 TOMADA DE DECISES
Correlavdo 229
1 Tendo encontrado o "posto-posio" de cada QI, podemos dar continuidade ao
Classificaveio QI
Respondente X clculo do rs conforme mostra a Tabela 11.3.

A 10 <- 110 TABELA 11.3 Relao entre Classificao Acadmica e QI


9 Ultimo lugar 90
8 104 Class:fleapit,
7 100 Acadmica QI
6 110 Respondente (X) (n X - Y = D D2
5 110
4 132 1 10 6 4,0 16,00
3 115 2 9 10 -1,0 1,00
2 primeiro lugar 140 3 8 8 0 0
1 4- 140 4 7 9 -2,0 4,00
5 6 6 0 o
6 5 6 -1,0 1,00
Antes de prosseguir com os clculos que levam obteno do rs-coeficiente de 7 4 3 1,0 1,00
8 3 4 -1,0 1,00
Spearman-vamos atribuir postos aos QIs dos nossos dez graduandos: 9 2 1,5 0,5 0,25
10 1 1,5 -0,5 0,25
Posto ao ID2 = 24,50
Respondente QI QI

A 110 7
Entrando agora, com os dados acima, na frmula, vem que:
90 10
104 8 os postos 5, 6 e 7
100 esto empatados 6(24,50)
rs
110 : 1
10(100 1) -
110
132
115
140
5
3
4
2 < os postos 1 e 2
1 -
- 990
147
= 1 - 0,15 = + 0,85

140 1 4" esto empatados


O coeficiente de correlao de postos resultante indica que existe uma correlao
positiva bem forte entre X e Y. Em outras palavras, universitrios com QI alto tendem
Como podemos observar, os sujeitos I e J obtiveram os QIs mais altos e esto, por a classificar-se bem em sua classe e universitrios com QI baixo tendem a classificar-se
isso, empatados (os postos 1 e 2 "pertencem" simultaneamente a ambos). Da mesma mal.
forma, os sujeitos A, E e F esto empatados com relao mesma varivel-QI-e, com
isso, os postos 5, 6 e 7 encontram-se "bloqueados". Prova de Signifiancia para o Coeficiente de Spearinan (rs)
Para determinar a posio exata de cada sujeito, no caso de postos empatados, Como proceder para testar a si ificncia do coeficiente de correlao de Spearman?
devemos somar esses postos (o "valor" numrico deles) e dividir o total pelo nmero de Exemplo: como podemos saber se tcoeficiente obtido (r, = 0,85) entre X (classificao
empates. Portanto, no caso de um QI = 140, em que ficaram bloqueados os postos 1 e acadmica) e Y (QI) significante, isto , se a "informao" pode ser generalizada para
2, o procedimento consiste em achar uma espcie de "media": a populao toda? Para testar a 4g'sraificncia de um r5 calculado, basta consultar a
Tabela G, no fim do livro, onde es/do 'arrolados, aos nveis de significncia de 5% e 1%,
+
1

2
2
- 1,5
os Y5 crticos. Observe-se que, nes,(e casc:;a consulta leva em conta apenas o nmero de
pares de escores (IV) e no, com4 noutros testes, os graus de liberdade. Neste problema,
N = 10 e, conforme a Tabela , para que um r, seja sigmficante (ao nvel de 0,05),
Por igual raciocnio, relativamente ao QI = 110, o procedimento : preciso que ele obedea se inte condio: r, > 0,648. Como o nosso rs observado
+ 6 + 7 igual a 0,85 (portanto maior que o F., crtico), rejeitamos a hiptese nula de que rs = 0
5
- 6,0 3
e aceitamos a hiptese experimental de que "classificao acadmica" e "QI" so

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
variveis correlacionadas no s na amostra como tambm na popukto.
230 TOMADA DE DECISES
Correlactio 231

Cone lao de Postos: Ilustrao PASSO 2: Calcular ED2. Para tanto, calcular as diferenas entrc os postos (colunas
Vamos resumir o procedimento que permite obter o coeficiente de correlao de postos Xe quadrar estas diferenas (D2) e somar os quadrados resultantes ):
utilizando, para isso, mais um exemplo. Seja o clculo da relao entre o "grau de
participao voluntria em as- X Y D D2
sociaes" (X) e o "nmero de Participao Voluntria
amigos ntimos" ( Y). Supo- em Associaes (X) Nmero de 1 1,5 -0,5 0,25
Respondente Posto Amigos (Y)
nha-se, ainda, uma amostra de 2 3,0 -1,0 1,00 UNIVERSIDADE
cinco respondentes, conforme 3 1,5 1,5 2,25 FEARAL t.g)
A 1 participa 6 4 4,5 -0,5 0,25 BIBLIOTECA CENTRAL PAIIA
o quadro 2 mais 4 5 4,5 0,5 0,25
3 6
4 2 1D2 = 4,00
participa
5 2
menos
PASSO 3: Entrar com o resultado do Passo 2 na formula do coeficiente de correlao
Para determinar o grau de associao entre X e Y, procedemos da seguinte ma- de postos de Spearman:
neira:
6/D2 6(4) 24
PASSO 1: Atribuir postos aos respondente tanto na varivel X quanto na Y. Como
= 1
N(AT2 - 1)
- 1
5( 4)
- 1
120
demonstra o quadro acima, a distribuio de ostos com respeito varivel X-partici-
pao voluntria em associaes-obedece se inte regra: posto 1 para o respondente = 1 - 0,20 = + 0,80
que participa "mais" e 5 para o
que participa "menos".
Nmero de Amig (Y): Posto PASSO 4: Comparar o rs obtido (calculad com ors crtico na Tabela G.
Precisamos, tambm, a- O

tribuir postos aos mesmos 1

respondentes sob a varivel 4 3 postos 1 e 2 r calcula do 0,80


Y-nmero de amigos ntimos. 6 2 "bloqueados" rs crtico 1,00
2 4 5
No exemplo em foco, ocorrem *-----___postos 4 e 5
postos empatados, conforme a 5 '"bloqueados" 0,05
demonstrao dada a seguir:
Volvendo Tabela G, no frm do livro, verificamos que, ao nvel de significncia
Para trabalhar com postos empatados, usamo a "mdia" dos empates: de 0,05 e com uma amostra de tamanho 5, necessitaramos de um rs observado igual
a 1,00 (correlao perfeita) para que fosse possvel rejeitar a hiptese nula. Portanto,
1 +
Para a primeira e segunda posies: 1,5 embora tenhamos conseguido uma forte correlao positiva na nossa amostra, somos
2 / obrigados a aceitar a hiptese nula segundo a qual rs = 0. Nossos resultados no podem
4 +
Para a quarta e quinta posies:
2
- 4,5
ser generalizados para a populao da qual a amostra foi extrada.

Requisitos Para o Uso do Coeficiente de Correlaco de Postos de Spearman


Portanto:
0 coeficiente de correlao de postos de Spearman (rs) deve ser empregado somente
quando as seguintes condies podem ser satisfeitas:
X
1. Correlao linear-0 rs (coeficiente de correlao de postos de Spearman) s6
1 1,5
2
detecta correlaes lineares entre X e Y, quaisquer que sejam essas variveis.
3,0
2. Dados ordinais-As variveis X e Y devem ser passveis de ordenao; como
3 1,5
4 4,5
alternativa, deve ser possvel atribuir-lhes postos.
3. Amostragem casual-Os sujeitos amostrais devem ter sido extrados aleatoria-
5 4,5
mente de uma dada populao.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
232 TOMADA DE DECISES Corte lao 233

Sempre que ocorrer acordo perfeito ou inverso perfeita, torna-se possivel prever,
GAMA DE GOODMAN E KRUSKAL
com preciso total, o posto de um sujeito numa varivel a partir do conhecimen to do
A correlao pode ser interpretada em termos do grau em que os valores de uma vari- posto desse sujeito na outra varivel. No caso de acordo perfeito, por exemplo, sabemos
vel podem ser previstos (ou adivinhados) a partir do conhecimento dos valores da outra que a pessoa que recebe posto 3 na varivel X tambm recebe o 3 em Y. Uma vez que
varivel. Isso pode ser diretamente observado no coeficiente gama de Goodman e a ocorrncia de correlao perfeita raramente ocorre na natureza,
nossa capacidade
Kruskal (G), que uma alternativa ao coeficiente de correlao de postos (1'0. Alis, para fazer previses acuradas sobre uma varivel a partir do conhecimento que temos
muitos pesquisadores do preferncia ao gama quando se trata de medir o grau de as- da outra vai depender da quantidade de acordos ou de inverses na ordenao de
sociao entre variveis mensuradas ao nvel ordinal. 4 postos dos indivduos em ambas as variveis.
A frmula bsica para o clculo do gama :
Coeficiente Gama (G): Ilustrao
G = - Para ilustrar o uso de gama, vamos admitir que estivssemos estudando a relao entre
+ (X), o tamanho da populao negra de reas metropolitanas dos Estados Unidos da
onde Amrica do Norte, e (Y), o respectivo nvel de discriminao em emprego. Tal
estudo
poderia ser levado a efeito, por exemplo, analisando os dados relacionados com popu-
fa = freqncia dos "acordos" laes e renda ora disponveis no U.S. Bureau of the Census.*
= freqncia das "inverses". Suponha-se que tenhamos sido capazes de ordenar e atribuir postos s seis maiores
reas metropolitanas dos EUA relativamente a X = tamanho da populao negra e
Podemos interpretar os acordos e as inverses como uma expresso do sentido Y = nvel de discriminao em emprego. Seja ento o quadro:
da correlao entre as variveis X e Y. Um acordo perfeito indica uma correlao posi-
tiva perfeita (+1,00): tal situao ocorre quando os sujeitos estudados receberam postos Tamanho da Nvel de
exatamente na mesma ordem em ambas as varkiveis. 0 quadro abaixo demonstra esse Area Populao Negra Discriminao em
fato muito bem: um sujeito recebe o posto 1 na varivel X e tambm o posto 1 na Metropolitana (X) Emprego (Y)
varivel Y; um outro sujeito recebe o posto 2 na varivel X e tambm na Y e assim
A 6 4
por diante.
2
2 3
Postos 5
Sujeitos X 4 6
3 1

A 1 1
2 2
Vemos, assim, que a rea metropolitana A apresentou o menor nmero de negros e
3 3
4 4
classificou-se em quarto lugar com respeito discriminao; a rea metropolitana B
5 5 apresentou a maior populao negra e classificou-se em segundo lugar quanto discri-
6 6 minao e assim por diante.**

PASSO 1: Redistribuir os dados de forma que a varivel X fique perfeitamente


orde-
Por outro lado, uma inverso perfeita in- nada (do posto menor ao maior). Para determinar o grau de associao entre o tamanho
Postos
dica uma correlao negativa perfeita (-1,00), da populao negra (X) e a respectiva discriminao em emprego (Y), levamos,
Sujeitos X primeiro,
de forma que os sujeitos estudados recebem a varivel X a uma tabela em que seus postos figurem de forma ordenada
de 1 a 6;
postos em ordem rigorosamente inversa nas A 6 os postos da varivel Yapenas acompanham os postos de X, o que fatalmente
1
determina
duas variveis. Assim, um sujeito que receba o 2 5
posto 1 em X receber o ltimo posto em Y; 3 4

um outro sujeito que receba o posto 2 em X 4 3 N.T.: Servio de Levantamento de Dados Demogrficos dos EUA.
5 2 N.T.: Observe-se que o menor posto (em ambas as variveis) corresponde
receber o penltimo posto em Y e assim 6 1
*'!`
5. maior populao
ou ao maior ntvel discriminador.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
por diante.
234 TOMADA DE DECISES UNIVERSIDADE FEDERAL DO PARA
111f5L1OTECA CENTRAL Correlao 235
uma ordem catica.* As freqncias dos acordos e das inverses na coluna desorde- PASSO 3: Obter as freqncias das inverses. Para encontrar as freqncias
nada (Y) indicam o quanto essa coluna de postos difere de uma ordenao perfeita, seja das inver-
saes, novamente comeamos com o primeiro posto da coluna dos Ys (isto , o
ela positiva (1, 2, 3, 4, 5, 6) ou negativa (6, 5, 4, 3, 2, 1): posto
que corresponde rea metropolitana B). Desta vez, entretanto, para cada posto,
o
procedimento ser o seguinte: contar o nmero de dados que, na tabela, situam-se
Tamanho da Nvel de acima de um particular posto e que, em valor numrico, siio maiores do que ele.
Area Populao Negra Discriminao em Ini-
Metropolitana Emprego (Y) ciando com o posto que figura no topo da coluna Y, verificamos que, em termos
(X) de
tabela, no ocorre nenhum dado antes dele (isto , antes do posto 2); por isso, entramos
1 2 com um zero na coluna das inverses. Tomando, agora, o segundo posto na coluna dos
2 3
Ys (3), isto , o que corresponde area metropolitana C, contamos o
3 1 nmero de dados
4 6 que o antecedem e so maiores do que ele. Uma simples inspeo da tabela revela-nos
5 5
A 6 4 que antes do posto 3 s figura um dado: o relativo ao posto 2 (rea metropolitana B)
e que, sendo 2 < 3, s possivel entrar com um zero na coluna
das inverses. Pros-
PASSO 2: Obter as freqncias dos acordos. Para obter tais freqencias (fa), comea- seguindo lista abaixo, o prximo posto o que corresponde rea metroplitana F
mos com o primeiro posto no topo da coluna dos Ys (isto , o posto que corresponde (posto 1). Como antes desse posto, 1, na coluna dos Ys, figuram os dados (postos)
A rea metropolitana B). Para cada posto, contamos o nmero de dados situados acima
3 e 2, e sendo (3 > 1) e (2 > 1), entramos com o valor 2 na coluna das
inverses. Ao
dele na tabela, porm que tenham menor valor numrico. 0 nmero de postos acima descer mais um pouco encontramos o posto 6, relativo rea metropolitana E. Obser-
do primeiro (sem levar em considerao seu valor numrico) sempre zero (uma vez vamos que, na tabela, trs dados precedem esse posto: 1, 3 e 2; porm, como nenhum
que, do ponto de vista estritamente "visual", no h nenhum posto antes do primeiro na deles supera, em valor numrico, o 6, novamente escrevemos zero na coluna das inverses.
la bela). Como resultado, entramos com um zero na coluna "acordos" para a rea metro- 0 processo continua at quo se esgotem todos os postos da coluna Y, dando origem aos
politana B. Observando o segundo posto (3) listado na coluna Y(rea metropolitana C), dois seguintes valores na coluna das inverses: 1 e 2 (o leitor poder fazer seus prprios
contamos o nmero de postos que esto acima dele na tabela e que tm menor valor clculos para comprovar).
nurnrico. Vemos que apenas o posto 2 est, na tabela, acima dele (3). E, uma vez que
esse posto (2) menor que 3, entramos com o valor 1 na coluna de acordos. Em conti-
Tamanho da Ntvel de
Area Populao Negra Discriminao em
nuao ao processo, o proximo posto listado (para a Area metropolitana F) 1. Como Metropolitana Emprego (Y) Inverses
(X)
os postos que esto acima dele, na tabela, so 3 e 2-e como ambos (3 e 2) so maiores
que 1-entramos com um zero na coluna de acordos. 0 posto seguinte na coluna dos o
Ys 6 e corresponde rea metropolitana E. Os postos que, na tabela, esto acima dele, o
sift) 1, 3 e 2 e estes, sem exceo, so menores que 6. Em outras palavras, se (1 < 6), 2
0
(3 < 6) e (2 < 6), h 3 postos menores que 6 e, por isso, entramos com o valor 3 na
1
eoluna de acordos. Procedendo de forma idntica com relao aos demais postos da 2
eoluna Y (relativos as areas D e A), vamos encontrar duas vezes o valor 3, que deve ser
levado coluna de acordos. Assim:
A cordos Inverses
Tamanho da Nvel de PASSO 4: Obter Efa e Efi. Uma vez que
Area Populao Negra Discriminao em todos os acordos e todas as inverses 0 0
Metropolitana (A') Emprego (Y) Acordos 0
tenham sido estabelecidos, somamos 1

0 2
1 2 0 separadamente essas colunas, conforme 3 0
2 3 1 a baixo: 3 1
3 1 0 A 3 2
4 6 3
5 5 3
E.t.a = 10 = 5

A 6 4 3

06tica estaria associada aos postos da varivel X. Por outro lado, entenda-se por ordem catica
PDFN.T.:compression,
Se esse procedimento de ordenao tivesse sido feito com relao varivel Y a ordem
OCR, web optimization using a watermarked ,
evaluation
qualquer seqncia numrica que nocopy of leiCVISION
apresente uma de formao. PDFCompressor
236 TOMADA DE DECISES AVERSIDADE t4coiffe4o 237
B1/11, s'
PASSO 5: Entrar com E.t.a e Eft na frmula do coeficiente gama: se, 8 interesse moderado e 11 pouco interesse. Observe-se que postos empatados ocor-
rem em todas as posies. Por exemplo, 29 respondentes empataram suas respostas na
- 10 5 - 5 coluna classe alta, no ponto mais alto da varivel X.
G =
+ 10 + 5 -
15 Observe-se que o quadro acima caracteriza uma tabela 3 X 3, onde existem 9 caselas (3
linhas X 3 colunas = 9 caselas). Para garantir que o sinal do coeficiente gama seja fixado
Um coeficiente gama igual a +0,33 indica a presena de uma correlao positiva com o devido rigor (positivo ou negativo), a varivel X (nas colunas) deve ser sempre
fraca. Essa correlao baseia-se numa dominncia de acordos: o nmero de acordos , disposta em ordem decrescente da esquerda para a direita. Por exemplo, na tabela, a
aproximadamente, 33% maior do que o nmero de inverses entre o tamanho da popu- classe social (X) decresce da esquerda para a direita, "assumindo" os valores "alta",
lao negra (X) e a discriminao em emprego (Y) nos EUA.* "mdia" e "baixa". De modo anlogo, a varivel Y, nas linhas, deve decrescer de cima
para baixo. Assim, nessa tabela, a adeso voluntria a uma associao (Y) varia, no
Procedimento Para Postos Empatados (Espelhados) sentido descendente, assumindo os valores "alta", "moderada" e "baixa".
Como j foi visto com relao ao coeficiente de correlao de postos (de Spearman),
nem sempre possvel evitar postos empatados ao nvel ordinal de mensurao. Na f
PASSO 2: Calcular Zfa. Para encontrar Efa, comece pela casela onde = 15 (canto
verdade, os pesquisadores se vem, com freqncia, s voltas com medidas ordinais, esquerdo superior). Multiplique essa freqncia (15) pela soma de todas as outras
brutas, que do origem a um nmero bem grande de postos empatados. Nos casos em que freqncias do quadro que, com relao ao 15, esto direita e abaixo. Lendo da
um nmero muito grande deles ocorrer, o coeficiente gama toma-se uma medida de esquerda para a direita, observamos que as freqncias que esto abaixo e a direita de
15 so: 10, 8, 7 e 11. Repita-se este procedimento relativamente a todas as caselas que
associao particularmente til. A frmula bsica para o clculo do coeficiente gama
admitam freqiincias nas posies (simultneas) "abaixo e direita". Assim, trabalhan-
pode ser empregada mesmo quando h postos empatados, desde que as freqncias dos do da esquerda para a direita, vem que:
acordos e das inverses sejam calculadas mediante uma "adaptao".
Classe A/Adeso alta 15(10 + 8 + 7 + 11) = 15(36) = 540
Vamos ilustrar o procedimento de obteno do coeficiente gama numa situao Classe B/Adeso alta 8(8 + 11) = 8(19) = 152
postos empatados. Suponha-se que um pesquisador quisesse examinar a relao entre Classe A/Adeso moderada
"classe social" e "adeso voluntria a uma associao". Suponha-se, ainda, que ele
10(7 + 11) = 10(18) = 180
Classe B/Adeso moderada 10(11) = 110
tivesse obtido os seguintes dados aps examinar questionrios distribudos a e respondi-
dos por 80 moradores de uma cidade: entre 29 respondentes da classe alta (A), 15
(Note-se que nenhuma outra casela da tabela admite clculos semelhantes aos que
demonstraram grande interesse, 10 interesse moderado e 4 pouco interesse em aderir acabamos de fazer, uma vez que para as freqncias 7 (I.' linha), 8 (2." linha), 4, 7
voluntariamente a uma determinada associao; entre 25 respondentes da classe mdia e 11 (ltima linha) as posies simultneas "abaixo e direita" no tm
(B), 8 demonstraram grande interesse, 10 interesse moderado e 7 pouco interesse; e, sentido.)
para finalizar, entre 26 respondentes da classe baixa (C), 7 demonstraram grande interes-
fa a soma dos produtos acima. Portanto:
PASSO 1: Redispor os dados numa tabela de freqncias.
Efa = 540 + 152 + 180 + 110
= 992
Classe Socl (X)
Adeso Voluntria a Alta Media Baixa
uma Associao (Y) (A) (B) PASSO 3: Calcular Efi. Para encontrar Efi, inverta-se o procedimento
(C) apresentado no
Passo 2, comeando com a freqncia que figura no topo direito da tabela (7). Desta
Alta 15 8 7 vez, cada valor vai ser multiplicado pela soma de todas as freqncias que, com relao
Moderada 10 10 8 a ele, figuram abaixo e esquerda. Fazendo a leitura da direita para a esquerda, obser-
Baixa 4 7 11
vamos que as freqncias que esto esquerda e abaixo de 7 so: 10, 10, 7 e 4. Como
29 25 26 no passo anterior, repita-se este procedimento at esgotar todas as alternativas posicio-
N = 80 nais. Ento, trabalhando da direita para a esquerda, temos:

Classe C/Adeso alta 7(10 + 10 + 7 + 4) = 7(31) 217


* N.T.: bom insistir no fato de que a preocupao do Autor foi ilustrar um procedimento
Classe B/Adeso alta 8(10 + 4) = 8(14) 112
estatstico e no criticar um quadro social eventualmente existente nos EUA. Alm disso, os dados Classe C/Adeso moderada 8(7 + 4) = 8(11) 88
usados bem podem ser fictcios. Classe B/Adeso moderada
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor 10(4) = 40
238 TOMADA DE DECISES
Correlao 239
(Note-se que nenhuma outra casela da tabela admite clculo semelhantes aos que fize-
Consultando a Tabela B, no fim do livro, verificamos que o z deve igualar-se a
mos acima, uma vez que para as freqncias 15 (1.a linha), 10 (2.a linha), 11, 7 e 4
ou exceder 1,96, a fim de que seja possvel rejeitar a hiptese nula a 5%. Como o nosso
(ltima linha) as posies simultneas "abaixo e direita" no tent sentido.) z calculado (z = 1,03) menor que o z critico (1,96), devemos aceitar a hiptese
nula
Efi a soma dos produtos que acabamos de obter. Ento: de que G = 0 e rejeitar a hiptese experimental de que G 0. A correlao que obti-
vemos no pode ser generalizada para a populao da qual a amostra foi extrada.
= 217 + 112 + 88 + 40
= 457 Requisitos Para o Uso de Gama
Os seguintes requisitos devem ser levados em conta a fim de que seja possvel o
emprego
PASSO 4: Entrar com os resultados dos Passos 2 e 3 na frmula do coeficiente gama. do coeficiente gama como medida de associao:

G =
- If 992 457 - 535
- + 0,37
1. Correlao linear-0 coeficiente gama (G) s detecta relaes lineares entre
"
+ If,
'
992 + 457 - 1.449 Xe Y.
2. Dados ordinais-As variveis X e Y devem ser passveis de atribuio de postos
Um G = +0,37 indica correkto positiva, moderadamente fraca, entre "classe ou de ordenao.
social" e "adeso voluntria". O resultado que acabamos de encontrar sugere uma 3. Amostragem casual-Para que seja possvel testar a hiptese nula de que G
= 0,
domintincia de acordos: estes excedem as inverses em 37% (Note-se que se o gama preciso que os sujeitos amostrais tenham sido extrados aleatoriamente de
tivesse sido -0,37, o significado concreto desse coeficiente seria: correlao negativa, uma dada populao.
moderadamente fraca e baseada em inverses.)

Prova de Significneia Para o Gama


COEFICIENTE DE CORRELAO DE
Para testar a hiptese nula de que X e Y no esto associados na populao, basta trans- DADOS NOMINAIS DISPOSTOS NUMA TABELA 2 X 2
formar o G calculado (observado) em escore z, mediante a aplicao da seguinte frmula:
No captulo anterior, comeamos a estudar um teste de significncia (para pr freqn-
cias prova) conhecido por qui-quadrado. Como simples extenso do teste de qui-qua-
z = G
N(1 - G2) drado, podemos agora estabelecer o grau de associao entre variveis que tenham sido
onde mensuradas a nvel nominal.
Vamos examinar, mais uma vez, a seguinte hiptese nula:
G= coeficiente gama calculado (observado) A proporo de fumantes de maconha entre alunos orientados para
fa = freqncia de acordos a universidade igual est dos no-orientados para a universidade.*
= freqncia de inverses.
No Captulo 10, essa hiptese nula foi testada numa amostra composta de 21
Na ilustrao acima, encontramos G = 0,37 (como indicador da correlao exis-
sujeitos orientados para a universidade e de 15 no-orientados. A pesquisa revelou
tente entre "classe social" e "adeso voluntria"). Para testarmos a significncia desse que 15 dos 21 orientados para a universidade e 5 dos 15 no-orientados eram fuman-
valor, entramos na frmula do z conforme se segue: tes de maconha (veja Captulo 10). Eis esse problema 2 X 2, de modo condensado, na
Tabela 11.4.

= (0,37)
992 - 457
80(1 - 0,372) A relao entre "ser fumante de maconha" (X) e "orientao para estudos
riores" (Y) foi testada mediante uma prova de qui-quadrado, conforme se segue:
supe-

= (0,37)
535
= (0,37)
535
X2 - 36[(15)(10). -
(5)(6n2 36(150 - 30)2
-
80(0,86) 68,80 (15 + 5)(6 + 10)(15 + 6)(5 + 10) 5,14
(20)(16)(21)(15)

(0,37) \F-78- = (0,37)(2,79) = 1,03


N.T.: Orientado para a universidade = que tenciona prosseguir os estudos ape's o 2.0 grau.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
*
240 TOMADA DE DECISES Correlao 241

2
Como o xo e maior que o x,, rejeitamos a hipotese nula de que = 0 e aceitamos a
TABELA 11.4 Uso de Maconha entre Estudantes Orientados e No-Orientados para a Universidade.
Dados Tirados da Tabela 10.3 hiptese experimental de que as variveis X e Y esto, de fato, associadas na populao
da qual se extraiu a amostra de 36 estudantes.
Fumantes No-fumantes
Requisitos Para o Uso do Coeficiente Fi
O emprego do coeficiente fi, como medida de associao entre duas variveis-X e
Orientados para
Y-leva em conta os seguintes requisitos:
15 6 21
a Universidade
1.Dados nominais-S se trabalha com freqncias.
2.Tabela 2 X 2-8 fundamental que os dados possam ser dispostos numa tabela
No-orientados 2 X 2 (2 linhas por 2 colunas). Constitui erro empregar o coeficiente fi em
para a Universidade 5 10 15 tabelas de ordem superior a 2 X 2 (por exemplo: 3 X 3; 4 X 3 etc.).
3. Amostragem casual-A fim de que seja possvel testar a significncia dos coefi-
cientes fi, importante que a escolha dos elementos amostrais tenha sido
20 16 N = 36 aleatria.

Uma vez conseguido o valor do qui-quadrado observado (Z = 5,14), podemos


calcular o coeficiente fi (0), que nada mais seno uma medida capaz de calcular o grau COEFICIENTES DE CORRELAO DE DADOS NOMINAIS
de associao em tabelas 2 X 2. Em smbolos:
DISPOSTOS EM TABELAS DE ORDEM SUPERIOR A 2 X 2
At este ponto, ocupamo-nos apenas do coeficiente de correlao de dados nominais
JN
V
X2 dispostos em tabelas do tipo 2 X 2. Como vimos no Captulo 10, h ocasies em que,
apesar de a varivel observacional ser nominal, comparam-se as freqncias de vrios
onde grupos ou categorias. Vamos ilustrar examinando a seguinte hiptese nula:
= coeficiente fi A freqncia relativa com que aparecem os mtodos de educar
x2 qui-quadrado observado (calculado) chamados "permissivos", "moderados" e "autoritrios" a mesma
N= tamanho da amostra (isto , nmero de sujeitos experimentais) para "liberais", "moderados" e "conservadores".

Aplicando a frmula acima ao problema em foco, resulta que: Essa hiptese foi testada no Captulo 10 com os dados dispostos numa tabela 3 X 3. A
Tabela 11.5 repro duz esses dados.
/5,14
36
- -10,14 = 0,37
A relao entre X e Y foi testada (no Captulo 10) por qui-quadrado, de acordo
=
com o que se segue:
O coeficiente fi obtido = 0,37) indica a existncia de correlao moderada entre
orientao para a universidade e uso de maconha.
x2
(7 - 10,79)2 (10 - 10,07)2 (15 - 11,14)2
10,79 + 10,07 + 11,14 4-
Teste de Significincia para o Coeficiente Fi
Sem nenhuma dificuldade, felizmente, o coeficiente fi pode ser testado por meio de
qui-quadrado cujos valores crticos esto registrados, em grande nmero, na Tabela E +
(9 - 10,11)2 +
(10 - 9,44)2 +
(11 - 10,45)2
(rim do livro), aos nveis de 0,05 e 0,01. Assim: 10,11 9,44 10,45

5,14 (14 - 9,10)2 (8 - 8,49)2 (5 - 9,40)2


2
X, 3,84 9,10 8,49 9,40
gl 1
= 7,58
0
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
242 TOMADA DE DECISES Correlao 243

TABELA 11.5 Relao entre "Mtodos de Educar Filhos" e "Orientao Poltica". Dados Tirados Teste de Significncia Para o Coeficiente de Contingncia
da Tabela 10.4 Tal como procedemos no caso do coeficiente fi, a determinao da significncia do
coeficiente de contingncia faz-se mediante consulta direta Tabela E, no fim do
X livro. Relativamente situao que acabamos de examinar acima temos que:
Conservadores Moderados Liberais
2
X19
7,58
2
Xc 9,49
Permissivos 14 30 UNIVERSIDADE FEDERAL DO PARA
gl = 4
0,05 B1BLIOTECA CENTRAL

Diante desses resultados (x02 < X2c), somos levados a no rejeitar a hiptese nula de que
Moderados 10 10 8 28
C = 0, descartando, por outro lado, a hiptese alternativa (experimental) de que 0.
Em outras palavras, a relao "mensurada" exprime uma circunstncia da particular
amostra utilizada e no da populao que lhe deu origem.

Autoritrios 15 11 5 31 Requisitos Para o Uso do Coeficiente de Contingncia


A fim de aplicar convenientemente o coeficiente de contingncia, o leitor deve ficar
atento para os seguintes re quisitos:
32 30 27 N = 89
1. Dados nominais-No clculo de C s se exigem freqtincias. Tais freqncias
podem ser dispostas numa tabela 2 X 2 ou de ordem superior.
No caso em foco, o que buscamos determiunar a correlao ou o grau de associa-
2. Amostragem casual-Para tornar factvel a prova de significncia (coefi-
o entre "orientao poltica" (X) e "mtodos de educar filhos" (Y). Numa tabela de
ciente de contingncia), todos os elementos amostrais devem ser selecionados
ordem superior a 2 X 2, essa correlao pode ser conseguida mediante uma simples
aleatoriamente de uma dada populao.
"ampliao" do teste de qui-quadrado, donde resulta o chamado coeficiente de contin-
gncia, notado C. O valor de C pode ser obtido pela aplicao da seguinte frmula:
Uma Altemativa Para o Coeficiente de Contingncia: V de Cram&
x2 Apesar da grande popularidade que o coeficiente de contingncia tem entre os pesqui-
C = sadores, ele apresenta uma notria desvantagem: o nmero de linhas e de colunas numa
N + x2
tabela de qui-quadrado exerce influncia sobre o valor mximo de C. Em outras pala-
vras, o valor do coeficiente de contingncia nem sempre vai variar de 0 a 1, muito
onde embora, em nenhum caso, exceda 1. Sob certas condies, o valor mximo de Cpoder
ser 0,94; sob outras, 0,89 e assim por diante.
qui-quadrado observado Para evitar-se essa desvantagem de C, podemos decidir pelo emprego de um coefi-
N==
X2
tamanho da amostra ciente de correlao alternativo, cuja finalidade exprimir o grau de associao entre
C= coeficiente de contingncia. variveis nominais em tabelas de ordem superior a 2 X 2. Conhecido por V de Cramr,
esse coeficiente Tao depende do tamanho (ordem) da tabela de x2 e apresenta os mes-
Com os dados deste problema, resulta, aplicando a frmula de C, o seguinte: mos requisitos de C(coeficiente de contingncia). Em smbolos:

X2
C =
/89 7,58
+ 7,58
- 7'"
96,58
N/0,08 = 0,28 V - N(le - 1)
onde
() nosso resultado, isto , C = 0,28, indica que a correlao entre "orientao poltica"
e "mtodos de educar filhos" bastante fraca. Essas duas variveis podem estar rela- V = V de Cram&
cionadas, o que no impede que surjam inmeras excees. N = tamanho da amostra
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
C'orrelavo 245
244 TOMADA DE DEC1SES

2. Calcule o coeficiente de correlao de Pearson para os seguintes conjuntos de


k = nmero de linhas ou de colunas.(Usar o nmero menor, seja ele
escores e verifique se a correlao significante.
qual for. Nas tabelas em que o nmero de linhas igual ao nmero
de colunas, tanto faz usar um como outro-por exemplo, numa
X
tabela 3 X 3, k = 3; numa tabela 4 X 4, k = 4-mas no caso de
tabelas tal como uma 3 X 5, k = 3 obrigatoriamente.) 2 5
1 4
Voltando ao exemplo da Tabela 11.5, em que se examinou a relao entre "orien- 5 3
tao poltica" (X) e "mtodos de educar filhos" (Y) (tabela 3 X 3), vem que: 4 1

7,58 7,58 7,58 3. Calcule o coeficiente de correlao de Pearson para o seguinte


= -10=C74 = 0,20 conjunto de escores
jEi9(3 - 1) 89(2) J 178 e verifique se a correlao significante.

Concluso: O V de Cramr, igual a 0,20 neste exemplo, indica que existe uma relao
fraca entre as variveis X e Y.
3 8
4 9
RESUMO 1 5

Neste captulo, entramos em contato com coeficientes de correlao que expressam 6 10


2 4
numericamente o grau de associao entre as variveis X e Y. Com o auxlio do coefi-
ciente de correlao de Pearson (r), podemos determinar tanto a fora quanto o sentido
4. Calcule o coeficiente de correlao de Pearson para o seguinte conjunto de dados
da relao entre variveis mensurveis, no mnimo, ao nvel intervalar. Podemos tambm
e indique se a correlao significante.
usar o r de Pearson para prever valores de uma varivel (Y) a partir do conhecimento
dos valores da outra varivel (X).
Existem inmeras alternativas no-paramtricas para o r de Pearson. A fim de
determinar a correlao entre variveis mensuradas ao nvel ordinal, podemos aplicar 2 1
o coeficiente de correlao de postos de Spearman (r5). O uso dessa medida de correla- 5 5
o implica que as variveis X e Y tenham sido ordenadas ou, ento, que a elas tenham 1 2
sido atribudos postos. Quando ocorrer um nmero muito grande de postos empatados 6 8
4
(espelhados), o coeficiente gama de Goodman e Kruskal (G) constitui uma boa alterna-
tiva para o coeficiente de correlao de postos.
Mediante uma simples extenso do teste de significncia de qui-quadrado, pode- 5. Calcule o coeficiente de correlao de Pearson para o seguinte conjunto de escores
e verifique se a correlao significante.
mos determinar o grau de associao entre variveis mensuradas ao nvel nominal. Para
um problema 2 X 2, empregamos o coeficiente fi (0); para um problema de ordem
X
superior a 2 X 2, podemos usar ou o coeficiente de contingncia (C) ou o V de Cramr.
10 2
PROBLEMAS 8 2
1. Os seis estudantes abaixo responderam a 6 4
perguntas relativas s suas atitudes com 3 9
1 10
relao a judeus (X) e a porto-riquenhos Alunos X
4 6
(Y). Calcule o coeficiente de correlao 5 5
A 1 2
de Pearson para esses dados e verifique
6 5
se a correlao significante. 4 3
3 3 6. Utilizando-se dos dados do Problema 1, estabelea a equao de regresso que
2 1 permite prever o valor de Y (atitude com respeito a porto-riquenhos) a partir dos
4 seguintes valores de X (atitude para com judeus): (a) X = 5; (b) X = 2; (c) X = 9.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
246 TOMADA DE DEC1SES Correlacdo 247

7. Utilizando-se dos dados do Problema 5, estabelea a equao de regresso que per- 11. Os cinco sujeitos abaixo foram "graduados" de 1 a 5 tanto na varivel X quanto na
mite estimar o valor de Y para os seguintes valores de X: (a) X = 10; (b) X = 2. Y. Tomando esses dados por base, calcule o coeficiente de correlao de postos
indique se entre X e Y existe relao significante.
8. Os cinco estudantes abaixo foram ordenados segundo o tempo que levaram para
completar uma prova (Y). Por exemplo, quem terminou em primeiro lugar recebeu
1, quem terminou em segundo, 2 e assim por diante. A seguir, as provas foram
avaliadas pelo professor, que atribuiu a esses alunos as notas (X) constantes do 1 4
quadro abaixo. Teste a hiptese nula de que no existe relao entre X (notas) e 3 2
Y (tempos de prova), isto , calcule o r, (coeficiente de correlao de postos de 2 5
4 3
Spearman) e verifique se ele ou no significante.
5 1

X
12. Cinco sujeitos foram avaliados relativamente a duas variveis: X e Y. Em ambas
53 1

91 2
receberam valores inteiros, de 1 a 5, que podem ser entendidos como postos.
70 3 Calcule o coeficiente gama e verifique se existe relao significante entre X e Y
85 4
91 5

9. Os oito sujeitos abaixo receberam postos em X e notas em Y. Calcule, para esses 2 3


1 2
dados, o coeficiente de correlao de postos e verifique se existe uma relao
3 1
significante entre essas variveis. 5 5
4 4

1 32 13. Um pesquisador distribuiu postos em ordem decrescente 106 estudantes relativa-


2 28
mente as duas variveis seguintes: consumo de bebidas alcolicas (X) e consumo
3 45
4 60
dirio de drogas (1'). Em ambas as variveis, o pesquisador dispunha de trs alter-
5 45 nativas: alto, moderado e baixo. Concludo o estudo, resultaram os dados freqen-
6 60 ciais constantes da tabela abaixo. Determine, pois, com base neles, o grau em que
7 53 as variveis X e Y esto associadas, e teste se a relao encontrada significante.
8 55 Sugesto: determinar o coeficiente gama.

10. Sete sujeitos receberam postos tanto na varivel X quanto na Y. Para esses dados, Consumo de Alcool
calcule o coeficiente de correlao de postos de Spearman e verifique se existe Alto Moderado Baixo
relao significante entre essas variveis. Consumo de Drogas

Alto (f) 5 7 20
X Modera do (f) 10 8 15
Baixo (f) 15 6 10
1 7
3 6
N = 106
2 5
4 3
5 4 14. No Problema 2 do Captulo 10, o X2 = 8,29 para a relao entre "comparecimento
7 2 as aulas" e "notas no exame final de Estatstica". Suponha que N = 58 e calcule
6 1 o coeficiente fi, com vistas a determinar o grau de associao existente entre essas
variveis.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
248

15.
TOMADA DE DECISES

Dado um problema 2 X 2, onde N = 138 e X2 = 4,02, calcule o coeficiente fi, a


fim*:le determinar o grau de associao entre as variveis X e Y.
12 I4,<5N
0
16, Dado urn problema 2 X 2, onde N = 150 e X2 = 3,90, calcule o coeficiente fi,
fim de estabelecer o grau em que as variveis X e Y esto associadas.
a
Aplicao <4%

t"
O
*4b.
e
17. Tendo ern mente estabelecer o grau de associao existente entre X e Y num
problema 4 X 3, com N = 100 e X2 = 8,05, calcule: (a) o coeficiente de contin-
gncia; (b) o V de Cramer. de Procedimentos 4Vt14,
18. No Problema 5 do Captulo 10, N = 118 e X2 = 17,75. Qual o grau de associao
existente entre X e Y nesse problema 4 X 2? Calcule: (a) coeficiente de contingen-
cia; (b) V de Cramr. Estatsticos a
19. A fim de estabelecer o grau de associao entre X e Y num problema 3 X 3, onde
N = 138 e X2 = 10,04, calcule: (a) o coeficiente de contingncia; (b) o V de
Cramr. Problemas de Pesquisa
A terceira parte deste livro contm certo nmero de procedimentos estatsticos que
podem ser aplicados a vrios problemas de pesquisa na rea de cincias humanas. Os
Captulos 8, 9 e 10 apresentaram alguns procedimentos distintos para determinar se
diferenas amostrais (calculadas) eram estatisticamente significativas ou se, ao contr-
rio, resultavam de meros erros de amostragem. Os procedimentos apresentados no
Captulo 11 permitem determinar o grau de associao, a correlao entre duas variveis.
Cada procedimento estatstico, conforme foi salientado ao longo deste livro,
possui um conjunto de pressupostos que devem ser satisfeitos para garantir-se sua apli-
cao adequada. Ao selecionar procedimentos, o pesquisador deve, portanto, considerar
certo nmero de fatores, tais como:
1.0 que procura testar? Diferenas significativas, grau de associao ou ambas as
coisas?
2. Relativamente varivel estudada, que nvel de mensurao foi conseguido:
nominal, ordinal, intervalar?
3. As variveis estudadas tm ou no distribuio normal na populao da qual
elas foram extradas?
4. A pesquisa implica o estudo de amostras independentes ou o estudo da mesma
amostra mensurada mais de uma vez?
O Captulo 12 apresenta algumas situaes hipotticas de pesquisa, onde os crit-
rios acima esto especificados. Sugere-se ao leitor que escolha o procedimento estatfsti-
co que lhe parea mais adequado a cada situao, dentre os constantes da seguinte lista
(todos esses procedimentos foram estudados na Parte III do livro):
1. razo (estatstica) t
2. anlise de varincia
3. qui-quadrado
4. teste da medium.
5. anlise da varincia de Kruskal-Wallis

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
250 TOMADA DE DECISES Aplicao de Procedimentos Estatisticos a Problemas de Pesquisa 25 I

6. dupla anlise da varincia de Friedman


7 . r de Pearson X1 X2
Escores dos Estudantes Escores dos Estudantes
8. correlao de postos de Spearman
Para os Quais o Professor Para os Quais o Professor
9. gama de Goodman e Kruskal Tinha 25 Anos Tinha 65 Anos
10. coeficiente fi
65 78
(4/4s/040,
11. coeficiente de contingncia
38 42
12. V de Cram& 52 77

A Tabela 12.1 (pg. 252) situa cada procedimento estatstico em funo de alguns
71
69
50
65
%oo.
pressupostos importantes que devem ser levados em conta para garantir-se sua correta 72 70
55 SS
aplicao. Ao examinar as colunas da tabela, deparamo-nos com a primeira deciso vital,
78 51
relacionada com a seleo do procedimento estatstico: nosso intento verificar se 56 33
existe alguma re/act-to entre as variveis? As provas de significncia discutidas nos Captu- 80 59
los 8, 9 e 10 permitem decidir se uma diferena amostral calculada reflete uma real
diferena na populao. Ou, ser que, em lugar disso, o que buscamos medir a fora Que procedimento estatstico aplicaria o leitor para determinar se existe diferena
da relao entre duas variveis? Este um problema de correlao que pode ser solucio- significativa entre esses grupos de alunos relativamente sua disposio para assistir as
nado por meio dos procedimentos estatsticos apresentados no Captulo 11. Os subttu- conferncias?
los das colunas da Tabela 12.1 alertam o pesquisador que decide empregar uma prova de
significncia em vez de um procedimento correlacional para um aspecto deveras impor- Situao de Pesquisa 2
tante: ele deve certificar-se de que est diante de amostras independentes ou, ento, de Um pesquisador, interessado em saber se a idade de um conferencista era capaz de
que seus dados resultam de vrias mensuraes da mesma amostra. influenciar a disposio de um grupo de universitrios para ouvi-lo, decidiu realizar o
As linhas da Tabela 12.1 dirigem nossa ateno para o nvel de mensurao seguinte experimento. Numa situao normal de sala de aula, foi dito a 30 alunos que
em que nossas variveis foram avaliadas. Se tivermos conseguido mensurar nossas vari- a administrao da eseola desejava conhecer suas preferncias com respeito a uma srie
veis no nvel intervalar, nada nos impede de considerar o emprego de um procedimen- de conferncias previstas. Especificamente, pediu-se-lhes que dessem sua opinio quanto
to paramtrico como, por exemplo, t, F ou r. Se, entretanto, tivermos obtido nvel ao professor que "poderia ser convidado". O professor foi descrito a todos os alunos da
nominal ou ordinal de mensurao, nossa escolha fica limitada a algumas alternativas mesma forma exceto num particular: a um tero dos alunos foi dito que o confereneista
no-paramtricas. tinha 75 anos; a outro tero que ele tinha 50 anos; ao ltimo tero, que se tratava de
As solues para as situaes de pesquisa apresentadas a seguir podem ser encon- um jovem de 25 anos. Pediu-se, a seguir, que manifestassem sua disposio para com-
tradas no fim deste captulo. parecer as conferncias. Obtiveram-se os seguintes resultados (onde escores mais altos
indicam maior disposio):

SITUAES DE PESQUISA Escores dos Alunos aos Quais foi Dito


que o Professor Tinha
Situao de Pesquisa 1 25 Anos 50 Anos 75 Anos
Um pesquisador realizou um experimento com vistas a determinar se a idade do confe- X1 X2 X3
rencista exercia alguma influe'ncia na disposio de um grupo de estudantes para ouvi-lo. 65 63 67
Numa situao normal de sala de aula, foi dito a 20 alunos que a administrao da 38 42 42
escola desejava conhecer suas preferncias com relao a uma srie de conferncias 52 60 77
previstas. Especificamente, pediu-se-lhes que dessem sua opinio sobre o professor que 71 55 32
69 43 52
"poderia ser convidado". O professor foi descrito a todos os alunos da mesma forma 72 36 34
exceto num aspecto: metade dos alunos foi dito que ele (o conferencista) tinha 65 55 69 45
anos, enquanto que outra metade a informao foi de que ele tinha 25 anos. Solici- 78 57 38
tou-se, em seguida, que manifestassem sua disposio para comparecer as conferncias. 56 67 39
80 79 46
Obtiveram-se os seguintes resultados (onde escores mais altos indicam maior disposio):
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
252 TOMADA DE DECISES
Aplicao de Procedimentos Estattsticos a Problemas de Pesquisa 253

TABELA 12.1 Critrio para a Escolha de um Procedimento Estatstico Adequado


X
Testes de Signzficeincia (Captulos 8, 9, 10) Correlao Aluno Soletrao Leitura
(Captulo 11) 51 45
Nvel de Amostras Mesma Amsotra
Mensuraco Independentes 48 39
Medida Duas Vezes
99 87
Nominal Qui-quadrado (no-pa- 85 59
Coeficiente fi (no- 57 56
ramtrico) para testar -paramtrico para ta- 60 69
a independncia de betas 2 X 2) 77 78
duas ou mais vari-
veis) Contingncia e V de 96 69
Cram& (no-param- 62 57
tricos para tabelas 28 35
maiores que 2 X 2) 43 47
'Ordinal Teste da mediana (no- Dupla anlise da va- Correlao de postos 88 73
72 76
-paramtrico para rincia de Friedman de Spearman (no-
75 63
"comparar" duas (no-paramtrico para -paramtrico)
69 79
amostras) "comparar" a mesma
Gama de Goodman e
Anlise de varincia de amostra mensurada no
Kruskal (no-param-
Kruskal-Wallis (no-pa- mnimo duas vezes)
trico para lidar com Qual o procedimento estatstico que o leitor aplicaria para determinar o grau
ramtrico para "com- de associao entre as variveis "soletrao" (X) e "habilidade para leitura" (Y)?
parar" trs ou mais um nmero grande de
amostras) postos "espelhados")
Situao de Pesquisa 4
Intervalar Razo t (paramtrico Razo t (paramtrico r de Pearson (param- Para pesquisar a validade de um particular teste de leitura, um grupo de pesquisadores
para "comparar" duas para "comparar" a trico) aplicou o referido teste a uma mostra de 20 alunos cuja habilidade para ler havia sido
amostras) mesma amostra medida
Anlise de varincia (pa- duas vezes) previamente avaliada pelo professor da classe. Os escores, bem como as avaliaes
ramtrico para "com- individuais feitas pelo professor, figuram, relativamente a c.ada aluno, na lista abaixo:
parar" trs ou mais
amostras)
X Avaliao
Aluno Escore-leitura pelo Professor
Que procedimento estatstico aplicaria o leitor para determinar se h diferena
significativa entre esses grupos de estudantes relativamente sua disposio para assistir A 28 18
50 17
s conferncias?
92 1

85 6
Situao de Pesquisa 3 76 5
69 10
Para estudar a relao entre soletrao e habilidade para ler, um pesquisador aplicou a
42 11
um grupo de 20 alunos, selecionados aleatoriamente numa populao de graduandos, 53 12
testes especficos para mensurar essas variveis. Obtiveram-se os seguintes resultados 80 3
91 2
(onde escores mais altos indicam maior habilidade): 4
73
74 9
X 14 20
Aluno Soletrao 29 19
Leitura
O 86 7
A 52 56 73 8
90 39 16
81
63 80 13
75
91 15
81 72 72 14
93 50

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
254 TOMADA DE DECISES
Aplicao de Procedimentos Estatisticos a Problemas de Pesquisa 255
Qual procedimento estatstico adotaria o leitor para
determinar o grau de associa-
o entre os escores-leitura e as avaliaes feitas pelo professor? Que procedimento estatstico escolheria o leitor para determinar o grau de as-
sociao entre desempenho acadmico e srie escolar?
Situao de Pesquisa 5
Para pesquisar diferenas regionais relacionadas com "auxlio Situao de Pesquisa 8
a estranhos", um pesqui-
sador espalhou 400 chaves nas proximidades de caixas de Para investigar a influencia da frustrao sobre o preconceito, pediu-se a 10 sujeitos
correios localizadas no nor-
deste, sul, centro-oeste e oeste dos Estados Unidos da America que atribussem adjetivos negativos, tais como preguioso, sujo e imoral, a membros
do Norte. Cada uma das
chaves estava etiquetada com o nome e endereo do respectivo de um grupo minoritrio (uma medida de preconceito). Essa atribuio de adjetivos
"perdedor" (dono). fez-se em dois momentos distintos: antes e depois de terem esses sujeitos experimentais
O nmero de chaves devolvidas de cada regio
(como medida indicativa de "disposio
para ajudar") figura na tabela abaixo: sido submetidos a uma srie de exames difceis e demorados. Entendeu o pesquisador
que os exames assim concebidos teriam condies de criar a situao frustrante deseja-
da. Obtiveram-se os seguintes dados, onde escores mais altos representam maior pre-
Regio
conceito:
Nordeste sur Centro-oeste Oeste
Escores Relacionados com
Devolvidas Preconceito
55 69 82 61 Sujeitos
No-devolvidas 45 31 18
Antes do Depois do
39
Exame Exame
100 100 100 100

Que procedimento estatstico aplicaria o leitor para A 22 26


determinar se essas diferenas 39 45
regionais so estatisticamente significativas?
25 24
40 43
36 36
Situao de Pesquisa 6 27 29
Para examinar a relao entre "autoritarismo" e "preconceito", 44 47
um pesquisador colheu
medidas de autoritarismo (com um instrumento especial) e de 31 30
preconceito (uma lista 52
de adjetivos negativos atribuveis a negros norte-americanos). 52
A amostra pesquisada 48
consistiu em 950 adultos norte-americanos sorteados 59
aleatoriamente. Obtiveram-se os
seguintes resultados: entre 500 respondentes autoritrios,
350 eram "preconceituosos" Qual procedimento estatstico usaria o leitor para determinar se existe uma
e 150 "tolerantes"; entre 450 no-autoritrios, 125
eram "preconceituosos" e 325 diferena estatisticamente significante entre os escores de preconceito em funo da
"tolerantes".
Que procedimento estatstico usaria o leitor para frustrao?
estudar o grau de associao
entre as variveis "autoritarismo" e "preconceito"?
Situao de Pesquisa 9
Para pesquisar-se a relao entre o status ocupacional real de um respondente e sua
Situao de Pesquisa 7 classe social subjetiva (isto , a classe social que o prprio respondente se atribui), um
Para investigar a relao Serie Eseolar pesquisador pediu a 677 sujeitos que indicassem suas ocupaes, bem como a classe
entre "srie escolar" e de- social a que eles pertenciam. Entre 190 respondentes de ocupaes de status superior
sempenho 1a 2.a 3.a 4.a
acadmico", (liberais-tcnicos-executivos), 56 identificaram-se como de "classe alta", 122 como
pesquisadores estudaram f f f f de "classe media" e 12 como de "classe baixa"; entre 221 respondentes de ocupaes
os registros de 186 univer- A - ou -ire1hor 6 5 7 10 de status mdio (vendedores-burocratas-operrios qualificados), 42 percebiam-se na
sitrios selecionados alea- B -aB 10 16 19 18 "classe alta", 163 na "media" e 16 na "baixa"; entre 266 com ocupaes de status
toriamente dentre a tota- C -a
C+ 23 20 15 7
lidade de alunos de certa
C ou pior 15 7 6 2 baixo (trabalhadores semi e no-qualificados), 15 perceberam-se na classe "alta", 202 na
universidade. Obtiveram-se 54 48 47 37 "media" e 49 na "baixa".
(N = 186)
os seguintes resultados: Que procedimento estatstico aplicaria o leitor para determinar o grau de as-
sociao entre status ocupacional e classe social subjetiva?
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
256 TOMADA DE DECISES
Aplicao de Procedimentos Estatsticos a Problemas de Pesquisa 257

Situao de Pesquisa 10
Para investigar a relao entre as variveis "opo profissional" e "salrio inicial" em
Situao de Pesquisa 12
Um pesquisador interessado em saber se a idade de um conferencista era capaz de
graduandos", pesquisadores entrevistaram um grupo de universitrios recm-formados.
S se preocuparam, os pesquisadores, com trs opes ocupacionais-engenharia, influenciar a disposio de um grupo de universitrios para ouvi-lo, decidiu realizar
profis- o seguinte experimento. Numa situao normal de sala de aula, foi dito a 130 alunos
ses liberals e administrao-com o fato de que o respondente estivesse na
situao de que a administraao da escola desejava conhecer suas preferncias com respeito a uma
"primeiro emprego" Os resultados, obtidos de entrevistas com 21 respondentes, figuram
na tabela abaixo: srie de conferncias previstas. Especificamente, pediu-se-lhes que dessem sua opinio
quanto ao professor que "poderia ser convidado". O tal professor foi ento descrito
Salrios Iniciais (em Cr $) a todos os alunos da mesma forma exceto num particular: metade dos alunos foi dito
que ele tinha 65 anos, enquanto que outra metade, que ele tinha 25. Pediu-se, a seguir,
Engenharia Prof Liberais Administragio que manifestassem sua disposio para comparecer as conferncias. Obtiveram-se os
189.000 126.000
seguintes resultados: relativamente aos que achavam que o professor tinha 65 anos,
189.000
221.400 171.000 162.000
22 manifestaram desejo de comparecer, enquanto que 43 expressaram m vontade; com
252.000 180.000 144.000 relao aos que supunham o professor com 25 anos, 38 dispuseram-se a comparecer,
171.000 198.000 167.400 enquanto que 27 mostraram-se pouco inclinados a assistir as suas conferncias.
162.000 153.000 189.000 Que procedimento estatstico usaria o leitor para determinar se existe diferena
153.000 135.000 180.000
135.000 significativa entre o comportamento de "adeso" desses dois grupos de estudantes,
126.000 126.000
quando a suposta varivel controladora da "disposio" a idade do conferencista?

Que procedimento estatstico usaria o leitor para determinar se existe uma dife-
SOLUES DAS PESQUISAS PROPOSTAS
rena significativa entre esses grupos de respondentes com respeito aos seus salrios
iniciais?
Soluo da Situao de Pesquisa 1
(Razo t ou Teste da Mediana)
Situao de Pesquisa 11 A situao de pesquisa 1 consiste ern uma comparao entre os escores de duas amostras
Para investigar a influncia da varivel "opo profissional" sobre a varivel independentes de alunos. A razo t (Captulo 8) empregada quando se trata de fazer
"salrio comparaes entre duas mdias (aritmticas) resultantes de dados mensurados ao nvel
inicial" em graduandos, pesquisadores entrevistaram um grupo de universitrios
recm- intervalar. O teste damediana (Captulo 10) uma alternativa no-paramtrica que pode
-formados em profisses liberais ou administrao. So os seguintes os resultados
co- ser aplicada sempre que suspeitarmos que os escores no tern distribuio normal na
lhidos desses 16 respondentes:
populao ou, ento, quando o nvel intervalar de mensurao no foi atingido.
Salirios Iniciais (em Cr $)
Soluo da Situao de Pesquisa 2
Prof Liberais Administraco (Andlise de Varidncia ou Prova de Kruskal-Wallis)
126.000 A situao de pesquisa 2 representa uma comparao de escores de trs amostras inde-
135.000
171.000 162.000 pendentes de alunos. A razo F (anlise de varincia-Captulo 9) empregada em
180.000 144.000 comparaes entre trs ou mais mdias independentes-desde que o nvel intervalar
198.000 167.400 tenha sido conseguido. A prova de Kruskal-Wallis (Captulo 10) uma alternativa
153.000 189.000 no-paramtrica que pode ser aplicada sempre que tenhamos boas razes para suspeitar
135.000 180.000
126.000 (a) da distribuio no-normal dos escores na populao e (b) do fato de o nvel de
126.000
144.000 mensurao em que foram colhidos os dados ser, no mximo, ordinal.
167.400
Soluo da Situao de Pesquisa 3
(r de Pearson)
Que procedimento estatstico empregaria o leitor para determinar se existe
uma A situao de pesquisa 3 um problema de correlao, uma vez que a soluo consiste
diferena significativa entre os salrios iniciais correspondentes a essas duas amplas
categorias de trabalho e as respectivas opes profissionais? na determinao do grau de associao entre X (habilidade para soletrar) e Y (habilida-
de para ler). O r de Pearson (Captulo 11) pode ser empregado para o estabelecimento
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
258 TOMADA DE DECISES Aplicaco de Procedimentos Estatsticos a Problemas de Pesquisa 259

da correlao linear entre as variveis X e Y, desde que elas tenham sido-ambas-mensu- Soluo da Situao de Pesquisa 7
radas, no mnimo, ao nvel intervalar de mensurao. Se X e Y no tiverem distribuio (Gama de Goodman e Kruskal)
normal na populao, devemos considerar uma alternativa no-paramtrica, tal como o A situao de pesquisa 7 6 um problema de correlao que consiste na determinao
coeficiente de correlao de postos de Spearman (Captulo 11). do grau de associao entre X (escala conceitual) e Y (srie escolar). O coeficiente gama
de Goodman e Kruskal (Captulo 11) emprega-se para o estabelecimento de urna cor-
Soluo da Situao de Pesquisa 4 relao linear entre X e Y quando a ambas as variveis foram atribudos postos, com
(Coeficiente de Correlaecio de Postos de Spearman) vrios deles empatados. No problema em foco, a escala conceitual foi graduada de A a D
A situao de pesquisa 4 um problema de correlao, uma vez que requer o clculo
ou pior e a srie escolar, por seu turno, da 1.a 4.a Ambas as variveis (X e Y) deram
do grau de associao entre X (escores-leitura) e Y (avaliao da habilidade para leitura, origem a "medidas" que, transformadas em postos, resultaram em numerosos empates
feita pelo professor). O coeficiente de correlao de postos de Spearman (Captulo 11) (postos empatados ou "esielhados"). Por exemplo, 54 alunos cursavam a primeira
pode ser empregado na deteco de uma relao linear entre as variveis X e Y-se o srie; 48 estavam na segunda, e assim por diante. O coeficiente de contingncia (C) ou
nvel em que essas variveis foram mensuradas tiver sido, no mximo, o ordinal. O r de o V de Cramer (Captulo 11) representam alternativas para o coeficiente gama, cujo
Pearson no pode ser empregado, pois ele implica a mensurao de Xe Ya nvel inter- clculo pressupe s dados de nvel nominal.
valar, no mnimo. No caso em foco, aos escores-leitura (X) devem ser atribudos postos
de 1 a 20 antes da aplicao da frmula de Spearman.
Soluo da Situao de Pesquisa 8
(Razo t ou Teste de Friedman)
A situao de pesquisa 8 corresponde a uma comparao do tipo "antes e depois",
Soluo da Situao de Pesquisa 5 onde a mesma amostra foi mensurada duas vezes, porm em momentos diferentes.
(Qui-quadrado) A razo t (Captulo 8) pode ser empregada na comparao de duas mdias resultantes
A situao de pesquisa 5 consiste em uma comparao entre as freqncias ("devolu- da mesma amostra, desde que o modelo experimental admita mensuraes em mo-
co" versus "no-devoluo") observadas em quatro grupos regionalmente divididos mentos distintos e que os dados resultantes dessas mensuraes sejam, no mnimo, de
(nordeste, sul, centro-oeste e oeste). A prova de significncia chamada qui-quadrado nvel intervalar. O teste de Friedman (Captulo 10) uma alternativa no-paramtrica
(Captulo 10) usada em comparaes entre freqncias oriundas de duas ou mais (dupla anlise de varincia) que se ajusta bem a modelos experimentais do tipo "antes
amostras. Para o teste de qui-quadrado no se requer mais do que nvel nominal de e depois", e pode ser usado sempre que haja razes para suspeitar de distribuio no-
mensurao. Os dados deste problema podem ser dispostos numa tabela 2 X 4, isto , -normal dos escores na populao, ou quando o nvel de mensurao dos dados no
numa tabela de 2 linhas e 4 colunas. Observe-se que o grau de associao entre "taxa tenha alcanado o intervalar.
de devoluo" (X) e "regio" (Y) pode ser expresso pelo chamado coeficiente C de
contingncia ou pelo V de Cramer (Captulo 11). Soluo da Situao de Pesquisa 9
(Gama de Goodman e Kruskal)
Soluo da Situao de Pesquisa 6 A situao de pesquisa 9 um problema de correlao que implica o clculo do grau
(Coeficiente "fi") de associao entre X (status ocupacional) e Y (classe scio-econmica subjetiva).
A situao de pesquisa 6 um problema de correlao, onde o grau de associao entre O coeficiente gama (Captulo 11) ajusta-se particularmente bem ao problema de de-
X (autoritarismo) e Y (preconceito) deve ser buscado. O coeficiente "fi" (Captulo 11) tectar a correlao linear entre duas variveis sujeitas atribuio de postos com a
6 uma medida de associao passvel de ser empregada quando as freqncias (ou os ocorrncia de grande nmero de empates. Na situao presente, tanto o "status ocupa-
dados de nvel nominal) podem ser dispostos numa tabela do tipo 2 X 2 (2 linhas cional" quanto a "classe scio-econmica subjetiva" foram ordenados segundo o critrio
e 2 colunas).
Neste problema, tal tabela assumiria a seguinte forma: Status Ocupacional (X)
Classe Scio-Econmica
Subjetiva Alto Mdio Baixo
Pavel de Autoritarismo (Y)
Nvel de
Preconceito A utoritrio Alta 5.6 42 15
Nifo-autoritrio
Mdia 122 163 202
Preconceituoso Baixa 12 16 49
350 120
Tolerante 150 325 N = 950 190 221 266
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
260 TOMADA DE DECISES

"alto", "mdio" e "baixo", gerando-se, assim, muitos postos empatados (por exemplo, UNIVERS1DADE. FLT:EVI. Z.30
221 respondentes apresentaram ocupaes de "status mdio"). Para que se possa calcular Eif EL1OTECA CLi.fl7J.!Z AL.

o coeficiente gama, os dados devem ser dispostos numa tabela freqencial, de dupla
entrada, como exemplificado no fmal da pgina anterior.
0 coeficiente de contingncia (C) e o V de Cram& constituem alternativas para
o coeficiente gama, que pressupe s dados de nvel nominal.

Soluo da Situao de Pesquisa 10


(Anlise de Varkincia ou Prova de Kruskal-Wallis)
A situao de pesquisa 10 consiste em uma comparao entfe os escores de trs amostras
independentes de respondentes. A razo F (Captulo 9) pode ser usada quando se trata
de comparar trs ou mais mdias aritmticas independentes, desde que os dados tenham
sido colhidos no nvel intervalar (no mnimo). A anlise de variancia de Kruskal-Wallis
(Captulo 10) uma alternativa no-paramtrica que pode ser empregada sempre que
suspeitarmos de que (a) os escores no estejam normalmente distribudos na populao
da qual provieram; (b) o nvel intervalar de mensurao no tenha sido alcanado.

Soluo da Situao de Pesquisa 11


(Razo t ou Prova de Mediana)
A situao de pesquisa 11 requer uma comparao entre os escores de duas amostras
independentes de sujeitos. A razo t (Captulo 8) usada na comparao de duas
mdias (aritmticas) quando os dados foram colhidos no nvel intervalar. A prova da
mediana (Captulo 10) uma altemativa no-paramtrica que pode ser aplicada quando
APNDICES
no tivermos razes para admitir normalidade de distribuio dos escores (na populao)
ou quando o nvel intervalar de mensurao no tiver sido atingido.

Soluo da Situao de Pesquisa 12


(Qui-quadrado)
A situao de pesquisa 12 consiste numa comparao entre as freqncias ("disposio"
versus " m vontade") de dois grupos de estudantes (aqueles aos quais se disse que a
idade do professor era 65 anos versus os que achavam que ele tinha 25). 0 teste (de
significncia) de qui-quadrado (Captulo 10) permite comparar as freqncias resultan-
tes de duas ou mais amostras, sempre que os dados tenham sido colhidos no nvel
nominal ou, ento, resultem de contagem. Os dados dessa situao podem ser levados a
uma tabela 2 X 2, isto , de 2 linhas e 2 colunas. Assim:

Condio Experimental:
Foi Dito aos Alunos
Disposicdo para Que o Professor Tinha
Comparecer 65 Anos (f) 25 Anos (f)

Sim 22 38
No 43 27 N = 130

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Apndice A Multiplican do
Apendice A Reviso de Fundamentos de Matemdtica

63,41 2,6 0,0003 0,5


Multipficador X 0,05 X 1,4 X 0,03 X 0,5
Pro duto 3,1705 3,64 0,000009 0,25
Efimine sempre, antes de dividir, as casas decimais do divisor. Isso se
consegu
caminhando com a vrgula para a direita tantas casas quantas sejam necessrias
punt
tornar o divisor um nmero inteiro. Proceda de forma anloga com relao ao
dividon-
do, movendo a vrgula para a direita tantas casas quantas tenham sido
"saltadas" no
divisor (isto , se a vrgula caminhou duas casas no divisor, deve caminhar
Reviso de Fundamentos duas casas no dividendo). Com esse recurso fica automaticamente
tambm
determinado o num.
ro de casas decimais da resposta.* Exemplos:
de Matemtica Dividendo
Divisor
-> 2,44
0,02
= 122

Quociente
2,44*

0,02
- -
244

2
= 122

Os estudantes de Estatstica que necessitem de uma reviso de alguns tpicos funda-


mentais de lgebra e aritmtica podero encontrar, neste apndice, problemas com
nmeros decimais, nmeros negativos e razes quadradas. Discutiram-se outros proble-
0,88 0438
mas de Matemtica, no corpo do texto, medida que foram surgindo. Por exemplo, o = 2,2 8 8
= = 2,2**
Captulo 1 identifica, define e compara os tits nveis de mensurao; o Captulo 2 0,4 4
0,4
discute porcentagens, propores, razes e taxas; o Captulo 4 introduz a noo de
somatrio (E).
10,10
10
- 1,01

NMEROS DECIMAIS
Low
Ao somar ou subtrair nmeros decimais, tenha o cuidado de escrev-los uns debaixo
0.10
= laloo
dos outros, fazendo coincidir a posio das vrgulas. Por exemplo, para somar 3.210,76,
2,541 e 98,3 procede-se assim: Operaes aritmticas freqentemente produzem respostas com notao decimal;
por exemplo, 2,034; 24,7; 86,001 e assim por diante. A questo que se pe
agora tem
3.210,76 relao com o nmero de casas decimais que devemos adotar nas nossas respostas.
Uma
2,541 regra simples de seguir consiste em realizar todas as operaes com trs casas
decimals
98,3 adicionais e arredondar o resultado de forma que ele contenha duas casas mais do quo
3.311,601 as constantes dos dados originals.
Ilustrando: se os dados originarem-se de um conjunto de nmeros inteiros (por
Para subtrair 34,1 de 876,62, o procedimento anlogo: exemplo, 12, 9, 49 ou 15), realizamos as operaes com trs casas decimais (al
simos) e expressamos nossa resposta com duas decimais (isto , em centsimos).***
Por
876,62 exemplo:
-34,1
842,52
* N.T.: 0 nnmero de casas decimais da resposta vai ser determinado pelo
Ao multiplicar nmeros decimais, cuide para que sua resposta tenha tantas casas niunero de eusus de-
cimais do dividendo aps aplicao do procedimento.
decimais quantas correspondam soma das existentes no multiplicando e no multi-
** N.T.: Uma casa decimal na resposta porque 8,8 tem uma casa
plicador. Exemplo: depois da vrgula.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
*** N.T.: Essa regra "prtica" contraria a orientao dada
pelo prprio Autor, linhas atrs, sobre
264 APENDICES Apndice A Revisdo de Fundamentos de Matemdtica
8$
3,889 = 3,89 Os seguintes nmeros foram arredondados para o
centsimo mais prximo:
1,224 = 1,22
7,761 = 7,76 3,328 = 3,33
4,823 = 4,82
O arredondamento para determinada casa decimal faz-se geralmente do seguinte 3,065 = 3,07
modo: abandona-se o ultimo dgito se ele for menor que 5: 3,055 = 3,06

Menor que 5

NMEROS NEGATIVOS
26,234 = 26,23 Ao somar um conjunto de nmeros negativos, certifique-se
de que o sinal menos ( )
14,891 = 14,89 no foi esquecido no resultado. Exemplo:
1,012 = 1,01
-20 -3
Entretanto, se o dgito abandonado (o ultimo) for igual a ou maior que 5, adiciona-se -12 -9
uma unidade ao primeiro dgito que sobra (no sentido da direita para a esquerda: -6 -4
-38 -16
5 ou mais*
Para somar um conjunto de nmeros dotados de sina1* (alguns com
+ , outros
26,236 = 26,24 com -), agrupam-se primeiro todos os negativos e depois todos
os positivos; da decor-
14,899 = 14,90 rem dois resultados, um negativo (isto , uma soma negativa) e
um positivo (uma soma
1,015 = 1,02 positiva); subtrai-se, a resultado do outro, mantendo o sinal do miniero de
maior valor absoluto.** Exemplos:
Os seguintes nmeros foram arredondados para o inteiro mais prximo:

3,1 = 3
-6 +4 -6 +6
+4 +2 -1 -10
+2 +6 -3 -4
4,5 = 5
4,8 = 5
-1 -10
-3
Os seguintes nmeros foram arredondados para o dcimo mais prximo:
-4
3,11 = 3,1 Para subtrair um nmero negativo, d-lhe antes sinal +
(mais) e siga o procedi.
3,55 = 3,6 mento indicado para a adio. O resto recebe o sinal do nmero de
maior valor absolu.
4,45 = 4,5 to. Exemplos:
4,17 = 4,2
24 -6 recebe sinal + e , por isso, adicionado ao 24. Como o ntimero
divislio de nmeros aproximados. Trabalhar com nmeros aproximados obedece a regras rgidas e
4-6) de maior valor absoluto positivo , o resto (resultado)
tambm vai
no apenas prticas. Entretanto, sugere-se ao leitor uma regra deveras prtica: esquecer o procedi- 30 ser positivo (30).
mento acima!
* N.T.: Melhor seria adotar a seguinte regra: se for mais de 5, "forcar" o dgito anterior de uma
unidade; se for exatamente 5, manter o dgito anterior se ele for par e "forc-lo" de uma unidade * N.T.: Nmeros dotados de Sinal chamam-se nmeros relativos.
Ex.: -5; +8 ; --0,2 etc. Um nil-
se for impar. Exemplos:

1,015 1,02
mero relativo pode ser fracionrio como tambm irracional: -0,8;
-I- I
3 '
- N/3-- ; elC.

1,025 1,02 ** N.T.: Valor ahsoluto de um nmero relativo o prprio nmero


sinal. EntEo, o desprovido de
PDF compression, OCR, web optimization using a watermarked
1,035 1,04 evaluation
valor absoluto de -2
copyde of
e o valor absoluto CVISION PDFCompressor
+2 tambm 2 2.
266 APEND10ES Apendice A Reviso de Fundamentos de Matemtica 267

-6 -24 recebe sinal + e , por isso, subtrado. Como o nmero de Exemplos:


-(-24) maior valor absoluto positivo, o resto tambm vai ser positivo
18 (18). 0555 = 74,53 (4) dgitos 2 = (2) dgitos
V55,55 = 7,45 (2) dgitos 2 = (1) dgito
-24 -6 recebe sinal + e , por isso, subtrado. Como o nmero de
-(-6) maior valor absoluto negativo, o resto tambm vai ser negativo Se o nmero de dgitos da parte inteira for um nmero mpar, da resultando
-(18) (-18). um "quebrado" na diviso, adicione-se uma unidade a esse nmero e proceda-se coii .
forme indicao acima. Exemplos:
Obs.: Quando um nmero positivo, ele dispensa o sinal. Ento +2 = 2.
Ao multiplicar (ou dividir) dois nmeros relativos que tm o mesmo sinal, d V555,5 = 23,57 (3) dgitos 2 = 1,5 dgitos
sempre sinal + (mais) ao resultado. Exemplos:

-
Ento, 3 + 1 = 4 e 4 2 = (2) dgitos
V5,555 = 2,36 (1) dgito 2 = 0,5 dgito
+40 = +5 Ento, 1 + 1 = 2 e 2 2 = (1) dgito
(+8) X (+5) = +40
+8

(-8) X (-5) = +40 --40 = +5


-8
Pode-se achar a raiz quadrada de qualquer nmero menor que
o seguinte procedimento:
1. Arredondar o nmero para o centsimo mais prximo.
1 de acordo coin

No caso de os nmeros terem sinais contrrios, o resultado ser sempre negativo. -V0,328 = \A-21,Yj

Exemplos: N/0,823 = V0,82


+40 V0,0651 = /0,07
(-8) X (+5) = -40
-8
- -5 V0,035 = N/0,04

2. Localizar (Tabela A) a raiz quadrada do nmero resultante como se fosse um


CALCULO DE RAZES QUADRADAS MEDIANTE 0 USO DA TABELA A inteiro. Para tanto, basta ignorar a vrgula.
Com o auxlio da Tabela A (fim do livro), pode-se facilmente encontrar a raiz quadrada
) de qualquer nmero inteiro (n) de 1 a 1.000.
Nr3-j= 5,74
Para calcular a raiz quadrada aproximada de nmeros decimais, bem como de N,A2 = 9,06
nmeros maiores que 1.000, pode ser til comear com a coluna de quadrados (n2), Ta- Nr7 = 2,65
bela A. A raiz quadrada de qualquer nmero multipliada por si mesma deve reproduzir = 0,26
o nmero original.* Como resultado, n, na Tabela A, , de fato, a prpria raiz quadrada
de n2. 3. Deslocar a vrgula uma casa para a esquerda e arredondar.
Tendo em mente tirar o mximo de proveito da coluna n2 em clculos aproxima-
dos de razes quadradas, devemos determinar o nmero de dgitos que precedem a NAM = 0,57
vrgula na resposta. Uma regra prtica, neste caso, a seguinte: contar o nmero de dgi- = 0,91
tos que compem a parte inteira (do nmero cuja raiz quadrada vai ser extrada) e dividi-lo NCTO = 0,27
por 2; o resultado corresponde ao nmero de dgitos da parte inteira da resposta.
071,64 = 0,2

* N.T.: Isso s verdade se o nmero for quadrado perfeito. Caso contrrio, jamais se consegue
uma reproduco do nmero original. Exemplos:
a) N/F4-4- = 12. Ento (12) X (12) = 144
b) N7-2- = 1,4142 aprox. (Veja Tabela A). Ento (1,4142) X (1,4142) = 1,9999616
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
UN/VERSOADE FZt 40944
t...ENTI(AL
131BLIOTECA.
TABELA A (continuao)

Apndice B n2
1 1

36 1296 6.0000 .027778 .1667


TABELA A Quadrados, Rafzes Quadradas e Inversos dos Nmeros de 1 a 1.000* 37 1369 6.0828 .027027 .1644
38 1444 6.1644 .026316 .1622
39 1521 6.2450 .025641 .1601
1 1
40 1600 6.3246 .025000 .1581
nz Vn
Vn 41 1681 6.4031 .024390 .1562
42 1764 6.4807 .023810 .1543
43 1849 6.5574 .023256 .1525
1 1 1.0000 1.000000 1.0000 44 1936 6.6332 .022727 .1508
2 4 1.4142 .500000 .7071 45 2025 6.7082 .022222 .1491
3 9 1.7321 .333333 .5774
4 16 2.0000 .250000 .5000 46 2116 6.7823 .021739 .1474
5 25 2.2361 .200000 .4472 47 2209 6.8557 .021277 .1459
48 2304 6.9282 .020833 .1443
6 36 2.4495 .166667 .4082 49 2401 7.0000 .020408 .1429
7 49 2.6458 .142857 .3780 so 2500 7.0711 .020000 .1414
8 64 2.8284 .125000 .3536 51 2601 7.1414 .019608 .1400
9 81 3.0000 .111111 .3333 52 2704 7.2111 .019231 .1387
10 100 3.1623 .100000 .3162 53 2809 7.2801 .018868 .1374
11 121 3.3166 .090909 .3015
54 2916 7.3485 .018519 .1361
12
55 3025 7.4162 .018182 .1348
144 3.4641 .083333 .2887
13 169 3.6056 .076923 .2774 56 3136 7.4833 .017857 .1336
14 196 3.7417 .071429 .2673 57 3249 7.5498 .01:7544
15 225 3.8730 .066667 .2582 .1325
58 3364 7.6158 .017241 .1313
59 3481 7.6811 .016949 .1302
16 256 4.0000 .062500 .2500 60 3600 7.7460 .016667
17 289 4.1231 .058824 .2425 .1291
18 324 4.2426 .055556 .2357 61 3721 7.8102 .016393 .1280
19 361 4.3589 .052632 .2294 62 3844 7.8740 .016129 .1270
20 400 4.4721 .050000 .2236 63 3969 7.9373 .015873 .1260
64 4096 8.0000 .015625 .1250
21 441 4.5826 .047619 .2182 65 4225 8.0623 .015385 .1240
22 484 4.6904 .045455 .2132
23 529 4.7958 .043478 .2085 66 4356 8.1240 .015152 .1231
24 576 4.8990 .041667 .2041 67 4489 8.1854 .014925 .1222
r
25 625 5.0000 .040000 .2000 68 4624 8.2462 .014706 .1213
69 4761 8.3066 .014493 .1204
26
27
676
729
5.0990
5.1962
a .038462
.037037
.1961
.1925
70 4900 8.3666 .014286 .1195
28 71 5041 8.4261 .014085 .1187
784 5.2915 .035714 .1890
29 .1857 72 5184 8.4853 .013889 .1179
841 5.3852 .034483 73
30 900 5.4772 .033333 .1826 5329 8.5440 .013699 .1170
74 5476 8.6023 .013514 .1162
31 961 5.5678 .032258 .1796 75 5625 8.6603 .013333 .1155
32 1024 5.6569 .031250 .1768 76 5776 8.7178
33 1089 5.7446 .030303 .1741 .013158 .1147
77 5929 8.7750 .012987 .1140
34 1156 5.8310 .029412 .1715 78 6084 8.8318
35 1225 5.9161 .028571 .1690 .012821 .1132
79 6241 8.8882 .012658 .1125
so 6400 8.9443 .012500 .1118
81 6561 9.0000 .012346 .1111
82 6724 9.0554 .012195 .1104
* Tendo em mente preservar as tabelas da edio original, foram elas reproduzidas neste livro foto- 83 6889 9.1104 .012048 .1098
graficamente, o que implica os seguintes cuidados da parte do leitor: 84 7056 9.1652 .011905 .1091
a) em lugar de ponto leia-se virgula e ss 7225 9.2195 .011765 .1085
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
b) aos nmeros iniciados por ponto acrescente-se um zero.
270 APENDICES
UNIVERSIDADE
FEDiRAL
EIBLIOTECA tIO PARA
CENTR A L
TABELA A (continuao) 'LOLA A (continuao)

n2 1 1
nz
1

Vn
86 7396 9.2736 .011628 .1078 136 18496 11.6619 .0857
87 7569 9.3274 .011494 .1072 18769 11.7047 007299
.007353 .0854
131
88 7744 9.3808 .011364 .1066 19044 11.7473 . 007246 .0851
135
89 7921 9.4340 .011236 .1060 139 19321 11.7898 . 007194 .0848
90 8100 9.4868 .011111 .1054 146 19600 11.8322 .007143 .0845
91 8281 9.5394 .010989 .1048 19881 11.8743 .0842
141
92 8464 9.5917 .010870 .1043 20164 11.9164 '007092
007042 .0839
141
93 8649 9.6437 010753 .1037 20449 11.9583 . 006993 .0836
149
94 8836 9.6954 .010638 .1031 141 20736 12.0000 . 006944
.0833
95 9025 9.7468 .010526 21025 12.0416 .006897 .0830
.1026 145
96 9216 9.7980 .010417 .1021 146 21316 12.0830 .0828
97 9409 9.8489 010309 .1015 141 21609 12.1244 .006849
006803 .0825
98 9604 9.8995 .010204 .1010 14$ 21904 12.1655 . 006757 .0822
99 9801 9.9499 010101 .1005 149 22201 12.2066 .006711 .0819
100 10000 10.0000 .010000 .1000 22500 12.2474 .006667 .0816
150
101 10201 10.0499 009901 .0995 22801 12.2882 .0814
151
102 10404 10.0995 .009804 .0990 151 23104 12.3288 006579
.006623 .0811
103 10609 10.1489 .009709 .0985 23409 12.3693 .006536 .0808
153
104 10816 10.1980 009615 .0981 154 23716 12.4097 '006494 0806
105 11025 10.2470 .009524 .0976 155 24025 114499 :006452 .0803
106 11236 10.2956 .009434 .0971 24336 12.4900 .0801
156
107 11449 10.3441 .0967 24649 12.5300 .006410
006369 .0798
151
108 11664 10.3923 .009346
009259 .0962 158 24964 12.5698 ' 006329 .0796
109 11881 10.4403 . 009174 25281 12.6095
0958 159 . 006289 0793
110 12100 10.4881 .009091 :0953 25600 12.6491 .006250 .0791
160
111 12321 10.5357 0949 25921 12.6886 .0788
161
112 12544 10.5830 008929
.009009 :0945 26244 12.7279 006173
.006211 .0786
161
113 12769 10.6301 . 008850 .0941 26569 12.7671 ' 006135 0783
163
114 12996 10.6771 . 008772 26896 12.8062 ' 006098
0937 164 .0781
115 13225 10.7238 .008696 :0933 27225 12.8452 :006061 .0778
165
116 13456 10.7703 .0928 27556 12.8841 .0776
166
117 13689 10.8167 008547
.008621 .0925 27889 12.9228 .006024
005988 0774
161
118 13924 10.8628 .008475 .0921 28224 12.9615 ' 005952
.0772
168
119 14161 10.9087 .008403 .0917 28561 13.0000 .005917 0769
169
120 14400 10.9544 :008333 .0913 28900 13.0384 .005882 .0767
170
121 14641 11.0000 .0909 29241 13.0767 .0765
11.0454 171
122 14884 '008264
008197 .0905 29584 13.1149 005814
.005848 .0762
172
123 15129 11.0905 . 008130 0902 29929 13.1529 005780 .0760
173 .
124 15376 11.1355 . 008065
.0898 30276 13.1909 . 005747 .0758
174
125 15625 11.1803 .008000 .0894 30625 13.2288 :005714 .0756
175
126 15876 11.2250 0891 30976 13.2665 .0754
176
127 16129 11.2694 007874
.007937 .0887 31329 13.3041 005650
.005682 .0752
128 177
16384 11.3137 . 007813 .0884 31684 13.3417 . 005618
.0750
129 178
16641 11.3578 .007752 .0880 32041 13.3791 . 005587 .0747
130 179
16900 11.4018 .007692 .0877 32400 13.4164 .005556 .0745
180
131 17161 11.4455 .0874 32761 13.4536 .0743
132 181
17424 11.4891 007576
.007634 .0870 33124 13.4907 .005525
005495 .0741
133 182
17689 11.5326 . 007519 .0867 33489 13.5277 005464
. .0739
134 183
17956 11.5758 . 007463 .0864 184 33856 13.5647 005435
. .0737
135 18225 11.6190 :007407 .0861 34225 13.6015 :005405 .0735
185

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
274 APENDICES
Apndice B 275

TA BELA A (continuao)
TA BELA A (continuao)

1
1 1 n2 Vn
n2 Vn Vn

286 81796 16.9115 .003497 .0591 336 112896 18.3303 .002976 .0546
287 82369 16.9411 .003484 .0590 337 113569 18.3576 .002967 .0545
288 82944 16.9706 .003472 .0589 338 114244 18.3848 .002959 .0544
289 83521 17.0000 .003460 .0588 339 114921 18.4120 .002950 .0543
290 84100 17.0294 .003448 .0587 340 115600 18.4391 .002941 .0542

291 84681 17.0587 .003436 .0586 341 116281 18.4662 .002933 .0542
292 85264 17.0880 .003425 .0585 342 116964 18.4932 .002924 .0541
85849 17.1172 .003413 .0584 343 117649 18.5203 .002915 .0540
293
294 86436 17.1464 .003401 .0583 344 118336 18.5472 .002907 .0539
295 87025 17.1756 .003390 .0582 345 119025 18.5742 .002899 .0538

296 87616 17.2047 .003378 .0581 346 119716 18.6011 .002890 .0538
297 88209 17.2337 .003367 .0580 347 120409 18.6279 .002882 .0537
298 88804 17.2627 .003356 .0579 348 121104 18.6548 .002874 .0536
17.2916 .003344 .0578 349 121801 18.6815 .002865 .0535
299 89401
350
300 90000 17.3205 .003333 .0577 122500 18.7083 .002857 .0535
I

17.3494 .003322 .0576 351 123201 18.7350 .002849 .0534


301 90601 352
302 91204 17.3781 .003311 .0575 123904 18.7617 .002841 .0533
303 91809 174069 .003300 .0574 353 124609 18.7883 .002833 .0532
304 92416 17.4356 .003289 .0574 354 125316 18.8149 .002825 .0531
17.4642 .003279 .0573 355 126025 18.8414 .002817 .0531
305 93025
306 93636 17.4929 .003268 .0572 356 126736 18.8680 .002809 .0530
307 94249 17.5214 .003257 .0571 357 127449 18.8944 .002801 .0529
308 94864 17.5499 .003247 .0570 358 128164 18.9209 .002793 .0529
17.5784 .003236 .0569 359 128881 18.9473 .002786 .0528
309 95481
360 129600
310 96100 17.6068 .003226 .0568 18.9737 .002778 .0527

96721 17.6352 .003215 .0567 361 130321 19.0000 .002770 .0526


311
97344 17.6635 .003205 .0566 362 131044 19.0263 .002762 .0526
312 363 131769
313 97969 17.6918 .003195 .0565 19.0526 .002755 .0525
17.7200 .0564 364 132496 19.0788 .002747 .0524
314 98596 .003185
315 99225 17.7482 .003175 .0563 365 133225 19.1050 .002740 .0523

.0563 366 133956 19.1311 .002732 .0523


316 99856 17.7764 .003165 367
100489 17.8045 .003155 .0562 134689 19.1572 .002725 .0522
317 368 135424 19.1833
318 101124 17.8326 .003145 .0561 .002717 .0521
.0560 369 136161 19.2094 .002710 .0521
319 101761 17.8606 .003135 370
.003125 .0559 136900 19.2354 .002703 .0520
320 102400 17.8885
321
322
103041
103684
17.9165
17.9444
* .003115
.003106
.0558
.0557
371
372
137641
138384
19.2614
19.2873
.002695
.002688
.0519
.0518
.0556 373 139129 19.3132 .002681 .0518
323 104329 17.9722 .003096 374 139876 19.3391
324 104976 18.0000 .003086 .0556 .002674 .0517
.0555 375 140625 19.3649 .002667 .0516
325 105625 18.0278 .003077
.0554 376 141376 19.3907 .002660 .0516
326 106276 18.0555 .003067 377 142129 19.4165
327 106929 18.0831 .003058 .0553 .002653 .0515
.0552 378 142884 19.4422 .002646 .0514
328 107584 18.1108 .003049 379
18.1384 .0551 143641 19.4679 .002639 .0514
329 108241 .003040 380 144400 19.4936 .002632
330 108900 18.1659 .003030 .0550 .0513

.0550 381 145161 19.5192 .002625 .0512


331 109561 18.1934 .003021 382 145924 19.5448
110224 18.2209 .003012 .0549 .002618 .0512
332 383 146689 19.5704 .002611
333 110889 18.2483 .003003 .0548 .0511
.0547 384 147456 19.5959 .002604 .0510
334 111556 18.2757 .002994 385 148225 19.6214 .002597
335 112225 18.3030 .002985 .0546 .0510

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
276 APENDICES
Apendice li 217

TABELA A (continuao) TABELA A (continuao)

n2 1
11
Vn 1
Vn 1 1

n
386 148996 19.6469 436
387 .002591 .0509 190096 20.8806 .002294
149769 19.6723 .002584 437 190969 .0479
388 150544 .0508 20.9045 .002288 .0478
19.6977 .002577 .0508 438 191844 20.9284
389 151321 19.7231 439 .002283 .0478
390 .002571 .0507 192721 20.9523 .002278
152100 19.7484 .002564 440 193600 .0477
.0506 20.9762 .002273 .0477
391 152881 19.7737 441
392 .002558 .0506 194481 21.0000 .002268
153664 19.7990 .002551 442 195364 .0476
393 154449 .0505 21.0238 .002262 .0476
19.8242 .002545 .0504 443 196249 21.0476
394 155236 19.8494 444 .002257 .0475
395 .002538 .0504 197136 21.0713 .002252
156025 19.8746 .002532 445 198025 .0475
.0503 21.0950 .002247 .0474
396 156816 19.8997 446
397 .002525 .0503 198916 21.1187 .002242
157609 19.9249 .002519 447 199809 .0474
398 158404 .0502 21.1424 .002237 .0473
19.9499 .002513 .0501 448 200704 21.1660
399 159201 19.9750 449 .002232 .0472
400 .002506 .0501 201601 21.1896 .002227
160000 20.0000 .002500 450 202500 .0472
.0500 21.2132 .002222 .0471
401 160801 20.0250 451
402 .002494 .0499 203401 21.2368 .002217
161604 20.0499 .002488 452 204304 .0471
403 162409 .0499 21.2603 .002212 .0470
20.0749 .002481 .0498 453 205209 21.2838
404 163216 20.0998 454 .002208 .0470
405 .002475 .0498 206116 21.3073 .002203
164025 20.1246 .002469 455 207025 .0469
.0497 21.3307 .002198 .0469
406 164836 20.1494 456
407 .002463 .0496 207936 21.3542 .002193
165649 20.1742 .002457 457 208849 .0468
408 166464 .0496 21.3776 .022188 .0468
20.1990 .002451 .0495 458 209764 21.4009
409 167281 20.2237 459 .002183 .0467
410 .002445 .0494 210681 21.4243 .00179
168100 20.2485 .002439 460 211600 .0467
.0494 21.4476 .002174 .0466
411 168921 20.2731 461
412 .002433 .0493 212521 21.4709 .002169
169744 20.2978 .002427 462 213444 .0466
413 170569 .0493 21.4942 .002165
20.3224 .002421 .0492 463 214369 .0465
414 171396 21.5174 .002160 .0465
20.3470 .002415 .0491 464 215296 21.5407
415 172225 20.3715 465 .002155 .0464
.002410 .0491 216225 21.5639 .002151
416 .0464
173056 20.3961 .002404 466 217156
417 173889 .0490 21.5870 .002146 .0463
20.4206 .002398 .0490 467 218089 21.6102
418 174724 20.4450 468 .002141 .0463
419 .002392 .0489 219024 21.6333 .002137
175561 20.4695 .002387 469 219961 .0462
420 176400 .0489 21.6564 .002132
20.4939 .002381 .0488 470 220900 .0462
21.6795 .002128 .0461
421 177241 20.5183 471
422 .002375 .0487 221841 21.7025 .002123
178084 20.5426 .002370 472 222784 .0461
423 178929 .0487 21.7256 .002119 .0460
20.5670 .002364 .0486 473 223729 21.7486
424 179776 20.5913 474 .002114 .0460
425 .002358 .0486 224676 21.7715 .002110
180625 20.6155 .002353 475 225625 .0459
.0485 21.7945 .002105
426 .0459
181476 20.6398 .002347 476 226576
427 182329 .0485 21.8174 .002101 .0458
20.6640 .002342 .0484 477 227529 21.8403
428 183184 20.6882 478 .002096 .0458
429 .002336 .0483
1

228484 21.8632 .002092


184041 20.7123 .002331 ; 479 229441 .0457
430 184900 .0483 21.8861 .002088 .0457
20.7364 .002326 .0482 480 230400 21.9089 .002083 .0456
431 185761 20.7605 481
432 .002320 .0482 231361 21.9317 .002079
186624 20.7846 .002315 482 232324 .0456
433 187489 .0481 21.9545 .002075
20.8087 .002309 .0481 483 233289 .0455
434 188356 21.9773 .002070 .0455
20.8327 .002304 .0480 484 234256 22.0000
435 189225 20.8567 485 .002066 .0455
.002299 .0479 235225 22.0227 .002062 .0454

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
278 APENDICES
Apndice B 279
UNIVERSIDADE FEDiRAL
DO PARA
TABELA A (continuao)
TA BELA A (continuao)
BIRK) TEC A CEN 712 A E

1 1
n2 -V n 1
n n2
Arn-
1
n
Vn
486 236196 22.0454 .002058 .0454 536
487 237169 287296 23.1517 .001866 .0432
22.0681 .002053 .0453 537 288369
488 238144 22.0907 23.1733 .001862 .0432
.002049 .0453 538 289444 23.1948
489 239121 22.1133 .002045 .001859 .0431
.0452 539 290521 23.2164 .001855
490 240100 22.1359 .002041 .0452 540 .0431
291600 23.2379 .001852 .0430
491 241081 22.1585 .002037 .0451 541
492 292681 23.2594 .001848 .0430
242064 22.1811 .002033 .0451 542
493 243049 293764 23.2809 .001845 .0430
22.2036 .002028 .0450 543 294849
494 244036 22.2261 23.3024 .001842 .0429
.002024 .0450 544 295936 23.3238
495 245025 22.2486 .002020 .0449 .001838 .0429
545 297025 23.3452 .001835 .0428
496 246016 22.2711 .002016 .0448 546
497 247009 298116 23.3666 .001832 .0428
22.2935 .002012 .0449 547 299209
498 248004 22.3159 23.3880 .001828 . 0428
.002008 .0449 548 300304 23.4094
499 249001 22.3383 .002004 .001825 .0427
.0448 549 301401 23.4307
500 250000 22.3607 .002000 .0447 .001821 .0427
550 302500 23.4521 .001818 .0426
501 251001 22.3830 .001996 .0447 551 303601 23.4734 .001815
502 252004 22.4054 .001992 .0446 552 .0426
503 253009 304704 23.4947 .001812 .0426
22.4277 .001988 .0446 553 305809
504 254016 22.4499 23.5160 .001808 .0425
.001984 .0445 554 306916 23.5372
505 255025 22.4722 .001980 .0445 .001805 .0425
555 308025 23.5584 .001802 .0424
506 256036 22.4944 .001976 .0445 556
507 257049 309136 23.5797 .001799 .0424
22.5167 .001972 .0444 557 310249
508 258064 22.5389 23.6008 .001795 .0424
.001969 .0444 558 311364 23.6220
509 259081 22.5610 .001965 .0443 .001792. .0423
559 312481 23.6432 .001789
510 260100 22.5832 .001961 .0443 560 .0423
313600 23.6643 .001786 .0423
511 261121 22.6053 .001957 .0442 561
512 262144 314721 23.6854 .001783 .0422
22.6274 .001953 .0442 562 315844
513 263169 22.6495 .001949 23.7065 .001779 .0422
.0442 563 316969 23.7276
514 264196 22.6716 .001946 .0441 .001776 .0421
564 318096 23.7487 .001773
515 265225 22.6936 .001942 .0441 565 .0421
319225 23.7697 .001770 . 0421
516 266256 22.7156 .001938 .0440 566
517 267289 320356 23.7908 .001767 .0420
22.7376 .001934 .0440 567 321489
518 268324 22.7596 .001931 23.8118 .001764 .0420
.0439 568 322624 23.8328
519 269361 22.7816 .001927 .0439 .001761 .0420
569 323761 23.8537 .001757
520 270400 22.8035 .001923 .0439 .0419
570 324900 23.8747 .001754 .0419
521 24441 22.8254 .001919 .0438 571 326041
522 272484 22.8473 .001916 23.8956 .001751 .0418
.0438 572 327184 23.9165
523 273529 22.8692 .001912 .0437 .001748 .0418
573 328329 23.9374 .001745
524 274576 22.8910 .001908 .0437 574 .0418
525 275625 329476 23.9583 .001742 .0417
22.9129 .001905 .0436 575 330625 23.9792 .001739 .0417
526 276676 22.9347 .001901 .0436 576
527 277729 331776 24.0000 .001736 .0417
22.9565 .001898 .0436 577 332929
528 278784 22.9783 .001894 .0435 24.0208 .001733 .0416
578 334084 24.0416 .001730
529 279841 23.0000 .001890 .0435 579 .0416
530 280900 335241 24.0624 .001727 .0416
23.0217 .001887 .0434 580 336400 24.0832 .001724 .0415
531 281961 23.0434 .001883 .0434 581 337561 24.1039 .001721
532 283024 23.0651 .001880 .0434 582 .0415
533 284089 338724 24.1247 .001718 .0415
23.0868 .001876 .0433 583 339889
534 285156 23.1084 .001873 .0433 24.1454 .001715 .0414
535 584 341056 24.1661 .001712
286225 23.1301 .001869 .0432 585 .0414
342225 24.1868 .001709 .0413

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
280 APENDICES Apendice B 281

TABELA A (continuao)
TABELA A (continuao)
1 1
1 1
n2 Vn Vn
n

.001706 .0413 636 404496 25.2190 .001572 .0397


586 343396 24.2074 .001570 .0396
587 344569 24.2281 .001704 .0413 637 405769 25.2389
.001701 .0412 638 407044 25.2587 .001567 .0396
588 345744 24.2487
.001565 .0396
.001698 .0412 639 408321 25.2784
589 346921 24.2693
.001563 .0395
590 348100 24.2899 .001695 .0412 640 409600 25.2982

591 349281 .001692 .0411 641 410881 25.3180 .001560 .0395


24.3105 .001558 .0395
592 350464 24.3311 .001689 .0411 642 412164 25.3377
.001686 .0411 643 413449 25.3574 .001555 .0394
593 351649 24.3516
.001553 .0394
594 352836 24.3721 .001684 .0410 644 414736 25.3772
354025 24.3926 .001681 .0410 645 416025 25.3969 .001550 .0394
595
.001678 .0410 646 417316 25.4165 .001548 .0393
596 355216 24.4131
.001546 .0393
597 356409 24.4336 .001675 .0409 647 418609 25.4362
.001672 .0409 648 419904 25.4558 .001543 .0393
598 357604 24.4540
.001541 .0393
599 358801 24.4745 .001669 .0409 649 421201 25.4755
.001667 .0408 650 422500 25.4951 .001538 .0392
600 360000 24.4949
601 361201 24.5153 .001664 .0408 651 423801 25.5147 .001536 .0392
.001661 .0408 652 425104 25.5343 .001534 .0392
602 362404 24.5357 .001531 .0391
603 363609 24.5561 .001658 .0407 653 426409 25.5539
604 .001656 .0407 654 427716 25.5734 .001529 .0391
364816 24.5764 .001527 .0391
605 366025 24.5967 .001653 .0407 655 429025 25.5930

.001650 .0406 656 430336 25.6125 .001524 .0390


606 367236 24.6171
25.6320 .001522 .0390
607 368449 24.6374 .001647 .0406 657 431649
.001645 .0406 658 432964 25.6515 .001520 .0390
608 369664 24.6577 .001517
609 370881 24.6779 .001642 .0405 659 434281 25.6710 .0390
610 24.6982 .001639 .0405 660 435600 25.6905 .00.1515 .0389
372100
611 24.7184 .001637 .0405 661 436921 25.7099 .001513 .0389
373321
612 374544 24.7386 .001634 .0404 662 438244 25.7294 .001511 .0389
613 375769 .001631 .0404 663 439569 25.7488 .001508 .0388
24.7588 .001506 .0388
614 376996 24.7790 .001629 .0404 664 440896 25.7682
.001626 .0403 665 442225 25.7876 .001504 .0388
615 378225 24.7992
616 379456 24.8193 .001623 .0403 666 443556 25.8070 .001502 .0387
617 380689 .001621 .0403 667 444889 25.8263 .001499 .0387
24.8395 .001497 .0387
618 381924 24.8596 .001618 .0402 668 446224 25.8457
619 383161 24.8797 .001616 .0402 669 447561 25.8650 .001495 .0387
620 384400 24.8998 .001613 .0402 670 448900 25.8844 .001493 .0386

621 385641 24.9199 .001610 .0401 671 450241 25.9037 .001490 .0386
622 386884 24.9399 .001608 .0401 672 451584 25.9230 .001488 .0386
388129 24.9600 .001605 .0401 673 452929 25.9422 .001486 .0385
I1P 623 .001484 .0385
624 389376 24.9800 .001603 .0400 674 454276 25.9615
625 390625 25.0000 .001600 .0400 675 455625 25.9808 .001481 .0385

626 391876 25.0200 .001597 .0400 676 456976 26.0000 .001479 .0385
627 393129 25.0400 .001595 .0399 677 458329 26.0192 .001477 .0384
628 394384 25.0599 .001592 .0399 678 459684 26.0384 .001475 .0384
629 395641 25.0799 .001590 .0399 679 461041 26.0576 .001473 .0384
630 396900 25.0998 .001587 .0398 680 462400 26.0768 .001471 .0383

631 398161 25.1197 .001585 .0398 681 463761 26.0960 .001468 .0383
632 399424 25.1396 .001582 .0398 682 465124 26.1151 .001466 .0383
633 400689 25.1595 .001580 .0397 683 466489 26.1343 .001464 .0383
634 401956 25.1794 .001577 .0397 684 467856 26.1534 .001462 .0382
635 403225 25.1992 .001575 .0397 685 469225 26.1725 .001460 .0382

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
282 APENDICES
Apindice

TA BELA A (continuao) TA BELA A (continuao)

n2 1 1
Vn n2 Vn
1 1

Vn Vn
686 470596 26.1916
687 .001458 .0382 736 541696 27.1293 .001359 .0369
471969 26.2107 .001456
688 473344 .0382 737 543169 27.1477 .001357 .0368
26.2298 .001453 .0381 738 544644 27.1662
689 474721 26.2488 .001355 .0368
690 .001451 .0381 739 546121 27.1846 .001353 .0368
476100 26.2679 .001449 .0381 740 547600 27.2029 .001351 .0368
691 477481 26.2869
692 .001447 .0380 741 549081 27.2213 .001350 .0367
478864 26.3059 .001445
693 480249 .0380 742 550564 27.2397 .001348 .0367
26.3249 .001443 .0380 743 552049
694 481636 26.3439 27.2580 .001346 .0367
695 .001441 .0380 744 553536 27.2764 .001344 .0367
483025 26.3629 .001439 .0379 745 555025 27.2947 .001342 .0366
696 484416 26.3818
697 .001437 .0379 746 556516 27.3130 .001340 .0366
485809 26.4008 .001435
698 487204 .0379 747 558009 27.3313 .001339 .0366
26.4197 .001433 .0379 748 559504 27.3496
699 488601 26.4386 .001337 .0366
700 .001431 .0378 749 561001 27.3679 .001335 .0365
490000 26.4575 .001429 .0378 750 562500 27.3861 .001333 .0365
701 491401 26.4764
702 .001427 .0378 751 564001 27.4044 .001332 .0365
492804 26.4953 .001425
703 494209 .0377 752 565504 27.4226 .001330 .0365
26.5141 .001422 .0377 753 567009
704 495616 26.5330 27.4408 .001328 .0364
705 .001420 .0377 754 568516 27.4591 .001326 .0364
497025 26.5518 .001418 .0377 755 570025 27.4773 .001325 .0364
706 498436 26.5707
707 .001416 .0376 756 571536 27.4955 .001323 .0364
499849 26.5895 .001414
708 501264 .0376 757 573049 27.5136 .001321 .0363
26.6083 .001412 .0376 758 574564
709 502681 26.6271 27.5318 .001319 .0363
710 .001410 .0376 759 576081 27.5500 .001318 .0363
504100 26.6458 .001408 .0375 760 577600 27.5681 .001316 .0363
711 505521 26.6646
712 .001406 .0375 761 579121 27.5862 .001314 .0363
506944 26.6833 .001404
713 508369 .0375 762 580644 27.6043 .001312 .0362
26.7021 .001403 .0375 763 582169
714 509796 26.7208 27.6225 .001311 .0362
715 .001401 .0374 764 583696 27.6405 .001309 .0362
511225 26.7395 .001399 .0374 765 585225 27.6586 .001307 .0362
716 512656 26.7582
717 .001397 .0374 766 586756 27.6767 .001305 .0361
514089 26.7769 .001395
718 515524 .0373 767 588289 27.6948 .001304 .0361
26.7955 .001393 .0373 768 589824
719 516961 26.8142 27.7128 .001302 .0361
720 .001391 .0373 769 591361 27.7308 .001300 .0361
518400 26.8328 .001389 .0373 770 592900 27.7489 .001299 .0360
721 519841 26.8514
722 .001387 .0372 771 594441 27.7669 .001297 .0360
521284 26.8701 .001385
723 522729 .0372 772 595984 27.7849 .001295 .0360
26.8887 .001383 .0372 773 597529
724 524176 26.9072 27.8029 .001294 .0360
725 .001381 .0372 774 599076 27.8209 .001292 .0359
525625 26.9258 .001379 .0371 775 600625 27.8388 .001290 .0359
726 527076 26.9444
727 .001377 .0371 776 602176 27.8568 .001289 .0359
528529 26.9629 .001376
728 529984 .0371 777 603729 27.8747 .001287 .0359
26.9815 .001374 .0371 778 605284
729 531441 27.0000 27.8927 .001285 .0359
730 .001372 .0370 779 606841 27.9106 .001284 .0358
532900 27.0185 .001370 .0370 780 608400 27.9285 .001282 .0358
731 534361 27.0370
732 .001368 .0370 781 609961 27.9464 .001280 .0358
535824 27.0555 .001366
733 537289 .0370 782 611524 27.9643 .001279 .0358
27.0740 .001364 .0369 783 613089
734 538756 27.0924 27.9821 .001277 .0357
735 .001362 .0369 784 614656 28.0000 .001276 .0357
540225 27.1109 .001361 .0369 785 616225 28.0179 .001274 .0357

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
284 APENDICES Apendice B 288

TABELA A (continuao)
TABELA A (continuao)

1 1 1
n2 Vn n2
1

Vn Vn n

786 617796 28.0357 .001272 .0357 .001196 .0346


787 619369 28.0535 .001271 .0356 836 698896 28.9137
700569 28.9310 .001195 .0346
788 620944 28.0713 .001269 .0356 837 .0345
838 702244 28.9482 .001193
789 622521 28.0891 .001267 .0356 .001192 .0345
624100 28.1069 .001266 .0356 839 703921 28.9655
790 28.9828 .001190 .0345
840 705600
791 625681 28.1247 .001264 .0356 .001189 .0345
792 627264 28.1425 .001263 .0355 841 707281 29.0000
29.0172 .001188 .0345
793 628849 28.1603 .001261 .0355 842 708964
710649 29.0345 .001186 .0344
794 630436 28.1780 .001259 .0355 843 .0344
844 712336 29.0517 .001185
795 632025 28.1957 .001258 .0355 .001183 .0344
845 714025 29.0689
796 633616 28.2135 .001256 .0354 .001182 .0344
797 635209 28.2312 .001255 .0354 846 715716 29.0861
717409 29.1033 .001181 .0344
798 636804 28.2489 .001253 .0354 I
847 .0343
848 719104 29.1204 .001179
799 638401 28.2666 .001252 .0354 .001178 .0343
800 640000 28.2843 .001250 .0354 849 720801 29.1376
722500 29.1548 .001176 .0343
850
801 641601 28.3019 .001248 .0353 .001175 .0343
802 643204 28.3196 .001247 .0353 851 724201 29.1719
725904 29.1890 .001174 .0343
803 644809 28.3373 .001245 .0353 852 .0342
853 727609 29.2062 .001172
804 646416 28.3549 .001244 .0353 .001171 .0342
805 648025 28.3725 .001242 .0352 854 729316 29.2233
731025 29.2404 .001170 .0342
855
806 649636 28.3901 .001241 .0352 .001168 .0342
651249 28.4077 .001239 .0352 856 732736 29.2575
807 29.2746 .001167 .0342
808 652864 28.4253 .001238 .0352 857 734449
736164 29.2916 .1301166 .0341
809 654481 28.4429 .001236 .0352 858 .0341
859 737881 29.3087 .001164
810 656100 28.4605 .001235 .0351 .001163 .0341
860 739600 29.3258
811 657721 28.4781 .001233 .0351 .0341
861 741321 29.3428 .001161
812 659344 28.4956 .001232 .0351 .001160 .0341
813 660969 28.5132 .001230 .0351 862 743044 29.3598
744769 29.3769 .001159 .0340
814 662596 28.5307 .001229 .0351 863 .0340
864 746496 29.3939 .001157
815 664225 28.5482 .001227 .0350 .001156 .0340
865 748225 29.4109
816 665856 28.5657 .001225 .0350 .001155 .0340
817 667489 28.5832 .001224 .0350 866 749956 29.4279
751689 29.4,449 .001153 .0340
818 669124 28.6007 .001222 .0350 867 .0339
868 753424 29.4618 .001152
819 670761 28.6182 .001221 .0349 .001151 .0339
672400 28.6356 .001220 .0349 869 755161 29.4788
820 29.4958 .001149 .0339
870 756900
821 674041 28.6531 .001218 .0349 .001148 .0339
822 675684 28.6705 .001217 .0349 871 758641 29.5127
760384 29.5296 .001147 .0339
823 677329 28.6880 .001215 .0349 872 .0338
873 762129 29.5466 .001145
824 678976 28.7054 .001214 .0348 .001144 .0338
40 825 680625 28.7228 .001212 .0348 874 763876 29.5635
765625 29.5804 .001143 .0338
875
826 682276 28.7402 .001211 .0348 .001142 .0338
827 683929 28.7576 .001209 .0348 876 767376 29.5973
769129 29.6142 .001140 .0338
828 685584 28.7750 .001208 .0348 877 .0337
878 770884 29.6311 .001139
829 687241 28.7924 .001206 .0347 .0337
879 772641 29.6479 .001138
830 688900 28.8097 .001205 .0347 .001136 .0337
880 774400 29.6648
831 690561 28.8271 .001203 .0347 .001135 .0337
832 692224 28.8444 .001202 .0347 881 776161 29.6816
777924 29.6985 .001134 .0337
833 693889 28.8617 .001200 .0346 882 .0337
.001199 883 779689 29.7153 .001133
834 695556 28.8791 .0346 .001131 .0336
835 697225 28.8964 .001198 .0346 884 781456 29.7321
783225 29.7489 .001130 .0336
885

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Apndice B 187
286 APENDICES

iiiniVERSIDADE FEDNAL DO PARA


TA BELA A (continuao) TA BELA A (continuao) BIBLIOTEC A CENTR A I.

1 1

n2 Vn
1
n2 Vn
Vn

936 876096 30.5941 .001068 .0327


886 784996 29.7658 .001129 .0336 .0327
.001127 .0336 937 877969 30.6105 .001067
887 786769 29.7825 .001066 .0327
788544 29.7993 .001126 .0336 938 879844 30.6268
888 30.6431 .001065 .0326
889 790321 29.8161 .001125 .0335 939 881721
940 883600 30.6594 .001064 .0326
890 792100 29.8329 .001124 .0335
941 885481 30.6757 .001063 .0326
891 793881 29.8496 .001122 .0335 .0326
.001121 .0335 942 887364 30.6920 .001062
892 795664 29.8664 .001060 .0326
797449 29.8831 .001120 .0335 943 889249 30.7083
893 30.7246 .001059 .0325
894 799236 29.8998 .001119 .0334 944 891136
945 893025 30.7409 .001058 .0325
895 801025 29.9166 .001117 .0334
946 894916 30.7571 .001057 .0325
896 802816 29.9333 .001116 .0334 .0325
.001115 .0334 947 896809 30.7734 .001056
897 804609 29.9500 .001055 .0325
806404 29.9666 .001114 .0334 948 898704 30.7896
898 30.8058 .001054 .0325
899 808201 29.9833 .001112 .0334 949 900601
950 902500 30.8221 .001053 .0324
900 810000 30.0000 .001111 .0333
951 904401 30.8383 .001052 .0324
901 811801 30.0167 .001110 .0333
.001050 .0324
30.0333 .001109 .0333 952 906304 30.8545
902 813604 30.8707 .001049 .0324
903 815409 30.0500 .001107 .0333 953 908209
954 910116 30.8869 .001048 .0324
904 817216 30.0666 .001106 .0333 .0324
.001105 .0332 955 912025 30.9031 .001047
905 819025 30.0832
956 913936 30.9192 .001046 .0323
906 820836 30.0998 .001104 .0332 .0323
.001103 .0332 957 915849 30.9354 .001045
907 822649 30.1164 .001044 .0323
824464 30.1330 .001101 .0332 958 917764 30.9516
908 30.9677 .001043 .0323
909 826281 30.1496 .001100 .0332 959 919681
960 921600 30.9839 .001042 .0323
910 828100 30.1662 .001099 .0331
961 923521 31.0000 .001041 .0323
911 829921 30.1828 .001098 .0331 .0322
.001096 .0331 962 925444 31.0161 .001040
912 831744 30.1993 .001038 .0322
913 833569 30.2159 .001095 .0331 963 927369 31.0322
964 929296 31.0483 .001037 .0322
914 835396 30.2324 .001094 .0331
.001036 .0322
837225 30.2490 .001093 .0331 965 931225 31.0644
915
966 933156 31.0805 .001035 .0322
916 839056 30.2655 .001092 .0330 .0322
.001091 .0330 967 935089 31.0966 .001034
917 840889 30.2820 .001033 .0321
842724 30.2985 .001089 .0330 968 937024 31.1127
918 31.1288 .001032 .0321
919 844561 30.3150 .001088 .0330 969 938961
970 940900 31.1448 .001031 .0321
920 846400 30.3315 .001087 .0330
971 942841 31.1609 .001030 .0321
921 848241 30.3480 .001086 .0330 .001029 .0321
922 850084 30.3645 .001085 .0329 972 944784 31.1769
973 946729 31.1929 .001028 .0321
923 851929 30.3809 .001083 .0329 .0320
.001082 .0329 974 948676 31.2090 .001027
924 853776 30.3974 .001026 .0320
31.2250
0 925 855625 30.4138 .001081 .0329 975 950625
31.2410 .001025 .0320
926 857476 30.4302 .001080 .0329 976 952576
977 954529 31.2570 .001024 .0320
927 859329 30.4467 .001079 .0328 .0320
.0328 978 956484 31.2730 .001022
928 861184 30.4631 .001078 .001021 .0320
863041 30.4795 .001076 .0328 979 958441 31.2890
929 .001020 .0319
930 864900 30.4959 .001075 .0328 980 960400 31.3050
981 962361 31.3209 .001019 .0319
931 866761 30.5123 .001074 .0328 .001018 .0319
932 868624 30.5287 .001073 .0328 982 964324 31.3369
966289 31.3528 .001017 .0319
933 870489 30.5450 .001072 .0327 983
984 968256 31.3688 .001016 .0319
934 872356 30.5614 .001071 .0327 .0319
.001070 .0327 985 970225 31.3847 .001015
935 874225 30.5778

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
288 APENDICES Apendice B 289

TABELA A (continuao)
TABELA B Porcentagem da Area sob a Curva Normal Entre X e z.
1 1
n2 Vn .01 .02 .03 .04 .05 .06 .07 .08 .09
Vn
0,0 00.00 00.40 00.80 01.20 01.60 01.99 02.39 02.79 03.19 03.59
986 972196 31.4006 .001014 .0318 0, I 03.98 04.38 04.78 05.17 05.57 05.96 06.36 06.75 07.14 07.53
987 974169 31.4166 .001013 .0318 0.2 07.93 08.32 08.71 09.10 09.48 09.87 10.26 10.64 11.03 11.41
988 976144 31.4325 .001012 .0318 0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17
989 978121 31.4484 .001011 .0318 0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79
990 980100 31.4643 .001010 .0318
0.5 19.15 19.50 19.85 20.19 20.54 20.88 21.23 21.57 21.90 22.24
991 982081 31.4802 .001009 .0318 23.89 24.22 24.54 24.86 25.17 25.49
0.6 22.57 22.91 23.24 23.57
992 984064 31.4960 .001008 .0318
993 986049 31.5119 .001007 .0317
0.7 280 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23
31.06
28.52
31.33
0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78
994 988036 31.5278 .001006 .0317 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89
995 0.9 31.59 31.86
990025 31.5436 .001005 .0317
34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
996 992016 31.5595 .001004 .0317 1.0
36.43 36.65 36.86 37.08 37.29 37.49 37.70 37.90 38.10 38.30
997 994009 31.5753 .001003 .0317 1.1
40.15
998 996004 1.2 38.49 38.69 38.88 39.07 39.25 39.44 39.62 39.80 39.97
31.5911 .001002 .0317 41.77
999 998001 31.6070 1.3 40.32 40.49 40.66 40.82 40.99 41.15 41.31 41.47 41.62
.001001 .0316 43.06 43.19
1000 1000000 31.6228 .001000 1.4 41.92 42.07 42.22 42.36 42.51 42.65 42.79 42.92
.0316
1.5 43.32 43.45 43.57 43.70 43.83 43.94 44.06 44.18 44.29 44.41
1.6 44.52 44.63 44.74 44.84 44.95 45.05 45.15 45.25 45.35 45.45
1.7 45.54 45.64 45.73 45.82 45.91 45.99 46.08 46.16 46.25 46.33
1.8 46.41 46.49 46.56 46.64 46.71 46.78 46.86 46.93 46.99 47.06
1.9 47.13 47.19 47.26 47.32 47.38 47.44 47.50 47.56 47.61 47.67

2.0 47.72 47.78 47.83 47.88 47.93 47.98 48.03 48.08 48.12 48.17
2.1 48,21 48.26 48.30 48.34 48.38 48.42 48.46 48.50 48.54 48.57
2.2 48.61 48.64 48.68 48.71 48.75 48.78 48.81 48.84 48.87 48.90
2.3 48.93 48.96 48.98 49.01 49.04 49.06 49.09 49.11 49.13 49.16
2.4 49.18 49.20 49.22 49.25 49.27 49.29 49.31 49.32 49.34 49.36

2.5 49.38 49.40 49.41 49.43 49.45 49.46 49.48 49.49 49.51 49.52
2.6 49.53 49.55 49.56 49.57 49.59 49.60 49.61 49.62 49.63 49.64
2.7 49.65 49.66 49.67 49.68 49.69 49.70 49.71 49.72 49.73 49.74
2.8 49.74 49.75 49.76 49.77 49.77 49.78 49.79 49.79 49.80 49.8
2.9 49.81 49.82 49.82 49,83 49.84 49.84 49.85 49.85 49.86 49.86

3.0 49.87

4.0 49.997

FONTE: Karl Pearson, Tables for Statisticians and Biometricians, Cambridge Univer-
sity Press, London, pp. 98-111, com a permisso de Biometrika Trustees.

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
290 APEND10ES Apendice 11 291

TABELA D Valores de F aos Niveis de Significncia de 0,05 e 0,01.


TABELA C Valores de t aos Nveis de Significncia de 0,05 e 0,01.
(gi para o numerador) P = .05
gl .05 .01
gl 1 2 3 4 5 6 8 12
1 12.706 63.657
2 4.303 9.925
3 3.182 5.841 1 161.4 199.5 215.7 224.6 230.2 234.0 238.9 243.9
4 2.776 4.604 2 18.51 19.00 19.16 19.25 19.30 19.33 19.37 19.41
5 2.571 4.032 3 10.13 9.55 9.28 9.12 9.01 8.94 8.84 8.74
4 7.71 6.94 6.59 6.39 6.26 6.16 6.04 5.91
6 _2.447) 3.707 5 6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.68
7 2.365 3.499
8 2.306 3.355 6 5.99 5.14 4.76 4.53 4.39 4.28 4.15 4.00
9 2.262 3.250 7 5.59 4.74 4.35 4.12 3.97 3.87 3.73 3.57
10 2.228 3.169 8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28
9 5.12 4.26 3.86 3.63 3.48 3.37 3.23 3.07
11 2.201 3.106 10 4.96 4.10 3.71 3.48 3.33 3.22 3.07 2.91
12 2.179 3.055
13 2.160 3.012 11 4.84 3.98 3.59 3.36 3.20 3.09 2.95 2.79
14 2.145 2.977 12 4.75 3.88 3.49 3.26 3.11 3.00 2.85 2.69
15 2.131 2.947 13 4.67 3.80 3.41 3.18 3.02 2.92 2.77 2.60
14 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.53
16 2.120 2.921 15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48
17 2.110 2.898
18 2.101 2.878 16 4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.42
19 2.093 2.861 17 4.45 3.59 3.20 2.96 2.81 2.70 2.55 2.38
20 2.086 2.845 18 4.41 3.55 3.16 2.93 2.77 2.66 2.51 2.34
19 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31
21 2.080 20 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.28
22 2.074 2.819
23 2.069 2.807 21 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25
24 2.064 2.797 22 4.30 3.44 3.05 2.82 2.66 2.55. 2.40 2.23
25 2.060 2.787 23 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20
24 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.18
26 2.056 2.779 25 4.24 3.38 2.99 2.76 2.60 2.49 2.34 2.16
27 2.052 2.771
28 2.048 2.763 26 4.22 3.37 2.98 2.74 2.59 2.47 2.32 2.15
29 2.045 2.756 27 4.21 3.35 2.96 2.73 2.57 2.46 2.30 2.13
30 2.042 2.750 28 4.20 3.34 2.95 2.71 2.56 2.44 2.29 2.12
29 4.18 3.33 2.93 2.70 2.54 2.43 2.28 2.10
40 2.021 2.704 30 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09
60 2.000 2.660
120 1.980 2.617 40 4.08 3.23 2.84 2.61 2.45 2.34 2.18 2.00
1.960 2.576 60 4.00 3.15 2.76 2.52 2.37 2.25 2.10 1.92
120 3.92 3.07 2.68 2.45 2.29 2.17 2.02 1.83
3.84 2.99 2.60 2.37 2.21 2.09 1.94 1.75

FONTE: R. A. Fisher and F. Yates, Statistical Tables for Biological, Agricultural,


and Medical Research, 4th ed, Oliver & Boyd, Edinburgh, Table V, com a permisso
dos autores e do editor.

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
292 APE-NDICES
Apindice /9 I

TABELA D (continuao)
TABELA E Qui-quadrado. Valores Crticos aos Nveis de Significncia de 0,05 e 0,01

(glpara o numerador) P = .01


gl .05 .01
gl 1 2 3 4 5 6 8 12
1 3.841 6.635
4052 4999 5403 5625
2 5.991 9.210
1
5764 5859 5981 6106
2 98.49 99.01 99.17 99.25 3 7.815 11.345
99.30 99.33 99.36 99.42 4 9.488 13.277
3 34.12 30.81 29.46 28.71 28.24 27.91 27.49
4 21.20 27.05 5 11.070 15.086
18.00 16.69 15.98 15.52 15.21 14.80 14.37
5 16.26 13.27 12.06 11.39 10.97 10.67 10.27 9.89 6 12.592 16.812
6 13.74 10.92 9.78 9.15 7 14.067 18.475
8.75 8.47 8.10 7.72
7 12.25 9.55 8.45 7.85 8 15.507 20.090
7.46 7.19 6.84 6.47
8 11.26 8.65 7.59 7.01
9 16.919 21.666
6.63 6.37 6.03 5.67
9 10.56 8.02 6.99 6.42 10 18.307 23.209
6.06 5.80 5.47 5.11
10 10.04 7.56 6.55 5.99 5.64 5.39 5.06 4.71 11 19.675 24.725
11 9.65 7.20 6.22 12 21.026 26.217
5.67 5.32 5.07 4.74 4.40
12 9.33 6.93 5.95 5.41
13 22.362 27.688
5.06 4.82 4.50 4.16 14 23.685 29.141
13 9.07 6.70 5.74 5.20 4.86 4.62 4.30
14 8.86 3.96 15 24.996 30.578
6.51 5.56 5.03 4.69 4.46 4.14 3.80
15 8.68 6.36 5.42 4.89 4.56 4.32 4.00 3.67 16 26.296 32.000
16 8.53 6.23 5.29 4.77 4.44
17 27.587 33.409
4.20 3.89 3.55 18 28.869 34.805
17 8.40 6.11 5.18 4.67 4.34 4.10 3.79 3.45 19 30.144 36.191
18 8.28 6.01 5.09 4.58 4.25 4.01 3.71 3.37 20 31.410 37.566
19 8.18 5.93 5.01 4.50 4.17 3.94 3.63
20 3.30
5.85 4.94 4.43 4.10 3.87 3.56 3.23 kt 21 32.671 38.932
21 8.02 5.78 4.87 22 33.924 40.289
4.37 4.04 3.81 3.51 3.17
22 7.94 5.72 4.82 4.31 3.99
23 35.172 41.638
3.76 3.45 3.12 24 42.980
23 7.88 5.66 4.76 4.26 3.94 36.415
3.71 3.41 3.07
24 7.82 5.61 4.72 4.22 3.90
25 37.652 44.314
3.67 3.36 3.03
25 7.77 5.57 4.68 4.18 3.86 3.63 3.32 2.99 26 38.885 45.642
26 7.72 5.53 4.64 4.14 27 40.113 46.963
3.82 3.59 3.29 2.96
27 7.68 5.49 4.60 4.11 28 41.337 48.278
3.78 3.56 3.26 2.93 29 49.588
28 7.64 5.45 4.57 4.07 42.557
3.75 3.53 3.23 2.90 30 43.773 50.892
29 7.60 5.42 4.54 4.04 3.73 3.50 3.20 2.87
30 7.56 5.39 4.51 4.02 3.70 3 47 3.17 2.84
40 7.31 5.18 4.31 3.83 3.51
FONTE: R. A. Fisher and F. Yates, Statistical Tables for Biological, Agricultural,
3.29 2.99 2.66
60 7.08 4.98 4.13 3.65 3.34 3.12 2.82 2.50
and Medical Research, 4th ed, Oliver & Boyd, Edinburgh, Table IV, com a permisso
120 6.85 4.79 3.95 3:48 dos autores e do editor.
3.17 2.96 2.66 2.34
Do 6.64 4.60 3.78 3.32 3.02 2.80 2.51 2.18

4o

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
294 APENDICES Apendice II )gi

TABELA F Valores de r aos Nfveis de Significfincia de 0,05 e 0,01.


TABELA H Nmeros Aleatrios.

gl .05 .01 Nmero de Colunas


Fileira 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
1 .99692 .999877
2 .95000 .990000 1 9 8 9 6 9 9 0 9 6 3 2 3 3 8 6 8 4 4 2
3 .8783 .95873 2 3 5 6 1 7 4 1 3 2 6 8 6 0 4 7 5 2 0 3
4 .8114 .91720 3 4 0 6 1 6 9 6 1 5 9 5 4 5 4 8 6 7 4 0
5 .7545 .8745 4 6 5 6 3 1 6 8 6 7 2 0 7 2 3 2 1 5 0 9
5 2 4 9 7 9 1 0 3 9 6 7 4 1 5 4 9 6 9 8
6 .7067 .8343 6 7 6 1 2 7 5 6 9 4 8 4 2 8 5 2 4 1 8 0
7 .6664 .7977 7 8 2 1 3 4 7 4 6 3 0 7 5 0 9 2 9 0 6 1
8 .6319 .7646 8 6 9 5 6 5 6 0 9 0 7 7 1 4 1 8 3 1 9 3
9 .6021 .7348 9 7 2 1 9 9 8 0 I 6 1 6 2 3 6 9 5 5 8 4
10 .5760 .7079 10 2 9 0 7 3 0 8 9 6 3 3 8 5 5 6 5 2 0 9
11 9 3 5 4 5 7 4 0 3 0 1 0 4 3 3 9 5 3 2
11 .5529 .6835 12 9 7 5 7 9 4 8 6 8 7 6 1 6 8 2 5 5 5 3
12 .5324 .6614 13 4 1 7 8 6 8 1 0 5 8 8 6 1 6 8 2 9 0 4
13 .5139 .6411 14 5 0 8 3 3 4 5 4 4 2 5 3 0 4 9 6 1 2 3
14 .4973 .6226 15 3 5 0 2 9 4 1 0 0 3 9 0 5 8 6 0 9 9 6
15 .4821 .6055 16 0 3 8 2 3 5 1 0 1 0 6 8 5 2 4 8 0 3 8
17 1 7 2 9 1 2 7 8 4 7 0 3 3 1 5 8 2 7 3
16 .4683 .5897 18 5 0 5 7 9 5 8 7 8 9 3 5 3 4 4 6 1 1 3
17 .4555 .5751 19 7 7 3 3 5 3 6 1 3 2 8 5 4 1 4 8 3 9 0
18 .4438 .5614 20 1 0 9 1 3 8 2 5 3 0 3 8 0 9 3 3 0 4 5
19 .4329 .5487 21 1 3 8 5 1 8 5 9 4 1 9 3 9 3 6 5 9 8 4
20 .4227 .5368 22 8 6 4 7 8 7 5 9 4 1 9 3 9 3 6 5 9 8 4
23 0 6 9 6 5 1 0 3 2 6 7 7 4 9 6 0 3 4 0
25 .3809 .4869 24 7 6 7 4 7 0 8 3 8 7 3 2 5 1 2 4 2 9 7
30 .3494 .4487 its 25 3 2 3 8 1 3 1 8 7 4 5 9 0 0 2 4 1 2 1

35 .3246 .4182 26 9 2 1 6 4 2 3 8 7 6 2 6 2 6 4 8 1 0 1

40 .3044 .3932 27 3 7 4 2 2 8 1 7 8 0 6 0 0 0 3 2 2 9 7
45 .2875 .3721 28 0 7 8 0 8 5 1 5 2 6 5 8 7 5 3 0 5 9 6
29 7 4 2 3 3 2 6 0 0 6 5 2 2 3 6 3 9 0 4
50 .2732 .3541 30 1 8 2 7 5 9 5 3 6 5 2 9 9 1 1 7 3 4 3
60 .2500 .3248 FONTE: E. A. Fisher and F. Yates, Statistical Tables 31 4 3 1 8 7 0 6 0 8 6 5 0 1 0 4 0 6 1 5
70 .2319 .3017 for Biological, Agricultural, and Medical Research, 4th 32 8 5 8 0 6 1 4 1 2 0 4 4 1 4 7 6 3 5 1

80 .2172 .2830 33 4 5 8 5 0 4 5 8 3 9 2 8 7 8 9 0 8 4 3
ed, Oliver & Boyd, Edinburgh, Table VI, com a permisso 0 0 4 7 6 4 0
90 .2050 .2673 34 5 0 2 5 4 9 2 2 1 1 5 8
dos autores e do editor. 35 0 8 1 7 0 6 3 3 4 7 6 2 6 8 9 3 4 1 4
36 2 5 9 3 4 6 0 7 5 2 0 0 9 6 0 8 2 2 5
37 2 1 3 1 3 7 8 9 8 4 9 3 8 0 2 2 1 8 1
38 3 8 8 6 8 5 1 3 3 4 6 7 2 6 3 4 8 6 7
TABELA G Valores de rs aos Nfveis de Significncia de 0,05 e 0,01. 39 0 9 9 8 5 9 8 4 4 2 2 1 1 0 1 7 6 1 3
40 2 2 3 5 3 9 7 4 4 2 1 4 0 5 8 2 3 0 8
.05 .01

5 1.000
6 .886 1.000
7 .786 .929
8 .738 .881
9 .683 .833
10 .648 .794
12 .591 .777
14 .544 .714
16 .506 .665 FONTE: E. G. Olds, The Annals of Mathematical Sta-
18 .475 .625
20 .450 591
tistics, "Distribution of the Sum of Squares of Rank
22 .428 .562 Differences for Small Numbers of Individuals," 1938,
24 .409 .537 vol. 9 e "The 5 Percent Significance Levels for Sums gp
26 .392 .515 of Squares of Rank Differences and a Correction,"
28 .377 .496
30 .364 .478 1949, vol. 20, coin a permissfo do Institute of Math-
ematical Statistics.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
296 APENDICES

TABELA H (continuao)
TABELA I Pontos Percentuais da Amplitude t.
NUmero de Colunas
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
35 36 37 38 39 40 Fileira
h = Nmero de Mdias
0 9 7 1 1 9 1 2 7 3 5 8 4 0 4 MSd
8
1 1 0 6 0 3 1
3 7 7 9 1 4 9 9 5 9 2 0 6 gl a 2 3
2
1 1 2 6 6 7 0 2 4 5 6 7 8 9 10 11
5 6 3 7 8 3 3 8 4 3 9 3 9 0 0 9 8 3 5 2
4 7 0 8 6 6 5 9 6 2 7 3
3 5 9 0 1 8 0 9 6 9 4 5 .05 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17
0 9 8 7 3 5 6 8 8 1 2 0 2 3 2 6 4 3 .01 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97
5 1 9 7 5 10.24 10.48
1 8 8 4 7 0 1 7 6 8 2 1 6 3 2 1 8 1 8 3 6 6 .05 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32
1 3 7 8 6 9 5 4 1 7 3 8 7 1 5 6 5 6 4 3 6 7
6.49 6.65
5 9 0 1 5 2 8 6 5 5
.01 5.24 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30
7 8 1 8 7 1 2 4 0 4 1 8
2 2 5 5 2 1 8 6 9 8 9 8 0 7 .05 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00
5 8 9 9 4 1 3 4 9 6.16 6.30
I 3 4 2 8 5 0 7 9 8 4 3 5 8 0 9 4 .01 4.95 5.92 6.54 7.01 7.37 7.68 7.94 8.17
2 6 8 6 6 4 7 6 6 0 5 10 8.37 8.55
1 5 1 6 4 6 7 6 0 8 7 3 5 2 11 8 .05 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77
8 6 0 1 4 2 9 8 6 8 0 7 6 5 9
5.92 6.05
9 5 7 0 9 8 7 6 9
1 1 3 7 0 3 12 .01 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68
0 6 5 4 0 3 6 5 6 3 5 0 7.86 8.03
2 2 3 4 7 8 0 2 0 8 0 3 4 9 2 13 9 .05 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59
5 7 7 8 6 4 14 5.74 5.87
2 4 6 1 0 5 0 6 1 4 9 4 7 3 9 .01 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49
1 7 6 4 5 8 15 7.65
6 3 4 8 1 6 9 5 6 2 0 4 6 6 8 10 .05 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46
1 1 9 9 1 1 16 5.60 5.72
9 0 5 1 3 6 9 5 4 1 2 5 4
1
2 9 5 6 2 4 0 17 .01 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21
3 6 7 0 3 5 3 7 4 1 7 4 8 7
7.36
4 3 6 6 3 6 3 0 0 9 4 2 2 5 1 8 4 8 5 7 2
5 3 18 11 .05 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49
9 5 1 9 7 19 5.61
1 0 6 9 0 2 7 3 9 8 4 0 6 9 .01 4.39 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13
8 2 3 2 8 0 4 20
9 1 3 5 7 9 6 2 4 3 4 6 4 9 12 .05 3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27
1 3 1 7 5 2 2 21 5.39 5.51
6 4 2 2 2 1 4 5 2 2 8 2 .01 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67
3 1 2 6 6 0 1 8 9 22 6.81 6.94
7 2 6 9 0 7 5 3 2 5 6 2 7 6 3
2
8 1 4 1 5 1 23 13 .05 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19
8 8 2 4 4 4 2 9 1 9 8 3 4 4 0 4 5.32 5.43
4 3 0 4 7 I 3 7 4 8 6 7 3 2 6 66 92 6 24 .01 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53
1
7 3 1 6.67 6.79
0 6 4 5 8
0 25 14 .05 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13
3 1 4 8 1 8 3 1 6 4 3 0 2 5.25 5.36
4 2 2 8 3 2 1 9 3 0 1 7 5 9 0 9 1 .01 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41
2 9 8 2 5 8 2 27 6.54 6.66
7 2 0 6 4 0 2 7 3 6 .05 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08
0 8 0 5 6 8 2 4 3 6 1 3 5 2 3 85 97 0 9 2 5 15
1 1
28 5.20 5.31
0 1 7 8 6 2 1 29 .01 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55
6 1 5 7 9 0 3 5 3 4 2 4 8
5 9
5 6 4 0 6 30 16 .05 3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03
1 8 5 2 4 5 1 7 5 3 2 4 6 7 9 9 6 7 2 5.15 5.26
0 3 6 31 .01 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22
6 3 7 8 6 9 7 2 8 9 0 7 2 9 4 0 8 6 6.35 6.46
5 0 0 0 2 0 8 9 0 1 32
0 6 2 0 4 6 9 6 5 4 9 33 17 .05 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21
1 9 4 4 2 6 4 2 4 1 0 2 7 9 6 8 7 5 6 9 3 .01 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15
0 0 5 3 8 3 2 7 5 0 4 7 6 4 6 3 0 34 6.27 6.38
6 2
4 7 5 3 35 18 .05 2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96
6 2 0 6 0 1 4 8 9 6 5 9 7 3 6 7 6 5.07 5.17
6 3 9 0 3 5 0 9 1 2 0 5 9 7 3 2 5 4 36 .01 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08
5 9 3 0 2 37 6.20 6.31
9 7 3 3 5 4 0 6 4 9 4 7 9 19 .05 2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92
1 4 3 9 7 7 1 8 38 5.04 5.14
1 9 6 2 9 4 2 9 7 0 3 8 9 5 7 0 .01 4.05 4.67 5.05 5.33 5.55 5.73 5.89 6.02
6 9 7 2 5 39 6.14 6.25
5 9 4 5 8 6 2 3 0 6 2 9 8 6 3 0 4 1 0 7 6 40 20 .05 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11
.01 4.02 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09
FONTE: N. M. Downie and R. W. Heath, Basic Statistical Methods, 6.19
3rd ed., Harper 24 .05 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81
& Row, New York, 1970. Reimpresso com a permisso 4.92 5.01
da Harper & Row. .01 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92 6.02
30 .05 2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92
.01 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85
40 .05 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82
.01 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69
60 .05 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73
.01 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45 5.53
120 .05 2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47 4.56 4.64
.01 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30 5.37
.05 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 4.55
.01 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23
FONTE: E. S. Pearson and H. O. Hartley,Biometrika Tables for Statisticians,
Vol. 1. 3rd ed., Cambridge Press, New York, 1966, com a
permisso dos
Biometrika Trustees.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Lista de Frmulas 299

Apndice C Posio da mediana = N +


2
1
43
X-
X =
45

x = X -X 46
fX-
LISTA DE FORMULAS X = 47
PAGINAS
N - Freqncia acumulada
53
P = f limite inferior / 2 correspondente ao
amplitude do
17 Mediana = real do intervalo + intervalo anterior ao
que contm a mediana X intervalo
me diano
mediano
freqncia absoluta
% = (loc) -f 18 do intervalo mediano

f, DM = 11x1
61
Razo
19
f2
x2
V N 64
Razo de sexo = (100)
f homens
f mulheres 19
= J1X2
N
- X2
66

Taxa de nascimento = (1.000) f nascimentos reais 20


f nascimentos potenciais N - 67

Taxa de mutao =
(100) tempo2f - tempo lf z
X -X
tempo 1 f 21 0- 90

X = -I- X
escore menor + escore maior 91
Ponto mdio = 25
2 Nmero de vezes que o
dado ou evento pode ocorrer
c% = (100) -N
fa Probabilidade - 92
27 Nmero total de dados
ou eventos

limite inferior X M
abaixcl
do limite escore - do intervalo 112

Posto percentil = nferior do + cr tico % no intervalo


crtico 0- -
intervalo
crtico
tamanho do
intervalo crtico
N - 1
113

28
Intervalo de confiana de 95% = X (1,96) 01
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
115 -
Lista de Frtnulas 301
300 APNDICES

Intervalo de confiana de 99% = I (2,58) cri. 117 r MS,


MSd
161

- VP(1 - P) 120
DI IS = I 79
Intervalo de confiana de 95% = P (1,96) ap 121 c,4444
(f. - fe)2 6,
4e4; 14e.
I 7/4
fe

z = (5-ci-Tc2)
- o 135
N(AD - BC)2
Crclif x2
(A + B)(C + D)(A + C)(B +'D) 194
07v22
= \ATV 139 O
Crclif

x2 =
(jf -f el - o,so)2 186
t = - Y2 140 fe
(rdif
NOD BC1 NI2)2 - - 197
JIN1s12+N2s22\( 1 1 \ 146 (A + B)(C + D)(A + C)(B + D)
Crdif Nol + N2 - 2 N2)
12
xp
2
Nk(k + 1) (IR)2
i - 3N (k + 1)
197
s =
IND2 (Y1 - .272)2 150
12 x-,1- R 021
SSd = 1X12 + 1X22 + 1X32 + IX42 159 N(N + n j 3(N + 1) 20

SS, = 1(X - Xtotal)2N 160


r - 21
SStotal = SSe SSd 161

r NIXY - (IX)(1Y)
SStotal = 1.(X 161 21
Xtotal)2 V[N1X2 - (IX)2][laY2 - (iY)2]
(IXtotal)
SStotat = IX2total 161
t - r VN - 2 21
IV total
N/ 1 - r2
SS, = [E (INX)2](IXNttoottaailr 162
222
\s x 1
SSd 163 6/D 2
= [ (Le) (1NX)2] I , = 1
N(N2 - 1) 22
SS,
MS, =
gl,
164 Ilkr, V. -V, .
23
'I Vc, + Vi
SSd
MSd Ifa -
-G N(1 164
81d - G2) z

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
302 APENDICES
CIIVIVERSIDADE

240
Apndice FEDinAL
81134177c4 DO
CAIPPAt PAN
C = )(2 242 Classificao de Classes Scio-Econmicas no Brasil
N + x2
Itens e pontuao levados ern conta na classificao scio-econmica dos indivduos no
X2 Brasil (veja Cap. 3):
N(k - 1) 243

Eletrodomesticos Pontos
Geladeira 1

Enceradeira 1

TV (Preto e branco) 1

TV (Cores) 3
Bate deira 3
Liqidificador 1

Mquina de lavar 3
Aspirador de pei 3

Empregadas
1 4
mais de 1 6

Automvel
1 de preo eqivalente ao do VW sedan

(do ano) 4
Mais de 1 automvel ou 1 de valor supe-
rior ao VW 1300 Sedan (do ano) 6

Escolaridade do Chefe da Casa


Primrio incompleto 0
1 grau Primrio completo 1

Ginasial incompleto 1

Ginasial completo 2
r Colegial incompleto 2
2 grau 1 Colegial completo
4 4
{Universitrio incompleto 4
3 grau Universitrio completo 8

Fazendo-se X = soma de pontos de um particular sujeito (S), vem:

seX>22 > S classe A;


se 8<X<21 > S E classe B;
se 4 <X<7 S E classe C;
seX<4 S E classe D.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Respostas aos Problemas Pares

Captulo 5 Captulo 9
2. (a) Classe A=5, Classe B =3, (b) Clas- 2. F =46,33, gl 2. , rejeitar a biptes

Respostas all
se A =1,67, Classe B =0,83, (c) Clas-
se A =1,89, Classe B =0,96
4. 2,70
nula a 0,05
4. F =4,23, gl =1. , rejeitar a hiptese n
a 0,05
12

6. 1,19 6. F = 8,16, gl = , rejeitar a hipteso


8. 1,40 20

aos
nula a 0,05
10. (a) 14, (b) 2,47, (c) 3,25
Captulo 10
2. xn2=a 8,29,,5g1 =1, rejeitar a hiptese
Captulo 6

Problernas Captulo 2
2. (a) 71%, (b) 74%, (c)P =0,71,
2. (a) +0,38, (b) -1,15, (c) -1,69, (d) +2,08,
(e) 0, (f) 0,77, (g) +2,69
4. (a) 5,37%, (b)P =0,05, (c) 7,14%,
(d) P=0,07, (e) P =0,43, (f) P =0,86,
4. X2 :051,50, gl =1, aceitar a hiptese nula

6. X2 =17,77, gl =4, rejeitar


nula a 0,05
a hiptese
(d) P =0,74
4. 156,25 (g) P =0,18 8. X2 = 2 , 2 4 , gl =2, aceitar a hiptese

Pares 6. 85,71 criancas nascem vivas para cada


1000 mulheres em idade compatvel
com gravidez Captulo 7
nula a 0,05
10. Mdn =6, X2 =19,57, g1 =1, rejeitar a
hiptese nula a 0,05
2. (a) 2,40 <---->.3,46, (b) 2,23 3,63 12. x2p =10,20, gl =2, rejeitar a hiptese
8. Intervalo de Classe 4. (a) 5,10 *---> 6,48, (b) 4,89 6,69 nula a 0,05
6. (a) 4,24 <---->5,76, (b) 3,99 4---> 6,01 14. H =10,64, gl =2, rejeitar a hiptese
10-12 11
8. (a) 0,04, (b) 0,24 0,40
7-9 16
nula a 0,05
4-6 9
1-3 4
Captulo 11
Captulo 8 2. r =13,64, gl =2, no significante
N =40
2. t =1,47, gl =6, aceitar a hiptese nula a 0 05
a 0,05 4. r =4-0,93, gl =3, significante a 0,05
a. 3
4. t =2,03, gl =16, aceitar a hiprtese nula 6. Y' =0,52X + 1,01; (a) Y' =3,61,
b. 9,5-12,5 a 0,05 (b) Y' =2,05, (c) Y' =5,69
6,5- 9,5 6. t =0,67 , gl = 8, aceitar a hiptese nula 8. rs N =5, no significante
3,5- 6,5 a 0,05 a 0,05
0,5-j 3,5 8. t =4,32, gl =10, rejeitar a hiptese nula 10. rs N =7 , significante a 0,05
c. 11 12. G =1-0,60, z = 0,82, no significante
a 0,05
8
10. t =3,12, gl =5, rejeitar a hiptese nula a 0,05
5
a 0,05 14. =0,37
2
12. t =6,0, gl 4, rejeitar a hiprtese nula 16. =0,17
d. fa a 0,05 18. (a) C =0,36, (b) V =0,39
40
29
13
4
e. c%
100
72,5
32,5
10,0
10. (a) 84,82, (b) 29,64

Captulo 4
2. (a) 17,00 e 153,00 (bimodal), (b) 85,00,
(c) 87,12
4. (a) 1, (b)(2_,5 (c) 3
6. (a) 3 e 6, (b) 4, (c) 4,1
8. (a) 6, (b) 4,5, (c) 4,17
10. (a) 12, (b) 7, (c) 7,86
12. (a) +1,0, (b) -0,5, (c) +3,3, (d) 0
14. (a).4, (44,-(c)-4,13
16. (a) 6, (b) 6, (c) 6,26
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
18. (a) 85,5, (b) 82,4 (c) 80,39
Referincin

Referncias Fried, Robert, Introduction to StatiStics, Oxford University, 1969.


Guilford, Jay P., Fundamental Statistics in Psychology and Educati
McGraw-Hill, New York, 1956.
Hagood, Margaret J., and Daniel O. Price, Statistics for Sociologists, Halt,
Rinehart and Winston, New York, 1952.
Hammond, Kenneth R., and James E. Householder, Introduction to the Sta.
tistical Method, Knopf, New York, 1963.
Huff, Darrell, How to Lie with Statistics, Wiley, New York, 1966.
Loether, Herman J., and Donald G. McTavish, Inferential Statistics for Soci.
ologists, Allyn and Bacon, Boston, 1974.
McNemar, Quinn, Psychological Statistics, Wiley, New York, 1962.
Meyers, Lawrence S., and Neal E. Grossen, Behavioral Research, Freeman,
San Francisco, 1974.
Mueller, John H., Karl F. Schuessler, and Herbert L. Costner, Statistical
Reasoning in Sociology, Houghton Mifflin, Boston, 1970.
Palumbo, Dennis J., Statistics in Political and Behavioral Science, Ap-
pleton, New York, 1969.
Popham, W. James, and Kenneth A. Sirotnik, Educational Statistics,
Anderson, Theodore R., and Morris Zelditch, Jr., A Basic Course in Sta- Harper & Row, New York, 1973.
tistics, Holt, Rinehart and Winston, New York, 1968. Runyon, Richard P., and Audrey Haber, Fundamentals of Behavioral Sta-
Blalock, Hubert M., Social Statistics, McGraw-Hill, New York, 1960. tistics, Addison-Wesley, Reading, Mass., 1971.
Campbell, Stephen K., Flaws and Fallacies in Statistical Thinking, Siegel, Sidney, Nonparametric Statistics for the Behavioral Sciences,
Prentice-Hall, Englewood Cliffs, N.J., 1974. McGraw-Hill, New York, 1956.
Champion, Dean J., Basic Statistics for Social Research, Chandler, San Spence, Janet T., Benton J. Underwood, Carl P. Duncan, and John W.
Francisco, 1970. Cotton, Elementary Statistics, Appleton, New York, 1968.
Chase, Clinton I., Elementary Statistical Procedures, McGraw-Hill, New Walker, Helen Mary, and Joseph Lev, Elementary Statistical Methods, Holt,
York, 1967. Rinehart and Winston, New York, 1958.
Cohen, Lillian, Statistical Methods for Social Scientists, Prentice-Hall, Eng- Wallis, Wilson A., and Harry Roberts, The Nature of Statistics, Free Press,
lewood Cliffs, N.J., 1954. New York, 1965.
Courts, Frederick A., Psychological Statistics, The Dorsey Press, Home- Welkowitz, Joan, Robert B. Ewen, and Jacob Cohen, Introductory Statistics
wood, Ill., 1966. for the Behavioral Sciences, Academic, New York, 1971.
Dixon, Wilfrid J., and Frank J. Massey, Introduction to Statistical Analysis, Williams, Frederick, Reasoning with Statistics, Holt, Rinehart and Win-
McGraw-Hill, New York, 1957. ston, New York, 1968.
Dornbusch, Sanford M., and Calvin F. Schmid, A Primer of Social Statis- Winer, B. J., Statistical Principles in Experimental Design, McGraw-Hill,
tics, McGraw-Hill, New York, 1955. New York, 1962.
Downey, Kenneth J., Elementary Social Statistics, Random House, New
York, 1975.
Downie, Norville M., and R. W. Heath, Basic Statistical Methods, Harper &
Row, New York, 1974.
Edwards, A. L., Experimental Design in Psychological Research, Holt, Rine- R10.4
hart and Winston, New York, 1960. Pe4R4t
Edwards, Allen L., Statistical Methods for the Behavioral Sciences, Holt,
Rinehart and Winston, New York, 1967. 00
Ferguson, George A., Statistical Analysis in Psychology and Education, 1:746a4
McGraw-Hill, New York, 1966.
Freeman, Linton C., Elementary Applied Statistics, Wiley, New York, 1965.
Freund, John E., Modern Elementary Statistics, Prentice-Hall, Englewood
Cliffs, N.J., 1960.
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
Indice

nuvem de pontos, 210

ndice Distribuio amostral de diferenas, 129-136


caractersticas, 129
teste de hipteses, 133
Dlstribuio amostral de mdias, 107-108
Hiptese,
alternativa, 128
experimental, 128-129
nula, 127-128
caractersticas, 108-109 probanda, 128
como curva normal, 110-111 teste de, 2
Distribuio cumulativa, 26-27 Histograma, 36-37
Distribuio de freqncias,
assimtricas, 40
cumulativas, 26-27
dados agrupados, 22-25 Intervalo de confiana,
dados nominais, 15 clculo, 115
dados ordinais e intervalares, 21-22 definio, 114
A Correlao, 208 forma, 40 noventa e cinco por cento, 115
coeficiente, 212 simtrica, 40 noventa e nove por cento, 117
Amostra, coeficiente de contingncia, 242-243 propores, 119
aleatria, 102 coeficiente fi, 240-241 Intervalo de classe, 22-23
casual, 102-106 coeficiente V de Cramr, 243 amplitude, 29
definio, 100 curvilnea, 210 Erro amostral, 106 definio, 22
no-casual, 101 de postos, 226 Erro padro da diferena, 138-140 limites, 22-25
randmica, 102 fora da, 208 Erro padro da mdia, 112-114 nmero de, 25
Amostras no-casuais, 101 r de Pearson, 212, 215 Erro padro da proporo, 120 pontos mdios, 25
Amplitude, sentido, 209 Erros alfa e beta, 138 tamanho, 22
clculo, 60 Cramr (V), 243 Escore padro. Ver escore Z
comparada com outras medidas de Curtose, Escore Z, 89-91
variabilidade, 71 turva normal, 81 clculos, 90-91
definio, 60 Area, 84-86 definio, 89 Kruskal-Wallis (teste de), 200-202
Anlise de varincia, 157-174 caractersticas, 82 relativo a diferenas entre mdias, 134-
comparao mltipla de mdias, 170-172 e o mundo real, 82-84 -135
estatistica F, 165 requisitos, 151
exigncias, 172 Estatstica, funes da, 6-13
F crtico, 166 Estatstica F, 165 Linha de rdgresso, 221
F observado, 166 exigncias, 172 Ito
equao, 222-223
lgica, 157-158 Decimais, 262-265 frmulas, 165
quadrado mdio, 163-165 Decis, 31 graus de liberdade, 166
razo F, 165 Desvios, 61 Estatsticas no-paramtricas, 175-176
soma dos quadrados, 158-159 afastamento, 61 Experimental (hiptese), 128-129
Aplicaes das estatsticas, 249-260 clculo, 46
A.s5_iinettilL40-41 definio, 46, 61
discrepncia, 46 Mdia,
clculo, 45-47
Desvio mdio, Fi (coeficiente), 240 comparada com outras medidas de
clculo, 61-63 tendncia central, 45-47
comparado com outras medidas de de dados agrupados numa distribuio
Bicaudal, 82 variabilidade, 71 de freqncias, 53-54
Binomial, de dados agrupados numa distribuio de dados isolados, 47
distribuio, 98 de freqncias, 72-75 Gama de Goodman e Kruskal, definio, 45
definio, 61 frmula, 232 Mediana,
.>: Desvio padro, postos empatados, 236 clculo, 43-44
clculo, 67-68 requisitos, 239 comparada com outras medidas de
comparado com outras medidas de significncia, 238-239 tendncia central, 47-52
variabilidade, 71 'Grfico de barras, 35-36 de dados agrupados numa distribuio
Coeficiente de contingncia, 242 de dados isolados, 67-68 construo do, 36 de freqncias, 52-53
Coeficiente de correlao de postos, 242 definio, 63-74 Grficos setoriais, 35 de dados isolados, 44-45
frmula, 226 frmula para dados brutos, 66-67 (Graus de liberdade, 143-144 definio, 43
postos empatados, 227 para dados agrupados numa distribui- qui-quadrado, 179 Mtodos de amostragem, 101
postos espelhados, 227 o de freqncias, 72-73 r de Pearson, 179 Moda,
procedimentos, 227 significado, 69-70 razo F, 165 comparada com outras medidas de
significncia, 229 Diagrama de disperso, 208 razo t, 151 tendncia central, 47-52
PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor
310 fildice

de dados vado o
lo na
de freqiincias, 5:
definio, 42 defio;
distribuies bimodal i3 Razo t, 14
amost iho, 140-142
amostr,. Aiferentes, 146-
-148
Nvel de confiana, 136-137 estatstica t, 143
Nvel de mensurao, 3-6 graus de liberdade, 143-144
intervalar, 6 mesma amostra mensurada duas vezes,
nominal, 4 148-151
ordinal, 5 requisitos, 151
Nvel de significncia, 136-138
Nvel intervalar de mensurao, 6
Nvel nominal de mensurao, 4
Nu la (hiptese), 127-128
Nmeros negativos, 265-266
Significncia (nvel). Ver nvel de confiana,
Soma de quadrados,
clculos, 161
Ordinal (nvel de mensurao), 5
definio, 158
dentro dos grupos, 160
entre 'grupos, 160
Paramtricos (te'sks), 175-176 ,* total, 161
Pearson (coefiCiente de correlao linear
frmula,-215-21,5
graus de'liberdade, 217 Taxa
requisitos, 218 clculo, 20
significncia, 216-218 definio, 20
Pesquisa, 2-4 Taxa de mudana,
Poder, 176 clculo, 21
Polgono de freqncia, 37-39 definio, 21
construo, 39 central, 42
Polgono de freqncias acumuladas, 38-39 comparao de medids, 47
ogiva de Galtpn, mdia, 45
Porcentagem, mediana, 43
clcialo48 _
moda, 42
Teste da mediana,#94-19,5
dfins Teste de Friedman (dupla anlise de varin-
PoZtc; percentiT,-27-31 cia) 197-200
Tukey (DHS de), 172-174
Quadrado mdie, 163-,165.
QuartiS/29-30 "
Uhicaudal, 97
Qui-quadrado, 176
clculo, 177-180 V
comparao de diversos grupos, 187-
-192 Variabilidade, 59
crtico, 179 amplitude, 60
de aderncia (prova de), 181 comparao de medidas, 71
de homogeneidade (prova de), 177 desvio mdio, 61-63
frmula para clculo, 184-185 desvio padro, 63-71
freqncias esperadas-, 180-181
freqncias esperadas pequenas, 185
freqncias teoricas, 180-181
graus de liberdade, 179 Yates (correo de), 185 N Cham. 310 I L665E
observado, 178 correo de continuidade, 186
requisitos, 192-193 Titulo ESTATISTICA APLICADA A CIENCIAS
teste de significncia, 176
Z (escala), 95

Razes quadradas, 266-267 11 I


Randmica (amostra), 102-103
aleatria (amostra), 102-103
casual (amostra), 102-103
- BC 871674 020892 UFPA

PDF compression, OCR, web optimization using a watermarked evaluation copy of CVISION PDFCompressor

Vous aimerez peut-être aussi