Vous êtes sur la page 1sur 26

sobre o\

-cend6 ~cesso livre' cbl,de CI


,,

Voc ainda U:saria ,o


URla'taxa? - - ~, .; "
"!"

_;-;

'

;_.

Captulo Um

o &?tarid" tia- &?ta!?tiu-

1-1 Viso Geral

O Problema do Captulo envolve pesquisas. Uma pesquisa uma das muitas ferramentas
A palavra estatstica derivada da
que podem ser usadas para a coleta de dados. Um objetivo comum de uma pesquisa colepalavra latina status (que significa
tar dados de uma pequena parte de um grupo maior, de modo a podermos aprender alguma
"estado"). Os primeiros usos da
coisa sobre o grupo maior. Este um objetivo comum e importante do objeto da estatstica:
estatstica envolviam compilao de
)!g[ender S.Qbre~mr~o~~ande atravs do exame de dados de alguns de seus membros.
dados e grficos que descreviam
Nesse contexto, os termos amostra e populalio tomam-se importantes. seguirso'd"d?is
definies formais desses e de outros termos bsicos.
vrios aspectos de um estado ou pas.
Em 1662, John Graunt publicou
informao estatstica acerca de
nascimentos e mortes. O trabalho de
Graunt foi seguido por estudos sobre
taxas de mortalidade e de doenas,
tamanhos de populaes, renda e.
taxas de desemprego. As farru1ias, os
governos e as empresas se apiam
fortemente nos dados estatsticos para
orientao. Por exemplo, taxas de
-elementos (escores, pessoas, medidas
"<~ , ~~'''~'" s~~tido de que inclui todos os sudesemprego, taxas de inflao, ndices
do consumidor e taxas de nascimento
e morte so cuidadosamente
~s ~ell}bros da populao.
compiladas de modo regular, e os
dados resultantes so usados pelos
dirigentes dos negcios para tomar
decises que afetam futuras
Por exemplo, a Pesquisa do Gallup perguntou o seguinte a 1087 adultos: "Voc tem oportucontrataes, nveis de produo e
nidade de fazer uso de bebidas alcolicas como as destiladas, o vinho ou a cerveja, ou voc
expanso para novos mercados.
totalmente abstmio?" Os 1087 sujeitos da pesquisa constituem uma amostra, enquanto a
populao consiste na coleo inteira de todos os 202.682.345 adultos americanos. A cada
1Oanos, o governo dos Estados Unidos tenta obter um censo de todos os cidados, mas fracassa, pois impossvel atingir todos. Uma controvrsia corrente envolve a tentativa de usar
mtodos' estatsticos confiveis para melhorar a preciso do Censo, mas consideraes de
ordem poltica so um fator-chave que leva os membros do Congresso a resistirem a essa
melhora. Til.lvez alguns leitores desse texto sero, um dia, membros do Congresso com a
abedoria para trazer o Censo para o sculo XXI.
Uma atividade importante deste livro demonstrar como podemos usar dados amostrais
para tirar concluses sobre populaes. Veremos que extremamente crtico obter dados
amostrais que sejam representativos da populao da qual se extraem os dados. Por exemplo, se voc pesquisa os alunos que se formaram na sua faculdade e lhes pede que escrevam
qual sua renda anual e a enviem pelo correio, as respostas provavelmente no sero representativas de todos os alunos. Aqueles com haixas rendas sero menos inclinados a responder, e aqueles que respondem podem ser inclinados a exagerar. medida que prosseguirmos neste captulo, enfatizaremos os seguintes 'conceitos-chave:

. ( Os dados amostrais devem ser coletados de modo apropriado, tal como atravs
)
de um processo de seleo aleatria.
Se os dados no forem coletados de modo apropriado, podem ser de tal maneira
inteis que nenhuma manipulao estatstica pode salv-los.
Alm de tudo mais, pedimos que voc inicie seu estudo de estatstica com uma cabea
aberta. Tem sido experincia do autor que os alunos muitas vezes se surpreendem com a
natureza interessante da estatstica e com o fato de que eles podem realmente dominar os
princpios bsicos sem muita dificuldade, mesmo no tendo sido bons alunos em outros
cursos de matemtica. Estamos certos de que, ao terminar este curso introdutrio, voc
estar convencido de que a estatstica um assunto interessante e rico, com aplicaes
extensas, reais e significativas. Estamos, tambm, certos de que, com assiduidade s aulas diligncia, voc ser bem-sucedido no domnio dos conceitos bsicos apresentados
neste curs0.

Introduo Estatstica

1-2 Tipos de Dados


Na Seo 1-1, definimos os termos populao e amostra. Os dois termos seguintes so usados para distinguir entre casos nos quais temos dados para uma populao inteira, e casos
nos quais temos dados apenas para uma amostra.

i
r
i

EXEMPLOS
1. Parmetro: Quando Lincoln foi eleito presidente pela primeira vez, ele recebeu
39,82% dos 1.865 .908 votos. Se encararmos a coleo de todos esses votos como a
populao a ser considerada, ento 39,82% um parmetro, no uma estatstica.
2. Estatstica: Com base em uma amstra de 877 executivos pesquisados, achou-se que
45 % deles no contratariam algum que cometesse um erro tipogrfico em sua solicitao de emprego. Esse nmero de 45% ~a~~que se baseia em uma
~~ulao ~teira de to~s execu3-vos.
~
.........._

Alguns conjuntos de dados consistem em nmeros (tais como alturas de 66 in e 72 in),


enquanto outros so no-numricos (tais como cor dos olhos: verde e marrom). Os termos dados
quantitativos e dados qualitativos so em geral usados para distinguir entre esses dois tipos.

Dados quali~tl~~~:(<i~f~~~go~~~~ ~ri~l


tes categori:a s qm!!Si-.=:.r.:.-,..
distin'guem"ffi.drfl~
._!,-:-::..-_..._._ l"....:f',U.;.._,,,~;;~;..;,,.:;"'.

EXEMPLOS
1

1. Dados Quantitativos: Os pesos de modelos.


2. Dados Qualitativos: Os sexos (masculino/feminino) de atletas profissionais.

Quando trabalhamos com dados qua~tiVOj..,_ i!!!lJortante usar as unida~s de medida

~~;)a~_!l~~lar:sJ ho._~es, metro~s~rte.5evnos ~


uiCado Ym observar refernci.cl como ''todas as quanfiadesSto~ilh~ i6lares" ou "todos os tempos esto em centsimos de segundo" ou "as-unidades so quilogramlls". Ignorar tais unidades de medida pode levar a concluses muito erradas. A NASA perdeu

seu Mars Climate Orbiter de $125 milhes de dlares quando ele bateu porque o programa
de controle tinha dados de acelerao em unidades inglesas, que foram interpretadas incorretamente como unidades mtricas.
Os dados quantitativos podem ainda ser descritos pela distino entre os tipos discreto e
contnuo.

Dados (numricosrcontilos'
alguma escala contr- que Cbrettiitiriterirruade-'ia1ore
./
~

"'"""-",:.~~.:-;--,;~~-

:~i

Captulo Um

EXEMPLOS

,MatiMd" a- Pe?d'kdinaa-

Como so coletados dados sobre algo


que no parece mensurvel, tal como
o nvel de desobedincia de pessoas?
O psiclogo Stanley Milgram
planejou o seguinte experimento: um
pesquisador instruiu um voluntrio
para operar um painel de controle que
dava "choques eltricos" em nvel
crescente de dor em uma terceira
pessoa. Na verdade, nenhum choque
era dado, e a terceira pessoa era um
ator. O voluntrio comeava com 15
volts e era instrudo a aumentar a
intensidade por incrementos de 15
volts. O nvel de desobedincia era o
ponto no qual o voluntrio se
recusava a aumentar a voltagem.
Surpreendentemente, dois teros dos
voluntrios obedeceram s ordens,
embora o ator gritasse e fingisse um
ataque cardaco.

; /

1. Dados Discretos: Os nmeros de ovos que as galinhas botam so dados discretos


porque representam contagens.
. Dados Contnuos: As quantidades de leite das vacas so dados contnuos porque so
medidas que podem assunr qualquer valor em um intervalo contnuo. Durante um
dado intervalo de tempo, uma vaca pode produzir uma quantidade de leite que pode
ser qualquer valor entre O e 5 gales. Seria possvel obter-se 2,343115 gales, porque
a vaca no restrita a quantidades discretas de O, 1, 2, 3, 4 ou 5 gales.

Outra maneira comum de classificar dados usar quatro nveis de mensurao: nominal,
ordinal, intervalar e razo. Na aplicao da estatstica a problemas reais, o nvel de mensurao dos dados um fator importante na determinao de qual procedimento usar. (Veja
Figura 14-1 mais adiante no Captulo 14.) Faremos algumas referncias a esses nveis de
mensurao neste livro, mas o ponto importante aqui se baseia no bom senso: no faa clculos e no use mtodos estatsticos com dados que no so apropriados. Por exemplo, no
faria sentido calcular uma mdia dos nmeros do seguro social, porque esses nmeros so
dados usados para identificao, e no representam medidas ou contagens de coisa alguma.
Pela mesma razo, no faria sentido calcular uma mdia dos nmeros das camisas dos jogadores pe basquete.

a_c~nzaf!'pi: didos que consistem em nomes,


-~~? podem ser ordenados (tal como do menor

EXEMPLOS Os exemplos seguintes ilustram dados amostrais no nvel nominal de


mensurao.

1. Sim/no/indeciso: Respostas de pesquisa de sim, no e indeciso


2. Cores: As cores de carros dirigidos por estudantes da faculdade (vermelho, preto, azul,
branco, e assim por diante)

)ft!11aMd"rara- a- natt-

de~

Os dados so, s vezes, coletados


uma maneira muito inteligente de
fontes pouco provveis. Um exemplo
envolve pesquisadores investigando
mudanas no clima. Eles descobriram
que a cada primavera desde 1917, a
pequena cidade de Nenana, Alasca,
fazia uma loteria em que as pessoas
apostavam a hora exata em que o rio
Tanana quebraria. (O ltimo prmio
foi de cerca de $300.000.) Sobre o rio
congelado foi colocado um trip
conectado a um relgio. O relgio
parava quando o trip fosse movido
pelo gelo que se quebrava. Os
pesquisadores foram capazes de obter
tempos de quebra para cada ano desde
1917, e os dados foram teis no
estudo das tendncias do clima.

Como os dados nominais no tm ordenao ou significado numrico, eles no devem


ser usados para clculos. Algumas vezes, usam-se nmeros associados s diferentes categorias (especialmente quando os dados so codificados para computador), mas esses nmeros
no tm qualquer significado computacional e qualquer mdia calculada com eles no tem
qualquer significado.
...._

1
1

EXEMPLOS Os exemplos a seguir so de dados amostrais no nvel ordinal de mensurao.


1. Notas em Cursos: Um professor de faculdade atribui notas A, B, C, D ou F. Essas
notas podem ser arranjadas em ordem, mas no podemos determinar as diferenas entre
elas. Por exemplo, sabemos que A maior do que B (assim, h uma ordem), mas no
podemos subtrair B de A (assim, a diferena no pode ser encontrada).
2. Postos: Com base em vrios critrios, uma revista classifica cidades de acordo com
suas "condies de habitao". Esses postos (primeiro, segundo, terceiro, e assim
por diante) determinam uma ordenao. No entanto, as diferenas entre os postos
no tm significado. Por exemplo, a diferena de "segundo menos primeiro" pode

Introduo Estatstica

sugerir 2 - 1 = 1, mas essa diferena de 1 no tem significado porque no uma


quantidade que possa ser comparada a outras tais diferenas. A diferena entre a
primeira e a segunda cidades no a mesma que a diferena entre a segunda e a
terceira cidades. Usando a classificao da revista, a diferena entre Nova York e
Boston no pode ser comparada quantitativamente com a diferena entre St. Louis
e Filadlfia.
Dados ordinais fornecem informaes sobre comparaes relativas, mas no as magnitudes das diferenas. Usualmente, os dados ordinais no devem ser usados para clculos,
tais como uma mdia, mas essa orientao , algumas vezes, violada (tal como quando usamos notas dadas por letras para calcular o conceito mdio da srie).
(\
j'-'

O nvelintervalar~de'me_osur~o1~ ____ 7 ,.,..,.. . ~~,


-,..-,!'J... ..
de que adif~renaentte qurusquer_~ois :valoii~:aeaaao:
dados nesse nvel no tm um p"nio
est presente).

"

~'

J.-.

_.; ...-,., . _~_,. .....

'l"~ tc._~

EXEMPLOS s exemplos seguintes ilustram o nvel intervalar de mensurao.


1. Temperaturas: As temperaturas do corpo de 98,2F e 98,6F so exemplos de dados
nesse nvel de mensurao. Os valores so ordenados, e podemos determinar sua diferena de 0,4F. No entanto, no h um ponto inicial natural. O valor de 0F pode
parecer um ponto inicial, mas arbitrrio e no significa ausncia total de calor. Como
0F no um ponto inicial zero natural, errado dizer que 50F duas vezes mais
quente do que 25F.
2. Anos: Os anos 1000, 2000, 1776 e 1492. (O tempo no comea no ano O, de modo
que o ano O arbitrrio e no um ponto inicial zero natural que represente "nenhum
tempo".)

de que h tambm um pon.t--iriie~al zr1ratur1


ti da de est presente). Para ,;'" 1;...$;c ,.,-I,c~<'~:n1',,,:;; if;t".i.!J.iin:S'~._;
ficativas.
.

EXEMPLOS Os exemplos a seguir so de dados no nvel de mensurao de razo. Note


a presena do valor zero natural, e note o uso de razes significativas como "duas vezes"
e "trs vezes".
1. Pesos: Os pesos (em quilates) de diamantes de anis (O representa nenhum peso, e 4
quilates duas vezes mais pesado do que 2 quilates).
2. Preos: Os preos de livros-texto ($0 representa nenhum custo, e um livro de $90 custa
trs vezes um livro de $30).
Esse nvel de mensurao chamado nvel de razo porque o ponto inicial zero tania as
razes significativas. Entre os quatro nveis de mensurao, a maior dificuldade surge na
distino entre os nveis intervalar e de razo.
,
Sugesto: Para simplificar a distino, use um "teste de razo" simples: considere duas
quantidades onde um nmero duas vezes maior do que o outro, e pergunte se "duas vezes"
pode ser usado para descrever corretamente as quantidades. Como um peso de 200 lb duas
vezes mais pesado do que um peso de 100 lb, mas 50F no duas vezes mais quente do que
25F, pesos esto no nvel de razo enquanto temperaturas Fahrenheit esto no nvel intervaiar. Para uma comparao concisa e reviso, estude a Tabela 1-1 para as diferenas entre
os quatro nveis de mensurao.

Captulo Um

1-2 Habilidades e Conceitos Bsicos


Nos Exerccios 1-4, determine se o valor dado uma estatstica ou um parmetro.

1. O Senado atual dos Estados Unidos compe-se de 87 homens e 13 mulheres.


2. Urna amostra de estudantes selecionada e a mdia do nmero de livros-texto comprados 4,2.
3. Urna amostra de estudantes selecionada e a mdia de tempo de espera na fila para comprar livrC\S-texto 0,65 h.

4. Em um estudo de todos os 2223 passageiros a bordo do Titanic, verificou-se que 706 sobreviveram quando ele afundou.

Nos Exerdcios 5-8, determine se os v~lores dados so de um conjunto de dados discreto ou contnuo.

5. O salrio de presidente de George Washington era de $25.000 por ano. e o valor atual do salrio
anual do presidente de $400.000.

6. Um .estudante de estatstica obtm dados amostrais e encontra que o peso mdio dos carros

na

amostra de 3126lb.

7. Em uma pesquisa com 1059 adultos, verificou-se que 39% deles tinham armas em suas casas
(com base em uma pesquisa do Gallup).

8. Quando 19.218 mscaras de gs do exrcito americano foram testadas, verificou-se que 10.322
delas eram defeituosas (com base em dados da revista Time).
Nos Exerccios 9-16, determine qual dos quatro nveis de mensurao (nominal, ordinal, intervalar,
razo) mais apropriado.

9. Alturas das jogadoras de basquete na WNBA


10. Classificao de

"encon~os

s cegas" corno fantstico, bom. mdio, fraco. inaceitvel

11. Temperaturas atuais nas salas de aula de sua faculdade


12. Nmeros nas camisetas das jogadoras de basquete na WNBA
13. Classificao da revista Consumer Repons em "melhor comprar, recomendado, no recomendado"

14. Nmeros do seguro social


15. O nillnero de respostas "sim" recebidas quando se perguntou a 1250 motoristas se alguma vez
tinham usado o telefone celular enquanto dirigiam

16. Cdigos postais (CEP)

Tabela 1-1 Nveis de Mensurao de Dados


Nvel

Resumo

Exemplo

Nominal

Apenas categorias. Os dados


no podem ser arranjados em

Estados dos estudantes:


5 californianos
20 texanos
40 nova-iorquinos
Carros dos estudantes:
5 compactos
20 de tamanho mdio
40 grandes
Temperaturas no campus:

um esquema de ordem
Ordinal

lntervalar

As categorias so ordenadas, mas

as diferenas no podem ser


encontradas ou no tm
significado.
As diferenas so significativas, mas
no existe ponto inicial natural e as
razes no tm sentido.

soF
20F
40F

Razo

H um ponto inicial zero natural e


as razes so significativas.

Distncias de traslado para


a escola:
5 milhas
20 milhas
40 milhas

Categorias ou nomes apenas


Uma ordem
estabelecida por
"compacto, tamanho
mdio, grande".

I
I
I
I

I
I

ooF no significa "nenhum

}
}

calor" . 40F no duas


vezes mais quente que 20F.

40 milhas duas vezes

mais distante do que


20 milhas.

I
I
I

Introduo Estatstica

Nos Exerccios 17-20, identifique (a) a amostra e (b) a populao. Determine, tambm, se provvel
que a amostra seja representativa da populao.

17. Um reprter da Newsweek se coloca em uma esquina e pergunta a 10 adultos se acham que o
atual presidente est fazendo um bom trabalho.
18. A Nielsen pesquisa 5000 familias selecionadas aleatoriamente e verifica que entre as televises
em uso 19% esto ligadas no programa 60 Minutes (com base em dados do USA Today).
19. Em uma pesquisa Ga!lup de 1059 adultos selecionados aleatoriamente, 39% responderam "sim"
quando lhes foi perguntado "Voc tem uma arma em sua casa?"
20. Uma estudante de graduao da Universidade de Newport realiza um projeto de pesquisa sobre
como os adultos americanos se comunicam. Ela comea com uma pesquisa pelo correio enviada
a 500 adultos que conhece. Ela pede a eles que devolvam por correio a resposta a esta pergunta:
"Voc prefere usar o correio eletrnico ou o correio usual?" Ela recebe de volta 65 respostas,
com 42 delas indicando preferncia pelo correio usual.

1-2 Alm do Bsico


21. Interpretao do Aumento da Temperatura Na tirinha de desenho "Bom Loser" de Art Sansom,
Brutus expressa satisfao com o aumento da temperatura de l para 2. Quando perguntam a ele
o que h de to bom com relao a 2, ele1'esponde " duas vezes mais quente do que essa manh". Explique por que Brutus est errado mais uma vez.
0

22. Interpretao da Pesquisa Poltica Um pesquisador entrevista 200 pessoas e lhes pergunta sobre
o partido poltico de sua preferncia. Ele codifica as respostas como O (para Democrata), l (para
Republicano), 2 (para Independente) ou 3 (para quaisquer outras respostas). Ele calcula, ento, a.
mdia dos nmeros e obtm 0,95. Como se pode interpretar esse valor?
23. Escala para Classificao de Comida Um grupo de estudantes desenvolve uma escala de classificao da qualidade da comida da lanchonete, com Orepresentando "neutra: nem boa nem ruim".
Do-se nmeros negativos para refeies niins e nmeros positivos para refeies boas, com o
valor absoluto dos nmeros correspondendo seriedade da m ou boa qualidade. A~ trs primeiras refeies tiveram classificaes 2, 4 e -5. Qual o nvel de mensurao para tal classificao? Justifique sua escolha.

1-3 Pensamento Crtico


O sucesso em um curso introdutrio de estatstica requer comumente, mais senso comum
do que habilidade matemtica (a despeito da advertncia de Voltaire de que "senso comum
no to comum"). Como agora temos acesso a calculadoras e computadores, as aplicaes
modernas da estatstica no mais exigem o domnio de algoritmos complexos de manipulaes matemticas. Em vez disso, podemos nos concentrar na interpretao dos dados e re~
sultados. Esta seo se destina a ilustrar como o senso comum usado quando pensamos
criticamente sobre dados e estatstica.
H cerca de um sculo, o famoso homem pblico Benjamin Disraeli disse: "H trs tipos
de mentiras: mentiras, mentiras hoqiveis e estatstica". Tambm j se disse que "n~~!_QS
no mentem, mas mentirosos manipuJllii1 nmeros", O historiador A.ndreyv Lang disse que
_algumas pessoas usam a estatstica "como os bbados usam os postes- para apoio mais do
que para iluminao". O cartunista poltico Don Wright nos encoraja a "trazer de volta o
mistrio da vida: minta a um pesquisador". O autor Franklin P. Jones escreveu que ~a .esta.
tstica pode ser usada para apoiar qualquer coisa- especialmente os estatsticos". No Esar' s
Comic Dictionary encontramos a definio de um estatsticq cgmo_:JJ.~ialista ,QJJe
colec_i9Q.a ~IJ.~e~os e dep~~s os_c:!e~vif!l.J" ~ssas afirmativas se referem a exemplos em que.
mtodos de estatstica foram mal usados, tornando-se, ao final, enganosos. H duas fontes
principais de tal engano: (1) m inteno da parte de pessoas desonestas e (2) erros no intencionais da parte de pessoas que no sabem nada melhor. Independentemente da fonte,
como cidados responsveis e como profissionais de mais valor, devemos ter uma habilidade bsica para distinguir entre concluses estatsticas que so provavelmente vlidas das
que so seriamente equivocadas.
.
Para no perder a perspectiva prpria desta seo, saiba que este no um livro sobre os
maus usos da estatstica. O restante deste livro estar repleto de usos muito significativos de
mtodos estatsticos vlidos. Aprenderemos mtodos gerais de uso dos dados amostrais para
fazer importantes inferncias sobre populaes. Aprenderemos sobre pesquisas e tamanhos
amostrais. Aprenderemos sobre importantes medidas de caractersticas-chave dos dados.

,~N -~1.
Perp-7~;4crt!!<lttar ~ ~

htuttd" htat?fitiJ"? / \

__l_\

Em Statistical Reasoning for 1/


Everyday Life, 2. edio, os autores
Jeff Bennett, William Briggs e Mario
Triola listam as oito seguintes
diretrizes para avaliao crtiaa de um
estudo estatstico. (1) Identifique o
objetivo do estudo, a populao
considerada e o tipo de estudo. (2)
Considere a fonte, particularmente em
relao possibilidade de
tenenciosidade. (3) Analise o
mtodo de amostragem. (4) Procure
problemas na definio ou
mensurao das variveis de
interesse. (5) Preste ateno ao
confundimento, que pode invalidar .
concluses. (6) Considere a colocao
e o fraseado de qualquer pesquisa. (7)
Certifique-se de que os grficos
representam os dados adequadar.J.ente,
e de que as concluses sejam
justificadas. (8) Considere se as
concluses atingem ou no os
objetivos do estudo, se fazem sentido
ou no, e se tm ou no significado
prtico.

Captulo Um
Juntamente com as discusses desses conceitos gerais, veremos muitas aplicaes reais especficas, tais como os efeitos do fumo passivo, a prevalnca do lcool e do fumo nos desenhos animados infantis, e a qualidade dos produtos do consumidor, incluindo balas M&M,
cereais, Coca e Pepsi. Mas, mesmo nessas aplicaes significativas e reais, devemos ser
cuidadosos ao interpretar os resultados de mtodos estatsticos vlidos.
Iniciamos nosso desenvolvimento do pensamento crtico pela considerao de ms amostras. Essas amostras so ruins no sentido de que o mtodo de amostragem as condena de tal
modo que elas provavelmente sero tendenciosas (no representativas da_J?opulao d_3>1ual
~~A seo seguinte di~s dethes sobre mefod<J('"de~sGagem,se
descreve a Importncia da aleatoriedade. O primeiro exemplo descreve um procedimento
amostrai que peca seriamente pela falta de aleatoriedade, que to importante. A definio
que segue se refere a um dos mais comuns e srios maus usos da estatstica.

Uma)~inostta.de:resposta v.hficlria(ou amostra auto-selecionada) aquela na qual


-~.;,~sp9na~n!s:'.i~tjd~Q~ 'lJs ll;tsnio's, se sero ou no includos.
J

~-

,__

@Como exemplos, volte ao Problema do Captulo. Quando a America Online ou qualquer


outra faz uma pesquisa pela Internet, os indivduos decidem, eles mesmos, se participam ou
no, de modo que constituem uma amostra de resposta voluntria. Mas as pessoas com opinies fortes tm mais tendncia a participar, de modo que as respostas no so representativas de toda a populao~~e~ com s de amostras de resposta voluntri~
que, por ~a prgria natureza, so seriamente de eituci"as, no sentido de...q~e._no devemos
. / tirar concluses sobre uma popUlao com base em um amostfao tendencisa: _./"'~

Pesquisas feitas pela Internet, nas quai s os sujeitos podem decidir se respondem ou
no
Pesquisas feitas pelo correio, nas quais os sujeitos podem decidir se enviam respostas
ou no
Pesquisas por telefone, nas quais anncios em jornais, rdio e televiso pedem que
voc disque um nmero dado para registrar sua opinio

f:X~MPLO@
,A r~rul??V ti?V terarr
P;;~t
Na corrida presidencial de 1936; a
revista Literary Digest reaJjzou uma
pesquisa e previu vitria de Alf
Landon, mas Franklin D. Roosevelt
teve uma vitria esmagadora. Maurice
Bryson aponta, "Dez rllilhes de
cdulas amostrais foram enviadas a
eleitores potenciais, mas apenas 2,3
milhes foram devolvidas. Como
todos devem saber, tais amostras so
praticamente sempre tendenciosas."
Ele afirmou, tambm, "Resposta
voluntria a questionrios enviados
pelo correio , talvez, o mtodo mais
comum de coleta de dados em
cincias sociais encontrado pelos
estatsticos, e talvez tambm o pior."
(Veja "The Litetary Digest Poli:
Making of a Statistical Myth", de
Bryson, em The American
Statistician, Vol. 30, No. 4.)

Com tais amostras de resposta voluntria, concluses vlidas podem ser tiradas apenas em
relo ao grupo que escolheu participar, mas prtica comum estender incorretamente as
concluses a uma populao maior. De um ponto de vista estatstico, tal amostra fundamentalmente tendenciosa e no deveria ser usada para se fazer afirmaes sobre uma populao maior.
.

*J

'

<~Pequenas Amostras Concluses no devem se basear em amostras muito pequenas. Como


,~r um .exemplo, o

Fundo para Defe~a.da Criana publicou Children Out of School in Ame rica
!i!'(Cnanas Fora da Escola na Arnenca) no qual se relatava que entre os alunos de escola se.i. cundria suspensos 67% tinham sido suspensos pelo menos trs vezes. Mas esta cifra se
l/ baseou em uma amostra da apenas trs estudantes! As reportagens da mdia deixaram de
mencionar que esse tamanho de amostra era pqr demais pequeno. (Veremos, nos Captulos
, 6 e 7, que podemos, algumas vezes, fazer algumas inferncias.valiosas a partir de pequenas
, amostras, mas devemos ter bastante cuidado em verificar se as exigncias necessrias so
I_satisfeitas.)
.l,
Algumas vezes, uma amostra pode par~:cer relativamente grande (tal como em uma pesquisa de "2000 adultos americanos selecionados aleatoriamente"), mas se as concluses so .
tiradas em relao a subgrupos, como os Republicanos de 21 anos de Pocatello, tais concluses podem ter se baseado em amostras muito pequenas. Embora seja importante termo
uma amostra suficientemente grande, do mesmo modo importante termos dados amostrais que tenham sido coletados de maneira apropriada, tal como em uma escolha aleatria.

Mesmo grandes amostras podem ser amostras ruins.

,
I

Grficos Grficos- como grficos de barras e grficos de setores - podem ser usados
para exagerar ou reduzir a verdadeira natureza dos dados. (No Captulo 2, discutiremos vrios
diferentes grficos.) Os dois grficos da Figura 1-1 retratam os mesmos dados do Bir de

Introduo Estatstica

-u:
i:~

$300

_'-!J

oc: "'

'
i.
i

o "'
"~ oo
(:'i

5c_"

$375

_'-!J

oc:

VI

~i

$200

<"

Ji~

il

Homens e Mulheres de 16-24 Anos

oc: "'
o
o c:

-u:
i:~

FIGURA 1-1 Salrios Semanais de

$400

$400
oc: "'
o
o c:

$350

V)-

..g ~

~~

$100

(:'i

$325

oQ_

$300

~-~

Homens

Mulheres

Hom ens

Mulheres
(b)

(a)

Estatsticas do Trabalho, mas a parte (b) feita de modo a exa rara e en~tre os salrios
semanais de homens e mulheres. Pelo fato de no iniciar o eixo vertic em zero, o grfico
da parte (b) tende a produzir uma impresso subjetiva enganosa, levando o leitor a acreditar
incorretamente que a diferena seja muito maior do que realmente . A Figura 1-1 traz a
seguinte lio: para interpretar corretamente um grfico, devemos analisar a informao
numrica dada no grfico, de modo a no nos deixarmos enganar por sua forma geral. (0
termo mediana, usado na Fig. 1-1, ser claramente descrito na Seo 2-4.)

Pictogramas Desenhos de objetos, chamados pictogramas, podem tambm ser enganosos. Alguns objetos comumente usados para representar dados incluem objetos tridimensionais, como sacos de dinheiro, pilhas de moedas, tanques de guerra (para despesas militares), barris (para produo de petrleo), e casas (para construo de casas).rQu~d.R dx_s<;am t~bjetos, os art~as pQ._de~ri~~ imm:esses que di~ dire~~s~"'Se
dobrimos ~ado de/um"'c[uai'do, a rea n--dob?; si~0smente, ela aumYntaporum
fator de quatro. Se dobramos cada lado de um cubo, o volume no dobra, simplesmente; ele
aumenta por um fator de oito, como mostra a Figura 1-2. Se os impostos dobram em uma
dcada, um artista pode retratar esse alimento atravs de uma sacola de dinheiro para o primeiro ano e uma segunda sacola de dinheiro duas vezes mais larga, duas vezes mais profunda e duas vezes mais alta. Em vez de parecer dobrar, os impostos parecero aumentar por
um fator de oito, de modo que a verdade ser distorcida pelo desenho.
FIGURA 1-2 Pictograma

Porcentagens P rcentage

s-no-claras~eng~sas

so.usadas s vezes. Se voc t


'-..J ."-.../
_/
, . '
''
'-<-"
~ ti a~v~ ~ tQ.g!an o-a to a. (Nao deve exigir 1l0% de esroro
entender o sentido da afirmao anterior.) Com relao a bagagens extraviadas, a Continental Airlines colocou anncios dizendo que essa era "uma rea na qual j melhoramos 100%
nos ltimos seis meses". Em um editorial criticando essa cifra, o New York Times interpretou corretamente a melhora de 100% com o sentido de que, agora, nenhuma bagagem
extraviada- um elogio no apreciado pela Continental Airlines.
Seguem alguns princpios-chave a serem usados quando trabalhamos com porcentagens.
Todos esses princpios usam a noo bsica de que% ou "por cento" realmente significa
"dividlchpor 100". O primeiro princpio ser usado constantemente neste livro.
~

Porcentagem de: Para achar alguma porcentagem de uma quantidade, despreze o smbolo de % e divida o valor da porcentagem por 100 e, ento, multiplique. Este exemplo mostra que 6% de 1200 so 72:

6
6% de 1200 respostas = X 1200 = 72
100
Frao ~ Porcentagem: Para converter uma frao em porcentagem, divida o numerador pelo denominador para obter um nmero decimal equivalente, multiplique
por 100 e acrescente o smbolo de %. Este exemplo mostra que 3/4 so equivalentes
a 75%:

3
4
=

0,75

0,75

100% = 75%

Dobre o comprimento, a largura e a altura de um cubo e o volume crescer por um


~c_slEU>~ como mostrado. Se o cubo
menor representa os impostos em um an
e o cubo maior representa a duplicao dos
impostos um tempo depois, os ltimos impostos parecero ser oito vezes a quantidade inicial, em vez de duas vezes.

10

Captulo Um

Decimal-+ Porcentagem: Para converter um decimal em poi'centagem, multipliq ue

/~Jtl'"'4.

por 100%. Este exemplo mostra que 0,234 equivalente a 23 .4%:

ESTATiSTICA

0,234

Nos Meios de
Comunica,o
-="~ ir~ ,

0,234 X 100%

= 23,4o/c:

Porcentagem --+ Decimal: Para converter uma porcentaget.'1 w r wn nmero deci. mal, despreze o smbolo% e divida por I 00. Este exemplo mostra que 8So/c so equi valentes a 0,85:

Estatstica e Minas Terrestres

'85
85 % = 100 = 0,85

A lntemational Campaign to Ban


Land Mines (Campanha Internacional
As quesQuestes Direcionadas H vrios problemas que afetam questes de
tes
de
pesquisas
podem
ser
"direcionadas"
ou
intencionalmente
fraseadas
para
provocar
para Banir as Minas Terrestres) e o
{ uma respo~ta desejada. Veja as taxas reais de respostas "sim" para os vrios fraseados de
diretor executivo da Vietnam
uma questao:
Veterans of America Foundation
(VV AF - Fundao dos Veteranos
97% sim: "O Presidente deve ter o poder de veto para ehminar desperdcios)' '
do Vietn da Amrica) foram
57% sim: "O Presidente deve ter o poder de veto, ou nc<'''
recentemente premiados com o
Em The Superpollsters, David W. Moore descreve um experimente no qual diferentes suPrmio Nobel da Paz. Quando a
jeitos
so inquiridos sobre se concordam ou no com as seguirtes a firmativa~ :
YY AF pediu ajuda na coleta de dados
sobre minas terrestres, formou-se um
Muito pouco dinheiro est sendo gasto com assistnci a .' ociai .
time de estatsticos notveis. Em vez
Muito pouco dinheiro est sendo gasto com assistncia aos pobres .
de trabalharem com dados
Mesmo sendo os pobres que recebem assistncia social, apenas 19% concordaram quando
inatingveis, como o valor da vida
a expresso "assistncia social" foi usada, mas 63% concordaram corr a ex pres~o "assishumana, eles trabalharam com dados
tncia
aos pobres".
brutos palpveis, tais como a rea que
uma mina terrestre toma intil e o
Ordem das Questes Algumas vezes, as questes de pesqui~as so irigidas no intenc icusto de plantaes que no podem
onalniente por fatores tais como a ordem dos itens em considerao . Veja os itens seguintes
ser fei tas. Os dados foram includos
de uma pesquisa realizada na Alemanha:
em After the Guns Fali Silent: The
Voc diria que o trfego contribui mais ou menos do que a indstria para a poluio
Enduring Legacy of Landmines, que
do ar?
se tornou um livro-chave de pesquisa
Voc diria que a indstria contribui mais ou menos do que o rrfego para a poluio
na discusso do problema das minas
do ar?
terrestres. O AMSTAT News citou um
dos editores do livro: "Foi esse
Quando trfego foi apresentado primeiro, 45 % acusaram o trfego e 27%. a indstria: quanesforo de coleta de dados e anlise
do indstria foi apresentada primeiro, 24% acusaram o trfego e 579L a indstria.
que tomou possvel colocar o
Recusas Quando se fazem perguntas de pesquisa s pessoas, aigum a, se recusam firproblema diante dos que fazem as
memente a responder. A taxa de recusa tem crescido nos ltimos .mos. ~m parte porque
polticas. Esse trabalho realmente fez
muitos vendedores persistentes tentam vender bens e serv:os ::o:neando com uma
diferena."
onversa de vendedor que soa como se fosse parte de uma pesquisa de opi nio . Em Lies,
Damn Lies and Statistics, o autor Michael Wheeler observa corretamente qu e 'as pes- soas que se recusam a falar com pesquisadores so, provavelmente. diferentes daquelas 1
que no se recusam. Algumas podem ter medo de estranhos c o utras podem que rer preservar sua privacidade, mas sua recusa em falar demon stra que sua v i~o do mundo em
torno marcadamente diferente daquela das pessoas que aceitam pesqu isadOes dentro
de suas casas".

pe.;quisa~.

Correlao e Causalidade No Captulo 9 deste livro, discutiremos .1 fb sociao estatstica entre duas variveis, tais como riqueza e QI. Usaremos o termo .;orrelao para indicar
que as duas variveis esto relacionadas. No entanto, no Captulo 9 chamamos a ateno
para o seguinte ponto importante: c~la.o no impliC(5aus~ Isso significa que
quando encontramos uma associao estatstica entre duas varftveis, n1io podemos concluir
que uma das variveis seja a causa da outra (ou a afete diretamente ) Se encontrarmos uma
correlao entre riqueza e QI, no poderemos concluir que o Ql afete di:etamente sua ri que- T
za, e no podemos concluir que a riqueza de uma pessoa afete direramente seu Ql. muito
comum que a mdia noticie uma correlao recm-descoberta com palavras que indicam ou
implicam que uma das variveis a causa da outra.

11

Introduo Estatstica

Estudo de Interesse Prprio,Estudos sQ, algumas vezes, fmanc~ por partes com
. teresses a seremprorfioyid~. Por exemplo, K.iwi Brands, um fabricante de~xa"Pa'ra'--"
sapato s, financiou um estudo que resultou na afirmativa que saiu em alguns jornais: "De
acordo com uma pesquisa nacional de 250 profissionais patres, sapatos gastos eram a razo mais comum para um homem que procura emprego no causar uma boa primeira im,presso." Devemos estar bastante atentos em relao a tais tipos de pesquisa nas quais o
financiador pode obter algum lucro monetrio com os resultados. Recentemente, tem sido
de crescente relevncia a prtica de laboratrios farmacuticos pagarem mdicos que realizam experimentos clnicos e relatam seus resultados em publicaes de prestgio como Jour-

nal of the American M edical Association.


.

Nmeros Precisos "H, agora, 103.215.027 fanu1ias nos Estados Unidos." Como essa cifra
muito precisa, muitas pessoas pensam, incorretamente, que ela tambm exata. Nesse caso,

aquele nmero uma estimativa, e teria sido melhor afirmar que o nmero de fanu1ias de
cerca de I 03 milhes.

Cenrios Parciais "Noventa por cento de todos os nossos carros vendidos nesse pas nos
ltimos 10 anos ainda esto rodando." Milhes de consumidores ouviram esse comercial e
[ no perceberam que 90% dos carros que o anunciante vendeu no pas tinham sido vendidos
nos ltimos trs anos, de modo que a maioria deles ainda rodando era bastante nova. A afirmativa era tecnicamente correta, mas era enganosa por no apresentar os resultados co~pletos.

Distores Delib e radas No seu livro Tainted Truth, Cynthia Crossen cita um exemplo
da revista Corporate Travei que publicou resultados mostrando que entre as companhias de
aluguel de carros, a A vis era a vencedora em uma pesquisa com pessoas que alugavam carros. Quando a Hertz requisitou informao detalhada sobre a pesquisa, as respostas reaiS'da
pesquisa desapareceram e o coordenador da pesquisa da revista pediu demisso. A Hertz
processou a A vis (por propaganda falsa baseada na pesquisa) e a revista; chegou-se a um
acordo.
Alm dos casos citados acima, h muitos outros maus usos da estatstica. Alguns desses
outros casos podem ser encontrados em livros como o clssico How to Lie with Statistics,
de Darrell Huff, The Figure Finaglers, de Robert Reichard, e Tainted Truth, de Cynthia
Crossen. A compreenso dessas prticas ser extremamente til na avaliao dos dados
estatsticos encontrados em situaes do dia~a-dia.

1-3 Habilidades e Conceitos Bsicos


Nos Exerccios 1-4, use o pensamento crtico para desenvolver uma concluso alternativa. Por exem"
pio, considere uma reportagem da mdia em que se diz que as pessoas que dirigemBMW so mais
saudveis do que os adultos que no dirigem. A concluso de que os carros BMW so a causa de uma
melhor sade provavelmente errada. Eis uma concluso melhor: os que dirigem carros BMW tendem a ser mais ricos do que adultos que no dirigem, e maior .riqueza est associada a melhor sade.

1. Peso e Caminhes U~ estudo mostrou que os choferes de caminhes pesam mais do que os
adultos que no dirigem caminhes. Concluso: Caminhes fazem as pessoas ganharem peso.

2. Casas e Longevidade Um estudo mostrou que os que possuem casa tendem a viver mais do que
os que no possuem sua prpria casa. Concluso: Possuir uma casa cria paz interior que propicia
melhor sade e vida mais longa.
3. Multas de Trnsito Um estudo mostrou que, em Orange County, mais multas por excesso de
velocidade eram aplicadas a minorias e no a brancos. Concluso: Em Orange County, as minorias correm mais do que os brancos.
4. Remdios para Gripe Em um estudo dos sintomas da gripe, todos os sujeitos do estudo com
gripe mostraram melhora duas semanas aps tomarem plulas de gengibre. Concluso: Plulas de
gengibre curam a gripe.
Nos Exerccios 5-16, use o pensamento crtico para apontar o problema-chave.

S. Alimentao Saudvel com Chocolate O New York Times publicou um artigo que inclua as
afirmativas: "Finalmente, o chocolate se coloca em seu lugar de direito na pirmide da alimentao, em algum lugar na boa vizinhana do vinho tinto, frutas e vegetais, e ch verde. Vrios estudos, relatados no Joumal of Nutrition, mostraram que, aps comerem chocolate, os sujeitos de
teste tiveram aumentados seus nveis de antioxidantes no sangue. Chocolate contm flavonides,

Pt?/t!?/antltJv Patt~ fit/7~

D-se a uma classe o dever de casa de


registrar os resultados de 500 jogadas
de uma moeda. Um aluno desonesto
decide economizar tempo inventando
os resultados em vez de realmente
jogar a moeda. Como as pessoas, em
geral, no conseguem fabricar
resultados que sejam realmente
aleatrios, normalmente podemos
identificar esses dados falsos. Com
500 jogadas de uma moeda de
verdade, extremamente provvel
que voc obtenha uma seqncia de
seis caras ou seis coroas, mas as
pessoas quase nunca incluem tal
seqncia quando fabricam os
resultados.
Outra maneira de detectar dados
fabricados estabelecer que os dados
violam a lei de Benford: Para muitas
colees de dados, os dgitos lderes
no so uniformemente distribudos.
Em vez disso, os dgitos lderes 1,

. 2, .... , 9 ocorrem com taxas de 30%,


18%, 12%, 10%, 8%, 7%, 6%, 5% e
5%, respectivamente. (Veja "The
Difficulty of Faking Data", de
Theodore Hill, Chance, V oi. 12,
No. 3.)

r i9fn.en1; \\o

12

Captulo Um
antioxidante que tem sido associado diminuio de risco de doenas do corao e infarto. A
Mars Inc., a companhla de doces, e a Chocolate Manufacturers Association financiaram grande
parte da pesquisa." Que h de errado com esse estudo?
6. Dados do Censo Aps o ltimo Censo nacional, o Poughkeepsie Joumal publicou a seguinte
manchete em sua pgina principal: "281.421.906 na Amrica." Que h de errado com essa manchete?

7. Pesquisa pelo Correio Quando a autora Shere Hite escreveu Woman and Love: A Cultural
Revolution in Progress, ela baseou suas concluses em 4500 respostas recebidas aps enviar por
correi0 100.000 questionrios a vrios grupos de mulheres. As concluses dela tm chance de
serem vlidas, no sentido de poderem ser aplicadas populao geral de todas a mulheres? Por
que ou por que no?
8. Nmeros ''900'' Em uma pesquisa do programa Nightline da rede ABC, 186.000 espectadores
pagaram, Ciida um, 50 centavos para ligar para um nmero "900" dando sua opinio sobre a
manuteno da sede das Naes Unidas nos Estados Unidos. Os resultados mostraram que 67%
dos que ligaram eram a favor da retirada das Naes Unidas dos Estados Unidos. Interprete os
resultados, identificando o que podemos concluir sobre como a populao em geral se sente em
relao a manter as Naes Unidas nos Estados Unidos.

9. Pesquisas por Telefone A Companhia de Segl)Ios Hartford contratou voc para pesquisar urna
amostra de adultos sobre suas compras de carros. Que h de errado em se usar as pessoas com
nmeros de telefones listados nos catlogos como a populao da qual se extrai a amostra?
10. Criminalidade e nibus O Newport Chronicle afirma que os pontos de nibus causam crime, porque
um estudo mostrou que as taxas de criminalidade so maiores nas cidades com pontos de nibus do
que em reas rurais que no tm pontos de nibus. Que h de errado com essa afirmativa?

11. Capacetes para Motocicletas O Senado do estado do Hava fez audincias pblicas quando estava
considerando uma lei que exigia que motociclistas usassem capacetes. Alguns motociclistas testemunharam que tinham sofrido acidentes nos quais o capacete no teria sido de qualquer utilidade. Qual grupo importante no pde testemunhar? (Veja "A Selection of Selection Anornalies"
de Wainer, Palmer e Bradlow em Chance, Volume 11, No. 2.)
12. Pesquisa da Merril Lynch O autor recebeu urna pesquisa da fuma de investimentos Merril Lynch.
O objetivo era avaliar sua satisfao como cliente, e tinha questes especficas para o autor pontuar seu Consultor Financeiro pessoal. A carta inicial continha esta afirmao: "Suas respostas
so de extrema importncia para seu Consultor Financeiro, Russel R. Smith, e para a Merril
Lynch ... Compartilharemos seu nome e resposta com seu Consultor Financeiro." Que h de errado com essa pesquisa?
13. Nicotina do Cigarro Em relao ao Conjunto de Dados 5 do Apndice B, considere o contedo
de nicotina das 29 marcas diferentes de cigarros. A mdia das quantidades 0,94 mg. Esse resultado pode ser uma boa estimativa da mdia de todos os cigarros fumados nos Estados Unidos?
Por que ou por que no?
14. Questo Ruim Uma pesquisa inclui este item: "D sua altura em polegadas." Espera-se que as
alturas reais dos respondentes possam ser obtidas e analisadas, mas h dois problemas importantes com esse item. Identifique-os.

15. Lngevidade Voc precisa realizar um estudo ie longevidade para pessoas que nasceram aps o
trmino da Segunda Guerra Mundial em 1945. Se voc tivesse que visitar os cemitrios e usar as
datas de nascimento e morte inscritas nas lpides, voc obteria bons resultados? Por que ou por
que no?
16. SMSC Em uma carta para o editor do New York Times, Moorestown, New Jersey, a residente
Jean Mercer criticou a afirmativa de que "colocar crianas em posio supina diminuiu o nmero
de mortes por SMSC". SMSC a abreviatura de sndrome de morte sbita em crianas, e a posio supina deitar de costas de rosto para cima. Ela sugeriu que essa afirmativa era melhor: "Os
pediatras recomendaram a posio supina durante um tempo em que taxa de SMSC diminuiu."
Que h de errado em dizer que a posio supina diminuiu o nmero de mortes por SMSC?

Nos Exerccios 17-22, responda s questes dadas que se relacionam com porcentagens.
17. Porcentagens
a. Transforme a frao 17/25 em urna porcentagem equivalente.
b. Transforme 35,2% em um decimal equivalente.
c. Quanto so 57% de 1500?
d. Transforme 0,486 em urna porcentagem equivalente.
18. Porcentagens
a. Quantos so 26% de 950?
b. Transforme 5% em um decimal equivalente.
c. Transforme 0,01 em uma porcentagem equivalente.
d. Transforme a frao 527/1200 em uma porcentagem equivalente. Arredonde o resultado para
o dcimo mais prximo.

Introduo Estatstica
19. Porcentagens na Pesquisa do Gallup
a. Em uma pesquisa do Gallup, 52% de 1038 adultos pesquisados disseram que o fumo passivo
"muito prejudicial". Qual o nmero real de adultos que disseram que o fumo passivo "muito
prejudicial"?
b. Dentre os 1038 adultos pesquisados, 52 disseram que o fumo passivo "no prejudicial de
forma alguma". Qual a porcentagem das pessoas que escolheram "no prejudicial de formaalguma"?

20. Porcentagens em um Estudo de Lipitor


a. Em um estudo da droga para colesterol Lipitor, 270 pacientes receberam um placebo, e 19
desses 270 pacientes queixaram-se de dor de cabea. Qual porcentagem desse grupo de placebo queixou-se de dor de cabea?

b. Dentre os 270 pacientes do grupo do placebo, 3,0% queixaram-se de dor nas costas. Qual o
nmero real de pacientes que se queixaram de dor nas costas?

21. Porcentagens da Criminalidade no Campus Em um estudo sobre crimes no campus de faculdades cometidos por alunos bbados ou drogados, realizou-se urna pesquisa pelo correio com
1875 estudantes. Um artigo no USA Today observou: "Oito por cento dos alunos que respondem
anonimamente dizem que j cometeram algum crime no campus. E 62% deste grupo dizem que
o fizeram sob influncia do lcool ou de drogas." Supondo que o nmero de estudantes que respondiam anonimamente fosse 1875, quantos realmente cometeram um crime no campus sob influncia do lcool ou de drogas?
22. Porcentagens na Mdia
a. Um editorial do New York Times criticou uma legenda de grfico que descrevia uma soluo
b~cal como aquela que "reduz a placa nos dentes em mais de 300%." O que h de errado com
essa afirmativa?
b. Na New York Times Magazine , uma reportagem sobre o declnio dos investimentos ocidentais no Qunia inclua isto: "Depois de anos de vos dirios, a Lufthansa e a Air France illterromperam o servio de passageiros. O investimento estrangeiro caiu 500 por cento durante os
anos 1990." O que h de errado com essa afirmativa?

1-3 Alm do Bsico


23. Dados Falsos Um pesquisador do Centro de Pesquisa do Cncer Sloan~Kettering foi uma
vez criticado por fals ificar dados. Entre seus dados havia valores obtidos de 6 grupos de camundongos, com 20 camundongos em cada grupo. Esses valores foram dados para a porcentagem de sucessos em cada grupo: 53 %, 58%, 63%, 46%, 48%, 67% . Qual a principal falha?
24. Que H de Errado Nesses Dados? Tente identificar cada um dos quatro defeitos principais no
seguinte. Um jornal dirio realizou uma pesquisa, pedindo aos leitores que dessem sua resposta
por telefone a esta questo: "Voc apia o desenvolvimento de armas atmicas que podem matar
milhes de pessoas inocentes?" Relatou-se que 20 leitores responderam e 87% disseram "no" e
13% disseram "sim".
25. Fraseado Tendencioso Escreva uma questo de pesquisa que se refira a um tpico de seu interesse. Primeiro escreva a pergunta objetivamente; reescreva-a, ento, de modo a encorajar
respostas em uma direo e reescreva-a de novo de modo a influenciar respostas na direo
oposta.
26. Grficos Atualmente, as mulheres ganham 74 centavos para cada dlar ganho pelos homens,
fazendo o mesmo trabalho. Faa um grfico que retrate essa informao objetivamente e em seguida faa um grfico que exagere a diferena. (Sugesto : Veja a Figura 1-1.)

1-4 Planejamento de Experimentos


Embora esta seo contenha muita informao, h dois pontos principais, que so muito
simples. Devemos entender que o mtodo usado para coletar dados absoluta e criticamente importante, e devemos saber que a aleatoriedade particularmente importante.

Se os dados amostrais no forem coletados de maneira apropriada, eles podem


ser de tal modo inteis que nenhuma manipulao estatstica poder salv-los.
A aleatoriedade comumente desempenha papel crucial na determinao de quais
dados coletar.

Os mtodos estatsticos so direcionados pelos dados. Normalmente, obtemos dados de


duas fontes distintas: estudos observacionais e experimentos.

13

14

Captulo Um

Yri'M_mef1to,e,p,assamos, ento, a observar seu efeito

Uma pesquisa do Gallup um bom exemplo de um estudo observacional, enquanto um


teste clnico da droga Lipitor um bom exemplo de um experimento. A pesquisa do Gal~ p
observacional no sentido de que ela simplesmente observa pessoas ~m geral, atravs de--'
entrevistas) sem modific-las de modo algum. Mas o teste clinico do Lip~reo~
tamento de algumas pessoas com a droga,,de modo que as pessoas tratadasjiio modificad~.
H diferentes tipos de estudos observacionais, conforme ilustrado na Figura 1-3. ~s termos, comumente usados em muitos diferentes peridicos profissionais, so definidos aqui .

H uma importante distino entre as amostragens feitas nos estudos retrospectivos e prospectivos. Nos estudos retrospectivos , voltamos no tempo para coletar dados sobre a caacterstica resultante que est sendo considerada, como grupo de motoristas que morreram em acidentes de carro e outro grupo de motori stas que no morreram em acidentes de
J carro. Nos estudos prospectivos, avanamos no tempo acompanhando grupos, um com
um fator potencialmente causativo e outro sem esse fator, tal como o grupo de motoristas
que usam telefones celulares ao dirigir e o grupo dos que no usam.

........,_.v

Estudo Transversal:
y
r
Y
Os dodos so me dido s em ay um ponto no tempo.
A.... -""
(

____..

-.....-......

~ ~

--...........

'> Est':..,do "Retrospectiva (ou de Controle de Caso}. '


K!?rorna no rempo para coletar dados.

..r-"

'.Y

Estudo Prospectivo (ou Longitudinal ou de Coor- t.e):


A vana no tempo e observa g r upos com
fatores em comum. tais como
fumantes e no-fumante s.
Estudos
_,{

'

} Elementos-chave no planejament o de exper imentos:


<, 1. Controla efeitos de variveis atravs de:
~
experime ntos cegos. blocos. planejamento expenmenta;
< comp let amente aleatorizado. planejament o e xperimental

c ,.

rigorosamente controlado.

2. "Replicao
3. A leatorizao

"

~ _f,

,.

FIGURA 1-3 Elementos dos Estudos Estabsticos

lJ

'\.

Introduo Estatstica
Essas trs definies se aplicam aos estudos observacionais, mas agora mudamos nossa .
ateno para os experimentos. Os resultados de experimentos so algumas vezes destru3os
por causa do confundim.ento.
'
._/ '--../ '-....../

lS

~.._. '"~:.l
. ''!!""'
_. / .........

/;;;;;..

ESTATiSTICA
Nos Meios de
Comunica~o

~"-

.o
i

'

aPor exemplo, suponha que um professor de Vermont experimente uma nova ttica. de freqncia ("sua mdia no curso cai um ponto para cada aula que voc mata"), mas ocorre um
inverno excepcionalmente ameno, sem a neve nem as baixas temperaturas que atrapalharam a freqncia no passado. Assim, se a freqncia melhorar, no poderemos determinar
se essa melhora se deveu nova ttica ou ao inverno ameno. Os efeitos da ttica de freqncia e do tempo foram confundidos.

tS.
'[ -

ti.

Controlando os Efeitos das Variveis


I

Il

T~ ~

Testes Clnicos vs.


Estudos Observacionais

~
)

tm
up
de

'1

A Figura 1-3 mostra que um dos elementos-chave no planejamento de experimentos o


controle dos efeitos das variveis. Podemos obter tal controle usando dispositivos como
experimentos cegos, blocos, planejamento experimental completamente aleatorizado ou um
planejamento experimental rigorosamente controlado, descritos a seguit.
Experimento Cego Em 1954, planejou-se um experimento macio para testar a eficcia da vacina Salk na preveno da plio, que matava ou paralisava milhares de crianas.
Naqueleexperimento, um grupo de tratamento recebeu a vacina Salk real, enquanto um
segundo grupo recebeu um placebo que no continha qualquer droga. Nos experimento
que envolvem placebos, h sempre um efeito placebo, que ocorre quando um sujeito no
tratado relata melhora nos sintomas. (A melhora relatada no grupo placebo pode ser rea
ou imaginada.) Esse efeito placebo pode ser minimizado ou contabilizado atravs do uso~
de um experimento cego, uma tcnica em que o sujeito no sabe se est recebendo o tratamento ou o placebo. O experimento cego nos permite determinar se o efeito do tratamento ou no significativamente diferente do efeito do placebo. O experimento da plio
foi do tipo duplo-cego, o que significa que a ocultao ocorreu em dois nveis (1) as crianas que recebiam a injeo no sabiam se estavam recebendo a vacina Salk ou um placebo, e (2) os mdicos que davam flS injees e avaliavam os resultados tambm no sabiam.

rlt-

Blocos No planejamento de um experimento para testar a eficcia de um ou mais tratamentos, importante colocar os sujeitos (em geral, chamadOS)Qtidades experimentais) em grupos diferentes (ou blocos) de tal modo que os grupos sejam
!_gil).P.Q._d~ sujeito.s..Que s~--'~antes nos modos que Bossam afetar o re~~aao a~
erin'ento~
'J' ~
J
"-/ ../
"--\ Ao conduzir u~ experimento que testa um ou mais tratamentos diferentes, forme
blocos (ou grupos) de sujeitos com caractersticas similares.

Planejamento Experimental Completamente Aleatorizado Na deciso de como


associar os sujeitos aos diferentes blocos, voc pode usar a seleo aleatria ou tentar controlar cuidadosamente a associao, de modo que os sujeitos dentro de cada bloco sejam
semelhantes. Uma abordagem usar um planejamento experimental completamente aleatorizado, onde os sujeitos so colocados nos blocos atravs de um processo de seleo
aleatria. Um exemplo de um planejamento experimental completamente aleatorizado a caracterstica do experimento da plio: as crianas foram destinadas ao grupo de
tratamento ou ao grupo placebo atravs de uma seleo aleatria (equivalente jogada de
uma moeda).

Em um artigo do New York Times


sobre terapia honnonal para mulheres,
a reprter Denise Grady escreveu
sobre um relato de tratamentos
testados em provas controladas
aleatorizadas. Ela afinnou que "Essas
provas, nas quais pacientes so
designados aleatoriamente ou a um
tratamento ou a um placebo, so
consideradas o que de melhor h em
pesquisa mdica. Em contraste, os
estudos observacionais, nos quais os .
pacientes decidem eles mesmos se.
tomam ou no a droga, so
considerados menos confiveis ... Os
pesquisadores dizem que os estudos
observacionais podem ter pintado
uma figura falsamente rsea da
reposio honnonal porque as
mulheres que optam pelo tratamento
so, de incio, mais saudveis e tm
elhores hbitos do que as mulheres
ue no fazem o tratamento."

16

Captulo Um

0? fle~td'? /lttW!Mr~ ~
tid-' f~111'W1!MtJr
O bem conhecido efeito placebo
ocorre quando um sujeito no tratado
acredita, incorretamente, que est
recebendo tratamento real e relata
melhora nos sintomas. O efeito
Hawthome ocorre quando sujeitos
tratados de alguma forma respondem
diferentemente, simplesmente por
fazerem parte de um experimento.
(Esse fenmeno foi chamado "efeito
Hawthome" porque foi primeiro
observado em um estudo dos
operrios da fbrica Hawthome da
Westem Electric.) Um efeito do
experimentador (s vezes chamado
efeito Rosenthall) ocorre quando o
pesquisador ou experimentador, no
intencionalmente, influencia os
sujeitos atravs de fatores tais como
expresso facial, tom de voz ou
atitude.

Planejamento Rigorosamente Controlado Outra abordagem para atribuir sujeitos aos


grupos usar um planejamento rigorosamente controlado, no qual os sujeitos so escolhidos cuidadosamente de modo que em cada bloco sejam similares em relao ao que importante para o experimento. Em um experimento que testa a eficcia de uma droga feita
para baixar a presso sangnea, se o grupo do placebo inclui um homem de 30 anos, com
excesso de peso, fumante e que consome sal e gordura em abundncia, o grupo do tratamento deve incluir, tambm, uma pessoa com caractersticas semelhantes (o que, nesse caso,
seria fcil de achar).

Replicao e Tamanho da Amostra


Alm do controle dos efeitos das variveis, outro elemento-chave do planejamento experimental o tamanho das amostras. As amostras devem ser grandes o bastante para que o
comportamento errtico, que caracterstica de amostras muito pequenas, no disfarce os
verdadeiros efeitos dos diferentes tratamentos.p. repetJso de um experimento ch~

~li~o.~p~~ us~etivam~nte Jlu'~~jet~suficierrtes,parae

/ ~e~as a p~a~os diferentes. (Em outro contexto, reg,lic4S:,.o ~


tefe~epeti-<tillfuphcaao de um exp~modo que os resultados p~oss~
_,.s;~~-yeQ.Q_cados) Com replicao, tamanhos amostrais g;ande?"-aumentam a
chance de reconhecimento dos efeitos de diferentes tratamentos. No entanto, uma amostra
~de ~o~neces~nte_;)IIQ_a boa amostra. Embora seja im'Portanre'terum~m~a
' que~ sufici6temente gi'h:tde, 1ni~e ter uma amostra na qual os dados tenham sido escolhidos de alguma maneira apropriada, tal como seleo aleatria (descrita
mais adiante).
1

Use um tamanho de amostra grande o bastante para que possa ser vista a verdadeira natureza de quaisquer efeitos e obtenha a amostra usando um mtodo apropriado, tal como um baseado em aleatoriedade.

No experimento planejado para testar a vacina Salk, 200.000 crianas receberam a verdadeira vacina e 200.000 outras crianas receberam um placebo. Como o experimento real
usou tamanhos amostrais suficientemente grandes, a eficcia da vacina pde ser comprova~a. No en~o: embora.Q_.g~~~e~ e dey~cebo. fossem.m~t~randes, o exp<::_
.ento tena sido um-~o se os suJeitos naLVesseth sido"ctSinrad9-s-~ad~rpo de
_..,.,-~g[UpOS""""semelhantes
--- ~
. ~
ornasse ambOS OS
]10 que era Importante
ar O.~
e v""'"'_....-

Aleatoriza~o

'__/

-/ J~

e Outras Estratgias Amostrais

Na estatstica, como na vida, um dos piores erros consiste em coletar dados de uma maneira
no apropriada. No podemos deixar de enfatizar esse ponto muito importante:

Jse

os dados amostrais no forem coletados de maneira adequada, eles podem ser de


tal modo inteis que nenhuma manipulao estatstica poder salv-los.

Na Seo 1-3 vimos que uma amostra de resposta voluntria uma amostra na qual os
sujeitos decidem se respondem ou no. Tais amostras so muito comuns, mas seus resultados so, em geral, inteis para se fazerem inferncias vlidas sobre populaes maiores.
V amos, agora, definir os mtodos de amostragem mais comuns.
l

:-,

r:
e
e
n
r;

Introduo Estatstica

E XEMPLO Amostra Aleatria e Amostra Aleatria Simples Imagine uma sala


de aula com 60 alunos arrumados em seis filas de 10 alunos cada. Suponha que o professor selecione uma amostra de 1Oalunos jogando um dado e selecionando a fila correspondente ao resultado da jogad. O resultado uma amostra aleatria? amostra
aleatria simples?
SOLUO A amostra uma amostra aleatria porque cada estudante individual tem

a mesma chance (uma chance em sers) de ser escolhido. No entanto, a amostra no


uma amostra aleatria simples porque nem todas as amostras de tamanho 1O tm a
mesma chance de serem escolhidas. Por exemplo, esse planejamento amostrai, ao usar
um dado para selecionar uma fileira, torna impossvel selecionar 10 estudantes que
estejam em filas diferentes (mas h uma chance em seis de selecionar os 10 estudantes da primeira fila).
Importante: Em todo este livro, usaremos vrios procedimentos estatsticos diferentes, e em geral faremos a exigncia de que coletamos uma amostra aleatria simples,
como definida acima.

r~n
\
"'''''" .!.

Com a amostragem<estratificlida;}mbqvKli:l
pos (ou estratos) quty comj}~iii( ....
etria) e em segid<, extiamds;UiJtaams:tra:
Na amostragem por conglomerado;
sees ( u conglomera<I,"os},
glo_m erados ento esolhtiQs
nados.

4 _.

( fcil confundir amostragem estra~ficada com amostragem por conglomerado, porque ambas envolvem a formao de subgrupos. Mas a amostragem por conglomerado
) usa todos os membros de uma amostra de conglomerados, enquanto a amostragem
estratificada usa uma amostra de mempros de todos os estratos. Um exemplo de amosltragem por conglomerado pode ser encontrado nas pesquisas eleitorais, onde selecio/ namos aleatoriamente 30 zonas eleitorais de um grande nmero de zonas e, em seguida,
entrevistamos todos os eleitores daquelas zonas selecionadas. Isso muito mais rpido
e muito menos dispendioso do que selecionar uma pessoa de cada uma das muitas zonas na rea populacional.~- resultad~da am~agem estratific.ada-Qu nor conglomerado podem ser ajustados ou ponderado~ara ~gir
porcionais de grupos. . . . . ._ /

..../~~

17

18

Captulo Um

Amostrage m A leatria:
Cada membro da populao tem chance
igual de ser escolh1do. Comput~dores
so. em geral. usados para gerar
nmeros telernicos aleatrios.
Amostragem Ale atria S imples:
Uma amostra de n SI.IJ"eitos
selecionada de tal modo que todo
amostro possvel do m esmo tamanho n
tem a mesma chance de ser escolhido.

i ti ti t

Amostragem S istemtica:
E.scolha algum ponto inicial e selecione.
ento. cada k-simo (tal como cada 50.0 )
element o da populao.

Amostrage m de Convenincia:
Usa resultados que so fceis de se
obter.

Mulheres

Hom e ns

Amostrage_m Estratificada:
Subdivida a populao em. pelo menos.
dois subgrupos diferentes (ou estratos)
que tenham as mesmas caractersticas
(tais como sexo ou foixa etria) e. ento.
ext raia uma amostra de cada subgrupo.

Entreviste todos os eleitores


nas zonas sombreadas.

Amostragem por Conglome r ado:


D ivida a rea da populao em sees
(ou conglomerados>. escolho. ento.
aleatoriamente alguns desses
conglomerados e e;colha todos os
membros desses conglomerados
escolhidos.

FIGURA 1-4 Mtodos Amostrais Comuns


~

I
c
s

1
N,
e:..

3.

!!\

Introduo Estatstica

19

f
1

~
t

~
f

I
l

II
'

Para um tamanho de amostra fixo, se voc seleciona aleatoriamente sujeitos de diferentes estratos, provavelmente obter resultados mais consistentes (e menos variveis) do que
simplesmente selecionando uma amostra aleatria de toda a populao. Por essa razo, a
amostragem estratificada , em geral, usada para reduzir a variao nos resultados. Muitos
dos mtodos discutidos mais adiante neste livro exigem que os dados amostrais sejam uma
amostra aleatria simples, e nem a amostragem estratificada, nem a amostragem por conglomerados satisfazem essa exigncia.
A Figura 1-4 ilustra os mtodos comuns de amostragem. Os profissionais, em geral,
coletam dados usando alguma combinao desses mtodos. Eis um exemplo tpico do que
chamamos planejamento amostrai de mltiplos estgios: primeiro, selecionamos aleatoriamente uma amostra de condados de todos os 50 estados; depois, selecionamos aleatoriamente cidades e vilas nesses condados; em seguida, selecionamos, aleatoriamente, quarteires residenciais em cada cidade ou vila; selecionamos aleatoriamente, ento, farru1ias
em cada quarteiro e, finalmente, selecionamos aleatoriamente uma pessoa de cada famlia. No usaremos tal planejamento amostrai neste livro. Enfatizamos, novamente, que os
mtodos deste livro exigem, caracteristicamente, que tenhamos uma amostra aleatria
. l
/'... --"' /
......
szmp
es.
~

it

Erros Amostrais

Um erro no-nlost!"al dc{>rre yu'i"'Iuu"~l'.Y.<;>':'.~:'!; .ffl:!,u~\


analisados incorretamente (tah:omo .'s~lt!'o~~tifu:.:a:
instrume11to de niedid~ defei~osq, 011 (;p Y..\b:'~!1~

Se coletarmos uma amostra cuidadosamente de modo que ela seja representativa da populao, poderemos usar os mtodos deste livro para analisar o erro amostrai, mas devemos tomar bastante cuidado para minimizar o erro no-amostrai.
Aps ler toda esta seo , fcil ficarmos espantados com a variedade de diferentes
definies. Mas lembre-se desse pon~o principal: o mtodo usado~ ~~<tdo~
_absoluUt.._e crit~amente importante, e-de~ emos -saber q~e a qj_eataz:j_da~ ~
~ente importante. Se os dados amostrais no fo~m coletados de maneira apropnada, os aaos podem se tornar to inteis que nenhuma manipulao estatstica poder
salv-los.

1-4 Habilidades e Conceitos Bsicos


Nos Exerccios 1-4, determine se a descrio dada corresponde a um estudo observacional ou a um
experimento.
1. Teste de Droga D-se Lipitor a pacientes para se determinar se essa droga tem ou no o efeito de

baixar os nveis altos de colesterol.


2. Tratamento da Sfilis Muita controvrsia surgiu em relao a um estudo de pacientes com sfilis que no receberam um tratamento que poderia t-los curado. A sade deles foi acompanhada
durarite anos, aps ter sido descoberto que tinham sfilis.
3. Fraude ao Consumidor O Bir de Pesos e Medidas do Condado de Dutchess seleciona aleatDriamente postos de gasolina e obtm I galo de gasolina de cada bomba. A quantidade bombeada
medida para verificar a exatido.

------- - - - - --

20

Captulo Um

4. Braceletes Magnticos Os passageiros de navios de cruzeiro recebem braceletes magnticos,


que eles concordam em usar numa tentativa de eliminar ou diminuir o enjo.
Nos Exercfcios 5-8, identifique o tipo de estudo observacional (transversal, retrospectivo ou prospectivo).

S. Pesquisa Mdica Um pesquisador da Escola de Medicina da Universidade de Nova York obtm


dados sobre ferimentos na cabea examinando os registros do hospital dos .ltimos cinco anos.
6. Psicologia do Trauma Um pesquisador do Hospital Mt. Sinai da cidade de Nova York planeja
obter dados acompanhando (at o ano 2010) irmos de vtimas fatais do ataque terrorista ao World
Trade Center em 11 de setembro de 2001.
7. Estatstica do Desemprego O Ministrio do Tra""alho americano obtm dados atuais do desemprego pesquisando 50.000 pessoas este ms.
8. Ganhadores de Loteria Um economista coleta dados entrevistando pessoas que ganharam na
loteria entre os anos de 1995 e 2000.
Nos Exercfcios 9-20, identifique qual destes tipos de amostragem usado: aleatria, sistemtica, de
convenincia, estratificada ou por conglomerados.

9. Notcias na Televiso Um reprter de notic:rio da rede de televiso NBC analisa a reao a


uma histria impressionante entrevistando pessoas que passam em frente ao seu estdio.

to. Seleo de Jri O Comissrio de Jurados do Condado de Dutchess obtm uma lista de 42.763
proprietrios de carros e obtm um conjunto de jurados selecionando cada centsimo nQme na
lista.

11. Pesquisas Telefnicas Em uma pesquisa do Gallup de 1059 adultos, os sujeitos da entrevista
foram selecionados usando-se um computador para gerar aleatoriamente nmeros de telefones,
que eram ento discados.
12. Posse de Carro Uma pesquisadora da General Motors dividiu todos os carros registrados em
categorias de subcompacto, compacto, mdio, intermedirio e grande. Ela est pesquisando 200
proprietrios de carro de cada categoria.
13. Bebida entre Estudantes Motivado pelo fato de um estudante ter morri do por excesso de bebida, a Faculdade de Newport fez um estudo do hbito de bebida dos estudantes, selecionando
aleatoriamente 10 classes diferentes e entrevistando todos os estudantes em cada uma dessas
classes.
14. Marbting Uma executiva de marketing da General Motors descobriu que o departamento de
relaes pblicas da empresa tinha acabado de imprimir envelopes com os nomes e endereos de
todos os proprietrios de Corvette. Ela deseja fazer um teste piloto de uma nova estratgia de
mercado, de modo que ela mistura bem os envelopes em uma caixa e obtm um grupo amostrai
retirando 50 desses envelopes.
15. Ponto de Checagem de Sobriedade O autor foi observador em um ponto de checagem de sobri.edade da polcia, no qual cada quinto chofer era parado e entrevistado, (Ele testemunhou a priso
de um ex-aluno.)
16. Pesquisa de Boca de Urna A rede CNN est planejando uma pesquisa na quallOO sees eleitorais sero selecionadas aleatoriamente e todos os eleitores sero entrevistados ao deixarem o
local.
17. Educao e Salrio Um economista est estudando o efeito da educao sobre o salrio e realiza urna pesquisa com 150 trabalhadores selecionados aleatoriamente de cada uma das seguintes
categorias: menos do que Ensino Mdio; Ensino Mdio; mais do que Ensino Mdio.
18. Antropometria Um estudante de estatstica obtm dados sobre altura/peso entrevistando membros da fanu1ia.
19. Pesquisa Mdica Um pesquisador da Universidade Johns Hopkins examina todos os pacientes
cardacos d(! cada um de 30 hospitais selecionados aleatoriamente.
20. Pesquisa da MTV Um especialista em marketing para a MTV est planejando uma pesquisa na
qual500 pessoas sero selecionadas aleatoriamente de cada faixa etria de 10-19,20-29, e assim
por diante.
Nos Exerccios 21-26, identifique as amostras aleatrias e as amostras aleatrias simples.

21. Amostragem de Comprimidos de Aspirina Um farmacutico mistura bem um recipiente com


1000 comprimidos de Bufferin e retira, ento, 50 que devem ser testados para se verificar o contedo exato de aspirina. Esse planejamento amostrai resulta em uma amostra aleatria? Em uma
amostra aleatria simples? Explique.
22. Amostragem de Estudantes Uma sala de aula compe-se de 30 alunos, sentados em cinco filas
diferentes, com seis alunos em cada fila. O instrutor joga um dado e o resultado usado para
selecionar uma amostra dos estudantes em uma fila particular. Esse plano amostrai resulta em
uma amostra aleatria? Em urna amostra aleatria simples? Explique.

f
fc

L'

~.

f.
f

r
~.

f;

1.

l
i

Introduo Estatstica

I
f

23. Amostra de Convenincia Um reprter de notcias se coloca em uma esquina e obtm uma
amostra de residentes da cidade selecionando cinco adultos que passam e perguntando sobre seus
hbitos de fumo. Esse plano amostra! resulta em uma amostra aleatria? Em uma amostra aleatria simples? Explique.

I
!-

24. Amostra Sistemtica Um engenheiro de controle da qualidade seleciona cada centsima fonte
de computador que passa em uma esteira transportadora. Esse plano amostra! resulta em uma
amostra aleatria? Em uma amostra aleatria simples? Explique.

21

25. Amostra Estratificada A General Foois planeja realizar uma pesquisa de mercado com 100
homens e 100 mulheres em Orange County, a qual consiste em um nmero igual de homens e
mulheres. Esse plano amostra! resulta em urna amostra aleatria? Em uma amostra aleatria simples? Explique.
26. Amostra por Conglomerado Um pesquisador de mercado seleciona aleatoriamente 10 quarteires em Village of Newport e pergunta ento a todos os adultos residentes nos quarteires selecionados se possuem ou no um aparelho DVD. Esse plano amostra! resulta em uma amostra
aleatria? Em uma amostra aleatria simples? Explique.

I
Ii

1-4 Alm do Bsico


27. Plano Amostrai A Addison-Wesley Publishing Company contratou voc para !lesquisar 100 estudantes que usam determinado livro. Descreva procedimentos para obteno de uma amostra de
cada tipo: aleatria, sistemtica, de convenincia, estratificada, por conglomerado.
28. Confundimento D um exemplo (diferente daquele do texto) que ilustre como ocorre o
confundimento.
29. Seleo Aleatria Dentre os 50 estados de um pas, seleciona-se um aleatoriamente. Obtm-se,
ento; uma lista de registro dos votantes de todo o estado e um nome escolhido aleatoriamente.
Esse procedimento resulta em um eleitor selecionado aleatoriamente?

30. Plano Amostrai Em "Cardiovascular Effects of Intravenous Triiodothyronine in Patients Undergoing Coronary Artery Bypass Graft Surgery" (Journal ofthe American Medical.Association , V o!. 275, No. 9), os autores explicam que os pacientes foram designados para um dos trs
grupos: ( 1) um grupo tratado com triodothironina, (2) um grupo tratado com volume nico de
soluo salina normal e dopamina, e (3) um grupo placebo, tratado com soluo salina norln.al.
Os autores resumem o plano amostra! cmo um "estudo prospectivo, aleatorizado, duplo-cego,
controlado por placebo" . Descreva o significado de cada um desses termos no contexto desse
estudo.

31. Motoristas com Celulares Quais so os dois maiores problemas provveis de se encontrar em
um estudo prospectivo no qual alguns motoristas no tm celulares enquanto se pede a outros
que usem seus celulares enquanto dirigem?

Reviso
Este captulo apresentou alguns conceitos bsicos importantes. Vimos definies fundamentais, tais
como amostra e populao , juntamente com alguns princpios muito bsicos. Na S('o 1-2, discutiram-se diferentes tipos de dados. A Seo 1-3 tratou do uso do pensamento crtico na anlise e avaliao de resultados estatsticos. A Seo 1-4 introduziu elementos importantes no planejamento de
experimentos. Ao completar este captulo, voc deve ser capaz de:
Distinguir entre uma populao e uma amostra e distinguir entre um parmetro e uma estatstica.
Identificar o nvel de mensurao (nominal, ordinal, intervalar, de razo) de um conjunto de
dads.
Compreender a importncia de um bom planejamento experimental, incluindo o controle dos
efeitos das variveis, replicao e aleatorizao.
Reconhecer a importncia de bons mtodos amostrais em geral e reconhecer a importncia de
uma amostra aleatria simples, em particular. Entender que, se os dados no forem coletados
de modo apropriado, podem se tomar to inteis que nenhuma forma de manipulao estatstica poder salv-los.

i:!4k"'t.tiIG4Y5t.l
1. Amostragem Logo aps a destruio das torres do W orld Trade Center por terroristas, a Arnerica
Online realizou uma pesquisa com seus assinantes e fez a seguinte pergunta: "As torres do World
Trade Center devem ser reconstrudas?" Entre as 1.304.240 respostas, 768.731 eram "sim", 286.756

22

Captulo Um
eram "no" e 248.753 diziam ser "muito cedo para decidir". Dado que essa amostra muito grande, as respostas podem ser consideradas representativas da populao dos Estados Unidos? Explique.
2. Plano Amostrai Voc foi contratado pela Visa para realizar uma pesquisa sobre o uso de carto de
crdito entre os estudantes de tempo integral de sua faculdade. Descreva um procedimento para a
obteno de uma amostra de cada tipo: aleatria, sistemtica, de convenincia, estratificada, por
. conglomerado.
3. Identifique o nvel de mensurao (nominal, ordinal, intervalar, de razo) usado em cada um dos
itens seguintes.
a. Os pesos de pessoas em uma amostra de passageiros de elevador.
b. Classificaes de um crtico de filmes do tipo "deve ser visto; recomendado; no recomendado; nem pense em ver".
c. Classificaes de um crtico de fll.mes do tipo "drama; comdia; aventura".
d. Bob, que diferente em muitos aspectos, mede o tempo em dias, com o O correspondendo
data de seu nascimento. O dia antes de seu nascimento -1, dia depois de seu nascimento
+ 1, e assim por diante. Bob converteu as datas dos fatos histricos mais importantes para seu
sistema de numerao. Qual o nvel de mensurao desses nmeros?
4. Coca A Coca-Cola Company tem 366.000 acionistas e uma pesquisa foi realizada selecionandose 30 acionistas de cada um dos 50 estados. Registrou-se o nmero de aes de cada um dos acionistas da amostra.
a. Os valores obtidos so discretos ou contnuos?
b. Identifique o nvel de mensurao (nominal, ordinal, intervalar, de razo) para os dados amostrais.
c. Que tipo de amostragem (aleatria, sistemtica, de convenincia, estratificada, por conglomerado) est sendo usado?
d. Se for calculada a mdia do nmero de aes, o resultado uma estatstica ou um parmetro?
e. Se voc fosse o diretor executivo da Coca-Cola Company, quais caractersticas dos dados consideraria como extremamente importantes?
f. Que h de errado com a medio da opinio dos acionistas atravs de um questionrio enviado
pelo correio que eles preencheriam e devolveriam tambm pelo correio?
S. Mais Coca Identifique o tipo de amostragem (aleatria, sistemtica, de convenincia, estratificada,
por conglomerado) usado quando se obtm urna amostra dos 366.000 acionistas da Coca-Cola
Cornpany corno descrito. Determine, ento, se o esauerna de amostragem poder resultar em uma
amostra que seja representativa da populao dos 366.000 acionistas.
a. Uma lista completa de todos os acionistas feita e seleciona-se cada 500. nome.
b. No encontro anual dos acionistas, realiza-se uma pesquisa com todos os presentes.
c. Selecionam-se, aleatoriamente, 50 corretores da Bolsa, e urna pesquisa feita com todos os
seus clientes que possuem aes da Coca-Cola Company.
d. Usa-se um arquivo de computador de todos os acionistas, sendo todos eles numerados consecutivamente. Geram-se, ento, pelo computador, nmeros aleatrios que so usados para selecionar a amostra de acionistas.
e. Coletam-se os cdigos postais de todos os acionistas e selecionam-se aleatoriamente 5 acionistas de cada cdigo postal.
6. Planejamento de Experimento Voc planeja realizar um experimento para testar a eficcia de
Sleepeze, uma nova droga que, supostamente, reduz o efeito da insnia. Voc usar uma amostra
de sujeitos que sero tratados com a droga e uma outra amostra de sujeitos que recebero um placebo.
a. O que "cego" e como deve ser usado nesse experimento?
b. Por que importante usar um experimento cego nessa situao?
c. O que um planejamento de blocos completamente aleatorizado?
d. O que um planejamento de blocos rigorosamente cuntrolado?
e. O que replicao e por que importante?

5.

6.

7.

I .

8.
N(
c
do
ra.
u"

9.

.
1.

(!) 2.

Introduo Estatstica
ran-

~'

~ pli-

Os Exerccios de Reviso Cumulativa neste livro destinam-se a incluir tpicos dos captulos precedentes. Para os Captulos 2-13, os exerccios de reviso cumulativa incluem tpicos dos captulos
precedentes. Para este captulo, apresentamos exerccios de aquecimento com calculadora usando
expresses semelhantes quelas encontradas em todo este livro. Use sua calcu:adora para encontrar
os valores indicados.
1. Reporte-se ao Conjunto de Dados 1 do Apndice B e considere apenas os pesos dus 10 primeiros
homens. Que valor se obtm quando aqueles 10 pesos so somados e o total dividido por 10?
(Esse resultado, chamado a mdia, discutido no Cap. 2.)

e> de

ra a
por
dos

da-

98,20 - 98.60
2. -----'-'-'- - 0,62

o
o
;eu

3. 98,20 - 98,60
0,62

Joio-

vT6
4. [ 1.96 15
2

JS -

te'J?

5.

~(5

6.

(183 - 137,09?
137,09

7?

+ ( 12 - 7) 2 + (4 - 7f
3 - 1

n-

lo

a.
la
1a

7.

8.

(30 - 41,68?
41 ,68

+----

10(513,27) - 71,5 2
10(10- I)
8(151.879) - (516,5)(2176)
V8 (34.525,75) - 516,52 v'8 (728.520) - 2176 2

Nos Exerccios 9-12, as expresses dadas se destinam a fornecer resultados expressos em notao
cientfica. Por exemplo, o resultado dado pela calculadora de 1,23E5 (ou 1,235 em algumas calculadoras) pode ser expresso como 123.000, e o resultado de 4,65E-4 (ou 4,65'14 em algumas calculadoras) pode ser expresso como 0,000456. Realize as operaes indicadas e expresse os resultados como
um nmero comum que no esteja em notao cientfica.

9. 0,95500

10.

814

11.

912

12. 0,2517

*!!M"'iildli+iS.I.J.IiiPh1

(j)

1. Atividade em classe Na lanchonete, obtenha 18 canudinhos .


Corte 6 deles ao meio, 6 em quartos e deixe os demais como
esto. H, agora, 42 canudinhos de tamanhos diferentes. Coloque-os em um saco, misture-os bem, tire um, mea seu comprimento e recoloque-o no saco. Repita isso at serem selecionados e medidos 20 canudinhos . Importante: Selecione os canudinhos sem olhar e pegue o primeiro em que sua mo tocar. Ache
a mdia da amostra de 20 canudinhos. Retire, agora todos do saco
e ache a mdia da populao. A amostra forneceu uma mdia
prxima da verdadeira mdia da populao? Por que sim ou por
que no?
2. Atividade em classe Em meados de dezembro de um ano recente, o
provedor de Internet America Online (AOL) realizou uma pesquisa
com seus usurios. Foi feita a seguinte pergunta sobre rvores de
Natl: "Qual voc prefere?" A resposta poderia ser "uma rvore
natural" ou "uma rvore artificial". Entre as 7073 respostas dadas
por usurios da Internet, 4650 indicavam preferncia por uma rvo-

re natural e 2423, por uma rvore artificial. J observamos que, po


ser uma amostra de resposta voluntria, nenhuma concluso pod
ser tirada acerca de uma populao maior do que as 7073 pessoa
que responderam. Identifique outros problemas com essa pergunt;
da pesquisa.
3. Atividade em classe Identifique os problemas com o seguinte.
Uma reportagem recente no programa de televiso CNN Headl.in.
News inclua um comentrio de que a criminalidade nos Estado
Unidos havia cado nos anos 1980 porque o crescimento do n
mero de abortos nos anos 1970 resultara em menos crianas nc
desejadas.
A revista Consumer Reports enviou um Questionrio Anual pel
correio sobre carros e outros produtos do consumidor. Includc
tambm, havia um pedido de uma contribuio voluntria er
dinheiro e uma cdula eleitoral para o Quadro de Diretores. A
respostas deviam ser enviadas pelo correio em envelopes qu
exigiam a selagem.

24

Captulo Um

O objetivo deste projeto introduzir os recursos tecnolgicos que voc


usar e-m seu curso de estatstica. Reporte-se ao Conjunto de Dados 14
do Apndice B e use os escores do lndice de Facilidade de Leitura de

STATDISK

Clique em Data no alto da tela, selecione, ento, Sample Editor e prossiga para introduzir os dados. Para
obter a impresso, clique em File e selecione Print.

Minitab

Introduza os dados na coluna Cl, clique em File e selecione ento Print Worksheet.

Flesch para Harry Potter e a Pedra Filosofai de J. K. Rowling. Usando


um pacote de estatstica ou uma calculadora TI-83 Plus, introduza aqueles 12 valores e obtenha uma listagem deles.

Excel

Introduza os dados na coluna A, clique em Arquivo e


selecione Imprimir.

Tl-83 Plus

Imprimir o visor de tela de urna TI-83 Plus s possvel se voc estiver usando urna conexo Graphlink para
um computador.

/'

Introduo Estatstica

25

"t/7~ tt?faf?fiUV ftlrtv tlt!/ttrminar t1"' frat# tlt!-' 17M~t1"'

mfrtt-'ftJ-?7Yei7 tt?ftJr(UtJ? natural?. "


O que voc faz?
Minha pesquisa se concentra na relao entre sociabilidade e estrutura populacional dos
cachalotes. Usamos essa informao para
construir melhores modelos de gerenciamento para a conservao desta e de outras espcies de mamferos marinhos.

Que conceitos de estatstica


voc usa?
Sarah Mesnick
Ecologista Comportamento/ e Molecular

Sarah Mesnick bolsista de


ps-doutorado do Conselho Nacional
de Pesquisa. Em seu trabalho como
biloga de mamferos marinhos, ela

Atualmente, uso as estatsticas qui-quadrado


e F para examinar a estrutura populacional,
e medidas de regresso para estimar o grau
de relao entre os indivduos dentro dos cardumes de baleias. Uso as estatsticas qui-quadrado e F para determinar quantas populaes discretas de baleias existem no Pacfico.
Populaes discretas so tratadas como estoques independentes. A anlise de regresso
da. relao usada para determinar as famnias dentro dos grupos.

realiza pesquisa no mar bem como no


Laboratrio de Ecologia Molecular. Sua
pesquisa se concentra na organizao
social e na estrutura populacional de
cachalotes. Ela recebeu o grau de
doutora em biologia evol utiva pela
Universidade do Arizona.

mente relacionados. Estamos descobrindo,


no entanto, que no so. A estatstica nos
permite determinar a probabilidade de que
dois indivduos sejam relacionados, dado o
nmero de alelos que compartilham. Tambm, o cachalote --.,.- e muitos outros mamferos marinhos, pssaros e espcies de tartarugas - so machucados e mortos aciden-
tal mente em operaes de pesca. Precisamos
saber o tamanho da populao da qual esses
animais so tirados. Se a populao for pequena, e a morte acidental for grande, a populao de mamfero marinho pode estar
ameaada. Usamos a estatstica para determinar o grau de isolamento entre estoques
naturais. Se os estoques estiverem isolados,
usaremos essa informao para preparar planos de gerenciamento destinados especificamente a conservar os mamferos marinhos na
regio. As atividades humanas devem proteger a sade do ambiente marinho e de seus
habitantes.

Qual o enfoque da sua pesquisa?


Voc poderia citar um exemplo
specfico que ilustre o uso da
estatstica?
Atualmente, estou trabalhado com amostras
de tecido obtido de trs massas encalhadas
de cachalotes. Usamos marcadores genticos
para determinar o grau de relao entre indivduos dentre os encalhados. Este um
comportamento surpreendente- cardumes
inteiros nadaram para a praia seguind<> uma
jovem fmea filhote, encalharam e, posteriormente, morreram todos. Pensamos que,
para fazerem algo to dramtico, os indivduos envolvidos deveriam ser muito proxima-

Tentamos no ter noes preconcebidas sobre como os animais esto dispersos em seu
ambiente. No caso de mamferos marinhos,
em particular, por serem to difceis de estudar, h noes geralmente aceitas sobre o
que os animais esto fazendo, embora isso
no tenha sido criticamente analisado. No
caso das relaes entre indivduos dentro dos
grupos de cachalotes, foram uma vez consi- .
derados matrilineares e acompanhados de
um "dono do harm" . Com o advento de
tcnicas genticas e dedicado trabalho de
campo, mais mentes abertas e mais anlise
crtica - aqui entra a estatstica - somos
capazes de reavaliar essas noes.