Vous êtes sur la page 1sur 91

I

)t,:

l'Rr lttAtn,n)AI)E
rA

l,lsllr olrr ir

('llnlir irrlrorlrtr.iru;t
rlrrs r'rrcirs

[tlolrrrlrilirlirtlc c rt l,stlrtslit it, It'ttrlrr


si<[o

s'l'rt

llirlrot'ir<[l ;rirtir irlrrtros

<k' < in< iirs lriolrigi< lrs, ('xlrlirs ('

hrrmanas. Ao

corrtliilio rlt'

orr(rrrs
<lc

rrItr'trlo Mlrgalhes lur l't'rlt'rlsrl <lc [,ima

textos e lcrlc'1ir'('s, os ttilli<'os

Estatstica l)escritivir rriro lrarrr apresentados en ur rnit o captrlo:

procurou-se

trodrrzir

csses conceil os

em paralelo corn outros tpicos mais tericos no decorrer do livro. Desse modo,.buscou-se desenvolver texto
de forma similar ao uso prtico da Estatstica, quando normalmente um

conjunto de dados explorado


descritivamente antes da modelagem
e aplicao de tcnicas estatsticas.

No foi explicitado o uso de nenhum


software em

particular, uma vez que

se

procuro enfatrzar

as idias envolvidas

e no a habilidade computacional.

No obstante, vrios exerccios

apresentados ao {im de cada seo


e em uma seo especfica ao final

de cada captulo

assumem o uso de
e

computadores para sua resoluo alguns conjuntos de dados mais


extensos so disponibilizados na
internet, o que estimula o

leitor

utilizar um programa computacional


com o qual tenha famiiariclade pan
ar

rxl

io ttits

t'csoltr'<-rcs.

)''

"

trpyrlglrt O hy Mulcos Nascinrcnlo Magalhcs c Arrtonio Carlos l)ctltoso clc Lima l" r'rlio 1999 (lMli-tJSP) ( lMll-l.JSl') .1" crlilio 2(X) I (lMli-tJSP)
J'' r'rlt1'rlo 2(XX)

Prefcio da 6s edio
eln Departamento de Estatstica do Instituto de Unversidade de So Paulo. Nesse perodo, foram ministradas diversas disciplinns lrrsicas de Estatstica para cursos nas reas de Cincias Humanas, Exatns e Biolgicas. Buscamos enfatizar dois aspectos neste livro. O primeiro se refere $ rcpartir a Estatstica Descritiva ao longo do texto, suavizando, assim, a transiilo pari Probabilidade e Variveis Aleatrias. Em geral, os alunos sentem o impacto <le uma maior formalizao e, muitas vezes, no conseguem estabelecer o elo clc ligao entre essas partes. Um segundo interesse transmitir a importncia dn colrputao na Estatstica. No atrelamos o texto a nenhum softvvare espec:ico, permitindo que o conhecimento computacional anterior dos estudantes pudesse ser incorporado, minimizando o desgaste de um novo aprendizado. Ressaltamos qUe vrios software disponveis no mercado podem ser utilizados. Os arquivos mencionados no decorrer do livro esto disponveis em www.ime.usp.br/-noproest juntamente com outras informaes de interesse' O livro contm exerccios ao final de sees e captulos. Os exerccios de seo so mais diretos e visam a aplicao imediata dos conceitos discutidos. Ao fim de cada captulo, um considervel nmero de exerccios ajuda os estudante$ nll fixao global das idias apresentadas. Tambm so propostos exerccios ptlrn serem desenvolvidos com a ajuda do computador. O principal objetivo desses exerccios, enfatizar as idias estatsticas envolvidas e no a habilidncle computacional. No Apndice'8, "apresentamos as solues comentadas dos exerccios de so e fornecems as respostas para os exerccios mpares de fim de captulo. Em relao edio anterior, a sext edio apresenta pequenfls rnodificaes. Uma das figuras do Captulo 7 foi mudadapara o Captulo 6, locnl que nos pareceu mais apropriado. Foram acrescentados exerccios em alguns captulos. Os erros em respostas, identificados at ento, foram corrigidos, Pequenas alteraes de redao tambm foram feitas. As mudanas, em relaO t quinta edio, esto listadas no endereo Internet mencionado acima. Ao longo das vrias ediges, diversos colegas contribuiram com sugestes, Entre eles destacamos Adilson Simonis, Cludia Monteiro Peixoto, Cllia Tsloi, Denise Botter, Elisabeti Kira, Elisete da Conceio Q. Aubin, Julio da Mottt Singer, Lighia B. Horodynski-Matsushigue, Lcia P. Barroso, Marli Mikael, Nelson Tanaka, Rinaldo Artes e Silvia Ferrari. Maria Ceclia Camargo Magalhies

Bste texto fruto da nossa experincia de vrios anos como professores

cl

Matenttica

Estatstica

crliro 2(X)2 (lJclusp) .1" crliro 2{X}2 (Ddusp) (rn ctlilo 2(X)4 (liclusp)
,1"

l )utkrs

lnlct nacionais dc Catalogao na Publicao (CIP) (('inrala Ilrasileira do Livro, SP, Brasil)

Mttgrt lhilt's, Mitt cos Nascinrento

Nuiics rlc I'robabilidade c Estatstica / Marcos Nascimento Mngllhitcs, nlonio Carlos Pcclroso cle Liml - ed. - So Paulo: Jltlilurl tlu IJrtive lsichclc de So Paulo, 2004. - (Acadmica; 40)
lllhliogr';r
li,rt

tstN

t5-3 I 4-077-3

L listltsticl t,1 0.171

lirrsirur 3. loltabiliclaclcs

llstuclo e Ensino 2. Matemtica - Estudo e - Estudo e Ensino I. Ttulo IL Srie.

cDD-5 t 9.507
ndicos para catlogo sistemtico:

l, 2,

l1\lirlslicl: Matcnriitica: Estudo e Ensino 519.507 lolrlhilitlrtilcs c Estatstica: Materntica:


lisluclo c

Errsino

519.507

I)ll'cllns lcsclvltlos

{i
Coutro d Ciaerap Ldarcai{h a do *hrreln

[Jnivclsidade de So Paulo l,rrciarto Gualbclto, Tlavcssa J,374 ('untlll lltl. rll ntiga leitoria - Cidade Universitria 0550tl U{X) .- Sio l'uulo - SP - Brasil I)ivisalo (lrrucrcial: tcl. (Oxxl l) 3091-4008 / 3091-4150 SA(l (0xxl l) 3091-291 I - Fax (Oxxll) 3091-4151 www,rrsp,lrr'/ctlusqr - c-mail: edusp@edu.usp.br

lklusp lulitrtrt tll


Av,

lrrl,

Iiibirotecl

ll.. :;,gil''rs

4658108

0\/0s

cr|sEra lrrslilulo rlc Mllcnttica c Estatstica - IME-USP l0l0 - Cidadc Universitria 0-55()t1"9(X) - S;io I'aulo - SP - Brasil l)cplrlnnlcnt( tlc listatstica - Tel. (Oxxl l) 3091-6129 / 3091-6130 ('uixil lrslIl (r(),2tI - 05315-970 rvww, irrx',rrsgr,lrr'/*ttoproest - c-mail: noproest@ime.usp.br
Ituil rkr Millikr,

l irt('(l iil
lroi leito o

llril/il

l(X)4

rlt'1tr1silo lcgal

vrt

vlu

Prefcio

colnborou na reviso final da redao. A estudante Tatyana Maya Okano auxiliou nn COrreo das respostas de vrios exerccios. Apontamos, ainda, o recebimento CJc vrrias mensagens eletrnicas com comentrios e/ou sugestes. A todos que Colnboraram, o nosso sincero muito obrigado. Agradecemos, ainda, aos alunos de vlrias unidades da USP, que apontaram erros e deram sugestes. Finalmente, gostaramos de agradecer a Lus Ricardo Cmara, da ADUSP- Associao dos Docentes da USP, pela diagramao das tabelas e auxlio na arte final de algumas dns figuras apresentadas no texto.

Contedo

Pedimos, desde j, desculpas pelos erros que sero eventualmente identificados nesta nova edio. As crticas e sugestes de colegas e estudantes
gcro muito bem-vindas e, certamente, auxiliaro na rnelhoria da prxima verso.

So Paulo, janeiro de2004

Marcos N. Magalhes

e Antonio Carlos P. Lima (marcos @ime.usp.br) (acarlos@ime.usp.br)

'
'

t"r

Contedo

Lista de Defnies
2.r
2.2
2.3

2.4

......,........ Probabilidade condicional ............. Independncia de eventos....... Partio do espao amostral


Probabilidade
Funo discreta de probabilidade ...........

.................... 38 ..................,,,42

.........,44 ............46

3.r
3.2
3.3

3.4
3.5

3.6
3.7 3.8
4.1

probabilidade Modelo Uniforme Discreto ........;.......... Modelo Bernoulli ................... Modelo Binomial Modelo Geomtrico Modelo Poisson Modelo Hipergeomtrico ........... Medidas de posio para um conjunto de dados
Funo de distribuio de

............63 ..............68 ......... 70


................... ..........72

......78

......,,,,,,79
.....,82

.......,..,......,,94

4.2
4.3

Medidas de posio para variveis aleatrias discretas ........................... 98

4.4
4.5
5.1

dados Varincia e desvio-padro em um conjunto de dados Varincia de uma varivel aleatria discreta Funo de probabilidade conjunta ...............
Amplitude de uma varivel em um conjunto de
Independncia de variveis

....,.. 103
......... 104 ....109

..,..128

5,2
.5.3

Probabi lidade condicional para variveis aleatrias discretas ............... 137

aleatrias

..........,... 137

5.4 5.5
.5.(r

Correlao entre variveis num conjunto de dados brutos ...........,.......,.

l4l

Covarincia de duas variveis


Correlairo entre variveis

aleatrias aleatrias .................


..t-,

.........,147 ................,.149

xu

Lista de Definies

6.1

6,2
6.3

6.4
6.5

........... ...... 168 Medidas de posio paravariveis aleatrias contnuas .....I73 .....................1,73 Varincia paravariveis aleatrias contnuas ..........177 Modelo Uniforme Contnuo .....180 Modelo Exponencial .................
Funo densidade de probabilidade

Lista de Figuras
1.1

Populao e amostra

r.2
1.3

....'..'....... Exemplos de grficos publicados na imprensa


Classificao de variveis Grfico de barras paa avarivel Idade

........"'."",.,',

d
'

..:'....."""""" l2

6,6
7,1

Modelo Normal
Parmetro

t.4
1.5

DiagramacircularparaavarivelToler.....'.'. .'.....'..""""""13
......."""':"""" 14 ......'.. .'..'.......'.15 Histograma paraavarivel Peso .'.'....'. ...'........""""" 18 Box-plot para o nmero de laranjas por caixa ....'.....".'.....18 Box-plot para a varivel Peso '.....'... .'.'......'."...'..'........ 19 Box-plotda varivel Peso para cada sexo ....'.,'..' 39 Regra de adio de probabilidades .'....... ....',,,,43 Regra do produto de probabilidades .'....... ,...,.,45 rvore de probabilidades ......'.. .'....,""""" 46 Partio do espao amostral (k : 6) ...........'.,..60 rvore de probabilidades - alteraes no subsolo ...........65 Funo de distribuio - doses de vacina .'...'...'.......,..,69 Modelo Uniforme Discreto [0, 10] .'."...'..'.........75 Grfico de freqncias - natalidade em porcos ..'.'7g Modelo Geomtrico (P: 0,0t) Modelo Poisson ( : 5) "..........."'.80 Independncia de variveis aleatrias '.....'.".."137
Valor esperado da soma de variveis aleatrias ..'.'.'.':"'......"'.......'....'. 145 Valor esperado do produto e independncia de variveis aleatrias ..,..146
Correlao para conjuntos de dados (brutos) Covarincia e correlao de variveis
xtu

7,2 7.3 7.4


7,5

Estimador e estimativa

.................. 208

t.6
1.7 1.8

......... Consistncia ................ Eficincia


Vcio

..................213 ...................213 ....................216

r.9
2,1

2.2
2.3

2.4
3.1.

3.2
3.3

3.4
3.5 3.6
5.1

5.2
5,3
.5.4
5,.5

.'.'.'....'.". aleatrias

'.'....151

..'.............

l5l

.qft

rlv

I'islu ilct liigrtnts

5,6 6,1 6,2 6,3 6.4 6.5 7.l 7.2 8.1

Varincia da soma de duas variveis


Densidade Uniforme

aleatrias

Contnua Densidade Exponencial """"""""' Densidade Normal


Aproximao Normal para o Modelo

""""""""" 151 ""' 178


"""""""""'180 ""' 183

Lista de Tabelas
l

Binomial """"""""' 189 190 Histogramas para valores simulados da Binomial """"""""""""""""' Efeito de n na distribuio amostral de X - N(10,I6/n) """"""""""22I
de Efeito do tamanho da amostra sobre a distribuio

Erros associados a testes de hipteses

X """"" """"""224 """"""'248

8'2Representaogrficadoserrosd'ep.,.'.....

S.3Representaogrficadaregioderejeio-unilateral...,.250
8,4Representaogrf\cadaregioderejeio-bilatera1

8.5 8,6 8.7 8.8 8.9 8. l0 8.1 I


9.1

Funo

Poder Student

"""""""""'

""""""'254 """"""""""'259 """""""""264 com Hoi F : Fo """"""""'265 """""""""'266


""'27O

EtaPas de um teste de hiPteses

Densidade -

Nvel descritivo unilateral Nvel descritivo bilateral


Densidade

"""""""

Regies desfavorveis num teste bilateral

"""""'1 .l lnformaes de questionrio estudantil - dados brutos """""""""' 9 1.2 Tubela de freqncia para a varivel Sexo """"" """"""""' 10 1,3 Tlbela de freqncia para a varivel Idade ""'"" """"""""" I 1,4 Tabela de freqncia para a varivel Peso """"" L5 TabeladefreqnciaparaavarivelTV""""""' """"""""'1l """" 100 4,1 Meclidas de tendncia central """""""""" 11 4,2 Medidas de disperso """"""""" 11 4,3 Propriedades da mdia e da varincia """""""' I l3 4,4 Modelos discretos- valor esperado e varincia """"""""""""""""""" 187 e varincia """"""""""""""""""' Modelos contnuos- valor esperado 6, I """''"""""211 7,l Estimadores para mdia' proporo e varincia """"'234 p Intervalos de confian apaa p e """"" 1 ,2 9,I Comparao de mdias para duas populaes """"""""""309 ""' 326 g,2 Tnbela de Anlise de Varincia (ANOVA)
1
1

"""""""' .f e Regio Crtica Snedecor

Cirsos na comparao de duas amostras

"""""""'

9.2
9.3

Distribuio de Fisher-

"""""""'295 """"""""""'317

Resduos no modelo de regresso linear simples

""""""""':""""""""'335

Captulo

Introduo Anlise Exploratria de Dados


t.1 O que Estatstica?
Neste captulo, pretendemos formalizar alguns conceitos que constitucrn tt base de tcnicas desenvolvidas com a finalidade de auxiliar a responder, de I'ortrtit objetiva e segura, situaes que envolvem uma grande quantidadc dc irrformaes. A utilizao dessas tcnicas, destinadas anlise de situitcs complexas ou no, tem aumentado efaz parte de nosso cotidiano. Tome-sc' pof

cxemplo, as transmisses esportivas. Em jogos de futebol, o nmero cle cscanteios, o nmero de faltas cometidas e o tempo de posse de bola so daclos
geralmente fornecidos ao telespectador e fazem com que as concluses sobre qunl

time foi o melhor em campo, se tornem objetivas (no que isso impliqlle que
tcnlra sido o vencedor...). O que tem levado a essa quantificao de nossas viclus no dia a dia? Um fator importante a populatizao dos computadores. No passado, tratar uma grande massa de nmeros era uma tarefa custosa e cansativtt, que exigia horas de trabalho tedioso. Recentemente, no entanto, grnnCle quantidade de informaes pode ser analisada rapidamente com um computudor

pessoal e pfogramas adequados. Desta forma, o computador contribui, positivamente, na difuso e uso de mtodos estatsticos. Por outro lado, o computador possibilita uma automao que pode levar um indivduo ser prepilro

especfico a:utilizar tcnicas inadequadas para resolver um dado problema. Assitrt, necessrio a compreenso dos conceitos bsicos da Estatstica, bem como 0s suposies necessrias para o seu uso de forma criteriosa. Entendemos it Estatstica como um conjunto de tcnicas que permite, de forma sistemtictt,

organizar, descrever, analisar e interpretat dados oriundos de estudos tltt experimentos, realizados em qualquer rea do conhecimento- Estatrtos denominando por dados um (ou mais) conjunto de valores, numricos ou nito. A aplicabilidade das tcnicas a serem discutidas se d nas mais variadas rels tln
atividade humana. A grosso modo podemos dividir a Estatstica em trs reas: o Estatstica Descritiva o Probabilidade o Inferncia Estatstica

Captulo 1: Introduo Anlise Exploratria de Dados

l.lOqueEstatstica?

Estatstica Descritiva , em geral, utilizada na etapa inicial da anlise, cprlndo tomamos contato com os dados pela primeira vez. Objetivando tirar concluses de modo informal e direto, a maneira mais simples seria a observao tlos valores colhidos. Entretanto, ao depararmos com uma grande massa de dados, lrcrcebemos, imediatamente, que a tarefa pode no ser simples. Para tentar depreender dos dados informaes a respeito do fenmeno sob estudo, preciso irplicar alguma tcnica que nos permita resumir a informao daquele particular conjunto de valores. Em outras palavras, a estatstica descritiva pode ser definida coto urn conjunto de tcnicas destinadas a descrever e resumir os dados, a fim de quc possamos tirar concluses a respeito de caractersticas de interesse. Probabilidade pode ser pensada.como a teoria matemtica utilizada para sc cstudarr a incerteza oriunda de fenmenos de carter aleatrio. Apesar de ser urrrn rrea extremamente atraente e estudada do ponto de vista matemtico, abordaremos, aqui, apenas os aspectos necessrios para as tcnicas estatsticas irprcsentadas neste livro. Inferncia Estatstica o estudo de tcnicas que possibilitam a cxtrapolao, a um grande conjunto de dados, das informaes e concluses obtidas a partir de subconjuntos de valores, usualmente de dimenso muito ffenor. Deve ser notado que, se tivermos acesso a todos os elementos que clesejamos estudar, no necessrio o uso das tcnicas de inferncia estatstica. Entretanto, elas so indispensveis quando existe a impossibilidade de acesso a todo o conjunto de dados, por razes de natureza econmica, tica ou fsica. Estudos complexos que envolvem o tratamento estatstico dos dados, tusnalrnente, incluem as trs reas mencionadas acima. Na terminologia estatstica, o grande conjunto de dados que contm a caracterstica que temos interesse reccbc o nome de populao. Esse termo refere-se no somente a uma coleo de inclivcluos, mas tambm ao alvo sobre o qual reside nosso interesse. Assim, nossa populniro pode ser tanto todos os habitantes de Sorocaba, como todas as lrnpaclas produzidas por uma ftbrica em um certo perodo de tempo, ou todo o sargue no corpo de uma pessoa. Algumas vezes podemos acessar toda a po;lulao para estudarmos caractersticas de interesse, mas, em muitas situaes, tal llroccciirnento no pode ser realizado. Em geral, razes econmicas so as mais clctclrninantes dessas situaes. Por exemplo, uma empresa, usualmente, no dispo clc vcrba suficiente para saber o que pensam todos os consumidores de scus proclutos. Hir ainda razes ticas, quando, por exemplo, os experimentos de lttlornttilio cnvolvem o uso de seres vivos. Alm disso, existem casos em que a irnpossillilitltclc clc sc accssrr toda a populao de interesse incontomvel. Na tndlisc rlo sirngr"rc cle unra pessoi ou em um experimento para determinar o tempo

cle funcionamento das lmpadas produzidas por uma indstria, no podemOS


observar toda populao de interesse. Tendo em vista as dificuldades de vrias naturezas para se observal todos os elementos da populao, tomaremos alguns deles para formar um grupo i Ser cstudado. Este subconjunto da populao, em geral com dimenso sensivelmentC rrenor, denominado amostra. A Figura 1.1 ilustra as etapas da anlige cstatstica.

Amostra

Figura 1.1: Populao

e amostra.

A seleo da amostra pode ser feita de vrias maneiras, dependendo, entre ()lrlr'os htores, do grau de conhecimento que temos da populao, da quantidade rlc rccursos disponveis e assim por diante. Devemos ressaltar que, em princpio, A sr:lciro da amostra tenta fornecer um subconjunto de valores o mais pareciclo possvcl com a populao que lhe d origem. A amostragem mais usada a
Eventualmente, se tivermos informaes adicionais a respeito cltt lrrrlrrrlirlio de interesse, podemos utilizar outros esquemas de amostragem muis so'isticuclos. Por exemplo, se numa cidade, tivermos mais mulheres do clue 111y111lrs, podernos selecionar um certo nmero de indivduos entre as'mulheres e outl'o nnrero entre os homens. Esse procedimento conhecido colno (tt,toslt'o!:ct"tt. astraificada. Outras vezes, pode existir uma relao numeradl dOS
(rtt!o,\lru r:ustral simples, em que selecionamos ao acaso, com olt sem reposi:o, os ilcrrs da populao que faro parte da amostra.

-"--qt Captulo

I:

Introduo Anlise Exploratria de Dados

1.2 Organizao de Dados

itens da populago (uma lista de referncia) que nos permitiria utilizar a chamada 1mostragem sistemtica em que selecionamos os indivduos de forma prdeterminada, por exemplo de 8 em 8 ou de 10 em 10. Outros esquemas de ilmostragem poderiam ser citados e todos fazem parte da chamada Teoria da

3. Discuta, para cadaum dos casos abaixo, os cuidados que precisam ser tomadOa para garantir uma boa concluso a partir da amostra. a. Um grupo de crianas ser escolhido para receber uma nova vacina contra

Amostragem, cujos detalhes no sero aprofundados neste livro. Assim sendo,


terminamos esta seo mencionando que quanto mais complexa for a amostragem' maiores cuidados devero ser tomados nas anlises estatsticas utilizadas; em contrapartida, o uso de esquemas de amostragem mais elaborados pode levar a uma diminuio no tamanho de amostra necessrio para uma dada preciso.

meningite. b. Sorteamos um certo nmero de donas de casa, para testar um novo


p.

sabEO

en

c. Uma fbrica deseja saber se sua produo de biscoitos est com o ssbof
previsto. d. Aceitao popular de um certo projeto do governo.

Exerccios da Seo 1.L:


1. Classifique em verdadeiro ou falso as seguintes afirmaes: a. Estatstica um conjunto de tcnicas destinadas aorganizar um conjunto de

1.2 Organizao de Dados


Nesta seo, discutiremos alguns procedimentos que podem ser utilizados

valores numricos.

b.

c.

Sempre que estivermos trabalhando com nmeros, deveremos utilizar a Inferncia Estatstica. A Estatstica Descritiva fornece uma maneira adequada de tratar um conjunto de valores, numricos ou no, com a finalidade de conhecermos o

pnrt organizar e descrever um conjunto de dados, seja em uma populaO OU em ulB omostra. Veremos como conceitos relacionados Teoria das Probabilidades 11pnrecem naturalmente, levando-nos, assim, a uma exposio maiS criteriosa dO
Rssullto.

fenmeno de interesse. d. Qualquer amostra representa, de forma adequada, uma populao.

A questo inicial : dado um conjunto de dados, como "tratar" os vttlofeE, nurnricos ou no, a fim de se extrair informaes a respeito de uma ou mAlC elllctcrsticas de interesse? Basicamente, faremos uso de tabelas de freqnclas e grc'('icos, notando que tais procedimentos devem levar em conta a natUreZ& dO
dnelos,

e. As tcnicas

estatsticas no so adequadas para casos que envolvam

experimentos destrutivos como, por exemplo, queima de equipamentos,


destruio de corpos de provas, etc.

Suponha, por exemplo, que um questionrio foi aplicado aos alunog do prirneiro ano de uma escola fornecendo as seguintes informaes:

2, Para as situaes

descritas a seguir, identifique a populao e a amostfa a validade do processo.de inferncia estatstica para Discuta correspondente. cada um dos casos. a. Para avaliar a efic'cia de uma campanha de vacinao no Estado de So Paulo, 200 mes de recm-nascidos, durante o primeiro semestre de um dado ano e em uma dada maternidade em So Paulo, foram entrevistadas a respeito da ltima vez em que vacinaram seus.filhos. b. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. c. Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por telefone com relao ao canal em que estavam
sintonizados.

Id:
Turma:

Scxo:
Iclade:

identificao do aluno turma a que o aluno foi alocado (A ou B) F se feminino, M se masculino


idade em anos altura em metros peso em quilogramas nmero de filhos na famli'a hbito de fumar, sim ou no

Alt:

Peso:

lilhos: lumn:

Toler:

tolerncia ao cigarro:

(I) indif'erente, (P) incomoda pouco e (M) incomoda muito

d. A fim de avaliar a inteno de voto para presidente dos brasileiros,


pessoas foram entrevistadas em Braslia.

122

. -Edl

Captulo

I:

Introduo Anlise Exploratria de Dados

1.2 Organizao de Dados

Exerc: Cine:
OpCine:

TV: OpTV:

horas de atividade fsica, por semana nmero de vezes em que vai ao cinema por semana opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa horas gastas assistindo TV, por semana opinio a respeito da qualidade da programao na TV: (R) ruim, (M) mdia, (B) boa e (N) no sabe

Tabela 1,1: Informaes de questiondrio estudantil - dados brutos,


.[d Turma Sexo Idade AIt Peso Filh Fuma Toler Exer Cine Opcine TV
OpTV

O conjunto de informaes disponveis, aps a tabulao do questionrio ou pesquisa de campo, denominado de tabela de dados brutos e contm os daclos da maneira que foram coletados inicialmente. Os valores obtidos para cada uma dessas informaes esto apresentados na Tabela 1.1. Cada uma das Caractersticas perguntadas aos alunos, tais como o peso, a idade e a altura, entre outras, denominada de varivel. Assim, a varivel Altura assume os valores (em metros) 1,60; 1,58;... e a varivel Turma assume os valores ou B. Claramente tais variveis tm naturezas diferentes no que tange aos possveis valores que podem assumir. Tal fato deve ser levado em conta nas anlises e, para fixar idias, vamos considerar dois grandes tipos de'variveis: numricas e no numricas. As numricas sero denominadas quantitativas, ao passo que as no numricas, qualitativ as.

varivel qualitativa quando os possveis valores que assume representam atributos e/ou qualidades. Se tais variveis tm uma ordenao natural, indicando intensidades crescentes de realizao, ento elas sero

ctassificadas como qualitativas ordinais. Caso contrrio, quando no possvel estabelecer uma ordem natural entre seus valores, elas so classificadas como qualitativas nominais. Variveis tais como Turma (A ou B), Sexo (feminino ou masculino) e Fuma (sim ou no) so variveis qualitativas nominais. Por outro lndo, variveis como Tamanho (pequeno, mdio ou grande), Classe Social (baixa, rndia ou alta) so variveis qualitativas ordinais. Variveis quantitativas, isto , variveis de natureza numrica, podem ser subdivididas em discretas e contnuas. A grosso modo, variveis quantitativas discretas podem ser vistas como resultantes de contagens, assumindo assim, em geral, valores inteiros. De uma maneira mais formal, o conjunto dos valores assumidos finito ou enumervel. J as variveis quantitativas contnuas assumem valores em intervalos dos nmeros reais e, geralmente, so provenientes de uma mensurao. Por exemplo, Nmero de Irmos (0, I,2, ...) e Nmero de Def'eitos (0, 1,2,.,.) so discretas, enquanto que Peso e Altura so quantitativas
contnufls.

1.AF 2AF 3AM 4AM 5AF 6AM 7\F BAF 9F IOAF 11 F 12 A F 13 A F T4AM 15AF 16AF LTAF 1g M 19 A F 30 A F 11 A F 22F 33 F 24AF 25 A F B6 A 3'/ B F 3E B F 39 B F 30 E F 31 B F 3 E M 3 B F 34 ll F 1E li M 16 t! Ir 1't 11 M t1 M 19 11 4r.) B M 41 t] F 4 Fr F' 41 HM 44DF 4F F F 4 E TI 478Iil 4E H F S H M h0 11 M
F.
1,'

1,7

18
1,8

19
19

L,60 60 ,5 1,69 55,0 L,85 12,8 l-, 85 80, 9 1", s8 55, 0


1_,76

20 l-8
t_8

T7

l-8
18
a1

I9
18
t-9 L7
1"8

20
l_8

2L 18
L8

20
L9

)^
z3
18

18 25 18 17
T7

L7
J.

18 77 2L
10
1A

L7 23 24 L8 18
L9 19

18

t7
1B

60,0 1,60 58.0 L,64 41,0 L,62 57,8 t,64 58,0 r,72 70,0 L,66 54,0 L,70 58,0 1, 78 68, 5 1,65 63,5 7,63 47 ,4 1.,82 66 ,0 1-,80 85,2 1,,60 54,5 L,68 52,5 1.,70 60,0 1,65 58,5 1,57 49 ,2 L,55 48,0 1.,69 57,6 L,54 51,0 L,62 63 ,0 L,62 52,0 L,57 49,0 t,65 59,0 t,6L 52,0 L,71. 73 ,0 t,65 56,0 r,67 58,0 1",73 87,0 r,60 47,0 1,70 95,0 L,85 84,0 1,70 60,0 1,73 '73 ,0 1,70 55,0 1,45 44,0 I,76 75,0 1,68 55,0 1,55 49,0 1,70 50,0 1,5s 54,5 r., 60 50, 0 L,8o 71,o 1,83 86,0

2 1 2 2 l3 1
3-

NAO
NAO

NAO NAO
NAO NAO NAO NAO NAO NAO NAO

SIM I SIM I

P M P P M M P M M M M

0101 52 52
a1

81.6R B7R M1.5R B20R B5R B7R MlOR M1-2R MlOR B8N BOR M 30 M2N BlOR B18R BlON BlOR B5R B14M B5R B5R BlOR M 28 M4N B5R M5R MlOR BL2R M2R M6N B 20 BL4R BlOR B25B M14R M12N B],OR BT2R B2R BlOB B 25 M1.4N B8R MlOR B8R B3R B5R M1.4R M 20
13 Z
.b{

3l22 102 02 6t 5l_ 4101 31 34 11


1)

3 2

L
3 2

ll3 2

SIM I NAO I NAO P NAO P NAO P NAO P


NAO NAO

3 2 1 1 1 2 2 2

NAO
NAO NAO NAO NAO NAO

SfM I SIM T

M P M

NAO I

1
2

P P
M

4
1-

L 3 L

NAO NAO
NAO NAO NAO NAO NAO

t
1 1 1 1 1 2 2 1 1

NAO P NAO M NAO f NAO M NAO NAO NAO NAO NAO NAO

SIM

P P M M M P P
T

NAO I

P
M

7
2

I
1 L

NAO

M M P P P

82 03 54 01 62 82 1"1 3L 12 22 1L 21 42 7L 51 1-0 64 52 4L 54 )) 70 51 01 01 43 2L "t0 70

Captulo

I:

Introduo Anlise Explorarta de Dados

1.2 Organzao de Dados

Resumimos a classificao das variveis no esquema apresentado na Figura I.2 (attulo de exerccio, tente classificar todas as variveis da Tabela 1.1).

Apesar de conter muita informao, a tabela de dados brutos pode nO Sef prtica pu.u r"rpondermos s questes de interesse. Por exemplo, da Tabela 1'1

rriro Nominal

imediato dizer se os alunos se incomodam muito ou pouco com Os

l'umantes. Porlanto, a partir da tabela de dados brutos, vamos construir UmO nOvtl

'
Varivel

-.ordinal

-a"Qualitativa

'Quantitativ u

1--""-Discreta

.-,contnua

liSura

1.2: Classificao de varidveis.

Vale ressaltar que, em muitas situaes prticas, a classificao depende de certas particularidades. Por exemplo, a varivel ldade, medida em nmero de anOS, pode ser vista como discreta, entretanto, Se levarmos em conta os dias, no absurdo falar que a idade 2,5 ou 2,85 anos, dando assim respaldo para classificla como contnua. Por outro lado, dependendo da preciso do instrumento utilizado para se obter medidas em um objeto, podemos ter limitaes no nmero cle casas decimais e uma varivel de mensurao pode se "tornar" discreta. E importante salientar que a classificao apresentada acima se refere natureza da varivel e, em geral, devemos utilizar o bom senso na hora de decidir qual procedimento adotar para caracterizar uma varivel. Para salientar tal fato, menciOnamos que podemos, inclusive, discretizar uma varivel contnua para obter uma melhor representao da ocorrncia de seus valores no conjunto de
dirclos.

t1$ela com as informaes resumidas, para cada varivel. Essa tabela Sefd clenominada de tabela de freqncia e, como o nome indica, conter os valOfeg dA virrivel e suas respectivas contagens, as quais so denominadas freqnelAEq ttbsolutas ou simplesmente, freqncias. No caso de variveis qualitativas OU tprantitativas discretas, a tabela de freqncia consiste em listar os valorog possveis da varivel, numricos ou no e fazer a contagem na tabela de dadOg lrrutos do nmero de suas ocorrncias. Representaremos por n; a freqncia dq vulor i e por ?? a freqncia total. Para efeito de comparao com outros grupOS ou conjunos de dadoi, ser conveniente acrescentarmos uma coluna na tabela de l.oqncia contendo o clculo da freqncia relativa, definida por fi = U/t\:, Convm notar que, quando estivermos comparando dois grupos com relaO S freqiincias de ocorrncia dos valores de uma dada varivel, grupos cgm Um nmero total de dados maior tendem a ter maiores freqncias de ocorrncia dos vtlores da varivel. Desta forma, o uso da freqncia relativa vem resolver Bte
problema.

A Tabela 1.2 apresenta


cln

as freqncias para a varivel Sexo, obtida a

p0rtir

Tubela I .1. Tabela 1.2: Tabela


de

freqnca para a varivel Sexo.


n,i
t t'7 d

Sexo

.t

F M total

13

0,74 0,26
1

n:50

Outro ponto que pode trazer confuso que, muitas vezes, na utilizao Cle programas computacionais, associamos cdigos numricos a uma varivel qqalitativa. Por exemplo na Tabela 1.1, pode-se associar ao sexo feminino o valor I e ao masculino 2. Apesar da varivel ser representada por valores numricos, issO no a torna uma varivel quantitativa. Novamente, vemos que a natureza da vnrivel deve sempre ser levada em conta na hora de se interpretar resultados obtidos na anlise descritiva.

Note que, para variveis cujos valores possuem ordenao n0tufel (eluglitltivas ordinais e quantitativas em geral), faz sentido incluirmos tambm urttrt coluna contendo asJreqncias acumuladas r,,'' Afreqncia acumulada at&
un1 cefto valor obtida pela soma das freqncias de todos os valores da varivel, tncnorcs ou iguais ao vator considerado. Sua utilidade principal ajudor o

estu$eleccr pontos de corte com uma determinada freqncia nos valores da vurivel. Poi exemplo, na Tabela t .3, observamos que 907o dos alunos tm idadcs rrt 2l unos, cle fato 22, um vez que este valor tem 'reqiincia zero.

l0

Captulo 1: Introduo Anlise Exploratria de Dados

L2 Organizao

de Dados

il

Tabela 1.4: Tabela Tabela 1.3: Tabela


Idade
L7 18
19
de

de

freqnca para a vardvel Peso.


fl,4

freqncia para a varvel ldade,


Peso
TLi

.ft

.f o"

40,01-- 50,0
50,0 60,0 70,0 80,0 90,0

lt. 0,16

fo"
0,16 0,60 0,76
0,BB

9 22
I

0,18 0,44

0,18
0,62 0,76

F
l--

60,0 70,0 80,0 90,0


100,0

22 8
6 5
1

0,44
0,16 0,L2 0,10
0',02
1

0,L4
0,08 0,06
0

20 2L 22 t ZJ 24 25

4
.1

0,84
0,90 0,90 0,94 0,96
1,00

F F

t--

0,98 1,00

0
2
1

total

n:50

0,04 0,02 0,04


1

total

50

cliscreta, mas

Com relao varivel Peso, lembremos que foi classificada como quantitativa contnua e assim, teoricamente, seus valores podem ser qualquer nmero real num certo intervalo. Aqui os valores variam entre 44,0 e 95,0 kg e foram medidos com apenas uma casa decimal. Ainda assim, existe um grande nmero de valores diferentes de modo que, se a tabela de freqncia fosse feita nos mesmos moldes dos casos anteriores, obteramos praticamente os valores originais da tabela de dados brutos. A alternativa que vamos adotar consiste em construir classes ou faixas de valores e contar o nmero de ocorrncias em cada laixa. Para a varivel Peso, usamos faixas de amplitude 10, iniciando em 40 kg. Na Tabela 1.4, escolhemos incluir o extremo inferior e excluir o superior. Dessa I'orma, a freqncia da faixa 40,0 F 50,0 no incluiu os alunos 46 e 48 que tinham peso igual a 50,0 kg. A opo de qual extremo incluir pode ser arbitrtria, n"os o importante indicar claramente quais so os valores que esto sendo conterdos em cada faixa. Apesar de no adotarmos nenhuma regra formal quanto ao total de faixas, utilizarnos, em geral, de 5 a 8 faixas com mesma amplitude. Entretanto, ressaltamos que faixas de tamanho desigual podem ser convenientes para
representar valores nas extremidades da tabela.

Vamos estudar, agora, a situao em que a varivel por natureza o conjunto de possveis valores muito grande. Por exemplo, a vflrivel TV, definida como o nmero de horas assistindo televiso, tem valores inteiros entre 0 e 30 e uma tabela representando seus valores e respectivas

ieqncias seria muito extensa e pouco prtica. O caminho adequado, nesse caso, trotar a varivel como se fosse contnua e criar faixas para representar seus vulores. Assim, passamos a tratar como contnua uma varivel que seria, originnlmente, classificada como discreta. Tabela 1.5: Tabela
de

freqncia para a varivel TV.

TV

ni
L4
12
18

.ft

61218 t-

0F-6
24

fu"
0,28 0,62 0,84 0,92 1,00

0,28 0,34 0,22 0,08 0,08


1

t7
11

4 4 50

24l---136 total

A organizao dos dados em tabelas de freqncia proporciona um meio


cl'icitz cle estudo do comportamento de caractersticas de interesse. Muitas vezes, tt irrbrnrao contida nas tabelas pode ser mais faci'lmente visualizada atravs dc grrl'icos. Meios de comunicao apresentam, diariamente, grficos das mais vlriidils formas para auxiliar na apresentao das informaes. rgos pblicos e ('nprcsos sc municiom de grrficos e tabelas em documentos internos e relatrios

--- qFFF

TF
1,2 Organtzao de Dados

t)

Cttpftulrt

l;

hilnxluiltt Antilise ll.rplorutrfu dt l)urlt*

de atividades e desempenho. Graas proliferao de recufsos grficos, cuja Cnstruo tem sido cada vez mais simplificada em programas computacionais,

equivocodr, Obviamente, questes

cxiste hoje uma infinidade de tipos de grficos que podem ser utilizados' Como ilustra deste ponto, apresentamos na Figura 1.3 alguns grficos publicados em
rrgos de imprensa.

ocorrer em qualque e,"7: pr-requisitos indispensveis divulgao tica e criterira de dados devem ser

p,id.*

de manipulao incorreta da informao n: cabe culpar a Estatstica' O uso e a


e

inegocirveis.

EVOLUO DO LUCRO tiQIDO


U$$ MII"HES
RECURSOS PROPRIOS

CIDIO

RU|AT

inrerrsa e representao. 'grfico

pizza, barras t vamos definir trs tipos bsicos de grficos: disco ou pode sef grfica na apresentao li$t(,t4ruma. como dissemos, a criatividade de vrios' entre os grficos que discutiremos sintetizam trs caminhos,

em repartir um disco em setores hem s variveis qualitativas nominais. consiste

de d.isco, otr pizza, ou ainda diagrama

circular,

se adapta muito

circularescorrespondentessporcentagensdecadlvalor,calculadas freqncia
exemplo, O,20 de rnnltiplicando-se por 100 a freqnca relativ f6.Por a207o o- u"' que 100 x 0'20:20' AFigura 1'4 apresenta relativa "o.r"rpond" da Tabela 1.1. Note que o cliagrama de disco para avarivel Tol-er, obljd^a.a .nartir fntiir correspondent categoria "indiferente" foi destacada.

'

LLiPLTO

8,9

12,

t5,9 COR|EAO INEGRAI

No

D[

C0NTRATCS

E[/ SIR = 22'l 0

VALO|ES A-IUATIZADOS NOS IOIDES DA

RECURSOS HUMANOS
DrsTRrBUrO POR ruvrL HtrnRRSUtCO

RECURSOS HUN/ANOS
DISIRISUO POR ESCOLARiDADE

ls I t e=
' ,=
TSCR

Figura 7.4: Diagrama circalar pard varilvel Toler'

=== == ==Gou == ==
2

CAIMS
23,891

l. Gor ==

SuPeior

ogrficodebarrasut\|\zaoplanocartesianocomosvaloresdavarivel eixo das ordenadas' no eixo das abiissas e as freqnciai ou porcentagens no barra com altuf8 Note que pIia cada valor a varivel desenha-se uma de grfico se adapta ,nrr"rptnd"rrdo sua freqncia ou porcentagem. Esse tipo
rnelhoi s variveis discretas ou qualitativas ordinais'

Figura 1.3: Exemplos

de grdficos publicados na im'prensa'

Deve ser notado, entretanto, que a utilizao de recursos visuais na


criao de grficos deve ser f'eita cuidadosamente; um grfico desproporcional em suas medids pode dar falst impresso de desempenho e conduzir a concluses

t4

Captulo

l:

Introduo Aruilise Exploratria de Dados

1.2 Organizao de Dados

t5

em cada faixa so homogeneamente distribudas, para um mesmo retngulo, fatias de mesmo tamanho contm uma mesma porcentagem de observaes. Apesar do suposio de homogeneidade no ser sempre verificada, ela bastante razovol em muitas situaes e pode ser uma boa aproximao da realidade.
25

20 .g

\r

c o
L

e15
E

$ru'

t;

10

18 le 20
,1" Fgura 1.5: Grftco de barras para a varvel ldade.

O histograma consiste em retngulos contguos com base nas faixas de valores da varivel e com rea igual freqncia relativa da respectiva faixa. Dessa forma, a altura de cada retngulo denominada densidade de freqncia oa simplesmente densidade definida pelo quociente da reapela amplitude da faixa.
Para a varivel peso, as densidades de cada faixa podem ser obtidas dividindo-se a

I 60 70 80 90 {) .?- Peso Figura 1.6: Histograma para a varivel Peso.


'

40x

/-'t'

100

da Tabela 1.4 por 10, que a amplitude de cada faixa. O histograma correspondente a essa varivel apresentado na Figura 1.6. Note que inclumos, no topo de cada retngulo, a porcentagem de observaes correspondente, para ftci I itar a interpretao. importante ressaltar que alguns autores utilizam a freqncia absoluta porcentagem na construo do histograma. Preferimos o uso da densidade de ou 'eqncia, pois ela faz om que o histograma no fique distorcido, quando amplitudes diferentes so utilizadas nas faixas. Uma outra vantagem diz respeito relao entre histograma e grfico da funo densidade de probabilidade, que ser visto mais adiante. O histograma tambm pode ser utilizado no clculo da mediana (mdor,), que o valor da varivel que divide o conjunto de dados ordenados em dois subgrupos de mesmo tamanho, Isto , das observaes ordenadas, 507o esto abaixo e 507o esto acima da mediana. Assumindo que as observaes da varivel

coluna

fi

Exemplo 1.1.' Vamos calcular a mediana da varivel Peso atravs do histogram, Inicialmente identificamos o retngulo que deve conter a mediana. Uma simplos soma das reas resulta que a mediana pertence ao intervalo [50,0; 60,0), uma vsz eluc at o valor 60,0 temos acumuladas 607o das observaes. Dentro dessa faixa, precisamos determinar um retngulo com rea igual a 34Vo, que o que falta para rringir o valor 50Vo. A situao ilustrada na figura a seguir, cujo retngulo
procurado est marcado com rea mais escura. Com uso de propores, estabelecemos a seguinte igualdade:
mdor,,

- 50 _ 0,34

60

- 50 lo

0,44

f;,li4 .,t. r

),

rtlt

JJ-' i,!t rn , 1-,


Y

,lr,

-,-' ,I''

"r'qr
t6 Captulo 1: Introduo AnIise Exploratria de Dados
1.2 Organizao de Dados

I7

q)

E p
a

0,05

(D

o,o+

6r,'6 : C,t\

.,,'60'--'^
''

0,03

',r"r''",'4'

o,o2

0,01

0,0 50
mdot,

60 Peso

Qt

Da segue qtte mdo6,

: 57,73kg.

tr

l)c

I'orma semelhante, obtemos para o terceiro quartil Qs

69,38

kg.

tr

4' O conceito de mediana, que ser considerado ern detalhes no Captulo em dividido dados pode ser generalizado para situaes em que o conjunto de o mais do q:ue dois subgrupos' Um caso importante aquele -em que dividimos conjunto em quatro iubg*pot. Para tanto, deveremos determinar' alm da de rn"iunu, dois valores tais qu 25Vo das observaes ordenadas estaro abaixo denominados' so um deles e 75Vo estaro abaixo do outro' Tais valores

respectivamente, primeiro quartil e terceiro quartil, Usualmente representados poi 8r e Q3. Note que a mediana, discutida anteriormerrte, representa o segundo clculo os valores dos quartis tambm pode ser feito atravs do

q""rii. O

histograma, conforme mostrado no exemplo a seguir.

Exemplo 1.2; No Exemplo 1.1, o valor da mediana (segUndo quartil) calculado atrav do histogram u, 57,73 kg. De forma semelhante, vemos que o valor do primeiro quartii tambm se encontra no intervalo [50,0; 60,0)' isto ' correrpondr ao valor 8r que determinar uma tea de 9Vo no retngulo correspondente. Assim, temos (ver figura a seguir)
Q^=

Para o clculo de quartis e medianas usando a tabela de dados brutos, prccisamos ordenar as observaes e escolher os valores que dividem os dados nits propores desejadas. Eventualmente, ser necessrio tomar mdias de vulores vizinhos. No caso de tabelas de freqncias, os dadosj esto ordenado ru procedimento similar. Uma representao grfica envolvendo os quartis o box-plot Definimoa, ul'nn "caixa" com o nvel superior dado pelo terceiro quartil e o nvel inferior pelo plirneiro quartil. A mediana representada por um trao no interior da caixa o segllcntos de reta so colocados da caixa at os valores mximo e mnimo, que rrlo scjam observaes discrepantes (o critrio para decidir se uma observao tliscrcpante no ser discutido aqui, mas, em geral, envolve a diferena entre o tercciro e o primeiro quartis)- O prximo exemplo ilustra a construo do box-plot pnrt uma varivel quantitativa discreta utilizando-se os dados brutos.

Ilwtttplo

: =-!o 0,09

*=

0,44 '

lo + Qt:52,,05kg'

1.3.' Suponha que um produtor de laranjas costuma guardar as frutns cm cuixus c estr interessado em estudar o nmero de laranjas por caixa. Aps um dia rle colhcita, 20 caixas foram contadas. Os resultados brutos, aps a ordenno, silo: 22, 29, 33, 35, 35, 37, 38, 43, 43, 44y 48, 48, 52, 53, 55, 57, 61, 62, 67 e 69, lrrrr osses dados, temos qe md,,6, ilfOo+ 11s) l2 : (44+48) 12 = 46, Annlogarnente, obtemos Qr : 36 e Qs :56. Tambm observamos que o nmero
r(-

\,i',,

511,,\

''i

r(.

18

Captulo 1: Introduo Anlise Exploratria de Dados

l,.l ()rganizao

de Dados

t9

mnimo de laranjas em uma caixa ' 22

o nmero mximo, 69. O box-Plot

correspondente apresentado na Figura 1'7'

Grficos tipo box-plol tambm so teis para detectar, descritivamentc, rliirl'crras nos comportamentos de grupos de variveis. Por exemplo, poclemos tturrsitlornr grficos da varivel Peso para cada sexo. O resultado apresentado nn l'jigrrlir 1,9, em que podemos notar que os homens apresentam peso mediano atrllet'iur ito das mulheres, alm de uma maior variabilidade'

60

100

90

3so e
E
J

80

o
40

En
I

60
30

50
I

40
20

Sexo

Figara 1.7. Box'plot para o nmero de laranjas por caixa'


atravs do box-plot bastante rica no sentido de informar, entre outras coisas, a variabilidade e simetria dos dados' Note'que na 1.7 os dados apresentam simetria acentuada (a distncia da mediana para

Irigura 1.9: Box'plot da varivel

Peso

para cada sexo,

A representao gr,fica

llxerr'clos

tll

Sco 1.2:
cacla uma das variveis abaixo em qualitativa (nominal

Figura

dos os"quartis a mesma), o mesmo podendo ser observdo a respeito da distncia Figura pono, de mnimo e mximo em relao mediana. Em contraste, temos na i.A o box-ptot paraa varivel Peso, que apresenta uma pecluena assimetria.

l, tlllssil'ique

/ ordinal) ott

rltmnl il rt i vil (cliscreta / contnua):

'100

90 80

3to L
60 50

$. Ocorrlrcia de hipertenso pr-natal em grvidas com mais de 35 anos (stl i ,,r tttrttlrtsf,opossveisrespostasparaestavarivel). l' ", t;t/titt( h, Inlelriio clo voto para presidente (possveis respdstas so os nomes dos ( ctttttlitlitrtts,almde no sei).''',,,t11 )1' t t'r, " C. l,r't'rh rlc pcso de maratonistas n Corrida de So Silvestre, em quilos. 'tl,\tt, 1'l maratonistas na Corrida de So Silvcstre rl, lrrlr.rrsirlnrlc clt perda de peso -" de ( l1 't.\ l;rtJ' (lt'Ve, tttoclCrilCla, fOrte). ' 1t r/ / , (lrrrrr rle satis'airo cla populao brasileira com relaro ao trabalho cle seu presirlerrte (vnlores de 0 a 5, com 0 indicando totalmente insatis'eito e 5 lrtlttltnettlc satisl'eito). i,,t tt! t (l' r/lr'l I , ,,1,','
'
,

40

l,

Figura 1.8: Box-plot para a varidvel Peso.

{Jrrirrzt pncientcs clc unra lrrica de ortopcdia foram entrevistados qunto ito nrnrr'r'r rk: r'ttcscs prcvistos cle I'isiotcrapin, se haver (S) ou niro (N) secltlelus

'.qt
20 Captulo

I:

Introduo Anlise Exploratria de Dados

1.3 O Uso de Computadares em Estatstica

2t

aps o tratamento e o grau de complexidade da cirurgia realizada: alto (A), mdio (M) ou baixo (B). Os dados so apresentados na tabela abaixo:
Pacientes 2
7 8
S 3 5

do que em uma regio industrial (Regio B). Para tanto, uma


Regio B
Peso

amostr

foi

tomada em cada regio, fornecendo a tabela de freqncias a seguir:

6
5
S

7 7

9 6

10 8
S

ll
6
S ts

t2
5

l3
5
S

I4
4 N

I 5

Fisioterapia
Seqelas

Cirurgia

s A

.N: ,N) A M

N M

N'
B

rN
ts

N)

ni
10
(,1,

a. Classifique cada uma das variveis. b. Para cadavarivel, construa a tabela de freqncia e faa uma representao

<60 60F70
TOFBO

34
109
111

grlica. Para o grupo de pacientes que no ficaram com seqelas, faa um grfico de c. barras para a varivel Fisioterapia. Voc acha que essa varivel se comporta
de modo diferente nesse grupo?

BOF90

>90
total

55

319
nas

3.

Os dados abaixo referem-se ao salrio (em salrios mnimos) de


funcionrios administrativos em uma indstria.
10,1
tt Jr9

20

a. Os dados apresentados sugerem que o grau de desnutrio diferente


duas regies? (Note que o total de observaes difere em cada regio).

nt lt
10,7

8,5
1,5

5,0

412

3,1

)) - )315

b. Construa, apartir dos dados das tabelas, um histograma para cada


9,0
914 6,1 6,1 de Faa uma suposio conveniente para as faixas no delimitadas.

regi0,

8;2

10,0

4,7

6,5

8,9

c. Com base nos

histogramas apresentados em

(b), obtenha as

medidas

a. Construa uma tabela de freqncia agrupando os dados em intervalos amplitude 2 apartir de l.


r. Construa o histograma e calculo o
1e

necessrias e construa o box-plot, um para cada regio. Com base nessa representao grfica, rediscuta o item (a).

e o 3e quartil.
a

4. Um grupo de

estudantes matemtica resultando em:

do ensino mdio foi submetido


Nota
freqncia
L4

1.3 O Uso de Computadores em Estatstica um teste


de

Foi mencionado anteriormente que o desenvolvimento da indstrirr de computadores deu grande impulso ao uso da Estatstica. Vrios progrumes
computacionais de uso comum contm rotinas estatsticas incorporadas s suas das planilhas eletrnicas, usualmente pi-instaladas em computadores novos. Programas especificamente desenvolvidos para efetuar anlises estatsticas so conhecidos como pacotes estatsticos. Existe um nmero considervel desses pacotes, alguns voltados para anlises mais comuns na dretl de humanidades, outros para a rea de biomdicas; alguns so extremamente simples de se utilizar atravs de menus, outros pressupem conhecimento de uma linguagem de programao especfica. Qualquer que seja o programa a ser utilizado, trs so as etapas que envolvem seu uso:
funes bsicas. o caso

0F-2

[a ,.r'

2+4

28 27
11 4

4-6
6FB 8F10
a. Construa o histograma.

b. Se a nota

mnima para aprova,o

5, qual

ser

porcentagem de

aprovao? c. Obtenha o box-plot.


5. Um estudo pretende verificar se o problema da,desnutrio em adultos medida pelo peso, em quilos, em uma regio agrcola (denotada por Regio A), maior

1 Entrada de Dados 2. Execuo da Anlise Estatstica 3. Interpretao de Resultados

A Entrada de Dados deve assumir certas convenes. Apesar de certos programas terem rotinas desenvolvidas de forma a simplificar a criao do banco

22

Captulo 1: Introduo Anlise Explqratria de Dados

1.4 Exerccios

23

de dados, intrinsecamente o que se tem a criao de uma matriz, em que cada linha corresponde a uma unidade experimental e cada coluna a uma varivel. Por unidade experimental, entende-se o elemento da populao ou amostra no qual observaremos as variveis. Por exemplo, na Tabela 1.1,

1".4

Exerccios

1. Responda certo ou errado, justificando:

observamos 50 unidades experimentais, os estudantes, nos quais foram observadas 14 variveis. Assim, os dados podem ser representados por uma matriz com dimenso 50 por 14. Leitores familiares com planilhas eletrnicas no tero problema em visualizar esta situao. Assim, quando estudamos uma nica varivel, consideramos a coluna correspondente. Se estamos interessados em saber o comportamento desta varivel em dois grupos diferentes (como na Figura 1.9), precisamos estudar os valores da coluna em que ela se encontra, conjuntamente com a coluna que contm a informao dos grupos' A fase da execuo da anlise estatstica pressupe o conhecimento de como o programa que est sendo utilizado trabalha as informaes. Torna-se, assim, importante se ter acesso ao manual do programa' Aps as informaes terem sido trabalhadas, vem a fase da interpretao dos resultados obtidos. Nesta hora, aconselhvel consultar o manual sempre que houver dvida, se o que foi calculado relaciona-se, de fato, anlise estatstica desejada. Ao interpretar as caractersticas observadas, importante verificar se resultados absurdos no esto ocorrendo. Em caso positivo, releia o manual e certifique-se de ter executado a anlise correta para os dados em questo. Em muitos casos, a fase de interpretao a mais difcil e interessante, pois envolve o equacionamento das caractersticas apresentadas na anlise com vistas a responder as questes inicialmente colocadas'
Exerccios da Seo 1.3:

a. Suponha duas amostras colhidas de uma mesma populao, sendo uma de tamanho 100 e outra de tamanho 200. Ento, a amostra de tamanho maior
b. Duas variveis diferentes podem apresentar histogramas idnticos' I c. Duas variveis combox-plol iguais no podem ter valores diferentes' Fj
mais representativa da populao. F

2.

Suponha que duas empresas desejam empreg-lo e aps considerar s uuntug"n. de cada uma, voc vai escher aqoel que lhe pgar melhor' Aps certa pesquisa, voc consegue a distribuio de salrio das errpresas, dadas segundo os grficos abaixo.
Empesa A Empresa B

5101520253035404550

Slrios Mnimos

Com base nas informaes de cada grfico, qual seria sua deciso?

3. Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo

l.

Utilizando alguma planilha eletrnica ou pacote estatstico disponvel e com as informaes da Tabela 1.1, construa um banco de dados para os 20 indivduos iniciais e as 4 primeiras colunas. Imprima e confira os valores digitados.

indagou sobre os diferentes tipos usados nas suas locomoes dirias. Dentre nibus, metro e trem, o nmero de diferentes meios de transporte utilizados foi

oseguinte:2,3,2, 1,2, 1,2, 1,2,3,I,1,1,2,2,3,1,1, 1,I,2, I, 1,2,2, 1,2,


1,2 e 3. a. Organize uma tabela de freqncia. b. Faa uma representao grfica. c. Admitindo que essa amostra represente bem o comportamento do usurio paulistano, voc acha que a porcentagem dos usurios que utilizam mais de um tipo de transporte grande?

2. Considerando o banco de dados criado no Exerccio 1 desta seo, construa histogramas para as quatro variveis e, baseado no grfico, descreva os seus
comportamentos.

3. Considerando o banco de dados criado no Exerccio

desta seo, divida a idade em trs categorias (menores de 18 anos, idade entre 18 e 21 inclusive, e maiores de 2l anos). Construa grficos de barra para essa varivel, incluindo toclos os indivduos e um para cada sexo. Interprete os resultados obtidos.

4. A idade dos 20 ingressantes num certo ano no curso de ps-graduao em jornalismo de uma universidade foi o seguinte: 22,22,22,22,23,23,24,24,
24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.

24

Captulo

l:

Introduo Anlise Exploratria de Dados

I -l li rrt t:cios

2.\

a. Apresente os dados em uma tabela de freqncia, incluindo a freqncia


relativa.

rl, l{cpita o item (c) para a varivel Salrio. r,. (lonsiderando apenas os funcionrios com mais de trs anos clc clsn,
tlcscreva o comportamento da varivel Salrio.

b.

Idades atpicas parecem ter ocorrido nesse ano. Aps sua retirada do conjunto de dados, refaa o item (a). Comente as diferenas encontradas.

Um novo medicamento para cicatrizao est sendo testado e um experimento feito para estudar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia. Uma amostra em trinta cobaias forneceu os valores: 15,17,16, 15, \7, 14,17, 16, 16,17,15, 18, 14,17, 15, 14,15,16,17, 18, 18, 17, 15, 16, 14,18, 18, 16, 15 e 14. a. Organize uma tabela de freqncia. b. Que porcentagem das observaes esto abaixo de 16 dias? c. Classifique como rpida as cicatrizaes iguais ou inferiores a 15 dias e

ll. I lrrr gnrpo de pedagogos estuda a influncia da troca de escolas no descntpcttlto tlt. llrrnos do ensino fundamental. Como parte do levantamento realizndo, lri nrotiulo o rrmero de escolas cursadas pelos alunos participantes do estttclo.
Escolas Cursadas
1

freqncia
46 57
2T 15 4

2
.)

4 5
ru.

como lenta as demais. Faa um diagrama circular indicando


porcentagens para cada classificao.

as

6.

O Posto de Sade de um certo bairro mantm um arquivo com o nmero de crianas nas famlias que se utilizam do Posto. Os dados so os seguintes: 3, 4, 3, 4, 5, r, 6, 3, 4, 5, 3, 4, 3, 3, 4, 3, 5,5, 5, 5, 6, ll, r0, 2, l, 2, 3, r, 5 e 2.
a. Organize uma tabela de freqncia. b. Faa uma representao grfica. c. Voc identifica valores nruito discrepantes? Que fazer com eles?
rr.

(.)rlrl a porcentagem dos alunos que cursaram mais de uma escola? Ir- ('onstrua o grrfico de barras. c. ('lirssil'i11r.rc os alunos em dois grupos segundo a rotatividade: a/c pnt'u itlulos cclur rnais de 2 escolas e baixa para os demais. Obtenha a titbclit tlc lr'r;iincin dcssa varivel.

Alrrrros tlir Escola cle Educao Fsica foram submetidos a urn lcslc rkr rr.sistrrciir rpranto ao nmero de quilmetros que conseguiram corrcr sert
( lrrrrirr'. )s clirclos cstiro apresentados a seguir. (-)rr;rl rr. ir vtriiivcl em estudo?

Um questionrio foi aplicado aos dez funcionrios do setor de contabilidade de


uma empresa fornecendo os dados apresentados na tabela.
Funcionrio
2
3

Curso (completo)

Idade
o

Salrio (R$)
1100,00 1450,00 960,00 960,00 600,00 600,00 600,00

Anos de Empresa
5 8 6 8
2 5 2
J

supenor superior
mdio mdio mdio mdio

b. ('orrsllrrir o ltistograma. e. ( )lrlt'rrltir o lnx-pktl. Faixas freqncia 438

43
31
dl

0t-4
4FB 8F12
12

4
5

24
25 27 22

206
125 22

6 1
8

mdio mdio
fundamental fundamental

F I6
F 20

9
10

2l
26

450,00 450,00 450,00


z

I6
I0.

a. Classifique cada uma das variveis. b. Faa uma representao grfica para

lltrrrPo t[r rrtiliziriio rlc citixus clctrnicos clcpcrrclc dc cada usurio c rlits tl lrrrirr's r'lctrrirtlirs. liorarn colctadas 2(l rncclidas dcssc tcmpo (crn rnirtutos):

varirvel Curso.

c. Discuta a melhor forma de construir a tabela de I'reqiincia para a vitriiivcl


Idade. Construa uma representao grii'ica,

l,t
I ,:t

1,2

1,7

l,i

I ,l'r

0,)
1,2

,:

t.4

.(i

l.('

,,1

1,2

I,0

0,)

lr7 l,g

1,0

1,0

0,8
I

I ,l-r

1,7

[,5

,ll

l-"r

26

Captulo

I:

Introduo Andlise Exploratria de Dados

I .l l';rtx:cios

,.J

a. Organize uma tabela defreqncia sem agrupar os dados. b. Agrupe os dados em faixas de tamanho 0,2 a pattit de 0,8 e obtenha uma
nova tabela de freqncia. c. Compare as tabelas obtidas em (a) e (b). Comente as diferenas' d. Se ao invs de 26 medidas tivssemos 1000, qual procedimento, dentre agrupar ou no, voc utilizaria? 11. Vinte e uma pacientes de uma clnica mdica tiveram o seu nvel de potssio no plasma medido. Os resultados foram os seguintes:

6,1
/t

612

617

615 714

6,9
712

7r7

7r5 7r5

7,7
716

7,6 8,2 7,5

8,3
716

8,1 7,4

6,3 7,2 8,1


r

714
t

7,6
716

7r7
7r5

7,6 7,4
714 714

8,1
714

7,9
7r5

7,8
7,5

rr- ( )rgnnize os dados em

faixas de tamanho 0,4 a partir de 6.

h. ('orrstrua o histograma. c. ('irlculc o segundo quartil.

Nvel 2,25 a 2,55 2,55 - 2,75


2,75 2,95

freqncia
1 t J

l.l. () lrirlcro de gols

marcados no ltimo campeonato daFederao Paulistl tle participantes nos seus 38 jogos uma varivel conl os pelos 20 clubes liutclxrl :;r'1it r i tttcs velores:

2,95

2 4 5 6

Clube
Gols

,
at td

6 57
16

7
dt

I
35
19

10

F 3,15 3,15 F 3,35 3,35 F 3,65


a. Construa o histograma.

32
11

42
72

35

79
15 6B

52

25 20 53

Clube
Gols

13

t4
4L

17 74

IB
29

55

70

42

66

47

b. Determine os 1e, 2e e 3e quartis. c. Qual a porcentagem dos valores que esto acima do nvel 3? 12. Foram feitas medidas em operrios da construo civil a respeito da taxa de hemoglobina no sangue (em gramas/cm3):
11,1 11,3 13,5 L2,2

ir, ('lirssi'iquc i varivel. Voc

LL,7
12,6 L2,3

12,5 73,4

13,9 L5,2 15,4

II,7
L2,7

12,3 L3,2
16,3

74,4

13,5

13,0 L5,2

13,6 16,9 72,3

!2,7
15,8 L3,7

12,6 L4,7
L4,1

acha razovel construir uma tnbclit tle l'r'ct;iincia de atcordo com a classificao dada? Ir. ('orrslnrt unra tirbela de freqncia agrupando as observaes em intcrvillos rlt, t:ornprirnento l0 a partir de 20 (no esquea de indicar clarnclto os irrlt't'vit los). r'. ( )lrtt'rrhir o histogranta. rt. (.)rrr lrorccntagent dos clubes mrcaram mais de 38 gols?

l, A t;rlrclir ir soguir
ar,

a. Organize os dados em faixas de tamanho 1 a partir do 1 1. b. Construa o histograma. c. Determine o terceiro quartil e a mediana. d. Taxas abaixo de 12 ou acima de 16 so consideradas alteradas e requerem

apresenta as freqtincias relativzts de ocorrncias de lrixns tle illluut (r.n cnt) para uma imostra de 100 criins de l2 anos de icladc.

('orrslt'ttit o histograma.
<t

lr, ( )lrlcrrhrr

lxtx-plo.

r'. I )r'st'ilrnclo-so sopirral' os l5o/o mis eltos, qual seria o ponto de cortc'/

acompanhamento mdico. Obtenha a tabela de freqncia Acompanhamento Mdico com duas opes sim ou no.

da varivel

L3. O valor mdio de comercializao da saca de milho de 60 cluilos nir Bols:t clc Cereais apresentado abaixo, em reais, para ltimos 40 meses.

28

Captulo

l:

Introduo Anlise Exploratria de Dados

I 'l l',ttn'cios

29

Faixas

freqncia relativa 0,10 0,25 0,30 0,25 0,10

Ganho

freqncia
45 83 52
15

F 110 110 F 120 120 F 130 130 F 140 140 F 160


100
1.6.

O ndice de germinao um dos principais fatores para definir a qualidade das sementes, Ele determinado em experimento cientfico conduzido pelo fabricante e regulamentado pelo rgos fiscalizadores. Um fabricante afirma que o ndice de germinao de suas sementes de milho de 85Vo. Para verificar tal afirmao, uma cooperativa de agricultores sorteou 100 amostras com 100 sementes em cada uma e anotou a porcentagem de germinao em cada
amostra. Germinao (Vo)

F 2,0 2,0 F 3,0 3,0 F 4,0 4,0 F 5,0 5,0 F 6,0 6,0 F 7,0
1,0

tH. Nrrrrr cstudo sobre rotatividade de mo-de-obra na indstria, anotou-sc o nunr(rro de empregos nos ltimos 3 anos para operrios especializados e nfro
tspt'r'iir Iizados.

tr, (lonstrua o diagrama de barra correspondente a cada tabela usanclo


Ir:rn'irs cla rotatividade
r's1 rr'c

it

porc:cntagem no eixo das ordenadas. b. ,lrrrrto as inormaes das duas tabelas em uma s e obtenha um diagratnn tle

freqncia
B

de mo de obra na indstria (sem dif'erenciar

it

60F75 75F80
BOFBS

ilrl iz.itiro). cle errtllrcgo'/

r'. Voc ircha que os trabalhadores especializados trocam menos


,f

20 42 18 10
2

rrslil'it1uc.

85F90 90F95
95

No Especializados ,; Iirnprcgos

izados

Empregos
1

TLi

I
2

106 222

2lo
342
109

F 100

2
J

338

a. Faa uma representao grfica da tabela acima. b. Construa o box-plot. c. Comente a afirmao do fabricante. 17. Uma nova rao foi fornecida a sunos recm desmamados e deseja-se avaliar sua eficincia. A rao tradicional dava um ganho de peso ao redor de 3,5 kg em um ms. A seguir, apresentamos os dados referentes ao ganho, em quilos, para essa nova rao, aplicada durante um ms em 200 animais nas condies acima. a. Construa o histograma. b. Determine o 1e, 2e e3e quartis. c. Voc acha que a nova rao mais eficiente que a tradicional? Justifique.

4
lr

292 164

4 5

9l
35 787

totitl

7I22

total

19, ('orrrtl ;lrltc do uurn avaliairo rndica em uma certa universidade, fbi rneclirln n lrr'r1irrciir cirrditca clos alunos do primeiro ano. Os dados so rprcscrttaclos
elrt:ir'1',ttirlit.

it. ( )lrtrrrlrir o histograrna. ll, lirctl(lrrciirs cnrclacls quc cstc.ianr rbaixo de 62 ou ercima de 92 rccluercrn irlrrrrrpirnlrirrrrcrrto rnclico, Quirl n porcentigem de alunos rcssits
r ltttliotrs'/ llrrur r', 'cr1lrrcil iur rcclor clc 72 baticlas por nrinuto considerada paclrio,

Vor't' irt'lrir rprc dc nroclo gcral csscs alruros sc cncaixaln ncssc caso'

.to

Captulo

I:

Introduo Anlise Exploratria de Dados

I J I t,'ttt'irts

3t

Freqncia Cardaca

freqncia
11

Slt'

60F65 65F70
70

35 68 20
L2 10
1

cada bateria por 207o acima do preo de custo, em l(XX) baterias fabricadas, descontadas as que repe, quanto ser seu lucro pol birtcria em funo do preo de custo?

o rbricante vende

t-

75

Durabilidade

freqncia relativa
0,02 0,05 0,15 0,25 0,30 0,23

75F80 80F85 85F90 90F95


95

100

0F3 3F6 6F9 I -L2 72-15


15F20

20. Um exame vestibular para uma faculdade tem 80 questes, sendo 40 de portugus e 4O de matemtica. Para os 20 melhores classificados,
apresentamos o nmero de acertos em cada disciplina, em ordem decrescente do total de pontos. a. Organize uma tabela de freqncia para cadavarivel. b. Faa uma representao grfica das tabelas obtidas em (a). c. Construa a tabela de freqncia da varivel total de pontos. d. Comente sobre a afirmao: os aprovados so melhores em portugus do que em matemtica. aluno Portugus
1

It,

lfr.st. jir-sc comparar trs tcnicas cirgicas pata a extrao de dente de siso, ('itrlir trrttir clas tcnicas foi aplicada em 20 pacientes e os resultados sio
apt r'st'rrtirrlus a seguir.
10

I '8. E
c)

.qo !t
o.

2 35 29

4
32 28
T4

5 31

6 30 26
T6

10

35
31
11

Matemtica aluno
Portugus

34 27

26 30

26 28
18

24 25

23 23

s6
&
c)
t--"

o d)

a,

28
15

F
rr

Es
4

t2
L2
t.\ z

t3
11

t7
L4

I9
B

20
10 20
*r, lirrr

23
27

20 20

17 27

T2

20
13

Matemtica

31

25

20

23

Tcnica cirrgica

21. Vinte baterias para automveis de uma certa marca foram testadas quanto sua vida til. O teste simula autilizao da bateria, acelerando seu desgaste de rnodo a criar uma rplica da situao real. Os resultados da durabilidade (em
mcses) so apresentados a seguir: a. Construa o histograma.
b. Se

rrrnr virlrlrcs a1-lloximados pilr

er

mediana de cada tcnica,

tttlrtvttltt ittlerqltdrtil. , dcl'inido colno e dil'erena entre o tcrccirc c irtrt'iro rlttiulis, Cllculc scu valor para cerda uma das tcnicers e comentc. 1rr .:. llir('ulit rr vlrrilrllilidlrclc do tcnpo dc rccupcrao ern cada tcnica.
ri. ,'jt,
r

b,ll

a amostra acima for considerada representativa do desempenho desszr rirce de bateria, quantas, em 1000 fabricadas, sero repostas pelo

r'rrr't-' t'r otirrrisla, clual tcnica

cscolhcria'l

3, tllr*. o

labricante, se ele o'erece 6 meses de garantia?

corrrPrrlirtlor') Os cllclos a scguir representam indivduos que btlrrr {r!rl'urinrr(krs llr,tlo vcrclo clc um ccrto tipo clc inseto e submcticlos ir Irrllrlrr'nl() (tr's rliI'crcnlos Iipos). As virriiivcis so:

-t2

Captulo

l:

Introduo Anlise Exploratria de Dados

,-t l','rrn'r:ios

33

No.: nmero associado aos pacientes; Idade: idade do paciente no momento de admisso' em anos;

Atrlvs do computador, crie uma planilha com os dados

apresentados.
:

Diag: tempo, em horas, gasto entre


administrao do tratamento;

contato com

inseto

Recup: tempo, em horas, entre

administrao

do tratamento

recuperao; Tratam: tipo do tratamento administrado; Coag: presena de cogulos no momento de admisso.
Pac.No.
T9

lirsoando-se nesta planilha: l. Cltssifique cada uma das variveis. ll. Construa uma tabela de freqncia (atravs do computador) para a virivel Diag. Utilize 5 classes. lll. Atravs de representao grfica adequada, compare os trs tratametos

corn relao idade dos pacientes. Voc diria que a idade se distribui
Itotttogeneamente nos trs tratamentos?

lv. l{cpita o item (iii) para a varivel Coag. b, Strltctrrha, que ao invs de trabalhar corn a varivel ldade, cria-se uma novl vurirvcl denominada Etrio, assumindo valor 0 se Idade for menor que 29 rlnos c I caso contrrio. Utilizando o computador: l. lixplique como voc poderia criar tal varivel. ll, Construa um box-plot para a varivel Recup, para cada grupo de Etrio, Corn base nos grficos, voc diria que o tempo de recuperao diferente dependendo da faixa etria? Justifique sua resposta' , tJmn nova varivel denominada Cura criada: Cura ser rpida se Recup frrr rnenor ou igual a 10, ser normal se entre 10 e 40 (inclusive) e ser lentct pnt'n lccr.rp acima de 40. Verifique, graficamente, se pacientes em cada umit clns cntcgorias de Cura apresentam diferenas no que se refere ao tempo
eltttr! o ccltttitto com o inseto e a administrao do tratamento.

Idade
28
15

Diag
7

Recup
3

Tratam

Coag
nao nao

4
27
7
14 5
11

52 30 53
3

45 23

76
15

II I II
I

slm
stm
nao nao nao
S S

46
2 42 47 41
12
51

2l
11

II
I I I

46
55

16 16

10

54
13

25 6

47
18

ilI
II
ru II

m m

59

nao

l6
20

40 24
32
31

20
J

l1
1

slm
nao nao nao

Elt nttlttit',t:; ilc dutlos mencionados nos exerccios a seguir podem ser obtidas ent lflPlt" llr, rt,y t, b r/- n rt p ro e s t

l3
15 8

9 9

J
-)

il il
I

#,

10

44
9 10

40
J 4
11

18
T2

3t

3l
46
21

il il
m

24
21

t3
1

2
B

il

22
-)

39

l7
53

il
I I
III III
I]

l5
9 75 54 35

46
39 22

slm slm slm sim slm slm slm


nao

(LIse o corrrputador) Os itens seguintes referem-se aos dados contidos no f'rluivo clr.: nome cancer.txt. Esse arquivo contm os dados de uma pesquisa fOtrrr: irrcidOncia de cncer e apresentado em 9 colunas representando ns rEu i nlFs vitritvcis de interesse:
e'eilttntt

l:

iderrt i l'icao do paciente.

e'ulumr 2i tliitgttstico:

2 23 26

42
30

I = nlso-negativo: diagnosticados como no tendo a doena qunnclo nl verclade a tinham, 2 = ncgativo: diagrrosticados como no tendo a doena quarrdo ele
'ato niro a tinham. - = llositivo: diagnosticados corretamente como tendo er doena. 4 = lulso-positivo: diagnosticados como tendo a doena quando na
verclircle niro tinham.

slm
nao
S

l8
t2
-58

l6
5

l7
9

In

50

II

m ln

ilutu.li

irlnrle.

34

Captulo

l:

Introduo Anlise Exploratria de Dados

1,4 l',ltex'cios

35

coluna 4: espectro qumico da anlise do sangue-alkaliine phosphatose (AKp). coluna 5: concentrao de fosfato no sangue (P). c o luna 6 : enzima, lactate dehydro genase (LDH). coluna 7: albumina (ALB). coluna B: nitrognio na uria (N). coluna 9: glicose (GL).

d. Crrlcnle a rea til total para cada apartamento. Armazene esta informao er uma varivel denominada Total. Repita os itens (b) e (c) para a varivel 'lrtal, c. Buserndo-se nos itens anteriores, voc diria que existem diferenas nas reas rkrs apartamentos dos blocos A e B? Em caso positivo, qual(is) cmodo(s)
rrplcsenta(m) o problema?

a. Escolha 3 variveis dentre as colunas 2 a 9. classifique-as e faa o


histograma e a tabela de freqncia para cada uma delas (se necessrio, crie
at cinco faixas).

f.

b. unia

afirmao feita por alguns mdicos a de que o grupo dos falsopositivos mais jovem do que o dos falso-negativos. para os dados dessa pesquisa, o que voc diria a respeito? Justifique sua resposta baseando-se em grficos e tabelas de freqncia.

lrxplore descritivamente os dados referentes a problemas estruturais (rlchaduras e infiltraes). Com a informao contida na varivel Andar clivicla os apartamentos em trs categorias dependendo do andar onde se cncontra: baixo, mdio e alto. Estude a ocorrncia de rachaduras e
in'i ltraes para cada categoria.

l,

25. (Use o computador) Um empreendimento imobilirio consistiu da construo de dois edifcios residenciais, com apartamentos de I dormitrio e rea til de fi #. Em uma primeira fase, foi construdo apenas um edifcio, denominado

"'Bloco 4". Para a concluso do Bloco B houve uma troca de empreiteiras.

Suspeita-se que seus apartamentos foram construdos com metragem diferente daquela especificada na escritura. O arquivo areas.txt contm as seguintes variveis, obtidas por peritos de uma firma independente:

(tJse o computador) Os itens seguintes referem-se aos dados contidos no rquivo de nome aeusp.txt, que contm parte dos dados de uma pesquisa, reslizuda pela Associao dos Educadores da USP (AEUSP), sobre aspectos eio-econmicos e culturais de comunidades de baixa renda da regio do utunti, So Paulo. O questionrio foi respondido por um dos moradores dn g sortcada para participar da pesquisa. Os dados esto organizados da gtlinlc lbrma:

golund /: Nmero do questionrio (Num). alunu 2: Comunidade (Comun).


alnnu.?: Sexo (Sexo): L : masculino;

Id: Bloco: Andar: Final:


Sala:

identificaoda observao no arquivo bloco a que prtence o apartamento


andar onde o apartamento est situado

feminino.

nmero identificando a posio do apto. no andar reada sala, em m2


rea da cozinha, em m2 rea do banheiro, em m2 rea do dormitrio, em m2 ocorrncia de rachaduras no apto: 0 - no, 1- sim ocorncia de infiltraes no apto: 0 - no, I - sim

Faixas de idade, em anos (Idade): 1 = 114,25);

Cozinha:
Banheiro:

Dorm: ' Infiltr:


Rachad:

no empreendimento? Quantos apartamentos existem por prdio? E por andar? b. Construa tabelas de freqncia para cada uma das variveis quantitativas contnuas e faa grficos adequados, c. Repita o item (b), para cada bloco, separadamente. construa grficos clo tipo box-plot e compare as reas para cada cmodo considerado.

a. Explore o arquivo de dados. Qual o nmero total de apartamentos

[35,45); [45, oo). Hltl,d 5l Bstado civil (Ecivil), 1 : solteiro; 2 = casado;

3: 4: :

2:125,35);

ll

clivorciado;

outro. eetlttnu (t: llegiio de procedncia (Reproce). ttunt 7i Tentpo de residncia em So Paulo, em anos (Ternposp), :olwtil li Nmero de residentes na casa (Resid).

= l'r =

vivo;

Captulo 1: Introduo Anlise Exploratria de Dados

coluna 9: Trabalho (Trab):

: 2: 3:
1

sim;

no;
aposentado.
:

habilidades
Introduo
No captulo anterior, vimos como caracterizar uma massa de dados, com o

coluna l0: Tipo de trabalho, s para os que trabalham (Ttrab) 1 : emPregado com carteira; 2 : emPregado sem carteira; 3 4 5

rural. coluna I l: Idadeque comeou a trabalhar, em anos (Itrab). coluna 12: Rendafamiliar em faixas de reais (Renda):

: : :

profissional liberal;
autnomo;

do organizar e resumir informaes. Neste captulo, apresentamos o nntemiltica que d a base terica para o desenvolvimento de tcnicas
atlens tt $erem apresentadas no restante do livro.

-- [0,150); 2:1t50,300);
g

Denominamos fenmeno aleatrio

situao

ou acontecimento cujos

: [300,450); 4 : [450, 900); 5 - [900,1500); 6 : [1500, oo).


coluna 13.' Acesso a computador (Acompu): 1 sim;
nao. coluna t4: Srieem que parou de estudar (Serief). Branco : no parou de estudar; 1a B : sries do ensino fundamental; 9 aL2: sries do ensino mdio. a. Explore o conjunto de dados e classifique as variveis. Verifique se existem variveis com valores incompatveis ou invlidos e proponha alternativas para a soluo do problema. Observe que existem variveis com respostas em branco e discuta porque isso acontece. b. Estude a varivel Renda em funo de Comun. Voc diria que os moradores da Cohab e do Jardim d'Abril tm a mesma renda? Justifique sua resposta baseando-se em grficos e tabelas de freqncia. c, Verifique se o comportamento'da varivel Temposp influenciado pelo tipo
de trabalho (varivel Ttrab). d. Faa um box-plot para a varivel ltrab.

no podem ser previstos com certeza. Por exemplo, as condies clo prximo domingo no podem ser estabelecidas com total acerto, O pocle ser dito da taxa de inflao do prximo ms. Veremos que, cm como essas, modelos podem ser estabelecidos para quantificar os
dus diversas ocorrncias.

z:

Aprcsentamos, a seguir, alguns conceitos de teoria dos conjuntos, que ados neste captulo. Chamamos de espao amostral ao conjunto de todos possveis de um certo fenmeno aleatrio. Ele ser represontedo letfa gregn O (mega). Os subconjuntos de 0 so denominados eventoge aclos pelas letras latinas maisculas A,8,. . . . O conjunto vazio, como jl lelpnnl, ser denotado por 0. denotada por AUB, represento tt A unio de dois eventos A e ia ele, pclo menos, um dos eventos Aou B. Ainterseco do evento

B,

Dois eventos A e B siro disjuntos ou mutuamefie exclusivos quando no lcmcntos ern coffrur.Isto , Ao B A. Dlzemos qr,re e B so complementares se sua unio o espao amostral lnteraeclo vuzia. O complementarr de ser representado por " e temos U ', _: fl e .zt A,,

, denotrrcln por.rl a B,

a ocorrncia simultnea de

A e B.

:4.

Vamos considerar probabilidade como sendo uma funo

P(')

que
n

valores nurnricos aos eventos do espao amostral, conforme a defiriio

37

38

Captulo 2 : Probabilidades

?,1 ltitit,tlttl'tt

39

efnio

2.

: Probabilidade

fll:n popullo, definimos a probabilidade dele ter uma certa idade


fuqttrre irr rclativa associada respectiva idade. Assim,

pela

uma funo P(.) denominada probabilidade se satisfaz as condies:


?)

0< P(A)< 1,VcQ;


P(A)

P(17)

0,18; P(18)

0,44;

...; P(25) :

0,04.

tr
a

i,i,)

r;

No 1lrximo exemplo, obtemos a probabilidade da unio de eventos.

ii P(UAj) j:t

: t P(A, com os 7t disjuntos. .i:r

2.2; Considere a Tabela L2 do Captulo 1, contendo informaes

tr

pergunta que poderia surgir seria: como atribuir probabilidades aos elementos do espao amostral? H duas maneiras principais de responder essa
questo.

r tlirs 'cqiincias da varivel Sexo. Sabendo que 52Vo dos alunos esto na A e 48Vo ni turma B, suponha que escolhemos um estudante ao acaso da lnno, Quirl seria a probabilidade de escolhermos um estudante do sexo r ott itlgurn da turma B?

l)rrs inbrrnaes a respeito da freqncia relativa acima e da Tabela 1.2,

delas consiste na atribuio de probabilidades, baseando-se em caractersticas tericas da realizao do fenmeno. Por exemplo, ao lanarmos um dado, temos o espao amostral 0: {1,2,3,4,5,6}. Admitindo que o dado foi construdo de forma homognea e com medidas rigorosamente simtricas, no temos nenhuma razo para privilegiar essa ou aquela face. Assim, consideramos

A primeira

/'(/") : 0,74, P(M) :0,26, P(A) :0,52, P(B):


Flor l

0,48.

P(1)

P(2)

:. '. :

P(6) :716.

Uma outra maneira de obter probabilidades atravs das freqncias de ocorrncias. Observando as diversas repeties do fenmeno em que ocorre a varivel de interesse, podemos anotar o nmero de ocorrncias de cada valor dessa varivel. Para um nmero grande de realizaes, a freqncia relativa poderia ser usada como probabilidade. For exemplo, desejando estabelecer as probabilidades de cada face de um dado sem fazer nenhuma suposio inicial sobre sua construo, usamos a experincia de sucessivas ocorrncias. O ponto delicado decidir quanta experincia necessria para se fazer a atribuio de probabilidades, com alguma garantia de no se estar muito distante do verdadeiro valor. Questes dessa natureza no sero discutidas aqui e fazem parte doS captulos de inferncia estatstica. Por ora, vamos assumir que, medida que O nmero de repeties vai aumentando, as freqncias relativas se estabilizam em um nmero que chamaremos de probabilidade. Em cincias biolgicas e humanas, essa a forma mais comum de atribuir probabilidades. De modo geral, diremos que estamos fazendo um sorteio aleatrio ou ao acaso em uma populao, se a escolha desse ou daquele elemento s depende da probabilidade a ele atribuda, seja atravs da freqncia relativa ou de algumit
suposio terica.

E,videntemente isso no pode acontecer, pois o valor clu llidnde poclc ser, no mximo, igual a 1. No difcil perceber que estamos n trlg,rrns elcmentos duas vezes, pois ao considerarmos apenas estudantcs tXo l'errrinino, temos estudantes da turma A bem como da turma B e ao los upotes i turn'a B, temos estudantes do sexo feminino e masculino, on r:sluclnntcs do sexo feminino e da turma B, isto , o evento F O B, estd Ito rlvcnlo ,;' c tambm no evento B.Logo, precisamos subtrair umi vez n IJ) ;turn obter a probabilidade correta. Desta forma, temos qllc il ilitlrrtle rlit unio FU B igual somadas probabilidades de ,F' e B menos lirlnrlc rlu interscco f' O B. tr
I

trilidrrdc que precisamos determinar pode ser representada por P(F U B), guLl se sirnplesmente somarmos P(.F') com P(B), obtemos uma somn

A plohnbilidaclc da unio de eventos calculada atravs da regru dct tltt ltnilnhilitlutlcs apresentada ni Figura 2.1. No faremos unlu lf rio lrrrnul, pois ncreditamos que o resultado bastante sirnples c
itivo,

Exemplo 2.1: Para a varivel ldade, ver Tabela 1.3 clo Captulo l, o cspito amostral ser f) : {17,18, .. . ,25}. Supondo que um aluno escolhiclo ao icoso

ltignra 2.1: Ilegru de adio dc probahiliclaclcs.

40

Captulo 2 : Probabilidades

2.2

robab ilidade Condic ional e Indep endnca

4T

2. Sendo A e B dois eventos em um mesmo espao amostral, "tadrtza" pafa


Observe quo, se A e B forem disjuntos, a expresso acima se reduz sorna das probabilicdades dos eventos A e B, pois a interseco vazia e a correspondente probabilidade nula. A regra de adio de probabilidades pode ainda ser expandidan para mais de dois eventos. Jente, por exemplo' escrever a expresso para P('$UBUC) considerando D: Bl)C e aplicando a regra de
adiro de probabilid,lades duas vezes.

linguagem da Teoria dos Conjuntos, as seguintes situaes:' a. Pelo menos um dos eventos ocorre. b. O evento ocorre mas B no. c. Nenhum deles ocorre. cl. Exatamente um dos eventos ocorre.

Comq conseqncia da regra da adio, obtemos que, para qualquer evcnto A c {1,

3. Uma universidade tem l0 mil alunos dos quais 4 mil so

considerados csportistas. Temos, ainda, que 500 alunos so do curso de biologia diurno, 700

P(A):I-P(A'),
que pode ser verificada aplicando a regra da adio com Ac no lugar de B. Tctnos,

cla biologia noturno, 100 so esportistas e da biologia diurno e 200 so csportistas e da biologia noturno. Um aluno escolhido, ao acaso, e perguntasc a probabilidade de:
a. Ser esportista. b. Ser esportista e aluno da biologia noturno.,-:l c. No ser da biologia. d. Ser esportista ou aluno da biologia. c. No ser esportista, nem aluno da biologia.

tr(Art

A')

: : :

P(A) + P(A") p(A) + P(A') p(A) + P(")

P(A A")
P(A) 0.

Como P(Au A) :

P(Cl) :

4. Sejam
1, segue imediatamente a igualdade desejada'

Ilxerccios da Seco 2.L: 1. Para cada um dors casos abaixo, escreva o espao amostral correspondente e conte seus elementos' a. Uma moeda anada duas veze,s, e observam-se as faces obtidas' b. Um dado lranado duas vezes e a ocorrncia de face par ou mpar

A e B dois eventos em um dado espao amostral, P(B) : p, P(AU B) : 0,5 e P(A n B) : 0,1. Determine o valor de p. 5. l)ois processadores tipos A e B so colocados em teste por 50 mil horas. A
probabilidade de que um erro de clculo acontea em um processador do tipo A de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: ri. Pelo menos um dos processadores tenha apre.sentado

,--(,,,-/ :9,2, tais que P(A)

b. Nenhum processador tenha apresentado erro? c. Apenas o processador A tenha apresentado erro?

"rrorc---.-u--\

c. Uma urna contm 10 bolas azuis e 10 vermelhas com dimenses


rigorosamento iguais. Trs bolas so selecionadas ao acaso com reposio e
as cores so arnotadas.

observada.

2.2 P r obabilidade Condicional e Independncia

'-

na soma L Dois dados sio lanados simultaneamente e estamos interessados


clas faces observadas.

Em muitas situaes prticas, o fenmeno .aleatrio com o


srrccssivas.

qual

g( Em uma cid;ade, famlias com 3 crianas so selecionadas ao ' anotando-se o sexo de cada uma.
observa-se o nmero de defeituosas na prxima hora. cafi.

Irrrbalhamos pode ser separado em etapas. A informao do que ocorreu em uma rletr-:rrninada etapa pode influenciar nas probabilidades de ocorrncias das etapas Nestes casos, dizemos que ganhamos informao e podemos "recalcular"

acaso,
e

peas por hora, escolhe-se um instante qualquer . f.'Urna mquina produz 20

g. Uma moeda lanada consecutivamnte at o aparecimento da primeira

rrs probabilidades de interesse. EsSas probabilidades "recalculadas" recebem o Irrrrrrc cle probabilidade condicional; cuja definio apresentamos a seguir.

'

42

Captulo 2 : Probabilidades

?.

J l' t r il x

It i I i

datle Condicional e Independncia

43

Defino 2.2 : Probabilidade c ondicional


Dados dois eventos A e B, a probabilidade condicional de ocorreu .B representada por P(A I B) e dada por

Ples srrposies iniciais, 1/ ) B

: H e ento, P(H n B) : P(H):

0,02.

dado que

Ettln,t,

'| Caso P(B) : g, P(Al B) pode ser definido usaremos P(Al B): P(A).

P(Al \ B\

: '

P(!,1,8). PB) \ /' > 0. P(B)


arbitrariamente; neste texto

P(Htrl:r#?:

ffi:0,025
l
no espao amostral'

ftgur rr, n scguir, apresenta o efeito da informao

tr
O = Regio (100 km2)

Exemplo2.3.' Considere a seguinte situao hipottica. Uma grande regio de 100 km2 contm um aqfero (reservatrio de gua) subterrneo com rea igual a 2 km2, cuja localizao _ desconhecida (ver figura a seguir). A fim de determinar a posio do aqfero, perfuraes so feitas ao acaso. Vamos representar por If o evento de encontrar gua. Temos P(H): 0,02, obtido pelo quociente da rea do aqfero pela rea total, onde usamos que o espao amostral f) : {regio de 100

k*t.

C)'= Nova Regio (80 km2)

= Regio (100 km2)

@ e:ptr,, rrtttostral perdeu

20 kmz , que a rea descartada para novos

furos, tr

j novos furos. Representamos essa informao por


km2

Suponha agora que, aps uma ano de pesquisas, uma rea de cerca de 20 foi amplamente perfurada sem encontrar gua e pode ser descartada para

fr

l)rr tlc'iniiro de probabilidade condicional, deduzimos a regra do produto Stnilultililrulcs, uma relao bastante til que apresentadanaFigura2'2,

1. Qual seria, agora,

a,

probabilidade de um furo, feito ao acaso, atingir o aqfero? Vamos representar por P(H I 1) u probabilidade desejada. Com a mesma argumentao utilizada acima, a nova regio de procura terrea B0 km2 e portanto P(H I I):0,025, Isto , como espervamos, a probabilidade de obter gua aumentou devido i informao recebida. Vamos refazer esse clculo utilizando agora a frmula de probabilidade condicional. Para tal, seja B a nova regio de procurir correspondendo a rea total inicial menos a parte que foi descartada para novas tentirtivits. Temos que P(B) : 0,8. O evento H a B representa a ocorrncin dc, scrn ncnhuma informao etuxiliar, ncontrarmos gua num 'uro f'eito na regiiro .R.

Itigura 2.2: Regra do produto


I lrrr

de probabilidades.
cle

corrceito nruito inrportante em probabilidade o da irulependnciu

etrrl.t,\', rllrL1 rict'ii utiliznclo rcpeticlitntcntc ao lottgo de toclo o texto'

44

Captulo 2 : Probabilidades

P rt tl t

il ti I i r k u I c

Co

ndic ional e Indep end nc ia

45

Deftnio 2.3: Independncia de eventos


no de

Dois eventos A e B so independentes, se a informao da ocorrncia ou no altera a probabilidade da ocorrncia de ,4. Isto ,

P(Al

B): P(A), P(B) > o,


.
B)

ol
0.9
5

ou ainda a seguinte forma equivalente:

P(A

P(A) P(B).

tr
0,0
5

o.;
o2

No difcil verificar que se A , independente de B, ento B independente de A. O uso da expresso acima permite, ainda, verificar que o evento vazio independente de qualquer evento. As demonstraes so deixadas a cargo do leitor. E muito comum, primeira vista, confundir eventos independentes e eyentos disjuntos. O prximo exemplo ajuda a esclarecer essa questo.
Exemplo 2.4: lJnaempresa produz peas em duas mquinas 1e f f , quepodem apresentar desajustes com probabilidade 0,05 e 0,10; respectivamente. No incio do dia de operao um teste realizado e, caso a mquina esteja fora de ajuste, ela ficar sem operar nesse dia passando por reviso tcnica. Para cumprir o nvel mnimo de produo pelo menos uma.das mquinas deve operar. Voc diria que a empresa corre o risco de no cumprir com suas metas de produo? Seja O; o evento da mquina i estar operando, ,i : 7,2. Pelas informaes disponveis temos P(Ot): 0,95 e P(O2): 0,90. Na Figura 2.3, apresentamos um diagrama conhecido como rvore de probabilidades, qu'e consiste em representar os eventos e as probabilidades condicionais associadas s realizaes. Cada um dos caminhos da rvore indica
uma possvel ocorrncia.

oi
o;
Figura 23: rvore
de

probabilidades.

A tabeln u seguir resume as ocorrncias e suas respectivas probabilidades,


Eventos

Probabilidade

oro,
OrO'

ol'o,
o'o;'
nilleluinn opcrando.
U (, t( )i'
t
J

0,95x0,90:0,855 0,95x0,1,0:0,095 0,05x0,90:0,045 0,05x0,10:0,005


corresponde

Parn otrter o nvel mnimo de produo di'ria, precisamos ter pelo menos

Isto

ocorrncia

do

evento

No preenchimento dos valores de probabilidades na rvore, observe que assumimos a independncia entre 01 e 02, pois acreditamos que a eventual falta de ajuste em uma mquina no interfere no comportamento da outra. Note que, no caso de independncia, o segundo ramo da rvore no afetado pela ocorrncia

Oj'0r.Ternos,

t1(()(),,Q OLOI u O'O2)

P(OQz) + P(OLO;') + P(O'O),

r ll'e renlizflcs so disjuntas. Por exemplo, no possvel as duns


e ao mesmo tempo s a mquinn .I lncs estnrenr operunclo (evento (evento O()').Dessn brma, conclumos que a probabilidade d manter o trfninro dc procluiio 0,995, Portanto, a empresa tem alta probabilidade de
r1n Huns rnetus cle produo.

dos eventos que aparecem no primeiro ramo. Portanto, pela definio de independncia, segue que P(O2l Ot) : P(Or): 0,90. Para facilitar a notao, vamos escrever O1O2 para o evento OtOz.
sua probabilidade da ocorrncia dada pelo produto dos ramos que levam nesse evento. Isto correspondendo aplicao da regra do produto de probabilidades:

Op)

tr
uniflo contenrplt toclas as possveis

P(Ap2)

P(Oz I 01) P(Ol).

No exernplo anterior, os eventos representados pelas interseces g,f,l1(J,j', ()i02 c Oi'Oi'lonnnrn novos cventos que tm a propriedacle de
ltlulrlnnrente exclusivos

e cuja

46

Captulo 2 : Probabilidades

F tt

il t

t I t

iI

il h ul c Co

ndicional

e Independncia

47

combinaes. Eventos que satisfaam essas duas caractersticas tm importante


papel no clculo de probabilidades e, assim, merecem destaque.

Definio 2.4: Part.o do espao amostrsl


Os eventos Cr,Cz,... ,Ct, formam uma partio do espao amostral, se eles no tm interseco entre si e se sua unio igual ao espao amostral. Isto ,

Ca)Ci:Q

Para

i'+i

1,

U Ci:9. .i:t

tr

A Figura 2.4 apresenta um exemplo de uma partio com 6 eventos.

A=

(A

nFr) u

(A.F) u (nq)

uittcln,estar interessados em saber qual a probabilidade de que a amostra tenlrir siclo obtida do leite fornecido pela fazenda F1, isto ,, P(4lA), lmpllen er se inverter a probabilidade condicional conheciOa P(lF'1). conro cssa so tpicas para o uso do resultado apresentado a seguir, tr

l e que suas probabilidades EFl evr:ttlo A, se conheam as


le
,,

dc llnycs: Suponha que os eventos Ct,Cz, ... ,Cn formem


linto, para qualquer

Figura 2.4: Partio do espao amostral (k=6).


Exemplo 2.5.' Suponha que um fabricante de sorvetes recebe 20Vo de todo o leite que utiliza de uma fazenda F1, 307o de ura outra fazenda F2 e 50Vo de -F's. Um rgo de fiscalizao inspecionou as fazendas de surpresa e observou que20Vo do leite produzido por .F'1 estava adulterado por adio de gua, enquanto que para F2 e Fs, essa proporo era de 57o e 2Vo, respectivamente. Na indstria de sorvetes os gales de leite so armazenados em um refrigerador sem identificao das fazendas. Para um galo escolhido ao acaso, vamos analisar o leite para decidir sobre sua adulterao ou no.

11

3,

. , ft,

j,

uma sejam conhecidas. Suponha, ainda, que probabilidades P(AlCt) para todo

I'(C,il A) :

P(A I c P(c j)
i:l

D p(A I cr) p(cr)

ro: t)r clcl'inio de probabilidade condicional temos

P(ci I A) :
Etettdor
lgnedo
r

P(C1n A)

P($
ser reescrito

dcssl expresso pode


f,'i, isto
,

'pela regra do produto,

Se denotarmos por o evento "o leite est adulterado", temos que P(Al.p'r) : 0,20, P(Al Fz):0,05 e P(Al rs):0,02. Alm disso, .F'1, F'2 e ,F3 formam uma partio do espao amostral pois uma dada amostra de leite vem, necessariamente, de uma e apenas uma das trs fazendas. Desta forma, o evento pode ser escrito em termos de interseces de com os eventos F1, F2 e F3, conforme ilustra a figura a seguir.

P(A;1n A)

: P(AC : P(Al C,:j)P(C.j).


:

EEttlFletnr u clentonstrairo note qu

r,,(A) :Dnra.ci) :Do(1l


i=l
i=L

l;

c,) P(c).

tr

48 '"

( t,' u \")
^\ . s')

-- T ((trn.r1')

- lC-0" v-w d"t- J'lv'ng.r.,rzn


Captulo 2: P

i,

( a) b'\ - P (

('*t'r',-,ll'

rr(,.

p[n'', -? (al@)

49

Exemplo 2.6: Yoltando situao do fabricante de sorvetes (exemplo anterior), podemos agora calcular facilmente a probabilidade desejada, isto ,

l/

rt tt'irttrito: se dois eventos so mutuamente exclusivos ento eles'

lnrlelrcttclcntes.
;e com 0,8 se chuva de 0,3. O So Paulo probabilidade de a Sctcrnbro eve, l'inr probabilidade ter chovido nesse qual de a ull1n l)nrticln em Setembro,

A) P(FrlA):--i(A)-

P(.il)

Pgulo llutebol Clube ganha com probabilidade 0,7 se chove

P(A I F'l)P(rl)

que sc
e, ento les.

AeB

so independentes ento

A e B"

tambm io

P(Frlrl:

:0,615.

reelos
fuedn vicitclu de modo que a probabilidade de sair cara 4 vezes maior I de urir coloi. Para 2 lanamentos independentes dessa moeda,
p@btthiliduclc de sair somente uma cara. pbchiliclnde dc sair pelo menos uma cara. ffebntrllidurle de dois resultados iguais.
urrr conjunto de 4 nmeros dos quais nenhum deles zero, dois so c dois sio negativos. Sorteamos ao acaso, com reposio, 2 nmeros enjunto, l)eterrnine a probabilidade de: deler r,rer negntivo.
qune ietrle set negativo. dclr nrrrerc)s terem o mesmo sinal.

Portanto, a probabilidade de que a amostra de leite em questo tenha si produzida pela fazenda F1, de 0,615 em contraste com as probabilidades 0,231 0,154 para as fazendas F2e F3, respectivamente. Exerccios da Seo 2.22

L. Considere dois eventos A e B, mrtumente exclusivos, com P()

:0,3

P(B) :0,5. Calcule: a. P(An B). b.P(Au B). /-t c.P(Al B). (-" d. P(A.). e. P((A u B)").
/

2. Se P(AU B)
de:

0,8;P()

0,5 e

P(B)

r, determine o valor de rno

caso

a. Ae -B serem mutuamente exclusivos., b. e B serem independentes. U'

& nt) -- 12,l'(Dl A):r


I

) - lllaf'@ l) :3/5ento AeB nopodemserdisjtrntos' :


e

He

sf,o vrlliclas

ats

afirmaes:

P(A lB)

Lf2 ento

An'/ao pode estar

f,tldn ettt /J.

3. Uma escola do ensino mdio do interior de So Paulo tem 40Va de estudanteg


do sexo masculino. Entre estes, 207a n]unca viram o mar, ao passo q\e, entre A meninas, essa porcentagem de 50Vo. Qual a probabilidade de que um aluno
selecionado ao acaso seja: a. Do sexo masculino e nunca tenha visto o mar? b. Do sexo feminino ou nunca tenha visto o mar?

lnu c fi clo 'crnirrino bram reprovados, 8 do sexo masculino e 14 do lno frtrurn ttprovndos, Para um atluno sorteado dessa classe, denote por M lutto eseollrirlo br do scxo masculino e por se o aluno foi aprovado.

lrce dr, estustica tcve a seguinte distribuio das notas finais: 4 do sexg

'/

F1d

t=t

ltl";,

a.SeP(f) :0,4;P(A) =0,7e P(A

nr)

= 0,3;calculc P(AI D"),

F(' F(d | /1/).

rr ilI"),

50

Captulo

robabilidades

ft'r't{'i,,f

5t

d.P(M'I

A). e,P(M I A). ?eas produzidas por uma mquina so classificadas como defeituosas,
,"c,rpe.veis ou perfeitas com probabilidade de 0, 1 ; 0,2 e 0,7 ; respectivamente. De um grande lote, foram sorteadas duas peas com reposio. Calcule:

a. P(duas serem defeituosas) b. P(pelo menos uma ser Perfeita). c. P(uma ser recupervel e uma perfeita). E se o ,,@)t"Oiqu. as suposies utilizadas para resolver os itens anteriores. vsorteio for sem rePosio? 6.Paradois evento s A e B,num mesmo espao amostral, verifique, atravs ile um diagrama, que sempre possvel escrever o evento A como sendO : P(An B) + P(A B")' e"o A1U ( n B") e que, portanto, vale P()

ttttr l)uirrg existem trs empresas de TV a cabo e 20 mil residncias. A 'l'A lcrn 2100 assinantes, a TB tem 1850 e a empresa TC tem 2600 :in1ttl,,s, scttclo que algumas residncias em condomnios subscrevem aos lr'u tlc: urais de uma empfesa. Assim, temos 420 residncias que sito Irlr:s tlo TA e TB, 120 de TA e TC, 180 de TB e TC e 30 que sito rrtrs tlns trs empresas. Se uma residncia desse bairro sorteada ao ruu, quttl l probabilidade de:

Fr nssirrlrrtc somente da empresa TA? A$lttnr 1rclo tncnos uma delas?

!Ee t.'r''l'V n cabo?

gttrrrit'ios guardam as bolas de voleibol e basqete. O armrio 1 tem 3

de vrrleibol

de basquete, enquanto o armrio 2 tem 3 bolas de I r' ? clc basquete. Escolhendo-se, ao acaso, um armrio e, em seguida'

eI

tle runs bolus, citlcule a probabilidade dela ser:

7.

Numa cidade do interior de So Paulo, estima-se que cerca de 20Va doS habitantes tm algum tipo de alergia. Sabe-se qne 50Vo dos alrgicos praticam esporte, enquanto que essa porcentagem entre os no alrgicos de 407o'PatA aleatoriamente nessa cidade, obtenha a probabilidade um indivduo
de:

p vok ibol, sitbcndo-se que o armrio 1 foi escolhido' burq,,.,*, sitbcnclo-se que o armrio 2 foi escolhido.0

fu buE,lrrcte,
Fgclctrtcs clc uma Clnica de Ginecologia com idade acima de 40 anos, trr rrrr lrtrn casadas e 407o so solteiras. Sendo solteira, a probabilidnde f tlrlo urn rlistrbio hormonal no ltimo ano de I07o , enquanto que poftl ftnrn I r e sstt probnb i I idade aumenta para 30Va' Pergunta-se : QU*rl tr prtoltnbiliclade de uma paciente escolhida ao acaso ter tido um dlrlr'trirt ltortttottal ? e A pncierrte sortcada tiver distrbio hormonal, qual a probabilidade de ser

"r"olhido

a. No praticar esporte. ' ', b. Ser alrgico dado que no pratica esportes.

8. As preferncias de homens e mulheres por cada gnero de filme alugado em uma locadora de vdeos, esto apresentadas na prxima tabela'
Sexo \ Filme Homens Comdia
136

Romance
92 195

Policial 248
62
A

:sltit'u'/

Mulheres

r02

excullr!'rnus cluits pacientes ao acaso e com reposio, qual

pfolruhilirlittlc clc pclo lrenos uma ter o distrbio?

Sorteando-se, ao acaso, uma dessas locaes de vdeo, pergunta-Se probabilidade de: a. Uma mulher ter alugado um filme policial? b. O filme alugado ser uma comdia? c. Um homem ter alugado ou o filme ser um romance? d. O filme ser policial dado que foi alugado por um homem?

Yt*

elttr,'g.tt il s!:tl amigo uma cart, destinada sua namorada, parat sgt :4111 tro crtrrcio. Entrcttnto, ele pode se esquecer com probabilidade 0,1 . llu Er. i,sr.lltec:cl', l probltrilidacle de que o correio extravie a carta de 0'1, lSetttr:, st: liri cnviacla pclo correio a probabilidade de que a namorada nlio

1
nO

,f,Ooit dados equilibrados so lanados' Calcule a probabilidade de: a. Obter o par (3,4), sabendo-se que ocorreu face mpar no prirneiro dado. ,,'i' ' ll. Ocorrcr face mpar no segundo ditdo, sabenclo-se quc ocorrcu acc par
pritttciro dado.

tscehrr rt tL: 0, I . Efu trrrrturt'urlit ttio rcccbctt o carta, qual a probabilidade de seu amigo tel prquecirto tlc crtloct-la no corrcio'l

br

Avrrltr, rrs llossillilidnclcs clcsse rlanoro cotttinuar, se a comunicaiio tepett,l,,r rltts ctrtits ottviitdas.

52

Captulo 2 : Probabilidade

ttr t,',,,.r

53

14. Numa certa regio, a probabilidade de chuva em um dia qualquer de primavera de 0,1. Um meteorologista da TV acerta suas previses em 807o
dos dias em que chove e em907o dos dias em que no chove. a. Qual a probabilidade do meteorologista acertar sua previso? b. Se houve acerto na previso feita, qual a probabilidade de ter sido um dia de chuva?

Flnr'rtttlt'ttt' gua em at duas tentativas.

Eneottlt'rtr iigtta.

UFt ttrrurlico closconfia que um paciente tem tumor no abdmen, pois isto nn 70(k' clos casos similares que tratou. Se o paciente de fato tivcr o

15. A tabela a seguir apresenta informaes de alunos de uma universidade quanto s variveis: Perodo, Sexo e Opinio sobre a Reforma Agr'ria,
Determine a probabilidade de escolhermos: a. Uma pessoa do sexo masculino e sem opinio sobre a reforma agrria? b. Uma mulher contrria a reforma agr6,ria? c. Dentre os estudantes do noturno, um que seja a favor da reforma agrria? d. Uma pessoa sem opinio, sabendo-se que ela do sexo feminino?
Perodo
Sexo

o lurror, o exame pode, erroneamente, indicar que tem com lirlirrle 0,1. Se o exame detectou um tumor, qual a probabilidade clo lcnte t lo tlu lto?
tlvr.r
t*helu dos 1000 ingressantes de uma universidade, e classe scio econmica. de estudo sobre rea lnfolrrrrrt'ics
rt segttir itpresenta dados

, u rxnno rrltra-som o detectar com probabilidade 0,9. Entretanto, se ele

Area \ Classe
Exatas

Alta
L20
72 169

Mdia
156
B5

Baixa
68 LL2
-q L)

Reforma Agrria Contra

Humanas

A Favor
8

Sem opinio 2
8

Biolgicas

I45

Diurno Noturno

Feminino Masculino Feminino Masculino

2
8

BFI ttltttur ittplt'cssiutte escolhido ao acaso, determine a probabilidade dc:

9
8

&r

du clussc ccontrrica mais alta.

4
T2

&tg,l,tt'ttu rit'cit clc exatas. &tu,lgr t,,, 1il'r:i dc humanas, sendo de classe mdia.
gf du r'lrsstr bitixit, clado que estuda na rea de biolgicas.

10

,.,,.

16. Trs candidatos disputam as eleies para o Governo do Estado. O candidato do partido de direita tem30Vo da preferncia eleitoral, o de centro tem307o e o da esquerda 40Vo. Em sendo eleito, a probabilidade de dar, efetivamente, prioridade para Educao e Sade de 0,4; 0,6 e 0,9 para os candidatos de direita, centro e esquerda, respectivamente. a. Qual a probabilidade de no ser dada prioridade a essas reas no prximo governo? b. Se a rea teve prioridade, qual a probabilidade do candidato de direita ter ganho a eleio? ,.

it probabilidade de gostar de teatro , Il3, enquinto gostlr rlc cinerna 112. Determine a probabilidade de gostar de tcatro tlc
t'r:r'lrr poprrlitiro,

:lc citrt'rttir, rtos scguintes casos:

grlnl'rlt, lerrtnr o gostilr cle cinema so eventos disjuntos. lnrttu'rh' lntltrr o gostar de cinema so eventos independentes.
Fgd,,r rlllr' loslnr clc teatro gostm de cinema. A Frrihirlrilirlrtrlo clc gostitr de teittro e de cinema Ll8. flenlre os (lue nio gostam de cinema, a probabilidade de
;l/.1,

nro gostar de

tcitlro

lf:.Uma companhia

que fura poos artesianos trabalha numa regio escolhendo, "leatoriamente, o ponto de furo. No encontrando gua nessa tentativa, sorteio outro local e, caso tambm no tenha sucesso, faz uma terceira e ltirnn tentativa. Admita probabilidade 0,7 de encontrar gua em qualquer ponto dcssn
regiro. Calcule a probabilidade de: a. Encontrar rguir na seguncla tcntativa.

I Tr hilrrir'ns lrrnccctn

EFa prlut'nl clrirrrco clo subcstirniro ou superestimao clas rnecliclns *lttit,lrrq A tlbcln it scgttit' aprcscnta o collportamcnto do equiparncnto Fdttrl,l,, t'!!t t'iltlll I'iillricl:

ecluipamcntos de preciso para o laboratrio tle Apesar cle serem aparelhos de preciso, cxiste ttttivct'siditcle, lpflnlr.rt rlr' untit

54

Captulo 2: Probabi

E.ttt't'it'irts

55

Fbrica I Probabilidade Fbrica II Probabilidade Fbrica III Probabilidade

Subestima 0,01 Subestima 0,005 Subestima 0,00

Exata 0,98 Exata 0,98 Exata 0,99

Superestima 0,01 Superestima 0,015 Superestima 0,01

Uporrhl que X represente o nmero de horas de atividade fsica por semana. cnriirlcrc a tabela a seguir:
Sexo \ Atividade

0<x<3 3<X<5 x>5


22
t d B

Feminino Masculino
r

7 6

Qull

As fbricas I,

II e III fornecem, respectivamente, 20Vo, 30Vo e 50Vo dos aparelhos utilizados. Escolhemos, ao acaso, um desses aparelhos e

perguntamos a probabilidade de: a. Haver superestimao de medidas? b. No haver subestimao das medidas efetuadas? c. Dando medidas exatas, ter sido fabricado em III? d. Ter sido produzido por I, dado que no subestima as medidas?

P(X > 5). a probabilidade de que um rapaz escolhido aleatoriamente dedique *rlcrrlc Cr pelo rncnos 5 horas atividade fsica. Idem para uma moa. , utttltitt'c is respostas dadas nos itens (b) e (c)'
r enlculc

a probabilidade de sortear aleatoriamente uma menina com atividade fsicit scrnanal na faixa de [3, 5) horas?

ptrrtlrtrilidade de encontrar gs numa certa regio ,

llrc. Trs sondas

22. Acredita-se que numa certa populao, 207o de seus habitantes sofrem algum tipo de alergia e so classificados como alrgicos para fins de sade
pblica. Sendo alrgico, a probabilidade de ter reao a um certo antibitico de 0,5. Para os no alrgicos essa probabilidade de apenas 0,05. Uma pessoa dessa populao teve reao ao ingerir o antibitico, qual a probabilidade de:
a. Ser do grupo no alrgico? b. Ser do grupo alrgico?

i!'ns estito perfurando de modo independente. gbertrlo-se que uma delas (qualquer) no achou gs, qual a probabilidade dHg ottlt'its duets encontrarem? $bcttrltt-so que uma delas (qualquer) no achou gs, qual a probabilidade d etteorttrar gs na regio atravs dessas perfuraes? tllrc:nrkr-sc que no mais de uma delas (qualquer) achou gs, qual a prohrrbiliducle de nenhuma encontrar gs?

23. Estatsticas dos ltimos anos do departamento estadual de estradas so apresentadas na tabela a seguir, contendo o nmero de acidentes incluindo vtimas fatais e as condies do principal motorista envolvido, sbrio ou
alcoolizado. Motorista \ Vtimas fatais Sbrio
No
L22B

F(a U B I c) : P(Al c) + P(B lc)-P(A)Blc). te Jt /'' cntito P(Au B I C) : 1. F(,4 t t 11U C) : P(A) + P(B) + P(c) - P(A. B) - P(A. c) = t'(/t l) + P(An B nC).
jlntr fnrrrlil

AltJ) :1-P(AlB).

A,

ll

c C pertencentes a um mesmo espao amostral. Mostre que:

Sim
275 762 na

vilja ao litoral para

passar um

fim de semana. A probabilidade


congestionamento, a

Alcoolizado
ocorrncia de vtimas fatais?

2393

ft

Voc diria que o fato do motorista estar ou no alcoolizado interfere


24. Sejam A e B dois eventos de f), tal que P(B) ) 0. Mostre que: a. Se P( I B) : P() ento P(A18) : P(A)P(B)' b. Se P( n B) : P(A)P(B) entito e D siro independcntes'

or.l scln congestionamento, probabilidade do pai perder a piIe in r'(n os 'ilhos de 0,7. E claro que havendo congestionamento o pai pde per,l,.r'tt pitcinciil com os filhos mesmo sem brigas, o que aconteceria Ft ptohlhilirlndo 0,5. Quando niro hr nem congestionamento, nem briga, o pi eltrtgr. trnrtqiiilo c nto 1:crdc a pucincia, Determine a probabilidade de: * Nnrr kt'ltitvirkl congestiottittrtcnto se o pai no percleu a pacincia com seus

$ngesti.rrrnnrenlo, a

Sbttlrilirlrrrkr clos seus dois filhos brigarem no carro de 0,8 e,

euttgr.slirtttittnento net estrada

de 0,6. Havendo

sem brga pode aparecer com probabilidade 0,4. Quando h

bitl, ,,.,",

flllrrtF

56

Captulo 2: Probabi

b. Ter havido briga, dado que perdeu a pacincia.

ultt.

29.Um candidato

a motorista treina na auto-escola e acredita que passa no exame com probabilidade 0,7. se no passar, far mais treinamento, o que ele estima que lhe aumentar em lj%o a probabilidade de passar, isto , no segundo exame passar com0,77 de probabilidade. a. Supondo que ele continue acreditando nesse aumento de possibilidade, em

rklvcis Aleatrias Discretas


IRtrorluiro
Nr.rlc c'irptulo, incorporamos o conceito de probabilidade no estudo de l: tsrociirclls a caractersticas em uma populao. No Captulo 1, vimos Hllllrrrrrrlo rrrtlr tabela de freqncia, podemos apresentar os valores oossveis glua rlrtrlir vnrirvel e suas respectivas freqncias. Evitamos, dessa forma, $endr, ltet'tlir clc informao, a repetio, s vezes muito grande, dos valores dvc.l, l)tr ornra irnloga, vamos formalizar, com a ajuda da Teoria das llrlnrk's, o conrportamento de variveis na populao, associando a cada vllor sua probabilidade de ocorrncia. Como j mencionamos no iilrtrli()r', irlnr da probabilidade poder ser obtida a partir do estudo das Irts, clrr tirrnbm pode ser deduzida a partir de suposies feitas a respeito llrt;t,r rlo 'r:nmeno. Na formalizao que faremos com a introduo de llklnrlr's, nos ocrparemos apenas das variveis quantitativas. Vamos It'etrlrr os casos discreto e contnuo, pois a atribuio de probabilidades h' r'trt ciulrt situao. As variveis qualitativas podem ser, em algumas ! E corrl o ctovido cuidado, tratadas como discretas na atribuio de
hliirlt's,

que exame ser aprovado com certeza?

b. Qual a probabilidade de serem necessrios mais de 2 exames?


Os arquivos de dqdos mencionados nos exerccios a seguir podem ser obtidos em www. i me. us p. b r/- no p ro e s t

30. (Use o computador) Considere os dados do arquivo areas.txt descrito no Exerccio 25, captulo 1. Suponha que voc ganhe um apartamento em uma promoo feita por uma cadeia de lojas. utilizando o computador, construa
tabelas de freqncia necessrias para responder s seguintes questes. a. Qual a probabilidade do apartamento estar situado entre os andares 4 e7? b. Qual a probabilidade do apartamento estar situado no bloco B?

c. Qual seria a probabilidade de voc ganhar um apartamento com algum


problema de construo? (Isto , com rachaduras ou infiltraes). d. Repita os itens anteriores, dado que o apartamento esta situado no bloco B.
3L. (Use o computador) Considerando o arquivo cancer.txt calcule:

a. As

probabilidades de que um paciente selecionado, ao acaso, seja

classificado em cada uma das quatro categorias da varivel Diagnstico. b. utilizando apenas o item (a), qual a probabilidade de um paciente,
selecionado ao acaso, ser diagnosticado como no tendo a doena?

32. (use o computador) considere os dados do arquivo aeusp.txt descrito no Exerccio 26, Capnlo 1. Suponha que escolhemos, ao acaso, um dos
moradores entrevistados. a. Qual a probabilidade da idade do entrevistado ser inferior a 35 anos? b. Dado que o morador tem menos do que 35 anos, qual a probabiridade dele ser do sexo feminino? c. Qual seria a probabilidade de escolher um morador do Jardim Raposo quo tenha acesso a computador? d. Determine a probabilidade de escolher um entrevistado qr"re tcnha vinclo clo nordeste, seja do sexo feminino e estr trabalhando. Se esse rnoraclor bi escolhido, qual a probabilidaclc delc tor cartcira assinacla?

Utnir rilrirrrticlaclc X, associada a cada possvel resultado do espao , tlt'rrrrrrrirtirdn dc vevivel aleatria discreta, se assume valores num r etttttrrel'iivol, corn certa probabilidade. Por outro lado, ser denominada ctle'ttltit'itt t:rtttltuta, se seu conjunto de valores qualquer intervalo dos
iFntH. o tltrc scria um conjunto no enumervel. (

rnlr i'i rrtcrrcionamos arnteriormente, existem variveis que so rrlr rlrl'irritlls courcl discretas ou contnuas, porm essa atribuio no
!r

e rlt';rt.trth-r tkr irrstrumento de medida e do estudo que est sendo feito. letttlrlrr, rr virliiivol tninrero dc,filltos em.famlias discreta, enquanto o

clr

te'tt1'titt

u utn t:erlo

mulicdnrcn.o

contnua. A

discusso sobre

iflr.tt;to rh' vrrliiivcis, lbitn lro Captulo l, serr utilizada em todo o texto e a fEl rtl:.'tttrrt'itt ir itcrcscicln itqui pttt'it inclicar qtle, cada possvel valor, r!1 unut prohullilidnclc clc ocorrlrciu. No caso discreto, a atribuio

57

58

Captulo 3: Varidveis Aleatrias Disc

folr,t,lrt1,t,,

59

similar

tabela

de freqncia;

jL

no caso contnuo,

utilizaremos

generalizao da idia de histograma. Neste captllo apresentamos os resultados e modelos mais comuns variveis aleatrias discretas, deixando para o Captulo 6 a discusso do

contnuo.

Seja
valores.

uml varivel aleatria discreta e

11,12,ryt...,

seus dife

1) : 0,30 e a catacterizao probabilstica a varivel =: '=l ) 0,15. Para completar lrt N. jrltn obter as probabilidades P(l : 3), P(l/ :4) e P(N : 5). r rrs irrlrmaes fomecidas, elas so iguais e, digamos, tm valor p. r rr rlcl'irtio de funo discreta de probabilidade, temos que:

= (l) 0,20. De forma semelhante, temos que P(l'r

/)(N
0,20

:
+

Definio 3.1: Funo dscreta de probabilidade

A funo que atribui a cada valor da varivel aleatria sua probabr denominada de funo discreta de probabilidade ou, simplesmente, funo probabilidade. Anotao a ser utilizada :
P(X =
ou ainda,

1) ... + P(,^f 0) + P(.^'r r 0,30 +0,35 + p+ p + P 0,85 + 3p: I

5)

0,15 p::0,05.
Ftttrio rlc probabilidade para

r;) :

p(r1)

: pi,'i : I,2,...

l/

dada pela tabela a seguir:

tr
.1,): Nir construo de um certo prdio, as fundaes devem atingir 15 de prolrnrliclade e, para cada 5 metros de estacas colocadas, o operador l lrorrvt. ;rltcrao no ritmo de perfurao previamente estabelecido. Essa icsrrltlulo de mudanas para mais ou para menos, na resistncia do Nps rlis c1sos, medidas corretivas sero necessrias, encarecendo o d pltru, ('otr lrase em avaliaes geolgicas, admite-se que a probabilidade tliit rltr irltcraes de 0,1 para cada 5 metros. O custo bsico inicial tlf'('s (rrrrirllrlc padro de construo) e ser acrescido de 50k, com k rtirhr o rrtirncto de alteraes observadas. Como Se comporta a varivel
\1

Uma funo de probabilidade satisfaz 0

1 p, <

pt : "I

L.

Note que, na maioria dos casos, X ter apenas um nmero finito valores possveis e, assim, a verificao de qge a soma de probabilidades igunl I ser feita atravs deuma soma finita. As variveis aleatrias so complet caracterizadas pela sua funo de probabilidade e uma parte importantg Estatstica , justamente, obter, para uma dada varivel de interesse, a funlo probabilidade que melhor represente seu comportamento na populao.
Exemplo 3.1.' Com
do ltimo censo, a assistente social de um Centro Sade constatou que para as famlias da regio, 20Vo no tm filhos, 30o/o t,m filho, 35Vo tm dois e as restantes se dividem iryglgrglf" entre trs, quatro cinco filhos. Suponha que uma famlia ser es'colhida, aleatoriamente, ne regio e o nmero de filhos averiguado. Definimos N como sendo a vari aleatria ntimero deftlhos e consideramos que a escolha feita entre as cli opes de valores parn N. Isto , no importa qual a famlia escolhida, mas qual a resposta dada quanto ao nmero de filhos. Desse mocJo, est sorteando um valor deNdentre 0,7,2,3, 4 ou 5. A funo de probabilidaclo varivel segue das informaes disponveis, isto , como 20ok das l'amlius tm filhos, ento a ptobabilidade de uma ftrrrrliir sortcacla ao icaso niro ter I'ilho
dados

r rilrtrrs tkr ltndaito?

Assrrrrrirrros cluc as alteraes ocorrem independentemente entre cada um ltrt,,rvitlos tlc -5 metros e representamos por A a ocorrncia de alterao *l, lrrlr,rrzlo, scltclo '' seu complementar. A Figura 3.1 apresenta as trs !,r!u (s possvcis resultados da perfurao. Cada etapa tem duas

$r

llrlri,l,'s (lu(:, (lr.riurclo combinadas com as outras duas etapas, originam 8 l -vlrrlos. llr cxcmplo, o evento AA"A representa que, na primeira e na Clllill,, it(.()tloccril-n alteraes, enquanto que na segunda nada se alterou. letfrr ri ll ('lirl)irs, coltt 2 possibilidades emcadauma, temos no total 23 :B
I I r-r,|no itrttoslt'itl cclnsistc na unio de todos os caminhos que levam de pHltlrlr {riil!o (llr iirvorc clc probabiliclacles,

60

Captulo 3: Variveis Aleatrias Discretas

lllln,ilrr'ro

61

P(C :150)

-----_----^0,t4 0,9

: P(AA"A') + P(A'AA") :3 x 0,1 x 0,92 :0,243.

+ P(A'A'A)

A"
on,

o"

o'

ptrrlrlbilidades para os outros valores de C podem ser obtidas de modo r, r'csultando na seguinte funo de probabilidade:

0,9

lrrrna, o comportamento da varivel de interesse pode ser estudado atravs

tsoc:iao

de cada custo com sua probabilidade de ocorrncia. Essa

tiio pode auxiliar na previso de gastos e na elaborao de oramentos.

Figura 3.1: rvore


Sendo

de

probabilidades- alteraes no subsolo.


obtemos a seguinte tabela:

Vlmos considerar agora exemplos em que as probabilidades associadas [:rucrrtos do espao amostral so obtidas a partir de uma suposio terica.
3.3r Considere o experimento de lanar uma certa moeda observar se eilnr ou coroa. Descreva o comportamento da varivel nmero de caras em lilnt mentos dessa moeda. Sc denotamos por ly' a varivel de interesse, segue imediatamente que l/ nssrrrrrir os valores 0, 1 ou 2.Para atribuir probabilidades a cada um desses rrecessrio fazu alguma suposio a respeito da probabilidade de rciir de cara ou coroa. Admitindo que a moeda equilibrada, as lrilitlrrcles de cada face sero iguais, isto , P(cara): P(coroa) : Ll2. ttos ainda a independncia entre lanamentos, de modo que a ocorrncia de rlclclnrinada face no primeiro lanamento no altere a probabilidade de cara
pror n0 segundo lanamento. l)oclemos considerar como espao amostral o seguinte conjunto:

C a varilrvel aleatria custo da obra,


Eventos

Probabilidade 0,1" 0,12 x 0,9 0,12 x 0,9

' (em UPCs)

AAA AAA"

AA.A
AA"A" A.AA

250 200 200


150

0,1

0,92

A.AA.
A" AcA

AcAcAc

x 0,9 0,1 x 0,92 0,1 x 0,9' 0,9 t


0,12

200
150 150 100

g
Note que associamos a cada evento do espao amostral um valor para a varivel aleatria C. Os distintos possveis valores so c1 - 100, cz: L50, cs : 200 a c4 :250. Alm disso, podemos ter um mesmo valor da varivel associado a mais de um elemento do espao amostral, por exemplo,
(I

: {cc ,c R, RC , RR},

P(C :

cz)

: P(C:

150)

: P(AAA'l) AAA'U A"A"A).

c / rcpresentando a ocorrncia de cara e coroa, respectivamente. l'lra deduzir a funo de probabilidade de -y', observe que o valor 1 rrttr. rros cventos CR e C, enquanto que os valores 0 e 2 tm apenas um etttrr ir cles associado, respectivamente, -R e CC. Segue ento que as
pfehnlrilitlucles associadas aos valores de Iy' so as seguintes:

Tendo em vista que os eventos so disjuntos, a probabilidade da unio fica sendo


simplesmente a soma das probabilidades de cada evento. Ento,

tr

62

Captulo 3: Variveis Aleatrias Disc

63

Exemplo 3.4: tJmjogador paga 5 fichas para participar de um jogo de disputando com a banca quem tem o ponto maior. O jogador e a banca cada um o seu dado e a seguinte regra de premiao estabelecida: maior, ele ganha 2 vezes a diferena entre o - se o Ponto do jogador Joga ponto e o obtido pela banca; se o ponto do jogador menor ou igual ao da banca, ele no ganha O que voc acha desse jogo?
Vamos admitir que os dados utilizados so perfeitamente homogneos, tal forma que no h preferncia na ocorrncia de qualquer uma das seis f Assim, podemos considerar que os pares de valores (b, i) representt respectivamente, ocorrer. Para cada par (b,7) sorteado, a premiao baseada nos seus va Definimos a varivel aleatria discreta G como sendo o ganho bruto do io em uma jogada, isto , o valor arrecadado sem descontar as fichas iniciais para participar do jogo. Pela regra de premiao' segue que:

(1, 1)

(2,L) (3,1) (4,1) (5,1) (6,1)

(2,2) (3,2) (4,2) (5,2) (6,2)

(3,3)

(4,3) (4,4) (5,3) (5,4) (5,5) (6,3) (6,4) (6,5)

(6,6)

3l 1r,t'.r trn todos a mesma probabilidade de ocorrncia e, portanto, Jtlf'l 0) :21136. De modo anlogo, calculamos os demais valores e
futtiio clc probabilidade:

o resultado obtido pela banca e pelo jogador, tm a met probabilidade de ocorrncia. Isto , qualquer par tem probabilidade 1136

(;l

2 4 6 B 10 0 7t, I ztlze 5lJ6 4lJ6 Jls6 2186 Llz6


de, rctorno, o que acontece com probabilidade !/aC t lf 36:6/36. Portanto, o jogo altamente favorvel banca e,
rint nruitl sorte (1/36), o jogador ganhar o dobro do que fiubrc o jogo fica, ento, evidente. Tendo em vista as 5 fichas pagas o .jogirclor s no ter prejuzo nos casos em que obtiver 6, 8 ou 10

apostou. tr

t:l
serG:2x(3-1):4.
j):
(1,1) (2,1) (3,1) (4,1)
(5, 1)

o,

se

i<b.
<

Ent vriliirs situaes til calcular a probabilidade acumulada at um , A tlel'inio a seguir apresenta esse conceito.
,2: Ituno de distribuio de probabildade

Dessa forma, se o jogador obtm 5 e a banca 6, temos G : 0 pois j < b (5 Por outro lado, se o jogador tira 3 e a bancaJ, o valor do ganho bruto do j

$ Jiutr;iltt dc tlistribuio
lerrlririrr cliscretzr
xpl'rssto:

ou

O espao amostral, correspondente a uma jogada, apresentado a

X definida, para qualquer nmero

funo acuru.ulada de probabilidade de uma real r, pela

atravs dos pares (b,

(\,2)
(3,

(2,2) (4,2) (5,2) (6,2)

2)

(6,1)
O valor G

(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)

(r,4)

(2,4) (3,4) (4,4) (5,4) (6,4)

(1,5) (2,5)
(3, 5)

(4,5) (5,5) (6,5)

(1,6 (2,6 (3,6 (4,6 (5,6 (6,6

F(r):
J,.f,'

P(X < r)

0 acontecer quando o ponto do jogador for menor ou

llrrt populao de 1.000 crianas foi analisada num estudo para cl'ctiviclnclc de uma vacina contra um tipo de alergia. No estudo, as n fer.t:lrirrnr r.rrna dose de vacina e, aps um ms, passavam por um novo r rritrrlir livcsscm tido alguma reao alrgica, recebiam outra dose da Ao lirrr rlc.5 closcs todas as crianas foram consideradas imunizadas. Os unrrr;rletos csto na tabela a seguir.
l)oses
'r'ccy.

ao da banca. Esse caso corresponde ao seguinte subconjunto do espao

245

2 28t

256

t45

66

64

Captulo 3: Variveis Aleatrias Discre

65

Supondo que uma criana dessa populao sorteada ao acaso, qual ser probabilidade dela ter recebido 2 doses? Utilizando a idia de atribui probabilidade atravs da freqncia de ocorrncia, a probabilidade desejada 288/1000:0,288. A funo de probabilidade da varivel aleatria nmero doses recebidas fica sendo:
0,145

I(.r)
l,oo
9,954 ,7fltl

,113

Suponha, agoa, que desejamos calcular a probabilidade da criana ter recebi at duas vacinas. O que precisamos obter a funo de distribuio no ponto ou seja, calculamos a probabilidade acumulada de ocorrncia de valores men ou iguais a 2. Assim,

F(2)

P(X < 2) : P(X

1)

* P(X :2) :

0,533.

Note que, tendo em vista que avarinel s assume valores inteiros, esse valor inalterado no intervalo 12,3).Isto , F(2,L);F(2,45) ou F(2,99) tm todos mesmo valor acirn*a. Por essa razo escrevemos:

012s45
I,'lgura 3.2: Funo de distribuio - doses de vacina. 3,6.' Nurn cstudo sobre a incidncia de cncer foi registrado, para cada

F(r):P(X<r) :0,533 Pata2 (r(3'


Os valores completos da funo de distribuio so os seguintes:

eonr essc diagnstico, o nmero de casos de cncer em parentes (pais, ilrniros, tios, filhos, primos e sobrinhos). Os dados de 26 pacientes
irttes:

",r,

: {

0,245 0,533
0,789

0,934
1

.ser<1; se 1( r 12; se 2( r13; se 3(r14; se 4( r15; se r)5.

llltcliorcs irssurnem que a incidncia de cncer em parentes prximos teut'icrrrrrcrrto nrodelada pela seguinte funo discreta de probabilidade:

notao utilizada para escrever a funo de distribuio pode, primeira vista, parecer confusa, mas como as contas efetuadas so simp acreditamos que com um pouco de treino o leitor ficar familiarizado com funo. A Figura 3.2 apresenta um diagrama dessa funo.

frh*ir,t'vitrlos concordam com o modelo terico?

Fg tnlrcln rlc dados brutos com as 26 observaes, coletamos para cada d vtrt'liivel, o nmcro de suas ocorrncias. Por outro lado, seguindo o
tct'ico, o rrrirrrcro cle observaes que seria esperado em cada incidncia

66

Captulo 3: Variveis Aleatrias Discre

67

(freqncia esperada) calculado cono i:26x pi. Note que os valores esperados no precisam ser nmeros inteiros, pois representam uma freqncia terica caso o modelo fosse adequado. A tabela a seguir apresenta os resultados:
Incidncia
0
1

tlc Sco 3.1:

fltu*rlii viciada tem probabilidade de cara igual a 0,4. Para

dois

nlos itttlcpcndentes dessa moeda, estude o comportamento da varivel rlet rttnlr c lra um grfico de sua funo de distribuio.
bgcu ltrt itrllrrnao que voc conhece, crie os valores e as respectivas lirlrrrlcs f)ura a varivel nmero de filhos em famlias, no caso da lsn eonsiclcrada ser: lgx*e rtrr"dil paulistana. hehitntrtcs clo interior do Maranho.

n; (observados)
4 4 6 6
2

ei (esperados)
216 216

7,8 7,9
216 216

4
5

4 26

total

26

gtttittlro lturit chcgar a uma festa pode ser dividido em trs etapas. Sem o tlrr.jeto I'cito em t hora. Se enganos acontecem na primeira etapa, [e l0 rninutos ao tempo do trajeto. Para enganos na segunda etapa, o ttn 20 o, pilra er terceira, 30 minutos. Admita que a probabilidade de

r,'l',1 ,t v

Representando em um mesmo diagrama as duas freqncias obtemos:

0, I ;

0,2 e 0,3 para a primeira, segunda e terceira etapas,

vnlenc. I'i provvel haver atraso na chegada festa? Determine a Irlurk tlc ltavcr atraso, e o atraso no passar de 40 minutos.

itttetn de iuros prestando vestibular para conseguir uma vaga na lttlc. esr scttdo estudado. As carreiras tm procura diferentes e, em delux, o col-r'ullr pode ser prestar vestibular mais de um ano. Suponha ttiolltr'tttos, ito acaso, um dos ingressantes da sua carreira. Que Itlirtle voc atribuiria (invente!) necessidade de 1, 2,3, ...anos de
I

filho vai plltll e onre r pipocu com probabilidade 0,'l e, alm disso, pode pedir bala pnrbnbilidnrlc 0,9. Esses pedidos so atendidos pelo pai com illtllrlc 0,.5; inclcpendentemente um do outro. Se a pipoca custa R$ 2. e a
levrt tt 'illro

to cinema

e vai gastar nas duas entradas R$ 15. O

fl$.1, r,strrrlc o gusto eletuado com a ida ao cinema.

Vntl:lvrl rrh:lttirin X tcrn a seguinte funo de distribuio:

Notamos que os dados observados seguem a mesma tendncia do terico, porm seus valores so dis-crepantes. uma amostra pequena, mas no haver boa adaptao entre os dois conjuntos de nmeros.

P(r)

:
{

se r<10; se 10(r1I2; se 12(r<13; se 1"3 ( r 125; se r)25.

I
68 Captulo 3: Variveis Aleatrias Disc
I

lt't t n la lr ts D

iscretos

69

Determine: a. A funo de probabilidade de

i rdl'icrr tln densidade apresentado na Figura 3.3 para o caso k

L0.

b. P(x c. P(X

d.P12<X<20).
e.P(x

< L2). < L2).

X.
Fl,r
=.r )

t rs). (t

E,l0
B,tlH

3.2 Principais Modelos Discretos


Os exemplos da seo anterior ajudam a esclarecer a relao entre varivel e a realizao do experimento aleatrio que a origina. Cada poss elemento do espao amostral uma realizao do experimento e corresponde
um valor da varivel, nem sempre distinto. Algumas variveis aleatrias aparecem com bastante freqncra situaes prticas e justificam um estudo mais aprofundado. Em geral casos, a distribuio de probabilidade pode ser escrita de uma maneira compacta, isto , existe uma lei para atribuir as probabilidades. Por exemplo, se uma varivel aleatria W tem funo de probabili dada por

E,Ofi g,4

,sa

2 3 4 5 6 7 I

9 l0

'ittura 3,3: Modelo Uniforme Discreto [0, 10]. Clhrelve (ple it cxpresso na definio anterior, de fato, representa umn dhet'etn rlc llrubabilidade, uma vez que seus valores esto no intervitlcl Fntilr tle loclits as probabilidades igual a 1. O modelo Uniforrne tem i pofrlue loclos os seus valores ocorrem com a mesma probabilidade e, pedetnus tlizer quc a probabilidade se distribui uniformemente entre os
1[hrres,

wl r
k:L,2,...,6.

ento, escrevemos essas probabilidades como P(W : k) :

Dessa maneira, temos uma forma abreviada de apresentar varivel e sua funo de probabilidade. Vamos apresentar os principais mode de variveis aleatrias discretas, comeando pelo mais simples a seguir, quo aquele que atribui igual probabilidade a todos os possveis valores da varivel, Definio 3.3: Modelo Uniforme Discreto
Seja X uma varivel aleatria cujos possveis valores so represe t2,r."1,...,tt. Dizemos que X segue o modelo Uniforme Discreto

J,7,' llrrrn rilr

por

J1 ,

atribui a mesma probabilidade de probabilidade dada por

llk

a cada um desses

k valores, isto , sua fu

assumindo a honestidade da ritt, l tttintr:rus lettt it ttrcsma probabilidade de corrncia, com l/100 para cnclit $ Yntlrivel ttletttr'ia cm questo, o n,mero sorteado, segue o rnodelo

lltllleill ([. giltlitr o $orteio. Entretanto,

2l 'd 25 e meu colega tem outros 5 bilhetes, col'1 os l, I l, .l(), (rtJ c 93. Quem tem maior possibilidade de ser sorteado? prlrreill vistn tcnr-se a impresso de que "espalhar" os nmeros tt
lvrrr nrtnre'rrulrts dc

tcrl

100 billretes numerados de 1 a 100. Tenho 5 bilhetes

P(X

x.

Ilk: ,V.:i

L,2,... ,k.

gnttltitr l rir. Ncstc sorteio, como no modelo Unilorme cttt lltllnr ou tncllot'probabiliclade clc garrhar clcpcndc dc quantos bilhetes'sc tr n rlrt pirrlit'rtlrtr escolltu tlo nntcro, llrhirlo

Fr prrllrrrrlu, !:u c mcu colcgit com 5 bilhetes temos et fiesll1lt

t['

70

Captulo 3: Varidveis Aleatrias Disc

tl.t

l,

n I t'

o^t

I)iscretos

ir""\ - {-'r '^ J - '

..l
.,

'-''

7t

Em muitas situaes prticas a varivel de interesse assume somente

classificada como boa ou defeituosa; entrevistado concorda ou no com a afirmao feita; a vacina imunizou ou criana. Estas situaes tm alternativas dicotmicas, que genericamente ser representadas por respostas do tipo sucesso-fracasso. A atribuio de qual respostas ser referida como sucesso feita de modo arbitrrio, mas deve definida claramente para evitar ambigidades. Esses experimentos recebem nome de Ensaios de Bernoulli e d,o origem a uma varivel aleatria com
mesmo nome.

valores. Por exemplo,

pea

{F

r'nrrsllrril a /rrvore de probabilidades, consideramos que a escolha dos or loi I'cilir a partir de uma populao muito grande. Dessa forma, cadit ebuullritkr torn probabilidade 0,80 de estar imunizado, independente dos vrlrros rllr populao. Se classificamos como sucesso a ocorrncia dc r, lururs ir repetio independente de trs ensaios de Bernoulli. {Lle rlt'srrjirnros estudar o comportamento da varivel X: nmero dc llrrrrrrizrrrkls nesse grupo. Ela assume os valores 0, 1,2 e 3 cont le,ri t'ir['rrlirclas com o auxlio da rvore e apresentadas na tabela:
Eventos
TTT

Dffinio 3.4: Modelo Bernoull


Dizemos que uma varivel X segue o modelo Bernoulli se atribui ou ocorrncia de fracasso ou sucesso, respectivamente. Com p representando probabilidade de sucesso, 0 ( p 1 7, sua funo discreta de probabilidade por
p ou, de modo resumido,

Probabilidade

X
J

0,8'
0,Bz 0,82

ITI''
I T,'I
T

x 0,2 x 0,2

rII

I,'1,'
J J(:

[(

0,8 x 0,22 0,8" x 0,2 0,8 x 0,2"

I
2
1
1

P(X - r) : p'' (7 -

O1L-:r: , r :0,L

T,'1,,

I
J(l

0,8 x

0,22

[( I(

0,2"

repetio de ensaios de Bernoulli independentes d origem importante varivel aleatria discreta denominada modelo Binomial.
Exemplo 3.8.' Sabe-se que a eficincia de ume vacina de 80Vo. Um grupo de indivduos sorteado, dentre a populao vacinada, e submetido a testes averiguar se a imunizao foi efetiva, evento representado por .I. A rvore probabilidades apresen tada a seguir.

nrcnle, ir rniro de probabilidade de X fica sendo


0
2

o,2ir ll x o,B x 0,22 3 x 0,82 x 0,2 0,8'


f,l rrnrpurturrre:nlo tlc X completamente determinado pela funo acima, lirlrrrlrs lirrrrbtl podem ser escritas atravs da expresso

. --_-_--_-_-.----..
0,2
I

0,8

,"

o''
0,2
0,8

I'(,
:lue
?rlirti

')

: (i) x

o,g'

x or23-k" k :0,7,2,3.

',,
t

lrrohllliliclirclcs correspondem aos temos do desenvolvimcnto Irr rlr. Newl91 rlo (0,8 + 0,2):, o qr-re justifica o nome escolhiclo pala

72

Captulo 3: Variveis Aleatrias Discretas

.,2 Principais Modelos Discretos

73

Defino 3.5: Modelo Binomial


Considere a repetio de n ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso p. A varivel aleatria que conta o nrmero total de sucessos denominada Binomial com parmetros n e p e sua funo de probabilidade dada por

Em muitas situaes prticas, a varivel Binomial aparece a partir de outras variveis, atravs da criao de duas categorias excludentes, como no
excmplo a seguir.

Ilxemplo 3.9: O escore em um teste internacional de proficincia na lngua itrglesa varia de 0 a 700 pontos, com mais pontos indicando um melhor
rlcscmpenho. Informaes, coletadas durante vrios anos, permitem estabelecer o scgr.rinte modelo para o desempenho no teste:
Pontos

P(X

: rl :

(i,)ru (i - p)''-k,

0,L,2,...,n,

lo,200)
0,06.

com (ii) representando o coeficiente binomial calculado por

n;

200,300) 0,15

1300,400)

1400,500)

1500,600)

1600,7001

0,16

0r25

0,28

0,10

- kG-4. \n) Usaremos a notao X -U1,",p) paraindicar que a varivel aleatria modelo Binomial com parmetros n e p.

(n\

nt.

segue o

tr

importante notar que

as

probabilidades so completamente

caracterizadas pela informao dos parmetros. Por exemplo, desejando calcular a probtrbilidade de 3 sucessos numa b(12;0,4) temos

universidades americanas, exigem um escore mnimo de 600 pontos para ruccitar candidatos de pases de lngua no inglesa. De um grande grupo de estudantes brasileiros que prestaram o ltimo exame, escolhemos ao acaso 20 tlclcs. Qual seria a probabilidade de no mximo 3 atenderem ao requisito mnimo ttrcncionado? Vamos admitir que a tabela acima representa o escore dos estudantes que estio prestando esse ltimo exame. Essa uma suposio razoixel tendo em vista clrc a tabela foi feita a partir de um conjunto muito grande de dados. Isto quer rliz,cr que um aluno selecionado ao acaso apresentar um dos vrios escores de ttcordo com as probabilidades apresentadas na tabela. Por exemplo, a chance de nprcsentar menos de 200 pontos 0,06. Admitimos ainda que os estudantes lunsileiros tm comportamento similar aos demais e portanto a tabela tambm
porlc ser usada para representar esse desempenho. Pelo critrio das universidades, o estudante classificado como apto, se neu cscore de 600 pontos ou mais, caso contrrio, ser considerado no apto. l)cssa fbrma, para cada indivduo, teremos a classificao de apto ou no, feita de ttrotlo independente e com as seguintes probabilidades

Vrits

P(x

- :
3)

(lj;o,n'0,6n

-1{e,4s

o,6e

0,142

De modo similar, obtemos os outros valores da funo discreta de probabilidade:

X
Pt'

0,002

I 0,017
8

-t

0,064
9

0,142
10

0,2r3
11

0,227
12

0,777

P(aPto)

0,10 e P(no apto)

6,99

X
Pt

l
0,101

0,042

0,012

0,002

0+

0+

Definindo uma nova varivel X como o nmero de estudantes aptos tlrttlrc os 20, temos que X - b(20;0,10). A probabilidade de no mximo 3 serem
nptos calculada pela funo de distribuio no ponto 3, ou seja,
de

O valor 0+ indica uma probabilidade muito pequena que, na aproximao


rnilsimos (3 casas aps a vrgula), no teve casa decimal diferente de zero.

F(3)
I)'ssr brma, temos:

:P(x<3).

Diversos programas computacionais contm rotinas que calculam as probabilidades da distribuio Binomial e alguns livros-texto incluem tabelas
dessa clistribuiiro, para vrios valores dos parmetros.

!
74

Captulo 3: Varidveis Aleatrias Discretas

..2 Principais Modelos Discretos

75

r1x 3ly

()

0,1 o,e2o-

e, cnto, podemos concluir por uma expectativa de ll,7 nascimentos com 7 I'ilhotes dentre as 100 inseminaes. Observe que os valores esperados no prccisam ser nmeros inteiros, pois representam uma freqncia terica de
ocorrncia.

: ()0,100,e20. ()0,11 0,e1e. ()0,120,e18. ()0,130,e17

A tabela a seguir contm os valores observados Binomial fosse utilizado. nxrclelo


Filhotes lrrccl. Observada I'cq. Esperada 0
0
0,1
1

e
7

os esperados, se o

0,r22 + 0,270 + 0,285 + 0,190

2
6

4
23

8 ,)

t0
0 0,1

0,867.

26

2t
20,5

4,4

tr,7

20,5

24,6

t2 I,7

I
1

4,4

Esse valor reflete as altas probabilidades atribudas aos escores menores de 600, conforme o modelo de desempenho no tr

teste.

Exemplo 3.10: Um veterinrio est estudando o ndice de natalidade em porcos sujeitos inseminao artificial. Para tal, coletou informaes sobre a varivel nmero de fllhotes nascidos vivos em cada uma das 100 inseminaes re'alizadas com o mesmo reprodutor. A tabela a seguir apresenta os resultados.
Nmero
Freq. Observada

O modelo proposto parece se ajustar bem aos dados observados (veja a F'igtrra 3.4) e tendemos a acreditar que o modelo Binomial uma escolhn ttdccluada. A representao grfica torna-se assim, um importante passo inicial purt auxiliar na escolha de um modelo probabilstico. A verificao aqui foi
flpcnas visual, mas possvel estabelecer procedimentos estatsticos que testam o ajustc do modelo proposto de forma objetiva. Procedimentos mais rigorosos

)
1

2
6

J 7

4
9a

6 2L

7
L2

8
t)

9
1

devcrn ser utilizados para a deciso final e podem se basear em um teste estirtstico conhecido como Teste de Aderncia. tr

26

muito comum buscar estabelecer um modelo para a varivel de interesse, o que nesse caso possibilitaria, por exemplo, p comparao entre diferentes reprodutores. O veterinrio informa que 11 ou mais filhotes nascidos vivos uma ocorrncia muito rara e pode ser desprezada em termos de model. Nestes termos, ele sugeriu considerar que a varivel N: nmero de filhotes nascidos vivos, poderia ser ajustada pelo modelo Binomial com parmetros n : 10 e p: 0,5. O que voc acha da sugesto do veterinrio? Note que, mesmo no tendo havido nenhuma observao do valor 0 ou 10, o veterinrio sugeriu o modelo de uma varivel que contm esses valores, pois apesar de no serem comuns eles podem acontecer. Com o modelo sugerido, calculamos as probabilidades de cada um dos valores de 0 a 10 e, a partir deles, os resultados que seriam esperados em 100 inseminaes realizadas. Por exemplo,

a o

Observada Esperada

10

P(N

:7) : (;o,t'0,53: o,rr.;

Filhots

Fgura 3.4: Grfico

de

freqncias- natalidade em porcos.

76

Captulo 3: Variveis Aleatrias Discretas

.,.1 Outros

Modelos Discretos

77

mencionar as diferentes formas utilizadas para referenciar os modelos tericos das variveis aleatrias. Por exemplo, alguns autores referem-se a uma varivel aleatria com distribuio Binomial enquanto outros enfatizam uma varivel aleatria seguindo o modelo Binomial. Neste livro, vamos utilizar indistintamente essas duas formas que
essa seo,
consideramos equivalentes.

Ao finalizar

oportuno

b. Escolhemos 20 lmpadas ao acaso na prateleira de um supermercado, sendo 10 de uma fbrica e 10 de outra. Contamos o nmero total de defeituosas. c. Quinze automveis 0 km de uma mesma marca e tipo so submetidos a um teste anti-poluio e contamos o nmero deles que passaram no teste. d. Um motorista submetido a um teste em que deve estacionar seu veculo num pequeno espao (isto popularmente chamado defazer baliza). Em l0 tentativas, contamos o nmero de vezes em que o motorista estacionou
corretamente.

Bxerccios da Seo 3.2:


1. Discuta a validade do modelo Uniforme Discreto nos seguintes casos: a. O nmero sorteado numa rifa com 100 nmeros. b. A escolha de um aluno que vai representar a classe junto direo da escola. c. O dia da semana em que ocorrem mais acidentes de trabalho numa indstria. d. O ms do ano com maior nmero de enchentes na cidade de So Paulo.

5. Sendo
a.

uma varivel seguindo o modelo Binomial com parmetros n


Pergunta-se: 14).

15 e

P:0,4;

lr.P(8<X<10). c. P(X 12 ou X > 11).


d.
r.

P(X >

2. Sendo X uma varivel seguindo o modelo Uniforme Discreto, com valores no conjunto {L,2,3,.. . , 10}, pergunta-se: a. P(X > 7\. /

P(X ) tL ou X > 13). a.P(X)3eX<6).

P(x < 13lx > 11).

d..P(X)5ouX>B)) e.P(X)3e X<6). ',1f. P(x < e lx 2 o;.r

'

c.

b.P(3 <X<7). P(X 12 ou t >

8).i
\,

6. Urna certa doena pode ser curada atravs de procedimento cinirgi co em 80Vo dos casos. Dentre os que tm essa doena, sorteamos 15 pacientes que sero submetidos cirurgia. Fazendo alguma suposio adicional que julgar nccessria, responda qual _a probabilidade de: ru. Todos serem curados? L-ll. Pelo menos dois ro serem curados? c. Ao menos l0 ficarem livres da doena?
7. Calcule a funo de distribuio da varivel

3. Um usurio de transporte coletivo chega pontualmente s 8 horas para pegar o seu nibus. Devido ao trnsito catico, a demora pode ser qualquer tempo entre 1 e 20 minutos (admita que o relgio "pule" de minuto em minuto).
Pergunta-se: a. Qual a probabilidade de demorar mais de 10 minutos? b. Qual a probabilidade de demorar pelo menos 5 mas no mais de 10 minutos? c. Qual a probabilidade da demora no chegar a 5 minutos? q._ d. Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo nibus (que /n ainda no passou), qual a probabilidade do amigo atrasado esperar at 3

t. X Bernoulli b. X - b(4;0,20). c. X - b(B;O,10).

com p :

nos casos:

0,6.

3.3 Outros Modelos Discretos Apresentamos, nesta seo, os modelos Geomtrico, Poisson
lliptrgcomtrico, que tm vrias aplicaes prticas, conforme ilustram

minutos? L
4. Discuta a validade do modelo Binomial nos seguintes casos: a. Dos alunos de uma grande universidade, sorteamos 5 e contamos quantos se declaram usurios de drogas.

os

e'xcrnrplos desta seo. Na seo anterior, os modelos definidos assumiram apenas

rrrrr nmero finito de varlores distintos. Foi assim com o modelo Unifbrme l)iscrcto com valores L,2,,..,;, Bernoulli com 0 e L e Binomial com os valores

If,t
78

Captulo 3: Variveis Aleatrias Discretas

.1.-l Outros

Modelos Discretos

79

Como veremos a seguir, os modelos Geomtrico e Poisson podem ter um nmero infinito de valores dentre os inteiros positivos. 0,

1,...,n,

P(Q=
0,010 0,008 0,006 0,004

Definio 3.6: Modelo Geomtrico


Dizemos que uma varivel aleatria X tem distribuio Geomtrica de parmetro p, se sua funo de probabilidade tem a forma

P(X: k): p(L- p)o',


Nesse caso, usaremos a notao

0<p

1le k:0,1,2,....
tr

X- G(p).

0,002

Interpretando p como a probabilidade de sucesso, a distribuio Geomtrica pode ser pensada como o nmero de ensaios de Bernoulli que precedem o primeiro sucesso. Note que a expresso apresentada na Definio 3.6 de fato uma funo de probabilidade, pois positiva e sua soma igual a 1, conforme pode ser verificado atravs da frmula da soma de progresso geomtrica (PG) infinita:

0 4 I 12 16 20 24 28 32 36 40 44 48
Figura 3.5: Modelo Geomtrico (n:0,01).

tc

t p) :et k): 8"," - [of @mm

(1

- p)^ :

r_fr1:

Clorno podemos verificar atravs da figura, a probabilidade vai ficando muito llc(luena para valores grandes de k. Em tese, a produo nunca seria interrompida se rriro houvesse o aparecimento de uma pea defeituosa. tr

Detnio 3.7: Modelo Poisson

Exemplo 3,11: lJma linha de produo est sendo analisada para efeito de controle da qualidade das pas produzidad. Tendo em vista o alto padro requerido, a produo interrompida para regulagem toda vez que uma pea defeituosa observada. Se 0,01 a probabilidade da pea ser defeituosa, estude o comportamento da varivel Q, quantidade de peas boas produzidas antes da la.
defeituosa. Vamos admitir que cada pea processada tem a mesma probabilidade de ser defeituosa, independentemente da qualidade das demais. Sendo a ocorrncia de pea defeituosa um sucesso, podemos aplicar o modelo Geomtrico. Observe que o nmero de peas boas produzidas exatamente o quanto se "espera" para a ocorrncia do primeiro sucesso. Temos,

Uma varivel aleatria X tem distribuigo de Poisson com parmetro

> 0, se sua funo de probabilidade

dada por

e-]'k P(X , \/kl =/c) :

0,1,2, ...

cor o parmetro sendo usualmente referido como notuo utilizadaser X- Po(\).

a taxa de ocorrncia, A tr

P(Q

:k) :0,01 x 0,99', k:0,L,2,"',

O modelo Poisson tem sido muito utilizado em experimentos fsicos e lriolgicos e, nesses casos, a freqncia mdia ou esperada de ocorrncins trtrrn determinado intervalo de tempo, Vamos verificar que a expresso rrprcsentada realmente representa uma funo de probabilidade. No difcil rrlrscrvar que, para qualquer k, ela um nmero positivo. Resta mostrar que tls prrrllabilidades somam 1. Temos,

cuja representao grfica est na Figura 3.5.

80

Captulo 3: Variveis Aleatrias Discretas


=1,.1

Otrtros Modelos Discretos

81

tt" : 4=# : "-^# :


l':0 k:U :ll

e-\e : r'

No clculo acima, usamos que a srie \R' 1kt , somada para valores de k entre 0 e oo, produz e. Esse resultado bastante conhecido e segue do desenvolvimento em srie de Taylor do termo el. O leitor interessado poder consultar, para outros detalhes, textos bsicos de Clculo Diferencial e Integral. Exemplo 3.12: A emisso de partculas radioativas tem sido modelada atravs de uma distribuio de Poisson, com o valor do parmetro dependendo da fonte utilizada. Suponha que o nmero de partculas alfa, emitidas por minuto, seja uma varivel aleatria seguindo o modelo Poisson com parmetro 5, isto , a taxa mdia de ocorrncia de 5 emisses a cada minuto. Calculemos a probabilidade de haver mais de 2 emisses em um minuto. Seja o ntimero de partculas alfa emitidas por minuto. Pelas suposies feitas, temos A - Po(5) e a probabilidade desejada ser

dlrtritruio de Poisson, mas com o valor do parmetro ajustado de forma Ggrrvcniente. Assim, se o perodo de tempo considerado for de dois minutos, tglepros que o nmero de partculas emitidas em dois minutos ter distribuio
Po( l 0),

Se o intervalo de tempo alterado, a varivel aleatria mantm a mesma

tr

Eyemplo 3./3; Engenheiros da companhia telefnica estudam se o modelo de Poisson pode ser ajustado ao nmero N de chamadas interestaduais que chegam, durante o perodo notumo. Os dados coletadOS, Fr [ora, a uma central telefnica,
Efl:r'cntes a 650 perodos de uma hora, esto apresentados a seguir:
Chamadas 0
1

Freq. Observada

38

7t

115

r25

106

6 79

>8
57

50

Da tabela temos que, por exemplo, em 125 perodos de uma

hora

P(A> 2) :t

P(A:a) :1-t

P(A:0) :1- $e-s,n 4 o,l


0,875.

orrcram 4 chamadas. Os engenheiros sugerem rttilizar uma taxa de ocorrncia de 4-5-chamadas pet lrora no perodo estudado. Seguindo o modelo indicado, a freqncia esperada

{g
na

Aps os clculos n":"lrrur,or, obtemos

ir'o 12) :

**r"r"t,"*os

ocorrncias com k chamadas obtida multiplicando 650 (o total das bnr-t'vaes) pela probabilidade de k chamadas. Assim, para k : 2, temos
Freq. esperadapara 2 chamadas

Figura 3.6, alguns valores da funo discreta de probabilidade da Po(5).

650 x

P(N
"-4's

:2)
4152

:650x
P(N=n)
0,1 8

:73,13.
Ee rrurclo anlogo obtemos os demais valores.

2l

0,16

0,14
o,12
0,1 0

Flr'! utrlas rvadn


LOhsc

0
a

I
38 32,50

2 71

>8
57 56,36

115

125
123,37

106

79

0;08
0,0 6

fllsl'1

7,22

73,13

109,66

111,02

83,27

50 53,56

0,04
0,02

10

12

14

16

18

20

Figura 3.6: Modelo Poisson (),: 5).

tabela acima parece indicar que o modelo Poisson, com : 4,5 ftl'rrr..c,c unr bom ajuste para a varivel aleatiia de interesse. O leitor pode e'otrslnrir um grfico de freqncia'para visualizar melhor essa aderncia. A cxh.nsiro clessas concluses aos diferentes perodos de tempo e/ou outros tipos de G:hirrrrncla deve ser feita com cuidado, porm o ajuste j obtido uma "boa pista" Flt'n il cscolha do modelo. Como mencionamos anteriormente, a concluso obtida

82

Captulo 3: Variveis ,Aleatrias Discretas

,.. Outros Modelos Discretos

83

aqui poderia ser feita de modo mais objetivo atravs de Testes Estatsticos de

Aderncia.

tr

Encerramos esta seo, definindo

modelo Hipergeomtrico. Este

moclelo surge da contagem de objetos de certo tipo, retirados ao acaso e sem reposio, de um conjunto contendo dois tipos de objetos. Por exemplo, num grupo de jovens com 5 meninas e 5 meninos, sorteamos 3 deles ao acaso, para azer uma comisso. O sorteio ser feito sem reposio, para evitar a escolha de utri mesma pessoa, o que inviabilizaria a formao da comisso. Na primeira escolha cada um dos 10 jovens tem 1/10 de probabilidade de ser sorteado. Na segunda, cada um dos 9 restantes, ser sorteado com probabilidade I/9 e, na terceira, 1/8. A varivel aleatria nmero de meninas na comisso segue o modelo Hipergeomtrico, conforme definido abaixo.

caixa pode ter peas boas ou defeituosas e vamos sortear algumas pcas, sem reposio. Baseado no nmero de peas defeituosas encontradas rlccidimos por aceitar ou rejeitar o lote. Seja D a varivel que conta o nmero de pcras defeituosas neste sorteio. Ela segue o modelo Hipergeomtrico e vamos itlcrrtilicar os diversos parmetros. O total de peas n:25, o nmero de
elel'cituosas

4 e o nmero de retiradas

r:

5.

P(aceitar o lote) lintiio,

P(no mximo 2 peas defeituosas)

: P(D < 2).

p(D<r)

Definio

3.8

: Modelo Hipergeomtrco

) . ()=!'il -0,e84 : ().(';) . ()=('i (',J) (',J)

('J)

Considere um conjunto de n objetos dos quais mso do tipo I e n - m so do tipo II. Para um sorteio de r objetos (r < n), feito ao acaso e sem reposio, defina X como o nmero de objetos de tipo I selecionados. Diremos que a varivel aleatria X segue o modelo Hipergeomtrico e sua funo de probabilidade dada pela expresso
,^., _ P(X:*)-

C-onclumos que, mesmo havendo quatro defeituosas na caixa inspecionada, a probabilidade de aceitar o Iote 0,984 ou, equivalentemente, para rejeitar o lote a

(T)

(",--T

/n,\ ("/

) ,k:A,I,...,min(r,rn). _ ., , ^;^t_
,-

tr

prolrabilidade 0,016. Claro que, na prtica, no saberemos quantas peas rlccituosas existem em cada caixa. Entretanto, a probabilidade calculada acima purlcria ser um indicativo para avaliar se o critrio do controle de qualidade est t'rrzoiivel ou no e, neste caso, parece que no! Poderamos tambm criar uma tobcla contendo os valores da probabilidade de rejeio do lote, em funo de tr Irrrvcr certo nmero de peas defeituosas na caixa sorteada.
l,lxcrccios da Seo 3.3:

Note que os valores possveis de X vo de 0 a min(r,rn), uma vez que podemos ter mais do que o nmero de objetos existentes do tipo I, nem no tillnpouco mais que o total de sorteados. Utilizando resultados de anlise combirratria, pode-se verificar que a expresso de P(X : k) um nmero no negativo entre 0 e 1 e a soma, para todos os valores de k, igual a l. Assim esto cumpridos os requisitos necessrios para ser uma funo de probabilidade. Exentplo 3.14: Uma ftbrica produz peas que so embaladas em caixas com 25 unidades. Para aceitar o lote enviado por essa fbrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco peas, sem reposio, dessa mesma caixa. Se constatar no mximo dr"ras defeituosas, aceita o lote fornecido pela fbrica. Se a caixa sorteada tivesse 4 pcas defeituosas, qual seria a probabilidade de rejeitar o lote?

l.

Scndo X(DG(0,4), calcule: n. P(X:3).

b.P(2<X<4).

P(X > LIX < rl. P(X > 1).


c.

2).

2. IJrrrir moeda equilibrada lanada sucessivamente, de modo independente, at (f ue ocorra a primeira cara. Seja X avarivel aleatria que conta o nmero de
lirnamentos anteriores ocorrncia de cara. Determine: u. P(X < 2). b. P(X > 1).

c.P(3<x<5).
rl.

Quantas vezes deve, no mnimo, ser lanada a moeda para garantir a ocorrncia de cara com pelo menos 0,8 de probabilidade.

8{

Captulo 3: Variveis Aleatrias Discretas

3,4 [ixerccios

3.

A varirvel aleatria Y temdensidade poisson com parmetro : 2. obtenha:


a.

b.P(2<Y <4).
c.

P(Y <

2),

P(Y >

d.

P(Y: 1l]'<

0).

3).

LJrna agncia de turismo apresenta aos clientes o oramento de uma certa viagem em duas partes. A primeira o transporte areo que tm trs opes com preos 3;3,5 e 4 mil reais e preferncias de escolha de 0,5; O,3 e 0,2 para ;rs companhias TWA, TWB e TWC, respectivamente. A segunda parte do

4. A aplicao de fundo anti-corosivo em chapas de ao de 1 m2 feita mecanicamente e pode produzir defeitos (pequenas boihas na pintura), de ncordo com uma varivel aleatria poisson de parmetro : t p, *2. -a
chapa sorteada ao acaso para ser inspecionad, pergunta-se a probabilidade
de:

prcferncia, independentemente da companhia area. Seja x a varivel irlcatria oramento da viagem. Calcule a funo de probabilidade e a funo rlc distribuio da varivel X .

or'amento a escolha de estadia. Existem quatro opes de hotis que custam 2; 2,5; 3 e 3,5 mil reais e so escolhidos pelos clientes com a mesma

n. Encontrarmos pelo menos I defeito. b. No mximo 2 defeitos serem encontrados. c. Encontrarmos de 2 a 4 defeitos. d. No mais de 1 defeito ser encontrado.

5. A varivel 11 segue o modelo Hipergeomtrico com parmetros a r' : 4. Determine: a, P(H :2). b. P(H < L). c. P(f/ > 0).

n:

r0,m

Urn equipamento consiste de duas peas A e B que tm 0,10 e 0,15 de ;lrobabilidade de serem de qualidade inferior. um operrio escolhe ao acaso utni pea tipo A e uma tipo B para construir o equipamento. Na passagem pelo controle de qualidade o equipamento vai ser classificado. Ser considerado como nvel I, se as peas A e B forem de qualidade inferior. ser nvel II, se trrna delas for de qualidade inferior e, nvel III, no outro caso. o lucro na venda dc R$ 10, R$ 20 ou R$ 30 para os nveis I, II ou III, respectivamente. Como se
cornporta a varivel lucro? Para dois equipamentos vendidos, obtenha a funo

tlo probabilidade do lucro. Nesse caso, qual seria a probabilidade de pelo


rronos R$ 30 de lucro?

6. Por engano 3 peas defeituosas foram misturadas com boas formando um lote corn l2 peas no total. Escolhendo ao acaso.,4 dessas peas, determine a
probabi lidade de encontrar: n. Pelo menos 2 defeituosas. b. No rnrximo I defeituosa. c. No mrrimo I boa.
t

3.4 Exerccios

Na verificao de mquinas, observam-se as partes eltrica, mecnica e estrutural. A probabilidade de aparecer uma falha em cada uma das partes 0,01; independente das demais. ocorrendo falha, o tempo de conserto ro,z0 orr 50 minutos para falha eltrica, mecnica ou estrutural, respectivamente. Se rr alha eltrica aparece junto com a falha mecnica, teremos ainda um ircrscimo de 20 minutos. Para uma mquina escolhida ao acaso, qual a lrrobabilidade do tempo de interrupo (se no h falha, esse tempo , zero): tt. Durar menos de 25 minutos?
b. Ultrapassar 40 minutos?

l.

urn agricultor cultiva laranjas e tambm produz mudas para vender. Aps irlguns meses a muda pode ser atacada por fungos p.bubilidade 0,0j e, nesse cASo, ela escolhida para ser recuperada com "oprobabilidade 0,5. Admita que o processo de recuperao infalvel. o custo e cada muda produzida l$ 1,00; acrescido de mais R$ 0,50 se precisar ser recuperada. Cada muda vorrdida a R$ 3,00 e so descartadas as mudas no recuperadas de ataque de lngos. Estude como se comporta o ganho por muda produzida.

llrna empresa paga a seus estagirios de engenharia de acordo com o ano de


ctrrso do estudante. Para se obter o salrio mensal pago por 30 horas semanais, rnrrltiplica-se o salrio mnimo pelo ano de curso do estagirio. Dessa forma, o trstudante {o primeiro ano ganha um salrio mnimo, o do segundo recebe dois r' itssim por diante at o quinto ano. A empresa vai empregar 2 novos

cstngirrios e admitimos que todos os anos tm igual nmero de estudantes intcressados no estgio (considere a populao de candidatos muito grande de trulclo a no haver diferena entre escolher com ou sem reposio). pergunta-se ;r protrabilidade de:

86

Captulo 3: Variweis Aleatrias Discretas

.1.4

Exerccios

87

a. Os dois serem do primeiro ano? b. A empresa gastar no mximo 3 salrios mninos com os estgios? c. Sabendo que gastou pelo menos 4, gastar menos de 7 salrios mnimos?
6. Uma varivel aleatria

tem a seguinte funo de distribuio:

9. Num certo restaurante, paga-se pelo almoo uma quantia fixa dependendo da escolha feita de prato e bebida. A carne de peixe tem I}Vo de preferncia, enquanto frango tem 40Vo e carne bovina 50Vo. As trs escolhas de bebida esto condicionadas opo do prato, segundo a tabela abaixo:
Opo:Peixe P(Bebida Peixe)
Opco: Frango P(Bebida I Frango) Cerveia

",rr:
Determine:
a.

0,9 se6(r115; { 1 se r)15.


X.

se r<-1; 0,2 se -1 1 r 12; 0,5 se 2(r15; 0,7 se 5(r16;

Agua
0,3

0,4
Cerveia

Vinho 0,3 Vinho


012

Azua
0,5 Agua

0,3
Cerveja 0,6

A funo

b. P(x c. P(X
e.

d.P(3<X<12).
P(X >
14).

<

< -2).
2).

de probabilidade de

Opo:Bovina P(Bebida I Bovina)


Admita os seguintes preos:
Pedido Preo Peixe
T2

Vinho
0,1

0'3

Frango

Bovina

Cerveja
6

Agua
J

Vinho
9

l5

t8

7. Estatsticas de acidentes, num trecho da rodovia SP330, indicam probabilidade de 0,05 de haver um acidente durante a madrugada (24 s 6 horas). Em ocorrendo um acidente nesse perodo, a chance de gerar vtimas de 0,5. Ainda considerando o perodo acima, se acontece um acidente com vtima, ela ser fatal com probabilidade 0,1. o servio de ajuda aos usuriqs :utiliza 2 veculos na inspeo do trfego naquela rea. A esse nmero, acrescentamos mais 2 se houver acidente. Se o acidente tem vtimas, acrescente aos anteriores mais 2 veculos e, finalmente, acrescente mais 1 se a vtima for fatal. Encontre a luno de probabilidade da varivel aleatria ntimero de veculos em servio de auxlio nessa estrada durante a madrugada.

ru. Dado que algum escolhe peixe, qual a probabilidade de que escolha cerveja? ll. Se escolhe carne bovina, qual a probabilidade de tomar vinho? c. Sabendo que tomou gua, qual a chance de ter escolhido frango? tl. Determine a funo de probabilidade para cada uma das variveis X: preo do almoo e Y: preo do almoo para aqueles que preferem cerveja.

8. Em treinamento de

animais, usa-se

repetio como estratgia de

aprendizagem. Num experimento, um macaco realiza certa tarefa corretamente,

pela primeita vez, com probabilidade 0,5. Caso falhe, a probabilidade de realizar corretamente na segunda tentativa cresce I\Vo, ou seja, a probabilidade , agora 0,55 e assim sucessivamente. Admita que o experimento termina em quatro tentativas ou antes, na primeira vez que o macaco acertar. Descreva o
comportamento probabilstico do nmero de tentativas.

l(1. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para rrrrra famlia com trs filhos, calcule a probabilidade de que: a. Exatamente dois sejam do sexo masculino. ll. Pelo menos um deles ser do sexo masculino. c. Todos serem do sexo feminino.

lf . tJrn time paulista de futebol tem probabilidade 0,92 de vitria sempre que
ioga. Se o time a\uar 4 vezes, determine a probabilidade de que vena n. Toctas as 4 partidas.

b. Exatamente 2 partidas c. Pelo menos uma partida. tl. No rnximo 3 partidas.

88

Captulo 3: Variveis Aleatrias Discretas

.1,,1

lixerccios

89

e. Mais da metade das partidas.

12.tJm certo equipamento expedido em lotes de 500 unidades. Antes que uma remessa seja aprovada, um inspetor escolhe 5 desses equipamentos e os inspeciona. Se nenhum dos equipamentos inspecionados for defeituoso, o lote aprovado. Se um ou mais equipamentos forem defeituosos, todos as unidades so inspecionadas. Suponha que existam, de fato, dez equipamentos defeituosos no lote. Utilizando uma suposio conveniente, qual , a probabilidade de que seja necessrio testar todos os equipamentos?
13. Suponha que um modelo terico para a varivel notas em um teste de histria

lS.Considere uma varivel aleatria Xassumindo os valores 0,1,2,...,5 e tal clLre P(X : j) :/c x 0,8 x 0,2i, i : 0,L,2,...,5. ir. Para qual valor de k a expresso acima uma funo de probabilidade? lr. Calcule P(X :3 I X < 5).

lr. Uma vacina contra a gripe eficiente em707o dos casos. Sorteamos, ao acaso,
20 dos pacientes vacinados e pergunta-se a probabilidade de obter: ru. Pelo menos 18 imunizados. b. No mximo 4 imunizados. c. No mais do que 3 no imunizados, 17. 25Vo dos universitrios de So Paulo praticam esporte. Escolhendo-se, ao ilcilso, 15 desses estudantes determine a probabilidade de: a. Pelo menos 2 deles serem esportistas. b. No mnimo 12 deles no serem esportistas: c. Havendo mais de 5 esportistas no grupo, obtermos menos de 7 que praticam
esporte.

(X),

dado por:

P(X:
Para

i1

lj -

111

66

, j:0,7,2,...,10.

2l

alunos submetidos a esse teste, apresentamos um resumo de suas


Notas Freqncia
6
10
5

notas:

0-2 2-4 4-6


6F8
8 Ft10

Itl. As pacientes diagnosticadas com cncer de mama precocemente tm

80Vo de

probabilidade de serem completamente curadas. Para um grupo de 12 pacientes lessas condies, calcule a probabilidade de: :r. Oito ficarem completamente curadas. ll. No serem curadas de 3 a 5 pacientes.
c. No mais de 2 permanecerem com a doena.

5
1

Um professor desconfia que o modelo no adequado. O que voc acha?

19. A resistncia (em toneladas) de vigas de concreto produzidas por uma clrpresa, comporta-se conforme a funo de probabilidade abaixo:
Resistncia

14. Um laboratrio estuda a emisso de partculas de certo material radioativo. Seja l/; nmero de partcula; emitidas em I minuto. O laboratrio admite que l/ tem funo de probabilidade Poisson com parmetro 5, isto ,

P(.^/
partculas.

k)

:;, --5 ^A

k:0,7,2,....
de

Admita que essas vigas so aprovadas para uso em construes se suportarem pclo menos 3 toneladas. De um grande lote fabricado pela empresa, cscolhemos 15 vigas ao acaso. Qual ser a probabilidade de:
a. Todas serem aptas para construes?

a. Calcule a probabilidade de que em um minuto no haja emisses

ll. No mnimo 13 serem aptas?


2{). Ern momentos de pico, a chegada de avies a um aeroporto se d segundo o rnodelo Poisson com taxa de 1 por minuto. ru. Determine a probabilidade de 3 chegadas em um minuto qualquer do horrio de pico.

b. Determine a probabilidade de que pelo menos uma partcula seja emitida em um minuto. c. Qual a probabilidade que, em um minuto, o nmero de partculas emitidas esteja entre 2 e 5 (inclusive)?

90

Captulo 3: Variveis Aleatrias Discretas

3,4 Ii.rerccios

91

b. se o aeroporto pode atender 2 avies por rninuto, qual a probabilidade de


haver avies sem atendimento imediato? c. Previses para os prximos anos indicam que o trfego deve dobrar nesse aeroporto, enquanto que a capacidade de atendimento poder ser no

mximo ampliada em 50vo. como ficat a probabilidade de espera por


atendimento?

24, Considere uma varivel aleatria X - G (0,8). Construa uma nova varivel )/ tal que Y : X para os valores 0,1,2,...,5 e Y : 6 para X ) 6. Dessa rrma, Y corresponde ao truncamento de X a valores menores ou iguais a 6. ( )btenha a funo de probabilidade de Y e calcule:

r. P(Y

:2).

21. IJma indstria de tintas recebe pedidos de seus vendedores atravs de fax, telefone e Internet. o nmero de pedidos que chegam por qualquer meio (no horrio comercial) uma varivel aleatria discreta com distribuio Poisson com taxa de 5 pedidos por hora. a. Calcule a probabilidade de mais de 2 pedidos por hora. b. Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50
pedidos? c. No haver nenhum pedido, em um dia de trabalho, um evento raro?

b. O valor da funo de distribuio (acumulada) no ponto 2,5. 3lY < 5). c. P(Y

d.P(Y>3eX<8).

25. A durao (em centenas de horas) de'uma lmpada especial segue o modelo Ceomtrico com parmetro t :0,7. Determine a probabilidade da lmpada: rr. Durar menos de 500 horas. b. Durar mais de 200 e menos de 400 horas. c. Sabendo-se que vai durar mais de 300 horas, durar mais de 800 horas. rl. O item anterior uma aplicao de um resultado geral vlido para o modelo

22. No estudo do desempenho de uma central de computao, o acesso unidade central de Processamento (cPU) assumido ser poisson com 4 requisies por segundo. Essas requisies podem ser de vrias naturezas tais como: imprimir um arquivo, efetuar um certo clculo ou enviar uma mensagem pela Internet, entre outras. a. Escolhendo-se ao acaso um intervalo de 1 segundo, qual a probabilidade de haver mais de 2 acessos cPU? E do nmero de acessos no ultrapassar
5?

Geomtrico. Assim, mostre que para X inteiros positivos rn e n,vale P(X > m *

- G (p) e quaisquer nmeros nlX > m) = P(X > n).

2r.

l}n um estudo sobre o crescimento de jacars, uma pequena lagoa contm 4 cxemplares de espcie A e 5 da espcie B. A evoluo de peso e tamanho dos 9 .iacars da lagoa acompanhada pelos pesquisadores atravs de capturas pcridicas. Determine a probabilidade de, em trs jacars capturados de uma vcz, obtermos:
ru.

b. considerando agora o intervalo de 10 segundos, tambm escolhido ao acaso, qual a probabilidade de haver 50 acessos?

Todos da espcie A.

b. Nem todos serem da espcie B. c. A maioria ser da espcie A.

23. Toda manh, antes de iniciar a produo, o setor de manuteno de uma indstria faz a verificao de todo o equipamento. A experincia indica que em 95vo dos dias tudo est bem e a produo se inicia. caso haja algum problema, uma reviso completa ser feita e a indstria s comear a trabalhar aps o almoo. Faa alguma suposio adicional que julgar necessria e respond:
a. Qual a probabilidade de demorar 10 dias para aprimeira reviso completa? b. E de demorar pelo menos l5 dias? c. um esquema de manuteno, com reviso preventiva, est sendo montado de modo a evitar a reviso completa num dia aleatrio. Deterrrine um dia d,

27,

descuidado mistura 4 exemplares defeituosos junto com outros 16 pcrfeitos de um certo livro didtico. Quatro amigas vo a essa livraria para cornprar seus livros escolares. ir. Calcule a probabilidade de 3 levarem livros defeituosos. ll. Qual a probabilidade de, aps a visita dessas meninas, restarem o mesmo nmero de defeituosos na livraria? E de no restar nenhum?

Un livreiro

tal que probabilidade de quebra alm de d seja pelo menos igual a 0,6.

Revisando conr intervalos de d dias, o que estaremos garantindo?

2ll. (Use o computador) Para os dados apresentados na Tabela l.l no Captulo l. l. Construa a tabela de freqncias para a varivel Exer, horas de atividade i'sica por semana. b. Suponha que 5 pessoas so selecionadas ao acaso. Qual a probabilidade de que 3 delas pratiquem, pelo menos, 6 horas de atividade fsica por semana?

92

Captulo 3: Variveis Aleatrias Discretas

c. Repita o item (b) calculando a probabilidade de todas as pessoas escolhidas praticarem pelo menos 6 horas de atividade fsica.

Captulo 4

29. (Use o computador) Considere a varivel altura apresentada na Tabela 1.1, Captulo 1. a. Crie uma varivel lj assumindo o valor 1 se a altura do indivduo e for maior que a mdia de altura da populao (indivdu os altos) e 0 caso contrrio (indivduos baixos). Apresente a distribuio de freqncia para
esta varivel e uma representao grfica adequada.

Medidas Resumo
4.1 Introduo
Neste captulo, vamos apresentar algumas medidas que buscam sumarizar s informaes disponveis sobre o comlortamento de uma varivel. podemos del'inir essas medidas nos casos de ur.t cilnto de dados u de uma funo de prrrbabilidade de varivel aleatria. Apesar danatureza diferente de cada caso, as itcrtlidas tero a mesma interpretao, variando apenas na forma de serem
trlcu ladas.

um deles ser associada uma varivel V, ,i:1, ..., 13. Defina X: nmero de alunos altos. Como voc expressaria X em termos das variveisY, i,: 1, ..., 13? c. Obtenhauma amostra de 100 valores da varivel X, isto , repita 100 vezes o sorteio de 13 alunos nas condies do item (b). Construa uma tabela de
freqncias.

b. Suponha que

13 alunos vo ser sorteados com reposio e a cada

d. Qual seria o modelo de probabilidades

Lembremos que, no Captulo 1, tivemos

adequado para as variveis Y;, 'i : L,...,73? O modelo Binomial se aplica para X? Em caso afirmativo, quais seriam os parmetros? Justifique suas resposta. (Uma boa idia calcular valores esperados e observados e coloc-los em um mesmo

Illg,ttrnas tcnicas para estudar e apresentar descritivamente quantidades na peipulao, seja por tabelas de freqncias ou por grficos adequados. o conjunto tle dados com que trabalhamos poderia ser toda a populao ou apenas uma parte

a oportunidade de discutir

grfico).
e. Assumindo que o modelo Binomial adequado para

i. Calcule P(X

:7), P(X < 9)

X:

ir'. Qual a probabilidade de pelo menos 4 alunos serem baixosT E de mais de 7 e menos do que 12 alunos serem altos?

"

P(0 S X < 13).

30. (Use o computador) Considere os dados do arquivo aeusp.txt descrito no


Exerccio 26, Captulo L a. Para a varivel Temposp, construa uma tabela de freqncia com faixas de tamanho 10, a partir dq zero. Obtenha o histograma correspondente e
discuta a adequao de algum modelo discreto a esses dados. b. Faa um histograma da varivel Resid. Verifique se o modelo Binomial com

delir. J estudamos, no captulo anterior, que a representao de eventos de lnlcrcsse pode ser feita atravs de variveis aleatrias discretas e definimos alguns ntotlclos cuja ocorrncia na vida prtica mais comum. Nosso interesse caracterizar o conjunto de dados atravs de medidas que fsstlllim a informao, por exemplo, representando a tendncia central dos dados gu ir rnaneira pela qual estes dados esto dispersos. Tais medidas tambm podem FL'r' tlcfinidas para variveis aleatrias, permitindo caracteriz-las de forma etrrclhante ao que feito para um conjunto de dados qualquer.

4.2 Medidas de Posio Se estamos numa parada de nibus urbano e nos pedem alguma llr'orrnao sobre a demora em passar um determinado nibus, que diremos?
Nirrgtrrn imagina que poderamos dar como resposta uma tabela de freqncias rltr(' l)acientemente coletamos no ltimo ms, ou ano! Tampouco, seria adequado ttllt1'scltar um modelo terico pelo qual teramos ajustado o comportamento da

parmetros

n: l0 e

: 0,5

seria adequado para representar

comportamento dessa varivel na populao.

virrirvcl aleatria de interesse. Quem perguntou deseja uma resposta breve e t,tllrirla que sintetize a informao que dispomos e no uma completa descrio dos
tlltrlos colctados ou da modelagem que porventura fizemos.

e3

94

Captulo 4: Medidas Resumo

1,) Madidas de Posio

95

Nesta seo, definiremos medidas de posio ot medidas de tendncia central para um conjunto de dados qualquer (populao ou amostra) e, ento, consideraremos as correspondentes definies para variveis aleatrias.

o nmero de parafusos, em cada caixa, um valor inteiro, porm, a Ftrlirr no precisa ser necessariamente um nmero inteiro, Para este exemplo,
Notcr que tclrros que, em mdia, as caixas contm 98,6 parafusos.

Definio 4./: Medidas de posio para um conjunto de dados

Considere uma varivel X com observaes representadas por 1,t2,... ,tn,. A mdia desse conjunto a soma dos valores dividida pelo nmero
total de observaes. Isto
,
n

Colocando os dados em ordem crescente, obtemos: 95,96,97,98,99,99, 100 e 102. Neste caso, como o nmero de elementos no conjunto de 100, 100, datlos 10, um nmero par, tomamos a mediana como sendo a mdia dos dois
Yhrrcs que ocupam a posio central. Temos

ftrdrh,

: 99+99

99.

Iohs:

rL+ir2*..,*rI,

i:T n

D*u

E imediato que o valor mais freqente 100 e assim, mo,,1,.

- L00. tr

A mediana, representad a pot rnd,,6r, o valor que ocupa a posio central


dos dados ordenados. A moda dada pelo valor mais freqente e ser denotada po moobs.

Se houver possibilidade de confuso, faremos meno varivel

representando a mediana e a moda por md,,6r(X) e

mo,,6r(X)

X tr

As medidas de posio podem ser utilizadas em conjunto para auxiliar a dos dados ou, em determinadas situaes, uma pode ser mais conveniente ndliso a outra. Por exemplo, se um ou mais valores so muito discrepantes do que rpr,: 6o gerirl das observaes, a mdia ser muito influenciad.a por este valor, tornando1 nssirn, inadequada

para representar aquele conjunto de dados. Se uma das

Note que as definies acima tambm podem ser aplicadas quando o conjunto de dados j est organizado numa tabela de freqncia. Por exemplo,
para a mdia temos

lxirs ao invs de 95 tivesse 45 parafusos, a mdia passaria de 98,6 para 93,6. NcFl('' cilso, como a mediana no afetada por valores discrepantes, seu uso seri0 ffiis irclcquado para representar os dados. Por outro lado, para conjuntos de dados ttr rrruitas observaes, a mediana difcil de ser calculada, uma vez que o pfoccsso de ordenao custoso, mesmo com o uso de computadores. nindn

rohs:

ntrt * n2r2 * "' I nt*"'lnk,

TT'xAt

Dr,.ru f-?'i i:l n - 4n*"


;

A:

o aparecimento de distribuies multimodais, isto , conjuntos de dados possuem mais de uma, moda. Como regra geral, .precisamos usar essfls QE:-r ffieclitlirs com o cuidado de no distorcer informaes e caractersticas dos dados
Egtttrrrrr
qu rlril iunos analisando.

k diferentes valores, ponderada pelas respectivas freqncias relativas de ocorrncia. De modo anlogo tambm
e, assim, 7n6, pode ser pensada como a mdia dos

podemos obter, atravs da tabelabe freqncia, a mediana e a moda.

Exemplo 4.1.. Suponha que parafusos a serem utilizados em tomadas eltricas so


embalados em caixas rotuladas como contendo 100 unidades. Em uma construo,

llm muitos casos, a varivel de iqteresse no observada diretamente e lro do conjunto original de dados. Assim, pode ser necessrio considerar Unln originais multiplicados ou acrescidos de constantes para produzir.um s vrrlorcs lltivo corrjunto de valores. Nos prximos exemplos, estudamos como as medidas de grosiiro se alteram e veremos como podem ser obtidas a partir das respectivas flterlirlirs do conjunto original.
El'entplo y'.2.. Nas caixas de parafusos do Exemplo 4.1, vamos admitir um custo de ,' p,rr paraso e de e pela embalagem da caixa. Desejamos calcular as medidas ele lrtrsio clo custo total (T), definido como a soma dos custos dos parafusos c dtt t'rrrlrirhgcm. Iniciamos, calculando as novas medidas de posio apenas pira o ulttt lqttido por caixa (.L), isto , o custo dos parafusos contidos na caixa sem it

10 caixas de um lote tiveram o nmero de parafusos contados, fornecendo os valores 98, 102, 100, 100, 99,97,96,95,99, 100. Para essas caixas, o nmero mdio de parafusos ser dado por

9()

Captulo 4: Medidas Resumo

4,2 Merlidas de Posio

embalagem. Temos,

,,!0/l'
9Bc

MdiadeL:lnbs:
Para a mediana segue que,

I02c

*.'. * 100c
10

986 c

10

98,6 c.

t' .j'', /'

md'o1,"(X)

75" + 76"

I+2

n"ff\P.To,,,(x) Potlt scr de intese estudar o gasto dos alunos : 99c*99c

1.

associado com as despesas do

mdr,6r(L)

:99c,

e, sern maiores dificuldades, moo65(L) : 100 c. Conclumos que a multiplicao ;rcla constante c resultou em que as novas medidas de posio so as antigas nrultiplicadas por c.

stilrular. Para simplificar um pouco a situao, vamos supor que se atribui, para du irluno, uma despesa fixa de R$ 1300, relativa preparao e mais R$ 50 para Eeltr vcstibular prestado. De posse dessas informaes, vamos calcular as medldas e posio da varivel D: despesa com vestibular. Pela definio desta nova
QUnrrlirladc temos

Vamosincluiragoraocustodaembalagem.Ascaixascustaro 98c
Entro,

50x
t! --

e,

L02c*e,...,

100

c+e.

LCgt,, clo clculo que fizemos, vem imediatamente que

oh.,:50 x

1,73

1300

:
1375; 1350.

,,hs:

(9Bc

+ e) +... + (100c + e) _
10

9B6c

* 10e
10

:98,6c *

md,o1,r(D)
e.

1,5

* 1300 :
1300

Il fcil ver que para a mediana md"6,(T) : 99c * e e que para a moda, tno,1,"(T): 100c * e. Dessa forma, o acrscimo por uma quantidade e teve o e'eito de somar essa mesma constante s medidas de po.sio. n Iixemplo 4.3: Foram coletadas 150 observaes da varivel x, representando o
ttnlaro de vestibulares FUVEST (um por ano) que um mesmo estudante prestou, Assim, foi observado que 75 estudantes prestaram vestibular FUVEST, uma nica vcz, e assim por diante. Os dados esto na tabela abaixo:

mo"1,"(D)

50

x 1+

fI
mnimos):

fuenplo 4.4: l-lm estudante est procurando um estgio para o prximo ano. As Btttltrurlrias A e B tm programas de estgios e oferecem uma remunerao por
lr,,r',,* semanais com as seguintes caractersticas (em salrios

Companhia mdia mediana moda


QUttl c.rrnpanhia mais adequada?

B
2,0
1.9

)5
T,7 1,5

l,g

Calculando as medidas de posio de

X,

obtemos

I $#t'l''' \'

Ix75t_2x47-t3x2I+4x7 :
150

Lr73;

lrricialmente vamos discutir as informaes fornecidas, supondo que o lttttlirrrtc tert seu salrio "escolhido" de acordo com uma poltica salarial FcErrrrritlir na tabela anterior. A companhia tem 50vo dos seus estagirios @r'elrrtttltl (: l,'7 salrios mnimos e o valor com maior freqncia de ocorrncia , f ,t, ('rrro a mdia 2,5 deve haver alguns poucos estagiiios com salrio bem lltris irlo, isto , valor alto de salrio com freqncia pequena de ocorrncia. A Elrtlrttttltiit R tem as trs medidas bem prximas indicando umaazovel simetria ltttr: slltrios altos e baixos. A opo do estudante depender de sua qualificao.

9,

Captulo 4: Medidas Resumo

1,2 Al*lidas de Posio

99

Se ele for bem qualificado, deve preferir a companhia ,4, pois ter mais chance de

obter um dos altos salrios. Se tiver qualificao prxima ou abaixo dos outros cstudantes, deve preferir a B que parece ter uma poltica mais homognea de
salrios.

irlgurnas situaes, as desigualdades so satisfeitas por qualquer valor num o intervalo e, nesse caso, tomamos a mediana como o ponto mdio do

tr

vamos, agora, descrever algumas medidas associadas s variveis aleatrias eue, como j mencionamos, sero correspondentes s medidas
apresentadas para um conjunto de dados.

A moda o valor (ou valores) da varivel que tem maior probabilidade de Egrt'ttcia, representando-a por Mo, temos

P(X : Mo) :

max (P1, Pz,' ' ', Pn)'

tr

esperado como sntese de toda a informao pode levar a distores e interpretaes equivocadas. Em especial, possvel construir uma funo de probabilidade, com valores da varivel muito diferentes uns dos outros, em que a rndia no caracteriza o real comportamento da varivel aleatria. A mdia junto com a moda e a mediana so medidas de posio ou de tendncia central e so
clefinidas a seguir.

sabemos que a descrio completa do comportamento da varivel aleatria discreta , feita atravs da sua funo de probabilidade. Assim sendo, razovel pensar que, qualquer que seja a quantidade destinada a resumir esse comportamento, sua definio dever envolver, de alguma forma, essa funo de probabilidade. A medida mais popular o valor esperado, ou simplesmente mdia, el representa o ponto de equilbrio da distribuio de seus valores. Da mesma forma, como mencionado no caso de um conjunto qualquer de valores, o uso do valor

4.5: Considbre a varivel aleatria

com a seguinte funo discreta de

Enttts.

/,.=

t i ipi: (-

5) x 0,3 * 10 x 0,2 * 15 x 0,4+20 x 0,1 :8,5.

A mrrrll o valor com maior probabilidade e, portanto, segue q1ae Mo: 15. Por ltnr lnclo, a mediana poder ser qualquer nmero entre 10 e 15, pois, para P e I ttt, J.5], temos

P(X<b)>0,5 e P(X >b) >0,5.


ftln
c'orrveno adotada, tomamos

Suponha que os possveis valores da varivel aleatria sejam rcpresentados por tt, 12, . . . , t., com correspondentes probabilidades 'l)t,'l)2,',. ,Pk.
De.finio 4.2: Medidas
de posio

Md:12,5

(ponto mdio do intervalo).

tr

para vardveis aleatrias discretas

A
cxprcsso:

mdia, valor esperado

ol

esperana de uma varivel

dada pela

E(X)
'

: Dr,

O$serve que nem a mediana, nem a mdia precisam ser valores assumidos peln vrrrirvel aleatria. No exemplo anterior, a mdia de X foi 8,5 e a mediana 13,i tpro so valores no assumidos pela varivel aleatria' l)c modo similar ao ocorrido com as medidas de posio num conjunto de dcrl,rs, ir rnultiplicao ou a adio de constantes a uma varivel aleatriafaz com gue suis medidas de posio fiquem multiplibadas ou acrescidas pelas mesmas
Elllslitttlcs.

ou

i:L

Eremplo 4... Considere uma v. a. X com funo densidade discreta dada por

umer notao alternativa representar E(x) por px ou simplesmente Itouver possibilidade de confuso. A mediana o valor Md que satisfaz s seguintes condies

p,

se no

P(x > Md)>Ll2 e P(x < Md) > 1/2.

Nnrr rl tlil'cil verificar que f/ : 10,3; Md : 8 e Mo : 5. Se uma nova varixelY rrlrlitlir it partir de X atravs de Y : 5 X - 10, sua funo de probabilidade ser

100

Captulo 4: Medidas Resumo


4,2 Medidas de Posio
101

o clculo Fv

Ressaltamos que, no caso de conjunto de dados, usamos letras minsculas pnrit denotar as referidas medidas, eniluanto, no caso de variveis aleatrias, Ulilizamos letras maisculas. Como mencionamos, a interpretao feita de modo
das suas medidas de posio pode ser feito pela definio. Temos

girnilar nos dois casos.

g x 0,1 * 15 x

0,3+... +90 x 0,2 :

4L,5)

Md(Y) :
Mo(Y)

30, pois onico valorcom

p(y > 30) > 0,5 e p(y < B0) )

Fxcrccios da Seo 4.2:


0,5;

l.

l)iscuta quais medidas de posio seriam mais adequadas para os conjuntos de


dados abaixo. Comente suas escolhas.

15, pois o valor com maior probabilidade.

Estes mesmos resultados poderiam ser obtidos a partir das medidas de posio de X multiplicadas por 5 e subtradas de 10. Isto ,

Esta propriedade

Fv:5x10,3-10:41,5; Md(Y):5xB-10:30; Mo(Y):5x5-10:15. facilita clculos e pode ser bastante til.

tr

Na Tabela 4.1, apresentamos as expresses para as medidas de posio para as duas situaes estudadas: conjunto de dados e varivel aleatria.
Tabela 4.1: Medidas de tendncia cntral.

disponveis dados mensais sobre a incidncia de envenenamento por picada de cobra. Deseja-se planejar a compra mensal de antdoto. lr. O nmero dirio de usurios, entre 17 e 19 horas, de determinada linha de nibus foi anotado. Pretende-se utilizar essa informao para dimensionar a frota em circulao c. Um fabricante de baterias deseja divulgar a durabilidade do seu produto e coleta a informao sobre a durao de 100 de suas baterias. tl. Num vo internacional uma companhia serve dois tipos de pratos no jantar: peixe ou frango. Um banco de dados contm os pedidos feitos nos ltimos 200 vos. Pretende-se planejar o nmero de cada tipo a ser colocado disposio dos passageiros.
tu. Esto

2, Vinte e cinco residncias de um certo bairro foram sorteadas e visitadas por um cntrevistador que, entre outras questes, perguntou sobre o nmero de tclcvisores. Os dados foram os seguintes:

2,2,2,3,7,2,1,
rlc posio.

1, 1, 1, 0, 1,

2,2,2,2,3,r,1,

3, 1, 2,7,0 e

2. ^eai#

//

Orgirnize os dados numa tabela de freqncia e determine as divers as

.1. Ntrrn experimento, l5 coelhos foram alimentados com uma nova rao e seu pcso avaliado ao fim de um ms. Os dados referentes ao ganho de peso (em r;uilogramas) foram os seguintes:
I

1,5; 1,6; 2,3;\7,7;

!;5;2,0; L,g; I,8;2,7;2,L; L;9i \,8;i.!,7;2,5

e 2,2.

n. Utilizando os dados brutos, determine mdia, moda e

mediana desse

conjunto. lr. Organize uma tabela de freqncia com faixas de amplitude 0,2 a partir de 1,5'

t02

Captulo 4: Medidas Resumo

4,. Medidas de DisPerstt

103

c. calcule, a partir da tabela de freqncia e com o ponto 'krdio como d.


representante de cada faixa, a mdia, a moda e a mediana. comente as diferenas encontradas com o item (a). se ao invs de 15, fossem 500 coelhos, qual seria o procedimento mais conveniente: o de (a) ou o de (c)? Ter acesso a computador faz diferena?

Ee

rtumente os altos rendimentos de alguns residentes sero suficientes para fazer mundo, porm trrclia atingir um patamar comparvel s melhores economias do grande. O que podemos e rliscrepnca entre os diversos valores deve ser muito cntrrr.esquecendo a variabilidade dos valores da varivel e isto no captado

4. Sendo

uma varivel aleatria com funo de probabilidade dada a seguir, obtenha as medidas de posio 1t, Md e Mo.

pelrr rnia e sim pelas medidas de disperso' Por exemplo, para o conjunto de Vnl.,,'cs 0, 20 e 40 a mdia igual a 20. O mesmo acontece com o conjunto 20, 30 c 20. Os dois conjuntos tm valores bem diferentes, apesar de terem a mesma

a-.''
> Md.: Mo. Md < Mo. < t-L 6. um atacadista recebe
b.
c.
pr,

fltrliir. De fato, fctl construir exemplos onde dois conjuntos de dados distintos possuem medidas de posio idnticas. Em muitas dessas situaes existe

li'.r"no em relao disperso dos dados, isto , quanto maneira como os Valer.cs de cada conjunto se espalham. A fim de quantificar tal aracterstica, vtliuos definir algumas medidas de disperso'
Dc,f'ittio 4.3: Amplitude de uma varidvel em utn coniunto de dados

5. Para cada item abaixo, construa uma_varivel aleatria que atenda as condies indicadas. . p: Md : Mo.

( -"

A amplitude, referente a uma certa varivel, definida como a diferena n por A. lltr.c o maror e o menor valor do conjunto de dados. Ser denotada

de vrios fornecedores uma certa pea para revenda. A pea produzida com material de qualidade diferente e, portanto, tem custo

A amplitude s leva em conta dois valores de todo o conjunto e, assim, as er.iir mais cnveniente considerarmos uma medida que utilizasse todas em observao ltscrvaes. Uma idia inicial considerar o desvio de cada nttrilr do que a referncia, o desvio
egtlir.

diferenciado. Levando em conta a proporo fornecida e o preo apresentado por cada fabricante, pode-se admitir que o custo de uma pea em reais, escolhida ao acaso, uma varivel aleatria (C). Admita a seguinte funo de probabilidade para C:

seja felrriro a um ponto de referncia e ento tomar sua mdia. caso a observao seria negativo, caso seja maior, positivo' A de sinais diferentes se compensem, que termos Fqrrur cle tais desvios far com p6tlcrrclo ocultar o efeito da variabilidade. Esta dificuldade discutida no exemplo

a. Determine as medidas de posio davarivgl C. b. Suponha que o atacadista revenda cada uma dessas peas acrescentando 50% sobre o custo da pea, alm de um adicional de R$0,10 pelo frete. Calcule as medidas de posio davarivel preo de revenda.

E,rttttplo 4.7: Numa classe com 12 alunos de um curso de ingls, os alunos llrlir:itt'am o nmero de outras lnguas (alm do portugus e ingls) que tinham 1, 1, Hlg,rrrla familiaridade. Os resultados ordenados foramos seguintes: 0;0,0,0, obtemos e mediana a e a mdia dificuldade sem f , l, I ,2,2 e 4. Calculamos
iT,,/,r

13f 12 e md,,6*

L.

O desvio de cada observao em relao

mediana

ex;rlcssito

4.3 Medidas de Disperso


Apesar das medidas de tendncia central fornecerem uma idia do
comportamento das variveis, elas podem esconder valiosas informaes. Essas medidas podem no ser suficientes para descrever e discriminar diferentes conjuntos de dados. Por exemplo, um bairro nobre da capital paulista inclui umir das maiores favelas de So Paulo. o que podemos dizer da renda mdia do bairro?

[], 0, 0, 0, ]-, 1

ri -

m(1o65.

Para o conjunto de dados acima temos:

Nultrrrr<ts que valores negativos e positivos se compensam, diminuindo a mdia

e 3.

Se calculamos a mdia desses desvios obtemos 1/12'

obtido pela -1, -1' -1, -1, 0,

rlrs rlcsvis e dando a falsa

impresso de pequena variao. Um caminho que trlcr.nirtivo seria tomar a mdia dos valores absolutos dos desvios acima, o rllrrrrtttitttdo tlesvio mediano e definido por

104

Captulo 4: Medidas Resumo

4,.1

Medidas de Disperso

105

desvio mediano : iElni - md.o6,l : *

A vantagem de usar essa expresso alternativa evitar a operao de subtrao,


qrrc em muitos casos envolve decimais e torna-se muito trabalhosa.

uma outra maneira de calcular os desvios em relao mdia e, neste caso, a expresso a ser usada r,; - rotr. A soma desses desvios sempre d zero se o clculo for feito sem arredondamento e, portanto, a mdia deles tambm sempre zero. Dessa maneira, essa medida no seria nada informativa sobre a disperso das observaes. Entretanto, podemos tomar os valores absolutos obtendo o desvio m,dio, que definido como a mdia dos valores absolutos dos desvios em
relao mdia. Isto , desvio

Exemplo 4.8: No Exemplo 4.1, foram fomecidas as quantidades de parafusos em l0 caixas de um lote. Pelos valores observados, o maior nmero de parafusos foi 102, ao passo que o menor foi 95. Logo, a amplitude ser dada por

A--102-95:7.
Para calcular a varincia, utilizamos o valor da mdia, 98,6; j,obtido no te'crido exemplo. Para auxiliar nos clculos, podemos construir as tabelas abaixo.

mdio: - a \-

L24lri-T"n''l: 6 '

"12

b(

llpcnas uma coluna com os valores

tJlilizando a expresso da Definio 4.4, necessrio criar colunas com os (*o - Tnt r)2, enquanto que a expresso alternativa requer vrrlrrres ri - Tohs

"

rf

I)efinio 4.4:
desvios mediano e mdio utilizam a funo mdulo que, por suas caractersticas matemticas, torna mais difcil o estudo de suas propriedades. Definimos a seguir ua nova medida de disperso que iliza o quarado dos
desvios em relao mdia.

i,,)lsi$
ri'Tob,

os

,L

1:;

/ \ri

Alternativa:

I
2
L)

\., I,'hs)'

lLi

ri'
9604 70404
10000 10000
9801

98

r02
100 100 99 97 96 95 99 100

0,6 3,4
r14

0,36
11,56 1,96 1,96

98

2
.)

102
100.
100 99

Definio 4.4: Vari,ncia e desvio-padro etn um conjunto de dados

4 5 6
I

L,4

4
5 6 7 8

A varincia, referente varivel


por
aTl

0,4

de um conjunto de dados, definida

ver(,hs:: /-' ) .(", -T,,t r)2 n,


desvio-padro como sendo dpob,: var,n . f confuso, faremos meno varivel X, utilizando

l-.-

8
.

- 2,6 - 3,6
1,6

0,4
L,4

0,16 2,56 6,76 L2,96 0,16


1,96 40,40

97
96 95 99 100

9409

9276 9025
9801
10000

l0
total

10

Para manter a mesma unidade dos dados originqis, conveniente definirmos o

total

97264

se houver
a notao

possibilidade de
Scp,rrc da

var,,6_(X). tr

Definio 4.4 e da tabela correspondente que:

A expresso apresentada na Definio 4.4 auxilia o leitor na interpretao


da varincia como uma medida de variabilidade. Entretanto, possvel obter uma

vlr(,hs:

1.\.
; L\",X:I

t1,6*)'

\, :

expresso alternativa que facilita os clculos. Fica como exerccio ao leitor


mostrar que:
Vgfobs

ff : n,on'

lrt:lir cxpresso alternativa, temos

- v \--, Q-t

4'ILl

_u

*obs'

1.\ " -1 vctt'(il).\:- > .r n,-' -ri,t^


z=l

:- 97260 -:1nu,u;): n,on. 10

t0(t

Captulo 4: Medidas Resumo

1,.1 4uliclas de

Disperso

107

Naturalmente, qualquer que seja a expresso utilizada, o desvio padro dado por

dpohr:

JT,04:2,AI.

Ee trtorlo anlogo, escrevemos

Para o caso em que o conjunto de dados est organizado numa tabela de freqncia, o clculo da varincia ser modificado de forma conveniente com a

var,,6,(Y):

(7b

502

+.'. + 7 x200\ -86,52 :1917,5i +...+7 x 15002) 1386,52

ponderao dos desvios pelas respectivas freqncias. Aproveitamos o prximo exemplo para ilustrar essa situao, alm de discutir o efeito, sobre a varincia, da multiplicao ou adio de constantes aos valores da varivel de interesse.

rttr,6,(D):

I #

(75 x 13502

:rgr7,5.

Exemplo 4.9; No Exemplo 4.3, definimos a quantidade D, despesa no vestibular, obtida a partir de x pela expresso D:50 x x*1800, com x indicando o nmero de vestibulares prestados. Para efeitos didticos, antes de obter a varincia de D, vamos calcular a varincia de X e da quantidade auxiliar Y:50 x x. Iniciamos por ampliar a tabela de freqncia de x, para incluir tambm os valores deY e D. Temos,

X
1

Y
50 100 150

D
1350 1400

Note que a varivel D nada mais do que Y acrscido de 1300. No bliy(e, suas varincias so iguais, isto , o acrscimo de constante no alterou a Crilrrcia. Esse resultado de certa forma previsvel, pois a adio ou subtrao $g orrstante corresponde a uma translao dos valores dessas quantidades, no ltet'ntrclo sua variabilidade relativa. Por outro lado, Y igual a 50 vezes a yt'irvcl X e sua varincia 502 vezes a varincia de X. Esse resultado se explica, pgls l multiplicao por constante altera a distncia entre os valores da varivel flgirrll e, pela frmula da varincia, o efeito ser pelo quadrado da constante. E E*emplo 4.10: O salrio de professores do ensino fundamental da rede privada Flri scrrclo estudado. A tabela abaixo apresenta os valores, em salrios mnimos, btitlos em um levantamento numa certa cidade. Desejamos calcular a mdia e a Vt'incia desse conjunto de dados.
Salrio

Tri

75

2
J

47
2L 7

r450
1500

200

As mdias de X e D jforam calculadas no Exemplo 4.3 e a de Y segue sem dificuldade. Assim, r,hs : I,73; y,,6-: 86,5 e ,,h, L 1386,5. Para calcular a varincia de X, via tabela de freqncia, adaptamos as expresses apresentadas anteriormente obtendo:

freqncia
L4

1F3 3F5

25
1B

var,,6.(X):
ou, na forma alternativa,

14

# -- " D",(*, i:l

r,,0,)'

5-7 7-9
9F11
total

I
4 70

Vafr,6r(X)

hD",",

_c nohs'

f-o1lo ir varivel est apresentada em faixas de valores, no temos os valores


el.livirnrente observados e, portanto, no podemos aplicar as frmulas da mdia e rlrr virrirrcia. Para contomar essa situao e obter resultados aproximados para as ttrt,rlirlas clesejadas, tomamos como representante de cada faixa seu ponto mdio. ['orrr cssit alternativa, o clculo feito nos mesmos moldes das variveis

Optando por utilizar essa ltima expresso temos o seguinte clculo:

var,,1,,,(X):

r,o

(Tsxt2 *4T x22 +2r x 32 + r x +2)-r,TJ2 :0,767.

t08

Captulo 4: Medidas Resumo

4,.1

Medidas de Disperso

109

quantitativas discretas. Assim,

.5 ln : : Iohs '(0 ) Tli.:xi -

14x2+25 x 4+ ". *4 x
70

10

4,97.

a informao dos valores esperados, medianas e modas concluiramos por uma perfeita harmonia de desempenho disponvel, ctitivesse elttrc os vrios mtodos. Entretanto, como podemos observar pelas distribuies de probabilidade, esse no o caso. Por serem medidas de tendncia central, as trs rnedidas acima no captaram a variabilidade existente em cada mtodo. D

Se apenas

Para a varinpia:
VQfohs

:h'"*r -77,u":29,7I - 24',72:

4,99.

Como mencionamos para as variveis em um conjunto de dados, podemos ter vrias maneiras de medir a disperso. Para o caso de variveis aleatrias vnrlos definir apenas a varincia, que a medida mais utilizada.
De.linio 4.5: Vartncia de uma varidvel aleatria discreta

Para um salrio mnimo de R$ 180, a mdia e a varincia dos salrios em reais seriam, respectivamente, 180 x 4,g7: 894,60 e 1802 x 4,gg: 161.676,00. tr

Vamos, agora, apresentar as medidas de disperso para variveis j mencionamos no incio da so, as medidas de posio no "explicam tudo" que est acontecendo, seja num conjunto de dados ou com variveis aleatrias. O prximo expmplo refora essa idia para o caso de
aleatrias. Como variveis aleatrias.

Seja X uma varivel aleatria com P(Xi - *n) : P,i,'i : L,2,... ,k e Itrdia p. A varincia de X a ponderao pelas respectivas probabilidades, dos tlesvios relativos mdia, elevados ao quadrado, isto ,
k

Var(X):
'

(*,

i:I'

p)'

pu

Exemplo 4.11: llma pequena cirurgia dentria pode ser realizada por trs mtodos diferentes cujos tempos de recuperao (em dias) so modelados pelas variveis Xr, Xz e Xs. Admita que suas funes de probabilidade so dadas por

Muitas vezes, denotamos a varincia por o2 e, se houver possibilidade de otuso, usamos o2r.Exttaindo araiz quadrada da varincia obtemos o desviotr pulrto que representado por d ou ox.

0,2

10

Exctnplo 4.12: Retomando o exemplo anterior, calculamos as varincias dos


tenrpos de recuperao para cada mtodo. Temos,

0,2

0,2 .

x, I 1 5 9 Pi I tls 113 rl3


O valor 0 na varivel X1 pode ser interpretado como recuperao no mesmo dia da cirurgia. Na tabela abaixo, apresentamos o valor esperado, a mediana e a moda para cada uma das trs variveis. Vale ressaltar que a moda nem sempre nica e para construir a tabela a seguir, escolhemos o valor 5 como representante dos valores modais de X1e X2.
X1 X2
5 5 5

Wtr(X): (0-

5)2

x0,2+(4-5)2 x0,2 + "'+ (10-b)2 x0,2:10,40.

l)e rrrodo anlogo, obtemos:

Var(X2)
vrrrinbilidade

L0,67

e Var(X3): 0,60.
e X2),teremos
maior

l)cssa brma, utilizando-se os mtodos 1 e 2 (variveis X1


no tempo de recuperao.

anteriormente pode ainda ser considerada como o vrrlor csperado de uma nova varivel aleatria, o desvio ao quadrado. Isto ,

A varincia definida

X3
5

valor esperado
mediana moda

5
5 5

Var(X):E[(X-p)2],
it rltrirl pode ser convenientemente reescrita na seguinte forma

5 5

u0

Captulo 4: Medidas Resumo

1,, Medidas de Disperso

IlI

Var(X)

: E(X\ - P2 : la,"? - ut' i:L


:,'i;i;iiir,-:u^2,;t
:. i
tl'.:li!;!.?.

Tabela 4.2: Medidas de disperso.

Esta ltima expresso bastante til e, para no criar confuso, explicitamos os seus termos. O termo E(Xt) o valor esperado da varivel leatria X2, ao passo que p2 indica o quadrado do valor esperado de X. O prximo exemplo recalcula as varincias do exemplo anterior, atravs da expresso acima.

'

u"lsf#'"!'li

',:ri;,ii

lll

Exemplo 4.13:

A partir das funes de probabilidade de X1,X2 e

Xs

::. Varinci-,.;=

apresentadas no Exemplo 4.11, obtemos

:::
j
:

*:

::::::::::-r:.,, ::.:!;:::..:!..:l/a;U

: r:l

llllllltlffi

(nltcrhti.v,a),[

un',;6;f1[ri:=

$Jr
rlf;\ -:i.'
"4,::r

r-r,ip',.t,i;

w"@
como por exempo,

x3

I r

25 81

x?l 16 2b 36

Tabela 4.3: Propriedades da mdia e da varincia.


t

As funes de probabilidade acima foram obtidas a partir de operaes simples,

conjni oe naos

P(X?:

16)

: P(Xt -- 4 ou Xt :
x 0,2 t"' +

4)

: P(Xt :

4),

uma vez que X1 no assume valores negativos. Temos ento que

i::i;

E(x?) : 0 x
Ento,

0,2

16

100

x 0,2 :35,40.

#,,

*Y, ,i.fiffi

Var(X):35,4-* - 10,40. De modo anlogo, obtemos E(X :35,67 e n(X'zr) :25,60; resultando emVar(X2) = 70,67 e Var(X3): 0,60. tr A Tabela 4.2 auxilia o estabelecimento da correspondncia entre as
medidas de disperso obtidas a partir de um conjunto de dados e aquelas calculadas para variveis aleatrias. Em seguida, na Tabela 4.3, apresentamos um resumo das propriedades da mdia e da varincia discutidas at agora.

Vamos concluir esta seo apresentando, atravs de exemplos, os clculos

do vlrlor esperado e da varincia de alguns dos modelos tericos que foram


del'irr itlos no captulo anterior.

Et'ttttpltt 4.14: SejaX com distribuio Bernoulli de parmetro p. Temos

E(X):0x(1 -p)+Lxp:p 6\: 02 x Q - p) * L2 x p: Lrrg,,, ir varincia ""rf Var(X)-p-p2:p(t-p).

'

tr

1t2

Captulo 4: Medidas Resumo

1,.1 l+4cdidas de

Disperso

113

Exemplo 4.75: Para uma varivel aleatria parmetrosnep,temos

com distribuio

Var(Y): E(Y\
k

E'(Y)

E(x):IkP(x:k)
;:0

: i2P(Y : i)j:r
.:J: L

(ry)'
_
(t

n' :ik, (r- P)"-* (n-ub* ?'" A:I

:iD,r- (+)'
_L k(k+r)(zk+7)
k6 :- k2-L
12

+ t)2

6-#@='Pk(1-P)'-k
s
n,

(n - 1)! L)t . nk_r (7 \ - p)-' ''' 2 @-\r, 1)!' k)t(k :1


Substituindo nesta ltima expresso,
obtemos

k-L

por

e, em seguida

n-I

pot r

E(x)
uma vez que

- "e'F_(,) r, e - p)' -i :

np,

Para se calcular o valor esperado e a varincia, no caso dos modelos de Pglss<rn, Geomtrico e Hipergeomtrico, so necessrias tcnicas um pouco mais rrdas. Optamos por no apresent-las aqui, tendo em vista o objetivo desse EXto c, para o leitor interessado, indicamos o livro de Mood, Graybill e Boes lq7q. Na Tabela 4.4 apresentamos os valores esperados e as varincias para telos os modelos discutidos no captulo anterior.

probabilidades de uma varivel Binomial com parmetros r e p' A varincia ser calculada mais facilmente no prximo captulo, qua apresentaremos propriedades da varincia da soma de variveis independentes. Por ora, s informamos que seu valor nplL - p)'
a

a somatria igual a 1, pois corresponde a somar todas

Tabela 4.4: Modelos discretos- valor esperado e varinca.


tffii1,///,//rij"l;,.?.*.-tF.

Varivel Diiciet'; : ;; /ji;..!. ... .........:.:;....-. -

wffi"',

Exemplo 4.16: Considere a varivel aleatria Y com modelo Uniforme entre os valores I e k. Aplicando a definio de esperana matemtica utilizando a conhecida expresso para a soma de uma progresso aritmti
temos

)(
_:::h6 t x|| I
:

;-. r:

b)ii
iii:l:::

r! !.!l$nN!

!i:!1

E(Y):Lipv : :Di j:1 j:1

k:k

>,t: '"
.:i=t

k+7

LLtt\\\riti

sffi\,wqry ls,::l:;;,:: :I

Para calcular a varincia usaremos o seguinte resultado de soma de sries:

Ws'..14)!
'W"{"/"K,2/'r'*?t:;i-z7:titi

r.

D/:
.:i:r

k (k

+ L)(zk +

"riltii;it

L)

ento,

il4

Captulo 4: Medidas Re

4,4 li.rtrccios

t15

Exerccios da Seo 4.3:

l.

Voc est indeciso em comprar uma televiso e decide avaliar a informaes estatsticas, fornecidas pelo fabricante, sobre a durao (e lroras) do tubo de imagem.
Marca da TV Mdia Mediana Desvio Padro

.jogador ganhou menos o pagamento inicial (prejuzo ' lucro negativ.o). l)ctermine mdia, moda, mediana e varincia dessa varivel.
6. Nrrma certa cidade, o nmero de crianas em idade escolar, em famlias com 4 f ilhos, uma varivel aleatria modelada pela Binomial com parmetros n : 4 c 1r: 0,6. Para cada filho em idade escolai, um projeto de apoio educao prrga 1 salrio mnimo para a famlia. Calcule a mdia e a varincia do custo
rlcsse projeto por famlia.

GA
8000 8000 600

EB 8200 9000
1500

HW
8000

7000
2500

e
4.4 Exerccios

---'t'

,-

Com que marca voc ficaria? Justifique.


2.

pulsao de 10 estudantes no incio de uma prova de estatstica?am

l,

)86. Calcule a mdia

"

a uurin"iu

O"rr"

3. Num estudo sobre consumo de combustvel, 200 automveis do mesmo ano modelo tiveram seu consumo observado durante 1000 quilmetros. infbrmao obtida apresentada na tabela abaixo em km/litro.
Faixas Freqncia
27 29 46 43 55

"".

tlrrr certo cruzamento tem alto ndice de acidentes de trnsito, conforme pode scr constatado em uma amostra dos ltimos 12 meses: 5,4,7, B, 5, 6, 4,7, g, 7, 6 e B. Determine a mdia e a varincia do nmero de acidentes mensais
rrcsse local.

l. listudando uma nova tcnica

de sutura, loram contados os dias necessrios para ir completa cicatrizao de determinada cirurgia. Os resultados de 25 pacientes

7F8 8F9
9F10
10
11

lrlam os seguintes: 6, 8,9, 7,8,6,6,7,8,9,10,7,8, 10,9, 9,9,7,6,5,7,7,8, l0 e I 1. Organize os dados numa tabela de freqncia e calcule a mdia e a
virrincia.

(-_:,.

F 11
F
12

, IJrna amostra de vinte empresas, de porte mdio, foi escolhidapata um estudo sobre o nvel educacional dos funcionrios do setor de vendas. Os dados coletados, quanto ao nmero de empregados com curso superior completo, so
rrpresentados abaixo.

Detennine o desvio padro do consumo.

Empresa

1 1

2 0 13

t d

4
r)

6
L

8
2

I
2 1B

10 2 19
t
L)

11

4.

Nurn certo bairro da cidade de So pauro, as companhias de seguro cstabeleceram o seguinte modelo para o nmero de veculos furtados por
sclnani:

No. Funcionrios
Empresa

0
15

I
16
1

0 20
2

72 2

14 2

t7
1

purtosl_o.

_1_

2 J n

t" \.
ru.

No. Funcionrios

calcule a mdia e a varincia do nmero de furtos semanais desse bairro. 5. Nunr jogo de dados, umjogador paga R$ S puralanar um dado equilibrado e ganha R$ 10 se der face g, ganha R$5 se der face 5 e no ganha nda as "o* outras faces. Defina a varivel luro por jogadacomo sendo o saldo do que o

Organize uma tabela de freqncia e calcule mdia, moda e mediana.' b. Determine o desvio padro.

c. As empresas pretendem
.1.

incentivar

estudo dos seus funcionrios

o'erecendo um adicional de 2 salrios mnimos para cada funcionrio com curso superior. Qual ser a despesa mdia adicional nessas empresas?

As notas finais de estatstica para alunos de um curso de Administrao foram irs scguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5,6, 4,6,6,3, 8, 4, 5, 4, 5, 5 e 6.

il

Captulo 4: Medidas R

4.4 li.rarccios

t17

a. Determine a mediana e a mdia. b. Separe o conjunto de dados em dois grupos denominado s aprovados, nota pelo menos igual a 5, e reprovados para os demais. Compare varincia desses dois grupos.
5.

l)aciente

27

22

23

24

25 208

26

27

28

29

30

Colesterol
n.

203

205

206

206

209

217

214

2IB

225

(lllcule

a mdia, a moda, a mediana e a varincia a partir da tabela de dados

est planejando a ampliao dos leitos para rec nascidos. Para tal, fez um levantamento dos ltimos 50 nascimentos, obtendo informao sobre o nmero de dias que os bebes permaneceram no h antes de terem alta. os dados, j ordenados, so apresentados a seguir: 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4,4,4,4,5,5,5, 5, 5, 5,6,7,7, g e 15. n. Organize uma tabela de freqncia. b. Calcule mdia, moda e mediana. c. Determine o desvio padro. d. Dentre as medidas de posio calculadas em (b), discuta quais delas seri mais adequadas para resumir esse conjunto de dados.

um lrospital maternidade

llrutos. b. ( )r'ganize os dados em uma tabela de freqncia com faixas de tamanho de l0 a partir de 160. l{cra o item (a) usando a tabela de freqncia obtida em (b). e, (lomente as diferenas encontradas entre os valores das medidas calculadas al. crn (a) e (c).
,

tcrnpo, em horas, necessrio para um certo medicarnento fazer efeio

Itplcscntado abaixo:

0,2r 2,71 2,12 2,81 3,30 0,15 0,54 3,r2 0,80 1,76 1,I4 0;16 0,31 0,91 0,18 0,04 l,16 2,16 I,48 0,63
conjunto de dados. b. (bnstrua uma tabela de freqncia para classes com amplitude de 0,5 hora, corneando do zero. f. Suponha que o conjunto original de dados foi perdido e s dispomos da
H. ( lllcLrle a mdia e a varincia para o

c. voc identifica algum valor excepcional dentre os que foram observados, Se sim, remova-o e recalcule os itens (a) e (b). Comente as difr
encontradas.

6.

o departamento de atendimento ao consumidor de um concessionria veculos recebe, via telefone, as reclamaes dos clientes. o nmero clramadas dos ltimos 30 dias foram anotados e os resultados foram: 3,4,5, 4, 5, 6, g, 4, 4, 5, 6, 4, 3, 6, 7, 4, 5, 4, 5, 7, g, g, 5, 7, 5, 4, 5, 7 e 6.
a. Construa uma tabela de freqncia. b. Calcule a mdia e o desvio padro.

tirbcla construda em (b). Utilizando alguma suposio conveniente, rcrculcule a mdia e a varincia e comente as possveis diferenas

cncontradas.

Ertrrrlirnclo-se o nmero de acertos em 100 lances-livre de bola ao cesto, uma $uros(r'a com 20 jogadores forneceu os seguintes resultados: 68,73, 61, 66,96,

c. Admitindo que cada telefonema acarreta servios sob a garantia avali em R$ 50 por chamada, calcule a mdia e o des.rio padro das oriundas do atendimento ao consumidor.
7. lioram anotados os nveis de colesterol (em mg/l00m1) para trinta pacientes urna clnica cardaca. As medidas se referem a homens entre 40 e 60 anos idade que foram clnica fazer um check-up.

ft), (t5,86, 84, 79,65,78,78,62,80,67,75,88, 75 e 82. Agrupe


l(10 irllcmessos.

as

obsr:r'vaes em intervalos de comprimento 5 a partir de 60 e, usando alguma Irrgrosiiro adicional, determine a mdia e a varincia do nmero de acertos em

10.

I Sindicato

dos Engenheiros do Estado de So Paulo est estudando o

Paciente

.)

4
163 74

I
173
19

10

Colesterol
Paciente

160
11

160
T2

161
13 181

167
15

170
16

172
T7

172
1B

177 20 203

irrrgrircto do estgio na obteno de bons empregos. Dentre os engenheiros a'r'r'd'ru 'ormaclos e com empregos considerados bons, foi sorteada uma aostra c' olrscrrvado o nmero de anos de estgio anteriores formatura. $, ('irlculc a mdia e a varincia.

Colesterol

178

181

782

185

186

194

797

199

It- l'irnr cl'eito de anlise, decidiu-se desprezar os valores que se distanciassem tlir rndia amostral por mais de dois desvios-padro, isto , s sero crrrrsiclcrados os valores no intervalo fronr* 2 dponr. Recalcule o item (a) e
corncntc os resultitdos.

il8

Captulo 4: Medidas Resumo

1,.1

Exerccios

119

Anos de estgio
0
1

freqncia
25
5B

Interrupes
0
1

freqncia

2
r)

t47 i05
72 45 10

t2 t4

2
.)

I
I

4 5 6

4
5 6

t d

3 2

total

462
ru.

total

50

11. Na linha de produo de uma grande montadora de veculos, existem 7 verificaes do controle de qualidade. Sorteamos alguns dias do ms e anotamos o nmero de "OKs" recebidos pelos veculos produzidos nesses dias, isto , em quantos dos controles mencionados o automvel foi aprovado.
Aprovaes 4
5 6 7

freqncia
L26,

359
1685

4764
6934

total produzido.
tr. Calcule a varincia.

Determine a mdia e a varincia do nmero de interrupes semanais. b. O Governo Federal aplica uma multa de 10 mil reais por semana, se h pelo menos uma interrupo no fornecimento. Calcule a mdia e a varincia do valor das multas aplicadas por semana. c. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios setores, decorrentes da falta de energia e atribuiu um valor total de 900 mil reais para ser ressarcido pela companhia responsvel pelo fornecimento de eletricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo mdio por semana? rl. Nesse perodo, qual ser a mdia e a varincia do desembolso semanal da companhia, incluindo multa e ressarcimento de prejuzo?

a. Determine mdia, moda e mediana do nmero de aprovaes por automvel

l.l. O Centro Acadmico

de uma faculdade pretende iniciar uma campanha junto direo da escola com vistas melhoria das salas de informtica. Para tal, fez nmero de uma enquete com todos os alunos perguntou sobre

c. crie uma nova varivel Reprovaes, indicando o nmero de verificaes no "OKs" no veculo. Determine mdia, moda, mediana e varincia dessa
varivel.

computadores que cada um tinha na sua residncia. Computadores


0
1

freqncia
156 135

d. Cada reprovao implica em custos adicionais para amontadora, tendo em vista a necessidade de corrigir o defeito apontado. Admitindo um valor
bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia e a varincia da despesa adicional por automvel produzido.

2
t)

47
25
B

12. O rgo do Governo Federal encanegado de fiscalizar a distribuio de energia eltrica tem acompanhado o nmro semanal de intemrpes de fornecimento numa certa cidade. Os dados, referentes s ltimas 50 semanas, consideraram apenas as interrupes que ultrapassaram 3 horas e so
apresentados na tabela abaixo.

total
a. Obtenha a mdia e a varincia. b. O Centro Acadmico argumenta qe

37L

o ideal ter uma

mdia de

cornputador por tluno,

.iuntando os 20 da sala de informtica da faculdade

H8

Captulo 4: Medidas Re

lixerccios

119

Anos de estgio
0
1

freqncia
25
5B

Interrupes
0

freqncia
12
T4

2
e)

747 105 72 45
10

I
2
t)

I
I t J t r)

4
5 6

4
5 6

total
1L.

462

total

50

Na linha de produo de uma grande montadora de veculos, existem, verificaes do controle de qualidade. Sorteamos alguns dias do ms anotamos o nmero de "oKs" recebidos pelos veculos produzidos nesses d
Aprovaes
4
5

isto , em quantos dos controles mencionados o automvel foi aprovado.


freqncia 726
359 1685

tt. l)etermine amdia e a varincia do nmero de interrupes semanais. It. O Govemo Federal aplica uma multa de 10 mil reais por semana, se h pelo rlenos uma interrupo no fornecimento. Calcule a mdia e a varincia do valor das multas aplicadas por semana. e. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios sctores, decorrentes da falta de energia e atribuiu um valor total de 900 mil rcais para ser ressarcido pela companhia responsvel pelo fornecimento de clctricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo
rrrdio por semana?

6
I

4764

total

6934

d. Ncsse perodo, qual ser a mdia e a varincia do desembolso semanal da companhia, incluindo multa e ressarcimento de prejuzo? () (-lentro Acadmico de uma faculdade pretende iniciar uma campanha junto rlirco da escola com vistas melhoria das salas de informtica.Parata\ fez ullir enquete com todos os alunos e perguntou sobre o nmero de
ornllutadores que cada um tinha na sua residncia. Computadores
0
1

a. Determine mdia, moda e mediana do nmero de aprovaes por au produzido. b. Calcule a varincia. c. Crie uma nova varivel 'Reprovaes, indicando o nmero de veri no "OKs" no veculo. Determine mdia, moda, mediana e varrancla varivel. d. Cada reprovao implica em custos adicionais para a montadora, tendo vista a necessidade de corrigir o defeito apontado. Admitindo um bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia varincia da despesa adicional por automvel produzido.
12.

freqncia
156 135 47 25
B

2
3

O rgo do Governo Federal encarregado de fiscalizar a distribuio energia eltrica tem acompanhado o nmero semanal de interrupec fomecimento numa certa cidade. Os dados, referentes s ltimas 50 consideraram apenas as interrupes que ultrapasszrram 3 horas I
apresentados na tabela abaixo.

total
n, ( )lrtcnha a mdia e a varincia,

37r

b. ( ) Centro Acadmico

argumenta qe o ideal ter uma mdia de 1 c'onrputador por aluno, juntando os 20 da sala de informtica da faculdade

t20

Captulo 4: Medidas Resumo

4.,1

lixerccios

121

com os que os alunos tm em casa. Quantos computadores precisariam ser


acrescentados sala para atender o Centro Acadmico?

10. Uma pea produzida por uma mquina pode receber do controle de qualidade

lrs classificaes: boa, defeituosa ou recupervel, com as

seguintes

14. Duas moedas esto sobre a mesa, uma delas tem duas caras e a outra tem probabilidade igual de cara e coroa. Sorteamos, ao acaso, uma dessas moedas e a lanamos duas vezes. Seja X a varivel aleatria que conta o nmero de caras nesses dois lanamentos. Qual a mdia de X?
15. Num teste de digitao, o tempo em minutos (7) que os candidatos le para digitar um texto modelado, de forma aproximada, pela seguinte fun de probabilidade:

probabilidades, 0,5; 0,2 e O,3, respectivamente. Suponha que sejam vendidas a l$ 100, R$ l0 ou R$50 conforme forem boas, defeituosas ou recuperveis, rcspectivamente. Se duas peas, escolhidas ao acaso, so vendidas, qual o vtlor mdio da venda?
2(1.

O tempo de durao em horas de uma lmpada especial foi modelado por uma vlrivel aleatria X com a seguinte funo de probabilidade:

pi
O candidato recebe 4 pontos se terminar a digitao em 9 minutos,
nmero de pontos obtidos no teste.
5

xl5

l0,L 0,1

0,2

0,4 0,1

8910

0,1

terminar em 8 minutos e assim por diante. Determine amdia e a varincia

(lacla lmpada custa ao fabricante R$ 10, mas se sua durao for inferior a 6 Iroras ele se compromete a indenizar o comprador com R$ 15. Qual deve ser o prco de cada lmpada para o fabricante obter um lucro mdio por lmpada de
l.$ 20?

16. A funo de probabilidade da varivel X k :7,2,"',5.Calcule E(X) e E(X') e, usando E[(X + 3)2] evar(3x - 2).

P(X:.

k)

: r/5

esses resultados, determi

17. Estatsticas obtidas junto s assistncias tcnicas indicam que a bomba gua de uma certa lavadora s pode apresentar defeitos aps 4 anos de Admita que nos prximos 6 meses, aps esse tempo, um mal funcioname tem probabilidade 0,10 de ocorrer e, caso ocorra, ter 0,5 de probabilidade ser recupervel. O reparo, que s pode ser feito uma vez, tem o preo de R$ I enquanto uma bomba nova custa R$ 30. Determine a mdia e a varincia
gasto com essa pea em 4,5 anos de uso.

11. tlrna concessionria tem disponvel, para um certo automvel, os modelos S, ('1, c GL com duas verses de combustvel, lcool ou gasolina. Com motor a rilcool os preos so 30, 35 e 40 mil reais para os modelos S, CL e GL, rrspcctivamente. Esses preos so 107o superiores se o combu3tvel for g,rrsolina. A procura por carros a lcool , de 307o e a gasolina 707o. Qualquer

tlnc seja o combustvel escolhido h igual preferncia entre os modelos. ('irlcule a funo de probabilidade do preo desse automvel e obtenha sua
Irrrlia e varincia.
so

,2, Nurn cassino, um jogador lana dois dados, cujas probabilidades

It. Os alunos do curso de estatstica tm um time de futebol que no melhores. O cartola que administra o time paga um prmio de vitria
partida de um sorvete porjogador, acrescentando mais um sorvete por saldo gols maior que I (saldo de gols a diferena entre gols feitos e sofri Admita que a funo de probabilidade dos diversos saldos a seguinte:
Saldo de gols Qu"rl a despesa mdia do cartola com cada jogador por partida? E corn os I
"c rilques" ?

lrroporcionais aos valores das faces. Se sair soma 7, ganha R$50, se sair soma I l, ganha R$ 100 e se sair soma 2, ganha R$ 200. Qualquer outro resultado ele rriio garrha nada. Qual o ganho mdio do jogador? l-1. I lrrra indstria pretende comprar 3 lotes de peas que so produzidas por dois lrlrrcccdores, A e B. Ela inicia, comprando de um dos fornecedores escolhido n(l ilciso e, se ficar satisfeita com o material entregue, compra o prximo lote rhr nrcsmo fornecedor. Se no ficar satisfeita, troca o fornecedor. Admita que lrirlir cacla lote o ndice de satisfao de 80Vo e de 707o para A e B, rrspcctivamente. Calcule a mdia e a varincia do nmero de lotes fornecidos por A.

122

Captulo 4: Medidas Resumo

4,4 lixerccios

t23

24. A experincia de diversas companhias de resgate de navios naufragados indica que a probabilidade de um resgate ser bem sucedido na primeira tentativa de 0,6; caindo para a metade a cada nova tentativa. Uma empresa de resgate tem

vcz. se o ganho acumulado da equipe (em milhares de reais) , 50c , sendo rrrimero de corridas completadas por esse motor antes de quebrar, calcule: corridas? Quanto receber em mdia essa equipe durante sua "vida" em corridas?

o
B

como norma no realizar mais de trs tentativas e cobra 50 mil reais para iniciar os trabalhos e mais 10.000 x (k - 1) reais, com k sendo o nmero de
tentativas. a. Qual o custo mdio dos servios dessa empresa?

1. Qual a probabilidade da equipe completar 8 corridas? E de participar de

[.

b. Se um navio resgatado

pode render ao proprietrio 65 mil


autopeas, siga o

interessante para ele contratar essa empresa? Justifique.

19. tlrn vendedor de cachorro quente trabalha na porta do Estdio do Morumbi errr clias de jogo. Ele pode deixar preparado 5, 6 ou 7 dzias de sanduches que (:lstam a ete R$ 5 adzia,. Sabe-se que a procura do cachorro quente (X), no s!u ponto, uma varivel aleatria com a seguinte funo de probabilidade:

25. Suponha que a demanda por certa pea, numa loja de


seguinte modelo:

P(X:

k,):+, tt:r,2,J,4.

a. Encontre o valor de a. b. Calcule a demanda esperada. c. Qual a variabilidade da demanda?

Sirbo-se que cada dzia de sanduche vendida a R$ 12 e os sanduches no Vcrrrlidos vo para um canil que paga R$ 2 pela dzia. Qual o nmero de eltiz,ias de sanduches que devem ser preparadas de modo a maximizar o lucro

nrrlio do vendedor?

26. Numa indstria farmacutica, uma mquina produz 100 cpsulas por minuto, A mquina est regulada de modo que no mximo 5Vo das cpsulas n contenham remdio e, assim, sejam consideradas defeituosas. a. Se as cpsulas so acondicionadas em vidros com 20 unidades, qual probabilidade de um vidro apresentar no mximo 2 cpsulas com defeito? b. Qual o nmero esperado de cpsulas com defeito, por vidro? c. Qual o nmero esperado de cpsulas com defeito por minuto de produo?

floricultura vende rosas, cravos e jasmins com lucrO de, respectivamente, R$ ltl, R$ 12 e R$ 15 por dezena. Observa-se que a procura igual para as trs flolcs. Se o estoque do dia no for vendido, a floricultura tem um prejuzo (lrrcro negativo) de, respectivamente, R$ 5, R$7 ou R$ 10 com cada'dezena de fosils, cravos ou jasmins. Se a floricultura dispe de duas dezenas de cada flor tr's clientes visitam a floricultura sucessivamente e compram uma dezena nrlir um. Fazendo alguma suposio adicional que seja conveniente, determine s lrrcro esperado da loja.
t.lrrra

27. Um fotgrafo negocia com o jornal o seguinte trato: ele submete al fotos semanalmente e por cada foto publicada, ganha R$ 50. Se a foto no publicada, no ganha nada. Nesta semana 4 fotos so submetidas com
uma tendo probabilidade 0,60 de ser publicada, independentemente da demais,

t{t pita o problema anterior, se a procura por rosas e cravos forem iguais e orrcsponderem ao dobro da procura porjasmins
a l'r,slroslr correta de 17 questes e responde as demais "chutando". gQVo das respostas. n. ('rrlcule a probabilidade dele acertar pelo menos It. l)ctcrrnine a mdia e a varincia do nmero de acertos. f. Srrpottlra que nesse mesmo exame, um outro estudante saiba a resposta col'rolit para l5 questes e tenha probabilidade de acerto nas demais de 0,7. (.)rrlrl clo.s estudantes voc espera que tenha melhor desempenho? tl, Nirs lncsmas condies do item (c), qual dos estudantes ter desempenho

jl, l,rrlir 1tn exame com 25 questes do tipo certo-errado, um estudante sabe

probabilidade que o fotgrafo tenha pelo menos duas f, publicadas esta semana? b. Calcule a distribuio de probabilidade de Y: montante que o fot

a. Qual a

recebe esta semana; c. Calcule o ganho mdio do fotgrafo nesta semana.

28. Admita que, em cada corrida de Frmula l, o motor tem 0,4 de probabi de quebrar, independentemente das corridits anteriores. Suponha que a encerrar sua participao no torneio quanclo o motor quebrar pcla pri

rrriris Irornogneo?

124

Captulo 4: Medidas Resumo

33. (Use o computador) Usando a Tabela 1.1 do Captulo 1: a. Obtenha as medidas de posio e de variabilidade para o Peso e a Altura. b. Compare, atravs de medidas de posio e de variabilidade, o peso e a altura dos alunos das turmas A e B. Comente as diferenas em relao ao item (a). c. Com respeito varivel TV, alunos e alunas tm o mesmo comportamento? Justifique sua resposta com o uso de medidas resumo.

Captulo 5

Variveis Bidimensionais
5.L Introduo

34. (Use o computador) Considere as observaes contidas no arquivo cancerlxt (ver Exerccio 24, Captulo 1). a. Obtenha as medidas de posio e de variabilidade para as variveis Idade e Glicose (GL). b. Repita o item (a) para cada tipo de diagnstico. Compare as respostas
obtidas. 35. (Use o computador) Com os dados do Exerccio 25, Captulo 1:

muito comum estarmos interessados no comportamento conjunto

de

a. Para cada bloco, determine medidas de posio e de variabilidade pra a rea total do apartamento e para a rea de cada cmodo. Voc diria que
existem diferenas nos apartamentos, dependendo do bloco? b. Construa uma tabela de freqncia para a rea total dos apartamentos do bloco I, utilizando faixas de valores convenientemente definidas. Suponha que um apartamento escolhido ao acaso. Defina por X a varivel aleatria rea total do apartamento selecionado. Baseando-se na tabela de freqncia construda, qual o valor esperado de X? Como este valor se compara com aquele observado no item (a) para a rea total? Porqu deveriam ser iguais e se no so, qual arazo?

36. (Use o computador) As variveis desse exerccio fazem parte do arquivo


aeusp.txt (ver Exerccio 26, Captulo 1).

viirias variveis. Neste captulo, vamos tratar de duas vriveis. Todavia, os conceitos discutidos aqui podem ser, em geral, expandidos para situaes em que lrs ou mais variveis so estudadas. Nesta primeira seo apresentamos, para variveis em um conjunto de dados, a tabela de freqncia conjunta e, para o caso tlc variveis aleatrias, a funo de probabilidade conjunta. A tabela de l'cqncia conjunta tambm pode ser utilizada com variveis qualitativas, conforme veremos nos exemplos. Nas sees subseqentes, estudamos a russociao entre variveis e a obteno de funes de variveis aleatrias. As informaes em um conjunto de dados, sejam elas referentes ao todo ou parte de uma populao, quase sempre contm observaes multidimensionais, isto , observaes relacionadas a vrias v4riveis. Por exemplo, num rprestionrio aplicado a alunos de uma universidade, podemos obter a idade, o llmanho da famlia e o nmero de disciplinas j cursadas, entre outras tluantidades que podem ser de interesse para cada aluno. Considerando duas variveis, digamos idade e tamanho da famlia, podemos listar todos os pares que ocorrem. Como pode haver repetio de valores, os resultados podem ser organizados em uma tabela, com os possveis pares associados s suas respectivas
'cqncias.

a. Obtenha as medidas de posio e de variabilidade para as variveis Itrab


Renda.

b. Repita o item (a) para cada uma das comunidades


diferenas entre elas?

estudadas. Existem

c. Utilizando os valores da varivel Serief, divida os moradores em trs


categorias: os que no pararam de estudar, aqueles que pararam at a 8 srie e os demais. Para cada uma das categorias, obtenha as medidas de posio e a varincia da varivel Itrab. d. Baseado nas variveis Sexo e Itrab, voc diria que os homens comeam a trabalhar mais cedo?

Ilxemplo 5.1.. Uma amostra de 20 alunos do primeiro ano de uma faculdade foi cscolhida. Perguntou-se aos alunos se trabalhevam, varivel que foi representada ;ror X, e o nmero de vestibulares prestados, varivel representada por Y' Os
tlados obtidos esto na tabela abaixo.

X
Y

nao
1

slm
1

nao
2

nao
1

nao

slm
2

slm
t)

nao
1

slm
1

stm
1

I
slm
2

X
Y

nao
2

nao
2

slm
1

no
J
D

nao
2

nao
2

nao
1

slm
.)

nao
2

t25

I2()

Captulo

: Variveis Bidimensionais

5.1 Introduo

127

varivel x qualitativa com dois valores: sim ou no. por outro lado, a varivel Y quantitativa discreta com valores inteiros I,2 ou 3. Podemos coletar as freqncias de ocorrncia dos possveis pares, construindo uma tabela de freqncia conjunta de X eY.

Ilxcmplo 5.2: Um estudo envolveu 345 pacientes HfV positivos, acompanhados,


dttrante um ano, pelo setor de doenas infecciosas de um grande hospital pblico. Os dados apresentados contm as ocorrncias relacionadas s variveis nmero de itttt:rnaes (I) e nmero de crises com infeces oportunistas (C).

(X,Y)
(sim,1 (sim,2) (sim,3)
(no,
1

freqncia
4
2 2 5 6
1

1\c
0
1

0
B4

rJ

4
0 2
12

27

8 35 43

2 T4

20
6

59
11

28

(no,2) (no,3) total

l)irra obter as marginais dessas variveis, acrescentamos mais uma linha e uma coluna na tabela anterior, contendo os respectivos totais de ocorrncia. Assim,

20

1\c
0
1

0
B4

q O

4 0
2 72 L4

total
115 130 100

O par (no,1) tem freqncia de ocorrncia igual a 5, pois, na amostra coletada, foi esse o nmero de alunos que no trabalhavam e prestaram o vestibular apenas uma vez. Os outros valores so obtidos de forma semelhante. Esta mesma tabela pode ser apresentada de modo mais conveniente atravs da tabela de dupla entrada, mosfada a seguir.

27

8 35 43
B6

20
6

59
11

t4
2B

total

110

91

44

345

x\v
slm
nao

2 2 6
B

.)

total
8
12

Cbnro j mencionamos, a ltima coluna da tabela acima fornece as freqncias eorrcspondentes aos valores da varivel -I, enquanto que a ltima linha fornece as
l'ct1i.incias para C. Logo,

4
5

2
1
a)

total

I
0
1

freqncia
115 130 100

C
0
1

freqncia
110 91
B6

20

Note que a ltima linha e a ltima coluna contm os totais de ocorrncias de cada varivel, separadamente. Dessa forma, fica facilitad a a tarefa de obter a tabela de 'eqtincia individual para cada "varivel que, pela posio em que seus valores aparecem na tabela de dupla entrada, chamada de tabela marginal de freqincia du vuridvel x (ou Y), ou simplesmente marginal de x (ou y). Temos ento para

2 3

total

345

44

I4
345

total

X eY

as seguintes tabelas de freqncia:

X
slm
nao

D Y
1

freqncia
8
L2

freqncia

I
8
r)

Ii:ccrnplo 5.3.' Numa amostra de 195 empregados de uma grande indstria,


rrlrscrvou-se o Salrio recebido (em salrios mnimos) e o Tempo de Servio na l')rrprcsa (em anos). Tendo em vista que a varivel Salrio quantitativa contnua,

2
t)

total

20

total

20

lrrirrn escolhidas algumas faixas para represent-la. Por outro lado, apesar da vrrt'irvel Tempo ser discreta, ela apresentou valores to diferentes que se achou rrlris conveniente organiz-latambm em faixas. Assim,

l2t

Captulo

: Variveis Bidimensionais

5.1 Introduo

Salrio \Tempo

<5
36
16 5
1

5F10
21
2B 6
2

10

<4 4t--B

t-4
2T

15

>15
2 12

total
63 77 35 20 195

Note que, pela notao utilizada na Definio 5.1, o termo

8-72
>12
total
Segue ento

74 72

10
5

5B as marginais so:

57

51

29

que

Salrio

freqncia
63 77 35 20 195

Tempo

4F8
8F12
>12
total

<4

freqncia
58 57
51

rcpresenta o conjunto de eventos que levam a varivel X a assumir o valor r. No prximo exemplo, ilustramos esse ponto. Ilxemplo 5.4: Uma empresa atende encomendas de supermercados dividindo os pcclidos em duas partes de modo a serem atendidos, de forma independente, pelas suas duas fbricas. Devido grande demanda, pode haver atraso no cronograma rlc entrega, sendo que aftbrica I atrasa com probabilidade 0,1 e a II com 0,2. Scjam A1 e All os eventos correspondentes a ocorrncia de atraso nas fbricas I e ll, respectivamente. Vamos admitir que as encomendas sempre sero entregues,

(X: r)

<5
5

tcsmo que com atraso.


encomenda, ficar sendo:

espao amostral, associado ao atendimento da

t--

10

10F15
>15
total

{A1A1r, AArr, ArAr,

AAr}.

29 195

tr
Pelos exemplos anteriores, podemos perceber que variveis de qualquer natreza podem ter seu comportamento conjunto representado atravs do tablas de freqncia. Dessa forma, variveis qualitativas u quantitativas, discretas ou contnuas, tm seu comportamento estudado com tabels de dupla entrada, para dados oriundos de toda a populao ou de uma amostra. veremos a seguir como tratar essa questo no caso de variveis aleatrias discretas, definidas a partir das suas funes de probabilidade. Iniciamos estendendo a definio de funo de probabilidade para o caso de duas variveis.

Defino 5.1: Funo de probablidade conjunta


Sejam X e Y duas variveis aleatrias discretas originrias do mesmo fenmeno aleatrio, com valores atribudos apartir do mesmospao amostral.

Pirra aliviar a notao, os eventos sero representados sem os respectivos xubscritos mantendo, entretanto, a ordem das fbricas. Dessa forma, o evento /" significa que a ftbrica I entregou sem atraso e afbrica II com atraso. Suponha que para um certo pedido, a indstria recebe 200 unidades tnonetrias (u.m.) pela encomenda total entregue, mas paga uma multa de 20 u.m. pirra cada fbrica que atrasar sua parte. Considere que o supermercado, que fez a cncomenda, criou um ndice relacionado pontualidade da entrega. Este ihdice, trllibui 10 pontos pata cada parte da encomenda entregue dentro do cronograma prcvisto. Vamos denotar por X o valor recebido pelo pedido eY o ndice obtido. Para cada evento do espao amostral, podemos obter os valores das virrirveis. Assim, se ocorre o evento AA', avarivel X tem valor 180, pois de ?(X) subtraimos a multa de 20, decorrente de um atraso. Por outro lado, a varivel )' assinala 10 pontos provenientes de uma entrega dentro do cronograma. A

uno de probabilidade conjunta definida, para todos os possiveis pares de valores de (X, Y), da seguinte forma:

lirbcla

seguir, apresenta os eventos, as respectivas probabilidades

os

crrrrcspondentes valores de

X eY.
Probabilidade
0,1 X 012

Eventos

X
160 180 180

Y
0
10 10

p(r,a)
isto ,

: P[(X: u) n (Y : ]:

t:otti unta das variveis.

comum nos referirmos, sempre que no houver ambiguidades e o contexto permitir, ftno de probabilidade conjunta como distribuio conjunta ou simplesmente

p(r,A)

representa a probabilidade

p(X : r,y : a), de (X,y) ser igual a (r,A).

AA AA' A'A
A.

0,1-x 0,&
0,9 X 012

A.

0,9

0,8

200

20

tr

Ap(rs coletarmos os pares idnticos, obtemos a conjunta das variveis:

130

Captulo 5 : Variveis Bidimensionais

5.1 Introduo

r3I

(X,Y)
(160, 0)

p(r,y)
0,02 0,26 0,72

Note que pares idnticos foram agrupados

e
2

somamos

as

respectivas

(180, 10)

probabilidades. Uma forma equivalente de apresentar a distribuio conjunta, porm com maior apelo visual, atravs da tabela de dupla entrada.

(200,20) Dessa forma,


combinaes dos valores

x\),
0
1

a distribuio conjunta de (X, Y)

contm todas as possveis (r, g), com suas correspondentes probabilidades. tr

r/rc 2lLj L/n r/rc

2110
0

Da funo de probabilidade conjunta p(r,E) possvel obter as funes X ou de Y, atravs da soma de uma db coordenadas. Assim,

L/n rlL0 rl10

de probabilidade marginal de

P(X

")

: t p(r,a) e P(Y : u:D

a)

:\n@,
X
ou

As distribuies marginais tambm podem aparecer na tabela, bastando efetuar a soma nas linhas para obter a marginal de X e, nas colunas, paa a marginal de Y. Por exemplo, para calcular a probabilidade de X ser igual a zero, temos

P(X :0) : P(X :0,Y:


o

com a somatria percorrendo todos os valores possveis de


caso.

Y, conforme

r225 :10-10-10:10

0)

* P(X :0,Y :1) + P(X :0,Y :2)


X
e 2

Iepetindo os clculos para outros valores de

Y, obtemos a tabela

a seguir:

Exemplo 5.5.' Uma regio foi subdividida em 10 sub-regies. Em cada uma delas, foram observadas duas variveis: ntmero de poos artesianos (X) e nmero de riachos ou rios presentes na sub-regio (y). Os resultados so apresentados na
tabela a seguir: Sub-regio
1

x\v
0
1

rlt0
7/70

2170

2lr0
0

P(X : r) 5lr0
2/r0
3l70
1

rl70

2 0 2

J 0
1

4 0 0

6 2 0

9
2

10

X
Y

0 I

I I

I
0

2
1

0 2

P(Y

r/L0
u)

r/n
4lro

r/t0
3lr0

3/L0

Portanto, as funes de probabilidade marginais so as seguintes:

Considerando que escolhemos uma das sub-regies ao acaso, isto , cada subregio tm mesma probabilidade 1/10 de ser escolhida, podemos construir a distribuio conjunta de (X,Y):

xl o 1 2 e Yl o 1 p I slro 4lro n I slto 2lro sllo


'Lrno das variveis

slro
tr

(X,Y)
(0,0) (0,1) (0,2) (1,0) (1,1) (2,0) (2,1 (2,2)
total

probab.

L/70 2/70

2lr0
r/10

r/rc
rlL0

Em muitas situaes h interesse em estudar o comportamento de uma tal como soma, produto ou alguma outra relao entre elas. Vamos nos restringir ao caso de variveis aleatrias, mas o tratamento similar para conjunto de dados referentes populao ou amostra. Se conhecemos a clistribuio conjunta de X e Y, o comportamento de outras variveis, tais como X +Y, X2 + 5Y ou X Y, pode ser determinado como ilustramos a seguir.
Ilxemplo 5.6: Emuma cidade do Estado de So Paulo, admite-se que o nmero de unos para completar o ensino fundamental (varivel F) e o nmero de anos para cornpletar o ensino mdio (varivel M) t,m funo de probabilidade conjunta:

rlrc
r/t0
1

t32

Captulo

: Variveis Bidimensionais

5.1 Introduo

(F, M) (8,3 (8,4 (8,5 (9,3) (9,4 (9,5 (10,4


(10, 5)

p(.f ,m)

3/L0

lxerccios da Seo 5.1:

r/rc
r/70 2/r0 r/20 r/10 r/70 r/20

l. O setor de emergncia de um Pronto Socorro Infantil anotou o numero de crianas atendidas (C), de mdicos (M) de auxiliares () de planto em 15
clias de atividades. Os dados so apresentados na tabela abaixo.

"

Dia C

t J

5 5 2
7

6
5
1 I

8
1

I
1

10
6 2

11
I

12 5 2
I

13 5

L4 6 2

15

5
1

7
1

5 2

6
2

7
2 6

5- 6
5 5

6
2

M
A

2
7

2
6

Suponha que exista interesse em estudar as variveis

Acrescentando, tabela anterior, colunas correspondendo aos valores dessa novas variveis temos

F+M e FxM.

(F,M) pU,m) F+M


(8,3 (8,4) (8,5) (9,3) 9,4) 9,5) (10,4) (10,5 3/10 L/70 7/L0 2/L0 L/20
11

FxM
24 32 40

a. Determine as tabelas de freqncia marginais de C, M e A. b. Obtenha a tabela de freqncia conjunta entre (C, M), (C, A) e (M, A). c. Represente a tabela de freqncia conjunta de M e A, atravs de uma tabela de dupla entrada.

d. Calcule amdiadas variveis

M e A.

L2 13

2.Paru famlias de um certo bairro de So Paulo, apresentamos abaixo a tabela de f'reqncia conjunta das variveis: nmero de automveis (A) e de Ws (T).

L2,
13 74 L4 15

27
36 45

\"
0
1

0 110 51
15

total
465
351

7/r0
L/70

235

t20
178

r22
84

40
50

r/20

total

176

44r

L62 460

267
L077

Para obter a funo de probabilidade de tr. valores comuns. Por exemplo,

* M, somamos as probabilidades nos


A\ -

a. Calcule as marginais de A e T. b. Determine as mdias dessas variveis.

?t'

P(F + M

13)

P(F

8,M

5)

* P(F : 9,M

.. 1 '1020
_

n'

Procedendo de modo similar com os outros valores, obtemos as funes de probabilidade de.F * M e de F x M:

3. Uma moeda equilibrada lanada 2 vezes de forma independente. Ao final dos lanamentos, duas variveis aleatrias so anotadas: o nmero total de caras (C) c o nmero de coroas no 2o. lanamento (K). a. Construa uma tabela com os possveis eventos, as respectivas probabilidades
e os valores de

L2 13 1.4 15 prob. | 3/10 3lL0 3120 2lI0 Il20 ' FxMl Z+ 27 32 36 40 45 prob. l B/10 2lL0

r+twl tt

C e K.

b. Apresente a tabela de dupla entrada com a funo de probabilidade conjunta das variveis aleatrias C e K. c. Determine o valor esperado de C.
50
'

tr

4. Num estudo sobre o tratamento de crises asmticas, estabeleceu-se a seguinte uno conjunta de probabilidades entre o nmero de crises de asma () e o tti,mero de interniles hospitalares (H).

134

Captulo 5 : Variv eis Bidimensionais

5,2 Associao entre Variaveis

135

\H
0
1

r/8
3/16 r/L6

I/16
L/8 3lL6

foi construda (l), portugus (P) e matemtica (M):


ingls. Para esses alunos,

a prxima tabela com as notas de ingls

r/16
3/L6

Aluno

1
(

2 7 6 6

3 7
B

4
F7

5 8

6 8

7
I

8 8
I

I
8
7

10
8

11

T2

13

L4

15

I
Ar/H.
P

a. Determine as funes de probabilidade marginal das var,{eis b. Calcule o valor esperado dessas variveis. c. Obtenha a funo de probabilidade da varivel A + H. '-/

8
5

9
5

8
t)

6
5

I
6

8
7 5

9 B^
5

6 6

I
6

I
8 5

10 8
5

M
apresentada

5. A funo conjunta de probabilidade entre as variveis abaixo (com algumas entradas faltando):

X eY

A tabela de freqncia conjunta de (.I, P) dada por:

1\
7 8

6
1

8
2
1

I
1 1 1

0
J

x\v
-2 -1
1

,14't
L/16

-1

4
%6

P(X

: r)
tto

7/at
5

P(Y

/64

3/64 7/16 77/64 0 /'r . 5/16

Ll32
0
1/6tt

5lL6

I
10

0 0

0 0

2
1

0
as

\lt ("
L/64 7t32

Ji
/n(^
1

5/76

tlrn grfico contendo as informaes dessa tabela apresentado, a seguir, com

3t64
311

y1

,^

r/4

l'oqncias ao lado de cada ponto. Note que h uma tendncia das notas altas em irrgls, serem acompanhadas por notas altas em portugus.
P

a. Complete a tabela. b. Obtenha as marginais de X e Y. c. Calcule afuno de probabilidade da varivel

10

X x Y.

5.2 Associao entre Variveis


Uma pergunta freqente de pesquisadores e usurios de Estatstica sobre a associao entre uma ou mais variveis. Bucar explicar como se comporta uma varivel em funo do desempenho de outras tm sido o objetivo de vrios estudos que utilizam a Estatstica como ferramenta auxiliar. Nesta
seo, comeamos a responder a essa questo. Uma resposta mais completa ser dada na parte referente Inferncia Estatstica. Com dados de duas variveis, em uma populao ou amostra, podemos
,l

construir um grfico no plano cartesiano com a freqncia de ocorrncia dos diversos pares de valores. Esse diagrama pode auxiliar a identificao de tendncias de associao entre as variveis, conforme veremos no prximo
exemplo.

Considere agora as variveis scguinte:

I e M. A tabela de freqncia conjunta

Exemplo 5.7: Dentre os alunos do 1o. ano do ensino mdio de uma certa escola, selecionou-se os quinze alunos com melhor desempenho (nota acima de 7) em

IJ

Captulo

Variveis Bidimensionais

5,2 Associado entre Variaveis

I\M
I

4 0
1

5
2
t J

6
1

7
1

Deftnio 5.2: Probabilidade condicional para variveis aleatrias discretas

I
10

2
1

I
0 0

0 0

2
1

Dadas duas variveis aleatrias discretas definidas no mesmo espao urnostral, a probabilidade condicional de X : :L,dado que Y : a ocorreu, dada
pcla expresso:

P(X:rlY:g):
Caso P(Y

P(X:r,Y:y)
P(Y

a)

, se

P(Y:

g) >

0.

A)

:0,

rtrbitrariamente e adotaremos

probabilidade condicional pode ser P(X : r lY : A) : P(X : r).

definida

Definio 5.3: Independncia de varidveis aleatras


Duas variveis aleatrias discretas so independentes, se a ocorrncia de rlualquer valor de uma delas no altera a probabilidade de ocorrncia de valores
tla outra. Em termos matemticos,

P(X:rlY:y):
prra todos os possveis valores

P(X
das variveis

(r,g)

(X,Y).

Como definio O

irlternativa e equivalente podemos usar que:

P(X : n,Y : A) : P(X : n) P(Y : A), para quaisquer (*,A).


8 I
10

Observe que o bom desempenho em ingls parece, neste caso, no implicar num bom desempenho em matemtica.

Apesar de ser um instrumento til para identificar tendncias, os difcit interprerao, ;;;;;.;", exempro, se o conjunto de dados tem muitas observes "rigun. pou.os valores diferentes, freqncias sero altas atrapahndo "o a visualizao de uma eventual 'lgumas tcndncia' Dessa forma, importanie ampliar o estudo da associao entre variveis, para buscar.uma caracterizao que no dependa s da interpretao visual' com este objetivo, definimos piobabilidad" e independncia para variveis aleatrias, estendendo os conceitos "ondi"ional apresentados no captul o 2 para cventos aleatrios. Aqui, o condicionamento, na ocorrncia de um valor da varivel
rliagramas rornam-se de

A verificao da equivalncia entre as duas expresses, acima, pode ser lbita de modo anlogo ao realizado no Captulo 2. Deixamos ao leitor essa tarefa. Note, ainda, que a definio de independncia exige que a igualdade seja vcrdadeira para todas as escolhas dos pares (r,A). Assim, basta encontrarmos um l)rr em que a igualdade no se verifique para concluirmos que as variveis irleatrias no so independentes. A Figura 5.1 resume esses comentrios.

aleatria, equivalente ao condicionamento na ocorrncia de um evento.

Figura

5.

: Indep endncin de variv eis aleatrias

Ilxemplo 5.8r O Centro Acadmico de uma faculdade de administrao fez um


lovantamento da remunerairo dos estrgios dos alunos, em salrios mnimos, com

/.ft

Captulo

: Variveis Bidimensionais

5.2 Associao entre Varives

139

apresentadas na prxima tabela, incluindo as distribuies marginais.

relao ao ano que esto cursando. As probabilidades de cada caso


Salrio
2
.)

so

u\r'r
Sim
No

2 ou mals

total
53,SVo

\ Ano

,)

P(Ano:

y)

2/25 2/25 7/25 5 /25

2/25 5/25 2/25 s/25

r/25
2/25 2/25 5/25

2/25 4/25
6125

P(Sal. : z) 5/25 Lr/25 I /25


1

2r,lvo
7B,9Vo

53,8%io

46,2Vq l0OVo

87,l%o L3,}Vo
L00Vo

46,7Vo
L00Vo

total

I00Vo

Pclas informaes apresentadas, as variveis salrio e Ano de curso no inclcpendentes pois, por exemplo,

sil

P[(Sal.

3)

n (Ano

: 4]:2lzs I p(Sat.:

B)p(Ano

4)

: rr/r2s.

Unra maneira bem pr'tica de verificar independncia consiste em usar a tabela de clupla entrada, checando se o produto da ltima linha e ltima coluna (as rnargirrais) reproduz o corpo da tabela. se a tabela contiver um zero no seu corpo, brsta verificar se uma das marginais correspondentes zero. caso nenhuma marginal seja zero, conclumos imediatamente a no independncia, uma vez que o produto de dois nmeros no nulos nunca zero. tr

(lgnsiderando os valores de [/ no conjunto total de dados, temos 53,3Vo de rcspostas positivas e 46,7V0 de negativas. Caso no haja associao dessa varivel eoln o nmero de parceiros, devemos esperar porcentagens similares em cada virlor da varivel ,f, indicando que esses valores no interferem com as respostas tlo [/. Assim, por exemplo, para ly' : 0 seria esperado ter, aproximadamente, lil,3%o de respostas positivas, que a mesma ocorrncia verificada no total da linha. Como se pode observar da tabela acima, as porcentagens so prximas lpenas no caso l/: 1, sendo bem diferentes nos outros casos. Dessa forma, os
rludos sugerem que as variveis no so

independentes'

A verificao da independncia, no caso de duas variveis em um conjunto de dados, ser discutida com maior profundidade no captulo g que trata cle Testes de Hipteses. Entretanto, podemos utilizar as idias de indepedncia cle variveis aleatrias para estudar a relao de duas variveis observadas numa populao ou amostra. Uma das formas utilizadas construir a tabela de dupla cntrada com porcentagens em relao ao total de colunas ou linhas.
Ilxcntplo 5.9.' Em uma clnica mdica foram coletados dados em 150 pacientes, relbrcntes ao ltimo ano. observou-se a ocorrncia de infeces urindris (J) eo ttttncru tle parceiros sexuais (,n/). Deseja-se verificar se essas variveis esto russociadas. os dados so apresentados a seguir, com as respectivas marginais.

Continuando o estudo da associao entre variveis num conjunto de tllctos, construmos, no prximo exemplo, uma tabela de dupla entrada contendo rrs freqncias que seriam esperadas, caso houvesse independncia entre as vlriveis. Precisamos decidir se as duas tabelas, a de freqncias observadas e a tlc esperadas, esto suficientemente prximas uma da outra. Ilxemplo 5.-f 0.. Apresentamos os dados relativos a uma amostra de 80 famlias, de lun certo bairro, com as informaes sobre o nmero de pessoas que trabalham nufamlia (") e o nmero de adolescentes entre 12 e 1B anos (A).

r\
0

0 5
2

2 2 6
B

rJ

4
1

total
15

4
B

3 4
5

I
2

I
2

2t
27

4
,

8
2

.1

4
15

2
1B

5 T7

I7
80

u\r/
Sim
No

total

22

B,

2 ou mais

total
BO

t2
45 57

2L
1B

47
7 54

total

39

70 150

A rnarginal deT e as freqncias de seus valores, restritas ao grupo - 0, sero irpresentadas em seguida. Note que as freqncias de ocorrncia, restritas a cada grr.rpo de valor de A, nada mais so do que as colunas da tabela de dupla entrada rlo incio do exemplo.

Cottstruindo uma nova tabela com as porcentagens em relao ao total de coluna, otrtcmos a proporo relativa da varivel (J em relao i cada subconjunto de
valores de

N.

t40

Captulo 5 : Variv eis Bidimensionais

5,2 Associao entre Variveis

141

T
0
1

freq.
15

/A:0
0
1

freq. observ.
5
2

eube agora quantificar se essa tabela est ou no "muito" distante da tabela


ohscrvada. Uma medida usualmente calculada a seguinte:

2 3

2L 27
L7

2
J

4 4
15

Q':D4,
i,i
"11

total

80

total

7 mantivessem a mesma proporcionalidade encontrada na ilmostra como um todo. Em outras palavras, as duas tabelas acima precisariam ser parecidas quanto freqncia relativa. Acrescentamos, na tabela restrita ao grupo A.:0, uma nova coluna com a freqncia esperada caso a independncia se verifique. Essa coluna foi calculada multiplicando a freqncia relativa do valor cle ? (em toda a amostra) pela freqncia do grupo. Por exemplo, a freqncia esperada do valor T:7, no grupo dos :0, seria 21180 x 15:3,94. Note que esta freqncia no precisa ser um nmero inteiro.
de cada valor de

Se houvesse independncia entre T e A, o comportamento da varivel ? em cada grupo deveria ser o mesmo e, portanto, esperaramos que as freqnci

repfesentando, respectivamente, as freqncias observadas e csl)cradas na linha 'i e coluna j. A medida Q2 usa a diferena entre oi.j e ei.j elcvada ao quadrado para evitar o cancelamento de termos positivos por flL:gativos. A diviso pot ei.i objetiva padronizar a medida, relativizando o tnrrranho da diferena encontrada. Como estamos tratando de observaes de vrrrirveis, podem ocorrer flutuaes devido natureza aleata da amostragem e rrrrcluiremos pela independncia entre essas variveis, se houver razoxel

Eonl o,;.i

e eii

T\:0
0
1

freq. observ.
5 2

freq. esperada
2,87

proximidade nas tabelas. No difcil perceber que isto significa valores pe(luenos da medida Q2 e,no Captulo 8, desenvolveremos um critrio estatstico, piri tomar a deciso de aceitar a independncia de duas variveis. Para este excrnplo, vamos nos contentar em apresentar o clculo da medida Q2 que, pelo tlr:rr valor, consideraremos uma indicao de no independncia:

4 4
15

3,94 5,06 3,19


15

Q,:

(5-2,81)2

2,81

:12.63. +...+ (4-r,70)2 L,70


D

total

De modo anlogo ao feito para o grupo 7 \.4


0 0
1

: 0, calculamos as freqncias

No caso de dependncia linear e de variveis quantitativas, existe uma prrtla medida que freqentemente utilizada e ser definida, a seguir, para um
corr.junto de dados brutos.

esperadas para todas as colunas da tabela de dupla entrada (valores aproximados):


2

I)t1[ino 5.4: Correlao entre variveis num conjunto de dados brutos

4 1,50

total
15

2,Bl
3,94 5,06 3,19
15

I
2
t t)

4,13 5,77 7,42 4,67


22

3,37 4,73 6,08 3,83


1B

3,19 4,46 5,74


3,61 77

2,r0
2,70

27 27 17 80

por (ru,g),':I,2,...,fr.O coeficiente de correlao entre as variveis e calculado da seguinte forma: linear rrrcrlc a dependncia

Considere um conjunto de dados com n pares de valores para as variveis

.\ c Y, representados

I,70
B

'n

total

Px,Y

D@o i,:l

- r,,r,,)(ar. -

a,*,)

142

Captulo 5: Variveis

5.2 Associao entre Variveis

143

ou, em uma forma mais conveniente para clculo,


n,

Scgue que r o6, : l-35, 63 currelao vem que:

oo,

38, 75. Utilizando a expresso de clculo da

PX,Y:

i:l

LrtAt.-TLIohsAobs

PX,Y:

43245-8x135,63x38,75

lrrtanto, a correlao entre ndice pluviomtrico e produo positiva e bastante titzovel. Desta forma, locais com maior intensidade de chuva tenderiam a ter

As expresses anteriores podem ser adaptadas para o caso em que dados esto agrupados em uma tabela de freqncia. As expresses no apresentadas aqui, mas acreditamos que podem ser obtidas sem dificuldade.
possvel verificar que o coeficiente de correlao sempre um n entre -1 e 1. Um ponto a ser ressaltado, que muitas vezes causa confuso, correlao igual a zero no indica independncia. Se a correlao zero, o podemos dizer que no existe dependncia linear entre as variveis. interpretao para os termos presentes no seu clculo ser dada mais adian quando definiremos coeficiente de correlao para variveis aleatrias. Exemplo 5.11: A quantidade de chuva um fator importante na produtivi agrcola. Para medir esse efeito foram anotados, para 8 diferentes regi produtoras de soja, o ndice pluviomtrico em milmetros (X) e a produo

tttlior

produtividade.

tr

Vamos voltar nossa ateno agora paravariveis aleatrias discretas. Para elc'inir medidas de dependncia entre elas, precisamos estudar, inicialmente, as propriedades do valor esperado. Sejam X e Y duas variveis aleatrias discretas com distribuio conjunta p(r,y). As marginais de X e )z sero representadas, repectivamente, por

p(t:) e p(y).
Vamos determinar o valor esperado da varivel

X +Y:

E(x-+Y):

tIt" r.u
TU:E'!J

+p@,a)

,t'tt(.

:I

D,p@, +L,\un@,u)

Tfutull>

'

r"ned'u,tt7-D

>

-,1,

rt'''UtA

"o-'o

auxlio o"

rr-uofrn[ilf"
88

lca o uma
10Bb

| ,,\J-

o,

: I"
:

rUUT

(t

p@,a))+t,

(f

p(*,)

D"o: i--L
88
8

,D"?:
i:l

:trp@)+tap@)
151533;

X;U

E(x) + E(Y).

Dru:310, t:12640; i:L i:t D*oro: i:l


43245.

Notc que obtemos essa importante propriedade do valor esperado, sem necessitar

tlc rtcnhuma hiptese adicional sobre as variveis. Dessa forma, esse resultado
lcrn ampla aplicao e tambm vlido para mais de duas variveis. Considere agora o produto XY. O valor esperado do produto ser o pt'oduto dos valores esperados, sempre que as variveis forem independentes. Para X eY variveis aleatrias discretas independentes, temos:

t44

Captulo 5 : Variveis

idimensionais

5.2 Associao entre Variveis

145

E(xY): tL"yp@,a) r
'!l

xl o
-$

: I D,*aP@)P@) r lt

p | 5/10 2/70 slto

: (T 'p@)) (Duna)
:
E(x) E(Y)

'.*

t \ ,nf
/t
represenr

pi |
Segue ento que

vl o t
:
L'

3lt0 4lr0

3lt0

E(X)

S/10 e E(Y)

Exemplo 5.12.' No Exemplo 5.5,


com suas probabilidades.

respectivamente, a quantidade de poos artesianos e de riachos em sub-regies uma certa rea. A prxima tabela contm os valores das variveis X f Y e X

o par de variveis f*,h

Podemos agora verificar que

E(X

+Y)

: ISlto: E(X) + E(Y):

B/10

1,

'

isto , o valor esperado da soma igual soma dos valores esperados. Entretanto, para o produto temos

(X,Y)
(0,0) (0,1) (0,2) (1,0 (1,1) (2,0)
(2,
1

X+Y XY
0
0

p(r,a)
L

I
2
1

/10

0 0 0

2/r0 2/r0

E(xY):7lLo+E(x)E(Y): * t,
ou seja, o valor esperado do produto de duas variveis no igual ao produto de seus valores esperados. Note que, conforme j havamos mencionado, as variveis
aleatrias

L/n
1170

2 2
t r)

I
0
2

X eY

no so independentes.

tr

L/10

Na Figura 5.2, apresentamos a expresso do valor esperado da sorra de


variveis aleatrias.

(2,2)

L/rc r/70

Utilizando a tabela acima, a funo de probabilidade de X obtidas sem dificuldade:

+Y

e a de

XY

x+rl

Fgura 5.2: Valor esperado da soma de vuriveis aleatrias.


Para os valores esperados temos:

importante salientar a relao unidirecional de implicao entre a


e E(XY)

E(X+Y):18/ro
reapresentadas em seguida:

:7lto.

As distribuies marginais de X e Y j foram calculadas no Exemplo 5.5 e so

independncia e a fatorao da esperana do produto. O resultado vfido afirma que a independncia de X e Y implica no valor esperado do produto XY set igual ao produto do valor esperado de X pelo valor esperado de Y. Todavia, se o valor esperado do produto de duas variveis o produto dos valores esperados,

t4(,

Captulo 5: Variveis Bidimensionais

5.2 Associao entre Variveis

t47

niio necessariamente verdade que

so independentes.

Figura

resume esse comentrio, que ilustrado no prximo exemplo.

c, desde que temos um par em que a probabilidade da conjunta no igual ao ;rroduto das probabilidades marginais, concluimos que as variveis aleatrias W e

no so

independentes.

tr

Se as variveis so dependentes, a relao entre elas pode ser de vrios tiflcs e, no caso de ser linear, vamos definir uma medida dessa dependncia.

Definio 5,5: Covarncia de duas varidveis aleatrias


Uma medida de dependncia linear entre

X eY
LLx)

, dada

pela covarincia:

Cov(X,Y)
Itigura 5.3: Valor esperado
do

ox,Y

E[(X

(Y

- P")]'
tr

produto e independnca de variveis aleatrias.

varivel em relao sua mdia.

Iirn palavras, a covarincia o valor esperado do produto dos desvios de cada

Ixemplo 5.13.' Considere as variveis


conjunta:

WeZ
4

com a seguinte distribuio

W\Z
-1
0
1

t
L)

P(W

No prximo exemplo ilustramos o clculo da covarincia e, para auxiliar ir interpretao de sua expresso, faremos uma representao grfica dos valores
clas variveis.

w)

2/72
0

r/L2
2/12 3/12

P(Z :

I/L2
z)

3/L2

3/12 L/T2 2/12 6/12

5l12 2/12

Ilxemplo 5.14: As variveis U eV tm a seguinte distribuio conjunta:

5/r2
1

(u,v)
P(u,u)

(2,2)
0,1

(3,4)
012

(3, B) 0,1

(4,6)
012

(5,4)
0,1

(5,8)
012

(6, 10)
0,1

A varivel W Z tem funo de probabilidade dada por:

wzl-4
prob. |
Temos ento,

3lL2 2/L2 2/L2 7/72 2

-2

l{epresentamos a seguir essa distribuio atravs de uma tabela de dupla entrada, i ncluindo as marginais.

u\v
2
t)

4 0
012

10

P(U

u)

E(W Z)

(-4) x 3lL2+ .'. + 4 x 2lLz


W e Z, podemoscalcular

0,1
0 0 0 0

0 0
012

0 0,1 0
012

0 0 0 0

0,1 0,3
012

-0.
Por outro lado, utilizando as distribuies marginais de
seus valores esperados. Assim,

4
5 6

0 0,1 0

0 0
012

0,3
0,1

E(W) : (-1) x 5lI2 + 0 x 2lI2 * L x 5fL2 : 0 ; E(Z) : 2 x 3lI2 + 3 x 3112 + 4 x 6lL2 : 391L2
Vale portanto a relao E(WZ):E(W)E(Z).Nesse caso, seriam independentes? A resposta no, uma vez que, por exemplo,

P(V

0,1
0,1

u)

0,1

0,3

0,3

WeZ

Utilizando as probabilidades marginais, obtemos imediatamente que E(t/) : 4 e Ii(V) :6. Nosso interesse verificar a existncia de uma relao linear entre U e |/. No diagrama a seguir, apresentamos a funo de probabilidade conjunta das
cluas variveis.

P(W

: -I,Z -

2)

: 2lI2 + P(W : -L)P(Z -

2)

L5/L44,

148

Captulo 5: Variveis

5,2 A,r,vtciao entre Variveis

r49

Sonr'ndo esses produtos, ponderados ielas respectivas probabilidades, temos:

os pontos localizados no 1" e 3" quadrantes tm suas coordenadas com o ffinnro sinal, Iogo o produto delas positivo. No 2" e 4o, o produto e n"guii;o.

tf

- n(u))x

(u

- E(v)) x p(u,u),

essc nmero inai"u' t"naon"iu de alinhamento no sentido dos quadrantes mp'res ou pares, de acordo com o sinal positivo ou negativo, respectivamente. A r;trcsso acima nada mais do que a frmula da covarincia entre x e y, prcsentada aqui em uma forma mais detarhada do que na Definio 5.5. calculos, obtemos Cov(U ru.rirnoo os clculos, Etbtuando : 2, inOi"nao Cov(U,V) indicando u rV) :2, a tendncia das
Uru tambm cresce.

varirveis moverem-se na mesma direo, isto , quando uma varivel cresce n a

tr

lternativa:

A covarincia pode ser calculada mais facilmente pela seguinte expresso

Fazemos agora uma translao de eixos para colocar a origem respectivas mdias, isto , no ponto (4,6).Dessa forma, os pontos anteri transformam-se em (u - 4,a - 6), com cada coordenada representando o desvi
em relao sua mdia.

ut1il vez que

: o*,, : E(Xl) - E(X) E(y). bserve que' no caso em que xe y serem independentes, temos cov(x,y) :
Cov(X,Y)

ffJl*'.for' lllcilr.

o valor esperado do produto se torna igual ao produto do, uIo.", A partir da covarincia, definimos uma nova medid" d" d;;"d;;;

0,

Derfinio 5.6: Correlao entre vatrveis aleatras


r:irlculado pela seguinte expresso:

O coeficiente de correlao entre as variveis aleatrias discretas

X ey

4'.,- :

Cov(X,Y)
OX OY

E
Pela definio acima, o coeficiente de correla o o quociente entre a crviuincia e o produto dos desvios-padro de x e )2. A diviso pelo produto dos rlcsvios-padro tem a funo de padronizar a medida e torn-la possvel de ser ,tilizada para comparaes com outras variveis. No difcil u"rifi.u, gue px,v rrrrr nmero adimensional e limitado por 1, isto , < lpx,vl 1. A interpretao de suir cxpresso segue os mesmos passos da covarincia, sendo que valores de 1t,y,y prximos de 1 indicam correlao forte.

t50

Captulo 5: Variveis

5,2 Associao entre Variaveis

151

Vamos, agora, deduzir a expresso da varincia da soma de duas vari aleatrias. Desenvolvendo a partir da definio de varincia temos:

Var(X

+Y): E16 +Y) - (trt + t"y)l' : El(x - px) + (Y - pt)l'


16 - px)z + (v - pv)2 + 2(x - px)(Y - p")l E(x - px)2 + E(Y - ttv)2 +2El(X - px)(Y - p")].
E Figura 5.4: Correlao para conjuntos de dados (brutos).

Ento,

Var(X +

y) :

Var(X) + Var(Y)

Cov(X,Y)

que, se rcdtzir soma das varincias, no caso de independncia entre

X eY.

Exemplo 5.15.' Nos Exemplos 5 .5 e 5 .I2, o par de variveis (X ,Y) representa respectivamente, o nmero de poos e de riachos em sub-regies de uma
6trea.

Figura 5.5: Covarincia


J calculamos .E(X

e correlao de varidveis aleatrias.

Y)

ltO, E(X) :8/10

E(Y)

1, portanto,

cov(x,Y)

E(xY)

: - E(x) E(Y) :+ t0- * 10t t


2x :76/100 ozr:

-*. 10
: :60/1
Figura 5.6: Varincia da soma de duas variveis aleatrins.

Usando as distribuies marginais, podemos obter Para avarincia de X i Y temos

e o2u

Var(X

+n: ''100 2 # "

+2(-#) :
-Llt0

116 100

O coeficiente de correlao ser

Cov(X,Y) ox oY

ffi@

-0,15.

Vamos encerrar essa seo, aplicando as propriedades do valor esperado e rlu varincia na obteno dessas quantidades para o modelo Binomial.
eorrr distribuio

Nas figuras a seguir, resumimos algumas frmulas dessa seo.

Il"rctnplo 5.1.' Considere uma sequncia de variveis aleatrias independentes Bernoulli de parmetro p. Como se comporta a soma de n dessas virliiiveis?

Representemos por Xr, Xz, .. ., X,,, a sequncia de variveis de Bernoulli. lisirrnos interessados em X : Xr t Xz * '.' * Xn, e, pela definio do modelo Ilirrornial, j sabemos que X - b(n,p). Lembrando que E(Xa) : p e Var(X6) : p(l - p) para 'i:1,2,..., D,

virrros calcular

mdia

ea

varincia de

X,

utilizando as propriedades

t52

Captulo 5 : Varidv eis Bidimensionais

5.2 Associao entre Variveis

t53

apresentadas anteriormente. Temos,

E(X):E(Xt+Xz.-"'+X,)

r\c
1

0
1B

: :
-

E(xt) + E(x2) + ... + E(x") p+ p+...+ p


np.

16

10 38 31

2
J

34
T2

45
16

Para obter a varincia, usaremos a independncia dos X;,r:

Var(X)

: Var(Xr t Xz + "' 1 X,,) : Var(Xt) * var(X2) + ... + var(X") : p(l - p) + p(I - p) + ... + p(L - p) : np(I- p). 3. tl
(M)

a. Obtenha as tabelas marginais de freqncia. b. Construa a tabela de freqncias esperadas, caso houvesse independncia entre as variveis. c. Determine o ndice Q2.

4. A funo de probabilidade conjunta entre as variveis aleatrias


apresentada na prxima tabela.

eY

Esses resultados coincidem com aqueles apresentados no Captulo

x\y
-1
1

Exerccios da Seo 5.2:


1. Na tabela a seguir encontram-se os conceitos de histria (H), matemtica efsica (F ) de alguns alunos do 3o. ano do ensino mdio de uma escola.

-2
0,1
012

4
012

0,2
0

0,1 0,1

0,1

Aluno

I
C

2
C'
C

4
C

6 h c c

7 b a c

9 b c b

10

11

H M

'c

b.
b b

b c b

d
b

c
C

b c c

b
c c

l2 a,
c
b

a. Obtenha as funes de probabilidade marginais das variveis. X e Y so independentes? c. Calcule a covarincia e a correlao entre X eY.

b.

5. Na caixa

a. Construa as tabelas de freqncia conjunta para H e M e para H e F. b. Calcule a proporo de alunos com em fsica, dentre os com pelo menos c em matemtica.

2. rJm levantamento obtido, junto

aos funcionrios de um pequeno escritrio; busca relacionar as variveis: anos de estudo (X) nmero de diftrentes " empregos nos ltimos 5 anos (y). O que voc pode dizer com os dados fornecidos?

I existem duas bolas numeradas 0 e 1, enquanto que a caixa II contm duas bolas numeradas 1 e 0. Uma bola retirada aleatoriamente de cada caixa, de forma independente uma da outra. A esse experimento, associamos as variveis aleatrias: nmero da bola retirada na caixa I (X), soma dos valores das duas bolas retiradas (Y) e a difurena, em mdulo, desses valores (Z). a. Determine a funo de probabilidade conjunta entre X eY e entre Y e Z. b. Verifique se X e Y so independentes. Idem paraY e Z. c. Calcule a covarincia entre X eY. d. Obtenha Var(X +Y).
Binomial com p

6.

X
Y
3.

I
2

10

11 2

l2

A varivel X ,Bernoulli com p : 0,4 eY Admita que X e Y so independentes. a. Determine P(X :\lY :2).

0,5 e n

3.

Uma amostra de 220 clientes de uma clnica dentria foi selecionada' As variveis tempo, em anos, decorridos desde a ltima visita ao dentista (V) eo nmero de cries encontradas (C) apresentado na prxima tabela'

b. Obtenha a funo de probabilidade conjunta de X e Y e do produto XY. c. Calcule E(X),8(Y) e E(XY) e verifique que: E(X) x E(Y) : E(XY). d. Determine o valor de Cov(X,Y) e de py,y.

t54

Captulo 5 : Variv eis Bidimensionais

5.3 Exerccios

155

5.3 Exerccios
1.

(F,C)
(0,0)
(0,
1

freq.
L2

tabela a seguir apresenta os valores observados em uma amostra de 130 empregados do ramo do comrcio.
Sexo \ Fumante

25
8

Sim
24 25

No
18

Masculino Feminino

63
e

(0,2) (1,1) (2,1 (3,1 (3,2)

t4
57
40 45 27 22

a. Construa as tabelas marginais de freqncia para as variveis Sexo

(4,r
(4,2)

Fumante. b. Se usssemos a amostra para tirar uma concluso sobre toda populao, voc diria que, proporcionalmente, mais homens fumam do que mulheres? c. Calcule o ndice de associao Q2 entre as variveis.
,,

5. Os dados a seguir referem-se a uma amostra de incio do curso, seu peso e idade.

5 alunos que informaram, no


5

Em uma amostra de 8 funcionrios de uma empresa, observou-se duas variveis: anos de empresa (A) e nmero de promoes recebidas (P). Com
os resultados apresentados a seguir voc diria que, para essa empresa, essas variveis esto associadas?

Aluno
Peso

2 65 L7

7L
L7

70
18

57
17

66
19

Idade

A P

5 2

6
1

7
2

B t J

B
1

8
0

a. Encontre a mdia e o desvio padro do peso dos alunos c"om b. Construa o diagrama de Peso por ldade. c. Obtenha o coeficiente de correlao entre peso e idade.

l7

anos.

3. Est sendo estudado o efeito do teor de ferro na capacidade ile car p de vigas de concreto. Os dados abaixo apresentam os resultados de medidas btidas em

r. Para cinco volumes de uma mesma soluo foram medidos os tempos aquecimento, em um mesmo bico de gs, e as respectivas temperaturas
ebulio: Tempo (min.)
Temperatura
20 75 22
BO

de de

uma amostra. Obtenha a correlao entre as variveis. Ferro (7o peso) Carga (ton./m2)

5,4
2rL

6,8

,)

6,9

7,3
2r9

2r9

7,7 3,0

8,1 3,1

8,2
3,1

8,5 3,1

8,6
314

8,9

19

23 82

17

3,5

('C)

75

78

4. A tabela de freqncia conjunta entre nmero de filhos


cusamentos ur certa empresa.

" oficiais (C) apresentada, a seguir, para os 250 funcionrios de

(f')

nmero de

a. Obtenha o grfico do Tempo pela Temperatura e calcule a correlao. b. Voc acha que existe associao entre as variveis?
7. Alguns cientistas sociais acreditam que a opinio sobre o aborto independe da situao familiar. O que voc diria, aps estudar a amostra?

a. Determine as tabelas de freqncia marginais, correspondentes a cada uma das variveis, isoladamente, e calcule as mdias de F e C. b. Construa um grfico com a distribuio de freqncia das variveis. Voc
chega a alguma

Situao \ Opinio
Casados

Favorveis
56
15

Contrrios
2:4

c.

coeficiente de correlao entre F e C. Note que ser necessrio adaptar a expresso apresentada na Definio 5.4. Determine

concluso?

Solteiros Divorciados

25
16

24
13

Vivos

27

t56

Captulo 5 : Variveis Bidimensionais

5.3 Exerccios

r57

8.

A tabela a seguir consiste de 16 valores de trs variveis observadas em alunos do curso de cincias sociaisr sexo (S), nota de estatstica (E) nota de " antropologio (A).

Pac. No.

2
1

J
2
t)

4
1 1

6
1

8
a)

9
2

10 2
J
L)

ll
1

12
1

I3
2

I
2

2
1 1

I
t
L)

s
E
A

M
r)
e)

F 6 4

M
4 3

F
iJ

M
6 5

M
5 5

F
5

F
I

F
4
5

M
5 5

M
5 4

F
6 4

M
5 5

F
4
5

F
r)

t t

M
6
5
er

s F
Pac. No.

2 2

2
1

t d

2
1

I
2

I4
2
,f t d

15

t6

7
1

18
a)

a. construa a

t9
1

20
2
1

2I
1 1 1

22
1

23
1

24
r)
t)

tabela de dupla entrada para as notas de estatstica

C
,9

I
()
D

I
2

antropologia. b. Repita o item (a), considerando apenas os homens. c. calcule, para os alunos do sexo masculino, o coeficiente de correlao entre as notas de estatstica e de antropologia. d. Com o uso da tabela obtida em (a), calcule a porcentagem de cada freqncia conjunta em relao ao total de alunos.
9. Num certo distrito de sade, o comportamento conjunto dos de

2
1

2
1

t
!)

,)

sarampo (S) e difteria (D) foi o seguinte:

a. Construa a tabela de dupla entrada com as variveis C e S. b. Estude a associao entre as variveis C e S, atravs das porcentagens em relao ao total de coluna. c. Repita os itens (a) e (b) para C e F. d. Repita os itens (a) e (b) para S e F.

11.

departamento de vendas de certa companhia ofereceu um curso de atualizao a seus funcionrios e, para estudar a eficcia do curso, resolveu comparar a noto de teste no curso (7) com o volume de vendas, em rhilhares de unidades, nos seis meses seguintes ao curso (V). Os resultados esto na
tabela abaixo.

t6
1

I7

18 2

t9

t .)

20
1

2t
0
2

22
1

23
2 2

24
1

25 0
2

26 0
1

27 0

28
1

29
L
i)

30
2
t ()

I
2

,1,

7
T2

8
13

.J

5 11

6 10

7
T2

7
13

q d

5 T2

3 11

74

13

10

I2

11

10

10

a. Obtenha a tabela de dupla entrada. b. Calcule a porcentagem de cada ocorrncia conjunta em relao ao total de
casos.

a. A varivel ? serve para explicar a varivel b. Calcule a correlao entre as variveis.

I/? Justifique.

c. Repita o item (b), fazendo a porcentagem em relao ao total de colunas.

d. Que concluso
difteria?

se pode tirar da relao entre a incidncia de sarampo e

12. Um total de 1000 passageiros de vos domsticos foram entrevistados no Aeroporto de Guarulhos. Duas variveis foram observadas: nmero de viagens mensais (V) nmero de automveis na famlia (). O resultado est na prxima tabela"que, por descuido, est incompleta.

10. As informaes da tabela a seguir foram coletadas de 24 pacientes da rea de cardiologia de um grande hospital pblico. A varivel C indica o nmero de

intervenes cirrgicas sofridas pelo paciente, ,9 representa o nmero de pontes safena colocadas pelo paciente em uma ou mais cirurgias e a varivel F indica o nmero de.familiares prximos com problemas cardacos.

V\A
1

2
BO

r)

total
-zt)O

/0
150 /t0

60
C

2
J

:.{.,t

450
300
'i i .. ),

L20

,l4a

total

300

200

/51J

Captulo 5 : Variveis Bidimensionais

5.3 Exerccios

t59

! a. Complete a tabela. b. Calcule as porcentagens em relao ao total de coluna. c. As variveis so independentes? Justifique.
13. A tabela de freqncia apresentada em seguida est incompleta e contm observaes das variveis: vida til do equipamento (t/) garantia do " fabricante (G), ambas medidas em anos.

16.

A funo de probabilidade conjunta das variveis tabela de dupla entrada.

x ey

dadapela seguinte

x\y
-1
0
1

I/B
1/8 L/8

-1

1/8
0

r/8
1/B

I/B

L/8

U\G
8 10

2
t)
4

4 3
I
) '.,

total
6

a. Verifique se E(XY) E(X)E(Y). b. X e Y so independentes? Comente.

o
6

0 4

+4.

17. Numa caixa existem 4 bolas numeradas 3, 5, 5

t2
total

5
1t

10\
<,O

a. Complete tabe Construa o grfico de [/ por G e verifique se h associao entre as variveis. c. Calcule a vida til mdia para cada subgrupo de valor da garantia. Comente os resultados.

b.

eT.rJmabola sorteada ao devolvida caixa. uma segunda bola " escolhida, tambm ao acaso, e seu nmero denotado por X2. a. Determine a conjunta de X1e X2. b. Calcule as marginais de X1 e X2. Elas so independentes? c. Encontre o valor esperado e a varincia de X1, X2 eX : e+t.
acaso, seu nmero anotado

(xr)

L4. Para o lanamento de dois dados equilibrados, defina duas variveis


aleatrias. Seja X o nmero de vezes que aparece aface 2 soma for par e 1, caso contrrio. a. Determine a funo de probabilidade conjunta de X eY. b. Calcule E(X), E(Y) e E(X +Y).
c. Verifique se
so independentes. d. Calcule o coeficiente de correlao entre

eY

igual a 0 se a

18. Uma moeda equilibrada lanada trs vezes e so definidas as variveis aleatrias: nmero de caras nos dois primeiros resultados (x), nmero de caras no ltimo lanamento (Y) e nmero total de caras (S). a. Construa a tabela conjunta de (X,Y). b. Verifique se X e Y so independentes. ' , c. Calcule E(X), E(Y) e Cov(X,Y). d. Expresse ,5 em funo de X e Y e determine E(.9) e Var(S).
19. considere a frase: "Para mais sade pratique mais esporte,,. Escolha ao acaso uma palavra dessa frase e considere as variveis aleatrias nmero de vogais

X eY

X eY.
2

15. Considere a funo conjunta:

x\v
0
1

t/78
7/9 L/6

rls I/I8
r/6
1,

rl6
U9 r/18

(V) e nmero de consoantes (C). a. Determine a conjunta deV e C. b. Obtenha as funes de probabilidade marginais. c. Calcule os valores esperados dessas variveis. d. As variveis so independentes? Justifique. e. se a escolha acima resultou em v : 2,, qual a probabilidade da palavra "mais" ter sido a escolhida.

a. Calcule

P(l < X 12,y > 1) e P(X:

1).

20.

b. Determine E(X), E(Y) e Cov(X,Y). c. X e Y so independentes? Justifique.

A tabela a seguir representa a funo de probabilidade conjunta de duas variveis aleatrias independentes.

160

Captulo

: Variveis Bidimensionais

\.. lxerccios

r61

x\
P(Y
a. Complete a tabela.

), -1
0
1

P(X

: r)

a. Determine o valor esperado e a varinciadavarivel

X :1-

18.

L/6

b.IdemparaY:E-l.tp.
c. Obtenha a conjunta entre

2/6 3/6
y1

X eY.

25.

conjunta das variveis aleatrias independentes

' parcialmente

r/5

3/5

L/5

apresentada a seguir:
I

i:3i,iil'l

:,Y';E(Y) "

cov(x'Y)
{

x\v
1

-2
u)
012

P(X

: r)

0,3

21. sorteia-se ao acaso um dentre os nmeros g, 12, e zz e feita a decomposio do nmero sorteado em fatores primos. $ejam D e T, as
3 aparecem na decomposio. a. Obtenha a conjunta entre D e T.

P(Y
a. Complete a tabela.

0r7

0,3

variveis que representam, respectivamente, o nmero de /ezes em que o 2 e o


\

b. Calcule o valor esperado e a varincia de 2X

Y.

b. calcule a covarincia e o coeficiente de correlao entre as variveis. 22. As variveis F e M representam, respectivamente, o nmero de anos para compltar o ensino fundamental e o ensino mdio. Numa certa cidade , a tabela a seguir adotada pafa a funo de probabilidade conjunta dessas variveis. Determine o valor esperado e a varincia da varivel F + M que representa o total de anos at completar o ensino mdio.

26. Sendo Xr,Xz e X3 variveis aleatrias independentes, seguindo o modelo Bernoulli de parmetro p, pergunta-se: a. Qual a funo de probabilidade de Xt t Xz * Xs? Voc reconhece essa varivel? b. Qual o valor aeVar($h)t
27. Sabe-se que

F\M
8
9
7

e 160

10

/60 3/60

I /60 7 /60
4160

/60 5/60 3/60


7

r/60
3/60 2/60

X e Y so independentes e assumem, respectivamente, os valores 7,2 e 3 e-0, I e2. Admita conhecidas as probabilidades P(Y:0):1/3, P(X :3) : Ll3, P(X : L,Y :0) : 1/9 e P(X :3,Y :2) : Llq, a. Construa atabela de dupla entrada para X eY. b. Calcule E(X x Y) e Var(X + Y).

23. Sejam X -b(5;0,5) e Y -b(3;0,2) independentes. Determine o valor


esperado e a varincia da

28. Um paleontlogo acredita que o nmero de minerais presentes em certo tipo de rocha pode influir na chance de se encontrar fsseis perto de uma indstria calcria. Atravs de amostras de rocha obtidas em levantamentos de campo, elc

varivel2X

BY.

obteve

24. A rabela a seguir representa a funo de probabilidade conjunta entre o nmero de empregos desde que comeou a trabalhar (E) e a idade do primeiro enlprego (1), de jovens em uma pequena cidade do Estado de so paulo.

presentes

eW:

distribuio conjunta para as variveis Z:nmero de minerctis varivel que assume 1, se for observada a presena de fssil e 0

caso contrrio.

w\z
0

r)

E\r
b 6
I

13

14

15

16

r/8
L/8

r/8
L/4

r/4
1/B

0,02 0,07 0,10 0,10

0,02 0,09 0,08 0,06

0,02 0,L2 0,03 0,04

I
a. Calcule

0,03 0,13 0,05 0,04

P(W

:0, Z > L).


.

b. Encontre as distribuies marginais para Z e W c. Qual a esperana de Z?

I ()2

Captulo 5 : Variveis Bidimensionais

.\.-l Exerccios

163

d. A

suspeita do paleontlogo confirmada pelos valores apresentados na

tabela? Justifique sua resposta quantitativamente.

c. Se o produto dever ser vendido poi 50 reais, qual ser o lucro mdio por
unidade?

29. Sejam (J

X eY

:Y2 eV : X +Y, com a funo de probabilidade

conjuntaentre

dada na tabeia a seguir:

33.

x\v
-1
1

L/12 7/6

Ll6 7/4

r/3
0

contm uma bola vermelha e uma azul, enquanto que a caixa II contm duas vermelhas e uma azul. Um experimento consiste em escolher uma bola ao acaso da caixa I e passar para a caixa II e, em seguida, escolher uma bola da II e passar paraa I. Sejam X eY os nmeros de bolas vermelhas nas

A caixa I

a. Obtenha a conjunta de U e V. b. Calcule P(U L). c. Determine Cov(U,V).

: 4lV :

caixas Ie II, respectivamente. a. Calcule a conjunta de X e Y. Elas so independentes? b. Comente o que ocorre com a varivel X +Y. c. Determine a mdia e a varincia para cada uma das varivel

eY

30. considere duas ua.iveis aleatrias discretas ,1,


somente os valores ay, a2 e oJ, enquanto

" os valore

a/l,aoota
sl6

assume e b2. Sabemos que:

que

34. Considere duas variveis aleatrias independentes U-Po(2) e V-G(0,3). A partir dessas variveis definimos outras duas da seguinte forma:

P(A: P(A :

:0,2; P(A - or) : 0,,5 ; P(B: br) : a1,B :bt) : 0,,L2 e P(B : bz I A : as):
ot)

0,6;
0,b,

-_0l1 sel/)1: \-

seU:0;

e Y: {'

seI/:0; seI/:1; seV ) 2.

a. Construa a tabela de dupla entrada entre A e B. b. As variveis so independentes? Justifique. c. Calcule P(A: or l B: br).

a. Construa a conjunta de X e Y e determine Cov(X,Y). b. Determine o valor esperado e a varincia de 2X - 3Y .

31. sejam x e Y independentes com funo de probabilidade G(0,5). Determine o valor esperado e a varincia de:

a.S: X+Y. b.D:X-Y.

35. Duas moedas so lanadas simultaneamente. Uma delas equilibrada e a outra tem probabilidade 213 de sair face cara. Considere as variveis U: total de caras observadas eV uma Bernoulli que assume valor I se as duas faces
so iguais. a. Determine a conjunta de U e V e verifique se so independentes. b. Calcule a mdia e a varincia de 2U - V .

32. Baseando-se nas projees de preo de duas matrias primas, M1 e M2, pretende-se estudar a viabilidade econmica do lanamento de um certo produto. A funo conjunta de probabilidade com os preos (em reais)
apresentada a seguir.

36. (Use o computador) Com os dados das variveis altura e peso da Tabela 1.1 do Captulo l: a. Verifique o grau de associao atravs do clculo do coeficiente de
correlao.

Mt\
I
I r)

Mz

I
0

13

0,1 0,1
0

0
012 012

b. Obtenha a mdia e o desvio padro para cada uma das variveis.

0,2
012

c.

Calcule

coeficiente de correlao entre as variveis peso

altura

a. Determine o preo mdio e a varincia das matrias primas. b. O produto usa 2 unidades de M1e 3 de M2. Qual seu custo mdio?

padronizadas. Os valores da varivel padronizada so obtidos subtraindo-se a mdia e dividindo-se pelo correspondente desvio padro. Compare com o resultado encontrado no item (a). .17. (Use

o computador) Considere os dados apresentados no Exerccio 23 do Captulo 1, onde, no item (b) foi definida a varivel Etrio.

I.1

Captulo 5 : Variveis Bidimensionais

diferente dependendo da faixa etria. b. Suponha que um paciente escolhido ao acaso. Qual a probabilidade de que a pessoa apresentasse cogulos no momento de admissol E uma pessoa de faixa etria mais alta? c. Voc diria que Coag e Etrio so independentes? por qu? 38. (Use o computador) Novamente com os dados do Exerccio 23 do Captulo
considere agotaavarivelCuracriadanoitem(c). \ a. Crie uma tabela de dupla entrada com Cura nas linhas e Tratjm nas colunas. b. com base na tabela do item (a), voc diria que neste caso,/rapidezda cura depende do tipo de tratamento considerado? Justifique. / c. Qual a probabilidade de que uma pessoa selecionada o u"uro tenha cura rpida, dado que recebeu tratamento do tipo I ? d. Qual a probabilidade de uma pessoa ter recebido tratamento do tipo I, dado que teve cura normal?
1.

n. crie uma tabela de dupla entracla, contendo Etrio nas linhas e Coag nas colunas. Com base em tal tabela, reavalie se a presena de cogulos

Captulo 6

Variveis Aleatrias Contnuas


(r.1

Introduo

Neste captulo, discutiremos a Vracteriz4o de variveis cujos possveis valores ocorrem aleatoriamente e pertencem a um intervalo dos nmerd's reais: virriveis aleatrias contnuas. Renda, salrio, tempo de uso de um equipamento, comprimento de uma pea e rea atingida por certa praga agreola so exemplos dc quantidades que podem ser modeladas por variveis aleatrias contnuas. De lrrma semelhante quela desenvolvida. para variveis aleatrias discretas, prccisamos estabelecer, para as contnuas, a atribuio de probabilidades s suas

39. (use o computador) Responda os itens a seguir, baseado nos dados de


incidncia de cncer apresentados no Exercc io 24, captulo l. a. utilizando a mediana da varivel GL, classifique os pacientes em dois grupos, de alta e de baixa taxa de glicose. Denote essa nova varivel por Clagl e construa uma tabela de dupla entrada entre Clagl e ALB. Voc diria que as duas variveis esto relacionadas de alguma forma? b. considere os valores da varivel Idade em trs grupos: jovem com at,25 anos (inclusive), meia idade para indivduos com idades entre 25 e 55 anos (inclusive) e senior para maiores de 55 anos. construa uma tabela de dupla entrada para estudar o comportamento desses grupos em relao concentrao de fosfato, tirando as concluses pertinentes. c. Escolhendo-se um paciente ao acaso, qual a probabilidade de que ele seja do grupo .falso-negativo, dado que tem mais de 50 anos? E ter acima de 50 irnos, dado que no do grupo falso-negativo?

cliversas realizaes que, neste caso, podem assumir um nmero vtlores diferentes. Abordamos esta questo no prgximo exemplo.

infinito

de

Iixemplo .1.' Estudos anteriores revelam a existncia de um grande lenol de gua no subsolo de uma regio. No entanto, sua profundidade ainda no foi tlcterminada, sabendo-se apenas que o lenol pode estar situado em qualquer
ponto entre 20 e 100 metros.

40. (use o computador) utilize as informaes do arquivo aeusp.txt, introduzido no Exerccio 26 do Captulo 1. a. crie uma tabela de dupla entrada com as variveis comun e Renda. Voc diria que existe associao entre elas? b. Repita o item (a) para as variveis Reproce e Trab. c. O que pode ser dito da associao entre nmero de residentes (varivel Resid) e idade que comeou a traballrar (varirvel Itrab),?

Vamos supor que escolhemos, ao acaso, um ponto nessa regio e tlispomos de uma sonda que, ao fazer a perfurao, detecta com preciso a lrlofundidade do reservatrio de gua. Denotamos por X a varivel alearia rcpresentand o a p rofundidade. Notemos que, apesar de X poder ser qualquer nmero entre 20 e 100 nctros, o instrumento, com que trabalhamos, pode no ser to preciso como liostaramos. Por exemplo, uma profundidade de 32,571 metros poderia ser rrrcdida por 32,6 metros. Vamos assumir, entretanto, que temos um instrumento itlcal que no faz aproximaes. Nessas condies, podemos supor a sonda ;rcoplada a um instrumento indicador da profundidade e um dispositivo que, tlrrnndo a sonda encontrar gua, provoque a imediata interrupo da perfurao. Uma vez que no temos informaes adicionais a respeito da lrronndidade do lenol, razovel assumirmos que a sonda pode parar em rprnlquer ponto entre 20 e 100 metros, sem que tenhamos motivos para privilegiar cssn oll aquela profundidade. Assim, consideraremos todos os pontos como igrralmcnte provveis. Se utilizarmos a mesma idia de atribuir a cada possvel

l6(t

Captulo 6: Variveis Aleatrias

6,1 Introduo

167

cleles tiver, individualmente, probabilidade maior que zero, a soma probabilidades ser igual a infinito e no 1, como requer a definio da funo probabilidade. Em geral, em situaes como esta, no de intEresse conside um nico valor para a vari..vel aleatria, mas intervalos de valores na atribui dc probabilidades. Neste caso, sabemos que o espao amostral corresponde intervalo [20, 100] e as profundidades so igualmente provveis. suponh, por nomento, que dividimos o espao amostral em 8 intervalos de comorimento 1 Logo, razovel atribuir aos intervalos a probabilidade l/g, us, corre$ondend, corres\ondendo relao entre o comprimento de cada um deles e o compri-"ntoldo ".p, nmostral. Isto , 10 para 80 ou 1/8. Assim, com a diviso m s fzas de is comprimento e sem interseco entre elas, teremos os intervalo d po, 30), 40),..., [90, 100] todos com a mesma probabilidade l/g, pois tods tem o mes
termanho.

ponto uma probabilidade, teremos uma dificuldade extra, pois eles pertencem intervalo [20, 100], em que existem infinitos nmeros reais. Assim, se cada

Densidade

20

30

40

50

70

80

90

100

O histograma mostra que,

apesar

de termos diferentes intervalos,

Para construir um histograma, nos mesmos moldes do captulo podemos supor que l/8 , a freqncia relativa da ocorrncia de cada um irrtervalos. As ordenadas do grfico so as densidades, calculadas de modo que
rea de cada retngulo seja a freqncia relativa (probabilidade) do intervalo.
Densidade

clcnsidade permanece com o mesmo valor, igual a 1/80.

taumentando cada vez mais o Podemos continuar esse procedimento, rrrnero de faixas, com a conseqente diminuio das suas amplitudes de tal forma

(ple, em uma situao terica com infinitos intervalos, temos


Iristograma:
Densidade de Probabilidade

seguinte

1/8

1/8

lta

1t8

1/8

'v8

1lA

118

Note que, dada as caractersticas do problema, a diviso em g intervalos produziu o mesmo valor de densidade de l/80 para todos eles. Se dividirmos o intcrvalo [20, 100] em l6 faixas iguais, utilizando o mesmo argumento anterior, tcrnos que os intervalos [20, 25), [25, 30), [30, 35), .. . , [95, 100] tero todos a rosma probabilidade l/16. O histograma correspondente ser:

100

Estamos agora em condies de caracterizar, completamente, a atribuio rlc probabilidades para o caso contnuo. Ela ser definida pela fuea abaixo de uma

I'uno positiva, denominada densidade de probabilidade. Observe que a clcnsidade em si no uma probabilidade, mas uma funo matemtica que nos