Académique Documents
Professionnel Documents
Culture Documents
)t,:
l'Rr lttAtn,n)AI)E
rA
l,lsllr olrr ir
('llnlir irrlrorlrtr.iru;t
rlrrs r'rrcirs
s'l'rt
hrrmanas. Ao
corrtliilio rlt'
orr(rrrs
<lc
procurou-se
trodrrzir
csses conceil os
em paralelo corn outros tpicos mais tericos no decorrer do livro. Desse modo,.buscou-se desenvolver texto
de forma similar ao uso prtico da Estatstica, quando normalmente um
se
procuro enfatrzar
as idias envolvidas
e no a habilidade computacional.
de cada captulo
assumem o uso de
e
leitor
rxl
io ttits
t'csoltr'<-rcs.
)''
"
trpyrlglrt O hy Mulcos Nascinrcnlo Magalhcs c Arrtonio Carlos l)ctltoso clc Lima l" r'rlio 1999 (lMli-tJSP) ( lMll-l.JSl') .1" crlilio 2(X) I (lMli-tJSP)
J'' r'rlt1'rlo 2(XX)
Prefcio da 6s edio
eln Departamento de Estatstica do Instituto de Unversidade de So Paulo. Nesse perodo, foram ministradas diversas disciplinns lrrsicas de Estatstica para cursos nas reas de Cincias Humanas, Exatns e Biolgicas. Buscamos enfatizar dois aspectos neste livro. O primeiro se refere $ rcpartir a Estatstica Descritiva ao longo do texto, suavizando, assim, a transiilo pari Probabilidade e Variveis Aleatrias. Em geral, os alunos sentem o impacto <le uma maior formalizao e, muitas vezes, no conseguem estabelecer o elo clc ligao entre essas partes. Um segundo interesse transmitir a importncia dn colrputao na Estatstica. No atrelamos o texto a nenhum softvvare espec:ico, permitindo que o conhecimento computacional anterior dos estudantes pudesse ser incorporado, minimizando o desgaste de um novo aprendizado. Ressaltamos qUe vrios software disponveis no mercado podem ser utilizados. Os arquivos mencionados no decorrer do livro esto disponveis em www.ime.usp.br/-noproest juntamente com outras informaes de interesse' O livro contm exerccios ao final de sees e captulos. Os exerccios de seo so mais diretos e visam a aplicao imediata dos conceitos discutidos. Ao fim de cada captulo, um considervel nmero de exerccios ajuda os estudante$ nll fixao global das idias apresentadas. Tambm so propostos exerccios ptlrn serem desenvolvidos com a ajuda do computador. O principal objetivo desses exerccios, enfatizar as idias estatsticas envolvidas e no a habilidncle computacional. No Apndice'8, "apresentamos as solues comentadas dos exerccios de so e fornecems as respostas para os exerccios mpares de fim de captulo. Em relao edio anterior, a sext edio apresenta pequenfls rnodificaes. Uma das figuras do Captulo 7 foi mudadapara o Captulo 6, locnl que nos pareceu mais apropriado. Foram acrescentados exerccios em alguns captulos. Os erros em respostas, identificados at ento, foram corrigidos, Pequenas alteraes de redao tambm foram feitas. As mudanas, em relaO t quinta edio, esto listadas no endereo Internet mencionado acima. Ao longo das vrias ediges, diversos colegas contribuiram com sugestes, Entre eles destacamos Adilson Simonis, Cludia Monteiro Peixoto, Cllia Tsloi, Denise Botter, Elisabeti Kira, Elisete da Conceio Q. Aubin, Julio da Mottt Singer, Lighia B. Horodynski-Matsushigue, Lcia P. Barroso, Marli Mikael, Nelson Tanaka, Rinaldo Artes e Silvia Ferrari. Maria Ceclia Camargo Magalhies
cl
Matenttica
Estatstica
crliro 2(X)2 (lJclusp) .1" crliro 2{X}2 (Ddusp) (rn ctlilo 2(X)4 (liclusp)
,1"
l )utkrs
lnlct nacionais dc Catalogao na Publicao (CIP) (('inrala Ilrasileira do Livro, SP, Brasil)
Nuiics rlc I'robabilidade c Estatstica / Marcos Nascimento Mngllhitcs, nlonio Carlos Pcclroso cle Liml - ed. - So Paulo: Jltlilurl tlu IJrtive lsichclc de So Paulo, 2004. - (Acadmica; 40)
lllhliogr';r
li,rt
tstN
t5-3 I 4-077-3
lirrsirur 3. loltabiliclaclcs
cDD-5 t 9.507
ndicos para catlogo sistemtico:
l, 2,
Errsino
519.507
I)ll'cllns lcsclvltlos
{i
Coutro d Ciaerap Ldarcai{h a do *hrreln
[Jnivclsidade de So Paulo l,rrciarto Gualbclto, Tlavcssa J,374 ('untlll lltl. rll ntiga leitoria - Cidade Universitria 0550tl U{X) .- Sio l'uulo - SP - Brasil I)ivisalo (lrrucrcial: tcl. (Oxxl l) 3091-4008 / 3091-4150 SA(l (0xxl l) 3091-291 I - Fax (Oxxll) 3091-4151 www,rrsp,lrr'/ctlusqr - c-mail: edusp@edu.usp.br
lrrl,
Iiibirotecl
ll.. :;,gil''rs
4658108
0\/0s
cr|sEra lrrslilulo rlc Mllcnttica c Estatstica - IME-USP l0l0 - Cidadc Universitria 0-55()t1"9(X) - S;io I'aulo - SP - Brasil l)cplrlnnlcnt( tlc listatstica - Tel. (Oxxl l) 3091-6129 / 3091-6130 ('uixil lrslIl (r(),2tI - 05315-970 rvww, irrx',rrsgr,lrr'/*ttoproest - c-mail: noproest@ime.usp.br
Ituil rkr Millikr,
l irt('(l iil
lroi leito o
llril/il
l(X)4
rlt'1tr1silo lcgal
vrt
vlu
Prefcio
colnborou na reviso final da redao. A estudante Tatyana Maya Okano auxiliou nn COrreo das respostas de vrios exerccios. Apontamos, ainda, o recebimento CJc vrrias mensagens eletrnicas com comentrios e/ou sugestes. A todos que Colnboraram, o nosso sincero muito obrigado. Agradecemos, ainda, aos alunos de vlrias unidades da USP, que apontaram erros e deram sugestes. Finalmente, gostaramos de agradecer a Lus Ricardo Cmara, da ADUSP- Associao dos Docentes da USP, pela diagramao das tabelas e auxlio na arte final de algumas dns figuras apresentadas no texto.
Contedo
Pedimos, desde j, desculpas pelos erros que sero eventualmente identificados nesta nova edio. As crticas e sugestes de colegas e estudantes
gcro muito bem-vindas e, certamente, auxiliaro na rnelhoria da prxima verso.
Marcos N. Magalhes
'
'
t"r
Contedo
Lista de Defnies
2.r
2.2
2.3
2.4
.................... 38 ..................,,,42
.........,44 ............46
3.r
3.2
3.3
3.4
3.5
3.6
3.7 3.8
4.1
probabilidade Modelo Uniforme Discreto ........;.......... Modelo Bernoulli ................... Modelo Binomial Modelo Geomtrico Modelo Poisson Modelo Hipergeomtrico ........... Medidas de posio para um conjunto de dados
Funo de distribuio de
......78
......,,,,,,79
.....,82
.......,..,......,,94
4.2
4.3
4.4
4.5
5.1
dados Varincia e desvio-padro em um conjunto de dados Varincia de uma varivel aleatria discreta Funo de probabilidade conjunta ...............
Amplitude de uma varivel em um conjunto de
Independncia de variveis
....,.. 103
......... 104 ....109
..,..128
5,2
.5.3
aleatrias
..........,... 137
5.4 5.5
.5.(r
l4l
.........,147 ................,.149
xu
Lista de Definies
6.1
6,2
6.3
6.4
6.5
........... ...... 168 Medidas de posio paravariveis aleatrias contnuas .....I73 .....................1,73 Varincia paravariveis aleatrias contnuas ..........177 Modelo Uniforme Contnuo .....180 Modelo Exponencial .................
Funo densidade de probabilidade
Lista de Figuras
1.1
Populao e amostra
r.2
1.3
........"'."",.,',
d
'
..:'....."""""" l2
6,6
7,1
Modelo Normal
Parmetro
t.4
1.5
DiagramacircularparaavarivelToler.....'.'. .'.....'..""""""13
......."""':"""" 14 ......'.. .'..'.......'.15 Histograma paraavarivel Peso .'.'....'. ...'........""""" 18 Box-plot para o nmero de laranjas por caixa ....'.....".'.....18 Box-plot para a varivel Peso '.....'... .'.'......'."...'..'........ 19 Box-plotda varivel Peso para cada sexo ....'.,'..' 39 Regra de adio de probabilidades .'....... ....',,,,43 Regra do produto de probabilidades .'....... ,...,.,45 rvore de probabilidades ......'.. .'....,""""" 46 Partio do espao amostral (k : 6) ...........'.,..60 rvore de probabilidades - alteraes no subsolo ...........65 Funo de distribuio - doses de vacina .'...'...'.......,..,69 Modelo Uniforme Discreto [0, 10] .'."...'..'.........75 Grfico de freqncias - natalidade em porcos ..'.'7g Modelo Geomtrico (P: 0,0t) Modelo Poisson ( : 5) "..........."'.80 Independncia de variveis aleatrias '.....'.".."137
Valor esperado da soma de variveis aleatrias ..'.'.'.':"'......"'.......'....'. 145 Valor esperado do produto e independncia de variveis aleatrias ..,..146
Correlao para conjuntos de dados (brutos) Covarincia e correlao de variveis
xtu
Estimador e estimativa
.................. 208
t.6
1.7 1.8
r.9
2,1
2.2
2.3
2.4
3.1.
3.2
3.3
3.4
3.5 3.6
5.1
5.2
5,3
.5.4
5,.5
.'.'.'....'.". aleatrias
'.'....151
..'.............
l5l
.qft
rlv
aleatrias
Lista de Tabelas
l
Binomial """"""""' 189 190 Histogramas para valores simulados da Binomial """"""""""""""""' Efeito de n na distribuio amostral de X - N(10,I6/n) """"""""""22I
de Efeito do tamanho da amostra sobre a distribuio
8'2Representaogrficadoserrosd'ep.,.'.....
S.3Representaogrficadaregioderejeio-unilateral...,.250
8,4Representaogrf\cadaregioderejeio-bilatera1
Funo
Poder Student
"""""""""'
Densidade -
"""""""
"""""'1 .l lnformaes de questionrio estudantil - dados brutos """""""""' 9 1.2 Tubela de freqncia para a varivel Sexo """"" """"""""' 10 1,3 Tlbela de freqncia para a varivel Idade ""'"" """"""""" I 1,4 Tabela de freqncia para a varivel Peso """"" L5 TabeladefreqnciaparaavarivelTV""""""' """"""""'1l """" 100 4,1 Meclidas de tendncia central """""""""" 11 4,2 Medidas de disperso """"""""" 11 4,3 Propriedades da mdia e da varincia """""""' I l3 4,4 Modelos discretos- valor esperado e varincia """"""""""""""""""" 187 e varincia """"""""""""""""""' Modelos contnuos- valor esperado 6, I """''"""""211 7,l Estimadores para mdia' proporo e varincia """"'234 p Intervalos de confian apaa p e """"" 1 ,2 9,I Comparao de mdias para duas populaes """"""""""309 ""' 326 g,2 Tnbela de Anlise de Varincia (ANOVA)
1
1
"""""""'
9.2
9.3
Distribuio de Fisher-
"""""""'295 """"""""""'317
""""""""':""""""""'335
Captulo
cxemplo, as transmisses esportivas. Em jogos de futebol, o nmero cle cscanteios, o nmero de faltas cometidas e o tempo de posse de bola so daclos
geralmente fornecidos ao telespectador e fazem com que as concluses sobre qunl
time foi o melhor em campo, se tornem objetivas (no que isso impliqlle que
tcnlra sido o vencedor...). O que tem levado a essa quantificao de nossas viclus no dia a dia? Um fator importante a populatizao dos computadores. No passado, tratar uma grande massa de nmeros era uma tarefa custosa e cansativtt, que exigia horas de trabalho tedioso. Recentemente, no entanto, grnnCle quantidade de informaes pode ser analisada rapidamente com um computudor
pessoal e pfogramas adequados. Desta forma, o computador contribui, positivamente, na difuso e uso de mtodos estatsticos. Por outro lado, o computador possibilita uma automao que pode levar um indivduo ser prepilro
especfico a:utilizar tcnicas inadequadas para resolver um dado problema. Assitrt, necessrio a compreenso dos conceitos bsicos da Estatstica, bem como 0s suposies necessrias para o seu uso de forma criteriosa. Entendemos it Estatstica como um conjunto de tcnicas que permite, de forma sistemtictt,
organizar, descrever, analisar e interpretat dados oriundos de estudos tltt experimentos, realizados em qualquer rea do conhecimento- Estatrtos denominando por dados um (ou mais) conjunto de valores, numricos ou nito. A aplicabilidade das tcnicas a serem discutidas se d nas mais variadas rels tln
atividade humana. A grosso modo podemos dividir a Estatstica em trs reas: o Estatstica Descritiva o Probabilidade o Inferncia Estatstica
l.lOqueEstatstica?
Estatstica Descritiva , em geral, utilizada na etapa inicial da anlise, cprlndo tomamos contato com os dados pela primeira vez. Objetivando tirar concluses de modo informal e direto, a maneira mais simples seria a observao tlos valores colhidos. Entretanto, ao depararmos com uma grande massa de dados, lrcrcebemos, imediatamente, que a tarefa pode no ser simples. Para tentar depreender dos dados informaes a respeito do fenmeno sob estudo, preciso irplicar alguma tcnica que nos permita resumir a informao daquele particular conjunto de valores. Em outras palavras, a estatstica descritiva pode ser definida coto urn conjunto de tcnicas destinadas a descrever e resumir os dados, a fim de quc possamos tirar concluses a respeito de caractersticas de interesse. Probabilidade pode ser pensada.como a teoria matemtica utilizada para sc cstudarr a incerteza oriunda de fenmenos de carter aleatrio. Apesar de ser urrrn rrea extremamente atraente e estudada do ponto de vista matemtico, abordaremos, aqui, apenas os aspectos necessrios para as tcnicas estatsticas irprcsentadas neste livro. Inferncia Estatstica o estudo de tcnicas que possibilitam a cxtrapolao, a um grande conjunto de dados, das informaes e concluses obtidas a partir de subconjuntos de valores, usualmente de dimenso muito ffenor. Deve ser notado que, se tivermos acesso a todos os elementos que clesejamos estudar, no necessrio o uso das tcnicas de inferncia estatstica. Entretanto, elas so indispensveis quando existe a impossibilidade de acesso a todo o conjunto de dados, por razes de natureza econmica, tica ou fsica. Estudos complexos que envolvem o tratamento estatstico dos dados, tusnalrnente, incluem as trs reas mencionadas acima. Na terminologia estatstica, o grande conjunto de dados que contm a caracterstica que temos interesse reccbc o nome de populao. Esse termo refere-se no somente a uma coleo de inclivcluos, mas tambm ao alvo sobre o qual reside nosso interesse. Assim, nossa populniro pode ser tanto todos os habitantes de Sorocaba, como todas as lrnpaclas produzidas por uma ftbrica em um certo perodo de tempo, ou todo o sargue no corpo de uma pessoa. Algumas vezes podemos acessar toda a po;lulao para estudarmos caractersticas de interesse, mas, em muitas situaes, tal llroccciirnento no pode ser realizado. Em geral, razes econmicas so as mais clctclrninantes dessas situaes. Por exemplo, uma empresa, usualmente, no dispo clc vcrba suficiente para saber o que pensam todos os consumidores de scus proclutos. Hir ainda razes ticas, quando, por exemplo, os experimentos de lttlornttilio cnvolvem o uso de seres vivos. Alm disso, existem casos em que a irnpossillilitltclc clc sc accssrr toda a populao de interesse incontomvel. Na tndlisc rlo sirngr"rc cle unra pessoi ou em um experimento para determinar o tempo
Amostra
e amostra.
A seleo da amostra pode ser feita de vrias maneiras, dependendo, entre ()lrlr'os htores, do grau de conhecimento que temos da populao, da quantidade rlc rccursos disponveis e assim por diante. Devemos ressaltar que, em princpio, A sr:lciro da amostra tenta fornecer um subconjunto de valores o mais pareciclo possvcl com a populao que lhe d origem. A amostragem mais usada a
Eventualmente, se tivermos informaes adicionais a respeito cltt lrrrlrrrlirlio de interesse, podemos utilizar outros esquemas de amostragem muis so'isticuclos. Por exemplo, se numa cidade, tivermos mais mulheres do clue 111y111lrs, podernos selecionar um certo nmero de indivduos entre as'mulheres e outl'o nnrero entre os homens. Esse procedimento conhecido colno (tt,toslt'o!:ct"tt. astraificada. Outras vezes, pode existir uma relao numeradl dOS
(rtt!o,\lru r:ustral simples, em que selecionamos ao acaso, com olt sem reposi:o, os ilcrrs da populao que faro parte da amostra.
-"--qt Captulo
I:
itens da populago (uma lista de referncia) que nos permitiria utilizar a chamada 1mostragem sistemtica em que selecionamos os indivduos de forma prdeterminada, por exemplo de 8 em 8 ou de 10 em 10. Outros esquemas de ilmostragem poderiam ser citados e todos fazem parte da chamada Teoria da
3. Discuta, para cadaum dos casos abaixo, os cuidados que precisam ser tomadOa para garantir uma boa concluso a partir da amostra. a. Um grupo de crianas ser escolhido para receber uma nova vacina contra
sabEO
en
c. Uma fbrica deseja saber se sua produo de biscoitos est com o ssbof
previsto. d. Aceitao popular de um certo projeto do governo.
valores numricos.
b.
c.
Sempre que estivermos trabalhando com nmeros, deveremos utilizar a Inferncia Estatstica. A Estatstica Descritiva fornece uma maneira adequada de tratar um conjunto de valores, numricos ou no, com a finalidade de conhecermos o
pnrt organizar e descrever um conjunto de dados, seja em uma populaO OU em ulB omostra. Veremos como conceitos relacionados Teoria das Probabilidades 11pnrecem naturalmente, levando-nos, assim, a uma exposio maiS criteriosa dO
Rssullto.
A questo inicial : dado um conjunto de dados, como "tratar" os vttlofeE, nurnricos ou no, a fim de se extrair informaes a respeito de uma ou mAlC elllctcrsticas de interesse? Basicamente, faremos uso de tabelas de freqnclas e grc'('icos, notando que tais procedimentos devem levar em conta a natUreZ& dO
dnelos,
e. As tcnicas
Suponha, por exemplo, que um questionrio foi aplicado aos alunog do prirneiro ano de uma escola fornecendo as seguintes informaes:
2, Para as situaes
descritas a seguir, identifique a populao e a amostfa a validade do processo.de inferncia estatstica para Discuta correspondente. cada um dos casos. a. Para avaliar a efic'cia de uma campanha de vacinao no Estado de So Paulo, 200 mes de recm-nascidos, durante o primeiro semestre de um dado ano e em uma dada maternidade em So Paulo, foram entrevistadas a respeito da ltima vez em que vacinaram seus.filhos. b. Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. c. Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por telefone com relao ao canal em que estavam
sintonizados.
Id:
Turma:
Scxo:
Iclade:
Alt:
Peso:
lilhos: lumn:
Toler:
tolerncia ao cigarro:
122
. -Edl
Captulo
I:
Exerc: Cine:
OpCine:
TV: OpTV:
horas de atividade fsica, por semana nmero de vezes em que vai ao cinema por semana opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa horas gastas assistindo TV, por semana opinio a respeito da qualidade da programao na TV: (R) ruim, (M) mdia, (B) boa e (N) no sabe
O conjunto de informaes disponveis, aps a tabulao do questionrio ou pesquisa de campo, denominado de tabela de dados brutos e contm os daclos da maneira que foram coletados inicialmente. Os valores obtidos para cada uma dessas informaes esto apresentados na Tabela 1.1. Cada uma das Caractersticas perguntadas aos alunos, tais como o peso, a idade e a altura, entre outras, denominada de varivel. Assim, a varivel Altura assume os valores (em metros) 1,60; 1,58;... e a varivel Turma assume os valores ou B. Claramente tais variveis tm naturezas diferentes no que tange aos possveis valores que podem assumir. Tal fato deve ser levado em conta nas anlises e, para fixar idias, vamos considerar dois grandes tipos de'variveis: numricas e no numricas. As numricas sero denominadas quantitativas, ao passo que as no numricas, qualitativ as.
varivel qualitativa quando os possveis valores que assume representam atributos e/ou qualidades. Se tais variveis tm uma ordenao natural, indicando intensidades crescentes de realizao, ento elas sero
ctassificadas como qualitativas ordinais. Caso contrrio, quando no possvel estabelecer uma ordem natural entre seus valores, elas so classificadas como qualitativas nominais. Variveis tais como Turma (A ou B), Sexo (feminino ou masculino) e Fuma (sim ou no) so variveis qualitativas nominais. Por outro lndo, variveis como Tamanho (pequeno, mdio ou grande), Classe Social (baixa, rndia ou alta) so variveis qualitativas ordinais. Variveis quantitativas, isto , variveis de natureza numrica, podem ser subdivididas em discretas e contnuas. A grosso modo, variveis quantitativas discretas podem ser vistas como resultantes de contagens, assumindo assim, em geral, valores inteiros. De uma maneira mais formal, o conjunto dos valores assumidos finito ou enumervel. J as variveis quantitativas contnuas assumem valores em intervalos dos nmeros reais e, geralmente, so provenientes de uma mensurao. Por exemplo, Nmero de Irmos (0, I,2, ...) e Nmero de Def'eitos (0, 1,2,.,.) so discretas, enquanto que Peso e Altura so quantitativas
contnufls.
1.AF 2AF 3AM 4AM 5AF 6AM 7\F BAF 9F IOAF 11 F 12 A F 13 A F T4AM 15AF 16AF LTAF 1g M 19 A F 30 A F 11 A F 22F 33 F 24AF 25 A F B6 A 3'/ B F 3E B F 39 B F 30 E F 31 B F 3 E M 3 B F 34 ll F 1E li M 16 t! Ir 1't 11 M t1 M 19 11 4r.) B M 41 t] F 4 Fr F' 41 HM 44DF 4F F F 4 E TI 478Iil 4E H F S H M h0 11 M
F.
1,'
1,7
18
1,8
19
19
20 l-8
t_8
T7
l-8
18
a1
I9
18
t-9 L7
1"8
20
l_8
2L 18
L8
20
L9
)^
z3
18
18 25 18 17
T7
L7
J.
18 77 2L
10
1A
L7 23 24 L8 18
L9 19
18
t7
1B
60,0 1,60 58.0 L,64 41,0 L,62 57,8 t,64 58,0 r,72 70,0 L,66 54,0 L,70 58,0 1, 78 68, 5 1,65 63,5 7,63 47 ,4 1.,82 66 ,0 1-,80 85,2 1,,60 54,5 L,68 52,5 1.,70 60,0 1,65 58,5 1,57 49 ,2 L,55 48,0 1.,69 57,6 L,54 51,0 L,62 63 ,0 L,62 52,0 L,57 49,0 t,65 59,0 t,6L 52,0 L,71. 73 ,0 t,65 56,0 r,67 58,0 1",73 87,0 r,60 47,0 1,70 95,0 L,85 84,0 1,70 60,0 1,73 '73 ,0 1,70 55,0 1,45 44,0 I,76 75,0 1,68 55,0 1,55 49,0 1,70 50,0 1,5s 54,5 r., 60 50, 0 L,8o 71,o 1,83 86,0
2 1 2 2 l3 1
3-
NAO
NAO
NAO NAO
NAO NAO NAO NAO NAO NAO NAO
SIM I SIM I
P M P P M M P M M M M
0101 52 52
a1
81.6R B7R M1.5R B20R B5R B7R MlOR M1-2R MlOR B8N BOR M 30 M2N BlOR B18R BlON BlOR B5R B14M B5R B5R BlOR M 28 M4N B5R M5R MlOR BL2R M2R M6N B 20 BL4R BlOR B25B M14R M12N B],OR BT2R B2R BlOB B 25 M1.4N B8R MlOR B8R B3R B5R M1.4R M 20
13 Z
.b{
3 2
L
3 2
ll3 2
3 2 1 1 1 2 2 2
NAO
NAO NAO NAO NAO NAO
SfM I SIM T
M P M
NAO I
1
2
P P
M
4
1-
L 3 L
NAO NAO
NAO NAO NAO NAO NAO
t
1 1 1 1 1 2 2 1 1
NAO P NAO M NAO f NAO M NAO NAO NAO NAO NAO NAO
SIM
P P M M M P P
T
NAO I
P
M
7
2
I
1 L
NAO
M M P P P
Captulo
I:
Resumimos a classificao das variveis no esquema apresentado na Figura I.2 (attulo de exerccio, tente classificar todas as variveis da Tabela 1.1).
Apesar de conter muita informao, a tabela de dados brutos pode nO Sef prtica pu.u r"rpondermos s questes de interesse. Por exemplo, da Tabela 1'1
rriro Nominal
l'umantes. Porlanto, a partir da tabela de dados brutos, vamos construir UmO nOvtl
'
Varivel
-.ordinal
-a"Qualitativa
'Quantitativ u
1--""-Discreta
.-,contnua
liSura
Vale ressaltar que, em muitas situaes prticas, a classificao depende de certas particularidades. Por exemplo, a varivel ldade, medida em nmero de anOS, pode ser vista como discreta, entretanto, Se levarmos em conta os dias, no absurdo falar que a idade 2,5 ou 2,85 anos, dando assim respaldo para classificla como contnua. Por outro lado, dependendo da preciso do instrumento utilizado para se obter medidas em um objeto, podemos ter limitaes no nmero cle casas decimais e uma varivel de mensurao pode se "tornar" discreta. E importante salientar que a classificao apresentada acima se refere natureza da varivel e, em geral, devemos utilizar o bom senso na hora de decidir qual procedimento adotar para caracterizar uma varivel. Para salientar tal fato, menciOnamos que podemos, inclusive, discretizar uma varivel contnua para obter uma melhor representao da ocorrncia de seus valores no conjunto de
dirclos.
t1$ela com as informaes resumidas, para cada varivel. Essa tabela Sefd clenominada de tabela de freqncia e, como o nome indica, conter os valOfeg dA virrivel e suas respectivas contagens, as quais so denominadas freqnelAEq ttbsolutas ou simplesmente, freqncias. No caso de variveis qualitativas OU tprantitativas discretas, a tabela de freqncia consiste em listar os valorog possveis da varivel, numricos ou no e fazer a contagem na tabela de dadOg lrrutos do nmero de suas ocorrncias. Representaremos por n; a freqncia dq vulor i e por ?? a freqncia total. Para efeito de comparao com outros grupOS ou conjunos de dadoi, ser conveniente acrescentarmos uma coluna na tabela de l.oqncia contendo o clculo da freqncia relativa, definida por fi = U/t\:, Convm notar que, quando estivermos comparando dois grupos com relaO S freqiincias de ocorrncia dos valores de uma dada varivel, grupos cgm Um nmero total de dados maior tendem a ter maiores freqncias de ocorrncia dos vtlores da varivel. Desta forma, o uso da freqncia relativa vem resolver Bte
problema.
p0rtir
Sexo
.t
F M total
13
0,74 0,26
1
n:50
Outro ponto que pode trazer confuso que, muitas vezes, na utilizao Cle programas computacionais, associamos cdigos numricos a uma varivel qqalitativa. Por exemplo na Tabela 1.1, pode-se associar ao sexo feminino o valor I e ao masculino 2. Apesar da varivel ser representada por valores numricos, issO no a torna uma varivel quantitativa. Novamente, vemos que a natureza da vnrivel deve sempre ser levada em conta na hora de se interpretar resultados obtidos na anlise descritiva.
Note que, para variveis cujos valores possuem ordenao n0tufel (eluglitltivas ordinais e quantitativas em geral), faz sentido incluirmos tambm urttrt coluna contendo asJreqncias acumuladas r,,'' Afreqncia acumulada at&
un1 cefto valor obtida pela soma das freqncias de todos os valores da varivel, tncnorcs ou iguais ao vator considerado. Sua utilidade principal ajudor o
estu$eleccr pontos de corte com uma determinada freqncia nos valores da vurivel. Poi exemplo, na Tabela t .3, observamos que 907o dos alunos tm idadcs rrt 2l unos, cle fato 22, um vez que este valor tem 'reqiincia zero.
l0
L2 Organizao
de Dados
il
de
.ft
.f o"
40,01-- 50,0
50,0 60,0 70,0 80,0 90,0
lt. 0,16
fo"
0,16 0,60 0,76
0,BB
9 22
I
0,18 0,44
0,18
0,62 0,76
F
l--
22 8
6 5
1
0,44
0,16 0,L2 0,10
0',02
1
0,L4
0,08 0,06
0
20 2L 22 t ZJ 24 25
4
.1
0,84
0,90 0,90 0,94 0,96
1,00
F F
t--
0,98 1,00
0
2
1
total
n:50
total
50
cliscreta, mas
Com relao varivel Peso, lembremos que foi classificada como quantitativa contnua e assim, teoricamente, seus valores podem ser qualquer nmero real num certo intervalo. Aqui os valores variam entre 44,0 e 95,0 kg e foram medidos com apenas uma casa decimal. Ainda assim, existe um grande nmero de valores diferentes de modo que, se a tabela de freqncia fosse feita nos mesmos moldes dos casos anteriores, obteramos praticamente os valores originais da tabela de dados brutos. A alternativa que vamos adotar consiste em construir classes ou faixas de valores e contar o nmero de ocorrncias em cada laixa. Para a varivel Peso, usamos faixas de amplitude 10, iniciando em 40 kg. Na Tabela 1.4, escolhemos incluir o extremo inferior e excluir o superior. Dessa I'orma, a freqncia da faixa 40,0 F 50,0 no incluiu os alunos 46 e 48 que tinham peso igual a 50,0 kg. A opo de qual extremo incluir pode ser arbitrtria, n"os o importante indicar claramente quais so os valores que esto sendo conterdos em cada faixa. Apesar de no adotarmos nenhuma regra formal quanto ao total de faixas, utilizarnos, em geral, de 5 a 8 faixas com mesma amplitude. Entretanto, ressaltamos que faixas de tamanho desigual podem ser convenientes para
representar valores nas extremidades da tabela.
Vamos estudar, agora, a situao em que a varivel por natureza o conjunto de possveis valores muito grande. Por exemplo, a vflrivel TV, definida como o nmero de horas assistindo televiso, tem valores inteiros entre 0 e 30 e uma tabela representando seus valores e respectivas
ieqncias seria muito extensa e pouco prtica. O caminho adequado, nesse caso, trotar a varivel como se fosse contnua e criar faixas para representar seus vulores. Assim, passamos a tratar como contnua uma varivel que seria, originnlmente, classificada como discreta. Tabela 1.5: Tabela
de
TV
ni
L4
12
18
.ft
61218 t-
0F-6
24
fu"
0,28 0,62 0,84 0,92 1,00
t7
11
4 4 50
24l---136 total
--- qFFF
TF
1,2 Organtzao de Dados
t)
Cttpftulrt
l;
de atividades e desempenho. Graas proliferao de recufsos grficos, cuja Cnstruo tem sido cada vez mais simplificada em programas computacionais,
cxiste hoje uma infinidade de tipos de grficos que podem ser utilizados' Como ilustra deste ponto, apresentamos na Figura 1.3 alguns grficos publicados em
rrgos de imprensa.
ocorrer em qualque e,"7: pr-requisitos indispensveis divulgao tica e criterira de dados devem ser
p,id.*
inegocirveis.
CIDIO
RU|AT
pizza, barras t vamos definir trs tipos bsicos de grficos: disco ou pode sef grfica na apresentao li$t(,t4ruma. como dissemos, a criatividade de vrios' entre os grficos que discutiremos sintetizam trs caminhos,
circular,
se adapta muito
circularescorrespondentessporcentagensdecadlvalor,calculadas freqncia
exemplo, O,20 de rnnltiplicando-se por 100 a freqnca relativ f6.Por a207o o- u"' que 100 x 0'20:20' AFigura 1'4 apresenta relativa "o.r"rpond" da Tabela 1.1. Note que o cliagrama de disco para avarivel Tol-er, obljd^a.a .nartir fntiir correspondent categoria "indiferente" foi destacada.
'
LLiPLTO
8,9
12,
No
D[
C0NTRATCS
RECURSOS HUMANOS
DrsTRrBUrO POR ruvrL HtrnRRSUtCO
RECURSOS HUN/ANOS
DISIRISUO POR ESCOLARiDADE
ls I t e=
' ,=
TSCR
=== == ==Gou == ==
2
CAIMS
23,891
l. Gor ==
SuPeior
ogrficodebarrasut\|\zaoplanocartesianocomosvaloresdavarivel eixo das ordenadas' no eixo das abiissas e as freqnciai ou porcentagens no barra com altuf8 Note que pIia cada valor a varivel desenha-se uma de grfico se adapta ,nrr"rptnd"rrdo sua freqncia ou porcentagem. Esse tipo
rnelhoi s variveis discretas ou qualitativas ordinais'
t4
Captulo
l:
t5
em cada faixa so homogeneamente distribudas, para um mesmo retngulo, fatias de mesmo tamanho contm uma mesma porcentagem de observaes. Apesar do suposio de homogeneidade no ser sempre verificada, ela bastante razovol em muitas situaes e pode ser uma boa aproximao da realidade.
25
20 .g
\r
c o
L
e15
E
$ru'
t;
10
18 le 20
,1" Fgura 1.5: Grftco de barras para a varvel ldade.
O histograma consiste em retngulos contguos com base nas faixas de valores da varivel e com rea igual freqncia relativa da respectiva faixa. Dessa forma, a altura de cada retngulo denominada densidade de freqncia oa simplesmente densidade definida pelo quociente da reapela amplitude da faixa.
Para a varivel peso, as densidades de cada faixa podem ser obtidas dividindo-se a
40x
/-'t'
100
da Tabela 1.4 por 10, que a amplitude de cada faixa. O histograma correspondente a essa varivel apresentado na Figura 1.6. Note que inclumos, no topo de cada retngulo, a porcentagem de observaes correspondente, para ftci I itar a interpretao. importante ressaltar que alguns autores utilizam a freqncia absoluta porcentagem na construo do histograma. Preferimos o uso da densidade de ou 'eqncia, pois ela faz om que o histograma no fique distorcido, quando amplitudes diferentes so utilizadas nas faixas. Uma outra vantagem diz respeito relao entre histograma e grfico da funo densidade de probabilidade, que ser visto mais adiante. O histograma tambm pode ser utilizado no clculo da mediana (mdor,), que o valor da varivel que divide o conjunto de dados ordenados em dois subgrupos de mesmo tamanho, Isto , das observaes ordenadas, 507o esto abaixo e 507o esto acima da mediana. Assumindo que as observaes da varivel
coluna
fi
Exemplo 1.1.' Vamos calcular a mediana da varivel Peso atravs do histogram, Inicialmente identificamos o retngulo que deve conter a mediana. Uma simplos soma das reas resulta que a mediana pertence ao intervalo [50,0; 60,0), uma vsz eluc at o valor 60,0 temos acumuladas 607o das observaes. Dentro dessa faixa, precisamos determinar um retngulo com rea igual a 34Vo, que o que falta para rringir o valor 50Vo. A situao ilustrada na figura a seguir, cujo retngulo
procurado est marcado com rea mais escura. Com uso de propores, estabelecemos a seguinte igualdade:
mdor,,
- 50 _ 0,34
60
- 50 lo
0,44
f;,li4 .,t. r
),
rtlt
,lr,
-,-' ,I''
"r'qr
t6 Captulo 1: Introduo AnIise Exploratria de Dados
1.2 Organizao de Dados
I7
q)
E p
a
0,05
(D
o,o+
6r,'6 : C,t\
.,,'60'--'^
''
0,03
',r"r''",'4'
o,o2
0,01
0,0 50
mdot,
60 Peso
Qt
: 57,73kg.
tr
l)c
69,38
kg.
tr
4' O conceito de mediana, que ser considerado ern detalhes no Captulo em dividido dados pode ser generalizado para situaes em que o conjunto de o mais do q:ue dois subgrupos' Um caso importante aquele -em que dividimos conjunto em quatro iubg*pot. Para tanto, deveremos determinar' alm da de rn"iunu, dois valores tais qu 25Vo das observaes ordenadas estaro abaixo denominados' so um deles e 75Vo estaro abaixo do outro' Tais valores
respectivamente, primeiro quartil e terceiro quartil, Usualmente representados poi 8r e Q3. Note que a mediana, discutida anteriormerrte, representa o segundo clculo os valores dos quartis tambm pode ser feito atravs do
q""rii. O
Exemplo 1.2; No Exemplo 1.1, o valor da mediana (segUndo quartil) calculado atrav do histogram u, 57,73 kg. De forma semelhante, vemos que o valor do primeiro quartii tambm se encontra no intervalo [50,0; 60,0)' isto ' correrpondr ao valor 8r que determinar uma tea de 9Vo no retngulo correspondente. Assim, temos (ver figura a seguir)
Q^=
Para o clculo de quartis e medianas usando a tabela de dados brutos, prccisamos ordenar as observaes e escolher os valores que dividem os dados nits propores desejadas. Eventualmente, ser necessrio tomar mdias de vulores vizinhos. No caso de tabelas de freqncias, os dadosj esto ordenado ru procedimento similar. Uma representao grfica envolvendo os quartis o box-plot Definimoa, ul'nn "caixa" com o nvel superior dado pelo terceiro quartil e o nvel inferior pelo plirneiro quartil. A mediana representada por um trao no interior da caixa o segllcntos de reta so colocados da caixa at os valores mximo e mnimo, que rrlo scjam observaes discrepantes (o critrio para decidir se uma observao tliscrcpante no ser discutido aqui, mas, em geral, envolve a diferena entre o tercciro e o primeiro quartis)- O prximo exemplo ilustra a construo do box-plot pnrt uma varivel quantitativa discreta utilizando-se os dados brutos.
Ilwtttplo
: =-!o 0,09
*=
0,44 '
lo + Qt:52,,05kg'
1.3.' Suponha que um produtor de laranjas costuma guardar as frutns cm cuixus c estr interessado em estudar o nmero de laranjas por caixa. Aps um dia rle colhcita, 20 caixas foram contadas. Os resultados brutos, aps a ordenno, silo: 22, 29, 33, 35, 35, 37, 38, 43, 43, 44y 48, 48, 52, 53, 55, 57, 61, 62, 67 e 69, lrrrr osses dados, temos qe md,,6, ilfOo+ 11s) l2 : (44+48) 12 = 46, Annlogarnente, obtemos Qr : 36 e Qs :56. Tambm observamos que o nmero
r(-
\,i',,
511,,\
''i
r(.
18
l,.l ()rganizao
de Dados
t9
Grficos tipo box-plol tambm so teis para detectar, descritivamentc, rliirl'crras nos comportamentos de grupos de variveis. Por exemplo, poclemos tturrsitlornr grficos da varivel Peso para cada sexo. O resultado apresentado nn l'jigrrlir 1,9, em que podemos notar que os homens apresentam peso mediano atrllet'iur ito das mulheres, alm de uma maior variabilidade'
60
100
90
3so e
E
J
80
o
40
En
I
60
30
50
I
40
20
Sexo
Peso
A representao gr,fica
llxerr'clos
tll
Sco 1.2:
cacla uma das variveis abaixo em qualitativa (nominal
Figura
dos os"quartis a mesma), o mesmo podendo ser observdo a respeito da distncia Figura pono, de mnimo e mximo em relao mediana. Em contraste, temos na i.A o box-ptot paraa varivel Peso, que apresenta uma pecluena assimetria.
l, tlllssil'ique
/ ordinal) ott
'100
90 80
3to L
60 50
$. Ocorrlrcia de hipertenso pr-natal em grvidas com mais de 35 anos (stl i ,,r tttrttlrtsf,opossveisrespostasparaestavarivel). l' ", t;t/titt( h, Inlelriio clo voto para presidente (possveis respdstas so os nomes dos ( ctttttlitlitrtts,almde no sei).''',,,t11 )1' t t'r, " C. l,r't'rh rlc pcso de maratonistas n Corrida de So Silvestre, em quilos. 'tl,\tt, 1'l maratonistas na Corrida de So Silvcstre rl, lrrlr.rrsirlnrlc clt perda de peso -" de ( l1 't.\ l;rtJ' (lt'Ve, tttoclCrilCla, fOrte). ' 1t r/ / , (lrrrrr rle satis'airo cla populao brasileira com relaro ao trabalho cle seu presirlerrte (vnlores de 0 a 5, com 0 indicando totalmente insatis'eito e 5 lrtlttltnettlc satisl'eito). i,,t tt! t (l' r/lr'l I , ,,1,','
'
,
40
l,
{Jrrirrzt pncientcs clc unra lrrica de ortopcdia foram entrevistados qunto ito nrnrr'r'r rk: r'ttcscs prcvistos cle I'isiotcrapin, se haver (S) ou niro (N) secltlelus
'.qt
20 Captulo
I:
2t
aps o tratamento e o grau de complexidade da cirurgia realizada: alto (A), mdio (M) ou baixo (B). Os dados so apresentados na tabela abaixo:
Pacientes 2
7 8
S 3 5
amostr
foi
6
5
S
7 7
9 6
10 8
S
ll
6
S ts
t2
5
l3
5
S
I4
4 N
I 5
Fisioterapia
Seqelas
Cirurgia
s A
.N: ,N) A M
N M
N'
B
rN
ts
N)
ni
10
(,1,
a. Classifique cada uma das variveis. b. Para cadavarivel, construa a tabela de freqncia e faa uma representao
<60 60F70
TOFBO
34
109
111
grlica. Para o grupo de pacientes que no ficaram com seqelas, faa um grfico de c. barras para a varivel Fisioterapia. Voc acha que essa varivel se comporta
de modo diferente nesse grupo?
BOF90
>90
total
55
319
nas
3.
20
nt lt
10,7
8,5
1,5
5,0
412
3,1
)) - )315
regi0,
8;2
10,0
4,7
6,5
8,9
histogramas apresentados em
(b), obtenha as
medidas
necessrias e construa o box-plot, um para cada regio. Com base nessa representao grfica, rediscuta o item (a).
e o 3e quartil.
a
4. Um grupo de
Foi mencionado anteriormente que o desenvolvimento da indstrirr de computadores deu grande impulso ao uso da Estatstica. Vrios progrumes
computacionais de uso comum contm rotinas estatsticas incorporadas s suas das planilhas eletrnicas, usualmente pi-instaladas em computadores novos. Programas especificamente desenvolvidos para efetuar anlises estatsticas so conhecidos como pacotes estatsticos. Existe um nmero considervel desses pacotes, alguns voltados para anlises mais comuns na dretl de humanidades, outros para a rea de biomdicas; alguns so extremamente simples de se utilizar atravs de menus, outros pressupem conhecimento de uma linguagem de programao especfica. Qualquer que seja o programa a ser utilizado, trs so as etapas que envolvem seu uso:
funes bsicas. o caso
0F-2
[a ,.r'
2+4
28 27
11 4
4-6
6FB 8F10
a. Construa o histograma.
b. Se a nota
5, qual
ser
porcentagem de
A Entrada de Dados deve assumir certas convenes. Apesar de certos programas terem rotinas desenvolvidas de forma a simplificar a criao do banco
22
1.4 Exerccios
23
de dados, intrinsecamente o que se tem a criao de uma matriz, em que cada linha corresponde a uma unidade experimental e cada coluna a uma varivel. Por unidade experimental, entende-se o elemento da populao ou amostra no qual observaremos as variveis. Por exemplo, na Tabela 1.1,
1".4
Exerccios
observamos 50 unidades experimentais, os estudantes, nos quais foram observadas 14 variveis. Assim, os dados podem ser representados por uma matriz com dimenso 50 por 14. Leitores familiares com planilhas eletrnicas no tero problema em visualizar esta situao. Assim, quando estudamos uma nica varivel, consideramos a coluna correspondente. Se estamos interessados em saber o comportamento desta varivel em dois grupos diferentes (como na Figura 1.9), precisamos estudar os valores da coluna em que ela se encontra, conjuntamente com a coluna que contm a informao dos grupos' A fase da execuo da anlise estatstica pressupe o conhecimento de como o programa que est sendo utilizado trabalha as informaes. Torna-se, assim, importante se ter acesso ao manual do programa' Aps as informaes terem sido trabalhadas, vem a fase da interpretao dos resultados obtidos. Nesta hora, aconselhvel consultar o manual sempre que houver dvida, se o que foi calculado relaciona-se, de fato, anlise estatstica desejada. Ao interpretar as caractersticas observadas, importante verificar se resultados absurdos no esto ocorrendo. Em caso positivo, releia o manual e certifique-se de ter executado a anlise correta para os dados em questo. Em muitos casos, a fase de interpretao a mais difcil e interessante, pois envolve o equacionamento das caractersticas apresentadas na anlise com vistas a responder as questes inicialmente colocadas'
Exerccios da Seo 1.3:
a. Suponha duas amostras colhidas de uma mesma populao, sendo uma de tamanho 100 e outra de tamanho 200. Ento, a amostra de tamanho maior
b. Duas variveis diferentes podem apresentar histogramas idnticos' I c. Duas variveis combox-plol iguais no podem ter valores diferentes' Fj
mais representativa da populao. F
2.
Suponha que duas empresas desejam empreg-lo e aps considerar s uuntug"n. de cada uma, voc vai escher aqoel que lhe pgar melhor' Aps certa pesquisa, voc consegue a distribuio de salrio das errpresas, dadas segundo os grficos abaixo.
Empesa A Empresa B
5101520253035404550
Slrios Mnimos
Com base nas informaes de cada grfico, qual seria sua deciso?
l.
Utilizando alguma planilha eletrnica ou pacote estatstico disponvel e com as informaes da Tabela 1.1, construa um banco de dados para os 20 indivduos iniciais e as 4 primeiras colunas. Imprima e confira os valores digitados.
indagou sobre os diferentes tipos usados nas suas locomoes dirias. Dentre nibus, metro e trem, o nmero de diferentes meios de transporte utilizados foi
2. Considerando o banco de dados criado no Exerccio 1 desta seo, construa histogramas para as quatro variveis e, baseado no grfico, descreva os seus
comportamentos.
desta seo, divida a idade em trs categorias (menores de 18 anos, idade entre 18 e 21 inclusive, e maiores de 2l anos). Construa grficos de barra para essa varivel, incluindo toclos os indivduos e um para cada sexo. Interprete os resultados obtidos.
4. A idade dos 20 ingressantes num certo ano no curso de ps-graduao em jornalismo de uma universidade foi o seguinte: 22,22,22,22,23,23,24,24,
24, 24, 25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.
24
Captulo
l:
I -l li rrt t:cios
2.\
rl, l{cpita o item (c) para a varivel Salrio. r,. (lonsiderando apenas os funcionrios com mais de trs anos clc clsn,
tlcscreva o comportamento da varivel Salrio.
b.
Idades atpicas parecem ter ocorrido nesse ano. Aps sua retirada do conjunto de dados, refaa o item (a). Comente as diferenas encontradas.
Um novo medicamento para cicatrizao est sendo testado e um experimento feito para estudar o tempo (em dias) de completo fechamento em cortes provenientes de cirurgia. Uma amostra em trinta cobaias forneceu os valores: 15,17,16, 15, \7, 14,17, 16, 16,17,15, 18, 14,17, 15, 14,15,16,17, 18, 18, 17, 15, 16, 14,18, 18, 16, 15 e 14. a. Organize uma tabela de freqncia. b. Que porcentagem das observaes esto abaixo de 16 dias? c. Classifique como rpida as cicatrizaes iguais ou inferiores a 15 dias e
ll. I lrrr gnrpo de pedagogos estuda a influncia da troca de escolas no descntpcttlto tlt. llrrnos do ensino fundamental. Como parte do levantamento realizndo, lri nrotiulo o rrmero de escolas cursadas pelos alunos participantes do estttclo.
Escolas Cursadas
1
freqncia
46 57
2T 15 4
2
.)
4 5
ru.
as
6.
O Posto de Sade de um certo bairro mantm um arquivo com o nmero de crianas nas famlias que se utilizam do Posto. Os dados so os seguintes: 3, 4, 3, 4, 5, r, 6, 3, 4, 5, 3, 4, 3, 3, 4, 3, 5,5, 5, 5, 6, ll, r0, 2, l, 2, 3, r, 5 e 2.
a. Organize uma tabela de freqncia. b. Faa uma representao grfica. c. Voc identifica valores nruito discrepantes? Que fazer com eles?
rr.
(.)rlrl a porcentagem dos alunos que cursaram mais de uma escola? Ir- ('onstrua o grrfico de barras. c. ('lirssil'i11r.rc os alunos em dois grupos segundo a rotatividade: a/c pnt'u itlulos cclur rnais de 2 escolas e baixa para os demais. Obtenha a titbclit tlc lr'r;iincin dcssa varivel.
Alrrrros tlir Escola cle Educao Fsica foram submetidos a urn lcslc rkr rr.sistrrciir rpranto ao nmero de quilmetros que conseguiram corrcr sert
( lrrrrirr'. )s clirclos cstiro apresentados a seguir. (-)rr;rl rr. ir vtriiivcl em estudo?
Curso (completo)
Idade
o
Salrio (R$)
1100,00 1450,00 960,00 960,00 600,00 600,00 600,00
Anos de Empresa
5 8 6 8
2 5 2
J
supenor superior
mdio mdio mdio mdio
43
31
dl
0t-4
4FB 8F12
12
4
5
24
25 27 22
206
125 22
6 1
8
mdio mdio
fundamental fundamental
F I6
F 20
9
10
2l
26
I6
I0.
a. Classifique cada uma das variveis. b. Faa uma representao grfica para
lltrrrPo t[r rrtiliziriio rlc citixus clctrnicos clcpcrrclc dc cada usurio c rlits tl lrrrirr's r'lctrrirtlirs. liorarn colctadas 2(l rncclidas dcssc tcmpo (crn rnirtutos):
varirvel Curso.
l,t
I ,:t
1,2
1,7
l,i
I ,l'r
0,)
1,2
,:
t.4
.(i
l.('
,,1
1,2
I,0
0,)
lr7 l,g
1,0
1,0
0,8
I
I ,l-r
1,7
[,5
,ll
l-"r
26
Captulo
I:
I .l l';rtx:cios
,.J
a. Organize uma tabela defreqncia sem agrupar os dados. b. Agrupe os dados em faixas de tamanho 0,2 a pattit de 0,8 e obtenha uma
nova tabela de freqncia. c. Compare as tabelas obtidas em (a) e (b). Comente as diferenas' d. Se ao invs de 26 medidas tivssemos 1000, qual procedimento, dentre agrupar ou no, voc utilizaria? 11. Vinte e uma pacientes de uma clnica mdica tiveram o seu nvel de potssio no plasma medido. Os resultados foram os seguintes:
6,1
/t
612
617
615 714
6,9
712
7r7
7r5 7r5
7,7
716
8,3
716
8,1 7,4
714
t
7,6
716
7r7
7r5
7,6 7,4
714 714
8,1
714
7,9
7r5
7,8
7,5
freqncia
1 t J
marcados no ltimo campeonato daFederao Paulistl tle participantes nos seus 38 jogos uma varivel conl os pelos 20 clubes liutclxrl :;r'1it r i tttcs velores:
2,95
2 4 5 6
Clube
Gols
,
at td
6 57
16
7
dt
I
35
19
10
32
11
42
72
35
79
15 6B
52
25 20 53
Clube
Gols
13
t4
4L
17 74
IB
29
55
70
42
66
47
b. Determine os 1e, 2e e 3e quartis. c. Qual a porcentagem dos valores que esto acima do nvel 3? 12. Foram feitas medidas em operrios da construo civil a respeito da taxa de hemoglobina no sangue (em gramas/cm3):
11,1 11,3 13,5 L2,2
LL,7
12,6 L2,3
12,5 73,4
II,7
L2,7
12,3 L3,2
16,3
74,4
13,5
13,0 L5,2
!2,7
15,8 L3,7
12,6 L4,7
L4,1
acha razovel construir uma tnbclit tle l'r'ct;iincia de atcordo com a classificao dada? Ir. ('orrslnrt unra tirbela de freqncia agrupando as observaes em intcrvillos rlt, t:ornprirnento l0 a partir de 20 (no esquea de indicar clarnclto os irrlt't'vit los). r'. ( )lrtt'rrhir o histogranta. rt. (.)rrr lrorccntagent dos clubes mrcaram mais de 38 gols?
l, A t;rlrclir ir soguir
ar,
a. Organize os dados em faixas de tamanho 1 a partir do 1 1. b. Construa o histograma. c. Determine o terceiro quartil e a mediana. d. Taxas abaixo de 12 ou acima de 16 so consideradas alteradas e requerem
apresenta as freqtincias relativzts de ocorrncias de lrixns tle illluut (r.n cnt) para uma imostra de 100 criins de l2 anos de icladc.
('orrslt'ttit o histograma.
<t
lr, ( )lrlcrrhrr
lxtx-plo.
r'. I )r'st'ilrnclo-so sopirral' os l5o/o mis eltos, qual seria o ponto de cortc'/
acompanhamento mdico. Obtenha a tabela de freqncia Acompanhamento Mdico com duas opes sim ou no.
da varivel
L3. O valor mdio de comercializao da saca de milho de 60 cluilos nir Bols:t clc Cereais apresentado abaixo, em reais, para ltimos 40 meses.
28
Captulo
l:
I 'l l',ttn'cios
29
Faixas
Ganho
freqncia
45 83 52
15
O ndice de germinao um dos principais fatores para definir a qualidade das sementes, Ele determinado em experimento cientfico conduzido pelo fabricante e regulamentado pelo rgos fiscalizadores. Um fabricante afirma que o ndice de germinao de suas sementes de milho de 85Vo. Para verificar tal afirmao, uma cooperativa de agricultores sorteou 100 amostras com 100 sementes em cada uma e anotou a porcentagem de germinao em cada
amostra. Germinao (Vo)
F 2,0 2,0 F 3,0 3,0 F 4,0 4,0 F 5,0 5,0 F 6,0 6,0 F 7,0
1,0
tH. Nrrrrr cstudo sobre rotatividade de mo-de-obra na indstria, anotou-sc o nunr(rro de empregos nos ltimos 3 anos para operrios especializados e nfro
tspt'r'iir Iizados.
it
porc:cntagem no eixo das ordenadas. b. ,lrrrrto as inormaes das duas tabelas em uma s e obtenha um diagratnn tle
freqncia
B
it
60F75 75F80
BOFBS
20 42 18 10
2
rrslil'it1uc.
85F90 90F95
95
No Especializados ,; Iirnprcgos
izados
Empregos
1
TLi
I
2
106 222
2lo
342
109
F 100
2
J
338
a. Faa uma representao grfica da tabela acima. b. Construa o box-plot. c. Comente a afirmao do fabricante. 17. Uma nova rao foi fornecida a sunos recm desmamados e deseja-se avaliar sua eficincia. A rao tradicional dava um ganho de peso ao redor de 3,5 kg em um ms. A seguir, apresentamos os dados referentes ao ganho, em quilos, para essa nova rao, aplicada durante um ms em 200 animais nas condies acima. a. Construa o histograma. b. Determine o 1e, 2e e3e quartis. c. Voc acha que a nova rao mais eficiente que a tradicional? Justifique.
4
lr
292 164
4 5
9l
35 787
totitl
7I22
total
19, ('orrrtl ;lrltc do uurn avaliairo rndica em uma certa universidade, fbi rneclirln n lrr'r1irrciir cirrditca clos alunos do primeiro ano. Os dados so rprcscrttaclos
elrt:ir'1',ttirlit.
it. ( )lrtrrrlrir o histograrna. ll, lirctl(lrrciirs cnrclacls quc cstc.ianr rbaixo de 62 ou ercima de 92 rccluercrn irlrrrrrpirnlrirrrrcrrto rnclico, Quirl n porcentigem de alunos rcssits
r ltttliotrs'/ llrrur r', 'cr1lrrcil iur rcclor clc 72 baticlas por nrinuto considerada paclrio,
Vor't' irt'lrir rprc dc nroclo gcral csscs alruros sc cncaixaln ncssc caso'
.to
Captulo
I:
I J I t,'ttt'irts
3t
Freqncia Cardaca
freqncia
11
Slt'
60F65 65F70
70
35 68 20
L2 10
1
cada bateria por 207o acima do preo de custo, em l(XX) baterias fabricadas, descontadas as que repe, quanto ser seu lucro pol birtcria em funo do preo de custo?
o rbricante vende
t-
75
Durabilidade
freqncia relativa
0,02 0,05 0,15 0,25 0,30 0,23
100
20. Um exame vestibular para uma faculdade tem 80 questes, sendo 40 de portugus e 4O de matemtica. Para os 20 melhores classificados,
apresentamos o nmero de acertos em cada disciplina, em ordem decrescente do total de pontos. a. Organize uma tabela de freqncia para cadavarivel. b. Faa uma representao grfica das tabelas obtidas em (a). c. Construa a tabela de freqncia da varivel total de pontos. d. Comente sobre a afirmao: os aprovados so melhores em portugus do que em matemtica. aluno Portugus
1
It,
lfr.st. jir-sc comparar trs tcnicas cirgicas pata a extrao de dente de siso, ('itrlir trrttir clas tcnicas foi aplicada em 20 pacientes e os resultados sio
apt r'st'rrtirrlus a seguir.
10
I '8. E
c)
.qo !t
o.
2 35 29
4
32 28
T4
5 31
6 30 26
T6
10
35
31
11
Matemtica aluno
Portugus
34 27
26 30
26 28
18
24 25
23 23
s6
&
c)
t--"
o d)
a,
28
15
F
rr
Es
4
t2
L2
t.\ z
t3
11
t7
L4
I9
B
20
10 20
*r, lirrr
23
27
20 20
17 27
T2
20
13
Matemtica
31
25
20
23
Tcnica cirrgica
21. Vinte baterias para automveis de uma certa marca foram testadas quanto sua vida til. O teste simula autilizao da bateria, acelerando seu desgaste de rnodo a criar uma rplica da situao real. Os resultados da durabilidade (em
mcses) so apresentados a seguir: a. Construa o histograma.
b. Se
er
tttlrtvttltt ittlerqltdrtil. , dcl'inido colno e dil'erena entre o tcrccirc c irtrt'iro rlttiulis, Cllculc scu valor para cerda uma das tcnicers e comentc. 1rr .:. llir('ulit rr vlrrilrllilidlrclc do tcnpo dc rccupcrao ern cada tcnica.
ri. ,'jt,
r
b,ll
a amostra acima for considerada representativa do desempenho desszr rirce de bateria, quantas, em 1000 fabricadas, sero repostas pelo
cscolhcria'l
3, tllr*. o
corrrPrrlirtlor') Os cllclos a scguir representam indivduos que btlrrr {r!rl'urinrr(krs llr,tlo vcrclo clc um ccrto tipo clc inseto e submcticlos ir Irrllrlrr'nl() (tr's rliI'crcnlos Iipos). As virriiivcis so:
-t2
Captulo
l:
,-t l','rrn'r:ios
33
No.: nmero associado aos pacientes; Idade: idade do paciente no momento de admisso' em anos;
apresentados.
:
contato com
inseto
administrao
do tratamento
recuperao; Tratam: tipo do tratamento administrado; Coag: presena de cogulos no momento de admisso.
Pac.No.
T9
lirsoando-se nesta planilha: l. Cltssifique cada uma das variveis. ll. Construa uma tabela de freqncia (atravs do computador) para a virivel Diag. Utilize 5 classes. lll. Atravs de representao grfica adequada, compare os trs tratametos
corn relao idade dos pacientes. Voc diria que a idade se distribui
Itotttogeneamente nos trs tratamentos?
lv. l{cpita o item (iii) para a varivel Coag. b, Strltctrrha, que ao invs de trabalhar corn a varivel ldade, cria-se uma novl vurirvcl denominada Etrio, assumindo valor 0 se Idade for menor que 29 rlnos c I caso contrrio. Utilizando o computador: l. lixplique como voc poderia criar tal varivel. ll, Construa um box-plot para a varivel Recup, para cada grupo de Etrio, Corn base nos grficos, voc diria que o tempo de recuperao diferente dependendo da faixa etria? Justifique sua resposta' , tJmn nova varivel denominada Cura criada: Cura ser rpida se Recup frrr rnenor ou igual a 10, ser normal se entre 10 e 40 (inclusive) e ser lentct pnt'n lccr.rp acima de 40. Verifique, graficamente, se pacientes em cada umit clns cntcgorias de Cura apresentam diferenas no que se refere ao tempo
eltttr! o ccltttitto com o inseto e a administrao do tratamento.
Idade
28
15
Diag
7
Recup
3
Tratam
Coag
nao nao
4
27
7
14 5
11
52 30 53
3
45 23
76
15
II I II
I
slm
stm
nao nao nao
S S
46
2 42 47 41
12
51
2l
11
II
I I I
46
55
16 16
10
54
13
25 6
47
18
ilI
II
ru II
m m
59
nao
l6
20
40 24
32
31
20
J
l1
1
slm
nao nao nao
Elt nttlttit',t:; ilc dutlos mencionados nos exerccios a seguir podem ser obtidas ent lflPlt" llr, rt,y t, b r/- n rt p ro e s t
l3
15 8
9 9
J
-)
il il
I
#,
10
44
9 10
40
J 4
11
18
T2
3t
3l
46
21
il il
m
24
21
t3
1
2
B
il
22
-)
39
l7
53
il
I I
III III
I]
l5
9 75 54 35
46
39 22
(LIse o corrrputador) Os itens seguintes referem-se aos dados contidos no f'rluivo clr.: nome cancer.txt. Esse arquivo contm os dados de uma pesquisa fOtrrr: irrcidOncia de cncer e apresentado em 9 colunas representando ns rEu i nlFs vitritvcis de interesse:
e'eilttntt
l:
e'ulumr 2i tliitgttstico:
2 23 26
42
30
I = nlso-negativo: diagnosticados como no tendo a doena qunnclo nl verclade a tinham, 2 = ncgativo: diagrrosticados como no tendo a doena quarrdo ele
'ato niro a tinham. - = llositivo: diagnosticados corretamente como tendo er doena. 4 = lulso-positivo: diagnosticados como tendo a doena quando na
verclircle niro tinham.
slm
nao
S
l8
t2
-58
l6
5
l7
9
In
50
II
m ln
ilutu.li
irlnrle.
34
Captulo
l:
1,4 l',ltex'cios
35
coluna 4: espectro qumico da anlise do sangue-alkaliine phosphatose (AKp). coluna 5: concentrao de fosfato no sangue (P). c o luna 6 : enzima, lactate dehydro genase (LDH). coluna 7: albumina (ALB). coluna B: nitrognio na uria (N). coluna 9: glicose (GL).
d. Crrlcnle a rea til total para cada apartamento. Armazene esta informao er uma varivel denominada Total. Repita os itens (b) e (c) para a varivel 'lrtal, c. Buserndo-se nos itens anteriores, voc diria que existem diferenas nas reas rkrs apartamentos dos blocos A e B? Em caso positivo, qual(is) cmodo(s)
rrplcsenta(m) o problema?
f.
b. unia
afirmao feita por alguns mdicos a de que o grupo dos falsopositivos mais jovem do que o dos falso-negativos. para os dados dessa pesquisa, o que voc diria a respeito? Justifique sua resposta baseando-se em grficos e tabelas de freqncia.
lrxplore descritivamente os dados referentes a problemas estruturais (rlchaduras e infiltraes). Com a informao contida na varivel Andar clivicla os apartamentos em trs categorias dependendo do andar onde se cncontra: baixo, mdio e alto. Estude a ocorrncia de rachaduras e
in'i ltraes para cada categoria.
l,
25. (Use o computador) Um empreendimento imobilirio consistiu da construo de dois edifcios residenciais, com apartamentos de I dormitrio e rea til de fi #. Em uma primeira fase, foi construdo apenas um edifcio, denominado
Suspeita-se que seus apartamentos foram construdos com metragem diferente daquela especificada na escritura. O arquivo areas.txt contm as seguintes variveis, obtidas por peritos de uma firma independente:
(tJse o computador) Os itens seguintes referem-se aos dados contidos no rquivo de nome aeusp.txt, que contm parte dos dados de uma pesquisa, reslizuda pela Associao dos Educadores da USP (AEUSP), sobre aspectos eio-econmicos e culturais de comunidades de baixa renda da regio do utunti, So Paulo. O questionrio foi respondido por um dos moradores dn g sortcada para participar da pesquisa. Os dados esto organizados da gtlinlc lbrma:
feminino.
Cozinha:
Banheiro:
no empreendimento? Quantos apartamentos existem por prdio? E por andar? b. Construa tabelas de freqncia para cada uma das variveis quantitativas contnuas e faa grficos adequados, c. Repita o item (b), para cada bloco, separadamente. construa grficos clo tipo box-plot e compare as reas para cada cmodo considerado.
3: 4: :
2:125,35);
ll
clivorciado;
outro. eetlttnu (t: llegiio de procedncia (Reproce). ttunt 7i Tentpo de residncia em So Paulo, em anos (Ternposp), :olwtil li Nmero de residentes na casa (Resid).
= l'r =
vivo;
: 2: 3:
1
sim;
no;
aposentado.
:
habilidades
Introduo
No captulo anterior, vimos como caracterizar uma massa de dados, com o
coluna l0: Tipo de trabalho, s para os que trabalham (Ttrab) 1 : emPregado com carteira; 2 : emPregado sem carteira; 3 4 5
rural. coluna I l: Idadeque comeou a trabalhar, em anos (Itrab). coluna 12: Rendafamiliar em faixas de reais (Renda):
: : :
profissional liberal;
autnomo;
do organizar e resumir informaes. Neste captulo, apresentamos o nntemiltica que d a base terica para o desenvolvimento de tcnicas
atlens tt $erem apresentadas no restante do livro.
-- [0,150); 2:1t50,300);
g
situao
ou acontecimento cujos
no podem ser previstos com certeza. Por exemplo, as condies clo prximo domingo no podem ser estabelecidas com total acerto, O pocle ser dito da taxa de inflao do prximo ms. Veremos que, cm como essas, modelos podem ser estabelecidos para quantificar os
dus diversas ocorrncias.
z:
Aprcsentamos, a seguir, alguns conceitos de teoria dos conjuntos, que ados neste captulo. Chamamos de espao amostral ao conjunto de todos possveis de um certo fenmeno aleatrio. Ele ser represontedo letfa gregn O (mega). Os subconjuntos de 0 so denominados eventoge aclos pelas letras latinas maisculas A,8,. . . . O conjunto vazio, como jl lelpnnl, ser denotado por 0. denotada por AUB, represento tt A unio de dois eventos A e ia ele, pclo menos, um dos eventos Aou B. Ainterseco do evento
B,
Dois eventos A e B siro disjuntos ou mutuamefie exclusivos quando no lcmcntos ern coffrur.Isto , Ao B A. Dlzemos qr,re e B so complementares se sua unio o espao amostral lnteraeclo vuzia. O complementarr de ser representado por " e temos U ', _: fl e .zt A,,
, denotrrcln por.rl a B,
a ocorrncia simultnea de
A e B.
:4.
P(')
que
n
37
38
Captulo 2 : Probabilidades
?,1 ltitit,tlttl'tt
39
efnio
2.
: Probabilidade
pela
P(17)
0,18; P(18)
0,44;
...; P(25) :
0,04.
tr
a
i,i,)
r;
ii P(UAj) j:t
tr
pergunta que poderia surgir seria: como atribuir probabilidades aos elementos do espao amostral? H duas maneiras principais de responder essa
questo.
r tlirs 'cqiincias da varivel Sexo. Sabendo que 52Vo dos alunos esto na A e 48Vo ni turma B, suponha que escolhemos um estudante ao acaso da lnno, Quirl seria a probabilidade de escolhermos um estudante do sexo r ott itlgurn da turma B?
delas consiste na atribuio de probabilidades, baseando-se em caractersticas tericas da realizao do fenmeno. Por exemplo, ao lanarmos um dado, temos o espao amostral 0: {1,2,3,4,5,6}. Admitindo que o dado foi construdo de forma homognea e com medidas rigorosamente simtricas, no temos nenhuma razo para privilegiar essa ou aquela face. Assim, consideramos
A primeira
0,48.
P(1)
P(2)
:. '. :
P(6) :716.
Uma outra maneira de obter probabilidades atravs das freqncias de ocorrncias. Observando as diversas repeties do fenmeno em que ocorre a varivel de interesse, podemos anotar o nmero de ocorrncias de cada valor dessa varivel. Para um nmero grande de realizaes, a freqncia relativa poderia ser usada como probabilidade. For exemplo, desejando estabelecer as probabilidades de cada face de um dado sem fazer nenhuma suposio inicial sobre sua construo, usamos a experincia de sucessivas ocorrncias. O ponto delicado decidir quanta experincia necessria para se fazer a atribuio de probabilidades, com alguma garantia de no se estar muito distante do verdadeiro valor. Questes dessa natureza no sero discutidas aqui e fazem parte doS captulos de inferncia estatstica. Por ora, vamos assumir que, medida que O nmero de repeties vai aumentando, as freqncias relativas se estabilizam em um nmero que chamaremos de probabilidade. Em cincias biolgicas e humanas, essa a forma mais comum de atribuir probabilidades. De modo geral, diremos que estamos fazendo um sorteio aleatrio ou ao acaso em uma populao, se a escolha desse ou daquele elemento s depende da probabilidade a ele atribuda, seja atravs da freqncia relativa ou de algumit
suposio terica.
E,videntemente isso no pode acontecer, pois o valor clu llidnde poclc ser, no mximo, igual a 1. No difcil perceber que estamos n trlg,rrns elcmentos duas vezes, pois ao considerarmos apenas estudantcs tXo l'errrinino, temos estudantes da turma A bem como da turma B e ao los upotes i turn'a B, temos estudantes do sexo feminino e masculino, on r:sluclnntcs do sexo feminino e da turma B, isto , o evento F O B, estd Ito rlvcnlo ,;' c tambm no evento B.Logo, precisamos subtrair umi vez n IJ) ;turn obter a probabilidade correta. Desta forma, temos qllc il ilitlrrtle rlit unio FU B igual somadas probabilidades de ,F' e B menos lirlnrlc rlu interscco f' O B. tr
I
trilidrrdc que precisamos determinar pode ser representada por P(F U B), guLl se sirnplesmente somarmos P(.F') com P(B), obtemos uma somn
A plohnbilidaclc da unio de eventos calculada atravs da regru dct tltt ltnilnhilitlutlcs apresentada ni Figura 2.1. No faremos unlu lf rio lrrrnul, pois ncreditamos que o resultado bastante sirnples c
itivo,
Exemplo 2.1: Para a varivel ldade, ver Tabela 1.3 clo Captulo l, o cspito amostral ser f) : {17,18, .. . ,25}. Supondo que um aluno escolhiclo ao icoso
40
Captulo 2 : Probabilidades
2.2
4T
linguagem da Teoria dos Conjuntos, as seguintes situaes:' a. Pelo menos um dos eventos ocorre. b. O evento ocorre mas B no. c. Nenhum deles ocorre. cl. Exatamente um dos eventos ocorre.
Comq conseqncia da regra da adio, obtemos que, para qualquer evcnto A c {1,
considerados csportistas. Temos, ainda, que 500 alunos so do curso de biologia diurno, 700
P(A):I-P(A'),
que pode ser verificada aplicando a regra da adio com Ac no lugar de B. Tctnos,
cla biologia noturno, 100 so esportistas e da biologia diurno e 200 so csportistas e da biologia noturno. Um aluno escolhido, ao acaso, e perguntasc a probabilidade de:
a. Ser esportista. b. Ser esportista e aluno da biologia noturno.,-:l c. No ser da biologia. d. Ser esportista ou aluno da biologia. c. No ser esportista, nem aluno da biologia.
tr(Art
A')
: : :
P(A A")
P(A) 0.
Como P(Au A) :
P(Cl) :
4. Sejam
1, segue imediatamente a igualdade desejada'
Ilxerccios da Seco 2.L: 1. Para cada um dors casos abaixo, escreva o espao amostral correspondente e conte seus elementos' a. Uma moeda anada duas veze,s, e observam-se as faces obtidas' b. Um dado lranado duas vezes e a ocorrncia de face par ou mpar
A e B dois eventos em um dado espao amostral, P(B) : p, P(AU B) : 0,5 e P(A n B) : 0,1. Determine o valor de p. 5. l)ois processadores tipos A e B so colocados em teste por 50 mil horas. A
probabilidade de que um erro de clculo acontea em um processador do tipo A de 1/30, no tipo B, 1/80 e, em ambos, 1/1000. Qual a probabilidade de que: ri. Pelo menos um dos processadores tenha apre.sentado
b. Nenhum processador tenha apresentado erro? c. Apenas o processador A tenha apresentado erro?
"rrorc---.-u--\
observada.
'-
qual
g( Em uma cid;ade, famlias com 3 crianas so selecionadas ao ' anotando-se o sexo de cada uma.
observa-se o nmero de defeituosas na prxima hora. cafi.
Irrrbalhamos pode ser separado em etapas. A informao do que ocorreu em uma rletr-:rrninada etapa pode influenciar nas probabilidades de ocorrncias das etapas Nestes casos, dizemos que ganhamos informao e podemos "recalcular"
acaso,
e
rrs probabilidades de interesse. EsSas probabilidades "recalculadas" recebem o Irrrrrrc cle probabilidade condicional; cuja definio apresentamos a seguir.
'
42
Captulo 2 : Probabilidades
?.
J l' t r il x
It i I i
43
0,02.
dado que
Ettln,t,
'| Caso P(B) : g, P(Al B) pode ser definido usaremos P(Al B): P(A).
P(Al \ B\
: '
P(Htrl:r#?:
ffi:0,025
l
no espao amostral'
tr
O = Regio (100 km2)
Exemplo2.3.' Considere a seguinte situao hipottica. Uma grande regio de 100 km2 contm um aqfero (reservatrio de gua) subterrneo com rea igual a 2 km2, cuja localizao _ desconhecida (ver figura a seguir). A fim de determinar a posio do aqfero, perfuraes so feitas ao acaso. Vamos representar por If o evento de encontrar gua. Temos P(H): 0,02, obtido pelo quociente da rea do aqfero pela rea total, onde usamos que o espao amostral f) : {regio de 100
k*t.
furos, tr
Suponha agora que, aps uma ano de pesquisas, uma rea de cerca de 20 foi amplamente perfurada sem encontrar gua e pode ser descartada para
fr
l)rr tlc'iniiro de probabilidade condicional, deduzimos a regra do produto Stnilultililrulcs, uma relao bastante til que apresentadanaFigura2'2,
a,
probabilidade de um furo, feito ao acaso, atingir o aqfero? Vamos representar por P(H I 1) u probabilidade desejada. Com a mesma argumentao utilizada acima, a nova regio de procura terrea B0 km2 e portanto P(H I I):0,025, Isto , como espervamos, a probabilidade de obter gua aumentou devido i informao recebida. Vamos refazer esse clculo utilizando agora a frmula de probabilidade condicional. Para tal, seja B a nova regio de procurir correspondendo a rea total inicial menos a parte que foi descartada para novas tentirtivits. Temos que P(B) : 0,8. O evento H a B representa a ocorrncin dc, scrn ncnhuma informao etuxiliar, ncontrarmos gua num 'uro f'eito na regiiro .R.
de probabilidades.
cle
44
Captulo 2 : Probabilidades
P rt tl t
il ti I i r k u I c
Co
45
Dois eventos A e B so independentes, se a informao da ocorrncia ou no altera a probabilidade da ocorrncia de ,4. Isto ,
P(Al
ol
0.9
5
P(A
P(A) P(B).
tr
0,0
5
o.;
o2
No difcil verificar que se A , independente de B, ento B independente de A. O uso da expresso acima permite, ainda, verificar que o evento vazio independente de qualquer evento. As demonstraes so deixadas a cargo do leitor. E muito comum, primeira vista, confundir eventos independentes e eyentos disjuntos. O prximo exemplo ajuda a esclarecer essa questo.
Exemplo 2.4: lJnaempresa produz peas em duas mquinas 1e f f , quepodem apresentar desajustes com probabilidade 0,05 e 0,10; respectivamente. No incio do dia de operao um teste realizado e, caso a mquina esteja fora de ajuste, ela ficar sem operar nesse dia passando por reviso tcnica. Para cumprir o nvel mnimo de produo pelo menos uma.das mquinas deve operar. Voc diria que a empresa corre o risco de no cumprir com suas metas de produo? Seja O; o evento da mquina i estar operando, ,i : 7,2. Pelas informaes disponveis temos P(Ot): 0,95 e P(O2): 0,90. Na Figura 2.3, apresentamos um diagrama conhecido como rvore de probabilidades, qu'e consiste em representar os eventos e as probabilidades condicionais associadas s realizaes. Cada um dos caminhos da rvore indica
uma possvel ocorrncia.
oi
o;
Figura 23: rvore
de
probabilidades.
Probabilidade
oro,
OrO'
ol'o,
o'o;'
nilleluinn opcrando.
U (, t( )i'
t
J
Parn otrter o nvel mnimo de produo di'ria, precisamos ter pelo menos
Isto
ocorrncia
do
evento
No preenchimento dos valores de probabilidades na rvore, observe que assumimos a independncia entre 01 e 02, pois acreditamos que a eventual falta de ajuste em uma mquina no interfere no comportamento da outra. Note que, no caso de independncia, o segundo ramo da rvore no afetado pela ocorrncia
Oj'0r.Ternos,
dos eventos que aparecem no primeiro ramo. Portanto, pela definio de independncia, segue que P(O2l Ot) : P(Or): 0,90. Para facilitar a notao, vamos escrever O1O2 para o evento OtOz.
sua probabilidade da ocorrncia dada pelo produto dos ramos que levam nesse evento. Isto correspondendo aplicao da regra do produto de probabilidades:
Op)
tr
uniflo contenrplt toclas as possveis
P(Ap2)
No exernplo anterior, os eventos representados pelas interseces g,f,l1(J,j', ()i02 c Oi'Oi'lonnnrn novos cventos que tm a propriedacle de
ltlulrlnnrente exclusivos
e cuja
46
Captulo 2 : Probabilidades
F tt
il t
t I t
iI
il h ul c Co
ndicional
e Independncia
47
Ca)Ci:Q
Para
i'+i
1,
U Ci:9. .i:t
tr
A=
(A
nFr) u
(A.F) u (nq)
uittcln,estar interessados em saber qual a probabilidade de que a amostra tenlrir siclo obtida do leite fornecido pela fazenda F1, isto ,, P(4lA), lmpllen er se inverter a probabilidade condicional conheciOa P(lF'1). conro cssa so tpicas para o uso do resultado apresentado a seguir, tr
11
3,
. , ft,
j,
uma sejam conhecidas. Suponha, ainda, que probabilidades P(AlCt) para todo
I'(C,il A) :
P(A I c P(c j)
i:l
P(ci I A) :
Etettdor
lgnedo
r
P(C1n A)
P($
ser reescrito
Se denotarmos por o evento "o leite est adulterado", temos que P(Al.p'r) : 0,20, P(Al Fz):0,05 e P(Al rs):0,02. Alm disso, .F'1, F'2 e ,F3 formam uma partio do espao amostral pois uma dada amostra de leite vem, necessariamente, de uma e apenas uma das trs fazendas. Desta forma, o evento pode ser escrito em termos de interseces de com os eventos F1, F2 e F3, conforme ilustra a figura a seguir.
P(A;1n A)
l;
c,) P(c).
tr
48 '"
( t,' u \")
^\ . s')
-- T ((trn.r1')
i,
( a) b'\ - P (
('*t'r',-,ll'
rr(,.
p[n'', -? (al@)
49
Exemplo 2.6: Yoltando situao do fabricante de sorvetes (exemplo anterior), podemos agora calcular facilmente a probabilidade desejada, isto ,
l/
lnrlelrcttclcntes.
;e com 0,8 se chuva de 0,3. O So Paulo probabilidade de a Sctcrnbro eve, l'inr probabilidade ter chovido nesse qual de a ull1n l)nrticln em Setembro,
A) P(FrlA):--i(A)-
P(.il)
P(A I F'l)P(rl)
que sc
e, ento les.
AeB
so independentes ento
A e B"
tambm io
P(Frlrl:
:0,615.
reelos
fuedn vicitclu de modo que a probabilidade de sair cara 4 vezes maior I de urir coloi. Para 2 lanamentos independentes dessa moeda,
p@btthiliduclc de sair somente uma cara. pbchiliclnde dc sair pelo menos uma cara. ffebntrllidurle de dois resultados iguais.
urrr conjunto de 4 nmeros dos quais nenhum deles zero, dois so c dois sio negativos. Sorteamos ao acaso, com reposio, 2 nmeros enjunto, l)eterrnine a probabilidade de: deler r,rer negntivo.
qune ietrle set negativo. dclr nrrrerc)s terem o mesmo sinal.
Portanto, a probabilidade de que a amostra de leite em questo tenha si produzida pela fazenda F1, de 0,615 em contraste com as probabilidades 0,231 0,154 para as fazendas F2e F3, respectivamente. Exerccios da Seo 2.22
:0,3
P(B) :0,5. Calcule: a. P(An B). b.P(Au B). /-t c.P(Al B). (-" d. P(A.). e. P((A u B)").
/
2. Se P(AU B)
de:
0,8;P()
0,5 e
P(B)
caso
He
sf,o vrlliclas
ats
afirmaes:
P(A lB)
Lf2 ento
lnu c fi clo 'crnirrino bram reprovados, 8 do sexo masculino e 14 do lno frtrurn ttprovndos, Para um atluno sorteado dessa classe, denote por M lutto eseollrirlo br do scxo masculino e por se o aluno foi aprovado.
lrce dr, estustica tcve a seguinte distribuio das notas finais: 4 do sexg
'/
F1d
t=t
ltl";,
nr)
rr ilI"),
50
Captulo
robabilidades
ft'r't{'i,,f
5t
d.P(M'I
A). e,P(M I A). ?eas produzidas por uma mquina so classificadas como defeituosas,
,"c,rpe.veis ou perfeitas com probabilidade de 0, 1 ; 0,2 e 0,7 ; respectivamente. De um grande lote, foram sorteadas duas peas com reposio. Calcule:
a. P(duas serem defeituosas) b. P(pelo menos uma ser Perfeita). c. P(uma ser recupervel e uma perfeita). E se o ,,@)t"Oiqu. as suposies utilizadas para resolver os itens anteriores. vsorteio for sem rePosio? 6.Paradois evento s A e B,num mesmo espao amostral, verifique, atravs ile um diagrama, que sempre possvel escrever o evento A como sendO : P(An B) + P(A B")' e"o A1U ( n B") e que, portanto, vale P()
ttttr l)uirrg existem trs empresas de TV a cabo e 20 mil residncias. A 'l'A lcrn 2100 assinantes, a TB tem 1850 e a empresa TC tem 2600 :in1ttl,,s, scttclo que algumas residncias em condomnios subscrevem aos lr'u tlc: urais de uma empfesa. Assim, temos 420 residncias que sito Irlr:s tlo TA e TB, 120 de TA e TC, 180 de TB e TC e 30 que sito rrtrs tlns trs empresas. Se uma residncia desse bairro sorteada ao ruu, quttl l probabilidade de:
de vrrleibol
de basquete, enquanto o armrio 2 tem 3 bolas de I r' ? clc basquete. Escolhendo-se, ao acaso, um armrio e, em seguida'
eI
7.
Numa cidade do interior de So Paulo, estima-se que cerca de 20Va doS habitantes tm algum tipo de alergia. Sabe-se qne 50Vo dos alrgicos praticam esporte, enquanto que essa porcentagem entre os no alrgicos de 407o'PatA aleatoriamente nessa cidade, obtenha a probabilidade um indivduo
de:
p vok ibol, sitbcndo-se que o armrio 1 foi escolhido' burq,,.,*, sitbcnclo-se que o armrio 2 foi escolhido.0
fu buE,lrrcte,
Fgclctrtcs clc uma Clnica de Ginecologia com idade acima de 40 anos, trr rrrr lrtrn casadas e 407o so solteiras. Sendo solteira, a probabilidnde f tlrlo urn rlistrbio hormonal no ltimo ano de I07o , enquanto que poftl ftnrn I r e sstt probnb i I idade aumenta para 30Va' Pergunta-se : QU*rl tr prtoltnbiliclade de uma paciente escolhida ao acaso ter tido um dlrlr'trirt ltortttottal ? e A pncierrte sortcada tiver distrbio hormonal, qual a probabilidade de ser
"r"olhido
a. No praticar esporte. ' ', b. Ser alrgico dado que no pratica esportes.
8. As preferncias de homens e mulheres por cada gnero de filme alugado em uma locadora de vdeos, esto apresentadas na prxima tabela'
Sexo \ Filme Homens Comdia
136
Romance
92 195
Policial 248
62
A
:sltit'u'/
Mulheres
r02
Sorteando-se, ao acaso, uma dessas locaes de vdeo, pergunta-Se probabilidade de: a. Uma mulher ter alugado um filme policial? b. O filme alugado ser uma comdia? c. Um homem ter alugado ou o filme ser um romance? d. O filme ser policial dado que foi alugado por um homem?
Yt*
elttr,'g.tt il s!:tl amigo uma cart, destinada sua namorada, parat sgt :4111 tro crtrrcio. Entrcttnto, ele pode se esquecer com probabilidade 0,1 . llu Er. i,sr.lltec:cl', l probltrilidacle de que o correio extravie a carta de 0'1, lSetttr:, st: liri cnviacla pclo correio a probabilidade de que a namorada nlio
1
nO
,f,Ooit dados equilibrados so lanados' Calcule a probabilidade de: a. Obter o par (3,4), sabendo-se que ocorreu face mpar no prirneiro dado. ,,'i' ' ll. Ocorrcr face mpar no segundo ditdo, sabenclo-se quc ocorrcu acc par
pritttciro dado.
tscehrr rt tL: 0, I . Efu trrrrturt'urlit ttio rcccbctt o carta, qual a probabilidade de seu amigo tel prquecirto tlc crtloct-la no corrcio'l
br
Avrrltr, rrs llossillilidnclcs clcsse rlanoro cotttinuar, se a comunicaiio tepett,l,,r rltts ctrtits ottviitdas.
52
Captulo 2 : Probabilidade
ttr t,',,,.r
53
14. Numa certa regio, a probabilidade de chuva em um dia qualquer de primavera de 0,1. Um meteorologista da TV acerta suas previses em 807o
dos dias em que chove e em907o dos dias em que no chove. a. Qual a probabilidade do meteorologista acertar sua previso? b. Se houve acerto na previso feita, qual a probabilidade de ter sido um dia de chuva?
Eneottlt'rtr iigtta.
UFt ttrrurlico closconfia que um paciente tem tumor no abdmen, pois isto nn 70(k' clos casos similares que tratou. Se o paciente de fato tivcr o
15. A tabela a seguir apresenta informaes de alunos de uma universidade quanto s variveis: Perodo, Sexo e Opinio sobre a Reforma Agr'ria,
Determine a probabilidade de escolhermos: a. Uma pessoa do sexo masculino e sem opinio sobre a reforma agrria? b. Uma mulher contrria a reforma agr6,ria? c. Dentre os estudantes do noturno, um que seja a favor da reforma agrria? d. Uma pessoa sem opinio, sabendo-se que ela do sexo feminino?
Perodo
Sexo
o lurror, o exame pode, erroneamente, indicar que tem com lirlirrle 0,1. Se o exame detectou um tumor, qual a probabilidade clo lcnte t lo tlu lto?
tlvr.r
t*helu dos 1000 ingressantes de uma universidade, e classe scio econmica. de estudo sobre rea lnfolrrrrrt'ics
rt segttir itpresenta dados
Area \ Classe
Exatas
Alta
L20
72 169
Mdia
156
B5
Baixa
68 LL2
-q L)
Humanas
A Favor
8
Sem opinio 2
8
Biolgicas
I45
Diurno Noturno
2
8
9
8
&r
4
T2
&tg,l,tt'ttu rit'cit clc exatas. &tu,lgr t,,, 1il'r:i dc humanas, sendo de classe mdia.
gf du r'lrsstr bitixit, clado que estuda na rea de biolgicas.
10
,.,,.
16. Trs candidatos disputam as eleies para o Governo do Estado. O candidato do partido de direita tem30Vo da preferncia eleitoral, o de centro tem307o e o da esquerda 40Vo. Em sendo eleito, a probabilidade de dar, efetivamente, prioridade para Educao e Sade de 0,4; 0,6 e 0,9 para os candidatos de direita, centro e esquerda, respectivamente. a. Qual a probabilidade de no ser dada prioridade a essas reas no prximo governo? b. Se a rea teve prioridade, qual a probabilidade do candidato de direita ter ganho a eleio? ,.
it probabilidade de gostar de teatro , Il3, enquinto gostlr rlc cinerna 112. Determine a probabilidade de gostar de tcatro tlc
t'r:r'lrr poprrlitiro,
grlnl'rlt, lerrtnr o gostilr cle cinema so eventos disjuntos. lnrttu'rh' lntltrr o gostar de cinema so eventos independentes.
Fgd,,r rlllr' loslnr clc teatro gostm de cinema. A Frrihirlrilirlrtrlo clc gostitr de teittro e de cinema Ll8. flenlre os (lue nio gostam de cinema, a probabilidade de
;l/.1,
nro gostar de
tcitlro
lf:.Uma companhia
que fura poos artesianos trabalha numa regio escolhendo, "leatoriamente, o ponto de furo. No encontrando gua nessa tentativa, sorteio outro local e, caso tambm no tenha sucesso, faz uma terceira e ltirnn tentativa. Admita probabilidade 0,7 de encontrar gua em qualquer ponto dcssn
regiro. Calcule a probabilidade de: a. Encontrar rguir na seguncla tcntativa.
I Tr hilrrir'ns lrrnccctn
EFa prlut'nl clrirrrco clo subcstirniro ou superestimao clas rnecliclns *lttit,lrrq A tlbcln it scgttit' aprcscnta o collportamcnto do equiparncnto Fdttrl,l,, t'!!t t'iltlll I'iillricl:
ecluipamcntos de preciso para o laboratrio tle Apesar cle serem aparelhos de preciso, cxiste ttttivct'siditcle, lpflnlr.rt rlr' untit
54
Captulo 2: Probabi
E.ttt't'it'irts
55
Uporrhl que X represente o nmero de horas de atividade fsica por semana. cnriirlcrc a tabela a seguir:
Sexo \ Atividade
Feminino Masculino
r
7 6
Qull
As fbricas I,
II e III fornecem, respectivamente, 20Vo, 30Vo e 50Vo dos aparelhos utilizados. Escolhemos, ao acaso, um desses aparelhos e
perguntamos a probabilidade de: a. Haver superestimao de medidas? b. No haver subestimao das medidas efetuadas? c. Dando medidas exatas, ter sido fabricado em III? d. Ter sido produzido por I, dado que no subestima as medidas?
P(X > 5). a probabilidade de que um rapaz escolhido aleatoriamente dedique *rlcrrlc Cr pelo rncnos 5 horas atividade fsica. Idem para uma moa. , utttltitt'c is respostas dadas nos itens (b) e (c)'
r enlculc
a probabilidade de sortear aleatoriamente uma menina com atividade fsicit scrnanal na faixa de [3, 5) horas?
22. Acredita-se que numa certa populao, 207o de seus habitantes sofrem algum tipo de alergia e so classificados como alrgicos para fins de sade
pblica. Sendo alrgico, a probabilidade de ter reao a um certo antibitico de 0,5. Para os no alrgicos essa probabilidade de apenas 0,05. Uma pessoa dessa populao teve reao ao ingerir o antibitico, qual a probabilidade de:
a. Ser do grupo no alrgico? b. Ser do grupo alrgico?
i!'ns estito perfurando de modo independente. gbertrlo-se que uma delas (qualquer) no achou gs, qual a probabilidade dHg ottlt'its duets encontrarem? $bcttrltt-so que uma delas (qualquer) no achou gs, qual a probabilidade d etteorttrar gs na regio atravs dessas perfuraes? tllrc:nrkr-sc que no mais de uma delas (qualquer) achou gs, qual a prohrrbiliducle de nenhuma encontrar gs?
23. Estatsticas dos ltimos anos do departamento estadual de estradas so apresentadas na tabela a seguir, contendo o nmero de acidentes incluindo vtimas fatais e as condies do principal motorista envolvido, sbrio ou
alcoolizado. Motorista \ Vtimas fatais Sbrio
No
L22B
F(a U B I c) : P(Al c) + P(B lc)-P(A)Blc). te Jt /'' cntito P(Au B I C) : 1. F(,4 t t 11U C) : P(A) + P(B) + P(c) - P(A. B) - P(A. c) = t'(/t l) + P(An B nC).
jlntr fnrrrlil
AltJ) :1-P(AlB).
A,
ll
Sim
275 762 na
passar um
Alcoolizado
ocorrncia de vtimas fatais?
2393
ft
or.l scln congestionamento, probabilidade do pai perder a piIe in r'(n os 'ilhos de 0,7. E claro que havendo congestionamento o pai pde per,l,.r'tt pitcinciil com os filhos mesmo sem brigas, o que aconteceria Ft ptohlhilirlndo 0,5. Quando niro hr nem congestionamento, nem briga, o pi eltrtgr. trnrtqiiilo c nto 1:crdc a pucincia, Determine a probabilidade de: * Nnrr kt'ltitvirkl congestiottittrtcnto se o pai no percleu a pacincia com seus
$ngesti.rrrnnrenlo, a
de 0,6. Havendo
bitl, ,,.,",
flllrrtF
56
Captulo 2: Probabi
ultt.
29.Um candidato
a motorista treina na auto-escola e acredita que passa no exame com probabilidade 0,7. se no passar, far mais treinamento, o que ele estima que lhe aumentar em lj%o a probabilidade de passar, isto , no segundo exame passar com0,77 de probabilidade. a. Supondo que ele continue acreditando nesse aumento de possibilidade, em
30. (Use o computador) Considere os dados do arquivo areas.txt descrito no Exerccio 25, captulo 1. Suponha que voc ganhe um apartamento em uma promoo feita por uma cadeia de lojas. utilizando o computador, construa
tabelas de freqncia necessrias para responder s seguintes questes. a. Qual a probabilidade do apartamento estar situado entre os andares 4 e7? b. Qual a probabilidade do apartamento estar situado no bloco B?
a. As
classificado em cada uma das quatro categorias da varivel Diagnstico. b. utilizando apenas o item (a), qual a probabilidade de um paciente,
selecionado ao acaso, ser diagnosticado como no tendo a doena?
32. (use o computador) considere os dados do arquivo aeusp.txt descrito no Exerccio 26, Capnlo 1. Suponha que escolhemos, ao acaso, um dos
moradores entrevistados. a. Qual a probabilidade da idade do entrevistado ser inferior a 35 anos? b. Dado que o morador tem menos do que 35 anos, qual a probabiridade dele ser do sexo feminino? c. Qual seria a probabilidade de escolher um morador do Jardim Raposo quo tenha acesso a computador? d. Determine a probabilidade de escolher um entrevistado qr"re tcnha vinclo clo nordeste, seja do sexo feminino e estr trabalhando. Se esse rnoraclor bi escolhido, qual a probabilidaclc delc tor cartcira assinacla?
Utnir rilrirrrticlaclc X, associada a cada possvel resultado do espao , tlt'rrrrrrrirtirdn dc vevivel aleatria discreta, se assume valores num r etttttrrel'iivol, corn certa probabilidade. Por outro lado, ser denominada ctle'ttltit'itt t:rtttltuta, se seu conjunto de valores qualquer intervalo dos
iFntH. o tltrc scria um conjunto no enumervel. (
rnlr i'i rrtcrrcionamos arnteriormente, existem variveis que so rrlr rlrl'irritlls courcl discretas ou contnuas, porm essa atribuio no
!r
e rlt';rt.trth-r tkr irrstrumento de medida e do estudo que est sendo feito. letttlrlrr, rr virliiivol tninrero dc,filltos em.famlias discreta, enquanto o
clr
te'tt1'titt
u utn t:erlo
mulicdnrcn.o
contnua. A
discusso sobre
iflr.tt;to rh' vrrliiivcis, lbitn lro Captulo l, serr utilizada em todo o texto e a fEl rtl:.'tttrrt'itt ir itcrcscicln itqui pttt'it inclicar qtle, cada possvel valor, r!1 unut prohullilidnclc clc ocorrlrciu. No caso discreto, a atribuio
57
58
folr,t,lrt1,t,,
59
similar
tabela
de freqncia;
jL
no caso contnuo,
utilizaremos
generalizao da idia de histograma. Neste captllo apresentamos os resultados e modelos mais comuns variveis aleatrias discretas, deixando para o Captulo 6 a discusso do
contnuo.
Seja
valores.
11,12,ryt...,
seus dife
1) : 0,30 e a catacterizao probabilstica a varivel =: '=l ) 0,15. Para completar lrt N. jrltn obter as probabilidades P(l : 3), P(l/ :4) e P(N : 5). r rrs irrlrmaes fomecidas, elas so iguais e, digamos, tm valor p. r rr rlcl'irtio de funo discreta de probabilidade, temos que:
/)(N
0,20
:
+
A funo que atribui a cada valor da varivel aleatria sua probabr denominada de funo discreta de probabilidade ou, simplesmente, funo probabilidade. Anotao a ser utilizada :
P(X =
ou ainda,
5)
0,15 p::0,05.
Ftttrio rlc probabilidade para
r;) :
p(r1)
: pi,'i : I,2,...
l/
tr
.1,): Nir construo de um certo prdio, as fundaes devem atingir 15 de prolrnrliclade e, para cada 5 metros de estacas colocadas, o operador l lrorrvt. ;rltcrao no ritmo de perfurao previamente estabelecido. Essa icsrrltlulo de mudanas para mais ou para menos, na resistncia do Nps rlis c1sos, medidas corretivas sero necessrias, encarecendo o d pltru, ('otr lrase em avaliaes geolgicas, admite-se que a probabilidade tliit rltr irltcraes de 0,1 para cada 5 metros. O custo bsico inicial tlf'('s (rrrrirllrlc padro de construo) e ser acrescido de 50k, com k rtirhr o rrtirncto de alteraes observadas. Como Se comporta a varivel
\1
1 p, <
pt : "I
L.
Note que, na maioria dos casos, X ter apenas um nmero finito valores possveis e, assim, a verificao de qge a soma de probabilidades igunl I ser feita atravs deuma soma finita. As variveis aleatrias so complet caracterizadas pela sua funo de probabilidade e uma parte importantg Estatstica , justamente, obter, para uma dada varivel de interesse, a funlo probabilidade que melhor represente seu comportamento na populao.
Exemplo 3.1.' Com
do ltimo censo, a assistente social de um Centro Sade constatou que para as famlias da regio, 20Vo no tm filhos, 30o/o t,m filho, 35Vo tm dois e as restantes se dividem iryglgrglf" entre trs, quatro cinco filhos. Suponha que uma famlia ser es'colhida, aleatoriamente, ne regio e o nmero de filhos averiguado. Definimos N como sendo a vari aleatria ntimero deftlhos e consideramos que a escolha feita entre as cli opes de valores parn N. Isto , no importa qual a famlia escolhida, mas qual a resposta dada quanto ao nmero de filhos. Desse mocJo, est sorteando um valor deNdentre 0,7,2,3, 4 ou 5. A funo de probabilidaclo varivel segue das informaes disponveis, isto , como 20ok das l'amlius tm filhos, ento a ptobabilidade de uma ftrrrrliir sortcacla ao icaso niro ter I'ilho
dados
Assrrrrrirrros cluc as alteraes ocorrem independentemente entre cada um ltrt,,rvitlos tlc -5 metros e representamos por A a ocorrncia de alterao *l, lrrlr,rrzlo, scltclo '' seu complementar. A Figura 3.1 apresenta as trs !,r!u (s possvcis resultados da perfurao. Cada etapa tem duas
$r
llrlri,l,'s (lu(:, (lr.riurclo combinadas com as outras duas etapas, originam 8 l -vlrrlos. llr cxcmplo, o evento AA"A representa que, na primeira e na Clllill,, it(.()tloccril-n alteraes, enquanto que na segunda nada se alterou. letfrr ri ll ('lirl)irs, coltt 2 possibilidades emcadauma, temos no total 23 :B
I I r-r,|no itrttoslt'itl cclnsistc na unio de todos os caminhos que levam de pHltlrlr {riil!o (llr iirvorc clc probabiliclacles,
60
lllln,ilrr'ro
61
P(C :150)
-----_----^0,t4 0,9
+ P(A'A'A)
A"
on,
o"
o'
ptrrlrlbilidades para os outros valores de C podem ser obtidas de modo r, r'csultando na seguinte funo de probabilidade:
0,9
tsoc:iao
de
Vlmos considerar agora exemplos em que as probabilidades associadas [:rucrrtos do espao amostral so obtidas a partir de uma suposio terica.
3.3r Considere o experimento de lanar uma certa moeda observar se eilnr ou coroa. Descreva o comportamento da varivel nmero de caras em lilnt mentos dessa moeda. Sc denotamos por ly' a varivel de interesse, segue imediatamente que l/ nssrrrrrir os valores 0, 1 ou 2.Para atribuir probabilidades a cada um desses rrecessrio fazu alguma suposio a respeito da probabilidade de rciir de cara ou coroa. Admitindo que a moeda equilibrada, as lrilitlrrcles de cada face sero iguais, isto , P(cara): P(coroa) : Ll2. ttos ainda a independncia entre lanamentos, de modo que a ocorrncia de rlclclnrinada face no primeiro lanamento no altere a probabilidade de cara
pror n0 segundo lanamento. l)oclemos considerar como espao amostral o seguinte conjunto:
AAA AAA"
AA.A
AA"A" A.AA
0,1
0,92
A.AA.
A" AcA
AcAcAc
200
150 150 100
g
Note que associamos a cada evento do espao amostral um valor para a varivel aleatria C. Os distintos possveis valores so c1 - 100, cz: L50, cs : 200 a c4 :250. Alm disso, podemos ter um mesmo valor da varivel associado a mais de um elemento do espao amostral, por exemplo,
(I
: {cc ,c R, RC , RR},
P(C :
cz)
: P(C:
150)
c / rcpresentando a ocorrncia de cara e coroa, respectivamente. l'lra deduzir a funo de probabilidade de -y', observe que o valor 1 rrttr. rros cventos CR e C, enquanto que os valores 0 e 2 tm apenas um etttrr ir cles associado, respectivamente, -R e CC. Segue ento que as
pfehnlrilitlucles associadas aos valores de Iy' so as seguintes:
tr
62
63
Exemplo 3.4: tJmjogador paga 5 fichas para participar de um jogo de disputando com a banca quem tem o ponto maior. O jogador e a banca cada um o seu dado e a seguinte regra de premiao estabelecida: maior, ele ganha 2 vezes a diferena entre o - se o Ponto do jogador Joga ponto e o obtido pela banca; se o ponto do jogador menor ou igual ao da banca, ele no ganha O que voc acha desse jogo?
Vamos admitir que os dados utilizados so perfeitamente homogneos, tal forma que no h preferncia na ocorrncia de qualquer uma das seis f Assim, podemos considerar que os pares de valores (b, i) representt respectivamente, ocorrer. Para cada par (b,7) sorteado, a premiao baseada nos seus va Definimos a varivel aleatria discreta G como sendo o ganho bruto do io em uma jogada, isto , o valor arrecadado sem descontar as fichas iniciais para participar do jogo. Pela regra de premiao' segue que:
(1, 1)
(3,3)
(6,6)
3l 1r,t'.r trn todos a mesma probabilidade de ocorrncia e, portanto, Jtlf'l 0) :21136. De modo anlogo, calculamos os demais valores e
futtiio clc probabilidade:
o resultado obtido pela banca e pelo jogador, tm a met probabilidade de ocorrncia. Isto , qualquer par tem probabilidade 1136
(;l
apostou. tr
t:l
serG:2x(3-1):4.
j):
(1,1) (2,1) (3,1) (4,1)
(5, 1)
o,
se
i<b.
<
Ent vriliirs situaes til calcular a probabilidade acumulada at um , A tlel'inio a seguir apresenta esse conceito.
,2: Ituno de distribuio de probabildade
Dessa forma, se o jogador obtm 5 e a banca 6, temos G : 0 pois j < b (5 Por outro lado, se o jogador tira 3 e a bancaJ, o valor do ganho bruto do j
$ Jiutr;iltt dc tlistribuio
lerrlririrr cliscretzr
xpl'rssto:
ou
(\,2)
(3,
2)
(6,1)
O valor G
(r,4)
(1,5) (2,5)
(3, 5)
F(r):
J,.f,'
P(X < r)
llrrt populao de 1.000 crianas foi analisada num estudo para cl'ctiviclnclc de uma vacina contra um tipo de alergia. No estudo, as n fer.t:lrirrnr r.rrna dose de vacina e, aps um ms, passavam por um novo r rritrrlir livcsscm tido alguma reao alrgica, recebiam outra dose da Ao lirrr rlc.5 closcs todas as crianas foram consideradas imunizadas. Os unrrr;rletos csto na tabela a seguir.
l)oses
'r'ccy.
245
2 28t
256
t45
66
64
65
Supondo que uma criana dessa populao sorteada ao acaso, qual ser probabilidade dela ter recebido 2 doses? Utilizando a idia de atribui probabilidade atravs da freqncia de ocorrncia, a probabilidade desejada 288/1000:0,288. A funo de probabilidade da varivel aleatria nmero doses recebidas fica sendo:
0,145
I(.r)
l,oo
9,954 ,7fltl
,113
Suponha, agoa, que desejamos calcular a probabilidade da criana ter recebi at duas vacinas. O que precisamos obter a funo de distribuio no ponto ou seja, calculamos a probabilidade acumulada de ocorrncia de valores men ou iguais a 2. Assim,
F(2)
1)
* P(X :2) :
0,533.
Note que, tendo em vista que avarinel s assume valores inteiros, esse valor inalterado no intervalo 12,3).Isto , F(2,L);F(2,45) ou F(2,99) tm todos mesmo valor acirn*a. Por essa razo escrevemos:
012s45
I,'lgura 3.2: Funo de distribuio - doses de vacina. 3,6.' Nurn cstudo sobre a incidncia de cncer foi registrado, para cada
eonr essc diagnstico, o nmero de casos de cncer em parentes (pais, ilrniros, tios, filhos, primos e sobrinhos). Os dados de 26 pacientes
irttes:
",r,
: {
0,245 0,533
0,789
0,934
1
llltcliorcs irssurnem que a incidncia de cncer em parentes prximos teut'icrrrrrcrrto nrodelada pela seguinte funo discreta de probabilidade:
notao utilizada para escrever a funo de distribuio pode, primeira vista, parecer confusa, mas como as contas efetuadas so simp acreditamos que com um pouco de treino o leitor ficar familiarizado com funo. A Figura 3.2 apresenta um diagrama dessa funo.
Fg tnlrcln rlc dados brutos com as 26 observaes, coletamos para cada d vtrt'liivel, o nmcro de suas ocorrncias. Por outro lado, seguindo o
tct'ico, o rrrirrrcro cle observaes que seria esperado em cada incidncia
66
67
(freqncia esperada) calculado cono i:26x pi. Note que os valores esperados no precisam ser nmeros inteiros, pois representam uma freqncia terica caso o modelo fosse adequado. A tabela a seguir apresenta os resultados:
Incidncia
0
1
dois
nlos itttlcpcndentes dessa moeda, estude o comportamento da varivel rlet rttnlr c lra um grfico de sua funo de distribuio.
bgcu ltrt itrllrrnao que voc conhece, crie os valores e as respectivas lirlrrrlcs f)ura a varivel nmero de filhos em famlias, no caso da lsn eonsiclcrada ser: lgx*e rtrr"dil paulistana. hehitntrtcs clo interior do Maranho.
n; (observados)
4 4 6 6
2
ei (esperados)
216 216
7,8 7,9
216 216
4
5
4 26
total
26
gtttittlro lturit chcgar a uma festa pode ser dividido em trs etapas. Sem o tlrr.jeto I'cito em t hora. Se enganos acontecem na primeira etapa, [e l0 rninutos ao tempo do trajeto. Para enganos na segunda etapa, o ttn 20 o, pilra er terceira, 30 minutos. Admita que a probabilidade de
r,'l',1 ,t v
0, I ;
vnlenc. I'i provvel haver atraso na chegada festa? Determine a Irlurk tlc ltavcr atraso, e o atraso no passar de 40 minutos.
itttetn de iuros prestando vestibular para conseguir uma vaga na lttlc. esr scttdo estudado. As carreiras tm procura diferentes e, em delux, o col-r'ullr pode ser prestar vestibular mais de um ano. Suponha ttiolltr'tttos, ito acaso, um dos ingressantes da sua carreira. Que Itlirtle voc atribuiria (invente!) necessidade de 1, 2,3, ...anos de
I
filho vai plltll e onre r pipocu com probabilidade 0,'l e, alm disso, pode pedir bala pnrbnbilidnrlc 0,9. Esses pedidos so atendidos pelo pai com illtllrlc 0,.5; inclcpendentemente um do outro. Se a pipoca custa R$ 2. e a
levrt tt 'illro
to cinema
Notamos que os dados observados seguem a mesma tendncia do terico, porm seus valores so dis-crepantes. uma amostra pequena, mas no haver boa adaptao entre os dois conjuntos de nmeros.
P(r)
:
{
I
68 Captulo 3: Variveis Aleatrias Disc
I
lt't t n la lr ts D
iscretos
69
L0.
b. P(x c. P(X
d.P12<X<20).
e.P(x
X.
Fl,r
=.r )
t rs). (t
E,l0
B,tlH
E,Ofi g,4
,sa
2 3 4 5 6 7 I
9 l0
'ittura 3,3: Modelo Uniforme Discreto [0, 10]. Clhrelve (ple it cxpresso na definio anterior, de fato, representa umn dhet'etn rlc llrubabilidade, uma vez que seus valores esto no intervitlcl Fntilr tle loclits as probabilidades igual a 1. O modelo Uniforrne tem i pofrlue loclos os seus valores ocorrem com a mesma probabilidade e, pedetnus tlizer quc a probabilidade se distribui uniformemente entre os
1[hrres,
wl r
k:L,2,...,6.
Dessa maneira, temos uma forma abreviada de apresentar varivel e sua funo de probabilidade. Vamos apresentar os principais mode de variveis aleatrias discretas, comeando pelo mais simples a seguir, quo aquele que atribui igual probabilidade a todos os possveis valores da varivel, Definio 3.3: Modelo Uniforme Discreto
Seja X uma varivel aleatria cujos possveis valores so represe t2,r."1,...,tt. Dizemos que X segue o modelo Uniforme Discreto
por
J1 ,
llk
a cada um desses
assumindo a honestidade da ritt, l tttintr:rus lettt it ttrcsma probabilidade de corrncia, com l/100 para cnclit $ Yntlrivel ttletttr'ia cm questo, o n,mero sorteado, segue o rnodelo
2l 'd 25 e meu colega tem outros 5 bilhetes, col'1 os l, I l, .l(), (rtJ c 93. Quem tem maior possibilidade de ser sorteado? prlrreill vistn tcnr-se a impresso de que "espalhar" os nmeros tt
lvrrr nrtnre'rrulrts dc
tcrl
P(X
x.
Ilk: ,V.:i
L,2,... ,k.
gnttltitr l rir. Ncstc sorteio, como no modelo Unilorme cttt lltllnr ou tncllot'probabiliclade clc garrhar clcpcndc dc quantos bilhetes'sc tr n rlrt pirrlit'rtlrtr escolltu tlo nntcro, llrhirlo
t['
70
tl.t
l,
n I t'
o^t
I)iscretos
..l
.,
'-''
7t
classificada como boa ou defeituosa; entrevistado concorda ou no com a afirmao feita; a vacina imunizou ou criana. Estas situaes tm alternativas dicotmicas, que genericamente ser representadas por respostas do tipo sucesso-fracasso. A atribuio de qual respostas ser referida como sucesso feita de modo arbitrrio, mas deve definida claramente para evitar ambigidades. Esses experimentos recebem nome de Ensaios de Bernoulli e d,o origem a uma varivel aleatria com
mesmo nome.
pea
{F
r'nrrsllrril a /rrvore de probabilidades, consideramos que a escolha dos or loi I'cilir a partir de uma populao muito grande. Dessa forma, cadit ebuullritkr torn probabilidade 0,80 de estar imunizado, independente dos vrlrros rllr populao. Se classificamos como sucesso a ocorrncia dc r, lururs ir repetio independente de trs ensaios de Bernoulli. {Lle rlt'srrjirnros estudar o comportamento da varivel X: nmero dc llrrrrrrizrrrkls nesse grupo. Ela assume os valores 0, 1,2 e 3 cont le,ri t'ir['rrlirclas com o auxlio da rvore e apresentadas na tabela:
Eventos
TTT
Probabilidade
X
J
0,8'
0,Bz 0,82
ITI''
I T,'I
T
x 0,2 x 0,2
rII
I,'1,'
J J(:
[(
I
2
1
1
P(X - r) : p'' (7 -
O1L-:r: , r :0,L
T,'1,,
I
J(l
0,8 x
0,22
[( I(
0,2"
repetio de ensaios de Bernoulli independentes d origem importante varivel aleatria discreta denominada modelo Binomial.
Exemplo 3.8.' Sabe-se que a eficincia de ume vacina de 80Vo. Um grupo de indivduos sorteado, dentre a populao vacinada, e submetido a testes averiguar se a imunizao foi efetiva, evento representado por .I. A rvore probabilidades apresen tada a seguir.
. --_-_--_-_-.----..
0,2
I
0,8
,"
o''
0,2
0,8
I'(,
:lue
?rlirti
')
: (i) x
o,g'
x or23-k" k :0,7,2,3.
',,
t
lrrohllliliclirclcs correspondem aos temos do desenvolvimcnto Irr rlr. Newl91 rlo (0,8 + 0,2):, o qr-re justifica o nome escolhiclo pala
72
73
Em muitas situaes prticas, a varivel Binomial aparece a partir de outras variveis, atravs da criao de duas categorias excludentes, como no
excmplo a seguir.
Ilxemplo 3.9: O escore em um teste internacional de proficincia na lngua itrglesa varia de 0 a 700 pontos, com mais pontos indicando um melhor
rlcscmpenho. Informaes, coletadas durante vrios anos, permitem estabelecer o scgr.rinte modelo para o desempenho no teste:
Pontos
P(X
: rl :
(i,)ru (i - p)''-k,
0,L,2,...,n,
lo,200)
0,06.
n;
200,300) 0,15
1300,400)
1400,500)
1500,600)
1600,7001
0,16
0r25
0,28
0,10
- kG-4. \n) Usaremos a notao X -U1,",p) paraindicar que a varivel aleatria modelo Binomial com parmetros n e p.
(n\
nt.
segue o
tr
as
probabilidades so completamente
caracterizadas pela informao dos parmetros. Por exemplo, desejando calcular a probtrbilidade de 3 sucessos numa b(12;0,4) temos
universidades americanas, exigem um escore mnimo de 600 pontos para ruccitar candidatos de pases de lngua no inglesa. De um grande grupo de estudantes brasileiros que prestaram o ltimo exame, escolhemos ao acaso 20 tlclcs. Qual seria a probabilidade de no mximo 3 atenderem ao requisito mnimo ttrcncionado? Vamos admitir que a tabela acima representa o escore dos estudantes que estio prestando esse ltimo exame. Essa uma suposio razoixel tendo em vista clrc a tabela foi feita a partir de um conjunto muito grande de dados. Isto quer rliz,cr que um aluno selecionado ao acaso apresentar um dos vrios escores de ttcordo com as probabilidades apresentadas na tabela. Por exemplo, a chance de nprcsentar menos de 200 pontos 0,06. Admitimos ainda que os estudantes lunsileiros tm comportamento similar aos demais e portanto a tabela tambm
porlc ser usada para representar esse desempenho. Pelo critrio das universidades, o estudante classificado como apto, se neu cscore de 600 pontos ou mais, caso contrrio, ser considerado no apto. l)cssa fbrma, para cada indivduo, teremos a classificao de apto ou no, feita de ttrotlo independente e com as seguintes probabilidades
Vrits
P(x
- :
3)
(lj;o,n'0,6n
-1{e,4s
o,6e
0,142
X
Pt'
0,002
I 0,017
8
-t
0,064
9
0,142
10
0,2r3
11
0,227
12
0,777
P(aPto)
6,99
X
Pt
l
0,101
0,042
0,012
0,002
0+
0+
Definindo uma nova varivel X como o nmero de estudantes aptos tlrttlrc os 20, temos que X - b(20;0,10). A probabilidade de no mximo 3 serem
nptos calculada pela funo de distribuio no ponto 3, ou seja,
de
F(3)
I)'ssr brma, temos:
:P(x<3).
Diversos programas computacionais contm rotinas que calculam as probabilidades da distribuio Binomial e alguns livros-texto incluem tabelas
dessa clistribuiiro, para vrios valores dos parmetros.
!
74
75
r1x 3ly
()
0,1 o,e2o-
e, cnto, podemos concluir por uma expectativa de ll,7 nascimentos com 7 I'ilhotes dentre as 100 inseminaes. Observe que os valores esperados no prccisam ser nmeros inteiros, pois representam uma freqncia terica de
ocorrncia.
e
7
os esperados, se o
2
6
4
23
8 ,)
t0
0 0,1
0,867.
26
2t
20,5
4,4
tr,7
20,5
24,6
t2 I,7
I
1
4,4
Esse valor reflete as altas probabilidades atribudas aos escores menores de 600, conforme o modelo de desempenho no tr
teste.
Exemplo 3.10: Um veterinrio est estudando o ndice de natalidade em porcos sujeitos inseminao artificial. Para tal, coletou informaes sobre a varivel nmero de fllhotes nascidos vivos em cada uma das 100 inseminaes re'alizadas com o mesmo reprodutor. A tabela a seguir apresenta os resultados.
Nmero
Freq. Observada
O modelo proposto parece se ajustar bem aos dados observados (veja a F'igtrra 3.4) e tendemos a acreditar que o modelo Binomial uma escolhn ttdccluada. A representao grfica torna-se assim, um importante passo inicial purt auxiliar na escolha de um modelo probabilstico. A verificao aqui foi
flpcnas visual, mas possvel estabelecer procedimentos estatsticos que testam o ajustc do modelo proposto de forma objetiva. Procedimentos mais rigorosos
)
1
2
6
J 7
4
9a
6 2L
7
L2
8
t)
9
1
devcrn ser utilizados para a deciso final e podem se basear em um teste estirtstico conhecido como Teste de Aderncia. tr
26
muito comum buscar estabelecer um modelo para a varivel de interesse, o que nesse caso possibilitaria, por exemplo, p comparao entre diferentes reprodutores. O veterinrio informa que 11 ou mais filhotes nascidos vivos uma ocorrncia muito rara e pode ser desprezada em termos de model. Nestes termos, ele sugeriu considerar que a varivel N: nmero de filhotes nascidos vivos, poderia ser ajustada pelo modelo Binomial com parmetros n : 10 e p: 0,5. O que voc acha da sugesto do veterinrio? Note que, mesmo no tendo havido nenhuma observao do valor 0 ou 10, o veterinrio sugeriu o modelo de uma varivel que contm esses valores, pois apesar de no serem comuns eles podem acontecer. Com o modelo sugerido, calculamos as probabilidades de cada um dos valores de 0 a 10 e, a partir deles, os resultados que seriam esperados em 100 inseminaes realizadas. Por exemplo,
a o
Observada Esperada
10
P(N
Filhots
de
76
.,.1 Outros
Modelos Discretos
77
mencionar as diferentes formas utilizadas para referenciar os modelos tericos das variveis aleatrias. Por exemplo, alguns autores referem-se a uma varivel aleatria com distribuio Binomial enquanto outros enfatizam uma varivel aleatria seguindo o modelo Binomial. Neste livro, vamos utilizar indistintamente essas duas formas que
essa seo,
consideramos equivalentes.
Ao finalizar
oportuno
b. Escolhemos 20 lmpadas ao acaso na prateleira de um supermercado, sendo 10 de uma fbrica e 10 de outra. Contamos o nmero total de defeituosas. c. Quinze automveis 0 km de uma mesma marca e tipo so submetidos a um teste anti-poluio e contamos o nmero deles que passaram no teste. d. Um motorista submetido a um teste em que deve estacionar seu veculo num pequeno espao (isto popularmente chamado defazer baliza). Em l0 tentativas, contamos o nmero de vezes em que o motorista estacionou
corretamente.
5. Sendo
a.
15 e
P:0,4;
P(X >
2. Sendo X uma varivel seguindo o modelo Uniforme Discreto, com valores no conjunto {L,2,3,.. . , 10}, pergunta-se: a. P(X > 7\. /
'
c.
8).i
\,
6. Urna certa doena pode ser curada atravs de procedimento cinirgi co em 80Vo dos casos. Dentre os que tm essa doena, sorteamos 15 pacientes que sero submetidos cirurgia. Fazendo alguma suposio adicional que julgar nccessria, responda qual _a probabilidade de: ru. Todos serem curados? L-ll. Pelo menos dois ro serem curados? c. Ao menos l0 ficarem livres da doena?
7. Calcule a funo de distribuio da varivel
3. Um usurio de transporte coletivo chega pontualmente s 8 horas para pegar o seu nibus. Devido ao trnsito catico, a demora pode ser qualquer tempo entre 1 e 20 minutos (admita que o relgio "pule" de minuto em minuto).
Pergunta-se: a. Qual a probabilidade de demorar mais de 10 minutos? b. Qual a probabilidade de demorar pelo menos 5 mas no mais de 10 minutos? c. Qual a probabilidade da demora no chegar a 5 minutos? q._ d. Se um amigo chegou 10 minutos atrasado e vai pegar o mesmo nibus (que /n ainda no passou), qual a probabilidade do amigo atrasado esperar at 3
com p :
nos casos:
0,6.
3.3 Outros Modelos Discretos Apresentamos, nesta seo, os modelos Geomtrico, Poisson
lliptrgcomtrico, que tm vrias aplicaes prticas, conforme ilustram
minutos? L
4. Discuta a validade do modelo Binomial nos seguintes casos: a. Dos alunos de uma grande universidade, sorteamos 5 e contamos quantos se declaram usurios de drogas.
os
rrrrr nmero finito de varlores distintos. Foi assim com o modelo Unifbrme l)iscrcto com valores L,2,,..,;, Bernoulli com 0 e L e Binomial com os valores
If,t
78
.1.-l Outros
Modelos Discretos
79
Como veremos a seguir, os modelos Geomtrico e Poisson podem ter um nmero infinito de valores dentre os inteiros positivos. 0,
1,...,n,
P(Q=
0,010 0,008 0,006 0,004
0<p
1le k:0,1,2,....
tr
X- G(p).
0,002
Interpretando p como a probabilidade de sucesso, a distribuio Geomtrica pode ser pensada como o nmero de ensaios de Bernoulli que precedem o primeiro sucesso. Note que a expresso apresentada na Definio 3.6 de fato uma funo de probabilidade, pois positiva e sua soma igual a 1, conforme pode ser verificado atravs da frmula da soma de progresso geomtrica (PG) infinita:
0 4 I 12 16 20 24 28 32 36 40 44 48
Figura 3.5: Modelo Geomtrico (n:0,01).
tc
(1
- p)^ :
r_fr1:
Clorno podemos verificar atravs da figura, a probabilidade vai ficando muito llc(luena para valores grandes de k. Em tese, a produo nunca seria interrompida se rriro houvesse o aparecimento de uma pea defeituosa. tr
Exemplo 3,11: lJma linha de produo est sendo analisada para efeito de controle da qualidade das pas produzidad. Tendo em vista o alto padro requerido, a produo interrompida para regulagem toda vez que uma pea defeituosa observada. Se 0,01 a probabilidade da pea ser defeituosa, estude o comportamento da varivel Q, quantidade de peas boas produzidas antes da la.
defeituosa. Vamos admitir que cada pea processada tem a mesma probabilidade de ser defeituosa, independentemente da qualidade das demais. Sendo a ocorrncia de pea defeituosa um sucesso, podemos aplicar o modelo Geomtrico. Observe que o nmero de peas boas produzidas exatamente o quanto se "espera" para a ocorrncia do primeiro sucesso. Temos,
dada por
0,1,2, ...
a taxa de ocorrncia, A tr
P(Q
O modelo Poisson tem sido muito utilizado em experimentos fsicos e lriolgicos e, nesses casos, a freqncia mdia ou esperada de ocorrncins trtrrn determinado intervalo de tempo, Vamos verificar que a expresso rrprcsentada realmente representa uma funo de probabilidade. No difcil rrlrscrvar que, para qualquer k, ela um nmero positivo. Resta mostrar que tls prrrllabilidades somam 1. Temos,
80
81
e-\e : r'
No clculo acima, usamos que a srie \R' 1kt , somada para valores de k entre 0 e oo, produz e. Esse resultado bastante conhecido e segue do desenvolvimento em srie de Taylor do termo el. O leitor interessado poder consultar, para outros detalhes, textos bsicos de Clculo Diferencial e Integral. Exemplo 3.12: A emisso de partculas radioativas tem sido modelada atravs de uma distribuio de Poisson, com o valor do parmetro dependendo da fonte utilizada. Suponha que o nmero de partculas alfa, emitidas por minuto, seja uma varivel aleatria seguindo o modelo Poisson com parmetro 5, isto , a taxa mdia de ocorrncia de 5 emisses a cada minuto. Calculemos a probabilidade de haver mais de 2 emisses em um minuto. Seja o ntimero de partculas alfa emitidas por minuto. Pelas suposies feitas, temos A - Po(5) e a probabilidade desejada ser
dlrtritruio de Poisson, mas com o valor do parmetro ajustado de forma Ggrrvcniente. Assim, se o perodo de tempo considerado for de dois minutos, tglepros que o nmero de partculas emitidas em dois minutos ter distribuio
Po( l 0),
tr
Eyemplo 3./3; Engenheiros da companhia telefnica estudam se o modelo de Poisson pode ser ajustado ao nmero N de chamadas interestaduais que chegam, durante o perodo notumo. Os dados coletadOS, Fr [ora, a uma central telefnica,
Efl:r'cntes a 650 perodos de uma hora, esto apresentados a seguir:
Chamadas 0
1
Freq. Observada
38
7t
115
r25
106
6 79
>8
57
50
hora
P(A> 2) :t
P(A:a) :1-t
orrcram 4 chamadas. Os engenheiros sugerem rttilizar uma taxa de ocorrncia de 4-5-chamadas pet lrora no perodo estudado. Seguindo o modelo indicado, a freqncia esperada
{g
na
ir'o 12) :
**r"r"t,"*os
ocorrncias com k chamadas obtida multiplicando 650 (o total das bnr-t'vaes) pela probabilidade de k chamadas. Assim, para k : 2, temos
Freq. esperadapara 2 chamadas
650 x
P(N
"-4's
:2)
4152
:650x
P(N=n)
0,1 8
:73,13.
Ee rrurclo anlogo obtemos os demais valores.
2l
0,16
0,14
o,12
0,1 0
0
a
I
38 32,50
2 71
>8
57 56,36
115
125
123,37
106
79
0;08
0,0 6
fllsl'1
7,22
73,13
109,66
111,02
83,27
50 53,56
0,04
0,02
10
12
14
16
18
20
tabela acima parece indicar que o modelo Poisson, com : 4,5 ftl'rrr..c,c unr bom ajuste para a varivel aleatiia de interesse. O leitor pode e'otrslnrir um grfico de freqncia'para visualizar melhor essa aderncia. A cxh.nsiro clessas concluses aos diferentes perodos de tempo e/ou outros tipos de G:hirrrrncla deve ser feita com cuidado, porm o ajuste j obtido uma "boa pista" Flt'n il cscolha do modelo. Como mencionamos anteriormente, a concluso obtida
82
83
aqui poderia ser feita de modo mais objetivo atravs de Testes Estatsticos de
Aderncia.
tr
moclelo surge da contagem de objetos de certo tipo, retirados ao acaso e sem reposio, de um conjunto contendo dois tipos de objetos. Por exemplo, num grupo de jovens com 5 meninas e 5 meninos, sorteamos 3 deles ao acaso, para azer uma comisso. O sorteio ser feito sem reposio, para evitar a escolha de utri mesma pessoa, o que inviabilizaria a formao da comisso. Na primeira escolha cada um dos 10 jovens tem 1/10 de probabilidade de ser sorteado. Na segunda, cada um dos 9 restantes, ser sorteado com probabilidade I/9 e, na terceira, 1/8. A varivel aleatria nmero de meninas na comisso segue o modelo Hipergeomtrico, conforme definido abaixo.
caixa pode ter peas boas ou defeituosas e vamos sortear algumas pcas, sem reposio. Baseado no nmero de peas defeituosas encontradas rlccidimos por aceitar ou rejeitar o lote. Seja D a varivel que conta o nmero de pcras defeituosas neste sorteio. Ela segue o modelo Hipergeomtrico e vamos itlcrrtilicar os diversos parmetros. O total de peas n:25, o nmero de
elel'cituosas
4 e o nmero de retiradas
r:
5.
p(D<r)
Definio
3.8
: Modelo Hipergeomtrco
('J)
Considere um conjunto de n objetos dos quais mso do tipo I e n - m so do tipo II. Para um sorteio de r objetos (r < n), feito ao acaso e sem reposio, defina X como o nmero de objetos de tipo I selecionados. Diremos que a varivel aleatria X segue o modelo Hipergeomtrico e sua funo de probabilidade dada pela expresso
,^., _ P(X:*)-
C-onclumos que, mesmo havendo quatro defeituosas na caixa inspecionada, a probabilidade de aceitar o Iote 0,984 ou, equivalentemente, para rejeitar o lote a
(T)
(",--T
/n,\ ("/
) ,k:A,I,...,min(r,rn). _ ., , ^;^t_
,-
tr
prolrabilidade 0,016. Claro que, na prtica, no saberemos quantas peas rlccituosas existem em cada caixa. Entretanto, a probabilidade calculada acima purlcria ser um indicativo para avaliar se o critrio do controle de qualidade est t'rrzoiivel ou no e, neste caso, parece que no! Poderamos tambm criar uma tobcla contendo os valores da probabilidade de rejeio do lote, em funo de tr Irrrvcr certo nmero de peas defeituosas na caixa sorteada.
l,lxcrccios da Seo 3.3:
Note que os valores possveis de X vo de 0 a min(r,rn), uma vez que podemos ter mais do que o nmero de objetos existentes do tipo I, nem no tillnpouco mais que o total de sorteados. Utilizando resultados de anlise combirratria, pode-se verificar que a expresso de P(X : k) um nmero no negativo entre 0 e 1 e a soma, para todos os valores de k, igual a l. Assim esto cumpridos os requisitos necessrios para ser uma funo de probabilidade. Exentplo 3.14: Uma ftbrica produz peas que so embaladas em caixas com 25 unidades. Para aceitar o lote enviado por essa fbrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco peas, sem reposio, dessa mesma caixa. Se constatar no mximo dr"ras defeituosas, aceita o lote fornecido pela fbrica. Se a caixa sorteada tivesse 4 pcas defeituosas, qual seria a probabilidade de rejeitar o lote?
l.
b.P(2<X<4).
2).
2. IJrrrir moeda equilibrada lanada sucessivamente, de modo independente, at (f ue ocorra a primeira cara. Seja X avarivel aleatria que conta o nmero de
lirnamentos anteriores ocorrncia de cara. Determine: u. P(X < 2). b. P(X > 1).
c.P(3<x<5).
rl.
Quantas vezes deve, no mnimo, ser lanada a moeda para garantir a ocorrncia de cara com pelo menos 0,8 de probabilidade.
8{
3,4 [ixerccios
3.
b.P(2<Y <4).
c.
P(Y <
2),
P(Y >
d.
P(Y: 1l]'<
0).
3).
LJrna agncia de turismo apresenta aos clientes o oramento de uma certa viagem em duas partes. A primeira o transporte areo que tm trs opes com preos 3;3,5 e 4 mil reais e preferncias de escolha de 0,5; O,3 e 0,2 para ;rs companhias TWA, TWB e TWC, respectivamente. A segunda parte do
4. A aplicao de fundo anti-corosivo em chapas de ao de 1 m2 feita mecanicamente e pode produzir defeitos (pequenas boihas na pintura), de ncordo com uma varivel aleatria poisson de parmetro : t p, *2. -a
chapa sorteada ao acaso para ser inspecionad, pergunta-se a probabilidade
de:
prcferncia, independentemente da companhia area. Seja x a varivel irlcatria oramento da viagem. Calcule a funo de probabilidade e a funo rlc distribuio da varivel X .
or'amento a escolha de estadia. Existem quatro opes de hotis que custam 2; 2,5; 3 e 3,5 mil reais e so escolhidos pelos clientes com a mesma
n. Encontrarmos pelo menos I defeito. b. No mximo 2 defeitos serem encontrados. c. Encontrarmos de 2 a 4 defeitos. d. No mais de 1 defeito ser encontrado.
5. A varivel 11 segue o modelo Hipergeomtrico com parmetros a r' : 4. Determine: a, P(H :2). b. P(H < L). c. P(f/ > 0).
n:
r0,m
Urn equipamento consiste de duas peas A e B que tm 0,10 e 0,15 de ;lrobabilidade de serem de qualidade inferior. um operrio escolhe ao acaso utni pea tipo A e uma tipo B para construir o equipamento. Na passagem pelo controle de qualidade o equipamento vai ser classificado. Ser considerado como nvel I, se as peas A e B forem de qualidade inferior. ser nvel II, se trrna delas for de qualidade inferior e, nvel III, no outro caso. o lucro na venda dc R$ 10, R$ 20 ou R$ 30 para os nveis I, II ou III, respectivamente. Como se
cornporta a varivel lucro? Para dois equipamentos vendidos, obtenha a funo
6. Por engano 3 peas defeituosas foram misturadas com boas formando um lote corn l2 peas no total. Escolhendo ao acaso.,4 dessas peas, determine a
probabi lidade de encontrar: n. Pelo menos 2 defeituosas. b. No rnrximo I defeituosa. c. No mrrimo I boa.
t
3.4 Exerccios
Na verificao de mquinas, observam-se as partes eltrica, mecnica e estrutural. A probabilidade de aparecer uma falha em cada uma das partes 0,01; independente das demais. ocorrendo falha, o tempo de conserto ro,z0 orr 50 minutos para falha eltrica, mecnica ou estrutural, respectivamente. Se rr alha eltrica aparece junto com a falha mecnica, teremos ainda um ircrscimo de 20 minutos. Para uma mquina escolhida ao acaso, qual a lrrobabilidade do tempo de interrupo (se no h falha, esse tempo , zero): tt. Durar menos de 25 minutos?
b. Ultrapassar 40 minutos?
l.
urn agricultor cultiva laranjas e tambm produz mudas para vender. Aps irlguns meses a muda pode ser atacada por fungos p.bubilidade 0,0j e, nesse cASo, ela escolhida para ser recuperada com "oprobabilidade 0,5. Admita que o processo de recuperao infalvel. o custo e cada muda produzida l$ 1,00; acrescido de mais R$ 0,50 se precisar ser recuperada. Cada muda vorrdida a R$ 3,00 e so descartadas as mudas no recuperadas de ataque de lngos. Estude como se comporta o ganho por muda produzida.
cstngirrios e admitimos que todos os anos tm igual nmero de estudantes intcressados no estgio (considere a populao de candidatos muito grande de trulclo a no haver diferena entre escolher com ou sem reposio). pergunta-se ;r protrabilidade de:
86
.1.4
Exerccios
87
a. Os dois serem do primeiro ano? b. A empresa gastar no mximo 3 salrios mninos com os estgios? c. Sabendo que gastou pelo menos 4, gastar menos de 7 salrios mnimos?
6. Uma varivel aleatria
9. Num certo restaurante, paga-se pelo almoo uma quantia fixa dependendo da escolha feita de prato e bebida. A carne de peixe tem I}Vo de preferncia, enquanto frango tem 40Vo e carne bovina 50Vo. As trs escolhas de bebida esto condicionadas opo do prato, segundo a tabela abaixo:
Opo:Peixe P(Bebida Peixe)
Opco: Frango P(Bebida I Frango) Cerveia
",rr:
Determine:
a.
Agua
0,3
0,4
Cerveia
Azua
0,5 Agua
0,3
Cerveja 0,6
A funo
b. P(x c. P(X
e.
d.P(3<X<12).
P(X >
14).
<
< -2).
2).
de probabilidade de
Vinho
0,1
0'3
Frango
Bovina
Cerveja
6
Agua
J
Vinho
9
l5
t8
7. Estatsticas de acidentes, num trecho da rodovia SP330, indicam probabilidade de 0,05 de haver um acidente durante a madrugada (24 s 6 horas). Em ocorrendo um acidente nesse perodo, a chance de gerar vtimas de 0,5. Ainda considerando o perodo acima, se acontece um acidente com vtima, ela ser fatal com probabilidade 0,1. o servio de ajuda aos usuriqs :utiliza 2 veculos na inspeo do trfego naquela rea. A esse nmero, acrescentamos mais 2 se houver acidente. Se o acidente tem vtimas, acrescente aos anteriores mais 2 veculos e, finalmente, acrescente mais 1 se a vtima for fatal. Encontre a luno de probabilidade da varivel aleatria ntimero de veculos em servio de auxlio nessa estrada durante a madrugada.
ru. Dado que algum escolhe peixe, qual a probabilidade de que escolha cerveja? ll. Se escolhe carne bovina, qual a probabilidade de tomar vinho? c. Sabendo que tomou gua, qual a chance de ter escolhido frango? tl. Determine a funo de probabilidade para cada uma das variveis X: preo do almoo e Y: preo do almoo para aqueles que preferem cerveja.
8. Em treinamento de
animais, usa-se
pela primeita vez, com probabilidade 0,5. Caso falhe, a probabilidade de realizar corretamente na segunda tentativa cresce I\Vo, ou seja, a probabilidade , agora 0,55 e assim sucessivamente. Admita que o experimento termina em quatro tentativas ou antes, na primeira vez que o macaco acertar. Descreva o
comportamento probabilstico do nmero de tentativas.
l(1. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para rrrrra famlia com trs filhos, calcule a probabilidade de que: a. Exatamente dois sejam do sexo masculino. ll. Pelo menos um deles ser do sexo masculino. c. Todos serem do sexo feminino.
lf . tJrn time paulista de futebol tem probabilidade 0,92 de vitria sempre que
ioga. Se o time a\uar 4 vezes, determine a probabilidade de que vena n. Toctas as 4 partidas.
88
.1,,1
lixerccios
89
12.tJm certo equipamento expedido em lotes de 500 unidades. Antes que uma remessa seja aprovada, um inspetor escolhe 5 desses equipamentos e os inspeciona. Se nenhum dos equipamentos inspecionados for defeituoso, o lote aprovado. Se um ou mais equipamentos forem defeituosos, todos as unidades so inspecionadas. Suponha que existam, de fato, dez equipamentos defeituosos no lote. Utilizando uma suposio conveniente, qual , a probabilidade de que seja necessrio testar todos os equipamentos?
13. Suponha que um modelo terico para a varivel notas em um teste de histria
lS.Considere uma varivel aleatria Xassumindo os valores 0,1,2,...,5 e tal clLre P(X : j) :/c x 0,8 x 0,2i, i : 0,L,2,...,5. ir. Para qual valor de k a expresso acima uma funo de probabilidade? lr. Calcule P(X :3 I X < 5).
lr. Uma vacina contra a gripe eficiente em707o dos casos. Sorteamos, ao acaso,
20 dos pacientes vacinados e pergunta-se a probabilidade de obter: ru. Pelo menos 18 imunizados. b. No mximo 4 imunizados. c. No mais do que 3 no imunizados, 17. 25Vo dos universitrios de So Paulo praticam esporte. Escolhendo-se, ao ilcilso, 15 desses estudantes determine a probabilidade de: a. Pelo menos 2 deles serem esportistas. b. No mnimo 12 deles no serem esportistas: c. Havendo mais de 5 esportistas no grupo, obtermos menos de 7 que praticam
esporte.
(X),
dado por:
P(X:
Para
i1
lj -
111
66
, j:0,7,2,...,10.
2l
notas:
80Vo de
probabilidade de serem completamente curadas. Para um grupo de 12 pacientes lessas condies, calcule a probabilidade de: :r. Oito ficarem completamente curadas. ll. No serem curadas de 3 a 5 pacientes.
c. No mais de 2 permanecerem com a doena.
5
1
19. A resistncia (em toneladas) de vigas de concreto produzidas por uma clrpresa, comporta-se conforme a funo de probabilidade abaixo:
Resistncia
14. Um laboratrio estuda a emisso de partculas de certo material radioativo. Seja l/; nmero de partcula; emitidas em I minuto. O laboratrio admite que l/ tem funo de probabilidade Poisson com parmetro 5, isto ,
P(.^/
partculas.
k)
:;, --5 ^A
k:0,7,2,....
de
Admita que essas vigas so aprovadas para uso em construes se suportarem pclo menos 3 toneladas. De um grande lote fabricado pela empresa, cscolhemos 15 vigas ao acaso. Qual ser a probabilidade de:
a. Todas serem aptas para construes?
b. Determine a probabilidade de que pelo menos uma partcula seja emitida em um minuto. c. Qual a probabilidade que, em um minuto, o nmero de partculas emitidas esteja entre 2 e 5 (inclusive)?
90
3,4 Ii.rerccios
91
24, Considere uma varivel aleatria X - G (0,8). Construa uma nova varivel )/ tal que Y : X para os valores 0,1,2,...,5 e Y : 6 para X ) 6. Dessa rrma, Y corresponde ao truncamento de X a valores menores ou iguais a 6. ( )btenha a funo de probabilidade de Y e calcule:
r. P(Y
:2).
21. IJma indstria de tintas recebe pedidos de seus vendedores atravs de fax, telefone e Internet. o nmero de pedidos que chegam por qualquer meio (no horrio comercial) uma varivel aleatria discreta com distribuio Poisson com taxa de 5 pedidos por hora. a. Calcule a probabilidade de mais de 2 pedidos por hora. b. Em um dia de trabalho (8 horas), qual seria a probabilidade de haver 50
pedidos? c. No haver nenhum pedido, em um dia de trabalho, um evento raro?
b. O valor da funo de distribuio (acumulada) no ponto 2,5. 3lY < 5). c. P(Y
d.P(Y>3eX<8).
25. A durao (em centenas de horas) de'uma lmpada especial segue o modelo Ceomtrico com parmetro t :0,7. Determine a probabilidade da lmpada: rr. Durar menos de 500 horas. b. Durar mais de 200 e menos de 400 horas. c. Sabendo-se que vai durar mais de 300 horas, durar mais de 800 horas. rl. O item anterior uma aplicao de um resultado geral vlido para o modelo
22. No estudo do desempenho de uma central de computao, o acesso unidade central de Processamento (cPU) assumido ser poisson com 4 requisies por segundo. Essas requisies podem ser de vrias naturezas tais como: imprimir um arquivo, efetuar um certo clculo ou enviar uma mensagem pela Internet, entre outras. a. Escolhendo-se ao acaso um intervalo de 1 segundo, qual a probabilidade de haver mais de 2 acessos cPU? E do nmero de acessos no ultrapassar
5?
Geomtrico. Assim, mostre que para X inteiros positivos rn e n,vale P(X > m *
2r.
l}n um estudo sobre o crescimento de jacars, uma pequena lagoa contm 4 cxemplares de espcie A e 5 da espcie B. A evoluo de peso e tamanho dos 9 .iacars da lagoa acompanhada pelos pesquisadores atravs de capturas pcridicas. Determine a probabilidade de, em trs jacars capturados de uma vcz, obtermos:
ru.
b. considerando agora o intervalo de 10 segundos, tambm escolhido ao acaso, qual a probabilidade de haver 50 acessos?
Todos da espcie A.
23. Toda manh, antes de iniciar a produo, o setor de manuteno de uma indstria faz a verificao de todo o equipamento. A experincia indica que em 95vo dos dias tudo est bem e a produo se inicia. caso haja algum problema, uma reviso completa ser feita e a indstria s comear a trabalhar aps o almoo. Faa alguma suposio adicional que julgar necessria e respond:
a. Qual a probabilidade de demorar 10 dias para aprimeira reviso completa? b. E de demorar pelo menos l5 dias? c. um esquema de manuteno, com reviso preventiva, est sendo montado de modo a evitar a reviso completa num dia aleatrio. Deterrrine um dia d,
27,
descuidado mistura 4 exemplares defeituosos junto com outros 16 pcrfeitos de um certo livro didtico. Quatro amigas vo a essa livraria para cornprar seus livros escolares. ir. Calcule a probabilidade de 3 levarem livros defeituosos. ll. Qual a probabilidade de, aps a visita dessas meninas, restarem o mesmo nmero de defeituosos na livraria? E de no restar nenhum?
Un livreiro
tal que probabilidade de quebra alm de d seja pelo menos igual a 0,6.
2ll. (Use o computador) Para os dados apresentados na Tabela l.l no Captulo l. l. Construa a tabela de freqncias para a varivel Exer, horas de atividade i'sica por semana. b. Suponha que 5 pessoas so selecionadas ao acaso. Qual a probabilidade de que 3 delas pratiquem, pelo menos, 6 horas de atividade fsica por semana?
92
c. Repita o item (b) calculando a probabilidade de todas as pessoas escolhidas praticarem pelo menos 6 horas de atividade fsica.
Captulo 4
29. (Use o computador) Considere a varivel altura apresentada na Tabela 1.1, Captulo 1. a. Crie uma varivel lj assumindo o valor 1 se a altura do indivduo e for maior que a mdia de altura da populao (indivdu os altos) e 0 caso contrrio (indivduos baixos). Apresente a distribuio de freqncia para
esta varivel e uma representao grfica adequada.
Medidas Resumo
4.1 Introduo
Neste captulo, vamos apresentar algumas medidas que buscam sumarizar s informaes disponveis sobre o comlortamento de uma varivel. podemos del'inir essas medidas nos casos de ur.t cilnto de dados u de uma funo de prrrbabilidade de varivel aleatria. Apesar danatureza diferente de cada caso, as itcrtlidas tero a mesma interpretao, variando apenas na forma de serem
trlcu ladas.
um deles ser associada uma varivel V, ,i:1, ..., 13. Defina X: nmero de alunos altos. Como voc expressaria X em termos das variveisY, i,: 1, ..., 13? c. Obtenhauma amostra de 100 valores da varivel X, isto , repita 100 vezes o sorteio de 13 alunos nas condies do item (b). Construa uma tabela de
freqncias.
b. Suponha que
adequado para as variveis Y;, 'i : L,...,73? O modelo Binomial se aplica para X? Em caso afirmativo, quais seriam os parmetros? Justifique suas resposta. (Uma boa idia calcular valores esperados e observados e coloc-los em um mesmo
Illg,ttrnas tcnicas para estudar e apresentar descritivamente quantidades na peipulao, seja por tabelas de freqncias ou por grficos adequados. o conjunto tle dados com que trabalhamos poderia ser toda a populao ou apenas uma parte
a oportunidade de discutir
grfico).
e. Assumindo que o modelo Binomial adequado para
i. Calcule P(X
X:
ir'. Qual a probabilidade de pelo menos 4 alunos serem baixosT E de mais de 7 e menos do que 12 alunos serem altos?
"
delir. J estudamos, no captulo anterior, que a representao de eventos de lnlcrcsse pode ser feita atravs de variveis aleatrias discretas e definimos alguns ntotlclos cuja ocorrncia na vida prtica mais comum. Nosso interesse caracterizar o conjunto de dados atravs de medidas que fsstlllim a informao, por exemplo, representando a tendncia central dos dados gu ir rnaneira pela qual estes dados esto dispersos. Tais medidas tambm podem FL'r' tlcfinidas para variveis aleatrias, permitindo caracteriz-las de forma etrrclhante ao que feito para um conjunto de dados qualquer.
4.2 Medidas de Posio Se estamos numa parada de nibus urbano e nos pedem alguma llr'orrnao sobre a demora em passar um determinado nibus, que diremos?
Nirrgtrrn imagina que poderamos dar como resposta uma tabela de freqncias rltr(' l)acientemente coletamos no ltimo ms, ou ano! Tampouco, seria adequado ttllt1'scltar um modelo terico pelo qual teramos ajustado o comportamento da
parmetros
n: l0 e
: 0,5
virrirvcl aleatria de interesse. Quem perguntou deseja uma resposta breve e t,tllrirla que sintetize a informao que dispomos e no uma completa descrio dos
tlltrlos colctados ou da modelagem que porventura fizemos.
e3
94
95
Nesta seo, definiremos medidas de posio ot medidas de tendncia central para um conjunto de dados qualquer (populao ou amostra) e, ento, consideraremos as correspondentes definies para variveis aleatrias.
o nmero de parafusos, em cada caixa, um valor inteiro, porm, a Ftrlirr no precisa ser necessariamente um nmero inteiro, Para este exemplo,
Notcr que tclrros que, em mdia, as caixas contm 98,6 parafusos.
Considere uma varivel X com observaes representadas por 1,t2,... ,tn,. A mdia desse conjunto a soma dos valores dividida pelo nmero
total de observaes. Isto
,
n
Colocando os dados em ordem crescente, obtemos: 95,96,97,98,99,99, 100 e 102. Neste caso, como o nmero de elementos no conjunto de 100, 100, datlos 10, um nmero par, tomamos a mediana como sendo a mdia dos dois
Yhrrcs que ocupam a posio central. Temos
ftrdrh,
: 99+99
99.
Iohs:
rL+ir2*..,*rI,
i:T n
D*u
- L00. tr
mo,,6r(X)
X tr
As medidas de posio podem ser utilizadas em conjunto para auxiliar a dos dados ou, em determinadas situaes, uma pode ser mais conveniente ndliso a outra. Por exemplo, se um ou mais valores so muito discrepantes do que rpr,: 6o gerirl das observaes, a mdia ser muito influenciad.a por este valor, tornando1 nssirn, inadequada
Note que as definies acima tambm podem ser aplicadas quando o conjunto de dados j est organizado numa tabela de freqncia. Por exemplo,
para a mdia temos
lxirs ao invs de 95 tivesse 45 parafusos, a mdia passaria de 98,6 para 93,6. NcFl('' cilso, como a mediana no afetada por valores discrepantes, seu uso seri0 ffiis irclcquado para representar os dados. Por outro lado, para conjuntos de dados ttr rrruitas observaes, a mediana difcil de ser calculada, uma vez que o pfoccsso de ordenao custoso, mesmo com o uso de computadores. nindn
rohs:
TT'xAt
A:
o aparecimento de distribuies multimodais, isto , conjuntos de dados possuem mais de uma, moda. Como regra geral, .precisamos usar essfls QE:-r ffieclitlirs com o cuidado de no distorcer informaes e caractersticas dos dados
Egtttrrrrr
qu rlril iunos analisando.
k diferentes valores, ponderada pelas respectivas freqncias relativas de ocorrncia. De modo anlogo tambm
e, assim, 7n6, pode ser pensada como a mdia dos
llm muitos casos, a varivel de iqteresse no observada diretamente e lro do conjunto original de dados. Assim, pode ser necessrio considerar Unln originais multiplicados ou acrescidos de constantes para produzir.um s vrrlorcs lltivo corrjunto de valores. Nos prximos exemplos, estudamos como as medidas de grosiiro se alteram e veremos como podem ser obtidas a partir das respectivas flterlirlirs do conjunto original.
El'entplo y'.2.. Nas caixas de parafusos do Exemplo 4.1, vamos admitir um custo de ,' p,rr paraso e de e pela embalagem da caixa. Desejamos calcular as medidas ele lrtrsio clo custo total (T), definido como a soma dos custos dos parafusos c dtt t'rrrlrirhgcm. Iniciamos, calculando as novas medidas de posio apenas pira o ulttt lqttido por caixa (.L), isto , o custo dos parafusos contidos na caixa sem it
10 caixas de um lote tiveram o nmero de parafusos contados, fornecendo os valores 98, 102, 100, 100, 99,97,96,95,99, 100. Para essas caixas, o nmero mdio de parafusos ser dado por
9()
embalagem. Temos,
,,!0/l'
9Bc
MdiadeL:lnbs:
Para a mediana segue que,
I02c
*.'. * 100c
10
986 c
10
98,6 c.
md'o1,"(X)
75" + 76"
I+2
1.
mdr,6r(L)
:99c,
e, sern maiores dificuldades, moo65(L) : 100 c. Conclumos que a multiplicao ;rcla constante c resultou em que as novas medidas de posio so as antigas nrultiplicadas por c.
stilrular. Para simplificar um pouco a situao, vamos supor que se atribui, para du irluno, uma despesa fixa de R$ 1300, relativa preparao e mais R$ 50 para Eeltr vcstibular prestado. De posse dessas informaes, vamos calcular as medldas e posio da varivel D: despesa com vestibular. Pela definio desta nova
QUnrrlirladc temos
Vamosincluiragoraocustodaembalagem.Ascaixascustaro 98c
Entro,
50x
t! --
e,
L02c*e,...,
100
c+e.
oh.,:50 x
1,73
1300
:
1375; 1350.
,,hs:
(9Bc
+ e) +... + (100c + e) _
10
9B6c
* 10e
10
:98,6c *
md,o1,r(D)
e.
1,5
* 1300 :
1300
Il fcil ver que para a mediana md"6,(T) : 99c * e e que para a moda, tno,1,"(T): 100c * e. Dessa forma, o acrscimo por uma quantidade e teve o e'eito de somar essa mesma constante s medidas de po.sio. n Iixemplo 4.3: Foram coletadas 150 observaes da varivel x, representando o
ttnlaro de vestibulares FUVEST (um por ano) que um mesmo estudante prestou, Assim, foi observado que 75 estudantes prestaram vestibular FUVEST, uma nica vcz, e assim por diante. Os dados esto na tabela abaixo:
mo"1,"(D)
50
x 1+
fI
mnimos):
fuenplo 4.4: l-lm estudante est procurando um estgio para o prximo ano. As Btttltrurlrias A e B tm programas de estgios e oferecem uma remunerao por
lr,,r',,* semanais com as seguintes caractersticas (em salrios
B
2,0
1.9
)5
T,7 1,5
l,g
X,
obtemos
I $#t'l''' \'
Ix75t_2x47-t3x2I+4x7 :
150
Lr73;
lrricialmente vamos discutir as informaes fornecidas, supondo que o lttttlirrrtc tert seu salrio "escolhido" de acordo com uma poltica salarial FcErrrrritlir na tabela anterior. A companhia tem 50vo dos seus estagirios @r'elrrtttltl (: l,'7 salrios mnimos e o valor com maior freqncia de ocorrncia , f ,t, ('rrro a mdia 2,5 deve haver alguns poucos estagiiios com salrio bem lltris irlo, isto , valor alto de salrio com freqncia pequena de ocorrncia. A Elrtlrttttltiit R tem as trs medidas bem prximas indicando umaazovel simetria ltttr: slltrios altos e baixos. A opo do estudante depender de sua qualificao.
9,
99
Se ele for bem qualificado, deve preferir a companhia ,4, pois ter mais chance de
obter um dos altos salrios. Se tiver qualificao prxima ou abaixo dos outros cstudantes, deve preferir a B que parece ter uma poltica mais homognea de
salrios.
irlgurnas situaes, as desigualdades so satisfeitas por qualquer valor num o intervalo e, nesse caso, tomamos a mediana como o ponto mdio do
tr
vamos, agora, descrever algumas medidas associadas s variveis aleatrias eue, como j mencionamos, sero correspondentes s medidas
apresentadas para um conjunto de dados.
A moda o valor (ou valores) da varivel que tem maior probabilidade de Egrt'ttcia, representando-a por Mo, temos
P(X : Mo) :
tr
esperado como sntese de toda a informao pode levar a distores e interpretaes equivocadas. Em especial, possvel construir uma funo de probabilidade, com valores da varivel muito diferentes uns dos outros, em que a rndia no caracteriza o real comportamento da varivel aleatria. A mdia junto com a moda e a mediana so medidas de posio ou de tendncia central e so
clefinidas a seguir.
sabemos que a descrio completa do comportamento da varivel aleatria discreta , feita atravs da sua funo de probabilidade. Assim sendo, razovel pensar que, qualquer que seja a quantidade destinada a resumir esse comportamento, sua definio dever envolver, de alguma forma, essa funo de probabilidade. A medida mais popular o valor esperado, ou simplesmente mdia, el representa o ponto de equilbrio da distribuio de seus valores. Da mesma forma, como mencionado no caso de um conjunto qualquer de valores, o uso do valor
Enttts.
/,.=
t i ipi: (-
A mrrrll o valor com maior probabilidade e, portanto, segue q1ae Mo: 15. Por ltnr lnclo, a mediana poder ser qualquer nmero entre 10 e 15, pois, para P e I ttt, J.5], temos
Suponha que os possveis valores da varivel aleatria sejam rcpresentados por tt, 12, . . . , t., com correspondentes probabilidades 'l)t,'l)2,',. ,Pk.
De.finio 4.2: Medidas
de posio
Md:12,5
tr
A
cxprcsso:
ol
dada pela
E(X)
'
: Dr,
O$serve que nem a mediana, nem a mdia precisam ser valores assumidos peln vrrrirvel aleatria. No exemplo anterior, a mdia de X foi 8,5 e a mediana 13,i tpro so valores no assumidos pela varivel aleatria' l)c modo similar ao ocorrido com as medidas de posio num conjunto de dcrl,rs, ir rnultiplicao ou a adio de constantes a uma varivel aleatriafaz com gue suis medidas de posio fiquem multiplibadas ou acrescidas pelas mesmas
Elllslitttlcs.
ou
i:L
Eremplo 4... Considere uma v. a. X com funo densidade discreta dada por
umer notao alternativa representar E(x) por px ou simplesmente Itouver possibilidade de confuso. A mediana o valor Md que satisfaz s seguintes condies
p,
se no
Nnrr rl tlil'cil verificar que f/ : 10,3; Md : 8 e Mo : 5. Se uma nova varixelY rrlrlitlir it partir de X atravs de Y : 5 X - 10, sua funo de probabilidade ser
100
o clculo Fv
Ressaltamos que, no caso de conjunto de dados, usamos letras minsculas pnrit denotar as referidas medidas, eniluanto, no caso de variveis aleatrias, Ulilizamos letras maisculas. Como mencionamos, a interpretao feita de modo
das suas medidas de posio pode ser feito pela definio. Temos
g x 0,1 * 15 x
4L,5)
Md(Y) :
Mo(Y)
l.
Estes mesmos resultados poderiam ser obtidos a partir das medidas de posio de X multiplicadas por 5 e subtradas de 10. Isto ,
Esta propriedade
tr
Na Tabela 4.1, apresentamos as expresses para as medidas de posio para as duas situaes estudadas: conjunto de dados e varivel aleatria.
Tabela 4.1: Medidas de tendncia cntral.
disponveis dados mensais sobre a incidncia de envenenamento por picada de cobra. Deseja-se planejar a compra mensal de antdoto. lr. O nmero dirio de usurios, entre 17 e 19 horas, de determinada linha de nibus foi anotado. Pretende-se utilizar essa informao para dimensionar a frota em circulao c. Um fabricante de baterias deseja divulgar a durabilidade do seu produto e coleta a informao sobre a durao de 100 de suas baterias. tl. Num vo internacional uma companhia serve dois tipos de pratos no jantar: peixe ou frango. Um banco de dados contm os pedidos feitos nos ltimos 200 vos. Pretende-se planejar o nmero de cada tipo a ser colocado disposio dos passageiros.
tu. Esto
2, Vinte e cinco residncias de um certo bairro foram sorteadas e visitadas por um cntrevistador que, entre outras questes, perguntou sobre o nmero de tclcvisores. Os dados foram os seguintes:
2,2,2,3,7,2,1,
rlc posio.
1, 1, 1, 0, 1,
2,2,2,2,3,r,1,
3, 1, 2,7,0 e
2. ^eai#
//
.1. Ntrrn experimento, l5 coelhos foram alimentados com uma nova rao e seu pcso avaliado ao fim de um ms. Os dados referentes ao ganho de peso (em r;uilogramas) foram os seguintes:
I
e 2,2.
mediana desse
conjunto. lr. Organize uma tabela de freqncia com faixas de amplitude 0,2 a partir de 1,5'
t02
103
Ee
rtumente os altos rendimentos de alguns residentes sero suficientes para fazer mundo, porm trrclia atingir um patamar comparvel s melhores economias do grande. O que podemos e rliscrepnca entre os diversos valores deve ser muito cntrrr.esquecendo a variabilidade dos valores da varivel e isto no captado
4. Sendo
uma varivel aleatria com funo de probabilidade dada a seguir, obtenha as medidas de posio 1t, Md e Mo.
pelrr rnia e sim pelas medidas de disperso' Por exemplo, para o conjunto de Vnl.,,'cs 0, 20 e 40 a mdia igual a 20. O mesmo acontece com o conjunto 20, 30 c 20. Os dois conjuntos tm valores bem diferentes, apesar de terem a mesma
a-.''
> Md.: Mo. Md < Mo. < t-L 6. um atacadista recebe
b.
c.
pr,
fltrliir. De fato, fctl construir exemplos onde dois conjuntos de dados distintos possuem medidas de posio idnticas. Em muitas dessas situaes existe
li'.r"no em relao disperso dos dados, isto , quanto maneira como os Valer.cs de cada conjunto se espalham. A fim de quantificar tal aracterstica, vtliuos definir algumas medidas de disperso'
Dc,f'ittio 4.3: Amplitude de uma varidvel em utn coniunto de dados
5. Para cada item abaixo, construa uma_varivel aleatria que atenda as condies indicadas. . p: Md : Mo.
( -"
A amplitude, referente a uma certa varivel, definida como a diferena n por A. lltr.c o maror e o menor valor do conjunto de dados. Ser denotada
de vrios fornecedores uma certa pea para revenda. A pea produzida com material de qualidade diferente e, portanto, tem custo
A amplitude s leva em conta dois valores de todo o conjunto e, assim, as er.iir mais cnveniente considerarmos uma medida que utilizasse todas em observao ltscrvaes. Uma idia inicial considerar o desvio de cada nttrilr do que a referncia, o desvio
egtlir.
diferenciado. Levando em conta a proporo fornecida e o preo apresentado por cada fabricante, pode-se admitir que o custo de uma pea em reais, escolhida ao acaso, uma varivel aleatria (C). Admita a seguinte funo de probabilidade para C:
seja felrriro a um ponto de referncia e ento tomar sua mdia. caso a observao seria negativo, caso seja maior, positivo' A de sinais diferentes se compensem, que termos Fqrrur cle tais desvios far com p6tlcrrclo ocultar o efeito da variabilidade. Esta dificuldade discutida no exemplo
a. Determine as medidas de posio davarivgl C. b. Suponha que o atacadista revenda cada uma dessas peas acrescentando 50% sobre o custo da pea, alm de um adicional de R$0,10 pelo frete. Calcule as medidas de posio davarivel preo de revenda.
E,rttttplo 4.7: Numa classe com 12 alunos de um curso de ingls, os alunos llrlir:itt'am o nmero de outras lnguas (alm do portugus e ingls) que tinham 1, 1, Hlg,rrrla familiaridade. Os resultados ordenados foramos seguintes: 0;0,0,0, obtemos e mediana a e a mdia dificuldade sem f , l, I ,2,2 e 4. Calculamos
iT,,/,r
13f 12 e md,,6*
L.
mediana
ex;rlcssito
[], 0, 0, 0, ]-, 1
ri -
m(1o65.
e 3.
impresso de pequena variao. Um caminho que trlcr.nirtivo seria tomar a mdia dos valores absolutos dos desvios acima, o rllrrrrtttitttdo tlesvio mediano e definido por
104
4,.1
Medidas de Disperso
105
uma outra maneira de calcular os desvios em relao mdia e, neste caso, a expresso a ser usada r,; - rotr. A soma desses desvios sempre d zero se o clculo for feito sem arredondamento e, portanto, a mdia deles tambm sempre zero. Dessa maneira, essa medida no seria nada informativa sobre a disperso das observaes. Entretanto, podemos tomar os valores absolutos obtendo o desvio m,dio, que definido como a mdia dos valores absolutos dos desvios em
relao mdia. Isto , desvio
Exemplo 4.8: No Exemplo 4.1, foram fomecidas as quantidades de parafusos em l0 caixas de um lote. Pelos valores observados, o maior nmero de parafusos foi 102, ao passo que o menor foi 95. Logo, a amplitude ser dada por
A--102-95:7.
Para calcular a varincia, utilizamos o valor da mdia, 98,6; j,obtido no te'crido exemplo. Para auxiliar nos clculos, podemos construir as tabelas abaixo.
mdio: - a \-
L24lri-T"n''l: 6 '
"12
b(
tJlilizando a expresso da Definio 4.4, necessrio criar colunas com os (*o - Tnt r)2, enquanto que a expresso alternativa requer vrrlrrres ri - Tohs
"
rf
I)efinio 4.4:
desvios mediano e mdio utilizam a funo mdulo que, por suas caractersticas matemticas, torna mais difcil o estudo de suas propriedades. Definimos a seguir ua nova medida de disperso que iliza o quarado dos
desvios em relao mdia.
i,,)lsi$
ri'Tob,
os
,L
1:;
/ \ri
Alternativa:
I
2
L)
\., I,'hs)'
lLi
ri'
9604 70404
10000 10000
9801
98
r02
100 100 99 97 96 95 99 100
0,6 3,4
r14
0,36
11,56 1,96 1,96
98
2
.)
102
100.
100 99
4 5 6
I
L,4
4
5 6 7 8
0,4
l-.-
8
.
- 2,6 - 3,6
1,6
0,4
L,4
97
96 95 99 100
9409
9276 9025
9801
10000
l0
total
10
total
97264
se houver
a notao
possibilidade de
Scp,rrc da
var,,6_(X). tr
vlr(,hs:
1.\.
; L\",X:I
t1,6*)'
\, :
ff : n,on'
- v \--, Q-t
4'ILl
_u
*obs'
t0(t
1,.1 4uliclas de
Disperso
107
Naturalmente, qualquer que seja a expresso utilizada, o desvio padro dado por
dpohr:
JT,04:2,AI.
Para o caso em que o conjunto de dados est organizado numa tabela de freqncia, o clculo da varincia ser modificado de forma conveniente com a
var,,6,(Y):
(7b
502
ponderao dos desvios pelas respectivas freqncias. Aproveitamos o prximo exemplo para ilustrar essa situao, alm de discutir o efeito, sobre a varincia, da multiplicao ou adio de constantes aos valores da varivel de interesse.
rttr,6,(D):
I #
(75 x 13502
:rgr7,5.
Exemplo 4.9; No Exemplo 4.3, definimos a quantidade D, despesa no vestibular, obtida a partir de x pela expresso D:50 x x*1800, com x indicando o nmero de vestibulares prestados. Para efeitos didticos, antes de obter a varincia de D, vamos calcular a varincia de X e da quantidade auxiliar Y:50 x x. Iniciamos por ampliar a tabela de freqncia de x, para incluir tambm os valores deY e D. Temos,
X
1
Y
50 100 150
D
1350 1400
Note que a varivel D nada mais do que Y acrscido de 1300. No bliy(e, suas varincias so iguais, isto , o acrscimo de constante no alterou a Crilrrcia. Esse resultado de certa forma previsvel, pois a adio ou subtrao $g orrstante corresponde a uma translao dos valores dessas quantidades, no ltet'ntrclo sua variabilidade relativa. Por outro lado, Y igual a 50 vezes a yt'irvcl X e sua varincia 502 vezes a varincia de X. Esse resultado se explica, pgls l multiplicao por constante altera a distncia entre os valores da varivel flgirrll e, pela frmula da varincia, o efeito ser pelo quadrado da constante. E E*emplo 4.10: O salrio de professores do ensino fundamental da rede privada Flri scrrclo estudado. A tabela abaixo apresenta os valores, em salrios mnimos, btitlos em um levantamento numa certa cidade. Desejamos calcular a mdia e a Vt'incia desse conjunto de dados.
Salrio
Tri
75
2
J
47
2L 7
r450
1500
200
As mdias de X e D jforam calculadas no Exemplo 4.3 e a de Y segue sem dificuldade. Assim, r,hs : I,73; y,,6-: 86,5 e ,,h, L 1386,5. Para calcular a varincia de X, via tabela de freqncia, adaptamos as expresses apresentadas anteriormente obtendo:
freqncia
L4
1F3 3F5
25
1B
var,,6.(X):
ou, na forma alternativa,
14
r,,0,)'
5-7 7-9
9F11
total
I
4 70
Vafr,6r(X)
hD",",
_c nohs'
var,,1,,,(X):
r,o
t08
4,.1
Medidas de Disperso
109
14x2+25 x 4+ ". *4 x
70
10
4,97.
a informao dos valores esperados, medianas e modas concluiramos por uma perfeita harmonia de desempenho disponvel, ctitivesse elttrc os vrios mtodos. Entretanto, como podemos observar pelas distribuies de probabilidade, esse no o caso. Por serem medidas de tendncia central, as trs rnedidas acima no captaram a variabilidade existente em cada mtodo. D
Se apenas
Para a varinpia:
VQfohs
4,99.
Como mencionamos para as variveis em um conjunto de dados, podemos ter vrias maneiras de medir a disperso. Para o caso de variveis aleatrias vnrlos definir apenas a varincia, que a medida mais utilizada.
De.linio 4.5: Vartncia de uma varidvel aleatria discreta
Para um salrio mnimo de R$ 180, a mdia e a varincia dos salrios em reais seriam, respectivamente, 180 x 4,g7: 894,60 e 1802 x 4,gg: 161.676,00. tr
Vamos, agora, apresentar as medidas de disperso para variveis j mencionamos no incio da so, as medidas de posio no "explicam tudo" que est acontecendo, seja num conjunto de dados ou com variveis aleatrias. O prximo expmplo refora essa idia para o caso de
aleatrias. Como variveis aleatrias.
Seja X uma varivel aleatria com P(Xi - *n) : P,i,'i : L,2,... ,k e Itrdia p. A varincia de X a ponderao pelas respectivas probabilidades, dos tlesvios relativos mdia, elevados ao quadrado, isto ,
k
Var(X):
'
(*,
i:I'
p)'
pu
Exemplo 4.11: llma pequena cirurgia dentria pode ser realizada por trs mtodos diferentes cujos tempos de recuperao (em dias) so modelados pelas variveis Xr, Xz e Xs. Admita que suas funes de probabilidade so dadas por
Muitas vezes, denotamos a varincia por o2 e, se houver possibilidade de otuso, usamos o2r.Exttaindo araiz quadrada da varincia obtemos o desviotr pulrto que representado por d ou ox.
0,2
10
0,2
0,2 .
Wtr(X): (0-
5)2
Var(X2)
vrrrinbilidade
L0,67
e Var(X3): 0,60.
e X2),teremos
maior
anteriormente pode ainda ser considerada como o vrrlor csperado de uma nova varivel aleatria, o desvio ao quadrado. Isto ,
A varincia definida
X3
5
valor esperado
mediana moda
5
5 5
Var(X):E[(X-p)2],
it rltrirl pode ser convenientemente reescrita na seguinte forma
5 5
u0
IlI
Var(X)
Esta ltima expresso bastante til e, para no criar confuso, explicitamos os seus termos. O termo E(Xt) o valor esperado da varivel leatria X2, ao passo que p2 indica o quadrado do valor esperado de X. O prximo exemplo recalcula as varincias do exemplo anterior, atravs da expresso acima.
'
u"lsf#'"!'li
',:ri;,ii
lll
Exemplo 4.13:
Xs
::. Varinci-,.;=
:::
j
:
*:
::::::::::-r:.,, ::.:!;:::..:!..:l/a;U
: r:l
llllllltlffi
(nltcrhti.v,a),[
un',;6;f1[ri:=
$Jr
rlf;\ -:i.'
"4,::r
r-r,ip',.t,i;
w"@
como por exempo,
x3
I r
25 81
x?l 16 2b 36
conjni oe naos
P(X?:
16)
: P(Xt -- 4 ou Xt :
x 0,2 t"' +
4)
: P(Xt :
4),
i::i;
E(x?) : 0 x
Ento,
0,2
16
100
x 0,2 :35,40.
#,,
*Y, ,i.fiffi
Var(X):35,4-* - 10,40. De modo anlogo, obtemos E(X :35,67 e n(X'zr) :25,60; resultando emVar(X2) = 70,67 e Var(X3): 0,60. tr A Tabela 4.2 auxilia o estabelecimento da correspondncia entre as
medidas de disperso obtidas a partir de um conjunto de dados e aquelas calculadas para variveis aleatrias. Em seguida, na Tabela 4.3, apresentamos um resumo das propriedades da mdia e da varincia discutidas at agora.
'
tr
1t2
1,.1 l+4cdidas de
Disperso
113
com distribuio
Var(Y): E(Y\
k
E'(Y)
E(x):IkP(x:k)
;:0
: i2P(Y : i)j:r
.:J: L
(ry)'
_
(t
:iD,r- (+)'
_L k(k+r)(zk+7)
k6 :- k2-L
12
+ t)2
6-#@='Pk(1-P)'-k
s
n,
k-L
por
e, em seguida
n-I
pot r
E(x)
uma vez que
- "e'F_(,) r, e - p)' -i :
np,
Para se calcular o valor esperado e a varincia, no caso dos modelos de Pglss<rn, Geomtrico e Hipergeomtrico, so necessrias tcnicas um pouco mais rrdas. Optamos por no apresent-las aqui, tendo em vista o objetivo desse EXto c, para o leitor interessado, indicamos o livro de Mood, Graybill e Boes lq7q. Na Tabela 4.4 apresentamos os valores esperados e as varincias para telos os modelos discutidos no captulo anterior.
probabilidades de uma varivel Binomial com parmetros r e p' A varincia ser calculada mais facilmente no prximo captulo, qua apresentaremos propriedades da varincia da soma de variveis independentes. Por ora, s informamos que seu valor nplL - p)'
a
wffi"',
Exemplo 4.16: Considere a varivel aleatria Y com modelo Uniforme entre os valores I e k. Aplicando a definio de esperana matemtica utilizando a conhecida expresso para a soma de uma progresso aritmti
temos
)(
_:::h6 t x|| I
:
;-. r:
b)ii
iii:l:::
r! !.!l$nN!
!i:!1
k:k
>,t: '"
.:i=t
k+7
LLtt\\\riti
sffi\,wqry ls,::l:;;,:: :I
Ws'..14)!
'W"{"/"K,2/'r'*?t:;i-z7:titi
r.
D/:
.:i:r
k (k
+ L)(zk +
"riltii;it
L)
ento,
il4
Captulo 4: Medidas Re
4,4 li.rtrccios
t15
l.
Voc est indeciso em comprar uma televiso e decide avaliar a informaes estatsticas, fornecidas pelo fabricante, sobre a durao (e lroras) do tubo de imagem.
Marca da TV Mdia Mediana Desvio Padro
.jogador ganhou menos o pagamento inicial (prejuzo ' lucro negativ.o). l)ctermine mdia, moda, mediana e varincia dessa varivel.
6. Nrrma certa cidade, o nmero de crianas em idade escolar, em famlias com 4 f ilhos, uma varivel aleatria modelada pela Binomial com parmetros n : 4 c 1r: 0,6. Para cada filho em idade escolai, um projeto de apoio educao prrga 1 salrio mnimo para a famlia. Calcule a mdia e a varincia do custo
rlcsse projeto por famlia.
GA
8000 8000 600
EB 8200 9000
1500
HW
8000
7000
2500
e
4.4 Exerccios
---'t'
,-
l,
"
a uurin"iu
O"rr"
3. Num estudo sobre consumo de combustvel, 200 automveis do mesmo ano modelo tiveram seu consumo observado durante 1000 quilmetros. infbrmao obtida apresentada na tabela abaixo em km/litro.
Faixas Freqncia
27 29 46 43 55
"".
tlrrr certo cruzamento tem alto ndice de acidentes de trnsito, conforme pode scr constatado em uma amostra dos ltimos 12 meses: 5,4,7, B, 5, 6, 4,7, g, 7, 6 e B. Determine a mdia e a varincia do nmero de acidentes mensais
rrcsse local.
de sutura, loram contados os dias necessrios para ir completa cicatrizao de determinada cirurgia. Os resultados de 25 pacientes
7F8 8F9
9F10
10
11
lrlam os seguintes: 6, 8,9, 7,8,6,6,7,8,9,10,7,8, 10,9, 9,9,7,6,5,7,7,8, l0 e I 1. Organize os dados numa tabela de freqncia e calcule a mdia e a
virrincia.
(-_:,.
F 11
F
12
, IJrna amostra de vinte empresas, de porte mdio, foi escolhidapata um estudo sobre o nvel educacional dos funcionrios do setor de vendas. Os dados coletados, quanto ao nmero de empregados com curso superior completo, so
rrpresentados abaixo.
Empresa
1 1
2 0 13
t d
4
r)
6
L
8
2
I
2 1B
10 2 19
t
L)
11
4.
Nurn certo bairro da cidade de So pauro, as companhias de seguro cstabeleceram o seguinte modelo para o nmero de veculos furtados por
sclnani:
No. Funcionrios
Empresa
0
15
I
16
1
0 20
2
72 2
14 2
t7
1
purtosl_o.
_1_
2 J n
t" \.
ru.
No. Funcionrios
calcule a mdia e a varincia do nmero de furtos semanais desse bairro. 5. Nunr jogo de dados, umjogador paga R$ S puralanar um dado equilibrado e ganha R$ 10 se der face g, ganha R$5 se der face 5 e no ganha nda as "o* outras faces. Defina a varivel luro por jogadacomo sendo o saldo do que o
Organize uma tabela de freqncia e calcule mdia, moda e mediana.' b. Determine o desvio padro.
c. As empresas pretendem
.1.
incentivar
o'erecendo um adicional de 2 salrios mnimos para cada funcionrio com curso superior. Qual ser a despesa mdia adicional nessas empresas?
As notas finais de estatstica para alunos de um curso de Administrao foram irs scguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5,6, 4,6,6,3, 8, 4, 5, 4, 5, 5 e 6.
il
Captulo 4: Medidas R
4.4 li.rarccios
t17
a. Determine a mediana e a mdia. b. Separe o conjunto de dados em dois grupos denominado s aprovados, nota pelo menos igual a 5, e reprovados para os demais. Compare varincia desses dois grupos.
5.
l)aciente
27
22
23
24
25 208
26
27
28
29
30
Colesterol
n.
203
205
206
206
209
217
214
2IB
225
(lllcule
est planejando a ampliao dos leitos para rec nascidos. Para tal, fez um levantamento dos ltimos 50 nascimentos, obtendo informao sobre o nmero de dias que os bebes permaneceram no h antes de terem alta. os dados, j ordenados, so apresentados a seguir: 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4,4,4,4,5,5,5, 5, 5, 5,6,7,7, g e 15. n. Organize uma tabela de freqncia. b. Calcule mdia, moda e mediana. c. Determine o desvio padro. d. Dentre as medidas de posio calculadas em (b), discuta quais delas seri mais adequadas para resumir esse conjunto de dados.
um lrospital maternidade
llrutos. b. ( )r'ganize os dados em uma tabela de freqncia com faixas de tamanho de l0 a partir de 160. l{cra o item (a) usando a tabela de freqncia obtida em (b). e, (lomente as diferenas encontradas entre os valores das medidas calculadas al. crn (a) e (c).
,
Itplcscntado abaixo:
0,2r 2,71 2,12 2,81 3,30 0,15 0,54 3,r2 0,80 1,76 1,I4 0;16 0,31 0,91 0,18 0,04 l,16 2,16 I,48 0,63
conjunto de dados. b. (bnstrua uma tabela de freqncia para classes com amplitude de 0,5 hora, corneando do zero. f. Suponha que o conjunto original de dados foi perdido e s dispomos da
H. ( lllcLrle a mdia e a varincia para o
c. voc identifica algum valor excepcional dentre os que foram observados, Se sim, remova-o e recalcule os itens (a) e (b). Comente as difr
encontradas.
6.
o departamento de atendimento ao consumidor de um concessionria veculos recebe, via telefone, as reclamaes dos clientes. o nmero clramadas dos ltimos 30 dias foram anotados e os resultados foram: 3,4,5, 4, 5, 6, g, 4, 4, 5, 6, 4, 3, 6, 7, 4, 5, 4, 5, 7, g, g, 5, 7, 5, 4, 5, 7 e 6.
a. Construa uma tabela de freqncia. b. Calcule a mdia e o desvio padro.
tirbcla construda em (b). Utilizando alguma suposio conveniente, rcrculcule a mdia e a varincia e comente as possveis diferenas
cncontradas.
Ertrrrlirnclo-se o nmero de acertos em 100 lances-livre de bola ao cesto, uma $uros(r'a com 20 jogadores forneceu os seguintes resultados: 68,73, 61, 66,96,
c. Admitindo que cada telefonema acarreta servios sob a garantia avali em R$ 50 por chamada, calcule a mdia e o des.rio padro das oriundas do atendimento ao consumidor.
7. lioram anotados os nveis de colesterol (em mg/l00m1) para trinta pacientes urna clnica cardaca. As medidas se referem a homens entre 40 e 60 anos idade que foram clnica fazer um check-up.
as
obsr:r'vaes em intervalos de comprimento 5 a partir de 60 e, usando alguma Irrgrosiiro adicional, determine a mdia e a varincia do nmero de acertos em
10.
I Sindicato
Paciente
.)
4
163 74
I
173
19
10
Colesterol
Paciente
160
11
160
T2
161
13 181
167
15
170
16
172
T7
172
1B
177 20 203
irrrgrircto do estgio na obteno de bons empregos. Dentre os engenheiros a'r'r'd'ru 'ormaclos e com empregos considerados bons, foi sorteada uma aostra c' olrscrrvado o nmero de anos de estgio anteriores formatura. $, ('irlculc a mdia e a varincia.
Colesterol
178
181
782
185
186
194
797
199
It- l'irnr cl'eito de anlise, decidiu-se desprezar os valores que se distanciassem tlir rndia amostral por mais de dois desvios-padro, isto , s sero crrrrsiclcrados os valores no intervalo fronr* 2 dponr. Recalcule o item (a) e
corncntc os resultitdos.
il8
1,.1
Exerccios
119
Anos de estgio
0
1
freqncia
25
5B
Interrupes
0
1
freqncia
2
r)
t47 i05
72 45 10
t2 t4
2
.)
I
I
4 5 6
4
5 6
t d
3 2
total
462
ru.
total
50
11. Na linha de produo de uma grande montadora de veculos, existem 7 verificaes do controle de qualidade. Sorteamos alguns dias do ms e anotamos o nmero de "OKs" recebidos pelos veculos produzidos nesses dias, isto , em quantos dos controles mencionados o automvel foi aprovado.
Aprovaes 4
5 6 7
freqncia
L26,
359
1685
4764
6934
total produzido.
tr. Calcule a varincia.
Determine a mdia e a varincia do nmero de interrupes semanais. b. O Governo Federal aplica uma multa de 10 mil reais por semana, se h pelo menos uma interrupo no fornecimento. Calcule a mdia e a varincia do valor das multas aplicadas por semana. c. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios setores, decorrentes da falta de energia e atribuiu um valor total de 900 mil reais para ser ressarcido pela companhia responsvel pelo fornecimento de eletricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo mdio por semana? rl. Nesse perodo, qual ser a mdia e a varincia do desembolso semanal da companhia, incluindo multa e ressarcimento de prejuzo?
de uma faculdade pretende iniciar uma campanha junto direo da escola com vistas melhoria das salas de informtica. Para tal, fez nmero de uma enquete com todos os alunos perguntou sobre
c. crie uma nova varivel Reprovaes, indicando o nmero de verificaes no "OKs" no veculo. Determine mdia, moda, mediana e varincia dessa
varivel.
freqncia
156 135
d. Cada reprovao implica em custos adicionais para amontadora, tendo em vista a necessidade de corrigir o defeito apontado. Admitindo um valor
bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia e a varincia da despesa adicional por automvel produzido.
2
t)
47
25
B
12. O rgo do Governo Federal encanegado de fiscalizar a distribuio de energia eltrica tem acompanhado o nmro semanal de intemrpes de fornecimento numa certa cidade. Os dados, referentes s ltimas 50 semanas, consideraram apenas as interrupes que ultrapassaram 3 horas e so
apresentados na tabela abaixo.
total
a. Obtenha a mdia e a varincia. b. O Centro Acadmico argumenta qe
37L
mdia de
H8
Captulo 4: Medidas Re
lixerccios
119
Anos de estgio
0
1
freqncia
25
5B
Interrupes
0
freqncia
12
T4
2
e)
747 105 72 45
10
I
2
t)
I
I t J t r)
4
5 6
4
5 6
total
1L.
462
total
50
Na linha de produo de uma grande montadora de veculos, existem, verificaes do controle de qualidade. Sorteamos alguns dias do ms anotamos o nmero de "oKs" recebidos pelos veculos produzidos nesses d
Aprovaes
4
5
tt. l)etermine amdia e a varincia do nmero de interrupes semanais. It. O Govemo Federal aplica uma multa de 10 mil reais por semana, se h pelo rlenos uma interrupo no fornecimento. Calcule a mdia e a varincia do valor das multas aplicadas por semana. e. A Prefeitura dessa cidade fez um levantamento dos prejuzos, nos vrios sctores, decorrentes da falta de energia e atribuiu um valor total de 900 mil rcais para ser ressarcido pela companhia responsvel pelo fornecimento de clctricidade, referente ao perodo de 50 semanas. Qual seria o prejuzo
rrrdio por semana?
6
I
4764
total
6934
d. Ncsse perodo, qual ser a mdia e a varincia do desembolso semanal da companhia, incluindo multa e ressarcimento de prejuzo? () (-lentro Acadmico de uma faculdade pretende iniciar uma campanha junto rlirco da escola com vistas melhoria das salas de informtica.Parata\ fez ullir enquete com todos os alunos e perguntou sobre o nmero de
ornllutadores que cada um tinha na sua residncia. Computadores
0
1
a. Determine mdia, moda e mediana do nmero de aprovaes por au produzido. b. Calcule a varincia. c. Crie uma nova varivel 'Reprovaes, indicando o nmero de veri no "OKs" no veculo. Determine mdia, moda, mediana e varrancla varivel. d. Cada reprovao implica em custos adicionais para a montadora, tendo vista a necessidade de corrigir o defeito apontado. Admitindo um bsico de R$ 200 por cada item reprovado num veculo, calcule a mdia varincia da despesa adicional por automvel produzido.
12.
freqncia
156 135 47 25
B
2
3
O rgo do Governo Federal encarregado de fiscalizar a distribuio energia eltrica tem acompanhado o nmero semanal de interrupec fomecimento numa certa cidade. Os dados, referentes s ltimas 50 consideraram apenas as interrupes que ultrapasszrram 3 horas I
apresentados na tabela abaixo.
total
n, ( )lrtcnha a mdia e a varincia,
37r
b. ( ) Centro Acadmico
argumenta qe o ideal ter uma mdia de 1 c'onrputador por aluno, juntando os 20 da sala de informtica da faculdade
t20
4.,1
lixerccios
121
10. Uma pea produzida por uma mquina pode receber do controle de qualidade
seguintes
14. Duas moedas esto sobre a mesa, uma delas tem duas caras e a outra tem probabilidade igual de cara e coroa. Sorteamos, ao acaso, uma dessas moedas e a lanamos duas vezes. Seja X a varivel aleatria que conta o nmero de caras nesses dois lanamentos. Qual a mdia de X?
15. Num teste de digitao, o tempo em minutos (7) que os candidatos le para digitar um texto modelado, de forma aproximada, pela seguinte fun de probabilidade:
probabilidades, 0,5; 0,2 e O,3, respectivamente. Suponha que sejam vendidas a l$ 100, R$ l0 ou R$50 conforme forem boas, defeituosas ou recuperveis, rcspectivamente. Se duas peas, escolhidas ao acaso, so vendidas, qual o vtlor mdio da venda?
2(1.
O tempo de durao em horas de uma lmpada especial foi modelado por uma vlrivel aleatria X com a seguinte funo de probabilidade:
pi
O candidato recebe 4 pontos se terminar a digitao em 9 minutos,
nmero de pontos obtidos no teste.
5
xl5
l0,L 0,1
0,2
0,4 0,1
8910
0,1
(lacla lmpada custa ao fabricante R$ 10, mas se sua durao for inferior a 6 Iroras ele se compromete a indenizar o comprador com R$ 15. Qual deve ser o prco de cada lmpada para o fabricante obter um lucro mdio por lmpada de
l.$ 20?
16. A funo de probabilidade da varivel X k :7,2,"',5.Calcule E(X) e E(X') e, usando E[(X + 3)2] evar(3x - 2).
P(X:.
k)
: r/5
17. Estatsticas obtidas junto s assistncias tcnicas indicam que a bomba gua de uma certa lavadora s pode apresentar defeitos aps 4 anos de Admita que nos prximos 6 meses, aps esse tempo, um mal funcioname tem probabilidade 0,10 de ocorrer e, caso ocorra, ter 0,5 de probabilidade ser recupervel. O reparo, que s pode ser feito uma vez, tem o preo de R$ I enquanto uma bomba nova custa R$ 30. Determine a mdia e a varincia
gasto com essa pea em 4,5 anos de uso.
11. tlrna concessionria tem disponvel, para um certo automvel, os modelos S, ('1, c GL com duas verses de combustvel, lcool ou gasolina. Com motor a rilcool os preos so 30, 35 e 40 mil reais para os modelos S, CL e GL, rrspcctivamente. Esses preos so 107o superiores se o combu3tvel for g,rrsolina. A procura por carros a lcool , de 307o e a gasolina 707o. Qualquer
tlnc seja o combustvel escolhido h igual preferncia entre os modelos. ('irlcule a funo de probabilidade do preo desse automvel e obtenha sua
Irrrlia e varincia.
so
It. Os alunos do curso de estatstica tm um time de futebol que no melhores. O cartola que administra o time paga um prmio de vitria
partida de um sorvete porjogador, acrescentando mais um sorvete por saldo gols maior que I (saldo de gols a diferena entre gols feitos e sofri Admita que a funo de probabilidade dos diversos saldos a seguinte:
Saldo de gols Qu"rl a despesa mdia do cartola com cada jogador por partida? E corn os I
"c rilques" ?
lrroporcionais aos valores das faces. Se sair soma 7, ganha R$50, se sair soma I l, ganha R$ 100 e se sair soma 2, ganha R$ 200. Qualquer outro resultado ele rriio garrha nada. Qual o ganho mdio do jogador? l-1. I lrrra indstria pretende comprar 3 lotes de peas que so produzidas por dois lrlrrcccdores, A e B. Ela inicia, comprando de um dos fornecedores escolhido n(l ilciso e, se ficar satisfeita com o material entregue, compra o prximo lote rhr nrcsmo fornecedor. Se no ficar satisfeita, troca o fornecedor. Admita que lrirlir cacla lote o ndice de satisfao de 80Vo e de 707o para A e B, rrspcctivamente. Calcule a mdia e a varincia do nmero de lotes fornecidos por A.
122
4,4 lixerccios
t23
24. A experincia de diversas companhias de resgate de navios naufragados indica que a probabilidade de um resgate ser bem sucedido na primeira tentativa de 0,6; caindo para a metade a cada nova tentativa. Uma empresa de resgate tem
vcz. se o ganho acumulado da equipe (em milhares de reais) , 50c , sendo rrrimero de corridas completadas por esse motor antes de quebrar, calcule: corridas? Quanto receber em mdia essa equipe durante sua "vida" em corridas?
o
B
como norma no realizar mais de trs tentativas e cobra 50 mil reais para iniciar os trabalhos e mais 10.000 x (k - 1) reais, com k sendo o nmero de
tentativas. a. Qual o custo mdio dos servios dessa empresa?
[.
b. Se um navio resgatado
19. tlrn vendedor de cachorro quente trabalha na porta do Estdio do Morumbi errr clias de jogo. Ele pode deixar preparado 5, 6 ou 7 dzias de sanduches que (:lstam a ete R$ 5 adzia,. Sabe-se que a procura do cachorro quente (X), no s!u ponto, uma varivel aleatria com a seguinte funo de probabilidade:
P(X:
k,):+, tt:r,2,J,4.
Sirbo-se que cada dzia de sanduche vendida a R$ 12 e os sanduches no Vcrrrlidos vo para um canil que paga R$ 2 pela dzia. Qual o nmero de eltiz,ias de sanduches que devem ser preparadas de modo a maximizar o lucro
nrrlio do vendedor?
26. Numa indstria farmacutica, uma mquina produz 100 cpsulas por minuto, A mquina est regulada de modo que no mximo 5Vo das cpsulas n contenham remdio e, assim, sejam consideradas defeituosas. a. Se as cpsulas so acondicionadas em vidros com 20 unidades, qual probabilidade de um vidro apresentar no mximo 2 cpsulas com defeito? b. Qual o nmero esperado de cpsulas com defeito, por vidro? c. Qual o nmero esperado de cpsulas com defeito por minuto de produo?
floricultura vende rosas, cravos e jasmins com lucrO de, respectivamente, R$ ltl, R$ 12 e R$ 15 por dezena. Observa-se que a procura igual para as trs flolcs. Se o estoque do dia no for vendido, a floricultura tem um prejuzo (lrrcro negativo) de, respectivamente, R$ 5, R$7 ou R$ 10 com cada'dezena de fosils, cravos ou jasmins. Se a floricultura dispe de duas dezenas de cada flor tr's clientes visitam a floricultura sucessivamente e compram uma dezena nrlir um. Fazendo alguma suposio adicional que seja conveniente, determine s lrrcro esperado da loja.
t.lrrra
27. Um fotgrafo negocia com o jornal o seguinte trato: ele submete al fotos semanalmente e por cada foto publicada, ganha R$ 50. Se a foto no publicada, no ganha nada. Nesta semana 4 fotos so submetidas com
uma tendo probabilidade 0,60 de ser publicada, independentemente da demais,
t{t pita o problema anterior, se a procura por rosas e cravos forem iguais e orrcsponderem ao dobro da procura porjasmins
a l'r,slroslr correta de 17 questes e responde as demais "chutando". gQVo das respostas. n. ('rrlcule a probabilidade dele acertar pelo menos It. l)ctcrrnine a mdia e a varincia do nmero de acertos. f. Srrpottlra que nesse mesmo exame, um outro estudante saiba a resposta col'rolit para l5 questes e tenha probabilidade de acerto nas demais de 0,7. (.)rrlrl clo.s estudantes voc espera que tenha melhor desempenho? tl, Nirs lncsmas condies do item (c), qual dos estudantes ter desempenho
jl, l,rrlir 1tn exame com 25 questes do tipo certo-errado, um estudante sabe
probabilidade que o fotgrafo tenha pelo menos duas f, publicadas esta semana? b. Calcule a distribuio de probabilidade de Y: montante que o fot
a. Qual a
28. Admita que, em cada corrida de Frmula l, o motor tem 0,4 de probabi de quebrar, independentemente das corridits anteriores. Suponha que a encerrar sua participao no torneio quanclo o motor quebrar pcla pri
rrriris Irornogneo?
124
33. (Use o computador) Usando a Tabela 1.1 do Captulo 1: a. Obtenha as medidas de posio e de variabilidade para o Peso e a Altura. b. Compare, atravs de medidas de posio e de variabilidade, o peso e a altura dos alunos das turmas A e B. Comente as diferenas em relao ao item (a). c. Com respeito varivel TV, alunos e alunas tm o mesmo comportamento? Justifique sua resposta com o uso de medidas resumo.
Captulo 5
Variveis Bidimensionais
5.L Introduo
34. (Use o computador) Considere as observaes contidas no arquivo cancerlxt (ver Exerccio 24, Captulo 1). a. Obtenha as medidas de posio e de variabilidade para as variveis Idade e Glicose (GL). b. Repita o item (a) para cada tipo de diagnstico. Compare as respostas
obtidas. 35. (Use o computador) Com os dados do Exerccio 25, Captulo 1:
de
a. Para cada bloco, determine medidas de posio e de variabilidade pra a rea total do apartamento e para a rea de cada cmodo. Voc diria que
existem diferenas nos apartamentos, dependendo do bloco? b. Construa uma tabela de freqncia para a rea total dos apartamentos do bloco I, utilizando faixas de valores convenientemente definidas. Suponha que um apartamento escolhido ao acaso. Defina por X a varivel aleatria rea total do apartamento selecionado. Baseando-se na tabela de freqncia construda, qual o valor esperado de X? Como este valor se compara com aquele observado no item (a) para a rea total? Porqu deveriam ser iguais e se no so, qual arazo?
viirias variveis. Neste captulo, vamos tratar de duas vriveis. Todavia, os conceitos discutidos aqui podem ser, em geral, expandidos para situaes em que lrs ou mais variveis so estudadas. Nesta primeira seo apresentamos, para variveis em um conjunto de dados, a tabela de freqncia conjunta e, para o caso tlc variveis aleatrias, a funo de probabilidade conjunta. A tabela de l'cqncia conjunta tambm pode ser utilizada com variveis qualitativas, conforme veremos nos exemplos. Nas sees subseqentes, estudamos a russociao entre variveis e a obteno de funes de variveis aleatrias. As informaes em um conjunto de dados, sejam elas referentes ao todo ou parte de uma populao, quase sempre contm observaes multidimensionais, isto , observaes relacionadas a vrias v4riveis. Por exemplo, num rprestionrio aplicado a alunos de uma universidade, podemos obter a idade, o llmanho da famlia e o nmero de disciplinas j cursadas, entre outras tluantidades que podem ser de interesse para cada aluno. Considerando duas variveis, digamos idade e tamanho da famlia, podemos listar todos os pares que ocorrem. Como pode haver repetio de valores, os resultados podem ser organizados em uma tabela, com os possveis pares associados s suas respectivas
'cqncias.
estudadas. Existem
Ilxemplo 5.1.. Uma amostra de 20 alunos do primeiro ano de uma faculdade foi cscolhida. Perguntou-se aos alunos se trabalhevam, varivel que foi representada ;ror X, e o nmero de vestibulares prestados, varivel representada por Y' Os
tlados obtidos esto na tabela abaixo.
X
Y
nao
1
slm
1
nao
2
nao
1
nao
slm
2
slm
t)
nao
1
slm
1
stm
1
I
slm
2
X
Y
nao
2
nao
2
slm
1
no
J
D
nao
2
nao
2
nao
1
slm
.)
nao
2
t25
I2()
Captulo
: Variveis Bidimensionais
5.1 Introduo
127
varivel x qualitativa com dois valores: sim ou no. por outro lado, a varivel Y quantitativa discreta com valores inteiros I,2 ou 3. Podemos coletar as freqncias de ocorrncia dos possveis pares, construindo uma tabela de freqncia conjunta de X eY.
(X,Y)
(sim,1 (sim,2) (sim,3)
(no,
1
freqncia
4
2 2 5 6
1
1\c
0
1
0
B4
rJ
4
0 2
12
27
8 35 43
2 T4
20
6
59
11
28
l)irra obter as marginais dessas variveis, acrescentamos mais uma linha e uma coluna na tabela anterior, contendo os respectivos totais de ocorrncia. Assim,
20
1\c
0
1
0
B4
q O
4 0
2 72 L4
total
115 130 100
O par (no,1) tem freqncia de ocorrncia igual a 5, pois, na amostra coletada, foi esse o nmero de alunos que no trabalhavam e prestaram o vestibular apenas uma vez. Os outros valores so obtidos de forma semelhante. Esta mesma tabela pode ser apresentada de modo mais conveniente atravs da tabela de dupla entrada, mosfada a seguir.
27
8 35 43
B6
20
6
59
11
t4
2B
total
110
91
44
345
x\v
slm
nao
2 2 6
B
.)
total
8
12
Cbnro j mencionamos, a ltima coluna da tabela acima fornece as freqncias eorrcspondentes aos valores da varivel -I, enquanto que a ltima linha fornece as
l'ct1i.incias para C. Logo,
4
5
2
1
a)
total
I
0
1
freqncia
115 130 100
C
0
1
freqncia
110 91
B6
20
Note que a ltima linha e a ltima coluna contm os totais de ocorrncias de cada varivel, separadamente. Dessa forma, fica facilitad a a tarefa de obter a tabela de 'eqtincia individual para cada "varivel que, pela posio em que seus valores aparecem na tabela de dupla entrada, chamada de tabela marginal de freqincia du vuridvel x (ou Y), ou simplesmente marginal de x (ou y). Temos ento para
2 3
total
345
44
I4
345
total
X eY
X
slm
nao
D Y
1
freqncia
8
L2
freqncia
I
8
r)
2
t)
total
20
total
20
lrrirrn escolhidas algumas faixas para represent-la. Por outro lado, apesar da vrrt'irvel Tempo ser discreta, ela apresentou valores to diferentes que se achou rrlris conveniente organiz-latambm em faixas. Assim,
l2t
Captulo
: Variveis Bidimensionais
5.1 Introduo
Salrio \Tempo
<5
36
16 5
1
5F10
21
2B 6
2
10
<4 4t--B
t-4
2T
15
>15
2 12
total
63 77 35 20 195
8-72
>12
total
Segue ento
74 72
10
5
5B as marginais so:
57
51
29
que
Salrio
freqncia
63 77 35 20 195
Tempo
4F8
8F12
>12
total
<4
freqncia
58 57
51
rcpresenta o conjunto de eventos que levam a varivel X a assumir o valor r. No prximo exemplo, ilustramos esse ponto. Ilxemplo 5.4: Uma empresa atende encomendas de supermercados dividindo os pcclidos em duas partes de modo a serem atendidos, de forma independente, pelas suas duas fbricas. Devido grande demanda, pode haver atraso no cronograma rlc entrega, sendo que aftbrica I atrasa com probabilidade 0,1 e a II com 0,2. Scjam A1 e All os eventos correspondentes a ocorrncia de atraso nas fbricas I e ll, respectivamente. Vamos admitir que as encomendas sempre sero entregues,
(X: r)
<5
5
t--
10
10F15
>15
total
AAr}.
29 195
tr
Pelos exemplos anteriores, podemos perceber que variveis de qualquer natreza podem ter seu comportamento conjunto representado atravs do tablas de freqncia. Dessa forma, variveis qualitativas u quantitativas, discretas ou contnuas, tm seu comportamento estudado com tabels de dupla entrada, para dados oriundos de toda a populao ou de uma amostra. veremos a seguir como tratar essa questo no caso de variveis aleatrias discretas, definidas a partir das suas funes de probabilidade. Iniciamos estendendo a definio de funo de probabilidade para o caso de duas variveis.
Pirra aliviar a notao, os eventos sero representados sem os respectivos xubscritos mantendo, entretanto, a ordem das fbricas. Dessa forma, o evento /" significa que a ftbrica I entregou sem atraso e afbrica II com atraso. Suponha que para um certo pedido, a indstria recebe 200 unidades tnonetrias (u.m.) pela encomenda total entregue, mas paga uma multa de 20 u.m. pirra cada fbrica que atrasar sua parte. Considere que o supermercado, que fez a cncomenda, criou um ndice relacionado pontualidade da entrega. Este ihdice, trllibui 10 pontos pata cada parte da encomenda entregue dentro do cronograma prcvisto. Vamos denotar por X o valor recebido pelo pedido eY o ndice obtido. Para cada evento do espao amostral, podemos obter os valores das virrirveis. Assim, se ocorre o evento AA', avarivel X tem valor 180, pois de ?(X) subtraimos a multa de 20, decorrente de um atraso. Por outro lado, a varivel )' assinala 10 pontos provenientes de uma entrega dentro do cronograma. A
uno de probabilidade conjunta definida, para todos os possiveis pares de valores de (X, Y), da seguinte forma:
lirbcla
os
crrrrcspondentes valores de
X eY.
Probabilidade
0,1 X 012
Eventos
X
160 180 180
Y
0
10 10
p(r,a)
isto ,
: P[(X: u) n (Y : ]:
comum nos referirmos, sempre que no houver ambiguidades e o contexto permitir, ftno de probabilidade conjunta como distribuio conjunta ou simplesmente
p(r,A)
representa a probabilidade
AA AA' A'A
A.
0,1-x 0,&
0,9 X 012
A.
0,9
0,8
200
20
tr
130
5.1 Introduo
r3I
(X,Y)
(160, 0)
p(r,y)
0,02 0,26 0,72
e
2
somamos
as
respectivas
(180, 10)
probabilidades. Uma forma equivalente de apresentar a distribuio conjunta, porm com maior apelo visual, atravs da tabela de dupla entrada.
x\),
0
1
2110
0
Da funo de probabilidade conjunta p(r,E) possvel obter as funes X ou de Y, atravs da soma de uma db coordenadas. Assim,
de probabilidade marginal de
P(X
")
a)
:\n@,
X
ou
As distribuies marginais tambm podem aparecer na tabela, bastando efetuar a soma nas linhas para obter a marginal de X e, nas colunas, paa a marginal de Y. Por exemplo, para calcular a probabilidade de X ser igual a zero, temos
Y, conforme
r225 :10-10-10:10
0)
Y, obtemos a tabela
a seguir:
Exemplo 5.5.' Uma regio foi subdividida em 10 sub-regies. Em cada uma delas, foram observadas duas variveis: ntmero de poos artesianos (X) e nmero de riachos ou rios presentes na sub-regio (y). Os resultados so apresentados na
tabela a seguir: Sub-regio
1
x\v
0
1
rlt0
7/70
2170
2lr0
0
P(X : r) 5lr0
2/r0
3l70
1
rl70
2 0 2
J 0
1
4 0 0
6 2 0
9
2
10
X
Y
0 I
I I
I
0
2
1
0 2
P(Y
r/L0
u)
r/n
4lro
r/t0
3lr0
3/L0
Considerando que escolhemos uma das sub-regies ao acaso, isto , cada subregio tm mesma probabilidade 1/10 de ser escolhida, podemos construir a distribuio conjunta de (X,Y):
slro
tr
(X,Y)
(0,0) (0,1) (0,2) (1,0) (1,1) (2,0) (2,1 (2,2)
total
probab.
L/70 2/70
2lr0
r/10
r/rc
rlL0
Em muitas situaes h interesse em estudar o comportamento de uma tal como soma, produto ou alguma outra relao entre elas. Vamos nos restringir ao caso de variveis aleatrias, mas o tratamento similar para conjunto de dados referentes populao ou amostra. Se conhecemos a clistribuio conjunta de X e Y, o comportamento de outras variveis, tais como X +Y, X2 + 5Y ou X Y, pode ser determinado como ilustramos a seguir.
Ilxemplo 5.6: Emuma cidade do Estado de So Paulo, admite-se que o nmero de unos para completar o ensino fundamental (varivel F) e o nmero de anos para cornpletar o ensino mdio (varivel M) t,m funo de probabilidade conjunta:
rlrc
r/t0
1
t32
Captulo
: Variveis Bidimensionais
5.1 Introduo
p(.f ,m)
3/L0
r/rc
r/70 2/r0 r/20 r/10 r/70 r/20
l. O setor de emergncia de um Pronto Socorro Infantil anotou o numero de crianas atendidas (C), de mdicos (M) de auxiliares () de planto em 15
clias de atividades. Os dados so apresentados na tabela abaixo.
"
Dia C
t J
5 5 2
7
6
5
1 I
8
1
I
1
10
6 2
11
I
12 5 2
I
13 5
L4 6 2
15
5
1
7
1
5 2
6
2
7
2 6
5- 6
5 5
6
2
M
A
2
7
2
6
Acrescentando, tabela anterior, colunas correspondendo aos valores dessa novas variveis temos
F+M e FxM.
FxM
24 32 40
a. Determine as tabelas de freqncia marginais de C, M e A. b. Obtenha a tabela de freqncia conjunta entre (C, M), (C, A) e (M, A). c. Represente a tabela de freqncia conjunta de M e A, atravs de uma tabela de dupla entrada.
M e A.
L2 13
2.Paru famlias de um certo bairro de So Paulo, apresentamos abaixo a tabela de f'reqncia conjunta das variveis: nmero de automveis (A) e de Ws (T).
L2,
13 74 L4 15
27
36 45
\"
0
1
0 110 51
15
total
465
351
7/r0
L/70
235
t20
178
r22
84
40
50
r/20
total
176
44r
L62 460
267
L077
?t'
P(F + M
13)
P(F
8,M
5)
* P(F : 9,M
.. 1 '1020
_
n'
Procedendo de modo similar com os outros valores, obtemos as funes de probabilidade de.F * M e de F x M:
3. Uma moeda equilibrada lanada 2 vezes de forma independente. Ao final dos lanamentos, duas variveis aleatrias so anotadas: o nmero total de caras (C) c o nmero de coroas no 2o. lanamento (K). a. Construa uma tabela com os possveis eventos, as respectivas probabilidades
e os valores de
L2 13 1.4 15 prob. | 3/10 3lL0 3120 2lI0 Il20 ' FxMl Z+ 27 32 36 40 45 prob. l B/10 2lL0
r+twl tt
C e K.
b. Apresente a tabela de dupla entrada com a funo de probabilidade conjunta das variveis aleatrias C e K. c. Determine o valor esperado de C.
50
'
tr
4. Num estudo sobre o tratamento de crises asmticas, estabeleceu-se a seguinte uno conjunta de probabilidades entre o nmero de crises de asma () e o tti,mero de interniles hospitalares (H).
134
135
\H
0
1
r/8
3/16 r/L6
I/16
L/8 3lL6
r/16
3/L6
Aluno
1
(
2 7 6 6
3 7
B
4
F7
5 8
6 8
7
I
8 8
I
I
8
7
10
8
11
T2
13
L4
15
I
Ar/H.
P
a. Determine as funes de probabilidade marginal das var,{eis b. Calcule o valor esperado dessas variveis. c. Obtenha a funo de probabilidade da varivel A + H. '-/
8
5
9
5
8
t)
6
5
I
6
8
7 5
9 B^
5
6 6
I
6
I
8 5
10 8
5
M
apresentada
5. A funo conjunta de probabilidade entre as variveis abaixo (com algumas entradas faltando):
X eY
1\
7 8
6
1
8
2
1
I
1 1 1
0
J
x\v
-2 -1
1
,14't
L/16
-1
4
%6
P(X
: r)
tto
7/at
5
P(Y
/64
Ll32
0
1/6tt
5lL6
I
10
0 0
0 0
2
1
0
as
\lt ("
L/64 7t32
Ji
/n(^
1
5/76
3t64
311
y1
,^
r/4
l'oqncias ao lado de cada ponto. Note que h uma tendncia das notas altas em irrgls, serem acompanhadas por notas altas em portugus.
P
10
X x Y.
construir um grfico no plano cartesiano com a freqncia de ocorrncia dos diversos pares de valores. Esse diagrama pode auxiliar a identificao de tendncias de associao entre as variveis, conforme veremos no prximo
exemplo.
Exemplo 5.7: Dentre os alunos do 1o. ano do ensino mdio de uma certa escola, selecionou-se os quinze alunos com melhor desempenho (nota acima de 7) em
IJ
Captulo
Variveis Bidimensionais
I\M
I
4 0
1
5
2
t J
6
1
7
1
I
10
2
1
I
0 0
0 0
2
1
Dadas duas variveis aleatrias discretas definidas no mesmo espao urnostral, a probabilidade condicional de X : :L,dado que Y : a ocorreu, dada
pcla expresso:
P(X:rlY:g):
Caso P(Y
P(X:r,Y:y)
P(Y
a)
, se
P(Y:
g) >
0.
A)
:0,
rtrbitrariamente e adotaremos
definida
P(X:rlY:y):
prra todos os possveis valores
P(X
das variveis
(r,g)
(X,Y).
Como definio O
Observe que o bom desempenho em ingls parece, neste caso, no implicar num bom desempenho em matemtica.
Apesar de ser um instrumento til para identificar tendncias, os difcit interprerao, ;;;;;.;", exempro, se o conjunto de dados tem muitas observes "rigun. pou.os valores diferentes, freqncias sero altas atrapahndo "o a visualizao de uma eventual 'lgumas tcndncia' Dessa forma, importanie ampliar o estudo da associao entre variveis, para buscar.uma caracterizao que no dependa s da interpretao visual' com este objetivo, definimos piobabilidad" e independncia para variveis aleatrias, estendendo os conceitos "ondi"ional apresentados no captul o 2 para cventos aleatrios. Aqui, o condicionamento, na ocorrncia de um valor da varivel
rliagramas rornam-se de
A verificao da equivalncia entre as duas expresses, acima, pode ser lbita de modo anlogo ao realizado no Captulo 2. Deixamos ao leitor essa tarefa. Note, ainda, que a definio de independncia exige que a igualdade seja vcrdadeira para todas as escolhas dos pares (r,A). Assim, basta encontrarmos um l)rr em que a igualdade no se verifique para concluirmos que as variveis irleatrias no so independentes. A Figura 5.1 resume esses comentrios.
Figura
5.
/.ft
Captulo
: Variveis Bidimensionais
139
so
u\r'r
Sim
No
2 ou mals
total
53,SVo
\ Ano
,)
P(Ano:
y)
r/25
2/25 2/25 5/25
2/25 4/25
6125
2r,lvo
7B,9Vo
53,8%io
46,2Vq l0OVo
87,l%o L3,}Vo
L00Vo
46,7Vo
L00Vo
total
I00Vo
Pclas informaes apresentadas, as variveis salrio e Ano de curso no inclcpendentes pois, por exemplo,
sil
P[(Sal.
3)
n (Ano
: 4]:2lzs I p(Sat.:
B)p(Ano
4)
: rr/r2s.
Unra maneira bem pr'tica de verificar independncia consiste em usar a tabela de clupla entrada, checando se o produto da ltima linha e ltima coluna (as rnargirrais) reproduz o corpo da tabela. se a tabela contiver um zero no seu corpo, brsta verificar se uma das marginais correspondentes zero. caso nenhuma marginal seja zero, conclumos imediatamente a no independncia, uma vez que o produto de dois nmeros no nulos nunca zero. tr
(lgnsiderando os valores de [/ no conjunto total de dados, temos 53,3Vo de rcspostas positivas e 46,7V0 de negativas. Caso no haja associao dessa varivel eoln o nmero de parceiros, devemos esperar porcentagens similares em cada virlor da varivel ,f, indicando que esses valores no interferem com as respostas tlo [/. Assim, por exemplo, para ly' : 0 seria esperado ter, aproximadamente, lil,3%o de respostas positivas, que a mesma ocorrncia verificada no total da linha. Como se pode observar da tabela acima, as porcentagens so prximas lpenas no caso l/: 1, sendo bem diferentes nos outros casos. Dessa forma, os
rludos sugerem que as variveis no so
independentes'
A verificao da independncia, no caso de duas variveis em um conjunto de dados, ser discutida com maior profundidade no captulo g que trata cle Testes de Hipteses. Entretanto, podemos utilizar as idias de indepedncia cle variveis aleatrias para estudar a relao de duas variveis observadas numa populao ou amostra. Uma das formas utilizadas construir a tabela de dupla cntrada com porcentagens em relao ao total de colunas ou linhas.
Ilxcntplo 5.9.' Em uma clnica mdica foram coletados dados em 150 pacientes, relbrcntes ao ltimo ano. observou-se a ocorrncia de infeces urindris (J) eo ttttncru tle parceiros sexuais (,n/). Deseja-se verificar se essas variveis esto russociadas. os dados so apresentados a seguir, com as respectivas marginais.
Continuando o estudo da associao entre variveis num conjunto de tllctos, construmos, no prximo exemplo, uma tabela de dupla entrada contendo rrs freqncias que seriam esperadas, caso houvesse independncia entre as vlriveis. Precisamos decidir se as duas tabelas, a de freqncias observadas e a tlc esperadas, esto suficientemente prximas uma da outra. Ilxemplo 5.-f 0.. Apresentamos os dados relativos a uma amostra de 80 famlias, de lun certo bairro, com as informaes sobre o nmero de pessoas que trabalham nufamlia (") e o nmero de adolescentes entre 12 e 1B anos (A).
r\
0
0 5
2
2 2 6
B
rJ
4
1
total
15
4
B
3 4
5
I
2
I
2
2t
27
4
,
8
2
.1
4
15
2
1B
5 T7
I7
80
u\r/
Sim
No
total
22
B,
2 ou mais
total
BO
t2
45 57
2L
1B
47
7 54
total
39
70 150
A rnarginal deT e as freqncias de seus valores, restritas ao grupo - 0, sero irpresentadas em seguida. Note que as freqncias de ocorrncia, restritas a cada grr.rpo de valor de A, nada mais so do que as colunas da tabela de dupla entrada rlo incio do exemplo.
Cottstruindo uma nova tabela com as porcentagens em relao ao total de coluna, otrtcmos a proporo relativa da varivel (J em relao i cada subconjunto de
valores de
N.
t40
141
T
0
1
freq.
15
/A:0
0
1
freq. observ.
5
2
2 3
2L 27
L7
2
J
4 4
15
Q':D4,
i,i
"11
total
80
total
7 mantivessem a mesma proporcionalidade encontrada na ilmostra como um todo. Em outras palavras, as duas tabelas acima precisariam ser parecidas quanto freqncia relativa. Acrescentamos, na tabela restrita ao grupo A.:0, uma nova coluna com a freqncia esperada caso a independncia se verifique. Essa coluna foi calculada multiplicando a freqncia relativa do valor cle ? (em toda a amostra) pela freqncia do grupo. Por exemplo, a freqncia esperada do valor T:7, no grupo dos :0, seria 21180 x 15:3,94. Note que esta freqncia no precisa ser um nmero inteiro.
de cada valor de
Se houvesse independncia entre T e A, o comportamento da varivel ? em cada grupo deveria ser o mesmo e, portanto, esperaramos que as freqnci
repfesentando, respectivamente, as freqncias observadas e csl)cradas na linha 'i e coluna j. A medida Q2 usa a diferena entre oi.j e ei.j elcvada ao quadrado para evitar o cancelamento de termos positivos por flL:gativos. A diviso pot ei.i objetiva padronizar a medida, relativizando o tnrrranho da diferena encontrada. Como estamos tratando de observaes de vrrrirveis, podem ocorrer flutuaes devido natureza aleata da amostragem e rrrrcluiremos pela independncia entre essas variveis, se houver razoxel
Eonl o,;.i
e eii
T\:0
0
1
freq. observ.
5 2
freq. esperada
2,87
proximidade nas tabelas. No difcil perceber que isto significa valores pe(luenos da medida Q2 e,no Captulo 8, desenvolveremos um critrio estatstico, piri tomar a deciso de aceitar a independncia de duas variveis. Para este excrnplo, vamos nos contentar em apresentar o clculo da medida Q2 que, pelo tlr:rr valor, consideraremos uma indicao de no independncia:
4 4
15
Q,:
(5-2,81)2
2,81
total
: 0, calculamos as freqncias
No caso de dependncia linear e de variveis quantitativas, existe uma prrtla medida que freqentemente utilizada e ser definida, a seguir, para um
corr.junto de dados brutos.
4 1,50
total
15
2,Bl
3,94 5,06 3,19
15
I
2
t t)
2,r0
2,70
27 27 17 80
por (ru,g),':I,2,...,fr.O coeficiente de correlao entre as variveis e calculado da seguinte forma: linear rrrcrlc a dependncia
.\ c Y, representados
I,70
B
'n
total
Px,Y
D@o i,:l
- r,,r,,)(ar. -
a,*,)
142
Captulo 5: Variveis
143
oo,
PX,Y:
i:l
LrtAt.-TLIohsAobs
PX,Y:
43245-8x135,63x38,75
lrrtanto, a correlao entre ndice pluviomtrico e produo positiva e bastante titzovel. Desta forma, locais com maior intensidade de chuva tenderiam a ter
As expresses anteriores podem ser adaptadas para o caso em que dados esto agrupados em uma tabela de freqncia. As expresses no apresentadas aqui, mas acreditamos que podem ser obtidas sem dificuldade.
possvel verificar que o coeficiente de correlao sempre um n entre -1 e 1. Um ponto a ser ressaltado, que muitas vezes causa confuso, correlao igual a zero no indica independncia. Se a correlao zero, o podemos dizer que no existe dependncia linear entre as variveis. interpretao para os termos presentes no seu clculo ser dada mais adian quando definiremos coeficiente de correlao para variveis aleatrias. Exemplo 5.11: A quantidade de chuva um fator importante na produtivi agrcola. Para medir esse efeito foram anotados, para 8 diferentes regi produtoras de soja, o ndice pluviomtrico em milmetros (X) e a produo
tttlior
produtividade.
tr
Vamos voltar nossa ateno agora paravariveis aleatrias discretas. Para elc'inir medidas de dependncia entre elas, precisamos estudar, inicialmente, as propriedades do valor esperado. Sejam X e Y duas variveis aleatrias discretas com distribuio conjunta p(r,y). As marginais de X e )z sero representadas, repectivamente, por
p(t:) e p(y).
Vamos determinar o valor esperado da varivel
X +Y:
E(x-+Y):
tIt" r.u
TU:E'!J
+p@,a)
,t'tt(.
:I
D,p@, +L,\un@,u)
Tfutull>
'
r"ned'u,tt7-D
>
-,1,
rt'''UtA
"o-'o
auxlio o"
rr-uofrn[ilf"
88
lca o uma
10Bb
| ,,\J-
o,
: I"
:
rUUT
(t
p@,a))+t,
(f
p(*,)
D"o: i--L
88
8
,D"?:
i:l
:trp@)+tap@)
151533;
X;U
E(x) + E(Y).
Notc que obtemos essa importante propriedade do valor esperado, sem necessitar
tlc rtcnhuma hiptese adicional sobre as variveis. Dessa forma, esse resultado
lcrn ampla aplicao e tambm vlido para mais de duas variveis. Considere agora o produto XY. O valor esperado do produto ser o pt'oduto dos valores esperados, sempre que as variveis forem independentes. Para X eY variveis aleatrias discretas independentes, temos:
t44
Captulo 5 : Variveis
idimensionais
145
E(xY): tL"yp@,a) r
'!l
xl o
-$
: I D,*aP@)P@) r lt
: (T 'p@)) (Duna)
:
E(x) E(Y)
'.*
t \ ,nf
/t
represenr
pi |
Segue ento que
vl o t
:
L'
3lt0 4lr0
3lt0
E(X)
S/10 e E(Y)
respectivamente, a quantidade de poos artesianos e de riachos em sub-regies uma certa rea. A prxima tabela contm os valores das variveis X f Y e X
E(X
+Y)
B/10
1,
'
isto , o valor esperado da soma igual soma dos valores esperados. Entretanto, para o produto temos
(X,Y)
(0,0) (0,1) (0,2) (1,0 (1,1) (2,0)
(2,
1
X+Y XY
0
0
p(r,a)
L
I
2
1
/10
0 0 0
2/r0 2/r0
E(xY):7lLo+E(x)E(Y): * t,
ou seja, o valor esperado do produto de duas variveis no igual ao produto de seus valores esperados. Note que, conforme j havamos mencionado, as variveis
aleatrias
L/n
1170
2 2
t r)
I
0
2
X eY
no so independentes.
tr
L/10
(2,2)
L/rc r/70
+Y
e a de
XY
x+rl
E(X+Y):18/ro
reapresentadas em seguida:
:7lto.
independncia e a fatorao da esperana do produto. O resultado vfido afirma que a independncia de X e Y implica no valor esperado do produto XY set igual ao produto do valor esperado de X pelo valor esperado de Y. Todavia, se o valor esperado do produto de duas variveis o produto dos valores esperados,
t4(,
t47
so independentes.
Figura
c, desde que temos um par em que a probabilidade da conjunta no igual ao ;rroduto das probabilidades marginais, concluimos que as variveis aleatrias W e
no so
independentes.
tr
Se as variveis so dependentes, a relao entre elas pode ser de vrios tiflcs e, no caso de ser linear, vamos definir uma medida dessa dependncia.
X eY
LLx)
, dada
pela covarincia:
Cov(X,Y)
Itigura 5.3: Valor esperado
do
ox,Y
E[(X
(Y
- P")]'
tr
WeZ
4
W\Z
-1
0
1
t
L)
P(W
No prximo exemplo ilustramos o clculo da covarincia e, para auxiliar ir interpretao de sua expresso, faremos uma representao grfica dos valores
clas variveis.
w)
2/72
0
r/L2
2/12 3/12
P(Z :
I/L2
z)
3/L2
5l12 2/12
5/r2
1
(u,v)
P(u,u)
(2,2)
0,1
(3,4)
012
(3, B) 0,1
(4,6)
012
(5,4)
0,1
(5,8)
012
(6, 10)
0,1
wzl-4
prob. |
Temos ento,
-2
l{epresentamos a seguir essa distribuio atravs de uma tabela de dupla entrada, i ncluindo as marginais.
u\v
2
t)
4 0
012
10
P(U
u)
E(W Z)
0,1
0 0 0 0
0 0
012
0 0,1 0
012
0 0 0 0
0,1 0,3
012
-0.
Por outro lado, utilizando as distribuies marginais de
seus valores esperados. Assim,
4
5 6
0 0,1 0
0 0
012
0,3
0,1
E(W) : (-1) x 5lI2 + 0 x 2lI2 * L x 5fL2 : 0 ; E(Z) : 2 x 3lI2 + 3 x 3112 + 4 x 6lL2 : 391L2
Vale portanto a relao E(WZ):E(W)E(Z).Nesse caso, seriam independentes? A resposta no, uma vez que, por exemplo,
P(V
0,1
0,1
u)
0,1
0,3
0,3
WeZ
Utilizando as probabilidades marginais, obtemos imediatamente que E(t/) : 4 e Ii(V) :6. Nosso interesse verificar a existncia de uma relao linear entre U e |/. No diagrama a seguir, apresentamos a funo de probabilidade conjunta das
cluas variveis.
P(W
: -I,Z -
2)
2)
L5/L44,
148
Captulo 5: Variveis
r49
os pontos localizados no 1" e 3" quadrantes tm suas coordenadas com o ffinnro sinal, Iogo o produto delas positivo. No 2" e 4o, o produto e n"guii;o.
tf
- n(u))x
(u
- E(v)) x p(u,u),
essc nmero inai"u' t"naon"iu de alinhamento no sentido dos quadrantes mp'res ou pares, de acordo com o sinal positivo ou negativo, respectivamente. A r;trcsso acima nada mais do que a frmula da covarincia entre x e y, prcsentada aqui em uma forma mais detarhada do que na Definio 5.5. calculos, obtemos Cov(U ru.rirnoo os clculos, Etbtuando : 2, inOi"nao Cov(U,V) indicando u rV) :2, a tendncia das
Uru tambm cresce.
tr
lternativa:
Fazemos agora uma translao de eixos para colocar a origem respectivas mdias, isto , no ponto (4,6).Dessa forma, os pontos anteri transformam-se em (u - 4,a - 6), com cada coordenada representando o desvi
em relao sua mdia.
: o*,, : E(Xl) - E(X) E(y). bserve que' no caso em que xe y serem independentes, temos cov(x,y) :
Cov(X,Y)
ffJl*'.for' lllcilr.
o valor esperado do produto se torna igual ao produto do, uIo.", A partir da covarincia, definimos uma nova medid" d" d;;"d;;;
0,
X ey
4'.,- :
Cov(X,Y)
OX OY
E
Pela definio acima, o coeficiente de correla o o quociente entre a crviuincia e o produto dos desvios-padro de x e )2. A diviso pelo produto dos rlcsvios-padro tem a funo de padronizar a medida e torn-la possvel de ser ,tilizada para comparaes com outras variveis. No difcil u"rifi.u, gue px,v rrrrr nmero adimensional e limitado por 1, isto , < lpx,vl 1. A interpretao de suir cxpresso segue os mesmos passos da covarincia, sendo que valores de 1t,y,y prximos de 1 indicam correlao forte.
t50
Captulo 5: Variveis
151
Vamos, agora, deduzir a expresso da varincia da soma de duas vari aleatrias. Desenvolvendo a partir da definio de varincia temos:
Var(X
Ento,
Var(X +
y) :
Var(X) + Var(Y)
Cov(X,Y)
X eY.
Exemplo 5.15.' Nos Exemplos 5 .5 e 5 .I2, o par de variveis (X ,Y) representa respectivamente, o nmero de poos e de riachos em sub-regies de uma
6trea.
Y)
E(Y)
1, portanto,
cov(x,Y)
E(xY)
-*. 10
: :60/1
Figura 5.6: Varincia da soma de duas variveis aleatrins.
e o2u
Var(X
+2(-#) :
-Llt0
116 100
Cov(X,Y) ox oY
ffi@
-0,15.
Vamos encerrar essa seo, aplicando as propriedades do valor esperado e rlu varincia na obteno dessas quantidades para o modelo Binomial.
eorrr distribuio
Il"rctnplo 5.1.' Considere uma sequncia de variveis aleatrias independentes Bernoulli de parmetro p. Como se comporta a soma de n dessas virliiiveis?
Representemos por Xr, Xz, .. ., X,,, a sequncia de variveis de Bernoulli. lisirrnos interessados em X : Xr t Xz * '.' * Xn, e, pela definio do modelo Ilirrornial, j sabemos que X - b(n,p). Lembrando que E(Xa) : p e Var(X6) : p(l - p) para 'i:1,2,..., D,
virrros calcular
mdia
ea
varincia de
X,
utilizando as propriedades
t52
t53
E(X):E(Xt+Xz.-"'+X,)
r\c
1
0
1B
: :
-
16
10 38 31
2
J
34
T2
45
16
Var(X)
: Var(Xr t Xz + "' 1 X,,) : Var(Xt) * var(X2) + ... + var(X") : p(l - p) + p(I - p) + ... + p(L - p) : np(I- p). 3. tl
(M)
a. Obtenha as tabelas marginais de freqncia. b. Construa a tabela de freqncias esperadas, caso houvesse independncia entre as variveis. c. Determine o ndice Q2.
eY
x\y
-1
1
-2
0,1
012
4
012
0,2
0
0,1 0,1
0,1
Aluno
I
C
2
C'
C
4
C
6 h c c
7 b a c
9 b c b
10
11
H M
'c
b.
b b
b c b
d
b
c
C
b c c
b
c c
l2 a,
c
b
a. Obtenha as funes de probabilidade marginais das variveis. X e Y so independentes? c. Calcule a covarincia e a correlao entre X eY.
b.
5. Na caixa
a. Construa as tabelas de freqncia conjunta para H e M e para H e F. b. Calcule a proporo de alunos com em fsica, dentre os com pelo menos c em matemtica.
aos funcionrios de um pequeno escritrio; busca relacionar as variveis: anos de estudo (X) nmero de diftrentes " empregos nos ltimos 5 anos (y). O que voc pode dizer com os dados fornecidos?
I existem duas bolas numeradas 0 e 1, enquanto que a caixa II contm duas bolas numeradas 1 e 0. Uma bola retirada aleatoriamente de cada caixa, de forma independente uma da outra. A esse experimento, associamos as variveis aleatrias: nmero da bola retirada na caixa I (X), soma dos valores das duas bolas retiradas (Y) e a difurena, em mdulo, desses valores (Z). a. Determine a funo de probabilidade conjunta entre X eY e entre Y e Z. b. Verifique se X e Y so independentes. Idem paraY e Z. c. Calcule a covarincia entre X eY. d. Obtenha Var(X +Y).
Binomial com p
6.
X
Y
3.
I
2
10
11 2
l2
A varivel X ,Bernoulli com p : 0,4 eY Admita que X e Y so independentes. a. Determine P(X :\lY :2).
0,5 e n
3.
Uma amostra de 220 clientes de uma clnica dentria foi selecionada' As variveis tempo, em anos, decorridos desde a ltima visita ao dentista (V) eo nmero de cries encontradas (C) apresentado na prxima tabela'
b. Obtenha a funo de probabilidade conjunta de X e Y e do produto XY. c. Calcule E(X),8(Y) e E(XY) e verifique que: E(X) x E(Y) : E(XY). d. Determine o valor de Cov(X,Y) e de py,y.
t54
5.3 Exerccios
155
5.3 Exerccios
1.
(F,C)
(0,0)
(0,
1
freq.
L2
tabela a seguir apresenta os valores observados em uma amostra de 130 empregados do ramo do comrcio.
Sexo \ Fumante
25
8
Sim
24 25
No
18
Masculino Feminino
63
e
t4
57
40 45 27 22
(4,r
(4,2)
Fumante. b. Se usssemos a amostra para tirar uma concluso sobre toda populao, voc diria que, proporcionalmente, mais homens fumam do que mulheres? c. Calcule o ndice de associao Q2 entre as variveis.
,,
5. Os dados a seguir referem-se a uma amostra de incio do curso, seu peso e idade.
Em uma amostra de 8 funcionrios de uma empresa, observou-se duas variveis: anos de empresa (A) e nmero de promoes recebidas (P). Com
os resultados apresentados a seguir voc diria que, para essa empresa, essas variveis esto associadas?
Aluno
Peso
2 65 L7
7L
L7
70
18
57
17
66
19
Idade
A P
5 2
6
1
7
2
B t J
B
1
8
0
a. Encontre a mdia e o desvio padro do peso dos alunos c"om b. Construa o diagrama de Peso por ldade. c. Obtenha o coeficiente de correlao entre peso e idade.
l7
anos.
3. Est sendo estudado o efeito do teor de ferro na capacidade ile car p de vigas de concreto. Os dados abaixo apresentam os resultados de medidas btidas em
r. Para cinco volumes de uma mesma soluo foram medidos os tempos aquecimento, em um mesmo bico de gs, e as respectivas temperaturas
ebulio: Tempo (min.)
Temperatura
20 75 22
BO
de de
uma amostra. Obtenha a correlao entre as variveis. Ferro (7o peso) Carga (ton./m2)
5,4
2rL
6,8
,)
6,9
7,3
2r9
2r9
7,7 3,0
8,1 3,1
8,2
3,1
8,5 3,1
8,6
314
8,9
19
23 82
17
3,5
('C)
75
78
(f')
nmero de
a. Obtenha o grfico do Tempo pela Temperatura e calcule a correlao. b. Voc acha que existe associao entre as variveis?
7. Alguns cientistas sociais acreditam que a opinio sobre o aborto independe da situao familiar. O que voc diria, aps estudar a amostra?
a. Determine as tabelas de freqncia marginais, correspondentes a cada uma das variveis, isoladamente, e calcule as mdias de F e C. b. Construa um grfico com a distribuio de freqncia das variveis. Voc
chega a alguma
Situao \ Opinio
Casados
Favorveis
56
15
Contrrios
2:4
c.
coeficiente de correlao entre F e C. Note que ser necessrio adaptar a expresso apresentada na Definio 5.4. Determine
concluso?
Solteiros Divorciados
25
16
24
13
Vivos
27
t56
5.3 Exerccios
r57
8.
A tabela a seguir consiste de 16 valores de trs variveis observadas em alunos do curso de cincias sociaisr sexo (S), nota de estatstica (E) nota de " antropologio (A).
Pac. No.
2
1
J
2
t)
4
1 1
6
1
8
a)
9
2
10 2
J
L)
ll
1
12
1
I3
2
I
2
2
1 1
I
t
L)
s
E
A
M
r)
e)
F 6 4
M
4 3
F
iJ
M
6 5
M
5 5
F
5
F
I
F
4
5
M
5 5
M
5 4
F
6 4
M
5 5
F
4
5
F
r)
t t
M
6
5
er
s F
Pac. No.
2 2
2
1
t d
2
1
I
2
I4
2
,f t d
15
t6
7
1
18
a)
a. construa a
t9
1
20
2
1
2I
1 1 1
22
1
23
1
24
r)
t)
C
,9
I
()
D
I
2
antropologia. b. Repita o item (a), considerando apenas os homens. c. calcule, para os alunos do sexo masculino, o coeficiente de correlao entre as notas de estatstica e de antropologia. d. Com o uso da tabela obtida em (a), calcule a porcentagem de cada freqncia conjunta em relao ao total de alunos.
9. Num certo distrito de sade, o comportamento conjunto dos de
2
1
2
1
t
!)
,)
a. Construa a tabela de dupla entrada com as variveis C e S. b. Estude a associao entre as variveis C e S, atravs das porcentagens em relao ao total de coluna. c. Repita os itens (a) e (b) para C e F. d. Repita os itens (a) e (b) para S e F.
11.
departamento de vendas de certa companhia ofereceu um curso de atualizao a seus funcionrios e, para estudar a eficcia do curso, resolveu comparar a noto de teste no curso (7) com o volume de vendas, em rhilhares de unidades, nos seis meses seguintes ao curso (V). Os resultados esto na
tabela abaixo.
t6
1
I7
18 2
t9
t .)
20
1
2t
0
2
22
1
23
2 2
24
1
25 0
2
26 0
1
27 0
28
1
29
L
i)
30
2
t ()
I
2
,1,
7
T2
8
13
.J
5 11
6 10
7
T2
7
13
q d
5 T2
3 11
74
13
10
I2
11
10
10
a. Obtenha a tabela de dupla entrada. b. Calcule a porcentagem de cada ocorrncia conjunta em relao ao total de
casos.
I/? Justifique.
d. Que concluso
difteria?
12. Um total de 1000 passageiros de vos domsticos foram entrevistados no Aeroporto de Guarulhos. Duas variveis foram observadas: nmero de viagens mensais (V) nmero de automveis na famlia (). O resultado est na prxima tabela"que, por descuido, est incompleta.
10. As informaes da tabela a seguir foram coletadas de 24 pacientes da rea de cardiologia de um grande hospital pblico. A varivel C indica o nmero de
intervenes cirrgicas sofridas pelo paciente, ,9 representa o nmero de pontes safena colocadas pelo paciente em uma ou mais cirurgias e a varivel F indica o nmero de.familiares prximos com problemas cardacos.
V\A
1
2
BO
r)
total
-zt)O
/0
150 /t0
60
C
2
J
:.{.,t
450
300
'i i .. ),
L20
,l4a
total
300
200
/51J
5.3 Exerccios
t59
! a. Complete a tabela. b. Calcule as porcentagens em relao ao total de coluna. c. As variveis so independentes? Justifique.
13. A tabela de freqncia apresentada em seguida est incompleta e contm observaes das variveis: vida til do equipamento (t/) garantia do " fabricante (G), ambas medidas em anos.
16.
x ey
dadapela seguinte
x\y
-1
0
1
I/B
1/8 L/8
-1
1/8
0
r/8
1/B
I/B
L/8
U\G
8 10
2
t)
4
4 3
I
) '.,
total
6
o
6
0 4
+4.
t2
total
5
1t
10\
<,O
a. Complete tabe Construa o grfico de [/ por G e verifique se h associao entre as variveis. c. Calcule a vida til mdia para cada subgrupo de valor da garantia. Comente os resultados.
b.
eT.rJmabola sorteada ao devolvida caixa. uma segunda bola " escolhida, tambm ao acaso, e seu nmero denotado por X2. a. Determine a conjunta de X1e X2. b. Calcule as marginais de X1 e X2. Elas so independentes? c. Encontre o valor esperado e a varincia de X1, X2 eX : e+t.
acaso, seu nmero anotado
(xr)
eY
igual a 0 se a
18. Uma moeda equilibrada lanada trs vezes e so definidas as variveis aleatrias: nmero de caras nos dois primeiros resultados (x), nmero de caras no ltimo lanamento (Y) e nmero total de caras (S). a. Construa a tabela conjunta de (X,Y). b. Verifique se X e Y so independentes. ' , c. Calcule E(X), E(Y) e Cov(X,Y). d. Expresse ,5 em funo de X e Y e determine E(.9) e Var(S).
19. considere a frase: "Para mais sade pratique mais esporte,,. Escolha ao acaso uma palavra dessa frase e considere as variveis aleatrias nmero de vogais
X eY
X eY.
2
x\v
0
1
t/78
7/9 L/6
rls I/I8
r/6
1,
rl6
U9 r/18
(V) e nmero de consoantes (C). a. Determine a conjunta deV e C. b. Obtenha as funes de probabilidade marginais. c. Calcule os valores esperados dessas variveis. d. As variveis so independentes? Justifique. e. se a escolha acima resultou em v : 2,, qual a probabilidade da palavra "mais" ter sido a escolhida.
a. Calcule
1).
20.
A tabela a seguir representa a funo de probabilidade conjunta de duas variveis aleatrias independentes.
160
Captulo
: Variveis Bidimensionais
\.. lxerccios
r61
x\
P(Y
a. Complete a tabela.
), -1
0
1
P(X
: r)
X :1-
18.
L/6
b.IdemparaY:E-l.tp.
c. Obtenha a conjunta entre
2/6 3/6
y1
X eY.
25.
' parcialmente
r/5
3/5
L/5
apresentada a seguir:
I
i:3i,iil'l
:,Y';E(Y) "
cov(x'Y)
{
x\v
1
-2
u)
012
P(X
: r)
0,3
21. sorteia-se ao acaso um dentre os nmeros g, 12, e zz e feita a decomposio do nmero sorteado em fatores primos. $ejam D e T, as
3 aparecem na decomposio. a. Obtenha a conjunta entre D e T.
P(Y
a. Complete a tabela.
0r7
0,3
Y.
b. calcule a covarincia e o coeficiente de correlao entre as variveis. 22. As variveis F e M representam, respectivamente, o nmero de anos para compltar o ensino fundamental e o ensino mdio. Numa certa cidade , a tabela a seguir adotada pafa a funo de probabilidade conjunta dessas variveis. Determine o valor esperado e a varincia da varivel F + M que representa o total de anos at completar o ensino mdio.
26. Sendo Xr,Xz e X3 variveis aleatrias independentes, seguindo o modelo Bernoulli de parmetro p, pergunta-se: a. Qual a funo de probabilidade de Xt t Xz * Xs? Voc reconhece essa varivel? b. Qual o valor aeVar($h)t
27. Sabe-se que
F\M
8
9
7
e 160
10
/60 3/60
I /60 7 /60
4160
r/60
3/60 2/60
X e Y so independentes e assumem, respectivamente, os valores 7,2 e 3 e-0, I e2. Admita conhecidas as probabilidades P(Y:0):1/3, P(X :3) : Ll3, P(X : L,Y :0) : 1/9 e P(X :3,Y :2) : Llq, a. Construa atabela de dupla entrada para X eY. b. Calcule E(X x Y) e Var(X + Y).
28. Um paleontlogo acredita que o nmero de minerais presentes em certo tipo de rocha pode influir na chance de se encontrar fsseis perto de uma indstria calcria. Atravs de amostras de rocha obtidas em levantamentos de campo, elc
varivel2X
BY.
obteve
24. A rabela a seguir representa a funo de probabilidade conjunta entre o nmero de empregos desde que comeou a trabalhar (E) e a idade do primeiro enlprego (1), de jovens em uma pequena cidade do Estado de so paulo.
presentes
eW:
distribuio conjunta para as variveis Z:nmero de minerctis varivel que assume 1, se for observada a presena de fssil e 0
caso contrrio.
w\z
0
r)
E\r
b 6
I
13
14
15
16
r/8
L/8
r/8
L/4
r/4
1/B
I
a. Calcule
P(W
I ()2
.\.-l Exerccios
163
d. A
c. Se o produto dever ser vendido poi 50 reais, qual ser o lucro mdio por
unidade?
29. Sejam (J
X eY
conjuntaentre
33.
x\v
-1
1
L/12 7/6
Ll6 7/4
r/3
0
contm uma bola vermelha e uma azul, enquanto que a caixa II contm duas vermelhas e uma azul. Um experimento consiste em escolher uma bola ao acaso da caixa I e passar para a caixa II e, em seguida, escolher uma bola da II e passar paraa I. Sejam X eY os nmeros de bolas vermelhas nas
A caixa I
: 4lV :
caixas Ie II, respectivamente. a. Calcule a conjunta de X e Y. Elas so independentes? b. Comente o que ocorre com a varivel X +Y. c. Determine a mdia e a varincia para cada uma das varivel
eY
" os valore
a/l,aoota
sl6
que
34. Considere duas variveis aleatrias independentes U-Po(2) e V-G(0,3). A partir dessas variveis definimos outras duas da seguinte forma:
P(A: P(A :
:0,2; P(A - or) : 0,,5 ; P(B: br) : a1,B :bt) : 0,,L2 e P(B : bz I A : as):
ot)
0,6;
0,b,
-_0l1 sel/)1: \-
seU:0;
e Y: {'
a. Construa a tabela de dupla entrada entre A e B. b. As variveis so independentes? Justifique. c. Calcule P(A: or l B: br).
31. sejam x e Y independentes com funo de probabilidade G(0,5). Determine o valor esperado e a varincia de:
35. Duas moedas so lanadas simultaneamente. Uma delas equilibrada e a outra tem probabilidade 213 de sair face cara. Considere as variveis U: total de caras observadas eV uma Bernoulli que assume valor I se as duas faces
so iguais. a. Determine a conjunta de U e V e verifique se so independentes. b. Calcule a mdia e a varincia de 2U - V .
32. Baseando-se nas projees de preo de duas matrias primas, M1 e M2, pretende-se estudar a viabilidade econmica do lanamento de um certo produto. A funo conjunta de probabilidade com os preos (em reais)
apresentada a seguir.
36. (Use o computador) Com os dados das variveis altura e peso da Tabela 1.1 do Captulo l: a. Verifique o grau de associao atravs do clculo do coeficiente de
correlao.
Mt\
I
I r)
Mz
I
0
13
0,1 0,1
0
0
012 012
0,2
012
c.
Calcule
altura
a. Determine o preo mdio e a varincia das matrias primas. b. O produto usa 2 unidades de M1e 3 de M2. Qual seu custo mdio?
padronizadas. Os valores da varivel padronizada so obtidos subtraindo-se a mdia e dividindo-se pelo correspondente desvio padro. Compare com o resultado encontrado no item (a). .17. (Use
o computador) Considere os dados apresentados no Exerccio 23 do Captulo 1, onde, no item (b) foi definida a varivel Etrio.
I.1
diferente dependendo da faixa etria. b. Suponha que um paciente escolhido ao acaso. Qual a probabilidade de que a pessoa apresentasse cogulos no momento de admissol E uma pessoa de faixa etria mais alta? c. Voc diria que Coag e Etrio so independentes? por qu? 38. (Use o computador) Novamente com os dados do Exerccio 23 do Captulo
considere agotaavarivelCuracriadanoitem(c). \ a. Crie uma tabela de dupla entrada com Cura nas linhas e Tratjm nas colunas. b. com base na tabela do item (a), voc diria que neste caso,/rapidezda cura depende do tipo de tratamento considerado? Justifique. / c. Qual a probabilidade de que uma pessoa selecionada o u"uro tenha cura rpida, dado que recebeu tratamento do tipo I ? d. Qual a probabilidade de uma pessoa ter recebido tratamento do tipo I, dado que teve cura normal?
1.
n. crie uma tabela de dupla entracla, contendo Etrio nas linhas e Coag nas colunas. Com base em tal tabela, reavalie se a presena de cogulos
Captulo 6
Introduo
Neste captulo, discutiremos a Vracteriz4o de variveis cujos possveis valores ocorrem aleatoriamente e pertencem a um intervalo dos nmerd's reais: virriveis aleatrias contnuas. Renda, salrio, tempo de uso de um equipamento, comprimento de uma pea e rea atingida por certa praga agreola so exemplos dc quantidades que podem ser modeladas por variveis aleatrias contnuas. De lrrma semelhante quela desenvolvida. para variveis aleatrias discretas, prccisamos estabelecer, para as contnuas, a atribuio de probabilidades s suas
cliversas realizaes que, neste caso, podem assumir um nmero vtlores diferentes. Abordamos esta questo no prgximo exemplo.
infinito
de
Iixemplo .1.' Estudos anteriores revelam a existncia de um grande lenol de gua no subsolo de uma regio. No entanto, sua profundidade ainda no foi tlcterminada, sabendo-se apenas que o lenol pode estar situado em qualquer
ponto entre 20 e 100 metros.
40. (use o computador) utilize as informaes do arquivo aeusp.txt, introduzido no Exerccio 26 do Captulo 1. a. crie uma tabela de dupla entrada com as variveis comun e Renda. Voc diria que existe associao entre elas? b. Repita o item (a) para as variveis Reproce e Trab. c. O que pode ser dito da associao entre nmero de residentes (varivel Resid) e idade que comeou a traballrar (varirvel Itrab),?
Vamos supor que escolhemos, ao acaso, um ponto nessa regio e tlispomos de uma sonda que, ao fazer a perfurao, detecta com preciso a lrlofundidade do reservatrio de gua. Denotamos por X a varivel alearia rcpresentand o a p rofundidade. Notemos que, apesar de X poder ser qualquer nmero entre 20 e 100 nctros, o instrumento, com que trabalhamos, pode no ser to preciso como liostaramos. Por exemplo, uma profundidade de 32,571 metros poderia ser rrrcdida por 32,6 metros. Vamos assumir, entretanto, que temos um instrumento itlcal que no faz aproximaes. Nessas condies, podemos supor a sonda ;rcoplada a um instrumento indicador da profundidade e um dispositivo que, tlrrnndo a sonda encontrar gua, provoque a imediata interrupo da perfurao. Uma vez que no temos informaes adicionais a respeito da lrronndidade do lenol, razovel assumirmos que a sonda pode parar em rprnlquer ponto entre 20 e 100 metros, sem que tenhamos motivos para privilegiar cssn oll aquela profundidade. Assim, consideraremos todos os pontos como igrralmcnte provveis. Se utilizarmos a mesma idia de atribuir a cada possvel
l6(t
6,1 Introduo
167
cleles tiver, individualmente, probabilidade maior que zero, a soma probabilidades ser igual a infinito e no 1, como requer a definio da funo probabilidade. Em geral, em situaes como esta, no de intEresse conside um nico valor para a vari..vel aleatria, mas intervalos de valores na atribui dc probabilidades. Neste caso, sabemos que o espao amostral corresponde intervalo [20, 100] e as profundidades so igualmente provveis. suponh, por nomento, que dividimos o espao amostral em 8 intervalos de comorimento 1 Logo, razovel atribuir aos intervalos a probabilidade l/g, us, corre$ondend, corres\ondendo relao entre o comprimento de cada um deles e o compri-"ntoldo ".p, nmostral. Isto , 10 para 80 ou 1/8. Assim, com a diviso m s fzas de is comprimento e sem interseco entre elas, teremos os intervalo d po, 30), 40),..., [90, 100] todos com a mesma probabilidade l/g, pois tods tem o mes
termanho.
ponto uma probabilidade, teremos uma dificuldade extra, pois eles pertencem intervalo [20, 100], em que existem infinitos nmeros reais. Assim, se cada
Densidade
20
30
40
50
70
80
90
100
apesar
Para construir um histograma, nos mesmos moldes do captulo podemos supor que l/8 , a freqncia relativa da ocorrncia de cada um irrtervalos. As ordenadas do grfico so as densidades, calculadas de modo que
rea de cada retngulo seja a freqncia relativa (probabilidade) do intervalo.
Densidade
taumentando cada vez mais o Podemos continuar esse procedimento, rrrnero de faixas, com a conseqente diminuio das suas amplitudes de tal forma
seguinte
1/8
1/8
lta
1t8
1/8
'v8
1lA
118
Note que, dada as caractersticas do problema, a diviso em g intervalos produziu o mesmo valor de densidade de l/80 para todos eles. Se dividirmos o intcrvalo [20, 100] em l6 faixas iguais, utilizando o mesmo argumento anterior, tcrnos que os intervalos [20, 25), [25, 30), [30, 35), .. . , [95, 100] tero todos a rosma probabilidade l/16. O histograma correspondente ser:
100
Estamos agora em condies de caracterizar, completamente, a atribuio rlc probabilidades para o caso contnuo. Ela ser definida pela fuea abaixo de uma
I'uno positiva, denominada densidade de probabilidade. Observe que a clcnsidade em si no uma probabilidade, mas uma funo matemtica que nos