Vous êtes sur la page 1sur 174
Paulo Afonso Lopes PROBABILIDADES | Estatistica Conceitos Modelos Aplicagées em Excel® Caries hee te ee eee www.estatistica.eng.br Introdu¢do inicio de tudo: determinando o que se quer saber, 2 Avaliando numericamente as unidades de observacéo, com a ajuda de escalas de medidas, 3 Comecando a estudar, na prética, uma populagéo: censo ¢ amostragem, 6 Retirando uma amostra da populacio, 7 © que fazer com os valores das caracteristicas das unidades da amostra: uma visdo sistémica da Estatistica, 10 Como realizar os célculos a partir de valores anotados, 11 Gerando digitos pseudo-aleatévios, 12 Erros na amostragem, 16 Informagées adicionais, 16 Termos-chave, 17 Resumo, 17 Exercicios propostos, 18 Solusses dos exercicios-exemplo, 19 2 Capitulo 1 /Inroducao studa-se Estatistica para aplicar seus conccitos como auxilio nas tomadas de deci- io diante de incertezas, justificando cientificamente as decisdes. Os principios estatisticos s2o utilizados ém uma grande variedade de situagdes — no govern, nos negécios € na indsstria, bem como no amibito das ciéncias sociais, bioldgicas e fieicus. A Estas tistica presta-se a aplicages operacionais de pesquisas, sendo efetiva ndo s6 em experimen. tos de laboratério, mas também em estudos fora dele. A Estatistiea compreende o planejamento ¢ a execugio de pesquisas, a descrigio ea anélise dos resultados ¢ a formulacao de predigies com base nesses resultados, “A Eatstica nada mais ¢ do que o bom senso expresvo em nimmeros."" “Ninguém que mece com 850 & normal “Antes, faces w estatistica dos moradores, Agora fz-se« dos desempregados. Quanto mais ‘wimentao nimero destes, mats enpregos haverd para os estatsicns O inicio de tudo: determinando 0 que se quer saber Método estatistico & um provesso para se obter, apresentar e analisar caracteristicas ov valores uméricos para uma melhor tomada de decisdo em situagdes de incerteza. Os passos da metodologia estatistica so o8 seguintes: + definigo cuidadesa do problema, + formulagio de um plano para a coleta das unidades de observagio; + coleta, resumo e apresentagao das unidzdes de observagao ou de seus valores numéricos: + analise dos resultados; * divulgagio de relatério com as conclusbes, de tal modo que estas sejam facilmente en- tendidas por quem as for usar na tomada de decisdes. A Agéncia Nacional de Telecomunicagses (Anatel)realizow. em 12 de janeiro de 1999 uma ‘Audincia Paibica para diseutiras conde geras do edual de lctagio pars controtagte de instituigdo que desenvolverd a metodologia destinada a ferro pra de sabagde ta Sociedade com o Servico Telefonica Fizo Comutado, Na Audlencia Paice, forah chovaan doses seguinestopicos: © processo de Wenifcosdo do gra de sarsfago + tinhas gevats do plano amostnal das penguins, + procedimentos para colea de dados em todo 0 territirio nacional: + procedimento de codficaao ¢ tabulagdo de Sede 4 “analisesaserem realzadas, demuficacto prorizagdo de atributosvatorisads pela sociedade eyes Anatel presentazio dos resultados Entre as caracteristicas do método estatistico, citam-se: + €0 dinico modo de lidar com uma grande quantidade de observagdes ou de valores; + aplica-se somente a observagoes redutiveis a uma forma quantita 7 0. mesmo tanto para as ciéncias humanas ¢ sociais como para as ciéncias tecnol6gicas; * € objetivo; entretanto, os resultados sio influenciados (embora nio devessem) pelt ne. ccossiria interpretagio subjetiva ‘Pesqusa tna, di seereturia. O assessor parlamentar da Secretaria de Fades Seguranca Publica {nu ise que @ pesquva realizada pelo Tse (Istituto Superior de Estudos lg Religiao) Sra, pots. ands foram fetas“longe do momenta adente don confrntos" “Este €0plor nimero do governo,"® poraacn A Bstuitica no interessa concur a respeit de unidadesindividuas de observacdo mas sin J de grupos, conjuntos ou agregados, porque seu objetivo € o esudo da chamnada popalacto © \~TramiCnsinchetedemndater al pode ser fnita ow infinive cauosioiwssinene Populacio finite & aquela em que 0 mimero de unidades de observagdo pode ser contalo e & pesoeseboroncronoda Lado petrderuas dejan ‘ce Tmbéenchamaa de univers nese io, 0M ting ete ods team. Caphuto 1 / intraducdo 3 1 Exemplos de populagao finite + alunos maticulados nas escolae plies etaduais: + todas as delaragdes de Imposto de Rend rechidas pela Receita Federal; + todas as pessoas que compra telefone celular * todos os crimes relatadospelee Seeetanas de Segurance Psblic. ‘Uma populagio ¢ infinita se « quantidade de unidades de observacio ¢ ilimitada, ou a sua com- pposigao é tal que as unidades da populagio no podem ser contadas. 1 Feemptos de popnlagdo infinta * conjunto de melas de determinato comprirmento, porque néo hi inite para n¥imero de veres em que se pode medir este compriment, + gases, liguidosealgus sides, como otal, porque as unidades no podem se ideniiceday cons (© miimero de unidades de observagao na populaetio denomina-se tamanho ¢, no caso finito, 0 aiimero dessas unidades & designado pela letra N. “No entant, a rede estadual registra, em 1998, um toal de 6.024.166 alunos.” : Em uma populagio, realiza-se uma pesquisa estatfstica observando-se todas as suas unidades ¢ tuma ou mais caracteristicas passiveis de estudo; também se identifica a drea de abrangencia. aquela que, fisicamente, limita as unidades de observagao que se descja estudar. O Bremplos de dreas de abrangéncia + thinos maticulados nas escotes publica estaduais em 1999; + todas as declaragdes de Imposto de Renda reeehidas pela Receita Federal em 1999; + todas as pessoas que compram telefone celular na regio Suess do Brasil, + todos os crimes relatados, nos meses de dezembro, dese 1900, peas Secetaris de Seguranga Pubicn Ao se descrever uma populagdo estatistica, deve-se diferenciar unidades de observagdo das caracteristicas dessa populacio. Uma unidade de observacao € um objeto (ou grupo de obje tos) do qual se coletam dados, e que pode ter muitas caracteristicas, embora 0 interesse : costumeiramente recai sobre apenas uma ou poucas dessas caractertsticas, cujos valores se ‘anotam e cujos prinetpios estatsticas se aplicam, 1 Kxemplo de unidade de observa ¢ caracteritcas Em uma popalagéo de municipios, uma unidade de observagho & © municipio, o qual apresenta rites caractristeas entre as quis a ea, o admero de habitanese a teade per capt, “(0 TBGE} acabow de tangar un CD-ROM (Banco de Inforaes Municipais) que integra os ‘dados essenciais dos cerea de 5.000 municipios do pats « pretende angle para inctuir ‘lemontos de folelore, euindria «cultura de tds ele." Avaliando numericamente as unidades de observacao, com a ajuda de escalas de medidas Hi dois tipos bisicos de dados: + aqueles obtidos de uma populacio qualitativa; + aqueles obtidos de uma populago quantitativa ariavel € uma atribuigdo de um niimero a cada caracteristica da unidade de >, 4 seja, € uma fungao matemética definida na populacao, Quando uma caracteristica ou varifvel é no-numérica, denomina-se varidvel quatitativa ou atributo. s de varisiveis 1 Exemplos de variévetquatitativa ehigito, haturaldade; cor dos oles: fina tira, ‘Uma variével qualitativa € expressa em categorias. 1 Bremplos de categorias de varidves quaitativas em sexo: masculnoe feminino: 0; cates, judaiea protestant: dade: cariaes palit, gricho e mneir; ‘em cor dos olhos:eastanhos, verdes eazuis, 1 faxa ein a6 25 anos, de 26 4 £9 aos e acima de 50 anos, Capito 1 1 tnerodugao Quando os dados silo quatitativos, o interesse encontra-se, normalmente, na quantidade ou na roporgio de cada categoria em relagdo & populagio. “oldies Miltares tem 42% de alunas "* tando pode ser expressa numcricamente, a variavel estudada denomina-se varidvel quantita. © Bxemplos de variéveis quantitatvas + quamidade de valores denotes de ume mosda: + uantidade de Sahores de refreccos + alo do patriménio do cided brasileiro: * daragio de uma Batra de telefon celle, art crete ~~ AS As varidveis quantitativas podem ser diseretas ou continua. iemassmireoeas Varies discretas podem assumit apenas determinados Valores,” e resullam de uma contagem. econo alren tesa Geunscintagem 1 Bxemplos de variévets quanttatvasdiseretas * quuntidede de vatores de noas de wn moed: 5, 10,20, $0, 190,200 e500 sarin continua "O euro comeca a circular com 13 bites de notasem sete valores (5, 10, 20,50, 100, 200 500)... cunbagem de 76 bikes de moedas de !e? euros-e del, 2.3, 10,2080 cenavon ut guaguer alr de exroimplicard uma troca completa de maquina ¢ equipments de vendadejomate ea douro deme dtm tea erfrigerantes." eee eetq © Navegando na Internet “0s sistemas de 75 milhdes de computadores na Buroléndiativeram de se tuslrados. Aint, ‘dese escondeu o simbolo Eno teclado? F cum imprim-to” A Microsoft extddhetvouintceoy Iminiprograma especial para o euro em hip:2wie mierouoficomindonedowoagee * quantidade de sabores de refresco “Em oto deliciosos sabores: tangerina,laranja, maracul, timaclimio, carambola, abacesi ‘maga verdee pomelo rosa Observe se que do pode haves 5.4 valores de nota, nem 3,8 sabores de frescos, Os nitmeros foram obtidos a pute de wma comtagem, ‘ extquos 110 mda sala de gindsticalocalizada da Academia ABC sao torados por cerca de 60 meninas 0 que dd..0.545494.. garotas por eada (sic) m de val node deem, lea Na pritca édiferente Ali nao ha muther pela metadee nom quaqucrdisia peridica sobrando até infinita Por outro lado, varidveis continuas sio aquelas cujo conjunto de valores posstveis & um interva- Jo de ntimeros reais, resultado de uma medicdo em qualquer giau de precisio. Na pritica, entee. {anto, os mecanismos de medigao tém preciso limitada, tal que os dados coletados de van veis continuas sio necessariamente discretos, Isto é, hi somente um conjunto finito (ras tolver ‘muito grande) de valotes possfveis que realmente podem set medidos. 1D Exemplos de variéveie quantitativas continues +, valor do patinvnio lo eiddto brasteino: 15,000.00: RS147,000,00; 884 675.778,95. "A partir de 1999, ax declaragdesteImposto de Renda dos contrbuintes com patriménio de at ‘RS 20 mil poderda ser feitas pele telefone.-" * para nduragio de uma bateradetelefone celular 60h, 46h37imin!2s ov 34h 3min(dependene ‘dodo ipe da batera ou da sta tlizagao) ‘Bateria vibratsrie com 3hiSmin de conversagto € 200h de espera”, “Batera h3Omin de comversacdo ¢ 24h de espera”, "Bateria 2hde comversagie¢ 18h ce exper, “Butera Sh de conversagia.e S7h de espera”, “Beteria de Zhs0min de conversocte 4h de opera “ald 3h 10 min de comversagto."® A Figura 1.1 mostra, esquematicamente, a classificagtio das variéveis, © Navegando na Internet Um poato vital na anise estatistca ena inerpretago dos resultados & 9 valor do dado uilizado. No Brasil. virios Orgios governamenais exercem pape! importante ne produgee ac daleg oor diversas reas, Neste pardgrafo,vsise a um impertante port (ste) braslciza na Inerne, ode Insttno Brsieizo de Geogfia ¢Esatistica IBGE). O objetivo éornar sonhechdow paineso local onde os dados oficias do Brasil io publicados e aprender respete da vontdooe de iferentes dads que cada uma das fonts colcea a disposigto do grande publiso, No procease de visitagto, havers ligagdes links) para locas onde podem set encomtraon ovis di 4 ees sites jainas daré una visio completa de fodor 09 recursos ou dads x fornecers unit introduc estrutrsda nou vasos recursos Uispomivels, * Osa so aes varies ca anjomo de valores poses Fito ou latte, Capitulo 3./ iiroducte Figura 11 Classificagao das idveis em Estatistica As escalas que caracterizam as unidades de ‘observagiio VARIAVEIS fo N ‘QUALITATIVAS, ‘QUANTITATIVAS (so atributos) (sé0 numéricas) xernpis: arelindo \ 2 neturaidade 3 cordos anos "aa otis DISCRETAS conrinuas Exempios Exommpos: > quantsace de estudanies 2 tompo de woe entre ‘om ume alsiptna ‘uas ogaces +> quantdace de comoaos + auragao da baterie ‘om ume resdenca Gerteietone color © IBGE tem os enderogos hrtp:/hvww.ibge.gov.br € htip://ibge.org.br, colocando a disposi- {glo dos usuarios dados terrtoriais, indicadores conjunturais, estatisticas bésicas de natureza Geiogeatica, social e econdmica ¢ resultados dos censos, incluindo dados sobre os estudos © pesquisas realizados, Possibilita ainda a transferéncia de arquivos de dados, gravados em for- imatos diversas, mapas ¢ textos. W Exerciciovexemplo LI V6 a site hpi ibge gr bre Taga 0 segue a. anote o ips de varveis (qualitative equantitatva) disor 1, Mentfigue o formato dos dadoe (HTML,DOC, XLS, ete); © verifique come podem ser balnados download urquivos Je dads pars o seu computador: A. erifigue se existm retrgGes de acesso 4 obtengao dos dados (pagamentos a serem fifos So atminisisador do sife ow impeditento de acesso a0 publico em geri; caso positivo, «e, excreva 0 URL. de ligagdes interessantes;, 1 Felacione cinco tipos ds dadosdisponiveis no IBGE f, lst algims locas para os quais 0 ISGE proporciona ligayses: B. idenitue como o IBGE "acs o atendimento aos seus ususros. eis para consult; Quatro escalas de medidas podem ser usadas para earactetizar as unidades de uma populagao, Siio elas: nominal, ordinal, intervalar © proporcional. Escala nominal Na escala nominal, as caracteristicas classificam-se em varias categorias, nas quais um valor numérica associado com a caracteristica no tem significado real 1 Bxemplo de escala nominal {A varivel sexo fem as categoiss maseulina efeminino, xs qua podem sr Fcamente pel atbuigdo do mtimera 1 para 0 sexo feinino edo 2 pra 0 “Tabola de céidigos da declarago de hens edireltos de imdvets: 11 Apartamentos; 12 ~ Casas: Di Tevvenos: 14 Terra naa, 15- Salas ow lojas; 16 Construgao: 17 Benfetorias; 19 SOnaron Escala ordinal [As caracteristcas sao ordenadas (de maneira crescente ou decrescente) em situagées para as ‘quais a posiglo associada ¢ importante, “URL eunersl esmure loco, eared um pra peralentisiato por pe. Capito 1 Inroducdo C_ Exemplo de eseata ordinal Ao se veriica odesempenho Je ums pessoa ou de uma ativdade, para o gual hé cinco catego Fias, para faildade de codiiengio aneocit-se uma nero cade dscenspen. (3) Sim, (3) bom, 3) regur, (2) rum e(1) pessimo. Um indica melhor desempenho do que un 5, mae mio implica, aecessitamente, que se tenba desempenho dus Yezes melhor que 02. "A avalagao do Plano Real. Respastaesinulada e nica, em %, nos dias 1¢ I! de decembro «de 1998: timorbom, 61: regula, 28: ruialpessim 10: no sabe, J." Escala intervalar As caracteristicas tém atribuido a elas valores que permitem comparar nio s6 a ordem como também a variago numérica entre as caracteristicas, D1 Exemplo deescale intervatar Em um imervato de duas horas foram anotadas cinco letras de temperatura: 205, 207,210,213 220. Alem de aver uma ordenaedo, a variagao entre 205 e213 €4 mesma do que ents 10 220. Embors esses valoces referents a temperatura possam ser colocads em ardem (crescents 0 decrescente)aComparaco entre eles sé €possivel se esiverem na mesma ovals por exemple, se as escalasfarem Celsius e Fahrenheit, 2 comparagao nio @ possvel porque ok zeros das calas so aiferontes. “0-ano 2000. ser 2004 de acordo com a data real de nasclmento de Crista m4 aC, 2753 Segundo ocalendario romano, 2749 egundo ot babilonios, 6236 de acondo com 0 primetra (alendri clo Egite, 5760 no calendar judaico, 1920 no calenrin musulmano, 2544 ‘segundo os budivtas, 5179 na calenddrto mata e208 de acanto cam a calendarta da Revel (ao Francesa." Escala proporcional As caracteristicas so ordenadas e a variaglo entre elas pode ser comparada, havendo um zero natural para a escala de medicao. 1D. Bxemplo de excale proporcional ‘Considers ma situaso na qual se obsiveram as seguintes masssh em qullogramas: 505.1, 52 eS. A varagao de 5,0 ky para $1 ky € de 0,1 kg, a mesa varagao de 23 kg para 24 Eg, ° existe um zero natural para & esata, 00 kg. 1 Feereiciowexemplo 1.2 ‘A avaliago dos curcossuperiores no Bra ‘valados estudanes de administagzo,dreto e engenharia civil em 1997, 06 mesmas 60 0 {anterior mais engeahars qumica, modicina vetenria@ odonologia: em 1998, os cusos ante ‘ores, mais engenhars clerics, jomallsmo, letras e matemstiea. Em 1999, akém des enferiores, {estéiam economia, engenbra mecinicae medicin, A classificagdo& feta por conccitos Je A LEE. Identiigueo tipo da escala adotad W Beercicio-exemplo 1.3 [Em 28 de dezombeo de 1998, a Fotha de S. Palo publicou x classificasso dos prefetos de nove capitals rasleras, AS notat,em urn esala de Oa 10, foram as sevuints: Cutiba, 6; Recife, {5.3 Porto Alegre. 6.4: Flovianépolis, 64; Salvador. 6,3: Fortaleza, 55; Belo Horizonte. 5 Rio de Janeiro, 54 e890 Paulo, 3.4. Kdntiiqueo tip de escala ula, jstificand ss reposts, © fato de uma varisvel ser expressa por mimeros nfo significa que ela seja necessariamente quamtitativa, porque a classificagso da varkével depende de como foi medida, e no do modo como se manifesta. Por exemplo, para a vatidvel peso de um luador de boxe, se for anotado 0 peso marcado na balanca, 2 varidvel & quantitativa continua; por outro lado, se esse peso for classificado segundo as categorias do boxe, a variavel € qualitativa ordinal. Comegando a estudar, na pratica, uma populagdo: censo e amostragem 4K oe “ame de todo os unidaes de ebseragie devma populate Se a populagio é pequena, é razofvel observa toda ela, ¢ a isto denomina-se censo. “0s dadesjnicias do Censo Demosrifico de 2000 estado disponiveis em devembro daguete ‘Todavia, examinar a populagdo inteira nem sempre & viével; na maioria das vezes, hé escassez de tempo e de recursos (humanos ou financeiros, por exemplo) ou impraticabilidade do censo. E possivel entrevistar e anotar o que pensam 44 pessoas que estejam em urna reunifio, mas no ouvir e registrar, em tempo razosvel, a opinilio de todos os torcedores da partida final de um campeonato de futebol em um grande estadio. Além disso, o mundo est em constante mudangat €, por esta causa, nunca as observagdes refletirdo, de maneira completamente precisa, as condi es reais e amais de todas as unidades de ebservacao, Capital 1 / Introduce 7 “Para Censo, por exemple, sua reullzage mais importante, 0 IBGE pedi R3600 mills, dee Yeces menor do que os EUA vo gastar para o mesmo trabalho. A coleta dos dados do ‘Censors dard entre agosto ecutubro de 2000 ¢ seria por 120 rll ecenseadores.O pals serd divide cm 17D mil efor consti. moun POF ESSES motivos, o estudo estatistico inicia-se com a coleta de parte de uma populagao, de- 228% nominada amostra, constituida por n unidades de observagio e que deve ter as mesimas earacy jaa miaaswimimanr teisticas da populagio. Essa coleta recebe o nome de amostragem, que envolve pelo menos veentemscss dois passes: eseolha das unidadese registro das observagGes. O tamanho da amostra a er retire dda da popalagao ¢ aquele que minimiza os custos da amostragem, podendo ser até de tamanho | “Ha 106 mithies de cletoret no Brasil, Qn tem come ouvir todos: Assim, lla métodos “startcon para aera into devo de mado gue as eirettadosrepresniem 0c Sino do eetrada “deundades de poplago ‘amenade A amostragem pode ser sem reposigdio © com reposigdo: na amostragem sem reposigd0, usual- ‘mente utilizada nos trabalhos estatisticos, as unidades so selecionadas apenas uma vez; na amosiragem com reposigio, selecionam-s¢ as unidades mais de uma vez. 1D. Feemplo de amostragem sem reposicéo , Em una pesgus cco proce erie am lh, para qua cong ined oto e a pessous entrevista, estas dever ser cuvidas apenas uma vez, pore, em na eleigo, 0 Aamesiragem éaparte mais voto individual “nporane ds Escttce ——C)_Exemplo de amostragem com reposigao ‘Quando se desea saber quanto tempo uma pessoa fica em uma fila de banco,# mesina pessoa Pde ser observ dass ou mais Veres, a ead ver que etorna 20 Banco. Justifica-se 0 uso da amostragem porque, comumente, € invidvel observar cada caracteristica de todas as unidades de observaedo da populagao, Além da escassez de lempo e de recursos, pode-se citar: + no caso de exume de doengas contagiosas, 0 pesquisador poderia infectar-se e comegar a transmitir a doenga a todes os entrcvistados; + com relagao aos testes destrutivos, ao final deles no haveria unidade de observagtio dis ponfvel: + no caso de exames médicos, impossibilidade de se estudar a totalidade do sangue de uma, pessoa sem causar-lhe a morte; + se @ trabalho despendido para obter os dados de cada unidade for excessivo, pode haver "anotuges erradas, motivadas pelo cansaco do observador, ap6s examinar as dItimas uni dades de uma extensa populagao. Decidido o emprege da amostragem, a coleta de dados pode ser realizada por dois métodos: * observagdo direta: as unidadcs de observagio da populace so obtidas pelo proprio ‘analista ou, entlo, automaticaniente, por um instrument. + observacdo indireta: as unidades de observagdo sto anotadas por outras pessoas e no pelo analista, Quanto aos fatores que i influenciam, a amostragem pode ser: ‘+ observacional, na qual no hi controle sobre os fatores em estudo pelo analista 1. Fxempto de amosiragem observacional (Qs estudos exaistios referentes intense de voto dos eeitores + de experimento, na qual é um controle parcial, ou seja, a slocago de fatores que podem influenciar os resultados esté sob o controle do analista; por exemplo, uma experigncia ‘om que as observagGes so feitas em um ambiente no gual uma situagdo € modificada para ‘que se verifique a influéncia dessa variacio. O Fxemplo de amostragem de experimento ‘As observages feta a parts de ma experéneia para verficara rag de pessoas submetidas a sioagoes de surprest “ce tubiam que seriam acondadas 6h em um dae knoe outros dos dias em gue oestudo ‘Joiconducido. Em um dos dias da experiencia, em vex de acordar os volumtias as 9h como Thaviam ito os cienistas os acordaraon ds h, para fetar como 0 organtam dessas pessoas reagiria surpresa de despertarantes do previo." Retirando uma amostra da populagiio (0s dados da amostra — relativos a uma cesta caracteristica de cada unidade de abservagio da populagaio— podem ser obtidos de maneira econémica, uma vez que apenas uma parte da popu- Iago é examinada, sided astral ee Titec de osergto ‘na cole desidades do-coinciee reds da ‘Trés tipas de amostragem (dentre 0s varios existentes) amosrogem ales sinpes ‘rover trade dun mostra dew popu don gua! (ou poriouade) deer reirade Copltula 1 Introdugao Unidade amostral é uma unidade individual de observagao ov uma colegao de unidades nio- coincidentes, retiradas da populagZo, Base amostral 6 uma listagem de todas as unidades amostrais. Por exemplo, para um conjunto de pecas produzidas por uma empresa em determinado més, a unidade amostral & uma peca individual c a base amostral 6 a listagem de todas as pecas produzi (principal objetivo de qualquer plano de amostragem € selecionas a amostea de tal maneira que la retrate fielmente a populacao, isto & seja representativa da populago, © que nem sempre “0 IBGE define come precéria a residéacia constuida com material de consrugdo impréprio— Tava, sueara, madera nao raiada ete.—-,0 que desconsidera casas de lvenaria em fares, [A preocupagdo deve ser constante em se manter essa representatividade "0... faz estudos prévios para saber como composta 0 cgnjuuo do eleitorado. O abjtvoé que ‘amostra sola representative do total de elelores."=* Amostragem sistemética Ha diferentes maneiras pelas quais as amostras podem ser sclecionadas, cada qual com vanta- gens desvantagens. e um dos problemas associados & amostragem é a definigao do tamanho da mostra a ser retirads da populagao. O tamanho deve minimizar os custos da amostragem, po- ddendo-se ter umostra até de tamanho 1. Uma amostragem é sistemctica quando a retirada das unidades de observagio & feita periodica- ‘mente, sendo o intervalo de selecao caleulado, para uma populagio finita, por meio da divisdo do tamanho da populago pelo tamanho da amostra a ser selecionada, Exempla de amostragem sistenética ‘Desejase reir uma amostra de n= 10 unidades de observacio de uma populgao de tamanho [N= 874, O ntervalo de selegio ¢,entio, 874/10 = 87,4 87 (aprostns-se pra menos, sen80 Se Uultrapassurd 4 ordem da itsma unidade),Desse modo, vio-se contando as unidades de observa~ fo eescolhem se aguelas que estiverem mas seguintes posiges: 87, 174, 261, 34%, 435, 522, £609,696, 783.0870. Amostragem aleatéria simples © processo de retirada de uma amostra de uma populago na qual cada unidade tem a mesma chance (ou oportunidade) de ser retirada denomina-se amostragem aleatéria simples. x amos- tra assim obtida 6 chamada de aniostra aleatoria. © process da amostragem aleatéria simples exige que se atribuam nimeros consccutivos as tunidades da populagao e proceda-se a um sorteio, colocando-se todos os niimeros em um reci- piente, por exemplo, ¢ retirando um aiimero, situago na qual cada unidade de abservagio tern a ‘mesma chance de ser selecionada. Entretanto, tal procedimento ndo é pritico para uma popula: ‘cdo muito grande; busca-se, entio, simular tal sorteio, 0 que é feito pelo uso de uma rabela de digitos pseudo-aieatérios (Tabela 1-1). Esta tabela, usualmente conheeida como tabela de miimeros aleatorios, 6 composta por uma relugio de digitos de 0 até 9 e tem duas caracter‘sticas que a toraam particularmente adequada & amostragem aleatéria simples: primeira, os digilos estio dispostos de tal maneira que a hance de qualquer um deles aparecer em determinada seqiéncia ¢ igual & chance do aparecimento em ‘qualquer outra posigo; seguido, cada uma de todas as combinagées de dois algarismos ter a mesma chance de ocorréacia, como também todas as combinagdes de tés algarismos, ¢ assim por diante, 1D Exemplo de uma amostragem aleatiria simples ‘Quando se quer selecionar,aleatoriamente, dezunidades 6e wma populapto de tamano N = 874 ‘Unidades, poge-e lists atibuindo-Inos consccutivarmente os mdimeros COI a 874, da primeira Aims, Como a klemitieago teve ndimeros de tr algarismos, ser necessti ler um Conjunto {e rs digtos em ura tibeladedipitos pseudo aleatros, para asegurar correspondencia entre (0s digtos psekio-aletérios a umdades da poptlagSo. Seleciona-e uma combinasao de dig {os pseudo aleatéaos, reirando sea unidade comrespondente so abmeroldb: se houverropetigho ‘32 sirgir wm agmcro maior ue o amano da populagso, este deve sr ignorado © eseolhids ‘tra combinagdo de digas. Exe procedimienta ¢repedido ata amostra de tumanho n= 10 ser ‘cscolhia WM Exerciciovesemplo L4 Deseja-c uma mostra de taranho 10 de uma populagto de tamanho 874; numeram-se3sunids: des de observagio da populagéo de 001 « #74, (Os ites pscudo-aleatsrios podem ser lidosisoladamente eu em grupo,cm qualquer ordem, por colunas ou por lnhas, da esquerda para drita ou da dita paras esquerda,diagonalmente da ‘esquenda para adieita ete regra de leitura pode ser qualquer ums, desde que ng sea ateraa ‘G0 final da amostrgem, Capitulo 1 / Introdugdo Tabela 1.1 Tabela de digitos pseudo-aleatérios. 10 cadewnes YO Uwres henesta!?! Users term tele demimeras altri ssw tseo7 wise 95208 ‘aise i ose wet ao | So fon an Set isu toa ie rr Sot Sane tia nie re ae CConsidere que voot comegon letra de cima para baixo.a panda primeira coluna, apenas dos tvesprimeinesdgitox Assim sendo, a primoira anidade sorteada serda 874, a segunda unidade, 11855.'e assim sucesaivamemte: 422,257, 7106, 162,434, 338, 365, 922 que deve ser descurts 4s, pr ser maior que 874) e 767. Qualquerseqzncia de 8s aigavismos fda em ume tabea de ‘igios pseid lear serve para entific as nidades a seem retiradas, eo provesto eon hua ae que voct tent ido dee ndmenoe diferentes (o que equiva & amostrgem sem reposigeo. titalmente utiliza}, os qua V30 covrespoder bs unidadesa sere estas ns popula. E comum o uso da expressio tabela de mimeros aleatdrios. porém o mais correto é falar em tabela de digitos psewdo-aleatdrios, porque eles so gerados a partir de uina expresso mate mdtica e de um conjunto inicial de digitos; se esse conjunto for gerado novamente, 0s digitos ssubseglientes poder ser previstos e, entio, a tabela nio serd mais aleatéria. Como 0 conjunto ‘de digitos se assemelha a um mimero porque as tabelas publicadas inserem espagos entre 0% digitos (geralmente um espago a cada cinco digitos) para facilidade de leitura, induz-se, errada- mente, a que se esteja lendo ntimeros, ¢ nao digitos. ara usar uma tabela de digitos pseudo-aleat6rios devem-se seguir os seguintes passos: * passo 1: listar as unidades da populagio; + passo 2: numerar consecutivamente as unidades, 2 comesar do + passo 3: ler nimeros na tabela de digitos pseudo-aleatérios de modo que o total de alga ris-mos em cuda tm deles seja igual ao total de algarismos do ultimo numero da istagem; se 0 tiltime numero for 56, por exemplo, devem ser lidos nitmeros de dois algarismos: {cas0 0 ultimo niimero seja 465, devern ser lidos mimeros de trés algarismos, e assim por ] [1] [J] ) relativa a seta para a direita, [5]. trés vezes, até destacarem-se, na primeira linha da tela, as letras PRB, quando apare- ‘com as seguintes opgSes: 1 rand 5: randine ( 2: nPr 6: randNorm ( 3: ner 7: randBin ( at passo 3: aperte a tecla [ENTER], situada no extremo inferior direito, para executar 0 pro- ‘erama; aparece o cursor piscante & direita da palavra rand. Aperte novamente 2 tecla [ENTER], quando surgiri o resultado. Para gerar outros nGmeros pseudo-aleatérios, basta ‘contimat pressionando a tecla [ENTER] ATI-83 também ger um nimero pseudo-aleatério inteiro dentro de uma faixa especificada por "um limite inferior e um limite superior. Os passos sio os seguintes: + passo 4: aperte a tecla [MATH], situada na primeira coluna de teclas, a quarta tecla, Obser- ‘ve que, na tela da culculadora, aparecem, na primeira linha, MATH (destacada), NUM, CPX & PR + passo 5: aperte a tecla azul (do conjunto de teclas azuis com setas para a esquerda, direita, acima e abaixo, & direita da caleuladora, [—] [-»] [1] [1] relativa a seta para a ddireita, [1], tees vezes, até destacarem-se, na primeira lina da tela, 3s leras PRB, quando aparecem as seguintes opgdes: 1: rand (cessaltada) $2 randint ( 2: mPr 6: randNorm ( ner 7: vanaBin ( ' a + passo 6: aperte a tecla azul relativa a seta para baixo 4 vezes, até destacar-se, S:randint: + passo 7: tecle [ENTER] e aparecers randint; para especificar um limite inferior, um limite ‘superior e a quantidade desejada de niimeros pseudo-aleatérios, digite o limite inferior, 0 Timite superior ¢ 0 niimero desejado de valores a serem gerados, separados por virgula (fecla acima da wecla com o niimero 7) ¢ terminando com um fecha parénteses (cla cima da tecla com o ndmero 9); *» passo 8: aperte a tecls [ENTER], e surgiré o resultado, Para gerar a mesma quantidade de Iniimeros inteitos pseudo-aleatérios no mesmo intervalo, basta continuar pressionando a tecla [ENTER] 1 Bxemplo de goragao de ndmeros prendo-aletirios na caleuladora T1-83 Para gerar seis mimeros imsios pscudo-slearis, © comando & randint(?2.15.61, Quando se aperts a tecla (ENTER) os resultados aparecem. Usandoo Excel A fungéo ALFATORIOENTRE i + passo 1: vi, na Bara de Ferramentas, a0 {cone f, (no Excel 97, a0 ser posicionads a seta do ‘mouse em cima desse (cone aparece 1 identificagao Colar funga0) ‘passo 2: clique duas vezes sobre o icone, para que surja a tela Colar fungao; ‘Passo 3: na coluna da esquerda, Casegorta da fungdo, clique em cima da categoria Mate- > ‘matica @ trigonomélrica, que fieard destacada: + passo 4: clique, na colun da direita, Nome da fungae:, a fungi ALEATORIOENTRE (Fi- gura 1.3); Figura 1.3 Fungo ALEATORIOENTRE. 4 Captuto 1 tarda + passo 5: clique OK na parte inferior da tela, surgindo a tela da Figura 1.4; + passo 6: 0 mimero pscudo-aleatsrio desejado surge ao se preencher os valores Inferior e Superior com o primeiro eo ultimo dos indices, respectivamente, das unidades de obser- vvacio da popalagio, Figura 14 Panel ALBATOROENTHE, (ROR ] pg0 j [3] eoesnatinee (oe as 1 Exemplo de erag de nimer pseudoraletrio no Beet Sendo 01» minima e874 0 mano da stage a popula, 0 niet ero 307m entad dais opr iafenBov) Teodo en vata seem pos uso mtn psec empl a fret enos nee o ese pec eee Stents ds pesos agra Figura 1.5 Mamero pseudo-ateatério era. Para gerar mais nimeros pseudo-aleatérios com a mesma fungdo, deve-se tomar ativa a eélula ‘com © niémero erado e levar o mouse até o extreme inferior direito da célula; quando a seta {quadrilateral branca do mouse transformar-se em uma erur simples, aperta-se © boto esquerdo do mouse e, sem deixar de pressions-lo, arrasta-se para baixo até onde se desejar: diversos rimeros pseudo-aleatérios surgem quando se solta 6 boto do mouse. A ferramenta de andlise Geracao de niimero aleatério + passo 1: vi ao menu Ferramentas e escolha Andlise de dados; surge a respectiva tela Figura 1.6); Figura 1.6 Andlise de dados. * passo 2: por meio da barra de rolagem da direita, procure, entre as Ferramentas de anil se, Geragéo de nimeno aleatério (Figura 1.6); * passo 3: clique OK no extremo superior dircito do quadro, surgindo a tela Geragao de numero aleatério (Fig 1.7); * asso 4: nessa cla (Figura 1,7), em Numero de variavels, digite a quantidade de colunas de valores que deseja na tabela de safda, usualmente 7 (para gerar uma coluna). Em Numero de numeros aleatérios, digite o total de niimeros pscude-sleat6rios desejados; cada va- for gerado apareceré em uma linha da planitha de saida. Em Distribuico, selecione © ‘modelo que deseja; no caso da arnostragem aleatéra simples, ¢ Unitorme, cujo nome € visto clicando-se na sets 8 diteta da palavra Discrete; nessa ocasio, aparece urna lista de opgdes; Capitulo 1 / ntrodugdo Figura 1.7 Geracdo de mimero aleatsrio. Figura 18 Tela para gerar nimeros pseudo-aleaisrios com 0 ‘modelo Uniforme. Figura 1.9 Tela preenchida para gerar 100 nimeros pseudo-aleatorios com 0 ‘modelo Uniforme entre 1e 874, Is surgindo a da Figura 1.8. Crinapatndeetine Na tela correspondente & Figura 1.8 devemser preenchidos respectivamente os valores inicial, 001, e final, 874, com o primeiro e o diltimo indices das unidades da populacao, bem como a semente aleut6ria — neste exemplo, 1999. Se varias pessoas usarem essa mesma semente no Excel, mas em computadores diferentes, serio gerados 0s mesmos digitos, presumivelmente aleatérios, A explicacao € que, no Excel, ha uma regra para a geragio desses digits, a qual, ‘sendo a mesma para todas 2s miquinas, produz.os mesmos Valores. Por isso, deve-se sempre iniciar ‘com uma semente aleatéria diferente para cada miquina. O aspecto € o da Figura 19. | | | secant | + passo 5: clique OK na parte superior da tela; surgem todos os ntimeros pseudo-aleatérios gerados. 16 Capinto 1 1 ttrotugdo W Exerciciovecemplo 19 Digite, o Excel, s partir da tla da Figura 1.8, 08 valores 001 © 874 nos espagos Entre. Eo € Emanosragen, pensar que sé com a sementealetéria 1999, observe o nimero geredo. ‘tease inden end Cady combinaga de resultados de dgitos pseudo-aleat6ris toma-se a semente para 0 proxi- ateninreneqelenaiee yo: deyense tomar cuidado porgue, sea setvente fora mesa, repete se a seqleiia don digi ecrytiractones e" tos pseudo-aleatrios, 0 que descardteria 1 aleatriedade, Garante-se. na praca, aaleatorie- doer eM dade dos digits gerados utilizandorse uma fungio matematica, denominada gerador de ccreuriiterjeaivateusten digitos pseudo-aleatorios, de tal maneira que 0 momento da repetigao da sementesleatGria fcorra aps tanto tempo que, no intervalo entre um dgito (ou uin Conjunto deles) e& sua repe- tigao, os dipitos gerados podem Ser considerads aleatSrios Erros na amostragem Geralmente, as causas de erros nas amostragens so as seguintes: * falta de aleatoriedade na escolha dus unidades da populagZo em uma amostragem simples; * falta de representatividade de populugio: “ Estausticas? Ah! Esté em alguns jornais estaética sobre o mmero de erentesem todo 0 ‘mundo..Nerfcaram, com menos preclide sileen ti fem, quem aeredita em pam, pedra (ou girino. Ea mda ~ ah « mia — repete iso sem 4 menor nota crea, Revelo una eksa: a mim ninguém veio consular Contultaram voc, lito amiga? F depois, digarme 1 todo G mundo € enquadrado"religiosamente? Nao tem meutro? NAO tem ningun mals oumenes, assimasson? Cristo &cristdo 24 horas por dia? De vez em quando ee no fe tia fens mea macunba?™* * falta de especificagio ou determinagio de uma populagdo, o que pode ocorrer na listagem incorreta de uma base emostral; “Mistério. Os téonicos do IBGE tiveram algumas surpresas durante a elaboragao do Banco de Injormacées Munictpais. Uma delas Jo um certo tipo de dito. "morte porolha eins”. ‘problema, resrioacldade de So Paulo, fez eric vitman. De que se train esse mal nnguém tem a mais pla ide.” + variagdo aleat6ria, causada pela variabilidade natural inerence as diversas amostragens; “Em lugares como Rio Grande do Su e Bras, mul plitzados, esses vias a sto trad “Hoje.a proporsto de mulheres analfebetas 56 é maior que a de homens entre as pestous com ‘mats de 40 anos que passaram pela escola hd pelo menos 20 anos. A mator diferenca et ‘enire as pessoas com mats de 30 amos. Nest fsa etria, 28% dos homens © 34% das ‘mulheres so anlfebetos, segundo dados do IBGE." ‘dna segunda fetra, quanto a contagen das urnas de lona mal einiciara 0 PT divulgou wm document listando uma devena de diferengas entre or volo eas as pesquisa. eaugerl ‘a erlagdo de uma CPL." 'Ndo considem para a mesma urna Lulza Eraadina ¢ os insitutos de pesquisa. Em 1988, 20 ‘legor-se prfeta de So Paul, ela provou que pesouia nao ¢ profeca, Nesta campanha, fayisow que nao votaria em Francisco Ross! quando 0 candidate liderava a’ pesgulsas Evundina ¢ a verdadeira boea de urna." “scr confusto se tradi nos niimoros de nia pesquisa exclusiva encomendada por. 20 Inst nue fetta em cinen capita do pas." Informagoes adicionais Umtrabatho A mods do robin ako sled pees pelo etic, te orn pode pen Sees oe ke gate ora pt rate, eso see Jui aeoeesDeseentiaar ges Soetnea de eyage€ tenn ae eect adds dase oso, cla pase ee aca ata ean uae tte ince Sata mses pee ee ee ee Iusnesult! Sbvameunits ps Ssuitceoaa re eae ae tite complexe odes sells eas cobain i rae dar nn Ney Ae Baa ele a Acasiwaron Saskaonen cmieiger an peeing eae ace Lee awalquer'eore. & problema é de Fato estatistico; em caso positivo, parte-se para decidir 0 melhor modelo a ser ope Umapalavra A quantidade de informasGes estatisticas que vém a piblico é tamanha, que se pode querer deadverténcia distinguir entre as boas e as mds estatisticas. Algm disso, a emissio de conclusdes erradas a partir de observagGes ¢ valores absolutamente corretos constitui um problema. Mais ainda, as Vezes ocorre que, com os mesmos valores, so estimuladas decisdes conflitantes. Convém esclarecer que 0 adequado tratamento estatstico de um problema consiste em fazer uma série Capito 1 taroducao de observagdes, realizar alguns caleulos ¢ chegar a uma conelusio, Todavia, é de fundan importaneia perguntar, primeiro, como se planejou a pesquisa e como se anotaram as observe {g0es. Como ocorre em qualquer campo do conhecimento, nada se consegue em Bstatistica se toh ncticotnaem hamarsede Etenaeset rms gee no bedecen fesreqrasestattions Indo se tem cuidado no estudo correto em todas as fases da pesquisa, desde 0 conceito © 0 enunciado do problema, passande pelo planejamento do projcto, pelis etapas de coleta das observagies e pela anilise e interpretagio dos resultados até se chegar a uma conclusdo valida De modo geral, nao hé célculo matematico ou manipulasaio estatistica que possa dar resultados confiiveis a partir de observagGes malfeitas ou amostragens malplanejadas, “N Termos-chave Método estaistco Populagio ‘Tamanho da populagte ‘Area de abrogencia Unidade deobservagio (Caracteristica da unidade Se observaci Verve, Nasiivelqualtaivn ariel quanitaiva Resumo 1, Estuda-se Estatistia para aplica seus conceitos como auxslio 8s tomadas Je decistodiante de incerezas, jusiieando cietificamien- te 88 decisdes 2. O métado estaritico € um processo utilizado para obte,apresen- tare analisar caractersteas ou Valores numérices para uma melhor tomada de decisio em situagbes de incertez, 3. O objetivo da Fstatistica ¢ 0 estudo da chamada populagao, que consisie na totalidade de unidades de observagao(astalinente pes- soas, objetos ou eventos) a purtir das quais so desea tomar uma exis. 4. Ao 6e descrever uma populagio estatistca, deve-se diferenciar lunidades de observacdo dss caractertsticas dessa populagto, ‘Una unidade de observagio € um objeto (ou grupo de objtos) do Al se coletam dads, e que pode ter vitascarscersticas, embo- ‘20 inleresse geralmente recaia sobre apenas uma ou poucas des- 25 caracterstieas. 5. Em Estatistica,variével € uma atribuigo de um nimero a cada earacteristiea da unidade de observagso, ov fea, 6 uma fungio ma lematies definida na populagio. A varivel pode ser quolitativa ou quantitatva,e ests dima pode ser disereta ow continua (Quatro eseslas de medidas podem ser usadas para ceracterizar as unidades de uma populaeSo: nominal, ordinal, intervalar © pro borcional. fato de uma variével ser expressa por nimeros nao significa que elu seja necessariamente quantitatva, porque a class- ficagéo da vardvel depende de cam foi medida, eno da mancira como se manifest, (Oestudo estatsticoinicia-se coma colet de parte de uma popu 60, denominada amostra, consttuda por» unidades de observa. sifo © que deve ter as mesmas caracteristices da populagio, Esse coletarecebe o nome de amostragem. 8, O principal objetivo de qualquer plano de amostragem é selecionara mostra de tal maneira que ela retate Felmente a populagio so, ‘ej representativa da poplagzo, 9. Entre os vrios ipos de amostragem, destacam-so es: sistema ca, aleatoria simples © extratificada: 10.0 processo da amostragem alatGra simples exige uma simulago Vorivel discret Base amostral Varigvelcontint Amestragem sistemétiea Escala nominal ‘Ammostrager alata simples Escala ordial Digits pseudo-aleatrios Escala itervalar ‘Amostragem estatiicada cals proporcional statistics deseiiva Como Inferéncia estatstica Amos, Probables ‘Amostragem ‘Semente letra Unidad amos de soreio, o que ¢ feito pelo uso de uma tabela de digitos pseudo- aleatérios, 11, Generaizar para a populagio aquilo que se observou na amostra curacteriza # inferéncia estatistica, parte da Esttitica que usa ‘uma amosta para fazer generalizages a respeito de aspectos im portantss do uma populagio. 12. Como as informagdes provém de um conjunto menor quea popult- 580, cometent-se erros ao se fazer uma inferéncia Estes erro x30 uantticedos pela probabilidade, a qual além ée lidar com sitaa- {bes infivenciadas por fatores nfo-contcolados pelo analista, pro- porciona un modelo raional para lidar com varablided inerent 2 natureza, bem como com situagbes relacionadas como aeas0 13, Com o surgimento das caleuladoraseletronicas ¢ dos computado- res, © trabalho estatstico ficou mis facil porque e eliminam 08 ‘’flulos eansativos e economiza-se tempo para a madelagem dos problemas, para a coleta de valores previsos ¢relevantese part @ andlise dos resultados, 14. A tecnologia mudou radicalmente a maneira de xe ensinar e apren- der Estatistia, bem como a maneira de resolver problemas. 15. Geralmente, a5 causas de erros nas amostragent sf0 a falto de aleatoriedade na escotha das wnidades da populacao em wna lamasicagem simples, auséncta de representatvidade da pop lacao © especificagto errénea de uma populace e variagao alearéria, 16. A maioria dos problemas nto ¢ resolvida apenas pelo estaiticn, ‘mas por um grupo de pessoas que o conhece em detalhes; a0 estar ico cabe selecionar as ferrumentes extatisticas para gjudar 8 resolves; 0 sentimento de equipe€ fundamental em qualquer es ‘nd, 17, A quaatidude de informagoes estatisticas que vm a publico tio irande que se pode querer distinguirentre ws hoase 38 mar estate {icas. Ouro problemaé emir conclusses eradas a parti de obset- vagdese valores absolutunentecoretos. Mas sna, 8s vezes ocorre que, com os mesmos valores, So estimaladas decisdes confltantes Todavia, éfandamental perguntar, primeiro, como se planeou 8 pes quis e como se anocaram 2s observages, 18 Sa Exercicios propostos “Tabela 1.2 relaciona a8 30 maiores empresas privadas do Brasil fem vend, € os pases que tm 2 maior das ages delas (revista ‘Exame, Maiores e Melhores, julbo de 1998). {8 Utilize atabela de digitos pscude-aleatrios (Tabela 1.1 pag. 9) para seleconar oto das empresas para serem entrevstadas em fetalhes« respeito de suas estratégias de erescimento. Come- Tabela 1.2 Observagbes de duas caracteristicas Capiaulo 1 /Introducao sgando com o extreme superior direito e movendo-se para baixo ‘has duasltimas colunas da direita, observe que os primeiros n- btidos $80 64, 06 75; determine as em presas restantes, segundo a mesma reer b. Nentfiqueo tipo de escala do controle acionério dessasempre- Empresa Controle actonsrto Empress Controle atonério votkswagen Alewaaha VeledoRioDoce Brasil, ow Estados Unidos Catia Bras Fist Avwomovels ia Mercedes Bene ‘Alera \ Shell Ilaror/Holanca sx Bra! Souza Cre Inglaterra 1M, Estados Unidos Canefowe Franca Light Frange/Esados Unidos Ipirange Baal (Caine Babs asi Fors Estados Unidos | Ustmtinas Bras ‘Brakna Bri Loja Americonas Brau Neste-sP Sug Mulsbrés Brat Gessy Lever Inglateratolands eval Sermadas Texaco Estedon Unidos Copernicar Bras Eso etadat Unidos argit Estados Unidos Po de Agicar Brasil Credicaré Bras Vie Prsil on. Bras i Foner Exams Mores Melhores, jlo de 1998 resultados do SAEB (Sistema de Avaliaglo da Fducago Bisi- ca) de 1997 basearam-se em ura amostrs de 167.196 estudantes ‘das 27 unidades da federagS0, de escolas publicas pariculares do ‘Brasil, Esses resultados geraram polémica, porque enquanto aque lesestados que tiveram bom desempenho na avallaeio comemors- van resultados, a secretéria de Ecucago de um estado afirmae ‘vaque oseu estado tink sido prejdicado porque a avaligfo exclaie alunos das escolas téenicasestaduas, que “tém um desempenho ‘melhor ‘a. IdentiFique o tipo de escalauiizada na frase “tém um desempe- nko melhor". b. Jusifique a sua concordncia ou discordincia quanto firma va dessa secrotéria de Educacio. is Engenbaria de AvaliagSes, diversas caractersticas de um imé- ‘vel so consideradas para 0 cfleulo dos pregos de vend e de uel de imeveis comercisiseresidenci 8, Kdentifiqueo tpa de excala a ser utlizada pars as seguintes ca racteristicas: ea global, idade localizegzo.*” ‘b.Expligue como quantificar existéncia ou inexistincia de gora: gem no pred. 4. Um antigo da revista Professor de Matematica, n.°3, do segundo remestze de 1983, expica como um génio pode ser reprovado em. "um teste de inteigéncia, porque a maioria dos testes exige iniigoe no deducio,palpites em verde raciocinioWico. Comos eonbect tentos que voce ja tem de Estatistica,responda & segue questi: que nimero est faltando ma sequencia 1,2, 43? 5, Ieatfique os ipos de escala utlizadas para cada uma das svintes caracteriticas das unidades de observacto, retradas de uma tabela ‘do Guiado Ususrio do aplicative Microsoft Bxeel: mes, tpo ce peodue to, wendedor, ego dopa, unidades vendiasetota de Vendas. (© eerie sos moseage eats pegs“ ‘quisa ouviu mlheres de todss as classes sociais, com idades que Variam de 25 270 anos. Nesse universo, 66% no acreditam que © Viagra poses melhoras 0 desempenho sexual do parceiro.”*> 17. No livia Boas priticas de laboratSrios elinicos elistas de veri- {ficarao.* wilizado no Brasil, consta que 0 cadactro do paciente ‘deve contr, entre outras, a seguintes informagdes: bridade: 4. procedencis on origem (p. ex. posto de colts, convenivete.); cecdata do atendimento; £ ndmero do registro; g.telefone do paciente ou do solictante (no havendo,€ obrigatirio enderegor, .nome do responsivel pelo paciente (quando fo 0 caso); 4. telefone do responsével (ndo havendo, éobrigatrioo enderego) ‘Com base nessas informagBes, monte uma tabela em que todas as cearacterfiticas possam ser preeachidas. 8, Um ariculista afirma que “cerea de 33% da populagto brasitira reclama de uma ou dass noites maldormidas na semana, o que alte ‘aa qualidade de vida da pessoa” ** Discuta essa afirmago. 9, Segundo aedigio especial da revista Veja 30 anos, de 1998, "cada ‘exemplar ¢lido por quatro pessous. S40 4,5 milhSes de leitoes por semana”. Comente come a revista chegou a esses resultados. 10, “As lojs, em Sto Paulo e Rio de Janeiro, pretendem reforgar no ccnsumidor — em especial o jovem de 15 229 anos que gosta de fesportes como surfe skate — a idéia de que essas linbas si a cara de sew estilo de vida." Identifique o tipo de amostragem rea- Tiaada, Capitulo 1 / neradugao 11. -Erai cream seme se dir dsrensa emer epi ae siorontn cm nares Droop tein escarole yom poston amen, 12 Bet ss ere dedi de 198s pues Ip nes ar esata np! soto Tong ines apinbonmance ae hau Supenysecn pute cerita stun unf tenuis made cea sone mri gee ipod avant remade 13. Sie a ogi ah“ me nora por 7 Cimapel son tnossne We cn d diuieibee qa on scouagpranecawtoseeamgaers escolher entre elas a televisio.™” Indique a importincia da Estatfs- ‘camden pte Ta ana mata sr pe ree watlndaccnnreyos Dalees erecear ep Shraseaet txts tess cpap ‘ier trcteaiesune casvence Duss es ee tims xe Toadoe press we ely 1s atnious Scipio espe domo SS depute prensa ea En ima reportagem sobre esterestipos" publicou-se que “hé ainda 0 ‘Tinie erste Geb at Sues pnt Creat San sewsitaremenyonieiaeac Teale sts gers nt Shapes Ben oi neces smear sonnei fonts tccasign Coane rere sees onunaipae stants Un ern egrcr pean cmcanateomirs inn nakcnng tesa oor Sts esac etc & Solugies dos exercicios-exemplo 1.2 Actcala adotada€ a ordinal 113 Asnotas podem ser ordenadas ,além disso, determinadas as dife- rengas entre elas, constantes e conhecidas, havendo um zero em ‘comum. A not26,5€0,| maior que 6,4,3mesma diferenga entre 64 £€6,3; neseala proporciona. 1.5 a.com base em uma amostra de 8.548 pessoas, estima-se que a ‘marea do sabio em p6 ABC é lembrads por (683 + 8.548) x 100 = 7,99% do total de consumidores; © jomal noticion 83%; @ Fontes de noticias e citagoes 1. Pere Simon, marqs de Laplace, matemstico francs do sf. XVI. 2. Twan Sor especialista em informatica que srmazena em computador ot valores sobre a selesao, sobre as pessoas que se dedicar a ei estast= ‘as obve # selegio. olka de S. Poul, 24/2/1995 ‘3 Garlos Drummondde Andrade Jornal de Bra 2974198 9 1. Hdentifiqueo tipo de escala uilizada para classificar a nacionali- dade de urna pessoa. ‘Discua a preciso das informasBes obsidas em um eenso demo- srifico. ceIndique as possiveis consoquéncas do fato de um entrevistado ‘nfo conhecer 0 signifieado de alguns termos contidos nas pe- sguntas que Ihe s30 feitas, 17. Considere o artigo jomalistico™ que afirms, a respeito das pesquisas realzadas anes das eleigdes de 1998 no Bras: ‘."Ninguém duvida do poder de indugo dus pesquisas eleitoras.” ‘Comente essa afirmativa com relacao& sua abrangéncis, 1b" seria fantasia suspeitar que as pesquisat sto manipuladas? Bs- _pecalmento se, bers as ura, ws cvergéncias entre os estado reais eas previsdessi0 signficaivas, que se pode-pensaz? Ot serdo apenas erros inocentes dos institutes — que als nunca erram nas apuragées de audiéncias de TV, ou nas pesquisas de mercado para langamento comercial de produtos?” Discutaessasafiemagdes. 18, Anuncio de empress telefonica: "Pesquisa... mostra que, sete meses _apés entrar em operagio na cidade, celular da XYZ recebe nota 7.3 ‘conta 6,4 do concorrents." Logo apés ests noticia, 0 comentiri: “Na avaliagdodo,..aXYZtemo melhor servigo de elfonia celular (63% de saisfaglo™! Comente a respeito desses nimeros 19, Comentea sepuinte noticia: “Segundo a pesquisa, realizada portele- fone no final de semana passado, com uma amostra de 961 pessoas, 32% dos entevistados diseram que ele deverig volta para o Chile ‘Outros 17% afrmaeam nao saber a resposta."*® 20, *Como foi feita a pesquiza: 0 trabalho foi feito por meio de entre- vistas pessoaise em grupo com mais de 500 milionios de pesgui- sa5 com mais de | 1,000 pessoas de alta renda ou com alt pasimanio Tiqoido. Cada uma responde 249 questdes sobre os mais diversos ‘pico igados a dinheio,” Essa noticia foi pubicada na revista Vood passo 3: tecle [2°] [1] [J 12" [2] {ENTER}, * Como Excel Para o efleulo da média aritmética ponderada da amostra utilize 0 Colar Fungdo com 0s se- guintes passos: 28 Figura 2.3 Céteuto da média ponderada SOMARPRODUTO no Excel. ‘ein raed order nde rod detederoveiores da Capitulo 2 / Andiise exploratoria de dedos * passo 1: digite em uma coluna os valores para os quais se deseja a média aritmética onderada, coluna A, por excmplo, de Al até AS, e na coluna B 0s pesos respectivos, de Bl até BS; * passo 2: escotha uma célula na qual voce queira colacar 0 resultado desejado, tomnando-a ativa; *+ passo 3: clique duas vezes na célula ative e digite '=SOMARPRODUTO(AI:AS;BI:BSYSOMABI:BS); EERE oton sion nave remimmstotastreerseteriie, { 2 eemnstinne v0 Cen ress + passo 4: tecle ENTER € 0 resultado aparece nacélula ativa, Bxceléncia Empresarial. Inticador eriado por Melhores © Miiores. E obtido peta soma de Pontos ponderades conseyuidas pelas empresas em cada wn deste seis inficudoves de desempento:lideranga de mercado {peso 10), erecimento de vendas (peso 20), rena. lidade do pourimdnio (peso 25), Tiquldes corrente [peso 20) inventmento no tmobile (peso 15)'e valor adiclonado por empregado (peso 10). Notar que. para rentabilidade @ Invesimentos no imobilizado, fo ainbuldes pontos apenas cujes indice sejam posto Em cada indicador a escala de ports iiciaie vai de 1d pare-o primeira colocedo até T ‘para odcimo, Asim, o primetro colacado em rentabilidade obtém 250 pons, 10 ponies Iniciats vezer 0 peso 35: Determinando a média geomérriea da amostra © Com a tnguagem naturat A média geométrica de uma amostra & um nimero que, levando em conta o total dos elementos da amostra, pode representar a todos, sem alterar 0 produto desses elementos, Assim sendo, a média geométrica de uma amostra de tamanho n € igual 2 raiz de ordem n do produto dos m valores. * Com formulas ‘A média geométrica de uma amostra com n valores, x. %yy nye Mo tem simbolo especial. ‘Como a média geométrica preserva a caracteristca do produto de todos os elementos e representa cada um deles, tem-se que: 2 POR PO 00%, = MC Me 9M (um total de n valores iguis aM) = Mt esse modo, a média geométrica 6 caleulada pela expresso. Diferentemente do que ocorre na média aritmética, a média geométrica de uma amostra & defi- la apenas para ndimeros positivos, © Com a caleuladora HP 486 * passo 1: digite 0 primeito valor, [ENTER], digite © segundo valor, digite {X), 0 terveito valor, Pe assim sucessivamente, aé o ditimo valor e [XI + passo 2: digite ne aperte as teclas verde e [/) * Com a calculadora Casio CFX-9850G/99S0G + passo 1: digite o ndimero n de valores; * passo 2: digite (SHIFT) [*}(equivale a \ ), (9.0 primeiro valor, digite [X,digite o segundo valor, digite (Xi, 0 terceiro valor, [XJ assim sucessivamente, a 0 timo * passo 3: aperte a tecla (EXE) Capitulo 2 / Andlixe exploratéria de dados 29 © Com a calculadora Texas T1-83 Para calcular a média geométrica dos valores armazenados na Lista 1 * passo 1: digite o total de valores: r + passo 2: tecle (MATH) escolha MATH, digite [6], equivalente a Vs + passo 3: tecle [2°] [STAT], escolha MATH, tecle 6}, equivalente & :prod ( | + passo 4: wecle [2° I 1]ENTER!, + Como Excel + passo 1: escolha, primeiro, uma célula na qual se queira colocar o resultado desejado, tornando-aativa: «+ passo 2: clique duas vezes no Colar Fungao, abrindo-se a tela da Figura 2.4; Figura 24 i Tela Colar Fungao. gape te tan tenant, ES) ce + passo 3: clique, no quadro 2 esquerda, a categoria Estatistica e, no quadro a direita, MEDIA GEOMETRICA (que deve ser procurada, agindo-se na barra de rolagem lateral); na parte inferior, clique OK, surgindo a Figura 2. Figura 2.5 Tela do Excel para a média geométrica da amostra Cer + passo 4: digite, no reténgulo Ném1 (agora com um tago vertical intermitente), a céh- fas inicial e final do conjunto de valores para os quais se deseja determinar a média geo- ‘métcica da amostra, separadas por dois pontos ou, entio, selecione o conjunto de valores Clicando ¢ arrastando © ponteiro do mouse (sein soltar 0 botéo); neste ditimo aso, obser Ve que em Niimi aparecem as colnas inicial e final onde foram digitados os valores e, & Jireita, parte da listagem doles; aps preenchido Naim, o resultado da média geométrica dda amostra aparece na extremidade inferior esquerda (Resultado da formula), + passo 5: clique em OK; feche a tela € 0 resultado aparece na célula tomada ativa no asso 1. “A estimatva do IBGE part a tayoura de arr: trigado na safra gauche 9899 ¢ de uma dreade “S05 O88 hectares,” com produc de 4.629.361 toneladas” ¢produtividadeinicil de 8.172 ‘quilos por hectare.” 1M Exercicio-evemplo 25 ‘8. As importapdes brasieras durante 1998 foram as seuintes, em bie de dlars: janeiro, S77 tevereno. 3.709: margo. 5.038) abil, 4.779; malo, 4913; junho, 4.844; jlho, 5.329; Imatonclas equate 000 qs 30 media de ume amour Se ‘ema Teagan em orem ‘rescen udecrtcotede srandeza dor ares dene omoine. 0 var ouwamedia ‘rime dn velre) ge eapaim) pongo conrad agen Capttdo 2.1 Andlise exploraria de dados ‘gosto, 4.534; setembro 5.38; outubro, 5.039; qovembro, 4.709; dezembro, 4538." Deter ‘mine a média das importagesbrasileirat ern 1998, '.O erescimento do Brasil foi de 2.8% em 1996, 3,75 em 1997 £0.55 em 1998. Determine a ‘axa média de crescimento do Brasil nesses tres anos Compreendendoo conceito de mediana ‘A mediana da amostra é aquole valor que ocupa a posigdo central da listagem, estando a mostra com seus valores em ordem erescente ou decrescente e com todos os valores tepeti dos também inelufdos, individuaimente, na lista ordenada. A mediana da amostra divide o con. junto total em duas partes iguais, com metade dos valores acima da mediana da amostra e meta. ‘de abaixo dela. A mediana de amostea pode ndo pertencer 40 conjunto original de valores, Quando a quantidade de valores & mpar, a mediana da amostra é 0 valor que ocupa a posigGo ‘central, posigio tnica, Quando a quantidade de valores ¢ par, hd duas posigdes centrais na lista ordenada; entdo, a ‘mediana da amostra é a média aritmética dos dois valores que ocupam as posigdes central Determinando a mediana da amostra + Com a linguagem natural Faga o rol da amostra ¢ verifique qual o valor que ocupa a posigio central; no caso de haver um infimero par de valores, hd duas posigdes centrais e, nesse caso, a mediana da amostra é a média aritmética dos que ocupam essas posigtes, M Exereicioexomple 26 Determine a medianado comportamento da Bolsa de Valores do Rio de Janciro na primeira semana {janeiro de 1999, com base em 09%: 2feira +186; 3" Feira: + 24%. delta 4 288, S fete ~R1% e 6 Feira: -1.2%." M Exercicio-exemplo 2.7 Determine a mediana dos segunte indices de reajste de alugus: IPCA, 1.16%; IGP, 1.414%: INPC, 2,645 eIGP-M, 2.18%." + Com formulas Faca o 101 dos 1 valores da amostra; se hé um ndmero {mpar de valores, a mediana da amostra é © valor que ocupa a (1 + 1)/2-€sima posigée a partir do inicio da lista, W Exercicioexemplo 28 Determine a mediana do comportamento da Bolsa de Valores do Rio de Janeiro na pzcia seman janeiro de 1999, com base em OM: Dera: + 14%; 3 fora + 2.46014" Tera VF 5 fee BIG 0 6 fei 12%" ‘Se h4 um niimero par de obscrvagées, (n+ 1/2 niio é um ndmero inteiro, mas um ndmero da forma [intciro + 0,5]. A mediana da amostra é, entio, a média aritmética dos valores que esto ‘nas posigdes [inteiro} e [intciro + 1] a partir do inicio da lista M Exereteio-sxemple 29 Determine a medians dos seguntes indices de reajuste de alugutis IPCA, 1.165 IGP, 119%, INPC, 2,648; 8 IGP-M, 2,185." * Com a calculadora HP 486 + passo 1: digite os valores em uma coluna de mattiz; * passo 2: na primeira linba da tela principal aparece {HOME EXAMPLES PRGS}; tecle [VAR] e 10] (Média); o resultado aparece. * Com a cateuladora Casio CPX-9850G/9950G + passo 1: insira 05 dados em uma das listas: + passo 2: tecle [MENU] para ir a tela principal; + Passo 3: coloque o cursor na opcdo RUN e tecle [EXE]; * passo 4: aperte, pela ordem, as teclas [OPTN], [F1] (LIST), [Fél(scta para a direita)iF4\(Med)(F6}, (seta para a diteita), (F6) (Seta para a dieita) (F1} (List (1] (se for a Lista 1) ) (fecha parénteses) e [EXE]. Aparece na (ela o valor da mediana da Liste 1 Median(List 1) + Com a caleuladora Texas 71-83 + passo 1: armazene os valores na Lista 1; + passo 2: tecle (2% [STAT] (List) MATH 4:median; + passo 3: tecle ((2°I1}(L1) [ENTER]. amo Excel * passo J: primeiramente, escolha uma cétula na qual queira colocar 0 resultado desejado, tomando-aativa; Copituto 2 / Andlise exploraidria de dados 31 Figura 2.6 Mediana no Excel. Figura 2.7 ‘Tela para a Mediana da amostra. Tabela 2.4 Rentabitidade das 10 methores empresas do Brasil no setor da eletrocletrénica em termos de retorno de investimento, em %. *+ passo 2: clique duas vezes no Colar Funcdo ¢ procure a fungdo MED. surgindo uma tela como a da Figura 2.6; tar aodia sina oun tine ota dein 3 cea: + passo 3: clique, no quadro a direita, MED e, na parte inferior, OK; surge uma tela como a da Figura 2.7: enacts Ce ee + passo 4: digite, no retangule Ném} (agora com um trago vertical intermitente), as célu- as inicial e final do conjunto de valores para as quais se deseja determinar a mediana da amostra, separadas por “dois pontos” (no Exercicio-exemplo 2.1, A1:A80) ou, ento, se- lecione 0 eonjunto de valores clicando em Al ¢ arrastando © ponteiro do mouse (sem soltar 0 botio esquerdo) até a eélula ABO (ado se preocupe com a notagav $A$1:8A$80): neste tiltimo caso, observe que em Néiml aparecem as colunas inicial ¢ final onde foram digitados os valores e, & direita, parte da listagem deles; *+ passo 5: apés preenchido Naim, clique em OK, feche a tela ¢ o resultado aparece na c6lula tornada ativa no passo 1. ‘A revista EXAME —~ Maiores e Melhores dejulho de 1998 apresentow a rentabilidade das 10 ‘nethores empresas no stor dacletrocetrnica, em iermas de retenia do bvestinento obtido mmo ano, em (Teele 2) Emprost Feo retorn do investment as ae sa 281 28 219 1 6s 12 28 ‘ei empresas Fonte: revise EXABE — Malone e Melhores, juho de 1998 32 ods ‘reewbiclamaamonra Figura 2.8 Fungo MODO no Excel Capitulo 2 / Andlise explorasria de dados ‘A mediana das 22 empresas € igual a 6,5, média atitmética dos retornos das empresas que se tencontram nas posigdes 11 ¢ 12 (€ que ndo estio na tabela). Observe que todos os retomos tabelados sto maiores que s medina. W Exercicioveremplo 2.10 Determines a mediana dos valores da Tela 2.1 (© Navegando ma Internet (0 surgimento da inguagem JAVA, como uma inguagem de programag8o com aplicagio na Web, independentemente do sista opetactonal utiliza, estimulow o desenvolvimento de aplicaivos pura demonstagdes intratvas vis Interset. Vi a0 site atp./fwwnirfrice.edl-lanefsta sim Index hin ot hip: iva rit edu/-ana/sat_simesriplivefindes hn © vein una see de ‘Simulagbes,ente 59 qvals Mun and Median, que demonstra as proprieddes bisicas da média arlimética eda median Instragdes, Um botko Begin incie) aparecers A exquerd quando o applet acabr de ser care gi {00,0 que leva sproximadamente dois minutos, & velocdade de 33.4 Bps. Se esse bouo no parecer, provavslmente 0 seu browser aGo suporta Tinguagem Java, E possivelconecturse ‘ualquerdesses ites, independentomente do browser que Vocus, mas para ye as demonstra ‘es Tunclonem é nacesieio que o Browser tenba capacidade para exeewtt 0s applets. Compreendendo 0 conceito de moda ‘A moda da amostra é 0 valor que mais aparece na amostra. Quando hi apenas uma moda, a ‘amostra denomina-se unimodal; duas moda, bimodal: is. trimodal; e quatro ou mais mods, polimodal ou multimodal, Se todos os valores ocorrem a mesma quantidade de vezes, a mostra senomina-se amodal. A moda da amostra sempre pertence uo conjunto original de valores. Determinando a moda da amostra + Coma linguagem natural ara determinar @ moda da amostra, basta procurar o valor que mais aparece. 1 Exercicioesemplo 2.11 Determine 2 moda das primelras marcas que Ihe vim & cabegs:" OMO, 8%; Coca-Cola, 5%; ‘Bombs, Natura, Philips Avon, 1%. 1M xercicin-exemplo 212 Determine a moda das marcas de nis mais lembraas por voe8, exceto a Olympikus (5% Rainha, 1456: Nike, 14%; Adidas, 7% e Reebok, 4. + Com formulas [Nia hé férmulas para se determinar a moda. Com a calealadora Geralmente, néo se determina a moda com a calculadora. © Como Excel © Excel nio calcula corretamente a moda de uma amostra, exceto se a amosira for unimodal; ‘caso haja mais de uma moda na amostra, 0 Excel s6 reconhece 0 valor que aparece listado primeiro, ignorando qualquer outra moda existente, Além disso, no Colar Funcdo, waduziu-se erradamente a palavra inglesa mode por modo, quando a mais correta © mais extensamente uusada é moda, Embora nao se recomende calcular @ moda de uma amostra no Excel, 0s passos sio os seme Thantes aos do edleulo da média aritmética da amostra e da mediana da amostra, mas agora usando a fungio MODO, conforme a Figura 2.8. Captule 2 / Andlise exploratsria de dados 33 Um nimero para mostrar a variabilidade dos dados: as chamadas medidas de dispersiio hueresil1! sat interpctgie dos fos. censderar apenas medida de tendeniacona “Gironaentreomeior eo mera damesina 1M Leerccio-evemplo 213 Determinar a moda dos valores da Tela 2.1 Peefil. 0 sursza brasileiro tert enie 30 ¢ 0 anos, rnda média de RSI.800 segundo grau completo, Viaiaduas veces por ano ede énibus Se objetva principal évstar parenies ¢ ‘amigos. A maioria— 70% — vigja durante a alta ert, As viagens durant emma 72 ‘lias, Ese &0 pert tragado pela Fundasdo Institute de Pesquisas Eeomamicen ds USF do ‘wrisa brasileiro em 1998. Ox dacos constam da publicacdo Dados Estaliaticos de Tureen a Tro98."" © Navegando a Internet Visite site da Embratur — Empresa Broiler de Turismo (wuw:embratur ox) atuaizese ‘quanto 205 dos estasticoe de turismo no Brasil. Verificou-se, a0 longo da histéria da Estatstica, que a melhor e a mais usada medida de tendén- cia central € a media aritmética da amostra. Enicetanto, a média aritmética da amostra, sozic nha, no forece toda a informagao necesséria para se descreverem adequadamente og valores das unidades observadas. Considere, por exernplo, os valores, em quilometros, de das amos tras, 4 e B: ‘amostra A: 30 km, 30 km, 30 km + mostra B: 20 kn, 30 km, 40 km. Embora cada amostra tenha a mesma média aritmética, 30 km, vé-se que hé maior variabilidade nna amostra B do que na amostra A Desse modo. pura descrever adequadamente uma amostra necesséria uma outra medida que, ‘além da informagao do valor representativo do conjunto de valores da amostra (formecido pela medida de tendéncia central), exprima a variabilidade desses valores em relago a urna determi nada referéncia, Quanto maior for essa medida de variabilidude, maior a dispersio do conjunto de valores da amostra, Deduzindo intuitivamente as medidas de variabilidade pelo uso da linguagem natural A mianeira mais natural e mais simples de se medir a disperséo de uma amosta €calcular a diferenga entre 0 maior € 0 menor valor; essa diferenga denomina-se amplitude toral da amostra. Continuando com o exemplo anterior, a amplitude total para a amostra A & 0 km (30 ken menos 30 km) e, para a amostra B, 20 km (40 km menos 20 km), pelo que se conclu gue a amostra B {em maior variabilidade, ou seja, é mais dispersa do que a amostra A, Quanto maior 2 amplitude ‘otal, maior a variabilidade entre os extremos dos valores ordenados, Essa primeira medida de dispersao seria dil se nfo tivesse « caracteristica de considerar ape: nas os valores exiremos, ignorando todos os outros valores, o que poderia levar a uma conclt- so errOnea a respeito do conjunto. Por esta razdo, 0 raciocinio natural imediato foi procarar utra medida que levasse em conta todos os valores, e no somente os extremos. Estudos sis. temiiticos ao longo do tempo provaram ser necessrio um valor de referéncia, e 8 media ari mética da amostra revelow ser esse o ponto de referéncia adequado, Assim, a partir da média aritmética da amostra calculam-se as medidas usvais de dispersio. ‘Tendo-se, agora, um ponto de referéneia, a atitude mais natural de medir dispersio é calcular as Giferengas de cada valor em relagao a esse ponto de referéncia © somur todas essas diferengas para ober um total geral Ainda considerando as amostras A ¢ B: para a amosira A, (30 km — 30 kin) + (30 km ~ 30 km) + (30 km ~ 30 km) para a amostra B, (20 km — 30 km) + (30 km ~ 30 km) + (40 km ~ 30 km) ==10 ken + 0 kim + 10 km = 0 km Embora seja uma medida intuitiva, essa soma de diferengas seri sempre igual a zero, porque 0 total das diferencas negativas € jaual ao total das diferengas positivas. Por essa razlo, conti. nuow-se a pesquisa de uma medida de dispersio que indicasse que a amastra B é mais dispersa que a amostra 4, km +0 km +0 km =0 km Observando-se as parcels, verifcs-se que o sinal da diferenga entre cada Valor ea meédia ait rmética da amostra é que toma a soma de todas as parcelas igual a zero. Sendo assim, 2 segunda tentative foi ignorar os sinais, ou seja, tomar 0 médalo” de cada parcela, Feito isto, obtém se para oamostra A 130 km ~ 30 ken «130 km ~ 30 km +130 km ~ 30 km |= 10 kam +10 kom |+10 km |= O km +0 km +0 km =0 km {Madi de un ie 60 alorsbout independent do sna epresete-o md de wane sokeandoene diss 34 resutant dase por n=) ‘dusoma dasdfrencaroo Capitulo 2 / Andlive exploraidria de dados para a amosira B, 120 kam — 30 km I+ | 30 kim ~ 30 kam | +140 kan — 30 kam | = 10 km 1+-10km | +110 km |=10 km +0 km-+ 10 km=20 km, novamente caracterizando que ‘a amostra B é mais dispersa que a amostra A. ‘Ocorre que, em Matemitica, efetuar operacdes com médulos de fungOes costuma ser trabalho- 80, A solucio de eliminar o sinal, omando-se 0 médulo dos valores, e somar todas essas di rengas, agora positivas, embora indique qual amostra € mais dispersa em relagio a uma referén- cia, ndo € prética quando se passa 3 formulagdo algébrica, sem valores numéricos. Determinou-se uma mestida adequada de variabilidade, mas surgiu um problema no desenvolvimento algébrico. (© pensamento seguinte foi entar eliminar o sinal de cada diferenga sem o uso do médulo; a solugéo natural & elevar a0 quadrado cada uma daquelas diferengas e somé-las, de modo seme- Ihante a0 j4 feito. Entio, para a amostra A, (30 Kem ~ 30 km)? + (30 km ~ 30 Km)?+ (30 kin — 30 ken)? = (O km)? + (0 km)? + (0 km)? =Okm*, para a amostra B, (20 km — 30 km? + (30 km. ~ 30 ny? + (40 km — 30 km)? = (— 10 km)?+ (0 kmy?+ (10 km)? = 100 kmé+ 0 km! + 100 km*= 200 km, ‘comprovando-se, mais uma vez, que a amostra B é mais dispersa que a amostra A. Como a variabilidade deve ser expressa por uma sintese, descja-se um valor Gnico que, levando fem conta todos os elementos da listagem, nio altere a sua caracteristicu, que é a soma dessus Jiferengas a0 quadrado. Conforme vimos, esse valor tnico é a média aritmética simples, por que a caracteristica que a média ngo altera é a soma. Todavia, observe também que estamos calculando © quadrado da diferenga entre cada valor e a média ariumética desses mesmos valo~ ves, havendo uma redundancia: para compensar esta situaglo, divide-se a soma final por m ~ I fem ver de n: Este valor, resultante da divisdo da soma das diferengas ao quadrado entre cada valor da amostra a média da amostra por (n ~ 1), denomina-se varidincia amostral Para a amostra A, Okm? _ Okm? 312 =0km? varidncia amostral = para a amostra B, 0-60 varifncia amosteal = Vimos no Capitulo 1 que, habitualmente, deseja-se estudar uma determinada caraeteristica nu- rmérica de um conjunto de elementos de uma populagdo. Por exemplo, em uma populagio de ‘carros (na qual cada carro & um elemento da populagi0), pode-se querer saber a quilometragem ‘média por litro de combustivel. Esta medida caracteristica da populagio denomina-se pardineir. ‘Ao se retrar uma amostra dessa populagao, dos elementos da amostra obtém-se uma medida da cearacteristica que ests sendo observada com o objetivo de se fazer uma inferéncia 2 respeito da populagio da qual foi retirada a amostra, Qualquer operagao matemitica realizada com essas medidas da amostra denomina-se estaristica, ¢ 0 valor obtido para essa estaistica denomina-se estimativa do parimetto da populagio. Jusifica-se a divisio por n— 1 porque, se hi poucos valores disponfveis, a estimaciva da variancia {a populagio, assim como da média, € de baixa precisio. Para a média da amostra, a preciso depende da quantidade de resultados utilizados no seu edleulo, mas para a varidncia amostral a precisfio esté subordinada & quantidade de diferencas independentes entre os valores a partir dos quais a varifneia amostral 6 calculada, Geralmente, as medidas sio feitas em uma amostra retirada de uma populagdo da qual se desco- nhece a média e a varidncia. Se uma medida ¢ feita e se obtém X'= 193, tem-se uma estimativa da média verdadeira ¥ = 193, gual a0 proprio valor X, mas no se tem uma idéia da preciso ‘dessa medida. Se o cdleulo da varidincia fosse feito dividindo-se por n igual a1, a variancia seria (293-193) 1 Capitulo 2 / Andlise exploratiria de dados 35 Odessopatrio uma metia (ueseresomaneparafecer problemas organ er Yomesda que nao é verdade, porque els & indeterminada, jé que nio existem valores suficientes para 0 seu ceflculo. Assim sendo, a varidncia amostral deve ser calculada pela expressa0 (93-193? 0 rio uma indeterminagdo, como realmente deve ser. Se é feita uma segunda medida, por exemplo 183, tem-se uma melhor estimativa da média, © também uma comparagio ou diferenga em que se bascar para uma estimativa da varidncia amosteal Observe que diferengas de cada uma das observagbes a partir da média nao sao independentes, desde que a média foi calculada a partir desses valores; como T = 188 e x,= 193, entdo x, nevessariamente € igual a 183; diz-se, entio, que a estimativa tem 1 grau de liberdade, divisor (n= 1) representa o que se denomina gra de liberdade, isto 6. a quantidade de ‘comparagOes independentes que podem scr feitas entre as n unidades da amostra, Se hi n unida- des de observagio, ha n valores (valor 1, valor 2, .. valor n), representados POE X85. un Ky € podem ser feitas (7 ~ 1) comparagdes independentes do tipo um valor menos 0 outto, (=~). Porque a média aritmética da amostra, 7, é caloulada a partir das n observagdes: se ¥ ¢(n- 1) dos valores sio fomecidos, o titimo estard determinado. Por exemplo, se a média amostral de 4 ‘imeros € 9 ¢ sio conhecides os valores 6, 8 2, 0 timo valor, nocessuriamente, deve ser 10. Outro exemplo: se 3 observagdes, ha somente duas comparagdes independentes, desde que, feitas duas comparagdes, como valor 1 menos valor 2, (x, x,),¢ valor 1 menos valor 3, (X, — 44) terceira comparacio toma-se conhecida, porque valor 2 menos valor 3 = (valor 1 menos Valor 3) menos (valor 1 menos valor 2), ou seja, (x, x5) = (&, 4) ~ (%, — 4). corte que, no célculo da variancia amostral, a0 se clevar go quadrado a diferenga entre cada valor € a média aritmética da amostra, a unidade de medida dos valores originals é também clevada a0 quadrado. Ou seja, resolveu-se um problema de desenvolvimento algébrico nao se uusando o médulo dos valores, mas se criow um problema com as unidades das medidas, haven- «do uma para a tendéncia central e outra para a dispersio, esta, agora, elevada ao quadrado, Para {que as unidades retomem 2s suas dimensbes originais, torna-se necessério extrait a riz qua- drada da variancia amostral. Quando isto & realizado, define-se a mais importante medida de dispersio para uma amostra, denominada desvio padrdo amostral, raiz. quadrada positiva da ‘ariincia amostal. Para a amostra A, tem-se que o desvio padre amostral ¢ igual a Voun™ = 0%, ©, para a amostra B, desvio padrio amostral i00 kan" Determinando as medidas de variabitidade por meio de férmulas “Amplitude total da amostra Okm. Se 0 maior valor da amostra for denotado por x,,, € © menor Valor por Xa, amplitude total da amostra, A7, diferenga entre 0 maior valor e o menor valor, é dada por AT Varineia amostrat No caso do célculo da varidineia amostral de n valores, simbolizada por +, sendo calculado por Su, -3? nai Desvio padrio amostral © desvio padriio amostral de n valores & simbolizado por 5, sendo calculado por 36 Captulo 2 / Anilise exploraria de dados Determinando as medidas de variabilidade por meio de calculadoras Com a caleuladora HP 486 Amplitude tol da amosira * passo 1: determine o méximno e o minimo dos dados em SINGLE-VARIABLE STATISTICS; + passo 2; calcule a amplitude total, subtraindo o minimo do maximo. Variancia da amostra *+ passes 1, 2, 3 ¢ 4: iguais ao eélculo da média aritmética: + passo 5: ressalte Sample em TYPE: + passo 6: em SINGLE-VARIABLE STATISTICS, ressalte VARIANCE (varidncia), na primeira linha abaixo de TYPE:, e aperte a terceira tecla branca, [C] (equivalente a YCHK, check, que quer dizer verificar). O nome VARIANCE ficaré com @ simbolo 7a0 lado dele. + passo 7: aperte a titima tecla branca, [F]; apareceri na pilha o resultado da varidncia amostral, Variance: Desvio padedo amostral * passos 1, 2, 3 ¢ 4: iguais a0 edleulo da média avitmética: + passo 5: ressalte Sample em TYPE:: * passo 6: em SINGLE-VARIABLE STATISTICS, ressalte STD DEV (standard deviation, Beas » Bros! » Bras 2 Braud a Estados Unidos a Bra 2 Bena 2 Estados Unidos = Baal s Bes a Beat! st Bas s Beal s Brasil % : % Brest 2 2 Brest # & Bes 2 » hie a ® Bre a Holanda 3 (he 2 Alea o Bs s Suse % Aeranha | oo# ‘Alenia 8 Bra % Best 85 Bra % Fetados Unidos % rm a Braille o Alemania a Bos % brat | ® sos Unidas » ess » Bra fo Estados Unie Fonte: revista EXAME— Maiorese Melhores, julho de 198, Quando existe uma grande quantidade de categorias ou valores individuais com extensa ampli- ‘ude total, a tabela sem perda de informagdo poderi ficar muito grande, sendo necessério um resumo dos dados, para os quais o intervalo de possiveis valores € dividido em subintervalos, corhecides como classes, com um limite inferior e um limite superior (denominados limite Inferior de classe e limite superior de classe), 0 que resultard em perda de informagio, porque 6s valores originais ndo mais apatecem individualmente. Para cada classe, a quantidade de di dos naqueta classe é anotado; esta € a fregiténcia absoluta da classe. Um equisito essencial para uma tabela de freqiéneia & que as classes sejum mutuamente excludentes e exaustivas, Ou Scja, cada valor no conjunto de dados deve pertencer a uma, e apenas uma classe. Uma earacte- ristica desejével, mas ndo essencial, & que as classes tenham o mesmo intervalo de classe, Em uma tabcla com & classes, a freqléncia da i-ésima classe é denotada por f para i= 1. 2,3, . Uma vez que a propriedade das classes da tabela sio motuamente exclusivas e exsustivas,f, + Lathe than A construgio de uma tabela de frequéncias com perda de informago requer as seguintes eta- pas: *+ paso 1: determine a amplitude total dos valores: * passo 2: escolha a quantidade de classes, geralmente entre $ ¢ 15 (0 mimero exato de- Capinulo 2 / Andlise exploratéria de dades 45 pende da pessoa que esti fazondo a tabela e do problema em questi, de tal sorte que 08 valores ndo fiquem compactados ou dispersos); + passo 3: caleule # amplitude de cada classe (ou seja, o comprimento do intervalo de Classe), dividindo-se a amplisude total pelo ntimero escothido de classes (geralmente ar~ edondando o resultado para um mimero inteiro, ou mtliplo de 10, para faciitar a inter- pretagio dos valores): + passo 4: estabeleca 0s limites de cada classe, a partir do primeiro valor (ou ura inteico imediatamente inferior), somando a cada limite inferior de classe 0 Valor da amplitude de classe «primeira classe: limite inferior da 1 classe c limite superior da 1.* classe inferior da classe + amplitude do intervalo de classe: = segunda classe: limite superior da 1 classe limite superior da 2.* classe superior da 1." classe + amplitude do intervalo de classe; assim sucessivamente; ppasso 5: eseteva, na parte superior da tabela, 0 titulo da situagao observada; asso 6: trace urna linha horizontal com espessura duplay asso 7: esereva ua primeira Tinha seguinte a esquerda o nome classes; ‘passo 8: trace uma links horizontal com eypessura simples; ‘passo 9: escreva em cade linha, sucessivamente, o limite superior, 0 simbolo I—¢ o limite Superior de cada classe (para evitar qualquer duvida quanto & possivel incluso de deter~ rinado valor em mis de uma classe, adota-se a seguinte notagio para os limites superior inferior de cada classe: uma barra vertical seguida de uma barra horizontal, significando fue aquela classe inclu 0 valor do limite inferior mas exclui o do limite superior; «+ passo 10: tace uma linha vertical, a partir da primeira linha, para criar uma segunda coht- asso I: esereva, na primeira linha dessa segunda coluna, 0 nome contagen; asso [2: anote, com algum simbolo, nessa segunda coluna, cada ver.que 0 valor ou cate- {goria daquela linha aparece: asso 13 trace outra vertical, « partic da primeira Tinha, para criar uma terceira coluna: Dasso 14: escreva, na primeira linha dessa terceira coluna, 0 nome fregiiéncia absotuta: passo 5: conte, em cada linha, as marcagGes € anote o seu total na tereeira colunas asso [6: apés a GItima classe, trace uma linha horizontal simples: asso 17> apds @ dltima classe, escreva, na primeira coluna, Total, em negrito, bem como fa terceira coluna, o total das freqléncias absolutas, também em negrto: + passo 18: termine a tabela,tragando uma linha horizontal, com espessura dupla; no fe- the as lacerais da tabets: + paso 19: coloque abaixo da gitima linha a palavra Fonte, segt vendo a referencia de onde foram retirados 0s dados. de dois pontos, escre: 1 Exerciciovexemplo 2.18 CConstrs uma abel de fregineis com peed de inform para os dados da Tabet 2. Medidas de tendéncia central e de disperséo revisitadas af) Seman parse esas tine nostro de Een deve over algun reno trea para "sum tadde qu deve ser iy iq rene experi ‘ruled he ‘Todas as tabelas de freqiiéncias, ao resumirem os valores das observagies originals, sempre perdem informagées, Por exemplo, se hi 30 valores entre 100, inclusive, ¢ 3.600, exclusive, Bio se sabe se todos 08 valores so iguais & 100, se hi 20 valores iguais a 200, 5 valores iguais 42 1.000 e 10 valores iguais a 3.000 ou qualquer outra distribuigto de valores que, resumidos, zgerassem a mesma freqhencia absoluta para aquela classe. Por esse motivo, para a célculo das medidas de tendéncia central, deve-se usar sempre os valo- res originais, célculo muito facilitado nos dias de hoje pelo uso das caleuladoras e dos compu- tadores. Entretanto, os livros de Bstatistica ainda apresentam maneiras diversas para o cdfeulo Ga média aritmética (método longo e método breve), da mediana (mediante o uso da. proporcionalidade entre valores) ¢ da moda (métodos de King e Cauber). Todavia, para que usar Bs métodos aproximados se os cdleulos podem ser feitos com os valores originais? Esses métodos simplifieados justificavam-se quando nao existiam caleuladoras e computadores, sen- do, aquela época, uma necessidade pritica, perdendo-se em preciso 0 que se ganhava em tem- poe na evitagao de erros ariiméticus ao se lidar com grande quuntidade de valores. “Macacos demonsiram fats hdscos a repel da anid.” CComece com uma jl contendo cinco macscos. Nault, pendure uma banana em um coda & Solegue uma escada sip 2 bana Em poweo tera, um macaco iri af 2 excdn © comegard & ‘Subir para pegar a anena, No shomento om gue toear ma escade, mole fodos os macacos com {gui bastante glad, Apes algum tempo, ust ost macaco lela novamente, com o msm 46 Festa ccumuladadair de ‘malas ¢onimer do ements qu ti valor menor (nel sipenor dessa case Capitulo 2 / Anilive exploratiria de dados resultado: todos ox macacos mothados com dgua bastante geal, Reticeo equipament que espe Thadgua glade ‘Se. mas tae. wm macaco tentar subir a escada, os demuis macseos vio procrar imped, ‘mesmo se nenburma ga for jogada neles. Agora rere wm macaco dal, subst tondo-o por ur ‘outro macaco ese vés banana e tents subir na eacida, Para surpresa dee, todos os acai & stacam: ps outa tentative outro atagu, el aprende que, setetar subir a esa, std stacado, Em seguids ite um outro mecaco dos nicks ecole um nova, o qual tnt subi a esc ¢ Serf atacado:o que fo colocado justo antes tomar parte ma puna com entusismo, Novamente substi otereeio macaco onginal porum novo, o qual ena subir a cada e 6 umber aac dis dos qustro macacos que ostacarar no tém a minima iia de por qe w ces no se permiic subir escada, ov de por aue este pacipando na agresso a0 nove inteprante do grupo. Apis sulbstiur o quarto 0 guinto dos macacos originals, todos os macacos que tinh sido tolhatos com gua bastante geada foram substitu, Apesar disso, nenhum macaeo aproximase aaa ‘ented escada, Por que nao? Porgue as coisas tém sido eripre assim por aq oral da histéria: a radipao aco jusifice,necesariamente 0 modo tual de proceden Entretanto, pode haver situagbes em que ndo se tem acesso aos valores originals e sim apenas as tabelas de fregiléncias. Sendo assim, a determinagio das medidas de tendéneia central (e, ssubsegilentemente, das medidas de dispersio) pode ser feita de seguinte modo nas tabelas de freqiiéncias com perda de informagde: ‘Média aritmética. Considere 0 porto médio de cada classe (limite inferior mais o limite supe- fio, dividide por 2) como sendo 0 representante du classe; para cada uma das classes, multiphi que 0 ponto medio pela frequncia da classe, some esses produtos e divida pelo total de valo- res. Os pasos so os seguintes: * passo 1: determine © ponto médio de cuda classe, dividindo por 2 @ soma do limite infe- tor e do superior; + passo 2: multiplique cada um dos pontos médios de cada classe pela freqléncia absoluta da classe respectivas * passo 3: some todas essas parcelas; + passo 4: divida 0 (otal obtido no passo 3 pelo total de valores, 1 Exercieo-exemplo 219 Determines médiaartetica para os vsloes da tabels final do Exercilo-exemplo 2.17, bt de Tabela 21 ‘Mediana. Os passos para o eéleulo da mediana dos valores de uma tabela com perda de infor- ‘magiio s80 0s scguintes: * passo 1: determine a posigao central, dividindo o total de valores (ow o total de valores, ‘mais 1) por + passo 2: some a frequéncia absoluta da primeira classe com a da segunda classe, ¢ assim sueessivamente; quando ests soma acumulads superar o ndmero ou os mimeros das posi- ‘e0es centrais, pare. ‘A mediana do conjunto de valores & 0 ponto médio dessa primeira classe euja soma aeumu- ada € imediatamente superior & metade do total de valores, WM Exercicio-exemplo 2.20 Determine « mens para os valores da tabla final do Enereick-exempo 2.17, obi d 21 bela Neste ponto surge o conceito de frequéncia acumulada de uma classe, Ao somar a ead fre- ‘gléncia de classe o total de elementos de todas as classes anteriores, voce estd determinando & Jregiiéncia acumulada dessa classe, também conhecida como freqiléncia acumulada abaixo de. Moda € 0 pono médio da classe com maior freqiéncia, WM Exereicio-eremplo 221 Determine mows para os valores da tabela ial do Exereico-exemplo 217, obida da Tabela 2.1 Amplitude total é a diferenga entre o limite superior da vltima classe menos o limite inferior {da primeira classe. © Ecerccio-ererplo 222 Determine « amplitce ttl pars os vlores da tahela Final do Bxereicio-exenplo 2.17, obtie da Tala 21 Varidincia. No citculo da variancia, cada valor € substituido pelo ponto médio da classe 1, x. € adiferenga em relagao 8 médis, elevada ao quadrado, é multiplicada pela freqléncia da classe i, f,, para cada uma das k classes. As férmulas sio: para a variaineia amostral Capitulo 2 /Anéiise exploratéria de dados a7 Ee, «para a variancia da populacio Le, -w?s a 1 Exercieloexemplo 223 ‘Determine a varia paras valores da abo inl do Exereiio-exemplo 2.17, oti da Tabela 2 Trazendo um pouco de justiga em comparagoes ¢ classificagaes Tabela 2.8 Resultados de quatro avaliagbes. Tabela 2.9 Média avitmetica e desvio padrao de quatro avaliacdes, ‘A maioria dos estudos fornece valores numéricos que ndo tém significado Gnico € ha poucas medidas absolutas, se € que hi alguma. Entretanto, 2 média aritmética tomou-se um clissico ponto de referéncia, e as diferengas entre os valores so apresentadas com base nas unidades de luma escala a partir da média aritmética. Entretanto, ocorrem situagdes com varias médias © desvios padrbes, sendo essencial haver uma maneita de converter valores brutos, provenientes. de varias populagbes © medidos em varias escalas, para alguma escala eomum, padronizada. 0 Exerefeio-exemplo 2.24 jlustra a necessidade de haver uma escala Unica para comparar resulta dos, 1 Exercciowexempla 2.24 ‘Com base nos resultados d quar avalapbes, classique as pessoas Ae B conformea Tabela 25. “raliagio x 5 Pow @ o Prova wo @ Prova wv » Prova » 0 Soma 200 200 ‘Analisando-se os dados brutos, 0 total de pontos de A € 200 eo de B também 200, havendo um cempate. Todavia, as escalas brutas sio arbitririas e absolutas, e ndo consideram a posicdo rela- tiva de cada valor em relagdo ao conjunto ao qual pertence, Infelizmente, nfo ha escalas comuns ideas para todas as situagdes com medidas que informem sobre os pardimetros da populagéo, a qual pode ter média elevada e pequena dispersio, ou entio média baixa e grande dispersio. A despeito dessus dificuldades, escalas padronizadas fornecem melhores resultados do que com- pparagdes feitas com base apenas em dados brutos. ‘Uma dessas escalas baseia-se no desvio de cada um dos valores em relagtio 2 média aritmeética, expressando-se esse desvio em unidades de desvio padro. Esta é a escala padronizada, denota- dda por z ¢ denominada varidvel reducida, sendo uma quantidade abstrata (isto 6, independe das unidades das medidas originais dos valores), Para o cilculo da varidvel reduzida z, correspon- dente a um valor, subtrai-se desse valor a média aritmética do conjunto ¢ divide-se pelo desvio slot menos a média padro do conjunto, ov sear ae Considere que as médias ¢ os desvios padres de cada uma das provas sejam o constante da Tabela 2.9. ‘Aralagdo Mein ‘Desig paario Prova A @ 10 rove | @ 20 “roae | & | Ss ‘Prova D 50. 48 Tabela 2.10 Valores relativos das quatro avaliagdes, mudada @ escala para média 1.000 e desvio padréo 100. Capitulo 2 / Andlise exploratiria de dados 1M Exereicio-exemplo 2.25 Com base nas Tabelas 28 ¢ 2.9, clasifiqu ws pessoas A B. Para que a escala reduzida no apresente valores negatives, na maioria das vezes pode-se fazer ‘uma outra mudanca de escala,fixando-se, arbitrariamente, uma média ¢ um desvio padrio, Por exemplo, escolfia a média 1.000 ¢ o desvio padrio 100 para transformar 0s valores relativos ‘nos novos valores por intermédio da expresso: nevo valor = nova média + novo desvio padrio. x (valor relativo), ou seja, X = 1.000 + 100z. Desse modo, os novos valores para a pessoa A, a partir de seus valores relativos, tornam-se: ‘+ na Prova A: X = 1,000 + 100(0 ‘+ na Prova B: X = 1.000 + 100(— 2 + na Prova C: X = 1.000 + 100(1 + na Prova D: X= 1.00 + 100 f Realizando os mesmos edlculos para a pessoa B, todos os resultados podem ser resumidos na Tabela 2.10. ‘valago Pessoa A Fro A 00 Peas | 0 Provac 100 Prva m0 ‘Soma [3800 Conclui-se mais uma vez que a pessoa A é a melhor, jd que tem, em termos de valores calcula dos com base nos valores relativos, uma vantagem de 700 pontos em relacio & pessoa B (pontos ‘equivalentes 2 multiplicagio da diferenga relativa de 7 pontos, multiplicada pelo desvio padrio 100). Apresentando visualmente ao publico a amostra ou a populagao: construindo grdficos brersaly! | ronnie | cacnaatar ioc a rant Grificos facilitam a visualizaco dos valores e sdo amplamente utilizados na apresentagao de dados estatisticos. Quando fazemos qualquer tipo de geifico pervemos informagao, porque nao ‘mais existem as observagdes originals. Eniretanto, freqtientemente essa perda de informaco & ppequena se comparada com a concisto e facilidade de interpretago, De todo modo, ao inferir sobre uma populagao a partir de gréficos devemos ter cuidado redobrado, © Naveganulo ma Internet Vaaosite up /wrwwmath yorkuea/SCSSiatResource he clique em Gallery ‘Visualization — para ver alguns exemple dos melhores e dos pores pric et Um deles € 0 grafico de Mioard, referente 3s campanhas de NapoteBo. O engeaheco ances Charis Minardihston o desastte de Napoledo ns RUssa,e mullosconsideram esse grlico 0 melhor grficoestatitico até hoe Feito. presenta tno do exit juntamente com © mapa dds campant no ataguee na retrada, enfatiranco largo do terene dsponivel para o exrcto Fanos, juntamente com a tesmpertura regis em um grafico de inh Ma pare inferior. AO ‘oie pars explorer outros grifcos da se ‘A representacao gréfica de uma série de dados permite, 20 mesmo tempo, uma visio geral & alguma caracterizacao particular da populagto por meio de uma correspondénci entre as cate- gorias ou valores e uma determinads figura geométrica, de tal modo que cada valor ou categoria € representado por uma figura proporcional 1 Beereiciowexempla 2.26 Pura 0s valores 5,15 « 25, considere comesponder 30 valor 5 a altura 2 em, Detsrmine at auras ‘que coresponderdo aos valores 13 825, Convém ressaltar que toms-se conveniente, por motivos estéticos, considerat, na elaboraglo de grificos, os seguintes aspectos: = 0 grifico, em seu conjunto, deve enquadrar-se em um retingulo de dimensdes que 0 torne agradavel a vist + as figuras ndo devem ser nem muito largas, nem muito estreitas, devendo obedecer @ um semtido estético; + finalmente, 0 grafico, por seu objetivo de simplificar, deve conter somente algumas divi ‘des da escala vertical; as linhas horizontais devem ser poucas, de modo a torné-lo agra- ‘davel em relacio a sua leitura e interpretagio. ery of Daa Capitulo 2 / Andlise exploratiria de dados 49 Descrevendo dados qualitativos Figura 2.17 Gréfico de barras. Figura 2.18 Grajfico de barras Justapostas. ‘Sao elementos complementares de um gréfico: ~ titulo geral, indicative da situagdo estudada, a época e o local ~ as escalas ¢ as respectivas unidades de medids; indicago das convengdes adotadas (geralmente quando se representam os resultados ddas observagdes de uma mesma situago em duas ou mais regiGes ou em datas diversas), - 8 fonte de informagiio de onde foram retirados os valores. A estética e a corresao cientifiea devem contribuir para a escolha de escalas, de tal modo que a aparéncia do grafico seja adequada para se tirar conclusées a respeito da situagio que esteja sendo examinada, Geralmente os grificos devem ser apresentados com a escala das ordenadas partindo do zero, a fim de que a comparacio visual entre as sucessivas marcagdes no cixo vertical possum set foitas corretamente. Entretanto, pode-se inicir a escala em outro Valor quando se deseja, mais do que comparar a grandeza dos dados, ressaltar as variagoes entre eles ‘Hi uma enorme variedade de modos de apresentagio de valores numérieos, todos destinados a atraira tengo para eles. Neste livro apresentaremos apenas os grficos que sto mais comumente usadas. Para estes tipos de dados, os gréticos mais utilizados sio 0 de barras, 0 de colunas ¢ 0 de setores, Gréfico de barras Um grafico de barras ilustra cormparagdes entre categorias; estas so organizadas verticalmen- tc, enquanto os valores tém disposieao horizontal, para enfatizar a comparagio de valores e dar ‘menos énfase ao tempo, No diagram de barras (Figura 2.17), cada categoria & representada por um reténgulo de drea proporcional ao seu valor (se os retingulos tiverem a mesma base, € suficiente considerar i proporcionalidade em relagao as alturas) BOLSAS: variacéo % sobre o prego anterior | 2) me Tease Lenses Neste grifico, ¢ indiferente a ordem de apresentagio dos retngulos, por se tratar de uma série ordenada segundo tma caracteristica qualitativa. Nesses casos, n&o hi, em geral, uma ordem tinica, tenica ¢ logicamente admissfvel, podendo existir diversas ordens, correspondentes a iversos eritérios, Uma variante desse tipo de gréfico € 9 de barras justapostas (Figura 2.18), que apresenta a relagio entre os valores ou ealegarias individuais e 0 total, Investimentos - 1996/1998 1998 ae [aos] #* 1991 [aE] Fonte Companhia Sideniiges National, SSO 50 Figura 2.19 Grafico de colunas. Figura 2.20 Grafico de colunas Jjustapostas. Deserevendo dados ‘quantitativos Copiulo 2 / Andlise exploratiria de dados Grifico de cotunas Um grafico de colunas mostra as alteragdes dos dados em um intervalo de tempo ou ilustra ccomparagdes entre categorias, as quais sao organizadas de maneira horizontal e os valores de ‘maneira vertical para enatizar a variagao ao longo do tempo. No grifico de colunas (Figura 2.19), cada categoria é representada por um retingulo de érea proporcional ao seu valor (se os retingulos tiverem a mesma base, é suficiente considerar a roporcionalidade em relagdo as alturas), Cambio -cotagao de venda Bie Faw Pols i Sa Pas Ste na eS No gréfico de colunas, também € indiferente a ordem de apreventaglo dos retingulos, por se tratar de uma série ordenada segundo uma caracteristica qualitativa, Nesses casos, no hé, em geral, uma ordem tnica, técnica e logicamente admissivel, podendo ocorrer diversas ordens, correspondentes a diversos critérios. Uma variante desse tipo de grafico é o de colunas justapostas, 0 qual apresenta a relacio entre (5 valores ou categorias individuais com o total. aayassassad Grifico em stores" Cada categoria corresponders a uma divisdo ou a um setor de um efreulo; dat o nome grafico de setores, geralmente utilizado quando se pretende comparar o total de cada categoria com 0 Conjunto total. Quando o objetivo da representacdio for a andlise da participagio de eada catezo- ria em relagio ao total, a representago em sefores & adequada porque permite estabelecer a ccomparasao entre os valores (purcelas) e o total (Figura 2.21). Diferentemente da apresentagdio dos dados qualitativos, os valores devem estar ordenados quando dda construgio dos grificos quanttativos, e podem mostrar variabilidade ou relacionamento, Mostrando variabilidade Os grificos mais utilizades so @ grifico de pontos ¢ o histograma. Gréfico de pontos © grafico de pontos (Figura 2.22) € adequado para ilustrar 0 comportamento de valores indivi- ‘duais em relagao ao conjunto desses valores. Desenha-se uma linha horizontal com uma escala para a varidvel quantitativa, enquanto 0 valor numérico de cada medida no conjunto de dados & Fepresentado acima da escala horizontal por um ponto; quando os valores se repetem, os pontos colocades um acima do outro, formando uma pilha naquela localizagio particular, na qual se listam 0s valores da varidvel de interesse. Improper map ont, Erna lor Capttulo 2 / Andiise exploratéra de dados 51 Figura 2.21 Gréfico de setores. Figura 2.22 Grafica de pontos. Figura 2.23 Histograma, Distibulgio dos eatéicos ne mundo em mines Histograma © histograma (Figura 2.23) ¢ adequado para ilustrar 0 comportamento de valores agrupados em 1760 ° Ava Peseta | PessoaB van + 2100 3 Prov A . zr 2a z - Prov 2 nae mim fT Powe | +d ESE) v Proved = T Tosat 0 “Soma 2 Fonte: ei EXAME — Mares «Melhores ak de 198 219, * asso 1: para» primeira classe, terse (100 + 3.6002 = 1.850: para a segunda clase, terse (3.600 + 7.10032 = 5.350, © assim sucessivamente; + passo 2: tem-se, pata a primeira classe: 1.850 «30 = 55.500: para Segunda classe, 5.350% 24 = 128,400; asso 3: (35.500 + 128.400 +...+ 29.850) perfazo total de 529,500; asso 4: 329 500/80 = 6 618,75, valor representative da média a ‘As duas pessoas podem agora ser comparad. Hmbora 4 e #tenbam ‘btid a mesma sonia de gras brutos,oresultado relativa, que levaem ‘conta posigto de cada pessoa em relaeHo a todas as outras naquela ‘determinada avaliagSo, coloca-as em ordem. Conclui-se que « pessoa ‘4.6 4 melhor, j6 que tem, era termos relatives, uma vantagem de 7 Pontos -2-(-9)] em relagio w B. 2.26. As alturas serio 6 cm e 10/em,respectivamente, porque, desse modo, asegura-se uma proporcionalidade. Verifica-se que #e- Jagao ente cada altura co respoctiv valor 6 constant e igual a 215 =6/15=1025=04. 60 @ Fontes de noticias e citages 1. FolhadeS. Pauls, 21/1959 2 Soma do rast. 1121999, A. Miguel ong, Fotha de Pal, 22/1/1999 4 Jomat do Brat, 2011959. 5 Fotha des Paul, 17/12/1998 6 Revit EXAME MaiorereBethor, jbo de 1998. 1 Somal Zero Hora, Si 1999, R Jomalde Brast AN N999, 9. Cana Capita 321999, 10, Jomal 0 Dio, 11171999. 1, Jomal © Das 1/1995, 12. Jorma Oa, avr1999, 18. mal 9 Dia, 10/1990 |. Cader Top of Mind, Foiha de S. Poul, 1712/1998, 15. Cader Tapani, FolkadeS Poul, 1112/98, 1s I #BRSRRRDN Capitulo 2 / Andlise exploratiria de dades Jorma do Bras, SUL Adapt dees GS. VERIO.NET> Jornal do Bras, 11211908. Milo Femmandes, Millarne Pasguim, Chuo do Livro, 1977 Tomato rast NVN009, Frade des Pao, 131999, ‘Outvio Fas Fit, Folia de Paulo, YON 211998 oma do Brat N49, oral Zero Hora, 1/1199, Toon do Brat, Y721995. Toma do Brasil, YAS Sommal do Brat, $1999. Somat de Brasil. 21/1999, Joma da Bra 8111389, oral © Di, L198, Probabilidades: uma introducdo 0 que 0 passado ensina, e antevendo um pouco: as chances de os fatos ocorrerem, 63 O que a experiéncia nos ensina: retornando a Estatistica Descritiva, 64 A lei dos grandes nimeros e a atribuicdo de probabilidades, 67 Um conceito adicional, 67 Aprendendo mais vocabuldrio estatistico, 67 Combinando os trés conceitos de probabilidade: 0 que a teoria fundamenta, 68 um auxilio ao cdlculo manual: 0 conceito de drvore de probabilidades, 70 Considerando mais detalhadamente informagées adicionais, 71 Interpretacies e determinacdo de probabilidades, 73 Expressando em nimeros os resultados desejados, 73 Determinacdo de uma medida de tendéncia central e uma medida de dispersdo no célculo das probabilidades, 79 Modelos matemdticos, 82 Termos-chave, 96 Resumo, 96 Exercicios propostos, 97 Solucées dos exercicios-exemplo, 100 62 Capitulo 3./ Probabilidades: uma intradugio Jopularmente, « palavra estaristica tem 9 significado singelo de colegio de dados LSAE® numéricos sobre determinado assunto. & comum ouviemos falar de estatisticas da inflagio ¢ estatisticas do campeonato de futebol, entre diversas outras, No entunto, como vimos no Capitulo 2, a Estatistica no & simplesmente uma técnica de coleta e de apre~ sentagio de dados, mas uma ciéncia com 2 qual se procura tirar conclusdes a partir de dados huméricos originados de observacdes. Verificamas que 0 objetivo da Estatistica é fazer inferéneias a respcito de determinada populagao, a parti de uma amostra dessa populagio, como ‘um instrumento auxiliar na tomada de decisdo em condigties de incerteza, Neste capitulo, veremos que 0 objetivo € também antever o desconhecido, quantificando-o adicionalmente a determinar o erro em uma estimagio (de algo também deseonhecido, de uma Populao). Em resumo, uma preocupaso em prever os {alos a partir de informagées existen tes, “0 futuro « Deus pertence, o palpte a nds” “Falar depos do jogo, comeniar v fm da temporada sto coisas facets, Dara cara para bater ‘com palptes que sdo elas. Mutespreferem ndo se arriscar cm tal empreitada, mas 0 bom cratuirtno tem aria deserama spe deve, Oueconomita lem ge A teoria do Célculo das Probubilidades comecou com uma correspondéncia entre dois mate ‘maticos franceses, Blaise Pascal (1623-1662) e Pierce Fermat (1601-1665), em 1654, a res- peito de dois problemas formulados por um jogudor compulsivo, Chevalier de Méxé,” A partic daquele momento, realizam-se estudos de modelos mateméticos com exemplos essencialmente e Jogos de azar (afinal, era a motivagio naquela época). Infelizmente, tal enfoque propagou-se até 08 dias de hoje, levando a que a maioria dos livros de probabilidade traga uma série de ‘exemplos referentes a jogos de azar, a retiradas de bolas de urnas, a jozadas para o ar de moedas (chamadas honestas, como se a maioria nfo o fosse), no langamento de dados e no apareci- mento de determinadas cartas de baralho, em especial ases e reis. Adicionalmente, a0 surgit 0 eensino da teoria dos conjuntos nas escolas brasleiras na década de 1960, enfatizou-se a asso- ciagio entre os conceitos de probabilidades ¢ os de conjuntos com 0 intuito de facilitar 0 ruciocinio estatistico a partir de outros modelos aparentemente mais estruturados ¢ de conhe- Cimento geral. Todavia, ambos os enfogues tiveram a sua importincia até a década de 1980, e 08 seus seguidores estavam preocupades em proporcionar melhor eatendimento dos conceitos estatisticos teéricos por meio de estruturas que, no entender deles, facilitaciam a compreenszo dos modelos existentes. Nos dias de hoje. tal visdo associativa nao é mais valida, sobretudo pela variedade de aplicagdes (no apenas em jogos de azar), mas pela ubsoluta necessidade de as pessoas entenderem como utilizar os conceitos estatisticos na vida didria, Bxercleio-exemplo 5.1 Tenrse 100bilhetesnumerados de 12100. Reta se és ao actso, Determine prokabilidade de: ovis bihetes erem mimeros conseeutivo: b. haverexatomente dois menos consectives (Gnas nio ues}; e: nao haver mimerosconsecutvos, tique quando esse problema — que, com estrus emelhante, ¢ comment encontrado nos livre Estatstiea da atualidade — fo formula pel primeira ver 1950 ». 1900 ©1850 4.1500 ‘-nenhura das respostas anteriores © estudo do relacionamento dos dados por meio de modelos probabilisticos denomina-se Es- latistica Matematica. Sem entrar em discussbes filoséficas x respeito do determinismo ou nao na nossa vida, diremos que as variagdos dos fenémenos devem-se a um grande niimero de cal- ‘sis que no podemos controlar, 8s quais 0 estatistico denomina, simplesmente, acaso, “0 segundo, (Stéphane Mallarmé], poeia estupendo, crow 0 verso que deveria ser 0 tema Dermanente de qualquer “aposta* econdmiea: Urn fance de dadoe jams abolia acs." ul dobro AG, ce (1610-1688, Capitulo 3 / Probabilidades: uma introdugao 63 Talagimcrnandten topon de pada dem raion, © resultado de uma experiéncia geralmente se dé a0 acaso; entretanto, s¢ cla se repetir uma grande quantidade de vezes, pode-se constcuir um modelo probabilistico e tomar decisbes re- ferentes ao processo experimental apenas pelas suas caracteristicas, sem necessidade de refa- zera experiéncia. A pritica indica que muitas experiéncias so realizadas como se ovorressem fem condigdes estaveis, e as aplicagées nos varios ramos da cigncia e da inddstria comportam- se de maneira idéntica. Em tais circunstincias, usualmente possfvel construir um modelo ‘matemético satisfatério © empregi-lo no estude de propriedades e na obtengio de conclusses. (© modelo matemstico que um estatistico seleciona geralmente capaz de possibilitar previ- ses sobre a freqiiéncia dos resultados que se espera ocorrerem quando a experiéncia for repe- {ida, Por exemplo, verificando-se a qualidade de componentes produzidos em uma fabrica pode- se prever a percentagem de componentes nio-conformes (defeituosos) esperados no processo de fabricacao. Em virtude da natureza dos modelos e dados estatisticos, € natural que a Probabilidade seja a segunda ferramenta da teoria estatistica (a Estatistica Descritiva & a primeira; ver Figura 1.2, p. 11). O estatistico vé nas probabilidades 0 ideal da proporgdo de vezes que determinado resulta- do ocorrera nas ropetigées de uma experiencia, ¢ um modelo probubilistico é um instrumento ‘matemstico que prevé a chance de um possivel resultado ser que sejx necessirio repelir @ experigneia. Devido ao fato de a probabilidade ser uma ferramenta importante nos métodos estatisticos te6ricos e priticos, uma introdug3o a0 célculo de probabilidades &, sempre, estu- dada antes da Tnferéncia Estatstica, Usar modetos matemsticos na solugao de situagdes da vida real ¢ comum em vérias ciénenss, Por exemplo. no estudo do movimento de um foguete uma lei simples fomece um modelo satisfatGrio, apesar da complexidade do problema. Quanto mais complexo 0 trabalho, mais el borado é 0 modelo, e, uma vez que um modelo constitui somente uma representagfo da situs (do atal, as conclusdes obtidas dependem do grau de adequabilidade do modelo em relago a Situagdo em estudo. Independentemente da dificuldade do problema, é fundamental conhecer 0 ‘campo de aplicugdo para garantir que os modelos te6ricos sejam adequados 2 realidade. “Reina de fantasta, Nos statttcas Brasil das novelas dum patede our planeta. Noterveno fin das extatstcas, hd wm abiemo entre fig e reatidae mais profundo do que cr quclid. de dos ansores de hoje do viruosismo da falecida Taner Clair. do € 10a que os autores Jovem da miseri, A ina novela que até hoje se atreveu a mostrd-la com todas as tnas, ‘Basletor ebsites, extbida pelo SBT em 1990, fo um retumbantefracasso de aun: Nos métodos estatisticos formulam-se hipéteses, conduzem-se experifncias, @ testa-se se bi Déteses iniciais so verificadas (ou no) com base nos dados experimentais. Embora os méto- dos estatisticos sejam utilizados em todos os ramos das ciencias, ha diferengas entre os pro- bblemas das ciéneias bioldgicas ¢ sociais — que envolvem varidveis indesejaveis que ndo podem ser controladas — e os problemas das ciéncias fisieas, nas quais tals varidveis podem ser con- (toladas satisfatoriamente em laborat6rio, © enfoque dado ao estudo das probabilidades depende du érea em que ele seri aplicado. O estatistico puro prefere tratar o assunto a partir do ponto de vista axiométieo, no qual algumas afirmagdes so aceitas sem demonstragao. Aquele que usa a estatftica aplicada prefere pensar em probabilidade como a proporsie de vvezes que determinada siwagio ocorrerg se uma experiéncia for repetida indefinidsmente em situagées de natureza repettiva ou que podem ser concebidas de tal maneira, Experiéneias como 2 conagem de pegas no-conformes em uma caixa, ou a letra didria da temperatura de um termémetro sio exemplos de experigncias simples. Por outro lado, uma experiéncia na qual ‘varias cobaias so alimentadas com diferentes tipos de alimentos s6 pode ser realizada uma vez com 0 mesmo animal; contudo, tal experiéncia pode ser imaginada como a primeira de uma série ilimitada de experiéncias e, por esta razio, considerada também como repetitiva, O que o passado ensina, ¢ antevendo um pouco: as chances de os fatos ocorrerem ‘Todos conhecem, por intuigdo, 0 eonccito de probabilidade, ou chance, de algo corre. Em eral expressas em termos de porcentagem, so comuns frases do seguinte tipo: “as chances de Covas se ecuperar so de 80%"? Adicionalmente, sabe-se que a chance de o impassivel ocor- rer € 0% € a do certo acomtecer € 100%. “A chance de 0 equipamento fathar & 40% também & uma afiemagio que quantifica © senti- mento a respeito da possibilidade de falha desse equipamento. Todas essas possbilidades sio ‘quantificadas por meio da associagao do resultado com tm németo no intervalo fechado entre Ge 1, onde ndmeros altos indicam que o resultado € mais passfvel de acontecer. 0-0 (zero) Jndica um resultado que nunca ocoreeré e 0 1 (um) indica que ele, com certeza, ocomers 64 Seumconpnto den ocrrdncias ruproaves in mmaneieas ewprovivelna gua nage parca pode scorn apobealsede dessa ‘tua Capitulo 3 / Probabilidades: uma introdusto [Esses pensamentos naturais sio fruto da experigncia passada, da observagdo dos fatos da vida, codificados e resumidos pela Estatstica Deyeritiva para consult postericr. No dia-a-dia, 0 termo provivelrefere-se & grandeza da porcentagem do que é favordvel go que 8¢ deseja em relagdo a todos os resultados. Costumnamos estimar as chances ou probabilidades de chover, ou de conseguir o lugar em um teatro, ou de um time de futebol vencer uma partids. E dificil, nesses casos, obier uma medida exata da probabilidade, © podemos ter apenas tentat vas intuitivas na obtengaio de resultados provaveis; além disso, as vezes € preciso levar em conta tum fator que muda com o tempo, tal como methora de desempento de uma equipe ou efeite de ‘mudangas sociais, (0 episbo fz lembrar a historia do suigo que, apavorado com a ameaca de guerra na Eurspa Tesolven se tsolar de tudo e de todos. Apis decenas de estudes, © suevo(.-) Peg un Imapa-mindie disse: “E ag’, apontando para Guadalcanal. Mudow-se para aha pouco ‘antes de comesar una das mais sangrenas batalhas da Segunda Guerva."* Para aprimorar esse conhecimento, necessita-se obter matematicamente uma medida numérica de probabilidade, Quando no se tem qualquer informagio, podem-se enumerar os resultados possiveis e descrevé- los como igualmente provaveis (equiprovaveis). Por exemplo, guichés encontrados vazios em uma repartigio pablica com cinco guichés pode resultar em qualquer um dos ndmeros 0,1, 2. 3, 4€ 5, Nossos morivos para consideri-los equiprovévels baselam-se no ato de cada guichi Ser (quase exalamente) simétrica e as condigoes de chegada a essa repartigo supostamente do favorecerem um niimero mais do que outro. Quando tais consideragOes de simetria propor- cionam significado razoivel para a expressio igualmente provdvels, podemos dizer que sem- ‘pre que uma experiéncia consiste em n resultados posstveis ¢ igualmente proviveis, a probabi- Tidade de cada resultado é I/n; ao entanto, embora ttl, essa informagao & circular (define com. 1 definigio) ‘Assim, quando forem enumerados todos 05 resultados possiveis com a hipétese de suposta igualdade, a probabilidade de determinada situago € x razio do némero de ocorréncias fa Vordveis 3 situa para o mimero total de resultados, A probabilidade assim definida é chamada probabilidade a priori, Nesse exemplo, u probabilidade de encontrar um guiché vazio € 1/6. ‘Péreosequilbrados. Foran formados 1 prea, alguns numerosoxe equlibrados...Ese deta The certamente wai difeutar os apestadares da Quinevata, que precisa aceriar as cinco duplasexatas das cinco ltimas proves.”” {A probabilidade também pode ser expressa em forma de relagio de ocorténcias favoréveis para as desfavordveis a uma situagao (ou vice-versa). Assim, podemos dizer que uma relagio a favor ‘de uma situagdo & 2 para 7, significando que a probabilidade de sua ocorréncia € 219, Essas consideragSes resultam no denominado conceito cldssico de probabitidade, o resultado da divisao entre 0 nlimero de casos favoriveis 0 nimero de casos possiveis mero de casos faveréveis ‘nme de cas0s poss Essa foi a primeira definigzo do conceito de probabilidade, conhecida como lei de Laplace O que a experiéncia nos ensina: retornando & Estatistica Descritiva [A definigdo classica nio atende a determinadas situagSes como, por exemplo, saber qual a probabilidade de uma pessoa morrer entre $0 ¢ 60 anos, jé que no se consegue ter o niimero completo de casos possiveis, Entretanto, as informagdes podem ser resumidas em tabelas de freqigneias, as quais se classificam naquelas sem perda de informago ¢ naquelas com perda de informagio, permitindo-nos fazer uma analogia entre as tabelas de freqiiéncias e os conceitos de probabilidade. ‘Tendo em vista que este livro apresenta os conceitos gradualmente, na medida em que sejam necessérios, retomemos as tabelas da Estatistica Descritiva, A menor freqléncia absoluta que pode ocorrer em uma série de observagées & igual a 0, ou seja. nfo ocorre determinado valor, situagdo ou classe, enguanto que a maior freqiéncia absoluta € N, ou seja, 36 ocorre aquele valor, situagiio ou classe, Essas afirmagtes podem ser expressas em porcentagens: 0% e 100%, enconrais pela divisto da freqléncis abst pelo total de valores © mulopicndo-se por 160: © Aateevago Pr spin proonidade de “etic Sm ples 09-1827, materi Fats Coptiulo 3 Probabilidades: wma introducdo 65 Sreghince rate Tis do mero de overages seein eure abso peo ‘nimero told obtener fas Tabela 3.1 Freqiténcias relativas do Exercicio- exemplo 2.17. Tabela 3.2 Freqiténcias relativas do Exerctcio~ exemple 2.18. freqhéncia absoluta otal Nas tabelas de frequéncias, cria-se uma coluna com as freqUéncias relativas dos valores ov de classes de valores, conforme mostram as Tabelas 3.1 ¢ 3.2, continuagie das tabelas dos Exerct cios-exemplo 2.17 (p. 43) © 2.18 (p. 45). ‘Verifica-se que qualquer valor, situagio ou classe tera chance de ocorréncia entre 0% € 100%, includos esses limites. Ora, esses sto os valores que as probabilidades podem assumir, con: forme verificamos no conceito classico. A fragio denomina-se fregiiéneia relativa. reqdénclarelativa racho, dein es100| 100 7100 100 Freqincia Bast Estados Unidos Alemanba waa ingle Trans Suk Bermodas anaes ators FranjaBatados Unidos Holanda BresvAlenane oa oa Fotat Fonte: EXAME ~Maiores ¢ Methoves, juno de 1998, Intuitivamente, na Tabela 3.1 vemos que a chance de se observar uma companhia brasileira é ‘maior do que observar uma compania chilens, porque a brasileira tem uma porcentagem (pro- babilidade) de 56%, bem maior que a chilena, de apenas 1% ‘classes reqdéncia Preaiinciarelaiva _ (Ceasio, decimal e porcentagem) 10 » BOR = O57 = 3158 300 a 2m = 03. = OR 7300 0 us = 01s = i256 10800 © ue = 0125 > 1258 iio ° m= 0 von 3 ‘ano = ogans 21109 2 amo = oms' an ° om Do 210 1 i = ones = 125% Toial “0 0780 © 100% = 16 Fonte: EXAME ~ Maiorese Melhores, jlo de 1998. Intuitivamente, na Tabela 3.2.vemos que a chance de se abservar uma companhia com o nsimero de empregados entre 100 ¢ 3.600 é maior do que observar uma compankia com o niimero de empregados entre 14.100 e 17.600, porque a primeira tem uma porcentagem (probabilidade) de 37,5%, bem maior gue a segunda, de 0%. 0s fenémenos estudados pela Estatistica sio aqueles cujo resultado, mesmo em condigdes luniformes de experimentagdo, variam de uma observagio para outra, O resultado de uma obser- vaio futura nao pode, portanto, ser previsto exatamente, Entretanto, a pritica mostra que 0s resultados de uma seqlléncia razoavelmente longa de repetigaes do mesmo fendmeno apresen- tam uma regularidade no sentido de que a freqliéncia relativa com que determinado resultado 66 Prabhas gus esaboece tndendoaconsdeegbe deinen ‘oureadaridade deride samples brnesl! Pensa gue models probaiiioas Jorrdo anatase comportar de cordecon modelo mana, Captulo 3 / Probabilidades: uma inrodugdo aparece na sequéncia tende a se manter constante, Os fenSmenos que apresentam essa regulari- dade estatistice denominam-se fendmenos aleatérios. Desse modo, pode-se definir a probabilidade de uma situago como sendo a freqliéncia relativa dessa situagdo em n observagdes, ou seja, & 0 némero de ocorréncias da situagao dividido pelo rnmero de observagées tendendo para infinite. A medida que o niimero de repetigdes aumenta, hha uma estabitizacZo na freqiéncia relativa, o que € conhecido como regularidade estatstica. ‘O erro relativo da estimativa dessa probabilidade vai-se tornando cada vez menor 3 medida que ‘0 mimero de repetieses do experimento aumenta, Esse conceito de probabilidade denomina-se Sreqitencial. ‘Nas paridasem que venceu, o Flamengo usou uniforme branco. Endo contou com opresidene (2) no Maracandainho. Nas duas derrotas, 0 time usou uniforme rabrovnegro. £ tinh (.-) amo torcedor no gindsto. Come serd na quartafetra?™* Quando se reaiza uma experigncia, um resultado observado é definido, determinado, nko po- dendo acontecer um nimero fracionério de veres. Voltando a observar uima tepartigio com cinco guichés, dizemos que a probabilidade de cada um dos resultados possfveis (achar de Oa 5 ‘uiches vagos) € 1/6, ¢ com certeza nio podemos obter como probabilidade 1/6 de um com tima tinica observagio dos guichés e procurando um guich® vago, Entéo podemos dizer que ‘bieremos cada resultado exatamente tima vez em cada seis observagoes, ou exatamente 100, vezes em 600 observagbes? A resposta, evidentements, é ndo, mas acreditamos muito que, se (5 seis guichés forem observados muitas vezes, em média os seis resultados possiveis ocorre- "io com frequéncias praticamente iguais. Se iss0 nao acontecer, devemos suspetar que um ‘uno fator estejaintervindo no que abservamos. A simetria, embora passivel de definigao de tum modo positive, em muitos casos é, em esséacia, um fato negativo: 0 fato de ndo haver diferenca conhecida ou observavel. Se’o resultado do nosso experimento demonstra alguma Inconsistenca, tl como um resultado obtido com maior freqUéncia na observacso de um gui- ch do que em out, acreditamos que isso se deve a uma causa orcntadora para aguele resulta. do ¢ concluimos que néo ha uma simetria, base do modelo, ou que hi um problema durante a realizagio da observagio. ‘A hora do perigo. Dos 577 acidentes ocorridos entre 1959. 1996, em quo io foi totabmen ‘te deviuido, com on sem vfimas, quase dois tergos aconteceram entre a fase de descda es de pouso. Via a porcentagem em cada etapa do v00: 29%. manobra; 16%, decotagem: Tse subd 59% lade de crucero: (5% descida 34%, aproximacdo 22%, pose, “erro humano. Entre 1987 ¢ 1996, sete entre cua dee acidents de ate ocorreram por fall ‘da prépria ripulacto. Veja os movivon principais 3% falha no controle de tdfego: mau tempo (69% fatha de manuteneao; 99% defetio do avid; 72%, err da tripulago: (8 ouos." Se a observagio for repetida. 1,000 vezes, encontar dois guichés varios, por exemplo, poderé ‘corer 0. 1,2,» 999 ou 1.000 vezes. E possivelealeular os probabilidades desss resultados fe demonstrar que a fragio de sucessos (no caso, encontrar dots guichéyvazios) em n observa {0es tende a estebiliza-se no valor 1/6 conforme m aumenta indefinamente. Mas extamos Tidsndo ainda com probabilidades « priori, obtidas « partir dc um clssfiengao de resoltadas igualmente provavete de n observagdes: nfo podemos provar matematicamente que as Tis da natureza 80 as lis da probabilidade matemdtica A igualdade ofetiva da probabilidade @ priori c a freqiéncia relatva em uma série extensa de repetigdes sto sapectos confirmados spenas pela experiencia "— Segundo as estatsices um em cada cinco bebés que nascem no mundo, hoje ¢ chines Beat? — Somos cinco. Nossas mulheres ext tendo filkas ao mesmo tempo, Devemes nos preparar ‘bara a possbildade de um dos nosso filo ser chines. —Queabsurdot =F aestatttica."™ Capttulo 3 / Probabilidades: uma introdupao 67 A lei dos grandes nimeros ¢ a atribuicdo de probabilidades Primera tl dos rondes mires (ioremade Bernuill rmarmonin nner sfc Jonete grande de experinetos ‘reaiencia reve deam contenant aie malt ds ‘aprobabldade Probtidade belt pla ‘ebserngso experimental dat eskbnta raves de gparsinento ‘deumresiads segunda eds granes miners rea gt omer de reper amesperiento clearia reace maior ‘unde sero valor abot da jerome afrequencs asc ‘aperimentl deumsveeso€@ ‘reienca abucuta terial eperade) Um conceito adicional Embora o relacionamento entre o conceito de frequéncia relativa e probabilidade seja incomum nos livros de Probabilidade e Estatistica, nao é um conceito novo como passa parecer. Na obra ‘Ars conjectandi, do matematico francés Jacques Bemnouilli (1654-1705), publicada postuma- ‘mente em 1713, aparece enunciada pela primeira vez. uma lei que veio a se chamar teorema de Bemouilli, ow lei emptrica do azar, ou ainda primeira lei dos grandes numero, que tem 0 seguinte enunciado: E muito pouco provivel que, se efetuarmos um niimero suficientemente grande de expe- rimentos, a freqiléncia relativa de um acontecimento se afaste muito da sua probabili- dade. ssa lei pode ser expressa de maneira mais precisa em termos mateméticos, mas esse entin- ciado é suficiente para resumir os fundamentos para se calcularem probabilidades. Outro texto 60 seguinte: Quando 0 nimero de realizacdes de um experimento aleatério cresce muito, a freqilén= Cia relativa do sucesso associado vai-se aprosimanda cada vez mais de um certo valor. Esse valor se chama probabilidade de sucesso. A lei dos grandes nimeros esté associada ao conceito de probabilidade a posteriori porque, quando nio se pode estabelecer a probabilidade a priori, a Gnica opsio € estimar a probabi dade de sucesso estudando o valor limite para 0 qual as freqincias relativas se aproximam: essa probabilidade denomina-se probabilidade a posteriori, Bastante relacionada com a primeira lei dos grandes miimeros existe a segunda lei dos grandes miimeros: dx medida que o niimero de repetigdes de um experimento aleatdrio cresce, maior fende a ser 0 valor absoluto da diferenca entre a freqiléncia absoluta experimental de um sucesso ¢ a freqiténcia absoluta teébrica (esperada). Note-se que a primeira lei dos grandes nlimeros refere-se & freqiiéncia selativa; e a segunda, & freqiiéncia absolut. Existe também 0 conceito subjetiva, uma avaliagso pessoal. A probabilidade subjetiva descre- ‘ve 0 julgamento de uma pessoa a respeito de quilo provavel determinada situagao possa ocorrer. [Nao se baseia em cleulo preciso, mas pode ser uma avaliagao razoével de wma pessoa com experiéncia, e pessoas diferentes poder associar probabilidades diferentes para os mesmos fesul- ‘ados, uma podendo achar que determinada probabilidade € 0,9 enquanto outta pensa em 0.4, (0 DNER estimow que 80% dos motoristas nao pagaram suas mules @ espera da anista."" Independentemente do conceito utilizado, as pessoas baseiam se na tentativa de modelagem do. comportamento da natureza, representada por modelos construtdos a parti das observacdes. Por mais perfeito que possa parecer, wn modelo é sempre uma simplificacao da realidad. Por exemplo, se perguntassem qual a probabilidade de uma pessoa retirar uma folha de papel amarelo de um pacote contendo 500 folhas amarelas, a probabilidade nao seria, abrigatoria- ‘mente, igual a 1, porque a pessoa poderia morrer segundos antes de retirar a referida folha. “Alguns estdiosoeafirmam que o maior poder da ciéncia & ‘poder de predigao’, ou sje, © Dpoer de saber que vai aconteceralguma coisa.) Mas exstem diferengas entre conbecer futuro pela ldgica matemdtca, pelo cileulo dat probabildades, e comhecer o fro por ‘ima misteriosapropriedaule da mente hunana Aprendendo mais vocabuldrio estatistico ‘alee prern debate gue [pale ser repent cantigeeranalons coma condo de ‘ouee decade uma de wos reali es Ao verificarmos o prego de venda do délar comercial, conduzimos o que se chama de expert ‘mento. Diariamente, os resultados podem apresentar uma ligeira diferenga um do outro, por ‘causa das pequenas modificagdes nas varidveis ndo-controladas, incluindo alteragées no edm- bio ou no volume de negscios. Chamamos experimento ao fenOmeno que estamos interessados em observat, e cada realiza- ‘do dele ¢ uma experiéncia. O experimento aleatério & aqucle que pode gerar diferentes re- Sultados, mesmo repetido sob as mesmas condigdes © em qualquer ocasiao, “0 primetro (Marcel Duchamp], talvez 0 artista mals interessante do éculo, sempre rabathow ‘com varidveiscontoldvels parém detzando aberto espace para a intervongdo do acts, Cow por exemplo, réquat a pari de barhantes de am metro, jogados an cho de umes ‘mesma elaradeterminada —flcando a0 acaso atarsfade excther forma que les assum: ram ao toro soto." 68 Capinulo 3 / Probabilidades: uma introduso epacoomotird —Desse modo, di se que esse experimento (e tantos quantos sejam realirados), tem componen- — tes aleatrias, Em algums ensos, a8 variagdes aletorias que ocorremn sho pequenas, compar iho dads oredr da com os objctivos do experiment, ¢ podem ser ignoralas, Entetanto,t vaiagao esta sem postonadewmesperimenio’ pee presente, e sua grandeza pode ser tal que as conclusées importantes podem nao ser ébvias e, neste caso, uiliza-se o metodo estatistico para modelar e analisar métodos experiments, Nos easos em que um experimento nao observado, mas realizado em aboratri, nto importa quao cuidadosamente ele € planejado: mesmo assim as variagdes sempre inde econ. Absimn Sendo, o objetivo do cleulo das probabilidedes ¢ compreender, moder e quantificur Os tipos de variagdes que podem ser encontradas na observacao ou na realizagao de experiments. Quando 56 incorpora esse conceito de varidhilidade co pensamento as andlises, decide-se melhor @ eretocompate partir dos valores bios “Gian cnrobevdrsrenitodss Para um determinado experimento, podemos definir o conjunto de todos os resultados que ‘iiepemmensctenarejalgamos possiveis, Esse conjunto’ denominacse espaco das possibilidades do experimento Ol, simplesmente, espago amosiral, denotado pea letra S~ cada um dos resultados possivels Etim elemento do conju 8. cent cloner (ou simples) masta dev experimen etree ‘enor mubomeneessitenes Eripora nig s€ possa prever qual resultado particular iré acorrer em uma repetigo do experi- mento, pode-se conhecer 0 conjunto dos resultados possfveis desse experimento; na pritica, do estamos interessudos no espago amostral, mas apenas em um resultado elementar (apenas tum elemento de 5) ou em uma reunio de resultados elementares, O resultado elementar deno- rmina-se evento elementar (ou simples), se for apenas um, ou evento eomposto, em caso con: trério. O que desejamos saber, na vide real, sf0 as probabilidades da ocorréncia de determinado evento, elementat ou nto. iaialesem que wacoréncie dare ent impedeeocomtuca duro miei emumeneriner Diremos que 0 evento ocorteu em certo experimento se 0 resultado for um elemento do con: teat domauoenc exons syaro que define 0 EVEN pou aan nds oredr “se coreéacia de um evento (elementar ou composta) impede a ocorréncia de outro evento (Cambém elementar ou composto) diz-se que so eventos mutuamente exeludentes. someto te ‘Como conseqiéncia do fato de os eventos serem mutuamente excludentes, a probabilidade de __enmlenetedcamereno’ eles ocorzerem a0 mesino tentpo € igual & zero ‘avr depaco Como © camplemento de um evento A consiste nos resultados do espago amostral que no ‘nomelmentefarmparcde faaem parte do evento A, a probabilidade de ocorréncia do evento contrarto, ou complementar ‘od de um evento, é igual a T menos a probabilidade do evento considerado. Para eventos coletivamente exaustivos, a soma das probabilidades de ocoréncia de todos 08 cvoos independents eventos coletivamente exaustivos € igual a 1 ~ ——-—_ Finalmente, os eventos sendo independentes — ou seja, a ocorréncia de um deles nao influen- aaulererquesocorriniede cia a ocorréncia do outro —, a probabilidade de eles ocorrerem simultaneamente € igual a0 _ Cece ntoforecitormacina produto de suas probabilidades, ‘ori, oui aacorinc ts ‘eno no tom fain ccorénlade cure Combinando os trés conceitos de probabilidade: 0 que a teoria fundamenta Afundamentagao 0 objetivo do célculo das probabilidades é obter um valor numérico da possibilidade de ocor- Tatemdtien ard de determina acne para enacted omade dure deco taco tall Por nf havrconcordncia ene os consis cisco, Feqencal © subjivo. a tera des Praubligaes eve gues buscarem sn conjoint em que pchidades ous Star ae vetliade om base no conecents do stuagto cm toto, Os atomas seg SE i que t proablidny esos as eaptinats pen et eres com fs. ridin lcm eno ules votes os fads Posen probabiidadesdesere¥% O, axiomas facilitam 0s célculos das probabilidades de ocorréncia de alguns eventos a partir do Souhscinent de rbabidads de outes erent. Os ilomat fotimssabelecloe plo Intomaico ras Kolmogeoy= so o cymes Em om experiment slnio com um expue amostolasciado, ua fngfo que asocia 2 Gate resultado um numero tes, ropesentado por PRA) e wma anode robbie se Subte s segines prope + S¢anbevagfo de pace someon smercan, mung por era alread he Sess sna Andres NestentchKelmogoo (5031987 cic nas Capttuto 3 / Probabilidades: uma introdugaa 69 Tri eB deine me epg amasielS dma, uefeccorespndera cae vento Eum numero rea nde (por rib saserondoatrs sim fondant As propriedades aditiva, emultiplicativa ajudam_ no céleulo das probabilidades de eventos no-elementares event @dennadapor PAB) eesti por 1) para qualquer evento A, 0 < PriA) $ 1; 2) a probabilidade do evento certo é a unidade, Pr (espago amosteal) = 1; 3) se os eventos A ¢ B sio incompativeis (mutuamente excludentes), a probabilidade de ocor: réncia do evento A ot do evento B é a soma da probabilidade de ocorréncia de A com a probabi- lidade de ocorréncia de 8. O primeiro axioma afirma que se atribui a todo evento do espago amostral algum nimero real; no cdlculo das probabilidades, a escolhia dos niimeros a serem associados aos resultados pode Fia ser qualquer uma, mas intuitivamente associam-se valores entre Oe 1 © segundo axioms afirma que 20 espago amostral como um todo é atribufdo © mimero 1 & ‘express a idgia de que a probabilidade de um evento certo é igual a 1 © terceiro axioma caracteriza a possibilidade de simplesmente se somarem probabilidades quando 0s eventos sio mutuamente exchudentes. Os trés axiomas no necessitam de prova; entretanto, se a teoria resultante 6 aplicada no mundo real, deve-se mostrar de algum mado que os axiomas sao realistas, isto é, apresentam resulta- dos razodveis, comprovados pelo conceito frequencial de probabilidade. s axiomas no dizem como atribuir probabilidades aos varios resultados de um ex; apenas restringem as maneicas pelas quais isto pode ser feito. Na pritica, as probabi atribufdas com base nas estimativas obtidas de experiéncias passadas, em um estudo cuidadose 2 respeito do experimento ou em suposigdes de que os varios resultados mantém a mesma probabilidade, Em muitas situagdes, a estimativa da probabilidade de um evento é atualizada com base em uma informagao adicional, antes provivel, mas agora certa, devendo 0 espago amostral ser atuali- zado com base nessa nova informage. A definigao de probabilidade condicional pode ser reeserita para fornecer uma expressio geral para a probabilidade de ocorréncia simultnea de dois eventos. A probabilidade da ocorréncia simultinca de dois eventos A e B, P(A c B) .€ igual a 1) probabilidade de A vezes a probabilidade de B, se A ocorreu primeiro, Pride B) = Pria} x PrBIA},” on 2) probabilidade de B vezes a probabilidade de A, se B ocorreu primeiro, Pride B) = PB) x PRAIB) Se.os eventos A e B forem independentes, Pr(A1B) = P(A) (porque independe do resultado de Bye Pr(BLA) = Pr(By; nesse caso, Pr(A e B) = PriA) x Pr). Esta € a propriedade multiplicativa das probabilidades. Pode-se deduzir de (1) ¢ (2) que # probabilidade de A tendo ocorrido B & dada por Pride B) PrB) © que a probabilidade de B tendo ocorrido A ¢ dada por Pride B) Pray desde que PriA) e Pr(B) sejam diferentes de zero (0 que 6 Sbvio). Esta é a definiglo de proba bilidade condicional. Pr(A| B)= PB A) Se A e B sto independentes, PreAeB) _ PAA PHB) | yyy Pad) Pray A probebilidade de ocoméncia de dois eventos, A © B, em que A ocorte ou B ocorre ou ambos ‘correm, é igual a soma da probabilidade de A com a probabilidade de B, menos a probabilidade da oconréncia de ambos. A denominada propriedade aditiva das probabilidades & a seguinis: Pa(A ou B) = Pr(A) + PB) ~Pr(Ae B) = Pr(A) + Pr(B)~ Pr) x PrBIA)= Pr(A) + Pr(B) ~ PHB) x PriAB). Se € forem independentes, Pr(A ow B) = Pr(A) + PAB)— PAA) x Pr(B) Pr(B| Ay conforme vis ‘ibae Pr A)como prota de a certs dee P(A como probable de A. ceneza dy, 70 Captnlo 3 / Probabilidades: uma inrodugdo 8 Exeretcloexemplo 2.2 ara ilstrar ax propriedades,tem-eeo problems de calcula confabikdade de um conjumo de cspamentos,especifcamente os chads sistemas sie paraeo, nos guais os eventos deal ‘dos equipamentor si considers mutuamenteindependentas com a finalidade de simpiicar os ‘eleulos matemslices, Um sistema em sére € agus no gual todos os componente 0 de tal modo Inter rlacionados que o sista inlseo Tahara se qualquer um dos componcnts aha (Figura 23:1), Umsistema em paraleto (od redundant) € aque qe falhrdsomente se todos 0s companies {es falnarem (Figura 32), sent tanita ©OHO=CHO= Figura 3.2 Sistema em paratelo. _a determine «confisbilidade do sista da Figura 3.3, sabendo-se qv a confiabiidade de cad ‘equipumenta 90%; be. determine a confabilidade do sistema da Figura 3.4, stbendo-se que a confabilidae de ada ‘cquipamento Figura 3.3 Sistema A. Figura 3.4 Sistema B. (© Exerefcio-exemplo 3.2b poderia ter sido resolvido também pelo evento complementar, por- {que a probabilidade de o sistema funcionar é igual a 1 menos a probabilidade de ele falhar: mas «9 sistema falha quando ambos os componentes falham, ou seja, falha © primeito e falha 0 se ‘undo, Daf que a probabilidade de nie falhar € igual a: 1 — (10,9) x (1 -0,9) = 99%. Bxercicio-exemplo 33 "Em uma ie J rode les parc rnco shee = air de eis it ‘am ue 3 npn nanan be pesmi: quan coement em ‘aka quam trp Gestr gue cove we cominesn em pie so es por magus dee ou sto stepentenes ermine IY chute de seston ua pac alms confoane (ou sea, que satis Ib went bs typo pacts qn astra plo menor a epsifea; b roportn de place ue no safari expecting be comprne «de rer SL ots ds naan boecnfone, sobre nc nn coorme gut 20 Caleatarcortomenteas proba ‘comprimento feito elas miquinasresponsveis pelo care nas medidas, probabiidade de ser ates deindeves eerie de nio-onforme quanto &largura ¢ 60% Tet de sateen cachar qe «es, no ite (a) 0 eventos podem ser considerados mutuaimenteexcludentes: ca al prea wSas desereva dots eventos deste exemplo que sejam matuamenteexcludentes. Um auxilio ao cdlculo manual: 0 conceito de drvore de probabilidades ‘Se um experimento ¢ tal que posta ser tratado em fases, uma em seguida a outra, a listagem dos resultados pode ser consideravelmente simplificada se deserita por um gréfico denominado Grvore de probabilidades ou diagrama em drvore Figura 3.5 Arvore de probabilidades (diagrama em drvore). Considerando mais detathadamente informagées adicionais Capitulo 3 / Probabilidades: uma introducto ma Quando um espago amostral pode ser escrito em diversas etapas, representa-se cada um dos n, Caminhos para completar a primeira etapa como o galho de uma drvore. Cada uma das manciras de se completar a segunda etapa pode ser representada como n, caminhos comecando a partir do final dos galhos originais, e assim sucessivamente. Por exemplo, uma mensagem em um sistema de comunicagdes digital pode ser recebida 2 tempo ou nio. Se trés mensagens sto recebidas, a Figura 3.5 ilustra o diagrama em drvore que representa 0 espago amostral dos resultados possiveis. Mensagem 1 === Mensagem 2 Mensagem 3—— _ B Emtompo AN ® Atrasacs Q ° 9° So 9° o °° ° ‘Cada fase de uma experigncia de varias fases tem tantos ramos quantas possibilidades existem naquele fase, No uso da Figura 3.5, hd dois diferentes na primeira fase ¢ dois ramos secund- rios em cada uma das segundas fases, O nimero total de ramos terminais na arvore fornece 0 ‘nimero total de resultados possiveis na experiéneia composta e, por essa razo, os pontos. {erminais daqueles ramos podem ser tratados como pontos amostrais do espago amostral cor respondente ao experimento. Se existem vérias fases para um experimento ¢ virias possibilidades em cada fase, a érvore fassociada com o experimento tomar-se-ia muito grande para ser manuscada, Fm tais proble~ mas, a contagem dos pontos amostrais & simplificada por meio de formulas algébricas: consi dere tm experimento com duas fases para a qual exister r possibitidades na primeira fase e s possibilidades na segunda fase, correspondentes a cada uma das possibilidades do primeiro. firvore, para representar esse experimento, tem r ramos primirios e s ramos secundacios saindo de cada um dos r ramos; conseqdentemente, © nimero de ramos terminais & rs. Se uma terceirs fase com # possibilidades Fosse adicionada, o total seria rst. Isto pode ser evtendido a qualquer rndimero de fases. Em algumas anilises de decisio, a informago probabilfstica pode ser obtida de mais de uma fonte, sendo interessante combinar a probabilidade ja conhecida com uma nova informagao adicional. As probabilidacies subjetivas ou as frequéncias relativas (obtidas a partir de uma amos- tra) so 0 grau de crenga do tomador de decisio a respeito da provavelmente verdadeira probabi lidade’ desses eventos. Nessa situagao, € possivel modificar as probabilidades « priori com base na nova informugio, atualizando as probabilidades. Para esse desenvolvimento so neces- sitios trés elementos. © primeira 6 a distribuigao @ priori, ou seja, a informagdo existente antes que novas informagdes tornem-se disponiveis; por exemplo, uma empresa decide langar ‘no mercado um novo produto c faz uma pesquisa de mercado para confirmar (ou no) 0 que = ‘empresa imagina ser a sua fatia do mercado a priori. O segundo € a informagio adicional, que pode ser 0 resultado da pesquisa de mercado; esse dado denomina-se informacdo da provavelmente verdadeira probabilidade, um conjunto de probabilidades condicionais. As probabilidades obtidas s0 aquelas que ocorrem com base nos ‘valores iniciais das participagdes no mercado. Deve-se enfatizar que os valores das provavel- mente verdadeiras probabilidades so probabilidades condicionais. ( tereeiro vem a ser a férmula usada para calcular as probabilidades que combinam as probabi lidades a priori com as provavelmente verdadeiras probabilidades condicionais. 72 Captiulo 3 / Probabitidades: uma intrude Exemplificando a identficago dos trés elementos: o diretor de uma empresa imagina que um. problema esté sendo causado ou pelo departumento de vendas (£,) ou pelo departamento de rodugdo (E,). Antes de consultar qualquer pessoa, esse dizetor arbitra, por sua experiéncia, ue a chance de ser problema de vendas € de 80%, e de producdo apenas 20%: eseas slo as probabitidades a priori dele Para melhorar a estimativa, o diretor resolve obter mais uma opiniao. Consulta entéo um asses- sor, 0 qual responde que 0 problema ¢ £; 0 diretor acredita que o seu assessor conhece bem 0 assunto ¢ teria chance de 90% de estar correto. Essa probabilidade € condicional porque as robabilidades condicionais sto as provavelmente verdadeiras probabilidades do diretor qual {0 a capacidade do seu assessor de identificar corretamente 0 problema, O diretor pode basear @ sua opiniio na capacidade do assessor com base nas informages que o assessor jé deu a respeito de problemas semelhantes’ Priassessor responder E, quando E, é verdadeiro) = Pr(assessor dizer E, | E, € verdadeito) = 90%, Por outro lado, 0 ditetor sente que, se 0 problema é E,, seu assessor poderia responder que €£,, mas com uma chance de apenas 30%: Pr(assessor responder E, quando E, é verdadeiro) deiroy = 30%, Com essas informagoes, 0 diretor consegue calculur a probabilidade de ser £, quando 0 asses sor responde £,, assim como a probabilidade de ser F, quando o assessor também responde E, Entdo se ealeula a probabilidade de ser E, quando 0 assessor responde que é E, ponderando-se as probabilidades a priori pelas probabilidades condicionais da eapacidade do assessor de iden~ tificar corretamente o problema, Para revisar a probabilidade a priori de E,, a situ problema é E, © 0 assessor diz realmente que € Ey. As situagdes posstveis de ocorrer slo o assessor dizer E,, mas o problema ser causado por E, ‘u por £,,.O fato de 0 assessor dizer que & E, no garante que 6 E,, porque pode ser também ‘ou seja, {0 assessor diz Ee 0 problema & F,] ou [o assessor diz Ee o problema é Ey] Com 2 notagio da probabilidade condicional, a situagao favordvel a0 ditetor é dada por 08 x09 = 72% Prtassessor responder EE, é verda- io favordvel ao diretor é aguela em que 0 Priser E,) x Pr(assessor dizer E,, sendo E, € a situugdo possivel 6 dada por: Priser E,) x Pr(assessor dizer E,, sendo E,) + Prser E,) x Pr(assessor dizer E,, sendo 0.8 x 0,9 + 0,2 0,3 = 0,72 + 0.06 = 78%. situagao Favordvel Finalmente, Priser El assessor diz E, aE " Situagdes possiveis = [o problema é £, ¢ 0 assessor diz E,, sendo E}] + | 0 assessor diz E, € 0 problema é E, ou ‘assessor diz F, € 0 problema é £,] ov seja, PH{E,)x Pri E, lor) 5) Pra, ler ,) + Pr(E,) x PGi, ser E. Pr(ser B,| dizer E)) 92.3% a Pr{ser Ey| dizer E,)=7,7%. Os eventos E, ¢ E, sio exaustivos € mutuamente excludentes, ¢ as probabilidades encontradas denominam-se probabilidades « posterior. Se 0 diretor consultar um segundo assessor para uma opinido a respeito, as probabilidades a posteriori da primeira iteragio tornam-se as probabilidades a priori da segunda iterago, © assim sucessivamente, Pode-se estender esse raciocinio para o scguinte caso: considerem-se By, By, By ~. B, eventos Hutuamente exeludentes ¢ exaustivos de um espago amostral $ ¢ seja E um evento associado a 'S. Com 0 racioesnio do exemplo ¢ aplicando-se a expressio de probabilidades condicionais, y= PPB PE LB) 3 Pa yxPrEIB) Copiuto 3./ Probbitidedes: uma introduce 73 Essa expresso & conhecida como tearema de Bayes." que permite coleular probabilidades que tém direcdo contrdrla de proporcionalidade a partir das probabilidades que se conhece. Alem disso, 0 teorema de Bayes € stil na andlise de decisdes, 0 qual necessita dessa informugio probabilistica em uma forma diferente daquels que naturalmente ocoree, onde o naturalmente ‘corre significa a moneira mais féeil de eoletar ov avaliar dados nas probabilidades condicio- Interpretages e determinagdo de probabilidades Expressando em nimeros os resultados desejados ire eerie “Fatal denn em ues ‘emoxtteaio damiio combo de resus cola igen Zeca ‘deminer reais Desenvolvendo uma fungi de probabilidade L wisae depres “ann dada pesibilidates A teoria moderna define probubilidade como um mimero que satistaz a uma série de postula: dos, mas nio fornece indicagio de como se obter esse mimero: apenas estabelece as regras que devemos obedecer uo manipulurmas as probabilidades obtidas. Em conseqiiéncia, ha duas gean- des comtentes a respeito do problema da determinago da probabilidade. A escola objetivista ou fregiencialista considera que a probabilidade $6 pode ser obtida por meio das freqiéncias relativas e, portanto, somente & aplicdvel a situagSes em que a experién- cia pode ser repetida varias vezes, sob as mesmas condigbes. Fica portanto exclufda, para os freqiencialistas, uma grande classe de problemas em que nto é possivel falar em freqiéncia relativa. Por exemplo, para os freqlencialistas nao ha sentido em perguatar qual a probabilidade de o homem ir a Marte nos proximos cinco anes, A escola subjetivista ou personalista considera 2 probabilidade como a medida da erenga de ‘uma pessoa racional em uma dads proposigao. Diferentes individuos racionais podem ter graus diferentes de crenga, mesmo em fuce da mesma evidencia — e, portanto, as probabilidades pessoais para o mesino acontecimento podem ser diferentes, porque as informagies de que dispdem podem ser diferentes, Um subjetivista aplica 0 conceito de probabilidade a todos os problemas considerados pelo freqiiencialista, © a muitos outros mais, como a viagem a Marte, por exemplo, A medida que vamos tendo mais observagies, podemos irrevendo a nossa avaliagio da proba: Tidade de uma situagao em face de novas informagoes. Assim & que, no caso de haver freqhin: cias relativas disponiveis, baseadas em um niimere grande de ebservagdes semelhantes, a avalia co subjetiva tende a se iguakir 8 avaliagao freqiencialista, A definigo classics, quando admite que todos 0s casos posstveis so igualmente provéveis, pode ser filiada, de certo modo, & corrente subjetivista, Ao afirmarmos que encontrar qualquer rndmero de guichés vazios & igualmente provavel, estamos manifestando @ nossa crenga de que 80 € verdade. Para um verdadeiro freqiiencialista, deveriamos observar o resultado de milha- res de observagbes para comprovar se isso € real. Em um experimento, estamos interessados em determinada caracteristca dos resultados que poderio ocorrer. Assim como na Estatistica Descritiva usam-se as escalas para transformar em rnGmeros as catacteristicas dos clementos da amostra, na realizagao de um experimento tam 'bém se deve ter um valor numérico para representar a caracteristica cuja probabilidade de ecor réncia queremos saber. Represente-se por X esse valor numérico, eujo valor depende do resultado da experiéneia; como X associa um resultado a um nimero, X'é uma funcdo cujo dominio de definiga0 € 6 conjunto de resultados e cuja imagem é 0 conjunto dos muimeros resis, X 6 definido no espago amostral associado a experiéneia fisica na qual o resultado de qualquer prova é incerta e, por essa F370, dependente do acaso. Essa funezo X € conhecida pelo nome de varidvel aleatéria.” Isso equiva- Te a descrever os resultados de um experimento aleatério por meio de niimeras em ver de palavras, possibilitando mais fécil tratamento matemético. Desse modo, no eileulo de probabilidades estudam-sc as variaveis alcatérias ¢ calculam-se as probabilidades associadas a elas, e uma medida de probabilidade é associada ao espago amostral por meio da varidvel aleatéria X: essa medida pode ser um némero, uma rea ou mestmo um volume. Assim como, na Estatistica Deseritiva, se construiu uma tabela de freqiiéncias sem perda de informagio, na qual uma frequéneia absoluta (e também uma freqUéncia relativa) ¢ associada & cada valor, pode-se fazer o mesmo com relagio ao célculo das probabilidades, originando uma labela que associa a cada valor a sua probabilidade de ocorréncia, tabela denominada distribui- ¢d0 de probabilidade. npr uveslmenta sala, aexposco ne ¢adequada, org X no vadel sm us fd slem di, olla ete anasado) lore) dessa Ves que aoe nem aed, nem sles 74 Tabela 3.3 Resultados dos testes ‘em 3 equipamentos. Tabela 3.4 Probabilidades dos resultados dos testes Tabela 3.5 Distribuigao de probabilidades da varidvel aleatéria X. Capitulo 3 / Probabilidades: uma intro Para se construir uma tabela de distribuigao de probabilidades, considere 0 seguinte exemplo: ‘um equipamento tom 80% de chance de ser reprovado em um teste e, em um experimento,tr8s equipamentos sZo testados. Supondo que cada equipamento é independente do outro, estabele- ‘98 disteibuigto de probabilidade do niimero X de equipamentos que S20 reprovados. Associando- se cada resultado a um determinado nimero, observe a Tabela 3.3, na qual R significa equipa- ‘mento reprovado e A. aprovado. Rewultada cementar RRA RAR —_&__+ RAA ABA ‘AAR ‘AAA, © niémero 3 € associado ao resultado RRR. Como existe uma chance de 80% de 0 equipamento ser reprovado em cadu teste (considerados independentes), entio 0,8 x 0,8 x 0,8 = 51.2% 6a probabilidade de ocorrerem teés reprovagées. Calculando-se dessa maneira, cada um dos ito resultados elementares tem as probabilidades de ocorréncia mostradas na Tabela 3.4 Resultado clement x Prebble RR 2 TRO RORSI-TO RRA 0880260 125-1285 RAR Po an08-0.2 ARE 2 (02.0850;60.1280128% RA 1) bea n02NMRE Ie RA, TT en.aseaan09Ai3 ‘AAR AAA A partir desses resultados, determina-se a distribuigdo de probabilidades da variavel alest6ria, X, niimero de equipamentos defeituosos reprovados no teste (Tabela 3.5). (Observemos que X ‘equivale a ter 1 equipamento reprovado), evento composto de tres eventos elementares ‘mutuamente excludentes [RAA, ARA e AARI.) ‘Apds terem-se visto os resultados, os valores numéricos da varidvel aleatGria so denotados por letras mindsculas, x, x, y- Desse modo, para uma varidvel aleatGria X, que assume alors xr ¢ assim por dlant, uma fungao de probabilidade Prix) tem as seyuintes prope aces: a p(x,)20 para todo i, onde p(x) = P(X =x) f= 1 » Loren, Pes) = Se a distibuigdo de probabilidades de uma varivel aleat6ria é explicitamente conhecida, entio todo © resumo estatistico (por exemplo, média ¢ desvio padrio) também seré conhecido. 2, Capita 5 f Probabilidades: uma inroducdo 75 Entendendoum conceito importante Tabela 3.6 Tabela de freqiténcias com amplitude de classe ‘igual a 20. Figura 3.6 Histograma da Tabela 3.6, ‘com amplitude de classe igual a 20, Tabola 3.7 Tabela de {fregiténcias com amplitude de classe igual a 10. Na Estatstica Descritiva, também se construiu uma tabela de freqtiéncias com perda de infor- ‘mago, na qual uma freqiiéncia absoluta (e também uma freqiéncia relativa) € associada a cada classe. Ao se fazer o mesmo com relago a um intervalo de valores e suas probabilidades, origina-se uma tabela que associa a cada intervalo a sts probabilidade de ocorréncia. Como ‘agora o numero de intervalos depende da amplitude de cada um deles, a tabela nfo é mais nica, diferentemente da distribuigio de probabilidade, em que cada valor era perfeitamente curacte- rizado. Mesmo que se saiba que of valores originais so finitos, a0 se coloeé-los em um int vvalo considera-se que esse iniervalo possa conter infinitos valores. Para essas varidveis aleaté ras, tendo em vista que 0 total de valores que # varidvel aleatoria pode assumir € infinito, ¢ distribuigdo de probabilidade é geralmente expressa como uma fungo matemstica, usada par ddeterminar a probabilidade de a varidvel aleatéria estar entre certos limites, Considete a Tabela 3.6 ¢ a Figura 3.6, lle. © Tap Tang Magy Mg Tage Tagg agp ggg age Como, na construgiio da tabela de freqiléncias, o ndmero de classes € escolhido por quem a faz, poder se-ia ter também a Tabela 3.7, na qual a amplitude de cada classe é 10, em vez de 20, com, ‘6 correspondente histograma da Figura 3.7 Progléncia aboot 2 a 1 DF ' wm bt 2 uo EB 5 m@ Fw 3 bw 6 wr ® iy Fw 2 bom 0 mb 0 m1 m | mF 6 210 4 1 1 1 76 Figura 3.7 Histograma da Tabela 3.7 ‘com amplitude de classe igual a 10. Tabela 3.8 Tabela de frequéncias com amplitude de classe igual a 40, Figura 3.8 Histograma da Tabela 3.8 com amplitude de classe igual a 40, Figura 3.9 Freqiléncia relativa como ‘irea do histograma. Capitulo 3 / Probabilidades: uma introduso § i i | E I ao Pode-se observar que, embora provenientes dos mesmos dados originais, 0s histogramas mos- tam diversos modos de apresentaciio das observagbes porque, dependendo da amplitude do intervalo de classe, os intervalos de classes io diferentes. Mesmo que a escala vertical fosse fade freqlncias relativas, o aspecto do histograma permaneceria 0 mesmo, jé que haveria ape- zhas uma mudanga de escala ara evitar que o aspecto das freqUéncias relativas leve a uma distorgo quando da leitura delas, como alturas do retingulo do histograma, jf que sdo dependentes da amplitude do imtervaio de classe, modifica-so o histograma tal que, em Vez de o eixo vertical sera freqiiéncia relativa de 0, jd que a probabilidade de chegar 2er0 elemento no ‘tempo zero 6 igial a 1 Para simplificar esse modelo, suponha-se, também, que cada p,(1) 6 continua e diferencisvel para 0S1s oo; D. sejam dois intervalos de tempo niio justapostos ¢ sucessivos, Ar. Na Figura 3.14, con- sidere que ha “k chegadas no primeiro intervalo 1" ¢ “n-k chegadas no segundo intervalo At” e que essas chegadus sejam independentes. Capitulo 3 / Probabilidades: wma introducao 87 Figura 3.14 Evento “n chegadas no imervalo de duracao t+ 40", sendo "k chegadas no intervalo de duracao «” 2 “wk chegadas no intervato de duragao At”. Portanto, a probabilidade de ambos os eventos ocorrerem no intervalo (¢ + A) € igual ap\(AP_ (M0. Desse mado, @ probabilidade de n chegadas no intervalo de duragio (¢ + Af) € obtida somando- se esses termos para todos 05 & $m. Dai que: pared > popes ¢. adicionalmente, para simplifiear a modclagem., considere que as probubilidades de mais uma chegada tém 0 valor 0 quando r> 1, ou seja, p.(0) = 0, p(0 = 0, p.() = 0, € assim Como $ y= 4) #0) # = eto ngoeriorE nine. Dai que yo = PAPO. A partir das condigdes do problema, tem=se que: pit ea =S plop. d6&8) = np 688) + Pa OPIAD +B, PDP sCA, ‘que 6 aproximadamente igual a pats St) = ps(O10-ABs 7, (DRA + 0 pae+ A8) = p,lt) = BORAL + Py OAAE Delt + AD - PLOL= RE PAO Py (DI DE (2,8 + AD -pO1/ A= A PO +R PLM Fazendo Af tender a zero, temos que: BAO = RDO) + RP, patan = 1,2, . Para cada n, temos uma equagio diferencial e de diferengas. Definindo-se uma fungi0 galt) = & p,{t) 0 sistema torna-se q'(0) = Rd, (2 Vomos que q, (0) = 0 para n > 0, Entio obtemos sucessivamente agit) =e dat que git) = At gohan © endo 4. = O02. Como ¢,(0 = 2.4, (0) entdo 9,0) = Oy! Pela definigao de 9) = €% p,(0) = Qay'in’ Finalmente 0 valor de pA) = eM I"Int. A esse modelo denominov-se distribuicao de Poisson. Propriedades do modelo ‘A média ¢ a varidncia de uma distribuiga0 de Poisson sio iguais e valem: 88 O terceiro modelo matemitico: exponencial Usando calculadoras Usando 0 Exeel Figura 3.15 DISTEXPON com @ Colar Funcdo. Capitulo 3 / Probabitidades: uma introdusdo Observando 0 nosso mundo ‘Voltando as filas (a gente sempre volia.)-Vimos que toda fila é formada por pessoas ou objetos (que se podem contar). os quais estio esperando pela realizagio de uma determinada atividade ue leva tempo (tempo esse que & mensurdvel), Analisamos o problema, primeiramente, com reluglo &s entidades que formam a fila; agora vamos analisar 0 tempo de processamento da atividade. Na distribuigito de Poisson, definimos a variavel aleatéria como sendo o niimero de eventos em determinado periodo, em que u média dos eventos naquele periodo era denotada por 2. Assim ‘como o nimero de elementos que chegam € uma varidvel aleatéria, observamos que o tempo centre os eventos também & uma varidvel aleatoria, Condicaes de aplicagao © mimero de eventos deve ter uma distribuigio de Poisson. Férmuta de pronto uso para quem tem pressa © periodo de tempo 7 entre contagens sucessivas de um processo de Poisson com média A > 0 uma variavel aleat6ria cuja fungio densidade de probabilidade ¢ dada por KO, Tendo em vista 0 aspecto matemético dessa fungio densidade de probabilidade, ela é denomi- nada exponencial com parimetro 3, B® Beercicio-esempla 3.11 Ao aservarmos a durasio des bateras de videogames, conclaimos que esta vida nade mas € que © tntervalo entre falhassuerssivas das bateras para esas falls, pode-seaplicar 0 processo de Poisson, Desse modo, tempo médioente falhas vem sera vida media ds bateia Consider que lndmeras Baers fram usaas «anotou-se (algo rare de aorre 0 dada, somente a bess 1 fazem) que cada sete dos havia necesidade de trols (ou fej, a vida media da bate de lua semana. As fulhas das bateras so aleatvias independentese atendem as condigaes da lstibuigdo de Poisson; ento, pars o vempo de vida da batri, pode-se utilize a cstnbuigio ‘exponencial ‘determine probbilidae de a batera durae pelo menos 2 semen [determine a probublidade de uma bateriafalbar dentro de 3 das: tempo especificado) = Pr(T'> ) € equivalente, na distribuigo de Poisson, a se ter N = 0, Dat que: Fatt o Mas Pre’ fang de dsrbuigtoacumulada de 7, igual ae" para 20 Diferenciandoa em eli a 1. chega-se «uma fangdo densidade de probabilidade, (fit) =he™, para 12 0, na qual a mesma méia por nidade de tempo da distbigo de Pinson Propriedades do modelo Amédia ea voréncia de uma dstibusio exponencia so iguis vale 1 gtel waZe Pay Diz-se que a distribuigdo exponencial tem a propriedade de nao ter meméria, Isso significe, por exemplo, que a probahitidade de a vida stil de um equipamento exceder(s + ?) unidades de fempo, considerando que jé se passarum r unidades de tempo sem que ele falhasse, & a mesma que a probabilidade de 2 vida dtil do equipamento exceder s unidades de tempo. Matematica mente, essa propriedade é representada por: PAT > 54011 > 1) =PHX>s) para todo se 120. PrN =0) PAT >t) =1~ PASO. WE Keerciciooexemplo 3.12 [No Excel, ealcule a probaildade aproximaga de am equipement, guia vida média de 2 anos e4 ‘meses pode ser modelada pela diswibuigto exponencal, dura) si 3 ance b) mais de 3 anos) 162 anos ed meses: d) mais de 2 anos e 4 meses ) ainda 3 ancs mais aps er durado 1 no. Observandoo nosso mundo Quando realizamos medigées, podemos ver que h4 um valor em torno do qual tendem a se Concentrar as medidas, ¢ € razodvel supormos que ha uma chance muito maior de encontrarmos uma medida proxima desse valor do que atastada dele, Também ¢ razodvel supormos que a chance de se obter uma medida maior ou menor que esse valor é a mesma, Esse valor, no que se refere a medigdes, por exemplo, € 0 valor verdadeiro do que se deseja determinar. Colocanclo em mimeros a, seo valor verdadeiro € 30, hd uma chance maior de encontrar uma medida entre 29 ¢ 31 do que entre 45 e 47; embora as diferencas entre esses limites sejam as mesmas (31 ~ 29 = 2e 47 ~ 45 = 2), as probabilidades de ocorréncia slo diferentes porgue ndo existe uma roporcionalidade entre as diferencas de medidas c as chances de ocorréncia, 90 Capitulo 3 / Probabilidades: uma introduce b.schance des enconte alg aims J vera vale 50%, sim somo 650% de aconrartina medida suo So endear sion Gases oe Cakes oe Se ie pe oe go ad a a A asrtuipso ma omplanente wad no probienns cascode de BoM Laplace™’-Gauss"", conhecida como distribuigo normal. Entrevanto, esse nome normal pode Tetara algunos snore ong va ae peace dee as be mt team ae matcloco ge ss€vene Ais oo a te cae ae ace {Sha denna einer no 8 vende (aoe coma aes mio em toca) porgataue eco deta Oeste Cas ten ie Cae. oe eee cee humsabt! Depencenl do valor da dopa dom dare gies d cape ser achat, pongo, ca race ats gece Sera oe Alrite Deter piace ‘Goustonfomadexne, Condigdes de aplicacdo Em situagdes nas quais os valores tendem a concentrar-se regularmente central torno de um valor eneswl)! Formula de pronto uso para quem tem pressa ‘hoiarqucedocerpmbiene, > Sunsio da densidade de probabilidade de uma varidvel aleatéria DeMoivre-Laplace-Gauss & ‘sequomimaderiaiao 4d por: Deter Laplace Gs | para — se << onde os seus parimetros sko: ‘H média da popula, 6, desvio padrio da populagzo ‘A Figura 3.16 mostra uma fungio de densidade de probabilidade de DeMoivre-Laplace- Gauss, Figura 3.16 Distribuigao de DeMoivre-Laplace- oe 0 0 @ wD Usilizagdo passo a passo ‘Ao resolver qualquer problema que envolva a distribuigio de DeMoivre-Laplace-Gauss. esbo- ce sempre 0 grifico da distribuigao © sombreie as Sreas desejadas para facilitar a visvalizagio das probabilidades que se desejum determinar. Modo classico Encontrar a area sob uma curva de DeMoivre-Laplace-Gauss e entre dois limites envolve a Integracdo da fungdo densidade de probabilidade entre esses limites, integraco que s6 pode ser feita por métodos numéricos. Como os valores dos parimetros da fungio densidade de probabilidade mudam para cada possivel combinacio de ie o, torna-se muito dificil calcular ‘essa drea sob a curva de DeMoivte-Laplace-Gauss todas as vezes que se deseja calcular proba: bilidades. Contudo, a drea entre certos limites pode ser encontrada fazendo-se o relacionamento entre as istribuigdes com quaisquer médias ¢ desvios padres com apenas uma distribuigio de DeMoivre-Laplace-Gauss, conhecida como reduzida (ou padrio), de média I e desvio padrio 0 e, cujas dreas entre dois limites so tabeladas. Essa distribuigso redurida é identficada como N(Q,1), ‘onde o primeiro pardmetro representa a média eo segundo a variancia. A sua fungi de densidade 1 fe)e pee As fteas entre ~o» e z estio na Tabela 3.9. * para me enews * Ababa Debi (1667-1759), rater anes. 14 ene Simon Laploe( 179-1827) maemo eis, ‘Ca search Ganss(1777-1859) tate ema, Seno “Principe dos Matec Carte 3 1 Probables: uma introdusdo 1 Tabela 3.9 Areas entre ~20 ¢ 2.na distribuigdo reduzida de DelMoivre-Laplace-Gauss. ool oaa___on3__aee__—aae_aes ke? SE ee ee ee ee ae ee ues ante ey goes ar ar eras cums Saat, i AS tabelas encontradas nos livros de probabilidace apresentam no os valores da fungdo densi- dade de probabilidade, mas a fungio de distribuigdo acumulada, porque, para uma variavel alea- {6ria continua interessam as probabilidades da variével aleatéria estar enire dois valores, ou seja, a drea abaixo da fungio densidade de probabilidade c limitada pelos dois valores. Entretan- to, deve-se ter euidado quando do edleulo dessas reas, tendo em vista que elas so apresents- das nas tabelas publicadas abrangendo limites diferentes, Assim sendo, fazer um grafico da area desejada & quase que obrigatério para calcular cometamente a probabilidade desejada. A leitura na Tabela 3.96 feita da seguinte maneira: na primeira coluna, os nimeros representam © inteiro e 0 décimo do valor de z: na primeira linha os nimeros representam 0 centésimo do valor de z. Desse modo, a fea limitada entre ~e e z 6 aquele valor obtido no encontro da linha, (com a parte inteira e 0 décimo de z) e a coluna (com o centésimo de 2) respectivas. Qualquer ‘outca drea é obtida pela soma ou subiragio de Areas, ou subtracio de 1 (a rea total sob a curva @ igual a 1) ov de 0,5 (aprovcitando a simetria da curva em relagdo a média).. Wm Bxercicioweremplo 3.13 Determine as seguintes probsbilidades: apreel2) Dips 129 ePreze ls) @pr(teze?) Qualquer distribuigio de DeMoivre-Laplace-Gauss com média 4 e desvio padrio ¢€ colocada 1a forma da distribuigo redurida mediante a transformagio afim: x ‘Mantém-se a propriedade de que a drea entre os limites a ¢ b da varidvel X € igual 3 frea entre os limites ze 2, da distribuigio reduzida, 0 valor z representa o miimero de desvios padres que qualquer valor X dista da média de todos cs valores X, podendo ser positive ou negativo. Se z é positivo, o valor esté a direita da médi 30 2 6 negativo, t esquerda da média. Na média, 0 valor de z & zero. Consequentemente, pode-se usar a tabela da distribuiglio reduzida para calcular a drea entre quaisquer limites de qualquer isteibuigao de DeMoivre-Laplace-Gauss, 92 , e Noo compar vatoer dex fataciest dea + como valores dar dea ene das abclsas ‘abuso dard DeMie= place Gina drene gua clon ‘oereOe lh Usando calculadoras Usando 0 Excel Figura 3.17 A funcéio PADRONIZAR no Colar Funcéo. Capitulo 3 / Probabilidades: uma introduedo © que levou a pessous a afinmazem que « distibaigdo DeMboivee-Laplace- Gauss tera a forme de "sino" foo faa de a DeMoivre-Lapltce Gass reduria lemibrar aspect Assim como, a partir dos valores de <, sio deverminadas as probabilidades, caso se fornegam os valores limitantes, a determinacio dos valores de z (que s30 a distancia de um valor para a média os valores, em mimero de desvios padres} é feita procurando-se a ire no interior da tabela € Tendo-se 0 valor de : na linha e na coluna 1 xerccio-exemplo 3.14 Determine o valor de z que coresponde& sre (probabilidale) 59% &disita dec, + Com a caleuladora HP 486 ‘A HP calla a probabilidade de x at + o para qualquer distibuigio de DeMoivr-Laplace- Gauss * asso I: elique ss tcl NTH] (primeira tesla da segunda inh fileira de tela) e (NXT: + posto 2: lique stele brane (Ay (PROB) € [NXT] de novos + posto 3: digs valor da media. tecle [ENTER + asso 4 digit a varldncla 0°, tele [ENTER] ; cio 86 tenha 0 desvio pad, dgite-o ¢ pene atecla ona ef yx CE) + passo 5: dgite valor We 5, clique a ecu brane (6] (UIP); 0 resultado aparece, + Com a catetadora Casio CEX-I8306 99506 3s eleulos so realizados no modo RUN para a disteibuigdo padronizada: * passo 1: tecle {OPTN}, [F6, [F3] (PROB) (FO); + passo 2: digite a. [F1} se deseja calcular a probabilidade de ~ (até o valor z aparece (P(; digite 0 valor de « e aperte a tecla (EXE}; b. (F2} se deseja calcular a probabilidade de 0 até 0 valor 2. aparece (Qf; digite o valor de x e aperte a tecla [EXE]: . [F9] se deseja calcular a probabilidade de 2 até +=, aparece (R(; digit o valor de x ¢ aperte a tecla {EXE}; 4d. [F] se deseja calcular o valor ds varidvel reduzida = para 0 valor, desde que essa opera ‘edo seja uma sequéncia de céleulos a partir dé uma lista de valores, aparece 1 (digite 0 Valor dere aperte a tecla [EXE], * Com a caleuladora Texas 71-63 a. para determinar a drea enire dois valores: * passo 1: tecle [2"}DISTR: escolha DISTR, aparecendo 2:normaledf (: 5 + passo 2: digite © limite inferior;( |, 0 limite superior, [.], média,[,] ¢ 0 desvio padr para determinar a ordenada na abscissa x + passa I: teele [2"[DISTRI: escolha DISTR, aparecendo J:normalpdf (2; + passo 2: digite 0 valor de x,[,],a média, (,} 0 desvio padcao. No Excel, a redugio para a distribuigao DeMoivre-Laplace-Gauss padronizada é feta pela fun- gio PADRONIZAR do Colar Funcdo, Figura 3.17, na qual, ao se digitarem os valores de x, da média e do desvio padrio, retoms-se io valor de = A fungao DIST.NORMP, Figura 3.18, fomece a érea sob a curva de DeMoivre-Laplace-Gauss desde — oe ats 7 Captulo $7 Probabtdades: ums imredusao 93 Figura 3.18 A funsgdo DISTNORMP. Figura 3.19 A fungdo DISTNORM, Figura 3.20 A fungao INVNORMP. Figura 3.21 A fuuncio INV.NORM. sere Seca pi os ea nn 2 rn tent a A fungio DISTNORM, Figura 3.19, fornece: 2 Grea sob a curva de DeMoivre-Laplace-Gauss desde ~o» até X, devendo ser digitados a ‘média ¢ 0 desvio padrio e cumulativo VERDADEIRO; ». a abscissa da curva de DeMoivre-Laplace-Gauss no ponto X, devendo ser digitados a média ‘© 0 desvio padrao ¢ cumulative FALSO. [satin Caso sejam fornecidas as areas entre ~ 0 ¢ z, a fungio INVNORMP, Figura 3.20, faz retornar 0 valor de z, |] rrr Cee J Caso sejam fornecidas as dress entre — © © X, a fungio INV.NORM, Figura 3.2 valor de X, conhecidos a média e o desvio pudrao, |. faz retornar 0 Cea cee Conhecendo a origem do modelo matemitico © estudo da chamada distribuigdo normal iniciou-se no século XVII, quando se comecou a observar que, se um objeto fosse pesado repetidamente na mesma balanga, os pesos abservados ‘no eram idémticos, havendo uma variagao entre as medidas. Se fosse feito um mGimero razcdvel de medigées, a distribuigo das observagdes apresentava um padrio regular, hoje reconhecido como sendo o da distribuigdo de DeMoivre-Laplace-Gauss: erros de observagio de caracteris- ticas diversas também seguiam o mesmo padro. De fato, a distribuigtio era inicialmente identificads como curva normal de erros. Essa curva, originada por DeMoivre em 1733, foi também estudada por Laplace e Gauss.” * Emp hitrs por ne questo dc jo, denon ae es ie, cones como noma sbi de bettonre Laplace Case 94 Capitulo 3 / Probabilidades: uma introdusdo ‘Com base nos trabalhos de Pascal,'de Fermat" e de Bemouilli,”” DeMoivre, quando se enconta- va exilado.em Londres, foi capaz de mostrar que a curva matemética que modela problemas desse tipo tem a seguinte expressa0: onde 16 2 média e cro desvio padro da populagio, Porém, Gauss chegou a essa distribuicdo a parti do estudo uma distribuigdo de probabilidade de eros de medicio, pesquisando a qual lei os erros de observago deveriam obedecer para que a ‘média aritmética de uma séric de medidas fosse 0 valor mais provavel da verdadeira grandeza. Com base nos argumentos de Gauss, mais préximos das aplicagSes, vamos deduzira expresso da fungi densidade de probabilidade de DeMoivre-Laplace-Gauss, Considere que o valor real de uma medida é a média de um grande mimero de observagoes, Ao se calcular os desvios entre cada valor e a média aritmética e somé-los, essa soma sera sempre igual 22er0, porque, conforme vimos no Capitulo 2 (p. 33), 8 soma das diferengas positivas 6 sempre igual A soma das diferengas negativas, ‘Sabemos que a probabilidade de um erro ou desvio no intervalo de x até x + dr €igual ajtoidr. Em. zm observacdes independentes, em que 0s ertos so X,,X,--» ya probabilidade do erro total é proporcional a Y= fix) fig) fin) fl). ‘Como, no século XVIII, as moltiplicagSes extensas eram normalmente feftas usando logaritmas, nada mais natural que escrever: In ¥=Inftsy) + bn fx) + Wn fix) + + In fx) Deseja-se fix); como temos considerado que o valor real de uma medida € a média de um snrande nimnero de observagoes, €razoaivel supor que a fungio desejada é aquela que toma ¥ um ‘méximo para o valor real ida medida. Em termos matematicos, isso significa que, inicialmen- te, a primeira derivada ¢ igual a zero, «din Yofdje = 0, ou seje,aplicando a regra da cadeia LO) de POD, bee PG) Fe) de Fee.) “ae Le) "a (0s valores de x, todavia, dependem de 1, desconhecido, porque, se as medidas feitas So m,, ms, . entao, 0 xy =m — Hi, ‘my Hi € assim sucessivamente, Ao se derivar em relagdo a 4, tem-se que: cafe Ley) LE), LO C4 oe Fo) Fay OP peany PED, Pea), FG) As) fos)" fey” ‘Tendo em vista que essa equagio relaciona-se com o conceito de soma de desvios em relago 3 ‘média aritmética (2 soma de ambos é igual a zero), devemos ter que LD Fay, 8° 2" proporconal ax (qualquer desvioobservado) para too Isto & + hase Pasa (1623-162), mateo rc. Pore de Format (1601-16), nto aets, | Capituto 3 / Probabilidades: umn introduce 95 f Li) Fay = onde k é uma constante de proporcionalidade. Integrando em relago a x, temos que ke! kee inft)= +eonstante= +n fay ¢? Finalmente Entio infix) —In C < in f=Cet A cconstante C pode ser determinada integrando-se fx) de—o a+ e igualando-se a | o resultado, 0 valor de & obtém-se calculando-se o valor esperado e a variancia dessa distribuicio ¢ igualan- do-se a4 ¢ a 7. O resultado é a disttibuigdo de DeMoivre-Laplace-Gauss reduzida, © Navegando ne internet Vi ao site hntp:/fwwwthinks.com/java/balldrop/normal.him € veja uma simulasao da distribui- {gio de DeMoivre-Laplace-Gauss. Voc# pode desligar-se da Internet que a simulagao continuaré: I fique observando 0 comportamento da caida das bolinhas, 1 Exercicionexemplo 3.15 ‘eritioou-se qu ocomprimeato de uma pegs pode ser model por ums dstrbuigfo de DeMoivr Laplace. Gaus com medi de 100mm des pate de 2 mi. Hl ‘a. determine 2 poporgie de peyas acima de 103.3 mm, HI by determine a proporgdo dos resultados encontewose entre 98 © 1020 mim € caleule a proporeao de pogas aio de 955 mm ! «.€ importante gue v comprimento da poya io seja muito grande quando comparsd a am ‘lor desejado: sea gerencia decide que no maximo 5% des papas devern er commpimen- ‘o acima desse valor, reeomente um limite de especifcapo, Propriedades do modelo A distribuigio de DeMoivre-Laplace-Gauss: ‘. tem come parimetros média y e desvio padrio 6, constituindo uma familia inf distribuigdes, uma para cada we para cada o; b, é simétriea em relacio a média antmética gr | de ¢ emamein stent smedsi ecrtsponde 20 maimo dng densidad de pba 4. Tuc siren se ower ua aan ii: undo maa ent, cota iiayo escape quando» nae dni dooce an ecient na Sem aaa er etre mat pln tgs, em tro da ma 5 varie oo devo fui se ou dail ee ee « fr tconent' groper oes de popuado que se enconraeate i = 0 tana maou ns Soi put) pa 66624 S85 oe ben al aoe jieagcs0,pon eno cme #3 g.ltn nine nine de ce | femal ot na tS poms ce nextons acsas + 0€ a Loramie Coss fa etd nd € oma a eg ato Dee banaue, spice Gane Se ee mt fe enone seule. gul sot Oe enon Os eseaverodoomundoévormel distribuigdes de probubilidade”? i Capitulo 3 / Probabilidades: wna imroduso Termos-chave Probabilidades Evento elementa (ou simples) Vinvel stra Modelos prohabiitieos Evento composto Disubuigdo de probabiidade ‘Ocorrénciasequiprovaveis Eventos muttamenteexeludentes Fungo densidade de Probebiliade a prion ‘Complemento de um evento probable ¢ Conceta cision de prosabilidade Freqiznciaelativa Fendmenos sleatérios Conceto frequencial de ‘probabiidade Leis dos grandes nimeros Probabildade «posteriori ‘Conceto subjetivode probabilidade Experimentoaleatério Espugo amos Resumo 1. 1. © eestudo do relacionamento dos dados por meio de modelos probabilisticas denomina-se Estatitien Matemstica. ‘As variap6es dos Fendmenos devem-se a um grande mimero de ‘eausas que no podenos controlar, is quais oestatistico denorsina, simplesmente,acaso, "Nos métodosestatisticos formulam-sehipstess, conduzem-se expe riéncias, etstamsehipskeses com base nos dios experimentais. ‘Quando consideragdes de sime tia proporcionam significado razoi- vel parn a frase dgualmente provaveis, podemos dizer que, se umn conjunto de m ocorréncias equipsovSveis inelui m maneiras cequiprovéveis nas quis uma sitmacdo particular pode ocorte, 2 pr: ‘bilidade dessa situagio€ n/n ‘A probubilidade também pode ser expressa como uma frag das ‘cocréncias favordvels pura as desfavoravels. Primeiradefinigko do conceto de probabilidade, conheeida como lei de Laplace’ resultado da divisdo entre o mimero de casos favordveis ¢ 0 miimero de casos possives, ‘Segundo conceit freqiencial ce probabilidede,probabilidade de ‘uma situaglo é a feqincia selativa em n observagdes dessa situs- ‘0, 04 sea, € 0 numero de ocarzéncias da stuagio dvidido pelo Inimero de observagées, quando este tende para infinite, A media ‘que o nimero de repeigdes aumenta, hi urna estabilizagao na fre- 0 Seo cence mvenefeecne parame sprosaoe, ets fuse densidad ge proba das por lidades pessoais para 0 mesmo acontccimento podem ser diferentes, fil) =2e™, parat2 0. porguc infra que pe etree, 6 sulle Come arte fase mao were raing sanju erssenc aja agence conpn de a1. tinadbuite de probablidade Eo conju de todas as posible ay 44, Aro desae de robbie de vail ear de reese ete sleatioc sncroblidas doen a periment aletrioe sus prbahilidades de. ocrrta place-Cabss€ dada por 52. Xfm densidad de probabildade 6 uma fang mate he. Poe oe ee re sGeju chee] 8-8 | - cnc A ta Secs ites fomace en aad To) 25 ee eee arctan oman wot gad oa eur garkmeiee a Windlass pope 1 So pt popsasto probabilidade da varvel lear estar entre aqueles limites. {A distibuigto de DeMoivre-Laplace-Gauss constitui ume fumtlia Dir-se que uma varidvel aleatériag discreta se todos 0s seus valores podem fer listdos, ou seja, pertencemauumconjunto fini ou infinite gs, infinita de distribuigdes, uma para cada e paracaba c Esme ‘ever toro da média, e a média, a mediana ea moda sto iguais€ ‘cnumerivel. ‘correspondcm ao mésima ds fungao. [A média ¢ varidncia do uma varvel aleat6ria exponencial sf Iguaisa: x 434, Dizese que uma varive aleatGri 6 continua se os seus valores nfo podem ser lists, ms poem assum wm mioero infinite de valores fro um intervatofinito ou infin. i Exercicios propostos (© Jomat do Bras de 23/1/99 publicou carta de um leitor que 1. A Folha de S. Paulo apresentou em 21/12/98 os ensios para um ‘eterminado acontecimento x serrealizado: mais prove. provs- ‘el, pouco provivel,improvével e muito improve, Estimeaspro- babilidades associadas a cada um desses terms. pedin ums visto no peocedimento dos srteios da Megassenapor- ‘gue Extou surpreso novamente com os concursos 147 da Megassena ‘6495 da Quina, ambos do dia 24 de dezembro, que premiaram cs ‘ndmeros 05,23 38, comnsnos dois concurs6s”. Comente ares- eto 98 3 4 A noticia a seguir contradic a niseas na prata do Lebton."* {A Folha de S, Paulo de 20/11/98 publicow a seguinte noticia: “A est com wma nova promocdo em suas 63 lojas. A cada RS40,00 fm compras, 0 cliente ganha wna raspadinha premiada. A em- ppresa nvestin USS500 mul.” Comente a respeito dessa novela Desereva um possivel espago amosiral paru cada um dos seguintes cexpsrimentor: A. sabesse que um grande Jote de chips RAM contém um pequeno ‘numero de chips ROM. Trés chip so escothidosaleatoriamente 2 verifiease cada um deles para idcntificar se é ura chip RAM euROM; ’. uma caixa de 10 chips contém um chip ndo-conforme ¢ nove bons. Escolhense 3 chips aleatorismente da caixa e test «, Uma instruglo SE. .ENTAO,..SENAO € executada 4 vezes Consiere um sistema de compatadoces com cince drives idéat cos, Um possivel experimento aleatéro consisteem veriticarosis- tema para ver quantos drives estéo disponiveis atualmente. Cada “rive estéem umde dois estados: ocupado(rotalado 0) ou dispont- vel (rotulado 1). Um resultado do experimento (um elemento do ‘espace amostral) pode ser representado por uma tapla de Us. Is (Um na posigZo fda tripla indica que drive fests ocupado © um Tindies que estédispontvel fa. Indique quantos elementos tem o espagoatnosta b.Listeo espago amostal,emiticando cads evento element por EE, (exemplo: EE, = (0.0.0,0,0} Liste o evento F, descrto por no minimo 4 drives esto dispo- 4. Liste o evento contrétio a E, Descreva com palaveas 0 evento contrio aE, Liste o evento E, deserite por na maximo 4 drives esta dispo- Liste 0 evento E, deserto por no minimo 4 drives esto dispo- niveis também no marine 4 drives estdo disponiveis. 1. Liste os elementos do evento E, deserito por drive T esid disponivel 5, Liste os elementos do evento E, deserito por no minimo 4 drives estdo disponiveis ou 0 drive I esid dispontvel. Se o evento F, for o drive 7 esid ocupado, indique a relagao dele como evento E, Prove os seguintes teoremas: ‘a aprobabilidade do evento imposstvel 626 a probabilidade do evento cont bilidade do evento respeito, «a probabilidade de acontecer pelo menos umn dos eventos A ou B quaisques,defindos no mesmo espage amostral 8, € igual soma ‘dus probabilidades de acorter A mais probabilidade de ocorrer $B menos aprobabilidade de A e B ocorrerem simultaneas Generalize o teoreroa da Soma para guaisquer némere de even- 4.3 € Bsho mutuamenteexcludentes, Pr(A ¢ B) = 0: ba probabilidade de ocorrerem simultanesiente dois eventos Ae B do mesmo espago amosial § ¢ igual ao produto da proba: bilidade de um dees pela prohabilidade condicional do outeo, dado {que primeiro ocorreu, oria estaiticn? “Avide fere ba uum menos » proba Em um sistema Ade, verfigue que R, br, Ron = Ro Consider ra canal binirio de comunicagiestransmitindo palavras den bits cada. A probabildade de uma transmissio coreta ép e0 digo € capaz. de corrgie até ¢ (e 2 0) ers. Por exemplo, se rrenhum céigo ou verificago de paridade ¢ usa, entaoe = 0. Se se ust o ego de Hamming para corree0 deer tinico,entio e = 1. Considerando que a transmissto de bits sucessivos ¢ indepen dente, esereva a expressio da probabilidade de uma transmissio comets de uma palavra, Capinilo 3 / Probabitidades: uma tntroducao 10. Deseja-se comparar dois esquemas diferentes para aumentar 3 ‘confabilidade de um sistema com o se de redundincia, O sistema, jcessita des componentes idénticos em série para operar e exis- temm.s eomponentes, cada qual coma mesma confiabilidade &: ‘a decida gual dos esquemas das Figuras 3.22 3.23 provéa maior confiablidde; ‘2 confiabilidade do cada componente é ; dotermine as confia- bilidades das das configuragses para m= 3e.=2,comparando ss duss expressdes pars 0 esquems A e para 0 esquema B. Figura 322 Esquema A wee peo 1H, Esboce uma fungao densidade de probabilidade roduzida de DeMoivre-Laplace-Gausse sombre a drea desejaia para obter a 020260 Lente s=-0.202=0.4 12, Em.ums populigio com média 25 ¢ desvio padrio 2, determine 0s valores de comespondentes para os Seguinies valores 220 bzs 240 4.252 255 13. Uma poputaio de DeMoivre-Laplace-Gauss tem media 40 des- vio padrio 3 Determine os valores comespanclentes cos eguintes valores des: 2.010 b.200 075 Capitulo 3 / Probabilidades: uma introdugao 14. Tendoem vita que a média ée uma distribuigho de probobilidades & lum parimetro de grande importincie, prove as segues proprie- dades ‘a, a média de uma constante¢ igual & propria constante 'b. se multiplicarmas os valores de urea varive sleatGeia por uma constant, a media fiea multiplcada por essa constante; ce amédia de uma soma ou diferenga de vaiives lestériss¢ igual soma ou diferenga das médias dessus varive se somarmos ou subrairmos uma constant aos valores de uma ‘ariel aletéra, a mdi ieaacrescida ou diminidadessa.cons- «. amédia do produto de duas varveisalestriasindependentes é ‘gual ao produto das médias dessas vaidveis, 15, Prove 2s seguintes propriedades da varineis: 8.4 verigneia de uma constante & mula; Bi. se multiplicarmos todos os valores de uma varivel aleatéia por ‘uma constant, sua vardneia flea multiplicada pelo quadrade da ‘c-a varidncia de uma soma ou diferenga de vastiveissleatrias independentes € igual a soma das variincias dess variveis «se somarmos ou subtrairmos uma constante aos valores de urna vvaidvelaleatra, sua variincia permanece inalterada 16. Demonstre que para a distibuipio binomiel a média €gusl anpe a. varidncia € igual a npg 17. Demoastre que para adstribuigdo de Poisson a média ea varincia sto iguais. 18. Demionstre que para distrbuigSo exponencial a médias varidneia sho iguais. 19. Um grupo de assinantes de um provedor¢ observado comtinvamen- {e durante 80 minutos no periodo de pico. Durante esse tempo, eles ‘izeram 30ligagbes, com um tempo total de uso de 4.200 segundos. Determine a taxa médi de chegadas, 4G 20, No Jornal do Brasil de 24 de janeiro de 1999, sparecew a seguinte noticia: Segundo as probabilidades matematicas,fazendo wma ‘aposta minima da Megassena, a chance de acertar os seis ni- ‘meros no universo de 60 (Sena) é de uma a cada 50.063.860 ‘apostas, ou seja, se no concurso howver aposias com todas as combinacdes passives, hd, segundo os fundamentos matemdi- eos, uma ocasido favordvel de te ter acertador em cada 0.063.860 pastas.” ‘a desenvolva os edleulos necessérios pata determiner © valor 50.063.860:, b.comente a respeito da expressio probabilidades matemdticas. 21, Para se resolver quaisquer problemas de cleulo da probabilidades, ‘ passor s30 of seguintes: + pasto I idemtitique o espago amostrals ‘+ asso 2: atrbua probabilidades: + pasto 3: dentiique os eventos de interesses + pasro4: calcule as probabilidades desejadas. ‘Conisidere um Iaboratério com seis microcamputadores. Suponhaque ‘cada micro tem ainesma probabilidae de estar acupado (ou disp vel) que qualquer outro, Considere os seguintes eventos: A= no minimo 2 micros mas ndo mais que 5 ocupados. B= no minimo 3 micros mas nio mais que § ocupuades C= todos os micros disponivels ou um mimero par de micros ecupades. determine qual dos eventos A, B eC 6 0 mais provével. . voce decide comprar mais micros somente sea probabilidade do ‘pelo menos um des eventos A, B ou C acorrerem for maior que 90%. Qual a sua decisio? 22. Considere oseguinte segmento de programa de computador: eB cnt 99 repita S, até 2, sento repita S, até 8, ‘Verificou-se que. em 60% das veres,B, € verdadeirae, nas restan- (es, B,€ verdadeiro. Exatamente uma dselarsed9 é comm as decia- 1a50es 5, eS. escreva (bomdia). Ap6s 200 execugdes desse sex mento de progcama, foram impressas em 24 das vezesexatamente 3 mensagens Je bom-dia, Se probabilidae de a condi gto B ser ver- ddadeirs for maior que 60%, vocé acetara esse segment de progra- ‘ma. Qual a sua deeisio? 23. Um meteoroiogista acerta 80% dos dias em que chove e 905% dos dias em gue faz bor tempo. Chove em 10% das dns. Tendo havi previsio de chuva, qual a probabilidade de chover? 24, Um método A de diagnéstico de cesta enfermidade di resultados positives para 80% dos portadores daenfermidade e para 10% dos ‘os, Um método B de diagnéstico da mesma enfermidade di pos tivo pera 70% dos portedores e para 5% dos sios. Se 15% da po pulagio sio porudores da dita enfermidade, calcul a probabilida- ee 1, de uma pessoa forecer resultado positiv pelos dos métodos: bide, entre duas pessoas enfermas, pelo menos uma fomecet r= sultad positive por algum metodo 25. A confibilidae (probabilidade de funcionar) ée um equipamenio€ ‘90, Determine a confizbiidade de um sistema Funcionar cam dois ‘componente se eles forem colocades: vem série; bem parle. 126. Dotermine 0s valores de: que correspondiem hs Seguintes probat Tides: £2.0,0505 a esquorda de = 10,0228 2 esquerda de z 60,0228 a dieeta de ¢ 4.04772 entre: 60,0240 entre ze £.0,9760 abaixo de 27. Uma companhia de aviagio chegow 3 conclusio de que 5% das pessoas que fazem reserva em um dado v60 nao comparecern 80 embarque. Conseqientement, adotou a politica de vender 70 ge Fes para um avio de 68 assentos. Qual € probahilidade de que todas ws pessoas que comparecerem encontrar lugar no v6o"? 28. Apés 28 dias de curagem, © cimento Portland comurn fem uma resistencia compressiva mia de 4.000 ps, Dados anteriores per rmitem afirmar que essa resisténcia tom uma distribuigao de DeMoivre-Laplace-Gauss com desvio padrio de 120 ps, Deter ne as seguintes probabilidades para uma resisténcia compress, de 28 dies: ‘a.menor que 3.900 psi Demenor que 3.850 psi ‘e maior que 3.850 pst Amnaioeque 3.880 psi 29, A rena média de uma grande comunidade pode ser razoavelmente ‘proximal por uma distribuigso de DeMoivre-Laplace-Gauss com dia de RSS.000 e desvio padrio de RS3.000: ‘8 que percentagem da populacio estima-se ter renda superior 8 Rg8.600? ‘bem uma amostra de 50 pessoas, quantas pode-se esperar que tenham menos de RS2.000 de renda? 130. Um fornecedor de fero alega que seu produto epresent resist cia tensdo que pode ser modslada aproximadamente pela dst 100 buigdo de DeMoivee-Laplace-Gauss com média de 50.000 psi ¢ vvarincia de 8.100 psi. Supondo verdadeira hipétese, que peteen- tagem de medidas dard resultado? Superior a 50.000 pat b. inferior a 49.550 psi -inais de 1.350 psi a contr de $0,000 psi 31. Um avaliadar de imoveis calcula que sua capacidade de estimar ‘eusos de projetostem uma distbuigo de DeMoivze Laploce-Gauss ‘em tomo do custo verdadeiro com desvio padrlo de $10,000, Em tal easo, em que percentagem das vezes sua estimativaestars den- trode 1. RS15.000 do verdadeiro custo? 1b. RS20.000 do verdadeiro custo? «©. R527.000 do verdadeiro custo? 33. Um processo industial produz eanos com difmetro medio de 4 em « desvio padrio de 0,2.em. Os canos com diimetros que variem ‘mais de 0,3 em a contar da média s4o considerados defeltwosos, ‘Com os dados anteriores permitindo afrmar que o: valores podem ‘ser modeludos pela distribuigio de DeMoivre-Laplace-Causs, de= a percentagem de eanos defeituosos: 1. aprobabilidade de encontrar duns pegasdefeituosas em seqign- ‘a probabilidade de encontrar duas pecas perfeits em seqiéncia 34, Determinado processo produz 5% deitens fo-confomnes, Se uit [mostra aleatria de Sitens for selecionada, determine a probabil dade de se encontrar em 2 tens nio-conformes 35. Un lboratério de microcomputadores tem uma biblioteca de 100, sub-rotins ea cada semana, em média, so encontrados(ecorrgi- dos) bugs em duas das sub-rotinas. Determine a probabilidale de ‘que sero encontrudos errs em no mais de 3 sub-rotinas na pr- 36. Omimero de soieitages que chegem por segundo em um servidor (em uma uixa media de 10 mensagens por sogundo. Determine 2 probabilidade de que: ‘4 nenhhuma solictagdo chegue no periodo de 1 segundo; 1b. 15.0u menos solicitagves cheguem no perfodo de | segundo, 237, Bstima-se que o mimero meio de defeitos supertcias er 20 metros ‘qualrados de pape! produzido por derermindo processoé 3, Qual 4 probabilidade de ngo se encontrar mais do que 2 defetos em 40 ‘metros quadrados de papel selecionadosaleatoriamente? 38, Verificou-se que o ndimero de bujjers em.uso em determinado sis a Solugdes dos exercicios-exemplo 3.1 Este problema foi proposto por Leonard Euler, matemético ale (1707-1783), hé mais de 200 anos. ‘4 para que sistema funcione, os urs equipamentos dover func nar simoltancamente.Aplicando a propriedade multiplicativapara ‘eventos independentes temas que’ Prtadosfuncionem) = 0,9 0,9 0.9 = 738: b. primeiro, caleula-se a confiabilidade do ramo superior: 0,9 x0,9=0,81 =81%; depois calcula-seaconfiabilidade dos tes ‘equiparsentos em paralelo,o ano superior com confisbilidade 081 ‘©0s dois ramos inferiores com confithilidade 0,9; confiabilidade ddesseconjunto¢ igual: { 1~ (1 ~0,9) x(1~0,9) «(1 ~0.81) } = (0,998); e Finalmente a confiailidade dos rs em série (oprimciro ‘cosilimo-e mais oequivalentedostésem parallo}:0,9%0,9981 20,9 = 81%, 1. Consiere evento A = {Places que satisfazem asespecificagées ‘quanto a0 comprimento}. CConsidere oevento B= (Placas que stisfazem as especiticapbes quanto largura) 32 33 2%. 40, 41 42, Capitulo 3 1 Probabildades: uma inioducao tema pode ser modelado pela cistrbuigéo de DeMoivre-Laplace- {Gauss com ima méin 100 eesvi prio 10. Determine a pro billdace de que o nimero de buffers: iio exceda 120; Desteja entre 80& 120; evexceda 130, A vida de determinado subsistema, no period de degradagio, pode ser modelada pela distibuigzo de DeMoivre-Laplace-Guuss com iia de 10.000 horas edesvio padro de 1.000 hors. Determine ‘confiailidade para um tempo de operagao de S00 horas, saber ddo-se que a idade do componente 6: 1- 9.000 horas: 3.17000 horas, A deteego de um ru na transmissd0 de um sinal pode ser mode- Jada por uma dstibuigio de DeMoivre-Laplace-Gauss com média OV edesvio padrio de 0,45V. Seo sistema interpreta que umdigito 16 transnitido quando a tensio excede 0.9V: ‘determine a prabahilidade de se detectar um sinalintexpretado ‘come 1, quando nenlhun Fo ransmitdo, Essa peobabilidade & conhecida como falso alarme: ‘determine os Fimitessimtrics em relago a0 O que incluam 99% de todas as leituras de ravdo:, «ese um digito 16 representado como um deslocamento de 1,8V a ‘médladadistribuigGo de rudo, determine aprobabilidade de esse sligito Into ser detectado, Essa probabilidade éconheeids como deteccao perdida (0 ditmetro de um doi preduzido por uns impressora pode ser mo- \delado pela dstibuigao de DeMoivre-Laplace-Gauss com um di ‘meizo médio de 0,002 polegada e desvio padrio de 0,0004 potesa- ae 4. determine a probabilidade de que o ditmetro de um dor exceda (0.0026 poteyad, by. determine a probabilidade de que um ditmetro este entre0,0014 20,0026 polegads: ‘qual a variabilidade méxima a ser conseguida (valor do desvio ‘aueo} para que a probubilidude de que um dimetraestejaen- {10 0,0014 ¢0,0026 polegeda seja 99,59? ‘Uma limpsds incandescente écomercilizada sem qualquer propa ganda quanto & sua duragdo ecusta RS 3,00. Enttetanto, arespeito ‘deuma nova limpada fuorescene firma que dura 40 vezes ais, ‘embora o seu custo seja RS60,00. Vale a pena comprar essa nova. ampad? Pela propriedade multipliativa, senda Ae B independentes, Prisalisfazer as especiticagSes de largura ede comprimento) = (095)(0.97)=92,15%. b. Pri) = 1 Pr (placas que aio satisfazem As especificagses {quanto a0 comprimento)» 1 ~0,05 » 95% PrB)=1 ~Pr(Placas que nao stistarem as especificagbes quanto Aargura) = 1-0,03 = 97% ‘A probabilidade desejada € no se ter placas que no atendem a0 Comprimento,2 larga, ou ambos. Pela propriedade atv, gual [005 +0,03 - (0,05) 0.03)]=7.854. Portamo, 7.85% das placas tero pelo menos uma caracterstca da qualidade que aio satistaz as especificasees, ©. A probuabilidade desajada & no se ter placas que nioatendem ‘0 comprimentoe argura, simultaneamente, ou Sea (0,05) (0.03) 135, Portant, menos de 1% das placas serso nfo-conformes {ato no comprimento quanto na larga. 4. 8 probebilidade de ineresse € a proporgto nao-conforme de [pegas quanto 20 comprimento e i largura, sabendo-se que se é Capitulo 3 / Probabilidades: wma introducao nifo-conforme quanto a0 comprimento, a probabilidade de ser nio-conforme quanto i largura € 60%. Pela propriedade ‘ntipicativa,€ igual 0,05) 0,60) = 3%. Portano, se os eventos ado forem independentes, 3% das placas 1 satisfazem as especificagies quanto & largura e ao compri- ‘mento, Pode-se observar que esse valor € inteiramente diferente Lbaquele obsido no item (c), onde os eventos foram considerados independentes « Sabe-se que Pra) Se ¢ B forem mutuamente excludentes, a probabil pluca ser conforme no comprimento ena largura dovera set 270 ‘Contudo, esse nfo € caso, uma ver que aprobuhildadecalenlada 92.15%, em conseqUocia, Ae Bnio slo motamenteexcludentes, F. Una vez que uma placa ndo pode ser conforme e ao-conforme ‘ao miesmo tempo. esses eventos sio mutuamente exchudentes 3.40 lucroesperado nos aeroportos & Ue: 0.4 x (RS3,42—RS1,57) 406 %(-RS1.47) = RS0,142. O lucro esperado nos congressos ¢ de: 0.7 « (R¥3.42 — RS1,37) + 0.3 x ( RSL,47) = RSO,SS4. O huero esperado no met éde: 0.2% (RS3.42 RS 157) 40,8x(-RSLAT) $0,806. Pode-se agora calcula o luero geral: 0,6 x (~ RSO142) + 0,3 (R$0,854) + 0,10 (-R$0,806) = RSO.0904, 3.5 Oniero de casos posstveis¢ 5.000.000. Ao comprararaspsinins, ‘oapostador js perle RS!.00, e nSoem 975.630 chances deretor ‘no, como aparentemente parece, porque em 450,000 veresretorna ‘io o diaheiro, mas outra raspudinha. Desse modo, o valor espera ‘do do ganho de uma pessoa é0 seguince [5 (+ R$15.000) + 1,300 « (+ RS1S0) + 1.500 x (+ R100) + {9,000 x (+R$20) + 65.000 > (+ RSID) + 160.000 » (+ RBA) = 350.000 x (+ RS2) + 450.000 x (RS0} + (5.000.000 ~ 975.630) x 'RS1,00)}/5.000.000 = (R52. 380.000 — RS4.024,370}5.000.000 } RS0,328874 ~ —RSO39. Em resumo, ha uma perda esperada {de RS0,39 ao se jogar nessa raspadinka, 3.6 Como as oppves sho 5, a probabilidade de sucesso € 0.2; assim sendo, nin 20) = C2 (02)"11 03)" 37 Ec, ozs 38 Pura que obtenta uma nota superior ou igual a 6, 0 aluno deve acertar 30 ou mais questoes, Desse modo, probabilidade deseja- da resulta do somatério de x= 30 até x= 50. Entretanco, 0 EXCEL retoma apenas o somatério de x= 0 até um determinado valor, Entdo,océleulo da probabilidade de um aluno obter nota igual ou superior «6 € feito da seguinte maneira a.calcula-se a probabilidade de o aluno acertar ats 29 questées, ‘Tendo em vista que a soma de todas as probabilidades gual a subtrai-se de 9 resultado apresentado pelo Excel, Senda assim, tem-se: DISTRBINOM (29:50;0,2; VERDADEIRO) = 0,999990999. Por esse resultado, a chance de o alo obter nots ‘nia igual 26, marcando 3s respostasuleaoriamente,¢ igual 8 ‘.onconn00: 'b,no caso de 4 opgBes, tems: DISTRBINOM (29;50:0,25:VER- DADEIRO) = 0,999999836, Por esse resultado, & chance de 0 lune obter nota nia igual a 6, marcando as respastas alton ‘mente. & gual a0,000000164, 2 qual, embara 168 eves ade Sopgées, é também praticamente zero, 3.9, Neste problema, A vale Sek, 3.Dai que es » Pe 3.102. A distribuigdo de probablidade éseguinte: o jr je [sje js |e |r {as rts) | 0,002 0,015} 0,045) 0,089) 0,134) 0.161] 0,160|0,138 0.108 i} x |e Mais que 15 Pray | 0,064 0.081 0,023 0,011 0,008 0,001 0,004 0,000 i. Nese exemplo, una unidade de tempo & 40 minutos, Portanto,)¢ determinado caiculando-se o ndmero médio de ehamadas em 40) ‘minutos, ou seja, X= 6, A probabiidade desejada & 3.11 a. uma ver que vida mésia ou meiavid de ura teri de 1 semana, a taka de fale €% = semana Se tempo de vida de ume bateria € repvesentado por X. desu ros encontrar PAX >2)= 1 PAX 2a1-[l-e Tel =I sem 135% 1. 3 das representam 3/7 da semana; entdo Pr(X 5 3/7) pale aaa ere I-f-e™ 20" ©. P93 SX <4) = RG) PG) = [I~ 0497 -0,0183 = 3.14%; Pr >3)_ 1 Prix s2) e. PAXSBIXS1)= ee a135%, Prax>) 1 PAX ED 3.12 Como A = 12,3333, tem-se:) 729%; b) 284%) 63 d) 539%:6) 285. 3.13.4 Pr(2-< 1,28) 6 obtida disetamente da tabela pelo encontro da linha 1,2 coma coluna 003; o resultado é 89,065 1% ~ 89%, ’b.Pr(2>1,23)equivale grea obtda subiaindo-se da Ses total 1 0 valde de Pr(z< 1.23}; entd0 1 ~89,06519 = 10.9349% ~ 11%, ©. probabilidade até z= 1,56 gual a0,9331927 e até: 6 igusl .0,8413447. Entio a drea pedide, por subtragio, € O09184R = 1885 ~ 95%, 4. probabilidade até 2=2 6 igual a0,977250: até 2 =~ 1¢ igual read diteitade 2= + 1 que, por sua vez, igual aT menos a drea Aesquerda de z= 1 Entdo o resultado 6 0,1586553, A dea dese jada, por subtragio, ¢ 0.977250 ~ 0,1586553 = 0,8185947 1.859475. ~ 82% 3.14 Esta drea no ¢ lida diretamente; 0 valor de z procurado é aquele para o qual atabela apresenta de ~~ até ele igual a 0.0505 = 10,3495, Desse modo, o valor de := + 1,65, aproximadamente 3.15a,Considere X 0 comprimento da peg os valores dos pardmetros ‘pura a distribuigao de DeMoivre-Laplace-Gauss st0 = 100¢ a2. ‘O valor da distibaigso de DeMoivre-Laplace-Gaussredurida cor- respondente a 103,3 mm é A= _ 1083-100 [No Excel, usa-se a fungo PADRONIZAR Portamio, Pr(X103,3) = Pr(Z >1,65). No Excel, na fonsio DIST.NORMP, com z= 1,65, PAX 1,65)=0.9505, que tab 495, ‘A probabilidade desejada Pr(X>103,3) £4,955 ~5. No Excel, océlculo podera ter sido feito diretamente com a fun- 40 DIST.NORM, colocando VERDADEIRO no Cumulativ, 102 b. Quer-sedeterminar Pr98,.5 SX < 102.0).Os valores da disti- buigio de DeMoivre-Laplace-Gaussreduzida sto caleulados como: 1020-100 44 Do Excel, om-se Pr(Z 1,00) =0,8413 ¢ PZ 0,78) =0,2266, A peobabildade desejada éigual a0,8413—0,2266 = 0.6147. Portato 61.47% ~ 60% dos resuliados sie esperados ene 98,5€ 102.0 mm. «. Procura-se por PAX < 96:3) equivalente a Pr(X $96.5), uma ‘vezque a probabilidade dea varivelaleatoria continua ser igual 4 lum valor espectfico € zero, O valor de X na distribuigao de DeMoivre-Laplace-Gauss reduzida€ yy Fontes de noticias ¢ citagies I.José Roberto Tore, Fotha de $. Paulo, 19/1/1998, 2 ose Ronen Torr, Fol de 8. Pando, 19/1/1998, 43 Marcos Augusto Goagalves,O Globo, 20/12/1998 4 Vue 1838, 5 de agstoce 1998, 53 Fotha de Poul, 12/1258 S Mauro Venus Jornal do Brae, 13131999, 7 Sarna do Bra 211121998, 8 Jarnatd Bri, 21121998 9 Winn 1338, Sele agosto de 1998, 10. Lis Feesando Vesti, casero “Domingo”, Jomal do Brasil, 211988 Jomaldo Bros, 2221998, 12 Fothade 8: Pouo, "Flt" 26/12199% 15. Marcos Augusto Gongaves, O Globe, 20/12/1998, 4. Chanvando o li Caputo 3 / Probabilidades: wma invrodugao 955-100 2 (Com o Excel, dtermina-se Px(2-$— 1:75) =0,0401. Portant, apeo- ximadamente 4% das pegas selecionadas apresentarao um com- primento menor que 96.5 mm, de espeeificagio de A, quctse Atal que PriX = A) =008. Portant, PAX A) = | -0,05 =0,95. 0 priximo passe 6 procarar por uma area de 0,95 eobtero valor de Z, ou 823, Z = 1,685.0 passo final édeterminar limite A: 1.615= Portanto, 0 limite de especificagSo A estabelecide para ating & estipulagdo desejada deve ser de 103,29 mm. = X,= 103,29 mm z 1140 teorema de Bayes tem 0 nome do seu criador, o clérigo inglés © matematico Thomas Bayes (1702-1761). 0. primeieo 4 usar Inducvamenteu probabilidade e estbelecer base matmstce par 4 Inferencin probabilistca 15, Gouves V. Ha "Prosbiidaes” 16 Wien” 588" de gosto de 1998 17 Revista rn E15/011999, 1 Arapud evista Ponte Ado, a2 141, 199, 19, PothadeS. Paulo, 101111956 21 0 Gobo, 211999. 22 Somat do Bra, 25/1/1999 23 Goreme da Are de Lteriase Produtos Commplemertaes da Caixa Econ ‘aFeders,a"Opinita do Lsiar,Jonoldo Brat, 311/199, Inferéncia e | decisées estatisticas H Entendendo estimacéo de pardmetros, 105 Visdo geral das mais comuns estimativas por intervalo e a primeira delas, 110 Um novo modelo probabilistico: a distribui¢do t de Student, 111 iq Retornando ao intervalo de conflanca da média quando nao se conhece a variancia da populacéo, 113 Construindo intervalo de confianca para diferenca de médias de i populacées, 114 Mais um modelo probabilistico: a distribui¢do F, 114 4 O que é a distribuigdo F?, 114 Ainda construindo intervalos de confianca para a diferenca de médias, 117 Determinando intervalo de confianca para proporcées, 118 Determinando o intervalo de confianca para diferenca de proporcées, 118 { Intervalo de confianca para a varidncia, 118 i Uma outra distribuigéo de probabilidade: a quiquadrado, 119 Compreendendo os testes de hipsteses, 121 f . Determinando alguns testes de hipéteses, 124 i Significancias estatistica e prética, 125 Analisando varidncias e descobrindo outros usos, 125 Regressdo linear e correlacdo, 130 _ Termos-chave, 141 | Resumo, 141 : | Exercicios propostos, 142 Solugdes dos exercicios-exemplo, 144 104 ” Ay a C nine apie cxavelorramencr ‘en era. deseoaecie amos cleat detemanhon Varied Xp XX Xensnnan una eatin de omanto nse a0, emes.eb seca temarmesmt Alsi deprobabidades ca u __ Tia eatin ma med movi alae pat des heerogierna imi Achar qu ape etinadenes enudadoron cutee Esai ss sufciones pare rover orpreiemas bata Capraulo 4 / nferéncia e decisies estatstcas Ove da Extmistica € a tomada de decisio em situagdes de incerteza,€ por esse AGF motivo of metodos de interna estan podem se aiicados sob os concttos eri dn Yeora da decir’ As concluses &respeito de umn popula sao ba, seads em informadeslimitadas a partir de una anact, Na maioria dos problemas de inferéncia estaistica, € praticamente impossivel, ou ndo 6 prati- co, observar a populagiio completa como, por exemplo, na realizacio de testes destrutivos, Mais ainda, como alguns (ou talvez muitos) dos problemas estnitarais ainda ndo existem no ‘momento da tomada de decisio, em um sentido amplo pode-se entender a populagio com sendo apenas um conceito, / Para que as inferéncias sejam validas, a amosira deve ser representativa da populagao, Todavia, fregiientemente selecionam-se as observagdes que sejam mais convenientes como amosti mas esse procedimento introduz uma tendenciosidade’ e o resultado que se deseja inferir para 1 populagio pode ser subestimado ou superestimado. Mesmo com a justficativa de o tomador de decisdes ter experiéncia prévia, o comportamento de um julzamento subjetivo no pode ser escrito estatisticamente Para evitar essas dificuldades, é desejével selecionar uma amostra aleat6ria como resultado de ‘algum mecanismo de acaso, Em consequéncia, a selecio de uma amostra & um experimento aleatério, cada observacio na emostra € 0 valor observudo de uma varidvel aleatéria ¢ as obscr- vvag6es da populago determinam a distribuigdo de probabilidade da variével alcatéria. / “Os alunos de uma classe de Segundo Grau de wma escola de Washington mereceram a bola de ‘rst de prémio na nona competicdo promovida pelo oral The Washington Post Eles Jiceram aio de csaepreviram gu os repubicanos nao ganbariam caderas na Carsara ‘nas elegdes da semana passada’Foi um vesame para as ordculos polices. Rarssimos tessa classe de analists perosticos«baralhentos, que tamara coma de midis americona, previram corretamente 05 resultado das elelgaes. Ele rvaram feo porque eleigdo pode se lama cated surpresae também por lerem pene de pave cabega de aves! ‘Os dois prineipais procedimentos da estaustica inferencial sBo a estimagdo (pont e por in- tervalosy os testes de hipdteses? Comumente, os pardmetros de uma populaglo so Jeseo- nbhecidos, sendo necessirio estimar o valor destes parimetros ou enlio planejer testes para ‘erficar se valores a eles arbitrados podem ser considerados verdadiros. Por exemplo, se se estiver pesquisando a duragHo de um componente, ¢comprovando-se que 0 tempo de vida pode ser considerado como sendo distibutdo segundo a distribuigio de DeMotvre- LLaplace-Gauss, pode-se esperar que cada uma das abservagées da vida do componente em ma mostra aleatrta de n componentes, X,,Xy Xo. os X seja uma vativel aleatoria independents com a mesma distibuigto de probabilidades, ‘Ao se retirar uma amostra para se estimar ura parimetro da populagdo, inimeros céleulos po- dem ser feitos com os valores associados as Observagdes da amosts. Por exemplo, para se estimar a média artmétca de uma populaglo a parr de uma amosia, com os valores numéei- 0s das earacterisicas dos elementos da amos pode-s, a partir dles,ealeular a média ai mética, escolher © maior valor, eseolher 0 menor valor, calcula a varéneia ou calelar a soma do primmeiro valor com © segundo valor clevado a0 quadado, 0 terceiro clevado #0 cubo, © assim sucessivamente. Além disso, escolhida uma das operagdes matemdtiess, cada um dos resultados ird variar de amostra para amostra, Desse modo, cada um dos edlculosé tambem una varivel aleatria,e essa varivel aleatGria denomina-se estaistlca, /” Pode-se observar,intitivamente, que, para se estimar a média aritmética da populacio, a esta- ica variéncia da amostra seria pior que caleulae a inédia asiumétien da amosiry, Sendo assim, estuda-se, para eada parimetro de interesse, 0 melhor estimador desse parametro., "As pecquisas so infaliyeis? Nao, mesmo porque u sontade doeleitor 6, mutts eee, wolvel A pesquisa influ” E evident que sim. Is0 € ruim? Mao necessariamente,. Por que 08 Dartides por exemple, nao aaliam antecipadamente ot crittrins ea metadologia adetados Delos diferentes instinios¢exercem umacompantamentoteenico ders rab, como, bem ‘ou mal lt antoriza?”* Capitulo 4 /Inferéncla e decisses estatisticas 105 intendendo estimagao de parametros ceimainapoaal Urn ramo dh estaiticainferencal trata da etimativa de partimetros desconhecidos da popula: wi ve ra de dados de uma amos. As estimativas podem dividi-se em esimativas pontais Teinporonasnssmylsto® — etmativas por imeralos tent etimativa pant, alr muro simples € obs como ums etinatv do arimeo cstatuicateprevenadapor) — 8 populagio. “Desemprego i a 95%. Esimaiva & para a América Lata, om 198, fe pla OT ae Scere Boke Na estimativa por intervalo, & determinado um intervalo tal que exista alguma probabilidade de que o verdadeiro valor do parametzo esteja contido ncle. Estimativas por intervalos so também chamadas de intervalos de confianca. Estimativas pontuais Uma estimativa pontual consiste em um valor numérico (inico usado para fazer uma inferéncia cre aaretangug desconhosio Ua popolagio. Por exemplo, para etmac & media de wna saeugae pags selesionar ama amosta do 100 elementos e calcul a métia amostl: se Popul for 27, uma esimaiva pontal da média da poplagdo€ 27, ara) une Negri de Lina tmpese na peeled cms Dist dea despahon com i tata sale Senor pr. temeamente 2 Fa heme Negro sarnaecom op desert ee eset mats eta ogi ane Com a ea i gr esehina ana ease pestisas™ santero tine ener Bin geral, se X € uma varigvel aleatéria, com distribuigao de probabilidade f(x) caracterizada i sngrseluccomaneanss-cnee por am parametro desconbecido @, © Xj. Xo» Nyx» Xy € wa amostrasleatria de tamanto 1» caenemctcapoas es.aniogeds eno wma fungao das Varidveis aleat6rias da amostra 6 a estatistica Oh Oy Xa, Ku oe Xe Teapoadmicsequeorvetres denominada estimador pontual de 8. Observe-se que 6 € uma varidvel alear6ria, porque € wna Tnwsrmassasasvoloescis fyngaa de variéveis aleat6rias. ApGs uma amostra ter sido retirada, cada um dos X, assume o rimerosdsppuia8e. valor x.¢ @ resulta em um valor numérico, chamado estimativa pontual de 8 Apes de sera ou parintos thopnlnin ae desconecdes, emprese aban cme sad ete er metorespblenas Basicamente, a estimagao pontual refere-se a escolher uma estaristica, um nimero Gnico eal- ‘eulado a partir dos dados amnostrais(¢talvez outra informacio) para o gual se tem alguma garan- fa de que € razoavelmente perto do parimetro que se deseja estimar. Todavia, € dificil explicar li fo que vem a ser razoavelmente perto:primeito, 0 valor do pardmetso ¢ desconhecigo e, SegUN~ i dio valor da estarstica € desconhecido uté que & amostra tenha sido retirada, Desse modo, li | pode se perauntar se, apés repetidas amostragens, a distibuigio de probabidudes da estatisti- a tem determinadas propriedades que se assemelham 2 proximidade. Hé diversas eseothas que podem ser feitas para um estimador pontual de um pardmetro & pata ecidir qual delas € a melhor, tilizam-se propriedades da Estatistica © desenvolvem-se crite: | ris para comparar estimadores, k Para estimar o comprimento médio dos elementos de uma populagde, por exemplo,utiliza-se © {stinador do compemento médio da amostra, Igualmente a varidncia de uma amostra € um estima Gorda varianets da populacio. E impostante apreader 0 comportamento desses estimacores por watig de repetidas amostragens e conclu a respeito dos pardmetros correspondentes. Como © Comporamento de um estimador varia a cada amostragem, esse comportamento € represcnta- i uaruieboamoseat do como urna distribuigdo amostral desse estimador, sendo expresso por uma distibuigso de L ee _probabilidade Fecioucande rattle’ por exemplo, a distibuigio de probabilidade de X chamada de distribuigdo amosra) da We Courant do x dist amosrat de uma estatisticn depende da dstribuigdo dx populogo, do tama vrai iho da amostra e do metodo de selegfo da armostra, Distribuicdo amostral da média aritmética: parte 1 ‘A média amostral é um dos estimadores mais utilizados porque as médias aritméticas das popu- Jngdes sao as estimadas com mais freqiéncia, sendo necessério, desse modo, conheeet a dis- tribuigéo amostral da média da amostra. Em uma populagio com média ye desvio padrao 6, s¢ todas as amostras aleatrias de tamanho nado selecronadas com reposigao a pani dessa populagao, esta é considerada como sendo de Tamanho infinito, Todos os valores & serem retirados 0 serio da mesma populagao (ou seit, terdo 1 mesma distribuigao original de probabilidades) e as médias aritméticas de todas as mostras constituirdo uma distribuigio de probabilidades com as seguintes caracteristicas + adistribuigdo amostral da média da amostra sera aproximadamente a de DeMoivre-Laplace- Gauss; + media da distibuigdo amostral da média da amostra (!) ser igual a mia da populaglo 106 | Tabela 4.1 Distribuigao de probabitidades de uma opulagdo com os elementos 2, 3. 4 Figura 4.1 Grifico da distribuigdo da populagao da Tabela 4.1. Tabeta 4.2 Médias amostrais de todas ‘as amostras de tamanho 2. Tabela 4.3 Distribuigéo de probabilidades da média amostral. Figura 4.2 Grafico da distribuigdo da média amostral da populagao da Tabela 4.1. Capito 4 /Inferencia ¢ decisoes estausticas Para comprovar, de maneira natural, que a média da distribui¢do amostral da média da amostra ser gual médtia da populaeéo , fagamos um estudo de uma populagio constituids dos mime: 10s 2, 34, A distribuigdo de probabilidades da populagio é a da Tabela 4.1, A média aritmét (valor esperado) dessa populacio € 3 Valor Probabiiade 2 3 1B 4 3 © grafico da distribuigto de probabilidades da Tabela 4.1 6 0 da Figura 4.1 7 3 Retiremos agora todas as amostras possiveis do tamanho n = 2, com reposigdo, e ealeulemos a média de cada amostra, resultando na Tabela 4.2, ‘Amora Média aronstrat| seeeeReR” Esse resultado experim a distribuigdo de probabilidades da média amostral (Tabela 4.3 e Figura 4.2); essa distribuigdo de probabilidades também tem uma média e uma varifincia, Média amostral Probable 2 w 25 29 2 » 35 29 a! i Total 1 Ao se calcular a média dessas médias amostrais, encontra-se 3, que é a média da populagao. Capitulo 4 /Inforéncia ¢ decisdes estatsticas 107 ‘esto no tndenson ce ms armen 0d popaagsoxe.c rmente team daa eaigioamel gual ae teorema central ate mete Fe Ny Ny coi ume eta uma poplin ‘faa com mee arnt fae’ ere X sama wns ‘na dubuto mesial de (ure mtende par inf proxmaseda dso de ean Laplce-Gaus commit edesiopadras oY Figura 4.3 Distribuigao de probabili dades da média amostral. hreesalt! Comaderar ur aobseragtes de ‘alae problema segue “dembucao nom Propriedades dos estimadores A distribuigao amostral de_X tem a mesma média que a populagiio de onde foi retirada, Desse modo, pode-se esperar que as médias de repetidas amostras de uma dada populacio estario entradas na média dessa popslagio ¢ nfo em outro valor qualquer. Entio, uma estatistica¢ denominads no-tendenciosa se, 0 seu valor esperado€ igual ao pardme- tro que supostamente se ests estimanco. E convengio denotar 0 estimador por um acento eircunflexo (*) sobre © pardmetro correspon: dente. O estimador da media da populagio #1 é fle este estimador é a média amostal, xO estimador da variancia da populagao a é 6? que, comumente, é a varidncia da amosta, De modo geral, esta propriedade da ndo-tendenciosidade & uma das mais desejadas proprieda- des na estimagao pontal, embora nfo seja de modo algum essencial ¢ algumas vezes soja supe- rada por outros fatores. Umnafalha do crtério da ndo-tendenciosidade & que geralmente ele nfo fomece uina estatistica tvica para um dado problema de estimagao. Porexemplo, para amostras de tamanbo 2, a média “1 "2 (ax +b (a+b) rédtia da populagdo. Isto sugere que se deva ter um evtério adicional para decidir qual dos estimadores ndo-tendenciosos € methor para se estimar determinado pardmetro/ Tal critériotorna-se evidente quando se compara distrbuigdes amostras da media e da mediana para amostras aleatrias de tamanhos n rtiradas da mesma populagao de DeMoivie-Laplace- Gauss. Embora essas duas populages possam ter a mesma média, por exemplo, ¢ embora se- jam ambas simétricas e com mesma disuibuigio, as swas varidneias sdo diferentes. esse modo, diz-se que uma estatistica 6, € uma estimativa nio-tendenciosa do pardmetro 6 cficiente do que a estatistica issim como a média ponderad, 2 onde a ¢ b sio constantes positivas, sio ambos estimadores nao-tendenciosos da + tanto 6, quanto 6, sao estimativas ndo-tendenciosas de 6; + a variineia da distribuigdo amostal de 6, 6 menor que a Varineia da distribuigdo amostal de 8.) Distribuigdo amostral da média aritmética: parte 2, e 0 Teorema Central do Limite ‘Ao se determinar a varidncia dessa populago, encontra-se 2/3. Com a mesma populasio constimuida dos nimeros 2, 3 ¢ 4, ao se caleular a média das médias amostrais, encontra-se 3, que & a média da populacio. ‘Ao calcular, agora, a varincia da média amostral, encont ‘$20 dividida pelo tamanho da amostra Os estimadores pontuais ¥¢.¢° silo estimadores no-tendenciosos e de variinc parimettos 11 € 6, respectivamente. Desse modo comprova-se, por meio de um exemplo simples, o chamado feorema central do limite. Observe-se a Figura 4.3, a qual ilustra que, mesmo a populagdo tendo uma distribuigho ‘qualquer, nfo necessariamente a de DeMoivre-Laplace-Gauss, a distribuigao de probabilidades ‘da média amostral ja se ussemelha & de uma distribuicao de DeMoivre-Laplace-Gauss— 36 13 /que a varia da popula- Pelos fatos de a média aritmética, na pritica, ser 0 pardmetro mais procurado da populagio ¢ de a distribuigao da média amosteal tender para 2 distribui¢Zo de DeMoivre-Laplace-Gauss, a maio~ ria das pessoas acha que todas as situagbes devam ser modeladas pela distribuigdo de DeMoivre- 108 hewsalt! Cerrar tinted teorema de otecenta: Estimativas por intervalo hexesial Acero informosa0 fom son verdaeia Capitulo 4 Inferéncta devisies estaisticas Laplace-Gauss, © que no € verdade, Somente a distribuigao da média amostral tende para a distribuigdo de DeMoivre-1 aplace-Gauss; outros estimadores, tal como a yaritncia amostrl, fo origem a outras distribuigbes. Aidk que valor do parmetra = valor da amostra. / do intervalo de confianca & um refinamento da estimativa pontual. Nesta, afirmava-se ‘Todavia, dificilmente o valor da amostra seré igual a0 valor da populagiio, mais ainda porque teste € desconhecido-Desse modo, considera-se uma variagio em torno do valor amostral , assim, pode-se eserever que 0 pardmetro se situa entre dais limites, ou seja ~~ valor do pardmetro confianca. "0 acer leva em conta a margem de err, ue pode ser de dor outs pontos percentuais — ‘lependendo do local ¢ da amosirapesguicada stimativa pontual = erro de amostragem, gerando um intervalo de © ero de amosiragem ¢ diretamente proporcional 2 dispersio da populagao (quanto mais dis- ppersa a populagao, maior sersa variagdo entre as amostras), diretamente proporcional & confianga dos resultados (se queremos um intervalo de confianga que contenha 0 valor do parimetzo, esse intervalo deve ser tanto maior quanto mais se aumenta a certeza de que ele conterd o valor «do partimetro); entretanto,é inversamente proporcional ao tamanno da amastra (quanto maior a amostra, mais esta se aproxima da populagio e a estimativa fica mais precisa, com menor erro ‘de amostragem).. (© médulo da diferenca entre © limite superior (ou inferior) do valor amostral ¢ 0 estimador & ‘uma importante medida da qualidade da informacdo que se abtém da amostra, Essa metade do intervalo € chamada de preciso do estimador. Quanto maior o intervalo de confianga, mais cconfiante se esta de que 0 intervalo realmente conteri 0 valor do parimetro, Por outro lado, {quanto maior o intervalo, menos informacio se obtém para esse mesmo parmetro. A sitwagdo desejavel é obter um intervalo relativamente pequcno com uma confianga elevada, Por exemplo, um intervalo de 99% de confianga é maior do que um de 95%, porque para se tet ‘maior confianca implica em ui intervalo com maior amplitude, Geralmente, para um tamanbo fixo de amostra e para a mesma varidncia, quanto maior o nivel de confianga, maior o intervalo e confianca. Novica na rev —Aora a previsto do tempo para amanha. A temperatura vai estar ence 10 gras ubuiso de 2270640 praus acme, Conentdra do Garfield: — ise cara nunca err ‘Como a extensio do intervalo de confianga mede a preciso da estimagao, vé-se que a preciso € inversamente proporcional ao nivel de confianga. Como vimos, deseja-se obter um intervalo de confianga pequeno o bastante para a tomada de decisio e que tenha também uma confianga adequada, 0 que pode ser feito escolhendo-se um tamanho n de amostra grande o bastante para se ter um intervalo de confianga de determinado eomprimento com uma confianga estabelecida, Observe o relacionamento geral entre o tamanho da amostra, a desejada extensfo do incervalo de confianga, 2 confianga ea dispersie: + quando a extensio do intervalo de confianga diminui, o tamanho necessévio da amosira aumenta para valores fixos da dispersao ¢ da confianga: + quando a dispersdo aumenta, 0 tamanho m da amostrastimenta para limites fixes do inter- valo de confiangu e da confianga especificada: *+ quando o nivel de confianga aumenta, o tamanho n da amostra auntenta para valores Fixos do intervalo de confianga e da dispersio, Toda afirmagdo deve vir acompanhada de wm grau de confianca, ou grau de certeza; ov seit, quanto se esté certo 20 comunicar aquela informasao. © nivel ou grau de confianga € denotado por 100 (1 ~ 0%, onde c denomina-se nivel de significancia. “Otverveosseuintes expos "lanes vaca brant Lae maui aco, tabi bleu mara qin” Quem equal stdout m8? {ea gs ya prs depen fon ir tedr inne eto pore eno Fem 3 Capitulo 4 / njeréncia& decisdes eststcas 109 Figura 4.4 0 conceito de interval de confianca. Desse modo, a estimativa por intervalos consiste em encontrar um intervalo definido por dois pontos extremos /-e 5, tal que a probabilidade de que o parimetso @ esteja contido nesse inter- Valo seja igual 2 um determinado valor, denotado por (1 ~ @). Isto é PRIS OSS) Se um grande nimero de intervalos de conflanga for construido a partir de amostras indepen dentes da mesma populagio, entSo espera-se que 100 (1 ~ c2% desses intervalos contenhim © valor verdadeiro do parimetto @ desejado. Intervalos de confianga podem também ser unilaterais. Um intervalo do tipo 1 < @, tal que Pr £8) ~ | ~0-€ um intervalo de confianga unilateral inferior de 100 (1 ~ 0)% para 0. De maneira idéntiea, um intervalo do tipo @ 5, tal que Pr(@ < $) = 1 ~ a€ um intervalo de confianga unilateral Superior de 100 (1 ~ 0)% para 0. Por exemplo, ao desejar um intervalo de confianga de 90% para estimar « média de uma popu- Tagdo, uma pessoa pode retirar uma amostra que dé um intervalo entre 48,5 ¢ 51,5, na qual 48,5 & S = 51,5. Por outro lado, uma segunda pessoa pode calcular o intervalo entre 47,9 ¢ 52.9, aparentemente gerando uma ddvida Sobre qual dos intervalos contém o valor do parametto ‘da populugio que se deseja estimar. Ocorte gue, se 100 desses intervalos forem construfdos partirde 100 amostras, deve-se esperar que 90 desses intervalos contenham o valor do parimetro a populagzo, embora nfo se saiba em qual intcrvalo de todos ele se enconta. “Margem de err. E 0 limite téenico da pesquisa, Significa que o resulrado obtdo por um Tevemtamento vai estar denira de un inervalo, para mais ou para menos, determina pela Imargem de crv Ela varia de acordo como mimero de eirevistas reaizadas.”” A situagio que se for estudar definird o tipo de intervalo de confianga a ser selecionado. Por ‘exemplo, em termos de carga méxima suportada por um elevador, 0 euidado € apenas com 0 valor méximo, néo importando o valor minimo da carga, Por outro lado, ao se estimar 0 Tucro de uma empresa, a preocupagio é com o faluramento minimo € nao com o maximo. Indepen- dentemente da situago a ser analisada, a estrutura dos intetvalos de confianga ¢ sempre a mes- ‘Valor do pardmetro = estimativa pontual # uma fungao di confianga e dispersio (direta- ‘mente proporcionais) e do tamanho da smostra (inversamente proporcional)}. (© conecita de intervalo de confianea é mais bem expresso pela Figura 4.4. “Intervalo de confianca. A margem de ervo fica deniro de um intervalo de conftanca. Se 0 Inicrvalo de conftang de uma pesquisa € 95%, tera significa que. a cagla 100 entrevistas {fetas peta mesma metodologa, 95 aprecentaro os mesmo resatados."* Observe que algumas estimativas intervalates ineluem e outras nao incluem 0 verdadciro valor do parametro da populacdio. Quando se retira una amostra e se calcula um inervalo de confian- ‘ga, nao se sabe, na verdade, se o parimetro da populagao se encontrs naqucle intervalo calcula- Uo, O importante é reconhecer que se est utilizando um método com 100 (1 ~ a)% de proba- bilidade de sucesso: em uma sequéncis muito grande de repetigtes, 100 (1 ~ 0)% dos intervalos assim construidos abrangerio o verdadeiro valor do pardmetto da populagio, embora no se saiba exatamente quanto ele vale. 110 Cophuta 4 / nferéncia e decisies estattticas Visio geral das mais comuns estimativas por intervalo e a primeira delas Os problemas existentes, na priica, resumem-se, na maforia dos casos, 8 necessidade de esti- + amédia p de uma populagio: + a diferenga nas médias de duas populagdes, 1, ~ 14 + a proporcio p de elementos de ume populacdo que pertence a uma classe de interesse: * a diferenes na proporedo de duas populagdes, p, ~ pi + a varidncia ode uma populacio. As estimativas pontuais mais utilizadas io as seguintes: + paral, aestimativa é = * , a média amostral; + pa f= Hy & estimativa € fl,~ A, = x, —,, a diferenga entre as médias amostrs do duas amostras aleatGrias independentes; + parap, aestimativa é p= onde x60 nimero de elementos de uma amostra de tamanho ‘n que pertence 2 classe de interesse: + para p, ~ py a estimativa 6 f,=P,=P,—P, . u diferenga entre as proporgdes amostrais calculadas a partic de duas amostras aleatérias independentes; + para 0%, a estimativa € 6? =s*, a varidncia amostral Intervalos de confianga Pura estimar a média j1 de uma caracteristica de um elemento da populago, é necessirio, pri- paraamédia —meiro, saber se a varigncia da populagao é conhecida ou nao. Admitindo conhecera variéncia ‘Surge, de imediato, uma duvida. Se se vai estimar a média ds populagio, pardimetro desconheci- do, como afirmar que a varidncia € conhecida, se para o seu céleulo € necessério saber qual a média da populagdo, justamente 0 que se quer estimar? Embora raramente lidemos com popu- Tages, ha situagdes nas quais se pode considerar uma variabilidade constante (por exemplo, ‘uma trepidacto — variabilidade constante que move um objeto de lugar ~ mudang apenas na média da posigio do objeto) Usando férmulas Para estimar a média ude uma caracteristica de um elemento da populagio quando se considera ‘que a varidncia dessa populagio é conhecid, seleciona-se uma amostra aleat6ria de tamanho e calcula-se a média amostral ¥. Do weorema central do limite sabe-se que a distribuicio amostral do estimador pontual x é aproximadamente a distribuigio de DeMoivre-Laplace- Gauss, com média 1e varidncia o"/n. ‘Tendo em vista que a distribuigo da média amostral tende para a distribuigto de DeMoivre- Laplace-Gauss, e considerando-se a variancia conhecida, o intervalo de confianga deve abran- ‘ger uma Srea de (1 ~ 0)% entre seus limites inferior e superior na distribuigao de DeMoivre- Laplace-Gauss; eada limite 6 expresso em unidades de desvio padrio e essa unidace €representud OT Zyq. OU Seja, 0 valor de z,., € a abscissa da distribuio de DeMoivre-Laplace-Gaus redui dda, tal que a dea da extremidade & esquerda de ~r,,, Vale a2 ¢ a érea a dircita de 24, Vale @/2, fazendo com que a area ence 0s limites de confianca seja 100 (1 — a)%. As abseissas z sto ‘encontradas a partir das tabelas da distribuigao de DeMoivre-Laplace-Gauss. Eatio © intervalo de confianga bilateral de 100 (1 ~ @)% para 41 € dado por Observe que essa expresso atende a: ‘valor do parametro = estimativa pontual « uma fungao da confianca e dispersto (diretamen te proporcionais) e do tamanho da amosira (inversamente proporcional), Usando * Com a calewladora Texas T1-83 ealculadoras + passo 1: tecle [STAT] (TESTS): escolha [7 J, aparecendo 7:Zinterval ( + passo 2: digite 0 desvio padrdo,{,],a média amostral, [jo tamanho da amosta,[,1€0 Capinulo 4 / Inerincia e decixses estatticas Wd Usando 0 Excel Figura 4.5 A fungéo INT CONFIANCA no Colar fund. Um novo modelo probabil Entendendo onde empregar No Exeel, 0 cfleulo do intervalo de confianga é feito pela fungdo INTCONFIANCA do Colar fangéo, Figura 4.5. Ao se digitarem 0s valores de @, do desvio padrio ¢ do tamanho da amostea ‘0 Excel, retorna 0 valor do erro de amostragem, ou Seja, quanto se deve somar e subtrair da médis amostral para se determinar os Ii [Een toma Cease M Ecerccio-exemplo 4.1 Histricamente,sabe-se que odesvio pede da dferenes de potencil de wma fonte de alimentago de 10 voi, Ein uma inspecdo pura verfcar a qualidade do produto fram realizada 50 ved ‘es, aleatoriamente,eamédia desas medigoes foi de 118 vos Estime a tensdo média de oss Fores de alimentagto fabecedas de modo que ae estjacometo en 954 dos cas. E 0 que ocorre quando nfo se pode eonsiderar que a varincia seja conhecid? x-xX ain Nesse caso, ndo se pode utilizar 0 fato de que tico: a distribuigao t de Student ‘Quando a varigneia da populacao ¢ desconhecida, ndo se pode utilizar a distriduigso de DeMoivre- Laplace-Gauss para calcularo intervalo de confianea, Todavia, érazodvel supor que anova abseissa seja caleulada como X= Tevando-se agora em conta o desvio padre amostral, Como so- Wn ‘mente uma estimativa s do desvio padrio da populagio esta disponivel, essa abscissa procurada baaseia-se no nimero de graus de liberdade, dependente do tamanko da amostra, bem como na confianca desejada. Desde que s esta sujeito a alguma incerteza, os limites de confianca para 2 média da populagio estardo mais afastadlos do que quando © desvie padrio 6 conhecido. Para tanto usa-se a abscissa de valor 1, cujos valores estio na Tabela 4.4 (pagina seguinte). Essa distribuigdo foi deduzida pelo matemstico ingles W. Gosset, 0 qual, impedido de publicar 0 seu trabalho com seu préprio nome, escolhen 0 pseuddnimo Student, nome pelo qual essa distri bbuigio € hoje conhecida- Para um valor elevado dos graus de liberdade — 50, por exemplo —, incerteza et rativamente pequena, e #6 praticamente igual a z, mas quando © nimero de graus de liberdade toma-se menor, # torna-se progressivamente maior que z. E importante enfatizar que, emibora no se necessite conhecer © valor do desvio padriio da populagao. requer-se a suposicao de que a populagdo de valores tenha wma distribuicdo de DeMoivre-Laplace-Gauss. Por esse ‘motivo, a forma da distribuigao 1 aproxima-se da distribuigao de DeMoivre-Laplace-Gauss re- valor) = 0,05 = Pr(z?> valor). Entretanto, z/> valor equivale a terse |z, I> Yvalor » ‘ou seja, Pr ("> valor) = 0,05 = Pr (I 2, 1> Valor ) = Pr (-z, < valor ) ou Pr (2,> Jvalor 120 Usando calculadoras Usando 0 Excel Figura 48 Distribuigdo INVQUI. Figura 4.9 Funcdo DIST.QUI. result! Aeron usu esinayio ete cadres normal andoumpnce drei nomisine drake Sade Capitulo 4 / Inferéncta e decistes estartticas Como a distribuigio de DeMoivre-Laplace-Gauss (premissa pars a determinagio da distribui- ‘¢do quiguadrado) & simétrica, pode-se escrever Pr (~z, < Yvalor ) = Pr (2,> valor ). Entio Pr {eo Vealor ) = 0.025. Mas 0 valor de cn distibwigio eduzida que imita essa reas 1.96 Endo, 196 dvalor -Dafque valor= 1,96" = 3,8416, valor tabelado da distribuigto quiquadrado para essa drea e 1 grau de liberdade. Caso desejdssemos determinar a abscissa da distribuigao quiquadrado que limita uma dea de 10% para uma amostra de tamanho 2 (ou seja, 1 grau de liberdade), Pr (X°> valor) =0,1 = Pr(z}> valor). Entretanto, 23> valor equivale a terse |z,1> Vvalor » ou seja, Pr (X'> valor) = O.l = Pr (12, 1> Valor ) = Pr (-z,< valor ) ou Pr (2,> Valor Como a distribuigio de DeMoivre-Laplace-Gauss (base para a detecminagio da distribu ‘quiguadrado) 6 simétrica, pode-se escrever Pr (2, < dvalor ) = Pr (2,> Vvalor ). Entio Pr (2, > (valor ) = 0.05. Mas o valor de z na distribuigdo reduzida que limita essas éreas € + 1,645. Eatio, 1,645 = Jvalor . Dai que valor 2,706, valor tabelado da distribuigao quiquadrado para essa frea e I grau de lil (© mesmo raciocinio se aplicaria a outras éreas e outros graus de liberdade; todavia, as tabelas ‘io geradas a partir da fungao densidude de probabilidades, obtida conforme técnica mostrada no Capitulo 3, p. 75. [A distribuigo quiquadrado apresenta apenas abscissas positivas, € assimetrica & direita ¢ de- pendente do niimero de graus de liberdade. * Com a caleuladora HP 486 AHP calcula a probabilidade de x ulé + e para qualquer distribuiga0 quiquadrado: + passo 1: eliqhe as teclas [MTH) (primeira tecla da segunda fileita de teclas) © [NXT + jpasso 2: clique a tecla branca [4] (PROB) e (NXT] de nov’ + passo 3: digite 0 valor dos graus de liberdade, tecle [ENTER]: + passo 4: digite o valor de x, e clique a tecla branca [A] (UTPC); 0 resultado aparece, © Com a caleuladora Texas TI-82 Para determinar a rea entre dois valores: * passe I: tecle (2"I[DISTRI, escolha DISTR, aparecendo 7: 1" edf (% * jpasso 2: digite 0 limite inferior, {,}, 0 limite superior, (0 mimero de graus de liberda- de e dé (ENTER} © Excel calcula 05 valores da abscissa da distribuiga0 2° correspondente A érea ceda extremi- dade & direita (ow 3 esquerda) para os graus de liberdade gl i © Excel também ealcula os valores da area abaixo da distribuigio X° correspondente até © valor x para os graus de liberdade gl. Captulo 4 / Inferéncia e decisdes esatisticas 121 Compreendendo os testes de hipéteses Figura 4.10 Representacdo da regiao de ndo-rejeigdo no teste bilateral. hewsah! hmarderieisrae Tondiaeat pe henesilt! arr aren ioe “Sroseom acrbaode tore llc Figura 4.11 Representacdo da regido de nao-rejeigao no wste unilateral superior. Figura 4.12 Representacao da regiao de ndo-rejeicdo no teste unilateral inferior © objetivo dos testes de hipéteses € verificar se so verdadeiras as afirmagdes sobre 0s parimetros de uma populagio. Por exemplo, ao afirmarmos que a amostra de um produto tem como média de uma medida 0 valor 70, consideramos 70 como sendo a média da populaczo de onde foi retirada a amostra. Determinar se tal informacio é verdadeira constitui um exemplo de teste de hipéteses. Os testes de hipsteses sio realizados com base na informagio das amostras, e estatistica usada é chamada estatistiea de teste. ‘Missa vinha Helém e eccalava 0 seu methor time de todos os tempes. Nao guardei todo 0 plantel, mas sus escalacdo comezava com Mantiga, Dedao ¢ Sacadura. Nos nes oli Inos,respettvomes Belém, que havia si até advogado do Preses, Ma um goeire com O nome de Manteiga podia ver confidvel? Belém desdenhava do nosso estupor. dca "Voces nunca viram jogar esse me, como podem dizer que no 0 melhor? Abaixavamos ‘eabeca Belém nha rato.” Em qualquer teste, existem duas hipsteses: a hipétese nula H, e a hipétese alternativa Hy. A hipétese nula representa o status quo, on ses, a circunsténcia que esta sendo testada, ¢ 0 obje- tivo dos testes de hipéteses € sempre tentar rejeitar a hipstese nula. A hipstese alternativa representa o que se deseja provar ou estabelecer, sendo formulada para contradizer a hipstese nul, Usualmente, as hipSteses sto formuladas do seguinte mado: H,; parimetro da popolagao = valor numérico Hi; parimetro da populaglo valor numérico Esse é um exemplo de reste bilateral, em que a hipétese alternativa é estipulada para detectar afastamentos, en ambos os sentidos, de um parimetro, a partir de um valor especificado, Graficamente, representa-se uma regio de ndo-rejeigao de 100 (1 ~ a) % de confianga para os (estes bilaterais conforme a Figura 4.10. wn an , ee ee Deve-se lembrar que 0 objetivo do teste de hipéteses & sempre tentar rejeitar a hipétese nula ‘com base em uma amosira, Se nio se conseguiu rejeitar a hipdtese nula em determinado teste, € porque aqucla amostra no forneceu elementos suficientes para se conseguir a rejeigio. Caso haja interesse em se determinar apenas se o pardmetro excede determinado valor, as hip6- teses sao formuladas como: Hi, : parimetro da populagao = valor numérico H,: parmetro da populagio > valor numérico Esse é um exemplo de reste unilateral superior, em que a hipotese alternativa indica afasta- ‘mentos do parimetro em relagiio a um valor no sentido da direita (Figura 4.11). De modo semelhante, no teste unilateral inferior (Figura 4.12), 0 objetivo é verificar se 0 pardmetro € menor que determinado valor, cas hipéteses sao formuladas como: H,; parimetro da populagio = valor numérico H,: parimetro da populagio < valor numérico 122 Capitulo 4 Inferencia e decisdes estatstcas ilustrar a regio de nfo-re porque os conceitos de regides de nao-rejeigio © rejeigio independem da distribuigao estat fica que modela o problema. Nos testes de hipéteses, a hipétese nula € considerada verdadeira, a menos que se prove © ‘Contrério, Se existe uma evidencia contradit6ria estatisticamente significativa para a hipétese nnula, ela seré rejeftada; caso contrério, no seré rejeitada. Definir 0 que ver a ser estatisticamente significativo depende da decisio a ser tomada em relagio ao erro que se admite cometer. Considere, por exemplo, 0 seguinte teste Hy = 70 He pe ‘com 0 desvio padiio da populago, o, considerado conhecido e igual a 2. Desejase testa se media igual a 70. Ao se retirar uma amosta de tamanho 36, a média amostra calcula € 65. ‘A diferenga entre 0s valores 65 e 70 & estaisticamente significante? De acordo com o teorema cental do Tinte, para amostras consideradas grandes (dependendo de diversos autores de livros de estatistica, maior que 30, 50, ou mesmo 120 unidades), a dis- tiibuigo de T € modelada, aproximadamente, pela distibuigio de DeMoivre-Laplace-Gauss. {K questio importante para o teste formulado & a seguinte: a média amostral 65 é, em termos ‘Catutfsticos, stgnificativamente menor que o valor 70, admitide como sendo 0 pardmetro da populagio? Para responder a essa pergunta, 6 preciso determinar um ponto de corte (ou limite) abaixo do ‘gual a hipétese nula sera rejitada, sto &, quio minima deve ser a média amostral para que 3 onclua que a média da populagio € menor que 707 Sendo assim, usando-se a média amostra como uma estalistica de teste existiré um valor er fico meee caso, no lado esquetdo —, tal que, se a média amostralestver absixo dele, a hhipotese nula serd tejetada, Esse valor define a regido de rejeigio da hipétese nula. Se o valor [mostral nfo se encontra na regio de rejei¢d0, nio ha evidenciasignificativa para concluir que a media da populace € menor que 70 e, portanto, a hipStese ule ndo serd rejeitada. Porém, dual € a localizagao precisa do ‘alot eritico selecionado e, conseqientemente, da regio de eeigao? Quao pequeno & o valor da média de amostrapara ser eonsiderado significativamente menor que 707 Determina-se a resposta pela escotha do chamado nivel de significncia do teste. A regito de ‘rola € tal que, sea hipotese nla € verdudeira, a probabiidade de a hipétese testada encon- Trarcte nessa fegido € pequena (comumente, de 1 @ 5%); esta probabilidade, denominada nivel Ge significdncia do teste, € denotada por d. Portanto, a escotha de o: 6 primordial pars se tstabelecer a regito de rejeigio. No exemplo, para a= 5% obtéi-se um valor crftco de 1,645 na tabela da distribuigdo de DeMoivre-Laplace-Gauss. Como 0, =o! vn. 1333, entdio 1,645 x 0,333 = 0,548 abaixo de 70 marcari o limite inferior de corte. A regito de tejeisfo é, pois, X < 69.452. ‘Como a média da amostra 6 65, decide-se rejeitar a hipétese mula. corre que se fixou 6 valor de ae se caleulou 0 ponto de corte, regrainflexivel. Modernamente Canse um valor normelizado do pardmetro como esttistica do teste, dependendo de 0 desvio padrio da populagio ser ou no conbecido, No caso da média amostral, se 0 desvio padrlo da populagao € considerado conhecido, 0 valor normalizado da média amostral dado por: Se o desvio padrlo da populago ¢ desconhesido,o valor padtronizado da média amostral € dado por: Es] 9 ‘Assim sendo, a regio de rejeigdo no é especificamente delimitada. Supde-Se que a hipdtese jhula é verdadeira ¢ calcula-se a probabilidade de se retirar aquela determinada amostra. Se probabilidade for muito baixa e 2 amostra foi selecionada, entdo a hipdtese ula deve ser falsa, ‘ou soja, deve ser rejeitada Capttute 4 /Inferéncia ¢ decisdes esatiticas 123 Identificando erros nos testes de hipsteses Essa probabilidade & conhecida como valor p, associado a essa estatistica de teste. Esse valor p, também conhecido como o nivel de significincia observado, é ent3o comparado a c, 0 nfvel {de significncia escolhido. Se o valor p & menor que a, a hipétese nula € rejeitada, |Hé dois tipos de erros nos testes de hipéteses: tipo 1 ¢ tipo I O erro de tipo I ocorre quando se rejeita uma hipétese nula sendo & hip6tese mula verdadeira. A probabilidade de um erro de tipo Té indicada por a, 0 nivel de significdncia do teste, ou sej @ = Pr (erro de tipo I) = Pr (rejeitar H, quando H,€ verdadeira). erro de tipo Il ocorre quando a hipétese nula nfo € rejeitada apesar de ser falsa, A probabili- dade de um erro de tipo Tl € simbolizada por B. Portanto, = Pr (erro de tipo TT) = Pr (nko rejeitar H, quando H, € fala). Para calcular a probabilidade de um erro de tipo TI necessita-se de informagio adicional sobre o pardmetro da populagSo (ou, pelo menos, de uma afirmativa sobre ele). Os valores de «e fi sto relacionados entre si de tal sorte que, se todos os demais pardmetros permanecerem constantes, o erro B diminuiré com o aumento do erro a, e vice-versa. A ideia do teste de hipSteses 6 julgar se o resultado amostral é muito raro de ocorrer, ne e380 de o estado da natureza descrito pela hipétese nula ser verdadeira, Para um teste bilateral, se a rmédia amostal € “muito pequena” ou "muito grande” a hipétese nula seré rejeitada, Hid, porém, um pequena chance de que a hipStese nula sejarejetada mesmo sendo verdadeira, ‘A probabilidade desse tipo de erro acontecer (chamado erro de tipo 1 € cujo valor, estabele- Cido previamente pelo tomador de decisio, determina a regra de decisdo para um teste de hip6- teses porque define as rogides de rejeigio e de nio-rejeico. Em um test bilateral, « dividido entre as duas extremidades, inferior e superior, com a regio de nio-rejeigio ocorrendo entre os valores criticas de X que delineiam « regio de rejeicio. Uma vez calculada, a estatstica amostral pode ser comparada com um valor ertico para deter- sminar a rejeigao ou nao da hipétese mula. 0 valor p é0 nivel mais alto para c para 0 qual ainda no se reeitaré uma hipotese nula para um ‘dado conjunto de dados. O valor p & calculado tipicamente pelos pacotes estatisticos para rela- tar resultados de testes de hipSteses, 0s quais podem facilmente ser analisados pelos tomadores de decisdo, independentemente do nivel de significdncia que os livros elassicos sugiram. “As estatsticas comprovam aguilo que todo cavica jd sabi: a fama de pove avesso ao taba: ho ¢ injusta. Ox moradores do Rio, em geral,trabatham tanto quanto os de Sto Paulo. Mesma com as extatstias fornecendo provas muméricas, 4 dif! esguecer 0 imagindrio popular quando esses mesmos nimeros morram que, das sts capitatspesqusadas [Rio de Janeiro. Sito Paulo. Port Alegre. Belo Hortzonte, Recife e Salvador), Salvador, a capital “da Bahia, €rcidade que tem maior jornada de trabalho: a jornada media do soteropoitano to primeira semestre de 1998 fl de 40,7 horas por semana 0 que torna injustice 9 Jama de preguizoxo que acompanta o balano Passos para a realizagio de um teste de hip6teses s passos para se realizar um teste de hipéteses sto os seguintes: + passo I: determine a populasio e © parimetro de interesse: + passo 2; estabelega a hipdtese aula (em portugués e em termos estatiticos); + passo 3; estabelega a hipStese alternativa (de forma natural e em termos estatisticos); + asso 4: escolha 6 tamanho m da amostra; + passo 5: determine a técnica estatistica apropriada € 0 correspondente teste estaistico; + asso 6: estabelega (8) valor(es) eritico(s) que divide(m) as regibes de rejcigao © de nio-rejeig0;, + passo 7: colete 08 dados e calcule 0 valor amostral do teste estatfstico adequado; + passo 8: determine se o valor do teste estatistico est na regido de rejeigao ou de niio- rejeigdos + passo 9: decida estatisticamente se rejeita ou ndo rejcita a hipétese nua: + passo 10; expresse a decisio estatistica em termos do problema, 1 Exercicioesemple 49 ‘Um fomnecedorapresenta uma cana, ¢afirma que peso mio desta 6 368 g. De experitacias anteriores, sabe-se ue o desvio pa da populagaa vale 15 ge que os valores se comportam Segundo a distibiggo de DeMoive-Laploce Gauss, Para verficar sew aliemaséo é verdadeia, Yerfica-se uma amosira de 25 cabs, pesesee caculase 0 peso méio da amosr, achando 3725 g Qual a conensto a respeito ds Afmagbo do fomecedor? 24 Testando hipéteses a respeito da diferenca entre duas médias Usando o Excel Figura 4.13 Teste T: duas amostras presumindo varidncias equivalentes. Usando o Excel Figura 4.14 Teste T: duas amostras presumindo varidneias diferentes. Capitulo 4 / Inferinciae decisbes estatiticas Determinando alguns testes de hipsteses Comumente deseja-se estudar os efeitos de trutamentos experimentais ou difetengas de trata- rmentos entre dois grupos. As duas grandes categorias nas quais esses testes podem ser agrupa- ddos so as seguintes: * independentes, quando os dados sdo coletados de tal maneira que as observages no so relacionadas umas as outras; + dependentes (comumente chamadas de pareadas), quando, ou uma caracteristica 6 medida das vezes em condigies diferentes, ou pares de elementos so escolhidos de tal sorte que sejaim semelhantes um a0 outro, Em qualquer desses casos, os dados so resumidos pelas médias amostrais, us quais podem ser comparadas por meio de um teste # ou pelo teste 2 Teste t para duas amostras independentes Este teste utiliza uma variincia ponderada, desde que as varidncias das populacdes sejam cor deradas iguais, Teste quando as varidncias ndo sao conhecidas ¢ supastamente iguais * passo 1: vi a Ferramentas, Andlise de Dados... © escolha Teste T: duas amostras prest= ‘mindo varigneias equivalentes: * passo 2: quando surgit a tela (Figura 4.13), preencha da seguinte mancira = no intervalo da varidvel 1, coloque as células com os dados da primcira amostrs; no intervalo da varidvel 2, coloque as eélulas com os dados da segunda amostta + na hipdtese da ciferenca da média, usualmente se admite que essa diferenga cnt as médias da populugio € 0; + Alfa, 0 nivel de significéncia desejado, usualmence igual a 0,05 ou 0,01, mas qualquer valor entre 0 e 1 pade ser escothido. Se nada & colocado, usi-se o valor 0.05; = Opcdes de saida, escotha onde colocar os resultados. * passo 3: ap6s 0 preenchimento, clique em OK ¢ observe 6 resultado, Teste quando as variincias ndo sao conhecitas © supostamente diferentes * passo 1: vi u Ferramentas, Andlise de Dados... ¢ escolha Teste T: duas amostras presi ‘mindo varianeias diferentes; * passo 2: quando surgir a tela (Figura 4.14), preencha da seguinte maneira +0 intervato da varidvel 1, cotogue as e€lulas com os dados da primeira amostras, = Mo intervalo da varidvel 2, coloque as células com os dados da segunda amostras + na hipdtese da diferenca da média, usualmente se admite que essa diferenga entre as ‘médias da populagao € 0; ~ Alfa, o nével de significéncia descjado, ustalmente igual a 0.05 ou 0,01, mas qualquer valor entre 0e 1 pode ser escolhido. Se nada é eolocado, usa-se o valor 0,05: + Opgdes de saida, escolha onde colocar os resultados: * passo 3: apés o preenchimento, clique OK e observe o sesultade, Capitulo 4 7 Inferéncia € decisdes Usando 0 Excel Figura 4.15 Teste T: duas amostras em par para médias. 125 Teste t para duas amostras em: pores + passo 1: via Ferramentas, Andlise de Dados... ¢ escolha Teste T; duas amostras em pat para médias; + passo 2: quando surgit a tela equivalente & da Figura 4.15, preencha da seguinte mancira no intervalo da varidvel 1, cologue as eSiulas com os dados da primeira amostra: = no intervalo da variavel 2. coloque as células com os dados da segunda amostra; na hipétese da diferenca da média, usualmente se admite que essa diferenga entre as médias da populagao € 0; = Alfa, 0 nivel de significineia desejado, ususimente igual a 0,05 o 0,01, mas qualquer valor entre 0 € 1 pode ser escolhido. Se nada € colocado, usa-se 0 valor 0,05; = Opstes de satda, escolha onde colecar os resultados; + passo 3: ap6s 0 preenchimento, clique em OK e observe o resultado, O teste ¢ € feito de forma semethante Significancias estatistica e pratica cmimers restates decdenos ‘art de adel metodo hrnesalt! onaroone mar sen inne eho tape Analisando varidncias ¢ 0s resultados dos testes de hipSteses colocados em termos do valor p so muito dtc 1am mais informagdo do que apenas uma afirmago “rejeitar a hipdtese mula” ou" tar a hipdtese mula” Entretanto, mesmo para um valor p pequeno, pode ser dificil interpreté-to do ponto de vista pritico quando se esti tomando decisbes, porque, enquanto um valor p pequeno indica uma ‘ignifiedncia estatistica no sentido de que a hipstese nula deve ser rejeitada em favor da hipéte- se altemativa, 0 afastamento real da hipétese nula que foi observado pode ser de pouca (ou henhiuma) significdincia pratica (engenheiros poderiam chamé-la “significincia de engenharia") Isso 6 mais verdadeiro quanto maior o tamanho da amostra Em um problema de engenharia, por exemplo, a diferengs entre 50 cm e 50,5 em nao é grande suficiente para ser considerada. Ou seja, conctuir que o valor é 50 cm, quando, na verdade, ele 6 50,5 cm € um erro inexpressivo e nao tem significincia prética. Para amostras razoavelmente grandes, com base no valor 50, um verdadeiro valor de 50,5 far com que a média amostral esteja perto dele, ea hipétese nula seté rojeitada, Desse modo, deve-se ter cuidado so interpre- tar resultados de um teste de hipdteses quando o tamanho da amostra € grande. porque pequenas diferengas do valor da hip6tese nula serio provavelmente notadas, mesmo quando sio de pouca ou nenhiuma signifieancia pratica. descobrindo outros usos (0s modelos probabilisticas jé vistos existem em um mundo tedrico. Se todas as amostras pos- siveis fostem setiradas de uma populagio, a distribuigdo de probabilidades resultante seria 0 ‘modelo probabilistico te6rica da populacdo. Nesse caso, os modelos da populagéo so carac- terizados por parimetcos, e os dois parametros mais conhecidos so a média e 0 desvio padrio. Convém reafirmar que uma das maiores utilidades da Estatistica € ajudar a formular conclusdes ‘com base na informago de uma amostra retirada de uma populagao. "0 tuft das pesquises também alterow o esquema de campanha da recleg do." As estatistcas amostrais so usadas como estimadores dos parimetros correspondentes 10 todelo da populagio. Por exemplo, » média amostal eo desvio padrio amostal so usados ‘Como estmativas da méia da papniagso do dessio padeio da popolagio, respectivament. essa mangira, 4 dstribuigio amostal é uma dstribuigéo de probabilidadcs de uma estatstica meniral E um modcle de distribuigdo de valores, assim como a distbuig2o da popatacto xceto pelo fato de que cles nio sdo'0sorigintis, mas estatisticas. Imagine 0 Seuinte exper fento: "Como seria’ mundo se uma pessoa fomasse,repeidamente, todas as cmostras de Tamanho n da popuagao e calculasse sama estaistica partielar a cada vez?” A ditibuigao ‘esultante dessa esatistica €a chamada dstnbuigao amostal 126 Estimandoa varidncia @7 da populagio de duas maneiras Tabela 4.8 Observagdes do tempo de vida de trés equipamentas. Capitulo 4 / Inferencia ¢ decisces estaittcas Por exemplo, a distribuigdo amostral da média é uma distribuigio de probabilidades, sendo deserita pelos parimetros Hy e Oz, Esses pardmetros sio relacionados com 0s partimetros da populagio, com base no teorema central do limite, o qual afirma que a média da distribuigto amostral da média (41; )6 igual A média da populagio (11) e que 0 desvio padrio da média amostral (oz) € igual ao desvio padrao da populagdo («'), dividido pelo tamanho n da amostra. Ou seja, conforme visto, Bo que pode resultar quando se estuda a varidncia? [As maneiras para se estimar a variancia o da populagie so as seguintes: ‘a, método DENTRO b. método ENTRE ‘Considere as observagoes do tempo de vida de trés equipamentos, conforme a Tabela 4.8. Equipamento | Observacies Média amostral Variincia smesiral BO 47-33-49.5046 o 2 55.5458.61-52 56 _| a 545051519 31 Método DENTRO Desde que cada uma das varincias smostais pode serconsderada uma esimativa independent do ‘parametro o, a média dessas 6 uma maneira de representar cada estimativa separada de 0? por um Nalordnico. A estatistca resultnte 6 denominada soma média de quadrados DENTRO, SMQ, {em ingits, mean squares within, MSq). € chamado método DENTRO porque calcul a est tnativa da variineia combinando varias obtidas denro de cada amostr ara a Tabela 4.8, a SMQ, € igual a 7,83, j4 que 75412543 SMQ, 1,83: . 3 Método ENTRE © parimetro «7 pode também ser estimado ealculando-se a varia das médias das diferentes amosias, Tsso € possivel com base no do tzorema central do limite; sabe-se que 73 onde 2 é estimada pela varncia amostal esse modo, a varincia da populagio pode ser encontrada pela moltilicagio do tamanho ds nostra pela variincia da média amos. Esse valor € chamado soma media de quadrados ENTRE, SMQ, (ein ingles. mean squares between, MS). E chamado méiodo ENTRE porque calcula a estinativa da variinciscombinando as varidnctas ENTRE as amostas ‘Com os valores da Tabela 4.8, a média das médias amostrais € igual a y-s2ssonst 2 e gp ns #16652) 4151-501" 3 (© mesmo resultado, sf, pode ser obtide da seguinte mancira Capitulo 4 / Infertncia € decisdes esatsticas 127 Retornando & distribuigio F onde as médias amostrais sio calculadas conforme jé vimos. Como SMQ, = n x 55 enti: SMQ, = 5 x 13 = 65. |Até este ponto, estabeleceram-se dois métodos diferentes para se estimar a varidncia da popu Jagd, calculando-se SMO, e SMQ,. estimativas independentes. As duas somas médias de qua ‘Gnides, caleuladss a partir do mesmo conjunto de valores, resvltarao em diferentes estimativas. Por exemplo, no caso dos valores da Tabels 4.8, SMQ, = 7,83 © SMQ, = 65. Todavia, se esti- ‘mam o mestio parimetro, teoricamente deveriam ser iguais. Dividindo-se SMQ, por SMQ,, calculu-se uma nova estatistice, chamada razdo F, ou se}, SMQe SMQ, Para os valores da Tubela 4.8, 65 7a ‘A tazio F pode ser pensadda como uma medida que indica qui diferentes sio as médias amostrais com relagio 2 variabilidade dentro de cada amostra. Quanto maior esse valor, maior a probabi- Tidade de as diferengas entre as médias amostrais serem causadas por motivo diferente do aca- s0, motivo denominado efeitos reais. Se a diferenga entte as médias amostrais € devida somente ao acaso, isto é, se mio ha efeitos reais, entio 6 valor esperado da razao F ¢ 1. Isto € verdade porque tanto 0 numerador quanto denominador da razio F so estimativas do mesmo parametro 6 da populagio, embora, ra mente, esta razdo venha a set exatamente igual a 1, porque o numerador ¢ o denominador so estimativas, em ver. de valores exatos e conhecids. Na Andlise da Varifincia (conhecida como ANOVA)’, a razio F é a estatistica usada para se testar a hipétese de que os efeitos sio reais, ou seja, as amostras provéem de populagdes dife- rentes, cujas médias sdo significativamemte diferentes umas das outras. Essa afirmagio pode ser comprovada pelas propriedades da média e da varigacia, Dado um Conjunto de valores com média. X, , se Somarmos uma constante a todos os valores originais, hhova média sera igual & anterior acrescida dessa constante, mas a varincia nio se alterat ‘Desse modo, quando se estima a variancia pelo método ENTRE, na verdade estio sendo consi- deradas as varlincias de todos 0s valores, independentemente de onde foram observadas. Se tlas pertencem 4 mesma popalagao (tém médias igusis), a varidncia calculada de outra manc everia sera mesma, Se ndo for, € porque ao menos uma média do grupo, no caso a média de um determinado equipamento, € diferente. “Placebo, Medicamento sem efit, wow ou pare enganar quem arenas pensa que est doente ar oalasva vam do vere agralat em lati, presionivelmente 0 usavum par dar prazer & hipscondriocos ou cm expericicias médias. Dé-se 0 remo que se quer testa para kun placebo para outro, depots medem-se 0s resultados nos dois grupos. Nos este. Pincebe sudo para ins lenis respeitveis, re bem gue iste na. console quem a tomow Pensa em ae cura No caso brasiteie dos remédios fasficados, como anticoncepeional de farinhe, comerciazarem o placebo.” Se 0 experimento fosse repetido um niimero infinito de vezes, ¢ a cada ver fosse caeulada a ranio Fre nfo houvesse efeitos reais, a distribuicio de probabitidades resultante poderia ser Seserita pela distribuigto tedrica F (caracterizada pelos dois parimetros, graus de liberdade do hnumerador e do denominador). Esses parmetros sJo, pura o numerador, ¢ = 1 (onde ¢ 0 fimero de grupos — no exemplo, nimero de equipamentos). e para o denominador, (1 — Dy nde n é0 ndimeto de observages em cada grupo. No exemplo com os dados da Tabela 4.8, 03 lids equipamentos, cada um com cinco observagées, constituem um experimento, ¢ a razio F tem 3] =? graus de liberdade no numerador ¢ o(n— 1) = 3(5 ~ 1) = 25 graus de liberdade no Fundo Moretti Intemactonal (EM)." Emibora taisrelagdes possam assumir uma grande diversidade de formas, este capitulo se limi- tard as equagdes lineares, As equagdes lineates (cujos grificos sfo linhas retas) so importan- {es porque servem para aproximar muitas relagdes du vida real, e so relativamente faceis de lidar e de interpreter. Outras formas da andlise de repressio, tals como a regressio méltipla (mais de duas varidveis) e a regressio curvilinea (ndo-linear), envolvem extensées dos mesmos. conceitos usados na regressio Tinear simples, mas no serio abordadas. A equagao da linha reta Duas importantes caracteristicas da equacdo linear sa0: + a inclinagio da reta (o coeficiente angular) e + a ordenada da reta (valor de y) em determinado ponto (quando x Uma equagdo linear tem a forma yeas br, onde a ¢ b sio valores que se determinam com base nos dados amostrais; « 6 ordenada da reta em x= 0, ¢ bo cocficiente angular. Dados dois pontos (x, y,) € (ty, 93), € igual a (Y,~ y, YF (y-m). Considere a equigiio linear y = 5 + 3x, iustrada na Figura 4.19. A reta intercepta o cixo dos ys (quando x = 0) no ponto em que y = 5. O coeficiente angular da reta € 3, o que significa que a cada unidade de varing20 de x co‘respondem 3 unidades de variagao de y. Pode-se usar a equagtio para determinar valores de y correspondentes a valores de x, como se vena Tabela 4.11 132 Tabela 4.11 Relacionamento linear das ‘caracteristicas x e y de um elemento de uma amosira. Tabela 4.12 Desempenho em uma disciplina e renda familiar de nove alunos. Figura 4.20 Diagrama de dispersdo referente a desempenko « renda familiar Capitulo 4 /Inferencia e decisies estatisticas Valor dex {A téenica de colocar valores de na equasio mateméticac resolver em relagao ay € preferivel, {leitura de valores no gréfico, porate proporciona um grav de precisio muito mais elevado HMto obstante, os praficossio importantes porque eviam tma imagem do relacionamento e, na fase nical di andlise, podem ajuda a decidir se uma telco linear € adequada importante ter em mente que netn todas as stuages so bem aproximadas por uma equagl0 Tinear. Por isso, em geral € necessrio desenvolver um trabalho peliminar para determina 5© lum modelo linear adequado. O processo mais simples consiste em fazer o grfico da disper- So dos valores ever se uma relagao linear 0 pass inci Determinacdo da equacdo matemética Considere a maneira de determinar a equagao de uma rets que melhor descreva um conjunto de observagdes. Por exemplo, suponha que se queira determinar se hd alguma relagdo entre 0 ine » us : one a aioe > ous 2 tes oe 2 aie " ois a oo b ot = a a | x & om iu) 35 a | os is ass x osm te sn > on 7 ae > oo Tabela 4.20 me Valores do OI e rapidez de pide a leitura de sete criangas. s ¢ a 5 Fi 1 Usando 0 Excel Finalizando o capitulo, uma forma de calcular diversos parametros de uma s6 vez: * passo I: coloque os dados nas colunas A e B, conforme a Figura 4.2 Figura 427 prong Dados dee i + passo 2: no menu, escolha: Ferramentas/Analisar Dados/Regressao (observe que voc? {rd de correr com a barra de rolagem vertical); ao clicar OK, surge a Figura 4.28, Figura 4.28 Tela para a regressao linear, + passo 3: preencha os intervalos de entrada X (coluna A) e ¥ (coluna B), clique em resi- ‘duos, residuos padronizados e plotagem de residuos. Aparcceré uma planiiha (Figura 4.29) ‘com uma série de valores. Para este estudo Capludo 4 / Inferéncia e decisdes estatisticas 141 = 08 coeficientes da reta de mfnimos quadrados; ia tabela da ANOVA, o resultado do teste de hip6teses: Hi, niéo ha relago linear i existe uma relagdo linear = na estatistica de regressio, 0 valor de R° E surgem os resultados da Figura 4.29. Figura 4.29 ves eosnesinsatos Tela final para a aaa regressdo linear, Fra res i Rous | Gauss von - sum, rs : | nos . { . | es - / are El GE HEteen ‘ous wee ouesees rete a iesaen eee 2 | s h { Termos-chave | Decides estatisticas Intervalo de confianga pare ‘Tratamentos experimentais | Tnferéncia esatistice amédia Teste \ ‘Tencenciosidade Distribuigdo de Student Tester | Estimaglo pois! Distbuigo F Teste para das amostas "Eeimativa por intervalos Razto F independentes ‘Testes de hipsteses Tiervale de conflanga para ‘Teste para das amostrasemn Pardmetros roporgses pares ‘Arnostasleaéria Intervato de confianga para ‘Significtncia estaition | Etatisticn Aiferenga de proporeses pritica Estimador Distibaigao de probabiidade Soma média de quadrados | Escatistica inferencial ‘quiquadrado dentro | Esttistca nfo-tendencioss Hipéiese mala ‘Soma métia de quadrades Estatsticneficiente Hipoveealemative entre \ Diswibuigio amostral da Teste bilateral Andlise da vaidncia smédiaantmetica Regido de nio-tecigdo ANOVA ‘Teorema central do limite Regidode rjeigao \aritnciaexplicada Estimadores nio- “Test unilateral superior ‘ritncianso-explicada ‘ene ‘scans ee opciones | Incervalo de confanga Ponto de corte Corelagio Enzo de amostragem Valorp. Pesqusnexperimental \ Nivel de confanga Estaritica de reste Pesquisa de elagbes Grau de certeza Nivlde sigificancis Diagrama de dispersto Intervalo de confiange Erro de tipo 1 ‘Método dos misimos ‘ileal Eno aquadrades Intervalo de confianga Ero de tipo 1 Coeficiente r de Peatson unite! inferior Ero B ‘Correlaio momento-prodito Antervalo de confianga Diferenga entre das médias (Coeficiente r, de Spearman ‘onisterasupenoe ¢ | Resumo - 1 0 objetivo da Esta 6 oma de deisoem siuagies de ob parison dma popula slo desomhcidos, en nes Obit Ee iitisenccrutsicipokm sino etimar 9 vale dens pdms ov eto plnejaresh | erintadr cb ono ge da eared dei, sae car ao valves vee aos poem coieedst 2. Os principais procedimentos da estaitica inferencial sioaestima-_verdadeiros. GBo pontualeporintervalos)eostestesde hipteses.Comumente, 3. As wargvels leatérias(X, X,, XX, constituem uma amosta 142 aleatria de tamanho nse: 08 X, so varveis aleatdras indepen dents, eb. cada X, tem a mesina distribuigao de probabilidades. 4, Asestimativas podem ser divididas em estimativas pontuais eesti ‘mativas por inervalos. Naestimativa pontual,um Yalor numérico simples € oblido como.uma estimativa do parmetra da populagso. Na estimariva por intervalo, umn interval € determinado tal que existaalguma probabilidade de que o verdadero valor do parimetro esteja conto nele.Estimarivasporintervalos so tmbém chama- ‘das de intervalos de conflanca 5, Distrbuigido amostral 6 a distribuiglo de probabilidade de wna ‘esttistica (valor do estimadorapds #retirada da smosta) 6, Bxiste a convengio de se denotar oestimador por um acento cir- ccunflexa (4) sabre @ parimetro correspondente, O esimador da ‘média da populagao 16 ji eesteestimadoré média amestral, estimador da varidincia da populagio a * € &* que, comumente, 6 varincia da amost,# 7. Dizese que uma estatistica @& uma estatistica ndo-tendenciosa de tm partmtro © da populago sc © somente se, a média da 8 peravse que LOD I~ a9 desses iterates conten valor ve Gadeio do primeira @ descjdo, 14, Asestimativaspontuais mas utilizads sos seguints: 4 para aestimativaé d= X, amédisamostal Di para ty aestinativaé ff, =X, ~X,, wdifeensa ene “smédiasainostras de dus amostes letria independents « parap,aestimativaé = v/a, onée x60 nimero de elementos ‘de uma amosire d= tamanbo nue petence clase de ineress: pare —Py.8e 7, P, adifereneaene ts proporydes amostraiscalculadas a partir de duas amostas eatrias independentes, c.parao®,aesimativad O° = Pag Exercicins propostos 2 varidncia amosta, 1. Discuta « seguinte afiemagio: “As pesquisas eleitoais sao a bola dda vez, Hi um sentimento generalizada de que os inttutos ems ram ov detueparam ndimeros, influindo negativamente no resulta- do das eleigses."™ 18, 26. Capitulo 4 / nferéncia e decisees estatistcas ‘Quando a varitneia da populagio & desconhecida, nfo se pode utiliara distrbuigio de DeMoivre-Laplace-Gauss paracaleularo uervalo de confianga e sim ade Student Aditibuigho #= éumn fang ds vss amos send uma varivel aleatria porque & dependente de cata amostra Fetraa, A distribu teen que modela esa azo denomsina-se ‘huribigdo Farm chamoda de distsbuig de Snedecor) com (n=) gras de bends no mumeradr e (~ 1) graus de liber ate no denominador CConsidere wna anos de elementos retitadosaeatriamnene de uma populago que tem uma dstrinigao de probabilidades de DeMoivre-Laplace-Gauss com media Oe des¥ pedo I,0u sea Zr tyon ty A distebuigdo quiquadrado (X) & detiniga como & oma dos quadrados dos valores x ‘© objetivo dos testes de hipSteses éverficar se so verdadei afirmasies sobre os parimetros de wma populagso, Em qualquer teste, existem duss hipstses: a hipstese nula W,e2 hipétese eltemativa H,. A hipétese mila representa 0 status quo, ‘ou seja,& ctcunstanela que std sendo testada, © o objetivo dos testes de hipoteses ¢ sempre tentar ejeitar a hipdiese nla. Ahip6- ese alterativa representa que se deseja provar ou estabelecer, ‘endo formolads para contradizer a hipétese nul Hi testes ilaterais,unilterisineriores c unilaterais superires. objetivo doteste de hipsteses & sempre tentar rejeitar a hipGtese nul com base em uma amostea, Se nao se consoguiu rejeitar em determinado test, € porque aquela amostra no forneceu elemen- tos suficientes para se consegult a rejeigo. Hi dois tipos do errosnos testes de hipoteses: de tipo Te de tipo Tt c.erode tipo I ocorre quando se rejeta ums hipstese nula quando ahipotese nulaé verdadeira. A probabilidade de um enre de tipo Lé {ndicade por c. © ero de tipo Il ocorte quando a hipdtese nvlando ‘rejetada apesur de ser tals. A probabilidade dem erro de ipo 16 simbolizada por B ‘A estatstica F,usada na ANOVA, é um test unilateral superior, ‘sto, a hipstese nul de que us médias s40igusis para cada grupo sera rojeitada $0.0 Fa, 8 partir dos valores €significauivamen- te grantc, on seja, etcode um valor teérico acima do qual o erro 8 ‘set cometido 6 maior que 0 desejado. Nesse este ANOVA, chamalo {de ftor nico, F & a razao da medida de varablidade entre grupos ora varsblidade dentro dos grupos. Rejetarahipétesenula signi Ficaque agama diferenca foi deerminadn ene 35 médias da popula ‘sho, embors sea identiicada qual msdia¢ diferente des outa. "A andlise de regressio linear e de correlagio compreende aan 8 dados amostais para saber se e como duas ou mais variveis, ‘esto relacionadas uma com a outa &m uma populagao. ‘A anilise de regressio linear apresenta como resultado wma €94a- io matematiea que descreve uma determinads relat. A equaio pode ser usd paraesimar. ou predizer valores de uma varidve quando econhecem ou se supbem conhecidos valores da outa varie! ‘A anélise de correlagao fomece um nimero que resume 0 graw de relag entre dus varveis, Ela € til eno vim trabalho explo- ‘Geo, quando um pesguisador ou analista procura determina quais ‘vansveis sfo poteneialmeate importantes, ‘deatifique o significado de termo conflanga na noticias seguir, ‘comparando-o com o da estatstca: “A evaligio dos nmeros ‘mostra que, a partt de mai, o gral de confianga no presidente 56 fem aurmentado."™ Capitulo 4/ Inferéncia e declebes esttitious 1 1 3, Mdemifique o significado do term confianca na noticia a segs “A sondagem dir se os ftos a forma como evoluiram abalaram a ‘renga nacional na eapacidade do Governo de enfrentar crises, Hi ez meses o nivel dessa confianga supera 605." 4. Indique até que ponto € valida aseguinte noticia: “Pesquisas com provam que uma refeicdo saudivel uo seordaraceler oraciocinio, melhora o humor e a disposigio fsica. .. pesquisas americana ‘omsataram que uma refeicio balanceada ae cordar deixa racio- cinio mais gi, sumenta a produtividade, bom humoce oequilio cmecional, sem contr os conhecidos henefiios do cate da ma nh para a preservagio da saide 5. Indique que técnica estatistica pode sr utiliza ness tipo de teste “Os temides bafdmetrostiveran ontem sua confibilidade testada pelo Tnstitwte Nacional de Metrologia (Inmetze) em um bar em [Niteci... Para isso, 48 voluntéries beberamm, em um hora, entre dois e sito chopes se submeteram a0 exame ex bafmetros de seis marcas, Os diferentes resultados dos estes nos seis apazelhos ica sobre a legalidade do uso do bafometo 6, Identifique como justiticar o seguinte ponto de vista: “Crengas po pares nascem ninguém sabe onde ner como, iém a poder de se espalhar eypidamente ede assumir ares de verdade absoluta, Algu- ‘mas podem ats tr um funde de verdede, otras no passam mes= mo de crendice. Na divida...methor nfo arrscat, pensamn alguns “Talver por isso muitos homens relutam em comprar cuecas mans Justa, mesmo que sesintam melhor com ese tipo de modelo. Reza a Tendla que roupy intima masculina apertada causa bem mais gue desconforte: compromete a frtilidade. Seguade especalists, tado ro passa mesina de tis lends.” > 7, Devida se € razoivel ter, om um experimento, o detalhamtento a seguir deserito: “Roupa intima cor-de-rosa para garantircarros ‘mais seguros. A legisla federal norte-armericana exige que 0¢ bbonecos usados em testes de colisdes de veeulos essjam vestidos ‘com roupas intimas decor rosu-piid quando sio atirados contra paredesde conereto .”"Superfcialmente, pode parecer bobazea", iz... representunte da ANSE para padroes de desempenno de seguranga, "Mas quanto riais se buscar e eliminar as fontes de variagio, mais consistentes sero os resultados dos testes {Uma aplicasio real dos testes de hipsteses ocorre nos Tribunais do Jr, nos quais ura pessoa 6 leva julgamentoperante wana rie le jursdos, 0s quais decidirao pola culpabilidade ou no do ra. Nese cenirio,identifique os seguintes elementos dos testes de hipsteses: a hip6tese nla; D.hipstese alternatives 6 teste estatstico; a regito de rejeigéo: ‘condigdes a serem stendidas relativamente 90 jn © experimento. cilculo dose estatistico; ‘g-conclusto; I.crros de tipo ede tipo I identifique qual dos dois eros 60 mais série: 1, 05 jurados nao sabem, em gera. os valores dos dois eros, ss imoging-se que devam ser pequenos. Supde-se que uma dessas probabilidades é menor que a ours em um julgatiento;identif- (que, justiicando, ‘9. Explique, com base no coneeito do valor p, por que a maioria dos brasileiros nao acreditou na seguints noticia: “Deus me ajadou, Ganbet 24 mil vezes na lotera” (do ex-deputade .. a0 depor na CPI do Orcamento em 1993)" 10. Identifique os elementos do taste de hipSteses que devem serespe- cificados antes da sua realizasio, ‘Testes mSdicos sto desenvolvidos para minimizar a probabiidade ‘deque produziré um resultado false positivo ow um resultado fal ‘negativo, Um resultado falso positive vefere-se a um teste positive para um individuo que no tema doenca, e um falso negative é lum teste que deu negativo para uma pessoa que realmente est sdoente. 143 ‘Se um teste médico 6 visto como sende um teste de hipteses, quis a hipéteses nulae altermtva? bi. Identifique os erros de tipos Te I, relacionando-os como fabo positive eo falso negative, « ldentifique qual dos eros ¢ 0 mais grave. Considerando-se esse eo, é mais importante :inimizar oon 8? Jusiiqu, 4. Identifique o tipo de ero relatado na sepuinte noticia: "Ns oca- silo, eseapou da operagao de safena, jf na mess de ciurgia Porque os médicos descobriram que ele havia caldo nos 5% de Possiblidade de erro do exame-"* Pods-se consider rizodivel essa porcentagem de 5% para esse tipo de erro? 12. rustfique apublicagso da noticia # seguir: "Na Previdencio, como ‘no dados, a estimativa supés que Um percentua similar 0 of {amento na Sadie (5,87) & consumido com pensbes, aposentado- Fas euxflio-doenga, Assim, o valor estado para a Previdéncia representa 5% do orgamento, Nao hi qualquer base iemitia nes sa suposigo— € uma analog.” 13. Kdentifigu o tipo de ero cometido no diagnésticonoticindo a seguir: "A emprogada doméstica .. que darante um ano acreditou que ti- nha. o virus da Aids, fixou em RS4 miles 0 valor da indenirago ‘em uma apdo que move .. por erro em diagndsticn de exame de Hv" 14. Programa dominical de grande audigncia na televisto brasileira di Vlg resultados de testes realizados com diversos produtos no sen sida de alerar a populagio quanto’ qualidade eles. Realizase, verdad, um teste de hipéreses para verfiew a veracidade de de ‘erminada informagdo. Ademas, tis resultados sto poblicads ern reportagensdejomais de irculaso nacional, mulls vezes ensejand protestos de fabricantes, os quais apresentam os sous argumentos, ‘como na seguinte carta “Em relagio & reportagem "Oito marcas ‘ferecem grande iso". cumpre-nos informar que o produto ci- ‘ado pela reporagem foi coletado fora de nossas dependéncias Industria, Foi realizado teste em apenas © exclusivamente em um) Tito de leit, entre os mais de 5 milhGes que a. produ e eoloca diariamente no mercado, A .. n&0 teve o diteito de realizar ‘contraprovacou acompanhar a compa e posterior andlise da amos trupelotrsttua." aA empresa refutou a metodologia de coleta de amos eos r= tlos do Tao, Mentifique os pontosem que possivelmence se baseou a empresa na sva defo, . A veiculagio de noticias semelhantes a essa jusiicada? 15. Mentifique as caracteristicas das testes de hipétesee na seguinte noticia: "Moratéria para os transgénicos. A directo do institute rgumentou que 0s testes nfo eram conclisivos, mis outros cien- {ist contimmaram a ese do pesquisador. Os resultados obtidos ‘no minimo, levantam suspeits de qve 08 alimentos geneticamente ‘moifieados podem ufetar sistema imnotégico.”™ 16, Determine sa informagdo a seguir & corres, “Na semana passa- dda, mestno ap6s a... onde FHC apareceu com 34% ds incengoes ‘de voto, contra 30% de Lula, um empate tGenico."" 17.A Fotha de S. Paulo de 9/4/1999 pubicou os resultados dos fn ‘ces Gerais de Pregos IGP-10, IGP-M e IGP, calculados pole Fu ‘ago Geto Vargas. para os meses de janeiro fevereiroe marco {de 1999. A metadologia adotada para ocileulo Ga mesma, e0 que muda ¢ 0 perfodo de preeos que entra na compatagio, OIGP con- siderao més Fechado:0 IGP-M, de 21 de wm més a 20INV.NORMP(1-C9): "Rejetar""NBorejeitar), + passo 6: em C16, digite: =1-DISTNORMP(C12); 4145 asso 7: em C18, digite: *SE(CI2INV.NORMP(I-CO/ 21 “Niorejerar");, asso 10: em C2, dh |-DISTNORMPLABS(C12))*2 ( resultado part o Exemplo 48 encontre-sena Figura 4.30, na (qual se deve veriicar apenas o resultado de interesse — no caso, oteste bilateral Figura 4.30 Resultados do Exercielo-eremplo 4.9. 4.0. 4a an. Than 4 pec unde ail cnbacde 5-1, (008-008) 545 SBD 0004055 Observesse que a planilha apresenta o resultado pars testes bilatersise unilsterais e, desse modo, a plant pade set apro- ‘yeitada para todos os testes a serem realizaos. PPode-se interpretaro teste de hipstese bilateral no nivel de 5% e signifcdncia ou qualquer nivel) usando o valor pd 01336, Desde que o valor p do teste exceda o nivel de significancia do teste, ahipotese io ¢rejeitnds, Outros tomadares de decisio podem ter dterents niveis de signifcéncia em mente. Para gual. ‘quer teste com nfvel de sigificancia abaino de alfe = 0.1335, eles poderiam chegar a mesma concnsa0e aio rejitar Hy Veriica-se que a estatstica P caleulada ¢ 5,386, excedendo © valor eritico de F,q,= 3,682, Iso signifies que hg evidéncia base tanre para rejeita a hipdtese aula de que ox métados apresen- tam os mesmos resultados “Os mereados, especialmente os financeitos, nla espera os fatos para fina? seus pregos: bastam as expectativas, Isso expt «a por que a nunciad moratéria de Minas Gersis pode afetar « Bolsas e © cimbio no Brasil e at em parte, no resto do ‘mundo, Seguindo-seos pasos, obese 1. Diagrama de disperszo Figura 4:31), Figura 431 Diagrama de dispersto. 146 Capitulo 4 /Inferencia¢ decistes estattticas 2 + passo 4: eleve ao quadrado essasdiferengas obtendo acoluna 7 ' asso I: ordene os valores da varivelA (epidez) em ordem da Tabela 4.23; ‘rescence; Tabela 4.23 Quadrado das diferencas entre as classificugdes + asso 2; ordene os valores da variével B (QU) da mesins ma- ‘eira, Calculam-se as classiicagSes empatadas atribuindo-se ‘cada valor s méatiaaritmética das cassfieagdes que teriam reeebid so no houvesse empates, ou sea, para a variével A, hi 2 valores “5”, que ocupariam 6 terceiro e quarto lugares; ‘ent, cada um doles recebe a classificagio 35, que é amédia ‘Grianga | Raider] OV | Ondemda) Orde | D rapier | das Qls = e [7 c * spe i fritintica de 3 ed (Vero resullado fina na Tabsla 421). eo [-w aps ape Tabela 421 Classfcaito dos valores das variéveis vt z[ 2 {a} Tee Oe eee eos | asf ats [as Criange | Rapidez | QU E x 1S, a | 3 [-05 | 025 o ps] T op aes 3 6 [oe + paso 5: some as difereaga obtidas,resskandoem SD? = 6: a + asso 6 calle 7, Do eer Pet 6x6. /17 x1) = 088 z 3 wm | © valor 7, é um indice do grau de relacionamento entre as duas e i+-# ‘aridvets Para responder pergunta"Satendo-seque a conetosio 5 +3 ole etareradacm 9% das vezes em ques fier « mesa coe {ee valores, pode se afimar que existe relagao entre as vaié- sei devesse wolizaa Tabela 19,8 qual, paraum aémero n= + pasro 3+ calle as diferengas (D) entre cada par de clas- 7g observapoes, oval taelada der, 60.78, Como 1, bser- Sifieages (ver coluna 6 da Tube 4.22), Por excrplo, para a igual 20.88 excede o valor tabelado, coneluse Grianga A, a diferengs entre aordem de rapidez (6) e4 ordem que, nu populagao, existe uma relag ene a8 varves, mas dos Qs (leva ao resultado D=6=7 =I: es Concho poderd estar ea ein 5% ds Yeresem que 86 ivecvarem outas oifo clang da mesma populagao e pasa 38 Tabela 422 treunes varisvele = popu co Diferongs entre as classifica dos valores das vardveit, Enfataa-e que, sr, observad na amosta excedeo valor tabe- lado, conclu-se que, na populagda, ese una rlapSo ent as CCrinaga | Rapider | QT | Ordemda | Ordem | DP variyeis, mas esta conclusio poders estar erada em 5% das ve- tapes | one eee abort cnteasen cam nega de x a 7_|-=1 mapoptilagi para as mesmes varidves. Quando se interpreta 0 B 6) 5 6 [-=1 significado de um cosfciente de comrelaglo. deve-se embrar que € 0s 7 5 Z_— asassocingdes entre vardveis nfo indicam, necessariamente, re D [1s 2 z (Bes de causa © eftito ec] sm | as 4 F 5 [ms | 3s 3 se i} 1 i c Fontes de noticias e citaces Caio Binder. 0 Gabo, 1710198, 19, Jomatdo Bra 811988 True Branlsco Carvaln Filho, Fotha de Paulo, 8/10/1998. Yoonal do Brasil VON 998. Lit Francisco Carvalho Fillo, Fahad , Paulo, 8/0998. Somat O Globe, 2971/1058 BE Caos Heitor Cony. FothadeS. Paul, L098. 2. Rica Bowchat O Globo, 1711/1999, Folia de Paul, 01998 2. OGtobo, 1717999, Folha de , Paulo, 671999. 2 oral do Bras 2/1998, Polhade S Paulo, 11099 35, Jomal do Brasil 101/199. olla de § Paulo, 701998 2. The Wall Street ural Americas, Jornal do Brawl, 2172/1998 ovis ja, 0/998. 1 Revista lato 1511997, Revs Voje, 10/1998. 2K “Informe JB" Foro do Bras, 1998, Revit jo, INOS, 1B. Folhadde Peale, 1211099 Jeelmit Being, 0 Globo 13/121998, 30 Fothade 8 Paulo, 6211999, ‘Cine Heitor Cony Polka de . Paulo, 6/999 31 “Panel do Ltr” Poth de’. Paulo, 1/2199 Sorat do Brasil 21/12998. 3 Jomat do Bras, 1321199. Revise, 17/1998. BA Revista Yj 1OWIOOR, | ‘erst, ormal do Bras, 28/7/1998 34 Ombudsman, Polka de S. Peal, 2671998, Jal O Dia, 101/198, 3. Pothade’ Paulo, 9/V1999, tte Bogen A M. Mell, Fotha dS. Pauo, 011998, Apéndice Roteiro bdsico para um projeto de pesquisa estatistica Passo 1. justificativa, 148 Passo 2. Fundamentacao teérica, 148 Passo 3. Objetivos da pesquisa, 148 Passo 4. Formulacao das hipsteses, 149 Passo 5. Detalhamento do plano do trabalho estatistico, 149 Passo 6. Especificacéo da amostra, 149 Passo 7. Plano de coleta de dados, 149 Passo 8. Teste-piloto, 149 Passo 9, Instrucdes aos entrevistadores ou aos observadores, 149 Passo 10. Realizacdo da pesquisa, 149 Passo 11. Andlise dos resultados, 149 Passo 12. Estabelecimento do cronograma e do orcamento, 150 148 Passo 1. Justificativa Apendice | / Roteiro bdsico para um projeo de pesquisa estaustica sociedade moderna encontra-se na denominada Era da Informago. A quantidade de dados a disposigao das pessoas é tdo grande que se torna necessario estudar parte dessa informagio disponivel para se tomar determinada decisio. Todavia, essa amostragem & uma situagio delicada: para muitos de n6s seria melhor ndo ter informagio, e saber disso, do que ter # informagio errada ¢ pensar que é a correta. A especialidade do estatistico € resultado de uma medida, ou seja, 0 método € 0 projeto dessa medida, Por exermplo: o que deve ser medido? Que perguntas devem ser formuladas? Que erro se pode cometer’ Quais sto os custos, nao s6 do projeto, mas do erro causado por uma decisao tomada erradumente? Qual € 0 significado dos resultados? Os trés maiores problemas teéricos de um projeto estatistico com base em uma amostra sd0 0s seguintes: especificagio, projeto e avaliagae. A especificacao consiste em determinar 0 erro maximo que pode ser cometido. © projeto consiste em produzir a confisbilidade desejada a0 menor custo possivel — € utili zando as facilidades fisicas e os recursos humanos disponiveis, A avaliagdo consiste em verificar as diferencas entre os varios procedimentos utilizados para ‘8 comparacao de resultados. Estes tds aspectos no sfo independentes, ¢ influenciam um ao outre, Desse modo, pode-se afirmar que a amostragem € a ciéncia e a arte de controlar e medit a confiabilidade de informa- (des estatisticas por meio da teoria da probabilidade, Geralmento, as pessoas esperam compreender de imediato quais so as pesquisas a serem fek- tus, como devem ser realizadas, quanto custaro e qual o tempo necessério para serem comple tadas. Entretanto, ndo sto possiveis respostas imediatas para essas perguntas, embora « formu Jago de um problema seja tio importante quanto a sua soluco, porque propicia discernimento fem relagio a ele pelo estudo das seus muitos aspectos. Em vm ambiente académico, a pesquisa desenvolve-se dentro de um contexto com ma base tebrics, ou seja, deseja'se testar determinado aspecto de um campo do conhecimento OU &X- pandir seu dominio; por outo lado; no contexto das organizagSes, 0 projelo surge da neces- Sidade dos administradores Este apéndice aprescnta um rotciro que nao é, cm absoluto, completo; ele apenas fornece uma indicagao de uma estratura que se pode utilizar na pric, & preciso considera, ainda que esse projelo de pesquisa deve se adaptado a cada campo do conhecimento, De inicio, explicitam-se os motivos que justificam a pesquisa, determinando-se e delimitando- se o problema, o qual deve estar formulado de maneira clara ¢ precisa, Passo 2. Fundamentagio tedrica Examinam-se as diversas correntes tedricas e decide-se qual ser utlizada na pesquisa, desere- vve-s2 0 relacionamento do problema com a teoria em vista e faz-se aligagio deste com proble- mas semelhantes, Passo 3. Objetivos da pesquisa (0s objetivos devem ser retirudos diretamente dos problemas levantados no Passo 2. Podem ser divididos em: = objetivos gerais, em que se define o que se pretende alcangar com a realizacao do traba- Iho; + objetivos especificos, aspectos determinados que contribuem para que se aleancem os objetivas gerais, Apindice 1 / Roteiro bésice para um projeto de pesquisa estatstica 149 Passo 4, Formulagdo das hipéteses Estabelecem-se as hipdteses a serem formuladas, as quais devem ser claras e precisas. Define- se 0 problema estatisticamente, decidindo-se que informasio estatistica ¢ realinente necesi- itam-se a8 vérias decisbes possiveis e determina-se se elas dependem dos resultados da esq Passo 5. Detalhamento do plano do trabatho estatistico Desereve-se o plano de pesquisa, caracterizando-se 0 tipo de estado: * exploratério, quando no se tem informagao sobre determinado assunto e se deseja ‘conhecé-lo; + descritivo, quando se deseja apenas descrever as caracteristicas de determinado fenéme= + explicativo, quando se deseje analisar as conseqiéncias de um determinado problema ‘Também se desereve, neste passo, 0 estudo a ser feito, bem como se especificam os estudos estatisticos a serem utilizados na andlise das informagées obtidas, Passo 6. Especificagao da amostra Devem-se determinar a srea de execugio da pesquisa, a populagio a ser investigada, o tipo de mostra e a determinagdo do seu tamanho, bem como o tipo de amastragem a ser utilizada Passo 7. Plano de coleta de dados Passo 8. Teste-piloto Determina-se o modo da coleta de dads, se por entrevistas, questionérios ou outro meio, bem ‘como sua freqiéncia on aié a época do ano a scr feita. Deve ser feito um estudo de quanta informagio necesséria jé estd disponivel em relatérios ou publicagdes, tendo-se sempre em 'mente tomar a pesquisa de campo to pequena quanto possfvel para o erro desejado. Com 6 instramento definitivo de coleta, estudum-se as opgbes de planos de amostragem, € caleulam-se os custos aproximados para diversos graus de precistio. Decide-se o erro que se pretende assumir e, se necessério, revisam-se os passos anteriores. Em geral, as pessoas que necessitam das informagdes pensam que os nimeros so absolutos € clas podem nao estar conscientes das dificuldades em se coletar e interpretar os dedos. Podem Pensar na amostragem como sendo um jogo de loteria, ignorando o fato de que os erros de amostragem estio sob controle. Todavia, elas necessitam de fatos e no de eras ou probabili- ddades, porque sio responsaveis pelas decisBes propriamente ditas e nao podem se arriscar. Realiza-se um teste-piloto que indicard a completeza da pesquisa, os efeitos dos erros das respostas ¢ das faitas de respostas, as diferencas resultantes da coleta de dados por diversos entrevistadores ou observadores, ¢ as diferencas de custos nos diversos procedimentos de amostragem. Apés realizado o teste-piloto, revisi-se © instrumento de medigdo e as instrugdes 4 serem fornecidas a quem realizar a pesquisa, Passo 9. InstrugGes aos entrevistadores ou aos observadores Deve ser preparado um conjunto de instruges para cada etapa a ser realizada durante @ observa. ‘sao estatistica, Passo 10. Realizagéo da pesquisa Realiza-se a pesquisa e organizam-se 0s resultados: tabelas, grficos e us medidas da estatistica descritiva, usualmente a média aritmética e © desvio padeao. Passo 11. Andlise dos resultados Passa-se a0 tratamento dos dados por intermédio dos testes estaisticos, os quais dependem ‘das hipéteses a serem testadas 150 Apéndice | / Roteiro basico para um projeo de pecauisa estavstca Passo 12. Estabelecimento do éronograma ¢ do orcamento Prepara-se um roteiro de trabalho, que deve ineluir: * planejamento da pesquisa; elaboragao dos instrumentos de andlise; teste piloto; selege da amostra-piloto; elaboragdo dos instrumentos de andlise definitivos: selegio e treinamento dos entrevistadores coleta das dados; andlise estatstica: relatério da pesquisa. Adicionalmente, estimam-se os recursos humanos, materiais ¢ financeires para a realizago do trabalho, Em resumo, o trabalho estatistico consiste em determinar que tipo de informagio € stil para a finalidade do problema em estudo e decidir sa informacio desejada pode ser abtida a um ‘custo razofvel. Por fim, procurar essa informago ao menor custo possfvel e interpreticta ade~ ‘quadamente. ‘A estatfstica é uma base para ums ago, ¢ todo trabalho tem um propésito: abter respostas para ‘determinadas questoes que influenciam a tomada de decisoes racionais e aumentam o conheci- mento sobre determinada situagdo. Apéndice Principios do uso co D de calculadoras Zu cientificas Usando @ calculadora eletrénica com a légica RPN, 152 Usando a calculadora eletrénica de légica ndo-RPN, 152 152 Apéndice 2 / Principios do uso de valeuladoras cientficas A ntes do advento das caleuladoras,fuzer efleulos esttsticos A mao consumia uma paucela considtivel do tempo tol disponivel para apresenayo dos resultados — T= pouco vestando para wna analise mais etalhade, Hoje, as pares conceal e ratica da Estaitleadominam a torlidade Go prsza, porque os resultados de cleus, diferentomen- te deh 30 anos, sto imectatos, Usando a calculadora eletrénica com a légica RPN A Sie fo de eetaor ils uma tga matic ue nt vst pres om ambiglidade, Desenvolvida pelo polonés Jan Lukasiewicz (1878-1956), essa logica € conheci- © da como noragdo polonesa. Enquanto a notagiio algébrica convencional coloca os operadores Seosvatvesninforam ene 08 niimeros OU a8 varidvels, & notagio de Lukasiewicz coloca-os antes dos extmeros ou ipiaiosconstmmnes Vatiéveis; entretanto, para otimizar 0 uso da meméria das calculadoras, modifica-se lige calandoneoconpuncr mente a notagao para especifica os operadores pds os mimetos, origem da expressio reverse omecemuirasies mei. polish notation (RPN), ou notagio polonesa Fevers ‘nictcenicurmeaca Exemplo de utilicagdo da catculadora de Iégica RPN dado ecccorein. Para somat 3 ¢ 2, digita-se 0 4, aperta-e a tecla ENTER, digita-sc 0 2 ¢ 0 sinal de +, surgindo 0 fesuliado, Por esa razto, na calculadora de lgica RPN ado existem a tecla de = e as teclas dos parénieses. Usandoa calculadora A representagio de uma tecla ¢ feita colocando-se a identificagéo dela entre os simbolos [ J eletrénica HP48G por exemplo, a tecla ENTER ¢ representada por [ENTER]. Para tigar a caleuladora: aperte a tecla [ON]. no extremo inferior esquerdo. Observe atenta- mente 0 aspecto da tela inicial, que serd a referéncia pars o inicio de qualquer calcul. Para desligar a calculadora: apeste a tecla verde de troca de Fungo’ (tecla com uma seta para 4 direita¢ logo acima da tecla (ON) e depois tecle [ON Antes de efetuar qualquer operagio, deixe a caleuladora sem qualquer informagio anterior: para isso aperte, apos liar a calculadora, a teca roxa de troea de fungio™ (tecla com uma seta Para a esquerds, duas teclas acima da tecla {ON} e depois a tecla {DEL (equivalente a fungao CLEAR), ferccira tecla& direita da tecla [ENTER], esta a maior da calculadora Usando a calculadora eletronica de légica néo-RPN Nesse tipo de calculudora, 0s valores e operagdes matemiticos sto efetuados de modo seme- Jhante & maneira como se efetuam célculos com pis ¢ papel. A ordem das operagbes ¢ impor- tante e devem ser usados parénteses quando so necessétios os agrupamentos de simbotes, para evitar ambigtidade, Exemplo de wilizagéo da calculadora eletrénica de logica ndo-RPN Para somar 3 ¢ 2, ¢ depois multiplicar esse resultado por 5, podem-se usar os seguintes méto- dos: * digitar 0 abre parénteses, o 3, 0 sinal de +, 0 2 ¢ fecha parénteses, surgindo o resultado parcial 5; em seguida, digtar o sinal de mulliplicsgao (x) e 0 5, aparecendo o resultado 25; + Gigitar o 3,0 sinal de +, € 0 2; em seguida, digitar o sinal de igual, 0 sinal de multiplicagio 60 20S, aparecendo 0 resultado 25, Usando a calculadora — Também para essa calculadora, a representagdo de uma tecla € feitu colocando-se a identifica eletrénica Casio ao da tecla enire os simbolos { ]; por exemplo, a (ecla EXE é representada por [EXE] (CFX-98506/9950G [ote va toda anges nin mn verde, aaa aia cde na sts canto Tava tv todas a uages ects oxo, focallandos sma Ge ads we a ela alelaor. Apéndice 2/ Prinspios da uso de culculadoras cientficar Usando a caleuladora eletronica TEXAS TI-83 153 Para ligar a maquina: apere a ceca {AC™), «ima fecla na linha dos nimer0s 7,8 « 9 Para destigar a méquina: sport a tecla amarela {SHIFT} (na primeira coluna, «segunda tea) eatecla ac, ‘Antes de eferoar qualquer operagao, elimine da ealeuladora qualquer informagso anterior, aper- tando, apésligs-la, novamente a tecla [AC™] A representagio de uma tecla continua sendo f ‘exemplo, a tecla On € representada por [ON]. A calculadora TI-83 vem com um cabo de ligaglo que proporciona 2 transferéncia de dados centre ela e uma outra caleuladora TL-83, Para ligar a calculadora: apere a tecla {ON}, no extzemo inferior esquerdo, Para desligar a calculadora: aperte a tecla amurela [2 (na primeira coluna de teclas, & a segunda tecla), e depois tecle (ON) ‘Antes de efetuar qualquer operacio, certifique se de que a calculadora estd sem qualquer infor magao anterior, apertando, apés ligé-la, a tecla [CLEAR], a dltima tecla da linha de teclas que ‘comes com (MATH ta pela colocasio da tecla entre 0s simbolos []; por Apéndice Introducdo ao Microsoft Excel Iniciando o Excel, 156 Graficos no Excel, 158 156 i qualquer stay, par ese esse ater plement os foramen eto Exel precisa sermsladonacp(e Iniciando 0 Excel Figura A3.1 Opsses iniciais para ativar 0 Excel Figura A3.2 Planitha 1, da Pasta 1, do Excel 97. Apendive 3 / Introduséo a0 Microsoft Excel s eélculos estatisticos, ja facilitados pelas calculadoras, ficaram ainda mais simples com a popularizagao dos computadores pessoais, que também permitem 0 armazenamento e o transporte dos resultados, em forma impressa ou nao. Surgiram ‘varios aplicativos especificos para se lidar com a Estatistica, mas um software no destinado especialmente a esse fim, a planilha eletrénica Excel, revelou-se um aplicativo computacional poderoso que permite efetuar célculos estatistcos relativamente complexos. Seu uso em Esta \istica, embora no ideal, permite resolver 2 maior parte das situagSes usuais c economiza tempo ao acabar com a demora na repeti¢a0 de longos e complexos cileulos estaisticos, 0 que ‘ocorria com os méiodos baseados em lépis, papel e calculadoras. Este livro baseia-se na versio 97 do Excel, mas outras verses podem ser usadas — inclusive © Excel 2000 para Windows —, porque os comandos e as fungées sio semelhantes. Entretanto, fem qualquer situago, para que se possam usar plenamente as ferramentas estatsticas o Excel precisa ser instalado na opciio completa Os passos slo os sepuintes: ‘passe 1: inicie 0 Window: * passo 2: clique em Iniciar (geralmente na extremidade inferior esquerda da tela); abre-se luma tela de opgbes. Leve © ponteiro do mouse alé a opelo Programas, quando se abre ‘outta tela; Ieve 0 ponteiro até o folder Office ou ao icone do Microsoft Excel (Figura ABI); + passo 3: ap6s alguns instantes, aparece uma tela reticulada, denominada planitha (Figura ‘A3.2), componente de uma pasta, chamada pasta de trabatho. TT Apéndice 3 /Introdusio ao Microsoft Excel Figura A3.3 Guias das planithas de tna Pasta de Trabatho. Figura A3.4 Alinhamento no Excel 97. 4157 A planitha do Excel é formada por 65.536 linhas (numeradas de 1 x 65.536) e 256 colunas (identificadas a partir da letra A até a Z e, continuando, de AA até [V). A interseco entre uma linha ¢ uma coluna chama-se célula; cada célula é identificada por seu endereco (ou roferén- Cia), determinado pela jungao da letta da coluna com o nimero da linha onde ha a intersegdo. Por exemplo, a primeira céiula da planilha, no extremo superior esquerdo, € 0 encontro da coluna A com a linha 1; seu enderego ¢, portanto, Al. A célula que se segue, na coluna ® diveita a Al, 64 BI; a célula que esti imediatamente abaixo da Al é 2 A2. A dltima célula da planitha, ‘no extremo inferior direito, & x [V65536. A Figura A3.2 mostra uma planitha onde se vé @ idemtificagao do endereco da eélula AL Quando se seleciona uma célula no Excel. esta aparece destacada na tela, com 2s bords mais largas: & cslula selecionada dé-se o nome célula ativa. Para tornar ativa uma eélula deve-se clicar dentro dela com 0 mouse ou mover-se até ela por meio das quatro teelas com setas, em eral localizadas & direita do teclado, Para exibir uma grea diferente da parte visivel da planilha clica-se no retangulo dentro das cha- madas barras de rolagens, localizadas na lateral diteita e na parte inferior direita da tela e, 'mantendo-se pressionado 0 botio esquerdo do mouse, arrasta-sc o retingulo até a pos sejada. Pode-se exibir novas areas da planidha clicando-se nos quadrados com setas que ficarn nos extremos das barras de rolagem, No Bxcel. a Pasta 1 é parte de uma pasta de trabalho que contém, inicialmente, 16 planithas, ccujas identificagdes (Plan, Plan2,...) slo mostradas em puias na parte inferior esquerda da jJanela da pasta de trabalho. O nome da planitha ariva fica serapre em negrito sobre um fundo bbranco e, para ir de tama planilha para outra, clica-se sobre as guias das planilhas (Figura A3.3). Essa disposigdo permite organizar, em um Gnico arquivo, diversos tipos de informagoes relacionadas entre si, ‘Uma planitha pode conter és tipos de informagao: valores, textos e formulas (até que se criem axéficos). Textos silo quaisquer palavras (ttulos, cabecalhos ow instrugdes) ou qualquer combi ago de niimeros, espagos e caracteres no-numéricos; valores slo nimeros: formulas sio 0 Potencial da planilha. porque permitem a realizagio de operagSes mateméticas com os valores ‘ou 08 textos existentes na planilha. Para incluir texto, valores ou férmulas em uma célula, clica-se duas vezes sobre a célula, sur gindo uma barra vertical inermitente dentro da célulaativas digita-se 0 texto ou o valor deseja do e pressiona-se a tecla ENTER. Ao digitar-se em uma célula, o que esté sendo escrito aparece nna denominada Barra de Férmulas, na parte superior da planitha. Quando se aperta a tecla ENTER, 0 texto, 0 valor ou a férmula so inclufdos na planilha No Excel, os niimeros so considerados valores constantes e podem conter apenas os seguit tes caracteres: 01 23456789 +—(/, Sc %. O sinal de soma (+) 3 esquerda dos valores & ignorado, mas € obrigat6rio colocar © sinal de subtragio (-) para identificar niimeros negati- vos. Todas as outtas combinagées de mimeros e caracteres nio-numéricos sto tratadas como. texto. Um detalhe a cuidar é que ro Excel em portugués os mimeras decimais devem ser escri- tos com virguia e, no Excel em inglés, com ponto, Como padrio do Excel, os nimeros digiados so sempre alinhados a direita na cétula, ¢ os {extos, a esquerda. Para alterar esse alinhamento, vaiese ao menu Formatar, depois em Céla- las... seleciona-se « guia Alinhamento ¢ escolhe-se 0 que se deseja para o alinkemento (hari- zontal ¢ vertical) e para a orientagiiodo texto. O alinhamento tambsin pode ser alterado clicando- se nos fcones existentes para isso na Barra de Ferramentas (Figura A3.4) Deuahy| yee a--- eel: - Nw e alee S| SSR Gdns i iswiaiy cau aieet es &) =e cael ae eo ees Ud 158 Exemplode operagao matemitica Apéndice 4 / Introdugao a0 Microsoft Excel O Excel decide se uma informagio inserida em uma célula é um valor ou um texto com base no ‘que se digita, Se é um ndmero, o Excel alinha-o a direita, Se se comega com o sinal de = ou +, (© Excel pressupde que se esté digitando uma fSrmula ¢ tenta determinar o seu resultado. Se digitadas letras, ou uma combinago de nimeros e letras, o Excel conclui que existe um texto € tlinha-o & esquerda. Caso se qucira que a plunilha realize operagdes mateméticas, deve-se co- rmecar a expressto sempre com o sinal de igual ou 0 de adigio (= ou +); caso contririo, o Exce! interpretaré a combinagio de nimeros, letras € simbolos como texto e ndo realizard céleulo algum. [As férmulas podem conter niimeros, referéncias a outras eélua, fungbes predefinidas ou ope- rages matematicas. As operagies matemdticas elementares que o Excel realiza sio as segu tes: soma (+), subtragio (-), multiplicagio (*), divisdo (/) ¢ potenciagto ("). 3446)" Para calewlar @ valor da expressdo x= 1+ 08 pasos sio os seguintes: + passol: selecione, por exemplo, a célula B4, tomando-a ativa; + passo 2: digite 0 texto x = cm Ba, e acione a tecla Enter: + passo 3: tome ativa a célula BS e digite: =1 + (3°(4+6)%2y/2; tecle Enter (observe a txisténcia dos parénteses adicionais antes do 3 ¢ do sinal de divisio para garantir a no- ambighidade na expressio); aparecerd o resultado, 151. sinal de = ou + antes de expresso matematica caracteriza que se esté diante de um cflculo, matemético. ‘Além de fazer eéleulos com constantes numéricas,tais como 0 1, 2, 3, 4 € 6, o Excel idemtifica fenderegos, que podem ter quaisquer valores, em vez de mimeros; isto é cquivalente aos « ey {que funcionam como inedgnitas na dlgebra, Para converter graus Fahrenheit (F)em graus Celsius (©), deve-se subtrair 32 da temperatura Fahrenheit, multiplicar por 5 e dividir por 9, ou se} F-2 c 9 Desse modo, desejando-se ter o resultado, em Celsius, na célula C7, a partir da temperatu- raem Fahrenheit digitada na eélula C6, deve-se tornar ativa a célula C7 e escrever a expres- slo: = (C6 ~ 32)/9, A cada vez.que se modificar o valor em C6, 0 resultado muda de acordo em C7, Gréficos no Excel Exemplode grdficos no Excel ‘Aumentesaargeradacolena Se ‘alacant pon do mouse na 1 ‘dnedn ore arcana quando : pone madarparee formate Sewn er clea tro tis crue do mone NO esa alararadesjale E muito fécil ¢ répido apresentar os dados de uma plunilha uilizando o Assistente de grifico, com o qual se pode escolher a parti das muitas variagSes predefinidas —e, ainda, personalizar {qualquer dessas opgaes. A vinculagto do gréfico com os valores que deram origem a ele tam- bém é simples, ¢ cada alteracio feita na planilla € automaticamente atualizada na figura ‘Tendo como ponto de partida a tabela a seguir, com a distribuigio dos catélicos no mundo, faga um grafico de barras, um de colunas ¢ um de setores. ‘Améicado None 709 maoes ‘Amirica Cental 142.2 mihoes America do Su re ues aropa 2834 ihaes Aiea 09,5 mies| | Asia a,2 mites mules Gréfico de barras + passo 1: digite, na coluna A, os nomes dos continentes, um em cada linha (aumente amanho da coluna para melhor apresentag0); + passo 2: digite, na coluna B, a quantidade de cat6licos por continente, um em cada linha, de acordo com os dados originais. + passo 3: na Barra de Ferramentas, clique no fcone do Assistente de grafico; abre-se a tela ‘Assistente de gréfico — etapa 1 de 4— tipo de grdfico (Figura A3.5). Também pode-se ir Barra de Menus e escolher Inserir grdfico. 159 Apéndice 3 / Inroducdo ao Microsoft Excel Figura A3.5 Assistonte de gréfico. Etapa 1 de 4, Tipo de grafico. Figura A3.6 Assistente de gréfico. Etapa 2 de 4 Dados de origem do grafico. Figura A3.7 Assistente de grafico, Buapa 3 de 4 Opcoes de gréfico ‘eat + passo 4: clique, no lado esquerdo, em Tipo de grdfico, na opgao Barras; surgem as seis ‘opgdes de apresentacao de grifico de barras (subripos de grdfico); escolha a primeira e clique em Avangar na parte inferior da tela; + passo 5: abre-se 0 Assistente de grdfico — etapa 2 de 4 — dados de origem do grifico (Figura A3.6); digite em Intervalo de Dados as células com us calegorias ¢ os valores; para a distribuicdo de cat6licos no mundo, Al: B7. Em Segiiéncias, marque Colunas, Porque 0s valores foram digitados em colunas, Clique em Avangar, + passo 6: abre-se a tela Assistente de grafico — etapa 3 de 4 — opedes de grafico (Fig 1 A3.7), com seis folhas, identificadas por abus na parte superior da tela: + na folha Titulo, digite, em Titulo do gréfico, Distribuigiée dos catblicos no mundo — em mithdes, no digite nada no eixo das eateyorias X nem no eixo dos valores ¥; - na folha Eéxos, nfo digite nada; + na folha Linhas de grade, desmarque Linhas de grade principais: ~ nw folba Legenda, desmarque Mostrar legenda: = na folhe Rétulos de dados, marque Mostrar valor, 160 Apendice 3 / trodueae ao Microsoft Excel + na folha Tabela de dados, no faga nada; + clique em Avangar: + passo 7: abro-se a tela Assistente de grdjico — etapa 4 de 4 — local do grifico (Figura ‘A3.8); deixe como objeto na planitha 1; clique em Concluir, quando aparece 0 gréfico desejado, Figura A3.9. Figura A38 Assistente de grafico. Etapa 4 de 4, Local do gréfico. Figura A3.9 Gréfico da distribuigdo de catélicos por regiao no mundo. Nos passos 4, 5 ¢ 6, pode-se clicar em Manter pressionade para exibir exemplo, de modo a visvalizar 0 aspecto intermedirio do grifico, facilitando alteragOes. Alterandoo Para alterar a posiedo do gréfico na planitha. Clique em qualquer lugar do grifieo, quando detalhamento dos surgiri uma moldura, Ao se colocar 0 ponteiro do mouse em qualquer ponto perto da moldura, grificos resultantes aparece o nome drea do gréfico abaixo do ponteiro do mouse. Ao clicar-se © mouse, 0 pont ro transforma-se em uma seta fina quadrilateral; pressionando-se 0 botdo esquerdo do mouse, pode-se arrastar 0 grafico até onde se deseja, Para alterar a forma e 0 tamanho do grifico na planilha, a0 se clicar em qualquer lugar do grafico surgird uma moldura, caracterizada por Oito pequenos quadrados pretos (quatro nas extremidades © quatro nos pontos médios), Figura A3.10: esses denominam-se algas. Ao posicionar-se © ponteiro do mouse em qualguer uma das algas, 0 ponteiro se transforma em fuma seta bilateral; pressionando-se 0 batio esquerdo do mouse e arrastando-o, a forma e 0 tamanho do grafico se alteram. Figura A3.10 Algas da moldura de um grafico. Apéndice 3 / Inrodustio av Mierasoft Excel 161 Figura A3.10 Formatar titulo do grafico. Figura A3.12 Ffeitos de Preenchimento. Para alterar o titulo do gréfico na planitha. Ao se colocar 6 mouse perto da titulo do geifico, aparece © nome Titulo do grdfico ubaixo do ponteiro do mouse. Ao clicar-se duas veres, rap damente, 0 botao esquerdo do mouse, surge 2 tela Formatar titulo do grdfico (Figura A3.11) ‘com trés folhas: padraes, fonte © alinhamento. Folha Padres Na folha Padres hi dois campos: Bordas e Area: Area. Nesse campo, pode-se escolher Automética, Nenhuma ou 0 botdo Efeitos de preenchi- ‘mento; clicando-se neste botdo, surge uma outta tela (Figura A3.12), agora com quateo fellas, Gradiemte, Textura, Padrio ¢ Figura, Gradiente. Pode-se escolher cores (uma, dus ou predefinida), sombreamento e variagies ¢ verificar 0 resultado embsixo, a direita, no quadrado do Exemplo, Cores. Ao escolher Uma cor, abrem-se duxs opsbes: de cor e de variagiio de claro para escure, Muda-se a cor clicando-se na seta a direita do retSngulo da Cor I, quando se abe a série de ‘opgées da qual se deve escolher a cor desejada, clicando nela; muda-se a tonalidade agindo-se nna barra de rolagem da variagao de claro para escuro. Ao escother Buss cores, abrem-se dias opgdes: da Cor 1 ¢ da Cor 2: mudam-se as cores elicando-se nas setas a direita dos retangulos de Cor I ¢ Cor 2, quando se abre a série de opgdes da qual se deve escoiher a cor descjada, clicando-se nela. Ao escolher Predefinidas, abre-se uma série de opcdes: escolhe-se cot predefinida desejada clicando-se na seta & direita do retangulo, quando aparece uma sétie de ‘opgdes, clicando-se na desejada, Sombreamento. Escolher um dos seis existentes, Variagées. Escolher uma das quatro existentes, Texmura, Pode-se escolhet 24 tipos diferentes predefinidos, clicando-se em cima da textura escolhida, ¢ verificar o resultado embaixo, a dieita, no quadrado de Exemplo. Se clicar-se no Ddotio Outra textura, aparece os arquivos existentes no computador para que se possa escolher ‘uma figura diferente nos arquivos do usta. 162 Figura A3.13 Formatar eixo. Figura A3.14 Formatar eixo, Apendice 3 / Inroducdo ao Microsoft Excel Padrdo. Permite que se escolha um entre 48 tipos diferentes predefinidos, bem como nas ‘cores do primeiro e do segundo planos; lica-se em cima do padrao desejado, bem como nas duas cores, ¢ Verifica-se o resultado embaixo, i direita, no quadrado do Exemplo. Figura, Nada fazer. Folha Fonte [Na folha Fonte hé sete campos que podem ser alterados de weordo com 0 desejo do usustio, seguindo a orientagao dada para mudanga na folha Padres. Fotha Alinkamento Nessa folha ha trés campos para se localizar 0 texto do tfulo: horizontal, vertical ¢ orienta (do, 08 quais devem ser alterados de acordo com o desejo do usuario. ‘Apds cada uma das escolhas compleras de todas as folhis, clique em OK. ara alterar 0 eixo das categorias na planilha — ao se colocar 0 ponteito do mouse perto das categorias, aparece 0 nome Eizo das categorias abaixo do ponteiro do mouse. Ao clicar-se dduas vezes, rapidamente, o botdo esquerdo do mouse, surge a tela Formatar eixo (Figura A3.13) com cinco folhas: Padtdes, Escala, Fonte, Numero e Alinhamento, cujos detalhes devem ser escolhides de acordo com & vontade do usuario, ‘a. Para alterar 0 cixo dos valores na planilha — ao se colocar 0 mouse perto dos valores, aparece 0 nome Eixo dos valores abaixo do poateiro do mouse, Ao clicar-se duas vezes, rapidamente, o mouse, surge a tela também chamada Formatar eixo (Figura A3.14) com tinco folhas: Padroes, Escala, Fonte, Ntimero ¢ Alinhamento, cujos detalhes 0 usuério deve escolher de acordo com & sua vontade. fone ra noe [use| —— [eeaecere = (Pree ste | eset encr i wat leh nom tearm is emer cunraoes [Powstevarecn ner one consi > Para aterara dre de plotagem na plnitha — a0 secolocar 0 mouse ma rea acinzentada do Erifico, aparece 0 nome Area de plotagem abaixo do ponteio do mouse. AO clicarse fduqs vezes apidamente, 0 mouse, surges tela Formatar drea de ploragem (Figura A3.15) ‘Com apenas. folha PadiGes,cujos detalhes 0 ususrio deve eseother de acordo com asia vontade Apéndice 3 / Inroducio ao Microsoft Excel Figura A3.15 Formatar drea de plotagem. Figura A3.16 Formatar drea do grafico, Figura A3.17 Formatar seqiténcia de dados. 1 Pa | | Eteene Para alterar a Grea do gréfico na planilha — ao se colocar o mouse na borda da area de plotagem. aparece o nome Area do gréfico abaixo do ponteiro do mouse. Ao clicar-se duas vezes, rapidamente, 0 mouse, surge a tela Formatar drea do grdfico Figura A3.16 ) ‘com trés folhas: Padrées, Fontes & Propriedades, cujos detalhes 0 usuario deve escolher de acordo com a sua vontade, 4. Para alterar a formatagio da seqiéncia de dados na planilha — ao se colocar o mouse sobre uma das barras do grifico, aparece 0 nome e o valor abaixo do ponteiro do mouse. Ao clicar-se duas vezes, tapidamente, © mouse, surge a tela Farmatar segiléncia de da dos (Figura A3.17) com seis folhas, cujos detalhes o usuério deve escolher de acordo ‘coma sua vontade, 164 Apindice 31 Inrodusto ao Microsoft Excel €. Para alterar a formatagilo do rétulo dos dados na planilha — go se colocar 0 mouse sobre ‘um dos valores a0 lado das barras do grifico, aparece © nome da categoria abaixo do ponteiro do mouse. Ao clicar-se duas vezes, rapidamente, o mouse, surge a tela Farmatar rétulo de dados (Figura A3.18) com quatro folhas, cujos detalhes 0 usudrio deve esco- Ther de acordo com a sua vontade. Figura A3.18 Formacar réwulo de dades. Gréfico de colunas Os passos 1 ¢ 2 sio iguais aos necessérios para o grifico de Barras + passo 3: vi Barra de Ferramentas ¢ clique no icone do Assstente de grétio; abre-se a tela Assistonte de grafico — etapa I de 4 — tipo de grafico + passo 4: clique em Tipo de grdfico na opgio Colunas, quando surge a tela Assstente de {grdjico — etapa 1 de 4 — tipo de grafico, agora com as sete opeoes de apresentagio de srélico de colunas (subripos de grafico). escolha a primeira e clique em Avancar: + passo 9: abre-se a tela Assstente de grifico — etapa 2 de 4 — dados de origem do ‘grafico; digite em Intervalo de Dados as células com as categorias e os valores; n0 ‘exemplo Al: B7, © om Sequéncias, marcar Colunas, porque os valores fora dgitados fem colunas; clique em Avangar. Os passas 6 ¢ 7. bem como as manciras de se alterar © aspeeto do grifico resultante ou a localizagio na planitha, sio iguais aos da construgdo do grafico de bara Figura 43.19 Grafico de colunas da em mines distribuigdo de catdlicos | xa por regido no mundo. | Gréfico de setores Os passos 1 ¢ 2 sio iguais aos neces: + passo 3: v4.4 Barra de Ferramentas © clique no icone do Assistente de grifico; abre-se a tela Assisiente de gréfico -— etapa I de 4 — tipo de gréfica; + passo 4: clique em Tipo de grdfico na opgie Pizza, quando surge a tela Assistente de \grifico — etapa I de 4 — tipo de grafico, agora com as seis opebes de apresentagao de irfico de colunas (subtipos de grdficoy; escolha a primeira e clique em Avancar Os passes 5, 6 € 7, bem como as manciras de se alterar 0 aspecto do grafico resultante ou a localizagdo na planilha, sio iguais aos da construgao do grafico de colunas Apindice 3 [ Introducto ao Microsoft Excel Figura A3.20 Grdfico de setores da distribuigdo de catslicos or regio no mundo. Distrbulgde doe etacos no mun Gréfico de pontos, histograma, de dispersiio e seqitencial * Grificode ponos + passo 1: digite os valores na coluna A e ordenc-os de modo erescente: + passo 2: na coluna seguinte, digite 0 niimero | a0 lado do primeiro niimero, 0 2 a0 lado {do segundo mimero, se igual ao primeiro, ¢ asim sucessivamente, reiniciando a numera ‘slo cada novo valor, * passo 3: va, a0 Assistente de grafico, escolha o grifico Dispersio (XY); destes, eseolha ‘© mtimero 1 (sem linhas nem grades); clique AVANGAR ¢ prossiga com a construgio do {grifico, Ajuste a escala na tela Formatar Eizo para os eixos horizontal e vertical + Histograma ‘Tendo em vista que o Excel trata o histograma de maneira diferente da usual no Brasil, esse tipo do serd abordado aqui + Grificodedspersao + passo 1: cologue 0s valores nas eélulas; * passe 2: va i Barra de Ferramentas ¢ clique no (cone do Assistente de grifico: abre-se a tela Assistente de grifico — etapa T de 4 — tipo de gréfico. Voce também pode ir & Barra de Menus ¢ escolher Grifico; clique em Dispersao (XY), surgindo quatro opsies do apresentagao de grificos. Escolha a primeira e clique em Avangar. + passo 3: abresse a tela Assisiente de grafico — etapa 2 de 4 — dados de origem do Brafico; digite em Intervalo de Dados us células com as categorias e os valores: em Seqiténcias, marcar Colunas, porque os valores foram digitadas em colunas. Clique em Avancar; . + passe 4: conclua o grifico, Grafica seqtencial Para construir o grifico de tempo, devem-se seguir os passos para 0 gréfico de dispersdo, tendo como referéncia as dois eixor coordenados: + no eixo horizontal, ou eixo das abscissas, anotam-se os valores referentes aos espagos de tempo considerados: + no eixo vertical, ou eixo das ordenadas, anotam-se os valores referentes & caracterfstica ‘que esté sendo estudada, Bibliografia 168 Bibliografia. BERENSON, Mark L. and LEVINE, David M., Basie Business Statistics: concepts and ‘applications, Prentice-Hall, 1996. BERK, Kenneth N. and CAREY, Patrick, Data Analysis with Microsoft Excel 5.0 for Windows, Course Technology, 1995. DEMING, William E., Some Theory of Sampling, Dover Publications, Tae., 1950. EMORY, C. William and COOPER, Donald R., Business Research Methods, 4* edition, Irwin, 1991 EVANS, David H., Probability and its applications for engineers, ASQC Quality Press, 1992 HOGG, Robert V. and CRAIG, Allen 7. . Introduction to Mathematical Statistics, 4° edition, ‘Macmillan Publishing Company, 1978. LARSON, Harold L., Introduction to Probability Theory and Statistical Inference, 3% ed. John Wiley & Sons, 1982. MASON, Robert D. and LIND, Douglas A., Statistical Techniques in Business & Economics, Irwin, 1996. MEYER, Paul L., Probabilidade: aplicagdes & Estatisiica, 2* edigio, Livros Técnicos e Cien Uificos Editora, 1983. MILLER, Robert B. and WICHERN, Dean W,, Intermediate Business Statistics: analysis of variance, regression and time series, Holt, Rinehart and Winston, 1977. NEUFELD, John L., Leaming Business Statistics with Microsoft Excel, Prentice-Hall, 1997. RICHARDSON, Roberto J. et alli, Pesquisa Social: métodos e técnicas, Exlitora Atlas, 1985, ROCHA, Marcos Vinicius, Curso de Estatistica, 3* ediga0, Fundagio Instituto Brasileiro de Geografia e Estatstica, id SUMMERS, George W, and PETERS, William S., Basic Statistics in Business and Economics, ‘Wadsworth Publishing Company, 1973. THOMAS, J, Introducio @ andilise estautstica para economistas, Zahat Editores, 1973. Indice alfabético A Amostra, 7 ~aleatéria de tamanho n, 104 =dados brutos da, 22, smédia da -aritmética, 24-28 ‘geométrica, 28 mmediana da, 30 rol da, 22 Amostragem, 7 ~aleatéria simples, 8 ~com reposicso, 7 ertos na, 16 ~estratificads, 10 ~observacional, 7 =sem reposigio, 7 temitica, 8 Amplitude total, 46 da amostra, 33 Anitise(s) ~de dados, 14 ~ exploratoria de dados, 21-60 ~-cileulos das medidas mais importantes, 39-42 classificagbes, 47 ‘coeficiente de variagio, 42 comparacdes. 47 esiatistica deseritiva, 22 grificos construgio, 48-54 que enganam, 54 medidas de tendéncia central e de disper siio revisitadas, 45 medidas de tendéneia central, 24-37 organizago dos valores das unidades amostrnis, 22 ANOVA, andlise da varidneia, 127, 128, 129 ~ drvore de probabilidades, 70 Axiomas, 63 c Calculadora(s) =determinagio da média aritmédica da amostra, 24, 26 da média geométrica da amostra, 28 dda mediana da amostra, 30 - -da moda da amostra, 32 - -das medidas de variabilidade, 36 = distribuigdo F, 116 Indice Alfabéico - distribuigdo quiquadrado, 120 = distribuigio ¢ de Student, 113 = medidas de variabilidade, 38 medidas mais importantes, 39 - modelos mateméticos, 82, 86, 88, 92 ~na andlise da variancia, 129 na estimativa por intervalos, 110 =na geragio de digitos pseudo-aleat6rios, 2 na organizagao dos valores das amostrais, 22 no intervalo de confianga da média, 113 = para intervalo de confianga da média, 113 para diferenga de médias, 116 para diferenga de proporSes, 118 uso de, principios do, 151 + valor esperado, 80 Célculo das medidas mais importantes, 39 Céloulos a partir de dados anotados, 11 Censo, 6 Coeficiente de variagao, 42 Coondenadas cartesianas de P, 52 Conelagio, 130, 135 sobservagées numéricas: coeficiente de Pearson, 135-139 ~observagies ordenadas: coeficiente de Spearman, 139 D Dados brutos =da amostra, 22 - da populagao, 37 Decisdes estatfsticas, 103 Desvia padtao, 35 Diagrama de dispersio, $1, 52, 130 Diferenga entre duas médias, 124 Digitos pseudo-aleatérios = geragdo de, 12 stabela de, 9 Distribuigso ~amostral, 105 ‘da média aritmética, 105, 107 binomial, 82 - de DeMoivte-Laplace-Gauss, 89 = de probabilidade, 73, ~ exponencial, 88 F, 114-116 idades Indice Alfabético Poisson, 85 = quiquadrado, 119 E Escalas que caracterizam as unidades de observacio, 5 intervalar, 6 nominal, 5 - ordinal, 5 =proporcional, 6 Espago amostral, 68 Estatfstica, 2, 104 de teste, 121 + descritiva, 10, 22, 41, 64 - matemtica, 62 -hio-tendenciosa, 107 - visto sistémica da, 11 Estimador, 107 = preciso do, 108 Estimativa(s) ~pontuais, 105 + por intervalo, 108 ~-de confianga para a média, 110 Evento =coletivamente exaustivo, 68 ~complemento, 68 =composto, 68 ~elementar, 68 + independente, 68 = mutuamente excludentes, 68 Excel ~construgao de gréficos no, 54 ~determinagio ~ -da média ariumética da amostra, 25, 27, 28 = -da média geométrica da amostra pelo, 29 ~da mediana da amostra, 30 = -da moda da amostra, 32 = ~das medidas de variabilidade, 36 Adistribuigao F no, 114 + distribuigdo quiguadraco no, 120 + distribuigao t de Student no, 113 + gtificos no, 158 = de barra, 158 ~-de colunas, 164 ~=de dispersio, 165 = -de pontos, 165 = de setores, 164 + -folla ‘alinhamento, 162 fonte, 162 debs, 161 ~ -histograma, 165 --seqiencial, 165 + iniciando 0, 156 + introdugdo a0, 155-165 = medidas de variabilidade no, 39 ~ medidas mais importantes no,40 ‘modelos matematicos no, $3, 86, 88, 92 171 na anélise da varincia, 129 nas estimativas por intervalo, 111 SOMARPRODUTO no, 81 “testes de hipéteses no, 124 = valor esperado, 80 Experimento aleatério, 67 F Fenomenos aleatorios, 66 Formula(s) + determinagio ~ da média aritmética da amostra, 24, 26 ~ da mediana da amostra, 30 = =da moda da amostra, 32 + para estimativas por intervalos, 110 - para intervalo de confianga = -da média ~~ para diferenga de médias de populagses, 114, 117 ++ quando ndo se conhece a variancia da populagdo, 113 = para diferenga de proporgées, 118 | = =para proporgses, 117 Frequncia + absoluta, 43 -acumulada, 46 = relativa, 65 Fungo = ALEATORIOENTRE, 13-14 = CORREL, 139 ~densidade de probabilidade, 77, 78 -DESVPAD, 37 - DISTNORMP, 93 -DIST.QUI, 120 | = DISTEXPON, 88 - DISTRBINOM, 83 -DISTT, 113 s INTCONFIANGA, 111 = INTERCEPCAO, 134 ~ INVNORM, 93 -INV.NORMP, 93, -MODO, 32 ~ PADRONIZAR, 92 = POISSON, 86 - VAR, 37, G Goragdo de nimero aleatério, 15 Graficos construgiio de, 48 =de barras, 49,'53, 158 justapostas, 49 de colunas, 50, 53, 164 = justapostas, $0 de pontos, 50, 51, $4, 165 em linha, 52, 54 ~em setores, 50, 51, 53, 168 que enganam, $4 = seqlencial, 52, 54, 165 172 H Hipéteses, testes de, 121 alternativa, 121 serros, 123 a, 123 =B. 123, tipo 1, 123 ipo Hl, 123 ula, 121 Histograma, 51, 165 seonstrigao do, 54 1 Inferéncia estatistica, 10, 22, 103, Informagaes, 22 Intemet, navegando na ~ amostragem estratificada, 10 + analise explorat6ria de dados, 22 + distribuigdo quiquadrado, 119 + discribuigao t de Student, 111 ~ grificos ma, 48 = mediana da amostra, 32 moda, 33, = modelos matemiticos, 95 Intervalo de confianga, 109 para a diferenga de médias, 116 + caleuladoras, uso de, 117 = férmulas, uso de, 117 ~ para a média, 110 = para a varidncia, 118. = para diferengs de médias de populagdes, 114 “conhecendo a variancia, 114 = =sem conhecer a varineia, 114 = pata diferenga de proporgies, 118 = -calenladoras, uso de, 118 + -frmulas, uso de, 118. ~ para proporgies, 117 + -calculadoras, uso ée, 117 + =fGrmulas, uso de, 117 L Lei dos grandes nimeros, 67 M Média, 24 + aritmética, 46 ~ -da amostra, determinagdo, 24 = += com a calculadora, 24-25, 28 +++ com a linguagem natural, 24, 28 === com fSenmuas, 24,28 =~ ~com 0 Excel, 25, 29 = -de uma populagio finita de tamanho N, 37 - -distribuigao amostral da, 105 = =ponderada de uma populagio finita de tamanho N, 37 - geométrica = da amostra, 28 = -de uma populagdo finita de tamanho N, 38 hndice Alfabsico ponderada da amostra, determinagio, 26 com a calculadora, 26-27 com a linguagem natural, 26 com formulas, 26 = -com 0 Excel, 27 Mediana, 46 da amostra, determinac0, 30 ‘com a calculadora, 30 ‘com a linguagem natural, 30, ‘com © Exeel, 30 ‘com f6rmulas, 30 = de uma populacio finita de tamanho N, 38 Medida(s) de dispersio, 33 -de tendéncia central, 2 “de variabilidade, 38 ‘com 2 ajuda Jo Excel, determinagao, 36 amplitude total da amostra, 36 desvio padrao amosteal, 37 varigneia da amostra, 37 = com a calculadora, 38 + por meio de formulas, determinagao, 35 desvio padrio amostral, 35 = variincin amostral, 35 = mais importantes, célculo das, 39 = com calculadoras, 39 = -com Excel, 40 Método estatistico, 2 ‘Moda, 32, 46 =da amostra, determinacto da, 32 = -com férmulas, 32 = com linguagem natural, 32 = =com o Excel, 32 de uma populacio finita de tamanho N, 38 Modelo(s) = matematicos, 82 N ‘Navegando na Internet, ver Internet P Pardmetro, 34, 104 =estimagio de, 10S Populagio, 2 = amostra, 7 ~amostragem, 7 = -aleatéria simples, 8 + sestratificada, 10 + -sistemética, 8 ~4rea de abrangéneia, 3 ~base amostral, 8 =censo, 6 cescalas que caructerizam as unidades de observagio, 5 intervalar, 6 ~-nominal, 5 = ordinal, 5 = =proporcional, 6 = finita, 2 infinita, 3 =tabela de digitos pscudo-aleat6rios, 9 37, 45 Indice AYaberico ~tamanho da, 3 média aritmética, 37 média geométrica, 38 mediana, 38 moda, 38 -unidade amostral, 8 - unidade de observagio, 3 Procisdo do estimador, 108 Probabilidade, 11 =a posteriori, 67 =a priori, 64, 66 cedleulos da, 79 =condicional, 69 + distribuigao de, 73 Probabilidades, 61-102 ~4rvore de, 70 ~eoneeito de, 63 ~condicional, 69 -de eventos nio-elementares, 69 + determinagao de uma medida de tendéncia central e dispersia no cilculo das, 79 ~determinagdo de, 73

Vous aimerez peut-être aussi