Vous êtes sur la page 1sur 176

CURSO DE ESTATSTICA APLICADA

Prof. Henrique Dantas Neder Departamento de Economia Universidade Federal de Uberlndia.

SUMRIO
1. Introduo.......................................................................................................4 2. Estatstica Descritiva.......................................................................................8 2.1 Tipos de Variveis .......................................................................................8 2.2 Tabelas e Distribuies de Freqncia......................................................10 2.3 Histogramas...............................................................................................13 2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas...........14 2.5 Medidas de Posio e de Disperso .........................................................17 2.5.1 Uma Nota sobre Notao Estatstica ...............................................18 2.5.2 A Mdia Aritmtica No Ponderada..................................................19 2.5.3 A Mdia Aritmtica Ponderada .........................................................20 2.5.4 Propores como Mdias .................................................................21 2.5.5 A Mdia Geomtrica ..........................................................................22 2.5.6 A Mdia Harmnica............................................................................26 2.5.7 A Mediana ...........................................................................................27 2.5.8 A Mdia para Dados Agrupados .......................................................28 2.5.9 A Mediana para dados Agrupados ...................................................30 2.5.10 A Moda para dados Agrupados ......................................................32 2.5.11 O Intervalo (ou amplitude)...............................................................39 2.5.12 Percentis, Decis e Quartis...............................................................41 2.5.13 Varincia e Desvio Padro ..............................................................42 2.5.14 Varincia e Desvio Padro para Dados Agrupados......................44 2.5.15 Interpretando e Aplicando o Desvio Padro..................................46 2.5.16 Coeficiente de Variao ..................................................................47 2.6 Medidas de Assimetria...............................................................................49 2.7 Curtose: uma medida de achatamento......................................................50 3. Probabilidade..................................................................................................53 3.1 Definio Clssica de Probabilidade ........................................................54 3.2 Conceito da Freqncia Relativa ...............................................................56 3.3 Probabilidade Subjetiva ............................................................................57 3.4 Algumas Regras Bsicas de Probabilidade ...............................................57 3.5 A Regra do Complemento .........................................................................58 3.6 A Regra Geral da Adio ...........................................................................60 3.7 Regras de Multiplicao............................................................................62 3.8 Probabilidade Condicional .........................................................................64 3.9 Diagramas em rvore ................................................................................66 3.10 Teorema de Bayes ..................................................................................67 Anexo 1 Recordando Definies e Conceitos ..............................................68 Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades ......................................................................................................................72 Anexo 3 - Probabilidade Condicional............................................................77 Resumo do Clculo de Probabilidades............................................................81 Exerccios de Probabilidade ............................................................................83

4. Variveis Aleatrias Discretas ......................................................................101 4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta .......................................................................................................................105 4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta..........................................................................................................106 4.3 A Distribuio de Probabilidade Binomial ................................................109 4.4 A Mdia e Varincia De Uma Distribuio Binomial ................................112 Apndice 1 (Recordao) ..............................................................................113 Apendice 2 (Recordao) ..............................................................................114 Apndice 3 (Recordao) ..............................................................................116 Apndice 4 (recordao)................................................................................119 Valor Esperado e Varincia de uma Varivel Aleatria ..............................119 Variveis Aleatrias Independentes ..............................................................126 5. Variveis Aleatrias Contnuas e Distribuio Normal..................................129 5.1 Variveis Aleatrias Contnuas................................................................129 5.2 Mdia e Varincia de uma Varivel Aleatria Contnua...........................130 5.3 Varivel Aleatria Normal ........................................................................131 5.4 Distribuio Normal Padro .....................................................................133 5.5 reas Abaixo da Curva Normal ...............................................................135 6. Mtodos de Amostragem e Distribuies Amostrais ....................................142 6.1 Amostragem Probabilstica ......................................................................143 6.2 Teorema do Limite Central ......................................................................147 6.3 Estimativa de Ponto .................................................................................148 6.4 Estimativa de Intervalo.............................................................................149 6.5 Intervalo de Confiana para Uma Proporo Populacional .....................150 6.6 Fator de Correo de Populao Finita ...................................................151 6.7 Selecionando uma Amostra.....................................................................152 6.8 Tamanho Amostral para Estimativa de Propores ................................153 7. Teste de Hipteses Amostras Grandes .....................................................154 7.1 Testes de Significncia Unicaudais .........................................................156 7.2 Testes de Significncia Bicaudais ...........................................................157 7.3 P-value de um Teste de Hiptese............................................................158 7.4 Clculo do P-value...................................................................................159 7.5 Teste de Hipteses: Duas Mdias Populacionais....................................160 7.6 Testes Referentes a Proporo ...............................................................162 Exerccios : ....................................................................................................166

1. Introduo
A Significncia e a Abrangncia da Estatstica Porque a estatstica importante? Os mtodos estatsticos so usados hoje em quase todos os campos de investigao cientfica, j que eles capacitam-nos a responder a um vasto nmero de questes, tais como as listadas abaixo:
1) 2) 3) 4)

Como os cientistas avaliam a validade de novas teorias? Como os pesquisadores mdicos testam a eficincia de novas drogas ? Como os demgrafos prevem o tamanho da populao do mundo em qualquer tempo futuro? Como pode um economista verificar se a mudana atual no ndice de Preos ao Consumidor a continuao de uma tendncia secular, ou simplesmente um desvio aleatrio? Como possvel para algum predizer o resultado de uma eleio entrevistando apenas algumas centenas de eleitores ? Estes so poucos exemplos nos quais a aplicao da estatstica

5)

necessria. Podemos presumir que a matemtica uma das rainhas das cincias porque ela fornece a estrutura terica para quase todas as outras cincias. Se voc j fez um curso bsico de fsica, j est familiarizado com algumas das leis matemticas que governam temas to diversificados como gravidade, energia, luz, eletricidade, etc. Mas tambm devemos considerar o fato de que as teorias matemticas esto sendo desenvolvidas todos os dias em muitas reas por estatsticos tericos - pessoas treinadas em teoria estatstica e probabilidade. Para citar alguns poucos casos ilustrativos elas so

desenvolvidas para teoria dos vos espaciais em fsica; para teorias do conhecimento do comportamento animal e humano em psicologia; para teorias da migrao e dos diferenciais de raa em sociologia; para teorias de epidemias em sade pblica;...

De fato, a estatstica tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em contato com dados quantitativos ou tiram concluses a partir destes. O que Estatstica ? palavra Estado, j que foi a funo tradicional de governos centrais no sentido de armazenar registros da populao, nascimentos e mortes, produo das lavouras, taxas e muitas outras espcies de informao e atividades. A contagem e mensurao dessas quantidades gera todos os tipos de dados numricos que so teis para o desenvolvimento de muitos tipos de funes governamentais e formulao de polticas pblicas. Dados numricos so de fato uma parte da Estatstica, mas so apenas a matria-prima, que precisa ser transformada pelos mtodos estatsticos para posterior anlise. A Estatstica, como um mtodo cientfico, refere-se ao projeto de experimentos e a descrio e interpretao de observaes que so feitas. De um ponto de vista moderno, a Estatstica freqentemente definida como um mtodo de tomada de deciso em face da aleatoriedade dos fenmenos. Em uma mais vasta perspectiva, o escopo da estatstica pode ser pensado em termos de trs reas diferentes de estudos: (1) a Estatstica Descritiva (2) A Estatstica Indutiva e (3) A Teoria da Deciso Estatstica. Estatstica Descritiva A estatstica Descritiva refere-se ao corpo de mtodos desenvolvidos para coletar, organizar, apresentar e descrever dados numricos. Essa rea da Estatstica refere-se s seguintes tarefas:
1) 2)

A noo de Estatstica foi originalmente derivada da mesma raiz da

Encontrar um mtodo apropriado de coletar dados numricos eficientemente e acuradamente para um dado problema. Determinar um formato eficiente , tal como uma apresentao tabular, para a organizao dos dados de uma forma sistemtica e ordenada, de maneira
5

que a informao fornecida pelos dados possa ser observada com grande facilidade e preciso.
3)

Apresentar dados numricos, seja organizados ou no, de forma que as caractersticas e o comportamento dos dados so clara e facilmente revelados. Tais apresentaes So feitas por meio de mtodos grficos.

4)

Sumarizar ou descrever cada caracterstica ou propriedade dos dados por um simples nmero, tal como uma mdia, uma porcentagem ou alguma outra medida apropriada, a qual calculada a partir dos dados por meio de uma frmula derivada a partir de algum princpio vlido.

Estatstica Indutiva

A Estatstica Indutiva, que tambm freqentemente chamada de

inferncia estatstica ou estatstica inferencial, em contraste com a estatstica descritiva, essencialmente analtica em sua natureza. Consiste de um conjunto de princpios ou teoremas que nos permitem generalizar acerca de alguma caracterstica de uma populao a partir das caractersticas observadas de objetos, coisas ou pessoas a respeito das quais a informao desejada para a uma amostra. Nessa definio, uma populao o conjunto de todos os itens, soluo de um problema. Uma amostra um grupo de itens selecionados por um mtodo cuidadosamente concebido e projetado a partir de uma populao. Existem diferentes tipos de amostras, dependendo dos diferentes mtodos de seleo disponveis. Uma amostra aleatria simples, falando em termos simplificados, aquela que selecionada de tal forma que cada e todos os itens na populao tem a mesma chance de serem includos na amostra. ela chamada de parmetro populacional, ou simplesmente parmetro; se Se uma medida descritiva calculada a partir dos dados da populao

calculada a partir dos dados da amostra ela chamada de estatstica amostral, estatstica indutiva como o processo de generalizar acerca de do valor de um

ou simplesmente estatstica. Considerando esses conceitos podemos definir parmetro a partir do valor de uma estatstica. Existem dois procedimentos de inferncia distintos mas relacionados: estimao e teste de hipteses.
6

Estimao processo de usar o valor de uma estatstica amostral para estimar o valor de um parmetro que desconhecido, mas uma constante. Como um exemplo suponhamos que temos uma populao de 100.000 bolas de gude em um saco, todas as quais so idnticas exceto pela cor, e que no podemos vlas embora saibamos que uma parte delas so brancas e o restante so pretas. Suponha que desejamos ter uma idia da proporo de, digamos, bolas brancas nessa populao. Suponha que para conseguir isso selecionamos 1.000 bolas aleatoriamente do saco e verificamos que 350 so brancas. Isso significa que nossa proporo amostral de bolas brancas 35 %. A partir disso conclumos que a proporo populacional de bolas brancas tambm 35 %. Fazendo isso ns realizamos o que chamado de estatstica pontual. Mas afirmar que a proporo de bolas brancas em toda a populao

exatamente igual a proporo daquela amostra particular como dar um tiro no escuro: o valor da proporo amostral um resultado aleatrio e depende de cada amostra de 1.000 bolas escolhida da populao. Pode ser que por uma enorme casualidade o resultado daquela amostra que escolhemos coincida exatamente com o valor da proporo de bolas brancas em toda a populao. Mas as chances de que isso no ocorra so muito grandes. Uma forma de contornarmos esse problema afirmarmos que as chances so de 95 em 100 (ou de 95 %) de que o intervalo formado pela proporo amostral acrescida e diminuda de 3 pontos percentuais contenha o verdadeiro valor da proporo populacional desconhecido. Ou seja, construmos um intervalo com limites 35 + 0,03 x 35 = 36,05 e 35 - 0,03 x 35 = 33,95 e afirmamos (com base em algum princpio obtido a partir da teoria estatstica) que as chances so de 95 em 100 de que o verdadeiro valor da proporo populacional esteja localizado dentro desse intervalo. Quando uma afirmativa dessa natureza feita estamos realizando o que se chama de estimativa por intervalo. Quanto ao segundo procedimento da estatstica inferencial deixaremos para coment-lo quando for abordado em sua ntegra. E o terceiro campo de estudos da Estatstica, a Teoria da Deciso Estatstica no ser discutido nessa apresentao.

2. Estatstica Descritiva
2.1 Tipos de Variveis Existem diversos tipos de variveis que sero utilizadas em um estudo estatstico. importante compreender o conceito matemtico de varivel. Varivel uma abstrao que se refere a um determinado aspecto do fenmeno que est sendo estudado. Podemos afirmar que a quantidade colhida da safra anual de soja uma varivel. Representemos essa varivel pela letra X. Essa varivel pode assumir diversos valores especficos, dependendo do anos de safra, por exemplo, X1986, X1990 e X1992. Esses valores que a varivel assume em determinados anos no so a prpria varivel , mas valores assumidos ela para determinados objetos ou pessoas da amostra ou da populao. Se uma amostra tiver 50 indivduos podemos referimo-nos a X como sendo a varivel nota de estatstica e a X30 como a nota de um indivduo particular, no caso o trigsimo. freqente tambm na literatura utilizar-se letras maisculas para a notao de variveis e as correspondentes letras minsculas para referncia aos valores particulares assumidos por essa varivel mas nesse resumo procuraremos evitar essa forma de notao. Variveis quantitativas - referem-se a quantidades e podem ser medidas em uma escala numrica. Exemplos: idade de pessoas, preo de produtos, peso de recm nascidos.

As variveis quantitativas subdividem-se em dois grupos: variveis quantitativas discretas e variveis quantitativas contnuas. Variveis discretas so aquelas que assumem apenas determinados valores tais como 0,1,2,3,4,5,6 dando saltos de descontinuidade entre seus valores. Normalmente referem-se a contagens. Por exemplo: nmero de vendas dirias em uma empresa, nmero

de pessoas por famlia, quantidade de doentes por hospital.1 As variveis quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o peso de pessoas, a renda familiar, o consumo mensal de energia eltrica, o preo de um produto agrcola.2 As variveis quantitativas contnuas referem-se ao conjunto dos nmeros reais ou a um de seus subconjuntos contnuos. Variveis Qualitativas - referem-se a dados no numricos.3 Exemplos dessas variveis so o sexo das pessoas, a cor, o grau de instruo. As variveis qualitativas subdividem-se tambm em dois grupos: as variveis qualitativas ordinais e as variveis qualitativas nominais. As variveis qualitativas ordinais so aquelas que definem um ordenamento ou uma hierarquia.
1

Uma varivel quantitativa discreta no precisa assumir necessariamente apenas valores de contagem, ou seja nmeros inteiros ou nmeros naturais em seqncia. Um exemplo de varivel quantitativa discreta seria, por exemplo, uma que assumisse apenas os seguintes valores : { 1; 3,5 ; 5,75 ; 10 }. Apesar dessa varivel abranger valores no inteiros ela apresenta saltos de descontinuidade: nesse exemplo ela no pode assumir nenhum valor intermedirio entre 1 e 3,5 ou entre 5,75 e 10.
2

Seria impossvel obter na prtica uma varivel perfeitamente contnua j que os instrumentos de medida no tem preciso infinita. Por exemplo., o peso de pessoas medido com uma balana com preciso, digamos, de dcimos de gramas. Ento jamais conseguiremos obter um valor para essa varivel que se localize entre 50.000,1 e 50.000,2 gramas, por exemplo, 50.000,15 gramas. Ocorre portanto um salto de descontinuidade entre os dois valores possveis de serem medidos e a varivel, do ponto de vista terico, no pode ser considerada como varivel quantitativa contnua, mas varivel quantitativa discreta. Mas do ponto de vista prtico, acabamos freqentemente por consider-la e trat-la como sendo uma varivel quantitativa contnua, apesar dessa falta de preciso absoluta. O mesmo podemos dizer para o caso da renda ou qualquer outra varivel econmica medida em unidades monetria: no existe uma renda de por exemplo R$ 200,345 j que o centavo a menor diviso do sistema monetrio. Mas de qualquer forma, costuma-se tratar a renda como varivel quantitativa contnua e no discreta.
3

muito comum considerar-se que a estatstica apenas abrange os estudos que utilizam as variveis quantitativas. Nada mais equivocado. Existe um vasto

Exemplos so o grau de instruo, a classificao de um estudante no curso de estatstica, as posies das 100 empresas mais lucrativas, etc. As variveis qualitativas nominais por sua vez no definem qualquer ordenamento ou hierarquia. So exemplos destas a cor , o sexo, o local de nascimento, etc.4 Dependendo da situao uma varivel qualitativa pode ser representada (codificada) atravs de emprego de nmeros (por exemplo: em sexo representamos homens como sendo 0 e mulheres como sendo 1). Mas no tratamento estatstico dessa varivel codificada no podemos consider-la como sendo quantitativa. Ela continua sendo uma varivel qualitativa (pois o em sua essncia e natureza) apesar de sua codificao numrica que tem como finalidade uma maior finalidade de tabulao de resultados. No podemos dizer que para qualquer uma destas categorias qualquer mtodo estatstico pode ser adequadamente aplicado. As variveis quantitativas contnuas so aquelas que permitem a utilizao de um conjunto maior e superior de mtodos estatsticos e so, sem dvida, as variveis mais passveis de um rico tratamento estatstico. Em seguida vm, nessa ordem, as variveis quantitativas discretas, as variveis qualitativas ordinais e por ltimo, as variveis qualitativas nominais Essas ltimas so as que permitem a utilizao de um menor e menos poderoso arsenal de instrumentos estatsticos de anlise. 2.2 Tabelas e Distribuies de Freqncia A anlise estatstica se inicia quando um conjunto conjunto de dados torna-se disponvel de acordo com a definio do problema da pesquisa. Um conjunto de dados, seja de uma populao ou de uma amostra contem muitas vezes um nmero muito grande de valores. Alm disso, esses valores, na sua forma bruta, encontram-se muito desorganizados. Eles variam de um valor para outro sem qualquer ordem ou padro. Os dados precisam ento ser organizados campo de aplicaes estatsticas em que so empregadas as variveis qualitativas, tanto isoladamente como em conjunto com variveis quantitativas. 4 No podemos dizer que a cor X superior a cor Y mas podemos afirmar que o terceiro ano do segundo grau superior hierarquicamente ao primeiro ano do primeiro grau.
10

e apresentados em uma forma sistemtica e seqencial por meio de uma tabela ou grfico. Quando fazemos isso, as propriedades dos dados tornam-se mais aparentes e tornamo-nos capazes de determinar os mtodos estatsticos mais apropriados para serem aplicados no seu estudo. Suponhamos o seguinte conjunto de dados:

14 16 11 14 12

12 14 13 13 12

13 14 14 14

11 15 15 13

12 17 13 15

13 14 12 16

Para montarmos uma distribuio de freqncias desses dados verificamos quais so os valores no repetidos que existem e em uma primeira coluna de uma tabela colocamos esses valores e na segunda coluna colocamos o nmero de repeties de cada um desses valores. Para o exemplo acima, a distribuio de freqncias ser :

Varivel 11 12 13 14 15 16 17

freqncia 2 5 6 7 3 2 1

11

observao no conjunto de observaes. A distribuio de freqncia uma funo formada por pares de valores sendo que o primeiro o valor da observao (ou valor da varivel) e o segundo o nmero de repeties desse valor. Freqncias Relativas e Acumuladas Para o exemplo acima tambm podemos calcular a freqncia relativa referente a cada valor observado da varivel. A freqncia relativa o valor da frequncia absoluta dividido pelo nmero total de observaes. Varivel 11 12 13 14 15 16 17 TOTAL freqncia absoluta 2 5 6 7 3 2 1 26 freqncia relativa 2/26 = 0,0769 5/26 = 0,1923 6/26 = 0,2308 7/26 = 0,2692 3/26 = 0,1154 2/26 = 0,0769 1/26 = 0,0385 1,0000

A freqncia de uma observao o nmero de repeties dessa

Podemos tambm calcular as freqncias acumuladas. Nesse caso existem as freqncias absolutas acumuladas e as freqncias relativas acumuladas. 5 Varivel freqncia absoluta freqncia relativa freqncia absoluta freqncia relativa

Observe que os valores da ltima coluna (freqncia relativa acumulada) podem ser calculados de duas maneiras. Na primeira, tal como feito na tabela a seguir, dividimos o valor da freqncia absoluta acumulada pelo total de observaes. Na segunda maneira, acumulamos o valor da freqncia relativa. Este ltimo mtodo pode levar a acmulos de erros, de forma que o ltimo valor de freqncia relativa acumulado se distancie consideravelmente de 1.
5

12

11 12 13 14 15 16 17 TOTAL

2 5 6 7 3 2 1 26

2/26 = 0,0769 5/26 = 0,1923 6/26 = 0,2308 7/26 = 0,2692 3/26 = 0,1154 2/26 = 0,0769 1/26 = 0,0385 1,0000

acumulada 2 7 13 20 23 25 26

acumulada 2/26 = 0,0769 7/26 = 0,2692 13/26 = 0,5000 20/26 = 0,7692 23/26 = 0,8846 25/26 = 0,9615 26/26 = 1,0000

2.3 Histogramas Histograma uma representao grfica de uma tabela de distribuio de frequncias. Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas) colocamos os valores da varivel em estudo e no eixo vertical

(ordenadas) colocamos os valores das freqncias. O histograma tanto pode ser representado para as freqncias absolutas como para as freqncias relativas. No caso do exemplo anterior, o histograma seria:

Histograma
7 6 5 4 3 2 1 0 Bloco Mais 11 12 13 14 15 16 17

Freqncia

Freqncia

13

histograma de frequncia acumulada (ou ogiva) a representao grfica do comportamento da frequncia acumulada. Na figura abaixo a ogiva mostrada em sobreposio ao histograma.

Histograma
7 6 5 4 3 2 1 0 Bloco Mais 11 12 13 14 15 16 17 100,00% 80,00% 60,00% 40,00% 20,00% ,00% Freqncia % cumulativo

2.4 Tabulao de Freqncia e Histograma para Variveis Contnuas At agora vimos como so calculadas as freqncias (relativas e acumuladas) para variveis quantitativas discretas. Nesse caso a tabulao dos resultados mais simples. Mas quando tratamos de variveis quantitativas contnuas os valores observados devem ser tabulados em intervalos de classes. Para a determinao dessas classes no existe uma regra pr estabelecida, sendo necessrio um pouco de tentativa e erro para a soluo mais adequada. Suponhamos que as safras agrcolas de um determinado produto, em uma determinada regio seja dada pela tabela a seguir: Ano 1 2 3 4 5 Safra (1000 t) 280 305 320 330 310 Ano 10 11 12 13 14 Safra (1000 t) 365 280 375 380 400
14

Freqncia

6 7 8 9

340 310 340 369

15 16 17 18

371 390 400 370

Devem ser seguido alguns passos para a tabulao de freqncias de dados que se referem a uma varivel quantitativa contnua, como o caso de nosso exemplo. 1. Definir o nmero de classes. O nmero de classes no deve ser muito baixo nem muito alto. Um nmero de classes pequeno gera amplitudes de classes grandes o que pode causar distores na visualizao do histograma. Um nmero de classes grande gera amplitude de classes muito reduzidas. Foram definidas regras prticas para a determinao do nmero de classes, sendo que este deve variar entre 5 e 20 (5 para um nmero muito reduzido de observaes e 20 para um nmero muito elevado). Se n representa o nmero de observaes (na amostra ou na populao, conforme for o caso) o nmero aproximado de classes pode ser calculado por Nmero de Classes = e 18 = 4,24 e podemos adotar um nmero de 5 classes, que ser razovel.
n

arredondando os resultados. No caso do exemplo anterior temos n = 18 2. Calcular a amplitude das classes. Essa ser obtida conhecendo-se o nmero de classes e amplitude total dos dados. A amplitude total dos dados o resultado da subtrao valor mximo - valor mnimo da srie de dados. A amplitude de classe ser:
Amplitude de classe = Valor Maximo - Valor Minimo nmero de classes

Em geral, o valor do resultado tambm arredondado para um nmero inteiro mais adequado. No nosso exemplo temos:

15

Amplitude de Classe =

430 - 280 = 30 5

3. Preparar a tabela de seleo com os limites de cada classe. Na tabela abaixo apresentamos para os dados do nosso exemplo os limites inferior e superior de cada uma das 5 classes de freqncia. Classe 1 2 3 4 5 Limite inferior 280 310 340 370 400 Limite Superior 310 340 370 400 430

Observa-se na tabela acima que o limite superior de cada classe coincide com o limite inferior da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observao seja exatamente igual ao valor do limite de classe deve-se estabelecer um critrio de incluso. Para evitar esse tipo de dificuldade normalmente se estabelece que o limite superior de cada classe aberto (e consequentemente, o limite inferior de cada classe fechado), ou seja, cada intervalo de classe no inclui o valor de seu limite superior, com exceo da ltima classe. 4. Tabular os dados por classe de freqncia. A partir da listagem de dados seleciona-se para cada um deles qual a sua classe de freqncia e acumula-se o total de freqncia de cada classe. De acordo com nosso exemplo, teremos: Classe Freqncia Absoluta Simples Freqncia Relativa Simples

16

280 - 310 310 - 340 340 - 370 370 - 400 400 - 430 Total

3 4 6 7 5 25

0,12 (12 %) 0,16 (16 %) 0,24 (24 %) 0,28 (28 %) 0,20 (20%) 1,00 (100 %)

Veremos adiante, quando discutirmos as medidas de posio e de disperso, que quando agrupamos dados numricos em intervalos de classe ocorre perda de informao o que leva a resultados no to precisos do que aqueles que seriam obtidos a partir dos dados originais sem agrupamento. 2.5 Medidas de Posio e de Disperso Podemos considerar que a Estatstica Descritiva subdivide-se em duas partes. Na primeira, abordada anteriormente, so estudadas as formas de apresentao dos dados para que fiquem salientadas as suas caractersticas principais. Na segunda, que comearemos a tratar agora, abrange as medidas descritivas na forma de simples nmeros que representam de forma sinttica essas caractersticas da distribuio estatstica dos dados. Estudaremos, a rigor, quatro tipos de medidas:

1. Medidas de Tendncia Central (ou medidas de posio). Essa propriedade dos dados refere-se a localizao do centro de uma distribuio. Elas nos indicam qual a localizao dos dados ( no eixo que representa o conjunto dos nmeros inteiros se estivermos tratando de uma varivel quantitativa contnua). 2. Medidas de Disperso. Essa propriedade revela o grau de variao dos valores individuais em torno do ponto central. 3. Assimetria. a propriedade que indica a tendncia de maior concentrao dos dados em relao ao ponto central.

17

4. Curtose. a caracterstica que se refere ao grau de achatamento, ou a taxa na qual a distribuio cresce ou cai da direita para a esquerda. 2.5.1 Uma Nota sobre Notao Estatstica Utilizaremos as letras maisculas para representar as variveis, como por exemplo a varivel X. Os valores individuais que uma varivel pode assumir so representados pelas correspondentes letras minsculas. Por exemplo se X numrico do peso de uma dessas 50 pessoas. Diferentes valores de uma varivel so identificados por subscritos. Assim, os pesos de 50 pessoas em uma amostra podem ser denotados por x1, x2, ..., x50. nmero total de observaes em uma populao finita designado por N e na amostra representado por n. A distino entre medidas descritivas para populaes e amostras muito importante. usado para designar o peso de uma amostra de 50 pessoas, ento x o valor

Denotaremos os parmetros (medidas referentes a populao) por letras gregas ou letras minsculas em portugus. As estatsticas amostrais sero representadas por letras maisculas em portugus e os valores observados de uma estatstica amostral pela

correspondente letra minscula em portugus. Por exemplo, as medidas descritivas a serem introduzidas nessa seo sero denotadas como segue: Nome da Medida mdia aritmtica proporo mdia geomtrica mdia harmnica mediana moda Parmetro m Notao da Estatstica X P G H X.5 Xm Valor observado x p g h x.5 xm

p ~ g
~ h ~ x

~ xm

.5

18

2.5.2 A Mdia Aritmtica No Ponderada de observaes. Se tivermos, por exemplo, n valores, temos:
x1 + x 2 +...+ x n X = = n

A mdia definida como a soma das observaes dividida pelo nmero

x
n i =1

Propriedades da mdia aritmtica no ponderada: 1. A mdia um valor tpico, ou seja, ela o centro de gravidade da distribuio, um ponto de equilbrio. Seu valor pode ser substitudo pelo valor de cada item na srie de dados sem mudar o total. Simbolicamente temos:

n( X ) = x

(6)

2. A soma dos desvios das observaes em relao a mdia igual a zero.

(x - X ) = 0
3. A soma dos desvios elevados ao quadrado das observaes em relao a mdia menor que qualquer soma de quadrados de desvios em relao a qualquer outro nmero. Em outras palavras,

(x - X )

= um mnimo.

A idia bsica de selecionar um nmero tal que a soma dos quadrados dos desvios em relao a este nmero minimizada tem grande importncia na
6

- Utilizaremos muito freqentemente a notao

representar

x
n i =1

simplificadamente para

.
19

teoria estatstica. Ela chega a ter um nome especial : o princpio dos mnimos quadrados. Ela , por exemplo, a base racional do mtodo dos mnimos quadrados que usado para ajustar a melhor curva atravs de um conjunto de pontos em um sistema de eixos cartesianos, como veremos adiante. Esta propriedade tambm a base para o clculo de uma importante medida de disperso, que veremos logo a seguir. A validade dessas tr6es propriedades pode ser facilmente demonstrada por um exemplo numrico simples, mostrado na tabela a seguir. Nesta tabela, a coluna (1) contem o conjunto de dados cuja soma 9 e cuja mdia 3. A coluna (2) demonstra a primeira propriedade da mdia, ou seja, se cada uma das observaes individuais dos dados substituda pela mdia, a soma permanece igual a 9. A coluna (3) verifica que de fato Finalmente, as colunas (4), (5) e (6) demonstram que

(x - X )

(x - X ) = 0 .
= 14, que

menor que somas quando os desvios individuais so tomados a partir do nmero 2 e do nmero 5, respectivamente.

(1) x 1 2 6 Soma 9

(2)

(3)

x
3 3 3 9

(x - x)

(4)

(5)

(6)

(x - x) 2
4 1 9 14

(x - 2) 2
1 0 16 17

(x -5) 2
16 9 1 26

-2 -1 +3 0

2.5.3 A Mdia Aritmtica Ponderada No clculo da mdia aritmtica no ponderada todos os valores observados foram somados atribuindo-se o mesmo peso a todas observaes. Agora veremos uma nova forma de calcular a mdia. Consideremos um exemplo familiar de clculo da mdia de notas de estudantes, quando o exame final vale duas vezes mais do que as duas provas comuns realizadas no
20

decorrer do semestre. Se um determinado obter as notas 7, 5 e 8 a sua mdia ponderada final ser:
1 (7) +1 (5) + 2 8 =7 1+ 1+ 2

Em termos gerais, a frmula para a mdia aritmtica ponderada :


X w = wi xi = wx
n

onde wi o peso da observao i e n o nmero de observaes.

i =1

A soma dos pesos no pode ser igual a zero. Fora disto, no existe restrio para os valores dos pesos. Se todos os pesos forem iguais a 1, a mdia ponderada recai em seu caso particular, a mdia aritmtica no ponderada. O mesmo ocorre se todos os pesos forem iguais a uma constante c. Portanto, a mdia aritmtica no ponderada na realidade uma mdia aritmtica ponderada com pesos iguais. 2.5.4 Propores como Mdias Freqentemente encontramos populaes cujas unidades elementares podem ser classificadas em duas categorias: uma que tem um certo atributo e outra que no tem esse atributo. Nesse caso, estamos interessados na proporo de casos que possuem esse atributo. Uma proporo comumente pensada como uma frao ou porcentagem, mas tambm pode ser pensada como um caso especial de mdia. Suponha que queremos determinar a proporo de votantes entre os cidados brasileiros. Devemos primeiro designar um valor 1 para cada pessoa qualificada como eleitor e um valor 0 para cada pessoa no qualificada como eleitor. Ento, a soma dos 1s seria pela diviso da soma pelo nmero N total de pessoas no Brasil.
21

e a mdia seria a mdia seria obtida

A mdia da varivel x m = x N . No entanto essa mdia tambm uma proporo, a proporo de eleitores na populao brasileira.

2.5.5 A Mdia Geomtrica produto nos n valores amostrais. A mdia geomtrica de uma amostra definida como a raiz ensima do

G = n ( x1 )( x2 )...( xn )
Por exemplo, a mdia geomtrica de 5, 9 e 13 :

G = 3 (5)(9)(13) = 8,36
mdia aritmtica maior do que a mdia geomtrica para qualquer srie de valores positivos, com exceo do caso em que os valores da srie so todos iguais, quando as duas mdias coincidem. clculo da mdia geomtrica muito simples. Mas a sua interpretao e as sua propriedades tornam-se mais evidentes quando reduzimos a frmula a sua forma logartmica. Tomando logaritmos de ambos os lados da equao anterior teremos:
logG = log( n ( x1 )( x2 )...( xn ) ) = log x1 + log x2 +...+ log xn = n

Para a mesma srie de dados a mdia 9. sempre verdade que a

log x
n

A concluso que chegamos que o logaritmo da mdia geomtrica igual a mdia aritmtica dos logaritmos dos valores da srie. Verifica-se que a mdia geomtrica somente tem significado quando todos os valores da srie so todos positivos. Suponhamos como exemplo de aplicao de clculo da mdia geomtrica os dados da tabela seguinte que mostram as mudanas de preos de duas mercadorias, A e B, de 1980 a 1985. Durante esse perodo o preo de
22

A subiu 100 % e o preo de B decresceu 50 %. Qual foi a mudana mdia relativa de preos? Em outras palavras, qual foi o percentual mdio de mudana de preos?

Preos das Mercadorias A e B em 1980 e 1985 Preo Relativo de Preos 1980 = 100 Mercadoria A B 1980 R$ 50 R$ 20 Mdia Aritmtica Mdia Geomtrica 1985 R$ 100 R$ 10 1980 100 100 100 100 1985 200 50 125 100 1985 = 100 1980 50 200 125 100 1985 100 100 100 100

A mdia aritmtica fornece uma resposta incorreta para essa questo. Como indicado pelos clculos da tabela acima leva a duas concluses opostas. Se 1980 tomado como base para o relativo de preos, os preos so em mdia 25 % maiores em 1985 do que em 1980. Se 1985 tomado como base, os preos de 1980 so 25 % maiores do que os preos de 1985. Portanto, a mdia aritmtica dos relativos de preos conduz a resultados inconsistentes. geomtrica aplicada: de 1980, ou seja: No entanto, um resultado consistente obtido quando a mdia

1. Se 1980 escolhido como a base, os preos de 1985 so 100 % dos preos

23

g = 200 50 = 10.000 = 100

2. Se 1985 escolhido como a base, os preos de 1980 sero tambm 100 % dos preos em 1985, ou seja:
g = 50 200 = 100

A mais importante aplicao da mdia geomtrica refere-se talvez ao clculo de taxas de crescimento mdias, desde que essas podem ser corretamente medidas somente por esse mtodo. Para exemplificar, no campo da economia, esse ponto, suponha que a produo anual de um setor industrial cresceu de 10.000 para 17.280 unidades durante o perodo 1985-1988 como mostrado na tabela a seguir; qual a taxa mdia de crescimento anual? A taxa mdia anual de crescimento pode ser calculada a partir dos valores em porcentagem da produo em relao aos anos anteriores. Se calcularmos a mdia aritmtica desses valores teramos:
x = ( 60 + 96 + 300) / 3 = 152

implicando uma taxa de crescimento mdia de 152 -100 = 52 %. Se a produo cresce 52 % ao ano, comeando da produo de 1985 de 10.000 unidades, ento a produo de 1986 seria de

23.0 + 0,52 (10.000) = 15.200; a produo de 1987 seria de 15.200+ 0,52(15.200) = 23.104; a produo de 1988 seria de 23.104 + 0,52(23.104) = 35.118,08

Ano Produo Porcentagem do ano

1985 10.000

1986 6.000

1987 5.760

1988 17.280

24

anterior

60

96

300

Observe-se que este ltimo valor quase 200 % do valor efetivamente observado em 1988, de 17.200. A mdia geomtrica, por sua vez, :

g = 3 (60)(96)(300) = 120
implicando uma taxa anual mdia de crescimento de 120 - 100 = 20 %. Verificando, teremos: no ano de 1986: 10.000 + 0,20(10.000) = 12.000; no ano de 1987: 12.000 + 0,20(12.000) = 14.400; no ano de 1988: 12.000 + 0,20(14.400) = 17.280 que coincide com o valor observado efetivamente em 1988. Se o valor da mdia geomtrica das porcentagens de crescimento for menor do que 100, implica em uma porcentagem mdia de crescimento negativa, o que indica uma taxa mdia de declnio ao invs de uma taxa mdia de crescimento.7 Atente tambm para o fato de que as trs porcentagens a partir das quais a mdia geomtrica calculada so percentuais do ano anterior ao invs de mudana percentual do ano anterior.8 clculo da taxa mdia de crescimento baseado principalmente na hiptese de uma taxa constante de crescimento ou de que os valores individuais formam uma progresso geomtrica. Quando o clculo envolve um nmero considervel de perodos, utiliza-se com mais

Se, por exemplo, ao invs de 60, 96 e 300 %, como anteriormente, tivermos 60, 96 e 78 %, a taxa de crescimento geomtrica mdia ser de g = 3 (60)(96)(78) = 76,59 , o que indica um decrscimo mdio de 76,59 - 100 = 23,41 %. Essas ltimas porcentagens, referentes ao exemplo da tabela anterior, seriam (6.000 - 10.000)/10.000= - 0,40, ou seja - 40 %; (5.760 - 6.000)/6.000 = -0,04 , ou seja, - 4 %; e (17.280 - 5.760)/5760 = 2, ou seja + 200 %.
8

25

freqncia uma frmula que se relaciona com a mdia geomtrica, que : xf R = n x -1 i onde: R = taxa de crescimento geomtrica mdia, n = nmero de perodos de tempo, xf = valor no perodo final, xi = valor no perodo inicial. Para os dados da tabela anterior, teremos: 17.280 - 1 = 0,20 ou 20 % , como obtido anteriormente.9 Note que R = 3 10.000 R = G -1. 2.5.6 A Mdia Harmnica A mdia harmnica o inverso da mdia aritmtica dos inversos dos valores observados. Simbolicamente, para uma amostra, temos: 1 1 (1 / x ) = n

H=

1 1 x1 + x2 +...+ xn = n

n (1 / x)

Para clculos mais simples, a frmula anterior pode ser reescrita como:

- interessante notar que pelo clculo anterior empregam-se os valores dos anos intermedirios, ao passo que nesse ltimo, apenas empregam-se os valores do perodo inicial e final, no importando o que ocorreu nos perodos intermedirios.
26

H=

x1 +

x2 +...+ n

xn

(1 / x )
n

A mdia harmnica dos trs valores 4, 10 e 16 : 1 +1 +1 4 10 16 = 0,1375 H= 3 H = 7,27 1

Para os mesmos dados a mdia aritmtica 10 e a mdia geomtrica

8,62. Para qualquer srie de dados cujos valores no so todos os mesmos e que no incluem o zero, a mdia harmnica sempre menor que tanto a mdia aritmtica como a mdia geomtrica. 2.5.7 A Mediana A mediana o valor do item central da srie quando estes so arranjados em ordem de magnitude. Para a srie R$ 2, R$ 4, R$ 5, R$ 7 e R$ 8, a mediana o valor do terceiro item, R$ 5. No caso do nmero de itens na srie ser par, a mediana a semi-soma dos dois valores mais centrais. Por exemplo, para a srie 3, 5 ,8 ,10, 15 e 21 kg, a mediana a media dos valores 8 e 10, ou seja 9. A mediana pode ser formalmente definida como o valor que divide a srie de tal forma que no mnimo 50 % dos itens so iguais ou menores do que ela, e no mnimo 50 % dos itens so iguais ou maiores do que ela. Mais rigorosamente, estabelecemos que: X.5 = o valor do [(n+1)/2] -simo item Por exemplo, para uma srie formada pelos valores 3,5,8,10,15 e 21 a mediana ser o valor do [(6+1)/2] = 3,5 simo item, ou seja, a semi soma do item de posto 3 e do item de posto 4, que so 8 e 10.
27

O valor da mediana

no influenciado pelos valores nas caudas

de uma distribuio. Por exemplo, se temos a srie de dados 1,2,3,4,5 a mediana 3. Se substitumos os valores das caudas dessa distribuio por quaisquer valores uma nova distribuio formada poderia ser formada pela srie -1000,-100,3,500,5000 e a mediana permanece sendo 3. Portanto, ela uma medida de posio da distribuio bem adequada para distribuies assimtricas, tais como a distribuio de renda, j que no sabemos se a famlia mais rica ganha R$7.000.000 ou R$ 500.000.000. Veremos, mais a frente que ela possui vantagens em relao a mdia aritmtica, como medida de posio (ou medida de tendncia central) para dados agrupados em classes de freqncia, quando a ltima classe tem limite superior indeterminado. A mediana tambm tem a interessante propriedade de que a soma dos desvios absolutos das observaes em relao a mediana menor do que a soma dos desvios absolutos a partir de qualquer outro ponto na distribuio. Simbolicamente:

x- X

.5

= um mnimo

2.5.8 A Mdia para Dados Agrupados Quando estamos tratando de amostras ou populaes muito grandes conveniente calcular as medidas descritivas a partir das distribuies de freqncia. A mdia no pode ser determinada exatamente a partir de distribuies de freqncia, mas uma boa aproximao pode ser obtida pela hiptese do ponto mdio. A aproximao quase sempre muito satisfatria se a distribuio bem construda.10 A hiptese do ponto mdio refere-se a considerar-se de que todas as observaes de uma dada classe esto centradas no ponto mdio daquela classe. Consequentemente, o valor total da freqncia da classe da i-sima classe simplesmente o produto fi mi, onde fi Isto , principalmente se no agrupamento dos dados originais em uma tabela de distribuio de freqncia, empregou-se um nmero adequado de classes de freqncia.
10

28

a freqncia (absoluta simples) da classe i e mi ponto mdio da classe i. Sob essa hiptese, a mdia aproximada para uma distribuio de uma amostra com k classes vem a ser: X@ f 1m1 + f 2 m2 +...+ f k mk @ f 1 + f 2 +...+ f k

fm n

fm f

importante notar que todos os somatrios na equao acima referemse s classes e no s observaes individuais. extrados de uma pesquisa de oramentos familiares. Consideremos a seguinte

tabela de distribuio de freqncia para dados de gasto com alimentao

Classe R$ 120,00 - R$139,99 140,00 160,00 180,00 200,00 220,00 Total 159,99 179,99 199,99 219,99 239,99

f 5 26 24 15 8 2 80
13620,00 = R$170,25 80

m 130,0 150,0 170,0 190,0 210,0 230,0

fm 650,0 3900,0 4080,0 2850,0 1680,0 460,0 13620,0

x=

Ao utilizar essa aproximao estamos considerando a hiptese de que todas as observaes em cada classe esto uniformemente distribudas nessa classe. Por exemplo, se tivermos um intervalo de tamanho 100 e com frequncia igual a 6 observaes, a localizao dessas observaes seria

29

0,20,40,60,80 e 100, com distncia constante entre cada par de observaes, de forma que:

0+20+40+60+80+100 = 300 = m x 6 e m = 50 , ou seja o ponto mdio do intervalo de 0 a 100. Conclui-se que se a distribuio das observaes for uniforme em cada intervalo, o somatrio dos valores das observaes de cada intervalo igual ao produto da freqncia no intervalo pelo valor do ponto mdio desse intervalo. Supe-se que com uma conveniente construo de intervalos de classe os eventuais erros nos intervalos compensam-se mutuamente. 2.5.9 A Mediana para dados Agrupados Assim como possvel estabelecer uma aproximao da mdia aritmtica para dados agrupados, o mesmo pode ser feito para a mediana. O mtodo usado o da interpolao utilizando-se a distribuio de freqncia acumulada ou ogiva. Inicialmente determina-se a classe que contem a mediana. Essa ser a classe cuja freqncia acumulada relativa correspondente a seu limite inferior menor que 0,50 (ou 50 %) e a freqncia acumulada relativa correspondente a seu limite superior maior que 0,50 (ou 50 %). O prximo passo a determinao do ponto exato onde localiza-se a mediana naquela classe. Para o exemplo anterior de gastos com alimentao de famlias, temos: Classe freq. absoluta freq.acumulada simples 5 26 24 15 8 2 5 31 55 70 78 80 freqncia relativa acumulada 0,0625 0,3875 0,6875 0,8750 0,9750 1,0000

R$ 120,00 - R$139,99 140,00 160,00 180,00 200,00 220,00 159,99 179,99 199,99 219,99 239,99

30

Total

80 A classe que contm a mediana a terceira classe, pois a freqncia

relativa acumulada da classe anterior (segunda classe) menor que 0,5 e a freqncia relativa acumulada da terceira classe maior do que 0,5.11

Freqncia acumulada da classe que contem a mediana

55

n + 1 80 + 1 = = 40,5 2 2
31

160

X.5

180

Por semelhana de tringulos, X .5 - 160 40,5 - 31 = 180 - 160 55 - 31 \ X .5 = 167,92

verifica-se que:

Este procedimento o mesmo que a seguinte frmula de interpolao:


(n + 1) / 2 - Fa X .5 = LI .5 + c f .5

- A freqncia relativa acumulada da classe anterior classe corrente a freqncia relativa acumulada do limite inferior da classe corrente. A freqncia relativa acumulada da classe corrente a freqncia relativa acumulada do limite superior dessa mesma classe.
11

31

onde: LI.5 = limite de classe inferior da classe da mediana, mediana, f.5 = freqncia absoluta simples da classe da mediana, c = amplitude (tamanho) da classe da mediana. 2.5.10 A Moda para dados Agrupados A moda de uma distribuio de freqncia pode muitas vezes ser aproximada pelo ponto mdio da classe modal - a classe com maior densidade de freqncia.12 Ento, para os dados de gastos com alimentao do exemplo anterior, xm = R$ 150, o ponto mdio da segunda classe, que possui a maior freqncia. Esse mtodo de localizar a moda totalmente satisfatrio quando as densidades de freqncia da classe imediatamente anterior classe modal (a classe premodal) e da classe imediatamente posterior classe modal (classe posmodal) so aproximadamente iguais. Quando isso no ocorre, como sugerido pela figura a seguir, resultados mais precisos podem ser obtidos com a seguinte frmula, para uma amostra:
X m @ Lm + ( D1 )c D1 + D 2

Fa = freqncia acumulada da classe imediatamente anterior classe da

12

Definimos densidade de freqncia de um intervalo de classe como sendo o quociente entre a freqncia absoluta simples desse intervalo e o seu tamanho (amplitude). Quando os intervalos de classe possuem amplitudes desiguais, existe uma tendncia de os intervalos maiores apresentarem maiores freqncias. Dessa forma a classe modal no a classe de maior freqncia mas a classe de maior densidade de freqncia. Naturalmente, quando todos os intervalos tm a mesma amplitude, como no caso do exemplo anterior e como geralmente so construdos para no distorcer a distribuio, a classe modal a classe de maior densidade de freqncia assim como tambm a classe de maior freqncia. Esse conceito de densidade de freqncia ser muito til, quando definirmos, mais adiante, a funo densidade de probabilidade e para a sua compreenso intuitiva.
32

onde: Lm = o verdadeiro13 limite inferior de classe da classe modal classe premodal. D2 = da diferena entre das densidades de freqncia da classe modal e classe posmodal. C = a verdadeira amplitude de classe da classe modal. Interpretao geomtrica da interpolao algbrica para a determinao da moda
Densidade de freqncia

D1 = da diferena entre das densidades de freqncia da classe modal e

xm

No exemplo anterior de gastos com alimentos de 80 famlias, como a amplitude de todos os intervalos so iguais, podemos utilizar as

13

Para determinar os limites de classe verdadeiros para uma varivel contnua, temos que escrever os limites de classe com uma casa decimal a mais do que os dados originais. Por exemplo, se o conjunto de dados consiste de medidas de peso arredondadas para um dcimo de grama, os limites nominais de classe (tambm chamados de limites aparentes podem ser 11,0 - 11,2; 11,3 - 11,5;11,6 - 11.8; ... Os limites verdadeiros de classe (tambm conhecidos como limites reais ou efetivos) seriam 10,95 - 11,25; 11,25 - 11,55; 11,55 - 11,85;...
33

freqncias absolutas de classe no lugar das densidades de freqncia, para o clculo do valor aproximado da mediana. Lm = 140,00 c = 20 D1 = 26 - 15 = 11 D2 = 26 - 24 = 2

xm @ 140,00 + (

Uma observaes aqui necessria. possvel calcular os valores aproximados da mediana e da moda para dados agrupados quando o ltimo intervalo de classe tem limite superior indeterminado. No caso da mediana isso imediato e no caso da moda, o seu clculo somente pode ser feito se a ltima classe no for a classe modal e preciso primeiramente calcular as densidades de freqncia. Como exemplo, suponhamos que a distribuio de renda de uma certa regio dada pela seguinte distribuio de freqncia:

11 ) 20 = 156,92 11 + 2

renda (R$) limites nominais 0 121 606 1201 mais de Total 120 605

limites reais

freqncia absoluta

densidade de freqncia 40/120,50 = 0,332 170/485 220/595 15/1150 = 0,350 = 0,370 = 0,013

0 120,50 605,50 1250,50 mais de -

120,50 605,50

40 170 220 15 97 542

- 1200 - 2400 2400

- 1200,50 - 2400,50 2450,50

indeterminado

A mediana est localizada na terceira classe:14

14

Observe-se que os dados originais esto, de acordo com o sugerido pela tabela acima, com aproximao igual a unidades de gramas. Os limites verdadeiros (ou reais) de classe) passam, portanto, a ter aproximao de uma casa decimal de grama. O valor final dos clculos da mediana e da moda so
34

(542 + 1) - 210 2 (1200,50 - 605,50) = 772 x.5 @ 605,50 + 220 A classe modal tambm a terceira classe:15 xm = 605,50 +

(0,370 - 0,350) (1200,50 - 605,50) = 637 (0,370 - 0,350) + (0,370 - 0,013)

Infelizmente, para esse exemplo no possvel o clculo da mdia, o que demonstra que para algumas situaes temos que contar com a mediana como medida de posio (ou de tendncia central) de uma distribuio estatstica. Discutiremos agora comparativamente algumas das caractersticas das trs principais medidas de posio: A Mdia Aritmtica
1) Ela afetada por todas as observaes e influenciada pelas

magnitudes absolutas dos valores extremos na srie de dados.


2) Ela das trs medidas de posio a que possibilita maiores

manipulaes algbricas, dadas as caractersticas de sua frmula.


3) Em amostragem, a mdia uma estatstica estvel. Isso ser

aprofundado posteriormente. aproximados para unidades de grama, j que essa a aproximao dos dados originais (que se refere ao instrumento de medida). J que esta classe a que apresenta maior densidade de freqncia. Como a ltima classe no tem limite superior definido no foi possvel calcular sua densidade de freqncia, j que no podemos determinar sua amplitude. Dependendo dessa amplitude ela poderia ter uma densidade de freqncia maior que a da terceira classe. Mas mesmo nesse caso, a terceira classe ainda seria modal, j que sua densidade de freqncia maior que a das suas classes vizinhas, e a distribuio passaria a ser bimodal.
15

35

A Mediana 1) Seu valor afetado pelo nmero de observaes e como elas esto extremas. 2) Sua frmula no passvel de manipulao algbrica. 3) Seu valor pode ser obtido, como vimos, em distribuies, com limites 4) A mediana a estatstica mais adequada para descrever observaes que so ordenadas ao invs de medidas. A Moda 1) A moda o valor mais tpico e representativo de uma distribuio. Ela representa o seu valor mais provvel. 2) Como a mediana, a moda tambm no influenciada pelos valores extremos da distribuio e no permite manipulaes algbricas como a frmula da mdia. superiores indeterminados para a sua ltima classe.

distribudas mas ela no afetada pelos valores das observaes

Existem algumas relaes entre as diversas medidas de posio:

1) Para qualquer srie, exceto quando no caso de todas as observaes coincidirem em um nico valor, a mdia aritmtica que a mdia harmnica. 2) Para uma distribuio simtrica e unimodal, mdia = mediana = moda. 3) Para uma distribuio positivamente assimtrica, mdia > mediana > moda. A distncia entre a mediana e a mdia cerca de um tero da distncia entre a moda e a mdia.
36

sempre maior que a mdia geomtrica, a qual, por sua vez, maior

4) Para uma distribuio negativamente assimtrica, mdia < mediana < moda. A distncia entre a mediana e a mdia cerca de um tero da distncia entre a moda e a mdia. Essas ltimas caractersticas so apresentadas graficamente, a seguir
POSIES RELATIVAS DA MDIA, MEDIANA E MODA EM FUNO DA ASSIMETRIA DAS DISTRIBUIES

Assimetria positiva

Distribuio Simtrica

37

Assimetria negativa

Medidas de Disperso, Assimetria e Curtose Muitas sries estatsticas podem apresentar a mesma mdia, mas no entanto, os dados de cada uma dessas sries podem distribuir-se de forma distinta em torno de cada uma das mdias dessas sries. Na anlise descritiva de uma distribuio estatstica fundamental, alm da determinao de uma medida de tendncia central, conhecer a disperso dos dados e a forma da distribuio. Duas sries de dados podem possuir a mesma mdia, mas uma pode apresentar valores mais homogneos (menos dispersos em relao a mdia) do que a outra. Um pas, por exemplo, com uma distribuio de renda mais equnime, ter uma disperso de suas rendas menor do que um pas com estrutura de renda mais diferenciada em diversos estratos ou categorias sociais. Uma mquina que produz parafusos e que estiver menos ajustada do que outra produzir medidas de parafusos com distribuio mais dispersa em torno de sua mdia. A inequao das mdias a renda familiar mdia de um determinado pas de US$ 5.000 por ano no sabemos muita coisa sobre a distribuio de renda desse pas. Uma mdia, como um simples valor adotado para representar a tendncia central de uma srie de dados uma medida muito til. Porm, o uso de um simples e nico valor para importantes. Em primeiro lugar, nem todas as observaes de uma srie de dados tem o mesmo valor da mdia. Quase sem exceo, as observaes includas em uma distribuio distanciam-se do valor central, embora o grau de afastamento varie de uma srie para outra. Muito pouco pode ser dito a respeito da disperso mesmo quando diversas medidas de tendncia central so calculadas para a descrever uma distribuio abstrai-se de muitos aspectos A importncia das mdias com freqncia exagerada. Se dizemos que

38

srie. Por exemplo, no podemos dizer qual distribuio tem maior ou menor grau de disperso da informao dada pela tabela abaixo.

Distribuio A Mdia Mediana Moda 15 15 15

Distribuio B 15 12 6

Uma segunda considerao que as formas de distribuio diferem de um conjunto de dados para outro. Algumas so simtricas; outras no. Assim, para descrever uma distribuio precisamos tambm de uma medida do grau de simetria ou assimetria. A estatstica descritiva para esta caracterstica chamada de medida de assimetria. Finalmente, existem diferenas no grau de achatamento entre as diferentes distribuies. Esta propriedade chamada de curtose (em ingls, kurtosis ). Medir a curtose de uma distribuio significa comparar a concentrao de observaes prximas do valor central com a concentrao de observaes prximas das extremidades da distribuio. 2.5.11 O Intervalo (ou amplitude) A medida de disperso mais simples a amplitude, a diferena entre o maior e o menor valor nos dados. Para uma distribuio de freqncia que usa intervalos de classe, a amplitude pode ser considerada como a diferena entre o maior e o menor limite de classe ou a diferena entre os pontos mdios dos intervalos de classe extremos. Os preos de aes e de outros ativos financeiros so freqentemente descritos em termos de sua amplitude, com a apresentao pelas Bolsas de Valores do maior valor e do menor valor da ao em um determinado perodo de tempo.

39

Para algumas distribuies simtricas a mdia pode ser aproximada tomando-se a semi-soma dos dois valores extremos,16 que freqentemente chamada de semi-amplitude. Por exemplo, prtica entre os meteorologistas derivar a mdia diria de temperatura tomando a mdia somente dos valores mximo e mnimo de temperatura ao invs, de digamos, a mdia das 24 leituras horrias do dia. A amplitude tem alguns defeitos srios. Ela pode ser influenciada por um valor atpico na amostra. Alm disso o seu valor independe do que ocorre no interior da distribuio, j que somente depende dos valores extremos. Este defeito ilustrado na figura a seguir:

f(X)

X Na figura acima so mostradas duas distribuies com diferentes variabilidade, mas com mesma amplitude. A amplitude tende a crescer, embora no proporcionalmente, a medida que o tamanho da amostra cresce. Por esta razo, no podemos interpretar a amplitude corretamente sem conhecer o nmero de informaes dos dados.

16

Foi o que fizemos ao calcular a mdia para valores agrupados em classes de freqncia. Nesse caso utilizamos o ponto mdio de cada intervalo de classe como representativo da mdia de cada intervalo. Assim, ao multiplicarmos a freqncia de cada classe pelo valor do ponto mdio, estamos calculando aproximadamente a soma das observaes em cada intervalo, admitindo como hiptese que a distribuio dos dados em todos os intervalos simtrica.
40

2.5.12 Percentis, Decis e Quartis Podemos tentar responder a seguinte pergunta: que proporo dos

valores de uma varivel menor ou igual a um dado valor? Ou maior ou igual a um dado valor? Ou entre dois valores ? Quando construmos uma distribuio de freqncia acumulada, tais questes somente podem ser respondidas com relao aos limites de classe exatos. Por exemplo, a partir da distribuio de

freqncia relativa acumulada da pgina 28, podemos dizer que 38,75 % das observaes so menores do que 159,99. Mas no podemos responder a pergunta: qual o gasto familiar tal que a proporo da amostra tendo este gastam com alimentao at R$ 139,99 e 38,75 % das famlias gastam at R$ 159,99. Portanto, como 35 % est entre estes dois valores, o gasto familiar tal que a proporo da amostra tendo este valor ou menos 35 % est situado entre R$ 139,99 e R$ 159,99. Este valor chamado de percentil 35. O percentil 40 o valor da varivel que maior do que 40 % das o valor da valor ou menos 35 %?. Mas visvel da tabela que 6,25 % das famlias

observaes. Generalizando, o percentil x, o valor da varivel que maior do que x % das observaes. Em outras palavras, o percentil x

varivel correspondente ao valor de freqncia relativa acumulada de x %.17 O primeiro decil o valor da varivel que supera um dcimo (ou 10 %) do total de

Para o clculo do valor exato do percentil x para dados agrupados utiliza-se o mesmo mtodo para a determinao da mediana, ou seja, a interpolao linear. Como no caso da mediana, podemos empregar uma frmula de interpolao p (n + 1) / 100 - Fa X p = LI p + c fp onde Xp o percentil p, Lip o limite inferior real da classe que contem o percentil, Fa a freqncia relativa acumulada da classe anterior classe que contem o percentil, fp a freqncia relativa (simples) da classe que contem o percentil, c a amplitude do intervalo de classe que contem o percentil e o nmero de observaes. O mesmo mtodo pode ser empregado tambm para os decis e quartis.
17

41

observaes.

Se

tivermos

200

observaes,

segundo

decil

ser

aproximadamente a observao de posto 40. 0,25 (ou 25 %). O terceiro quartil o valor da varivel cuja freqncia relativa valores observados e menor do que trs quartos destes valores. O terceiro quartil maior do que trs quartos dos valores observados e menor do que um quarto destes valores. O segundo quartil confunde-se com a mediana. Uma medida de disperso o chamado desvio interquartlico que a diferena entre o terceiro e o primeiro quartis. O primeiro quartil o valor da varivel cuja freqncia relativa acumulada

acumulada 0,75 (ou 75 %). O primeiro quartil maior do que um quarto dos

2.5.13 Varincia e Desvio Padro A varincia definida como a mdia dos desvios ao quadrado em relao

mdia da distribuio. Para uma amostra,

(x - X ) =
n -1

Para uma populao finita,

s2 =

(x - m)
N

Na penltima equao, n-1 chamado de nmero de graus de liberdade de S2 , um conceito a ser definido mais tarde. Existe uma restrio para esta equao: n > 1 (no se pode calcular a varincia para uma amostra de uma observao apenas). O desvio padro a raiz quadrada da varincia, e denotado S (para amostra) e s (para populao). Existem frmulas que facilitam os clculos para S2 e s 2 :

42

n x 2 - ( x ) 2 S = n( n - 1)
2

s2

x =
N

x - N

com a soma dos valores ( x )

Com estas duas ltimas frmulas, podemos calcular a varincia somente

no mais necessrio calcular a mdia, em seguida os desvios em relao s mdias e finalmente os quadrados destes desvios. Para ilustrar o processo de clculo da varincia e desvio padro e para mostrar o uso destas medidas, considere o seguinte exemplo. Dois tipos diferentes de mquina, X e Y so projetadas para produzir o mesmo produto. Elas tm o mesmo preo de venda. Um fabricante est tentando decidir qual delas comprar e observou 10 mquinas distintas de cada tipo em operao por uma hora. A tabela seguinte mostra as produes horrias nas primeiras duas colunas. As mdias so x = 40310 = 40,3 unidades por hora e y = 408 10 = 40,8

e a soma dos quadrados dos valores ( x 2 );

unidades por hora. Portanto, com base nestes dados, o tipo Y um pouco mais rpida. Podemos retirar mais alguma informao a partir destes dados? Podemos medir e comparar as disperses das produes horrias dos dois tipos de mquina. Usando a penltima frmula para os dados da tabela, obtemos:
10(16.405) - ( 403) 2 = 18,23 10(10 - 1)

2 SX =

S X = 18,23 = 4,27 unidades por hora


2 SY =

SY = 135,12 = 11,62 unidades por hora

10(17.984) - ( 408) 2 = 135,11 10(10 - 1)

x2

y2

43

35 36 49 44 43 37 38 42 39 40

25 26 55 52 48 24 34 47 50 47

1.225 1.296 2.401 1.936 1.849 1.369 1.444 1.764 1.521 1.600

625 676 3.025 2.704 2.304 576 1.156 2.209 2.500 2.209

Soma 403

408

16.405

17.984

que o tipo Y, a mquina X mais precisa.

O tipo X tem menor disperso que o tipo Y. Apesar de ter maior preo

2.5.14 Varincia e Desvio Padro para Dados Agrupados A varincia e o desvio padro (como a mdia, mediana, moda, quartis, percentis, decis) podem ser calculados para dados agrupados, ou seja, distribuies de freqncia com intervalos de classe. Entretanto, os resultados podem ser apenas aproximadamente precisos. Utiliza-se, como no caso da mdia, a hiptese do ponto mdio: a de que toda observao est localizada no ponto mdio de sua classe. Cada ponto mdio entra nos clculos quantas vezes

44

so as observaes naquele intervalo de classe. As equaes para as varincias so:


S
2

f (m - X ) =
n -1

, para a amostra;

s2 =

f (m - m )
N

, para a populacao.

Os smbolos utilizados nestas equaes j foram definidos anteriormente. Para facilitar os clculos podemos utilizar as seguintes frmulas mais convenientes para as varincias:
S2 = e

fm

- ( fm) 2 / n n -1 - ( fm) 2 / N N

fm =

para a amostra e populao, respectivamente. Aqui, como antes, assumimos que a populao finita. Os somatrios em todas estas equaes so para todas as k classes, no para as observaes individuais. Estas equaes podem ser aplicadas tanto para intervalos de classe iguais como para intervalos de classe desiguais. Entretanto, elas no podem ser empregadas quando existem um ou mais intervalos sem limites. Como para os dados no agrupados, a raiz quadrada destas equaes so os desvios padres para a amostra e para a populao, respectivamente. Aplicando as ltimas equaes para o exemplo de consumo de alimentos, temos: Classe (1) m 130 (2) f 5 (3) fm (2)(1) 650 (4) fm2 (3)(1) 84.500

R$ 120,00 - R$139,99

45

140,00 160,00 180,00 200,00 220,00 Total

159,99 179,99 199,99 219,99 239,99

150 170 190 210 230

26 24 15 8 2 80

3.900 4.080 2.850 1.680 460 13.620

585.000 693.000 541.500 352.800 105.800 2.363.200

S2 =

fm

- ( fm) 2 / n n -1

2.363.200 - (13.620) 2 / 80 = 561,96 80 - 1

S = 561,96 = 23,71

2.5.15 Interpretando e Aplicando o Desvio Padro Infelizmente, o desvio padro no tem uma interpretao intuitivamente bvia. Por exemplo, no exemplo anterior das mquinas, SX = 4,27 unidades por hora, mas no bvio o que isto quer dizer para a mquina X. Para muitas sries de dados h dois teoremas para a interpretao do desvio padro que so muito teis. Eles so chamados de Desigualdade de Chebyshev e a Regra de Gauss, as quais introduzimos a seguir. Teorema: Desigualdade de Chebyshev. Para qualquer conjunto de dados e qualquer constante h > 1, no mnimo 1 - 1 / h 2 dos dados estaro situados dentro de um intervalo formado por h desvios padres abaixo e acima da mdia. Por este teorema temos certeza de que no mnimo , ou 75 % dos dados iro situar-se dentro do intervalo X 2S . Neste caso h = 2 e 1 - 1 / h2 = 1 - 1 / 22 = 3 / 4 . O desvio padro mais a mais usada das medidas de variabilidade.

No mnimo 8/9, ou 88,9 % dos dados estaro no

intervalo X 3S ; e no mnimo 15/16, ou cerca de 94 % dos valores de qualquer varivel estaro includos dentro do intervalo X 4 S .

46

Considere o exemplo anterior das mquinas. Temos


S X = 4,27 .

X = 40,3 e

Que

percentagem

das

mquinas

tero

produo

entre

X 1,5S X = 40,3 1,5 4,27 , ou seja, entre 33,9 e 46,7? Resposta: no mnimo 1 - 1 2 = 0,56 , ou aproximadamente 56 %. Da tabela anterior encontramos 9 1,5

das 10 mquinas tipo X que esto dentro deste intervalo e claramente 9/10 maior do que 56 %. variveis com qualquer padro de distribuio (no importa que sejam simtricas, assimtricas, mesocrticas, platicrticas, leptocticas, A vantagem da Desigualdade de Chebyshev que ela pode ser aplicada etc.).

Entretanto, ela tem a desvantagem de no ser muito precisa, j que a porcentagem efetiva que caem dentro do intervalo em torno da mdia quase sempre muito maior do que o mnimo dado por 1 - 1 / h 2 , especialmente quando as amostras so pequenas, como no nosso exemplo anterior. Teorema: A Regra de Gauss. Se os dados so amostrais e se so, de forma aproximada, distribudos normalmente, ou seja, o histograma dos dados aproximadamente simtrico e tem a forma de um sino, ento: 1. X 1S incluir aproximadamente 68 % dos dados 2. X 2 S incluir aproximadamente 95 % dos dados Chamamos isto de Regra de Gauss, porque baseada na distribuio de probabilidade gaussiana (ou distribuio de probabilidade normal). Esta distribuio ser discutida em detalhe em um captulo posterior. 3. X 3S incluir aproximadamente 100 % dos dados

2.5.16 Coeficiente de Variao Com freqncia, como no caso do exemplo das duas mquinas, queremos comparar a variabilidade de dois ou mais conjuntos de dados. Podemos fazer isto facilmente usando as varincias ou os desvios padres

47

quando, primeiro, todas as observaes individuais tm a mesma unidade de medida e, segundo, as mdias dos conjuntos de dados so aproximadamente iguais. Quando qualquer uma destas condies no satisfeita, uma medida relativa de disperso deve ser usada. Uma medida relativa de variabilidade freqentemente usada chamada de coeficiente de variao, denotada por CV para uma amostra. Esta medida o valor do desvio padro em relao mdia:
CV = S X

Suponha que um cientista na ndia obteve os seguintes dados referentes aos pesos de elefantes e ratos. Elefantes
sE = 300 kg x E = 6.000 kg

Ratos
sR = 0,04 kg x R = 0,150 kg

Se calcularmos os respectivos coeficientes de variao, teremos: sE 300 = = 0,050 ou 5,0 % x E 6000 s 0,04 cv(X R ) = R = = 0,266 ou 26,7 % x R 0,150 cv(X E ) =

Portanto, a variabilidade relativa dos pesos dos ratos mais do que 5 vezes maior do que a variabilidade dos pesos dos elefantes. Para o exemplo anterior das mquinas, teremos: 4,27 = 0,1060 ou 10,60 % 40,30 11,62 cv(Y) = = 0,2848 ou 28,48 % 40,80 cv(X) =

Assim, a disperso relativa da produo da mquina Y quase trs vezes maior do que a disperso relativa da mquina X.

48

2.6 Medidas de Assimetria Duas distribuies tambm podem diferir uma da outra em termos de assimetria ou achatamento, ou ambas. Como veremos, assimetria e achatamento (o nome tcnico utilizado para esta ltima caracterstica de forma relativas inferncia estatstica que so freqentemente baseadas na hiptese de populaes distribudas normalmente. Medidas de assimetria e de curtose so, portanto, teis para se precaver contra erros aos estabelecer esta hiptese. Diversas medidas de assimetria so disponveis, mas introduziremos apenas uma, que oferece simplicidade no conceito assim como no clculo. Esta medida, a medida de assimetria de Pearson, baseada nas relaes entre a mdia, mediana e moda. Recorde que estas trs medidas so idnticas em valor para uma distribuio unimodal simtrica, mas para uma distribuio assimtrica a mdia distancia-se da moda, situando-se a mediana em uma posio intermediria, a medida que aumenta a assimetria da distribuio. Consequentemente, a distncia entre a mdia e a moda poderia ser usada para medir a assimetria. Precisamente, Quanto maior a distncia, seja negativa ou positiva, maior a assimetria da distribuio. Tal medida, entretanto, tem dois defeitos na aplicao. Primeiro, porque ela uma medida absoluta, o resultado expresso em termos da unidade original de medida da distribuio e, portanto, ela muda quando a unidade de medida muda. Segundo, a mesma grandeza absoluta de assimetria tem diferentes significados para diferentes sries de dados com diferentes graus de variabilidade. Para eliminar estes defeitos, podemos medir uma medida relativa de assimetria. Esta obtida pelo coeficiente de assimetria de Pearson, denotado por SKP e dado por: Assimetria = mdia - moda da distribuio curtose) tm importncia devido a consideraes tericas

SK P =

X - Xm S

49

A aplicao desta expresso envolve outra dificuldade, que surge devido ao fato de que o valor modal da maioria das distribuies ser somente uma distribuio, enquanto que a localizao da mediana mais satisfatoriamente precisa. Contudo, em distribuies moderadamente assimtricas, a expresso X m = X - 3( X - X .5 )

adequada (no envolve impreciso muito grande). A partir disto, vemos que: X - X m = X - [ X - 3( X - X .5 )] = 3( X - X .5 ) Com este resultado, podemos rescrever o coeficiente de assimetria de Pearson como:
SK P = 3( X - X .5 ) S

Esta medida igual a zero para uma distribuio simtrica, negativa para distribuies com assimetria para a direita e positiva para distribuies com assimetria para a esquerda. Ela varia dentro dos limites de 3. Aplicando SKP aos dados agrupados de gastos com consumo de alimentos das famlias, temos: SK P = 3(170,25 - 167,92) = +0,295 23,71

Este resultado revela que a distribuio de gastos com consumo de alimentos tem assimetria moderadamente positiva (o que significa maior concentrao de famlias nas classes de menor gasto). muito comum encontrar distribuies positivamente assimtricas em dados econmicos, particularmente na produo e sries de preos, os quais podem ser to pequenos quanto nulos mas podem ser infinitamente grandes. Distribuies assimetricamente negativas so raras em cincias sociais.

2.7 Curtose: uma medida de achatamento

50

Apresentaremos agora uma medida de achatamento das distribuies, o coeficiente de curtose, denotado por K. Esta medida algebricamente tratvel e geometricamente interpretvel. definida como a relao entre o desvio semiinterquartlico, ou seja, a metade do valor do desvio interquertlico, e o intervalo entre o decil 9 e o decil 1: 1 (Q3 - Q1 ) K= 2 D9 - D1 Por meio do coeficiente de curtose, classificamos diferentes graus de achatamento em trs categorias: leptocrtica, platicrtica e mesocrtica (ver figura, a seguir). Uma distribuio leptocrtica (curva a) tem a maior parte de suas observaes concentrada no centro. Consequentemente, a diferena entre as duas distncias, (Q3 - Q1) e (D9 - D1) tende a ser muito pequena. Para um dado grau de disperso, quanto menor for o achatamento da distribuio, menor ser diferena entre estas duas distncias. Desde que (Q3 - Q1) < (D9 - D1) para uma distribuio com forma muito pontiaguda, K aproxima-se de 0,5 no limite, quando Q3 - Q1 = D9 - D1. Ao contrrio, quanto mais platicrtica a distribuio (curva b), mais o intervalo entre os decis 9 e 1 tende a exceder o intervalo interquartlico. Portanto, quando o intervalo de uma varivel tende ao infinito e para uma curva completamente achatada, K tende a zero. Em vista destas consideraes, parece razovel estabelecer valores prximos de 0,25 para representar distribuies mesocrticas (curva c). Esta escolha reforada pelo fato de que para a varivel normal padronizada, k = 0,2630 (veremos este ponto em captulo posterior).

51

Na figura acima compara-se a curtose de duas distribuies com a curtose de uma distribuio mesocrtica (em linha tracejada). Na figura da esquerda temos uma distribuio platicrtica (linha cheia) e na figura da direita temos uma distribuio leptocrtica (linha cheia).

Aps o clculo dos quartis e decis a partir dos dados agrupados para a distribuio de gastos com alimentao, temos que:
1 ( Q3 - Q1 ) (1 / 2)(188.39 - 154,83) K= 2 = D9 - D1 209,78 - 146,58

= 0,2655

aproximadamente mesocrtica, j que muito prximo de 0,25.

Este resultado indica que a distribuio de gastos com alimentos

52

3. Probabilidade
Objetivos do captulo:

Definir o termo probabilidade. Descrever as abordagens clssica, da freqncia relativa e subjetiva da probabilidade. Entender os termos experimento, espaos amostral e evento. Definir os termos probabildade condicional e probabilidade conjunta Calcular probabilidades aplicando as regras da adio e da multiplicao Determinar o nmero de possveis permutaes e combinaes
53

Calcular uma probabilidade usando o Teorema de Bayes Probabilidade: uma medida de possibilidade de ocorrncia de um determinado evento; ela pode assumir um valor entre 0 e 1 Exemplo: Experimento jogar uma moeda duas vezes Evento: Uma coleo de um ou mais resultados de um experimento

Possveis resultados (espao amostral) { KK, KC, CK, CC } Evento: no mnimo uma cara = {CC, CK, KC} Como uma probabilidade expressa ? Uma probabilidade expressa como uma nmero decimal, tal como 0,70 ; 0,27 ; ou 0,50. Entretanto ela pode ser representada como uma percentagem tal com 70 %, 27 % ou 50 %. O valor de uma probabilidade est localizado no intervalo de nmero reais que vai de 0 a 1, inclusive as extremidades deste intervalo.

Quanto mais uma probabilidade prxima de 0, o evento a ela associado mais improvvel de ocorrer. Quanto mais uma probabilidade prxima de 1, o evento a ela associado mais provvel de ocorrer.

3.1 Definio Clssica de Probabilidade Probabildade Clssica: baseada na hiptese de que os resultados de um experimento so igualmente provveis.

Usando o ponto de vista clssico:

54

Probabilidade de um evento =

nmero de resultados favorveis nmero total de possveis resultados

Considere o experimento de jogar duas moedas. O espao amostral deste experimento S = { CC,CK,KC,KK} Considere o evento: uma cara
nmero de resultados favorveis 2 = =1 2 nmero total de possveis resultados 4

Probabilidade de um evento =

Definies Eventos mutuamente exclusivos: a ocorrncia de qualquer um evento significa que nenhum dos outros pode ocorrer ao mesmo tempo. No caso do experimento de jogar duas moedas, os quatro possveis resultados so mutuamente exclusivos.

CC

CK

KC

KK

55

Eventos Coletivamente Exaustivos: no mnimo um dos eventos deve ocorrer quando o experimento conduzido.

No experimento de jogar 2 moedas, os quatro possveis resultados so coletivamente exaustivos.

Soma das probabilidades = 1

Desde que cada resultado no experimento de jogar 2 moedas tem probabilidade igual a , ento a soma das probabilidades dos resultados possveis + + + = 1

3.2 Conceito da Freqncia Relativa A probabilidade de um evento ocorrer no longo prazo determinada pela observao de que frao de vezes o evento ocorreu no passado. A probabilidade pode ser calculada pela frmula: nmero de vezes em que o evento ocorreu no passado nmero total de observaes

Pr obabilidade do evento =

Exemplo 2 A questo de ser ou no um ru culpado: em uma amostra de 500 estudantes em um determinado campus, 275 indicaram que o ru era culpado. Qual a probabilidade de que um estudante neste campus indicar que o ru neste caso era culpado? Nota: Neste problema podemos aplicar a frmula para a probabilidade baseada na frequncia relativa.

Assim, P(culpado) = 275/500 = 0,55


56

3.3 Probabilidade Subjetiva Probabilidade Subjetiva : a probabilidade de que um particular evento ocorra atribuda por um indivduo e baseada em um conjunto de informao disponvel.

Exemplos de probabilidade subjetiva so: Estimar a probabilidade de que o time de futebol da Ponte Preta disputar a final do campeonato nacional. Estimar a probabilidade de que voc obtenha conceito A neste curso.

3.4 Algumas Regras Bsicas de Probabilidade Regra da Adio : Se dois eventos A e B so mutuamente exclusivos, a regra especial da adio estabelece que a probabilidade de que A ou B ocorram igual a soma de suas respectivas probabilidades. A regra dada pela seguinte frmula:

P(A ou B) = P(A) + P(B) Exemplo 3 A companhia de aviao X recentemente forneceu a seguinte informao para o Departamento de Aviao Civil (DAC) sobre os vos da origem A ao destino B

Chegada Adiantada No horrio Atrasada Cancelado

Frequncia 100 800 75 25

57

Total

1000

Seja A o evento: o vo chega adiantado

Ento P(A) = 100 / 1000 = 0,1 Seja B o evento: o vo chega atrasado

Ento P(B) = 75 / 1000 = 0,075 Nota: os eventos A e B so mutuamente exclusivos. Porque ? Qual a probabilidade de que um vo chegue adiantado ou atrasado?

P(A ou B) = P(A) + P(B) = 0,1 + 0,075 = 0,175

3.5 A Regra do Complemento


A regra do complemento usada para determinar a probabilidade de um evento ocorrer subtraindo-se a probabilidade do evento no ocorrer de 1.

Seja P(A) a probabilidade do evento A e P ( A ) a probabilidade do evento no A (complemento de A).

P( A) + P( A ) = 1 P( A) = 1 - P( A )
Um diagrama de Venn pode ilustrar a Regra do Complemento:

A
58

Exemplo 3 Reconsidere os dados do exemplo 2. Seja C o evento: o vo chega no horrio. Ento P(C) = 800 / 1000 = 0,8 Seja D o evento: o vo cancelado.

Ento P(D) = 25 / 1000 = 0,025 Nota: os eventos C e D so mutuamente exclusivos. Porque? Use a regra do complemento para mostrar que a probabilidade do vo chegar adiantado (A) ou atrasado (B) 0,175 P(A ou B) = 1 P(C ou D) = 1 [0,8 + 0,025] = 0,175 O diagrama de Venn abaixo ilustra esta situao:

C 0,8

D 0,025

59 (C ou D) = (A ou B) = 0,175

A regra do complemento muito importante no estudo de probabilidade. Com freqncia, mais eficiente calcular a probabilidade de um evento o resultado de 1. ocorrer determinando-se a probabilidade do evento no ocorrer e subtraindo

3.6 A Regra Geral da Adio Sejam A e B dois eventos que no so mutuamente exclusivos. Ento P(A ou B) dado pela seguinte frmula:

P(A ou B) = P(A) + P(B) P(A e B) O Diagrama de Venn abaixo ilustra esta regra:

60

Exemplo 5 Em uma amostra de 150 estudantes, 70 disseram que somente tm um aparelho de CD, 50 disseram que somente tm uma TV e 25 disseram que tm ambos. O Diagrama de Venn a seguir descreve esta situao.

TV Ambos CD 70 25 50

Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha somente um aparelho de CD ? De somente uma TV ? De tanto uma TV como um aparelho de CD?

61

Seja C o evento o estudante tem um aparelho de CD e T o evento o estudante tem uma TV

P(C) = 70 / 150 = 0,4667

P(T) = 50 / 150 = 0,3333

P(C e T) = 25 / 150 = 0,1667 Se um estudante selecionado ao acaso, qual a probabilidade de que ele tenha tanto um aparelho de CD ou uma TV? ( Nota: isto inclui a probabilidade de Ter ambos os aparelhos).

Desde que: P(C ou T) = P(C) + P(T) P(C e T) Ento, P(C ou T) = 0,4667 + 0,3333 0,1667 = 0,6333

3.7 Regras de Multiplicao Regra Especial de Multiplicao A regra especial de multiplicao requer que dois eventos A e B sejam independentes. Definio: Dois eventos A e B so independentes se a ocorrncia de um no tem efeito sobre a probabilidade de ocorrncia do outro. A regra especial escrita simbolicamente como:

62

P(A e B) = P(A). P(B) Para trs eventos independentes A,B e C, a regra especial da multiplicao usada para determinar a probabilidade de que todos os eventos ocorram :

P(A e B e C) = P(A).P(B).P(C) Exemplo 6 Um investidor possui duas aes. Uma de uma companhia de produo de assumir que suas cotaes so independentes. A probabilidade de que a ao da companhia de petrleo suba no prximo ano 0,50. A probabilidade de que a cotao da cadeia de supermercados aumente em valor no prximo ano 0,70. Qual a probabilidade de que ambas as aes cresam em valor no prximo ano? Seja A o evento: a cotao da companhia de petrleo cresce no prximo ano e seja B o evento: a cotao da cadeia de supermercados cresce no prximo ano.

petrleo e a outra de uma cadeia de supermercados, de forma que podemos

P(A e B) = (0,50).(0,70) = 0,35 Qual a probabilidade de que ao menos uma destas aes aumentem em valor no prximo ano? Isto implica que tanto uma pode aumentar (sem que a outra aumente) assim como ambas. Portanto, P(no mnimo uma) = (0,50).(0,30) + (0,50).(0,70) + (0,70).(0,50) = 0,85

63

Exemplo 7 Um estudo recente constatou que 60 % das mes com crianas de idade de at 10 anos empregam-se em tempo integral. Trs mes so selecionadas aos acaso. Assumiremos que as mes so empregadas de forma independente umas das outras. Qual a probabilidade de que todas sejam empregadas em perodo integral?

P( todas as trs empregadas em perodo integral) = (o,60).(0,60).(0,60) = 0,216 Qual a probabilidade de que no mnimo umas das mes sejam empregadas em perodo integral? P(no mnimo uma) = 1 P(nenhuma empregada em perodo integral) = 1 [(0,40).(0,40).(0,40)] = 0,936

3.8 Probabilidade Condicional a probabilidade de que um evento particular ocorra, dado que outro evento tenha ocorrido. Notao: A probabilidade do evento A dado que o evento B ocorreu denotada por P(A/B) Regra Geral da Multiplicao A Regra Geral da Multiplicao usada para encontrar a probabilidade conjunta de que dois eventos ocorram.

64

A regra estabelece que para dois eventos A e B, a probabilidade conjunta de que os dois eventos ocorram obtida pela multiplicao da probabilidade de que o evento A ocorra pela probabilidade condicional de B dado que A ocorreu. A probabilidade conjunta, P(A e B) dada pela seguinte frmula: P(A e B) = P(A) . P(B/A)

Alternativamente, podemos tambm escrever:

P(A e B) = P(B) . P(A/B) Exemplo 8 Uma faculdade coletou a seguinte informao sobre seus estudantes de graduao: Curso Contabilidade Finanas Marketing Administrao Estatstica Computao Total Homens 120 110 70 110 50 140 600 Mulheres Total 80 70 50 100 10 90 400 200 180 120 210 60 230 1000

Um estudante selecionado ao acaso. Qual a probabilidade de que o(a) estudante seja mulher e que esteja cursando Contabilidade? Seja A o evento: o(a) estudante est cursando Contabilidade e F o evento: o(a) estudante mulher.

65

P(A e F) = 80 / 1000 Qual a probabilidade de selecionar uma mulher ?

P(F) = 400 / 1000 Dado que o(a) estudante mulher, qual a probabilidade de que esteja cursando Contabilidade ? Precisamos calcular P(A / F).

P(A / F) = P(A e F) / P(F) = [80 / 1000] / [400 / 1000] = 0,20

3.9 Diagramas em rvore Um diagrama em rvore muito til para representar probabilidades conjuntas e probabilidades condicionais. Ele particularmente til para analisar decises quando h diversos estgios no problema. Exemplo: Suponha que h 7 peas vermelhas e 5 peas azuis em uma sacola. Suponha que voc selecione duas peas, uma aps a outra e sem reposio. Construa um diagrama em rvore para esta informao. 6/11

V2

(7/12) (6/11)

V1
7/12 5/11 7/11 5/12

B2

(7/12) (5/11) (5/12) (7/11)

V2

B1
4/11

B2
66

(5/12) (4/11)

Probabilidades Condicionais

Probabilidades Conjuntas

3.10 Teorema de Bayes Considere o seguinte diagrama com as parties A1 e A2 : Espao Amostral

A1 A1 e B

A2 B A2 e B

P(A1 / B) = P(A1 e B) / P(B); P(A1 e B) = P(A1) . P(B / A1) P(B) = P(A1 e B) + P(A2 e B); P(A2 e B) = P(A2) P(B / A2) A partir disto, temos a frmula seguinte (Teorema de Bayes):

67

P( A / B) =
1

P( A ) P( B / A ) P( A ) P( B / A ) + P( A ) P( B / A )
1 1 1 1 2 2

Nota: Este teorema pode ser estendido para diversas parties do espao amostral ( A1, A2, A3, etc.) Exemplo 9 : A Companhia C & W tem recebido recentemente diversas reclamaes de que suas garrafas esto sendo preenchidas com contedo abaixo do especificado. Uma reclamao foi recebida hoje mas o administrador da produo no capaz de identificar qual das duas plantas (A ou B) preencheu a garrafa. Qual a probabilidade de que a garrafa com pouco preenchimento provenha da planta A? Seja S o evento: a garrafa foi preenchida com contedo abaixo do especificado.

% da Produo Total % de garrafas com pouco preenchimento A B 55 45 3 4

P( A / S ) =

0,55 0,03 = 0,4783 0,55 0,03 + 0,45 0,04

Anexo 1 Recordando Definies e Conceitos


Uma moeda mostra cara 50% do tempo, em mdia. Depois de muitos lances, o nmero de caras aproximadamente igual ao nmero de coroas.
68

Um conceito de Probabilidade No limite quando o nmero de lances -> infinito nmero de caras 0,5 nmero de lanamenos

Dizemos que a probabilidade de aparecer uma cara em qualquer lance 1/2. Isto ilustra o conceito de probabilidade que ser usada neste curso. Exemplo - 10 000 lances de moeda John Kerrich, um matemtico sul africano estava visitando Copenhague quando a Segunda Guerra Mundial comeou. Dois dias antes de seu voo marcado para a Inglaterra, os alemes invadiram a Dinamarca. Kerrich passou o resto da guerra internado em um acampamento em Jutland e para passar o tempo ele levou a cabo uma srie de experimentos em teoria da probabilidade. Em um destes experimentos, lanou uma moeda 10.000 vezes. Seus resultados so mostrados no grfico seguinte. 10

% de caras 50 %

0 -5 -10 10 100 100 1000 0 0 Nmero de lanamentos

(O eixo horizontal est em uma escala logartmica) O lanamento de uma moeda 10 vezes um exemplo de um experimento aleatrio. A maioria dos experimentos est sujeito a Variao Aleatria. A

69

Teoria de probabilidade a aproximao matemtica que busca quantificar em temos de modelos o que ocorre com estes experimentos.

Exemplo - 2 lanamentos de uma moeda Lance uma moeda duas vezes e registre para cada lance se o resultado era uma cara (C) ou uma coroa (K). Exerccio: Liste os possveis resultados. Seja A o evento deu uma ou mais caras. Quais resultados pertencem ao evento A? (CK, KC, CC). Seja B o evento no aparece nenhuma cara. (KK) Neste exemplo, os eventos A e B so ditos disjuntos ou mutuamente exclusivos, pois eles no tm nenhum resultado em comum. Eles tambm so exaustivos, j que eles cobrem todos os possveis resultados do experimento. Exerccio: Defina um evento C que no disjunto em relao a A. DEFINIES Um espao amostral o conjunto de todos os possveis resultados de um experimento. Um evento um conjunto de um ou mais resultados no espao amostral. nenhum resultado em comum. A variao aleatria ocorre quando impossvel predizer com certeza o resultado exato de um experimento individual, mas como o experimento repetido um nmero grande de vezes uma distribuio regular de freqncias relativas surge. A probabilidade de um resultado ou evento pode ser determinada tanto empiricamente (baseado em dados) ou teoricamente (baseado em um que um resultado (ou evento) A ocorre f vezes em n observaes. Ento modelo matemtico do processo). A definio emprica a seguinte: Suponha Dois eventos so disjuntos ou mutuamente exclusivos se eles no tm

70

frequncia relativa de A =

nmero de vezes em que A ocorre f = nmero de observaes n

O conceito da probabilidade de um evento A um idealizao da freqncia relativa. o valor limite da freqncia relativa quando n fica muito grande, i.e. quando n =>

f P ( A) quando n n
(P(A) denota a probabilidade de A ocorrer). Estimativas tericas de probabilidade esto baseadas em suposies plausveis. A suposio mais comum a de que todos os possveis resultados so igualmente provveis. Ento

P( A) =

nmero de resultados correspondendo a A nmero total de resultados no espao amostral

Por analogia com freqncias relativas, as probabilidades tm as seguintes propriedades: 1. P(A) um valor entre 0 e 1. 2. P(A) = 0 significa A nunca acontece (correspondendo a f = 0) 3. P(A) = 1 significa A sempre acontece (correspondendo a f = n) 4. O conjunto S de todos os possveis resultados tem probabilidade 1. P(S) = 1, os quais se agrupam em 5 eventos.

71

Anexo 2 - Independncia e Modelos de rvore para Calcular Probabilidades


Se eventos X e Y so mutuamente exclusivos, ento, P(X ou Y) = P(X) + P(Y) Em geral, se eventos X e Y no so mutuamente exclusivos ento P(X ou Y) = P(X) + P(Y) - P(X e Y). Exemplo - Fruta em 2 distritos Um certo tipo de fruta produzido em 2 distritos, A e B. Ambas as reas s vezes so atacadas por uma praga (mariposa que ataca as frutas). Suponha que as probabilidades so P(A) = 1/10, P(B) = 1/20, P(A e B) = 1/50 Qual a probabilidade de que um ou outro (ou ambos) distrito esto infetados em um determinado momento? P(A ou B) = P(A) + P(B) - P(A e B) = 0.1 + 0.05 - 0.02 = 0.13 Alternativamente, considere partes mutuamente exclusivas

P(A somente) = 0,1 0,02 = 0,08

P(A e B) = 0,02

P(B somente) = 0,05 0,02 = 0,03

72

A ou B consiste em 3 partes mutuamente exclusivas: A somente, B somente, A e B. P(A ou B) = P(A somente) + P(B somente) + P(A e B) = 0.08 + 0.02 + 0.03 = 0.13 . Dois eventos X e Y so ditos independentes se a probabilidade de que X acontece no afetada pelo fato de Y acontecer ou no. Pode ser mostrado que isto implica: P(X e Y) = P(X)P(Y) Esta chamado a regra de multiplicao para eventos independentes. Exemplo - 2 guardas de segurana e o seus aparelhos de controle H dois guardas de segurana para um grande estabelecimento. Cada um carrega um aparelho de controle ativado por detectores nos edifcios. O Guarda 1 consciencioso e est atento ao aparelho 80% do tempo. O Guarda 2 no to confivel e s responde ao aparelho 50% do tempo. Se os guardas relatam independentemente qualquer alerta para a polcia ou o corpo de bombeiros, qual a probabilidade de que pelo menos um informar um alerta? Seja X o evento o Guarda 1 relata o alerta. P(X) = 0.8 Seja Y o evento o Guarda 2 relata o alerta. P(Y) = 0.5 So os eventos X e Y mutuamente exclusivos? - No, ambos podem informar. X e Y so independentes? - Considere por hiptese que Sim. P(no mnimo um Guarda informa) = P(X ou Y) = P(X) + P(Y) - P(X e Y) Mas P(X e Y) = P(X) P(Y) (independentes) = 0.8 x 0.5 = 0.4 assim P(X ou Y) = 0.8 + 0.5 - 0.4 = 0.9 Assim embora Y s fidedigno 50% do tempo, empreg-lo aumenta a probabilidade de informar um alerta.
73

Diagramas de rvore so teis em clculos que envolvem vrias fases. Cada segmento na rvore uma fase do problema e as probabilidades nos ramos a partir de cada ponto tem que somar 1. A probabilidade de alcanar o fim de qualquer caminho completo o produto das probabilidades escritas em seus ramos.

Exemplo - Meninos e meninas em uma famlia de 3 filhos Modelo de rvore para meninos (B) e meninas (G) em uma famlia de tamanho 3. (ver figura a seguir) Figura 1

74

Cada caminho representa um resultado ( famlia de 3 filhos). H 8 resultados. Se voc assume que estes so igualmente provveis ento a probabilidade de cada 1/8. por exemplo P(BGB) = 1/8. Outro modo de calcular isto assumir que para cada nascimento P(B) = P(G) = 1/2. Ento por exemplo P(BGB) = 1/2 x 1/2 x 1/2 = 1/8 = 0.125 i.e. assumindo que sexo independente dos nascimentos prvios e multiplicando probabilidades ao longo dos ramos da rvore. Modelos de rvore so teis para analisar qualquer processo "passo por passo". Exemplo - Gnero em populaes humanas Em populaes humanas aproximadamente 52% de nascimentos so meninos e 48% so meninas. Assim um modelo mais realista usar P(B) = 0.52 P(G) = 0.48
Figura 2 - modelo mais realista

75

por exemplo P(BGB) = 0.52 x 0.48 x 0.52 = 0.13 Um evento qualquer subconjunto de resultados. Calcule probabilidades para os eventos seguintes que usam o " modelo realista ". C: todas as crianas tm o mesmo sexo D: menos de 2 meninos E: C e D ==> todas meninas F: C ou D ==> no 2 meninos

GGG GGG GGG GGB GGB GGB GBG GGB GGB GBB GBB GBB BGG BGG BGG

GGG GGB GGB GBB BGG


76

BGB BBG BBG

BGB BBG BBG BBB D

BGB BBG BBG BBB E

BGB BBG BBG BBB F

BBB C

P(C) = P(GGG) + P(BBB) = 0.11 + 0.14 = 0.25 P(D) = 0.11 + 3 x 0.12 = 0.47 P(E) = P(C e D) = P(GGG) = 0.11 P(F) = P(C ou D) = 0.11 + 3 x 0.12 + 0.14 = 0.61 Os eventos C e D no so mutuamente exclusivos (disjuntos) porque o resultado GGG est em ambos. C e D podem acontecer simultaneamente. Ento P(C ou D) = P(F) no igual a P(C)+P(D), porque isto contaria o resultado comum (GGG) duas vezes. [compare isto com a regra de adio para probabilidades de eventos mutuamente exclusivos]. Ao invs, use a regra mais geral para P(C ou D)

= 0.25 + 0.47 - 0.11 = 0.61 como requirido

Anexo 3 - Probabilidade Condicional


A probabilidade de um evento A pode ter que ser recalculada se ns sabemos com certeza que outro evento B j aconteceu e A e B no so independentes.

77

Exemplo - Uma famlia de 3 crianas Em uma famlia de 3 crianas suponha se sabe que h menos que 2 meninos. Qual a probabilidade que todas as 3 crianas so do mesmo sexo? Usando a anotao prvia C: todas as crianas do mesmo sexo D: menos que 2 meninos. Ns queremos a probabilidade de C dado que D aconteceu. Usaremos notao P(C|D) descrever isto.

' C'

' D'

GGG GGG Cada coluna lista todo os resultados. GBG GBG Aqueles que incluem o eventos C e D esto em negrito. GBB GBB BGG BGG BGB BGB BBG BBG BBB BBB Como D aconteceu, s 4 resultados so agora possveis: GGG, GGB, GBG e BGG. As sua probabilidades devem somar 1. Para obter estas probabilidades calculadas previamente elas precisam ser "recalculadas" dividindo pelo seu total que era P(D) = 0.47. A probabilidade de C, dado que D aconteceu, chamada de probabilidade era 0.11: condicional e escrita como P(C|D). Lembre-se que a probabilidade de GGG GGB GGB

P (C / D ) =

P (C ou D) 0,11 = = 0,23 0,47 P ( D)

78

Em geral para eventos X e Y a probabilidade condicional de X dado que Y aconteceu

P( X / Y ) =

P( X e Y) P(Y)

P(X|Y) = P(X e Y)/P(Y) Isto pode ser rearranjado como: P(X e Y) = P(X|Y)P(Y) P(X e Y) = P(Y|X) P(X) Exemplo - Gnero de empregados A tabela abaixo mostra as probabilidades de homens (M) e mulheres (F) sendo empregados (E) ou desempregados (U) em alguma populao (exclui aqueles que no desejam ser empregado).

M E U 0.52 0.05 0.57

F 0.41 0.02 0.43 0.93 0.07 1.00

Ache (a) P(E|M), a probabilidade condicional de emprego dado que a pessoa masculina (b) P(M|E), a probabilidade condicional de ser masculino dado que a pessoa empregada. Respostas:

79

P( E / M ) =

P ( E e M) 0,52 = = 0,91 P(M) 0,57

Figure 3: Modelo de rvore que mostra probabilidades condicionais

por exemplo P(E) = P(E e M) + P(E e F) = P(E|M)P(M) + P(E|F)P(F) = 0.91 x 0.57 + 0.95 x 0.43 = 0.93

P(M / E ) = =

P( E / M ) P(M ) P( E / M ) P(M ) + P( E / F ) P( F ) 0,52 = = 0,56 0,93


Independncia Revisitada A regra para a interseo de dois eventos P(X e Y) = P(X)P(Y|X) = P(Y)P(X|Y) Se P(X|Y) = P(X), ento diramos que X independente de Y que a probabilidade de X ocorrer no afetada se Y acontece ou no. Substituindo

P ( M e E) P( E )

80

isto na equao acima d P(X e Y) = P(X) .P(Y), a regra para eventos independentes.

Resumo do Clculo de Probabilidades

81

82

Exerccios de Probabilidade 1) Trs moedas so jogadas simultaneamente. Qual a probabilidade de obter 2 caras? Qual a probabilidade de obter pelo menos 2 caras? 2) Dois dados so jogados simultaneamente. Calcular a probabilidade de que a soma dos nmeros mostrados nas faces de cima seja 7. 3) Dois dados so jogados simultaneamente. Calcular a probabilidade de que o mximo seja maior ou igual a 3. 4) Para a Copa do Mundo 24 pases so divididos em seis grupos, com 4 pases cada um. Supondo que a escolha do grupo de cada pas feita ao acaso, calcular a probabilidade de que dois pases determinados A e B se encontrem no mesmo grupo. ( Na realidade a escolha no feita de forma completamente aleatria). 5) Uma loteria tem N nmeros e s um prmio. Um jogador compra n bilhetes em uma extrao. Outro compra s um bilhete em n extraes diferentes. ( Ambos os jogadores apostam portanto a mesma importncia). Qual deles tem maior probabilidade de ganhar o prmio? 6) Seis bolas so colocadas em trs urnas diferentes. Qual a probabilidade de que todas as urnas estejam ocupadas? 7) Um nmero entre 1 e 300 escolhido aleatoriamente. Calcular a probabilidade de que ele seja divisvel por 3 ou por 5. 8) Um torneio disputado por 4 times A,B, C e D. 3 vezes mais provvel que A vena do que B, duas vezes mais provvel que B vena do que C e 3 vezes mais provvel que C vena do que D. Quais as probabilidades de ganhar para cada um dos times? 9) Uma caixa contem 20 peas em boas condies e 15 em ms condies. Uma amostra de 10 peas extrada. Calcular a probabilidade de que ao menos uma pea na amostra seja defeituosa. 10) Uma cidade tem 30 000 habitantes e trs jornais A, B e C. Uma pesquisa de opinio revela que: 12 000 lem A; 8 000 lem B; 7 000 lem A e B; 6 000 lem C;

83

4 500 lem A e C; 1 000 lem B e C; 500 lem A,B e C. Qual a probabilidade de que um habitante leia: a) b) Pelo menos um jornal; S um jornal.

11) Os algarismos 1,2,3,4,5 so escritos em 5 cartes diferentes. Estes cartes so escolhidos (sem reposio) aleatoriamente e os algarismos que vo aparecendo so escritos da esquerda para a direita, formando um nmero de 5 algarismos. a) b) calcular a probabilidade de que o nmero escrito seja par Se a escolha fosse com reposio qual seria a probabilidade?

12) Colocam-se aleatoriamente b bolas em b urnas. Calcular a probabilidade de que exatamente uma urna seja deixada desocupada. 13) Dez pessoas so separadas em dois grupos de 5 pessoas cada um. Qual a probabilidade de que duas pessoas determinadas A e B faam parte do mesmo grupo? 14) 5 homens e 5 mulheres compram 10 cadeiras consecutivas na mesma fila de um teatro. Supondo que se sentaram aleatoriamente nas 10 cadeiras, calcular: a) b) a probabilidade de que homens e mulheres se sentem em cadeiras alternadas; A probabilidade de que as mulheres se sentem juntas.

15) Um nmero entre 1 e 200 escolhido aleatoriamente. Calcular a probabilidade de que seja divisvel por 5 ou por 7. 16) Uma moeda foi cunhada de tal forma que 4 vezes mais provvel de dar cara do que coroa. Calcular as probabilidades de cara e coroa. 17) Aos nmeros inteiros entre 1 e n so designadas probabilidades proporcionais aos seus valores. Calcular P(i) para 1 i n 18) Trs dados so jogados simultaneamente. Calcular a probabilidade de obter 12 como a soma dos resultados. 19) Sejam A e B eventos tais que

84

1 1 1 P( A) = , P(B) = e P(A B) = 2 4 5 Calcular : b) P(A) c) P( B) a) P ( A B )

d) P(A B) e) P(A B) f) P(A B)

g) P(A B)
20) No jogo da Sena so sorteadas 6 dezenas distintas entre as dezenas 01 02 - ...- 50. O apostador escolhe 6 dessas 50 dezenas e premiado se so sorteadas 4 (quadra), 5 (quina), 6 (Sena Principal) das dezenas por ele escolhidas ou se as dezenas sorteadas so escolhidas aumentadas (Sena Anterior) ou diminudas (Sena Posterior) de uma unidade (50 +1 = 01, 01 1 = 50). Determine a probabilidade de uma apostador fazer: a) b) c) d) uma quadra uma quina a Sena Principal A Sena Anterior ou a Posterior.

21) No jogo da Loto so sorteadas 5 dezenas distintas entre as dezenas 01 02 - ...- 99 - 00. O apostador escolhe 6,7,8,9 ou 10 dezenas e premiado se so sorteadas 3 (terno), 4 (quadra) ou 5 (quina) das dezenas escolhidas. Determine a probabilidade de uma apostador que escolheu 10 dezenas fazer: a) um terno b) uma quadra c) a quina 22) Na Loteria Esportiva h 13 jogos e o apostador deve indicar em cada um deles a vitria do time 1, a vitria do time 2 ou o empate. Um jogador premiado: a) com 10 pontos, se acerta os resultados dos 10 primeiros jogos e erra os dos 3 ltimos;

85

b) com 11 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas um dos resultados dos 3 ltimos; c) com 12 pontos, se acerta os resultados dos 10 primeiros jogos e acerta apenas 2 dos resultados dos 3 ltimos; d) com 13 pontos, se acerta os resultados dos 13 jogos. Supondo que em cada jogo os resultados possveis tenham probabilidades iguais, determine a probabilidade de um apostador ser premiado: a) b) c) d) com 10 pontos; com 11 pontos; com 12 pontos; com 13 pontos.

23) Escolhem-se ao acaso duas peas de um domin. Qual a probabilidade delas possurem um nmero comum? 24) Em um armrio h n pares de sapatos. Retiram-se ao acaso p pares de sapatos desse armrio. Qual a probabilidade de haver entre esses ps exatamente k pares de sapatos? 25) Colocam-se ao acaso n botes em um tabuleiro n x n, no sendo permitido haver dois botes em uma mesma casa. Qual a probabilidade de no haver dois botes nem na mesma linha nem na mesma coluna? 26) Um polgono regular de 2n + 1 lados est inscrito em um crculo. Escolhemse 3 dos seus vrtices, formando-se um tringulo. Qual a probabilidade do centro do crculo ser interior ao tringulo? 27) Tem-se n urnas. Bolas so colocadas ao acaso nas urnas, uma de cada vez, at que alguma urna receba duas bolas. Qual a probabilidade de colocarmos exatamente p bolas nas urnas? 28) Joo e Pedro lanam, cada um, um dado no-tendencioso. Qual a probabilidade do resultado de Joo ser maior ou igual ao resultado de Pedro? 29) Numa prova h 7 perguntas do tipo verdadeiro-falso. Calcular a probabilidade de acertarmos todas as 7 se: a) escolhermos aleatoriamente as 7 respostas, b) escolhermos aleatoriamente as respostas mas sabendo que h mais respostas verdadeiro do que falso. 30) Sabe-se que 80 % dos pnaltis marcados a favor do Brasil so cobrados por jogadores do Flamengo. A probabilidade de um pnalti ser convertido 40 %

86

se o cobrador for do Flamengo e de 70 % em caso contrrio. Um pnalti a favor do Brasil acabou de ser marcado: a) Qual a probabilidade do pnalti ser cobrado por um jogador do Flamengo e ser convertido? b) Qual a probabilidade do pnalti ser convertido? c) Um pnalti foi marcado a favor do Brasil e acabou de ser desperdiado. Qual a probabilidade de que o cobrador tenha sido um jogador do Flamengo? 31) Marina quer enviar uma carta a Vernica. A probabilidade de que Marina escreva a carta de 8/10. A probabilidade de que o correio no perca de 9/10. A probabilidade de que o carteiro entregue de 9/10. Dado que Vernica no recebeu a carta, qual a probabilidade condicional de que Marina no a tenha escrito? 32) Durante o ms de agosto a probabilidade de chuva em um dia determinado de 4/10. O Fluminense ganha um jogo em um dia com chuva com probabilidade de 6/10 e em um dia sem chuva com probabilidade de 4/10. Sabendo-se que o Fluminense ganhou um jogo naquele dia de agosto, qual a probabilidade de que choveu neste dia? 33) Num exame h 3 respostas para cada pergunta e apenas uma delas certa. Portanto, para cada pergunta, um aluno tem probabilidade de 1/3 de escolher a resposta certa se ele est adivinhando e 1 se sabe a resposta. Um estudante sabe 30 % das respostas do exame. Se ele deu a resposta correta para uma das perguntas, qual a probabilidade de que a adivinhou? 34) Um jogador deve enfrentar, em um torneio, dois outros A e B. Os resultados dos jogos so independentes e as probabilidades dele ganhar de A e de B so 1/3 e 2/3 respectivamente. O jogador vencer o torneio se ganhar dois jogos consecutivos, de uma srie de 3. Que srie de jogos mais favorvel ao jogador: ABA ou BAB? 35) A probabilidade de fechamento de cada rel do circuito apresentado na figura abaixo igual a p, 0 < p < 1. 2

87

Se todos os rels funcionam independentemente, qual a probabilidade de que haja corrente circulando entre os terminais A e B? 36) Escolhe-se ao acaso um nmero entre 1 e 50. Se o nmero primo qual a probabilidade de que seja mpar? 37) Uma moeda jogada 6 vezes. Sabendo-se que no primeiro lanamento deu coroa, calcular a probabilidade condicional de que o nmero de caras nos 6 lanamentos supere o nmero de coroas. 38) Uma moeda jogada 4 vezes. Sabendo que o primeiro resultado foi cara, calcular a probabilidade condicional de obter pelo menos 2 caras. 39) Joga-se um dado duas vezes. Calcule a probabilidade condicional de obter 3 na primeira jogada, sabendo que a soma dos resultados foi 7. 40) Duas mquinas A e B produzem 3000 peas em um dia. A mquina A produz 1000 peas, das quais 3 % so defeituosas. A mquina B produz as restantes 2000, das quais 1 % so defeituosas. Da produo total em um dia uma pea escolhida ao acaso e, examinando-a, constata-se que defeituosa. Qual a probabilidade de que a pea tenha sido produzida pela mquina A? 41) Um estudante resolve um teste do tipo verdadeiro-falso. Ele sabe dar a soluo correta para 40 % das questes. Quando ele responde uma questo cuja soluo conhece, d a resposta correta, e nos outros casos decide na cara ou coroa. Se uma questo foi respondida corretamente, qual a probabilidade que ele sabia a resposta? 42) Sejam A e B dois eventos independentes tais que P(A) = 1/3 e P(B) = Calcule

P( A B), P(A B) e P(A B)

43) Sejam A e B dois eventos independentes tais que

P ( A) = 1 / 4 e P(A B) = 1/3
Calcule P(B) 44) Uma moeda equilibrada jogada duas vezes. Sejam A e B os eventos: A: cara na primeira jogada; B: cara na segunda jogada
88

Verifique que A e B so independentes 45) Jogue um dado duas vezes. Considere os eventos: A = o resultado do 1 lanamento par; B = o resultado do 2 lanamento par; C = a soma dos resultados par. A e B so independentes? e A e C? e B e C? e A, B e C? 46) Uma pessoa com um molho de n chaves tenta abrir uma porta. Apenas uma das chaves consegue abrir a porta. Qual a probabilidade dela s conseguir abrir a porta na k-sima tentativa: a) supondo que aps cada tentativa mal sucedida ela descarta a chave usada; b) supondo que ela no faz isso. 47) (Problema de Chevalier de Mr) Determine a probabilidade de obter: a) ao menos um 6 em 4 lanamentos de um dado; b) ao menos um duplo 6 em 24 lanamentos de um par de dados. 48) A probabilidade de um homem ser canhoto 1/10. Qual a probabilidade de, em um grupo de 10 homens, haver pelo menos um canhoto? 49) Sacam-se, sucessivamente e sem reposio, duas cartas de um baralho comum (52 cartas). Calcule a probabilidade de a 1 carta ser uma dama e a 2 ser de copas. 50) Um exame de laboratrio tm eficincia de 95 % para detectar uma doena quando essa doena existe de fato. Entretanto o teste aponta um resultado falso positivo para 1 % das pessoas sadias testadas. Se 0,5 % da populao tem a doena, qual a probabilidade de uma pessoa ter a doena dado que seu exame foi positivo? 51) A lana uma moeda n+ 1 vezes e B lana a mesma moeda n vezes. Qual a probabilidade de A obter mais caras que B? 52) Quantas pessoas voc deve entrevistar para ter probabilidade igual ou superior a 0,5 de encontrar pelo menos uma que aniversarie hoje? 53) Uma urna contm 3 bolas vermelhas e 7 bolas brancas. A e B sacam alternadamente, sem reposio, bolas dessa urna at que uma bola vermelha seja retirada. A saca a primeira bola. Qual a probabilidade de A sacar a bola vermelha?

89

54) Em uma cidade com n+ 1 habitantes, uma pessoa conta um boato para outra pessoa, a qual por sua vez conta para uma terceira pessoa, etc. Calcule a probabilidade do boato ser contado m vezes: a) sem retornar primeira pessoa; b) sem repetir nenhuma pessoa. 55) Sacam-se, com reposio, n (n > 1) bolas de uma urna que contem 9 bolas numeradas de 1 a 9. Qual a probabilidade do produto dos nmeros das n bolas extradas ser divisvel por 10? 56) Quantas vezes, no mnimo, se deve lanar um dado no tendencioso para que a probabilidade de obter algum 6 seja superior a 0,9? 57) Um jri de 3 pessoas tem dois jurados que decidem corretamente (cada um) com probabilidade p e um terceiro jurado que decide por cara ou coroa. As decises so tomadas por maioria. Outro jri tem probabilidade p de tomar uma deciso correta. Qual dos jris tem maior probabilidade de acerto? 58) Um dia voc captura 10 peixes em um lago, marca-os e coloca-os no lago novamente. Dois dias aps, voc captura 20 peixes no mesmo lago e constata que 2 desses peixes haviam sido marcados por voc. a) se o lago possui k peixes, qual era a probabilidade de, capturando 20 peixes, encontrar dois peixes marcados? b) para que valor de k essa probabilidade mxima? 59)Qual a probabilidade de, em um grupo de 4 pessoas: a) b) c) d) e) haver alguma coincidncia de signos zodiacais? as quatro terem o mesmo signo? duas terem o mesmo signo, e as outras duas, outro signo? trs terem o mesmo signo e, a outra, outro signo? todas terem signos diferentes?

60) Deseja-se estimar a probabilidade p de um habitante de determinada cidade ser um consumidor de drogas. Para isso realizam-se entrevistas com alguns habitantes da cidade. No se deseja perguntar diretamente ao entrevistado se ele usa drogas, pois ele poderia se recusar a responder ou, o que seria pior, mentir. Adota-se ento o seguinte procedimento: prope-se ao entrevistado duas perguntas do tipo SIM-NO: I) II) Voc usa drogas? Seu aniversrio anterior ao dia 2 de julho?

90

Pede-se ao entrevistado que jogue uma moeda, longe das vistas do entrevistador, e que se o resultado for cara, responda primeira pergunta e, se for coroa, responda segunda pergunta. a) sendo p1 a probabilidade de um habitante da cidade responder sim, qual a relao entre p e p1 ? b) se forem realizadas 1000 entrevistas e obtidos 600 sim razovel imaginar que p1 0,6. Qual seria, ento, sua estimativa de p? 61) Uma firma fabrica chips de computador. Em um lote de 1000 chips, uma amostra de 10 chips revelou 1 chip defeituoso. Supondo que no lote houvesse k chips defeituosos: a) Calcule a probabilidade de em uma amostra de 20 chips haver exatamente 1 chipdefeituoso. b) Determine o valor de k que maximiza a probabilidade calculada no item a). 62) Jogamos uma moeda no viciada 10 vezes. Qual a probabilidade de obtermos exatamente 5 caras? 63) Um aluno marca ao acaso as respostas em um teste mltipla-escolha com 10 questes e 5 alternativas por questo. Qual a probabilidade dele acertar exatamente 4 questes? 64) Joga-se uma moeda no viciada. Qual a probabilidade de serem obtidas 5 caras antes de 3 coroas? 65) Lana-se um dado no viciado at a obteno do terceiro 6. Seja X o nmero do lanamento em que isto ocorre. Calcule: a) P(X = 10); b) P(X > 10); c) P(X = 10). 66) Dois adversrios A e B disputam uma srie de partidas. A probabilidade de A ganhar uma partida 0,6 e no h empates. Qual probabilidade de A ganhar a srie? 67) Dois adversrios A e B disputam uma srie de partidas. O primeiro que obtiver 12 vitrias ganha a srie. No momento o resultado 6 x 4 a favor de A. Qual a probabilidade de A ganhar a srie sabendo que em cada partida as probabilidades de A e B vencerem so respectivamente 0,4 e 0,6? 68) Motores de avio funcionam independentemente e cada motor tem uma probabilidade p de falhar durante o vo. Um avio voa com segurana se a maioria de seus motores funciona. Para que valores de p um avio com 3 motores prefervel a um avio com 5 motores?

91

69) Suponha que uma caracterstica (como a cor dos olhos, por exemplo) dependa de um par de genes. Representemos por A um gen dominante e por a um gen recessivo. Assim um indivduo com genes AA dominante puro, um com genes aa um recessivo puro e um com genes Aa um hbrido. Dominantes puros e hbridos so semelhantes em relao caracterstica. Filhos recebem um gen do pai e um da me. Suponha que pai e me sejam hbridos e tenham 4 filhos. a) Qual a probabilidade do primeiro filho ser um recessivo puro? b) Qual a probabilidade de exatamente um dos 4 filhos ser um recessivo puro? 70) (O problema das caixas de fsforos de Banach18) Um matemtico sai de casa todos os dias com duas caixas de fsforos, cada uma com n palitos. Toda vez que ele que acender um cigarro, ele pega (ao acaso) uma das caixas e retira da um palito. O matemtico meio distrado, de modo que quando ele retira o ltimo palito de uma caixa, ele no percebe que a caixa est vazia. Como ele fuma muito, em certa hora ele pega uma caixa e constata que ela est vazia. Qual a probabilidade de nesse momento a outra caixa conter exatamente k ( 0 k n ) palitos? 71) Lana-se repetidamente um par de dados no tendenciosos. Qual a probabilidade de obtermos duas somas iguais a 7 antes de obtermos trs somas iguais a 3? 72) Uma moeda tem probabilidade 0,4 de dar cara. Lanando-a 12 vezes qual o mais provvel valor do nmero de caras obtidas? 73) Suponha que uma varivel aleatria T tem a seguinte distribuio de probabilidade

T P(T=t)

0 0,5

1 0,3

2 0,2

a. Ache P(T <= 0) b. Ache P(T >= 0 and T < 2) c. Calcule E(T), a mdia da varivel aleatria T. 74) Suponha que voc escolha uma bola de uma urna contendo 7 bolas vermelhas, 6 bolas brancas , 5 bolas azuis e 4 bolas brancas. Qual a probabilidade de que voc escolha uma bola vermelha? 75) Suponha que voc escolha uma bola aleatoriamente de uma urna 7 bolas vermelhas, 6 bolas brancas, 5 bolas azuis e 4 bolas amarelas. Qual a probabilidade de que voc escolha uma bola branca?
18 Stefan Banach (1892-1945), matemtico polons

92

76) Um dado no viciado jogado duas vezes. Ache a probabilidade de sair um 5 ou 6 no primeiro lance e um 1, 2 ou 3 no segundo lance. 77) Ache a probabilidade de no sair um 5 ou 6 em qualquer uma de duas jogadas de um dado no viciado. 78) Voc tem um baralho de 52 cartas bem embaralhadas. Qual a probabilidade de escolher dois valetes consecutivos se a primeira carta no recolocada no baralho? 79) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado que cada bola recolocada na urna depois de escolhida. 80) Uma urna contem 5 bolas vermelhas, 3 bolas brancas e 6 bolas azuis. Determine a probabilidade de que elas sejam escolhidas na ordem azul, branca e vermelha dado que cada bola no recolocada na urna depois que ela escolhida. 81) A urna A contem 2 bolas vermelhas e 3 azuis. A urna B contem 8 bolas vermelhas e 2 azuis. Voc joga uma moeda honesta. Se amoeda mostra cara voc escohe uma bola da urna A. Se a moeda mostra coroa voc escolhe uma bola da urna B. Determine a probabilidade de que voc escolha uma bola vermelha. 82) Voc tem 6 bolas, cada uma de cor diferente. De quantas maneiras distintas voc pode dispo-las em uma fila? 83) De quantas maneiras possveis 8 pessoas podem sentar-se em um banco se apenas esto disponveis 3 assentos? 84) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos 0,1,2,..,9 se repeties so permitidas? 85) De quantas maneiras nmeros de 3 algarismos podem ser formados com os dgitos 0,1,2,..,9 se repeties no so permitidas? 86) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los se todos os livros de cada assunto precisam ficar juntos? 87) Trs diferentes livros de Cincias, 5 diferentes livros de Ingls e 4 diferentes livros de Economia so arranjados em uma estante. De quantas maneiras possvel dispo-los se somente os livros de Cincias precisam ficar juntos? 88) Calcule C(8,3)

93

89) De quantas maneiras pode um comit de 6 pode ser escolhido de 10 pessoas? 90) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3 mdicos e 4 enfermeiras precisa ser formado. De quantas maneiras isto pode ser feito se um particular mdico deve ser includo e se qualquer enfermeira pode ser includa? 91) A partir de 4 mdicos e de 6 enfermeiras, um comit consistindo de 3 mdicos e 4 enfermeiras precisa ser formado. De quantas maneiras isto pode ser feito se uma particular enfermeira no pode ser includa no comit? 92) De quantas maneiras diferentes saladas de frutas podem ser feitas de ma, laranja, tangerina e banana? 93) A partir de 6 consoantes e 4 vogais, quantas combinaes distintas de letras podem ser feitas? 94) Quais dos seguintes pares de eventos so mutuamente exclusivos? a. A: os nmeros pares ; b. A: os nmeros mpares; que 10; c. A: os nmeros menores que 5; que 200; e. A: os nmeros negativos; B: os nmeros pares B: todos os nmeros negativos B: os nmeros menores do B: o nmero 5; B: os nmeros maiores do

d. A: os nmeros maiores do que 100;

95) Uma carta escolhida de um baralho padro de 52 cartas. Ao descrever a ocorrncia de dois possveis eventos, um s e um Rei, estes dois eventos so: (a) independentes (b) mutuamente exclusivos (c) variveis aleatrias (d) aleatoriamente independentes.

94

96) Suponha que certa caracterstica oftalmolgica associada com a cor dos olhos. 300 indivduos selecionados aleatoriamente so estudados e apresentam os seguintes resultados:

Cor dos olhos Caracterstica Azuis Sim No Total 70 20 90 Castanhos 30 110 140 Outra 20 50 70 Total 120 180 300

A. Qual a probabilidade de que uma pessoa tenha olhos azuis ? B. O que voc espera que seja o valor de P(Ter a caracterstica e olhos azuis) se a cor dos olhos e a existncia da caracterstica so independentes ? C. Quais das seguintes expresses descrevem a relao entre os eventos A = a pessoa tem olhos castanhos e B = a pessoa tem olhos azuis ? (marque a resposta correta). i. independente iii. simples ii. exaustivo iv. mutuamente exclusivos

97) Uma amostra de 1000 pessoas diagnosticada com certa doena distribuda de acordo com a altura e o status (evoluo) da doena a partir de um exame clnico de acordo com a seguinte tabela:

Sem doena Alta 122

a Fraca 78

Moderada 139

Severa 61

Totais 400

95

Mdia Baixa Totais

74 104 300

51 71 200

90 121 350

35 54 150

250 350 1000

Como voc estimaria, a partir dessa tabela, a probabilidade de ser mdia ou baixa em altura e ter moderado ou severo grau de evoluo da doena ? a. 600/1000 * 500/1000 b. 300/500 c. 300/1000 d. 300/600 e. 800/1000

98) De cerca de 25 artigos, nove so defeituosos, seis tem defeitos superficiais e trs tem defeitos importantes. Determine a probabilidade de que um artigo selecionado aleatoriamente tenha defeitos importantes dado que ele tem defeito. a. 1/3 b. 0,25 c. 0,24 d. 0,08 99) A seguinte tabela de duas entradas mostra as frequncias de ocorrncia de uma exposio hipottica e a doena em um grupo de 1000 pessoas. Doena Presente Exposio Presente Ausente Totais 75 25 100 Totais 400 600 1000

Ausente 325 575 900

a. Qual a probabilidade de exposio no grupo ? b. Qual a probabilidade conjunta de tanto exposio como de doena estar presente no grupo ?
96

c. Calcule a probabilidade de doena estar presente condicionada a presena de exposio e condicionada a ausncia de exposio. 100) Um epidemiologista acredita que as rodovias tm alguma relao com o desenvolvimento de uma nova doena porque a probabilidade de uma pessoa estar morando a menos de uma milha das rodovias, dado que ela tem a doena, 0,80. Voc concorda com ele ? Porque ou porque no ? 101) Um dormitrio de um campus universitrio abriga 200 estudantes. 120 so homens, 50 so dos graus mais avanados e 40 so homens dos graus mais avanados. Um estudante selecionado ao acaso. A probabilidade de selecionar um estudante de grau menos elevado, dado que o estudante mulher, : (a) 7/8 (b) 7/15 (c) 2/5 102) Uma amostra de 2000 indivduos distribuda de acordo com a cor de olho e a presena ou ausncia de uma certa caracterstica oftalmolgica como segue: (d) 7/20 (e) 1/4

Caracterstica Sim No Total

Cor dos olhos Castanho Azul 400 270 200 650 600 920

Outro 130 350 480

800 1200 2000

Em uma seleo aleatria de um indivduo da populao em estudo, Qual sua estimativa da probabilidade de: a. a pessoa tem olhos azuis? ___________ b. a caracterstica est presente e a pessoa tem castanhos? ____________ c. a pessoa nem no tem olhos castanhos nem olhos azuis dados que a caracterstica est ausente? _______________ d. a pessoa nem no tem olhos de outra cor nem olhos azuis e a caracterstica est presente _______________
97

e. a pessoa no tem olhos castanhos? _______________ f. a pessoa tem olhos azuis ou nem no tem olhos azuis nem olhos castanhos? __________ g. a pessoa no tem a caracterstica ou no tem olhos castanhos? ________ 103) Um sindicato de trabalhadores local consiste de associados encanadores e eletricistas, classificado de acordo com grau: Aprendiz 25 15 40 Jornaleiro 20 40 60 Oficial 30 20 50

Encanadores Eletricistas

75 75

Um associado do sindicato selecionado ao acaso. Dado que o pessoa selecionada um encanador, a probabilidade de que ele um jornaleiro : a. 1/2 b. 1/3 c. 4/15 d. 2/15 e. nenhuma das anteriores. 104) Entre vinte e cinco artigos, nove so defeituosos, seis tem somente um defeito no importante e trs tm um defeito importante. Determine a probabilidade de que um artigo selecionado ao acaso tenha defeitos importantes dado que ele tenha defeitos. a. b. c. d. 1/3 0,25 0,24 0,08

105) Os depositantes do Banco X so categorizados por idade. Selecionaremos aleatoriamente um indivduo desse grupo de 2.000 depositantes Sexo Idade | Homem | Mulher ----------------------------------------------30 ou menos | 800 | 600 31 ou mais | 400 | 200 ----------------------------------------------i) Ento P(mulher de 30 ou menos) = a) 2/5 b) 3/4 c) 3/7 d) 3/10 e) nenhuma das anteriores
98

ii) Ento P[homem ou (31 ou mais)] = a) 1/5 b) 3/10 c) 1/2 d) 7/10 e) nenhuma das anteriores iii) Ento P(mulher) = a) 3/10 b) 2/5 c) 3/5

d) 2/3

e) nenhuma das anteriores

iv) Qual a probabilidade condicional de que um depositante escolhido tenha idade de 30 anos ou menos, dado que ele homem? a) 2/3 b) 7/10 c) 4/7 d) 2/5 e) nenhuma das anteriores

v) So as idades e sexos dos depositantes independentes para o Banco X? Porque?

105) Um epidemiologista sente que as rodovias tem alguma relao com o desenvolvimento de uma nova doena porque a probabilidade de que uma pessoa esteja morando a uma milha ou menos da rodovia, dado que ela tem a doena 0,80. Voc concorda com ele? Explique porque. 106) Existem duas urnas marcadas com H e T. A urna H contem 2 bolas vermelhas e 1 bola azul. A urna T contem 1 bola vermelha e 2 azuis. Uma moeda jogada ao acaso. Se sai cara escolhida uma bola da urna H. Se sai coroa, uma bola escolhida da urna T. Ache as seguintes probabilidades. a. P(cara e vermelha) d. P(azul) b. P(coroa) c. P(vermelha) e. P(cara|vermelha)

107) O nmero de paradas de mquinas em uma grande fbrica durante uma semana tem a seguinte distribuio de probabilidade: B P(B = b) 5 0,25 10 0,30 15 0,25 20 0,15 25 0,05

Usando essa distribuio, Calcule E[B] e V[B]

108) A Companhia Beta comprou 80 componentes eletrnicos de um fornecedor que declara que somente 2 % dos componentes que ele vende so defeituosos e que os componentes defeituosos so misturados aleatoriamente com os componentes bons. Cada componente defeituoso

99

custar a Beta US$ 250 em custos de reparo. Se o fornecedor est certo, qual ser o nmero esperado de componentes defeituosos ? E qual o custo esperado de reparo? 109) Um vendedor de carros oferece a todos os seus clientes potenciais uma corrida de 30 milhas no tipo de carro que o cliente est interessado em comprar, mais um almoo ou jantar gratuitos. Todos estes custos so cerca de US$ 50. Se o cliente no compra o carro, o vendedor perde US$ 50, mas se o cliente comprar o carro, o lucro mdio do vendedor de cerca de US$ 500 (dos quais os custos da corrida e da refeio devem ser deduzidos). No passado, 20 % dos clientes compraram o carro depois da corrida e da refeio gratuita. Qual o lucro esperado para o vendedor nessa situao? 110) Um processo de produo paralisado para ajuste toda vez que uma amostra aleatria de cinco itens, selecionada com reposio, apresenta dois ou mais defeituosos. Ache a probabilidade de que o processo ser paralisado aps uma inspeo se ele est produzindo: a) 20 % de defeituosos b) 10 % de defeituosos c) 5 % de defeituosos 111) Um simples mssil de certa variedade tem uma probabilidade de de derrubar um bombardeiro, uma probabilidade de de danific-lo e uma probabilidade de de err-lo. Alm disso, dois tiros danificadores derrubaro o avio. Se quatro destes msseis so lanados, qual a probabilidade de derrubar um avio? 112) De acordo com um cientista poltico, a populao votante de certa cidade consiste de 46 % do candidato A, 40 % do candidato B, 11 % do candidato C e 3 % do candidato D. Em uma amostra aleatria de 5 votantes, qual a probabilidade de que a amostra contenha: a) Dois votantes para o candidato A e um de cada das outras categorias? b) Trs votantes para o candidato A e dois para o candidato B? c) Nenhum votante para o candidato D?

100

4. Variveis Aleatrias Discretas


Objetivos do Captulo: Distinguir entre uma distribuio de probabilidade discreta e contnua Calcular a mdia, a varincia e o desvio padro de uma distribuio de probabilidade discreta. Definir os termos Distribuio de Probabilidade e Varivel Aleatria Descrever as caractersticas das distribuies Binomial, Hipergeomtrica e de Poisson. Definio: Uma varivel aleatria um valor numrico determinado pelo resultado de um experimento ( uma quantidade resultante de um experimento aleatrio que, por acaso, pode assumir diversos valores).

101

Exemplo 1: Considere um experimento aleatrio no qual uma moeda jogada 3 vezes. Seja X o nmero de caras. Seja H o resultado cara e T o resultado coroa.

O espao amostral para este experimento ser:

TTT, TTH, THT, THH, HTT, HTH, HHT, HHH

Assim, os possveis valores de X (nmero de caras) sero: X = 0, 1, 2, 3.

Nota: Neste experimento, h 8 possveis resultados no espao amostral. Desde que eles so todos igualemente provveis de ocorrer, cada resultado tem uma probabilidade de 1/8 de ocorrer.

A figura a seguir ilustra a associao existente entre resultados do experimento (no espao amostral) e os valores assumidos pela varivel X.

TTT TTH THT THH HTT HTH HHT HHH

0 1 1 2 1 2 2 3

102

Espao Amostral

X = Nmero de Caras

O resultado zero caras ocorre o corre somente uma vez O resultado 1 cara ocorre trs vezes O resultado 2 caras ocorre trs vezes

O resultado 3 caras ocorre somente uma vez Da definio de uma varivel aleatria, X, tal como definida neste resultados do experimento. Nota: A varivel aleatria X uma associao de pontos no espao amostral com pontos na reta dos nmeros reais (0,1, 2,3). Na realidade, uma varivel aleatria definida atravs de uma funo em que o domnio o conjunto de todos os resultados possveis do experimento e a imagem o conjunto de todos os valores assumidos pela varivel aleatria. Note que a varivel aleatria no resultado do experimento, mas sim um valor associado a este. Definio: Uma Distribuio de Probabilidade uma lista de todos os resultados de um experimento e suas probabilidades associadas. De forma mais rigorosa, uma funo matemtica em que o domnio so os valores possveis de uma varivel aleatria e a imagem so as suas probabilidades associadas.

experimento, uma varivel aleatria. Seus valores so determinados pelos

A distribuio de probabilidade de uma varivel aleatria X (nmero de caras) nas trs jogadas de uma moeda mostrada a seguir. Distribuio de Probabilidade para Trs Jogadas de uma Moeda

103

Nmero de Probabilidade Caras 0 1 2 3 1/8 = 0,125 3/8 = 0,375 3/8 = 0,375 1/8 = 0,125

Total

8/8 = 1

probabilidade

3/8

1/8

Nmero de caras

CARACTERSTICAS DE UMA DISTRIBUIO DE PROBABILIDADE A probabilidade de um resultado deve estar sempre situada entre 0 e 1.

Exemplo: P(0 caras) = 0,125, P(1 cara) = 0,375 , etc. no experimento de jogar 3 moedas. A soma das probabilidades de todos os resultados mutuamente exclusivos sempre 1 (veja a tabela de distribuio de probabilidade no texto).
104

VARIVEL ALEATRIA DISCRETA Definio: Uma varivel aleatria discreta uma varivel que pode assumir somente certos valores claramente separados (em descontinuidade) resultantes, por exemplo, de uma contagem de algum item de interesse. Exemplo: Seja X o nmero de caras quando uma moeda jogada 3 vezes. Aqui os valores de X so 0,1,2 ou 3 (so claramente separados, em descontinuidade). Nota: uma varivel aleatria discreta no precisa necessariamente assumir apenas valores inteiros. Poderia, por exemplo, ser uma varivel que apresentasse os seguintes valores: 0, 23/7 , 72/25, etc. A condio que deve ser cumprida seus valores sejam descontnuos. VARIVEL ALEATRIA CONTNUA Definio: Uma varivel aleatria contnua prticas). uma varivel que pode

assumir um nmero infinitamente grande de valores (com certas limitaes

Exemplo: (a) Peso de um estudante (b) comprimento de um carro

4.1 O Valor Esperado (mdia) de uma Distribuio de Probabilidade Discreta A mdia refere-se a localizao central de um conjunto de dados. Ela pode ser considerada como um valor de longo prazo de uma varivel aleatria e tambm chamada de valor esperado (ou esperana matemtica), E(X).
105

A mdia de uma distribuio de probabilidade discreta determinada pela frmula:

m = E ( X ) = [ X .P ( X )]
onde

(letra grega, mi) representa a mdia (ou valor esperado) e P(X) a

probabilidade dos vrios resultados de X.

4.2 A Varincia e o Desvio Padro de uma Distribuio de Probabilidade Discreta A varincia mede a quantidade de disperso ou variabilidade de uma distribuio. Ela denotada pela letra grega

(sigma ao quadrado).

O desvio padro obtido atravs da raiz quadrada de da frmula:

A varincia de uma distribuio de probabilidade discreta calculada atravs

s 2 = [(X - m)2 P( X )]
O desvio padro :

Exemplo 2 Uma empresa especializa-se no aluguel de carros para famlias que necessitam de um carro adicional para um perodo curto de tempo. O presidente da empresa tem estudado seus registros para as ltimas 20 semanas e apresentou os seguintes nmeros de carros alugados por semana.

s = s2

106

Nmero 10 11 12 13

Carros alugados

de Semanas 5 6 7 2

Os dados acima podem ser considerados como uma distribuio de probabilidade? Porque ou porque no?

Converta o nmero de carros alugados por semana em uma distribuio de probabilidade.

Nmero 10 11 12 13

carros alugados

de Probabilidade P(X) 0,25 0,30 0,35 0,10

Total

1,00

Calcule o nmero mdio de carros alugados por semana.

A mdia

m = E ( X ) = [ X .P( X )] = (10) (0,25) + (11) (0,30) + (12) (0,35) + (13) (0,10) = 11,3
Calcule a varincia do nmero de carros alugados por semana.

107

A varincia

s 2 = [( X - m ) 2 .P ( X )] = (10 - 11,3) 2 0,25 + (11 - 11,3) 2 0,30 + ... + (13 - 11,3) 2 0,10 = 0,91

Clculo de E(X) Nmero 10 11 12 13 Total de Carros Probabilidade, P(X) 0,25 0,30 0,35 0,10 1,00 XP(X) 2,5 3,3 4,2 1,3 E(X) = 11,3

alugados

Clculo de Nmero Carros 10 11 12 13 Total Alugados

s2
de Prob. P(X) 0,25 0,30 0,35 0,10

(X - m)

( X - m)2

( X - m ) 2 P( X )

10-11,3 11-11,3 12-11,3 13-11,3

1,69 0,09 0,49 2,89

0,4225 0,0270 0,1715 0,2890

s 2 = 0,9135

s = 0,9135 = 0,9558

108

4.3 A Distribuio de Probabilidade Binomial A Distribuio Binomial tem as seguintes caractersticas:

Considere um experimento que apresenta apenas dois resultados possveis que so categorias mutuamente exclusivas: sucesso e falha. So repetidos diversas vezes este mesmo experimento. A probabilidade de sucesso permanece constante para cada tentativa (consequentemente, constante). a probabilidade de falha tambm permanece

As tentativas so independentes, significando que o resultado de uma tentativa no afeta o resultado de qualquer outra tentativa.

Para construir uma distribuio binomial, consideremos: n o nmero de tentativas r o nmero de sucessos observados

p a probabilidade de sucesso em cada tentativa

q a probabilidade de falha em cada tentativa, que igual a 1-p FRMULA PARA A DISTRIBUIO DE PROBABILIDADE BINOMIAL

P( X = r ) =

onde n! lido como n fatorial. Por exemplo, 4! = (4).(3).(2).(1)=24. 0! igual a 1, por definio e 1! = 1. Exemplo 3

n! p q r!(n - r )!
r

n-r

109

O Departamento de Estatstica do Trabalho de um municpio estimou que 20 % da fora de trabalho est desempregada. Uma amostra de 14 trabalhadores obtida deste municpio. Calcule as seguintes probabilidades:

Trs esto desempregados na amostra. (Nota: n = 14 e p = 0,2)

P ( X = 3) =

14! 0,2 3 0,814 - 3 = 0,250 3!(14 - 3)!

No mnimo um dos trabalhadores da amostra esto desempregados.

P ( X 1) = 1 - P ( X = 0) = 1

14! 0,2 0 0,814 - 0 = 0,956 0!(14 - 0)!

No mximo dois dos trabalhadores esto desempregados.

P ( X 2) = 0,044 + 0,154 + 0,250 = 0,448


Exemplo 4 Uma companhia fabrica rolamentos para serem usados em bicicletas. Sabe-se que 5 % dos dimetros dos rolamentos estaro fora dos limites de aceitao (defeituosos). Se 6 rolamentos so selecionados ao acaso, qual a probabilidade de que:

Exatamente zero sejam defeituosos? Exatamente um seja defeituoso? Exatamente dois sejam defeituosos? Exatamente trs sejam defeituosos? Exatamente quatro sejam defeituosos? Exatamente cinco sejam defeituosos? Exatamente seis sejam defeituosos? Note que as condies de uma distribuio binomial esto satisfeitas neste exemplo:

110

H uma probalidade constante de sucesso (0,05) H um nmero fixo de tentativas (6) As tentativas so independentes (Porque?) H somente dois possveis resultados (um rolamento defeituoso ou no defeituoso).

DISTRIBUIO DE PROBABILIDADE BINOMIAL para n = 6 e p = 0,05 Nmero de rolamentos defeituosos, X Probabilidade de ocorrncia, P(X) 0 1 2 3 4 5 6 0,735 0,232 0,031 0,002 0,000 0,000 0,000

Verifique os clculos para os valores da tabela acima Mostre a representao grfica para a Distribuio de Probabilidade Binomial com n = 6 e p = 0,05

Para um n fixo (10) e p pequeno (0,05), a distribuio positivamente assimtrica Para um n fixo (10) e p aproximando-se de 0,5, a distribuio torna-se simtrica. Para um n fixo (10) e p grande (0,95), a distribuio torna-se negativamente assimtrica. Para um p fixo e para valores cada vez maiores de n, a distribuio torna-se cada vez mais simtrica

111

Nota: Como os procedimentos de clculo tornam-se repetitivos (e montonos) faremos a seguir uma simulao no computador para diversos valores dos parmetros n e p de uma distribuio binomial.

4.4 A Mdia e Varincia De Uma Distribuio Binomial A mdia dada por:

m = np
A varincia dada por:

s 2 = np (1 - p )
Nota: A demonstrao terica para estes valores ser desenvolvida em sala de aula e encontra-se na maioria dos livros de Introduo a Estatstica.

Para o exemplo anterior:

p = 0,05 e n = 6

m = np = 6 0,05 = 0,3 s 2 = np (1 - p ) = 6 0,05 0,95 = 0,285

Distribuio Cumulativa de Probabilidade Um engenheiro estimou que 60 % das pontes de um Estado necessitam de reparos. Uma amostra de 10 pontes no Estado foi aleatoriamente selecionada.

112

Qual a probabilidade de que exatamente 6 destas pontes necessitem de reparos? Esta situao (deste exemplo) satisfaz as condies para uma distribuio binomial ? Porque?

Verificar: n = 10, p = 0,6 P(X = 6) = 0,251 Qual a probabilidade de que 7 ou menos destas pontes necessitem de reparos ?

P ( X 7) = P ( X = 0) + P ( X = 1) + ... + P ( X = 7) = 0,833 (verificar)


Este um exemplo de probabilidade cumulativa.

Apndice 1 (Recordao) Uma varivel aleatria (v.a.) um valor numrico que definido em ou determinado pelos resultados ou eventos de um experimento. Variveis aleatrias normalmente so denotadas por letras maisculas, X, Y etc e podem ser discretas ou contnuas. Seja a v.a. X o nmero de sementes que germinam em 100 plantadas. Possveis valores para X so 0,1,2,100, (discreta) Seja a v.a. X a temperatura mxima diria em Uberlndia. Possveis valores so 0 - 50 C por exemplo 26.1276(contnua). Seja X a resposta a uma questo com ' Sim', ' No', 'No Sei'. X no uma v.a (no numrica). Seja Y o nmero de 'Sim's. Y uma v.a. discreta.

113

Distribuio de probabilidade de um v.a. Discreta. Esta uma lista dos possveis valores da v.a. e as probabilidades correspondentes (que tem que somar 1). As probabilidades podem ser escritas:

p =1
k i =1 i

P( X = x i ) = p i para i = 1,2,..., k e 0 p i 1

Apendice 2 (Recordao)

Varivel Aleatria discreta Uma varivel aleatria discreta uma varivel aleatria que toma valores discretos com probabilidades especificadas. Exemplo - uma Famlia de 3 crianas. Seja X uma Varivel Aleatria (VA) = nmero de meninas Possveis valores: X=3 X=2 X=1 X=0 x Probabilidade P(X = x) GGG GGB BBG BBB 0 1/8 1 3/8 2 3/8 3 1/8 GBG BGB BGG GBB

Considere que os 8 resultados so igualmente provveis de forma que

A lista de valores que X pode assumir e as suas probabilidades chamada de distribuio de probabilidade discreta para X.

Conveno de notao - use letras maisculas para variveis aleatrias e letras minsculas para valores especficos

114

Exemplo - tentativas de Bernoulli Cada tentativa um 'experimento' com exatamente 2 possveis resultados, "sucesso " e " fracasso " com probabilidades p e 1-p. Seja X = 1 se sucesso, 0 se fracasso A Distribuio de probabilidade x P(X = x) Exemplo - so lanados 2 dados Seja X a soma dos resultados. Resultados: 11 12 13 14 15 16 21 22 23 24 25 26 31 32 33 34 35 36 41 42 43 44 45 46 51 52 53 54 55 56 61 62 63 64 65 66 0 p 1 1-p

Considere que os 36 resultados so igualmente provveis. Portanto cada um tem probabilidade = 1/36. Possveis valores de X so 2, 3,... , 12 por exemplo P(X = 4) = P(1,3 ou 2,2 ou 3,1) = 3/36. A distribuio de probabilidade x P(X=x) 2 1/36 3 2/36 4 3/36 ... ... 10 3/36 11 2/36 12 1/36

115

Apndice 3 (Recordao)

A distribuio Binomial

Considere n tentativas Bernoulli. tentativas, P(S) = p.

Assuma que a probabilidade de sucesso (S) o mesma para todas as Assuma que as tentativas so independentes e portanto a probabilidade para qualquer determinada combinao de sucessos e fracassos, por exemplo para 5 tentativas, a probabilidade do resultado SSFSF, pode ser obtida multiplicando as probabilidades para cada resultado de tentativa. por exemplo P(SSFSF) = p.p. (1-p) .p.(1-p) = p3(1-p)2

De fato, a probabilidade de obter trs sucessos e dois fracassos em cinco tentativas p3(1-p)2 para cada um dos modos diferentes que isto poderia acontecer, isto , SSSFF, SSFSF,... etc. O nmero de arranjos " distintos " de 3 sucessos e 2 fracassos pode ser facilmente calculado usando o coeficiente binomial tentativas e x o nmero de sucessos requerido.

n onde n o nmero de x n x

O coeficiente binomial (leia-se como "binomial de x em n") definido como

n n! = x x!(n - x )! 5 5! 5.4.3.2.1 Neste exemplo, = 3 3!2! = (3.2.1)(2.1) = 10, portanto tendo uma probabilidade p 3 (1 - p) 2

h 10 maneiras distintas de se obter 3 sucessos em 5 tentativas, com cada arranjo

116

Seja X a V.A. igual ao nmero total de sucessos em n tentativas . Para calcular a probabilidade de obter x sucessos, pode ser mostrado que

n P ( X = x) = x

px

(1 - p) n - x

nmero de arranjos de x Ss e (n-x) Fs

prob. de x Ss

prob. de (n-x) Fs

onde o nmero mnimo de sucessos 0 e o mximo n.

A distribuio do nmero de sucessos chamada distribuio binomial com dois parmetros, n e p, necessrios para determinar P(X=x). Dizemos, de forma abreviada, X ~ B(n,p) Exemplo - Um time de futebol joga 3 jogos Assuma que cada jogo uma tentativa Bernoulli com prob(ganhar) = 0,5 Seja X a V.A. = nmero de vitrias Ento X tem distribuio binomial com n=3 e p=0,5, com resultado vitria (W) ou derrota (L) em cada tentativa. (Isto abreviado como X ~ B(3;0,5)) Qual a probabilidade de que o time ganhe 2 jogos exatamente? P(X=2) = P(WWL) + P(WLW) + P(LWW) = 3/8 (desenhe um diagrama de rvore) ou usando a frmula para probabilidades binomiais, a prob(WWL) = p2(1-p) e o nmero de distintos arranjos de 2 vitrias em trs jogos

3 3! = 2 2!1! = 3 .

117

Portanto

resposta

3 P ( X = 2) = (0,5) 2 (1 - 0,5) 1 usando n = 3, x = 2, p = 0,5 2 3 = 8


As distribuies binomiais so usadas para modelar situaes que podem ser pensadas como tentativas repetidas e " independentes " cada uma com somente 2 possveis resultados. Ns os usaremos posteriormente para fazer inferncias estatsticas sobre propores. Exemplo - Um Sistema de Controle de Qualidade Um Sistema de Controle de Qualidade requer que de cada lote de itens uma amostra de 10 selecionada e testada. Se 2 ou mais itens da amostra so defeituosos o lote inteiro rejeitado. Se a probabilidade de um item ser defeituoso 0,05 (i) qual a probabilidade de 2 defeituosos na amostra? (ii) Qual a probabilidade do lote ser rejeitado? Seja X a V.A. = nmero de defeituosos na amostra de n = 10 itens. Portanto, X ~ Binomial (10; 0,05) (i)

3p2(1-p).

Assim

10 P ( X = 2) = (0,05) 2 (0,95) 8 = 0,0746 2


P(rejeitar o lote) =

(ii)

10 10 P ( X 2) = (0,05) x (0,95) 10 - x o que muito x=2 x

trabalhoso de calcular. Mas:

= 1 - [P(X = 0) + P(X = 1)] mutuamente exclusivos 10 10 = 1 - [ (0,05) 0 (0,95) 10 + (0,05) 1 (0,95) 9 ] 0 1 = 0,0862
118

P ( X 2) = 1 - P ( X < 2) = 1 - P ( X = 0 ou X = 1)

Apndice 4 (recordao)

Valor Esperado e Varincia de uma Varivel Aleatria


Anlise de deciso Exemplo - explorao de petrleo Uma companhia de explorao de petrleo tem um arrendamento para o qual precisa decidir se: (i) vende agora, (ii) segura durante um ano e ento vende, ou (iii) perfura agora. O custo de perfurar $200,000 ($200K). Perfurando conduzir a um dos resultados seguintes Resultado Poo Seco Poo com pouco petrleo Poo com jorro Probabilidade 0.5 0.4 0.1 Receita $0 $400K $1500K

Se vende agora, a companhia pode adquirir $125K.

Se segura durante um ano e os preos do petrleo sobem (probabilidade =0.6) pode vender por $300K ou se os preos do petrleo caem (probabilidade = 0.4) pode adquirir $100K. O que deveria fazer?

119

Valor esperado Vende agora

125 K

$ 125 K

Preos do petrleo sobem Vende depois 0,6 $ 300 K 300 x 0,6 + 100 x 0,4 = $ 220 K

Deciso

Preos do petrleo caem 0,4 $ 100 K

Seco $0 200 K 0,5 Pouco petrleo $400 200 K

Perfura

0,4

-200 x 0,5 + 200 x 0,4 + 1300 x 0,1 = $ 110 K

0,1 Jorro $1500-200 K

A melhor deciso segurar durante um ano e ento vender. Este um exemplo de usar um diagrama de rvore para Anlise de Deciso. Tambm ilustra o conceito do valor esperado de uma varivel aleatria .

120

Se a distribuio de probabilidade de uma varivel aleatria X Valores de X Probabilidades seu valor esperado x1 p1 x2 p2 ... ... xk pk

E ( X ) = x p + x p + ... + x p = x p
K 1 1 2 2 K K i =1 i

exemplo Perfurao de Petrleo Resultado Poo seco Poo com pouco petrleo Poo com jorro Probabilidade 0.5 0.4 0.1 Receita 0 $400K $1500K

Seja X a varivel aleatria lucro financeiro = Receita custo de perfurao = Receita - $200K A distribuio de probabilidade para X x P(X=x) -200 0.5 200 0.4 1300 0.1

Portanto, o valor esperado (mdia) de X E(X) = -200 x 0.5 + 200 x 0.4 + 1300 x 0.1 = $110K Isto diretamente anlogo mdia amostral. E(X) pode ser considerada como uma idealizao de, ou um valor terico para, a mdia da amostra. E(X) denotado freqentemente pela letra grega

m (pronuncia-se mu).

121

Varincia de uma Varivel Aleatria Recorde que a varincia uma medida de disperso. Para uma amostra de observaes de uma populao a varincia ao redor da mdia definida como

s =
2

(x - x)
n i =1

n -1

A varincia de uma Varivel Aleatria X definida como

ou

var( x) = p1 ( x1 - m ) 2 + p 2 ( x 2 - m ) 2 + ... + p K ( x K - m ) 2 var( x) = p i ( x i - m ) 2 = E ( x - m ) 2


K i =1

Ela representa o limite terico da varincia amostral s2 quando o tamanho da amostra (n) fica muito grande. var(X) denotada freqentemente por

s 2 (sigma quadrado).

Uma frmula mais simples para var(X)


2 var( X ) = ( p1 x12 + ... + p K x K ) - m 2

= E ( X 2 ) - [ E ( X )] 2

Exemplo - Gnero em uma classe de 5 Assuma que a probabilidade de um estudante em uma classe ser masculino um meio. Seja a varivel aleatria X o nmero de estudantes masculinos em um grupo da classe de tamanho 5. Qual o valor de E(X), o nmero esperado de homens no grupo, e qual a varincia de X? Considere X ~ binomial (5;0,5). Ento a distribuio de probabilidade de X
122

x P(X=x)

0 1/32

1 5/32

2 10/32

3 10/32

4 5/32

5 1/32

(Confira isto usando a frmula para probabilidades binomiais e desenhe um diagrama de rvore para analisar a estrutura dos resultados.)

E ( X ) = xp( x) = 0

1 5 10 10 + 1 + 2 + 3 32 32 32 32 5 1 80 + 4 + 5 = = 2,5 = m 32 32 32

isto , em mdia tais grupos tm 2,5 homens.

var( X ) = x 2 p ( x) - m 2 = 0 2 = 7,5 - (2,5) 2 = 1,25

1 1 + ... + 5 2 - (2,5) 2 32 32

Portanto, s = var( X ) = 1,25 = 1,12


Esta uma medida da variabilidade de X. Em geral se X ~ binomial (n,p) pode ser mostrado que E(X) = np e var(X) = npq onde q = 1 - p [Confira os valores de E(X) e var(X) calculados acima para X ~ binomial (5;0,5) usando estas frmulas.]

EMPRICO

TERICO
123

(baseado

nos

dados) (MATEMTICO) QUANTIDADE

QUANTIDADE

(a) Freqncia relativa

f xi = i n
i

PROB[X = xi] = pi

(b)

(c) mdia x = 1 xi f i n i

fi =1 n

fi n quando n0

p
n i =1

=1

ESPERANA, m = E(X) = p i x i
i

quando n

x E( X )

( d ) VARINCIA S 2 = VAR ( X ) = 2 n (x - x) f n i i ( xi - x) 2 p i i =1 n -1 ii =1

quando n

S 2 VAR( X )

Valor esperado e Varincia para uma Funo de Variveis Aleatrias Se Y = aX + b onde X uma varivel aleatria e a e b so valores constantes conhecidos, ento, E(Y) = a E(X) + b var(Y ) = a 2 var( X )

2 Portanto, s Y = a 2 var( X ) = a 2s x = as X

124

Semelhantemente se T = a X + b Y + c onde X e Y so variveis aleatrias e a, b e c so constantes conhecidas, ento, E(T) = a E (X) + b E (Y) + c. e

Em particular, se X e Y so independentes ento a covarincia cov(X,Y) zero. Portanto

Var (T ) = a 2 var( X ) + b 2 var(Y ) + 2ab cov( X , Y )

Var (T ) = a 2 var( X ) + b 2 var(Y )


Prova: Segue das definies de E(X) e var(X).

Exemplo - Lucro previsto estimado Uma companhia faz produtos para mercados locais e de exportao. O nmero de vendas do prximo ano no pode ser predito exatamente mas estimativas podem ser feitas como a seguir unidades de X,local Probabilidade 1,000 0.1 3,000 0.3 5,000 0.4 10,000 0.2

unidades Y, export. Probabilidade

300 0.4

500 0.5

700 0.1

Consequentemente E(X) = 1000 x 0.1 + 3000 x 0.3 + 5000 x 0.4 + 10000 x 0.2 = 5000 (= esperou vendas locais) E(Y) = 300 x 0.4 + 500 x 0.5 + 700 x 0.1 = 440 (= vendas de exportao esperadas) A companhia lucra $2000 em cada unidade vendida no mercado local e $3500 em cada unidade exportada.

125

Consequentemente o lucro total T = 2000 X + 3500 Y Usando a frmula acima E(T) = 2000 E(X) + 3500 E(Y) = 2000 x 5000 + 3500 x 440 = $11,540,000 - este o lucro estimado (previsto) durante o prximo ano. Exemplo - Fabricao de um componente de metal Um componente feito cortando um pedao de metal de comprimento X e reduzindo este valor da quantidade Y. Ambos estes processos so um pouco imprecisos. O comprimento lquido ento T = X - Y. Isto pode ser escrito na forma T = a X + b Y com a = 1 e b = -1 assim E(T) = a E (X) + b E (Y) = 1 E(X) + (-1)E(Y) = E(X) - E(Y)

Var (T ) = a 2 var( X ) + b 2 var(Y ) Por tan to var(T) = 12 var( X ) + (-1) 2 var(Y ) = var(X) + var(Y)
ou seja, var(T) maior tanto que var(X) ou var(Y), embora T = X - Y, porque X e Y contribuem variabilidade em T.

Variveis Aleatrias Independentes

126

Lembremos que dois eventos A e B so independentes se e somente se P(A e B) = P(A)P(B) se a probabilidade da interseo de A e B o produto das probabilidades de A e de B. Podemos relacionar variveis aleatrias a eventos, ou seja, podemos definir eventos em termos de valor(es) que uma varivel aleatria assume. Por exemplo, o evento A = {a < X b) ocorre se X maior do que a e menor do que b. Duas variveis aleatrias, X e Y, so independentes se e somente se todo evento da forma {a < X b} independente de todo evento da forma {c < Y d}. Duas variveis aleatrias so independentes se conhecendo o valor de uma no ajuda a predizer o valor da outra.

Exemplos: Considere a jogada de uma moeda 10 vezes.

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas 4 jogadas. Portanto X e Y so independentes. Conhecer o valor de X no ajuda a predizer o valor de Y e vice-versa.

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de caras nas ltimas 5 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X 6) e o evento {-1 < Y 0} so dependentes (e mutuamente exclusivos).

Seja X o nmero de caras nas primeiras 6 jogadas e seja Y o nmero de coroas nas primeiras 2 jogadas. Ento X e Y so dependentes porque, por exemplo, o evento {5 < X 6} e o evento {2 < Y 3} so dependentes (e mutuamente exclusivos).

Que espcies de experimentos conduzem a variveis aleatrias independentes? Somas e mdias de seqncias que no se sobrepem seja de jogadas de moedas, de jogadas de dados so alguns exemplos. O segundo e terceiro

127

exemplo acima mostram porque existe a necessidade das seqncias serem no sobrepostas (ou seja, no tenham interseco). Valor Esperado do Produto de Variveis Aleatrias Independentes Se as variveis aleatrias X e Y so independentes, Ento

E[ X Y ] = E[ X ] E[Y ]

O inverso (recproca) no verdadeiro em geral: E[ X Y ] = E[ X ] E[Y ] no implica que X e Y sejam independentes.

128

5. Variveis Aleatrias Contnuas e Distribuio Normal


5.1 Variveis Aleatrias Contnuas Diferentemente de uma varivel aleatria discreta, para uma varivel aleatria contnua no podemos definir uma funo de distribuio de probabilidade (f.d.p.). No entanto, podemos definir o que se chama de uma funo densidade de probabilidade para as variveis aleatrias contnuas. Por exemplo, suponhamos uma distribuio uniforme do tipo:

f(X)

1/10

15

Observe que f(X) uma funo constante assumindo sempre o valor 1/10 no intervalo fechado

5 X 10 . Essa funo goza das seguintes propriedades:

1) ela sempre positiva ou nula. Ou seja,

f ( X ) 0 para qualquer valor de X.

2) se integrarmos esta funo no intervalo definida ser igual a 1. Ou seja,


15 5 15 f ( X )dx = 1 / 10dx = [ x / 10] 5 = 5 15

5 X 10 o valor desta integral

15 5 - =1 10 10
129

Toda funo que satisfizer essas duas propriedades chamaremos de funo densidade de probabilidade. Essa funo apenas um instrumento matemtico para que possamos calcular probabilidades para variveis aleatrias contnuas (assim como utilizamos a funo distribuio de probabilidade para as variveis aleatrias discretas). Por exemplo, para o exemplo acima, se quisermos calcular a probabilidade da varivel aleatria contnua X estar contida no intervalo

10 X 12 ser:

P(10 X 12) = f ( X ) dx = (1 / 10)dx = [ x / 10]12 = 10


10 10

12

12

12 10 = 2 / 10 10 10

Dessa forma, podemos calcular a probabilidade para qualquer intervalo sendo esta probabilidade o valor da integral definida da funo densidade de probabilidade sendo que os limites de integrao so as extremidades do intervalo. De uma forma geral, podemos dizer que se f(X) a funo densidade de probabilidade de uma varivel aleatria contnua, ento:

P (a X b) = f ( X )dx
a
5.2 Mdia e Varincia de uma Varivel Aleatria Contnua A mdia (ou valor esperado) de uma varivel aleatria contnua dada pela expresso:
E[ X ] =
+

Xf ( X )dx

No exemplo anterior, o valor esperado da varivel aleatria X ser:

130

A varincia de uma varivel aleatria contnua dada pela expresso:


+

x2 E[ X ] = Xf ( X )dx = X (1 / 10)dx = = 20 5 5 - 225 25 = 10 20 20


+ 15

15

V[X ] =

( X - E[ X ])

f ( X ) dx

No exemplo anterior, a varincia da varivel aleatria X ser:


V[X ] =
15 +

( X - E[ X ])

f ( X )dx = ( X - 10) 2 (1 / 10)dx = X3 - X 2 + 10 X = 8,333 30 5


5 15

15

X2 ( 10 - 2 X + 10)dx = 5

5.3 Varivel Aleatria Normal A mais importante (e mais utilizada na prtica) varivel aleatria contnua a varivel aleatria normal. A varivel aleatria normal tem uma funo densidade de probabilidade (chamada de curva normal) que apresenta a forma de um sino e unimodal no centro exato da distribuio. A mdia, mediana e a moda da distribuio normal so iguais e localizadas no pico da distribuio. Metade da rea sob a curva est acima do ponto central (pico) e a outra metade est acima dele. A distribuio de probabilidade normal simtrica em relao a sua mdia. toca efetivamente ele. Figura 1 Caractersticas de uma Funo Densidade de Probabilidade Normal (Distribuio Normal) Ela assinttica acurva aproxima-se cada vez mais do eixo X mas nunca

131

Figura 2 Duas Distribuies Normais com mesma mdia mas distintos desvios

padres

Podemos tambm ter distribuies normais com o mesmo desvio padro mas com distintas mdias ou com mdias e desvios padres distintos. Na realidade a distribuio normal um nome genrico para definir uma famlia de infinitas distribuies normais particulares, cada uma com os seus valores especficos de mdia e desvio padro. O que caracteriza, portanto, e diferencia uma distribuio normal de outra so os valores destes dois parmetros: a sua mdia e o seu desvio padro. A funo densidade de probabilidade de uma varivel aleatria normal dada por:

132

f (X ) =

2ps

-( X - m ) 2 2s 2

possvel demonstrar matematicamente que a mdia (ou valor esperado) dessa varivel aleatria igual ao seu parmetro

e o seu desvio padro igual ao

seu segundo parmetro (da equao acima)

s.

O que quer dizer que se e s2. O

aplicarmos as definies de valor esperado e de varincia de uma varivel aleatria contnua a expresso acima chegaremos aos resultados m problema recamos em integrais mais difceis de serem resolvidas:
+

E[ X ] =

Xf ( X )dx = X
- 2

2ps

-( X - m ) 2 2s 2

dx = m

e
V[X ] =
+

(talvez um bom matemtico possa fazer essa demonstrao, mas no o nosso caso pois pretendermos ser bons em estatstica aplicada to somente). possvel tambm demonstrar matematicamente que as duas abcissas no eixo X de valor + s e - s correspondem a pontos de inflexo da curva normal. Para isto basta obter a segunda derivada da funo densidade e provar que o seu valor muda de sinal no ponto de inflexo mostrando que a a curvatura muda de sentido de cncava para convexa ou vice-versa.

( X - E[ X ])

f ( X )dx =

( X - m)

2ps

-( X - m ) 2 2s 2

dx = s 2

5.4 Distribuio Normal Padro muito difcil ficarmos calculando probabilidades para distribuies normais atravs de clculos de integrao. Para evitar este trabalho foi definida uma distribuio normal particular chamada de distribuio normal padro. Esta

133

distribuio tem as caractersticas de ser uma distribuio normal com mdia (valor esperado) igual a zero e desvio padro igual a 1. Em notao matemtica dizemos que:
Z ~ N(0,1)

Se X uma varivel aleatria normal com mdia m diferente de zero e desvio padro s diferente de 1 podemos converter essa distribuio em uma

distribuio normal padro atravs da transformao linear:


Z= X -m s

Para que serve essa distribuio Z? Nada melhor que um exemplo para explicar isso.

Exemplo: As rendas mensais dos graduados em um curso de especializao em uma grande empresa so normalmente distribudas com uma mdia de R$ 2000 e um desvio padro de R$ 200. Qual o valor de Z para uma renda X de R$ 2200? R$ 1700? Para X = 2200 Z =
X - m 2200 - 2000 = =1 s 200 X - m 1700 - 2000 = = -1,5 s 200

Para X = 1700 Z =

Um valor de Z = 1 indica que o valor de R$ 2200 est localizado 1 desvio padro acima da mdia de R$ 2000. Um valor de Z = -1,5 indica que o valor de R$ 1700 est localizado 1,5 desvio padro abaixo da mdia de R$ 2000.

134

5.5 reas Abaixo da Curva Normal Cerca de 68 % da rea sob a curva normal est entre menos um e mais um desvio padro da mdia. Isto pode ser escrito como m 1s . Cerca de 95 % da rea sob a curva normal est entre menos dois e mais dois desvios padres da mdia, escrito como m 2s . Praticamente toda (99,74 %) a rea sob a curva normal est entre menos trs e mais trs desvios padres da mdia, escrito como m 3s .

Exemplo 2: O uso dirio de gua por pessoa em uma determinada cidade normalmente distribudo com mdia m igual a 20 litros e desvio padro s igual a 5 litros. O uso dirio de cerca de 68 % das pessoas nesta cidade caem entre que valores?

m 1 s = 20 1 (5) . Ou seja, cerca de 68 % das pessoas usam de 15 a 25


litros de gua por dia. Similarmente, para 95 % e 99 %, os intervalos sero de 10 a 30 litros e 5 a 35 litros.

135

Qual a probabilidade de que uma pessoa selecionada ao acaso usar menos do que 20 litros por dia ? O valor de Z Z = (20 20) / 5 = 0. Portanto P(X < 20) = P(Z < 0) = 0,5.

Qual a probabilidade de que uma pessoa selecionada ao acaso use mais do que 20 litros por dia ? O valor de Z Z = (20 20) / 5 = 0. Portanto P(X > 20) = P(Z > 0) = 0,5.

Que percentagem da populao usa entre 20 e 24 litros por dia ? Z=0

X = 20

136

X = 24

Z=

24 - 20 = 0,8 5

P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).

Que percentagem usa entre 16 e 20 litros ?


Z= 16 - 20 = -0,8 5

X = 16 X = 20

Z=0

P(16 < X < 20) = P (-0,8 < Z < 0) = (porque ?) P(0 < Z < 0,8) = 0,2881 = 28,81

Para a obteno das probabilidades para a curva normal padro Z consulta-se uma tabela que pode ser encontrada em anexo em praticamente todos os livros de estatstica. Reproduziremos a seguir integralmente essa tabela (para que possa ser mostrado para os exemplos anteriores como foram obtidas as reas (que so probabilidades) abaixo da curva norma Z. Resolvemos colocar a tabela no corpo do texto devido a sua grande importncia em estatstica aplicada ( e achamos que ela no deve ser relegada a um anexo que poucos alunos tem a curiosidade de consultar).

137

Tabela 1 Valor de P(0 < Z < Z0) onde Z varivel normal padro Z0 Segunda decimal de Z0 0,00 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,0793 0,0832 0,0871 0,1179 0,1217 0,1255 0,1554 0,1591 0,1628 0,1915 0,1950 0,1985 0,2257 0,2291 0,2324 0,2580 0,2611 0,2642 0,2881 0,2910 0,2939 0,3159 0,3186 0,3212 0,3413 0,3438 0,3461 0,3643 0,3665 0,3686 0,3849 0,3869 0,3888 0,4032 0,4049 0,4066 0,4192 0,4207 0,4222 0,4332 0,4345 0,4357 0,4452 0,4463 0,4474 0,4554 0,4564 0,4573 0,4641 0,4649 0,4658 0,4713 0,4719 0,4726 0,4772 0,4778 0,4783 0,4821 0,4826 0,4830 0,4861 0,4864 0,4868 0,4893 0,4896 0,4898 0,1103 0,1141 0,1480 0,1517 0,1844 0,1879 0,2190 0,2224 0,2517 0,2549 0,2823 0,2852 0,3106 0,3133 0,3365 0,3389 0,3599 0,3621 0,3810 0,3830 0,3997 0,4015 0,4162 0,4177 0,4306 0,4319 0,4429 0,4441 0,4535 0,4545 0,4625 0,4633 0,4699 0,4706 0,4761 0,4767 0,4812 0,4817 0,4854 0,4857 0,4887 0,4890 0,4913 0,4916

138

2,4 2,5 2,6 2,7 2,8 2,9 3,0

0,4918 0,4920 0,4922 0,4938 0,4940 0,4941 0,4953 0,4955 0,4956 0,4965 0,4966 0,4967 0,4974 0,4975 0,4976 0,4981 0,4982 0,4982 0,4987 0,4987 0,4987

0,4934 0,4936 0,4951 0,4952 0,4963 0,4964 0,4973 0,4974 0,4980 0,4981 0,4986 0,4986 0,4990 0,4990

Qual a probabilidade de que uma pessoa selecionada ao acaso use mias do que 28 litros ? X = 28 Z = (28 20 )/ 5 = 1,6 P( X > 28) = P (Z > 1,6) = 0,5 - 0,4452 = 0,0548

139

Qual a porcentagem entre 18 e 26 litros ? X = 18 Z = X = 26 Z =


18 - 20 = -0,4 5

26 - 20 = 1,2 5

P(18 < X < 26) = P(-0,4 < Z < 1,2) = 0,1554 + 0,3849 = 0,5403

Quantos litros ou mais 10 % da populao usam ? Em outras palavras,para os 10 % da populao que mais consomem gua qual o valor mnimo desse consumo ?

Seja X a quantidade mnima. Portanto, precisamos encontrar X tal que


P ( X X ' ) = 0,1 . Para achar o valor de Z correspondente veja no corpo (miolo)

140

da tabela o valor de Z0 que deixa uma rea entre 0 e Z0 igual a (0,5 0,1) = 0,4. O valor correspondente de Z0 1,28 (aproximadamente). Portanto, temos:
X '-20 = 1,28 5

X = 26,4. Ou seja, 10 % da populao usa no mnimo 26,4

litros por dia (ver figura).

Exemplo 4

Um professor verificou que as mdias finais em seu curso de Estatstica tem distribuio normal com uma mdia igual a 72 e desvio padro 5. Ele decide atribuir conceitos para o seu curso tal que os melhores 15 % recebem grau A . Qual a mnima mdia que o estudante precisa receber para obter um A ? Seja X a mnima mdia. P ( X X ' ) = 0,15 O Z correspondente 1,04 (aproximadamente)
X '-72 = 1,04 X' = 77,2 5
141

6. Mtodos de Amostragem e Distribuies Amostrais

OBJETIVOS DO CAPTULO: Explicar porque em muitas situaes uma amostra a nica forma plausvel de aprender alguma coisa sobre uma populao. Explicar os mtodos de selecionar uma amostra Distinguir entre amostragem probabilstica e amostragem no probabilstica Definir e construir uma distribuio amostral de mdias amostrais

142

Explicar o Teorema do Limite Central e sua importncia para a Inferncia Estatstica Calcular Intervalos de Confiana para Mdias e Propores Determinar que tamanho uma amostra deve ter propores para estimar mdias e

Porque amostrar uma populao

Natureza destrutiva de certos testes A impossibilidade fsica de checar todos os itens na populao O custo de estudar todos os itens em uma populao freqentemente proibitivo Muitas vezes as estimativas baseadas em uma amostra so mais precisas do que os resultados obtidos atravs de um levantamento censitrio Tempo muito elevado para a apurao de resultados em censos

6.1 Amostragem Probabilstica O que uma amostragem probabilstica ? uma amostra selecionada de tal forma que cada item ou pessoa na populao estudada tm uma probabilidade (no nula) conhecida de ser includa na amostra.

Mtodos de Amostragem Probabilstica: Amostragem Aleatria Simples (AAS)

143

Uma amostra escolhida de tal forma que cada item ou pessoa na populao tem a mesma probabilidade de ser includa. Se a populao tem um tamanho N, cada pessoa desta populao tem a mesma probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela de nmeros aleatrios para sortear (com mesma probabilidade) os elementos da amostra. Tambm pode ser utilizada uma funo randmica: No Excel, por exemplo, temos a funo ALEATRIO ENTRE. Amostragem Aleatria Sistemtica

Os itens ou indivduos da populao so ordenados de alguma forma alfabeticamente ou atravs de algum outro mtodo. Um ponto de partida aleatrio sorteado, e ento cada k-simo membro da populao selecionado para a amostra. Amostragem Aleatria Estratificada A populao inicialmente dividida em subgrupos (estratos) e uma subamostra selecionada a partir de cada estrato da populao Amostragem aleatria Estratificada com Repartio Proporcional

Suponhamos que a populao subdividida em k estratos. Sejam: N = o nmero de indivduos na populao n = o nmero de indivduos na amostra Ni = o nmero de indivduos contidos no i-simo estrato da populao ni = o nmero de indivduos contidos no i-simo estrato na amostra

ni = n

Ni N

i=1,2,...., k

os estratos devem ser o mais homogneos possveis com relao s caractersticas relevantes da pesquisa (variveis que se correlacionam fortemente com a varivel estudada) para um mesmo tamanho amostral, a
144

amostragem aleatria estratificada com repartio proporcional mais precisa (menor varincia do estimador) do que a amostragem aleatria simples (AAS). Amostragem Aleatria Estratificada com Repartio de Neyman (ou repartio tima)

Se conhecermos a varincia de cada estrato populacional referente a varivel que estamos desejando estimar o seu parmetro, um mtodo mais adequado o da repartio de Neyman.

ni = n

Ws
k i =1 i

wis i

= n
i

N s
k i =1 i

Nis i

para um mesmo tamanho amostral a preciso maior para amostra aleatria estratificada com repartio de Neyman (repartio tima) do que para a amostra aleatria estratificada com repartio proporcional que por sua vez maior do que a amostra aleatria simples Amostragem por Conglomerados

A populao inicialmente subdividida inicialmente em subgrupos (estratos) e uma amostra de estratos selecionada (por exemplo, com probabilidade proporcional ao tamanho de cada estrato). A seguir, amostras so selecionadas dos estratos selecionados previamente. A principal vantagem da amostra por conglomerados a de possibilitar considervel reduo de custos (em relao por exemplo a uma amostragem aleatria estratificada) para um mesmo tamanho amostral. O mtodo costuma ser empregado quando no dispomos de um cadastro da populao (como no caso da amostragem sistemtica) e os custos de ser elaborado um cadastro para toda a populao muito elevado. Erro amostral: A diferena entre a estatstica amostral e seu correspondente parmetro.
145

Uma distribuio de probabilidade consiste de uma lista de todos os possveis valores das mdias amostrais de um dado tamanho amostral constante selecionado da populao e a probabilidade de ocorrncia associada a cada mdia amostral. Exemplo 1 Uma empresa tem 5 scios. Semanalmente, os scios relatam o nmero de horas de atendimento a clientes Scio Horas 1 22 2 26 3 30 4 26 5 22 Dois scios so selecionados aleatoriamente. Quantas amostras distintas so possveis? O nmero de amostras distintas de dois elementos tomados em 5 objetos corresponde a:
5C2 =

5! = 10 ( 2! )( 3! )
Mdia 24 26 24 22 28 26 24 28 26 24

Scios 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Total 48 52 48 44 56 52 48 56 52 48

Organize as mdias amostrais em uma distribuio de freqncias. Mdia Amostral 22 freqncia Freqncia Relativa (Probabilidade) 1/10
146

24 26 28

4 3 2

4/10 3/10 2/10

Calcule a mdia das mdias amostrais e compare-a com a mdia da populao.

A mdia da populao : 22 + 26 + 30 + 26 + 22 m= = 25,2 5 A mdia das mdias amostrais :

( 22)(1) + ( 24)( 4) + ( 26)(3) + ( 28)( 2) = 25,2 10

Observe que a mdia das mdias amostrais igual a mdia populacional

6.2 Teorema do Limite Central Para uma populao com mdia m e uma varincia s 2 , a distribuio amostral das mdias de todas as possveis amostras de tamanho n, geradas a partir da populao, ser aproximadamente normalmente distribuda com a mdia da distribuio amostral igual m e varincia igual s 2 / n assumindo que o tamanho amostral suficientemente grande, ou seja, n 30 . Em outras palavras, se a populao tem qualquer distribuio (no precisa ser necessariamente normal) com mdia igual a m e varincia igual a s 2 , ento a distribuio amostral dos valores mdios amostrais normalmente distribuda com a mdia das mdias ( populao (

mX

mX

) igual a mdia da

) e o erro padro das mdias amostrais igual a

, desde que n 30 .

147

Note que o erro padro das mdias amostrais mostra quo prximo da mdia da populao a mdia amostral tende a ser. O erro padro das mdias amostrais calculado por:

sX sX
n

o smbolo para o erro padro das mdias amostrais o tamanho da amostra o desvio padro da populao

sX sX = n

Se no conhecido e n 30 (considerada uma amostra grande), o desvio padro da amostra, designado por s, usado para aproximar o desvio padro da populao, . A frmula para o erro padro torna-se:

sX =
onde

s n

s=

(Xi - X )
i =1

n -1

6.3 Estimativa de Ponto Estimativa de ponto um valor (chamado um ponto) que usado para estimar um parmetro populacional Exemplos de estimativas de ponto so a mdia amostral, o desvio padro amostral, a varincia amostral, a proporo populacional, etc.

Exemplo: O nmero de itens defeituosos produzidos por uma mquina foi registrado em cinco horas selecionadas aleatoriamente durante uma semana de trabalho de 40 horas. O nmero observado de defeituosos foi 12,4,7,14 e 10. Portanto, a mdia amostral 9,4. Assim a estimativa de ponto para a mdia semanal do nmero de defeituosos 9,4.

148

6.4 Estimativa de Intervalo Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um parmetro populacional provavelmente cai. O intervalo dentro do qual um parmetro populacional esperado ocorrer chamado de intervalo de confiana. Os intervalos de confiana que so extensivamente usados so os de 95 % e 99 %. Um intervalo de confiana de 95 % significa que cerca de 95 % dos intervalos construdos similarmente contero o parmetro que est sendo estimado. Outra interpretao do intervalo de confiana de 95 % que 95 % das mdias amostrais para um tamanho de amostra especificado cairo a uma distncia mxima de 1,96 desvios padres da mdia populacional. Para o intervalo de confiana de 99 %, 99 % das mdias amostrais para um tamanho amostral especificado cairo a uma distncia mxima de 2,58 desvios padres da mdia populacional. Os intervalos de confiana para 95 % e 99 % so construdos como segue, para n 30: O IC de 95 % para a mdia populacional dado por:

s X 1,96 n
O IC de 99 % para a mdia populacional

dado por:

X 2,58

X Z

Em geral, um intervalo de confiana para a mdia, calculado por:

onde Z obtido da tabela de distribuio normal padro. Exemplo 2 Uma universidade quer estimar o nmero mdio de horas trabalhadas por semana por seus estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas com um desvio padro de 4 horas.

s n

s n

149

A estimativa de ponto do nmero mdio de horas trabalhadas por semana 24 horas (mdia amostral). Qual o intervalo de confiana de 95 % para o nmero mdio de horas trabalhadas por semana ? Usando a frmula anterior (

X 1,96

22,88 a 25,12. O limite de confiana inferior 22,88. O limite superior de confiana 25,12. O grau de confiana (nvel de confiana) utilizado 0,95. Interprete os resultados Se ns tivssemos tempo para selecionar aleatoriamente 100 amostras de tamanho 49 da populao de alunos do campus e calcular as mdias amostrais e os intervalos de confiana para cada uma destas 100 amostras, a mdia populacional (parmetro) do nmero de horas trabalhadas estaria contida em cerca de 95 dos 100 intervalos de confiana. Cerca de 5 dos 100 intervalos de confiana no conteriam a mdia populacional.

s 4 ) temos 24 1,96 n 49

ou

6.5 Intervalo de Confiana para Uma Proporo Populacional Um intervalo de confiana para uma proporo populacional dado por:

p Zs p

onde:

p sp

a proporo amostral o erro padro da proporo amostral e dado por:

sp =

p (1 - p ) n

O intervalo de confiana construdo por:

150

p Z
onde:

p (1 - p ) n

Z o valor da varivel normal padro para o grau de confiana adotado. n o tamanho amostral Exemplo 3 Um planejador financeiro est estudando os planos de mudana de jovens executivos. Uma amostra de 500 jovens executivos que possuem suas prprias casas revelou que 175 planejam vend-las e retirarem-se para o interior do Pas. Construa um intervalo de confiana de 98 % para o parmetro proporo populacional de executivos que planejam mudar para o interior. Aqui n = 500,

a proporo amostral

e Z = 2,33 (para a = 0,98 - nvel de confiana adotado ) O CI de 98 % 0,35 2,33


(0,35) (0,65) ou 0,35 0,0497 500

p = 175

500

= 0,35

Interprete a resposta 6.6 Fator de Correo de Populao Finita Uma populao que tem um limite superior definido chamada de finita. Em estatstica, considera-se como populao finita quando n > 0,05 (ou seja, N quando a frao amostral maior do que 5 %). Para uma populao finita, onde o nmero total de objetos N e o tamanho da amostra n, o seguinte ajuste feito para os erros padres da mdia amostral e da proporo amostral. Erro padro da mdia amostral:

sX =

Erro padro da proporo amostral:

s N -n n N -1

151

sp =

p (1 - p ) N - n n N -1 n 0,05 , o fator de correo de populao finita ignorado.

Este ajuste chamado de Fator de Correo de Populao Finita (FCPF)

Nota: se

Exemplo 4 A universidade do exemplo 2 quer estimar o nmero mdio de horas trabalhadas por semana pelos estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas e um desvio padro de 4 horas. Construa um intervalo de confiana para o nmero mdio de horas trabalhadas se h somente 500 estudantes no campus. Agora FCPF

n 49 = = 0,098 > 0,05 . Portanto, temos que usar o N 500 4 500 - 49 = [22,93 ; 25,11] 49 500 - 1

24 1,96

6.7 Selecionando uma Amostra H 3 fatores que determinam o tamanho de uma amostra, nenhum dos quais tendo uma relao direta com o tamanho da populao. Eles so: 1. O grau de confiana adotado 2. O mximo erro permissvel 3. A variabilidade da populao Uma frmula de clculo conveniente para determinar o tamanho amostral n :

Zs n= E
onde:

152

E o erro permissvel Z o valor da varivel normal padro associado ao grau de confiana adotado s o desvio padro da amostra piloto Exemplo 5 Um grupo de consumidores deseja estimar a mdia de gasto mensal em eletricidade para um domiclio familiar simples em Julho. Baseado em estudos similares o desvio padro estimado como sendo R$ 20,00. Deseja-se construir um intervalo de confiana de 99 % com um erro mximo admissvel de

R$5,00 . Qual deve ser o tamanho da amostra?


(2,58) (20 ) n= = 106,50 @ 107 5
2

6.8 Tamanho Amostral para Estimativa de Propores A frmula para determinar o tamanho amostral no caso de estimativa de propores :

Z n = p (1 - p ) E
p
amostra piloto

2
onde

a proporo estimada, baseada na experincia passada ou em uma

Z o valor da varivel normal padro associado ao grau de confiana adotado. E o mximo erro permissvel que o pesquisador tolera. Exemplo 6 Um clube deseja estimar a proporo de crianas que tem um cachorro. Se o clube deseja que a estimativa esteja no mximo afastada 3 % da proporo
153

populacional, quantas crianas devem conter a amostra? Assuma um intervalo de confiana de 95 % e que o clube estimou, com base em experincia anterior, que aproximadamente 30 % das crianas tm um cachorro.

1,96 n = (0,30 )(0,70 ) = 893,4 @ 893 0,03

7. Teste de Hipteses Amostras Grandes

OBJETIVOS:
Definir hipteses e Testes de Hipteses Descrever os 5 passos do procedimento de Teste de Hipteses Distinguir entre Teste de Hipteses Unicaudal e Bicaudal Realizar um teste para a mdia populacional Realizar um teste para a diferena entre duas mdias ou propores populacionais Descrever os erros estatsticos associados aos testes de hipteses

Nota: Se nada conhecido acerca da populao, a estimao usada para fornecer uma estimativa de ponto e de intervalo acerca da populao. Se alguma informao acerca da populao proposta ou suspeitada, o Teste de Hipteses usado para determinar a plausibilidade desta informao. O que uma hiptese ? Hiptese: uma sentena sobre o valor de um parmetro populacional desenvolvida para o propsito de teste.

154

Exemplos de hipteses, ou sentenas, feitas acerca de um parmetro populacional so: A renda mdia mensal proveniente de todas as fontes para os analistas de sistemas de US 3625 Vinte por cento de todos os transgressores juvenis so presos e sentenciados a priso.

O que um Teste de Hipteses ? Teste de Hipteses: um procedimento, baseado na evidncia amostral e na teoria da probabilidade, usado para determinar se a hiptese uma afirmao razovel e no seria rejeitada, ou no razovel e seria rejeitada. A seguir so propostos 5 passos para um teste de hipteses:

Passo 1: Estabelea a Hiptese Nula e a Hiptese Alternativa Passo 2: Selecione um nvel de significncia Passo 3: Identifique a Estatstica de teste Passo 4: Formule uma regra de deciso Passo 5: Tome uma amostra e obtenha uma deciso: No rejeitar H0 ou rejeitar H0 e aceitar H1

Hiptese Nula H0: Uma afirmao (sentena) sobre o valor de um parmetro populacional Hiptese Alternativa H1: Uma afirmao (sentena) que aceita se os dados amostrais fornecem evidncia de que a hiptese nula falsa. Nvel de Significncia: A probabilidade de rejeitar a hiptese nula quando ela efetivamente verdadeira, ou seja, valor de a (alfa) Erro Tipo I: Rejeitar a Hiptese Nula, H0, quando ela efetivamente verdadeira. A probabilidade do erro tipo I igual ao nvel de significncia, a (alfa). Erro Tipo II: Aceitar a Hiptese Nula, H0, quando efetivamente falsa. A probabilidade do erro tipo II igual a b (beta)

155

Tipos de Erros Aceita H0 Deciso Correta Erro Tipo II Beta = erro tipo II Rejeita H0 Erro Tipo I Deciso Correta

H0 verdadeira H0 falsa Alfa = erro tipo I

Estatstica de Teste (ou z efetivo ou valor de t): Um valor, determinado a partir da informao amostral, usado para determinar se devemos ou no rejeitar a hiptese nula. Valor Crtico (ou z crtico ou valor de t): O ponto divisor entre a regio onde a hiptese nula rejeitada e a regio onde ela no rejeitada. Este valor obtido a partir da tabela de z (normal padro) ou da tabela de t (t de Student). 7.1 Testes de Significncia Unicaudais Um teste unicaudal quando a hiptese alternativa, H1, estabelece uma direo tal como: H0: A renda mdia das mulheres menor que ou igual a renda mdia dos homens. H1: A renda mdia das mulheres maior que a renda mdia dos homens. A regio de rejeio neste caso a cauda direita (superior) da curva.

Figura com distribuio normal mostrando a regio de rejeio para um teste unicaudal

156

7.2 Testes de Significncia Bicaudais Um teste bicaudal quando no existe uma direo especificada para a hiptese alternativa H1, tal com: H0: A renda mdia das mulheres igual a renda mdia dos homens. H1: A renda mdia das mulheres no igual a renda mdia dos homens. A regio de rejeio neste caso dividida igualmente em duas caudas da curva.

Figura com distribuio normal mostrando a regio de rejeio para um teste bicaudal (distribuio amostral para a estatstica z para um teste bicaudal, 0.05 de nvel de significncia

Testando a Mdia Populacional: Amostra Grande, Desvio Padro da Populao conhecido. Neste caso a estatstica de teste (z efetivo) dado por:

z =

X - m s n

Exemplo 1 Os processadores de uma indstria indicam o ponto (marca) que a garrafa contem 16 onas (medida inglesa de peso) do produto. O Departamento de Controle de Qualidade responsvel pelo controle da quantidade includa na garrafa. Uma amostra de 36 garrafas selecionada por hora e o seu contedo pesado. Na ltima hora uma amostra de 36 garrafas apresentou um peso mdio de 16,12 onas com um desvio padro de 0,5 onas.

157

Ao nvel de significncia de 0,05 podemos concluir que o processo est fora de controle?

Passo 1: Estabelecer a Hiptese Nula e a Hiptese Alternativa:

H0 : m =16

H1 : m 16

Passo 2: Estabelecer a regra de deciso: H0 rejeitado se o z (efetivo calculado com base nos valores amostrais) < 1,96 ou z > 1,96. Passo 3: calcule o valor da estatstica de teste ( z efetivo)

z = [16,12 -16] [0,5

] 36

= 1,44

Passo 4: Qual a deciso sobre H0? H0 no rejeitada, porque 1,44 menor que o valor crtico de 1,96.

7.3 P-value de um Teste de Hiptese P-value: Esta a probabilidade (considerando que a hiptese nula verdadeira) de ter um valor para a estatstica de teste no mnimo to extremo como o valor calculado (efetivo) para o teste.

Se o p-value menor que o nvel de significncia (alfa), H0 rejeitada. Se o p-value maior que o nvel de siginificncia (alfa), H0 no rejeitada.

158

7.4 Clculo do P-value

Teste Unicaudal (para a direita ou cauda superior):

p-value = P{z valor da estatstica de teste calculada} Teste Unicaudal (para a esquerda ou cauda inferior):

p-value = P{z valor da estatstica de teste calculada} Teste Estatstico Bicaudal

p-value = 2P{z valor absoluto do valor da estatstica de teste calculado} Para o exemplo anterior, z = 1,44, e desde que era um teste bicaudal, ento o p-value = 2 P{z 1,44} = 2(0,5 - 0,4251) = 0,1498 . Desde que 0,1498 > 0,05, no rejeitada H0. Testando para a Mdia Populacional: Grandes Amostras, Desvio Padro Populacional desconhecido Aqui s desconhecido, portanto o estimamos com o desvio padro amostral s. Quanto maior for o tamanho amostral for n 30, o z efetivo pode ser aproximado com

z=
Exemplo 2

X -m s n

A cadeia de Lojas Arjo emite o seu prprio carto de crdito. O administrador de crdito quer verificar se o saldo no pago mensal maior do que US$ 400. O nvel de significncia fixado em 0,05. Uma amostra aleatria de 172 saldos no pagos revelou uma mdia amostral de US$ 407 e o desvio padro amostral de US$ 38. O admistrador de crdito pode concluir que a
159

mdia populacional maior que US$ 400, ou razovel assumir que a diferena de US$ 7 (US$ 407 US$ 400 devido a chance (variao aleatria)? Etapa 1: Estabelea a Hiptese Nula e a Hiptese Alternativa.

H0 :m400

H :m>400 1

Etapa 2: Estabelea a regra de deciso.

H0 rejeitada se o z (efetivo) > 1,645. z= Etapa 3: Calcule o valor da estatstica de teste. 407 - 400 = 2,42 38 172 Etapa 4: Qual a deciso sobre H0?

H0 rejeitada. O administrador conclui que a mdia dos saldos no pagos maior do que US$ 400.

Figura ilustrando a regio de rejeio do exemplo

7.5 Teste de Hipteses: Duas Mdias Populacionais

Assuma que os parmetros para duas populaes so:

m1,m2,s1 es2.

Caso I: Quando

s1,s 2 so conhecidos, a estatstica de teste (Z efetivo) :

160

z =

X1 - X 2

s 12 s 22 + n1 n2

Caso II: Quando 1 2 no so conhecidos mas os tamanhos amostrais n1 e n2 so maiores ou iguais a 30, a estatstica de teste (Z efetivo) :

s ,s

z =

X1 - X 2

2 s12 s2 + n1 n2

Exemplo 3 Na indstria X foi realizado um estudo para comparar o nmero mdio de anos de servio para aqueles que se aposentaram em 1975 com aqueles que se aposentaram no ltimo ano. Os seguintes dados amostrais foram obtidos. A um nvel de significncia de 0,01 podemos concluir que os trabalhadores que se aposentaram no ltimo ano tiveram mais anos de servio? 1975 25,6 2,9 40 ltimo ano 30,4 3,6 4,5

Caracterstica Mdia Amostral Desvio Padro Amostral Tamanho amostral

Estabelea a Hiptese Nula e a Hiptese Alternativa

Considere que a populao 2 aquela dos que se aposentaram no ltimo ano.

H0 : m2 m1

H1 : m2 > m1

Estabelea a regra de deciso Rejeitar H0 se o z (efetivo) > 2,33.

161

Calcule o valor da estatstica de teste (valor de z efetivo):

z =

30 , 4 - 25 , 6 3, 6 2 .9 + 45 40
2

= 6 ,80

Nota: Desde que neste problema estamos testando para: H0 :

m 2 m1

Precisamos trocar as posies das variveis na equao do z efetivo (a seguinte equao).

z =

2 s 12 s2 + n1 n2

- X

Z efetivo Qual a deciso sobre a hiptese nula ? Interprete os resultados?

Desde que o Z efetivo = 6,80 > Z crtico = 2,33, H0 rejeitada. Aqueles que se aposentaram no ltimo ano tiveram mais anos de servio.

7.6 Testes Referentes a Proporo

Proporo: Uma frao ou porcentagem que indica uma parte da populao ou amostra que tem um particular trao de interesse.

A proporo amostral denotada por p onde:

162

p=

nmero de sucessos na amostra tamanho da amostra

Estatstica de teste para testar uma Proporo Simples de uma Populao

z =

p - p p (1 - p ) n

p proporo populacional p proporo amostral Exemplo 4 No passado, 15 % das solicitaes postais feitas por uma instituio de caridade resultaram em contribuio financeira. Uma nova carta de solicitao foi redigida. Esta nova carta elevou a taxa de contribuio? A nova carta enviada a uma amostra de 200 pessoas e 45 responderam com uma contribuio. Ao nvel de significncia de 0,05 pode-se concluir que a nova carta mais efetiva? Estabelea a Hiptese Nula e a Hiptese Alternativa:

H 0 : p 0,15
Estabelea a regra de deciso

H1 : p > 0,15

H0 rejeitada se o Z (efetivo) > 1,645.

163

Calcule o valor da estatstica de teste ( valor do Z efetivo):

z=

45 - 0 ,15 200 = 2 ,97 ( 0,15 )( 0 ,85 ) 200

Qual a deciso sobre a hiptese nula? Interprete os resultados.

Desde que o z efetivo = 2,97 > z crtico (1,645), H0 rejeitada. A nova carta mais efetiva.

Um Teste envolvendo a Diferena entre duas Propores Populacionais A Estatstica de teste (Z efetivo) neste caso :

z=

p1 - p 2 pc (1 - pc ) pc (1 - pc ) + n1 n2

n1 o tamanho da amostra da populao 1. n2 o tamanho da amostra da populao 2.

pc
pc =

a mdia ponderada das duas propores amostrais, calculada por:


nmero total de sucessos tamanho total das duas amostras = X1 + X 2 n1 + n 2

X1 o nmero de sucessos em n1.

164

X2 o nmero de sucessos em n2.

Exemplo 5 Os trabalhadores solteiros so mais provveis de faltar ao trabalho do que os trabalhadores casados?

Uma amostra de 250 trabalhadores casados mostrou que 22 faltaram mais do que 5 dias no ltimo ano por alguma razo. Uma amostra de 300 trabalhadores solteiros mostrou que 35 faltaram mais do que 5 dias. Use o nvel de significncia de 0,05. Estabelea a hiptese nula.

H 0 : p2 p1 H1 : p2 > p1
onde o subscrito 2 refere-se a populao dos trabalhadores solteiros. Estabelea a regra de deciso. Rejeitar H0 se z > 1,645. Calcular o valor da estatstica de teste, Z efetivo:

pc =

22 + 35 = 0,1036 250 + 300

22 35 250 300 Z= = 1,10 0,1036(1 - 0,1036) 0,1036(1 - 0,1036) + 300 250


Nota: Novamente, trocamos a posio das duas variveis Qual a deciso referente a hiptese nula?

165

H0 rejeitada. No h diferena na proporo de ausncias para trabalhadores casados e solteiros. Qual o p-value?

p-value = P{z > 1,1} = 0,1357 , ( a hiptese nula no rejeitada).

Exerccios :
(incluem recordao de tpicos anteriores) 1. A Associao Nacional de Educao coleta e publica dados sobre o nmero de anos de experincia em sala de aula dos professores do curso secundrio. Uma amostra obtida neste ano de 10 professores de curso secundrio e foram publicados os seguintes dados sobre o nmero de anos de experincia. 33 18 21 12 2 18 9 16 15 17 a. b. c. d. Calcule a mdia amostral, X , dos dados. Calcule a amplitude dos dados. Calcule o desvio padro amostral, , s, dos dados. Pelo Teorema de Chebychev, no mnimo _________ % dos dados caem dentro de dois desvios padres de cada lado da mdia.

2. A seguinte tabela de contingncia fornece uma distribuio de freqncias conjunta para os votos populares apurados na eleio presidencial de 1984 por regio e por partido poltico. Os dados esto em milhares, arredondados para o mais prximo milhar. Democrata Republicano Outros P1 P2 P3 Total Nordeste R1 9,056 11,336 101 20,493 Meio Oeste R2 10,511 14,761 169 25,441 Sul R3 10,998 17,699 136 28,833 Oeste R4 7,022 10,659 214 17,895 Total 37,587 54,455 620 92,662 a. b. c. d. e. Quantos pessoas votaram no partido Republicano? Quantas pessoas no Meio Oeste votaram? Quantas pessoas no Sul votaram no partido Democrata? Determine a probabilidade dos eventos R3 e P2 (simultneos). Calcule Pr(R3 ou P2), usando a tabela de contingncia diretamente

166

f. Calcule Pr(R3 ou P2), usando a regra geral da adio de probabilidade, isto , Pr(A ou B) = Pr(A) + Pr(B) - Pr (A e B). g. Ache Pr(R3 | P2). h. Calcule Pr(P1) e Pr(P1 | R4). i. So os eventos P1 e R4 independentes? Explique sua resposta. So os eventos P1 e R4 mutuamente exclusivos? Explique sua resposta. 3. Em um levantamento recente, a probabilidade de que um acidente de carro causado por um motorista embriagado cerca de 0,229. Nos prximos trs acidentes, qual a probabilidade de que: a. exatamente um acidente seja causado por um motorista embriagado? b. No mnimo um acidente seja causado por um motorista embriagado? c. Se voc6e tem os seguintes resultados de probabilidade de acidentes causados por motoristas embriagados nos 10 prximos acidentes pdf (*) 0 0,0742 1 0,2205 2 0,2947 3 0,2334 4 0,1213 5 0,0432 6 0,0107 7 0,0018 8 0,0002 9 0,0000 10 0,0000 Cdf (**) 0,0742 0,2947 0,5893 0,8227 0,9440 0,9873 0,9980 0,9998 1,0000 1,0000 1,0000

(*) Pdf = Probability Distribution Function (Funo de Distribuio de Probabilidade) (**) Cdf = Cumulative Distribution Function (Funo de Distribuio Cumulativa) 1. Ache Pr(x = 3). 2. Ache Pr(5 < x 9). 3. Qual a mdia e a varincia da distribuio tabulada acima?

4. Um dentista tem 5 cadeiras disponveis para pacientes em sua sala de espera. A distribuio de probabilidade do nmero de cadeiras ocupadas, x, dada por x 0 p(x) 0,304
167

1 2 3 4 5

0,228 0,171 0,128 0,096 0,073

a. Ache a mdia m da varivel aleatria x. b. Calcule o desvio padro, s , da varivel aleatria x. c. Calcule Pr(2 x 5). d. Desenvolva (no formato tabular a cdf (Cumulative Distribution Function Funo de Distribuio Acumulada) dessa distribuio. 5. Seja X normalmente distribuda com mdia m = 100 e desvio padro s = 7 (daqui em diante indicaremos tal distribuio como X ~ N(100;7) ). Determinar: a. P(X = 80) b. P(X > 100) c. P( X - 95 < 5)

d. P( X - 100 < 10

6. Dado que X uma varivel aleatria normal com mdia m = 10 e P(X > 12) = 0,1587, qual a probabilidade de que X esteja includo no intervalo (9,11) ? 7. Os pesos de certos produtos em quilogramas so normalmente distribudos com mdia m = 180 e desvio padro s2 = 4. Se uma unidade deste produto escolhida aleatoriamente, qual o peso desta unidade se a probabilidade de ocorrncia : a. De um peso maior igual a 0,10 ? b. De um peso menor igual a 0,05 ? 8. Se W uma varivel aleatria normal e se P(W < 10) = 0,8413 e P(W < -10) = 0,0668, qual E(W) e V(W) respectivamente ? 9. H dois procedimentos para possibilitar que um determinado tipo de avio esteja pronto para a decolagem. O procedimento A requer um tempo mdio de 27 minutos com desvio padro de 5 minutos. Para o procedimento B, m = 30 e s = 2 minutos, respectivamente. Qual procedimento deve ser utilizado se o tempo disponvel de 30 minutos? 34 minutos? 10. Suponha que os dividendos anuais de quatro aes sejam respectivamente $ 2,00, $ 4,00, $ 6,00 e $ 8,00. Deduza a distribuio amostral de X considerando as seguintes hipteses :
168

1. tamanho amostral n = 2. 2. mtodo de amostragem: amostragem aleatria simples com reposio Para a distribuio amostral deduzida de X , verifique por demonstrao que

a. E( X ) = m b. V( X ) = s2 /n c. Se a amostragem for sem reposio deduza a distribuio de X e demonstre


( N - n) / ( N - 1) que E( X ) = m e V( X ) = s n d. Se a amostragem fosse realizada com reposio, qual o valor de V( X )?

11. Uma populao consta de 4 nmeros: 3, 7, 11 e 15. Considerar todas as amostras possveis que podem ser retiradas com reposio. Determinar: a) a mdia populacional; b) o desvio padro da populao; c) a mdia da distribuio amostral das mdias; d) o desvio padro da distribuio amostral das mdias. Verificar (c) e (d) diretamente e por meio de (a) e (b) atravs das frmulas apropriadas. 12. Certas vlvulas fabricadas por uma companhia tm uma vida mdia de 800 horas e desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria de 16 vlvulas, retiradas do grupo, ter a vida mdia: (a) entre 790 e 810 horas; (b) inferior a 785 horas. Para realizar esses clculos, o que necessrio supor? Explique a razo de sua afirmativa. 13. De acordo com o exerccio 8. Se for tomada uma amostra de 64 vlvulas, como ser resolvido? Explicar a diferena. 14. Os pesos de fardos recebidos por um depsito tm mdia de 150 kg e um desvio padro de 25 kg. Qual a probabilidade de 25 fardos, recebidos ao acaso e carregados em um elevador, no exceder o limite especfico desse ltimo , que de 4100 kg ? Neste caso, para a soluo do problema, necessrio especificar a forma da distribuio estatstica (funo densidade de probabilidade) dos pesos dos fardos na populao ?

15. Questo terica. Demonstre que s 2 = para a varincia populacional s 2 =

(X
n i =1 N i

- X )2

, onde n o tamanho da N amostra e N o tamanho da populao. Calcule o valor do vis. O que ocorre com esse valor quando n tende ao infinito. (Lembrar que um estimador Q de um parmetro Q dito no viesado se E[ Q ] = Q
i =1

(X

um estimador viesado

- m)2

169

16. Questo terica a. Enuncie o Teorema do Limite Central e o interprete da melhor forma possvel b. O que considerado populao finita (e infinita) para fins estatsticos ? c. Assinale as condies em que necessrio realizar a correo de populao finita, justificando a resposta:

n quando a populao infinita, no importando se a amostragem feita n quando a populao finita, no importando se a amostragem feita n n n n n n
com ou sem reposio quando a populao finita e a amostragem feita com reposio quando a populao finita e a amostragem feita sem reposio quando a populao infinita e a amostragem feita com reposio quando a populao infinita e a amostragem feita sem reposio quando a populao finita ou a amostragem feita com reposio existem outras alternativas no enumeradas acima com ou sem reposio

17. Uma funo de probabilidade uma regra de correspondncia ou uma equao que: a) Acha o valor mdio da varivel aleatria b) Atribui valores de x a eventos de um experimento probabilstico c) Atribui probabilidades para valores de x d) Define a variabilidade no experimento e) Nenhuma das anteriores correta 18. Suponha que a varivel aleatria T tenha a seguinte distribuio de probabilidade: t | 0 1 2 ---------------------P(T = t) | .5 .3 .2 a. Ache P(T <= 0) b. Ache P(T >= 0 e T < 2) Calcule E(T), a mdia da varivel aleatria T. 19. Uma centena de estudantes realizou um teste no qual o escore mdio foi de 73 com uma varincia de 64. Um grau A foi dado para quem obteve um escore de 85 ou mais. Quantos As foram obtidos aproximadamente, assumindo que os escores So normalmente distribudos? (escolha o mais prximo)

170

1. 2. 3. 4. 5.

42 7 58 5 22

20. Se uma distribuio normal tem mdia 200 e desvio padro 20, ache K tal que a probabilidade de que um valor amostral seja menor do que K 0,975. a. 239 f. 230 b. 204 g. 239 c. 210 h. 250 d. 215 e. 220

21. Se X a mdia de uma amostra extrada de uma distribuio normal com m = 10, s 2 X = 25 e n = 9, ento P( X > 15) : (a) 0,001350 (b) 0,998650 (c) 0,98778 (d) 0,15866

22. A distribuio do tempo de vida de certo tipo de lmpada eltrica normalmente distribuda com mdia de 1000 horas e um desvio padro de 100 horas. Ache o 33 Percentil da distribuio de tempo de vida. a. 560 b. 330 c. 1044 d. 1440 e. nenhuma das anteriores 23. O valor de Z correspondente ao 52 percentil : a. 2,06 b, 2,05 c, 1,99 d, 0,48 e, 0,05 24. Pr(Z > +1.96 ou Z < -1.65) 1) 2) 3) 4) 5) 0,025 0,05 0,0745 0,0495 Nenhuma das anteriores

25. Em uma distribuio normal com mdia 3 e varincia 49, quais so o limite superior e inferior para os 50 % dos dados centrais?
171

a. b. c. d. e.

-29,83 e 35,83 -1,31 e 7,69 -1,69 e 7,69 3,00 e 24,00 nenhuma das anteriores

26. Uma amostra aleatria de tamanho 25 escolhida de uma populao com mdia 7 e varincia 4. A mdia amostral calculada como 8. Qual o valor da varivel normal padro (z) correspondente a mdia amostral? a. b. c. d. e. 25 1,25 1,25 +2,5 nenhuma das anteriores

27. Suponha que para uma amostra de 36 Auxiliares de Enfermagem de diversos hospitais similares, uma avaliao de competncia com intervalo entre 0 e 100 foi obtida a partir de um teste clnico. Suponha que a mdia populacional da avaliao para todas as Auxiliares de Enfermagem destes hospitais foi de 80 e a varincia populacional foi de 100. Para uma amostra de 36 Auxiliares de Enfermagem, qual a probabilidade de que a nota mdia esteja entre 75 e 80? a. 0,4987 b. 0,1915 c. 0,5013 d. 0,2287 e. 0,5115 28. Uma companhia fabrica cilindros que tem uma mdia de 2 polegadas de dimetro. O desvio padro dos dimetros dos cilindros de 10 polegadas. Os dimetros de uma amostra de 4 cilindros so medidos todas as horas. A mdia amostral usada para decidir se o processo de fabricao est operando satisfatoriamente ou no. A seguinte regra de deciso aplicada: se dimetro mdio da amostra de 4 cilindros maior ou igual a 2,15 polegadas, ou menor ou igual a 1,85 polegadas, interrompe-se o processo. a. Qual a probabilidade de parar o processo se a mdia do processo m permanece constante no valor de 2,00 polegadas ? b. Qual a probabilidade de parar o processo se a mdia do processo muda para m = 2,10 polegadas ? c. Qual a probabilidade do processo continuar operando se a mdia do processo mudar para m = 2,15 polegadas ? 29. Qual (ou quais) das seguintes sentenas descreve inferncia estatstica ?

172

a. uma sentena verdadeira sobre uma populao feita atravs de uma informao amostral de uma populao b. uma conjectura acerca de uma populao feita a partir da informao contida em uma amostra daquela populao c. uma sentena verdadeira acerca de uma amostra feita a partir da informao contida em uma populao. 30. Para uma certa populao normalmente distribuda, o valor do desvio padro conhecido, mas o valor da mdia desconhecido. Qual ser o efeito de mudanas no tamanho amostral e do grau de confiana no comprimento do intervalo de confiana da estimativa da mdia populacional? a. Aumentando o tamanho amostral aumenta o comprimento dado um grau de confiana fixo. b. Aumentando o grau de confiana reduz o comprimento, dado um tamanho amostral fixo. c. Aumentando o tamanho amostral reduz o comprimento, dado um grau de confiana fixo. d. Nenhuma das anteriores. 31. A distribuio das mdias de todas as possveis amostras de tamanho (n) escolhidas de uma populao se aproximar de uma curva normal se a. b. c. d. e. n grande o bastante a populao grande a populao simtrica a mdia de cada amostra igual a mdia da populao nenhuma das anteriores correta

32. A distribuio amostral das mdias de amostras aleatrias de tamanho n extradas de uma populao se aproximar de uma distribuio normal se a. somente se a populao normalmente distribuda e se n grande b. somente se a populao normalmente distribuda no importando o valor de n c. se n grande no importando a forma da distribuio da populao d. no importa o valor de n e no importa a forma da distribuio da populao original

33. Em um estudo sobre que relao existente entre uma atitude de criana e a idade na qual ela fala primeiro, os pesquisadores registraram a idade (em meses) da primeira fala da criana e o nmero de pontos (escore) obtido

173

pela criana em um teste sobre a atitude. Seguem-se os dados para 21 crianas:

criana Idade Escore Criana Idade Escore

1 15 95 12 9 96

2 2 71 13 10 83

3 10 83 14 11 84

4 9 91 15 11 102

5 15 102 16 10 100

6 20 87 17 12 105

7 18 93 18 42 57

8 11 100 19 17 121

9 8 104 20 11 86

10 20 94 21 10 100

11 7 113

A linha de mnimo quadrado para a predio do scorea partir da idade da primeira fala : escore = 110 1,13 * idade ; o valor do coeficiente de correlao 0,640. a. Que proporo da variabilidade nos escores da atitude explicada pela reta de mnimos quadrados ? b. Qual seria a predio de mnimos quadrados para os escore de uma criana que fala primeiro aos 20 meses ? c. Calcule o resduo para a criana 6. d. A partir do diagrama de disperso, qual criana tem o maior (em valor absoluto) resduo? O que incomum para esta criana? e. Qual criana tem o menor valor ajustado? 34. Uma amostra no ano de 1989 de 130 mulheres que visitaram um ginecologista em uma determinada universidade do Noroeste dos EUA indicou que 113 tiveram experincia sexual. a. Assumindo que essas mulheres so uma amostra aleatria simples da populao de todas as mulheres daquela universidade, calcule um intervalo de confiana para a proporo da populao que sexualmente ativa. b. O intervalo seria mais largo, mais estreito ou da mesma largura se 520 mulheres fossem amostradas? (Voc no precisa fazer nenhum clculo) Explique. c. O intervalo seria mais largo, mais estreito ou da mesma largura se resultassem 73 mulheres com experincia sexual 130 mulheres amostradas? (Voc no precisa fazer nenhum clculo) Explique. d. Voc acha que razovel assumir que essas mulheres formam uma amostra aleatria? Explique.

174

35. No execute nenhum clculo para responder o seguinte. Explique seu raciocnio em cada caso. a. Tres pesquisadores Alex, Bob e Chuck selecionam de maneira independente amostras aleatrias da mesma populao. Os tamanhos amostrais so 1000 para Alex, 4000 para Bob e 250 para Chuck. Cada pesquisador constri um intervalo de confiana de 95 % para a partir de seus dados. A semiamplitude dos trs intervalos so 0,015; 0,031 e 0,062. Relacione cada semiamplitude com o pesquisador. b. Cada um dos dois pesquisadores Donna e Eileen selecionam amostras aleatrias de tamanho 1000 de populaes diferentes e constrem intervalos de confiana de 95 % para p (a proporo populacional). A semi-amplitude do intervalo de Donna 0,030 e a de Eileen 0,025. Dado que as propores amostrais foram p1 =.20 e p2 =.40, relacione cada pesquisadora com a sua proporo amostral. c. Um pesquisador de nome Fran seleciona 100 indivduos aleatoriamente de uma populao, observa 50 sucessos e calcula 5 intervalos de confiana. Os nveis de confiana so 80 %, 90 %, 95 %, 98 % e 99 % e os cinco intervalos so (0,402 ; 0,598), (0,371 ; 0,629), (0,418 ; 0,582), (0,436 ; 0,564) e (0,384 ; 0,616). Relacione cada intervalo com o seu nvel de confiana.

36. Suponha que 80 % de todos os habitantes da Pensilvnia comam Peru no Dia de Ao de Graas. Suponha alm disso que voc planeja selecionar uma amostra aleatria simples (AAS) de 300 habitantes da Pensilvnia visando determinar a sua proporo que come peru no Dia de Ao de Graas. a. 80 % uma parmetro ou uma estatstica? Que smbolo voc deve usar para represent-lo? b. De acordo com o Teorema do Limite Central, como a proporo amostral de quem come peru no Dia de Ao de Graas varia de amostra para amostra ? c. Determine a probabilidade de que menos do que 3 quartos da amostra comam peru no Dia de Ao de Graas. d. Seria a resposta a (c) menor, maior ou a mesma se o tamanho amostral de 800 fosse usado? (voc no precisa executar o clculo). Explique. d. Podemos mostrar que nesse contexto P ( p 0,80) = 0.15. Se essa afirmativa no estiver correta escreva uma verdadeira que a substitua. Escreva uma ou duas sentenas explicando para um leigo o que essa afirmativa significa.

175

37. A seguinte tabela lista a temperatura mdia mensal e minha conta de eletricidade para aquele ms. ms Abr-91 Mai-91 Jun-91 Jul-91 Ago-91 Set-91 Out-91 Nov-91 Dez-91 Jan-92 Fev-92 Mar-92 Abr-92 Mai-92 temp 51 61 74 77 78 74 59 48 44 34 32 41 43 57 conta $41.69 $42.64 $36.62 $40.70 $38.49 $37.88 $35.94 $39.34 $49.66 $55.49 $47.81 $44.43 $48.87 $39.48 ms Jun-92 Jul-92 Ago-92 Set-92 Out-92 Nov-92 Dez-92 Jan-93 Fev-93 Mar-93 Abr-93 Mai-93 Jun-93 Jul-93 temp 66 72 72 70 * 45 39 35 * 30 49 * 68 78 Conta $40.89 $40.89 $41.39 $38.31 * $43.82 $44.41 $46.24 * $50.80 $47.64 * $38.70 $47.47

A linha de mnimos quadrados desenhada no diagrama de disperso; a equao dessa reta : conta = 55,1 0,214 temp. mdia a. Estime o valor do coeficiente de correlao entre a conta de eletricidade e a temperatura mdia. b. Qual a predio de mnimos quadrados para a conta de energia eltrica em uma temperatura mdia de 60 graus F? c. Sem fazer clculos, identifique que ms tem o maior (em valor absoluto) resduo. Que ms tem o menor valor ajustado?

d.

176

Vous aimerez peut-être aussi