Vous êtes sur la page 1sur 117

Probabilidade e Estatstica

Sonia Maria Barros Barbosa Correa



2 Edio


































Pontifcia Universidade Catlica de
Minas Gerais


Gro Chanceler
Dom Serafim Fernandes de Arajo

Reitor
Prof. Pe. Geraldo Magela Teixeira

PUCMINAS, 2003




PUC Minas Virtual


Diretora de Ensino a Distncia
Maria Beatriz Ribeiro de Oliveira Gonalves

Coordenao Acadmico-pedaggica
Stela Beatris Trres Arnold (coordenadora)
Agnela da Silva Giusta
Liana Portilho Mattos
Maria Ceclia de Ruiz Combat Stortini
Mercia Moreira
Wilba Lcia Maia Bernardes

Coordenao Tecnolgica
Luiz Flvio F. B. Oliveira (coordenador)
Antnio Bosco de Oliveira Jnior
Eduardo Marques Duarte
Guilherme C. V. Costa
Mrcio Tlio Morato
Rosiane C. M. Oliveira
Simone Nogueira
Tlio Nogueira

Coordenao da rea de Televiso
Iara Cordeiro de Melo Franco (coordenadora)

Assessoria de Comunicao e Marketing
Jnia Cludia Carvalho (assessora de comunicao)
Carolina Franco

Gerncia de Projetos
Eduardo Silva Ladeira

Secretaria
Eloisa A. T. Lott Carvalho (secretria)
Cludio Elias Marques
Cristina Maria Isoni Auad
Jacqueline C. Carvalho
Design Grfico e diagramao:
Simone Nogueira / Slvia Fonseca (Trainee I)
Reviso:
PUC Minas Virtual

Reproduo proibida. Art. 184 do Cdigo Penal
e Lei 9.610 de 19 de fevereiro de 1998.
Todos os direitos reservados
PONTIFCIA UNIVERSIDADE
CATLICA DE MINAS GERAIS

DIRETORIA DE ENSINO A DISTNCIA
R. Esprito Santo, 1.059 - 12 andar Centro
CEP 30160-922 - Belo Horizonte - MG
Telefone: (0xx31) 3273-7898 - Fax: 3274-2805
http://www.virtual.pucminas.br
e-mail: ead@pucminas.br


ATENDIMENTO E INFORMAES:
Belo Horizonte: (0xx31) 3274-1862
Demais localidades: 0300 313 3 313
*

e-mail: atendimento@virtual.pucminas.br
* O custo da ligao 0300 de R$ 0,27/min, para telefones fixos,
ou de R$ 0,63/min, para telefones celulares, e ser pago pelo
usurio. Os valores indicados no incluem impostos
(ref. 30/06/03). Valores sujeitos a alteraes sem aviso prvio.
Confira os valores atualizados em
http://www.virtual.pucminas.br/0300

FICHA CATALOGRFICA
Elaborada pela Biblioteca da
Pontifcia Universidade Catlica de Minas Gerais


Correa, Sonia Maria Barros Barbosa

C824p Probabilidade e estattica / Sonia Maria
Barros Barbosa Correa. 2 ed. - Belo Hori-
zonte: PUC Minas Virtual, 2003
116 p.

Bibliografia

1. Probabilidade. 2. Estatstica matemtica.
3. Amostragem (Estatstica). I. Pontifcia Uni-
versidade Catlica de Minas Gerais.
II. Ttulo.

CDU: 519.2


Bibliotecria - Eunice dos Santos - CRB 6/1515


Impresso no Brasil

sumrio


Unidade 1 Natureza e Fundamentos do Mtodo Estatstico........................ 07

1.1 - Introduo Estatstica ........................................................

07

1.2 - Importncia da Estatstica .....................................................

08

1.3 - Grandes reas da Estatstica ..................................................

09

1.4 - Fases do Mtodo Estatstico ...................................................

12

1.5 - Sries Estatsticas ...............................................................

15

1.6 - Apresentao de dados

Tabelas e Grficos: Construo e Interpretao .......................... 22




Unidade 2 Amostragem .................................................................... 28

2.1 Importncia da Amostragem................................................... 28

2.2 Conceitos Fundamentais ....................................................... 29

2.3 Amostragem Aleatria Simples ................................................ 31

2.4 Amostragem Aleatria Estratificada ......................................... 32

2.5 Amostragem por Conglomerado .............................................. 34

2.6 Amostragem Sistemtica ...................................................... 34




Unidade 3 Distribuio de Freqncia ................................................. 37

3.1 Conceitos ......................................................................... 37

3.2 - Elementos de uma distribuio de freqncia: amplitude total,
limites de classe, amplitude do intervalo de classe, ponto mdio
da classe, freqncia absoluta, relativa e acumulada .................... 40

3.3 - Regras Gerais para a elaborao de uma distribuio de freqncia ... 44

3.4 - Grficos representativos de uma distribuio de freqncia:

histograma, polgono de freqncia e ogiva ................................ 45



Unidade 4 - Medidas de Posio ........................................................... 48

4.1. Introduo.........................................................................

48
4.2. Mdia aritmtica simples e ponderada e suas propriedades .............. 49
4.3. Moda: Dados agrupados e no agrupados em classes....................... 50
4.4. Mediana: Dados agrupados e no agrupados em classes ................... 52
4.5. Mdia Geomtrica: Dados agrupados e no agrupados em classes....... 54
4.6. Mdia Harmnica: Dados agrupados e no agrupados em classes ........ 54
4.7. Separatrizes: Quartis, Decis e Percentis ..................................... 55

Unidade 5 Medidas de Disperso ........................................................

59

5.1 Disperso .........................................................................

59
5.2 Assimetria ....................................................................... 61
5.3 Curtose............................................................................ 63

Unidade 6 Probabilidade ..................................................................

65

6.1 Experimento aleatrio, espao amostral e eventos .......................

65
6.2 Probabilidade:Definio clssica; Probabilidade e
freqncia relativa .............................................................

70
6.3 Tipos de eventos ................................................................ 70
6.4 Axiomas de Probabilidade ..................................................... 72
6.5 Probabilidade condicional e independncia de eventos ................. 74
Unidade 7 Variveis Aleatrias ..........................................................


7.1 Conceito de varivel aleatria ...............................................
78


78
7.2 Distribuio de probabilidade ................................................. 79
7.3. Funo de densidade de probabilidade....................................... 79
7.4. Esperana matemtica, varincia e desvio padro: propriedades ....... 79
7.5. Distribuies discretas: Hipergeomtrica, Binomial e Poisson............ 80
7.6. Distribuio contnua: Normal - propriedades, distribuio
normal padro, a Normal como aproximao da Binomial ................


85

Unidade 8 - Inferncia Estatstica ......................................................... 93

8.1. Populao e amostra; Estatsticas e parmetros;

Distribuies amostrais ......................................................... 93

8.2. Estimao ......................................................................... 96

8.3. Testes de Hipteses ............................................................. 100




Unidade 9 Correlao e Regresso Linear ............................................. 106

9.1. Diagrama de disperso .......................................................... 107

9.2. Correlao Linear ................................................................ 107

9.3. Coeficiente de Correlao Linear ............................................. 108

9.4. Regresso Reta de regresso ................................................. 112




Referncias Bibliogrficas .................................................................. 116

PUC Minas Virtual 7 Probabilidade e Estatstica


UNIDADE 1
Natureza e Fundamentos do Mtodo Estatstico

1.1. Introduo Estatstica
1.2. Importncia da Estatstica
1.3. Grandes reas da Estatstica
1.4. Fases do Mtodo Estatstico
1.5. Sries Estatsticas
1.6. Apresentao de dados Tabelas e Grficos:
Construo e Interpretao







Nesta unidade, sero abordados temas relacionados ao mtodo estats-
tico. Oferecer exemplos de tabelas e grficos que podem representar, de
forma sinttica, as informaes obtidas atravs de processos de pesqui-
sa, so objetivos especficos desta unidade, que tem o propsito de:

Demonstrar a importncia da Estatstica na vida diria;

Mostrar como podemos utiliz-la de forma correta;

Ensinar como compor tabelas a partir de dados numricos;

Ensinar como representar dados numricos em grficos.




1.1. Introduo Estatstica


A palavra estatstica lembra, maioria das pessoas, recenseamento. Os censos
existem h milhares de anos e constituem um esforo imenso e caro feito pelos
governos, com o objetivo de conhecer seus habitantes, sua condio socioeconmi-
ca, sua cultura, religio, etc. Portanto, associar estatstica a censo perfeitamente
correto do ponto de vista histrico, sendo interessante salientar que as palavras
estatstica e estado tm a mesma origem latina: status.

A estatstica tambm comumente associada s pesquisas de opinio pblica, aos
vrios ndices governamentais, aos grficos e s mdias publicados diariamente na
imprensa. Na realidade, entretanto, a estatstica engloba muitos outros aspectos,
sendo fundamental na anlise de dados provenientes de quaisquer processos onde
exista variabilidade.
PUC Minas Virtual 8 Probabilidade e Estatstica


possvel distinguir duas concepes para a palavra ESTATSTICA: no plural (esta-
tsticas), indica qualquer coleo de dados numricos, reunidos com a finalidade de
fornecer informaes acerca de uma atividade qualquer. Assim, por exemplo, as
estatsticas demogrficas referem-se aos dados numricos sobre nascimentos,
falecimentos, matrimnios, desquites, etc. As estatsticas econmicas consistem
em dados numricos relacionados com emprego, produo, vendas e com outras
atividades ligadas aos vrios setores da vida econmica. No singular (Estatstica),
indica a atividade humana especializada ou um corpo de tcnicas, ou ainda uma
metodologia desenvolvida para a coleta, a classificao, a apresentao, a anlise e
a interpretao de dados quantitativos e a utilizao desses dados para a tomada
de decises.



1.2. Importncia da Estatstica


O mundo est repleto de problemas. Para resolvermos a maioria deles, necessita-
mos de informaes. Mas, que tipo de informao? Que quantidade de informa-
es? Aps obt-las, que fazer com elas? A Estatstica trabalha com essas informa-
es, associando os dados ao problema, descobrindo como e o que coletar, assim
capacitando o pesquisador (ou profissional ou cientista) a obter concluses a partir
dessas informaes, de tal forma que possam ser entendidas por outras pessoas.

Portanto, os mtodos estatsticos auxiliam o cientista social, o economista, o enge-
nheiro, o agrnomo e muitos outros profissionais a realizarem o seu trabalho com
mais eficincia.


A Estatstica uma parte da Matemtica que fornece mtodos para a
coleta, organizao, descrio, anlise e interpretao de dados, viabili-
zando a utilizao dos mesmos na tomada de decises.



Vejamos alguns exemplos:

Os estatsticos do governo conduzem censos de populao, moradia, produtos
industriais, agricultura e outros. So feitas compilaes sobre vendas, produo,
inventrio, folha de pagamento e outros dados das indstrias e empresas. Essas
estatsticas informam ao administrador como a sua empresa est crescendo, seu
crescimento em relao a outras empresas e fornece-lhe condies de planejar
aes futuras. A anlise dos dados muito importante para se fazer um plane-
jamento adequado.
PUC Minas Virtual 9 Probabilidade e Estatstica

Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e,
com seus processos e tcnicas, tm contribudo para a organizao de empresas
e utilizao dos recursos do mundo moderno.

Em geral, as pessoas, quando se referem ao termo estatstica, desconhecem que o
aspecto essencial o de proporcionar mtodos inferenciais, que permitam conclu-
ses que transcendam os dados obtidos inicialmente.



1.3. Grandes reas da Estatstica


Para fins de apresentao, usual se dividir a estatstica em trs grandes reas,
embora no se trate de ramos isolados:

Estatstica Descritiva e Amostragem Conjunto de tcnicas que objetivam cole-
tar, organizar, apresentar, analisar e sintetizar os dados numricos de uma po-
pulao, ou amostra;
Estatstica Inferencial Processo de se obter informaes sobre uma populao
a partir de resultados observados na amostra;
Probabilidade - Modelos matemticos que explicam os fenmenos estudados
pela Estatstica em condies normais de experimentao.
Em estatstica, utilizamos extensamente os termos: populao, amostra, censo,
parmetros, estatstica, dados discretos, dados contnuos, dados quantitativos e
dados qualitativos; que estaremos definindo abaixo para maior compreenso::
Populao: uma coleo completa de todos os elementos a serem
estudados.
Amostra: uma subcoleo de elementos extrados de uma popula-
o.
Censo: uma coleo de dados relativos a todos os elementos de
uma populao.
Parmetros: uma medida numrica que descreve uma caractersti-
ca de uma populao.
Estatstica: uma medida numrica que descreve uma caracterstica
de uma amostra.
Dados contnuos: resultam de um nmero infinito de valores poss-
veis que podem ser associados a pontos em uma escala contnua de
tal maneira que no haja lacunas.
PUC Minas Virtual 10 Probabilidade e Estatstica


Dados discretos: resultam de um conjunto finito de valores possveis,
ou de um conjunto enumervel de valores.
Dados quantitativos: consistem em nmeros que representam conta-
gens ou medidas.
Dados qualitativos:podem ser separados em diferentes categorias
que se distinguem por alguma caracterstica no-numrica.


Amostragem


o processo de escolha da amostra. a parte inicial de qualquer estudo estatstico.
Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. Ge-
ralmente, as pesquisas so realizadas atravs de estudo dos elementos que com-
pem uma amostra, extrada da populao que se pretende analisar.


Exemplo 1.1. Pesquisas sobre tendncias de votao


Em pocas de eleio, comum a realizao de pesquisas com o objeti-
vo de se conhecer as tendncias do eleitorado. Para que os resultados
sejam de fato representativos, toma-se o cuidado de se entrevistar um
conjunto de pessoas com caractersticas socioeconmicas, culturais, re-
ligiosas, etc. to prximas quanto possvel da populao qual os resul-
tados da pesquisa sero estendidos. A escolha da amostra, a redao do
questionrio, a entrevista, a codificao dos dados e a apurao dos re-
sultados so as etapas deste tipo de pesquisa.



Populao e amostra


O estudo de qualquer fenmeno, seja ele natural, social, econmico ou biolgico,
exige a coleta e a anlise de dados estatsticos. A coleta de dados , pois, a fase
inicial de qualquer pesquisa.


sobre os dados da amostra que se desenvolvem os estudos, visando a fazer infe-
rncias sobre a populao.

Exemplo 1.2. Avaliao de um programa de ensino


Toma-se certo nmero de pares de turmas: a um conjunto de turmas
ensina-se um assunto por um novo mtodo e, ao outro, pelo mtodo
clssico. Aplica-se uma prova a ambos os grupos. As notas observadas
PUC Minas Virtual 11 Probabilidade e Estatstica

nesses conjuntos de turmas constituem a nossa amostra. Se os resulta-
dos do novo mtodo forem melhores, iremos aplic-lo a todas as tur-
mas, isto , populao. A partir da amostra, estabelecemos o que
conveniente para a populao, ou seja, fazemos uma inferncia sobre a
populao.


Exemplo 1.3. Renda mdia per capita em diversas regies do pas


Toma-se um conjunto de indivduos em cada regio, escolhidos ao aca-
so, e sobre esse grupo so feitos os estudos. Os indivduos assim esco-
lhidos constituem a amostra e os resultados nela observados sero es-
tendidos populao.



Estatstica Descritiva


a parte mais conhecida. Quem v o noticirio, na televiso ou nos jornais, sabe
quo freqente o uso de mdias, ndices e grficos nas notcias.

Exemplo 1.4. INPC (ndice Nacional de Preos ao Consumidor)


Sua construo envolve a sintetizao, em um nico nmero, dos au-
mentos dos produtos de uma cesta bsica.


Exemplo 1.5. Anurio Estatstico Brasileiro


O IBGE publica esse anurio apresentando, em vrias tabelas, os mais
diversos dados sobre o Brasil: educao, sade, transporte, economia,
cultura, etc. Embora simples, fceis de serem entendidas, as tabelas so
o produto de um processo demorado e extremamente dispendioso de
coleta e apurao de dados.


Exemplo 1.6. Anurio Estatstico da Embratur


A Embratur publica esse anurio apresentando, em vrias tabelas e gr-
ficos, os mais diversos dados sobre Turismo Interno e dados sobre en-
trada de turistas estrangeiros no Brasil.
PUC Minas Virtual 12 Probabilidade e Estatstica


Estatstica Inferencial (ou Indutiva)


A tomada de decises sobre a populao, com base em estudos feitos sobre os da-
dos da amostra, constitui o problema central da inferncia estatstica.


Exemplo 1.7. Suponha que a distribuio das alturas de todos os habi-
tantes de um pas possa ser representada por uma distribuio normal.
Mas no conhecemos de antemo a mdia da distribuio. Devemos,
pois, estim-la.


Exemplo 1.8. Anlise financeira. Os analistas financeiros estudam dados
sobre a situao da economia, visando explicar tendncias dos nveis de
produo e de consumo, projetando-os para o futuro.


Exemplo 1.9. Ocorrncia de terremotos. Os gelogos esto continua-
mente coletando dados sobre a ocorrncia de terremotos. Gostariam de
inferir quando e onde ocorrero tremores, e qual a sua intensidade. Tra-
ta-se, sem dvida, de uma questo complexa, que exige longa experi-
ncia geolgica, alm de cuidadosa aplicao de mtodos estatsticos.



Probabilidade


O processo de generalizao, que caracterstico do mtodo indutivo, est associa-
do a uma margem de incerteza. A existncia da incerteza deve-se ao fato de que a
concluso, que se pretende obter para o conjunto de todos os indivduos analisados
quanto a determinadas caractersticas comuns, baseia-se em uma parcela do total
das observaes. A medida da incerteza tratada mediante tcnicas e mtodos que
se fundamentam na Teoria da Probabilidade. Essa teoria procura quantificar a
incerteza existente em determinada situao.



1.4. Fases do Mtodo Estatstico


Quando se pretende empreender um estudo estatstico completo, existem diversas
fases do trabalho que devem ser desenvolvidas para se chegar aos resultados finais
de um estudo capaz de produzir resultados vlidos. As fases principais so as
seguintes:

Definio do problema
PUC Minas Virtual 13 Probabilidade e Estatstica

Planejamento

Coleta de dados

Apurao dos dados

Apresentao dos dados

Anlise e Interpretao dos dados



Definio do problema


A primeira fase do trabalho consiste em uma definio ou formulao correta do
problema a ser estudado. Alm de considerar detidamente o problema objeto do
estudo, o analista dever examinar outros levantamentos realizados no mesmo
campo e que sejam anlogos, uma vez que parte da informao de que se necessi-
ta pode, muitas vezes, ser encontrada nesses ltimos.



Planejamento


O passo seguinte, aps a definio do problema, compreende a fase do planeja-
mento, que consiste em se determinar o procedimento necessrio para se resolver
o problema e, em especial, como levantar informaes sobre o assunto, objeto do
estudo. preciso planejar o trabalho a ser realizado tendo em vista o objetivo que
se pretende atingir. nessa fase que ser escolhido o tipo de levantamento a ser
utilizado. Sob esse aspecto, pode haver dois tipos de levantamento:

Levantamento censitrio, quando a contagem for completa, abrangendo todo o
universo;
Levantamento por amostragem, quando a contagem for parcial.



Outros elementos importantes que devem ser tratados nesta mesma fase so:

Cronograma das atividades, atravs do qual so fixados os prazos para as vrias
fases;
Custos envolvidos;

Exame das informaes disponveis;

Delineamento da amostra, etc.
PUC Minas Virtual 14 Probabilidade e Estatstica


Coleta dos dados


O terceiro passo essencialmente operacional, compreendendo a coleta das infor-
maes propriamente ditas. Nesta fase do mtodo estatstico, conveniente esta-
belecer uma distino entre duas espcies de dados:

Dados primrios quando so publicados ou coletados pelo prprio pesquisador
ou organizao que os escolheu;
Dados secundrios quando so publicados ou coletados por outra organizao.


Um conjunto de dados , pois, primrio ou secundrio em relao a algum. As
tabelas do Censo Demogrfico so fontes primrias. Quando determinado jornal
publica estatsticas extradas de vrias fontes e relacionadas com diversos setores
industriais, os dados so secundrios para quem desejar utilizar-se deles em algu-
ma pesquisa que esteja desenvolvendo.

A coleta de dados pode ser realizada de duas maneiras:

Coleta Direta quando obtida diretamente da fonte, como no caso da empresa
que realiza uma pesquisa para saber a preferncia dos consumidores pela sua
marca;
Coleta Indireta quando inferida a partir dos elementos conseguidos pela cole-
ta direta, ou atravs do conhecimento de outros fenmenos que, de algum mo-
do, estejam relacionados com o fenmeno em questo.


Apurao dos dados


Antes de comear a analisar os dados, conveniente que lhes seja dado algum tra-
tamento prvio, a fim de torn-los mais expressivos. A quarta etapa do processo ,
ento, a da apurao ou sumarizao, que consiste em resumir os dados atravs de
sua contagem e agrupamento. Pode ser manual, eletromecnica ou eletrnica.



Apresentao dos dados


Por mais diversa que seja a finalidade, os dados devem ser apresentados sob forma
adequada, tornando mais fcil o exame do fenmeno que est sendo objeto de tra-
tamento estatstico.
PUC Minas Virtual 15 Probabilidade e Estatstica

H duas formas de apresentao ou exposio dos dados observados, que no se
excluem mutuamente:

Apresentao tabular uma apresentao numrica dos dados. Consiste em
dispor os dados em linhas e colunas distribudas de modo ordenado, segundo al-
gumas regras prticas adotadas pelos diversos sistemas estatsticos. As tabelas
tm a vantagem de conseguir expor, sinteticamente e em s local, os resultados
sobre determinado assunto, de modo a se obter uma viso global mais rpida
daquilo que se pretende analisar.
Apresentao grfica uma apresentao geomtrica dos dados numricos.
Embora a apresentao tabular seja de extrema importncia no sentido de facili-
tar a anlise numrica de dados, no permite ao analista obter uma viso to
rpida, fcil e clara do fenmeno e sua variao como aquela conseguida atra-
vs de um grfico.


Anlise e interpretao dos dados


Nesta ltima etapa, o interesse maior reside em tirar concluses que auxiliem o
pesquisador a resolver seu problema. A anlise dos estatsticos est ligada essenci-
almente ao clculo de medidas, cuja finalidade principal descrever o fenmeno.
Assim, o conjunto de dados a ser analisado pode ser expresso por nmeros-
resumo, as estatsticas que evidenciam as caractersticas particulares desse conjun-
to. O significado exato de cada um dos valores obtidos atravs do clculo das vrias
medidas estatsticas disponveis deve ser bem interpretado. possvel mesmo, nes-
ta fase, arriscar algumas generalizaes, as quais envolvero, como mencionado
anteriormente, algum grau de incerteza, porque no se pode estar seguro de que o
que foi constatado para aquele conjunto de dados (a amostra) se verificar igual-
mente para a populao.



1.5. Sries Estatsticas


Define-se srie estatstica como toda e qualquer coleo de dados estatsticos refe-
ridos a uma mesma ordem de classificao: quantitativa. No sentido mais amplo,
srie uma sucesso de nmeros referidos a qualquer varivel. Se os nmeros
expressarem dados estatsticos, a srie ser chamada de srie estatstica.

Em sentido mais restrito, pode-se dizer que uma srie estatstica uma sucesso
de dados estatsticos referidos a caracteres qualitativos, ao passo que uma suces-
PUC Minas Virtual 16 Probabilidade e Estatstica


so de dados estatsticos referidos a caracteres quantitativos configurar uma Dis-
tribuio de Freqncia.

Em outros termos, a palavra srie usada normalmente para designar um conjunto
de dados dispostos de acordo com um carter varivel, residindo a qualidade serial
na disposio desses valores, e no em uma disposio temporal ou espacial de
indivduos.


Tabela um quadro que resume um conjunto de observaes.
Uma tabela compe-se de:
Corpo conjunto de linhas e colunas que contm informaes sobre a varivel
em estudo;

Cabealho parte superior da tabela que especifica o contedo das colunas;

Coluna indicadora parte da tabela que especifica o contedo das linhas;

Linhas retas imaginrias que facilitam a leitura, no sentido horizontal, de da-
dos que se inscrevem nos seus cruzamentos com as colunas;
Casa ou clula espao destinado a um s nmero;

Ttulo conjunto de informaes, as mais completas possveis, respondendo s
perguntas: O qu?- Quando?- Onde?- localizado no topo da tabela.
Fonte referncia de onde se obteve os dados, colocado, de preferncia, no ro-
dap.

As tabelas servem para apresentar sries estatsticas. Conforme varie um dos ele-
mentos da srie, podemos classific-la em:

Cronolgicas - Tempo (fator temporal ou cronolgico) a que poca refere-se o
fenmeno analisado;
Geogrficas - Local (fator espacial ou geogrfico) onde o fenmeno acontece;

Especficas - Fenmeno (espcie do fato ou fator especificativo) o que des-
crito.

As sries tambm so divididas em:


Sries Homgradas - aquelas em que a varivel descrita apresenta variao dis-
creta ou descontnua. So sries homgradas a srie temporal, a srie geogrfi-
ca e a srie especfica;
PUC Minas Virtual 17 Probabilidade e Estatstica

Sries Hetergradas - aquelas nas quais o fenmeno ou o fato apresenta gradu-
aes ou subdivises. Embora fixo, o fenmeno varia em intensidade. A Distribu-
io de freqncias ou seriao uma srie hetergrada.


Os dados estatsticos resultantes da coleta direta da fonte, sem outra manipulao
seno a contagem ou medida, o chamados dados absolutos. Dados Relativos so o
resultado de comparaes por quociente (razes) que se estabelecem entre dados
absolutos e tm por finalidade realar ou facilitar as comparaes entre quantida-
des.


1.5.1. Tipos de Sries Estatsticas Simples (ou de uma entrada)


As sries estatsticas diferenciam-se de acordo com a variao de um dos trs ele-
mentos: tempo, local e fenmeno.
PUC Minas Virtual 18 Probabilidade e Estatstica



Srie Cronolgica


Tambm chamada de srie temporal, srie histrica, srie evolutiva ou marcha,
identifica-se pelo carter varivel do fator cronolgico. Assim, deve-se ter:

Elemento varivel: poca

Elementos Fixos: Local e Fenmeno

Exemplo:

Tabela 1.1 - Operadora WKX Venda de bilhetes areos
Mercado Interno 1995





Meses
Vendas (em milhares
de reais)

Janeiro

2300
Fevereiro 1800
Maro 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510

Fonte: Departamento de Anlise de Mercado
PUC Minas Virtual 19 Probabilidade e Estatstica

Srie Geogrfica


Tambm chamada de srie territorial, srie espacial ou srie de localizao, identifi-
ca-se pelo carter varivel do fator geogrfico. Assim, deve-se ter:

Elemento varivel: Local

Elementos Fixos: poca e Fenmeno Exemplo:


Tabela 1.2 Operadora WKX - Vendas por Unidade da Federao 1995



Unidades da Federao

Vendas (em milhares de reais)

Minas Gerais

4000

Paran

2230

Rio Grande do Sul

6470

Rio de Janeiro

8300

So Paulo

10090

Outros

420

TOTAL BRASIL

31510

Fonte: Departamento de Anlise de Mercado
PUC Minas Virtual 20 Probabilidade e Estatstica


Srie Especfica


Tambm chamada de srie categrica ou srie por categoria, identifica-se pelo ca-
rter varivel de fator especificativo. Assim, deve-se ter:

Elemento varivel: Fenmeno

Elementos Fixos: Local e poca

Exemplos:


Tabela 1.3. Operadora WKX -
Venda de bilhetes areos por Linha 1995


Linha do Produto

Vendas (em milhares de reais)

Linha A

6450

Linha B

9310

Linha C

15750

TODAS AS LINHAS

31510

Fonte: Departamento de Anlise de Mercado


Tabela 1.4. Nmero de empregados das vrias classes
de salrios no estado de So Paulo 1998


Classes de Salrios (R$)

Nmero de Empregados

At 80

41 326

De 80 a 119

123 236

De 120 a 159

428 904

De 160 a 199

324 437

De 200 a 399

787 304

De 400 a 599

266 002

De 600 a 799

102 375

De 800 a 999

56 170

1000 e mais

103 788

TOTAL

2 233 542

Fonte: Servio de Estatstica da Previdncia e Trabalho

(Dados alterados para melhor compreenso)
PUC Minas Virtual 21 Probabilidade e Estatstica

1.5.2. Tabelas Compostas (ou de dupla entrada)


As tabelas apresentadas anteriormente so tabelas estatsticas simples, onde ape-
nas uma srie est representada. comum, todavia, haver necessidade de apre-
sentar, em uma nica tabela, mais do que uma srie. Quando as sries aparecem
conjugadas, tem-se uma tabela de dupla entrada. Em uma tabela desse tipo so
criadas duas ordens de classificao: uma horizontal (linha) e uma vertical (colu-
na).

Exemplos:


A) Srie especfico-temporal


B) Srie geogrfico-temporal

A) Tabela 1.5 Populao economicamente ativa
por setor de atividades Brasil



Setor

Populao (1 000 Hab.)

1940

1950

1960

Primrio

8 968

10 255

12 163

Secundrio

1 414

2 347

2 962

Tercirio

3 620

4 516

7 525

Fonte: IPEA



B) Tabela 1.6 Populao Indgena Brasileira



Unidade de
Produo

Produo

1937

1938

1939

Acre

5 007

4 765

4 727

Amazonas

6 858

5 998

5 631

Par

4 945

4 223

4 500

Mato Grosso

1 327

1 285

1 235

Outros Estados

333

539

337

Fonte: Anurio Estatstico do Brasil IBGE - (Dados alterados para melhor compreenso)
PUC Minas Virtual 22 Probabilidade e Estatstica


Podem existir, se bem que mais raramente, pela dificuldade de representao, s-
ries compostas de trs ou mais entradas.


Observao:


9 Nem sempre uma tabela representa uma srie estatstica. Por vezes, os dados
reunidos no revelam uniformidade, sendo meramente um aglomerado de in-
formaes gerais sobre determinado assunto, as quais, embora teis, no apre-
sentam a consistncia necessria para se configurar uma srie estatstica.


Exemplo: Tabela com resumos de dados, mas que no representa uma
srie estatstica.

Tabela 1.8 Situao dos espetculos cinematogrficos no Brasil 1967


Especificao

Dados Numricos

Nmero de cinemas

2 488

Lotao dos cinemas

1 722 348

Sesses por dia

3 933

Filmes de longa metragem

131 330 488

Meia-entrada

89 581 234

Fonte: Anurio Estatstico do Brasil IBGE



1.6. Apresentao de dados - Tabelas e Grficos:
Construo e Interpretao

A representao grfica das sries estatsticas tem por finalidade representar os
resultados obtidos, permitindo que se chegue a concluses sobre a evoluo do
fenmeno ou sobre como se relacionam os valores da srie. A escolha do grfico
mais apropriado ficar a critrio do analista. Contudo, os elementos simplicidade,
clareza e veracidade devem ser considerados, quando da elaborao de um grfico.

Simplicidade o grfico deve ser destitudo de detalhes de importncia secund-
ria, assim como de traos desnecessrios que possam levar o observador a uma
anlise morosa ou sujeita a erros.
Clareza o grfico deve possibilitar uma correta interpretao dos valores re-
presentativos do fenmeno em estudo.
Veracidade o grfico deve expressar a verdade sobre o fenmeno em estudo.
PUC Minas Virtual 23 Probabilidade e Estatstica

Diretrizes para a construo de um grfico:


9 O ttulo do grfico deve ser o mais claro e completo possvel. Quando
necessrio, deve-se acrescentar subttulos;

9 A orientao geral dos grficos deve ser da esquerda para a direita;

9 As quantidades devem ser representadas por grandezas lineares;


9 Sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer
a linha 0 (zero);

9 S devem ser includas no desenho as coordenadas indispensveis para guiar o
olhar do leitor ao longo da leitura. Um tracejado muito cerrado dificulta o exame
do grfico;

9 A escala horizontal deve ser lida da esquerda para a direita, e a vertical de
baixo para cima;

9 Os ttulos e marcaes do grfico devem ser dispostos de maneira que sejam
facilmente lidos, partindo da margem horizontal inferior ou da margem esquer-
da.


Leitura e interpretao de um grfico:


9 Declarar qual o fenmeno ou fenmenos representados, a regio considerada,
o perodo de tempo, a fonte dos dados, etc;

9 Examinar o tipo de grfico escolhido, verificar se o mais adequado, criticar
a sua execuo, no conjunto e nos detalhes;

9 Analisar cada fenmeno separadamente, fazendo notar os pontos mais em evi-
dncia, o mximo e o mnimo, assim como as mudanas mais bruscas;

9 Investigar se h uma tendncia geral crescente ou decrescente ou, ento, se
o fato exposto estacionrio;

9 Procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo a-
proximado, etc.
PUC Minas Virtual 24 Probabilidade e Estatstica

v
e
n
d
a
s


Eis os tipos mais comuns de grficos:


Grfico em Linhas

Constitui uma aplicao do processo de representao das funes num sistema de
coordenadas cartesianas
Exemplo: Vendas em Cr$ 1000,00 nos anos de 1971 a 1977 de determinado produ-
to da empresa x.

Vendas em Cr$ 1000,00


500

400

300

200

100

0
1971 1972 1973 1974 1975 1976 1977
anos

Fonte: Dados Fictcios.

Grfico em Colunas

a representao de uma srie por meio de retngulos, dispostos verticalmente.

Exemplo:Populao Brasileira nas dcadas de 40 a 70.


Populao


100

80

60
Populao

40

20

0
1940 1950 1960 1970


Fonte: Dados Fictcios
PUC Minas Virtual 25 Probabilidade e Estatstica

Grfico em Barras

semelhante ao grfico em colunas, porm, os retngulos so dispostos horizon-
talmente.
Exemplo:Populao Brasileira nas dcadas de 40 a 70


Populao do Brasil



1970

1960

1950


Populao do
Brasil

1940

0 20 40 60 80 100


Fonte: Dados Fictcios


Grfico em Setores

a representao grfica de uma srie estatstica em crculo, por meio de setores.
utilizado principalmente quando se pretende comparar cada valor da srie com o
total.
Exemplo:

Receita (em R$ 1.000.000,00) do Municpio X de 1975-77


Anos

Receita (em R$ 1.000.000,00)

1975

90

1976

120

1977


Total


Fonte: Departamento da Fazenda, Municpio X.


O total representado pelo crculo, que fica dividido em tantos setores quantas so
as partes. Os setores so tais que suas reas so respectivamente proporcionais
aos dados da srie.
PUC Minas Virtual 26 Probabilidade e Estatstica


Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando
que o total da srie corresponde a 360.

Total 360


Parte x




Para 1975: 360 - 360 Para 1976: 360 - 360 Para 1977: 360 - 360


90 - x


120 - x


150 - x


x = 90


x = 120


x = 150





Receita do Municipio X





1975
1976
1977





Fonte: Departamento da Fazenda, Municpio X


Grfico Polar

o grfico ideal para representar sries temporais cclicas, isto , sries que apre-
sentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a
variao da precipitao pluviomtrica ao longo do ano, ou da temperatura ao lon-
go do dia, o consumo de energia eltrica durante o ms ou o ano, etc.
PUC Minas Virtual 27 Probabilidade e Estatstica

Exemplo:

Movimento Mensal de Compras de uma agencia em 1972


Meses

Valores (R$1.000,00)

Janeiro

12

Fevereiro

13

Maro

14

Abril

12

Maio

15

Junho

19

Julho

17

Agosto

18

Setembro

14

Outubro

16

Novembro

12

Dezembro

18

Fonte: Departamento financeiro da Agncia (dados Fictcios)


Movimento Mensal de Compras de uma agencia em 1972







Nov


Out


Set


Dez
Jan
20
15
10
5
0


Fev




Mar


Abr


Mai

Ago


Jul
Jun




Fonte: Departamento financeiro da Agncia (dados Fictcios)
PUC Minas Virtual 28 Probabilidade e Estatstica



UNIDADE 2
Amostragem

2.1. Importncia da Amostragem
2.2. Conceitos Fundamentais
2.3. Amostragem Aleatria Simples
2.4. Amostragem Aleatria Estratificada
2.5. Amostragem por Conglomerado
2.6. Amostragem Sistemtica








Nesta unidade, veremos quais as tcnicas que podemos utilizar para
compor uma amostra. So objetivos especficos desta unidade:

Familiarizar o leitor com a terminologia empregada na pesquisa de
um fenmeno;
Identificar os fatores que afetam a quantidade de informaes de um
fenmeno;
Explicar como utilizar a Tabelas de Nmeros Aleatrios (TNA) para
selecionar amostras aleatrias.


2.1. Importncia da Amostragem


Na realizao de qualquer estudo, quase nunca possvel examinar todos os ele-
mentos da populao de interesse. Temos usualmente que trabalhar com uma
amostra da populao. A inferncia estatstica nos d elementos para generalizar,
de maneira segura, as concluses obtidas da amostra para a populao. Mas, para
as inferncias serem corretas, necessrio garantir que a amostra seja
representativa da populao, isto , a amostra deve possuir as mesmas
caractersticas bsicas da populao no que diz respeito ao fenmeno pesquisado.

errneo pensar que, caso tivssemos acesso a todos os elementos da populao,
seramos mais precisos. Os erros de coleta e manuseio de um grande nmero de
dados so maiores do que as imprecises a que estamos sujeitos quando generali-
zamos, via inferncia, as concluses de uma amostra bem selecionada.
PUC Minas Virtual 29 Probabilidade e Estatstica

Em se tratando de amostra, a preocupao central que ela seja representativa.
preciso que a amostra, ou as amostras que vo ser usadas sejam obtidas por pro-
cessos adequados.

Assim que decidimos obter informaes atravs de um levantamento amostral, te-
mos imediatamente dois problemas:

9 Definir cuidadosamente a populao de
interesse;

9 Selecionar a caracterstica que iremos
pesquisar.

Dados coletados de forma descuidada podem ser to inteis que nenhum proces-
samento estatstico consegue salv-los.


2.2. Conceitos Fundamentais


O conceito de populao intuitivo; trata-se do conjunto de indivduos ou objetos
que apresentam em comum determinadas caractersticas definidas para o estudo.

Amostra - um subconjunto da populao.


Amostragem - so procedimentos para extrao de amostras que repre-
sentem bem a populao.

Riscos - a margem de erro motivado pelo fato de investigarmos parcial-
mente (amostras) o universo (populao).

Populao-alvo - a populao sobre a qual vamos fazer inferncias ba-
seadas na amostra.

Para que possamos fazer inferncias vlidas sobre a populao a partir de uma a-
mostra, preciso que essa seja representativa. Uma das formas de se conseguir
representatividade fazer com que o processo de escolha da amostra seja, de al-
guma forma, aleatrio. Alm disso, a aleatoriedade permite o clculo de estimativas
dos erros envolvidos no processo de inferncia.

Quanto extrao dos elementos, as amostras podem ser:

Com reposio - quando um elemento sorteado puder ser sorteado novamente;

Sem reposio - quando o elemento sorteado s puder figurar uma nica vez na
amostra.

Basicamente, existem dois mtodos para composio da amostra: probabilstico e
PUC Minas Virtual 30 Probabilidade e Estatstica

no probabilstico (intencional).
PUC Minas Virtual 31 Probabilidade e Estatstica

O mtodo de amostragem probabilstica exige que cada elemento da populao
possua determinada probabilidade de ser selecionado. Normalmente, possuem a
mesma probabilidade. Assim, se N for o tamanho da populao, a probabilidade
de cada elemento ser 1/N. Somente com base em amostragens probabilsticas
pode-se realizar inferncias sobre a populao, a partir dos parmetros estuda-
dos na amostra. So elas:
Amostragem Aleatria Simples;

Amostragem Aleatria Estratificada;

Amostragem Sistemtica;

Amostragem por Conglomerado.


Por serem as principais tcnicas estudas, sero mais detalhadamente exploradas no
item 2.3.

Os mtodos no probabilsticos so amostragens em que h uma escolha delibe-
rada dos elementos que compem a amostra. No se pode generalizar os resul-
tados das pesquisas para a populao, uma vez que as amostras no probabils-
ticas no garantem a representatividade da populao. So elas:
Amostragem Acidental;

Amostragem Intencional;

Amostragem por Quotas.


Amostragem Acidental - formada por elementos que vo aparecendo, que so
possveis de se obter at completar o nmero de elementos da amostra.

Ex: Pesquisa de opinio, em que os entrevistados so acidentalmente escolhidos.


Amostragem Intencional - formada por elementos escolhidos por determinado
critrio, ou seja, escolhe-se intencionalmente um grupo de elementos que iro
compor a amostra.


Amostragem por Cotas - Classificao da populao em termos de propriedades
que se sabe serem relevantes para a caracterstica a ser estudada. Determinao
da proporo da populao para cada caracterstica com base na constituio co-
nhecida, ou estimada, da populao. Fixao de quotas para cada observador, ou
entrevistador, a quem tocar a responsabilidade de selecionar interlocutores ou
entrevistados, de modo que a amostra total observada, ou entrevistada, contenha a
proporo de cada classe.
PUC Minas Virtual 32 Probabilidade e Estatstica


2.3. Amostragem Aleatria Simples


A amostragem aleatria simples um processo para selecionar amostras de tama-
nho n dentre as N unidades em que foi dividida a populao. Sendo a amostra-
gem realizada sem reposio, que o caso mais comum, existem (N,n) possveis
amostras, todas igualmente provveis. As amostras aleatrias podem ser escolhi-
das por diversos mtodos, inclusive por tabelas de nmeros aleatrios (TNA) e de
computadores para gerar nmeros aleatrios Na prtica, a amostra aleatria sim-
ples escolhida unidade por unidade. As unidades da populao so numeradas de
1 a N. Em seguida, escolhe-se, na tabela de nmeros aleatrios (TNA), (ou por
computador) n nmeros compreendidos entre 1 e N. Esse processo equivalente a
um sorteio no qual se colocam todos os nmeros misturados dentro de uma urna.
As unidades correspondentes aos nmeros escolhidos formaro a amostra.

Observao:


1. Um exemplo de TNA encontra-se no final da unidade 2.


2. A TNA (Tabela de Nmeros Aleatrios) consiste em tabelas que apresen-
tam seqncias dos dgitos de 0 a 9 distribudos aleatoriamente nas li-
nhas(horizontais) e colunas (verticais). Para obtermos os elementos da
amostra usando a TNA, sorteamos uma linha e uma coluna qualquer para
comearmos a leitura. Por exemplo: escolho 3 linha 15 coluna o digito
encontrado 5. A leitura da tabela pode ser feita horizontalmente (da direi-
ta para a esquerda ou vice-versa), verticalmente (de cima para baixo ou vi-
ce-versa), diagonalmente (no sentido ascendente ou descendente). A op-
o, porm, deve ser feita antes de iniciado o processo.

Assim, em nossos exerccios, avaliaes e trabalhos, utilizaremos sempre a TNA
lendo na vertical, de cima para baixo, considerando sempre as colunas da
esquerda para a direita.

Exemplo de utilizao da TNA


Procure os 10 primeiros nmeros na TNA comeando a leitura na 9 li-
nha e na 5 coluna (lembre-se que cada dgito representa uma coluna.
(Resposta: 1, 0, 0, 1, 8, 4, 7, 0, 1, 3)


3. Para retirar amostras em populaes com mais de 10 itens, necessitaremos ler
as colunas quantos dgitos comporem o nmero total de itens da populao. E-
xemplo: para retirarmos 5 amostras de uma populao com 300 itens, temos
PUC Minas Virtual 33 Probabilidade e Estatstica

que ler trs colunas para conseguirmos valores entre 001 e 300. Se o nmero
sorteado superar o nmero de elementos rotulados, abandona-se o nmero sor-
teado, prosseguindo-se o processo. Considerando 9 linha e 5 coluna temos
como resposta : 124,056,094,143,014.

Outras tcnicas de amostragem so preferveis aleatria simples, pois levam
em considerao a composio da populao, facilitando o trabalho de seleo
de amostras e aumentando a preciso.

Exemplo:


Vamos obter uma amostra representativa de 8 itens para a pesquisa da
estatura de noventa alunos de uma escola. Utilize a TNA (3 linha e 8
Coluna).

Resoluo:

Numeramos os alunos de 01 a 90;

Iniciamos o processo de sorteio dos itens da amostra na TNA conside-
rando as colunas 8 e 9, pois 90 so dois dgitos;
A amostra ser os alunos correspondentes aos nmeros: 46, 58, 16,
51, 88, 09, 89, 14.


2.4. Amostragem Aleatria Estratificada


Uma amostra estratificada obtida separando-se as unidades da populao em
grupos no superpostos chamados estratos, e selecionando-se independentemente
uma amostra aleatria simples de cada estrato. Existem dois tipos de amostragem
estratificada:

De igual tamanho;

Proporcional.


No primeiro tipo, sorteia-se igual nmero de elementos em cada estrato. Esse pro-
cesso utilizado quando o nmero de elementos por estrato for aproximadamente
o mesmo.
PUC Minas Virtual 34 Probabilidade e Estatstica


No outro caso, utiliza-se a amostragem estratificada proporcional, cujo processo de
calcular o nmero de amostras por estrato :


N N de unidades da populao
n N de unidades das amostras
N
a
N de unidades do estrato A
n
a
N de amostras de A

N
a
=
n
a

N n


n
a


n

= .N
a

N




Exemplo:


Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam me-
ninos e 36 sejam meninas, vamos obter uma amostra proporcional es-
tratificada de 10%.

Resoluo:

So, portanto, dois estratos (sexo masculino e feminino) e queremos
uma amostra de 10% da populao;
Calcula-se o nmero de amostras de cada estrato.




Sexo

Populao

10%

Nmero de amostras

M


F

54


36

5,4


3,6

5


4

Total

90

9,0

9




Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspon-
dem meninos e de 55 a 90, meninas. O prximo passo o mesmo do
exemplo anterior.
PUC Minas Virtual 35 Probabilidade e Estatstica

2.5. Amostragem por Conglomerado


Uma amostra por conglomerado uma amostra aleatria simples na qual cada uni-
dade de amostragem um grupo, ou um conglomerado de elementos.

O primeiro passo na amostragem por conglomerado especificar conglomerados
apropriados. Os elementos em um conglomerado tendem a ter caractersticas simi-
lares, portanto, o fato de novas medidas serem tomadas num conglomerado no
implica necessariamente aumento de informao sobre o parmetro populacional.
Como regra geral, o nmero de elementos num conglomerado dever ser pequeno
em relao ao tamanho da populao e o nmero de conglomerados dever ser
razoavelmente grande.

Na amostragem por conglomerado a populao dividida em grupos. E selecionam-
se amostras aleatrias simples de grupos e, ento, todos os itens dos grupos (con-
glomerados) selecionados faro parte da amostra.


Exemplo:


Em um levantamento da populao de uma cidade, podemos dispor do
mapa indicando cada quarteiro e no dispor de uma relao atualizada
dos seus moradores. Pode-se, ento, colher uma amostra dos quartei-
res e fazer a contagem completa de todos os que residem naqueles
quarteires sorteados.


2.6. Amostragem Sistemtica


Quando os elementos da populao j se encontram ordenados, no h necessida-
de de se construir o sistema de referncia. Nesses casos, a seleo dos elementos
que constituiro a amostra pode ser por um sistema imposto pelo pesquisador.

Em geral, para se obter uma amostra sistemtica de n elementos de uma popula-
o de tamanho N, K deve ser menor ou igual a N/n. No possvel determinar K,
precisamente, quando o tamanho da populao desconhecido, mas pode-se supor
um valor de k de tal modo que seja possvel obter uma amostra de tamanho n. Em
vez da amostragem aleatria simples, pode-se empregar a amostragem sistemtica
pelas seguintes razes:

a amostragem sistemtica mais fcil de se executar e, por isso, est menos
sujeita a erros do entrevistador do que aqueles que acontecem na aleatria sim-
ples;
PUC Minas Virtual 36 Probabilidade e Estatstica


a amostragem sistemtica freqentemente proporciona mais informaes por
custo unitrio do que a aleatria simples.


Diretrizes para calcular as amostras:


1 - Estabelecer o intervalo de amostragem K:

K =
N

n

OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.


2 - Iniciar aleatoriamente a composio da amostra.

b inicio (n de ordem inicial sorteado na TNA).

OBS:
0 < b o K

3 - Composio da Amostra:

1 item b

2 item b + K

3 item b + 2k


Exemplo:

1 Suponhamos uma rua contendo quinhentos prdios, dos quais dese-
jamos obter uma amostra formada de vinte prdios. (TNA, 3Linha e 5
Coluna)

Soluo:

a) Calcular K (intervalo de amostragem)

b) K=500/20, K=25

c) b= 12 (valor encontrado na TNA)

d) Composio da amostra
1 item 12

2 item 12 + 25 = 37

3 item 12 + 2*25 = 62

20 item 12 +19*25 = 487
PUC Minas Virtual 37 Probabilidade e Estatstica

Tabela de Nmeros Aleatrios


COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49

LINHA
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969
PUC Minas Virtual 38 Probabilidade e Estatstica



UNIDADE 3
Distribuio de Freqncia

3.1. Conceitos
3.2. Elementos de uma distribuio de freqncia: amplitude total,
limites de classe, amplitude do intervalo de classe, ponto
mdio da classe, freqncia absoluta, relativa e acumulada
3.3. Regras Gerais para a elaborao de uma distribuio
de freqncia
3.4. Grficos representativos de uma distribuio de freqncia:
histograma, polgono de freqncia e ogiva






Vamos considerar, nesta unidade, o estudo detalhado da distribuio de
freqncia, que a forma pela qual podemos descrever os dados esta-
tsticos resultantes de variveis quantitativas. So objetivos desta uni-
dade:

Compor uma distribuio de freqncia com ou sem intervalos de
classe;
Determinar o quadro de freqncias, eles so teis para condensar
grandes conjuntos de dados, facilitando o sua utilizao;
Representar uma distribuio de freqncia atravs de histograma,
polgono e ogiva.


3.1. Conceitos


Ao analisarmos um conjunto de dados, devemos determinar se temos uma amos-
tra ou uma populao. Essa determinao afetar no somente os mtodos utiliza-
dos, mas tambm as concluses, pois se estamos trabalhando com uma amostra os
resultados encontrados so estimativas da populao.

Nem sempre possvel compreender o significado contido numa amostragem por
simples inspeo visual dos dados numricos coletados. Entretanto, entendemos
que o sucesso de uma deciso depender da nossa habilidade em compreender as
informaes contidas nesses dados. O objetivo deste estudo mostrar a organiza-
o, apresentao e anlise grfica de uma srie de dados, matria prima das dis-
tribuies de freqncias e dos histogramas. Freqncia de uma observao o
PUC Minas Virtual 39 Probabilidade e Estatstica

nmero de repeties dessa observao, ou seja, quantas vezes determinado fe-
nmeno acontece.

Os dados podem ser classificados como:

Dados brutos so os dados originais, que ainda no se encontram prontos
para anlise, por no estarem numericamente organizados. (Tambm so co-
nhecidos como Tabela Primitiva).



Exemplo: Nmero mensal de aparelhos defeituosos na Empresa X.






J

F

M

A

M

J

J

A

S

O

N

D

1995

6

2

5

1

0

3

2

1

3

5

5

3

1996

5

4

2

1

3

4

1

4

5

4

0

1

1997

3

1

2

4

3

1

4

1

0

3

0

2

1998

2

2

0

3

1

4

2

0

1

1

5

2




Rol so os dados brutos, organizados em ordem crescente ou decrescente.



Exemplo: Considerando o exemplo anterior temos:




0

0

0

0

0

0

1

1

1

1

1

1

1

1

1

1

1

2

2

2

2

2

2

2

2

2

3

3

3

3

3

3

3

3

4

4

4

4

4

4

4

5

5

5

5

5

5

6
PUC Minas Virtual 40 Probabilidade e Estatstica


Dados discretos a varivel discreta quando assume valores em pontos da
reta real.

Exemplo: nmero de erros em um livro: 0,1,2,3,4,....
nmero de filhos de vrios casais: 1,2,3,4,.....
quantidade de acidentes em determinada rodovia: 4,10,12,15,....

Dados contnuos a varivel pode assumir, teoricamente, qualquer valor em
certo intervalo da reta real.

Exemplo: peso de alunos: 55,5 kg; 61,0kg; 63,4 kg; 68,1 kg.......
distncia entre cidades: 35,5 km; 48,6 km; 100,10 km; ....



Dados Tabelados no agrupados em classes os valores da varivel apare-
cem individualmente.

Exemplo, considerando os dados da tabela anterior:





N de aparelhos
com defeitos

N de meses

0

06

1

11

2

09

3

08

4

08

5

05

6

01

Total

48
PUC Minas Virtual 41 Probabilidade e Estatstica

Dados Tabelados agrupados em classes - os valores da varivel no apare-
cem individualmente, mas agrupados em classes.





Notas

N de alunos

0 |--- 20

020

20 |--- 40

065

40 |--- 60

230

60 |--- 80

160

80 |--- 100

025

Total

580



3.2. Elementos de uma distribuio de freqncia:
amplitude total, limites de classe, amplitude do intervalo de classe,
ponto mdio da classe, freqncia absoluta, relativa e acumulada


3.2.1. Amplitude total (A) - a diferena entre o maior e o menor nmero
do rol.

Exemplo: Estatura de 40 alunos do Colgio A em cm. (Dados ordenados
em ordem crescente, por colunas)




150 154 155 157 160 161 162 164 166 169

151

155

156

158

160

161

162

164

167

170

152

155

156

158

160

161

163

164

168

172

153

155

156

160

160

161

163

165

168

173



A = 173 150 = 23
PUC Minas Virtual 42 Probabilidade e Estatstica


3.2.2. Nmero de classes (K) e Classe (i) no existe regra fixa para se
determinar o nmero de classes. Podemos utilizar:

A Regra de Sturges, que nos d o nmero de classes em funo do nmero de
valores da varivel:

K = 1 + 3,3. log n
, onde n o nmero de itens que compe a amostra;



Ou

K = 5



para n o 25 e k E



n , para n > 25.

Exemplo: considerando o exemplo anterior n=40

Pela formula de Sturges: K= 1+3,3log40 = 6,28 K=6

Adotando K =

n , temos k =

40 =6,3 K=6


3.2.3. Amplitude de um intervalo de classe (h) ou simplesmente inter-
valo de classe a medida do intervalo que define a classe.

h = A / K


Exemplo, considerando o exemplo anterior:


H = 23/ 6 = 3,83 h = 4


3.2.4. Limites de Classe denominamos limites de classe os extremos de
cada classe. Assim temos:

limite inferior (l
inf
) e

limite superior (L
sup
)


Observao: Vamos trabalhar com intervalos fechados esquerda e abertos
direita; isso significa que valores iguais ou superiores ao limite inferior so conside-
rados nessa classe e valores iguais e/ou superiores ao limite superior so conside-
rados na classe abaixo.
PUC Minas Virtual 43 Probabilidade e Estatstica

Exemplo: Do exemplo anterior, temos:



i


Classes


n


1

2

3

4

5

6


150 , 154

154 , 158

158 , 162

162 , 166

166 , 170

170 , 174


4

9

11

8

5

3







40




Na segunda classe, temos:

L
2
=158

l
2
= 154

3.2.5. Ponto Mdio da Classe - (x
i
) , como o prprio nome indica, o
ponto que divide o intervalo de classe em duas partes iguais. Para
obtermos o ponto mdio de uma classe, calculamos:


l
inf

x
i
=

+ L
sup
2


Exemplo: considerando a segunda classe do exemplo anterior, temos:


x
2
=
154 + 158
2

= 156

x
2
=

156


3.2.6. Freqncias

Freqncias simples ou absoluta da classe i (n
i) - so os valores que real-
mente representam o nmero de dados de cada classe. A soma das freqncias
simples igual ao nmero total dos dados.

Exemplo: considerando a segunda classe do exemplo anterior, temos:
n
2
= 9 .
PUC Minas Virtual 44 Probabilidade e Estatstica

N

Freqncias relativas (f
i
) so os valores das razes entre as freqncias
simples e o nmero total de dados.

n
i

f
i
=
n

Exemplo: considerando a segunda classe do exemplo anterior, temos:
f
2
= 9/40=0,225 .


Obs: as freqncias relativas permitem a anlise ou facilitam as
comparaes.

Freqncia acumulada (Ni) o total das freqncias de todos os valores
inferiores ao limite superior do intervalo de uma dada classe:

Exemplo: Considerando a freqncia acumulada da quarta classe (N
4
),
temos:

N
4
= n
1
+n
2
+n
3
+n
4
= 4+9+11+8 = 32

Freqncia acumulada relativa (F
i
) a freqncia acumulada da classe,
dividida pela freqncia total da distribuio.


F
i
=
i

n

Exemplo: para o exemplo anterior, F
4
= 0,8 .


NOTA Usualmente, denominamos:

9 Freqncia relativa acumulada crescente da classe i F
i.



Obs: F
i
pode ser entendido como sendo a percentagem de observaes abaixo
do limite superior da classe i.

9
Freqncia relativa acumulada decrescente da classe i F
i.


Obs: F
i
e a porcentagem de observaes acima do limite inferior da classe i.
PUC Minas Virtual 45 Probabilidade e Estatstica

3.3. Regras Gerais para a elaborao de uma distribuio de freqncia


Os principais estgios na construo de uma distribuio de freqncia para dados
amostrais so:

1. Encontrar a amplitude total do conjunto de valores observados;


2. Escolher o nmero de classes;


K = 1 + 3,3logn ou k = n

3. Determinar a amplitude do intervalo de classe;

h =
A

k

4. Determinar os limites de classe;


5. Construir a tabela de freqncias.


Exemplo:


Calcule as freqncias e o ponto mdio dos dados abaixo:


Alturas de 50 estudantes do sexo masculino da Univesidade XYZ


33

35

35

39

41

41

42

45

47

48

50

52

53

54

55

55

57

59

60

60

61

64

65

65

65

66

66

66

67

68

69

71

73

73

74

74

76

77

77

78

80

81

84

85

85

88

89

91

94

97




Soluo: Amplitude : A = 97-33 = 64

Nmero de Classes : K =

50 E 7

Intervalo de classe : h =64/7 10
PUC Minas Virtual 46 Probabilidade e Estatstica



i


Classes


n


N
i



f
i



F
i



x
j


1

2

3

4

5

6

7


30 , 40

40 , 50

50 , 60

60 , 70

70 , 80

80 , 90

90 ,100


4

6

8

13

9

7

3


4

10

18

31

40

47

50


0,08

0,12

0,16

0,26

0,18

0,14

0,06


0,08

0,20

0,36

0,62

0,80

0,94

1,0


35

45

55

65

75

85

95






50


1




3.4. Grficos representativos de uma distribuio de freqncia:
histograma, polgono de freqncia e ogiva


Uma distribuio de freqncia pode ser representativa graficamente pelo histo-
grama, pelo polgono de freqncia e pelo polgono de freqncia acumulada (Ogiva
de Galton).

Histograma formado por um conjunto de retngulos justapostos, cujas bases
se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coinci-
dem com os pontos mdios dos intervalos de classe.

As larguras dos retngulos so iguais s amplitudes dos intervalos de classe.

As alturas dos retngulos devem ser proporcionais s freqncias das classes,
sendo igual a amplitude dos intervalos.

Histograma
n
i


12



8



4




30 40 50 60 70 80 90 100
PUC Minas Virtual 47 Probabilidade e Estatstica

Polgono de freqncia um grfico em linha, sendo as freqncias marcadas
sobre perpendiculares ao eixo horizontal, levantada pelos pontos mdios dos inter-
valos de classe.

Para realmente obtermos um polgono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira
e da posterior ltima, da distribuio.


Polgono de Freqncia

ni

12



8




4




35 45 55 65 75 85 95
Ponto mdio


Polgono de freqncia acumulada traado marcando-se as freqncias a-
cumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos corres-
pondentes aos limites superiores dos intervalos de classe.

Polgono de Freqncia Acumulada

F

50

47

40


31


18


10

4

30 40 50 60 70 80 90
100
classes
PUC Minas Virtual 48 Probabilidade e Estatstica


Observao: Uma distribuio de freqncia sem intervalos de classe
representada graficamente por um diagrama onde cada valor da varivel
representado por um segmento de reta vertical e de comprimento proporcional
respectiva freqncia.




ni

12



8



4




1 2 3 4 5 6
xi

PUC Minas Virtual 49 Probabilidade e Estatstica


UNIDADE 4
Medidas de Posio

4.1. Introduo
4.2. Mdia aritmtica simples e ponderada e suas propriedades
4.3. Moda: Dados agrupados e no agrupados em classes
4.4. Mediana: Dados agrupados e no agrupados em classes
4.5. Mdia Geomtrica: Dados agrupados
e no agrupados em classes
4.6. Mdia Harmnica: Dados agrupados
e no agrupados em classes
4.7. Separatrizes: Quartis, Decis e Percentis




Nesta unidade, veremos as tendncias caractersticas de cada distribui-
o, destacando as medidas de posio central, que recebem tal deno-
minao pelo fato de os dados observados tenderem, em geral, a se a-
grupar em torno dos valores centrais. So objetivos desta unidade:

Calcular as medidas de posio central;

Diferenciar as medidas - moda, mdia e mediana;

Utilizar as separatrizes para melhor interpretar os resultados.


4.1. Introduo


Nas sees anteriores, vimos a sintetizao dos dados sob a forma de tabelas, gr-
ficos e distribuies de freqncias. Agora, vamos destacar o clculo das medidas
que possibilitam localizar a maior concentrao de valores de uma dada distribui-
o, isto , se ela se localiza no incio, no meio ou no final, ou, ainda, se h uma
distribuio por igual. Tais medidas possibilitam comparaes de sries de dados
entre si pelo confronto desses nmeros.

No entanto, para ressaltar as tendncias caractersticas de cada distribuio, isola-
damente, ou em confronto com outras, necessitamos introduzir os elementos tpi-
cos da distribuio, que so:

Medidas de posio;

Medidas de variabilidade ou disperso;

Medidas de assimetria;

Medidas de curtose.
PUC Minas Virtual 50 Probabilidade e Estatstica


As medidas de posio mais importantes so as medidas de tendncia central, que
destacamos:

A mdia aritmtica;

A mediana;

A moda.


As outras medidas de posio so as separatrizes, que englobam:

A mediana;

Os quartis;

Os decis;

Os percentis.


Primeiramente, vamos estudar as principais medidas de tendncia central, depois
veremos as separatrizes e, na prxima unidade, as medidas de Disperso, Assime-
tria e Curtose.


4.2. Mdia aritmtica simples e ponderada e suas propriedades

o quociente da diviso da soma dos valores da varivel pelo nmero deles. A m-
dia (aritmtica) , de modo geral, a mais importante de todas as medidas descriti-
vas.

Dados no tabelados

n

x
i
x =
i =1

n
x
i
: valor observado
n : nmero total de observaes

Exemplo: Suponha que o tempo de vida til de 10 aparelhos de telefone so:
10 29 26 28 15 23 17 25 0 20. Qual a mdia de vida til
destes aparelhos?

Soluo:

X

= 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193
x =

x
=
193
= 19,3 ,

n 10
portanto mdia de vida til dos aparelhos so 19,3 anos.
PUC Minas Virtual 51 Probabilidade e Estatstica

Dados Tabelados

Sem intervalo de Classe


n

x
i
n
i
x =
i =1

n

X
i
: valor observado
n
i
: n de observaes por classe

n : n de observaes totais


Com intervalo de Classe

n

x
i
n
i
X =
i =1

n



x
i
: ponto mdio da classe
n
i
: n de observaes


s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados
que ela representa.


4.3. Moda (M
o
): Dados agrupados e no agrupados em classes


o valor que ocorre com maior freqncia em um conjunto de dados, e que de-
nominado valor modal. Baseado nesse contexto, um conjunto de dados pode apre-
sentar mais de uma moda. Nesse caso, dizemos ser multimodais; caso contrrio,
quando no existe um valor predominante, dizemos que amodal.

Dados no tabelados: o valor modal o predominante na distribuio.


Exemplo: Nos valores abaixo, qual o valor modal?

3 4 4 5 6 7 8 9 9 9 10 11 12 13

Soluo: M
o
= 9


Dados tabelados

Sem intervalo de Classe: O valor modal o valor que possuir maior freqn-
cia.

Exemplo:

Classes

0

1

2

3

4

5

6


PUC Minas Virtual 52 Probabilidade e Estatstica



N

06

11

09

08

08

05

01

48

Soluo: o valor predominante o nmero 1, que ocorreu 11 vezes.
Temos, portanto, M
o
=1.

Com intervalo de classe: tratando-se de dados agrupados em classe, a moda
no percebida to facilmente como nos casos anteriores. Para calcular o va-
lor modal nesses casos, podemos utilizar os seguintes processos:

1 Processo: Frmula de Czuber



Mo = l

inf

+ h
Mo
(n

n
mo
n
ant
n ) + (n n )

mo ant mo post




onde constatamos:

Classe Modal: Classe de maior freqncia
n
mo:
freqncia simples da classe modal
n
ant
: freqncia simples anterior classe modal


n
post
: freqncia simples posterior classe modal
l
inf
: limite inferior da classe modal
h
Mo
: intervalo de classe modal




2 Processo: Frmula de Pearson


M
o
= 3Md 2 X



onde constatamos:

M
d
= Mediana
X = Mdia
PUC Minas Virtual 53 Probabilidade e Estatstica
Md

Exemplo - Determinar a moda para a distribuio:




Classes

0|--- 1

1|--- 2

2|--- 3

3|--- 4

4|--- 5



n
i


3

10

17

8

5

43




Soluo: Utilizando a frmula de Czuber

a classe modal a classe 2|----3

l
inf
= 2

h
Mo
= 1

n
Mo
= 17

n
ant
= 10

n
post
=8


Substituindo esses valores na frmula, encontramos: M
o
= 2,44


4.4. Mediana (M
d
): Dados agrupados e no agrupados em classes


A mediana uma medida de posio. , tambm, uma separatriz, pois divide o
conjunto em duas partes iguais, com o mesmo nmero de elementos. O valor da
mediana encontra-se no centro da srie estatstica organizada, de tal forma que o
nmero de elementos situados antes desse valor (mediana) igual ao nmero de
elementos que se encontram aps esse mesmo valor (mediana).

Dados no tabelados

Para uma srie com nmero mpar de itens: a mediana corresponde ao valor
central.

E
Md -
elemento mediano: indica a posio da mediana.


n mpar
E
Md
= (n+1)/2

Md = X
(E )



A mediana ser o termo de ordem (n+1)/2.
PUC Minas Virtual 54 Probabilidade e Estatstica

(E
Md

Para uma srie com nmero par de itens: no h termo central nico, mas,
sim, dois termos centrais. A mediana ser dada por:

n par
E
Md
= n/2

Md =
X
Md
)
+ X
(E
2

+1)


A mediana ser a mdia aritmtica entre os termos centrais.


Dados tabelados:


Neste caso, o problema consiste em determinar o ponto do intervalo em que est
compreendida a mediana.

Sem intervalo de classe: devemos, primeiro, obter a localizao da mediana
na srie atravs do termo de ordem:

n

E
MD
=
2

Uma vez localizada a posio da mediana, devemos verificar o valor numrico da
varivel correspondente a essa posio.

Com intervalo de classe: localizada a classe mediana, calculamos o valor da
mediana pela frmula:





Md = l
inf


n

2

+ h
Md


N
ant
n
Md




onde temos:

l
inf
: limite inferior da classe mediana.
h
Mo
: intervalo de classe mediana.
n
Md
: freqncia simples absoluta na classe mediana.


N
ant
: freqncia acumulada absoluta anterior classe mediana.
Classe Mediana: classe onde est o elemento mediano.
PUC Minas Virtual 55 Probabilidade e Estatstica
x
n n
x
n n
=
n

4.5. Mdia Geomtrica (M
G
): Dados agrupados e no agrupados em classes


Dados no tabelados

A mdia geomtrica de um conjunto de N nmeros x
1
, x
2
,x
3
,
......x
n
a raiz de or-
dem N do produto desses nmeros:


M
G
=
N

x
1
.x
2
.

x
3
.....x
n




Dados agrupados

Sem intervalo de classe


M
G
=
N


1
1
x
2
2


3
3
....x
n
n

X
i
: valor observado
n
i
: n de observaes da classe




Com intervalo de classe


M
G
=
N


x
1
n
1


x
2
n
2


x
3
n
3


....x
n
n
n

x
i
: ponto mdio
n
i
: n de observaes






4.6. Mdia Harmnica (M
h
): Dados agrupados e no agrupados em classes

Sejam x
1
, x
2
, x
3,
......x
n
, valores de x, associados s freqncias absolutas n
1
, n
2
,
n
3
,......n
n
, respectivamente.

A mdia harmnica de X definida por:



Mh =


n
1
+
n
2
n
+
n
3
+



........



+
n
n
n

n
i
x
1
x
2
x
3

x
n i =1
x
i




Para dados no agrupados n = 1.

Para dados agrupados sem intervalo de classe x
i
o valor da varivel.

Para dados agrupados com intervalo de classe x
i
o ponto mdio da classe.
PUC Minas Virtual 56 Probabilidade e Estatstica

Q Q
Q Q
D

1 3
n
K

4.7. Separatrizes: Quartis, Decis e Percentis


So valores que ocupam determinados lugares de uma distribuio de freqncia.
Podemos classific-las em:


Quartis: dividem a distribuio em 4 partes iguais

Q
i
= quartil i=1,2,3

Q
1
= 1 quartil, valor situado de tal modo na srie que uma quarta parte (25%)
dos dados menor que ele e as trs quartas partes restantes (75%) so maio-
res.
Q
2
= 2 quartil, evidentemente, coincide com a Mediana (Q
2
= Md).
Q
3
= 3 quartil, valor situado de tal modo que as trs quartas partes (75 %) dos
termos so menores que ele e uma quarta parte 25 % maior.



Q = l
1
n

N
+

4

|

ant
|
.
.h



Q = l
3
3n


+

4

|

N
ant
|
.
.h

n
1 3


Onde temos:

l
inf
: limite inferior da classe do quartil considerado
h
Q
: intervalo de classe do quartil considerado
n
Q
: freqncia simples absoluta do quartil considerado


N
ant
: freqncia acumulada anterior classe do quartil considerado


Decis: dividem a distribuio em 10 partes iguais

D
i
= decil i=1,2,3, , 9


9 1 Passo: Calcula-se em que K = 1,2,3,......,9;

9 2 Passo: Identifica-se a classe D
K
, pela N
ac
;


9 3 Passo: Aplica-se a frmula:




D = l
K

KN


+

10

n


|

N
( ant )
|
.
h
l
DK
: limite inferior da Classe D
k

N : tamanho da amostra
h : amplitude da classe
n
DK:
freqncia da classe
D
K
N
(ant):
freqncia acumulada da classe
PUC Minas Virtual 57 Probabilidade e Estatstica
P
P
K

Percentis: : dividem a distribuio em 100 partes iguais.
P
i
= centil i=1,2,3, , 99
9 1 Passo: Calcula-se em que K = 1,2,3,4,............98,99

9 2 Passo: Pela N
ac
identifica-se a classe P
i


9 3 Passo: Aplica-se a frmula




=
KN

100


|

N
( ant )
|

l
PK
: limite inferior da classe
em que, K = 1,2,3,...,98,99.
N : tamanho da amostra
P = l
K
+
.
h
n
K
N
(ant):
freqncia acumulada anterior classe

h : amplitude da classe
n
PK
: freqncia da classe



Exemplo:


1- Num acampamento infantil, foram obtidas as seguintes estaturas:


Estaturas

120|--- 128

128|---136

136|--- 144

144|--- 152

152|--- 160

frequencia

6

12

16

13

7

Calcule:


a) O 1 Quartil (Q
1
);
b) o 4 Decil (D
4
);
Soluo:
Primeiro vamos estruturar a tabela de distribuio de Freqncias, como esta-
mos trabalhando com intervalos de classe , temos que calcular os pontos m-
dios de cada classe. Depois iremos utilizar as frmulas para cada item que que-
remos calcular.
PUC Minas Virtual 58 Probabilidade e Estatstica

Q
Q
1




i

Estaturas (cm)

n

N

X
i
(Ponto mdio)


1


2


3


4


5

120|--- 128


128 |--- 136


136 |--- 144


144 |--- 152


152 |--- 160

6


12


16


13


7

6


18


34


47


54

124


132


138


148


156



Total

54


a) Calculo de Q
1
,

Para calcular Q
1
, temos que primeiro identificar a classe que esta o valor, para
isto consideramos :

N
=
54
= 13,5 , que vamos neste momento arredondar para 14, pela frequencia

4 4
acumulada procuramos a classe que encontra o 14 elemento, que a 2 classe
com limites de 128 |--- 136.

Agora usamos a formula para calcular Q
1







Onde:



Q = l
1

n

N
+

4

n
1

|

ant
|
.
.h

l
inf
: limite inferior da classe do quartil considerado = 128
h
Q
: intervalo de classe do quartil considerado = 8
n
Q
: freqncia simples absoluta do quartil considerado = 12


N
ant
: freqncia acumulada anterior classe do quartil considerado =6

Substituindo estes valores na expresso acima temos
(13,5 6)

Q
1
= 128 +
12
* 8 = 133
PUC Minas Virtual 59 Probabilidade e Estatstica

D K

b) Calculo de D
4


Primeiro identificamos a classe que esta o valor;
KN
=
4x54
= 21,6 = 27 , atravs da freqncia acumulada identificamos a clas-

10 10
se que encontra o 27 , que a 3 classe com limites de 136 |--- 144

Agora usamos a frmula

KN


10
|

N
( ant )
|

D = l
K
+
.
h
n

D
K


onde:

l
DK
: limite inferior da Classe D
k = 136

N : tamanho da amostra = 54
h : amplitude da classe = 8
n
DK:
freqncia da classe = 16
N
(ant):
freqncia acumulada da classe anterior = 18


Substituindo estes valores na expresso acima temos:
(21,6 18)

D
4
= 136 +
16
* 8 = 137,8
PUC Minas Virtual 60 Probabilidade e Estatstica



UNIDADE 5
Medidas de Disperso

5.1. Disperso
5.2. Assimetria
5.3. Curtose












A interpretao de dados estatsticos exige que se realize um nmero
maior de estudos, alm das medidas de posio. Nesta unidade, vere-
mos que as medidas de disperso servem para verificar a representati-
vidade das medidas de posio, que o nosso principal objetivo.


5.1. Disperso


So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou disper-
so, dos valores em torno da mdia. Servem para medir a representatividade da
mdia.


Absoluta

Amplitude (A)

Varincia (S
2
)

Desvio padro (S)


Relativa

Coeficiente de Variao (CV)
PUC Minas Virtual 61 Probabilidade e Estatstica
.


Amplitude Total (A)


a diferena entre o maior e o menor dos valores da srie. A utilizao da amplitu-
de total como medida de disperso muito limitada, pois sendo uma medida que
depende apenas dos valores externos, instvel, no sendo afetada pela disperso
dos valores internos.


Varincia (S
2
)


A varincia leva em considerao os valores extremos e os valores intermedirios,
isto , expressa melhor os resultados obtidos. A varincia relaciona os desvios em
torno da mdia, ou, mais especificamente, a mdia aritmtica dos quadrados dos
desvios.

Dados Brutos Dados Agrupados

n _
x
2
n


2

x n |
( x
i

x)
2

S
2
=


i i



i i
|

S
2
=
i =1
n 1
n 1

n 1
|



Onde temos que:

Para dados agrupados sem intervalo de classe, x
i
o valor da varivel.

Para dados agrupados com intervalo de classe, x
i
o ponto mdio da classe.


Para dados amostrais, o denominador n-1; para dados
populacionais, usamos no denominador o valor de n.



Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero
em unidade quadrada em relao varivel em questo, o que, sob o ponto de
vista prtico, um inconveniente; por isso, tem pouca utilidade na estatstica des-
critiva, mas extremamente importante na inferncia estatstica e em combinaes
de amostras.
PUC Minas Virtual 62 Probabilidade e Estatstica


Desvio Padro (S)

O desvio-padro a medida mais usada na comparao de diferenas entre conjuntos de
dados, por ter grande preciso. O desvio padro determina a disperso dos valores em rela-
o mdia e calculado por meio da raiz quadrada da varincia.


S = S
2






Coeficiente de Variao (CV)


Trata-se de uma medida relativa de disperso til para a comparao em termos
relativos do grau de concentrao. O coeficiente de variao a relao entre o
desvio padro (S) e a mdia x .

CV =
S

x



Diz- se que uma distribuio tem:

Baixa disperso: CV o 15%
Mdia disperso: 15%< CV<30%
Alta disperso: CV c 30%

5.2. Assimetria


Estas medidas referem-se forma da curva de uma distribuio de freqncia,
mais especificamente do polgono de freqncia ou do histograma.

Denomina-se assimetria o grau de afastamento de uma distribuio da unidade de
simetria.

Em uma distribuio simtrica, tem-se igualdade dos valores da mdia, mediana
e moda.
PUC Minas Virtual 63 Probabilidade e Estatstica

Simetria







X = Mo = Md




Toda distribuio deformada sempre assimtrica. Entretanto, a assimetria pode
dar-se na cauda esquerda ou na direita da curva de freqncias.

Em uma distribuio assimtrica positiva, ou assimetria direita, tem-se:


Assimetria direita (ou positiva)

Mo < Md < X




Mo Md
X







Em uma distribuio assimtrica negativa, ou assimetria esquerda,
predominam valores inferiores Moda.

Assimetria esquerda (ou negativa)


X < Md < Mo










X
Md Mo
PUC Minas Virtual 64 Probabilidade e Estatstica


Existem vrias frmulas para o clculo do coeficiente de assimetria. As mais utiliza-
das so:

1 Coeficiente de Pearson


AS =
x Mo
S
M
o
: valor modal (moda)
S : Desvio padro
X : Mdia



2 coeficiente de Pearson

AS =
Q
1
+ Q
3
2Md

Q
3
Q
1



Q
1
: valor do 1 Quartil
Q
3
: valor do 3 Quartil
M
d
: valor da Mediana

Quando


AS = 0, diz-se que a distribuio simtrica.



AS > 0, diz-se que a distribuio assimtrica positiva ( direita)



AS > 0, diz-se que a distribuio assimtrica positiva ( direita)




5.3. Curtose


Curtose o grau de achatamento (ou afilamento) de uma distribuio em comparao com
uma distribuio padro (chamada curva normal). De acordo com o grau de curtose, classifi-
camos trs tipos de curvas de freqncia:

Mesocrtica: uma curva bsica de referncia chamada curva padro ou curva normal;
PUC Minas Virtual 65 Probabilidade e Estatstica


Platicrtica: uma curva mais achatada (ou mais aberta) que a curva normal;













Leptocrtica: uma curva mais afilada que a curva normal;














Para medir o grau de curtose utiliza-se o coeficiente:


K =
Q
3
Q
1

2(P
90
P
10
)

Q
1
: valor do 1 Quartil
Q
3
: valor do 3 Quartil
P
10
: valor do percentil 10
P
90
: valor do percentil 90


Se K= 0,263, diz-se que a curva correspondente distribuio de freqncia
mesocrtica.
Se K > 0,263, diz-se que a curva correspondente distribuio de freqncia
platicrtica.
Se K < 0,263, diz-se que a curva correspondente distribuio de freqncia
leptocrtica.
PUC Minas Virtual 66 Probabilidade e Estatstica



UNIDADE 6
Probabilidade

6.1. Experimento aleatrio, espao amostral e eventos
6.2. Probabilidade: Definio clssica; Probabilidade e
freqncia relativa
6.3. Tipos de eventos
6.4. Axiomas de Probabilidade
6.5. Probabilidade condicional e independncia de eventos







Nesta unidade, vamos ver que a probabilidade expressa por meio de va-
lores numricos as possibilidades da ocorrncia dos resultados de um
fenmeno. So objetivos desta unidade:

Definir e determinar os possveis espaos amostrais de determinados
fenmenos;
Determinar a probabilidade de ocorrncia de um determinado fen-
meno.
Formar um conhecimento slido dos valores probabilsticos que sero
utilizados nas prximas unidades.




6.1. Experimento aleatrio, espao amostral e eventos


Introduo


Todas as vezes que se estudam fenmenos de observao, cumpre-se distinguir o
prprio fenmeno e o modelo matemtico (determinstico ou probabilstico) que
melhor o explique.

Os fenmenos estudados pela estatstica so fenmenos cujo resultado, mesmo em
condies normais de experimentao, varia de uma observao para outra, dificul-
tando dessa maneira a previso de um resultado.

A observao de um fenmeno casual recurso poderoso para se entender a varia-
bilidade do mesmo. Entretanto, com suposies adequadas e sem observar direta-
mente o fenmeno, podemos criar um modelo terico que reproduza de forma bas-
PUC Minas Virtual 67 Probabilidade e Estatstica

tante satisfatria a distribuio das freqncias quando o fenmeno observado
diretamente. Tais modelos so os chamados modelos de probabilidades.

Os fenmenos determinsticos conduzem sempre a um mesmo resultado quando as
condies iniciais so as mesmas. Ex: tempo de queda livre de um corpo. Mantidas
as mesmas condies, as variaes obtidas para o valor do tempo de queda livre de
um corpo so extremamente pequenas (em alguns casos, desprezveis).

Os fenmenos aleatrios podem conduzir a diferentes resultados e mesmo quando
as condies iniciais so as mesmas, existe a imprevisibilidade do resultado. Ex:
lanamento de um dado.

Podemos considerar os experimentos aleatrios como fenmenos produzidos pelo
homem.

Lanamento de uma moeda honesta;

Lanamento de um dado;

Lanamento de duas moedas;

Retirada de uma carta de um baralho completo, de 52 cartas;

Determinao da vida til de um componente eletrnico.


A anlise desses experimentos revela que:

Cada experimento poder ser repetido indefinidamente sob as mesmas
condies;
No se conhece em particular valor o do experimento a priori, porm po-
de-se descrever todos os possveis resultados as possibilidades;
Quando o experimento for repetido um grande nmero de vezes, surgir
uma regularidade.

Para a explicao desses fenmenos (fenmenos aleatrios), adota-se um modelo
matemtico probabilstico.

Para melhor entendimento desta unidade, interessante relembrar alguns concei-
tos bsicos no estudo das probabilidades tais como:


Espao Amostral


Um dos conceitos matemticos fundamentais utilizados no estudo das probabilida-
des o de conjunto. Um conjunto uma coleo de objetos ou itens que possuem
PUC Minas Virtual 68 Probabilidade e Estatstica


caracterstica(s) comum(ns). importante definir cuidadosamente o que constitui o
conjunto em que estamos interessados, a fim de podermos decidir se determinado
elemento ou no membro do conjunto.


Conjunto uma coleo bem definida de objetos ou itens.



A probabilidade s tem sentido no contexto de um espao amostral, que o con-
junto de todos os resultados possveis de um experimento. O termo experimen-
to sugere a incerteza do resultado antes de fazermos as observaes. Os resulta-
dos de um experimento (ex: a ocorrncia de um raio, uma viagem etc.) chamam-
se eventos.


Evento Aleatrio (E)

qualquer subconjunto de um espao amostral. tambm o resultado obtido de
cada experimento aleatrio, que no previsvel.


Espao Amostral (S)


Espao amostral de um experimento aleatrio o conjunto de todos os possveis
resultados desse experimento.

Exemplos de Espaos Amostrais:

S = { c, r } ( composto de 2 eventos)

S = { 1, 2, 3, 4, 5, 6 } ( composto de 6 eventos)

S = { (c, r), (c, c), (r, c), (r, r)} ( composto de 8 eventos)


Genericamente, se o n de pontos (elementos do espao amostral) amostrais de
um espao amostral finito n, ento o nmero de eventos dado por 2
n
.


Exemplo: No lanamento de 5 moedas, o nmero de pontos amostrais
(resultados possveis) 2
5
= 32. Portanto, S= 32.


O complemento de um evento constitudo de todos os resultados no espao a-
mostral que no faam parte do evento.

Os eventos so mutuamente excludentes, quando no tm elemento em comum.
Ou se no podem ocorrer simultaneamente.
PUC Minas Virtual 69 Probabilidade e Estatstica

Exemplo:


Na extrao de uma s carta, os eventos a carta de copas e a carta
de ouros so mutuamente excludentes, porque uma carta no pode
ser ao mesmo tempo de copas e de ouros.

J os eventos a carta de copas e a carta uma figura no so mu-
tuamente excludentes, porque algumas cartas de copas so tambm fi-
guras.

Muitas vezes, til representar graficamente um espao amostral, porque isso tor-
na mais fcil visualizar-lhe os elementos.



A A

Os eventos A e A so complementares.
A A

S




Os eventos A e B so mutuamente

A A B B
excludentes porque no se interceptam.
S



Os eventos A e B no so mutuamente excludentes,

pois tm alguns elementos em comum. A A B B

S
Operaes com Eventos Aleatrios

Consideremos um espao amostral finito:

S = {
1
,
2
,
3




....
n
}
PUC Minas Virtual 70 Probabilidade e Estatstica


S
C C



Sejam A e B dois eventos de S, as seguintes operaes so definidas:


A) Reunio A - B O evento reunio formado pelos pontos amostrais que per-
tencem a pelo menos um dos eventos.

A - B = {
1
() S /
1
A ou
1
B}


A A
B B o evento que ocorre se A
ocorre ou B ocorre, ou am-
bos ocorrem






B) Interseo A ) B O evento interseo formado pelos pontos amostrais que
pertencem simultaneamente aos eventos A e B.


A ) B = { S A e B}

i i i
o evento que ocorre se A e
B ocorrem







Obs: Se A ) B = , A e B so eventos
A A B
mutuamente exclusivos


S S




C) Complementao S A = A
c
o evento que ocorre se A no ocorre.





A A
A
c
= { S A}

A A i i


S S
PUC Minas Virtual 71 Probabilidade e Estatstica

6.2. Probabilidade: Definio Clssica; Probabilidade e freqncia relativa

Dado um experimento aleatrio, E e S o espao amostral, probabilidade de um
evento A P(A) - uma funo definida em S que associa a cada evento um
nmero real, satisfazendo os seguintes axiomas:

0 < P(A) <1

P(S) = 1

Se A e B forem eventos mutuamente exclusivos, ( A ) B)=), ento:

P (A - B)=P(A)+P(B)

Chamamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:


P(A) =
Nmero de Casos Favorveis ( A)
=
NCF(A)

Nmero Total de Casos NTC


6.3. Tipos de eventos


Chamamos de evento qualquer subconjunto do espao amostral S de um experi-
mento aleatrio.

Assim, qualquer que seja E, se E S (E est contido em S), ento E um evento
de S.

Evento Certo aquele que ocorre em qualquer realizao do experimento aleat-
rio.

Se E = S, E chamado evento certo.


Evento Elementar aquele formado por um nico elemento do espao amostral.
Se E S e E um conjunto unitrio, E chamado evento elementar.

Evento Impossvel - aquele que no ocorre em nenhuma realizao de um expe-
rimento aleatrio. Se E = , E chamado evento impossvel.

Evento Complementar seja um evento A qualquer, o evento A (chamado de
complementar de A), tal que A=S-A, ou seja, um outro conjunto formado pelos
elementos que pertencem a S e no pertencem a A.
PUC Minas Virtual 72 Probabilidade e Estatstica


Eventos Equiprovveis

Quando se associa a cada ponto amostral a mesma probabilidade, o espao amos-
tral chama-se equiprovvel ou uniforme. Os eventos E
i
,i=1,2,3......n so equipro-
vveis quando P(E
i
)=P(E
2
)=P(E
n
)=P, isto , quando todos tm a mesma probabili-
dade de ocorrer: P=1/n.

Se os n pontos amostrais (eventos) so equiprovveis, a probabilidade de cada um
dos pontos amostrais 1/n .



P( A) = r |
4 P( A) =
r

1 |

n
.
n

Exemplo:

Retira-se uma carta de um baralho completo de 52 cartas. Qual a pro-
babilidade de sair um rei ou uma carta de espadas?

Soluo:


P( A - B) = P( A) + P(B) P( A ) B)


Eventos mutuamente exclusivos

Dois eventos A e B so denominados mutuamente exclusivos se eles no puderem
ocorrer simultaneamente, isto , A ) B = .
Evento impossvel



Exemplo:


E = Jogar um dado e observar o resultado. Sejam os eventos A= ocorrer
n par e B= ocorrer n mpar.

S = {1,2,3,4,5,6}

Ento, A e B so mutuamente exclusivos, pois a ocorrncia de um n-
mero par e mpar no pode ser verificada em decorrncia da mesma ex-
perincia.
PUC Minas Virtual 73 Probabilidade e Estatstica

6.4. Axiomas de Probabilidade


1 Se o conjunto vazio (evento impossvel), ento P()=0.

2 Teorema do evento complementar: Se A
c
o complemento do evento A, ento:
P(Ac) = 1 P(A)
3 Teorema da soma: Se A e B so dois eventos quaisquer, ento:
P(A -B) = P (A) + P (B) P (A ) B)
Se tomssemos apenas P(A - B) = P (A) + P (B), estaramos, considerando duas
vezes a probabilidade de interseo.


Teoria da Contagem


Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e o
segundo pode ocorrer de n maneiras distintas, ento os dois eventos conjuntamen-
te podem ocorrer de m.n maneiras distintas. O clculo da probabilidade de um e-
vento reduz-se a um problema de contagem. Assim que a Anlise Combinatria
tem fundamental importncia para se contar o n de casos favorveis e o total de
casos. Para problemas simples ou com poucos elementos, pode-se contr o nmro
de resultados de forma direta, sem necessidade de recorrer s frmulas matemti-
cas da anlise combinatria. Para problemas menos simples, recorre-se s combi-
naes e arranjos para determinar o nmero de casos.


Combinao

o O Nmero de combinaes de r elementos combinados p a p sendo
p<r e calculado por:

r r !

C = | =
|
r ,p

p
|
p!(r
p)!
.


Notao: O Smbolo fatorial ! denota o produto dos inteiros positivos em ordem
decrescente. Por exemplo, 6! = 6.5.4.3.2.1= 720. Por definio , 0! = 1.
PUC Minas Virtual 74 Probabilidade e Estatstica


Exemplo: Quantas comisses de trs pessoas podem ser formadas com
um grupo de dez pessoas?


10 |

C
10,3
= | =
3

10.9.8.7!
3.2.7!


= 120
.

Podemos ter 120 comisses diferentes compostos com 3 pessoas.


Arranjos


o O nmero de arranjos de r elementos calculado por:


A
r , p
=
r!

(r p)!




Exemplo: Considerando um grupo de dez pessoas, quantas chapas dife-
rentes podemos ter para uma eleio de presidente, tesoureiro e secre-
trio?

A =
10!
=

10,3
(10 3)!
3628800
7!
=
3628800

5040

= 720


Podemos ter 720 chapas diferentes.


OBS: Quando queremos selecionar r elementos de um conjunto de n elementos
distintos sem levar em conta a ordem, estamos considerando combinaes, quando
contamos separadamente ordenaes diferentes dos mesmos elementos temos
arranjos.
PUC Minas Virtual 75 Probabilidade e Estatstica

6.5. Probabilidade Condicional e Independncia de Eventos


Probabilidade Condicional

O evento em que ambos, A e B, ocorrem chamado A interseo B; portanto, a
probabilidade do evento A ocorrer, dado que B ocorreu, de:

P( A B) =
P( A ) B)

P(B)


Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, igual pro-
babilidade de ocorrncia simultnea de A e B dividida pela probabilidade de ocor-
rncia de B. (Note-se que essa definio no se aplica quando P(B)=0, porque en-
to estaramos dividindo por zero).

Exemplo:


Dois dados so lanados. Consideremos os eventos


A={(x
1
,x
2
) / x
1
+x
2
=10} e B={(x
1
,x
2
) / x
1
> x
2
},


onde x
1
o resultado do dado 1 e x
2
o resultado do dado 2. Avaliar
P(A); P(B); P(A/B) e P(B/A).


Soluo:


P(A)= 3/36 =1/12


P(B) =15/36 =5/12


P(A/B)=1/15


P(B/A)=1/3


Teorema do Produto


A probabilidade da ocorrncia simultnea de dois eventos, A e B, do mesmo espa-
o amostral, igual ao produto da probabilidade de um deles pela probabilidade
condicional do outro, dado o primeiro.
PUC Minas Virtual 76 Probabilidade e Estatstica



P( A B) =
P( A ) B)

P(B)

P(B A) =
P( A ) B)

P( A)




Independncia Estatstica

Um evento A considerado independente de um outro evento B se a probabilidade
de A igual probabilidade condicional de A dado B.

Exemplo: Em um lote de 12 peas, 4 so defeituosas, 2 peas so reti-
radas uma aps a outra, sem reposio. Qual a probabilidade de que
ambas sejam boas?

A={a 1 pea boa}
B={a 2 pea boa}
P(A ) B)= P(A). P(B/A)= 8/12.7/11=14/33


Isto , se P(A)=P(A/B) evidente que, se A independente de B, B
independente de A; P(B)=P(B/A). Se A e B so independentes, ento
temos que

P(A ) B)=P(A).P(B)


Regra de Bayes

Sejam A
1
, A
2
, A
3
,......A
n
, n eventos mutuamente exclusivos tais que A
1
- A
2
- A
n
=
S.

Sejam P(A
i
) as probabilidades conhecidas dos vrios eventos e B um evento qual-
quer de S, tal que so conhecidas todas as probabilidades condicionais P(B/A
i
).




P( A
i
/ B) =
P( A
i
).P(B / A
i
)
P( A
1
).P(B / A
1
) + P( A
2
).P(B / A
2
) + ...... + P( A
n
).P(B / A
n
)


OBS: O Teorema de Bayes tambm chamado de Teorema da Probabilidade a Pos-
teriori. Ele relaciona uma das parcelas da probabilidade total com a prpria probabi-
lidade total.
PUC Minas Virtual 77 Probabilidade e Estatstica

uma generalizao da probabilidade condicional ao caso de mais de dois eventos.


Exemplos:


1. Sendo P(A) = 1/3, P(B)= e P(A - B)=11/12, calcular P(A/B).


Soluo:


Como P( A / B) =
P( A ) B)
, devemos calcular P(A ) B).

P(B)


Como P(A - B) = P(A) + P(B) - P(A ) B),


temos: 11/12= 1/3 + - P(A ) B)


4 P(A ) B)= 2/12=1/6 logo, P(A/B) =
1 / 6
=
2

3 / 4 9




2. Em certo colgio, 5% dos homens e 2% das mulheres tm mais do que
1,80 m de altura. Por outro lado, 60% dos estudantes so homens. Se um
estudante selecionado aleatoriamente e tem mais de 1,80m de altura,
qual a probabilidade de que o estudante seja mulher?

Soluo:


Temos que :


P(Ma/H) = 0,05 (Probabilidade de Homem ter mais de 1,80 m)
P(Ma/M) = 0,02 (Probabilidade de Mulher ter mais de 1,80 m)
P(H) = 0,6 (Probabilidade de ser homem)
P(M) = 0,4 (Probabilidade de ser mulher)


P(M/Ma)= ? (Probabilidade de ser mulher dado que tem mais que 1,80 m)
PUC Minas Virtual 78 Probabilidade e Estatstica


Utilizando a Regra de Bayes temos:


P(M / Ma) =
P(M ) * P(Ma / M )
P(M ) * P(Ma / M ) + P(H ) * P(Ma / H )
=
0,4 * 0,02

(0,4 * 0,02) + (0,6 * 0,05)
P(M / Ma) =
0,008
= 0,21 = 21%

0,038


3. Trs mquinas, A, B e C produzem respectivamente 40%, 50% e 10% do
total de peas de uma fbrica. As porcentagens de peas defeituosas nas
respectivas mquinas so 3%, 5% e 2%. Uma pea sorteada ao acaso e
verifica-se que defeituosa. Qual a probabilidade de que a pea tenha vin-
do da mquina B? E da mquina A?

Soluo
Temos que :
P(A) = 0,4
P(B) = 0,5


P(C)= 0,10


P(D/A) = 0,03


P(D/B) = 0,05


P(D/C) = 0,02


P(B/D) = ?


Utilizando a Regra de Bayes temos:


P(B / D) =


P(B / D) =
P(B) * P(D / B)
P( A) * P(D / A) + P(B) * P(D / B) + P(C ) * P(D / C )
0,5 * 0,05
0,4 * 0,03 + 0,5 * 0,05 + 0,1* 0,02
P(B / D) =
0,025
= 0,641 = 64,1%

0,039
PUC Minas Virtual 79 Probabilidade e Estatstica


UNIDADE 7

Variveis Aleatrias

7.1. Conceito de varivel aleatria
7.2. Distribuio de probabilidade
7.3. Funo de densidade de probabilidade
7.4. Esperana matemtica, varincia e desvio padro:
propriedades
7.5. Distribuies discretas: Bernoulli, Binomial e Poisson
7.6. Distribuio contnua: Normal - propriedades, distribuio
normal padro, a Normal como aproximao da Binomial






Muitos experimentos aleatrios produzem resultados no-numricos.
Antes de analis-los, conveniente transformar seus resultados em n-
meros, o que feito atravs da varivel aleatria, que uma regra de
associao de um valor numrico a cada ponto do espao amostral. Por-
tanto, variveis aleatrias so variveis numricas s quais iremos asso-
ciar modelos probabilsticos. Veremos que uma varivel aleatria tem
um nmero para cada resultado de um experimento e que uma distribu-
io de probabilidades associa uma probabilidade a cada resultado nu-
mrico de um experimento.

7.1. Conceito de varivel aleatia


Sejam E um experimento e S o espao associado ao experimento. Uma funo X,
que associe a cada elemento s S um nmero real X(s), denominada varivel
aleatria.


S X


s
Varivel
Aleatria


R



X(s)



Exemplo:

E: lanamento de duas moedas;

X: n de caras obtidas nas duas moedas;
PUC Minas Virtual 80 Probabilidade e Estatstica


S={(C,C), (C,R), (R,C),(R,R)}

X=0 corresponde ao evento (r,r) com probabilidade

X= 1 corresponde ao evento (r,c), (c,r) com probabilidade 2/4

X= 2 corresponde ao evento (c,c) com probabilidade .

Empregamos a termo varivel aleatria para descrever o valor que cor-
responde ao resultado de determinado experimento.
As variveis aleatrias tambm podem ser discretas ou continuas e te-
mos as seguintes definies:
Variveis Aleatrias Discretas Admite um nmero finito de valores ou
tem uma quantidade enumervel de valores.
Variveis Aleatrias Continuas pode tomar um nmero infinito de valo-
res, e esses valores podem ser associados a mensuraes em uma es-
cala contnua.


7.2. Distribuio de probabilidade


Uma vez definida a varivel aleatria, existe interesse no clculo dos valores das
probabilidades correspondentes.

O conjunto das variveis e das probabilidades correspondentes denominado dis-
tribuio de probabilidades, isto :

{(x
i
,p(x
i
), I=1,2,.n}


7.3. Funo de densidade de probabilidade


a funo que associa a cada valor assumido pela varivel aleatria a probabilida-
de do evento correspondente, isto :

P(X=x
i
)= P(A
i
), i=1,2,.,n


7.4. Esperana matemtica, varincia e desvio padro: propriedades


Existem caractersticas numricas que so muito importantes em uma distribuio
de probabilidades de uma varivel aleatria discreta. So os parmetros das distri-
buies, a saber:

Esperana matemtica (ou simplesmente mdia) - E (x) um nmero real,
tambm uma mdia aritmtica;
PUC Minas Virtual 81 Probabilidade e Estatstica

Varincia - VAR (x) a medida que d o grau de disperso (ou de
concentra- o) de probabilidade em torno da mdia. O fato de conhecermos
a mdia de uma distribuio de probabilidades j nos ajuda bastante, porm,
precisamos de uma medida que nos d o grau de disperso de probabilidade
em torno dessa mdia.
Desvio Padro DP(X) a raiz quadrada da varincia.


7.5. Distribuies discretas: Bernoulli, Binomial e Poisson

Uma funo X, definida sobre o espao amostral e assumindo valores num conjunto
enumervel de pontos do conjunto real, dita uma varivel aleatria discreta.

Uma varivel aleatria X do tipo discreto estar bem caracterizada se indicarmos os
possveis valores x
1
, x
2
, , x
k
que ela pode assumir e as respectivas probabilidades
p(x
1
), p(x
2
), , p(x
k
), ou seja, se conhecermos a sua funo de probabilidade (x;
p(x)), onde

p(x) = P(X = x)

Dada a v.a. discreta X, assumindo os valores x
1
, x
2
, , x
k
, chamamos esperana
matemtica de X ao valor:


E ( X ) =

x p( x)


Chamamos varincia de X ao valor:


Var( X ) = E( X
2
) [E ( X )]
2

onde
E ( X
2
) =

x
2
p( x)



E de desvio padro de X a


DP( X ) = Var( X )
PUC Minas Virtual 82 Probabilidade e Estatstica

2 2 2

Distribuies Discretas de Probabilidade



1. Distribuio de Bernoulli

Seja um experimento aleatrio E realizado repetidas vezes, sempre nas mesmas
condies, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o
evento que nos interessa) ou um Fracasso (f) (se o evento no se realizar).

Seja X a varivel aleatria: Sucesso ou Fracasso

X x
1
= 1 (sucesso) ou x
2
= 0
(fracasso)
P(X) p(x
1
) = p
P( x = 0) = q
p(x
2
) = 1 p = q
e P(x = 1 ) = p


Essas condies caracterizam um conjunto de Provas de Bernoulli ou um experi-
mento de Bernoulli, e sua funo probabilidade dada por:


P( X = x) = p
x
.q
1 x




Principais caractersticas


Mdia:
1
E ( X ) =

x
i
P( x
i
) = 0.q + 1. p = p

i =0



Varincia:

Var ( X ) = E ( X
2
) [E( X )]
2


E ( X
1
) =

x
i
P( x
i
) = 0


q + 1
2


p = p
i =0
Var ( X ) = p p
2
= p(1 p) = pq
PUC Minas Virtual 83 Probabilidade e Estatstica



2. Distribuio Binomial

Uma varivel aleatria tem distribuio binomial quando o experimento ao qual
est relacionada apresenta apenas dois resultados (sucesso ou fracasso). Este mo-
delo fundamenta-se nas seguintes hipteses:

n provas independentes e do mesmo tipo so realizadas;

cada prova admite dois resultados Sucesso ou Fracasso;

a probabilidade de sucesso em cada prova p e de fracasso 1- p = q


Define-se a Varivel X que conta o nmero de sucesso nas n realizaes do expe-
rimento.

(X pode assumir os valores 0, 1, 2, 3, ......., n.)


Fazendo sucesso corresponder a 1 e fracasso, a 0, temos:


Para X = 0 , uma seqncia de n zeros : 000000....000.

P( X = 0) = q.q.q.q.q.....q = q
n



Para X = 1, uma seqncia do tipo: 1000....0; 01000....0; 001000...0; sero n
seqncias, cada uma com um nico sucesso e n-1 fracassos:

P( X = 1) = n. p.q
n 1



Para X= x, tem-se x sucessos e (n-x) fracassos, correspondendo s seqncias
com x algarismos 1 e n-x zeros. Cada seqncia ter probabilidade
n |

p
x
q
n x
e como
h

| seqncias distintas, tem-se:


x
.



n |




Expresso geral da
P( X

= x) =

| p
x
q
n x

distribuio Binomial

x
.
PUC Minas Virtual 84 Probabilidade e Estatstica


Principais caractersticas:

Mdia: E ( X ) = n. p

Varincia: Var ( X ) = n. p.q


Exemplo: Uma moeda no viciada lanada 8 vezes. Encontre a proba-
bilidade de:

a) dar 5 caras;

b) pelo menos uma cara;
c) no mximo 2 caras.
Soluo:
a) x = sair cara, p=0,5 ( probabilidade do sucesso de X), q= 0,5 ( pro-
babilidade do fracasso de X0, n = 8 ( nmero de repeties do evento).



P( X

= 5) =
8!
5!(8 5)!
.0,5
5
.0,5
85
=
40320
.0,5
8
= 0,21875 = 21,88%

120.6



b) P(x1)= 1 { P(X=0)} = 1-{ q
n
} = 1- 0,5
8
= 0,9960 = 99,6%



c) P(X2) = P(X=0)+ P(x=1) + P(X=2) , utilizando as frmulas dos i-
tens anteriores calcula-se as probabilidades.



3. Distribuio de Poisson

Consideremos a probabilidade de ocorrncia de sucessos em um determinado inter-
valo. A probabilidade da ocorrncia de um sucesso no intervalo proporcional ao
intervalo. A probabilidade de mais de um sucesso nesse intervalo bastante pe-
quena em relao probabilidade de um sucesso.
PUC Minas Virtual 85 Probabilidade e Estatstica

Seja X o nmero de sucessos no intervalo; temos, ento:



P( X = k ) =
e


.
k
k!

onde

a mdia.




A varivel X assim definida tem distribuio de Poisson.


A distribuio de Poisson muito usada na distribuio do nmero de:

Carros que passam por um cruzamento por minuto, durante uma certa hora do
dia;
Erros tipogrficos por pgina, em um material impresso;

Defeitos por unidade (m, m, m, etc.,,) por pea fabricada;

Colnias de bactrias numa dada cultura por 0,01mm, numa plaqueta de mi-
croscpio;
Mortes por ataque de corao por ano, numa cidade;

Problemas de filas de espera em geral, e outros.


Principais caractersticas:

Mdia: E ( X ) =

Varincia: Var ( X ) =


OBS: Muitas vezes, no uso da binomial, acontece que n muito grande e p muito
pequeno. Podemos, ento, fazer uma aproximao de binomial pela distribuio de
Poisson, da seguinte forma:

= np


Exemplo: Em mdia, so feitas 2 chamadas por hora para certo telefo-
ne. Calcular a probabilidade de se receber no mximo 3 chamadas em 2
horas e a probabilidade de nenhuma chamada em 90 minutos.

Soluo:
= 2 por hora, para 2 horas = 4
P(X3)= P(X=0)+P(X=1)+P(X=2)+P(X=3)4
PUC Minas Virtual 86 Probabilidade e Estatstica



P(X3) =

e

.
0
0!

e

.
1

+
1!

e

.
2

+
2!

e

.
3

+ 4
3!

e

P(X3) =
4
.4
0
1
e
4
.4
1

+
1
e
4
.4
2

+
2
e
4
.4
3

+ 4
6
P(X3) = e
4
+ 4e
4
+ 8e
4
+ 10,666e
4
= 23,66e
4
= 0,4334 = 43,34%


Agora para 90 minutos =3 ( 1 hora (60 minutos) =2)

P(X=0)=

e
3
.3
0


= e
3
= 0,0498 = 4,98 %

1



7.6. Distribuio contnua: Normal - propriedades, distribuio normal
padro, a Normal como aproximao da Binomial

Uma varivel aleatria, cujos valores so expressos em uma escala contnua,
chamada de varivel aleatria contnua.

Podemos construir modelos tericos para v.a.s contnuas, escolhendo adequada-
mente a funo de densidade de probabilidade (f.d.p.), que uma funo indicado-
ra da probabilidade nos possveis valores de X.

Assim, a rea sob a f.d.p. entre dois pontos a e b nos d a probabilidade da varivel
assumir valores entre a e b, conforme ilustrado na figura 1, apresentada a seguir.



P(a<X<b)







a b


Figura 1 Probabilidade como rea sob a curva entre dois pontos
PUC Minas Virtual 87 Probabilidade e Estatstica

Portanto, podemos escrever:

b
P(a < X < b) =
+
f ( x)dx

a

Da relao entre a probabilidade e a rea sob a funo, a incluso, ou no, dos ex-
tremos a e b na expresso acima no afetar os resultados. Assim, iremos admitir

P(a < X < b) = P(a o X < b) = P(a < X o b) = P(a o X o b)

Teoricamente, qualquer funo f(x) que seja no negativa e cuja rea total sob a
curva seja igual unidade, isto ,

+
f ( x)dx = 1


caracterizar uma v.a. contnua.

Dada a v.a. contnua X, assumindo os valores no intervalo entre a e b, chamamos
valor mdio ou esperana matemtica de X ao valor

b
E( X ) =
+
x f (
x)dx

a

Chamamos varincia de X ao valor

Var( X ) = E ( X
2
) [E( X )]
2

onde





e de desvio padro de X a

b
E ( X
2
) =
+
x
2
f ( x)dx

a


DP( X ) = Var( X )


Se X uma v.a. contnua com f.d.p. f(x), definimos a sua funo de distribuio
acumulada F(x) como:



F ( x) = P( X o x) =
x
+
f (t )dt


PUC Minas Virtual 88 Probabilidade e Estatstica

(

1 - Distribuio Normal

A distribuio normal a mais importante das distribuies de probabilidades. Co-
nhecida como a curva em forma de sino, a distribuio normal tem sua origem
associada aos erros de mensurao. sabido que quando se efetuam repetidas
mensuraes de determinada grandeza com um aparelho equilibrado, no se chega
ao mesmo resultado todas as vezes; obtm-se, ao contrrio, um conjunto de valo-
res que oscilam, de modo aproximadamente simtrico, em torno do verdadeiro va-
lor. Construindo-se o histograma desses valores, obtm-se uma figura com forma
aproximadamente simtrica. Gauss deduziu matematicamente a distribuio normal
como distribuio de probabilidade dos erros de observao, denominando-a ento
lei normal dos erros.

Supunha-se inicialmente que todos os fenmenos da vida real devessem ajustar-se
a uma curva em forma de sino; em caso contrrio, suspeitava-se de alguma anor-
malidade no processo de coleta de dados. Da a designao de curva normal.

A observao cuidadosa subseqente mostrou, entretanto, que essa pretensa uni-
versalidade da curva, ou distribuio normal, no correspondia realidade. De fato,
no so poucos os exemplos de fenmenos da vida real representados por distribu-
ies no normais, curvas assimtricas, por exemplo. Mesmo assim, a distribuio
normal desempenha papel preponderante na estatstica, e os processos de infern-
cia nela baseados tm larga aplicao.

A distribuio normal tem sua funo de densidade de probabilidade dada por



f(x) =

1


exp

(x )
2
(


< x <

( 2 2(
2
(



Como pode-se observar atravs da equao acima, a distribuio normal inclui os
parmetros e (, os quais possuem os seguintes significados:

: posio central da distribuio (mdia,
x
)

( : disperso da distribuio (desvio padro, (
x
)


Se uma varivel aleatria X tem distribuio normal com mdia e varincia (
2
,
escrevemos: X < N( ,(
2
).

A figura 2 ilustra uma curva normal tpica, com seus parmetros descritos grafica-
mente.
PUC Minas Virtual 89 Probabilidade e Estatstica



f(x)



(

: mdia
(: desvio padro




x



Figura 2 - Curva normal tpica



Propriedades da distribuio normal

Para uma mesma mdia e diferentes desvios padro (, a distribuio que tem
maior desvio padro se apresenta mais achatada, acusando maior disperso em
torno da mdia. A que tem menor desvio padro apresenta pico mais acentuado e
maior concentrao em torno da mdia. A figura 3 compara trs curvas normais,
com a mesma mdia, porm, com desvios padro diferentes. A curva A se apresen-
ta mais dispersa que a curva B, que por sua vez se apresenta mais dispersa que a
curva C. Nesse caso, (
A
> (
B
> (
C
.

Distribuies normais com o mesmo desvio padro e mdias diferentes possuem a
mesma disperso, mas diferem quanto localizao. Quanto maior a mdia, mais
direita est a curva. A figura 4 ilustra o fato, onde a curva A possui mdia maior
que a curva B (
A
>
B
).

C





B

A




Figura 3 - Distribuies normais com mesma mdia e desvios padro diferentes
PUC Minas Virtual 90 Probabilidade e Estatstica




B A



A


Figura 4 - Distribuies normais com mesmo desvio padro e mdias diferentes




Como descrito anteriormente, a probabilidade de uma varivel assumir valores en-
tre a e b igual rea sob a curva entre esses dois pontos. A determinao dessas
probabilidades realizada matematicamente atravs da integrao da funo de
densidade de probabilidade entre os pontos a e b de interesse. No caso da normal,
a integral no pode ser calculada exatamente e a probabilidade entre dois pontos
s pode ser obtida de forma aproximada, por mtodos numricos. Essa tarefa
facilitada atravs do uso da distribuio normal padro definida a seguir.

No caso da distribuio normal, algumas dessas reas - com os pontos a e b, fun-
o da mdia e do desvio padro ( so bastante difundidas e esto representa-
das na figura 5:

99.73 %

95.46 %

68.26 %











-3(

-2(
-( +( +3(
+2(


Figura 5 - Probabilidades da distribuio normal



Portanto, 68,26% dos valores populacionais caem entre os limites definidos como
mdia mais ou menos um desvio padro ( 1(); 95,46% dos valores caem entre
PUC Minas Virtual 91 Probabilidade e Estatstica

mdia mais ou menos dois desvios padro ( 2(); e 99,73% dos valores caem
entre mdia mais ou menos trs desvios padro ( 3().

A distribuio normal padro

A distribuio normal particular com mdia 0 e desvio padro 1 chamada de dis-
tribuio normal padro e costuma ser denotada por Z.

Se X < N( ,(
2
), ento, a varivel aleatria definida por

Z =
X

(

ter uma distribuio N(0,1). Essa transformao ilustrada pela figura 6:












-3(



-2(


-(
X

+( +3(
+2(

X -
(
Z

-3 -2 -1 0 1 2 3


Figura 6 - Transformao de uma N( ,(
2
) para uma N(0,1)


A rea esquerda de um valor especificado da N(0,1) encontra-se tabelada.
Utilizando-se a transformao acima, podemos obter as probabilidades para
qualquer N( ,(
2
). O procedimento ilustrado atravs do exemplo abaixo.


Exemplo:


Extrudados tubulares possuem tenso de escoamento (tenso a partir da qual o
material se deforma plasticamente), que segue uma distribuio normal com mdia
de 210 MPa com desvio padro de 5 MPa. Em notao estatstica, X < N(210 ,5
2
).
desejado que tais extrudados tenham tenso de escoamento de pelo menos 200
MPa. Portanto, a probabilidade do extrudado no atingir a especificao desejada :
PUC Minas Virtual 92 Probabilidade e Estatstica


Soluo:


P(X < 200) = P

Z <

|
= P(Z < -2).
200 210 |
5 .


A figura 7 mostra a transformao realizada e a rea desejada.









P(X<200)



X
180 190 200 210 220 230 240






P(Z<-2)



Z
-6 -4 -2 0 2 4 6


Figura 7 - Probabilidade do extrudado no atingir a especificao desejada


Para clculo dessa probabilidade, utilizamos a tabela de distribuio normal padro-
nizada ( que esta no apndice do livro indicado na bibliografia bsica). Observe que
a tabela traz apenas a P(Z<z) para z no negativo (z c 0). As propriedades que se
seguem podem ser deduzidas a partir da simetria da densidade em relao mdia
0, e so teis na obteno de outras reas no tabuladas.


P(Z>z) = 1 - P(Z<z)


P(Z<-z) = P(Z>z)


P(Z>-z) = P(Z<z)
PUC Minas Virtual 93 Probabilidade e Estatstica



P(Z < -z)
1 - P(Z < z)


-z z


Figura 8 - reas correspondentes na distribuio normal



Utilizando as relaes apresentadas acima, a probabilidade do extrudado no aten-
der especificao


P(X < 200) = P(Z < -2) = P(Z > 2) = 1 - P(Z < 2)


que, atravs da tabela da N(0,1) igual a


P (X < 200) = 1 - 0,97725 = 0,02275.


= 2,275%
PUC Minas Virtual 94 Probabilidade e Estatstica



UNIDADE 8

Inferncia Estatstica

8.1. Populao e amostra; Estatsticas e parmetros;
Distribuies amostrais
8.2. Estimao
8.3. Testes de Hipteses










Trata-se do processo de obter informaes sobre uma populao a partir
de resultados observados na amostra.

De modo geral, tem-se uma populao com grande nmero de elemen-
tos e deseja-se, a partir de uma amostra dessa populao, conhecer o
mais prximo possvel algumas caractersticas da populao.

Toda concluso tirada por uma amostragem, quando generalizada para
a populao, vir acompanhada de um grau de incerteza ou risco.

Ao conjunto de tcnicas e procedimentos que permitem dar ao pesqui-
sador um grau de confiabilidade, de confiana nas afirmaes que faz
para a populao, baseadas nos resultados das amostras, damos o no-
me de Inferncia Estatstica.

O problema fundamental da Inferncia Estatstica, portanto, medir o
grau de incerteza ou risco dessas generalizaes. Os instrumentos da
Inferncia Estatstica permitem a viabilidade das concluses por meio de
afirmaes estatsticas.


8.1. Populao e amostra; Estatsticas e parmetros;
Distribuies amostrais

Se um conjunto de dados consiste de todas as observaes possveis (concebveis
ou hipotticas), chamado uma populao; se um conjunto de dados se consiste
apenas de uma parte dessas observaes, chamado uma amostra.
PUC Minas Virtual 95 Probabilidade e Estatstica

Um dos principais objetivos da maioria dos estudos, anlises ou pesquisas estatsti-
cas fazer generalizaes seguras - com base em amostras em relao s popu-
laes das quais se extraram as amostras.

Definies

Parmetro: a medida usada para escrever uma caracterstica numrica populacio-
nal. Genericamente representado por \. A mdia (), a varincia ((
2
) e o coefici-
ente de correlao ()) so alguns exemplos de parmetros populacionais.

Estimador: tambm denominado estatstica de um parmetro populacional. uma
caracterstica numrica determinada na amostra, uma funo de seus elementos.
Genericamente, representado por \. A mdia amostral (x) e a varincia amostral
(s
2
) so alguns dos exemplos de estimadores.



POPULAO






AMOSTRAS
PARMETROS: \






ESTIMADORES: \





Distribuio Amostral

Considere todas as possveis amostras de tamanho n que podem ser extradas de
determinada populao. Se para cada uma delas se calcular um valor do estimador,
tem-se uma distribuio amostral desse estimador. Como o estimador uma vari-
vel aleatria, pode-se determinar suas caractersticas, isto , encontrar sua mdia,
varincia, desvio-padro.

As distribuies amostrais so fundamentais para o processo de inferncia estatsti-
ca.

Distribuio amostral da Mdia


Sabe-se que x' =
=
x
i

n

(mdia aritmtica) um estimador da mdia populacional .
O estimador x uma varivel aleatria; portanto, busca-se conhecer sua distribui-
o de probabilidade.
PUC Minas Virtual 96 Probabilidade e Estatstica

.
= (
x '
2
n


Teorema 1 A mdia da distribuio amostral das mdias, denotada por (x),
igual mdia populacional .


E (x) = (x) =


Assim, provado que a mdia das mdias amostrais igual mdia populacional.
Teorema 2 Se a populao infinita, ou se a amostragem com reposio, ento
a varincia da distribuio amostral das mdias, denotada por (
2
(x), dada por:



VAR ( x ' )
2
=
(

n

Teorema 3 Se a populao finita, ou se a amostragem sem preposio, ento
a varincia da distribuio amostral das mdias dada por:


(
2

N n
|

( =
(

N n

(
2
( x' ) =
|

n

N 1
.

x '
N 1


Sendo que: (x) =


Teorema 4 - Se a populao tem ou no distribuio normal com mdia e varin-
cia (
2
, ento a distribuio das mdias amostrais ser normalmente distribuda com
(
2

mdia e varincia .
n

Esses quatro teoremas provam que a mdia amostral (x) tem distribuio normal
(
2

com mdia igual mdia da populao () e varincia dada por
n
(
2
N n |

para popula-
es infinitas, assim como
n

N 1
|
para populaes finitas. Ou, ainda:



(
2
|


(
2
N n |
|

x' H N ; |
ou

n

x' H N ;

|
|
n N 1
.
.
.

PUC Minas Virtual 97 Probabilidade e Estatstica
i
x




com distribuies padronizadas dadas por:

Z =
x
i

Z =
x
i


( ou

n
i

(

N


n
N

n
|

|

1
.



Exemplo:


Temos uma populao de 5000 alunos de uma faculdade. Sabemos que
a altura mdia dos alunos de 175 cm e o desvio padro, de 5 cm. Reti-
ramos uma amostra sem reposio, de tamanho n = 100. Qual o valor
do desvio padro amostral?

Soluo:


X : N (175 , 25 cm)
)
= 175cm
}

(
( = 5cm



Ento

= E (x) = 175


E ( =
(

x
n
N n
=
5

N 1 10
5000 25
= 0,4988

5000 1


8.2. Estimao
H dois tipos fundamentais de estimao: por ponto e por intervalo.
Estimao pontual

O problema da estimao pontual surge quando estamos interessados em alguma
caracterstica numrica de uma distribuio desconhecida (ex: mdia, varincia) e
desejamos calcular, a partir de observaes, um nmero que inferimos que seja
uma aproximao da caracterstica numrica em questo.

Para ilustrar alguns dos problemas com os quais nos deparamos quando estimamos
a mdia de uma populao com base em dados amostrais, vamos recorrer a um
PUC Minas Virtual 98 Probabilidade e Estatstica


estudo em que planejadores industriais procuraram determinar o tempo mdio que
um adulto leva para montar um rob fcil de montar. Com uma amostra aleat-
ria, obtm-se os seguintes dados (em minutos) para 36 pessoas que montaram o
rob:


17 13 18 19 17 21 29 22 16 28
21 15 26 23 24 20 8 17 17 21
32 18 25 22 16 10 20 22 19 14
30 22 12 24 28 11



A mdia desta amostra x = 19,9 minutos. Na ausncia de qualquer outra infor-
mao, podemos tomar esta cifra como uma estimativa de , o verdadeiro tempo
mdio que um adulto leva para montar o rob.

Esse tipo de estimativa chamada estimativa pontual, pois consiste de um nico
nmero, ou um nico ponto na escala dos nmeros reais. Embora se trate da forma
mais comum de expressar estimativas, ela deixa margem para no poucas ques-
tes. Por exemplo, no nos diz em quantas informaes a estimativa se baseia,
nem tampouco nos informa sobre o tamanho possvel do erro.

Estimao por intervalo

A estimao por pontos de um parmetro no possui uma medida do possvel erro
cometido na estimao, da surge a idia de construir os intervalos de confiana,
que so baseados na distribuio amostral do estimador pontual.

Uma maneira de expressar a preciso da estimao estabelecer limites que, com
certa probabilidade, incluam o verdadeiro valor do parmetro da populao. Esses
limites so chamados limites de confiana: determinam um intervalo de confian-
a, no qual dever estar o verdadeiro valor do parmetro. Logo, a estimao por
intervalo consiste na fixao de dois valores tais que (1 - () seja a probabilidade de
que o intervalo, por eles determinado, contenha o verdadeiro valor do parmetro.



( : nvel de incerteza ou grau de desconfiana
1 - ( : coeficiente de confiana ou nvel de confiabilidade.



Portanto, ( nos d a medida da incerteza desta inferncia (nvel de significncia).
Logo, a partir das informaes de amostra, devemos calcular os limites de um in-
PUC Minas Virtual 99 Probabilidade e Estatstica
|
'

tervalo, valores crticos que em (1 - ()% dos casos inclua o valor do parmetro a
estimar e em (% dos casos no inclua o valor do parmetro.

Intervalo de confiana (IC) para a mdia populacional ()
quando a Varincia ((
2
) conhecida.

Como se sabe, o estimador de x. Tambm conhecida a distribuio de
probabilidade de x:

(
2
|

x' H N

;
|

n
.

para as populaes infinitas,




(
2
N n |
|

x' H N ;

|
|
para as populaes finitas.


n

N 1
.
.


Assim, para o caso de populaes infinitas, a varivel padronizada de x ser:

Z =
x

(
n


Fixando-se um nvel de confiana 1 - (, tem-se:






Ou seja:

P

Z
(

o Z o Z
( |
=


1 (


2 2
.
PUC Minas Virtual 100 Probabilidade e Estatstica

(
(
.
n
2
n


Substituindo-se o valor de Z, tem-se:


P

Z
(



o
x'

|

|
o Z
|
= 1 (


2
(
2
|
|

.


Resolvendo-se as duas inequaes para , tem-se o intervalo de confiana para a
mdia populacional () quando a varincia ((
2
) conhecida:


P x'Z

2

(
o o x'+ Z
(

n
2

( |

| = 1 (
n
.


Como poder ser verificado, a aplicao da frmula extremamente simples. Fixa-
se o valor de 1 - ( , ou (1 - ()100= %, e observa-se na tabela de distribuio nor-
mal padro o valor das abscissas que deixam (/2 em cada uma das caudas. Com
os valores de x (mdia amostral), (=desvio padro da populao, que neste caso
conhecido, e n (tamanho da amostra), constri-se o intervalo.

Para o caso de populaes finitas, usa-se a seguinte frmula:



( (

P

x'Z

N n
o o x'+ Z
( ( N n
|

|
= 1 (


N 1 2 n N 1
|




Exemplo:

A durao da vida de uma pea de equipamento tal que (=5 horas.
Foram amostradas 100 dessas peas, obtendo-se a mdia de 500 horas.
Deseja-se construir um intervalo de confiana para a verdadeira durao
mdia da pea com um nvel de 95%.

Soluo:


( = 5 ; n = 100 x=500 (1 - ()100=95%
PUC Minas Virtual 101 Probabilidade e Estatstica


P 500 1,96

5

o o 500 + 1,96

|

100 100
.


(

o grfico da distribuio normal padro ser:






2,5% 2,5%
95%



-1,96 1,96




lembre-se que para descobrir a abscissa 1,96, entrou-se na tabela de
distribuio normal padronizada com o valor 0,475 = 47,5 , j que a ta-
bela de faixa central.

Substituindo na formula :


P x'Z

2

(
o o x'+ Z
(

n
2

( |

| = 1 (
n
.

5
| = 95%




Efetuando os clculos temos:
P(499,02 500,98) = 95%

8.3. Testes de Hipteses


Trata-se de uma tcnica para se fazer inferncia estatstica. Ou seja, a partir de um
teste de hipteses realizado com os dados amostrais, pode-se fazer inferncias so-
bre a populao.


Principais conceitos


Hipteses Estatstica Trata-se de uma suposio quanto ao valor de um parme-
tro populacional, ou quanto natureza da distribuio de probabilidade de uma
varivel populacional. So exemplos de hipteses estatsticas:

a) Os chips da marca A tm vida mdia H : =
0
;
PUC Minas Virtual 102 Probabilidade e Estatstica

1 )
1 )
1 )

b) O nvel de inteligncia de uma populao de universitrios H : =
0;


c) O ao produzido pelo processo A mais duro que o ao produzido pelo proces-
so B:
A
>
B;

d) A altura mdia da populao brasileira de 1,65m, isto : H :=1,65m;

e) A varincia populacional dos salrios vale R$ 5.000
2
, isto : H :(
2
=5.000
2
;
f) A proporo de paulistas com a doena X de 40 %, ou seja: H : p=0,40;
g) A distribuio dos pesos dos alunos da nossa faculdade normal;
h) A chegada de navios ao porto de Santos descrita por uma distribuio de
Poisson.

Formulamos duas hipteses bsicas:
H
o
: hiptese nula ou da existncia;

H
1
: hiptese alternativa.


Testamos hipteses para tomarmos uma deciso entre duas alternativas. Por essa
razo, o Teste de Hiptese um Processo de Deciso Estatstica.

Tipos de Hiptese Designa-se por H
0,
chamada hiptese nula, a hiptese estatsti-
ca a ser testada, e por H
1
a hiptese alternativa. A hiptese nula expressa uma i-
gualdade, enquanto a hiptese alternativa dada por uma desigualdade.

Exemplo:

H
0
: = 1,65m
H : 1,65m
`


para testes bilaterais

(d origem a um teste

bicaudal)


H
0
: = 1,65m
H : > 1,65m
`


para testes unilaterais direita (d origem a um teste

unilateral direita)


H
0
: = 1,65m
H : < 1,65m
`


para testes unilaterais esquerda (d origem a um teste unicaudal esquerda)



O procedimento padro para a realizao de um Teste de Hipteses o seguinte:

Define-se as hipteses do teste: nula e alternativa;

Fixa-se um nvel de significncia (;

Levanta-se uma amostra de tamanho n e calcula-se uma estimativa \
0
do par-
metro \;
PUC Minas Virtual 103 Probabilidade e Estatstica

Usa-se para cada tipo de teste uma varivel cuja distribuio amostral do esti-
mador dos parmetros seja a mais concentrada em torno do verdadeiro valor do
parmetro;
Calcula-se com o valor do parmetro \
0
, dado por H
0
, o valor crtico, valor obser-
vado na amostra ou valor calculado (V
calc
);
Fixa-se duas regies: uma de no rejeio de H
0
(RNR) e uma de rejeio de H
0

ou crtica (RC) para o valor calculado, ao nvel de risco dado;

Se o valor observado (V
calc
) Regio de No Rejeio, a deciso a de no re-
jeitar H
0
;
Se V
calc
Regio Crtica, a deciso a de rejeitar H
0
.


Devemos observar que quando se fixa ( , determinamos para os testes bilaterais,
por exemplo, valores crticos (tabelados), V
(
, tais que:


P(|V
calc
|< V
(
)=1 - ( RNR
P(|V
calc
| V
(
)= ( RC

Testes de Hipteses para a Mdia de Populaes
normais com varincias ((
2
) conhecidas


Testes Bilaterais

De uma populao normal com varincia 36, toma-se uma amostra casual de ta-
manho 16, obtendo-se x=43. Ao nvel de 10%, testar as hipteses:


)H
0
: = 45
}

(
H
1
: 45



Soluo: Como o teste para mdia de populaes normais com varincia conheci-
da, usaremos a varivel Z: N(0,1) como critrio.


(
2
=36 x=43 n=16
PUC Minas Virtual 104 Probabilidade e Estatstica

'

Z =
x'
H 0

(

x




(
(
x'
=
n



Como o teste bilateral e ( =10%, a Regio de No Rejeio, (RNR), :
P(|Z|< Z
(
)=1 - ( P(|Z|<1,64)=0,90

Z
(
=Z5%=1,64


E a Regio de Rejeio (RC) dada por

P(Z c Z
(
) = ( P( Z

c 1,64) = 0,10






Como Z
calc
=-1,33


Temos que Z
calc
RNR


Logo, a deciso no rejeitarmos H
0
, isto , a mdia de 45, com 10% de risco de
no rejeitarmos uma hiptese falsa.



Testes Unilateral (Monocaudal) Esquerda

Uma fbrica anuncia que o ndice de nicotina dos cigarros da marca X apresenta-se
abaixo de 26 mg por cigarro. Um laboratrio realiza 10 anlises do ndice obtendo:
26,24,23,22,28,25,27,26,28,24. Sabe-se que o ndice de nicotina dos cigarros da
marca X se distribui normalmente com varincia 5,36 mg2. Pode-se aceitar a afir-
mao do fabricante, ao nvel de 5%?
PUC Minas Virtual 105 Probabilidade e Estatstica

)H
0
: = 26
}

(
H
1
: < 26




4RNR= (-1,64; +)


4RC = (- ; -1,64]


4Z
calc
RNR



No se rejeita H
0
, isto , ao nvel de 5% podemos concluir que a afirmao do fa-
bricante falsa.



Testes Unilateral (Monocaudal) Direita

Um fabricante de lajotas de cermica introduz um novo material em sua fabricaao
e acredita que aumentar a resistncia mdia, que de 206 kg. A resistncia das
lajotas tem distribuio normal, com desvio padro de 12 kg. Retira-se uma amos-
tra de 30 lajotas, obtendo-se X =210 kg. Ao nvel de 10%, pode o fabricante acei-
tar que a resistncia mdia de suas lajotas tenha aumentado?


)H
0
: = 206
}

(
H
1
: > 206




PUC Minas Virtual 106 Probabilidade e Estatstica


4RNR=(- ; 1,28)


4RC = [1,28; +)


4Z
calc
RC


Como Z
calc
> Z
(
, rejeita-se H
0
, isto , ao nvel de 10% o fabricante pode concluir
que a resistncia mdia de suas lajotas aumentou.


Erros de Deciso

Tipos de Erro H dois tipos possveis de erro ao testar uma hiptese estatstica.
Pode-se rejeitar uma hiptese quando ela , de fato, verdadeira, ou aceitar uma
hiptese quando ela , de fato, falsa. A rejeio de uma hiptese verdadeira
chamada erro tipo I. A aceitaao de uma hiptese falsa constitui um erro tipo II.

As probabilidades desses dois tipos de erros so designadas, respectivamente, por
( e .
A probabilidade ( do erro tipo I denomidada nvel de significncia do teste.
Resumindo:




Realidade

H
0
verdadeira

H
0
falsa


Deciso

Aceitar H
0


Deciso Correta (1-()

Erro tipo II ()

Rejeitar H
0


Erro tipo I (()

Deciso Correta (1 - )


Observe que o erro tipo I s poder ser cometido se se rejeitar H
0;
e o erro do tipo
II, quando se aceitar H
0
.


O objetivo, obviamente, reduzir ao mnimo as probabilidades dos dois tipos de
erros. Infelizmente, essa uma tarefa difcil porque, para uma amostra de deter-
minado tamanho, a probabilidade de se incorrer em um erro tipo II aumenta me-
dida que diminui a probabilidade do erro I. E vice-versa. A reduo simultnea dos
erros poder ser alcanada pelo aumento do tamanho da amostra.
PUC Minas Virtual 107 Probabilidade e Estatstica


UNIDADE 9

Correlao e Regresso Linear

9.1. Diagrama de disperso

9.2. Correlao Linear

9.3. Coeficiente de Correlao Linear

9.4. Regresso Reta de regresso
(ou reta de mnimos quadrados ou reta de ajuste)







Em muitas situaes, torna-se interessante e til estabelecer uma rela-
o entre duas ou mais variveis. A matemtica estabelece vrios tipos
de relaes entre variveis, por exemplo, as relaes funcionais e as
correlaes.


Relaes Funcionais

So relaes matemticas expressas por sentenas matemticas, cujos exemplos
apresentamos a seguir:

rea do retngulo (A=a.b) a relao entre os lados do retngulo;

Densidade de massa (d
m
= m/v) a relao entre a massa e o volume de um
corpo;
Permetro de uma circunferncia (C=2R) a relao entre o comprimento da
circunferncia e o valor do raio.


Relaes Estatsticas e Correlaes

So relaes estabelecidas aps uma pesquisa. Com base nos resultados da pes-
quisa, so feitas comparaes que eventualmente podem conduzir (ou no) liga-
o entre as variveis.


Exemplo: relao entre a idade e a estatura de uma criana, ou a rela-
o entre a classe social de uma pessoa e o nmero de viagens por ela
realizado.
PUC Minas Virtual 108 Probabilidade e Estatstica


No estudo estatstico, a relao entre duas ou mais variveis denomina-se correla-
o. A utilidade e importncia das correlaes entre duas variveis podem conduzir
descoberta de novos mtodos, cujas estimativas so vitais em tomadas de deci-
ses.



9.1. Diagrama de disperso


O diagrama de disperso um grfico cartesiano em que cada um dos eixos cor-
responde s variveis correlacionadas. A varivel dependente (Y) situa-se no eixo
vertical e o eixo das abscissas reservado para a varivel independente (X). Os
pares ordenados formam uma nuvem de pontos.

A configurao geomtrica do diagrama de disperso pode estar associada a uma
linha reta (correlao linear), uma linha curva (correlao curvilnea) ou, ainda, ter
os pontos dispersos de maneira que no definam nenhuma configurao linear;
nesta ltima situao, no h correlao.




100
90
80
70
60
50
40
30
20
10
0









0 1 2 3 4 5 6
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5


Correlao Linear Correlao Curvilnea


Figura 9.1. Diagramas de disperso



9.2. Correlao Linear


Correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. uma linha de tendncia, porque procura acompanhar a tendncia
da distribuio de pontos, que pode corresponder a uma reta ou a uma curva. Por
outro lado, , tambm, uma linha mdia, porque procura deixar a mesma quanti-
dade de pontos abaixo e acima da linha.
PUC Minas Virtual 109 Probabilidade e Estatstica


25

20

15

10

5

0
0 1 2 3 4 5 6
100
90
80
70
60
50
40
30
20
10
0









0 1 2 3 4 5 6


Correlao Linear positiva
Correlao Linear negativa



8,5

8

7,5

7

6,5

6

5,5

5









0 2 4 6 8 10 12 14
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5


No h correlao Relao curvilnea direta

Figura 9.2. Diagramas de disperso de diversos tipos de correlao.




Para definir se a correlao entre as variveis corresponde a uma linha reta ou a
uma curva, pode-se utilizar modos qualitativos ou quantitativos.

No modo qualitativo, vai imperar o bom senso do pesquisador para verificar qual
o grau de intensidade na correlao entre as variveis; isso significa o estabeleci-
mento de uma relao numrica que medir o nvel da correlao.



9.3. Coeficiente de Correlao Linear (r)


O coeficiente de correlao linear pode ser apresentado como uma medida de
correlao, pois tem como objetivo indicar o nvel de intensidade que ocorre na
correlao entre as variveis. O coeficiente de correlao linear pode ser positivo ou
negativo. O sinal positivo do coeficiente de correlao linear indica que o sentido da
correlao corresponde a uma reta de inclinao descendente, e o sinal negativo
corresponde a uma reta de inclinao ascendente. Uma das formas de medir o coe-
ficiente de correlao linear foi desenvolvido por Pearson e recebe o nome de coefi-
PUC Minas Virtual 110 Probabilidade e Estatstica

i i
|
i

ciente de correlao de Pearson. O coeficiente de correlao de Pearson mede o
grau de ajustamento dos valores em torno de uma reta.


Coeficiente de Correlao de Pearson (r):

n

x
i
y
i
(

x
i
)(y
i
)

r =
n

x
2
(

x
i

)
2
|* |n

y
2
(

y )
2
|


Temos

r = o coeficiente de Pearson

n = o nmero de observaes
x
i
= varivel independente
y
i
=varivel dependente


O valor do coeficiente de correlao r tem a variao entre +1 e 1, ou seja, est
limitado entre os valores do Intervalo[-1,+1].

r = +1 (correlao positiva entre as variveis);

r = - 1 (correlao perfeita negativa entre as variveis);

r = 0 (no h correlao entre as variveis ou, ainda, a correlao no linear,
caso exista).


Quanto mais prximo o valor de r estiver do valor 1, mais forte a correlao line-
ar.

Quanto mais prximo o valor de r estiver do valor 0, mais fraca a correlao line-
ar.

Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado passa a ser
expresso em porcentagem. Na prtica, estabelecem-se critrios para verificar os
diversos nveis do fraco ao forte, chegando at o perfeito:

0<|r|<0,3 : a correlao fraca e fica difcil estabelecer relao entre as vari-
veis. Em porcentagem: 0<|r|< 30%;

0,3 o |r|< 0,6 : a correlao fraca, porm, podemos considerar a existncia de
relativa correlao entre as variveis. Em porcentagem: 30% o |r| <60%;
PUC Minas Virtual 111 Probabilidade e Estatstica
P
e
s
o

d
o

p
a
p
e
l


0,6 o |r| <1 : a correlao de mdia para forte; a relao entre as variveis
significativa, o que permite coerncia com poucos conflitos na obteno das con-
cluses. Em porcentagem: 60% o |r| o 100%.

Exemplo:

Uma pesquisa pretende verificar se h correlao significativa entre o
peso total do lixo descartado, por dia, numa empresa com o peso do
papel contido nesse lixo.


Hotel

H
1


H
2


H
3


H
4


H
5


H
6


H
7


H
8


H
9


H
10

Peso
total

10,4
7

19,85

21,2
5

24,3
6

27,38

58,09

33,6
1

35,75

38,33

49,14

Peso do
papel

2,43

5,12

6,88

6,22

8,84

8,76

7,54

8,47

9,55

11,43


De acordo com os dados, fazemos a representao grfica. Os pares ordenados
formam o diagrama de disperso.



14

12

10

8

6

4

2

0
10 20 30 40 50 60 70

Peso total do lixo



Figura 9.3. Correlao entre o peso total do lixo
descartado e o peso do papel contido nesse lixo
PUC Minas Virtual 112 Probabilidade e Estatstica

i i
|
i
r =

Para se verificar o grau de correlao entre as variveis, calcula-se o coeficiente de
correlao linear pela frmula do coeficiente de correlao de Pearson:

n

x
i
y
i
(

x
i
)(y
i
)

r =
n

x
2
(

x
i

)
2
|* |n

y
2
(

y )
2
|





Peso total (x
i
)

Peso papel (y
i
)

x
i
y
i
x
i
2
y
i
2

H
1


10,47

2,43

25,44

109,62

5,90

H
2


19,85

5,12

101,63

394,02

26,21

H
3


21,25

6,88

146,20

451,56

47,33

H
4


24,36

6,22

151,52

593,41

38,69

H
5


27,38

8,84

242,04

749,66

78,15

H
6


28,09

8,76

246,07

789,05

76,74

H
7


33,61

7,54

253,42

1129,63

56,85

H
8


35,73

8,47

302,63

1276,63

71,74

H
9


38,33

9,55

366,05

1469,19

91,20

H
10

49,14

11,43

561,67

2414,74

130,64



288,21

75,24

2396,68

9377,52

623,47




n

x
i
y
i
(

x
i
)(

y
i
)

|n

x
2
(

x

)
2
|* |n

y
2
(

y

)
2
|

i i i i


r =
10 * 2396,68 288,21* 75,24

[10 * 9377,52 (288,21)
2
] *[10 * 623,47 (75,24)
2
]


r =
23966 ,8 21684 ,9
=

[93775,2 83065 ] * [6234,7 - 5661,1]
2281,83
10 * 710,21 * 573,59
=
2281,83

2478,57

= 0,9206
PUC Minas Virtual 113 Probabilidade e Estatstica
i
2
r = 0,921 ou r = 92,1%




Observamos, assim: 0,6 o r o 1 . Esse resultado indica que h uma forte correlao

entre as variveis ou, ainda, que a correlao entre as duas variveis bastante
significativa. Nesse caso, podemos concluir haver coerncia na afirmao de que
existe correlao entre o peso total do lixo descartado e o peso do papel contido
nesse lixo.



9.4. Regresso Reta de regresso
(ou reta de mnimos quadrados ou reta de ajuste)


A correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. O grfico cartesiano que representa essa linha denominado dia-
grama de disperso. Para poder avaliar melhor a correlao entre as variveis,
interessante obter a equao da reta; essa reta chamada de reta de regresso e
a equao que a representa a equao de regresso. O diagrama de disperso
construdo de acordo com os dados amostrais de n observaes e a equao de
regresso dada pela expresso:


Y= aX + b Y = aX + b


X a varivel independente


YY a varivel dependente; na verdade, a varivel correlacionada com a vari-
vel X e sobre a qual se obtm um valor estimado.

Esse tipo de notao, de Y para Y, caracteriza que no se trata de uma relao
funcional para a determinao da reta, e sim de uma relao estatstica, em que a
distribuio est baseada em estimativas de dados colhidos por amostragem.

Sendo a e b os parmetros de equao da reta, esses podem ser calculados por
meio das frmulas:


n

x
i
y
i


x
i
*

y
i

a =

n

x
2


(

x
i
)
b = y a x
PUC Minas Virtual 114 Probabilidade e Estatstica

a =

Sendo:

n = nmero de observaes dos dados amostrais

y = valor mdio da varivel y; o clculo faz-se pela expresso


x = valor mdio da varivel x; o clculo faz-se pela expresso


y =

y
i
n
x =
=
x
i

n

Exemplo:


Determine a equao da reta de regresso do exemplo anterior, que tra-
ta de uma pesquisa entre o peso total do lixo descartado por dia com o
peso do papel contido nesse lixo.


Para a obteno da equao da reta de regresso, elabora-se inicialmente uma ta-
bela contendo nas colunas as variveis dependentes (y
i
), as independentes (x
i
) e os
produtos x
i
y
i
e x
i
2
.

Clculo do parmetro a da equao da reta:


n

x
i
y
i


x
i
*

y
i
=
10 * 2396,68 288 * 75,24
=
23996,8 - 21684,9

n

x
2
(

x )
2
10 * 9377,52 (288,21)
2
93775,2 - 83065

i i


a =
2281,83
= 0,213

10710,2


Clculo do parmetro b da equao da reta:


y =
75,24

10

= 7,52 e x =
288,21
= 28,82

10


b = y a x = 7,52 - 0,213 * 28,82 = 7,52 - 6,14 = 1,38



Uma vez calculados os parmetros a e b, pode-se escrever a equao da reta:


Y = 0,213 X + 1,38
PUC Minas Virtual 115 Probabilidade e Estatstica

Para o traado de uma reta, basta que se conhea dois de seus pontos. Assim, com
base na equao da reta acima, pode-se estabelecer dois pontos para X e Y.

Para X = 0, temos Y = 1,38

Para X = 50, temos Y = 12,03


De acordo com os pontos P
1
(0;1,38) e P
2
(50;12,03), pode-se traar a reta de re-
gresso.



14
y = 0,2131x + 1,3836
12

10

8

6

4

2

0
0 10 20 30 40 50 60



Figura 9.4. Correlao entre o peso total do lixo
descartado e o peso do papel contido nesse lixo



Com base no conhecimento da equao da reta, pode-se interpolar e extrapolar
valores.

Interpolao: a interpolao ocorre quando o valor considerado pertence ao in-
tervalo da tabela, porm, no figura entre os dados coletados.

Supondo-se o valor 15 kg para o peso total do lixo descartado, pode-se estimar o
peso de papel contido nesse lixo. Uma vez que 15 kg no um dado coletado e,
conseqentemente, no pertence tabela de dados, utiliza-se a equao da reta
para determinar o valor correspondente ao peso do papel.

Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel contido nesse
lixo.
PUC Minas Virtual 116 Probabilidade e Estatstica


Extrapolao: a extrapolao ocorre quando o valor considerado no pertence ao
intervalo da tabela, e tambm no figura entre os dados coletados.

Suponha que o peso do lixo descartado seja de 60 kg. Esse valor no um dado
coletado e nem se encontra dentro do intervalo [10,47, 49,14]. Essa situao
semelhante anterior e utiliza-se a equao de reta para determinar o peso do
papel.

Para 60 kg de lixo descartado, estima-se, por extrapolao, que haja 14,16 kg de
papel contido nesse lixo.
PUC Minas Virtual 117 Probabilidade e Estatstica

Referncias Bibliogrficas



BUSSAB, W.O. e Morettin, P.A. Estatstica Bsica. So Paulo: Atual, 1987.
FONSECA, J.S. e Martins, G.A. Curso de Estatstica. So Paulo: Atlas, 1993.
LAPPONI, J.C. Estatstica usando Excel 5 e 6. So Paulo: Lapponi Treinamento e
Editora, 1997.


MORETTIN, L.G. Estatstica Bsica Vol. 2 Inferncia. So Paulo: Makron Books,
1999.


MORETTIN, L.G. Estatstica Bsica Vol.1 Probabilidade. So Paulo: Makron Bo-
oks, 1999.


STEVENSON,W.J. Estatstica Aplicada Administrao. So Paulo: Harbra, 1996.
TIBONI,C.G. R. Estatstica Bsica para o curso de Turismo. So Paulo: Atlas, 2002.
TOLEDO, G. L. e Ovalle, I.I. Estatstica Bsica. So Paulo: Atlas, 1985.

Vous aimerez peut-être aussi