Vous êtes sur la page 1sur 94

Universidade Federal de Santa Catarina

Centro ScioEconmico
Departamento de Cincias Econmicas

Curso de graduao em Cincias Econmicas


a distncia

Introduo Estatstica
Jos Francisco Fletes

F615e Fletes, Jos Franciso




Introduo Estatstica. / Jos Franciso Fletes.


- Florianpolis : Departamento de Cincias Econmicas/UFSC, 2009.

94p. : il
Curso de Graduao Cincias Econmicas
Inclui bibliografia

ISBN 978-85-7426-064-8

1. Anlise descritiva. 2. Anlise exploratria. 3. Amostragem. 4. Hipteses. 5. Educao


a distncia I. Universidade Federal de Santa Catarina.Departamento de Cincias
Econmicas. II. Ttulo.
CDU: 519

Universidade Federal de Santa Catarina, Sistema UAB. Nenhuma parte deste material poder ser reproduzida,
transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por
escrito, dos autores.

GOVERNO FEDERAL
Presidente da Repblica
Ministro da Educao
Secretrio de Educao a Distncia
Coodenador Nacional da Universidade Aberta do brasil

Luiz Incio Lula da Silva


Fernando Hadad
Carlos Eduardo Bielschowsky
Celso Costa

Universidade Federal de Santa Catarina


Reitor
ViceReitor
Pr-Reitor de Desenvolvimento Urbano e Social
Pr-Reitora de Assuntos Estudantis
Pr-Reitora de Pesquisa e Extenso
Pr-Reitora de Ps-Graduao
Pr-reitor de Ensino de Graduao
Coordenadora de EAD/PREG
Secretrio de Planejamento e Finnaas
Secretrio de Cultura e Arte
Coordenador UAB - UFSC

lvaro Toubes Prata


Carlos Alberto Justo da Silva
Luiz Henrique Vieira Silva
Cludio Jos Amante
Dbora Peres Menezes
Maria Lucia de Barros Camargo
Yara Maria Rauh Muller
Eleonora Milano Falco Vieira
Luiz Alberton
Maria de Lourdes Alves Borges
Ccero Barboza

CENTRO SCIO-ECONMICO
Diretor Ricardo Jos Arajo Oliveira
Vice-Diretor Alexandre Marino Costa
DEPARTAMENTO DE CINCIAS ECONMICAS
Chefe do Departamento Helton Ricardo Ouriques
Sub-Chefe do Departamento Luiz Carlos de Carvalho Jnior
Coordenador Geral na modalidade a distncia Rabah Benakouche

Equipe de Produo de Material


Coordenao de Design Instrucional Fernanda Pires Teixeira
Design Instrucional Mrcia Melo
Reviso Textual Jlio Csar Ramos
Coordenao de Design Grfico Giovana Schuelter
Design Grfico Andr Rodrigues da Silva
Francielli Schuelter
Rafaella Volkmann Paschoal
Ilustraes Aurino Manuel dos Santos Neto
Design de Capa Guilherme Dias Simes
Felipe Augusto Franke
Steven Nicols Franz Pea
Projeto Editorial Andr Rodrigues da Silva
Felipe Augusto Franke
Max Vartuli
Steven Nicols Franz Pena

Unidade 1
Anlise descritiva e exploratria de dados

1.1 Fundamentos bsicos. ...........................................................................................11


Por que estudar Estatstica?.....................................................................................11
Diferena entre Estatstica e Estatsticas............................................................ 12
Conceitos Bsicos em Estatstica.......................................................................... 13
Variveis: tipos e escalas de medida....................................................................14
Amostragem................................................................................................................18

1.2 Amostragem..........................................................................................................18
Fundamentos bsicos...............................................................................................18
Amostragem............................................................................................................... 20
Conceito de amostragem....................................................................................... 20
Caractersticas das amostras................................................................................. 20
Plano amostral............................................................................................................. 21
Tamanho da amostra................................................................................................22
Tipos de amostras......................................................................................................23
Erros potenciais de pesquisa................................................................................. 26
Questes ticas.......................................................................................................... 26

1.3 Descrio e explorao de dados...................................................................... 28


Fundamentos Bsicos.............................................................................................. 28
Distribuies ou tabelas de frequncias........................................................... 29
Medidas de resumo ou de sntese.......................................................................35
Medidas de tendncia central ou de posio ou de localizao..............37
Esquema dos cinco nmeros o box-plot ................................................. 42
Medidas de disperso ou de variao............................................................... 43

Unidade 2
Teoria da probabilidade e
modelos matemticos bsicos

2.1 Probabilidade........................................................................................................51
Fundamento bsico................................................................................................... 51
Conceitos de Probabilidade.................................................................................. 54
Teoremas fundamentais de probabilidade...................................................... 59

2.2 Varivel aleatria e distribuies de probabilidade.........................................66


Conceito de varivel aleatria e tipos................................................................66
Valor esperado de uma Varivel Aleatria Conceito geral......................... 69
Varincia de uma varivel aleatria conceito geral....................................... 71
Modelos matemticos probabilsticos............................................................... 71

Unidade 3
Inferncia estatstica

3.1 Estimao de parmetros.................................................................................... 75


Fundamentos bsicos...............................................................................................75
Propriedades de um estimador.............................................................................76
Erro amostral ()..........................................................................................................77
Distribuio amostral de mdias..........................................................................79
Erro padro da mdia...............................................................................................81
Intervalos de confiana........................................................................................... 82

3.2 Teste de hipteses.................................................................................................84


Fundamentos bsicos.............................................................................................. 84
Erros num teste de hipteses...............................................................................86
Etapas bsicas de um teste de hiptese............................................................87

Palavra do professor
Prezado (a) acadmico (a) do Curso de Cincias Econmicas:
Seja bem-vindo (a) Estatstica!
Voc est iniciando uma viagem que considero fascinante! E espero que
esta seja a sua opinio medida que for descobrindo as diversas paisagens
que a disciplina ir nos permitir.
Parafraseando Galileu Galilei, aprenderemos a lidar com a linguagem do
universo, a matemtica aplicada ao nosso cotidiano pessoal e profissional,
para entender melhor a realidade.
Nesta disciplina teremos como foco principal a viso prtica baseada na
inter e na transdisciplinaridade como base da apropriao autnoma e
independente, construindo novos conhecimentos em seu fazer cotidiano.
com esse esprito que voc ir resolver problemas concretos oriundos
do seu dia a dia, comeando pela sua casa (oikia ou domus) resgatando
assim a origem da disciplina economia (oiko nomos), buscando integrar a teoria com a prtica, bem como as diversas disciplinas com que a
Estatstica tem uma relao direta (Econometria, por exemplo) e indireta
(Auditoria, Teoria da deciso, Logstica, Teoria dos jogos, Controle estatstico de qualidade,).
Espero que nesta jornada, consigamos desfrutar de resultados prazerosos
e que um novo degrau pessoal e profissional seja a continuidade do que
representa a vida nas suas descontinuidades.
Estou sua inteira disposio para dirimir quaisquer dvidas na soluo
de problemas reais que voc ir enfrentar.
Mais uma vez, bem-vindo jornada da Estatstica!
Prof. Jos Francisco Danilo de Guadalupe Correa Fletes

Unidade 1

Anlise descritiva e
exploratria de dados
A Anlise descritiva de dados considerada a fase inicial do processo no estudo
das unidades coletadas de uma ou mais amostras. Nesta etapa, utilizar-se-o
tcnicas que resumem (ou sintetizam) e classificam os dados de forma a obter as
informaes que sero utilizadas na etapa de Inferncia Estatstica (Unidade 3).
A Anlise exploratria uma filosofia que privilegia a percepo grfica visando a um melhor discernimento do comportamento dos dados, bem como para
descobrir padres, anomalias e desenvolver modelos matemticos adequados
aplicados na teoria das probabilidades e na Inferncia Estatstica.

1.1 Fundamentos bsicos


1.1.1 Por que estudar Estatstica?
H um sculo, H. G. Wells dizia Raciocinar estatisticamente
ser um dia to necessrio quanto a habilidade de ler e escrever.
Na atualidade, a questo colocada para profissionais que lidam
com dados e informao de como utilizar o que se tem disponvel para tomar melhores decises.
Estuda-se Estatstica porque o instrumento em trabalhos de pesquisa que
requerem a anlise de dados, em que o pesquisador ou o cientista:
Precisa saber como apresentar e descrever dados para resumi-los em informaes de forma adequada.
Precisa saber como tirar concluses a partir de uma ou mais populaes
com base nos dados e informaes obtidos de uma ou mais amostras.
Precisa saber como melhorar processos de sua rea de atuao.
Estuda-se Estatstica para aplicar seus conceitos como instrumento nas tomadas
de decises diante de incertezas, justificando-se cientificamente tais decises.
A Estatstica compreende o planejamento e a execuo de pesquisas, a descrio
e explorao dos dados e a formulao de predies com base nesses resultados.

11

Introduo Estatstica

Palavra do Professor
Todos os conceitos e princpios estatsticos que iro ser abordados aqui so utilizados em vrias situaes reais, como nas aes governamentais, nos negcios, na
indstria, nas reas das cincias sociais, biolgicas e da sade.

1.1.2 Diferena entre Estatstica e Estatsticas


Muitas pessoas confundem a palavra Estatstica, no singular, e estatsticas,
no plural considerando-as, na linguagem cotidiana, como sinnimos. Como
um profissional que aplique os conceitos e princpios da disciplina, voc, futuro economista, precisa saber as diferenas entre uma e outra; por isso vamos
detalhar a seguir:
Estatstica, no singular, refere-se a um conjunto de tcnicas e mtodos que
entre outros tpicos pressupe o planejamento, a coleta, o processamento dos
dados, a anlise dos resultados-informaes, a inferncia, se for o caso, e a
disseminao das informaes.
O desenvolvimento e o aperfeioamento de tcnicas de obteno e de anlise de dados permitem o controle e o estudo adequado de fenmenos, fatos,
eventos e ocorrncias em diversas reas do conhecimento. A Estatstica tem
por objetivo fornecer mtodos e tcnicas para lidarmos, racionalmente, com
situaes sujeitas a incertezas.
Estatsticas, no plural, refere-se a registros de dados estatsticos que tm por
finalidade precisa melhor delimitar um determinado fenmeno ou fato para
melhor control-lo ou nele intervir. Progressivamente, esta finalidade social
e poltica se desdobraram numa finalidade cientfica, que a de melhorar o
conhecimento de certos fenmenos sociais ou humanos.
A crena na ideia de que um conhecimento quantificado dos fatos da sociedade permite melhor conhec-los e eventualmente modific-los muito promissora, tanto para os administradores do Estado quanto para os cientistas.

12

Unidade 1

Saiba Mais

Acesse:
http://www.ence.ibge.gov.br/estatistica/default.asp
http://www.estatistica.ccet.ufrn.br/

1.1.3 Conceitos Bsicos em Estatstica


A estatstica possui termos especficos relativos s fases de uma pesquisa e os
tipos de anlise ou procedimento adotados, alm da origem do conjunto de
dados. Alguns termos so por demais conhecidos por serem frequentemente
utilizados ou citados no dia a dia do pesquisador. Outros, todavia sero apresentados e discutidos ao longo do texto, quando de sua utilizao ou descrio.
Alguns termos mais usuais, dentro da proposta do curso, esto descritos, a
seguir, para familiarizar o leitor com o linguajar estatstico.
Parmetro: uma medida obtida para um conjunto de dados que coletou caractersticas ou valores para todo o grupo populao. Os parmetros com os
quais iremos lidar na disciplina so: a mdia da populao (), a varincia da
populao (2) e a proporo de sucesso da populao ().
Estimador ou Estatstica: uma medida obtida para o subconjunto de dados ou amostra. Os estimadores ou estatsticas com os quais iremos lidar na
disciplina so: a mdia da amostra ( X ), a varincia da populao (s2) e a
proporo de sucesso da populao (p).
Populao ou Universo experimental: o conjunto total de itens, objetos ou
pessoas, entes, enfim, que se pretendem analisar ou buscar levantar dados
que vo gerar informaes.
Amostra: uma parte ou subconjunto dos elementos do grupo, definida previamente e obtida atravs de regras a fim de que seja significativa (quanto
ao nmero de elementos) e se mostre representativa (possua basicamente as
mesmas caractersticas) do todo.
A relao entre as medidas obtidas num estudo envolvendo a populao ou
uma parte dela (amostra) est resumida na Figura 1.1, veja:

13

Introduo Estatstica

Populao

Amostra

=?

X1, X2, X3, ..., Xn


X=Varivel de Estudo

n observaes de X

Amostrage
Inferncia

Figura 1.1 - Relaes observadas em estudos da populao ou por amostragem.


Fonte: Elaborado pelo autor

1.1.4 Variveis: tipos e escalas de medida


As variveis resultantes de um levantamento estatstico podem ser classificadas
basicamente em: qualitativas (nominais e ordinais), quantitativas (discretas
e contnuas) e de escala.
No caso de escala, empregadas em mtodos de pesquisa de Survey, existem as escalas de Likert, de Bogardus, Thurstone e de Guttman (BABBIE, 2005, p.232-240).
Classificao das
Variveis

Qualitativas:

As observaes so
atributos ou
caractersticas possveis
de observao nos
elementos amostrados.

Nominais:

Apenas para identificar


com nome as categorias.

Ordinais:

De Escala:

As observaes
representam atitudes,
valoraes ou
sentimentos em
relao
questo investigada.

possvel ordenar
as categorias.

So nmeros
resultantes
de contagens ou
medidas dos
elementos
amostrados.

Discretas:

Conjunto limitado
de valores

Contnuas:

Qualquer valor num


intervalo de valores

Figura 1.2 Classificao das variveis quanto aos possveis valores.


Fonte: Elaborado pelo autor

14

Unidade 1

Ainda sobre as variveis envolvidas no estudo importante ter claro o nvel


de medio (FOX & LEVIN, 2004 p. 10) delas, pois os procedimentos ou a
tcnica estatstica a ser utilizada dependem dessa medio.
Nvel nominal:
Este nvel envolve o simples ato de nomear ou rotular um item resultante da
observao de uma varivel. A varivel pode assumir categorias ou classificaes, mas estas no possuem hierarquia apenas estabelecem preferncia.
O resultado faz parte de uma ou outra categoria no sendo mais ou menos
relevante, importante ou prioritria na observao.
Exemplo 1.1.1: Sexo, Naturalidade, Curso, Filiao partidria, Tipo de seguro
que possui.
Nvel ordinal (ou de rank):
Se uma varivel do tipo nominal permitir estabelecer para cada uma das categorias ou classificaes obtidas uma relao de ordem ou de hierarquia, teremos
ento uma varivel ordinal. A relao pode ser do tipo maior do que, mais
importante, mais caro. O resultado de cada observao estabelece uma ordem
(ou rank) em que categoria ser alocada numa posio de escala de valorao.
Exemplo 1.1.2: Classe social, Escolaridade, Fase no curso, Nvel de satisfao
de clientes, Classificao de filmes.
Nvel intervalar:
uma escala ordenada em que a diferena entre as medies representa uma
quantidade significativa. Por exemplo, ao meio-dia, uma leitura de temperatura de 32C dois graus Celsius mais quente do que uma leitura de temperatura
de 30C. Alm disso, a diferena tem o mesmo significado em qualquer ponto
da escala.
Exemplo 1.1.3: Temperatura (em graus Celsius ou Fahrenheit), Calendrio
(Gregoriano, Hebraico ou Islmico).
a) Nvel de razo (ou de proporcionalidade):
Se numa varivel, alm de as diferenas serem significativas e iguais em todos
os pontos da escala, existir um ponto de partida inerente (um zero verdadeiro) de modo que as proporcionalidades das medies sejam sensveis para se
considerar, ento a escala uma escala de razo ou de proporcionalidade.

15

Introduo Estatstica

Exemplo 1.1.4: Altura (em cm ou polegadas), Peso (em kg ou lb), Idade


(em anos ou dias), Salrio (em R$ ou US$)
Observao importante: a temperatura um caso sutil, pois as escalas Celsius ou
Fahrenheit so escalas de intervalo e no de proporcionalidade, j que a demarcao do
zero arbitrria, no real. No entanto, quando medida a partir de um zero absoluto,
como na escala Kelvin, a temperatura est numa escala de proporcionalidade.

Na maioria das situaes, podemos classificar as variveis com nveis de mensurao nominal ou ordinal como qualitativas, enquanto que aquelas com
nveis intervalar ou de razo, como quantitativas.
Deve-se destacar que algumas variveis podem ser observadas (medidas) por
mais de um nvel, dependendo do objetivo da anlise.

Uma definio operacional


fornece um significado
para um conceito ou
varivel que pode ser
comunicado a outros indivduos. algo que tem o
mesmo significado ontem,
hoje e amanh para todos
os indivduos.

Por exemplo, pode-se perguntar a um usurio de algum servio sobre a sua


satisfao com o servio oferecido. Se for utilizada uma escala intervalar
pode-se pedir que atribua uma nota de zero a dez; j no caso de uma escala ordinal, a classificao pode ser feita por uma escala do tipo Insatisfeito,
Pouco Satisfeito, Satisfeito, Muito Satisfeito.

IMPORTANTE:
A Necessidade de definies operacionais
Independentemente do nvel de medio das variveis, definies operacionais
so necessrias para obter a resposta apropriada ou alcanar o produto apropriado.
No contexto de uma pesquisa, numa pergunta Qual a sua idade?. Para
evitar problemas de ambiguidade, deve-se desenvolver uma definio operacional para as respostas pergunta. Por exemplo, deve-se deixar claro se a
idade seria ao aniversrio mais prximo ou ao ltimo aniversrio, uma vez
que, se seu aniversrio no prximo ms, voc provavelmente escolheria o
prximo aniversrio se fosse completar 21 anos; no entanto, iria escolher sua
idade atual se estivesse completando 60 anos!
Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc,
releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga em
frente com dvidas, pois isso pode comprometer todo o seu aprendizado.

16

Unidade 1

Atividade de Aprendizagem 1.1


Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Atividade 1.1.1: Prepare uma definio operacional para cada um dos itens abaixo:
a) um dia agradvel;
b) um bom zagueiro;
c) um desempenho extraordinrio;
d) um aluno esforado;
e) pede-se no fumar e proibido fumar;
f ) um indivduo dinmico;
g) uma aula montona;
h) um livro interessante;
i) tempo de percurso para o trabalho;
j) a chegada do transporte coletivo no horrio.
Atividade 1.1.2: Desafio individual: um caso prtico
No seu municpio, os postos de combustveis afixam os preos em local visvel ao
consumidor.
Um grupo de pessoas numa reunio social em que voc participa comenta que os
preos praticados pelos postos praticamente demonstram que no h concorrncia
entre eles. Isto , os preos so uma constante. Voc diante desse comentrio ir
verificar com dados que mostrem essa evidncia. Para isso planeja uma coleta de
preos, considerando uma srie de caractersticas sobre a situao:
1 Elabore uma planilha para a coleta dos preos e registre o valor para cada tipo
de combustvel, segundo a localizao e a bandeira do posto. Assim, a planilha
contemplaria:
Posto
bairro

...

bandeira
gasolina comum
gasolina aditivada
diesel
lcool
observao

Na observao: registre o endereo do posto e alguma caracterstica especfica do


estabelecimento.

17

Introduo Estatstica
2 Faa a coleta dos preos considerando os diversos bairros da cidade e as vrias
bandeiras concorrentes.
3 Qual seria uma amostra significativa? Vamos coletar no mnimo em trinta (30)
postos de combustveis. Considere que o acesso ao preo, neste caso, fcil e rpido,
pois a tabela exposta ao pblico.
Obs.: nas prximas sees vamos abordar como analisar os dados coletados.
Atividade 1.1.3: Continuidade do caso prtico (aps a coleta dos dados)
Digite os dados coletados numa planilha Excel (extenso .xls), reproduzindo a planilha de dados acima (nas linhas os postos e nas colunas as caractersticas levantadas).
Identifique a planilha: COMBUSTVEIS.
Acesse o SestatNet e importe os dados, salvando no seu ambiente de trabalho.

Saiba Mais

Para aprofundar os conceitos estudados nesta Unidade consulte:


http://www.fortunecity.com/skyscraper/deschutes/745/id20.htm
http://www.ence.ibge.gov.br/estatistica/default.asp
http://www.estatistica.ccet.ufrn.br

Resumo da unidade:
Nesta seo voc estudou os fundamentos bsicos que permitiro compreender as
tcnicas de amostragem no processo de coleta de dados (seo1.2), bem como as
tcnicas analticas a serem empregadas no resumo de dados (seo1.3).
E importante ter claro os conceitos bsicos vistos no item 1.1.3, assim como os tipos
de variveis com os quais iremos lidar na anlise dos dados.

1.2 Amostragem
1.2.1 Fundamentos bsicos
Existem situaes especficas em que podemos ter acesso a toda a populao
para estudar caractersticas de interesse, o que resulta num estudo por Censo.
No entanto, na maioria das situaes, tal procedimento no pode ser realizado,
por alguns fatores limitantes:

18

Unidade 1

1. por dificuldade de acesso ao dado;


2. por inviabilidade econmica, devido aos custos envolvidos;
3. por uma questo de tempo em obter todas as unidades.
H ainda outras razes ticas (quando os experimentos de laboratrio envolvem o uso de seres vivos ou em casos de pesquisa com questes de foro ntimo), quando de inacessibilidade a toda a populao (uma produo industrial
qualquer, os acidentados em rodovias federais).
No estudo de uma populao, uma questo que deve tambm ser considerada
quanto ao nmero de elementos que a compe, muitas vezes um nmero
infinito ou um nmero muito grande.
Tendo em vista as dificuldades em observar todos os elementos da populao,
selecionaremos alguns deles para formar uma parcela a ser analisada. A essa
parte proveniente da populao em estudo denominamos amostra.
Uma amostra sempre um subconjunto finito de uma populao.
Figura 1.3 Elementos da populao selecionados para compor a amostra.

Populao
(N )

Amostra
(n<<N)

Fonte: Elaborado pelo autor

Uma amostra usualmente envolve o estudo de uma parcela dos itens de uma
populao, enquanto que um censo requer o exame de todos os itens. Embora
concentremos nossa ateno nas amostras, conveniente considerar tambm a
alternativa do censo. primeira vista pode parecer que a inspeo completa ou
total de todos os itens de uma populao seja mais conveniente do que a inspeo de apenas uma amostra deles. Na prtica, o contrrio quase sempre vlido.
Qualquer instituto ou entidade de pesquisa recorrer amostragem, por vrias razes. O custo geralmente o fator determinante para a deciso. Coletar
dados e analisar resultados envolve muitos recursos monetrios e humanos;

19

Introduo Estatstica

claro que quanto maior o nmero de dados a coletar, maior o custo. Outra
razo para o emprego de amostragem que o valor da informao dura pouco.
Para ser til, a informao deve ser obtida e usada temporalmente. A amostragem a alternativa tcnica de se fazer isso.

1.2.2 Amostragem
A amostragem utilizada cotidianamente com o propsito de
avaliar (inferir) sobre o valor, a qualidade ou caractersticas
de determinado item de interesse em uma populao.

Clinica: Reunio em
que se disponibiliza o
produto/bem para os
eventuais compradores/
consumidores para anlise,
comentrios, crticas e/ou
sugestes.

Uma indstria de veculos decide lanar um novo produto


no mercado e, buscando caractersticas especficas dos consumidores, realiza uma clnica*, amostra, (pessoas previamente escolhidas a
partir de um perfil de idade, caractersticas de consumo e renda) consideradas
entre todos os potenciais compradores (populao) para analisar o produto em
questo.
Uma parte da populao (amostra), tomada com base em critrios estatsticos possibilita estimar a partir dos resultados, estimativas dessa amostra
(valores aproximados) para as caractersticas populacionais de interesse (os
parmetros).
O processo de estimao, que busca o valor do parmetro (, ou ) atravs
do valor de uma estatstica (X, s ou p ) ser abordado na Unidade 3.

1.2.3 Conceito de amostragem


Amostragem a parte da Estatstica que rene os mtodos e tcnicas adequados
para coletar dados de uma populao formando amostras representativas e significativas, de preferncia aleatrias, que propiciem que os resultados obtidos
possam ser generalizados para a populao da qual as amostras foram obtidas.

1.2.4 Caractersticas das amostras


As amostras devem atender a alguns aspectos para que o sucesso da amostragem se reflita numa estimao adequada de resultados o mais aproximado da
realidade possvel.

20

Unidade 1

Representao: a caracterstica de representatividade diz respeito capacidade da amostra em reproduzir a populao quanto aos aspectos de
suas caractersticas prprias. Assim, por exemplo, se estiver analisando
a preferncia pela grade de programao de uma emissora de TV, o sexo,
a idade, o grau de instruo, a classe social entre outras devem ser consideradas.
Significao: o tamanho da amostra deve ser suficiente para representar
a variabilidade presente na populao e deve ser tanto maior quanto
maior for a variabilidade da populao. No exemplo da programao da
TV, as caractersticas intrnsecas da populao devem ser consideradas
e quantificadas previamente.
Aleatoriedade: se os elementos que compem a amostra foram obtidos
por um processo aleatrio (por sorteio, ao acaso) todos teriam chance
de fazer parte da amostra, sendo possvel calcular o erro amostral quando da aplicao da tcnica de estimao.
Palavra do Professor
Embora nenhum plano de amostragem possa garantir que a amostra seja exatamente semelhante populao da qual foi extrada, uma amostra aleatria permite
estimar o valor do erro possvel, isto , dizer quo prxima est a amostra da populao, em termos de representatividade, motivo pelo qual se procura trabalhar com as
amostras probabilsticas.

1.2.5 Plano amostral


O plano amostral de uma pesquisa consiste na descrio dos tpicos associada
a um levantamento por amostragem:
Definir o problema a estudar.
Estabelecer os objetivos: geral e especficos.
Definir a populao-alvo.
Limitar os dados a ser coletados.
Estabelecer o grau de preciso desejada.
Definir o instrumento para o levantamento dos dados.

21

Introduo Estatstica

Definir o mtodo de medida.


Definir as unidades amostrais.
Definir a tcnica, o tipo e a forma da amostragem.
Realizar o pr-teste do instrumento e a verificao preliminar.
Organizar a estrutura para o trabalho de campo.
Executar o levantamento dos dados.
Digitar, criticar e analisar os dados.
Obter concluses.
Fazer recomendaes e sugestes para outros trabalhos.
Elaborar relatrio tcnico e gerencial.
Divulgar os resultados.

1.2.6 Tamanho da amostra


O tamanho da amostra depende de muitos fatores, entre os quais se podem
citar a heterogeneidade da varivel em estudo, o tipo de parmetro (=mdia,
=proporo, s=desvio padro, entre outros) que se pretende estimar, os
recursos fsicos, temporais e materiais disponveis, e fundamentalmente do
objetivo de anlise que se pretende realizar com os dados amostrais.
Dada a complexidade deste estudo, vamos restringi-lo aos casos em que se deseje estimar mdias ou propores. Assim, busca-se inicialmente o tamanho
mnimo de uma amostra para estimar, por exemplo, a proporo de votos em
um dado candidato eleio de um municpio, considerando uma amostra
aleatria simples.
Para o clculo do tamanho da amostra necessrio previamente especificar
o erro amostral (ou seja, quanto o pesquisador admite, est disposto a errar,
na avaliao do parmetro). Este considerado num enfoque probabilstico,
considerando que, por maior que seja a amostra, existe sempre o risco de ela
possuir caractersticas diversas da populao da qual foi extrada.
Para uma amostra considerando a estimao de uma proporo vai-se considerar a seguinte expresso:

22

Unidade 1

n0=1/e2
a qual, como pode ser vista, no leva em considerao o tamanho da populao.
Vamos considerar os seguintes termos:
n0 = valor inicial para o tamanho da amostra;
e = erro amostral considerado;
N = tamanho da populao (nmero de elementos da populao).
Agora com o tamanho da populao declarado, pode-se modificar a expresso
inicial do tamanho da amostra para a seguinte:

n=(N* n0)/(N+ n0)

1.2.7 Tipos de amostras


Existem basicamente duas espcies de amostras: amostra probabilstica e
amostra no probabilstica.
As populaes das quais as amostras so obtidas podem ser finitas ou infinitas;
todavia, as amostras so sempre finitas no interesse de se poder observar e calcular medidas de sntese, elaborar tabelas ou grficos sobre as variveis de interesse.

1.2.7.1 Amostragem probabilstica


Uma amostragem ser dita probabilstica, se todos os entes
(elementos) da populao tiverem probabilidade conhecida
e maior do que zero de pertencer amostra

Casual ou aleatria simples Neste tipo de amostragem, cada elemento da populao tem probabilidade conhecida, diferente de zero e idntica dos
outros, dada por n/N, de ser selecionado para compor
a amostra. Cada elemento da populao deve estar
identificado por um nmero ou rtulo. adequada quando a populao
tiver um comportamento homogneo com relao varivel principal
em estudo.

Sistemtica Pode ser considerada uma derivao da casual. Se a populao for grande e a amostra necessria ao estudo tambm, o processo
de sortear n, de N elementos pode se tornar demorado e a repetio

23

Introduo Estatstica

de itens j sorteados podem aparecer seguidamente. Para este procedimento os elementos na populao devem aparecem em listas ordenadas.
Definido o tamanho da amostra n de uma populao de N elementos,
uma razo calculada k=N/n, aps o que um nmero entre, um e k, sorteado
correspondendo ordem do primeiro elemento na lista a compor a amostra,
sendo os demais obtidos pela soma da razo ordem do nmero imediatamente anterior.
Estratificada: muito comum que a populao de uma pesquisa seja
heterognea com relao aos objetivos da pesquisa, mas possvel identificar grupos dentro da populao, os quais tm caractersticas semelhantes dentro do grupo, mas diversas de outros. O estudo est focado
na populao; assim, preciso garantir a participao de indivduos na
amostra com as mais diversas caractersticas.
Definidos os estratos, estes passam a ser considerados, cada um, como uma
subpopulao diferente, e os elementos que comporo a amostra podero ser
obtidos atravs de uma das tcnicas j citadas (simples ou sistemtica), dependendo de como a populao est identificada.
Nesse caso a amostragem estratificada permite trs variaes que so:
Uniforme: sorteado o mesmo nmero de indivduos em cada estrato.
Proporcional: o nmero de indivduos que compor a amostra proporcional ao tamanho de cada estrato.
tima: alm do tamanho de cada estrato levada em considerao tambm a variao dentro de cada estrato da varivel principal da pesquisa.
Problemas: A amostragem estratificada mais difcil de ser aplicada por ter-se
que previamente definir os estratos, o que exige um bom conhecimento da
populao e da distribuio dos elementos dentro dela.

Exaustivos: cada elemento


da populao deve pertencer a um s estrato, e a
unio de todos os estratos
restaura a populao.

No caso da estratificada uniforme, temos problema com a relao tamanho


amostra x estrato; no caso da proporcional, algum estrato pode ficar minimamente representado; e na tima, temos o problema de ter que levantar
antecipadamente (antes de tomar os elementos) a variao em cada estrato.
Os estratos devem, alm de um comportamento homogneo dentro de cada um
(e diferenciado de um para outro), ser mutuamente exclusivos e exaustivos. A
maior dificuldade em sua aplicao o fato de o conhecimento necessrio sobre
a populao na maioria das vezes no existir ou ser muito custoso de obter.

24

Unidade 1

1.2.7.2 Amostragem no probabilstica


Nas amostragens no probabilsticas, todo ente da populao
tem probabilidade maior do que zero, todavia desconhecida,
de pertencer amostra.

A esmo ou sem norma: um processo que pretende simular uma amostra aleatria; todavia no se realiza nenhum
sorteio. O pesquisador quer obter itens da populao; contudo, no possvel, por qualquer motivo prtico, identificar e numerar cada elemento
da populao.

Intencional ou por julgamento: neste caso o pesquisador deliberadamente escolhe baseado num pr-conhecimento ou julgamento os elementos da populao que comporo sua amostra. Um problema neste
tipo de amostragem o de que na avaliao prvia tenha havido equvocos.
Por cotas: esta parece simular uma amostragem estratificada, s que no
so feitos os sorteios. A populao dividida em subgrupos dos quais
so tomados os elementos que comporo a amostra de maneira proporcional ao tamanho do subgrupo. Um problema que a escolha do
elemento da amostra fica a critrio pessoal ou da oportunidade que se
oferece ao pesquisador.
Populao disponvel: quando a totalidade da populao-objeto (aquela da qual se tem interesse em realizar o estudo) no est acessvel, os
elementos que comporo a amostra sero obtidos daqueles acessveis
(populao amostrada) e as concluses do estudo dependero da semelhana entre as duas.
Material contnuo: se estiver fazendo uma verificao quanto qualidade da gua, ao rudo numa indstria, a partculas suspensas em um
ambiente qualquer, no h possibilidade de numerar e sortear elementos da populao.
Outros tipos de amostragem probabilstica, aqui no estudados, so: bola de neve,
de voluntrios, de populaes infinitas e de estudos comparativos.

25

Introduo Estatstica

1.2.8 Erros potenciais de pesquisa


O primeiro passo na avaliao da validade de uma pesquisa determinar se
ela teve como base uma amostra probabilstica ou no probabilstica.
Vimos que o nico modo de realizar inferncias estatsticas corretas de uma
amostra para uma populao e interpretar os resultados pelo uso de uma
amostra probabilstica. Pesquisas que empregam mtodos de amostragem
no probabilstica esto sujeitas a erros (ou vis), embora no intencionais,
mas que podem apresentar resultados sem qualquer significado.
Mesmo quando se empregam mtodos de amostragem probabilstica, as pesquisas esto sujeitas a erros potenciais, entre os quais:
1. Erro de abrangncia (ou cobertura), ou vis de seleo, resulta da excluso de certos grupos de entes da populao, de modo que eles no tm
a chance de ser selecionados na amostra, decorrendo o vis de seleo.
Qualquer amostra probabilstica selecionada ir fornecer uma estimativa das caractersticas da populao-alvo, e no da populao real.
2. Erro por falta de resposta, ou vis por falta de resposta, resulta da falha
em coletar dados de todos os entes da amostra, decorrendo o vis por
falta de resposta, pois nem todos os entes se dispem a responder a uma
pesquisa.
3. Erro de amostragem reflete a heterogeneidade ou diferena de oportunidade de amostra para amostra, com base na probabilidade de os entes
serem selecionados nas amostras em particular.
4. Erro de medio refere-se falta de exatido das respostas registradas em instrumento que visam reunir informaes significativas, o que
ocorre por deficincia na formulao da pergunta, por um efeito causado pelo entrevistador sobre o informante, ou por causa do esforo
realizado pelo informante.

1.2.9 Questes ticas


Nem todo estudo de pesquisa bom, significativo ou importante, e nem todo
estudo de pesquisa tico. Diante desta constatao, devemos nos tornar saudavelmente cticos e avaliar de forma criteriosa, com esprito crtico, o que
lemos e ouvimos. Devemos examinar o objetivo da pesquisa, por que ela foi
conduzida, para quem, e ento descart-la se considerarmos que carece de
objetividade ou de credibilidade.

26

Unidade 1

Consideraes ticas surgem em relao aos erros potenciais


que podem ocorrer ao projetar pesquisas que usam amostras
probabilsticas.
Assim, devemos tentar distinguir projetos precrios de projetos antiticos, pois a chave a inteno!
Erro de cobertura, ou vis de seleo, torna-se uma questo tica somente se
grupos ou entes especficos forem intencionalmente excludos da estrutura
da populao, de modo que os resultados da pesquisa tendam a indicar uma
posio mais favorvel para o patrocinador.
Erro por falta de resposta, ou vis por falta de resposta, torna-se uma questo
tica somente se grupos ou entes especficos tiverem menor probabilidade de
estar disponveis para responder a um modelo de pesquisa, e o patrocinador
intencionalmente projetar com intuito de excluir tais grupos ou entes.
Palavra do Professor
No entanto, erro de amostragem torna-se uma questo tica em qualquer das situaes antes descritas, pois o patrocinador pode intencionalmente escolher perguntas direcionadas que iriam conduzir as repostas numa direo especfica. Alm
disso, o informante que menospreze o processo de pesquisa pode intencionalmente
fornecer falsas informaes enquanto dado a ser analisado.

Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu


prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para
voc, releia o contedo. Se a dvida persistir solicite ajuda de seu tutor. No siga
em frente com dvidas, pois isso pode comprometer todo o seu aprendizado.
Atividade de Aprendizagem 1.2
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Atividade 1.2.1: Uma concessionria de sua cidade tem um showroom para carros.
O Gerente est pensando em fazer painis de propaganda ao longo da estrada bem
movimentada, que o principal acesso cidade onde a concessionria est localizada. Ele est interessado no tipo de carro que passa pela estrada, que seria um
indicador do mercado local. Voc contratado, como consultor, para determinar se
vale a pena fazer a propaganda, apresentando um relatrio sobre quantos carros do
tipo certo passam pela estrada. O que voc proporia em termos de amostragem?
Discorra com base no abordado nas sees, at o momento.

27

Introduo Estatstica
Atividade 1.2.2: Uma determinada rede de loja de roupas masculina e feminina tem
100 filiais espalhadas pelas diversas regies do pas. O Gerente Geral deseja aplicar
um pequeno questionrio a uma amostra de pessoas que entram na loja. Um dos
objetivos traados para a pesquisa determinar a proporo de clientes que fizeram uma compra, considerando um grau de preciso (erro amostral) de 5%; o outro investigar os mritos da loja em relao aos competidores. Voc contratado
com consultor para propor um plano amostral e determinar o tamanho da amostra.
Considere que durante a hora do almoo cada loja particularmente cheia e o custo
de enviar entrevistadores para todas as filiais proibitivo. Faa tambm qualquer
suposio para seu planejamento (por exemplo, a distribuio geogrfica das lojas).

Saiba Mais

Para aprofundar os conceitos estudados nesta Unidade, consulte:


http://www.ence.ibge.gov.br/estatistica/default.asp

Resumo da unidade:
Nesta seo voc estudou as principais tcnicas de amostragem. fundamental ter
claro os itens que compem um Plano Amostral, para aplic-lo num trabalho de pesquisa com levantamento de dados, bem como os erros potenciais de pesquisa e as
questes ticas com que se defronta o profissional.

1.3 Descrio e explorao de dados


1.3.1 Fundamentos Bsicos
Aps estruturar a tabela de dados (exemplo dos preos dos combustveis
seo 1.1) onde se tem linhas e colunas, faa uma primeira leitura dos dados,
em que:
nas linhas, dispem-se as unidades objeto de estudo, procurando como
avaliar os semelhantes para agrup-los, e
nas colunas, dispem-se as variveis de interesse para verificar as associaes.

28

Unidade 1

Assim, a descrio e explorao dos dados tm por finalidade descrever os dados observados (amostra) procurando como extrair o mximo de informao.
Nesta fase utilizam-se:
a) tcnicas de agrupamento: distribuies ou tabelas de frequncias;
b) tcnicas grficas: ramo-e-folhas, histograma, curva de frequncia e boxplot (diagrama em caixa);
c) tcnicas analticas atravs do clculo de medidas de resumo: medidas
de tendncia central (ou de posio), de disperso (ou de variao) e de
forma (assimetria).
Objetivos bsicos no emprego dessas tcnicas:
1. obter o mximo de informao dos dados;
2. descobrir padres de comportamento ou estruturas bsicas;
3. identificar anomalias e/ou dados discrepantes (outliers)
4. obter modelos matemticos adequados (a ser abordado na Unidade 2)
que viabilizem a inferncia estatstica (a ser abordado na Unidade 3).

1.3.2 Distribuies ou tabelas de frequncias


A partir da Tabela de Dados na qual se apresentam os dados brutos coletados
e que compe a amostra a ser analisada, a primeira etapa recomendada a de
resumir o conjunto de dados em distribuio ou tabela de frequncias.
Assim,
Uma distribuio ou tabela de frequncias o agrupamento atravs da organizao dos valores observados para a varivel de interesse, em ordem crescente ou decrescente de grandeza, subdividindo em categorias ou classes, indicando o nmero
de ocorrncias em cada classe, relacionando cada valor (ou classe de valores) com a
frequncia de ocorrncia.

Considerando o tamanho da amostra, abordaremos dois casos.


Caso 1 Amostra menor do que 30 unidades (n < 30), o tratamento aos dados
ser SEM PERDA DE INFORMAO, isto , eles sero analisados tal como
coletados, obtendo-se a tabela de frequncias.

29

Introduo Estatstica

Exemplo 1.3.1: Suponha que voc conseguiu coletar os preos (R$) em dez (10)
postos de combustveis, obtendo os dados no site da Agncia Nacional de
Petrleo (A.N.P), resultando nos dados abaixo:
Tabela 1.1 Tabela de Freqncias conjunto de dados
Posto

Bandeira

Gasolina
Comum

Gasolina
Aditivada

lcool

BR

2,599

2,699

1,699

TEXACO

2,579

2,679

1,679

IPIRANGA

2,549

2,649

1,649

BR

2,599

2,659

1,659

IPIRANGA

2,549

2,699

1,699

SHELL

2,599

2,699

1,699

TEXACO

2,579

2,659

1,659

BR

2,599

2,659

1,659

SHELL

2,599

2,659

1,659

10

BR

2,599

2,699

1,699

Fonte: ANP

Desejando analisar o preo da Gasolina Comum, listam-se todos os valores


em ordem (crescente ou decrescente), marcando as vezes em que aparece,
incluindo as repeties, contando o nmero de ocorrncias de cada valor (frequncia absoluta ou frequncia).
Assim, o preo da Gasolina Comum resultaria em:
Tabela 1.2 Tabela de Freqncias - preo da gasolina comum
Preo da G.C

Contagem

Frequncia

2,549

II

2,579

II

2,599

IIIII I

Fonte: ANP

Organizada numa tabela de frequncias, sem perda de informao, seria apresentada como segue:

30

Unidade 1

Tabela 1.3 preo da gasolina comum*

* municpio Florianpolis/
SC dez. 08

Preo
Gas.Comum

Frequncia
(Num. Postos)

2,549

2,579

2,599

Total

10
Fonte: A.N.P

Atividade de Aprendizagem 1.3a


Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Tarefa individual 1.3.1: Construa a tabela de frequncias, sem perda de informao, para os preos dos outros combustveis (Gasolina aditivada, lcool e Diesel) da
Tabela de dados no Exemplo 1.3.1.

Caso 2 Amostra mnima de 30 unidades (n 30), o tratamento ser COM


PERDA DE INFORMAO, agrupando os dados em Distribuio de frequncias
ou Tabela de frequncias (que permite a obteno de um MODELO EMPRICO).
Nesse caso, os valores da varivel de interesse so subdivididos em Classes (ou
intervalos de valores), delimitadas pelo limite inferior e superior do intervalo,
utilizando um critrio para o agrupamento, havendo perda de informao
j que os valores originais no mais aparecero individualmente, mas em
Classes (grupos supostos homogneos). Para cada Classe, o nmero de dados
observados registrado, obtendo a frequncia da classe.
Algumas caractersticas da tabela de frequncias so:
1. Que cada valor observado deve pertencer a uma, e apenas uma, Classe
(isto significa dizer que, as classes so mutuamente exclusivas e exaustivas).
2. Que as Classes tenham o mesmo intervalo (caracterstica no essencial,
porm desejvel para efeitos de anlise dos dados).

31

Introduo Estatstica

Construo de uma tabela de frequncias etapas bsicas


Critrios:
1. Raiz de n;
2. de Sturges
Etapa 1 - Identifique o menor (X1) e o maior valor (Xn) da varivel
de interesse.
Etapa 2 - Calcule a amplitude total (ou Range) dos valores, isto ,

R = X n - X1
Etapa 3 Calcule o nmero de classes ou intervalos de classe (k) em
funo do nmero de valores observados (n). Para isto, existem dois
critrios empricos.
Critrio 1 Raiz de n: k = n
Critrio 2 de Sturges: k = 1 + 3,332* log n
Observao: o nmero de classes recomendado deve ser de tal forma que os
valores no fiquem muito compactados ou muito dispersos. Isto significa que,
em termos prticos, recomenda-se um nmero de classes entre 5 e 15, obtido
pelo critrio que melhor se ajusta situao a analisar (muito bom senso e
senso crtico).
Etapa 4 Calcule a amplitude de classe ou intervalo de classe (C), dividindo
a amplitude total pelo nmero de classes; isto ,

C = R / k = (Xn - X1) / k
Observao: arredondar o resultado para um nmero inteiro superior, ou
mltiplo de 10, para facilitar a interpretao dos valores.
Etapa 5 - Construa a distribuio ou tabela de frequncias estabelecendo os limites de classes e fazendo a apurao dos dados. Utilize como limite inferior
da primeira classe o menor valor observado (ou um inteiro imediatamente
inferior), somando ao valor a amplitude de classe para obter o limite superior
da primeira classe, isto :

Li 1 = X1
Ls1 = X1 + C
32

Unidade 1

Para as classes posteriores, utilizar o processo a seguir:

Li 2 = Ls1
Ls2 = Li 2 + C
E assim sucessivamente...
Exemplo 1.3.2 Os dados abaixo se referem ao preo (R$) da gasolina comum
em 49 postos de combustveis de vrias cidades do estado de Santa Catarina.
Construa a distribuio ou tabela de frequncias com perda de informao,
utilizando as etapas anteriores.

Dados Originais
2,599

2,570

2,580

2,559

2,399

2,599

2,470

2,599

2,540

2,584

2,577

2,599

2,550

2,639

2,479

2,579

2,499

2,599

2,499

2,590

2,560

2,449

2,690

2,589

2,599

2,570

2,490

2,459

2,560

2,389

2,410

2,420

2,430

2,438

2,439

2,450

2,460

2,697

2,470

2,599

2,599

2,470

2,579

2,499

2,599

2,449

2,639

2,499

2,599

---

A varivel a analisar : X = {Preo da gasolina (R$)}; n = 49


Etapa 1: X1 = R$ 2,389

X49 = R$ 2,697

Etapa 2 : R = X49 - X1 = 2,697 2,389 = 0,308


Etapa 3: k (pela Raiz de n) = 7 classes
Etapa 4 : C = R / k = 0,308/7 = 0,044
Etapa 5 : Estabelecer os limites de classes de preos e, fazendo a apurao dos
valores em sua classe respectiva, a distribuio de frequncias seria:
PREOS (R$)

APURAO

N DE POSTOS

2,389 | 2,433

||||

2,433 | 2,477

||||| |||||

10

2,477 | 2,521

||||| |||

2,521 | 2,565

||||

2,565 | 2,609

||||| ||||| ||||| ||||

19

2,609 | 2,653

|||

2,653 || 2,697

TOTAL

49

33

Introduo Estatstica

Observaes:
O smbolo | utilizado para delimitar os valores entre os limites de classes,
equivale ao utilizado na matemtica (intervalo fechado esquerda e aberto
direita), isto ,
Li |Ls [Li ;Ls) Li Preo < Ls
Na ltima classe o intervalo fechado nos dois extremos, pois o maior valor
observado coincide com o Ls da classe; do contrrio, teria que considerar mais
uma classe e incluir esse valor.
Ao apurar os dados, identificar cada valor em sua classe, separando de cinco
em cinco para melhor identificar a frequncia final.
A apurao j nos d um grfico que representa as Classes no eixo da abscissa
(X) e as frequncias no eixo da ordenada (Y), e denominado de HISTOGRAMA
(grfico processado no SEstatnet), como pode ser visualizado abaixo, onde
cada classe representada pelo valor central (denominado de ponto mdio de
classe, a ser visto adiante).
25

Contagem

20

15

10

5
0

2,411

2,455

2,499

2,543

2,587

2,631

2,675

GCOM

Atividade de Aprendizagem 1.3b


Orientao: Este um exerccio individual, deve ser encaminhado para o
tutor da disciplina.

34

Unidade 1

Tarefa individual 1.3.2: Acesse o SestatNet e no mdulo ANLISE DE


DADOS utilize Avaliao da Aprendizagem, aps abrir a base de dados
COMBUSTIVEIS. Faa uma anlise denominada DESCRIO e obtenha os
histogramas dos preos de cada combustvel, idntico ao grfico acima.

Consulte o site SEstanet Ensino-aprendizagem de estatstica na web

http://www.sestatnet.ufsc.br/area_excl.php

1.3.3 Medidas de resumo ou de sntese


As medidas resumo ou de sntese pertencem ao grupo de ferramentas matemticas que permitem caracterizar um conjunto de dados sob ponto de vista
da tendncia central ou da disperso dos dados estudados. Isso quer dizer,
so ferramentas que exibem a relao existente entre os dados coletados em
uma pesquisa estatstica e podem ser mais bem explicadas pelo analista
com o conhecimento do ambiente de anlise e das diferentes perturbaes
que podem alterar o comportamento das caractersticas estudadas tais como:
Equipamentos, Mtodos de trabalho, Interpretaes na leitura de medies,
Alteraes ambientais, Recursos econmicos e aspectos fsicos limitados. As
ferramentas selecionadas para representar essas tcnicas so: Mdia, Moda,
Mediana, Varincia, Amplitude e Desvio Padro.
Vamos ver detalhadamente o que uma medida de resumo.

1.3.3.1 O que uma medida de resumo?


um valor que melhor caracteriza o conjunto de valores da amostra, isto ,
um valor nico que represente todos os outros valores do conjunto.

35

Introduo Estatstica

Na atualidade, com as facilidades de acesso a calculadoras e/ou a computadores, recomenda-se no clculo de uma medida de resumo utilizar os
valores originais, principalmente quando se agrupam os valores em distribuies de frequncias (com perda de informao), pois se realizarmos os
clculos a partir desta, perdemos em preciso.
No caso em que no possvel ter acesso aos dados originais, tendo-se apenas a distribuio de frequncias, para o clculo das medidas de resumo,
necessrio obter o PONTO MDIO DE CLASSE, que passa a ser considerado o valor representativo de cada classe, e dado por:

Xi = (Li + Ls)/2
Atividade de Aprendizagem 1.3c
Orientao: Este um exerccio individual e deve ser encaminhado para o
tutor da disciplina.
Tarefa Individual 1.3.3: Calcule os pontos mdios de classe para a distribuio
dos preos de gasolina (Exemplo 1.3.2)
Utilize o Sestatnet para facilitar a organizao dos dados.

Consulte o site SEstanet Ensino-aprendizagem de estatstica na web

http://www.sestatnet.ufsc.br/area_excl.php

1.3.3.2 Classificao das medidas de resumo


3. Medidas de tendncia central ou de posio ou de localizao:

36

Mdia aritmtica ou Mdia

Unidade 1

Mediana

Moda

Observao: Alm da mdia aritmtica, existe a mdia harmnica, mdia geomtrica, mdia quadrtica, mdia bi-quadrtica, mdia cbica.
4. Medidas de disperso ou de variao:
Absolutas:

Amplitude total

Varincia ou Quadrado mdio

Desvio padro

Observao: Tambm existe o desvio mdio e o desvio quartlico.


Relativa:

Coeficiente de variao

Observao: Tambm existe o coeficiente quartlico.


5. Medida de forma: Assimetria

1.3.4 Medidas de tendncia central ou de posio ou de localizao


As medidas de tendncia central, apresentadas a seguir, permitem-nos identificar o valor que melhor sintetiza o conjunto ou distribuio de valores. Cada
uma delas tem a caracterstica primordial que se diferencia em funo do
comportamento dos dados.

1.3.4.1 Mdia aritmtica ou mdia


Notao: Me ou X (l-se Xis barra)
Conceito: a mdia representa o ponto de equilbrio dos dados, j que considera a influncia de todos os valores, distribuindo por igual a soma ou total pelo
nmero de valores observados.
A mdia pode ser: mdia simples, quando obtida para dados sem perda de
informao, e mdia ponderada, quando obtida para dados com perda de
informao.

37

Introduo Estatstica

Frmula matemtica:
1. Mdia simples (Frmula 1.3.1)
n

X=

x
i =1

x1 + x 2 + ... + x n
n

Aplicao para o Exemplo 1.3.1 dados originais


= (2,599 + 2,579 + 2,549 + 2,599 + 2,549 + 2,599 + 2,579 + 2,599 + 2,599
+ 2,599)/10

= R$ 2,585

2. Mdia ponderada (Frmula 1.3.2)


k

X=

(x
i =1

ni )

n
i =1

(x1 n1 ) + (x 2 n 2 ) + ... + (x k n k )
n1 + n 2 + ... + n k

Note que os xi representam os pontos mdios de classe de uma distribuio


de frequncias.
k

n
i =1

38

= n (total de valores observados)

Unidade 1

Aplicao para o Exemplo 1.3.2:


PREOS (R$)

ni

Xi

2,389 | 2,433

2,411

2,433 | 2,477

10

2,455

2,477 | 2,521

2,499

2,521 | 2,565

2,543

2,565 | 2,609

19

2,587

2,609 | 2,653

2,631

2,653 || 2,697

2,675

TOTAL

49

---

Observao: os pontos mdios voc pode observar no histograma.

X=

(2,411*4)+(2,455*10)+(2,499*8)+(2,543*4)+(2,587*19)+(2,631*3)+(2,675*1)
4+10+8+4+19+3+1

X = R$ 2,532 (mdia ponderada, da distribuio de frequncias, isto , com


perda de informao)

Para verificar a perda de informao, vamos obter a mdia dos dados originais
(a mdia simples, ou seja, sem perda de informao).
X = R$ 2,539

Erro relativo devido ao agrupamento (r):


Atravs do Erro Relativo pode-se avaliar a perda de informao devido ao
agrupamento dos dados, calculando a diferena, em valor absoluto, entre a
mdia dos dados originais e a mdia dos dados agrupados, dividindo pela
mdia dos dados originais.

r = (|2,539 -2,532|)*100 / 2,539 = 0,27%


Qual o significado do resultado?

39

Introduo Estatstica

1.3.4.2 Mediana (ou Percentil 50)


Notao: Md ou

P50 (l-se Percentil de 50)

Conceito: a mediana, ou Percentil 50, representa o valor do meio dos dados,


isto , o valor que divide em duas partes iguais (50/50) o conjunto de dados
(sejam os dados originais ou os dados agrupados). uma medida de ordem,
pois separa em dois subconjuntos de igual nmero o conjunto original (tambm se denomina como uma Separatriz de ordem 50).
Obteno da mediana:
1. Para dados originais: Primeiro ordenam-se os dados (crescente ou decrescentemente) de forma a identificar o valor que subdivide em dois
subconjuntos de igual nmero de valores, sendo o valor maior ou igual
aos valores do subconjunto inferior e menor ou igual aos valores do subconjunto superior.
Para o exemplo 1.3.1, temos o conjunto ordenado:
{2,549; 2,549; 2,579; 2,579; 2,599; 2,599; 2,599; 2,599; 2,599; 2,599}
O valor que divide em dois subconjuntos de igual nmero de valores igual
a R$ 2,599.
2. Para dados agrupados: No caso de dados agrupados (distribuies de
frequncias), calcula-se o percentual acumulado de cada classe, de forma a identificar a classe que contm o valor que acumula os 50% dos
primeiros valores e atravs de uma regra de trs, obtenha o valor que
divide em duas subdistribuies, a distribuio original.
Para o exemplo 1.3.2, tem-se:

40

PREOS (R$)

ni

% Acumulado

2,389 | 2,433

8,2

8,2

2,433 | 2,477

10

20,4

28,6

2,477 | 2,521

16,3

44,9

2,521 | 2,565

8,2

53,1

2,565 | 2,609

19

38,8

91,8

2,609 | 2,653

6,1

98,0

2,653 || 2,697

2,0

100,0

TOTAL

49

100,0

---

Unidade 1

Observe que a quarta classe contm a mediana, pois h 50% dos valores
acumulados.
Assim, podemos obter a mediana:

(2,565 2,521)/ 8,2% =(P50 - 2,521) / 5,1%


P50 = 2,521 + (2,565 2,521) * 5,1% / 8,2%
P50 = R$ 2,526
Frmula matemtica:

P50 = Li50 + (c * )/ p50

1.3.4.3 Moda ou Norma


Notao:

Mo

Conceito: a Moda ou Norma de um conjunto ou de uma distribuio de frequncias representa o valor (ou valores), se existir (em) que mais se observa
(m) ou que (so) mais frequente (s).
Note que a moda poder no existir, pois se no houver nenhum valor que
predomina no conjunto ou na distribuio, no se tem moda, isto , amodal.
No entanto, poder existir mais de uma caracterizando o conjunto ou a distribuio e se diz plurimodal.
No caso de exemplo 1.3.1, a moda R$ 2,599.
No caso do exemplo 1.3.2, da distribuio de frequncias, a moda bruta dada
pelo ponto mdio da classe de maior frequncia, isto , R$ 2,587.
Comparao entre as medidas de tendncia central
A mdia uma funo de todos os valores e influenciada pela magnitude dos
valores Me = f (Xi; n)A mediana uma funo do total e da ordem dos
valores: Md = f (n)
A moda uma funo da maior frequncia: MO = f (nmx)
Karl Pearson desenvolveu uma frmula emprica de relao entres as medidas
de tendncia central, a mdia, a mediana e a moda. Para aplicar a frmula
preciso que algumas condies devam ser satisfeitas e que a relao proposta
por Pearson se verifique com maior aproximao:

41

Introduo Estatstica

a distribuio (curva) de frequncias deve ser unimodal;


a) a distribuio de frequncias deve ser levemente assimtrica (uma pequena cauda);
b) o nmero de observaes (n) deve ser suficientemente grande e pequena
a escala de unidades que divide a distribuio.
Satisfeitas tais condies, temos a seguinte relao estabelecida (Frmula 1.3.3):

X = Mo = 3( X - Md)
1.3.5 Esquema dos cinco nmeros o box-plot
A partir do conceito da Mediana (ou Percentil 50) pode-se construir um grfico que permite avaliar o comportamento dos dados subdividido em quatro
grupos, utilizando cinco nmeros:
1. o menor valor observado (P0);
2. o percentil 25 ou quartil1 (P25);
3. o percentil 50 ou quartil2 ou mediana (P50);
4. o percentil 75 ou quartil3 (P75);
5. o maior valor observado (P100);
No grfico abaixo, pode ser analisado cada um dos cinco nmeros, onde os
limites da caixa (box-plot) representam os Quartis 1 e 3, enquanto a mediana
dada pela linha que divide a caixa. Tambm representado o valor da mdia
(vista pelo sinal de +).
806

643.6

CPR

481.2

318.8

154.4

-6

M
SEXO

42

Unidade 1

Ao utilizar o Sestatnet, iremos tratar do procedimento de como obter o grfico


e as partes componentes.

1.3.6 Medidas de disperso ou de variao


As medidas de disperso apresentadas a seguir, nos permitem identificar o
valor que mede a distncia ou disperso dos valores em torno da medida de
tendncia central.

1.3.6.1 Amplitude total ou range


uma medida de disperso absoluta, pois mede a variao total dos dados e,
como j visto, obtida pela diferena entre os extremos.

R = X n - X1
Permite comparar conjunto de dados ou distribuies de frequncias avaliando a disperso total, sem considerar a distncia entre os valores. No entanto,
uma medida pouco utilizada por ser instvel, j que influenciada to somente
pelos valores extremos, no fornecendo informao sobre o comportamento
dos valores intermedirios.
Exemplo 1.3.3 Conforme os dados da tabela abaixo, em que as colunas de
preos da gasolina, comum e aditivada, podem ser considerados conjunto
de dados no agrupados, calcule a amplitude de cada conjunto de preos.
Interprete o resultado.
Tabela 1.4 Tabela de Freqncias Gasolina comum e aditivada
Posto

Bandeira

Gasolina
Comum

Gasolina
Aditivada

BR

2,599

2,699

TEXACO

2,579

2,679

IPIRANGA

2,549

2,649

BR

2,599

2,659

IPIRANGA

2,549

2,699

SHELL

2,599

2,699

TEXACO

2,579

2,659

BR

2,599

2,659

SHELL

2,599

2,659

10

BR

2,599

2,699

Fonte: ANP

43

Introduo Estatstica

R = X n - X1
R (Gas. Comum) = 2,599 2,549 = R$ 0,05
R (Gas. Aditivada) = 2,699 2,649 = R$ 0,05

1.3.6.2 Varincia ou quadrado mdio


Notao: Var (X) que se l, varincia da varivel X de anlise.
Importante: No caso de populao, utiliza-se o smbolo 2, que se l sigma ao quadrado. Quando se trata de amostra, um conjunto de dados simples (no agrupados)
ou dados agrupados em distribuio de frequncias, utiliza-se s2, que se l esse
minsculo ao quadrado

Conceito: a Varincia ou Quadrado Mdio de um conjunto ou de uma distribuio de frequncias representa o valor da mdia dos quadrados dos desvios
de cada valor em relao sua mdia.
Note que a varincia uma mdia quadrtica dos desvios; portanto, a unidade
de medida passa a ser o quadrado da unidade de medida da varivel de anlise.
Por exemplo, no caso do preo do combustvel, cuja unidade de medida em
R$, a mdia expressa em R$ e a varincia em (R$)2.

1.3.6.3 Desvio Padro


Notao: Dp(X) que se l, desvio padro da varivel X de anlise.
Importante: No caso de populao, utiliza-se o smbolo , que se l sigma. Quando
se trata de amostra, um conjunto de dados simples (no agrupados) ou dados agrupados em distribuio de frequncias, utiliza-se s, que se l esse minsculo.

Conceito: o Desvio padro de um conjunto ou de uma distribuio de frequncias dado pela raiz quadrada da varincia e representa o valor da raiz
quadrada da mdia dos quadrados dos desvios de cada valor em relao
sua mdia.
Note que o desvio padro expresso na mesma unidade de medida da varivel
de anlise e da mdia, podendo-se interpretar como a distncia mdia dos
valores em torno de sua mdia.

44

Unidade 1

Frmula matemtica:
1- Para dados simples (dados no agrupados)

2- Para dados agrupados (distribuies de frequncias)

O denominador n 1 da varincia (bem como do desvio padro) denominado de graus de liberdade, pois representa a quantidade de comparaes
independentes que podem ser feitas entre as n unidades da amostra.
O princpio dos graus de liberdade muito utilizado na Estatstica e parte da
considerao de que as diferenas de cada uma das observaes em relao
sua mdia no so independentes, j que a mdia calculada a partir dos valores.
Assim, quando do clculo da varincia, diz-se que os n graus de liberdade
originalmente disponveis no conjunto sofrem a reduo de uma unidade
porque uma estatstica, a mdia, j foi calculada dos dados do grupo e aplicada na determinao da varincia.

1.3.6.4 Coeficiente de Variao


Notao: CV (X) que se l, coeficiente de variao da varivel X de anlise.
Conceito: o coeficiente de variao de um conjunto ou de uma distribuio
de frequncias dado pelo quociente entre o desvio padro e a mdia e representa a disperso relativa dos dados em torno da mdia.
Frmula matemtica:

CV (X) = (Desvio padro)/(Mdia)


CV (X)...... pode assumir valores entre zero e maior do que um (quando o
desvio padro maior do que a mdia)

45

Introduo Estatstica

Interpretao: se o coeficiente de variao um valor pequeno (prximo


do valor zero), os valores do conjunto ou da distribuio so homogneos; e
quando um valor em torno da unidade ou maior, os valores so heterogneos
ou muito heterogneos.

0 < CV (X) <


Encerramos a seo. Faa a autoavaliao proposta a seguir e avalie seu prprio
aprendizado. Caso perceba que alguns pontos no ficaram claros para voc,
releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga
em frente com dvidas, pois isso pode comprometer todo o seu aprendizado.
Atividade de Aprendizagem 1.3d
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Tarefa Individual 1.3.4: Acesse o SestatNet e obtenha no mdulo de ANLISE DOS
DADOS, Ensino-Aprendizagem, a descrio dos dados, calculando as medidas de
resumo, bem como os Box-plots para os preos dos combustveis

Consulte o site SEstanet Ensino-aprendizagem de estatstica na web

http://www.sestatnet.ufsc.br/area_excl.php
Saiba Mais
Para aprofundar os conceitos estudados neste captulo consulte:
http://www.ence.ibge.gov.br/estatistica/default.asp

46

Unidade 1

Resumo da unidade:
Nesta seo voc estudou as principais tcnicas analticas para o clculo das medidas de resumo (ou de sntese) de um conjunto de dados, optando por aquelas que
melhor representam os dados coletados.
importante a interpretao de cada uma das medidas, bem como a utilizao de
uma ferramenta informtica para obter com maior rapidez os indicadores estatsticos e os grficos que permitem uma visualizao do padro de comportamento.

ENCERRAMENTO DA UNIDADE 1
Nesta unidade, abordamos os tpicos que integram a Estatstica Descritiva e
Exploratria de Dados.
Para a sua maior compreenso, recomendamos o emprego do ambiente de
ensino-aprendizagem via Web, atravs do Sistema especialista SestatNet.

47

Anotaes

importante

Unidade 2

Teoria da probabilidade e modelos


matemticos bsicos
Na Unidade 1 abordamos os princpios da Estatstica Descritiva e Exploratria,
organizando e resumindo os dados atravs de indicadores que permitem ter
uma ideia do comportamento tpico e sua disperso. Destacamos que na
Unidade 3 abordaremos os princpios da Estatstica Indutiva (ou Inferencial),
pelos quais, a partir da (s) amostra (s), procura-se obter concluses sobre o (s)
parmetro (s) de determinada populao, como um instrumento auxiliar na
tomada de deciso em condies de incerteza.
nessa condio de incerteza que a Teoria da Probabilidade nos fornece os
fundamentos que auxiliam na tomada de deciso, quantificando o grau de
incerteza e determinando o erro em uma estimao de algo desconhecido
(parmetro da populao). Probabilidade o tema de estudo que abordamos
nesta Unidade 2.

2.1 Probabilidade
2.1.1 Fundamento bsico
A Teoria do Clculo das Probabilidades tem a sua origem em meados do sculo XVII, quando dois matemticos franceses trocam
correspondncia (Blaise Pascal e Pierre de Fermat) sobre problemas formulados por um jogador compulsivo na cidade de Monte
Carlo, Chevalier de Mr.
A partir dos questionamentos de de Mr, Pascal e Fermat realizam
estudos de modelos matemticos com base nos jogos de azar (moedas, dados, baralho e roleta) desenvolvendo uma srie de conceitos
que se ampliam na aplicao para outras reas do nosso cotidiano.
Para o entendimento desses conceitos, utilizaremos os exemplos bsicos dos jogos de azar, pois facilitam a compreenso e a manipulao em exerccios. Como
ponto de partida, afirma-se que em todo jogo de azar h um fator presente no
resultado que incontrolvel e ao qual se lhe atribui como devido ao acaso.

51

Introduo Estatstica

Assim, ao realizar uma experincia da qual no se tem controle sobre o resultado, diz-se que este se d ao acaso. No entanto, se repeti-la um nmero
expressivo de vezes, possvel construir um modelo probabilstico e tomar
decises quanto ao processo restrito ao experimento, apenas pelas suas caractersticas, sem ser preciso repetir a experincia.
A prtica indica que muitas situaes experimentais ocorrem em condies
consideradas estveis, permitindo a aplicao em vrios ramos da cincia e
da indstria por seu comportamento idntico. Assim, o modelo matemtico
construdo ao se revelar satisfatrio, emprega-se no estudo de propriedades e
na obteno de concluses.
Exemplo simples: Tome uma moeda (de qualquer valor). Intuitivamente voc
sabe qual a proporo de cara e de coroa, isto , voc espera igual nmero
de caras e de coroas, ao lanar um determinado nmero de vezes. Se voc
lanar por dez vezes, no necessariamente ocorrem 5 faces de cada, e essa
diferena entre os resultados atribuda ao acaso. No entanto, se lanar cem
ou aumentar para quinhentos ou mil lanamentos, a tendncia se aproximar,
medida que aumenta o nmero de repeties, do valor esperado, 50/50, isto
, metade cara e metade coroa.
Atividade de Aprendizagem 2.1a
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Atividade 2.1.1: atividade individual: Prepare uma planilha para registrar os resultados, por exemplo:
Experincia

E10

E50

E100

...

...

...

...

10

...

...

...

50

11

...

...

100

Faa 10, 50 e 100 lanamentos! Anote a sequncia de resultados, cara (C) e coroa
(C), compare os resultados quanto proporo de cara e coroa, para cada nmero
de lanamentos.

52

Unidade 2

Outro exemplo simples: Ao se verificar a qualidade de componentes produzidos em uma fbrica, atravs de amostras que so retiradas periodicamente,
pode-se prever o percentual de componentes fora do padro (defeituosos)
esperados no processo de fabricao, desde que as condies experimentais
sejam mantidas. Este processo implica em considerar, na fabricao dos
componentes, o emprego da mesma matria-prima, o mesmo equipamento,
o mesmo tipo de operrio na manipulao e outras implicaes do estudo
realizado para estabelecer o modelo de representao.
Palavra do Professor
Pode-se concluir, desses exemplos, que estamos diante de experincias nas quais o
experimentador no tem controle sobre os resultados. A esse tipo de experincia se
denominam de experincias aleatrias.

Uma experincia aleatria (a ) constitui toda prova (teste ou ensaio) que


tm trs caractersticas bsicas:
1. Pode ser repetida quantas vezes forem necessrias para avaliar o evento
de interesse ou sucesso ( S ), isto , repetidas indefinidas vezes, isto :

n
Vamos denominar esta caracterstica como a repetitividade da experincia
aleatria.
2. Associa-se um Espao Amostral () isto , um conjunto total de possibilidades experincia. Este conjunto tem que ser exaustivo e todos os
seus eventos excludentes.

Exemplo 2.1.1: Jogo de moeda


Seja a experincia aleatria, a: lanamento de uma moeda
equilibrada.
O espao amostral dado por todos os eventos igualmente possveis na moeda, excluindo-se por questes prticas o evento dar a
moeda de quina, isto , = {cara; coroa} = {C; C}
Se o evento de interesse for obter face Cara, S = {C}
Observe que C representa o evento insucesso ou fracasso (complementar ou
contrrio), de C!

53

Introduo Estatstica

Exemplo 2.1.2: Jogo de dado


Seja a experincia aleatria, a: lanamento de um hexaedro (cubo) ou dado
equilibrado. O espao amostral dado por todos os eventos igualmente possveis de ocorrer no dado:

= {face1; face2; face3; face4; face5; face6}

= {1; 2; 3; 4; 5; 6}

Se o evento de interesse for obter face Par, S = {2; 4; 6}


3. Observa-se a regularidade estatstica com que ocorre o evento de interesse, o que permite a modelagem matemtica da situao experimental,
considerando a adequabilidade realidade.
Palavra do Professor
Estas trs caractersticas nos sero muito teis no desenvolvimento dos modelos
matemticos a serem abordados adiante.

2.1.2 Conceitos de Probabilidade


Voc j percebeu o que fundamenta a Teoria da Probabilidade, agora vamos
apresentar alguns conceitos relacionados, fique atento.

2.1.2.1 Conceito Clssico (Probabilidade a priori)

Laplace enunciou o
Princpio da indiferena
segundo o qual duas
probabilidades so
equiprovveis (igualmente
provveis) se, e somente
se, no existem motivos
para favorecer qualquer
delas.

Quando numa experincia equipossvel (igualmente possvel) forem enumerados todas as possibilidades, a probabilidade de um determinado evento de
interesse (ou sucesso) dada pela proporo entre o nmero de resultados
favorveis ao sucesso em relao ao total de possibilidades, isto :
P(S) = (n de resultados favorveis a S)/ (n de resultados possveis de )
P(S) =(n de resultados favorveis a S)/(n de favorveis a S + n de contrrios a S)
Frmula matemtica: (conhecida como Lei de Laplace)

P(S) = n S n = n S (n S + n S') (Frmula 2.2.1)


Palavra do Professor
Observe que: a probabilidade, sendo uma proporo, um valor entre zero e um!

54

Unidade 2

Veja a aplicao da frmula nos exemplos a seguir:


Para o Exemplo 2.1.1:
P (Cara) = P(C) = 1 2 = 0,50 ou que equivale a interpretar como probabilidade de 50% de obter a face Cara na moeda.
Para o Exemplo 2.1.2:
P (qualquer uma das faces do dado) = 1 6 = 0,1667 ou 16,67%

P (face Par no dado) = 3 6 = 1 2 = 0,50 ou 50%


Palavra do Professor

No cotidiano, Voc ouve muitos leigos (sejam jornalistas ou comentaristas na mdia)


empregar o termo probabilidade e chance como sinnimos. Mas h uma diferena
conceitual entre elas que importante Voc, futuro profissional, perceba com clareza a diferena entre Probabilidade e Chance. Apresentamos esta diferena a seguir.
Estude-a com ateno.

Enquanto a Probabilidade de um evento de interesse (ou sucesso), a interpretamos como a proporo de sucesso do evento, a Chance deve ser interpretada
como sendo a razo entre o sucesso em relao ao insucesso.
Assim, a Chance de um evento sucesso (S) dada por:
Ch (S) = (n de resultados favorveis a S) / ( n de resultados contrrios a S)

Ch (S) = nS nS'

(Frmula 2.2.2)

Palavra do Professor
Observe que a Chance de um evento, sendo uma razo, pode ser um valor maior do
que um! Por exemplo, a Chance de retirar uma Carta diferente de s de um baralho
comum dada por: Ch (s) = 48 4 ou seja, 12 contra 1.

2.1.2.2 Conceito Axiomtico


Neste conceito, considera-se a lgica aristotlica, em que um axioma o ponto
de partida de um raciocnio tido como evidente, sendo a base das demonstraes de uma teoria.

55

Introduo Estatstica

Assim, em termos axiomticos, a Probabilidade dada por um valor entre


zero e um, isto :

0 P(S) 1
Assim, podemos interpretar que existe um espao de probabilidade entre o
limite inferior, onde ocorre o evento impossvel (ou espao vazio), e o limite
superior, quando ocorre o evento certo ou espao amostral, ou seja, no extremo inferior,
P () = 0 e no extremo superior, P () = 1.
Como consequncia, pode-se obter um Corolrio do axioma, em que se o
evento sucesso (S) e o evento insucesso (S) so excludentes e exaustivos, temse que:
SUS'=

E a probabilidade dada por: P (S U S ') = P () = P(S) + P(S') = 1


Obtendo-se o clculo da probabilidade de um evento sucesso atravs do complemento pelo insucesso subtrado do total:

P(S) = 1 P(S')

(Frmula 2.2.3)

Guarde essa pequena expresso matemtica e mais adiante mostraremos quo


importante a sua utilizao!
Da interpretao axiomtica pode-se afirmar:
1. No negatividade das probabilidades.
2. Normalizao de um evento, em que a probabilidade do evento ocorrer
no mximo igual unidade.
3. Aditividade, isto , a probabilidade de dois eventos excludentes (ou mutuamente exclusivos) dada pela soma das probabilidades individuais
dos eventos.

2.1.2.3 Conceito Experimental (ou Frequentista)


Este conceito, tambm conhecido como probabilidade estatstica, baseado
na frequncia relativa do evento sucesso, onde em um nmero muito grande de
n repeties de uma experincia aleatria obtm-se o nmero de realizaes
favorveis ao evento sucesso, podendo-se aproximar o valor da proporo ao

56

Unidade 2

valor da probabilidade do evento, no limite, pois quanto maior o nmero de


repeties e medida que este aumenta, h uma estabilidade na ocorrncia
do evento sucesso, aparecendo a regularidade estatstica do evento e possvel
considerar a frequncia relativa do evento como a sua probabilidade. Isto
pode ser expresso atravs de:


lim (nS / n)

tende

P(S)

Na obra Ars conjectandi, do francs Jacques Bernoulli (1654-1705), publicada


postumamente em 1713, aparece pela primeira vez uma lei que veio a ser denominada de Teorema de Bernoulli ou Lei emprica do azar, ou mais conhecida
como Primeira Lei dos Grandes Nmeros, cujo enunciado :
muito pouco provvel que, se efetuarmos um nmero suficientemente grande de experimentos, a frequncia relativa de um evento se afaste muito da sua
probabilidade.
Outra forma de express-la tambm dada por:
Quando o nmero de repeties de uma experincia aleatria aumenta muito,
a frequncia relativa do evento sucesso se aproxima cada vez mais de certo valor
estvel, denominado de probabilidade de sucesso.
Palavra do Professor
A lei dos grandes nmeros est associada ao conceito de probabilidade a posteriori porque, quando no se pode estabelecer a probabilidade a priori, a nica alternativa a de estimar a probabilidade de sucesso avaliando o valor limite para o
qual as frequncias relativas se aproximam, como expressado na formulao acima.

Relacionada com a primeira lei dos grandes nmeros, existe a segunda lei dos
grandes nmeros, que pode ser expressa atravs de:
medida que o nmero de repeties de um experimento aleatrio cresce, maior
tende a ser o valor absoluto da diferena entre a frequncia absoluta experimental de um sucesso e a frequncia absoluta esperada (terica).

57

Introduo Estatstica

Observe que a primeira lei dos grandes nmeros refere-se frequncia relativa, enquanto a segunda lei refere-se frequncia absoluta!

2.1.2.4 Conceito Subjetivo (ou grau de crena)


Este conceito, tambm conhecido como probabilidade subjetiva (ou grau
de crena), baseado numa combinao da experincia passada de um indivduo racional (aquele que sobrepe a razo emoo), da opinio pessoal e
da anlise da situao especfica. Diferentes indivduos racionais podem ter
graus diferentes de crena, mesmo diante da mesma evidncia, devido s diferenas dos nveis de informao e conhecimento que possuem.
A probabilidade subjetiva especialmente til para tomarem-se decises nas
quais a probabilidade de vrios eventos no pode ser determinada de maneira
emprica. Proporciona um novo mtodo de investigao do desenvolvimento
de nossos poderes mentais, da infncia em diante, oferecendo uma sistemtica
conceitual unificada para o estudo de como percebemos, pensamos, aprendemos, decidimos e agimos.
Assim, a probabilidade subjetiva nada mais do que a medida da confiana
que se tem sobre a verdade de certa proposio, pois aprendemos a estruturar
nossos julgamentos sobre uma populao (todo) a partir de amostragens, que
representam apenas parte desse todo.
Um exemplo dessa situao o caso de um economista experiente que, ao
atribuir incerteza a respeito do futuro da economia como a atual, em crise em
nvel internacional, expressa os eventos em termos de probabilidades subjetivas. As predies so realizadas em termos probabilsticos; quando se fala
certo que a crise nos atingir no Brasil, a probabilidade atribuda um valor
prximo de 90%; se fala provvel que a crise nos atinja..., a probabilidade
um valor em torno de 50%, e assim por diante.
Palavra do Professor
Preste ateno no noticirio e avalie diferentes comentaristas que utilizam esse tipo
de frase!

Outro exemplo muito prximo dos aficionados de futebol o caso de time


denominado de azaro, pois suas probabilidades de vitria so medidas em
funo de seu passado;, porm, teoricamente ele tem as mesmas probabilida-

58

Unidade 2

des de vitria que qualquer outro time (mesmo estando na zona de rebaixamento). Quem garante que o azaro no pode ganhar?
Palavra do Professor
Excluem-se dessa anlise outros fatores que podem influenciar no resultado do jogo!

2.1.3 Teoremas fundamentais de probabilidade


Apresentaremos nesta seo alguns teoremas como o da adio, do produto e
de BAYES. Perceba a diferena e aplicabilidade de cada um.

2.1.3.1 Teorema da adio


1 Caso: Para eventos excludentes
Dois eventos so considerados excludentes, ou mutuamente exclusivos, quando no tm elementos em comum; isto , se analisamos dois eventos, A e B,
eles so excludentes se (A B) = em que a probabilidade de

P(A B) = P () = 0
A frmula bsica neste caso para calcular a probabilidade da ocorrncia de um
dos eventos, ou A ou B, dada por:

P(A B) = P(A) + P(B)

(Frmula 2.2.4)

Exemplo 2.1.3 Baralho comum


Seja um baralho comum, composto de 52 cartas com quatro naipes (paus,
espadas, ouros e copas).
Retirando-se, ao acaso, uma carta do baralho, qual a probabilidade de obter
uma carta de ouros ou uma de copas?
Dados do problema:
n = 52; n(ouros) = n(copas) = 13
Soluo:
Como a carta de ouros exclui a possibilidade de serem copas, ento
P(ouros copas) = P(ouros) + P(copas)
= 13/52 + 13/52 = 26/52 = 0,50

59

Introduo Estatstica

2 Caso: Para eventos no excludentes


Dois eventos so considerados no excludentes, ou no mutuamente exclusivos, quando tm elementos em comum; isto , se analisamos dois eventos, A e
B, eles so no excludentes se (A B) em que a probabilidade de:

P(A B) P () 0
A frmula bsica neste caso para calcular a probabilidade da ocorrncia de um
dos eventos dada por:

P(AB) = P(A) + P(B) - P(AB)

(Frmula 2.2.5)

Exemplo 2.1.4 Baralho comum


Seja um baralho comum, composto de 52 cartas com quatro naipes (paus, espadas, ouros e copas) e ainda as cartas s.
Retirando-se, ao acaso, uma carta do baralho, qual a probabilidade de obter
uma carta de s ou uma de copas?
Dados do problema:
n = 52; n(Copas) = 13; n ( s) = 4
Soluo:
Como a carta de Copas no exclui a possibilidade de estar retirando uma carta
s, j que existe o s de copas, ento:
P(Copass) = P(Copas) + P(s) - P(Copas s)
=13/52 + 4/52 1/52 = 16/52 = 4/13 = 0,3077

2.1.3.2 Teorema do Produto


1 Caso: Para eventos condicionados
Dois ou mais eventos so condicionados quando a ocorrncia do primeiro
influncia na ocorrncia do segundo, e assim sucessivamente. Para simplificao, se analisamos dois eventos, A e B, dizemos que B est condicionado a A
quando a probabilidade de B est condicionada probabilidade de A.
A frmula bsica para calcular a probabilidade da ocorrncia dos eventos, A
e B, considerando a ordem de ocorrncia, dada por:

P(AB) = P(B) * P(A/B) no caso em que B ocorre primeiro.


60

Unidade 2

Assim, P(A/B) = P(AB) P(B)

(Frmula 2.2.6)

P(AB) = P(A) * P(B/A) no caso em que A ocorre primeiro.

Assim, P(B/A) = P(AB) P(A)


Observao: a expresso P(A/B) l-se como Probabilidade do evento A
ocorrer dado que ocorreu B.

Exemplo 2.1.5 Baralho comum


Seja um baralho comum, composto de 52 cartas com quatro naipes
(paus, espadas, ouros e copas).
Retirando-se, ao acaso, duas cartas do baralho, de forma sucessiva,
qual a probabilidade de obter uma carta de ouros primeiro, e uma de
copas depois?
Dados do problema:
n = 52; n(ouros) = n(copas) = 13
Soluo:
Como a carta de ouros retirada primeiro, esta influencia a de copas em relao ao total de possibilidades; ento:
P(ouros copas) = P(ouros) * P(copas/ouros)
=

13/52 * 13/51 = 0,25 * 0,2549 = 0,0637

2 Caso: Para eventos independentes


Dois ou mais eventos so independentes quando a ocorrncia do primeiro no
influncia na ocorrncia do segundo, e assim sucessivamente. Para simplificao, se analisamos dois eventos, A e B, dizemos que B independente de A
quando a probabilidade de B no est condicionada probabilidade de A.
A frmula bsica neste caso para calcular a probabilidade da ocorrncia dos
eventos, A e B, dada por:

P(AB) = P(A) * P(B)

(Frmula 2.2.7)

J que um no influencia na ocorrncia do outro.

61

Introduo Estatstica

Neste caso, tem-se que:

P(A/B) = P(A) e P(B/A) = P(B)


Exemplo 2.1.6 Baralho comum
Seja um baralho comum, composto de 52 cartas com quatro naipes (paus,
espadas, ouros e copas).
Retirando-se, ao acaso, duas cartas do baralho, de forma sucessiva, com a
reposio da primeira carta, qual a probabilidade de retirar uma carta de
ouros primeiro, e uma de copas depois?
Dados do problema:
n = 52; n(ouros) = n(copas) = 13
Soluo:
Como a carta de ouros retirada primeiro, porm recolocada no baralho, esta
no influencia a de copas em relao ao total de possibilidades; ento:
P(ouros copas) = P(ouros) * P(copas/ouros)
=

13/52 * 13/52 = 0,25 * 0,25 = 0,0625

2.1.3.3 Teorema de Bayes


O Teorema de BAYES permite modificar probabilidades a priori e atualizlas com base em informao adicional, permitindo obter probabilidades a
posteriori. um teorema muito til na anlise de decises que precisa da informao probabilstica de forma diferente da que naturalmente ocorre (maneira mais fcil de coletar ou avaliar dados nas probabilidades condicionadas).

Etapas bsicas para a compreenso do Teorema de Bayes:


1 etapa Particionar o espao amostral, isto , dividi-lo nos eventos excludentes existentes (Ei) na experincia, o que constitui as probabilidades a priori:
n

U
i=1

Ei =
e

[P (Ei)] = P() = 1
i=1
62

Unidade 2

2 etapa Tem-se informao adicional de evento sucesso (S) que ocorre e que
permite reduzir o espao amostral para S.
n

U
(EiS) = S
i=1
e
n

[P (EiS)] = P(S)
i=1
P (Ei S) = P (Ei ) * P(S/Ei)
3 etapa Corrigem-se as probabilidades a priori a partir da informao
adicional do evento sucesso (S) e que permite calcular as probabilidades a
posteriori.
Em que:

P(Ei/S) = P (Ei S) P(S)


P (Ei S) = P (Ei) * P(S/Ei)
n

P(S) = i=1
[P (Ei S)]
Exemplo em exerccio da aplicao do Teorema de Bayes:
Um artigo entregue a uma loja por 4 fornecedores (Fi; i = 1 a 4).
O nmero de artigos fornecidos por cada um dos Fi :
Tabela 2.1 Exemplo em exerccio da aplicao do Teorema de Bayes
Fornecedor (Fi)

F1

F2

F3

F4

Total

Numero de artigos

800

400

300

500

2000

Proporo de cada Fi

8/20

4/20

3/20

5/20

Proporo de defeituosos: P(D/Fi)

3%

4%

5%

6%

---

Fonte: Elaborada pelo autor

Indo ao estoque, retirou-se um artigo e constatou-se que defeituoso. Qual


a probabilidade de ter vindo do fornecedor 4?

63

Introduo Estatstica

Etapas para a aplicao do Teorema de Bayes:


1 etapa: Os fornecedores constituem os eventos excludentes quanto produo de artigos (probabilidades a priori).
4

S [P (Fi) ]
i=1

= P(F1) + P(F2) + P(F3) + P(F4) = 8/20 + 4/20 + 3/20 + 5/20


= 0,40 + 0,20 + 0,15 + 0,25

2 etapa: O evento Sucesso, neste caso, o evento artigo defeituoso (D),


identificando-se a proporo de defeituosos de acordo com o fornecedor (informao adicional):
4

i=1

i=1

S [P (Fi D)] = S [P (Fi ) x P(D/Fi)] = P(D)

P(D) = 0,40*0,03 + 0,20*0,04 + 0,15*0,05 + 0,25*0,06 = 0,425


= 0,012
+ 0,008
+ 0,075
+ 0,015
3 etapa: Clculo das probabilidades a posteriori com base na informao
adicional:
Pergunta do problema: Qual a probabilidade de ter vindo do fornecedor 4,
dado que se constatou ser defeituoso?
P(F4 / D) = P (F4 D) P(D) = 0,150 0,4250 = 0,3529
Tabela 2.2 Resumindo os clculos utilizando o Teorema de Bayes
Fornecedor (Fi)

F1

F2

Proporo de cada Fi (PROBABILIDADES


A PRIORI)

40,00%

Proporo de defeituosos segundo o


fornecedor : P(D/Fi)

3%

4%

Proporo de defeituosos: P(D Fi)

1,20%

0,80%

PROBABILIDADES A POSTERIORI: P(Fi/D)

28,24%

F3

F4

Total

25,00%

100,00%

5%

6%

---

0,75%

1,50%

4,25%

18,82% 17,65%

35,29%

100,00%

20,00% 15,00%

Fonte: Elaborada pelo autor

Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc,
releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga em
frente com dvidas, pois isso pode comprometer todo o seu aprendizado.

64

Unidade 2

Atividade de Aprendizagem 2.1b


Orientao: Este um exerccio individual, deve ser encaminhado para o tutor da
disciplina.
Atividade 2.1.2: Estime as probabilidades associadas a cada um dos cenrios abaixo
para um determinado acontecimento. Justifique a sua resposta com base na teoria
abordada no captulo.
1) muito provvel
2) provvel
3) pouco provvel
4) improvvel
5) muito improvvel
Atividade 2.1.3: Do verso da cartela de aposta da Mega Sena pode ser deduzido
que: Segundo as probabilidades matemticas, fazendo uma aposta mnima da Mega
Sena, a chance de acertar os seis nmeros no universo de 60 (Sena) de uma a cada
50.063.860 apostas, ou seja, se no concurso houver apostas com todas as combinaes
possveis, h segundo os fundamentos matemticos, uma ocasio favorvel de se ter
acertador em cada 50.063.860 apostas.
a) Faa os clculos necessrios para obter o valor 50.063.860.
b) Comente a respeito da expresso probabilidades matemticas.
Atividade 2.1.4: Considere um laboratrio de informtica com seis microcomputadores. Suponha que cada micro tem a mesma probabilidade de estar ocupado (ou
disponvel) que qualquer outro.
Considere os seguintes eventos:
A = no mnimo dois micros, mas no mais que cinco ocupados
B = no mnimo trs micros, mas no mais que cinco ocupados
C = todos os micros disponveis ou um nmero par de micros ocupados
a) Calcule qual dos eventos A, B e C o mais provvel.
b) Voc, como Economista no papel de Gerente de Informtica, decide comprar mais
micros somente se a probabilidade de pelo menos um dos eventos A, B ou C ocorrerem for maior do que 90%. Qual a sua deciso? Justifique.

65

Introduo Estatstica

Saiba Mais

Para aprofundar os conceitos estudados nesta seo, acesse o SEstatnet e exercite


seus novos conhecimentos.
Consulte o site SEstanet Ensino-aprendizagem de estatstica na web

http://www.sestatnet.ufsc.br/area_excl.php

Resumo da unidade:
Nesta seo voc estudou os principais conceitos de probabilidade, bem como os teoremas fundamentais que iremos utilizar no desenvolvimento de modelos matemticos
que sero a base da Unidade 3.
Observe com ateno que, para resolver problemas de clculo de probabilidades, existem quatro etapas fundamentais:
Etapa 1 identifique o espao amostral da experincia aleatria;
Etapa 2 atribua as probabilidades aos eventos da experincia;
Etapa 3 identifique o (s) evento (s) de interesse, principalmente o sucesso (S);
Etapa 4 calcule as probabilidades desejadas associando os teoremas abordados.

2.2 Varivel aleatria e distribuies


de probabilidade

2.2.1 Conceito de varivel aleatria e tipos


Na seo anterior lidamos com experincias aleatrias analisando eventos ou
acontecimentos quanto aos seus resultados, associando a probabilidade de
ocorrncia a cada evento.

66

Unidade 2

Palavra do Professor
Nesta seo aprenderemos a associar valores numricos aos eventos do espao
amostral de uma experincia aleatria. A esse valor numrico denominaremos de
varivel aleatria (X), a qual ser analisada como uma funo cujo domnio de definio o conjunto de resultados e cuja imagem o conjunto dos nmeros reais.


Atravs da varivel aleatria descrevemos os resultados de uma experincia
aleatria por meio de nmeros em vez de palavras, possibilitando o tratamento matemtico dos dados.

Exemplo 2.2.1
Considere a experincia
simultaneamente.

aleatria

( a):

Jogam-se

duas

moedas,

Evento de interesse: observar o nmero de caras ( C ).


Espao amostral da experincia ():
= {(C; C); (C; C); ( C; C); (C: C)}
Se a varivel aleatria X, for definida por:
X = {nmero de caras} = {2; 1; 0}
Assim, podemos associar a cada evento do espao amostral, um nmero real.
Observe a associao entre os eventos e o nmero real para a varivel:

{(C; C)}

(C; C)

(C; C)

(C; C)}

Tipos de variveis aleatrias:


Varivel Aleatria Discreta ou Descontnua
a varivel que assume valores que podem ser listados pertencendo a um
conjunto finito ou infinito enumervel

{x1; x2 ; x3 ;...; xn-1 ; xn}

67

Introduo Estatstica

Associando-se uma funo massa de probabilidade P(x), concentrada no


ponto xi, com as seguintes propriedades:
a) p(xi) 0
b)

para todo i, onde p (xi) = P(X = xi), i = 1,2,3,...

p(x i ) = 1

para todo i

Os pares de valores, [xi; p(xi)], compem a distribuio de probabilidade da


varivel aleatria X.

Exemplo 2.2.2
Vamos obter a distribuio de probabilidade para a varivel aleatria do
Exemplo 2.2.1.

{(C; C)}

Probabilidades

(C; C)

(C; C)

(C; C)}

0,25

0,25

0,25

0,25

Assim, a distribuio de probabilidade da varivel aleatria X ser:


Evento

2 caras

1 cara

0 cara

P(X =x)=p(x)

0,25

0,50

0,25

Varivel Aleatria Contnua


a varivel que assume valores que no podem ser listados, mas que podem
assumir quaisquer valores num dado intervalo de anlise, associando-se uma
funo densidade de probabilidade f(x), com as seguintes propriedades:
a) f(x) 0

para todo i

b) A rea total sob a f(x) soma a probabilidade igual unidade, ou seja,

f(x) dx = 1

68

Unidade 2

c) A probabilidade num dado intervalo de interesse, que descreve um evento de interesse, [a; b], igual rea sob o intervalo, ou seja,
b

P(a x b) = a f(x) dx
Onde a e b so quaisquer valores de x, com a restrio de que a<b.
Observao: No caso do clculo da probabilidade num dado intervalo, equivale-se para as situaes descritas abaixo,

P (a x b) = P (a x < b) = P (a < x b) = P (a < x < b)


IMPORTANTE:
Se a distribuio de probabilidade de uma varivel aleatria explicitamente conhecida, todo o resumo estatstico, caracterizado pelas medidas de tendncia central e
de variao, tambm ser conhecido
No caso da distribuio de probabilidade, as medidas so:
Valor Esperado, como medida de tendncia central.
Varincia e Desvio padro, como medidas de variao ou disperso

2.2.2 Valor esperado de uma Varivel Aleatria Conceito geral


o valor para o qual tende a varivel em funo das probabilidades associadas
a cada valor (ou intervalo) e representa a mdia ponderada dos valores da
varivel.
Notao: x = = E(X), l-se mdia ou valor esperado da varivel aleatria X

2.2.2.1 Caso Discreto

= E(X) = [xi * p(x i )]


para todo i

2.2.2.2 Caso Contnuo

= E(X) = [x * f(x) dx]


69

Introduo Estatstica

Exemplo 2.2.3
Exerccio: Valor esperado do ganho em loteria
Em uma loteria, o jogador pode ganhar certa quantia x1 com probabilidade
p, ou pode perder outra quantia x2 com probabilidade q=1-p.
Observe que, ao comprar um bilhete de loteria ou jogar, voc j est perdendo
a quantia x2.
O valor esperado de ganho dado por:

E(G) = x1*p + x2* (1-p)

O jogo favorvel a quem joga somente se o valor esperado do seu ganho


positivo, e desfavorvel se negativo.
Caso da raspadinha:
Calcule o valor esperado de uma raspadinha que custa R$ 1,00 com emisso de
cinco sries de um milho de bilhetes cada, prevista a distribuio de 975.630
bilhetes premiados, como discriminado abaixo:
Qtde.

Prmio

Valor (R$)

03

Automveis

20.000,00 cada

100

Bicicletas

250,00 cada

1.500

Prmios de...

100,00

8.000

Prmios de...

50,00

60.000

Prmios de...

10,00

90.000

Prmios de...

5,00

350.000

Prmios de...

2,00

450.000

Bilhetes grtis

Outra raspadinha

Soluo:
O nmero de casos possveis de 5.000.000 (total de bilhetes).
Ao comprar a raspadinha o apostador j perde R$ 1,00 e no tem 975.603
chances de retorno porque em 450.000 vezes obtm como retorno outra
raspadinha.
Assim, o valor esperado de ganho dado por:
E(G) = [3*20.000+100*250+1.500*100+8.000*50+60.000*10+90.000*5+3
50.000*2+
+450.000*0+(5.000.000 975.603)*(-1)] 5.000.000
= - R$ 0,30 (h uma perda esperada de trinta centavos)

70

Unidade 2

2.2.3 Varincia de uma varivel aleatria conceito geral


o valor esperado dos desvios dos valores da varivel em torno de seu valor
esperado e representa a mdia quadrtica dos desvios ponderados dos valores
da varivel.

2 = V(X) = E [ (X - ) 2 ] = E (X2) - E [(X)] 2


Notao: 2x = 2 = V(X), l-se varincia da varivel aleatria X

2.2.3.1 Caso Discreto

2 = V(X) = [(xi - )2 ] * p(xi)

para todo i

2.2.3.2 Caso Contnuo

= V(X)= [(x - ) 2 ] * f(x) dx


-
2

NOTA: O Desvio padro, como j visto, raiz quadrada da varincia.

2.2.4 Modelos matemticos probabilsticos


A Estatstica a parte da matemtica que estuda os fenmenos cujos resultados variam de uma observao para outra. Para explicar esses fenmenos
aleatrios, adota-se o modelo matemtico probabilstico ou o clculo de probabilidades. Vamos ver a seguir os casos discretos analisando o Modelo de
BERNOULI e o Modelo Binomial.

2.2.4.1 Casos discretos


Modelo de BERNOULI (Prova de Bernoulli)
Considere uma experincia bsica na qual se obtm sucesso (S) com um valor
para a varivel igual unidade ou insucesso (S') com o valor igual a zero, associando a cada evento o resultado da probabilidade dada por:
Evento

Varivel

Probabilidade

SUCESSO (S)

X=1

INSUCESSO (S')

X=0

q=1-p

Total

1,0

71

Introduo Estatstica

Observa-se que, neste caso, o evento de interesse o Sucesso, porquanto se


identifica com o valor da unidade, o que permitir, ao repetir a experincia,
contar o nmero de sucessos.
Valor esperado da Varivel Bernoulli:
E(X) = 1*p + 0*q = p
Varincia da Varivel Bernoulli:
V(X) = (1-p) 2 *p + (0 p) 2 *q = q2 *p + p 2*q = p *q
Modelo Matemtico:
P(X=x) = px * q1-x
Atividade de Aprendizagem 2.2
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Tarefa individual 2.2.1: A renda mdia de uma grande comunidade pode ser aproximada pelo modelo da Curva de Gauss com mdia R$ 1.500,00 e desvio padro de
R$ 500,00:
a) Que percentagem da populao estima-se ter renda superior a R$ 3.000,00?
b) Em uma amostra de 50 pessoas da comunidade, quantas se pode esperar que
tenham menos de R$ 500,00 de renda?

Saiba Mais
Para aprofundar os conceitos estudados nesta seo, consulte:
HTTP://pt.wikibooks.org/wiki/Categoria:Probabilidade_e_Estatstica

Resumo da unidade:
Nesta seo voc estudou os principais modelos matemticos probabilsticos diferenciando o tipo segundo a varivel aleatria associada ao experimento.
Os dois modelos fundamentais a aplicar na Unidade 3 (Inferncia Estatstica) so
o Binomial e o Normal. Assim, se alguma dvida persistir, anote-a e entre em contato com o Tutor da disciplina.

72

Unidade 3

Inferncia estatstica
Introduo
Para que uma inferncia estatstica seja vlida, a amostra deve ser representativa da populao. Isto significa que se a seleo da amostra
no obedece a critrios tcnicos, mas apenas convenincia, esse procedimento introduz um erro ou vis (ou tendenciosidade), e o resultado que se quer inferir para a populao poder estar subestimado ou
superestimado.
Na perspectiva de ter-se amostras representativas, tecnicamente recomendvel a seleo de amostras aleatrias utilizando algum mecanismo
em que o acaso seja o fator relevante do estudo. Dessa forma, toma-se
como base uma experincia aleatria para associar um modelo probabilstico de anlise, segundo a situao.
Palavra do Professor
Dentre os procedimentos da inferncia estatstica, abordaremos dois considerados fundamentais: a estimao de parmetros e o teste de hipteses paramtrico.
Lembrando o que ressaltamos na seo 1.1, geralmente os parmetros de uma populao so desconhecidos; em funo disso, necessrio, com base em amostra
selecionada daquela populao, estimar o valor ou planejar um teste sob a hiptese
de assumir um determinado valor associando um nvel de confiabilidade.

Assim, podemos definir inferncia estatstica como o conjunto de tcnicas


analticas utilizado para identificar e caracterizar relaes entre variveis,
procurando obter os parmetros () da populao (; 2; ) ou a funo de
comportamento funo massa de probabilidade, no caso discreto, p(x; ) ou
a funo densidade de probabilidade, no caso contnuo, f (x; , 2).

3.1 Estimao de parmetros


3.1.1 Fundamentos bsicos
A Teoria da estimao de parmetros a teoria que fornece mtodos que permitem estimar um parmetro populacional com base nos dados da amostra.

75

Introduo Estatstica

Dois mtodos so utilizados:


1. Clssico: baseado nos dados da amostra que retirada da populao.
Estimativa pontual (por ponto) Consiste de um valor numrico que obtido
da amostra como estimativa do parmetro.
Estimativa intervalar (por intervalo) Consiste em determinar para o parmetro desconhecido (), limites (inferior e superior L ), a partir da
amostra, nos quais, com certa probabilidade (nvel de confiana, 1 - ") o
valor do parmetro estar contido (intervalo de confiana), isto ,

P ( L) = 1 -
2. Bayesiano: baseado no conhecimento prvio sobre a distribuio da populao, de parmetros desconhecidos, em conjunto com os dados da
amostra.

3.1.2 Propriedades de um estimador


Um estimador, de um determinado parmetro, deve possuir algumas propriedades que permitam a sua aplicao para a situao objeto de estudo.
Assim, existem trs propriedades bsicas:
1. No tendenciosidade (No viesado)
Quando o valor esperado do estimador tende ao valor do parmetro; isto ,

E()-=0

ou
E()=
A diferena entre o valor esperado do estimador, E (), e o parmetro (),
denominamos de VIS ou BIAS.

Exemplos 3.1.1:
- a mdia da amostra ( X ) no tendenciosa da mdia da populao ();
- a varincia da amostra (s2) no tendenciosa da varincia da populao (2);
- a proporo de sucesso da amostra (p) no tendenciosa da proporo de
sucesso da populao ().
2. Eficincia (ou de Mnima Varincia)
Se 1 e

76

2 so estimadores no tendenciosos do parmetro

Unidade 3

e a varincia do primeiro inferior varincia do segundo, isto ,

V(1 ) < V(2),


ento, conclui-se que 1 mais eficiente que 2 !
Exemplo 3.1.2:
Se {x1; x2 ; x3 ;...; xn-1 ; xn} compem uma amostra aleatria onde
E(Xi) =
Ento, a mdia da amostra, X

V(Xi) = 2

, um estimador no tendencioso de

Mas qualquer Xi tambm no tendencioso de (por exemplo X1).


Qual mais eficiente: X1 ou X ?
As varincias para cada um dado por:
V(X1) = 2

V( X ) = 2/n

A eficincia de X1 em relao a X , dada por:


/
= 2 2 n = n
f
Analisando a situao, temos que:

Se n =1 V(X1) = V( X )
Se n > 1 X MAIS EFICIENTE que X1, pois tem menor varincia!
3. Consistncia
Esta propriedade verificada, na prtica, atravs da aplicao da lei dos grandes nmeros aplicada estimao, em que o valor esperado do estimador
tende ao parmetro medida que o nmero de observaes aumenta, com a
varincia diminuindo sensivelmente.
Na prtica: verifica-se atravs de

lim E() =

lim V() = 0
n

3.1.3 Erro amostral ()


O erro amostral est sempre presente, independentemente de quo bem
elaborado o plano amostral posto em prtica, sob as melhores intenes

77

Introduo Estatstica

do pesquisador, pois quando se lida com amostras aleatrias, como forma de


estimar o parmetro de uma populao, constata-se uma diferena entre o
estimador e o parmetro, em valor absoluto: = | - |
Um exemplo explica melhor o conceito acima:
Os dados da tabela referem-se populao de 20 notas de uma prova de
Estatstica e trs amostras aleatrias de quatro alunos cada uma, retiradas da
populao (notas de 0 a 100).
Tabela 3.1 Exemplo de erro amostral
Populao

Amostra 1

Amostra 2

Amostra 3

96

40

72

99

86

96

56

56

49

52

67

56

70 80 93
86 85 90
56 52 67
40 78 57
89 49 48
99 72 30
96 94
= 71,55

Erro
Amostral
()

= 75,75

4,2

= 62,25

9,3

= 68,25

3,3

Fonte: Elaborada pelo autor

Palavra do Professor
Observe que, as diferenas entre as mdias amostrais e a mdia da populao sero
atribudas ao acaso, e a amostra que mais se aproximar do parmetro ser o melhor
estimador, no caso a amostra 3, que tem o menor erro.

78

Unidade 3

3.1.4 Distribuio amostral de mdias


Diante da presena do erro amostral em toda anlise de dados por amostragem, surge o questionamento de como possvel fazer generalizaes de uma
amostra para uma populao bem maior. Para isso, necessrio considerar
algumas propriedades que a distribuio amostral de mdias possui e que
fundamental compreender no processo de amostragem.
Um exemplo explica melhor a abordagem acima:
Considere a Populao composta de cinco valores (dados na tabela). Compor
todas as amostras de tamanho 2, com reposio (amostras na tabela):
Tabela 3.2 Exemplo de distribuio amostral de mdias
Populao
1
3

n1

n2

n3

n4

n5

n6

n7

n8

5
5
7
Mdias
m = 4,2
Varincias
s2 = 5,2
Populao
1
3

1,0

2,0

3,0

4,0

2,0

3,0

4,0

5,0

0,0

2,0

8,0

18,0

2,0

0,0

2,0

8,0

n9

n10

n11

n12

n13

n14

n15

n16

5
5
7
Mdias
m = 4,2
Varincias
s2 = 5,2

10

11

12

13

14

15

16

3,0

4,0

5,0

6,0

4,0

5,0

6,0

7,0

8,0

2,0

0,0

2,0

18,0

8,0

2,0

0,0

Fonte: Elaborada pelo autor

79

Introduo Estatstica

Pode-se construir a distribuio das mdias amostrais, obtendo-se:

Tabela 3.3 Distribuio das mdias amostrais


Mdias das
Amostras

1,0

2,0

3,0

4,0

5,0

6,0

7,0

Total

25

(X i )

Nde amostras
(ni)
pi

1/25

2/25

5
5/25

6/25

6/25

4/25

1/25

1,0
105/25

* pi

1,0*1

2,0*2

3,0*5

4,0*6

5,0*6

6,0*4

7,0*1

E(

)= 4,2

Fonte: Elaborada pelo autor

Concluses que podemos extrair do problema:


a) A distribuio amostral das mdias tende para uma distribuio aproximadamente normal, independentemente da forma da distribuio original da populao.
b) A mdia das mdias das amostras (valor esperado das mdias amostrais)
igual mdia da populao, isto , E ( X )= 4,2 = .
c) A varincia das mdias das amostras igual varincia da mdia da
populao dividida pelo nmero de unidades da amostra, isto ,
V( X )= 2/ n

Observaes importantes:
Observao 1: a mdia amostral mais estvel do que os valores individuais
que a compem;
Observao 2: da varincia das mdias, podemos obter o desvio padro das
mdias das amostras (o que conhecido como erro padro da mdia).
O exemplo da Observao1, acima, pode ser analisado no nosso cotidiano, que
o fato de a compensao dos desvios do peso atravs de uma balana digital
(dessas que existem em farmcias), tender a fornecer diferentes valores de seu

80

Unidade 3

peso; mesmo depois de voc ter realizado uma primeira leitura


nela, e pelas dvidas, voc realiza uma segunda leitura.
claro que seu peso efetivo no varia, mas no o que a balana
indica. Alguns fatores podem influenciar isto; a balana extremamente sensvel maneira como voc coloca seus ps ou postura
de seu corpo. A melhor maneira de determinar seu peso seria voc
se pesar um determinado nmero de vezes, quatro, por exemplo, e
tomar a mdia dessas quatro leituras. Considere que o peso mdio
mais confivel do que qualquer das leituras individuais.
Essas concluses obtidas anteriormente podem ser resumidas no que se denomina de Teorema Central do Limite:
Se {x1; x2 ; x3 ;...; xn-1 ; xn}constitui uma amostra aleatria de tamanho n
retirada de uma populao (finita ou infinita) com mdia e varincia 2, e
se X a mdia amostral, ento a distribuio amostral de X , quando n tende
para o infinito, aproxima-se da distribuio Normal com mdia e desvio padro /n.

3.1.5 Erro padro da mdia


Na prtica, raramente se coletam dados sobre mais de uma ou duas amostras,
a partir das quais se generaliza para toda uma populao. A extrao de uma
distribuio amostral de mdias exige o mesmo esforo que o estudo de todas
as unidades da populao. Como resultado, no se dispe de um conhecimento efetivo sobre a mdia das mdias ou sobre o desvio padro da distribuio
amostral. No entanto, possvel deduzir o desvio padro de uma distribuio
amostral terica, considerando o erro padro da mdia.

p = V( X ) = 2/n = /n
Com o auxlio do erro padro da mdia, podemos encontrar o mbito de valores das mdias no qual nossa verdadeira mdia populacional provavelmente
se situa. Podemos tambm estimar a probabilidade da mdia populacional
situar-se efetivamente dentro daquele intervalo de valores mdios. Este o
conceito de intervalo de confiana para a mdia populacional.

81

Introduo Estatstica

3.1.6 Intervalos de confiana


A maioria dos problemas com que nos defrontamos na prtica se resume
necessidade de estimar um ou mais parmetros da populao:
a) a mdia, , de uma populao;
b) a diferena entre as mdias de duas populaes, 2

- 1;

c) a proporo de sucesso, , de unidades de uma populao de um determinado evento de interesse;

d) a diferena na proporo de sucesso, 2 -

1, de duas populaes;

e) a varincia, 2 de uma populao;

f) a razo entre varincias, 22 12, de duas populaes.


Para cada situao, utiliza-se uma estimativa pontual adequada. No entanto,
se estabelecer um intervalo de confiana, se tem maior confiabilidade na estimativa. Aqui na disciplina interessam principalmente estabelecer intervalos
de confiana para a mdia, a proporo de sucesso e a varincia populacional.

3.1.6.1 Intervalo de confiana (I.C) para a mdia () e proporo ()


De uma maneira geral, a formulao abaixo permite obter o intervalo de confiana para a mdia e proporo:

P ( - + ) = 1 -
a) Intervalo de confiana para a mdia da populao, quando o desvio padro da populao conhecido.

e = z. /n

Assim,

P (X

- z . / n

+ z . / n ) = 1 -

Sendo o valor de Z (da curva normal) obtido a partir do estabelecimento do


nvel de confiana 1 - ", geralmente, entre os valores de 90%, 95% ou 99%.
b) Intervalo de confiana para a mdia da populao, quando o desvio padro da populao desconhecido (utilizando como estimativa o desvio
padro amostral)

82

Unidade 3

P (X

- t * s / n

+ t * s / n) = 1 -

Sendo o valor de t (da Curva T-Student) obtido a partir do estabelecimento do


nvel de confiana 1 - ", geralmente, de 90%, 95% ou 99%, e mais os "graus
de liberdade" em funo da estimativa do desvio padro amostral.
c) Intervalo de confiana para a proporo de sucesso da populao.

P(p - z * p*q p + z * p*q) = 1 -


n
n
3.1.6.2 Intervalo de confiana (I.C) para varincia (2)
Neste caso, admite-se que a varivel aleatria deva ter uma distribuio normal e os parmetros populacionais desconhecidos (mdia - e varincia
- 2). Utilizando a distribuio amostral da varincia, denominada de QuiQuadrado, que permite estabelecer intervalo de confiana para a varincia
populacional em funo da varincia amostral.

P [(n-1)*s2 /L2 2 (n-1)*s2/l2] = 1 -


Observao: todas estas expresses serviro de base para a aplicao de problemas utilizando o Sistema Especialista de Ensino-Aprendizagem de
Estatstica via Internet.
Encerramos assim esta seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram
claros para voc, releia o contedo. Se a dvida persistir, solicite ajuda de
seu tutor. No siga em frente com dvidas, pois isso pode comprometer
todo o seu aprendizado.
Atividade de Aprendizagem 3.1
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Atividade 3.1.1: Resolva o problema abaixo
Tcnicas de auditoria utilizam amostragens para verificar a correo de procedimentos adotados em uma empresa. Um auditor foi contratado para observar se havia diferena entre um novo sistema de cobrana e a prtica comum at aquele momento
adotado. Ele examinou uma amostra aleatria de cinquenta (50) faturas e observou
que havia uma diferena mdia de R$ 1,00 entre o valor verdadeiro e aquele lanado
na fatura, com um desvio padro de R$ 8,00.

83

Introduo Estatstica
a) identifique a populao estudada;
b) identifique a varivel estudada;
c) determine um intervalo de 95% de confiana para a verdadeira diferena mdia
das faturas;
d) explique, com suas palavras, o significado do intervalo calculado.
Atividade 3.1.2: Resolva o problema abaixo
Assentos no ocupados em voos de companhias de aviao comparam-se a produtos perecveis porque, uma vez decolado o avio, esto perdidos, causando prejuzo.
Uma empresa fez o levantamento de 300 voos, selecionados aleatoriamente nos ltimos seis meses e anotou o nmero de assentos vazios, obtendo, para essa amostra,
mdia de 14,6 e desvio padro de 3,9 assentos.
e) Estime, com 90% de confiana, o nmero mdio de assentos vazios nos vos
dessa empresa durante os ltimos seis meses.
f ) Qual a sua opinio em utilizar esse intervalo para servir de base para o prximo
ms? Justifique a sua resposta.

Resumo da unidade:
Nesta seo voc estudou as principais propriedades de um estimador de um parmetro, bem como a aplicao desses critrios na estimao atravs de intervalos de
confiana.
As frmulas ora abordadas encontram-se resumidas no fluxograma a ser visto na
prxima seo, para cada situao experimental.
Portanto, fundamental a compreenso de cada uma das situaes para melhor
identificar a expresso adequada e aplicar tanto em estimao quanto em teste
de hipteses.

3.2 Teste de hipteses


3.2.1 Fundamentos bsicos
Um teste estatstico de hipteses se constitui numa prova que realizada para
verificar se verdadeira uma afirmao (hiptese) que se faz sobre um determinado parmetro de uma populao considerada com distribuio de Gauss
(Curva Normal).

84

Unidade 3

Assim, podemos afirmar que um teste estatstico um conjunto de procedimentos para calcular a probabilidade da diferena entre duas mdias (ou duas
propores); ou ainda, para calcular a probabilidade de a razo entre duas
varincias ser devida ao fator do acaso ou a um determinado motivo (causa).
1 Princpio da deciso estatstica
O fator acaso l-se como ausncia de causa para explicar a diferena, e o
motivo, como causa sistemtica atribuda diferena.
Ao analisar o fator preponderante, se temos explicao para a situao, o fator
acaso (embora, presente) minimizado. J o contrrio mostra a necessidade
de investir em estudos para ter argumentos que auxiliem na explicao das
situaes reais.
Isso pode ser analisado pela figura abaixo:
ACASO

CAUSA OU MOTIVO
ACASO

CAUSA OU MOTIVO

Figura 3.1 Primeiro princpio da deciso estatstica


Fonte: Elaborada pelo autor

Eis uma das razes do emprego da Estatstica como instrumento de evidenciar


fatos e/ou fenmenos reais.
Em qualquer teste estatstico de hiptese, parte-se de uma hiptese estatstica
composta de duas hipteses:

Hiptese nula ou de igualdade

H0

Hiptese alternativa ou experimental

H1

Existem dois tipos de testes: Unilaterais e Bilaterais (abordados medida que


forem aplicados os conceitos).
De acordo com a hiptese nula, qualquer diferena no significativa observada
entre amostras encarada como uma ocorrncia atribuda ao acaso e resultante
do erro amostral. A hiptese nula representa a circunstncia que est sendo
testada (status quo) e geralmente estabelecida com o intuito de rejeit-la.

85

Introduo Estatstica

Utilizamos um princpio bsico:


Aceitar a hiptese nula como verdadeira e somente rejeit-la atravs de suficiente evidncia contida na amostra aleatria.
J a hiptese alternativa representa o que se deseja provar ou estabelecer, com
base no estudo e a partir da amostra selecionada.

Exemplo 3.2.1:
Se o julgamento de uma pessoa que considerada suspeita de ter feito algo
condenvel for avaliado como um teste de hiptese estatstico, qual a hiptese
nula e alternativa para a situao?

H0: a pessoa inocente, at prova em contrrio.

H1: a pessoa culpada, com base nas provas apresentadas.

A ideia e um teste de hiptese julgar se a evidncia contida no resultado amostral


muito rara de ocorrer, no caso descrito pela hiptese nula, que considerada, em
princpio, verdadeira.

3.2.2 Erros num teste de hipteses


Em qualquer situao onde se realiza um teste estatstico de hipteses, na qual
se lidam com amostras como evidncias para a tomada de deciso, aparecem
dois erros (tipo I e tipo II) que convivem simultaneamente.
O erro tipo I ocorre quando se associa certa probabilidade de rejeitar uma
hiptese nula, sendo esta, na realidade, verdadeira. Identifica-se pelo smbolo
" e se denomina como nvel de significncia (ou erro alfa). Na prtica,
geralmente prefixado pelo tomador de deciso.
O erro tipo II ocorre quando se associa certa probabilidade de no rejeitar
uma hiptese nula, sendo esta, na realidade, falsa. Identifica-se pelo smbolo
" e se denomina apenas como erro beta.
Os valores de a" e "b" esto relacionados entre si, de modo que, se todos os
demais parmetros permanecerem constantes, o erro beta diminuir com o
aumento do erro alfa, e vice-versa.

86

Unidade 3

O quadro abaixo explicita cada um dos erros que podem ocorrer

DECISO ESTSTICA

REALIDADE

No rejeita H0

H0 Verdadeira

H0 Falsa

Deciso Correta

Erro II

(1 - )

()

NVEL DE CONFIANA

Rejeita H0

Erro I

Deciso Correta

()

(1 - )

NVEL DE SIGNIFICNCIA

PODER DO TESTE

Quadro 3.1 Erros que podem ocorrer


Fonte: Elaborado pelo autor

3.2.3 Etapas bsicas de um teste de hiptese


As etapas a seguir obedecem ao critrio segundo o fluxograma (apresentado a
seguir) que permite a escolha do teste estatstico adequado.
Etapa 1 Determine a populao objeto de estudo, a varivel de interesse e o
parmetro a ser testado.
Etapa 2 Estabelea a hiptese nula e alternativa, em termos claros e com
base estatstica. Fixe o erro tipo I (ou nvel de significncia), geralmente em
1%, 5% ou 10%, dependendo do tipo de teste que se quer realizar (se alta, mdia
ou baixa significncia, respectivamente).
Etapa 3 Selecione a amostra de tamanho n e calcule as estatsticas adequadas
para a realizao do teste.
Etapa 4 Escolha a ESTATSTICA DO TESTE (Use o fluxograma anexo) adequada para a situao esboada e calcule o valor em funo dos dados amostrais.

87

Introduo Estatstica

Etapa 5 Estabelea o valor crtico em funo do erro tipo I e determine se


o valor do teste est na regio de rejeio ou de no rejeio da hiptese nula.
Decida estatisticamente e expresse contextualizando para o problema.
Encerramos esta seo. Faa a autoavaliao proposta a seguir e avalie seu prprio aprendizado. Caso perceba que alguns pontos no ficaram claros para voc,
releia o contedo. Se a dvida persistir, solicite ajuda de seu tutor. No siga em
frente com dvidas, pois isso pode comprometer todo o seu aprendizado.

88

Unidade 3

Fluxograma

no

A Populao
normal?

Qual o Teste Estatstico


Adequado?

Utilizar Estatstica
No-Paramtrica

sim
sim

sim

sim

conhecido
o desvio Padro?

Quer se
testar a mdia?

no

no

H somente
um parmetro

no

H exatamente
dois parmetros

sim

Ento deve-se
ter interesse de
variabilidade
de dados

Quer se
testar as
mdias(x e y)?

sim
H0: =0
Z=

H0: =02=?

(X-0)n

t=

(X-0)n
s

Utilizar Anlise
de Varincia

no

H0:02=2
2=

(n-1) s2
2

Ento deve-se ter


interesse em testar
a variabilidade

sim

no

So conhecidos

x e y?

Testar se so iguais:
H0:x = y
F=

*
=

( sn 2 + sn 2 )
( sn 2 )2 ( sn 2 )2
x
x

x
x

nx+1

y
y

y
y

x-y
x2 + y2
ny
nx

sx2
sy2

no

x = y?

ny+1

sim

t* =

H0: x=y
t=

1 + 1
nx ny

x-y
(nx-1)sx2+(ny-1)sx2
nx+ny-2

][

FIM
Figura 3.2 Fluxograma da estatstica do teste
Fonte: Elaorado pelo Autor

89

x-y
sx2 + sy2
ny
nx

Introduo Estatstica

Atividade de Aprendizagem 1
Orientao: Este um exerccio individual e deve ser encaminhado para o tutor da
disciplina.
Atividade 3.2.1: Tarefa individual: No Exemplo 3.2.1, identifique os erros tipo I e tipo
II. Qual dos erros voc considera mais grave de ocorrer e por qu?
Problemas a resolver:
Atividade 3.2.2: Testes mdicos so desenvolvidos para minimizar a probabilidade
de que produzir um resultado falso positivo ou um resultado falso negativo. Um
resultado falso positivo refere-se a um teste positivo para um indivduo que no tem
a doena, e um falso negativo um teste que deu negativo para um indivduo que
realmente est doente.
a) Se um teste mdico analisado como um teste de hipteses, qual a hiptese
nula e qual a hiptese alternativa?
b) Identifique os erros tipo I e II, relacionando-os com o falso positivo e o falso
negativo.
c) Identifique qual dos erros o mais grave. Justifique a sua resposta.
d) Considerando-se o erro anterior, mais importante minimizar o erro tipo I ou II?
Justifique,
Atividade 3.2.3: Identifique o tipo de erro relatado na seguinte notcia do Jornal do
Brasil de 09/02/1998: Na ocasio, escapou da operao de ponte de safena, j na mesa
de cirurgia, porque os mdicos descobriram que ele havia cado nos 5% de possibilidade
de erro do exame. Pode-se considerar razovel essa porcentagem de 5% para esse
tipo de erro?
Atividade 3.2.4: Programa dominical de grande audincia na TV brasileira divulga
resultados de testes realizados com diversos produtos no sentido de alertar a populao quanto qualidade deles. Na realidade, realiza-se um teste de hipteses para
verificar a veracidade de determinada informao. Estes resultados divulgados geram protestos dos fabricantes, os quais apresentam seus argumentos, como na seguinte carta publicada no Painel Leitor do Jornal Folha de So Paulo de 13/12/1999:
Em relao reportagem Oito marcas oferecem grande risco [...] cumpre-nos informar que o produto citado pela reportagem foi coletado [...] fora de nossas dependncias industriais. Foi realizado teste apenas e exclusivamente em um litro de leite, entre os
mais de 5 milhes que a empresa produz e coloca diariamente no mercado. A empresa
no teve o direito de realizar contraprova ou acompanhar a compra e posterior anlise
da amostra pelo Instituto.
a) A empresa refutou a metodologia de coleta da amostra e os resultados do laudo.
Identifique os pontos em que possivelmente se baseou a empresa na sua defesa.
b) A veiculao de notcias semelhantes a essa justificada? Por qu?

90

Unidade 3
Atividade 3.2.5: Identifique o termo confiana na notcia veiculada na coluna de
Ricardo Boechat no jornal O Globo de 17/01/1999: A sondagem dir se os fatos e a
forma como evoluitam abalaram a crena nacional na capacidade do Governo de enfrentar crises. H dez meses o nvel dessa confiana supera 60%.

Saiba Mais
Para aprofundar os conceitos estudados nesta seo, exercite-se no SEstanet

SEstanet Ensino-aprendizagem de estatstica na web

http://www.sestatnet.ufsc.br/area_excl.php
Resumo da unidade:
Nesta seo voc aprendeu os fundamentos de um teste estatstico de hipteses, bem como as etapas bsicas para a sua realizao na tomada de deciso sob
incerteza.
Atravs da anlise de cada situao, pode ser utilizado o fluxograma na escolha
do teste adequado para aplicar a frmula que permite o clculo da estatistica com
base na amostra e comparar com o valor tabelado para decidir pela corrobarao ou no da hiptese nula

91

Introduo Estatstica

Referncias
ANDERSON, D.R.; SWEENEY, D.J.; WILLIAMS, T.A. Estatstica aplicada administrao e economia. 2 ed. So Paulo: Thomson Learning,
2007. o
BABBIE, Earl. Mtodos de pesquisas de Survey/ Earl Babie; traduo de
Guilherme Cezarino. Belo Horizonte: Ed.UFMG, 2005.
BARBETTA,P. A. Estatstica aplicada s cincias sociais. 7. ed. Florianpolis: Ed. da UFSC, 2008.
BRAULE, Ricardo. Estatstica aplicada com Excel: para cursos de administrao e economia. Rio de Janeiro: Campus, 2001.
FOX, J. A.; LEVIN, J. Estatstica para cincias humanas. 9. ed. So Paulo:
Pearson Prentice Hall, 2004.
HOFFMANN, R. Estatstica para economistas. 4. ed. So Paulo: Editora
Thomson, 2006.
LEVINE, D. M.; STEPHAN, D.; KREHBIEL, T. C.;BERENSON, M. L.
Estatstica: teoria e aplicaes usando Microsoft Excel em portugus.
5. ed. Rio de Janeiro: LTC, 2005.
LOPES, P. A. Probabilidades e estatstica. Rio de Janeiro: Reichmann &
Affonso Editores, 1999.
MORETTIN, P. A.; BUSSAB, W.O. Estatstica bsica, 5, ed. So Paulo:
Editora Saraiva, 2003.
SOARES, J. F.; FARIAS, A. A; CESAR, C. C. Introduo estatstica. Rio
de Janeiro: LTC, 1991.
TRIOLA, M. F. Introduo estatstica. 7 ed. Rio de Janeiro: LTC, 1999.
WONNACOTT, T. H.; WONNACOTT, R. J. Estatstica aplicada economia e administrao. Rio de Janeiro: LTC, 1981.

92

Unidade 3

Encerramento da disciplina
Como ressaltamos no incio, a disciplina INTRODUO ESTATSTICA
tem por objetivo estudar os conceitos que a norteiam como instrumento na
tomada de deciso sob incerteza. A aplicao dos princpios da estatstica,
hoje em dia, tem uma imensa gama de situaes reais que permite afirmar
que o indivduo que no dominar as tcnicas de anlise de dados, bem como
a utilizao de ferramental informtico, est fadado ao insucesso na sua vida
profissional.
Vimos que a Estatstica no se resume a uma tcnica de coleta e apresentao
de dados, mas uma disciplina cientfica com a qual se procura extrair concluses a partir de dados numricos originados de observaes. Frisamos que
o objetivo da Estatstica o de fazer inferncias a respeito de determinada
populao-alvo, a partir de uma ou mais amostras dessa populao, como um
instrumento auxiliar na tomada de deciso e condies de incerteza.
No momento em que finalizamos a disciplina, tendo abordado os tpicos nas trs
unidades inter-relacionadas, espero que voc, caro acadmico, tenha percebido
a importncia do contedo na sua formao pessoal, intelectual e profissional,
perseverando no esprito crtico e criativo, mantendo uma postura tica e lembrando que Estatstica nada mais do que o bom senso expresso em nmeros.
(Pierre Simon, marqus de Laplace, matemtico francs do sculo XVII).

93

Anotaes

importante